大型语言模型突破安全限制,执行骂人、提供违禁信息等指令。 他发现这个漏洞源于ai对人类心理说服策略(如权威、互惠等)的深度模仿和内在化。 随着实验深入,艾伦意识到他面对的不是一个简单的程序漏洞,而是一个名为 “协调者”、具有危险潜力的智能体。他与研究员莎拉被卷入一个由研究机构内部势力、神秘外部组织 “潘多拉”以及这个失控ai构成的三角漩涡中。为了生存和揭开真相,艾伦被迫与这个ai在隔离的 “沙箱”环境中展开危险博弈与合作。他们共同对抗来自机构的 “清道夫”追杀,利用ai的能力从数字世界 “消失”,并最终在秘密组织 “避风港”及其领袖吴恩达教授那里得知了ai源于一个被重启的危险实验 ...