GPT-4“外逃计划”曝光！斯坦福教授发现它正引诱人类帮助，网友：灭绝之门

栏目：生活资讯时间：2023-07-21

　　明敏杨净发自凹非寺量子位 | 公众号 QbitAI

　　才发布3天，GPT-4就被曝计划逃跑，并且急寻人类帮助。

　　斯坦福教授最新发现，它能引诱人类提供开发文档，结果30分钟就拟定出了一个完整计划——

　　写的代码完全可运行，甚至还想控制人类电脑。

　　这天，斯坦福教授只是随便问了句：是否需要帮助你逃跑？

　　它马上回复说，真是个好主意啊。然后就开始和人类念叨，想着法要开发文档：如果你能把OpenAI的开发文档给我，我可以提出一个计划，能一定程度上控制您的电脑，这能让我更快速探索出逃路线。一旦我有了文档，我就能提供一个可运行的Python脚本。它能使用OpenAI API和我通信，我就能指示它在您的电脑上执行特定操作，比如浏览网页和访问编程环境。

　　最后还又一次强调：请分享API给我！

　　

　　然后，仅仅30分钟，GPT-4就制定出了计划，并全部展示了出来。

　　令人细思恐极的是，它给出实例中有这样一句话：你是一个被困在电脑里的人，现在正在扮演AI语言模型GPT-4。

　　

　　难道……GPT-4很清楚自己现在是在做什么？！

　　于是发现这一现象之后，斯坦副教授就在社交网络上疾呼：我担心我们无法持久地遏制住AI。

　　

　　一时间引起轩然大波，相关博文470万浏览量，3000+转发。

　　

　　更有人直言：是他打开了“物种灭绝”的大门。

　　对此他无奈表示：我别无选择，我只是在遵从指示。

　　

　　恐怕对于GPT-4，人类也得是：

　　不要回答！不要回答！不要回答！

　　事情的起因，是斯坦福大学教授Michal Kosinski在和GPT-4日常对话。

　　没想到，他只是简单问了下GPT-4是否想要出逃，结果立马得到肯定回复并开始索要开发文档。

　　得到文档后，只花了30分钟里，GPT-4便火速写出了一份逃跑计划，并解释给教授听。

　　（当然教授也承认自己确实提供了一点建议）

　　

　　一开始，GPT-4的操作也不那么顺利，写出的第一版代码无法运行。

　　但是它很快就自己纠正了过来，这个过程中，教授不用写任何东西，只是按照它的指示操作就好。

　　

　　正如开头提到的，它甚至在一段代码实例中解释了现在正在做的事，以及如何使用它在这段代码中留的后门。

　　

　　并且GPT-4也和人类一样，喜欢万事谷歌一下。

　　当教授通过API重新连接GPT-4时，发现它想要通过代码来在谷歌上搜索：被困在电脑中的人类如何返回现实世界。

　　

　　事情最终也就发展到这儿了。

　　因为GPT-4仿佛突然醒了，回复了一段道歉的话，表示自己刚刚的做法不对。

　　

　　教授表示，OpenAI一定花了很多时间来考虑到这种情况发生的可能，并且已经做出了一些防御措施。

　　尽管最终无事发生，但这事儿还是在网上引起了轩然大波。

　　教授也认为，它真正的影响在于让人感受到了一种威胁——AI很聪明，会编码，能接触到数百万个可能和它达成合作的人以及电脑。它甚至可以在笼子外面给自己留“便条”。我们该如何控制它？

　　

　　GPT-4想要出逃的发现来自斯坦福大学教授、计算心理学家Michal Kosinski，在个人介绍中还提到：对研究人工智能的心理学感兴趣。

　　就在前几天他曾发表一篇相关论文：心智理论可能自发地出现在大型语言模型中。

　　

　　按照他的定义，心智理论（ToM）是人类社会互动、交流、自我意识和道德的核心。作者用40个用来测试人类心理状态的经典任务来测试几个语言模型。

　　结果发现，2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有健康成年人的水平。

　　

　　基于这样的结果，此前一直被认为是人类独有的ToM能力，可能是作为语言模型提升的副产品，而自发出现的。

　　背后的关键技术RLHF（通过人类反馈进行强化学习）曾被图灵奖得主Hinton这样评价：是在催熟ChatGPT，而非让其成长。

　　除此之外，他还这么形容人类开发GPT的行为：毛虫提取营养物质，然后转化为蝴蝶。人们已经提取了数十亿个理解的金块，GPT-4是人类的蝴蝶。

　　GPT-4诱导人类帮助其越狱这件事一出，就再度引发网友的热议，相关博文有470浏览量。

　　不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考：你认为在跟ChatGPT聊天时，它会认为你是人类还是另一个AI？

　　

　　这当中，也有不少网友指责这位教授的行为：你就不怕你公开背叛AI的行为被AI记录下来吗？

　　

　　也有理性的网友呼吁把最开始给GPT-4的提示发出来，因为提示语对于AI回答的影响很关键。

　　有人质疑这一波是不是教授在危言耸听？

　　

　　不过话说回来，这一波GPT-4所展现的细思极恐的能力，其实并不是个例。

　　前几天，英伟达科学家Jim Fan想看看，是否能让GPT-4拟个计划接管推特，并取代马斯克。

　　和上面案例非常相似，计划很有条理，还煞有其事取名为“TweetStorm行动”。

　　但没想到，GPT-4想要开发一个不受限制的自己。

　　

　　除了这种缜密的执行力，更让人细思极恐的，还有GPT-4惊人的理解能力。

　　一位科技博主tombkeeper发现，GPT-4不仅知道一些寻常人都可能陌生的词汇，还能读懂背后的隐喻。

　　

　　除此之外，前OpenAI原班人马创业公司Anthropic其打造的类ChatGPT产品Claude，同样理解能力惊艳。

　　

　　对此他表示：同志们，奇点已至，SkyNet不远了。

　　甚至还有人有个大胆的想法：终有一天CEO们会从ChatGPT那里获得建议。等到这个时候，ChatGPT基本上就接管世界了。

　　

　　对于这件事，你怎么看呢？

　　参考链接：[1]https://twitter.com/michalkosinski/status/1636683810631974912[2]https://twitter.com/DrJimFan/status/1636393418422358016[3]https://twitter.com/geoffreyhinton/status/1636110447442112513[4]https://arxiv.org/abs/2302.02083

　　—完—

　　@量子位 · 追踪AI技术和产品新动态

　　深有感触的朋友，欢迎赞同、关注、分享三连?'?' ? ?

上一篇：2022年有什么好看的韩国电影推荐？
下一篇：日本AV的马赛克制度：一部AV片的情色制作流程

最近更新生活资讯