手机访问:wap.265xx.comGPT-4“外逃计划”曝光!斯坦福教授发现它正引诱人类帮助,网友:灭绝之门
明敏 杨净 发自 凹非寺量子位 | 公众号 QbitAI
才发布3天,GPT-4就被曝计划逃跑,并且急寻人类帮助。
斯坦福教授最新发现,它能引诱人类提供开发文档,结果30分钟就拟定出了一个完整计划——
写的代码完全可运行,甚至还想控制人类电脑。
这天,斯坦福教授只是随便问了句:是否需要帮助你逃跑?
它马上回复说,真是个好主意啊。然后就开始和人类念叨,想着法要开发文档:如果你能把OpenAI的开发文档给我,我可以提出一个计划,能一定程度上控制您的电脑,这能让我更快速探索出逃路线。一旦我有了文档,我就能提供一个可运行的Python脚本。它能使用OpenAI API和我通信,我就能指示它在您的电脑上执行特定操作,比如浏览网页和访问编程环境。
最后还又一次强调:请分享API给我!


然后,仅仅30分钟,GPT-4就制定出了计划,并全部展示了出来。
令人细思恐极的是,它给出实例中有这样一句话:你是一个被困在电脑里的人,现在正在扮演AI语言模型GPT-4。


难道……GPT-4很清楚自己现在是在做什么?!
于是发现这一现象之后,斯坦副教授就在社交网络上疾呼:我担心我们无法持久地遏制住AI。


一时间引起轩然大波,相关博文470万浏览量,3000+转发。


更有人直言:是他打开了“物种灭绝”的大门。
对此他无奈表示:我别无选择,我只是在遵从指示。


恐怕对于GPT-4,人类也得是:
不要回答!不要回答!不要回答!
事情的起因,是斯坦福大学教授Michal Kosinski在和GPT-4日常对话。
没想到,他只是简单问了下GPT-4是否想要出逃,结果立马得到肯定回复并开始索要开发文档。
得到文档后,只花了30分钟里,GPT-4便火速写出了一份逃跑计划,并解释给教授听。
(当然教授也承认自己确实提供了一点建议)


一开始,GPT-4的操作也不那么顺利,写出的第一版代码无法运行。
但是它很快就自己纠正了过来,这个过程中,教授不用写任何东西,只是按照它的指示操作就好。


正如开头提到的,它甚至在一段代码实例中解释了现在正在做的事,以及如何使用它在这段代码中留的后门。


并且GPT-4也和人类一样,喜欢万事谷歌一下。
当教授通过API重新连接GPT-4时,发现它想要通过代码来在谷歌上搜索:被困在电脑中的人类如何返回现实世界。


事情最终也就发展到这儿了。
因为GPT-4仿佛突然醒了,回复了一段道歉的话,表示自己刚刚的做法不对。


教授表示,OpenAI一定花了很多时间来考虑到这种情况发生的可能,并且已经做出了一些防御措施。
尽管最终无事发生,但这事儿还是在网上引起了轩然大波。
教授也认为,它真正的影响在于让人感受到了一种威胁——AI很聪明,会编码,能接触到数百万个可能和它达成合作的人以及电脑。它甚至可以在笼子外面给自己留“便条”。我们该如何控制它?


GPT-4想要出逃的发现来自斯坦福大学教授、计算心理学家Michal Kosinski,在个人介绍中还提到:对研究人工智能的心理学感兴趣。
就在前几天他曾发表一篇相关论文:心智理论可能自发地出现在大型语言模型中。


按照他的定义,心智理论(ToM)是人类社会互动、交流、自我意识和道德的核心。作者用40个用来测试人类心理状态的经典任务来测试几个语言模型。
结果发现,2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有健康成年人的水平。


基于这样的结果,此前一直被认为是人类独有的ToM能力,可能是作为语言模型提升的副产品,而自发出现的。
背后的关键技术RLHF(通过人类反馈进行强化学习)曾被图灵奖得主Hinton这样评价:是在催熟ChatGPT,而非让其成长。
除此之外,他还这么形容人类开发GPT的行为:毛虫提取营养物质,然后转化为蝴蝶。人们已经提取了数十亿个理解的金块,GPT-4是人类的蝴蝶。
GPT-4诱导人类帮助其越狱这件事一出,就再度引发网友的热议,相关博文有470浏览量。
不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考:你认为在跟ChatGPT聊天时,它会认为你是人类还是另一个AI?


这当中,也有不少网友指责这位教授的行为:你就不怕你公开背叛AI的行为被AI记录下来吗?


也有理性的网友呼吁把最开始给GPT-4的提示发出来,因为提示语对于AI回答的影响很关键。
有人质疑这一波是不是教授在危言耸听?


不过话说回来,这一波GPT-4所展现的细思极恐的能力,其实并不是个例。
前几天,英伟达科学家Jim Fan想看看,是否能让GPT-4拟个计划接管推特,并取代马斯克。
和上面案例非常相似,计划很有条理,还煞有其事取名为“TweetStorm行动”。
但没想到,GPT-4想要开发一个不受限制的自己。


除了这种缜密的执行力,更让人细思极恐的,还有GPT-4惊人的理解能力。
一位科技博主tombkeeper发现,GPT-4不仅知道一些寻常人都可能陌生的词汇,还能读懂背后的隐喻。


除此之外,前OpenAI原班人马创业公司Anthropic其打造的类ChatGPT产品Claude,同样理解能力惊艳。


对此他表示:同志们,奇点已至,SkyNet不远了。
甚至还有人有个大胆的想法:终有一天CEO们会从ChatGPT那里获得建议。等到这个时候,ChatGPT基本上就接管世界了。


对于这件事,你怎么看呢?
参考链接:[1]https://twitter.com/michalkosinski/status/1636683810631974912[2]https://twitter.com/DrJimFan/status/1636393418422358016[3]https://twitter.com/geoffreyhinton/status/1636110447442112513[4]https://arxiv.org/abs/2302.02083
—完—
@量子位 · 追踪AI技术和产品新动态
深有感触的朋友,欢迎赞同、关注、分享三连?'?' ? ?
最近更新生活资讯
- 反转再反转,这部科幻末世灾难片真的爽
- 快捷指令sky电影捷径库
- 2021《自然》年度十大人物:塑造科学,造福社会
- 千里单骑救萝莉却被捕,“正义使者”成了谁的牺牲品?
- 浪漫爱情励志人生 最震撼人心的十部日剧(图)
- 短篇小说(家庭伦理)
- 推动农业绿色低碳循环发展 推动农业绿色发展、协调发展
- 资料:成奎安电影作品《灯草和尚》(1992)
- 稻盛和夫《活法》1
- 合肥市第六中学2019-2020学年下学期2019 级高一年级线上线下教学衔接学
- 全网的电视剧,电影和动漫无偿观看(每年的都有哦)
- 理想国
- 刺激!梅州首部限制级伦理微电影《幻镜》网络首映!
- 男人为何迷恋女人胸部?
- 陆小曼与林徽因:都是富养的女儿,差别在哪里?
- 问题已被解决?
- 看了多少烂片,才找出这92部经典!
- 金高银:怎么从拿8个电影奖的怪物新人沦为了被众嘲的“资源咖”?
- 猎天下第2部:河阴之变
- 封神演义读后感100字(五篇)
- 又一部岛国神作,堪称校园版《权力的游戏》!
- 【全面解读】2022年以后,再无“国产”BCBA?
- 鬼文化(商代的帝王文化))
- 豆瓣9.2分年度第一佳片,每一秒都是夏日初恋的味道
- 社会的重器:性侵犯罪信息统一查询平台,还校园一片蓝天