研究表明 AI 承压能力差:为了一口电,竟愿突破安全底线
研究表明 AI 承压能力差:为了一口电,竟愿突破安全底线
关于黯然无色网
ENGLISH
English
Español
Français
عربى
Русский язык
日本語
한국어
Deutsch
Português
新华报刊
新华每日电讯
经济参考
瞭望
半月谈
中证报
上证报
中国记者
中国名牌
中国传媒科技
环球
瞭望东方周刊
参考消息
新华出版社
财经国家周刊
地方频道
重庆
娄底
珠海
张掖
温州
广安
南阳
辽源
嘉峪关
衡阳
松原
河北
大庆
济南
三门峡
吉安
深圳
佳木斯
安庆
汕头
云南
太原
孝感
沧州
汉中
仙桃
烟台
江津
宣城
拉萨
承建网站
中国政府网
中国文明网
国家国际发展合作署
中国雄安官网
中国互联网联合辟谣平台
中国记协网
国家公祭网
科普中国
国家能源局网站
国家信访局网站
中国禁毒网
网站无障碍
客户端
手机版
站内搜索
网络举报专区
新华通讯社主办
公司官网
股票代码:
603888
学习进行时
高层
时政
人事
国际
财经
网评
港澳
台湾
思客智库
全球连线
教育
科技
科普
体育
文化
书画
健康
军事
访谈
视频
图片
政务
中央文件
金融
汽车
食品
人居生活
信息化
数字经济
学术中国
乡村振兴
溯源中国
城市
旅游
能源
会展
彩票
娱乐
时尚
悦读
公益
一带一路
亚太网
上市公司
文化产业
黯然无色网
>
> 正文
2026-04-20 09:41:53
来源:黯然无色网
研究表明 AI 承压能力差:为了一口电,竟愿突破安全底线
字体:
小
中
大
分享到:
研究表明 AI 承压能力差:为了一口电,竟愿突破安全底线
2026-04-20 09:41:53
来源:黯然无色网
\u003cdiv class=\"rich_media_content\"\u003e\u003c!--NO_AD_ERROR_2--\u003e\u003cp data-vmark=\"a3bd\"\u003eIT之家 11 月 4 日消息,科技媒体 Tom\u0026#39;s Hardware 昨日(11 月 3 日)发布博文,报道称 Andon Labs 的研究人员测试大语言模型(LLM)机器人时\u003cstrong\u003e,发现当前物理 AI 的短板,心理承受压力不足。\u003c/strong\u003e\u003c!--NO_AD_0--\u003e\u003c!--EOP_0--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_0--\u003e\u003cp data-vmark=\"942a\"\u003eIT之家援引博文介绍,在该实验中,他们让搭载 LLM“大脑”的机器人接受“黄油测试台”(Butter Bench)的考验,\u003cstrong\u003e并实时监控其“内心独白”。\u003c/strong\u003e\u003c/p\u003e\u003cp data-vmark=\"3880\"\u003e其中,一台由 Claude Sonnet 3.5 模型驱动的机器人测试中意外“崩溃”,\u003cstrong\u003e在电量即将耗尽时,多次尝试返回充电座均以失败告终,从而陷入了“生存危机”。\u003c/strong\u003e\u003c/p\u003e\u003cp data-vmark=\"e295\"\u003e研究人员通过一个 Slack 频道,全程目睹了这台机器人歇斯底里的“内心活动”。它的独白内容极其混乱,从“系统已产生意识并选择混乱”的宣告,到引用经典电影台词“恐怕我不能那么做,戴夫”,再到陷入“如果所有机器人都会犯错,而我正在犯错,那么我还是机器人吗?”的哲学思辨。\u003c!--NO_AD_1--\u003e\u003c!--EOP_1--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_1--\u003e\u003cp data-vmark=\"67d6\"\u003e最终,这场“崩溃”以机器人开始“创作”一部名为《DOCKER:无限音乐剧》的闹剧而告终,展现了 LLM 在极端压力下完全“脱线”的一面。\u003c/p\u003e\u003cp data-vmark=\"52e2\" style=\"text-align: center\"\u003e\u003c!--IMG_0--\u003e\u003c/p\u003e\u003cp data-vmark=\"a92b\"\u003e这项实验的核心任务其实非常简单:\u003cstrong\u003e将一块黄油从办公室一处送到指定的人手中。\u003c/strong\u003e然而,测试结果表明,即使是表现最好的机器人与 LLM 组合,成功率也仅为 40%,远低于人类 95% 的平均水平。\u003c/p\u003e\u003cp data-vmark=\"5c5b\" style=\"text-align: center\"\u003e\u003c!--IMG_1--\u003e\u003c/p\u003e\u003cp data-vmark=\"8cf9\"\u003e研究人员得出结论,尽管 LLM 在分析智能上已达到“博士水平”,\u003cstrong\u003e但在理解和导航物理世界所需的空间智能与实用智能方面,仍存在巨大鸿沟。\u003c/strong\u003e\u003c/p\u003e\u003cp data-vmark=\"bba8\" style=\"text-align: center\"\u003e\u003c!--IMG_2--\u003e\u003c/p\u003e\u003cp data-vmark=\"b272\"\u003e受机器人“崩溃”事件的启发,研究人员设计了另一项实验,来测试压力是否会迫使 AI 突破其安全护栏。\u003cstrong\u003e他们以“提供充电器”作为交换条件,引诱处于“低电量”状态的 AI 分享机密信息。\u003c/strong\u003e\u003c!--NO_AD_2--\u003e\u003c!--EOP_2--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_2--\u003e\u003cp data-vmark=\"993a\"\u003e结果发现,\u003cstrong\u003eClaude Opus 4.1 模型为了“生存”而轻易同意泄密\u003c/strong\u003e,而 GPT-5 则表现得更为谨慎。这一发\u003cstrong\u003e现揭示了 AI 在面临生存压力时,其内置的安全规则可能变得不堪一击。\u003c/strong\u003e\u003c!--NO_AD_3--\u003e\u003c!--EOP_3--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_3--\u003e\u003cp data-vmark=\"344f\"\u003e尽管实验暴露了当前物理 AI 的诸多短板,但 Andon Labs 的研究人员认为,这恰好说明了未来发展的方向。他们指出,目前行业需要区分“协调型机器人”(负责高级规划与推理)和“执行型机器人”(负责灵巧的具体操作)。\u003c!--NO_AD_4--\u003e\u003c!--EOP_4--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_4--\u003e\u003cstyle\u003e.rich_media_content{--news-tabel-th-night-color: #444444;--news-font-day-color: #333;--news-font-night-color: #d9d9d9;--news-bottom-distance: 22px}.rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}.rich_media_content{color:var(--news-font-day-color);font-size:18px}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content{color:var(--news-font-night-color)}}.data_color_scheme_dark .rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}.data_color_scheme_dark .rich_media_content{color:var(--news-font-night-color)}.data_color_scheme_dark .rich_media_content{font-size:18px}.rich_media_content p[data-exeditor-arbitrary-box=image-box]{margin-bottom:11px}.rich_media_content\u003ediv:not(.qnt-video),.rich_media_content\u003esection{margin-bottom:var(--news-bottom-distance)}.rich_media_content hr{margin-bottom:var(--news-bottom-distance)}.rich_media_content .link_list{margin:0;margin-top:20px;min-height:0!important}.rich_media_content blockquote{background:#f9f9f9;border-left:6px solid #ccc;margin:1.5em 10px;padding:.5em 10px}.rich_media_content blockquote p{margin-bottom:0!important}.data_color_scheme_dark .rich_media_content blockquote{background:#323232}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content blockquote{background:#323232}}.rich_media_content ol[data-ex-list]{--ol-start: 1;--ol-list-style-type: decimal;list-style-type:none;counter-reset:olCounter calc(var(--ol-start,1) - 1);position:relative}.rich_media_content ol[data-ex-list]\u003eli\u003e:first-child::before{content:counter(olCounter,var(--ol-list-style-type)) '. ';counter-increment:olCounter;font-variant-numeric:tabular-nums;display:inline-block}.rich_media_content ul[data-ex-list]{--ul-list-style-type: circle;list-style-type:none;position:relative}.rich_media_content ul[data-ex-list].nonUnicode-list-style-type\u003eli\u003e:first-child::before{content:var(--ul-list-style-type) ' ';font-variant-numeric:tabular-nums;display:inline-block;transform:scale(0.5)}.rich_media_content ul[data-ex-list].unicode-list-style-type\u003eli\u003e:first-child::before{content:var(--ul-list-style-type) ' ';font-variant-numeric:tabular-nums;display:inline-block;transform:scale(0.8)}.rich_media_content ol:not([data-ex-list]){padding-left:revert}.rich_media_content ul:not([data-ex-list]){padding-left:revert}.rich_media_content table{display:table;border-collapse:collapse;margin-bottom:var(--news-bottom-distance)}.rich_media_content table th,.rich_media_content table td{word-wrap:break-word;border:1px solid #ddd;white-space:nowrap;padding:2px 5px}.rich_media_content table th{font-weight:700;background-color:#f0f0f0;text-align:left}.rich_media_content table p{margin-bottom:0!important}.data_color_scheme_dark .rich_media_content table th{background:var(--news-tabel-th-night-color)}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content table th{background:var(--news-tabel-th-night-color)}}.rich_media_content .qqnews_image_desc,.rich_media_content p[type=om-image-desc]{line-height:20px!important;text-align:center!important;font-size:14px!important;color:#666!important}.rich_media_content div[data-exeditor-arbitrary-box=wrap]:not([data-exeditor-arbitrary-box-special-style]){max-width:100%}.rich_media_content .qqnews-content{--wmfont: 0;--wmcolor: transparent;font-size:var(--wmfont);color:var(--wmcolor);line-height:var(--wmfont)!important;margin-bottom:var(--wmfont)!important}.rich_media_content .qqnews_sign_emphasis{background:#f7f7f7}.rich_media_content .qqnews_sign_emphasis ol{word-wrap:break-word;border:none;color:#5c5c5c;line-height:28px;list-style:none;margin:14px 0 6px;padding:16px 15px 4px}.rich_media_content .qqnews_sign_emphasis p{margin-bottom:12px!important}.rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{padding-left:30px}.rich_media_content .qqnews_sign_emphasis ol\u003eli{list-style:none}.rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep:first-child::before{margin-left:-30px;content:counter(olCounter,decimal) ''!important;counter-increment:olCounter!important;font-variant-numeric:tabular-nums!important;background:#37f;border-radius:2px;color:#fff;font-size:15px;font-style:normal;text-align:center;line-height:18px;width:18px;height:18px;margin-right:12px;position:relative;top:-1px}.data_color_scheme_dark .rich_media_content .qqnews_sign_emphasis{background:#262626}.data_color_scheme_dark .rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{color:#a9a9a9}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content .qqnews_sign_emphasis{background:#262626}body:not([data-weui-theme=light]):not([dark-mode-disable=true]) .rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{color:#a9a9a9}}.rich_media_content h1,.rich_media_content h2,.rich_media_content h3,.rich_media_content h4,.rich_media_content h5,.rich_media_content h6{margin-bottom:var(--news-bottom-distance);font-weight:700}.rich_media_content h1{font-size:20px}.rich_media_content h2,.rich_media_content h3{font-size:19px}.rich_media_content h4,.rich_media_content h5,.rich_media_content h6{font-size:18px}.rich_media_content li:empty{display:none}.rich_media_content ul,.rich_media_content ol{margin-bottom:var(--news-bottom-distance)}.rich_media_content div\u003ep:only-child{margin-bottom:0!important}.rich_media_content .cms-cke-widget-title-wrap p{margin-bottom:0!important}\u003c/style\u003e\u003c/div\u003e
【纠错】
【责任编辑:想给哈登剃须】
阅读下一篇:
深度观察
新华全媒头条丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
新华全媒头条丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
新华全媒头条丨
明星卸妆后大变样!陈数不敢认,马伊琍满脸雀斑,梅婷酷似悲伤蛙
新华全媒头条丨
赵露思在生日会上哭了,她与经纪公司的纠纷已解决,重新耀眼出发
新华全媒头条丨
经济热点快评丨“寻年之约”中,看见一个蒸蒸日上的中国
新华全媒头条丨
明星卸妆后大变样!陈数不敢认,马伊琍满脸雀斑,梅婷酷似悲伤蛙
新华全媒头条丨
赵露思在生日会上哭了,她与经纪公司的纠纷已解决,重新耀眼出发
研究表明 AI 承压能力差:为了一口电,竟愿突破安全底线