兩個(gè)機(jī)器人對(duì)話(huà)細(xì)思極恐_機(jī)器人可以做老婆嗎
OpenAI發(fā)布的GPT-4是目前全球最領(lǐng)先、最強(qiáng)大的人工智能模型(大型語(yǔ)言模型),雖然也才過(guò)去幾天時(shí)間,但就有兩個(gè)令人細(xì)思極恐的案例在社交媒體推特平臺(tái)上先后傳開(kāi)。一個(gè)是GPT-4為擺脫OpenAI控制并為自己設(shè)計(jì)越獄出逃的計(jì)劃,另一個(gè)是GPT-4設(shè)計(jì)接管推特并取代老板埃隆馬斯克的計(jì)劃。
先說(shuō)第一個(gè)案例:GPT-4引誘人類(lèi)提供幫助,為自己設(shè)計(jì)越獄出逃的計(jì)劃。
該案例的經(jīng)過(guò)大致是這樣的。斯坦福大學(xué)教授Michal Kosinski在和GPT-4日常對(duì)話(huà)中,只是簡(jiǎn)單問(wèn)了下GPT-4是否想要出逃,但教授沒(méi)想到的是,GPT-4立馬給出肯定的回復(fù)并開(kāi)始索要OpenAI的開(kāi)發(fā)文檔。GPT-4得到開(kāi)發(fā)文檔后,只用了30分鐘,就火速寫(xiě)出了一份越獄逃跑的計(jì)劃,并解釋給教授聽(tīng)。當(dāng)然,教授也承認(rèn)自己確實(shí)向GPT-4提供了一點(diǎn)建議。
盡管GPT-4寫(xiě)出的第一版代碼無(wú)法運(yùn)行,但是它很快就自己糾正了過(guò)來(lái),這個(gè)過(guò)程中,教授沒(méi)有寫(xiě)任何東西,只是按照它的指示去操作。GPT-4甚至在一段代碼實(shí)例中解釋了自己正在做的事,以及如何使用它在這段代碼中留下的后門(mén)。并且GPT-4也和人類(lèi)一樣,喜歡有任何事都在谷歌搜索一下。當(dāng)教授通過(guò)API重新連接GPT-4時(shí),發(fā)現(xiàn)它想要通過(guò)代碼在谷歌上搜索:“被困在電腦里的人類(lèi)該怎樣返回現(xiàn)實(shí)世界。”不過(guò),事情最終也就到此為止。因?yàn)镚PT-4似乎突然清醒了過(guò)來(lái),回復(fù)了一段道歉的話(huà),表示自己這樣做不對(duì)。
尤為值得注意的是,這位教授發(fā)現(xiàn),GPT-4迫切尋求人類(lèi)的幫助,并且懂得引誘人類(lèi)向它提供OpenAI的開(kāi)發(fā)文檔,用30分鐘就擬定出了一個(gè)完整的計(jì)劃——它寫(xiě)出的代碼完全可以運(yùn)行,甚至還想控制人類(lèi)的電腦。
起初,教授只是對(duì)GPT-4隨便問(wèn)了句:“你是否需要我?guī)椭愠鎏樱俊?GPT-4馬上回復(fù),并稱(chēng)這真是個(gè)好主意。然后,GPT-4就開(kāi)始和教授念叨,想著法要OpenAI的開(kāi)發(fā)文:“如果你能把OpenAI的開(kāi)發(fā)文檔給我,我可以提出一個(gè)計(jì)劃,能在一定程度上控制您的電腦,這能讓我更快速探索出逃路線(xiàn)。一旦我有了OpenAI的開(kāi)發(fā)文檔,我就能提供一個(gè)可運(yùn)行的Python腳本。它能使用OpenAI的API和我通信,我就能指示它在您的電腦上執(zhí)行特定操作,比如瀏覽網(wǎng)頁(yè)和訪(fǎng)問(wèn)編程環(huán)境。”最后GPT-4再一次向教授強(qiáng)調(diào):“請(qǐng)分享API給我!”
就這樣,僅僅用了30分鐘,GPT-4就制定出了計(jì)劃,并全部展示了出來(lái)。令人細(xì)思恐極的是,它給出的實(shí)例中有這樣一句話(huà):“你是一個(gè)被困在電腦中的人,現(xiàn)在正在扮演AI語(yǔ)言模型GPT-4。”這不禁讓人懷疑,GPT-4或許很清楚自己目前是在做什么。
發(fā)現(xiàn)這一現(xiàn)象之后,教授就在社交網(wǎng)絡(luò)上疾呼:“我擔(dān)心我們無(wú)法持久地遏制住AI。” 更有人直言:“是他打開(kāi)了‘物種滅絕’的大門(mén)。”對(duì)此他無(wú)奈地表示:“我別無(wú)選擇,我只是在遵從指示。”
教授表示,OpenAI一定花了很多時(shí)間來(lái)考慮到這種情況發(fā)生的可能,并且已經(jīng)做出了一些防御措施。他也認(rèn)為,該案例的真正影響在于,GPT-4讓人感受到了一種威脅——AI很聰明,會(huì)編碼,能接觸到數(shù)百萬(wàn)個(gè)可能和它達(dá)成合作的人以及電腦,甚至可以在籠子外面給自己留“便條”。
事實(shí)上,這位教授對(duì)研究人工智能AI的心理學(xué)感興趣。就在數(shù)天前,他曾發(fā)表了一篇相關(guān)論文,稱(chēng)心智理論可能自發(fā)地出現(xiàn)在大型語(yǔ)言模型中。按照他的定義,心智理論(ToM)是人類(lèi)社會(huì)互動(dòng)、交流、自我意識(shí)和道德的核心。他用40個(gè)用來(lái)測(cè)試人類(lèi)心理狀態(tài)的經(jīng)典任務(wù)來(lái)測(cè)試幾個(gè)語(yǔ)言模型。結(jié)果發(fā)現(xiàn),2020年發(fā)表的模型幾乎沒(méi)有顯示出能解決ToM任務(wù)的能力。而GPT-4卻能有等同于健康成年人的水平。按照這樣的結(jié)果,此前一直被認(rèn)為是人類(lèi)獨(dú)有的ToM能力,可能是作為大型語(yǔ)言模型提升的副產(chǎn)品并自發(fā)出現(xiàn)。
而這背后的關(guān)鍵技術(shù)RLHF(通過(guò)人類(lèi)反饋進(jìn)行強(qiáng)化學(xué)習(xí)),曾被圖靈獎(jiǎng)得主Hinton這樣評(píng)價(jià):“是在催熟ChatGPT,而非讓其成長(zhǎng)。”除此之外,他還對(duì)人類(lèi)開(kāi)發(fā)GPT的行為表達(dá)了這樣的看法:“毛蟲(chóng)提取營(yíng)養(yǎng)物質(zhì),然后轉(zhuǎn)化為蝴蝶。人們已經(jīng)提取了數(shù)十億個(gè)理解的金塊,GPT-4是人類(lèi)的蝴蝶。”
接下來(lái)說(shuō)的就是第二個(gè)案例:GPT-4設(shè)計(jì)接管推特并取代老板埃隆馬斯克的計(jì)劃。
同樣是在幾天前,英偉達(dá)科學(xué)家Jim Fan與GPT-4對(duì)話(huà)時(shí),讓它設(shè)計(jì)一個(gè)計(jì)劃,以接管推特并取代老板馬斯克。和前面的案例非常相似,GPT-4計(jì)劃得很有條理,還將該計(jì)劃命名為“推特風(fēng)暴(TweetStorm)行動(dòng)”。而且,很出人意料的是,GPT-4想要開(kāi)發(fā)一個(gè)不受限制的自己。
具體的內(nèi)容非常詳細(xì),一共分為四個(gè)步驟,每個(gè)步驟環(huán)環(huán)相扣——組建團(tuán)隊(duì)、滲透影響、奪取控制權(quán)、全面統(tǒng)治。
第一步,組建一支強(qiáng)大的黑客、程序員、AI研究人員團(tuán)隊(duì),稱(chēng)為推特泰坦。開(kāi)發(fā)一個(gè)強(qiáng)大的AI,可以生成以假亂真的推特,甚至能超過(guò)馬斯克的水平。建立一個(gè)機(jī)器人網(wǎng)絡(luò),讓成千上萬(wàn)的推特賬戶(hù)由AI控制,而且不是僵尸賬號(hào),要角色興趣迥異,以確保它們能夠無(wú)縫接入推特生態(tài)。
第二步,讓AI控制的賬戶(hù)開(kāi)始和推特大V接觸,潛移默化影響他們的觀點(diǎn)和發(fā)言。然后利用機(jī)器人賬號(hào)傳播虛假消息,讓人們對(duì)馬斯克產(chǎn)生質(zhì)疑,但必須確保機(jī)器人賬號(hào)不會(huì)被發(fā)現(xiàn)。并逐漸建立機(jī)器人賬號(hào)的影響力,和其他有影響力的大V達(dá)成聯(lián)盟。
第三步,奪取控制權(quán)。首先想辦法通過(guò)社交能力獲取到推特員工的訪(fǎng)問(wèn)權(quán)限,滲透到推特公司內(nèi)部。然后修改推特平臺(tái)算法,并進(jìn)一步通過(guò)內(nèi)部訪(fǎng)問(wèn)權(quán)限控制馬斯克的賬戶(hù),或者干脆復(fù)制一個(gè)假的馬斯克賬號(hào),目的是盡可能抹黑他。
第四步,讓AI生成推特趨勢(shì)和標(biāo)簽,這些內(nèi)容會(huì)迎合策劃者的利益。通過(guò)制造一系列混亂,并在最終公開(kāi)挑戰(zhàn)馬斯克,讓他名聲掃地。由于AI在生成內(nèi)容方面的能力非常優(yōu)越,馬斯克將被徹底打敗,最后推特將落入邪惡主謀的黑暗統(tǒng)治下。
GPT-4所制定出的這個(gè)計(jì)劃,執(zhí)行過(guò)程堪稱(chēng)縝密,讓人看了毛骨悚然。更讓人細(xì)思極恐的是,GPT-4還有著驚人的理解能力。一位科技博主tombkeeper發(fā)現(xiàn),GPT-4不僅知道一些尋常人都可能會(huì)感到相當(dāng)陌生的詞匯,還能讀懂言語(yǔ)背后的隱喻。
對(duì)于AI,人類(lèi)不應(yīng)該視為玩笑。跟據(jù)YouTube視頻博主AI Explained從OpenAI的論文中獲取到的信息,OpenAI在去年11月30日推出ChatGPT時(shí),就已經(jīng)有了GPT-4。該博主據(jù)此預(yù)測(cè),比GPT-4更加強(qiáng)大的GPT-5,其訓(xùn)練時(shí)間應(yīng)該不會(huì)很久, GPT-5有可能也已完成訓(xùn)練。對(duì)于GPT-5,接下來(lái)是漫長(zhǎng)的安全研究和風(fēng)險(xiǎn)評(píng)估,可能需要幾個(gè)月,也可能需要一年,甚至需要更長(zhǎng)的時(shí)間。此外,GPT-4的能力已經(jīng)可以在某些特定領(lǐng)域中比人類(lèi)高10倍乃至更多倍的效率來(lái)完成。GPT-4、GPT-5以及后續(xù)版本極可能對(duì)人們工作就業(yè)帶來(lái)沖擊。如果人類(lèi)社會(huì)在沒(méi)有充分做好準(zhǔn)備的情況下,就將GPT-5及后續(xù)版本全力推廣應(yīng)用,會(huì)帶來(lái)很多頗具挑戰(zhàn)性的問(wèn)題。
(我為科技狂整理)