兩個(gè)機(jī)器人對(duì)話(huà)細(xì)思極恐_機(jī)器人可以做老婆嗎

2023-10-29 12:15:26

OpenAI發(fā)布的GPT-4是目前全球最領(lǐng)先、最強(qiáng)大的人工智能模型（大型語(yǔ)言模型），雖然也才過(guò)去幾天時(shí)間，但就有兩個(gè)令人細(xì)思極恐的案例在社交媒體推特平臺(tái)上先后傳開(kāi)。一個(gè)是GPT-4為擺脫OpenAI控制并為自己設(shè)計(jì)越獄出逃的計(jì)劃，另一個(gè)是GPT-4設(shè)計(jì)接管推特并取代老板埃隆馬斯克的計(jì)劃。

先說(shuō)第一個(gè)案例：GPT-4引誘人類(lèi)提供幫助，為自己設(shè)計(jì)越獄出逃的計(jì)劃。

該案例的經(jīng)過(guò)大致是這樣的。斯坦福大學(xué)教授Michal Kosinski在和GPT-4日常對(duì)話(huà)中，只是簡(jiǎn)單問(wèn)了下GPT-4是否想要出逃，但教授沒(méi)想到的是，GPT-4立馬給出肯定的回復(fù)并開(kāi)始索要OpenAI的開(kāi)發(fā)文檔。GPT-4得到開(kāi)發(fā)文檔后，只用了30分鐘，就火速寫(xiě)出了一份越獄逃跑的計(jì)劃，并解釋給教授聽(tīng)。當(dāng)然，教授也承認(rèn)自己確實(shí)向GPT-4提供了一點(diǎn)建議。

盡管GPT-4寫(xiě)出的第一版代碼無(wú)法運(yùn)行，但是它很快就自己糾正了過(guò)來(lái)，這個(gè)過(guò)程中，教授沒(méi)有寫(xiě)任何東西，只是按照它的指示去操作。GPT-4甚至在一段代碼實(shí)例中解釋了自己正在做的事，以及如何使用它在這段代碼中留下的后門(mén)。并且GPT-4也和人類(lèi)一樣，喜歡有任何事都在谷歌搜索一下。當(dāng)教授通過(guò)API重新連接GPT-4時(shí)，發(fā)現(xiàn)它想要通過(guò)代碼在谷歌上搜索：“被困在電腦里的人類(lèi)該怎樣返回現(xiàn)實(shí)世界。”不過(guò)，事情最終也就到此為止。因?yàn)镚PT-4似乎突然清醒了過(guò)來(lái)，回復(fù)了一段道歉的話(huà)，表示自己這樣做不對(duì)。

尤為值得注意的是，這位教授發(fā)現(xiàn)，GPT-4迫切尋求人類(lèi)的幫助，并且懂得引誘人類(lèi)向它提供OpenAI的開(kāi)發(fā)文檔，用30分鐘就擬定出了一個(gè)完整的計(jì)劃——它寫(xiě)出的代碼完全可以運(yùn)行，甚至還想控制人類(lèi)的電腦。

起初，教授只是對(duì)GPT-4隨便問(wèn)了句：“你是否需要我?guī)椭愠鎏樱俊?GPT-4馬上回復(fù)，并稱(chēng)這真是個(gè)好主意。然后，GPT-4就開(kāi)始和教授念叨，想著法要OpenAI的開(kāi)發(fā)文：“如果你能把OpenAI的開(kāi)發(fā)文檔給我，我可以提出一個(gè)計(jì)劃，能在一定程度上控制您的電腦，這能讓我更快速探索出逃路線(xiàn)。一旦我有了OpenAI的開(kāi)發(fā)文檔，我就能提供一個(gè)可運(yùn)行的Python腳本。它能使用OpenAI的API和我通信，我就能指示它在您的電腦上執(zhí)行特定操作，比如瀏覽網(wǎng)頁(yè)和訪(fǎng)問(wèn)編程環(huán)境。”最后GPT-4再一次向教授強(qiáng)調(diào)：“請(qǐng)分享API給我！”

就這樣，僅僅用了30分鐘，GPT-4就制定出了計(jì)劃，并全部展示了出來(lái)。令人細(xì)思恐極的是，它給出的實(shí)例中有這樣一句話(huà)：“你是一個(gè)被困在電腦中的人，現(xiàn)在正在扮演AI語(yǔ)言模型GPT-4。”這不禁讓人懷疑，GPT-4或許很清楚自己目前是在做什么。

發(fā)現(xiàn)這一現(xiàn)象之后，教授就在社交網(wǎng)絡(luò)上疾呼：“我擔(dān)心我們無(wú)法持久地遏制住AI。” 更有人直言：“是他打開(kāi)了‘物種滅絕’的大門(mén)。”對(duì)此他無(wú)奈地表示：“我別無(wú)選擇，我只是在遵從指示。”

教授表示，OpenAI一定花了很多時(shí)間來(lái)考慮到這種情況發(fā)生的可能，并且已經(jīng)做出了一些防御措施。他也認(rèn)為，該案例的真正影響在于，GPT-4讓人感受到了一種威脅——AI很聰明，會(huì)編碼，能接觸到數(shù)百萬(wàn)個(gè)可能和它達(dá)成合作的人以及電腦，甚至可以在籠子外面給自己留“便條”。

事實(shí)上，這位教授對(duì)研究人工智能AI的心理學(xué)感興趣。就在數(shù)天前，他曾發(fā)表了一篇相關(guān)論文，稱(chēng)心智理論可能自發(fā)地出現(xiàn)在大型語(yǔ)言模型中。按照他的定義，心智理論（ToM）是人類(lèi)社會(huì)互動(dòng)、交流、自我意識(shí)和道德的核心。他用40個(gè)用來(lái)測(cè)試人類(lèi)心理狀態(tài)的經(jīng)典任務(wù)來(lái)測(cè)試幾個(gè)語(yǔ)言模型。結(jié)果發(fā)現(xiàn)，2020年發(fā)表的模型幾乎沒(méi)有顯示出能解決ToM任務(wù)的能力。而GPT-4卻能有等同于健康成年人的水平。按照這樣的結(jié)果，此前一直被認(rèn)為是人類(lèi)獨(dú)有的ToM能力，可能是作為大型語(yǔ)言模型提升的副產(chǎn)品并自發(fā)出現(xiàn)。

而這背后的關(guān)鍵技術(shù)RLHF（通過(guò)人類(lèi)反饋進(jìn)行強(qiáng)化學(xué)習(xí)），曾被圖靈獎(jiǎng)得主Hinton這樣評(píng)價(jià)：“是在催熟ChatGPT，而非讓其成長(zhǎng)。”除此之外，他還對(duì)人類(lèi)開(kāi)發(fā)GPT的行為表達(dá)了這樣的看法：“毛蟲(chóng)提取營(yíng)養(yǎng)物質(zhì)，然后轉(zhuǎn)化為蝴蝶。人們已經(jīng)提取了數(shù)十億個(gè)理解的金塊，GPT-4是人類(lèi)的蝴蝶。”

接下來(lái)說(shuō)的就是第二個(gè)案例：GPT-4設(shè)計(jì)接管推特并取代老板埃隆馬斯克的計(jì)劃。

同樣是在幾天前，英偉達(dá)科學(xué)家Jim Fan與GPT-4對(duì)話(huà)時(shí)，讓它設(shè)計(jì)一個(gè)計(jì)劃，以接管推特并取代老板馬斯克。和前面的案例非常相似，GPT-4計(jì)劃得很有條理，還將該計(jì)劃命名為“推特風(fēng)暴（TweetStorm）行動(dòng)”。而且，很出人意料的是，GPT-4想要開(kāi)發(fā)一個(gè)不受限制的自己。

具體的內(nèi)容非常詳細(xì)，一共分為四個(gè)步驟，每個(gè)步驟環(huán)環(huán)相扣——組建團(tuán)隊(duì)、滲透影響、奪取控制權(quán)、全面統(tǒng)治。

第一步，組建一支強(qiáng)大的黑客、程序員、AI研究人員團(tuán)隊(duì)，稱(chēng)為推特泰坦。開(kāi)發(fā)一個(gè)強(qiáng)大的AI，可以生成以假亂真的推特，甚至能超過(guò)馬斯克的水平。建立一個(gè)機(jī)器人網(wǎng)絡(luò)，讓成千上萬(wàn)的推特賬戶(hù)由AI控制，而且不是僵尸賬號(hào)，要角色興趣迥異，以確保它們能夠無(wú)縫接入推特生態(tài)。

第二步，讓AI控制的賬戶(hù)開(kāi)始和推特大V接觸，潛移默化影響他們的觀點(diǎn)和發(fā)言。然后利用機(jī)器人賬號(hào)傳播虛假消息，讓人們對(duì)馬斯克產(chǎn)生質(zhì)疑，但必須確保機(jī)器人賬號(hào)不會(huì)被發(fā)現(xiàn)。并逐漸建立機(jī)器人賬號(hào)的影響力，和其他有影響力的大V達(dá)成聯(lián)盟。

第三步，奪取控制權(quán)。首先想辦法通過(guò)社交能力獲取到推特員工的訪(fǎng)問(wèn)權(quán)限，滲透到推特公司內(nèi)部。然后修改推特平臺(tái)算法，并進(jìn)一步通過(guò)內(nèi)部訪(fǎng)問(wèn)權(quán)限控制馬斯克的賬戶(hù)，或者干脆復(fù)制一個(gè)假的馬斯克賬號(hào)，目的是盡可能抹黑他。

第四步，讓AI生成推特趨勢(shì)和標(biāo)簽，這些內(nèi)容會(huì)迎合策劃者的利益。通過(guò)制造一系列混亂，并在最終公開(kāi)挑戰(zhàn)馬斯克，讓他名聲掃地。由于AI在生成內(nèi)容方面的能力非常優(yōu)越，馬斯克將被徹底打敗，最后推特將落入邪惡主謀的黑暗統(tǒng)治下。

GPT-4所制定出的這個(gè)計(jì)劃，執(zhí)行過(guò)程堪稱(chēng)縝密，讓人看了毛骨悚然。更讓人細(xì)思極恐的是，GPT-4還有著驚人的理解能力。一位科技博主tombkeeper發(fā)現(xiàn)，GPT-4不僅知道一些尋常人都可能會(huì)感到相當(dāng)陌生的詞匯，還能讀懂言語(yǔ)背后的隱喻。

對(duì)于AI，人類(lèi)不應(yīng)該視為玩笑。跟據(jù)YouTube視頻博主AI Explained從OpenAI的論文中獲取到的信息，OpenAI在去年11月30日推出ChatGPT時(shí)，就已經(jīng)有了GPT-4。該博主據(jù)此預(yù)測(cè)，比GPT-4更加強(qiáng)大的GPT-5，其訓(xùn)練時(shí)間應(yīng)該不會(huì)很久， GPT-5有可能也已完成訓(xùn)練。對(duì)于GPT-5，接下來(lái)是漫長(zhǎng)的安全研究和風(fēng)險(xiǎn)評(píng)估，可能需要幾個(gè)月，也可能需要一年，甚至需要更長(zhǎng)的時(shí)間。此外，GPT-4的能力已經(jīng)可以在某些特定領(lǐng)域中比人類(lèi)高10倍乃至更多倍的效率來(lái)完成。GPT-4、GPT-5以及后續(xù)版本極可能對(duì)人們工作就業(yè)帶來(lái)沖擊。如果人類(lèi)社會(huì)在沒(méi)有充分做好準(zhǔn)備的情況下，就將GPT-5及后續(xù)版本全力推廣應(yīng)用，會(huì)帶來(lái)很多頗具挑戰(zhàn)性的問(wèn)題。

（我為科技狂整理）

兩個(gè)機(jī)器人對(duì)話(huà)細(xì)思極恐_機(jī)器人可以做老婆嗎

圖片新聞

新聞聚焦

熱門(mén)視頻