(相關(guān)資料圖)
在2023年的世界人工智能大會(huì)(WAIC)上,大模型“扎堆”。根據(jù)大會(huì)主辦方此前發(fā)布的內(nèi)容,這次大會(huì)上有30多個(gè)海內(nèi)外大模型登場(chǎng),開(kāi)發(fā)團(tuán)隊(duì)或是分享大模型路徑,或是展示大模型賦能各行各業(yè)的多元生態(tài),都爭(zhēng)相在大模型發(fā)展上有所行動(dòng)或謀得先機(jī)。
如“雨后春筍”般出現(xiàn)的大模型,究竟改變了什么?
它讓“專(zhuān)業(yè)門(mén)檻”變低
一個(gè)初學(xué)者如果學(xué)畫(huà)畫(huà),可能需要練個(gè)幾年,才能畫(huà)出一幅足夠?qū)I(yè)的畫(huà)。
人工智能改變了這一情況。它讓畫(huà)畫(huà)的“專(zhuān)業(yè)門(mén)檻”變低,僅僅輸入一些文字,一幅美輪美奐的作品便在短時(shí)間里生成了。
在大會(huì)的一場(chǎng)論壇上,商湯科技董事長(zhǎng)兼CEO徐立在生成式大模型“商湯秒畫(huà)SenseMirage3.0”上輸入一些提示詞:中國(guó)龍、藍(lán)色擺件、珠寶風(fēng)格。
看似簡(jiǎn)單,但徐立說(shuō),該大模型可以根據(jù)大眾認(rèn)知,自動(dòng)“補(bǔ)齊”提示詞,讓生成的圖片細(xì)節(jié)更豐富。
在“補(bǔ)齊”提示詞后,該大模型呈現(xiàn)的是:一張中國(guó)龍3D渲染圖,具有精細(xì)的圖案。龍站在一片藍(lán)色“瑪瑙海”上,增添了深度和神秘感……
7月6日至8日,2023世界人工智能大會(huì)在上海舉辦。 鄭瑩瑩 攝它讓“數(shù)據(jù)家族”發(fā)生改變
因?yàn)閿?shù)據(jù)安全問(wèn)題,很多企業(yè)不敢讓數(shù)據(jù)“流通”起來(lái)。
大模型下,“數(shù)據(jù)家族”悄然發(fā)生變化。
星環(huán)科技創(chuàng)始人、CEO孫元浩認(rèn)為,運(yùn)用大模型對(duì)數(shù)據(jù)進(jìn)行分類(lèi)分級(jí),可能是個(gè)新嘗試。
他認(rèn)為,大模型用的數(shù)據(jù)可以分為四類(lèi):第一類(lèi)是感知類(lèi)數(shù)據(jù),如視覺(jué)數(shù)據(jù)、語(yǔ)音數(shù)據(jù)等。第二類(lèi)是事實(shí)類(lèi)數(shù)據(jù),過(guò)去很多行業(yè)已經(jīng)能將這類(lèi)數(shù)據(jù)結(jié)構(gòu)化,但需要借助大模型將其變化歷史找出來(lái),組成完整語(yǔ)義;第三類(lèi)是知識(shí)類(lèi)數(shù)據(jù),過(guò)去很多這類(lèi)數(shù)據(jù)并沒(méi)有被有效利用,大模型出現(xiàn)以后有望助力改變這一情況;第四類(lèi)數(shù)據(jù)是方法論類(lèi)數(shù)據(jù)。
孫元浩說(shuō),從感知類(lèi)、事實(shí)類(lèi)、知識(shí)類(lèi)到方法論類(lèi),所有的數(shù)據(jù)向大模型輸入時(shí)都需要轉(zhuǎn)化為大模型能理解的語(yǔ)言,因此“大模型時(shí)代”,數(shù)據(jù)產(chǎn)業(yè)鏈需要各種工具以及各種類(lèi)型的數(shù)據(jù)庫(kù),這樣才能真正把大模型用起來(lái)。
它讓產(chǎn)業(yè)變“活”
大模型改變了什么?這對(duì)致力于搭“數(shù)據(jù)樂(lè)高”的數(shù)庫(kù)科技創(chuàng)始人兼CEO劉彥來(lái)說(shuō),并不難回答。
他的團(tuán)隊(duì)把SAM(Segment Analysis& Mapping)產(chǎn)業(yè)鏈數(shù)據(jù)體系升級(jí)為UPG(Universal Product Graph)產(chǎn)業(yè)鏈數(shù)據(jù)體系,“UPG不但有SAM的框架,同時(shí)它可以疊加工藝、生產(chǎn)環(huán)節(jié)、材質(zhì)、設(shè)備等各種類(lèi)型的關(guān)系。”
換句話(huà)說(shuō),大模型的出現(xiàn),讓該企業(yè)搭“數(shù)字樂(lè)高”的能力更強(qiáng)了。
劉彥說(shuō),原來(lái)要“提煉”這些關(guān)系很難,大語(yǔ)言模型可以跑海量數(shù)據(jù)、快速生成這些關(guān)系,大大提高了效率。
螳螂捕蟬,黃雀在后。當(dāng)大模型“運(yùn)動(dòng)員”越來(lái)越多的時(shí)候,大模型“考官”出現(xiàn)了。
今年的世界人工智能大會(huì)上,作為“鎮(zhèn)館之寶”之一,“蟻鑒AI安全檢測(cè)平臺(tái)2.0”(簡(jiǎn)稱(chēng):蟻鑒2.0)受到關(guān)注。螞蟻集團(tuán)大安全事業(yè)群技術(shù)部總裁李俊奎表示,“生成式大模型是一種‘深黑盒’技術(shù),‘蟻鑒2.0’很像一個(gè)24小時(shí)不眠不休的‘安全黑客’,致力于找出大模型存在的弱點(diǎn)和安全問(wèn)題。這種AI對(duì)AI的評(píng)測(cè),好比‘生成式考官’考核‘生成式運(yùn)動(dòng)員’,也是教學(xué)相長(zhǎng)。”
7月6日至8日,2023世界人工智能大會(huì)在上海舉辦。 湯彥俊 攝它讓“智能未來(lái)”更具挑戰(zhàn)
大模型有了,大模型下的“智能世界2.0”就能來(lái)了嗎?
還沒(méi)有。生成式大模型,以概率的方式生成內(nèi)容,會(huì)生成似是而非的內(nèi)容,這也被稱(chēng)為“幻覺(jué)問(wèn)題”。
如何讓語(yǔ)料更精準(zhǔn)、讓大模型減少“幻覺(jué)問(wèn)題”,業(yè)界在努力。
上海數(shù)據(jù)交易所總經(jīng)理湯奇峰在大會(huì)上稱(chēng),大模型建設(shè)中,語(yǔ)料庫(kù)是一個(gè)非常重要的方面。上海數(shù)據(jù)交易所致力于建設(shè)高質(zhì)量的語(yǔ)料庫(kù),推動(dòng)人工智能大模型產(chǎn)業(yè)的發(fā)展。
在今年的世界人工智能大會(huì)上,中國(guó)電信發(fā)布行業(yè)大模型Telechat。據(jù)中國(guó)電信數(shù)字智能科技分公司副總經(jīng)理何忠江介紹,Telechat依托中國(guó)電信云網(wǎng)融合優(yōu)勢(shì),利用自研技術(shù)增強(qiáng)大模型的預(yù)訓(xùn)練和推理能力,減少大模型“幻覺(jué)現(xiàn)象”;同時(shí),Telechat大模型正在與千行百業(yè)的信息化解決方案進(jìn)行融合,以滿(mǎn)足多樣場(chǎng)景需求。(完)