新華通訊社主管

首頁 >> 正文

超級大腦!AI大模型有望重塑信息產(chǎn)業(yè)格局
我國應用市場巨大,亟待突破技術(shù)、人才、成本等瓶頸
2022-01-06 記者 烏夢達 趙旭 北京報道 來源: 經(jīng)濟參考報

  《經(jīng)濟參考報》記者近日調(diào)研獲悉,AI(人工智能)大模型相當于“超級大腦”,正成為人工智能“新高地”。AI大模型有望實現(xiàn)人工智能從感知到認知的躍遷,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標準,給部分產(chǎn)業(yè)帶來重大變革。我國有較大的AI大模型應用市場,但發(fā)展過程中面臨部分技術(shù)薄弱、人才稀缺、成本高昂等多重挑戰(zhàn),亟須對相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局加以引導和支持。

趙乃育 繪

  “學富五車”的“超級大腦”

  ——“不開心的話可以聽點開心的歌,看看喜劇,也可以去運動,或者好好休息一下。”

  ——“心情不好是一種很正常的情緒,所以不用太過自責?!?/p>

  針對“今天心情不好應該怎么辦”這一問題,一個人工智能平臺以不同的“人設”,給出了不同的回答。通過網(wǎng)址鏈接進入該平臺,在“人設問答”區(qū)隨機輸入問題,機器可支持和扮演不同“人設”,對問題給出多角度答案。該平臺正是基于AI大模型打造而成。

  創(chuàng)新工場首席科學家、北京瀾舟科技創(chuàng)始人周明介紹,AI大模型也稱人工智能預訓練模型,將海量數(shù)據(jù)導入具有幾億量級甚至十萬億量級參數(shù)的模型中,機器通過做類似“完形填空”等任務,深度學習數(shù)據(jù)中蘊含的特征、結(jié)構(gòu),最終被訓練成具有邏輯推理和分析能力的人工智能。

  通俗地說,AI大模型相當于做了無數(shù)套關(guān)于各領(lǐng)域知識練習題、模擬題的“超級大腦”,深諳各領(lǐng)域知識內(nèi)在邏輯和解題思路,既能理解人類世界的知識體系,也可能產(chǎn)出新的知識。

  2018年起,人工智能進入“大模型時代”,由重復開發(fā)、手工作坊式人工智能,即“一千個應用場景就有一千個小模型”的零散、低效局面,走向工業(yè)化、集成化智能的全新路徑,以一個大模型“走天下”,為通用人工智能帶來曙光。比如,為生產(chǎn)智能音響,各個品牌競相開發(fā)各自的AI小模型,未來各品牌只需在同一個AI大模型基礎上開發(fā)即可。

  “以前是‘碎片化’的人工智能,針對不同的應用場景要開發(fā)不同的模型。作坊式開發(fā)對資源、成本造成較大消耗,且效率低下。未來在各垂直領(lǐng)域落地時,只需基于一個大模型,對其參數(shù)進行微調(diào)即可,這樣就打造出了具有通用性質(zhì)的人工智能?!比A為云人工智能領(lǐng)域首席科學家、國際歐亞科學院院士田奇介紹,AI大模型將重新定義人工智能產(chǎn)業(yè)模式、產(chǎn)業(yè)標準,甚至產(chǎn)業(yè)倫理。

  受訪者舉例介紹,以前的小模型就像“偏科的機器”,只學習針對特定應用場景的有限數(shù)據(jù),“舉一反三”能力不足,一些智能產(chǎn)品被用戶調(diào)侃為“人工智障”的情況時有發(fā)生。而AI大模型則學習了各行各業(yè)各類數(shù)據(jù),成為具備良好的知識遷移能力的“通才”,適用領(lǐng)域更廣,產(chǎn)出內(nèi)容質(zhì)量更高,更加智能。

  同時,周明指出,大模型的發(fā)展并非一味追求參數(shù)量大,而是聚焦模型的高性能,“在讓大模型學習和掌握更大量數(shù)據(jù)的同時,盡可能讓大模型參數(shù)相對輕量化,在‘減負’的同時提高能效?!?/p>

  可分飾多角 應用場景廣泛

  自動問診、產(chǎn)品營銷、小說續(xù)寫……由于懂得人類語言,且具備細分行業(yè)專業(yè)知識,一個AI大模型可分飾多角,它做得了醫(yī)生,當?shù)昧俗骷?,勝任得了情感博主,從事得了電商客服…?/p>

  AI大模型行業(yè)適用范圍廣,在醫(yī)療、金融、零售、氣象、新聞傳播、文學藝術(shù)等領(lǐng)域具有廣泛應用場景。周明介紹,在大模型中輸入關(guān)鍵詞、主題、文本風格等控制屬性后,即可生成滿足約束條件的文本內(nèi)容,可用于產(chǎn)品營銷文案寫作、電商智能客服等。在金融等領(lǐng)域,大模型通過抓取行業(yè)數(shù)據(jù),自主完成篩選、分析,并自主撰寫生成行業(yè)報告,輔助從業(yè)人員做決策。

  田奇介紹,AI大模型已應用于國網(wǎng)電力部門的日常線路檢測?!耙郧耙R別各種電力傳輸線上的缺陷,需要針對每一類缺陷單獨做一個小模型,有幾百種缺陷就要做幾百種模型,現(xiàn)在利用一個大模型就可完成各類缺陷的識別?!?/p>

  值得注意的是,AI大模型目前的技術(shù)進步,是人工智能從感知向認知演進的關(guān)鍵環(huán)節(jié)。清華大學計算機科學與技術(shù)系副教授劉知遠表示,古今中外一切文章、資料,都可作為訓練大模型的數(shù)據(jù)。通過分析并“內(nèi)化”海量知識,不僅讓智能產(chǎn)品擁有更高性能,如機器翻譯更加準確、機器寫作更加生動有邏輯;還能品讀人類情感,用于情感標注。此外,“它可能識別到‘弦外之音’,甚至有希望發(fā)現(xiàn)人類未曾掌握的知識?!?/p>

  這一技術(shù)的發(fā)展,也可能給部分產(chǎn)業(yè)帶來重大變革。周明說,未來將產(chǎn)生新一代搜索引擎?!澳壳按蟛糠炙阉饕媸腔陉P(guān)鍵詞識別,只將庫里已有的包含關(guān)鍵詞的結(jié)果‘搬運’給用戶,而基于大模型的新一代搜索引擎,通過理解人類語言,可以自主生成回答,且支持文字、圖片、音頻、視頻等多模態(tài)搜索。”

  田奇表示,新一代搜索引擎具備創(chuàng)作能力,比如搜索“長翅膀的貓”“會飛的豬”等現(xiàn)實中不存在的事物,搜索引擎也可根據(jù)描述生成相應照片。

  多重發(fā)展難題待解

  當前,美國OpenAI、谷歌、微軟、臉書、英偉達等海外公司紛紛布局AI大模型產(chǎn)業(yè),國內(nèi)的華為、阿里巴巴、百度等大型企業(yè),以及高校、科研機構(gòu)也加入研發(fā)賽道。AI大模型正成為人工智能“新高地”。

  記者調(diào)研了解到,從技術(shù)上講,國內(nèi)AI大模型已初步成熟,下一步將聚焦行業(yè)推廣,并結(jié)合具體問題對模型進行迭代。田奇預測,AI大模型的大規(guī)模應用“可能還需要兩到三年時間”,且未來AI大模型還有望集納于芯片上,更方便落地應用。

  專家指出,我國有較大的AI大模型應用市場,在應用領(lǐng)域具有優(yōu)勢,但發(fā)展過程中也面臨一些挑戰(zhàn)。

  劉知遠介紹,很多核心技術(shù)目前仍然掌握在發(fā)達國家手中,訓練AI大模型需大量GPU(圖形處理器)芯片,但當前國產(chǎn)GPU芯片技術(shù)相對薄弱。同時,我國在算法上的原始創(chuàng)新能力也有待提升。

  多位受訪者表示,目前從事AI大模型研發(fā)且能產(chǎn)出創(chuàng)新性成果的高校、科研機構(gòu)和企業(yè)屈指可數(shù),與國外相比,我國相關(guān)領(lǐng)域高水平基礎人才培養(yǎng)力度有待加強。

  此外,訓練大模型需要較高的電力成本、設備成本等,很多中小企業(yè)、科研單位囿于高昂成本,無法搭建擁有充足算力的機房,面臨算力不足的問題。

  多措并舉搶占“新高地”

  多位專家表示,AI大模型有望實現(xiàn)人工智能從感知到認知的躍遷,將更高效地賦能AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化。相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局引導、配套支持政策、合理監(jiān)管等舉措能否有效落地至關(guān)重要。

  首先,推進AI大模型標準化。受訪專家指出,大模型的訓練過程具有高能耗的特點,制定標準后,許多工作可基于已經(jīng)開發(fā)的標準化大模型進行適配和二次開發(fā),無需每次從頭訓練,以降低能耗。同時,大模型發(fā)展的過程中,也可能衍生違法違規(guī)信息生成、隱私泄露、虛假信息傳播等風險,對用于訓練模型的源頭數(shù)據(jù)等做好規(guī)范,有利于規(guī)避相關(guān)風險。國家相關(guān)部門可牽頭或引導企業(yè)、研究所、高校等共同定義大模型的標準。

  其次,適當開放訓練數(shù)據(jù)。受訪者表示,訓練大模型需要海量數(shù)據(jù),出于對數(shù)據(jù)的隱私、安全等方面的擔憂,一些領(lǐng)域難以獲取數(shù)據(jù),形成數(shù)據(jù)孤島。建議在國家機構(gòu)監(jiān)管和宏觀把控的前提下,各方數(shù)據(jù)能夠?qū)Π酌麊纹髽I(yè)、機構(gòu)、高校適當開放,在確保數(shù)據(jù)安全使用的同時,增強我國AI大模型實力。例如,醫(yī)院等機構(gòu)適當開放數(shù)據(jù),將有利于訓練更懂醫(yī)療的大模型,賦能健康醫(yī)藥領(lǐng)域發(fā)展。

  再次,鼓勵算力共享。記者調(diào)研了解到,目前只有部分大企業(yè)能夠負擔超大模型訓練所需的算力成本。受訪專家呼吁,可引導具有強算力的人工智能“國家隊”,為更多中小微企業(yè)、科研單位提供大模型訓練所需的算力支撐,可探索合理付費的算力共享機制,共同促進技術(shù)的發(fā)展和資源的節(jié)約。

  最后,加大原始創(chuàng)新引導和支持。多位專家指出,我國應加強研發(fā)力度,同時加強針對模型框架的基礎創(chuàng)新研究,引導更多科研單位、高校積極培養(yǎng)相關(guān)人才,鼓勵更多社會力量加入這場信息革命的浪潮。

?

凡標注來源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數(shù)字媒體產(chǎn)品,版權(quán)均屬經(jīng)濟參考報社,未經(jīng)經(jīng)濟參考報社書面授權(quán),不得以任何形式刊載、播放。獲取授權(quán)
矩形廣告大

超級大腦!AI大模型有望重塑信息產(chǎn)業(yè)格局

超級大腦!AI大模型有望重塑信息產(chǎn)業(yè)格局

AI大模型有望實現(xiàn)人工智能從感知到認知的躍遷,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標準,給部分產(chǎn)業(yè)帶來重大變革。

·喚醒沉睡資產(chǎn) “農(nóng)地入市”助力鄉(xiāng)村振興

經(jīng)濟參考報社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)經(jīng)濟參考報協(xié)議授權(quán),禁止轉(zhuǎn)載使用

新聞線索提供熱線:010-63074375 63072334 報社地址:北京市宣武門西大街57號

JJCKB.CN 京ICP備18039543號