
中國工程院院士陳曉紅
未來,多模態大模型將和搜索引擎、知識圖譜、博弈對抗、腦認知等技術進一步融合互促,朝著更智能、更通用的方向發展,應對更加復雜豐富的環境、場景和任務
大模型基于深度神經網絡,為黑盒模型,在語言大模型的涌現能力、規模定律,多模態大模型的知識表示、邏輯推理能力、泛化能力、情景學習能力等方面,還存在一些盲區和薄弱環節,相關技術有待持續突破
積極推進云計算平臺建設,打造以算力網絡為核心的新型基礎設施,以網強算,提供強大算力資源和相應服務
文 |《瞭望》新聞周刊記者 張玉潔
當前,眾多科技企業都在圍繞人工智能(AI)大模型擴張商業版圖。
“大模型正產生著史無前例的影響力。從趨勢看,大模型的發展能夠催生通用人工智能,將引領千行百業數智化創新發展?!敝袊こ淘涸菏?、湘江實驗室主任、湖南工商大學黨委書記陳曉紅告訴《瞭望》新聞周刊記者。
大模型經過大規模數據訓練后,能夠適應一系列任務,具有參數規模大、訓練數據規模大和算力消耗需求大等特點。盡管技術發展突飛猛進,但仍受到可靠性差、訓練數據依賴、因果推理能力弱、搭建成本高等的制約,并面臨尋找合適落地場景的挑戰。
近年來,陳曉紅率領團隊在先進計算與人工智能領域取得了一批原創性、系統性成果,并在大模型技術上積極探索?!拔覀儗⒁詮娀A、促應用、保安全的思路推動發展,以體系化工程思路進行科技攻關?!标悤约t說。
把握AI大模型發展生態和趨勢
《瞭望》:AI大模型經歷了怎樣的發展歷程?
陳曉紅:就發展速度而言,超級智能的到來比我們想象的更快。當前,AI技術已步入了大模型時代,并成為了全球創新的焦點。
自2006年神經網絡有效學習獲得重要的優化途徑至今,基于深度學習的AI技術研究范式,經歷了從小數據到大數據,從小模型到大模型,從專用到通用的發展歷程。2022年底,依托“大模型+大數據+大算力”加持的語言大模型ChatGPT,具備了多場景、多用途、跨學科的任務處理能力。這類大模型技術能廣泛應用于經濟、法律等眾多領域,在全球范圍掀起了大模型發展熱潮。
大模型技術本身的發展也經歷了架構演進統一、訓練方式轉變、模型高效適配等過程,且正由單一模態的語言大模型,向融合語言、視覺、聽覺等多模態的大模型發展。數據顯示,過去5年,參數量超過百億的大模型全球已有45個左右。
我國在大模型領域擁有良好基礎,具有強烈需求,具備廣闊市場。近年來,國產大模型加速發展,“文心一言”在半年時間內迭代到了4.0版本,其理解、生成、邏輯、記憶四大能力都有顯著提升。數據顯示,我國有至少130家公司研究大模型產品,其中通用大模型78家,100億級參數規模以上的大模型超過10個,10億級參數規模以上的大模型已近80個,大模型數量位居世界第一梯隊。
湘江實驗室作為聚焦先進計算與人工智能領域的高能級科創平臺,正集中力量在大模型領域積極攻關,力爭早日推出面向行業領域的“軒轅”大模型,賦能智慧交通、智能制造、智慧醫療和元宇宙等行業產業高質量發展。
《瞭望》:怎樣評價大模型在技術創新和落地應用方面的發展趨勢?
陳曉紅:當前,大模型“基礎設施—底層技術—基礎通用—垂直應用”的發展路線逐漸清晰。大模型技術生態正蓬勃發展,其主流趨勢是開源服務與開放生態。得益于國內外大模型開放平臺、開源模型、框架、工具與公開數據集等,大模型技術正加速演進。
大模型服務平臺方面,向個人開放及商業落地應用延伸是主要趨勢。如用戶可以通過OpenAI API這一服務平臺,訪問不同的深度學習模型,進而完成下游任務。
在大模型開源生態方面,得益于開源框架的有效支撐,大規模模型的訓練日趨成熟。例如飛槳作為國產的深度學習平臺,集深度學習核心框架、基礎模型庫、端到端開發套件、工具組件于一體,可在自然語言處理、計算機視覺等多個領域模型的分布式訓練中發揮重要作用。
大模型技術與實體經濟加速融合,應用場景十分廣泛。例如大模型+教育可以讓教育方式更智能、更個性化;大模型+醫療能夠賦能醫療機構的診療全過程;大模型+娛樂能夠通過增強人機互動提升趣味性和娛樂性等等。正是在與教育、醫療、傳媒藝術等千行百業的深度融合中,通用大模型的能力邊界不斷拓廣,改變著人類社會的生產生活方式。
總之,大模型+軟硬件+數據資源的上游發展生態勢頭強勁,大模型+應用場景的下游應用生態層出不窮,大模型正加速在全產業智能升級中形成關鍵支撐。未來,多模態大模型將和搜索引擎、知識圖譜、博弈對抗、腦認知等技術進一步融合互促,朝著更智能、更通用的方向發展,應對更加復雜豐富的環境、場景和任務。我們要搶抓重要機遇,加快大模型更好賦能千行百業的步伐。
認清AI大模型發展的風險與挑戰
《瞭望》:當前AI大模型發展還面臨哪些挑戰?
陳曉紅:隨著大模型日趨廣泛的部署應用,帶來的風險與挑戰不容忽視,需引起高度關注。
首先,可解釋性仍然存在不足。大模型基于深度神經網絡,為黑盒模型,在語言大模型的涌現能力、規模定律,多模態大模型的知識表示、邏輯推理能力、泛化能力、情景學習能力等方面,還存在一些盲區和薄弱環節,相關技術有待持續突破。
其次,可靠性保障有待提升?;诤A繑祿柧毜恼Z言大模型,其合成內容在事實性、時效性等方面存在較多的問題,尚無法對所合成內容做出可靠評估。同時,大模型可能吸收和反映數據中存在的不當、偏見或歧視性等內容,從而產生仇恨辱罵、偏見歧視以及誤導性的輸出。
第三,部署代價高、遷移能力不足亟需解決。大模型的參數規模和數據規模非常巨大,訓練和推理的算力需求量大、功耗高、應用成本高,而且端側推理存在延遲等問題,這些限制了它的落地應用。同時,大模型作用的發揮依賴訓練數據所覆蓋的場景,依賴數據規模、廣度、質量和精度。由于復雜場景數據不足、精度不夠,大模型存在特定場景適用性不足的問題,面臨泛化性等挑戰。
第四,安全與隱私保護待加強。數據投毒攻擊、模型竊取攻擊、對抗樣本攻擊、指令攻擊、后門攻擊等多種攻擊方式,對大模型相關應用部署造成隱患。同時,在大模型訓練過程中,各類敏感隱私數據可能被編碼進大模型參數中,存在通過提示信息誘發隱私數據泄露的可能。
第五,伴生技術風險需警惕。語言大模型與語音合成、圖像視頻生成等技術結合,可以產生人類難以辨別的音視頻等逼真多媒體內容,可能會被濫用于制造虛假信息、惡意引導行為,誘發輿論攻擊,危害國家安全。

在百度世界大會2023現場,參會者在展區試用百度“文心一言”(2023年10月17 日攝) 張漫子攝/本刊
推動AI大模型更好賦能千行百業
《瞭望》:如何推動大模型服務經濟社會高質量發展?
陳曉紅:應抓緊推動大模型技術研發,強化垂直行業數據基礎優勢,同時加強對大模型的風險監督,彰顯AI的技術屬性和社會屬性。具體有以下建議:
一是推動大模型技術棧自主可控。首先,加強宏觀規劃和頂層設計,制定大模型發展綱要。加強在大模型核心環節和相關技術上的知識產權布局。積極組建包括由芯片、云計算、互聯網、應用等上下游企業組成的產業發展聯盟,支持產學研三方協同的大模型研發模式,鼓勵相關企業基于大模型進行數字化轉型升級。其次,加強大模型原始技術創新和大模型軟硬件生態建設,提升大模型構建所需基礎軟件的自主可控性,鼓勵企事業單位在開展大模型訓練和推理時,更多使用國產深度學習框架;引導國產芯片廠商基于國產框架開展與大模型的適配和融合優化。
二是破解大模型訓練過程中算力緊缺問題。首先,支持推動分布式計算技術的研究創新,提高算力的可擴展性和效率,促進產生計算集群,從而形成更大規模的計算能力。其次,積極推進云計算平臺建設,打造以算力網絡為核心的新型基礎設施,以網強算,提供強大算力資源和相應服務;通過實施資金支持、稅收優惠、知識產權保護等激勵措施,鼓勵企業和研究機構投資和研發與大模型算力相關的技術和設施,形成支撐大模型發展的強大基礎。
三是技術驅動提升大模型的安全性。首先,設計系統的分類法,研究集成大模型應用中的潛在漏洞,有針對性地應對信息搜集、入侵、內容操縱、欺詐、惡意軟件、服務可用性降低等攻擊,研發大模型安全對齊、安全評估技術,發展大模型安全增強技術,提升訓練數據的安全性,優化安全對齊訓練算法,提高AI的魯棒性和抗干擾性,不斷提升透明性、可解釋性、可靠性、可控性,逐步實現可審核、可監督、可追溯、可信賴。其次,加強對AI大模型發展的潛在風險研判和防范,對生成式AI服務實行包容審慎和分類分級監管,強化大模型安全監管措施;將倫理道德融入AI全生命周期,構建AI倫理治理標準體系,使模型的設計和訓練嚴格遵循倫理準則。
四是構建大模型合規標準和評測平臺。首先,制定AI的合規標準和開發指南,全面覆蓋大模型的研發、訓練和部署過程中的安全要求,制定相應的安全標準、準則,重點開展AI安全術語、AI安全參考框架、AI基本安全原則和要求等標準的研制;構建對大模型能力水平進行評估的方法體系,包括數據采集和使用的透明度和合法性,隱私保護措施,以及對敏感主題和內容的處理原則,確保大模型的研發應用符合道德和法律要求。其次,搭建科學有效的評測平臺,制定一套針對中文背景下大模型評測的規范和方法論,明確評測過程中的數據準備、評估指標、測試方法等,并提供統一標準,依托平臺開展針對不同領域和應用的多樣化評測任務,從而準確研判不同模型的性能和效果。
五是構建協同推動大模型發展的機制。首先,探索加強學術界和企業界間常態化合作機制,鼓勵高校和企業設立聯合研究中心、實驗室或合作項目,推動兩者之間的數據共享和協同研究,以增進對大模型訓練數據的理解和分析,幫助學術界更好地理解大模型的特性和潛在風險,幫助企業界進一步改進算法和模型的安全性。其次,促進優秀人才的培養和交流,通過建立博士生聯合培養計劃、研究人員赴企實地駐點訪問等方式,促進校企之間拔尖人才的培養和交流。■





