新華通訊社主管

首頁 >> 正文

度小滿開源千億參數(shù)金融大模型“軒轅”
2023-05-31 記者 沈寅飛 北京報道 來源: 經(jīng)濟(jì)參考報

  記者從度小滿獲悉,近日,度小滿正式開源國內(nèi)首個千億級中文金融大模型——“軒轅”。

  據(jù)介紹,軒轅大模型是在1760億參數(shù)的Bloom大模型基礎(chǔ)上訓(xùn)練而來,在金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等任務(wù)上,效果相較于通用大模型大幅提升,表現(xiàn)出明顯的金融領(lǐng)域優(yōu)勢。在金融場景中的任務(wù)評測中,軒轅全面超越了市場上的主流開源大模型,贏得了150次回答中63.33%的勝率,充分凸顯了其在金融領(lǐng)域的顯著優(yōu)勢。在通用能力評測中,軒轅有10.2%的任務(wù)表現(xiàn)超越ChatGPT 3.5,61.22%的任務(wù)表現(xiàn)與之持平,涉及數(shù)學(xué)計算、場景寫作、邏輯推理、文本摘要等13個主要維度。

  為了提升軒轅大模型對金融領(lǐng)域問題的理解能力,度小滿將自身業(yè)務(wù)中積累的金融領(lǐng)域的千億tokens的中文預(yù)訓(xùn)練數(shù)據(jù)集用來訓(xùn)練模型。該數(shù)據(jù)集涵蓋了金融研報、股票、基金、銀行、保險等各個方向的專業(yè)知識。經(jīng)過清洗和標(biāo)注的高質(zhì)量數(shù)據(jù)集,不僅在通用性方面與ChatGPT達(dá)到持平成為可能,且顯著提升了模型在金融垂直領(lǐng)域的性能。

  目前,千億級的軒轅模型已可以在Huggingface中申請下載,面向所有金融機(jī)構(gòu)開放。

  “軒轅大模型是經(jīng)度小滿業(yè)務(wù)場景中積累的金融數(shù)據(jù)訓(xùn)練而來的,對金融相關(guān)問題的理解比通用大模型更有優(yōu)勢?!倍刃MCTO許冬亮說,我們把大模型能力開放給金融機(jī)構(gòu),有利于推動大模型在金融行業(yè)的應(yīng)用,降低大模型的應(yīng)用門檻,提升金融行業(yè)智能化水平。

  對于軒轅大模型開源后,對金融機(jī)構(gòu)的意義。許冬亮認(rèn)為,生成式大模型在內(nèi)容生成與創(chuàng)作、信息摘要與總結(jié)、知識理解與問答、自然交互與對話等方面具備非常出色的能力,在金融場景中會有廣泛的應(yīng)用。

?

凡標(biāo)注來源為“經(jīng)濟(jì)參考報”或“經(jīng)濟(jì)參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數(shù)字媒體產(chǎn)品,版權(quán)均屬經(jīng)濟(jì)參考報社,未經(jīng)經(jīng)濟(jì)參考報社書面授權(quán),不得以任何形式刊載、播放。獲取授權(quán)

官方平臺“一票難求” 加價倒票“大行其道”

官方平臺“一票難求” 加價倒票“大行其道”

混亂的購票秩序、遠(yuǎn)高定價的“黃牛票”,嚴(yán)重困擾觀眾體驗(yàn),擾亂市場秩序。

·一片樹葉里的高質(zhì)量發(fā)展密碼

經(jīng)濟(jì)參考報社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)經(jīng)濟(jì)參考報協(xié)議授權(quán),禁止轉(zhuǎn)載使用

新聞線索提供熱線:010-63074375 63072334 報社地址:北京市宣武門西大街57號

JJCKB.CN 京ICP備18039543號