3月16日,文心大模型4.5和文心大模型X1正式發(fā)布! 目前,兩款模型已在文心一言官網(wǎng)上線,免費向用戶開放。(https://yiyan.baidu.com) 同時,文心大模型4.5已上線百度智能云千帆大模型平臺,企業(yè)用戶和開發(fā)者登錄即可調(diào)用API;文心大模型X1也即將在千帆上線。百度搜索、文小言APP等產(chǎn)品,將陸續(xù)接入文心大模型4.5和文心大模型X1,為用戶帶來更多元的體驗。 文心大模型4.5:原生多模態(tài)基礎(chǔ)大模型 文心大模型4.5是百度自主研發(fā)的新一代原生多模態(tài)基礎(chǔ)大模型,通過多個模態(tài)聯(lián)合建模實現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進(jìn)的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。 多模態(tài)能力 文本能力 文心大模型4.5具備優(yōu)秀的多模態(tài)理解能力,能對文字、圖片、音頻、視頻等內(nèi)容進(jìn)行綜合理解。例如,針對下面這道題,文心大模型4.5綜合理解了圖中的文字與圖表內(nèi)容,提取出題目考查的重點;并給出詳細(xì)的解題步驟和細(xì)化的選項分析,最終得出正確答案。 不僅是“高智商”,文心大模型4.5也擁有“高情商”,網(wǎng)絡(luò)梗圖、諷刺漫畫等等,理解起來都不在話下。例如,在下文中,這張梗圖蘊含著“連續(xù)不一定可倒(導(dǎo))、可倒(導(dǎo))一定連續(xù)”的數(shù)學(xué)概念,文心大模型4.5不僅秒懂,點出梗圖的巧妙和幽默;還能詳細(xì)對其中蘊含的數(shù)學(xué)概念和畫面邏輯進(jìn)行解釋。 文心大模型4.5能力顯著增強(qiáng),離不開這些關(guān)鍵技術(shù): ◎ FlashMask動態(tài)注意力掩碼:加速大模型靈活注意力掩碼計算,有效提升長序列建模能力和訓(xùn)練效率,優(yōu)化長文處理能力和多輪交互表現(xiàn); ◎ 多模態(tài)異構(gòu)專家擴(kuò)展技術(shù):根據(jù)模態(tài)特點構(gòu)建模態(tài)異構(gòu)專家,結(jié)合自適應(yīng)模態(tài)感知損失函數(shù),解決不同模態(tài)梯度不均衡問題,提升多模態(tài)融合能力; ◎ 時空維度表征壓縮技術(shù):在時空維度對圖片和視頻的語義表征進(jìn)行高效壓縮,大幅提升多模態(tài)數(shù)據(jù)訓(xùn)練效率,增強(qiáng)了從長視頻中吸取世界知識的能力; ◎ 基于知識點的大規(guī)模數(shù)據(jù)構(gòu)建技術(shù):基于知識分級采樣、數(shù)據(jù)壓縮與融合、稀缺知識點定向合成技術(shù),構(gòu)建高知識密度預(yù)訓(xùn)練數(shù)據(jù),提升模型學(xué)習(xí)效率,大幅降低模型幻覺; ◎ 基于自反饋的Post-training技術(shù):融合多種評價方式的自反饋迭代式后訓(xùn)練技術(shù),全面提升強(qiáng)化學(xué)習(xí)穩(wěn)定性和魯棒性,大幅提升預(yù)訓(xùn)練模型對齊人類意圖能力。 文心大模型X1:能力更全面的深度思考模型 文心大模型X1具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),是首個自主運用工具的深度思考模型。作為能力更全面的深度思考模型,文心大模型X1兼?zhèn)錅?zhǔn)確、創(chuàng)意和文采,在中文知識問答、文學(xué)創(chuàng)作、文稿寫作、日常對話、邏輯推理、復(fù)雜計算及工具調(diào)用等方面表現(xiàn)尤為出色。 作為能自主運用工具的大模型,文心大模型X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網(wǎng)頁鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢等多款工具。 例如,讓文心大模型X1使用中國各朝代歷史人物典故,替換《寒窯賦》原文中的事例,它展現(xiàn)出清晰的思維鏈:找到和原文相似的人物典故→注意文風(fēng)和句式→檢查人物典故的適配度→行文保持結(jié)構(gòu)流暢,最后生成了和原文立意、文風(fēng)句式都基本一致的文本 文心大模型X1能力的全面提升,得益于這些關(guān)鍵技術(shù)的支撐: ◎遞進(jìn)式強(qiáng)化學(xué)習(xí)訓(xùn)練方法:創(chuàng)新性地應(yīng)用遞進(jìn)式強(qiáng)化學(xué)習(xí)方法,在創(chuàng)作、搜索、工具調(diào)用、推理等場景全面提升模型的綜合應(yīng)用能力; ◎基于思維鏈和行動鏈的端到端訓(xùn)練:針對深度搜索、工具調(diào)用等場景,根據(jù)結(jié)果反饋進(jìn)行端到端的模型訓(xùn)練,顯著提升訓(xùn)練效果; ◎ 多元統(tǒng)一的獎勵系統(tǒng):建立了統(tǒng)一的獎勵系統(tǒng),融合多種類型的獎勵機(jī)制,為模型訓(xùn)練提供更加魯棒的反饋。 體驗全新文心大模型4.5與文心大模型X1 ↓指路↓ 文心一言官網(wǎng),即刻免費體驗兩款全新大模型?。?span lang="EN-US">https://yiyan.baidu.com) 在百度智能云千帆大模型平臺,現(xiàn)可直接調(diào)用文心大模型4.5API,輸入價格低至0.004元/千tokens,輸出價格低至0.016元/千tokens;文心大模型X1也即將在千帆平臺上線,輸入價格低至0.002元/千tokens,輸出價格低至0.008元/千tokens。 2025是大模型技術(shù)全面迭代的一年,我們將在人工智能、數(shù)據(jù)中心、云基礎(chǔ)設(shè)施上更大膽地投入,打造更好、更智能的下一代模型。 |
5月7日,佛山市具身智能機(jī)器人創(chuàng)新中心合作簽約暨揭牌儀式
【CNMO科技消息】近日,有數(shù)碼博主爆料稱,華為計劃于今年
手機(jī)APP
官方微博
官方微信