請登錄后使用快捷導(dǎo)航
沒有賬號？立即注冊

[切換城市]
蘭州 北京 上海 天津 重慶 長春 沈陽 西寧 西安 銀川 鄭州 濟(jì)南 太原 合肥 武漢 南京 成都 貴陽 昆明 南寧 杭州 南昌 廣州 福州

分類信息發(fā)布

新資訊_傳遞價值資訊,優(yōu)質(zhì)的新資訊平臺_最新_熱點_產(chǎn)業(yè)_行業(yè)觀察_城市發(fā)展_政策解讀 › 首頁 ›最新資訊› 產(chǎn)業(yè)資訊 › 查看內(nèi)容

返回首頁

京東發(fā)布千億級大模型“言犀”，號稱“最懂產(chǎn)業(yè)的大模型”

新資訊 2023-7-15 11:53 香港財華社 18 0

全球大模型競賽依舊在持續(xù)，京東也推出自己的千億級大模型“言犀”。

7月13日，在2023京東全球科技探索者大會暨京東云峰會上，京東推出言犀大模型，率先布局產(chǎn)業(yè)應(yīng)用。同時，京東還發(fā)布言犀AI開發(fā)計算平臺，該平臺已經(jīng)啟動預(yù)約注冊，預(yù)計8月正式上線。

與一般大模型相比，京東言犀具備天然的“產(chǎn)業(yè)基因”。京東集團(tuán)技術(shù)委員會主席曹鵬表示，京東靈犀大模型源于產(chǎn)業(yè)、服務(wù)產(chǎn)業(yè)，具有更高的產(chǎn)業(yè)屬性。

從場景中來，回到場景中去

大模型背后競爭的本質(zhì)，或是數(shù)據(jù)要素的競爭。

智能大模型訓(xùn)練是指使用大規(guī)模數(shù)據(jù)和高級計算資源對深度學(xué)習(xí)等人工智能訓(xùn)練的過程。

在人工智能領(lǐng)域，大模型通常指的是參數(shù)數(shù)量龐大、層數(shù)深的神經(jīng)網(wǎng)絡(luò)模型，如ChatGPT等。這些模型具有強(qiáng)大的學(xué)習(xí)能力和表達(dá)能力，但同時也需要大量的數(shù)據(jù)和計算資源來進(jìn)行訓(xùn)練。

由此，大模型訓(xùn)練所需要的數(shù)據(jù)的重要性越來越突出，數(shù)據(jù)規(guī)模與質(zhì)量都會影響模型最終呈現(xiàn)效果。

從過往大模型發(fā)展看，很多Transformer的通用大語言模型都依賴于來自維基百科、CommonCrawl、書籍、期刊等大型公共數(shù)據(jù)集，以及大量從互聯(lián)網(wǎng)上抓取到的內(nèi)容。

與之相比，京東言犀大模型孵化于產(chǎn)業(yè)場景豐富的京東，具備天然的“產(chǎn)業(yè)基因”。

作為一家新型實體企業(yè)，京東具備豐富的產(chǎn)業(yè)場景，包括零售、物流、科技、健康、工業(yè)、產(chǎn)發(fā)等領(lǐng)域，積累下每年數(shù)百億條優(yōu)質(zhì)交互數(shù)據(jù)。

深厚的產(chǎn)業(yè)數(shù)據(jù)積累，以及千行百業(yè)Know-How，成為京東布局大模型的核心優(yōu)勢。京東用于訓(xùn)練言犀大模型的數(shù)據(jù)庫，便是由70%通用數(shù)據(jù)和30%供應(yīng)鏈原生數(shù)據(jù)組成，由此，訓(xùn)練出的大模型天然具備“產(chǎn)業(yè)基因”，具有“更高產(chǎn)業(yè)屬性、更強(qiáng)泛化能力、更多安全保障”的優(yōu)勢。

此外，在訓(xùn)練過程中，京東言犀還采用數(shù)萬小時含有不同噪音、方言的真實場景數(shù)據(jù)進(jìn)行迭代，包括把正常語境下的句子變成一種含有噪聲或方言的數(shù)據(jù)再輸入到模型里，從而進(jìn)一步提升模型的抗干擾能力。

源于產(chǎn)業(yè)、用于產(chǎn)業(yè)，京東言犀未來將服務(wù)于產(chǎn)業(yè)，致力于深入零售、物流、金融、健康、政務(wù)等知識密集型、任務(wù)型產(chǎn)業(yè)場景，解決真實產(chǎn)業(yè)問題。

此前言犀已經(jīng)與大同12345政務(wù)熱線合作，呼入電話接起率達(dá)到100%。同時，言犀也自動完成了工單創(chuàng)建、智能匹配至對應(yīng)委辦局、跟蹤工單執(zhí)行情況、自動對市民回訪等全閉環(huán)流程。

在養(yǎng)老行業(yè)，言犀還聯(lián)合天津市河西區(qū)的智慧養(yǎng)老服務(wù)平臺，每天早上9點自動給近5000名獨居老人撥打問候電話，避免其突發(fā)疾病或無人照顧等情況。

京東集團(tuán)CEO許冉表示，“大模型真正實現(xiàn)自己的價值，一定是在產(chǎn)業(yè)應(yīng)用中。”“京東的大模型技術(shù)演進(jìn)，遵循了京東的技術(shù)追求：成本、效率、體驗、可信、普惠、突破。成本、效率和體驗是從京東的經(jīng)營理念傳承而來，也是零售的第一性原理。可信、普惠和突破則是技術(shù)服務(wù)于產(chǎn)業(yè)和社會的承諾。”

京東集團(tuán)技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬表示，“數(shù)智供應(yīng)鏈訓(xùn)練了產(chǎn)業(yè)大模型，而大模型則依托供應(yīng)鏈深入產(chǎn)業(yè)”。

依托京東言犀大模型，以及京東在產(chǎn)業(yè)和供應(yīng)鏈側(cè)的優(yōu)勢，京東還發(fā)布了兩大服務(wù)平臺，包括全新升級的優(yōu)加DaaS和言犀智能服務(wù)平臺，以及面向零售、金融、城市、健康、物流五大領(lǐng)域的行業(yè)解決方案。

京東積極錘煉大模型

京東從很早就開始布局大模型。

京東探索研究院院長、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬公開表示，京東大模型并不是馬上就產(chǎn)生的，而是多年的鋪墊。2020年時京東就關(guān)注到了深度學(xué)習(xí)模型和語言生成，當(dāng)時也開啟了語言模型研發(fā)。

2021年，京東推出十億級模型K-PLUG，2022年推出百億級模型Vega，本次大會則展示了千億級模型。

一開始，京東就發(fā)揮供應(yīng)鏈和豐富的產(chǎn)業(yè)場景優(yōu)勢，來訓(xùn)練更加適合行業(yè)使用要求，更容易實現(xiàn)場景落地的大模型產(chǎn)品。

其早先研究的K-PLUG模型已經(jīng)在京東的發(fā)現(xiàn)好貨等場景廣泛應(yīng)用。其對于給定商品的sku，可以自動生成長度不等的商品文案，目前已經(jīng)覆蓋2000多個京東的品類。在商品文案的生成上，K-PLUG明顯比ChatGPT的更加符合商家需求。

2022年針對模型泛化性不足，京東提出了百億級模型Vega，服務(wù)京東物流一站式數(shù)智化供應(yīng)鏈數(shù)據(jù)管理平臺，助力企業(yè)降本增效。

百億級模型之后，今年京東再推出千億級大模型。本次千億級大模型言犀推出，讓京東形成了一套大模型的完整工具鏈：言犀AI開發(fā)計算平臺、向量數(shù)據(jù)庫，以及全新升級的基礎(chǔ)設(shè)施云艦、云海和京剛。

國內(nèi)大模型千帆競發(fā)

ChatGPT系列大模型再次引發(fā)人工智能在全球的火爆，國內(nèi)互聯(lián)網(wǎng)大廠也紛紛秀肌肉。2023年以來，國內(nèi)大模型產(chǎn)品批量涌現(xiàn)。

今年3月，百度發(fā)布國內(nèi)首個知識增強(qiáng)大語言模型“文心一言”，只需簡單提出需求，文心一言就能自動生成內(nèi)容，并能設(shè)計排版、AI繪畫等。

日前，百度文心大模型正式從3.0升級到3.5，在問答、推理、代碼、文生圖等能力都向前邁了一步，實現(xiàn)安全性顯著提升，訓(xùn)練和推理速度也大幅提升。

另一家人工智能龍頭科大訊飛（002230.SZ）在今年5月正式發(fā)布“1+N認(rèn)知智能大模型”星火，并火速在AI學(xué)習(xí)機(jī)的中英文作文輔導(dǎo)、中英文口語學(xué)習(xí)，以及訊飛聽見一段錄音一鍵成稿、訊飛辦公本自動文本摘要等場景落地。

6月，訊飛星火還迎來V1.5版本更新，在開放式知識問答、多輪對話等多方面都有全新升級。

此外，國內(nèi)大模型領(lǐng)域還涌現(xiàn)出通義千問、商量、序列猴子……據(jù)世界人工智能大會官方微信披露數(shù)據(jù)，2023年的大會上聚齊了三十多個大模型及相關(guān)產(chǎn)品。

在行業(yè)發(fā)展如火如荼之際，相關(guān)監(jiān)管政策也落地。

7月13日，《生成式人工智能服務(wù)管理暫行辦法》自2023年8月15日起施行，以促進(jìn)生成式人工智能健康發(fā)展和規(guī)范應(yīng)用。

東方證券認(rèn)為，認(rèn)為，《暫行辦法》的實施初步建立起了我國對于生成式人工智能領(lǐng)域的監(jiān)管體系，并且未來將會進(jìn)一步完善。隨著監(jiān)管體系的逐步建立，我國的AI領(lǐng)域從基礎(chǔ)模型到上層應(yīng)用的商業(yè)化進(jìn)程將有望快速推進(jìn)，AI生態(tài)有望快速建立。

李瑩

來源：香港財華社

聲明：發(fā)布此文是出于傳遞更多信息之目的，若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益，請聯(lián)系我們，確認(rèn)后馬上更正或刪除，謝謝！