全球大模型競賽依舊在持續(xù),京東也推出自己的千億級大模型“言犀”。 7月13日,在2023京東全球科技探索者大會暨京東云峰會上,京東推出言犀大模型,率先布局產(chǎn)業(yè)應(yīng)用。同時,京東還發(fā)布言犀AI開發(fā)計算平臺,該平臺已經(jīng)啟動預(yù)約注冊,預(yù)計8月正式上線。 與一般大模型相比,京東言犀具備天然的“產(chǎn)業(yè)基因”。京東集團(tuán)技術(shù)委員會主席曹鵬表示,京東靈犀大模型源于產(chǎn)業(yè)、服務(wù)產(chǎn)業(yè),具有更高的產(chǎn)業(yè)屬性。 從場景中來,回到場景中去 大模型背后競爭的本質(zhì),或是數(shù)據(jù)要素的競爭。 智能大模型訓(xùn)練是指使用大規(guī)模數(shù)據(jù)和高級計算資源對深度學(xué)習(xí)等人工智能訓(xùn)練的過程。 在人工智能領(lǐng)域,大模型通常指的是參數(shù)數(shù)量龐大、層數(shù)深的神經(jīng)網(wǎng)絡(luò)模型,如ChatGPT等。這些模型具有強(qiáng)大的學(xué)習(xí)能力和表達(dá)能力,但同時也需要大量的數(shù)據(jù)和計算資源來進(jìn)行訓(xùn)練。 由此,大模型訓(xùn)練所需要的數(shù)據(jù)的重要性越來越突出,數(shù)據(jù)規(guī)模與質(zhì)量都會影響模型最終呈現(xiàn)效果。 從過往大模型發(fā)展看,很多Transformer的通用大語言模型都依賴于來自維基百科、CommonCrawl、書籍、期刊等大型公共數(shù)據(jù)集,以及大量從互聯(lián)網(wǎng)上抓取到的內(nèi)容。 與之相比,京東言犀大模型孵化于產(chǎn)業(yè)場景豐富的京東,具備天然的“產(chǎn)業(yè)基因”。 作為一家新型實體企業(yè),京東具備豐富的產(chǎn)業(yè)場景,包括零售、物流、科技、健康、工業(yè)、產(chǎn)發(fā)等領(lǐng)域,積累下每年數(shù)百億條優(yōu)質(zhì)交互數(shù)據(jù)。 深厚的產(chǎn)業(yè)數(shù)據(jù)積累,以及千行百業(yè)Know-How,成為京東布局大模型的核心優(yōu)勢。京東用于訓(xùn)練言犀大模型的數(shù)據(jù)庫,便是由70%通用數(shù)據(jù)和30%供應(yīng)鏈原生數(shù)據(jù)組成,由此,訓(xùn)練出的大模型天然具備“產(chǎn)業(yè)基因”,具有“更高產(chǎn)業(yè)屬性、更強(qiáng)泛化能力、更多安全保障”的優(yōu)勢。 此外,在訓(xùn)練過程中,京東言犀還采用數(shù)萬小時含有不同噪音、方言的真實場景數(shù)據(jù)進(jìn)行迭代,包括把正常語境下的句子變成一種含有噪聲或方言的數(shù)據(jù)再輸入到模型里,從而進(jìn)一步提升模型的抗干擾能力。 源于產(chǎn)業(yè)、用于產(chǎn)業(yè),京東言犀未來將服務(wù)于產(chǎn)業(yè),致力于深入零售、物流、金融、健康、政務(wù)等知識密集型、任務(wù)型產(chǎn)業(yè)場景,解決真實產(chǎn)業(yè)問題。 此前言犀已經(jīng)與大同12345政務(wù)熱線合作,呼入電話接起率達(dá)到100%。同時,言犀也自動完成了工單創(chuàng)建、智能匹配至對應(yīng)委辦局、跟蹤工單執(zhí)行情況、自動對市民回訪等全閉環(huán)流程。 在養(yǎng)老行業(yè),言犀還聯(lián)合天津市河西區(qū)的智慧養(yǎng)老服務(wù)平臺,每天早上9點自動給近5000名獨居老人撥打問候電話,避免其突發(fā)疾病或無人照顧等情況。 京東集團(tuán)CEO許冉表示,“大模型真正實現(xiàn)自己的價值,一定是在產(chǎn)業(yè)應(yīng)用中。”“京東的大模型技術(shù)演進(jìn),遵循了京東的技術(shù)追求:成本、效率、體驗、可信、普惠、突破。成本、效率和體驗是從京東的經(jīng)營理念傳承而來,也是零售的第一性原理。可信、普惠和突破則是技術(shù)服務(wù)于產(chǎn)業(yè)和社會的承諾。” 京東集團(tuán)技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬表示,“數(shù)智供應(yīng)鏈訓(xùn)練了產(chǎn)業(yè)大模型,而大模型則依托供應(yīng)鏈深入產(chǎn)業(yè)”。 依托京東言犀大模型,以及京東在產(chǎn)業(yè)和供應(yīng)鏈側(cè)的優(yōu)勢,京東還發(fā)布了兩大服務(wù)平臺,包括全新升級的優(yōu)加DaaS和言犀智能服務(wù)平臺,以及面向零售、金融、城市、健康、物流五大領(lǐng)域的行業(yè)解決方案。 京東積極錘煉大模型 京東從很早就開始布局大模型。 京東探索研究院院長、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬公開表示,京東大模型并不是馬上就產(chǎn)生的,而是多年的鋪墊。2020年時京東就關(guān)注到了深度學(xué)習(xí)模型和語言生成,當(dāng)時也開啟了語言模型研發(fā)。 2021年,京東推出十億級模型K-PLUG,2022年推出百億級模型Vega,本次大會則展示了千億級模型。 一開始,京東就發(fā)揮供應(yīng)鏈和豐富的產(chǎn)業(yè)場景優(yōu)勢,來訓(xùn)練更加適合行業(yè)使用要求,更容易實現(xiàn)場景落地的大模型產(chǎn)品。 其早先研究的K-PLUG模型已經(jīng)在京東的發(fā)現(xiàn)好貨等場景廣泛應(yīng)用。其對于給定商品的sku,可以自動生成長度不等的商品文案,目前已經(jīng)覆蓋2000多個京東的品類。在商品文案的生成上,K-PLUG明顯比ChatGPT的更加符合商家需求。 2022年針對模型泛化性不足,京東提出了百億級模型Vega,服務(wù)京東物流一站式數(shù)智化供應(yīng)鏈數(shù)據(jù)管理平臺,助力企業(yè)降本增效。 百億級模型之后,今年京東再推出千億級大模型。本次千億級大模型言犀推出,讓京東形成了一套大模型的完整工具鏈:言犀AI開發(fā)計算平臺、向量數(shù)據(jù)庫,以及全新升級的基礎(chǔ)設(shè)施云艦、云海和京剛。 國內(nèi)大模型千帆競發(fā) ChatGPT系列大模型再次引發(fā)人工智能在全球的火爆,國內(nèi)互聯(lián)網(wǎng)大廠也紛紛秀肌肉。2023年以來,國內(nèi)大模型產(chǎn)品批量涌現(xiàn)。 今年3月,百度發(fā)布國內(nèi)首個知識增強(qiáng)大語言模型“文心一言”,只需簡單提出需求,文心一言就能自動生成內(nèi)容,并能設(shè)計排版、AI繪畫等。 日前,百度文心大模型正式從3.0升級到3.5,在問答、推理、代碼、文生圖等能力都向前邁了一步,實現(xiàn)安全性顯著提升,訓(xùn)練和推理速度也大幅提升。 另一家人工智能龍頭科大訊飛(002230.SZ)在今年5月正式發(fā)布“1+N認(rèn)知智能大模型”星火,并火速在AI學(xué)習(xí)機(jī)的中英文作文輔導(dǎo)、中英文口語學(xué)習(xí),以及訊飛聽見一段錄音一鍵成稿、訊飛辦公本自動文本摘要等場景落地。 6月,訊飛星火還迎來V1.5版本更新,在開放式知識問答、多輪對話等多方面都有全新升級。 此外,國內(nèi)大模型領(lǐng)域還涌現(xiàn)出通義千問、商量、序列猴子……據(jù)世界人工智能大會官方微信披露數(shù)據(jù),2023年的大會上聚齊了三十多個大模型及相關(guān)產(chǎn)品。 在行業(yè)發(fā)展如火如荼之際,相關(guān)監(jiān)管政策也落地。 7月13日,《生成式人工智能服務(wù)管理暫行辦法》自2023年8月15日起施行,以促進(jìn)生成式人工智能健康發(fā)展和規(guī)范應(yīng)用。 東方證券認(rèn)為,認(rèn)為,《暫行辦法》的實施初步建立起了我國對于生成式人工智能領(lǐng)域的監(jiān)管體系,并且未來將會進(jìn)一步完善。隨著監(jiān)管體系的逐步建立,我國的AI領(lǐng)域從基礎(chǔ)模型到上層應(yīng)用的商業(yè)化進(jìn)程將有望快速推進(jìn),AI生態(tài)有望快速建立。 李瑩 來源:香港財華社 |
5月8日上午,羅氏制藥中國全新生物制藥生產(chǎn)基地投資項目啟
在黔北大地的層巒疊嶂間,一片曾經(jīng)“地?zé)o三尺平”的荒蕪之
手機(jī)APP
官方微博
官方微信