羅詠浩(右一)與團(tuán)隊(duì)成員一起上車測(cè)試。(受訪者供圖) 青春名片 長(zhǎng)安汽車AI實(shí)驗(yàn)室團(tuán)隊(duì):一群聚焦汽車智能座艙AI研發(fā)的年輕人。從理念到產(chǎn)品,他們從零開始、精研磨礪,不斷改進(jìn)長(zhǎng)安系智能網(wǎng)聯(lián)新能源車的用戶體驗(yàn)。 “你好小安,向右變道。” “即將向右變道,請(qǐng)確認(rèn)。” 4月27日下午,長(zhǎng)安科技園某試驗(yàn)車旁,一群年輕人圍成一圈,一邊看著語(yǔ)音交互,一邊盯著顯示屏。駕駛員輕聲喊出“確認(rèn)”,汽車迅速開啟轉(zhuǎn)向燈,同時(shí)方向盤自行轉(zhuǎn)動(dòng),一氣呵成地完成向右側(cè)變道。大家松了口氣,隨后一齊歡呼起來(lái)。 在重慶長(zhǎng)安汽車股份有限公司,有一支青年突擊隊(duì),他們通過(guò)AI大模型技術(shù)推進(jìn)汽車智能座艙AI研發(fā),即將上市的新款車就聚合了他們的創(chuàng)新成果。 摸索中找準(zhǔn)研發(fā)方向 “人工智能突飛猛進(jìn),將對(duì)汽車產(chǎn)業(yè)帶來(lái)怎樣的影響?”2021年8月底,重慶長(zhǎng)安汽車股份有限公司成立AI實(shí)驗(yàn)室,“90后”羅詠剛成為項(xiàng)目負(fù)責(zé)人。 “團(tuán)隊(duì)建立時(shí),相關(guān)領(lǐng)域的探索剛起步,大家的專業(yè)也是天差地別。”為了盡快打開突破口,大家摸索開展了動(dòng)力底盤、工具鏈等方面研究,“想了很多辦法,但效果并不理想。”羅詠剛回憶說(shuō)。 沒有方向,研發(fā)就顯得盲目和沉重,但這支年輕的團(tuán)隊(duì)依然在咬牙堅(jiān)持。一年后,隨著OpenAI推出GPT-3.5版本,團(tuán)隊(duì)受到啟發(fā),正式確定了努力方向——聚焦汽車智能座艙AI研發(fā)。經(jīng)過(guò)短暫討論,羅詠剛等決定以多意圖控制為切口,打開局面。 多意圖控制就是通過(guò)AI大模型技術(shù)使駕駛員可以同時(shí)對(duì)車輛進(jìn)行多項(xiàng)功能控制。羅詠剛解釋,在傳統(tǒng)駕駛座艙,駕駛員打開車窗、空調(diào)、氛圍燈等控制行為都是一對(duì)一控制,要實(shí)現(xiàn)多意圖控制,就要給車輛裝上AI大模型并升級(jí)。 羅詠剛團(tuán)隊(duì)用了2個(gè)月,初步實(shí)現(xiàn)了三意圖控制。“開窗開空調(diào)同時(shí)放首周杰倫的歌。”在試驗(yàn)車上,羅詠剛下達(dá)指令,不到一秒,車輛如預(yù)想般開窗、開空調(diào)、放起音樂(lè),大家頓時(shí)歡呼雀躍。“這證明我們的研究方向是正確的,數(shù)月的堅(jiān)持沒有白費(fèi)。” 以“多意圖控制”為起點(diǎn),團(tuán)隊(duì)迅速展開攻關(guān),很快在語(yǔ)音編排、服務(wù)推薦等領(lǐng)域獲得突破。 不斷把金點(diǎn)子變成好產(chǎn)品 “小安小安,我要導(dǎo)航去大竹林。”不到1秒,駕駛員便收到汽車回復(fù):“我有3條路線,請(qǐng)問(wèn)你要選擇哪一條呢?”這是長(zhǎng)安汽車語(yǔ)音交互模塊工作的狀態(tài)。通過(guò)云端建立連接,AI大模型借助語(yǔ)音合成技術(shù)對(duì)用戶需求進(jìn)行反饋,實(shí)現(xiàn)人車溝通交流。 其實(shí),早在2024年10月前,這項(xiàng)技術(shù)并不成熟。一旦遇上弱網(wǎng)、斷網(wǎng),交互就會(huì)中斷,非常影響用戶體驗(yàn)。團(tuán)隊(duì)副總設(shè)計(jì)師孟藝凝與部分成員萌生了一個(gè)想法:如果增加一個(gè)線下語(yǔ)音處理模塊,是不是就能解決? “辦法看似簡(jiǎn)單,但操作很難。”孟藝凝說(shuō),線下語(yǔ)音處理模塊如果通過(guò)CPU處理,最簡(jiǎn)單高效,但CPU需要處理汽車運(yùn)行中的海量信息,剩余資源十分有限;若是通過(guò)DSP數(shù)字信號(hào)處理技術(shù)處理,又會(huì)因數(shù)據(jù)格式的轉(zhuǎn)化造成信息損失,導(dǎo)致反饋存在偏差。最終,團(tuán)隊(duì)決定走一條“中間路線”,將“云端”和車載CPU及相應(yīng)模塊、DSP系統(tǒng)整合在一起,通過(guò)不斷迭代,實(shí)現(xiàn)目標(biāo)。 另外,他們還針對(duì)語(yǔ)音交互中的各種痛點(diǎn)進(jìn)行了分析,按照用戶體驗(yàn)最佳、資源利用最少、技術(shù)水平最能實(shí)現(xiàn)的原則確定了最優(yōu)解決方案。 今年6月,孟藝凝負(fù)責(zé)并開發(fā)的自然語(yǔ)言處理模塊將正式完成并交付。 集思廣益找到關(guān)鍵突破口 4月9日,對(duì)于團(tuán)隊(duì)成員李翔來(lái)說(shuō)是個(gè)特別的日子。由他設(shè)計(jì)并訓(xùn)練的語(yǔ)音模型,正式通過(guò)考核進(jìn)入量產(chǎn),這是他首個(gè)全流程參與完成的產(chǎn)品。 “車載語(yǔ)音系統(tǒng)承擔(dān)著識(shí)別、分析車主意圖的職責(zé)。我的工作就是訓(xùn)練語(yǔ)音模型。”李翔需要為每一句話中的關(guān)鍵詞打上標(biāo)記,并建立關(guān)鍵詞庫(kù)。1個(gè)多月,他收集了上萬(wàn)句相關(guān)提問(wèn)。模型最終調(diào)試完畢,并通過(guò)了初步測(cè)試。 可好景不長(zhǎng),測(cè)試部門很快發(fā)現(xiàn)了問(wèn)題,“有時(shí)候語(yǔ)音系統(tǒng)聽不懂我們說(shuō)話。”“車載語(yǔ)音系統(tǒng)的回復(fù)明顯錯(cuò)誤。” “這是因?yàn)殛P(guān)鍵詞庫(kù)還不足以覆蓋生活中常用的提問(wèn)表述方式。”李翔冷靜分析。“既然不夠,那就升級(jí)擴(kuò)充關(guān)鍵詞庫(kù)。”但是經(jīng)過(guò)努力,測(cè)試部門仍給出“效果不佳”的反饋。 于是,李翔將問(wèn)題帶到例會(huì)上,與團(tuán)隊(duì)成員展開討論。最終大家決定,通過(guò)嵌入AI大模型解決問(wèn)題。又經(jīng)一個(gè)月調(diào)整,李翔的新語(yǔ)音模型出爐。 “前面風(fēng)景好美。”測(cè)試時(shí),一位同事對(duì)著語(yǔ)音大模型說(shuō)出了這樣的話。大模型迅速回復(fù):“是否要打開車窗、調(diào)整座椅靠背?”李翔激動(dòng)地表示,這個(gè)回復(fù)非常符合駕駛者的心意。 今年4月,李翔等人的語(yǔ)音模型終于通過(guò)最終測(cè)試。幾個(gè)年輕人激動(dòng)得濕了眼眶。(新重慶-重慶日?qǐng)?bào)記者 卞立成) |
羅詠浩(右一)與團(tuán)隊(duì)成員一起上車測(cè)試。(受訪者供圖)
【大河財(cái)立方 記者 李錚】5月9日,記者從宇通集團(tuán)獲悉,近
手機(jī)APP
官方微博
官方微信