[汽車之家 新鮮技術解讀] “一人開車時喜歡用語音系統(tǒng),全家人都在車上的話就算了!,跟一位剛買“智能車”的朋友聊天,不經(jīng)意間他說了這樣一句話。
近年來,各家推出的新車或多或少都跟“智能化”有了聯(lián)系。作為實體按鍵和觸控屏之外的新操作方式,能動嘴盡量不用你上手的語音控制,愈發(fā)常見也受到了不少消費者歡迎。不過易受其他乘客聊天干擾、對后排乘客發(fā)出的指令識別能力較弱,是不少語音系統(tǒng)的不足?蓪ι嫌欣舷掠行〉募彝ビ脩魜碚f,家人的聊天往往是語音交互的背景音。本該大秀一場的好功能施展不開拳腳,文章開頭的那句話,就是車主們的無奈。
作為中國新勢力車企中聚焦家庭用戶的代表,計劃本月中旬向用戶推送2.2版車機系統(tǒng)的理想,將帶來哪些新功能、車主們的“無奈”會迎刃而解嗎?咱們一起搶先體驗一下吧。
2.2版本都有啥?
在2021款理想ONE(參數(shù)|詢價)上市之后,理想發(fā)布了今年的語音系統(tǒng)升級計劃。在推出包含喚醒打斷、動力與駕駛模式語音控制等功能,并將底層能力換為地平線+思必馳+微軟的FOTA2.1之后,理想將在FOTA2.2加入連續(xù)對話、可見即可說、四音區(qū)鎖定和跨音區(qū)上下文對話等功能,同時上線了“應用中心”擴充車機里的軟件。
這些新功能既減少了你說喚醒詞的次數(shù),也能在不打斷家人聊天時,讓語音系統(tǒng)準確識別用戶指令。說白了,上圖這些就是針對全家人駕車出行的場景,以及語音系統(tǒng)的短處研發(fā)的功能。
20秒連續(xù)說/爽點竟是“我也要”
顧名思義,連續(xù)對話是指喚醒語音系統(tǒng)后,在一段時間用戶可以連續(xù)說指令,而不用多次說出喚醒詞。
舉個例子,想打開空調(diào)和座椅通風,通常需要喚醒兩次語音系統(tǒng)并分別進行操作。伴隨說喚醒詞次數(shù)的增加,不僅麻煩還會覺得自己很“話癆”,更不用說與機器人對話產(chǎn)生的違和感造成的“不爽”了。我拍了段視頻,大家感受一下。
除了理想之外,小鵬和長安等車企也提供了“連續(xù)說”功能,想到哪說到哪、一次不到位還能連續(xù)調(diào)節(jié),過程中減少了說喚醒詞的次數(shù),操作也就沒那么繁瑣了。至于如何讓交互體驗不像跟機器人說話,聽懂上下文邏輯是解決方案之一。
支持連續(xù)識別、掌握上下文邏輯銜接后,相比“一次一句、反復喚醒”的傳統(tǒng)語音系統(tǒng),現(xiàn)在的“理想同學”能省去不少麻煩事?稍谟酶玫捏w驗吸引更多用戶之前,它還要面對一個難題——抗干擾。
生來就會四音區(qū)識別的理想ONE,能自動判斷語音系統(tǒng)應該重點關注的位置,雖然像打開車窗這種操作,無需用戶說“右后”等定向詞,但座艙內(nèi)的背景音依舊會干擾系統(tǒng)識別。對于全家自駕游的用戶來說,讓家人們暫停聊天總顯得不太和諧,因而在音源定向識別的基礎上,理想加入了無效文本拒識能力。
所謂無效文本拒識,就是系統(tǒng)會在識別的對話中,依靠算法“挑出”指令并執(zhí)行。乘客們聊天不會干擾人機交互,語音系統(tǒng)也能更好的應對多人出行場景了。文字太蒼白,還是請朋友看視頻吧。
“氣氛組”一番嘗試后,系統(tǒng)依舊能識別出副駕乘客說出的指令。從聊天話語中找到“指令”后,系統(tǒng)會用加粗和高光,告訴操作者指令已被識別。
希望在旅途中享受片刻寧靜的你,想想自家對科技情有獨鐘、精力旺盛的“小怪獸”,這個功能“香”不?掌握應對“小怪獸”的技巧后,理想將多音區(qū)識別和上下文邏輯銜接合在了一起。如果想系統(tǒng)幫你完成與上一位操作者相同的動作,現(xiàn)在只說“理想同學,我也要”就夠了。下面視頻里有完整演示哦。
用“我也要”三個字復刻之前乘客的全部操作,體驗簡短卻足夠打消你嫌棄說話字多、太累,不如直接動手用實體按鍵旋鈕操作的念頭。無論說激發(fā)用戶使用語音系統(tǒng)的潛力,還是弱化了語音操作在個別場景下效率不高的長尾問題,這項功能都稱得上2.2版系統(tǒng)的一個爽點。
想點哪里直接說/體驗上的小亮點
一套好的語音系統(tǒng)應該讓用戶只動嘴不動手,可實現(xiàn)這個最終目標之前,要實現(xiàn)無數(shù)個“小目標”,比如部分功能做到“可見即可說”。在理想2.2版系統(tǒng)中,QQ音樂、喜馬拉雅、藍牙電話和車輛中心四項功能率先做到了這一點。
從視頻中可見,系統(tǒng)不僅能識別頁面中的文字,還能根據(jù)“返回”指令選中相應圖標。同時只需說出目標選項中的幾個字,系統(tǒng)就能找到你想要的那個。做到部分場景非必要不上手之余,可見即可說功能也為坐在第二/三排、無法點擊屏幕的乘客提供了便利。
不過體驗過程中我們發(fā)現(xiàn)了兩個小問題,一來,系統(tǒng)偶有需要操作者放慢語速才能聽懂的情況;二來,彈出音樂列表后只能說歌曲名,系統(tǒng)無法識別“第幾個”這樣的話術,這個細節(jié)可以再完善一下。
另外,理想聯(lián)手微軟打造了基于云端的在線神經(jīng)網(wǎng)絡深度學習模型,通過緩存并在有需要時播放出好聽的聲音,減少了語音系統(tǒng)較為機械的發(fā)音。這就是上文多段視頻中,“理想同學”聲音的由來,至少男同學們應該很喜歡“她”。
應用中心上線
伴隨理想應用中心登陸2.2版系統(tǒng),車機能覆蓋到的場景和提供的音/視頻內(nèi)容得到了擴充。
中控屏與副駕屏中的應用不盡相同,前者以在線音樂/音頻類為主,后者主要提供視頻類軟件,提供聲音類內(nèi)容的只有“愛趣聽”。
寫在最后
廠方人員跟我說,這次搶先體驗的2.2版車機系統(tǒng),將在本月中旬推送給理想ONE的車主們,雖然可優(yōu)化的地方還有,但整體上說很值得期待。特別是連續(xù)對話、無效文本拒識和跨音區(qū)上下文對話功能,可以說是針對當前語音系統(tǒng)短板,以及居家出行的車上場景而來。至于正式版會把“細節(jié)”打磨成什么樣?咱們繼續(xù)期待吧。(圖/文 汽車之家 馬一凡)
好評理由:
差評理由: