商城類電商軟件及服務(wù)提供商--HiShop海商,歡迎您!
Hi新零售消息,語(yǔ)音交互是去年AI最火的領(lǐng)域,先鋒的智能音箱一個(gè)單品就讓所有互聯(lián)網(wǎng)大佬們都參戰(zhàn)其中。
但從當(dāng)初驚人眼球的蘋果SIRI語(yǔ)音助手到智能音箱,語(yǔ)音這項(xiàng)被寄予厚望成為人機(jī)交互入口的技術(shù),似乎未能形成真正顛覆市場(chǎng)的應(yīng)用落地,始終在單品上火一陣試一陣。相反,視覺(jué)技術(shù)里人臉識(shí)別已經(jīng)形成規(guī)模化的基礎(chǔ)應(yīng)用,滲透到金融、安防甚至零售領(lǐng)域。
為何最早火起來(lái)被寄予厚望的語(yǔ)音交互反而在市場(chǎng)化應(yīng)用這一環(huán)節(jié)上似乎慢了?
一方面,相比圖像識(shí)別語(yǔ)音的交互鏈條更長(zhǎng),是一個(gè)點(diǎn)往縱深深入走。語(yǔ)音交互不只包括識(shí)別,還要識(shí)別后理解文本意思再反饋出來(lái),包括自然語(yǔ)言理解、語(yǔ)音合成以及對(duì)內(nèi)容資源的整合挖掘,路線遠(yuǎn)比圖像更長(zhǎng)。
另一方面,機(jī)器視覺(jué)受干擾因素較少,例如人臉識(shí)別的臉部特征幾十年不會(huì)大變,光線的強(qiáng)弱通過(guò)紅外都已經(jīng)解決。而語(yǔ)音是個(gè)變量,噪音、環(huán)境、距離、人的發(fā)音特征等因素下的語(yǔ)音交互都完全不一樣,同一句話在逛街、辦公室等不同場(chǎng)景,所表達(dá)的意思完全不一樣。
因此,語(yǔ)音比視覺(jué)的挑戰(zhàn)更大,它只存在于整體智能,而不是局部智能。語(yǔ)音是個(gè)交互手段,通過(guò)交互調(diào)取后端的服務(wù),例如聽(tīng)什么歌,去什么地方。而這又涉及與后端內(nèi)容的配合,如果第三方內(nèi)容庫(kù)內(nèi)容不夠全,也會(huì)導(dǎo)致整體語(yǔ)音交互顯得不夠智能。
第三,語(yǔ)音商業(yè)化落地不具有非常強(qiáng)的復(fù)制性,圖像識(shí)別技術(shù)的應(yīng)用復(fù)制性非常高,對(duì)設(shè)備的依賴程度不高,就一個(gè)數(shù)據(jù)包在任何情況下都可以用。
語(yǔ)音所處的場(chǎng)景不一樣,例如用在機(jī)器人、冰箱、車載不同的產(chǎn)品里,對(duì)三款產(chǎn)品說(shuō)同一句“我餓了”,對(duì)機(jī)器人說(shuō)有可能就是單純聊天;對(duì)車載說(shuō)肯定不會(huì)是點(diǎn)外賣也不會(huì)是聊天,只有可能是導(dǎo)航。
新零售模式 | 國(guó)外新零售 |
門店新零售 | 馬云新零售解讀 |
新零售商業(yè)模式 | 新零售模式概念圖解 |
因此,沒(méi)有辦法把所有語(yǔ)義做成一個(gè)通用庫(kù)復(fù)制到所有產(chǎn)品,每一個(gè)產(chǎn)品針對(duì)不同場(chǎng)景都有不同需求,都需要個(gè)性化定制。
基于語(yǔ)音的特征,語(yǔ)音交互的商業(yè)化更像個(gè)系統(tǒng)工程,從語(yǔ)音識(shí)別到語(yǔ)義理解到后端內(nèi)容資源庫(kù),互相制約,牽一發(fā)而動(dòng)全身。由于語(yǔ)音交互的復(fù)雜帶來(lái)的商業(yè)化困境,語(yǔ)音交互技術(shù)公司也開(kāi)始走技術(shù)平臺(tái)輸出路線。
一方面開(kāi)放自己的基礎(chǔ)技術(shù)能力,讓市場(chǎng)化的應(yīng)用企業(yè)直接在基礎(chǔ)上商業(yè)化應(yīng)用,例如家居、車載、金融、醫(yī)療、教育等各領(lǐng)域的智能語(yǔ)音服務(wù)都可以采用其平臺(tái)的技術(shù)來(lái)探索細(xì)分領(lǐng)域的商業(yè)化,擴(kuò)大定制規(guī)?;?另一方面,將語(yǔ)音交互技術(shù)開(kāi)放出來(lái)擴(kuò)大生態(tài)合作,以突破語(yǔ)音交互的局限。