首頁>>廠商>>語音識別與合成>>Nuance

3G時代語音識別成本仍然是“攔路虎”

2009/06/10

  “跑遍了京城的兒童玩具市場,竟然找不到幾款能夠順利完成語音對話的玩具娃娃”,這是六一前夕記者遭遇到的尷尬。無獨有偶,此前中科院自動化所以31萬元的價格,為四川科技館定做的能根據(jù)人類語音命令來完成畫像的特種機器人“貝奇”,可惜只是展示和娛樂觀眾。

  中國已經(jīng)進入了3G元年,整個通信產(chǎn)業(yè)以高速度前進,兒童玩具市場作為全球最大的消費市場,其語音技術應用如此稀缺,產(chǎn)業(yè)鏈的企業(yè)是不是該反思反思。根據(jù)記者調(diào)查,目前最大的問題還是投入過高,回報甚微。

  鄭裕慶

  “一直以來,語音控制模塊的成本因素似乎都是阻礙語音識別技術接近普通消費者的“攔路虎!盢uance大中華區(qū)總經(jīng)理鄭裕慶告訴《通信產(chǎn)業(yè)報》(網(wǎng))記者。

  Nuance全球尋找突破口

  鄭裕慶對《通信產(chǎn)業(yè)報》(網(wǎng))記者表示,“早在三年前我們已經(jīng)和索尼公司合作,進軍到了兒童電子玩具市場。由于兒童玩具語音對話功能涉及到產(chǎn)業(yè)鏈的數(shù)個企業(yè),而且成本較高,因此,目前這個市場處于雛形階段,今后開發(fā)前景大有可為”。

  Nuance移動-企業(yè)事業(yè)部及消費者服務事業(yè)部總裁史蒂夫·錢伯斯告訴《通信產(chǎn)業(yè)報》(網(wǎng))記者,語音識別技術在世界上許多國家都有其應用,目前,全球超過2/3的財富100強企業(yè)采用了Nuance的解決方案,超過2.5億臺設備內(nèi)置了Nuance移動語音處理設備。

史蒂夫·錢伯斯

  在通信領域,包括AT&T、Verizon、LG電子、諾基亞、摩托羅拉,在終端上都載入了語音識別的技術,在航空方面應也比較廣泛。如今,包括美國航空公司在內(nèi)全球多家航空公司采用了語音識別系統(tǒng)軟件。

  業(yè)內(nèi)人士分析,語音識別技術有兩個方向:一是大詞匯量連續(xù)語音識別系統(tǒng),主要應用于計算機的聽寫機,以及與電話網(wǎng)或者互聯(lián)網(wǎng)相結合的語音信息查詢服務系統(tǒng),這些系統(tǒng)都是在計算機平臺上實現(xiàn)的;另外一個重要的方向是小型化、便攜式語音產(chǎn)品的應用,如手機撥號、汽車設備的語音控制、智能玩具、家電遙控等方面的應用,這些應用系統(tǒng)大都使用專門的硬件系統(tǒng)實現(xiàn)。近幾年來迅速發(fā)展的語音信號處理專用芯片和語音識別片上系統(tǒng)的出現(xiàn),為語音識別的廣泛應用創(chuàng)造了有利的條件。

  中國市場方興未艾

  目前,語音識別技術在中國金融系統(tǒng)應用曙光初現(xiàn)。

  “語音軟件目前應用屬于初級階段。主要是大多是手機銀行和電話銀行根據(jù)用戶的聲音辨別真?zhèn)。估計今后可能拓展到更寬泛的領域”。中國建設銀行數(shù)據(jù)服務中心的負責人表示,語音軟件在身份認證、賬單支付、個人數(shù)據(jù)修復等應用效果明顯。

  目前,通過語音識別技術在中國移動增值業(yè)務上有所突破。此前,江蘇移動、山東移動等電信運營商,已經(jīng)實現(xiàn)了用戶通過“哼”一段旋律,就能查找到自己聽過卻不知道名稱的歌曲或彩鈴,并且進行點播和下載的新業(yè)務。
  
  “這種大規(guī)模的商業(yè)應用,已經(jīng)進入了成熟階段!敝锌圃郝晫W所語音實驗室有關人士表示,在商業(yè)應用上,這套系統(tǒng)最關鍵的部分是解決了計費環(huán)節(jié)的問題,電信運營商和聲學所,由此可以按照每條查詢的下載量來進行按比例分賬。

  “中國擁有超過近8億移動用戶,占全球最大的流動電話市場!卞X伯斯對中國的3G市場充滿了期待。據(jù)其透露,Nuance目前已和包括中國銀行在內(nèi)六家銀行達成了協(xié)議,未來語音系統(tǒng)將全面發(fā)力中國市場!

  語音識別技術壁壘猶存

  據(jù)媒體報道,2006年,中國電信推出的號碼百事通新業(yè)務,就是一款整合用戶號碼信息的基礎上,針對用戶的模糊查詢等信息服務需求提供的新產(chǎn)品?上У氖悄:樵,效果不佳,現(xiàn)行的“號碼百事通”業(yè)務還需要靠人工接線來實現(xiàn),這必然需要投入大量資金來建設和不斷完善呼叫中心。

  錢伯斯表示,今后將加大中國市場的開拓力度和在中國的投入,今年Nuance中國的員工將增加一倍,并加大研發(fā)力度,提高中國語言識別的準確率。

  目前,國際上Google和微軟在語音識別技術上競爭激烈。世界上只有少數(shù)幾家公司能夠形成核心技術,而中科院聲學所是國內(nèi)唯一完全擁有核心自主技術的單位,目前其最大的競爭對手主要是美國的Nuance公司。

  在金融危機仍籠罩全球之時,恰逢中國3G元年,語音識別技術的應用將是一個千載難逢的機會。但是,突破這個壁壘也需要一個長期的過程。

通信產(chǎn)業(yè)網(wǎng)