国产精品午夜免费观看网站_国产精品禁18久久久夂久_晚上开车又疼又叫的视频_尤物麻豆av在线_善良迷人的女教师2中文

微軟申請(qǐng)“無(wú)聲語(yǔ)音輸入”讓“機(jī)器聽(tīng)懂人話”

世界知識(shí)產(chǎn)權(quán)組織(WIPO)日前公布了一項(xiàng)微軟申請(qǐng)的“無(wú)聲語(yǔ)音輸入”(Silent Voice Input)專利,豐富了“機(jī)器聽(tīng)懂人話”的場(chǎng)景。

 

 

 

雖然還很難判斷使用者能否接受該專利的另類(lèi)語(yǔ)音輸入方法及該專利的市場(chǎng)前景,但很多看似天馬行空的研發(fā)往往孕育著巨大的商機(jī),如果它們能找到正確的市場(chǎng)和恰當(dāng)?shù)耐苿?dòng)方法。

驗(yàn)證了語(yǔ)音交互技術(shù)的又一種可能

語(yǔ)音識(shí)別技術(shù)離完美還很遠(yuǎn),噪雜的環(huán)境、吐字不清的詞匯、俚語(yǔ)及方言都會(huì)讓機(jī)器陷入混亂,開(kāi)發(fā)更精準(zhǔn)更私密的語(yǔ)言識(shí)別技術(shù),仍是包括微軟在內(nèi)的產(chǎn)業(yè)和學(xué)界的主要科研方向。

通常情況下,語(yǔ)音輸入首先要發(fā)出聲音,其次需要一個(gè)相對(duì)安靜的環(huán)境。根據(jù)微軟這項(xiàng)專利的說(shuō)明,只要讓麥克風(fēng)等設(shè)備靠近嘴巴,該語(yǔ)音輸入解決方案就能捕捉到極低的,如同耳語(yǔ)般的聲音信號(hào),并過(guò)濾掉周?chē)碾s音。除自己之外,別人聽(tīng)不見(jiàn)或聽(tīng)不懂。

當(dāng)然,說(shuō)話方式可能需要練習(xí)。一般情況下,我們講話時(shí)吐氣,微軟的解決方案要求使用者在吸氣時(shí)執(zhí)行語(yǔ)音輸入。

此外,盡管語(yǔ)音輸入的性能持續(xù)被改善,但除了“調(diào)戲”siri,很少有人會(huì)在公共場(chǎng)所一本正經(jīng)的用語(yǔ)音輸入,怕打擾別人,也有語(yǔ)音內(nèi)容私密性的顧慮。在這種情況下,微軟的專利不失為一種妥善的解決方案。

而麻省理工學(xué)院的研究人員開(kāi)發(fā)的新型人機(jī)接口“AlterEgo”則更為魔幻,骨傳導(dǎo)耳機(jī)環(huán)繞用戶的耳朵和下巴,計(jì)算機(jī)系統(tǒng)處理并翻譯耳機(jī)接收的數(shù)據(jù)并輸出反應(yīng),如同人們?cè)陂喿x時(shí)的“默念”。

這個(gè)系統(tǒng)有點(diǎn)像“肌電假體”,當(dāng)你準(zhǔn)備作出某種行為時(shí),大腦會(huì)告訴肌肉怎么做,同理,當(dāng)你想著某個(gè)詞時(shí),大腦會(huì)向面部及喉部肌肉發(fā)送信號(hào)。

主要研究人員Arnav Kapur表示,他們的初衷是將人類(lèi)和機(jī)器以某種方式進(jìn)行混合,仿佛人類(lèi)自身認(rèn)知的內(nèi)部延伸。

如果這臺(tái)設(shè)備真的能商用,確實(shí)意義非凡。但是,當(dāng)前的無(wú)聲語(yǔ)音識(shí)別都處在技術(shù)驗(yàn)證階段,這究竟是一種無(wú)用的“情懷技術(shù)”,還是可演變?yōu)橛糜谔厥鈭?chǎng)景的產(chǎn)品,尚待業(yè)界探索。

工程師們還在努力彌補(bǔ)語(yǔ)音技術(shù)缺陷

語(yǔ)音技術(shù)不僅具有典型的“賦能”特征,更是當(dāng)前人們與人工智能互動(dòng)的最重要界面,已同焦土戰(zhàn)般激烈的“百箱大戰(zhàn)”給語(yǔ)音技術(shù)市場(chǎng)帶來(lái)很多幻象。

事實(shí)上,現(xiàn)在大多數(shù)基于語(yǔ)音技術(shù)的硬件產(chǎn)品與智能服務(wù)交互體驗(yàn)仍然存在很多缺陷,研究機(jī)構(gòu)與產(chǎn)業(yè)公司還在技術(shù)研發(fā)層面不斷努力完善。

微軟全球資深技術(shù)院士、微軟云與人工智能事業(yè)部負(fù)責(zé)人黃學(xué)東博士,是微軟語(yǔ)音技術(shù)的創(chuàng)始人,微軟的語(yǔ)音識(shí)別、語(yǔ)音合成技術(shù)研發(fā)團(tuán)隊(duì)都由他一手組建。

在黃學(xué)東的帶領(lǐng)下,2016年10月18日,微軟語(yǔ)音團(tuán)隊(duì)識(shí)別研究團(tuán)隊(duì)在 Switchboard語(yǔ)音識(shí)別基準(zhǔn)測(cè)試中刷新自己的紀(jì)錄,詞錯(cuò)率低至5.9%,達(dá)到了人類(lèi)的水平。

306天后,這一紀(jì)錄再次被微軟刷新,詞錯(cuò)率降低到 5.1%,超過(guò)專業(yè)速記員的誤差水平,被學(xué)術(shù)界看作是“人工智能在感知上的一重大里程碑”。

微軟全球執(zhí)行副總裁沈向洋說(shuō):“盡管這項(xiàng)語(yǔ)音識(shí)別系統(tǒng)還存在一些應(yīng)用場(chǎng)景的限制,但我相信未來(lái)幾年內(nèi),機(jī)器將會(huì)完全超越人類(lèi)的識(shí)別水平。”

盡管各類(lèi)科研機(jī)構(gòu)為了實(shí)現(xiàn)語(yǔ)音識(shí)別準(zhǔn)確率的“人類(lèi)對(duì)等”,奮斗了二十幾年,但目前在嘈雜環(huán)境下較遠(yuǎn)的麥克風(fēng)的語(yǔ)音識(shí)別、方言識(shí)別、訓(xùn)練數(shù)據(jù)有限的特定說(shuō)話風(fēng)格或較少人使用的語(yǔ)言的語(yǔ)音識(shí)別等,都未達(dá)到人類(lèi)水平。

與此同時(shí),Switchboard雖然是全球語(yǔ)音研究人員用了20多年的通用測(cè)試數(shù)據(jù)集,很多技術(shù)公司與組織在上面做語(yǔ)音方面的相關(guān)研究,它有著全球開(kāi)發(fā)人員多年來(lái)的技術(shù)積累,但并不意味著測(cè)試結(jié)果可以“平移”到現(xiàn)實(shí)環(huán)境中。

如黃學(xué)東所說(shuō),公開(kāi)性的測(cè)試、發(fā)表的學(xué)術(shù)文章,與現(xiàn)實(shí)產(chǎn)品雖然不能完全割裂,但消費(fèi)級(jí)產(chǎn)品與商業(yè)場(chǎng)景,需要不一樣的評(píng)判標(biāo)準(zhǔn)。

關(guān)鍵詞:
圖片版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系我們,我們立刻刪除。
新化月報(bào)網(wǎng)報(bào)料熱線:886 2395@qq.com

相關(guān)文章

你可能會(huì)喜歡

最近更新

推薦閱讀
延寿县| 丹凤县| 遵义市| 靖江市| 无极县| 隆德县| 塔河县| 嘉峪关市| 普定县| 澳门| 镇坪县| 天峻县| 益阳市| 明星| 宜州市| 天等县| 田林县| 阿拉尔市| 固始县| 朝阳市| 神农架林区| 潍坊市| 平潭县| 高碑店市| 略阳县| 舒城县| 宜城市| 鹰潭市| 会泽县| 翁牛特旗| 公主岭市| 曲阳县| 新巴尔虎右旗| 梨树县| 沁阳市| 南雄市| 泰顺县| 太仆寺旗| 宣城市| 志丹县| 天镇县|