語(yǔ)音識(shí)別技術(shù)是未來(lái)
從你的話語(yǔ)中真能聽(tīng)出你是怎樣的一個(gè)人嗎?其實(shí)答案甚至超出了人類(lèi)大腦的想象。從你的聲音中可以察覺(jué)到你的情緒、社會(huì)地位、成長(zhǎng)經(jīng)歷、年齡、種族、體重、身高,以及面部特征—此外還有你周?chē)沫h(huán)境信息。
人耳無(wú)法察覺(jué)這些細(xì)微的信息。但是人工智能呢?那就是另外一回事情了。
經(jīng)常通過(guò)“以培訓(xùn)為目的”的客戶服務(wù)電話錄音來(lái)學(xué)習(xí)的軟件,目前可以從聲音中提取微觀特征,這些特征反映出了講述者的具體情況。這個(gè)概念被稱作“語(yǔ)音畫(huà)像”,2017年12月,卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)的研究人員實(shí)現(xiàn)了一個(gè)突破,他們利用人工智能,僅憑分析錄音,便創(chuàng)造出講述者面部的三維影像?!澳愕穆曇艟拖袷悄愕腄NA或指紋?!笨▋?nèi)基梅隆大學(xué)負(fù)責(zé)這項(xiàng)研究工作的麗塔·辛格(Rita Singh)說(shuō)。
人類(lèi)對(duì)語(yǔ)音分析的研究已經(jīng)持續(xù)了數(shù)十年,但是直到這一次,語(yǔ)音識(shí)別才開(kāi)始進(jìn)入主流。如今,由于計(jì)算能力的大幅提高,以及算法的日益復(fù)雜,一大批語(yǔ)音技術(shù)蓬勃發(fā)展。
美國(guó)海岸警衛(wèi)隊(duì)(U.S. Coast Guard)正在利用卡內(nèi)基梅隆大學(xué)的人工智能技術(shù)對(duì)撥打惡作劇報(bào)警電話的人立案,這些惡作劇電話會(huì)讓實(shí)施營(yíng)救的隊(duì)員撲空,從而造成時(shí)間和金錢(qián)的浪費(fèi)。海岸警衛(wèi)隊(duì)每年大約接到150個(gè)惡作劇電話。這項(xiàng)技術(shù)已經(jīng)在一起針對(duì)撥打此類(lèi)電話的刑事案件中發(fā)揮了作用,不過(guò)目前還不清楚這樣的聲音指紋能否成為呈堂證供。
聲音指紋有可能幫你減少銀行的安全漏洞,因?yàn)樗滥闶悄?,而不是一母同胞的邪惡姊妹。它還能讓你的車(chē)認(rèn)識(shí)你,當(dāng)你坐進(jìn)駕駛座并且開(kāi)口說(shuō)話后,汽車(chē)會(huì)解除防盜報(bào)警,自動(dòng)調(diào)節(jié)座椅,并且根據(jù)你的喜好調(diào)節(jié)溫度。[寶馬(BMW)、奧迪(Audi)和福特(Ford)等汽車(chē)生產(chǎn)商正在與馬薩諸塞州伯靈頓(Burlington)的Nuance Communications公司合作開(kāi)發(fā)這項(xiàng)技術(shù)。]
如果你向電視機(jī)詢問(wèn)有什么好看的喜劇,聲音指紋也許會(huì)讓電視機(jī)打開(kāi)一部R級(jí)的電影,而不是9歲的女兒提出同樣問(wèn)題時(shí)打開(kāi)的G級(jí)電影。法國(guó)的Orange TV正在與Nuance公司合作開(kāi)發(fā)這樣的應(yīng)用程序軟件。
“這僅僅是開(kāi)始?!盕uture Today Institute公司的創(chuàng)始人艾米·韋布(Amy Webb)說(shuō)?!拔磥?lái)10年,我們即將(在生物識(shí)別和語(yǔ)音技術(shù)方面)經(jīng)歷翻天覆地的變化?!盕uture Today Institute是一家技術(shù)公司,它預(yù)測(cè)未來(lái)的技術(shù)趨勢(shì)。
辛格希望有一天她的技術(shù)可以在醫(yī)生進(jìn)行遠(yuǎn)程醫(yī)療時(shí)發(fā)揮作用,為帕金森病(Parkinson's disease)等疾病的早期患者確診。對(duì)于這項(xiàng)技術(shù)的潛能而言,這個(gè)應(yīng)用程序可能只是冰山一角。辛格說(shuō):“如果DNA可以定義你本人,那么從你的聲音中就可以捕獲你的完整人格?!保ㄘ?cái)富中文網(wǎng))
譯者:錢(qián)志清
-
熱讀文章
-
熱門(mén)視頻