除了指紋識(shí)別、面容識(shí)別,你還能想到什么生物識(shí)別方法?
除了指紋識(shí)別、面容識(shí)別,你還能想到什么生物識(shí)別方法呢?沒錯(cuò)!就是聲紋識(shí)別。雖然聲紋識(shí)別一直非常低調(diào),但也不能否認(rèn)它是人工智能領(lǐng)域的又一黑科技。
語(yǔ)音識(shí)別并不是聲紋識(shí)別
▲ 設(shè)置Siri時(shí)的聲紋識(shí)別
聲紋識(shí)別聽上去好像很高級(jí),其實(shí)不少小伙伴的手機(jī)里就有這個(gè)功能哦。小黑以iPhone為例,當(dāng)你開啟Siri語(yǔ)音助手時(shí),系統(tǒng)會(huì)先讓你讀出一些特定的句子。這個(gè)步驟就是為了識(shí)別你的聲紋,以免其他人可以喚醒你的Siri。
▲ 通過聲音可控制許多智能家居
現(xiàn)在很多智能家居都可以通過聲音來操控,比如用小愛音箱來開關(guān)燈具,或者對(duì)智能電視發(fā)出指令來調(diào)換頻道等。于是就會(huì)有許多小伙伴認(rèn)為,這也是聲紋識(shí)別。其實(shí)目前大多數(shù)的聲音操控都屬于語(yǔ)音識(shí)別。
簡(jiǎn)而言之,語(yǔ)音識(shí)別是為了識(shí)別語(yǔ)音中的內(nèi)容,并用AI自動(dòng)將我們說出的話轉(zhuǎn)換成相應(yīng)的文字。而聲紋識(shí)別可以識(shí)別出說話人的身份,實(shí)現(xiàn)“一對(duì)一”語(yǔ)音控制。因此,聲紋識(shí)別不注重語(yǔ)音信號(hào)的語(yǔ)義,而是從語(yǔ)音信號(hào)中提取個(gè)人聲紋特征,挖掘出包含在語(yǔ)音信號(hào)中的個(gè)性因素。
聲紋識(shí)別究竟特別在哪里?
我們平時(shí)在說話時(shí)的發(fā)聲器官在尺寸和形狀方面每個(gè)人的差異都很大,所以任何兩個(gè)人的聲紋圖譜都不可能相同。聲紋識(shí)別也正是通過這個(gè)特點(diǎn)來通過對(duì)比語(yǔ)音的相同音素上的發(fā)聲來判斷聲音是否屬于同一個(gè)人。
聲紋識(shí)別基于語(yǔ)音中所包含的說話人特有的個(gè)性信息,再利用計(jì)算機(jī)以及現(xiàn)有的識(shí)別技術(shù),自動(dòng)鑒別當(dāng)前語(yǔ)音對(duì)應(yīng)的說話人身份。聲紋識(shí)別系統(tǒng)包含了說話人模型訓(xùn)練和測(cè)試語(yǔ)音識(shí)別兩個(gè)階段。
▲ 聲紋識(shí)別的系統(tǒng)框架
訓(xùn)練階段:對(duì)使用系統(tǒng)的說話人預(yù)留了充足的語(yǔ)音,并對(duì)不同說話人的語(yǔ)音提取聲學(xué)特征,然后根據(jù)每個(gè)說話人的語(yǔ)音特征,訓(xùn)練得到對(duì)應(yīng)的說話人模型,最終將全體說話人模型集合在一起組成系統(tǒng)的說話人模型庫(kù)。
識(shí)別階段:說話人進(jìn)行識(shí)別認(rèn)證的時(shí)候,系統(tǒng)對(duì)識(shí)別語(yǔ)音進(jìn)行相同的特征提取,并將語(yǔ)音特征與說話人模型庫(kù)進(jìn)行比對(duì),得到對(duì)應(yīng)說話人模型的相似性打分,最后根據(jù)識(shí)別打分,判斷說話人身份。
▲ 指紋和面容識(shí)別無法做到無感知
和指紋識(shí)別相比,聲紋識(shí)別技術(shù)可以做到無感知、無接觸。你不需要用手指觸摸很多人留下細(xì)菌的指紋識(shí)別設(shè)備。而相比于面容識(shí)別,特別在人人都戴口罩的特殊時(shí)期,不用摘下口罩依然可以利用聲紋來辨別信息。
哪些場(chǎng)景會(huì)運(yùn)用到聲紋識(shí)別?
其實(shí)當(dāng)今遠(yuǎn)程交互方式變得越來越多,在一些特定的智能場(chǎng)景中,是沒有辦法通過指紋或是面容來進(jìn)行識(shí)別的,那么聲紋識(shí)別就成為了唯一可以識(shí)別我們身份的技術(shù)。既然聲紋識(shí)別這么厲害,它可以被運(yùn)用到哪些場(chǎng)景中呢?
大家應(yīng)該都在銀行的電話客服上面辦過業(yè)務(wù)吧,每一次都要報(bào)出身份證、手機(jī)號(hào)等一系列能夠證明自己身份的信息。但如果聲紋識(shí)別未來得到普及,銀行就可以通過聲紋來辨別身份,無論是電話還是網(wǎng)上都能夠輕松辦理業(yè)務(wù)了。
當(dāng)然,社保局也可以運(yùn)用聲紋識(shí)別防止養(yǎng)老金被冒領(lǐng)。畢竟許多老人對(duì)于人工智能、生物識(shí)別并不很了解,而聲紋識(shí)別只用通過聲音,哪怕本人無法到達(dá)現(xiàn)場(chǎng),也可以通過電話進(jìn)行遠(yuǎn)程身份確認(rèn)。
聲紋識(shí)別還可以運(yùn)用到火車、飛機(jī)的安檢流程中,有效的對(duì)危險(xiǎn)人物進(jìn)行識(shí)別和提示。對(duì)于電話詐騙、刑事案件也有很大的幫助,公安司法人員可以通過聲紋識(shí)別來鎖定嫌犯或縮小偵查范圍。
不過,聲紋識(shí)別的缺點(diǎn)也十分明顯,對(duì)環(huán)境的要求非常高,在嘈雜的環(huán)境混合說話下,聲紋不易獲;人的聲音也會(huì)隨著年齡、身體狀況、情緒等的影響而變化;不同的麥克風(fēng)和信道對(duì)識(shí)別性能有影響等。
聲紋識(shí)別作為最前沿的生物識(shí)別技術(shù)之一,未來一定會(huì)有更多有意義的使用場(chǎng)景,例如在操控智能音箱時(shí),根據(jù)不同用戶的聲紋判斷他們的使用習(xí)慣,來以此提供更人性化的服務(wù)。不過,小黑覺得想要達(dá)到真正的一對(duì)一聲紋識(shí)別,人工智能還需要時(shí)間來學(xué)習(xí)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?