AI又有進步 可在多人情況下辨認聲音

2017-11-05
  • A
  • A+
  • A++

前幾天中國重金砸下,培植本土產業曠世科技研究AI;蘋果手機的必備功能Siri現已可以成了許多人的重要智慧助理。最近,AI產業往前邁進!過去智慧助理這類的功能無法在吵雜的環境下辨認聲音,但日前位於美國麻州的三菱電子研究中心研發出一項技術,能在多人講話的情況辨認出你的聲音,並於東京科技展首次亮相。

 

根據國外網站New Scientist報導,像Amazon或是Google皆有建置聲音辨認的功能,但是若是在吵雜的派對當中,這些語音辨識效果會遇到困難而無法執行指示。現在,AI技術有新的發展,這項新的技術能夠在有許多不同的說話者的情況下,自動辨認出你的聲音,「它甚至可以幫你找到離你最近的電梯」。

 

AI又有進步 可在多人情況下辨認聲音

(AI技術有新的發展,這項新的技術能夠在有許多不同的說話者的情況下,自動辨認出你的聲音。圖取自網路)

 

研究團隊表示,他們使用機器學習中一種稱為「deep clustering」的方法來辨認每個人的「聲音軌跡」(voiceprint)。三菱電子發言人梅克(Niels Meinke)說,一開始他們使用 100 個英語母語使用者來訓練機器學習模型,後來發現即使用帶有口音的聲音當訓練資料,機器也有辦法辨認出不同聲音。

 

報導指出,相比傳統使用兩個麥克風模擬人耳的方法來辨認聲音--只有 51% 準確度,這套新方法在兩個人說話的環境下,辨認準確度可達 90%,就算3個人的環境也能有 80% 準確度,這樣的結果是這套系統從未遇過的佳境。

 

多人環境下語音辨識的問題已困擾人工智慧界多年,這項新技術可望幫助智慧家庭助理、智慧汽車,甚至自動語言翻譯等領域的進步。三菱電子也表示,他們正計劃安裝語音辨識技術到自家冷氣、電梯等產品。

 

AI又有進步 可在多人情況下辨認聲音 | 文章內置圖片

(蘋果的語音辨識功能Siri受到高度喜愛。圖取自網路)

 

 

 

  • 本文評論:
分享: