App 市場動態 影音 手機 生活 網路 觀察 軟體

Google在即時語音轉錄文字app加入過濾額外聲音干擾功能

今年二月針對聽障人士打造的Live Transcribe app,Google稍早做了一些更新,讓app增加能夠辨識環境聲音功能,例如判斷聲音內容是周遭人士無謂的低語,或是鄰近的狗叫聲,避免造成不必要的誤判情況。

-

目前Live Transcribe已經可讓全球18億台Android裝置使用,本身透過連網以雲端協作形式進行機器學習,透過裝置端的麥克風進行收音,並且將收錄人聲口語內容轉換成文字呈現,讓聽覺障礙者可以透過文字敘述方式與人「對談」。

而為了改善麥克風可能同時錄到環境雜音,導致轉換成文字內容時會造成一些誤判困擾,因此Google藉由機器學習方式進一步判斷過濾人聲無謂的低語,或是環境中狗叫等聲音,讓聽障者能更容易透過聲音轉換文字方式明白他人陳述內容。

這樣的方式也有助於線上直播內容即時轉成文字敘述,同時也能讓接下來即將成為Android Q功能之一的Live Caption應用表現更加實用。

現階段Live Transcribe app已經可以對應英文 (區分美式英文、英式英文、澳洲英文)、中文 (目前僅對應香港繁中、中國簡中用語)、日文,以及包含印度、中東、俄羅斯與歐洲等地區語言,並且增加文字內容選取複製功能,讓使用者更方便用於口語內容記錄,並且快速轉換成文字內容。

不過,就現階段的應用表現來看,Live Transcribe依然有無法正確判斷連續對話,或是無法正確判斷過於口語化陳述內容的情況,但預期會在後續調整之下持續改善。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響