Google利用AI讓演講內容能以文字即時在投影片上呈現

運用機器學習在內的人工智慧技術,Google稍早宣布將在旗下投影片編輯服務Google Slides導入自動字幕功能,預計率先提供G Suite企業用戶使用。

在此項新功能裡,使用者將可透過裝置麥克風錄製聲音,並且由Google Slides自動將聲音內容識別轉換為文字,並且即時在投影片中呈現。

目前此項功能僅先對應美式英語,同時也必須透過Chrome瀏覽器開啟Google Slides操作,相關使用辦法可以參考Google說明

而識別基礎則是建立在Google預先透過一般人經常使用10億組例句進行訓練,同時文字轉換正確與否,則是取決使用者的口音、語調,以及講話速度,另外個人慣用語句也可能影響實際識別結果。

雖然無法保證目前是否能完善地即時呈現使用者表達內容,但Google表示接下來將會持續讓此項功能精進,並且避免在使用過程產生認知偏見,或是產生歧視等負面情況。

微軟先前也曾運用旗下Translator翻譯服務,透過外掛方式讓Powerpoint也能對應類似功能,藉此讓演講現場所有與會人員能即時透過手持裝置觀看文字內容,避免現場因為其他聲音干擾,導致無法清楚聆聽台上人員演講內容。

發表迴響

%d 位部落客按了讚: