Google利用AI讓演講內容能以文字即時在投影片上呈現 - mashdigi

運用機器學習在內的人工智慧技術，Google稍早宣布將在旗下投影片編輯服務Google Slides導入自動字幕功能，預計率先提供G Suite企業用戶使用。

在此項新功能裡，使用者將可透過裝置麥克風錄製聲音，並且由Google Slides自動將聲音內容識別轉換為文字，並且即時在投影片中呈現。

目前此項功能僅先對應美式英語，同時也必須透過Chrome瀏覽器開啟Google Slides操作，相關使用辦法可以參考Google說明。

而識別基礎則是建立在Google預先透過一般人經常使用10億組例句進行訓練，同時文字轉換正確與否，則是取決使用者的口音、語調，以及講話速度，另外個人慣用語句也可能影響實際識別結果。

雖然無法保證目前是否能完善地即時呈現使用者表達內容，但Google表示接下來將會持續讓此項功能精進，並且避免在使用過程產生認知偏見，或是產生歧視等負面情況。

微軟先前也曾運用旗下Translator翻譯服務，透過外掛方式讓Powerpoint也能對應類似功能，藉此讓演講現場所有與會人員能即時透過手持裝置觀看文字內容，避免現場因為其他聲音干擾，導致無法清楚聆聽台上人員演講內容。

相關內容