Tag: Google Translate

Google翻譯導入Gemini 變得更懂「梗」!強化俚語與成語翻譯、耳機即時口譯能保留語氣

Google翻譯導入Gemini 變得更懂「梗」!強化俚語與成語翻譯、耳機即時口譯能保留語氣

Google稍早宣布針對旗下搜尋與Google翻譯App推出基於Gemini AI模型的重大更新,讓翻譯結果可以更具「人味」,不僅能精準解讀帶有弦外之音的俚語 (Slang) 與成語,還針對耳機使用者推出了能保留說話者語氣的即時翻譯功能。 拒絕「機翻」感,Gemini幫你懂在地俚語 Google表示,透過導入Gemini模型,新的文字翻譯功能現在能處理更具「細微差別」 (nuanced meanings)的語句。過去翻譯App遇到口語化的俚語或習慣用語時,往往會給出令人啼笑皆非的直譯結果。而此次更新後,系統會將這些非正式用語納入考量,提供更自然、更符合當地情境的翻譯。 這項功能首波將在美國與印度推出,支援英文與其他約20種語言 (包含中文、德文、西班牙文與阿拉伯文等)之間的互譯,並且同步開放iOS、Android App與網頁版本更新。 耳機即時口譯:聽得懂口語中的「抑揚頓挫」 除了文字,語音翻譯也有更新。Google升級其語音對語音 (speech-to-speech)翻譯功能,讓使用者透過耳機就能聽到即時翻譯。 這項功能目前以Beta測試版形式先在美國地區的Android版翻譯App提供 (iOS版本預計明年推出),最大特色在於透過AI保留說話者的語氣、強調重點與抑揚頓挫 (cadence),讓使用者即使不用看畫面也能聽出對方是在生氣,或是在開玩笑,更清楚對話的流向。 而這項功能支援任何耳機 (不侷限Pixel Buds),並且支援超過70種語言。這似乎是有意與蘋果AirPods Pro 3的類似功能互別苗頭。 越來越像Duolingo?學語言功能再強化 Google似乎也想搶食語言學習市場的大餅。繼今年8月開始在翻譯App中加入AI輔助學習工具後,這次更新加入了類似Duolingo的「連續打卡」功能,系統會記錄使用者連續幾天進行語言練習,激勵使用者持之以恆 (但不知道是否會像Duolingo以情勒鳥形式持續「死纏爛打」。 此外,發音回饋功能也獲得改善,能提供更實用的發音建議。這套教育工具將擴大開放至德國、印度、瑞典等20個國家地區使用。 分析觀點:AI讓翻譯從「看懂」進化到「聽懂」 筆者觀察,Google近期對翻譯的關注度明顯提升,雖然很早就開始以AI技術提升翻譯功能,但近年藉由生成式AI技術,則是讓Google翻譯功能從過往機器翻譯表現,顯得更有「人味」,同時翻譯準確率也變得更高 (雖然還是有不少語言文化上的落差)。 而此次針對俚語與語氣翻譯的提升,可以看出Google正利用Gemini的優勢,試圖解決機器翻譯長久以來缺乏「語境」與「情緒」的痛點。當AI開始能聽懂你的弦外之音與語氣起伏,跨語言溝通的最後一道高牆或許真的快被推倒了。

Google:未來5年內讓人與電腦能以自然語言「對談」

Google翻譯整合Gemini,新增「Advanced」選項、犧牲速度換取更高翻譯準確性與上下文語境

Google 稍早開始為旗下 Google 翻譯 (Google Translate) 服務導入更深度的 Gemini 模型整合。在新版本的 App 中,將新增一個翻譯模型選項,允許用戶在標準的「Fast」 (快速)模式,以及由 Gemini AI 加持的「Advanced」 (進階)模式之間進行選擇,藉此滿足不同的使用需求。 Advanced 模式:速度較慢,但更準確、更通順 根據 Google 的說明,既有的「Fast」模式將維持其一貫的翻譯速度與效率,適用於需要即時結果的場景。而切換至「Advanced」模式後,系統將會「使用 Gemini 專注於準確性」。 這也意味在 Advanced 模式下,AI 處理所需的時間會相對較慢,但其產出的譯文將更為準確,並且更符合上下文的語境。報導指出,此模式生成的譯文品質,已相當接近用戶直接使用 Gemini 服務進行翻譯的結果。 提醒留意 ...

Google:未來5年內讓人與電腦能以自然語言「對談」

Google翻譯以AI升級,加入語言學習工具與即時會話翻譯功能

長期作為Google服務生態中最受歡迎的Google翻譯,在稍早更新也納入更多Gemini AI應用功能,讓翻譯服務不僅停留在「看懂文字」的階段,更往「幫助學習」與「流暢溝通」的方向前進。 AI驅動的語言學習體驗 Google在調查使用者需求後發現,跨語言溝通中最難克服的往往不是字詞理解,而是實際的口語交流。因此新版Google翻譯加入全新「語言學習工具」,透過AI建立模擬對話場景,協助使用者進行聽力與口語練習。 不同於單純的單字或文法測驗,這項功能會根據使用者的目標語種與學習動機進行客製化安排,例如模擬日常對話、旅行場景,甚至在必要時給出即時提示。而學習進度也能透過打卡與進度追蹤方式呈現,提升使用者的持續動力。 目前這項功能的語言支援仍相當有限,主要鎖定英語與部分歐洲語系。例如,英語使用者可學習西班牙語與法語,而西班牙語、法語及葡萄牙語使用者則可學習英語。 Google表示,後續將逐步擴展更多語種。整體來看,這項功能雖不至於直接取代Duolingo等專業語言學習軟體,但作為日常翻譯工具的延伸,將能增加更多實用價值。 更自然的即時會話翻譯 另一項重點更新,則是以AI驅動的即時會話翻譯功能。相較於過去單純將對話逐句轉譯,新版Google翻譯能自動偵測雙方語言 (支援超過70種),並且同時改善語音的自然度,包含語調、停頓與流暢性,將使翻譯內容聽起來更接近真人對話,而非以機械化聲音輸出。 此外,Google也強化在噪音環境下的使用體驗,例如在機場、咖啡店等公共場域,演算法會盡可能過濾背景聲音,讓對話不受干擾。目前這項功能已經在美國、印度與墨西哥率先推出,接下來會逐步開放至更多地區。 翻譯服務的新定位 在Google翻譯於全球範圍的使用率與實際需求始終居高情況下,此次更新凸顯Google希望重新賦予此項服務使用定位,使其不只是滿足查詢單詞或簡單翻譯的需求,更可成為語言學習輔助與跨文化交流工具。 隨著AI技術普及,翻譯應用逐漸從「工具」走向「服務」。未來Google翻譯若能持續擴展學習語種、深化對話互動,甚至與Gemini AI持續整合,將可能成為許多使用者在日常溝通與學習上的第一選擇。 Google翻譯與常見翻譯、語言學習工具比較: 功能面向 Google翻譯 (新版) DeepL Duolingo Speak 核心定位 翻譯工具 + AI語言學習 + 即時會話翻譯 翻譯工具 (專注文字翻譯與文體調整) ...

原本僅向Google One用戶提供的暗網報告功能,將從7月底後開放所有用戶使用

從印度方言到日本喜劇翻譯,Google以AI推動亞洲超過2300種在地語言數位化發展

相關資料顯示,亞洲目前現存超過2300種在地語言,佔全球地區約32%比例,但其中多半數缺乏數位化資源,甚至面臨被邊緣化,或是面臨消失危機。Google透過一系列AI專案,試圖讓更多在地語言能進入數位化發展。 Project Vaani:長達21500小時語音數據,深入印度腹地 三年前,Google與印度科學研究所啟動名為「Project Vaani」的計畫,目標收錄涵蓋全國773個地區的語言變體。目前已經收集長達21500小時語音音檔與835小時的轉錄資料,涵蓋86種語言,分別來自11.2萬名發言者。 這些數據並未限制在特定專案內部,而是透過印度國家語言任務Bhashini與HuggingFace平台向大眾社群免費開放,藉此促進更多AI模型的開發與應用。 專案負責人解釋,印度境內語言並非在邦內統一,以印度人口第二多、面積第十二大的比哈爾邦為例,當地就有超過100種在地方言與其變體。而人口流動讓語言差異變得更加複雜,因此讓服務能在全印度地區通用,就必須捕捉這些語言細緻變化。 目前Project Vaani已經完成第一與第二資料收集階段,涵蓋160個區縣,並且與Megdap、Karya等單位合作,持續擴大語料收集規模。 Project SEALD與Aquarium:東南亞1200種語言的資料庫 東南亞地區總計有11個國家、超過6.5億人口,語言多達1200種,其中光在印尼境內就有超過700種在地語言。為應對如此複雜的語言環境,Google與AI Singapore共同推動Project SEALD計畫,核心工具為Aquarium平台。 Aquarium平台的目標,是建立一個完整的東南亞語言資料目錄,讓任何人都能貢獻與使用資料,促進符合當地需求的AI工具與應用。 專案團隊也針對低資源與瀕危語言制定策略,包含與當地機構合作,將紙本或口述資料數位化,並且由母語人士校驗。若語言幾近消失,則透過圖片或文字提示,蒐集母語者的聲音內容與轉錄資料,並且保存至語料庫。 CHAD 2:用AI打破日本喜劇的語言障礙 語言AI不僅止於保存,更能推動文化輸出。日本最大娛樂經紀公司吉本興業與Google合作開發的CHAD 2系統,是以Gemini 2.0 Flash為基礎,專為「お笑い」 (Owarai,日本喜劇)翻譯所設計。 只要上傳影片,CHAD 2就能自動生成中、英、韓字幕,其轉錄與翻譯準確率達90%,遠高於一般模型的60%-75%,同時將翻譯流程所需時間從數月縮短至數分鐘。 系統內建超過200種喜劇專屬詞典,能處理文化典故與笑點,未來只需增加詞典,即可拓展至動漫、戲劇或體育翻譯領域。吉本興業也正推動將該系統商業化,讓全球觀眾能即時理解日本喜劇笑點。 透過AI彌補數位鴻溝的未來 無論是Project Vaani的印度方言、SEALD聚焦的東南亞語言,或是CHAD 2跨越文化壁壘的應用,都凸顯AI正在成為語言保存與文化傳播的重要工具。隨著資料規模擴大與模型進化,Google所推動的這場語言數位化革命,將讓更多亞洲語言走出失聲的邊緣,在全球數位世界中佔有一席之地。 ...

Google:未來5年內讓人與電腦能以自然語言「對談」

Google以PaLM 2模型大幅提升翻譯功能,新增110種語言翻譯、透過AI學習更多語言

Google宣布以其大型自然語言模型PaLM 2強化翻譯功能,讓Google翻譯服務新增110種語言,其中強化多數非洲境內語言,甚至也強化中文裡的粵語遣辭用字,使其更符合香港地區中文翻譯習慣。 距離上次在2022年5月大幅更新Google翻譯服務,並且在後續聲明將以人工智慧技術強化翻譯品質之後,Google在此次更新也利用PaLM 2模型學習翻譯語種貼近語系,使其翻譯品質能進一步提升。 依照Google翻譯資深軟體工程師Isaac Caswell說明,利用PaLM 2模型學習能力,將使系統能更快藉由印地語學習同屬印歐語系的阿瓦迪語、馬爾瓦語,或是以法語或英語等語言混用詞法的克里奧爾語,而未來也將持續與語言專家與更多母語人士合作,讓Google翻譯能對應更多語言與拼寫呈現方式。 此次更新將使全球約6.14億人 (等同全球總人口數的8%)受益,同時此次更新語種約四分之一對應非洲境內使用語言。至於此次更新將包含網頁版Google翻譯,以及iOS與Android平台版本,方便使用者透過不同裝置、平台使用。

Google將地圖、行事曆、翻譯等功能整合進iOS版Chrome瀏覽器

Google將地圖、行事曆、翻譯等功能整合進iOS版Chrome瀏覽器

Google稍早公布4個針對iOS版Chrome瀏覽器的更新,其中包含內建Google Maps、Google Calendar與Google Translate功能,同時也能直接使用Google Lens服務。 在此次更新後,使用者日後將無須額外下載,或是跳出開啟Google Maps等常用服務App,不僅能加快內容瀏覽效率,同時也能相對降低裝置耗電量,另一方面也能減少使用者下載不常使用的App,避免佔用裝置儲存空間。 不過,內建在Chrome瀏覽器內的服務功能相對簡單,但基本上像是檢視連結對應的Google Maps位置資訊,或是使用Google Translate翻譯功能,基本上都能滿足一般使用需求。 至於在內建於Chrome瀏覽器的Google Lens功能,則可直接透過裝置相機進行拍攝搜尋,或是透過長按圖片進行識別,對於使用者而言應該可以帶來更大使用便利性。 雖然將幾個服務功能整合進Chrome瀏覽器,但Google表示如果需要使用更進階功能,基本上還是會建議使用者個別下載所需App。

網頁版Google翻譯終於可以透過上傳方式翻譯圖像文字

網頁版Google翻譯終於可以透過上傳方式翻譯圖像文字

行動版Google翻譯很早就能藉由Google Lens技術翻譯圖像形式的文字內容,Google稍早也正式宣布將此項功能帶到網頁版Google翻譯。 使用方式基本上與行動版相同,只是網頁版主要還是透過上傳影像或擷圖內容,讓系統能自動識別圖像內容對應文字。 而支援語言部分,則總計對應113種語言識別效果,並且能將識別結果翻譯成總共133種語言,另外翻譯後的文字內容也能複製,或是保存紀錄。 在近期公布消息中,Google表示其結合人工智慧與深度學習技術的語言翻譯功能,已經可以呈現相當流暢、正確的翻譯結果,甚至強調比OpenAI提出的Whisper大型語言模型能有更準確的語言理解能力。

Google:未來5年內讓人與電腦能以自然語言「對談」

Google翻譯結果更貼近自然語意,更能串接上下文表意

借助人工智慧技術發展,Google翻譯的品質其實相比過去幾年已經提升許多。而在此次宣布更新消息中,Google更強調可讓Google翻譯結果更貼近自然語意,同時更能串接上下文表意,讓使用者更能理解不同語言所表達內容。 相比過往僅以資料比對方式,往往會出現「文不對題」的詭異翻譯結果,其中有不少因素與許多語言經常有單字對應多種詞義,或是在不同語句使用情況下,會有不同涵義有關,因此若是單純透過資料比對方式進行逐字翻譯,就會出現令人難以理解的翻譯內容。 而借助人工智慧技術,讓翻譯系統能借助人工智慧語言模型,更進一步理解不同字句組合所應對應涵義,進而能讓翻譯結果更貼近正確語意,不會將「鱸魚」當作「貝斯」 (兩者的英文單詞都是「bass」)。 目前新版Google翻譯將會在未來幾周內推出,將對應英文、法文、德文、日文和西班牙文等主要語言。 另外,新版Google翻譯也換成全新介面,更計畫在未來調整iOS版本介面,讓使用者能更方便直覺使用,或是透過相機鏡頭拍攝翻譯。而在新增加手勢中,增加按住語言按鈕,並且快速滑動,即可選擇最近曾使用過的語言選項,或是在主畫面文字區域向下滑動,就能快速查閱最近的翻譯紀錄。 同時新版介面也變得更容易閱讀,並且適時加入其他翻譯結果與字詞定義參考內容,此次更增加包含巴斯克文、科西嘉文、夏威夷文、苗文、庫德文、拉丁文、盧森堡文、巽他文、意第緒文和祖魯文等33種語言,同樣可使用離線翻譯功能。

Google翻譯增加24種新語言、採用全新學習方式,未來將成為更直接溝通工具

Google翻譯增加24種新語言、採用全新學習方式,未來將成為更直接溝通工具

Google翻譯一直是Google相當重要的產品,目的就是為了消弭語言之間的溝通隔閡,藉此讓知識、情感可以更容易交流。而在此次Google I/O 2022中,Google也將Google翻譯列為重點更新項目,分別宣布增加支援24種新語言,同時也宣布啟用全新訓練模式,進而讓Google翻譯可以有更多應用可能性,甚至也提出整合Google翻譯功能的智慧眼鏡,讓不同語言使用者能透過即時翻譯進行溝通。 依照Google先前說明,Google翻譯除了讓使用者能更容易溝通,並且打破語言隔閡之外,更重要的是保留全球更多稀少語言,而此次增加的24種語言分別涵概印度、非洲,以及南美洲,使用人數總數約為3億。 同時,Google也說明相比過往是透過比對方式進行翻譯,亦即透過兩種語言共同文本進行學習,理論上只要參考文本數量足夠,實際產生翻譯品質就會相對提升,但這樣的方式用於較少人使用的語言,顯然就會失真,其中因素可能會透過參考跨語言翻譯結果,使得轉譯過程會有誤差。 因此在目前Google採用技術,則是透過建立全新語言模型,讓翻譯系統可以比照人腦理解語言方式進行學習,進而更快學會新語言,並且與既有學習語言進行互譯。 這樣的好處,則是讓Google翻譯可以更準確詮釋特定語言所表達原意,不會有語言多次轉譯產生誤解,或是翻譯結果難以理解的情況,同時也更能保留更多稀少語言。 而在提高Google翻譯品質之餘,Google也將新版Google翻譯應用在更多服務項目,例如針對手機版YouTube增加自動生成翻譯字幕功能。 另外,Google也計畫將Google翻譯功能與智慧眼鏡裝置結合,在先前的測試性目中,Google便透過可透過眼鏡呈現浮空投影字幕方式,讓配戴者能直接透過翻譯字幕了解使用不同語言的對方所陳述內容,例如讓旅居美國、卻不太會說英語的母親,可以聽懂從小只學會英語溝通的女兒所說內容,藉此實現消弭語言隔閡的目標。 但Google並未說明是否會讓此款智慧眼鏡成為實際商品,或是僅為實驗性質產物。

傳Android 13可獨立指定app使用語言翻譯功能,還將原生支援LE Audio音訊技術

傳Android 13可獨立指定app使用語言翻譯功能,還將原生支援LE Audio音訊技術

相關消息指稱,Google預計明年推出的Android 13,將會加入名為「Panlingual」新功能,將可讓app對應獨立使用語言設定,無需與系統設定語言綁定。此外,Android 13也可能原生支援藍牙技術聯盟提出的LE Audio技術規範,藉此對應更好藍牙傳遞音質表現。 依照目前Android平台上的app使用模式,通常會隨著系統設定使用語言,進而使用相同語言介面,除非app本身僅支援單一語言,或是透過使用者手動設定。 而目前在「Panlingual」功能中,則可能讓使用者在系統設定選項內,即可自訂app預設使用語言介面,例如讓系統維持英文介面,app則使用中文介面。此外,此項功能也可能導入Android 12開始強化的翻譯功能,讓app可以透過Google翻譯轉換成不同語言顯示模式。 不過,目前此項功能顯然仍處於初期階段,甚至可能還有不少會做調整部分,或是最終使用模式截然不同。 另一方面,Android 13也可能加入藍牙技術聯盟去年提出的LE Audio技術規範,在標準藍牙技術上增加LC3編解碼技術,讓Android手機能以更低功耗傳輸高品質音訊,並且納入無上限設計的音訊共享功能,以及針對聽障者使用藍牙助聽器加入更好支援性。

第 1 至 2 頁 1 2

Welcome Back!

Login to your account below

Retrieve your password

Please enter your username or email address to reset your password.