同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO
2020-02-24
訪談/Sony定調全新旗艦手機的Xperia 5,究竟是否歸類「Compact」定位?
2019-09-07
Google宣布,旗下AI研究助理服務NotebookLM的影片摘要功能「Video Overview」,目前支援語言已經正式擴展至80種,同時語音摘要功能「Audio Overview」也在非英語環境下新增詳細解說能力。 此波更新新增語言包括日語、中文、阿拉伯語、西班牙語等主要語系,並且開始逐步在全球地區推出。 NotebookLM自2023年7月首次亮相後,即提供以指定資料來源生成摘要與問答的功能,使用者可上傳Google Docs文件、簡報、PDF、網頁網址,或是YouTube影片連結 (需設置為公開狀態),即可透過AI自動整理內容,並且生成內容重點摘要、心智圖等內容,甚至能產生語音對談,或是針對內容進行提問。 Video Overview:將資料轉為短影片,快速掌握重點 Video Overview功能可將上傳資料內容轉換為短影片,讓使用者透過影像形式快速掌握重點,適合學生複習課程內容、研究者掌握學術發表要點,或是DIY愛好者學習複雜操作流程。該功能在今年7月已經先提供英語版本,此次更新則是大幅增加支援語言,讓全球用戶均可直接以母語生成影片摘要,藉此提升學習與研究效率。 Audio Overview:雙聲道解說、長度可調,詳細解析非英語資料 與Video Overview相輔相成的語音摘要功能Audio Overview,則可透過男女雙聲道形式生成討論式對話內容,並且針對上傳內容進行解說與解析。使用者可依需求自訂語音長度,生成簡短精華或完整解說。過去非英語情況僅能生成簡單摘要,而此次更新後則是讓非英語使用者也能獲得詳細分析結果,進一步提升NotebookLM作為跨語言研究工具的價值。 走向多語種AI助理應用 Google表示,NotebookLM的多語種更新目標在於降低語言障礙,讓更多國家與地區的學生、研究者與專業創作者能在同一平台上快速理解大量資料,並且將內容轉化為影音形式,方便複習、分析與展示。 而這也展現Google在AI助理領域持續深化多語言能力的策略,尤其在教育與科研應用場景下,有望進一步提升生產力與跨文化協作效率。
自2023年首次亮相以來,Google推出的AI筆記工具NotebookLM持續擴展應用方式與功能,此次再度宣布加入名為「精選筆記本」 (Featured Notebooks)的新功能,進一步透過主題式內容引導使用者探索NotebookLM的實際應用潛力,並且提供更具互動性與深度的知識學習體驗。 此次新增的「精選筆記本」功能,是由Google與全球各地具公信力的作者、研究機構、媒體與非營利組織合作,將其內容製作為可互動的筆記本範例,展示NotebookLM如何結合AI工具與專業知識內容,打造出實用又可信的知識應用介面。 目前這些「精選筆記本」內容已經可以透過NotebookLM首頁的專屬頁籤存取,首波推出的主題包含長壽建議 (內容來自《Super Agers》一書)、年度趨勢預測 (訓練自《經濟學人》的《The World Ahead》報告),以及《大西洋》的「如何打造更好人生」專欄建議等
先前已經用在NotebookLM服務的語音摘要功能 (Audio Overviews),目前也將納入Google Search搜尋服務,讓使用者能直接透過語音摘要內容「聆聽」搜尋結果,同時也能以虛擬對談方式讓使用者更了解內容重點。 此功能比較適合用於搜尋需要詳細解釋、說明的內容,例如某個真實歷史發生事件、某個慶典緣起,或是特定人物介紹,並且跟NotebookLM服務一樣,可以透過兩名虛擬主持人以對談方式呈現搜尋內容重點。 而播放語速則可從0.25倍放慢到加快2倍之間選擇,同時也能確認人工智慧引述原始參考網頁內容,藉此確認更完整內容細節。其他功能部分,則同樣能向虛擬主持人進行內容提問,或是透過深度探索模式進一步了解特定內容細節。 在先前更新中,Google已經讓NotebookLM支援超過50種語言,讓包含中文、日語、西班牙語、德語、法語、阿拉伯語、韓語等主流語言使用者也能輕易透過NotebookLM彙整文件資料,並且將其輸出為語音對談討論內容,不僅方便使用者透過聆聽方式「閱讀」,甚至也能直接作為Podcast內容進行創作。 此外,Google目前也已經推出NotebookLM對應Android與iOS平台的獨立App,讓使用者能更方便使用。此次將語音摘要功能納入Google Search服務,則將讓更多人透過語音摘要導讀形式「閱讀」冗長的搜尋結果內容。 目前此功能仍為測試階段,使用者必須透過Google實驗室 (Google Labs)申請加入測試。
Google在其AI筆記服務NotebookLM的語音摘要功能新增中文在內超過50種語言、加入互動模式之後,稍早更預告將在5月20日推出其獨立App,讓使用者能更方便使用此服務。 獨立App分別將推出Android與iOS平台版本,並且預計在Google I/O 2025首日開放使用,目前則先開放使用者註冊預約。 而App版本將保留網頁版完整功能,一樣可讓使用者上傳包含網頁網址、YouTube影片、文件內容等,並且透過Gemini人工智慧技術彙整、分析,並且透過語音摘要功能製作分析報告,甚至可以針對報告內容進行提問。 在先前更新,則是進一步擴大讓NotebookLM支援超過50種語言,讓包含中文、日語、西班牙語、德語、法語、阿拉伯語、韓語等主流語言使用者也能輕易透過NotebookLM彙整文件資料,並且將其輸出為語音對談討論內容,不僅方便使用者透過聆聽方式「閱讀」,甚至也能直接作為Podcast內容進行創作。 另外,Google也在語音摘要功能以beta形式新增互動模式,將由人工智慧形成的「主持人」 向使用者主動回答提問內容,或是反問使用者相關問題。
自2023年推出,並且在後續接連加入不少更新的筆記服務NotebookLM,目前在其語音摘要 (Audio Overview)功能正式加入中文、日語、西班牙語等超過50種語言,方便使用者將文件內容輸出為不同語言版本。 語音摘要功能是在去年9月加入NotebookLM,主要可讓NotebookLM背後的人工智慧就使用者上傳資料進行「討論」,並且歸納重點內容,並且以英語為主語言輸出語音內容,讓使用者能以聲音方式聆聽。 而目前則是進一步擴大支援超過50種語言,讓包含中文、日語、西班牙語、德語、法語、阿拉伯語、韓語等主流語言使用者也能輕易透過NotebookLM彙整文件資料,並且將其輸出為語音對談討論內容,不僅方便使用者透過聆聽方式「閱讀」,甚至也能直接作為Podcast內容進行創作。 另外,Google也在語音摘要功能以beta形式新增互動模式,將由人工智慧形成的「主持人」 向使用者主動回答提問內容,或是反問使用者相關問題。
去年10月下旬將Gemini App服務併入DeepMind團隊之後,目前傳出Google Gemini業務負責人蕭令怡 (Sissie Hsiao)將轉任其他職務,而Gemini業務將由負責NotebookLM服務、Google Labs主管Josh Woodward接手。 蕭令怡後續仍會繼續在Google負責其他業務,但接下來會先暫時休息一段時間。至於接掌Gemini業務後,Josh Woodward依然會繼續帶領Google Labs團隊。 近年經常對外發言的蕭令怡,在Google任職長達19年,過去主要負責Google Assistant數位助理服務,近年則是投入Gemini的前身「Bard」開發,後續則是將服務名稱調整為與模型相同的Gemini命名方式,成為Google當前重要發展服務。 而在Gemini業務併入DeepMind團隊,同時Google也確認未來將以Gemini服務取代原先的Google Assistant,藉此讓更多資源與發展重心聚焦在Gemini。 至於將Gemini業務轉交給Josh Woodward接續推動,蕭令怡後續將負責什麼樣的業務,目前Google並未對外說明。
Google稍早針對一般大眾使用的Gemini人工智慧服務增加更多協作功能,其中包含原先提供Google Wrokspace用戶使用的Canvas功能,以及先前僅在NotebookLM服務提供的音訊總覽功能。 先前在Google Workspace企業用戶方案中提供的Smart Canvas功能,有點像是會議室內的白板,讓工作團隊成員可以共同進行腦力激盪,其中不僅可以透過Google Docs分享文件,更可將更多資料進行串接,或是快速列出待辦事項。 在此次更新中,Smart Canvas功能也能在向一般大眾提供的Gemini人工智慧服務使用,僅需在Gemini提示欄位選擇「Canvas」,即可進行文件撰寫或編輯,另外也能協助編寫程式碼,或是進行除錯。 其他應用,則包含可產生能運作的網路應用程式、Python腳本、遊戲、模擬和其他互動式應用程式原型,另外也能生成、預覽HTML/React程式碼,例如在網站建立一個電子郵件訂閱表單。 目前Canvas將從即日起於全球地區開放所有用戶使用,並且能在所有Gemini應用程式已上線地區,提供Gemini及Gemini Advanced用戶使用。 而先前在NotebookLM服務提供的音訊總覽功能,目前也已經能在Gemini使用,可讓使用者將文件、投影片、報告等資料輸入至Gemini,即可產生類似Podcast以兩人對談方式討論的聲音內容,並且可總結內容、找出主題之間關聯、動態地來回討論,同時提供獨特見解。 不過,目前」在Gemini的音訊總覽功能僅先提供英文版本,之後則會加入支援更多語言。
OpenAI在ChatGPT推出搜尋功能之後,稍早更宣布推出可進一步深入搜尋的「Deep Research」功能,可讓使用者在網路深入查找內容,並且快速彙整為全面性報告,目前將優先開放ChatGPT Pro付費用戶使用,每月限制100次查詢,後續也會開放ChatGPT Plus、ChatGPT Team與ChatGPT Enterprise用戶使用。 此功能可分析網路上文字、圖像或PDF等資料,並且加入參考資料作為參考來源,並且能快速彙整成全面性報告,方便查閱。而目前此功能主要鎖定金融、科學、政策、工程等研究需求使用,方便使用者快速彙整網路上龐大資料內容。 目前「Deep Research」功能僅先提供網頁版本,但預期後續也會提供行動版本,至於現階段輸出內容僅限文字,不過後續也會加入圖像,以及更多專業數據內容。 至於「Deep Research」功能背後使用OpenAI新版o3人工智慧模型,強調能透過多步驟方式找到最新數據內容,並且可針對即時資訊做出反應,藉此確認內容真偽。 類似功能,Google先前也推出以Gemini 1.5 Pro為基礎,透過其可處理較長前後文內容特性,打造名為Deep Research的全新工具,讓使用者能透過此工具分析各類長篇大論的內容,讓後續研究可以變得更有效率。 除了分析使用者上傳提供資料,Deep Research也會透過公開網路搜尋相關資料,並且在分析報告中羅列引用資料來源,同時在分析報告中也會透過圖表方式使人更容易理解數據差異。 另一方面,Google也推出名為NotebookLM的人工智慧筆記服務,標榜能彙整文字及語音內容重點,後續更加入支援彙整YouTube影片內容重點功能,後續更新功能則可讓使用者深入探索特定主題內容,讓使用者能就特定主題整理重點項目。 而NotebookLM服務本身能蒐集所有來源資料,並且透過人工智慧方式在單一平台上進行彙整。而彙整之後的資料更能以人工智慧建議方式呈現,或是讓彙整後的資料更容易閱讀、使用。同時,彙整資料也會各自標示來源,並且建立正確資料引用呈現方式,方便使用者以更有效率方式彙整繁瑣、片段資訊。
在微軟等業者接連以人工智慧加強助理服務應用發展後,Google也宣布在Google Cloud雲端平台推出名為Agentspace的助理服務,藉此協助企業用戶能更有效率處理工作事宜。 Agentspace助理服務目標簡化企業用戶工作流程 Google Cloud雲端人工智慧產品管理業務副總裁Raj Pai指出,企業用戶為了解決單一問題,平均會使用4-6種工具作為輔助,其中通常會需要跨團隊搜尋資料,或是在不同應用服務間切換,而過程中可能導致個人隱私或資料內容外洩,並且造成時間上的浪費。 因此,在名為Agentspace的助理服務設計想法中,Google藉由搜尋功能強化助理服務處理事情能力,並且透過助理服務增加生成式搜尋成效,在整合RAG (擷取增強生成)的人工智慧應用情況下,將讓搜尋、助理服務能以更有效率方式協助企業用戶完成各類工作。 比方企業用戶可以透過整合RAG技術的搜尋功能擴大搜尋企業內部資料,並且比照公開網路內容,進而讓資料彙整更為完整、正確,同時也更有效率,而在整合RAG技術的助理服務部分,則可透過人工智慧方式協助處理日常繁瑣事務,甚至也能透過Google日前提出的人工智慧筆記服務NotebookLM,或是配合此次提出的付費升級版NotebookLM Plus快速彙整文字及語音內容重點,並且針對特定主題整理重點項目。 另外,Agentspace助理服務可對應Google諸多既有服務如Google日曆、Google文件等,同時也能對應Dropbox、Box、Slack、OneDrive等第三方應用服務,至於搜尋技術則一樣整合知識圖譜 (Knowledge Graph)與Google網頁搜尋功能,而企業用戶也能透過無編碼方式建立適合自己的助理服務,藉此對應不同工作流,後續也會開放相關API企業或開發者打造更進階的助理服務。 強調完整保護資料隱私,適合需要彙整大量資料的團隊使用 針對隱私保護部分,Google表示Agentspace助理服務將秉持其隱私政策,不會將企業用戶用於其他用途,同時也不會外流,更不會窺見任何企業敏感資訊,僅用戶能看見、管理個人或企業內部資料,同時也能透過服務運作各個元件確保資料安全,並且避免將資料傳送給工作團隊以外,或是授權對象以外人士。 Raj Pai表示,Agentspace助理服務相當適合企業行銷、軟體開發團隊或人事等需要彙整大量資料的團隊使用,而包含全球最大會計師事務所Deloitte (德勤)、巴西第七大銀行Banco BV、Nokia、迪卡儂 (Decathlon)等企業目前都已經率先導入Agentspace助理服務,使其員工工作效率得以提升。 背後串接Gemini人工智慧模型,未來可能也會支援其他人工智慧模型 而目前Agentspace助理服務背後是以Gemini人工智慧運作,後續也會接入近期揭曉的Gemini 2.0人工智慧模型,但Google表示未來也可能考慮加入支援其他人工智慧模型。至於目前Agentspace助理服務僅先提供企業使用,不過未來也有可能視情況推出適合一般用戶使用版本。 至於現階段還是先以beta形式提供測試,Google暫時尚未公布Agentspace助理服務使用價格,目前可以透過此連結申請測試。