同時支援6GHz以下頻段與毫米波 Sony揭曉開發中旗艦手機Xperia PRO
2020-02-24
訪談/Sony定調全新旗艦手機的Xperia 5,究竟是否歸類「Compact」定位?
2019-09-07
在Google Photos中加入魔術修圖工具 (Magic Editor),並且可使用魔術橡皮擦 (Magic Eraser)等功能修改照片內容後,Google宣布將在Google Photos服務收錄照片內容標示曾被人工智慧技術修改的紀錄。 此項功能預計會在下週開始加進Google Photos服務,讓使用者能更容易透過照片資訊確認內容是否曾被人工智慧工具修改,而透過諸如「最佳鏡頭」 (Top Shot)功能拍攝照片,同樣也會在照片資訊標示。 在相關資訊中,Google會清楚標示照片是否以人工智慧工具修改,或是藉由自動生成式人工智慧產生內容。 由於自動生成式人工智慧技術持續普及,目前有越來越多假以亂真內容混淆視聽,甚至可能造成負面影響,因此不少科技業者開始構思數位浮水印等技術,讓使用者能清楚知曉所見內容是否為人工智慧產生。
Adobe稍早針對其Firefly自動生成式人工智慧工具增加產生影片功能,並且預計在今年底前釋出測試版本。 在此之前,Adobe已經在Firefly加入文字描述即可產生影像、一鍵消除影像特定細節等功能,讓創作者能減少花費在調整影像細節的時間,進而將更多創意心思放在創作上。 而此次預覽的影片自動生成功能,則預計會在今年底前釋出測試版,將可讓使用者透過文字描述方式產生相應影片內容,甚至可進一步調整視角、運鏡方式,或是對焦位置,讓使用者能以此生成更多B-Roll內容,藉此填補影片空白,或是作為內容補強使用素材。 目前此工具僅會生成5秒鐘長度內容,而Adobe更標榜其模型以安全形式訓練而成,並且透過自身AdAdobe Stock資料庫收錄超過4億張圖像、插圖與影片內容進行訓練,其生成內容將不會構成版權、商業使用等問題,同時也強調並未使用任何用戶上傳資料作為訓練內容。 在不少人工智慧新創已經接連推出能以文字描述產生影片內容的情況下,Adobe預期能以自身內容創作工具結合Firefly人工智慧技術,讓使用者能在單一服務使用完整創作功能,同時也能以單一平台使用體驗對應更流暢的內容創作流程。
如同微軟藉由Copilot技術協助開發者快速編寫程式碼,蘋果也如市場傳聞在新版Xcode 16加入名為Swift Assist的輔助功能,讓開發者僅需透過單條指令即可快速產生程式碼建議內容,或是協助修正程式碼編寫錯誤部分。 另外,蘋果更在Xcode 16採用動態連結架構,讓開發者能更有效率檢視、執行程式碼內容,同時也能透過Swift Assist背後的人工智慧模型加快程式碼編寫效率,更可藉由蘋果處理器與macOS 15 Sequoia背後隱私安全機制確保程式碼內容隱私。 而Swift Assist在離線狀態下也能正常運作,因此讓開發者即使處於斷網狀態下依然可以順利完成程式碼編寫工作,進而可以更快打造、測試各類應用服務。 同時,蘋果也說明持續更新Swift程式語言功能,並且透過其擴展特性,讓Swift能對應更多程式碼編輯器,更藉由全新GitHub資源強化Swift編譯器、基礎架構,以及相關程式庫內容。 藉由Swift Testing框架API,更可讓開發者更容易建立跨平台測試項目,同時可藉由標記系統協助開發者整理、評估測試結果,甚至可對應App或伺服器端應用服務測試需求。 至於此次WWDC 2024期間,蘋果也針對各類需求釋出開發工具及相關API資源,例如針對Mac平台上的遊戲擴展需求提供新版Game Porting Toolkit 2編譯工具,讓開發者能更快將Windows平台遊戲帶到Mac環境,甚至進一步對應iPhone、iPad機種使用,另外也能藉由新版Metal 3 API提高遊戲畫質、即時光影追跡表現。 針對新版visionOS 2、iOS 18、iPadOS 18、tvOS 18、watchOS 11等作業系統平台,蘋果此次也釋出諸多應用資源,甚至也能讓開發者善用AirPods系列耳機此次增加點頭、搖頭控制功能,以及Apple Watch的雙指掐擠動作,藉此創造更多互動體驗。
作為此次WWDC 2024真正的主軸,蘋果正式揭曉名為「Apple Intelligence」的人工智慧技術平台,同時也強調在用戶隱私以更高要求確保使用安全,另外也確認與OpenAI合作ChatGPT技術,藉此提升Siri數位助理服務功能。 ▲「Apple Intelligence」是蘋果佈局人工智慧應用市場的第一步 作為蘋果佈局「AI」市場的第一步 雖然蘋果過去一直強調致力深度學習等技術應用,但在當前的自動生成式人工智慧技術發展,顯然還是晚了其他競爭對手一步。 因此,「Apple Intelligence」將成為蘋果佈局人工智慧應用市場的第一步,而在相關說明中也透露與OpenAI的ChatGPT技術進行合作,意味將以最新的GPT-4o人工智慧模型運作。 此外,蘋果說明若使用者本身已經是ChatGPT Plus或企業版訂閱身分,亦可透過額外登入帳號方式取得進階使用功能。 ▲背後目前是以ChatGPT技術運作 如先前市場猜測,蘋果也確認未來將會整合更多人工智慧模型,因此未來也仍有可能與Google的Gemini等模型合作,但估計未來蘋果也會推出自有人工智慧模型,藉此將技術資源掌握在自身手上。 免費提供使用、強調所有運算都不會涉及隱私問題 至於「Apple Intelligence」將以免費形式提供使用,因此現階段不會有額外計費情形,但如果要以裝置端完成相關運算的話,就必須採用A17 Pro或M1以上規格處理器,因此現階段主要僅iPhone 15 Pro以上機種,或是搭載M1處理器以上規格的iPad或Mac機種。 而超過裝置端算力能處理部分,則會透過蘋果以私有雲架構形式的伺服器進行協同運算,更說明所有資料依然僅存放在使用者裝置,雲端協同運算部分僅只是進行算力輸出使用,不會另外儲存任何數據內容。 全新設計的Siri數位助理服務 推出「Apple Intelligence」之後,蘋果也不意外地宣布每天被全球用戶使用超過15億次的Siri數位助理服務將作更新,除了代表圖示及互動動畫重新作調整,背後更透過大型自然語言模型理解使用者口述或輸入內容,同時也能對應前後文內容判斷,藉此做出相應操作,例如幫忙撰寫內容、編輯照片,或是尋找特定相簿中的某個人。 ▲Siri數位助理服務換上全新識別圖示 ▲喚醒介面也與過往不同,變成在螢幕邊緣點亮的視覺效果 而藉由與更多App整合,Siri也能進一步執行特定App內的功能,甚至回答相關功能實際操作流程,同時蘋果也向開發者提供相關API資源,方便更多第三方App能與Siri服務串接。 ▲將對開發者提供SiriKit設計工具,藉此打造更多能與Siri整合互動的應用服務 ▲當前僅包含蘋果旗下書籍、瀏覽器、相機、閱讀器、檔案、郵件、相簿、白板等功能可透過Siri延伸控制,但蘋果接下來將開放更多資源讓開發者取用,藉此提升Siri使用第三方應用服務特定功能的能力 自動生成式人工智慧應用 雖然蘋果強調藉由人工智慧技術打造更多自然互動使用體驗,但也有不少功能採用目前市場常見的應用設計,例如自動產生文字內容、生成不同風格圖像,或是總結長篇文字內容重點,而蘋果也透過可自動生成不同表情貼圖的Genmoji,或是產生圖像內容的Image ...
從Google I/O 2018提出,借助人工智慧協助視力障礙者「看見」前方物件的Lookout App,在此次Google I/O 2024宣布更新消息中,則是增加可大聲朗讀長篇文章,並且加入在拍攝圖像尋找特定物品功能。 其中拍攝尋找特定物品功能,將能協助視力不佳或失明的身障者透過Lookout App尋找座位、桌子、車輛、餐具,或是浴室等位置,並且能讓身障者藉此判斷特定物品所在方向,以及推估距離。 而藉由自動生成式人工智慧技術輔助,Google也讓Lookout App能更即時、準確地描述手機拍攝畫面細節,藉此協助視障者更快判斷前方景象,同時透過更多描述建構完整環境認知。 此外,在Look to Speak功能中,除了維持原本可透過內建短語內容,讓身障者直接點選與人交流,目前更添加透過表情貼圖、特殊符號,或是直接以照片內容觸發描述語音,藉此讓身障者也能藉此作更傳神的溝通。 在Google Lens的更新,則是加入描述鏡頭拍攝畫面中特定物件,例如餐廳、ATM、出入口等,同時也會陳述相對距離、方位,同時可透過清楚語音指示身障者如何繞過障礙物前往特定地點。 其他更新部分,則是將先前已經在行動版Google Maps加入的輪椅通道資訊帶到桌機版,讓更多使用者能透過Google Maps尋找預計前往地點是否提供無障礙出入口設計,同時也能確認前往地點是否提供無障礙廁所、座位或停車場設計。 在先前公布消息中,Google與罹患肌肉萎縮症的遊戲實況主Lance Carr合作,共同打造Project Gameface操作介面,讓Lance Carr能藉此以頭部操作滑鼠進行遊戲,並且與印度社會企業Incluzza合作推廣此介面,讓更多身障者能以此更方便操作Android裝置,同時也透過GitHub將Project Gameface相關程式編碼開源,藉此推動更多運用Project Gameface為基礎的應用可能。
在此次Google NEXY'24活動中,Google除了宣布將從5月開始導入以NVIDIA代號「Hopper」的H100加速元件,藉此打造名為A3 Mega的運算設備,另外也計畫引進NVIDIA近期揭曉代號「Blackwell」的新一代加速運算元件,預計在2025年初導入GB200 NVL72運算系統,雙方更宣布協助更多新創業者,使其加速建立自動生成式人工智慧應用服務。 在此之前,NVIDIA在今年GTC 2024期間宣布推出NVIDIA NIM微服務,讓開發者、企業可在數分鐘內完成佈署自動生成式人工智慧。 而在此次與Google合作中,雙方將透過NVIDIA Inception計畫與Google for Startups Cloud計畫,讓新創業者能藉由雲端平台取得更多人工智慧技術資源,藉此打造多元自動生成式人工智慧應用服務。 其中,NVIDIA Inception是一項已經協助超過18000家新創公司的全球計劃,其合格會員將能夠加速使用Google Cloud基礎設施,並且可累積獲得Google Cloud雲端積分,專注於人工智慧技術發展的新創企業最高可獲得價值350000美元的雲端積分,藉此能用於NVIDIA DGX Cloud雲端服務。 參與Google for Startups Cloud計畫成員可同時加入NVIDIA Inception計畫,並且獲得技術專業知識、NVIDIA深度學習機構課程學分、NVIDIA硬體與軟體技術資源。同時,Google for Startups Cloud計畫的合格成員更可參與NVIDIA Inception Capital Connect,讓新創企業能接觸到對該領域感興趣的創投公司,進而獲得後續投資機會。 由於新創企業通常面臨成本限制,尤其投入需要更大開銷的人工智慧技術應用發展時,若能藉由Google、NVIDIA計畫協助,將能加快佈局各類人工智慧技術應用成長。 ...
Google宣布將使畫圈搜尋 (Circle to Search)功能套用在更多Android手機,其中包含去年推出的Pixel Fold與新款Pixel Tablet,同時也將使更多人工智慧功能應用在Android手機。 除了日前已經宣布將畫圈搜尋套用在三星Galaxy S24系列手機,以及Pixel 8系列與Pixel 7系列手機,目前包含Pixel 6系列、Pixel 6a,以及Pixel 7a,加上三星Galaxy S23系列與Galaxy S23 FE、Galaxy Z Fold5、Galaxy Z Flip5與Galaxy Tab S9系列都能使用畫圈搜尋功能。 而此次宣布消息,更加入Pixel Fold與新款Pixel Tablet,另外也透露接下來將有更多Android手機都能獲得畫圈搜尋功能,意味畫圈搜尋接下來將成為Android標準功能之一。 搜尋部分更進一步強化Google Lens應用功能,例如提升畫圈搜尋的螢幕翻譯功能,讓使用者能更快翻譯螢幕顯示文字內容,或是翻譯拍攝招牌文字。 至於先前就曾預告,並且已經開放部分美國境內用戶測試的搜尋生成體驗 (Search Generative ...
Google近期調整其搜尋業務團隊領導層,將由2003年就加入Google、過去負責搜尋體驗核心業務的Liz Reid接手帶領搜尋團隊,並且向同時負責搜尋、廣告、數位助理等業務的資深副總裁Prabhakar Raghavan匯報。 除了Liz Reid,包含原本負責Google搜尋結果排行及品質控管的Pandu Nayak,目前將轉任搜尋首席科學家,其原本職務將由過去負責搜尋人工智慧產品研究的Cheenu Venkatachary接手。 而原本負責Google新聞 (Google News)與Google探索 (Google Discover)服務的Cathy Edwards,目前則將負責帶領Google長期投資項目團隊。 Google方面並未特別說明此次人事異動原因,但若從Liz Reid對內部團隊說明表示將以自動生成式人工智慧推動搜尋業務,意味Google將在核心搜尋業務大量導入人工智慧應用,而非只是單純透過關鍵字比對查找合適解答,而是進一步透過理解使用者詢問需求,並且在諸多答案中找出合適解答,甚至以更容易理解形式呈現。
過去與NVIDIA深度合作的雲端串流遊戲解決方案業者Ubitus (優必達),今日 (3/19)宣布獲得NVIDIA投資,並且將自動生成式人工智慧技術應用在雲端串流遊戲服務。 Ubitus表示持續與NVIDIA合作擴展GPU雲端基礎設備,並且在亞洲建置最大規模GPU農場,搭配自行研發的虛擬化技術,讓雲端串流伺服器使用率最佳化,並且降低營運成本,同時也透過客製化解決方案推動雲端串流遊戲服務成長。 而目前提供自動生成式人工智慧技術服務,包含以客製化、繁體中文為主的台灣版大型語言模型 (Taiwan LLM)所運作UbiGPT,讓遊戲能透過自動生成式人工智慧與玩家進行互動,並且產生不同遊戲內容體驗。 透過圖像和影片擴散服務UbiArt,則可透過人工智慧技術將遊戲視覺轉換為經驗、逼真的藝術創作內容。至於Ubi-chan (優必醬)則是針對玩家和內容創作者量身定製的AI虛擬角色,讓虛擬角色能夠過個性化互動提升真實性與參與度。
NVIDIA宣布推出以支援CUDA的GPU加速,並且能以預先訓練人工智慧模型運作,可在最佳化調整後佈署於雲端、資料中心、工作站及PC的NVIDIA NIM微服務。 ▲NVIDIA NIM微服務可在數分鐘內完成佈署自動生成式人工智慧 藉由NVIDIA NIM微服務,NVIDIA表示將能透過數十種企業級自動生成式人工智慧,讓企業能以微服務形式在自有服務平台建構、佈署客製化應用程式,並且確保完全持有及控制自有智慧財產權的權利。 ▲NVIDIA NIM微服務能佈署於雲端平台,或是自有伺服器運作環境,讓企業、開發者能在短時間內導入人工智慧應用資源 除了提供NVIDIA NIM微服務,目前企業也能透過NVIDIA CUDA平台使用NVIDIA及其合作夥伴生態系統收錄的20多種熱門人工智慧模型,例如A121、Adept、Cohere、Getty Images、Shutterstock提供模型,以及Google、Hugging Face、Meta、Mistral AI及Stability AI提供開放模型,而NVIDIA加速軟體開發套件、函式庫及工具也能作為NVIDIA CUDA-X微服務使用,藉此應用在檢索增強生成 (RAG)、可程式化控管、資料處理、高效能運算 (HPC)等作業。 ▲可透過NVIDIA CUDA平台使用NVIDIA及其合作夥伴生態系統收錄的20多種熱門人工智慧模型建構服務 包含Adobe、Cadence、CrowdStrike、Getty Images、SAP、ServiceNow,以及Shutterstock均為首波透過NVIDIA AI Enterprise 5.0使用NVIDIA NIM微服務的業者,分別應用旗下提供的應用程式、資料服務,以及網路安全平台服務。 而NVIDIA NIM微服務以包含Triton Inference Server、TensorRT-LLM在內推論軟體構成的預先建置容器形式運作,並且以API即可完成串接,讓人工智慧應用服務佈署從原本需要花費數周時間,縮減為幾分鐘即可完成,甚至能佈署於自有安全託管環境,藉此提升人工智慧應用彈性。 ...