Tag: GPT-4

OpenAI推出可進一步深入搜尋的「Deep Research」功能,方便將網路資訊彙整為全面性報告

OpenAI預告GPT-5大型語言模型將於8/8凌晨登場,可能同步推出輕量版模型GPT-5 mini、nano

OpenAI預告將於台灣時間8月8日凌晨1點進行一場直播活動,極有可能正式發表先前傳聞的全新大型語言模型GPT-5。雖然官方目前仍未明說直播主題,但從社群平台「X」釋出預告內容來看,英文「LIVESTREAM」中刻意將「S」改為數字「5」,先前透露接下來將公布內容將與GPT-5有關。 自2023年3月發表GPT-4以來,GPT-5將成為OpenAI新一代主力的大型語言模型。在過去一年多的時間裡,OpenAI雖然先後推出GPT-4.5、GPT-4-turbo,以及整合多模態功能的GPT-4o,甚至在2025年初間接透露GPT-4.1的存在,但主要都還是隸屬GPT-4系列的延伸版本,而接下來將公布的GPT-5則預期會有「次世代」的大幅度更新。 LIVE5TREAM THURSDAY 10AM PT— OpenAI (@OpenAI) August 6, 2025 OpenAI執行長Sam Altman先前透露,GPT-5將在推理與邏輯能力上大幅躍進,具備所謂的「鏈式思維」 (chain-of-thought reasoning)特性,能將複雜問題拆解為一系列邏輯步驟,並且逐步推論答案,展現更接近人類思維邏輯的運作方式。 除此之外,GPT-5也將內建更強大的推理模組、支援深度搜尋 (Deep Research)等延伸功能,進一步強化回應精準度與多步驟任務的處理效率。 而OpenAI除了將推出GPT-5主要模型,可能也會同步發表輕量級的GPT-5 mini與GPT-5 nano,讓開發者與一般使用者能依不同需求與運算資源選擇最合適的模型版本,並且能佈署應用在諸如筆電、手機等終端裝置。這樣的配置策略,實際上也與先前在GPT-4.1系列中出現多模型階層的做法相呼應。 目前尚不清楚GPT-5是否會取代現有GPT-4o,並且成為ChatGPT的新預設模型,或是僅提供給進階用戶或以API串接服務。不過,根據過往OpenAI對免費與付費用戶的佈局策略,未來用戶仍有可能在免費層級中獲得一定程度的GPT-5使用體驗。 目前可知的是,OpenAI已經大幅擴建資料中心與調校模型訓練架構,為GPT-5日後運作鋪路。而這次的直播若真如預期帶來GPT-5全新模型系列,勢必也將成為AI發展進程中的重要里程碑。

數據統計顯示OpenAI的ChatGPT在1月已經吸引超過1億人使用

OpenAI證實GPT-4模型將在今年4月底正式從ChatGPT服務中退役

OpenAI近期於其技術支援網站確認,GPT-4模型將在今年4月底正式從ChatGPT服務中退役,將由GPT-4o取代。不過,開發者依然可以透過API形式存取GPT-4模型資源。 GPT-4最早在2023年3月推出,主要作為GPT-3.5後繼模型,但相比2024年5月中推出的GPT-4o少了多模態運作模式,因此在執行效益顯得相對較弱。 而GPT-4o目前可處理超過50種語言,並且在內容寫作、編碼處理、STEM認知運算表現超越GPT-4,同時能藉由多模態運作支援文字、聲音與影像同時輸入,進而生成更細緻、豐富的內容。 目前有消息指稱OpenAI準備揭曉新系列人工智慧模型,可能會以GPT 4.1為稱,甚至可能推出規模較小的GPT-4.1 mini與nano版本,藉此對應更快、更有效率的執行表現,另外也預期推出新款o3系列推論模型,或是新款o4-mini推論模型,藉此與DeepSeek、Google在輕量化推論模型競爭。

曾參與GPT-4模型預先訓練、對齊的OpenAI安全系統團隊負責人翁荔宣布離開

曾參與GPT-4模型預先訓練、對齊的OpenAI安全系統團隊負責人翁荔宣布離開

OpenAI安全系統團隊負責人翁荔 (Lilian Weng)稍早在其個人「X」平台宣布將於11月15日離職,結束其在OpenAI長達7年的職涯,而OpenAI方面則說明感謝其過去以來在任內投入安全研究,並且建立嚴謹的技術應用安全保障所作貢獻。 翁荔最早於2012年加入當時的Facebook擔任軟體工程與資料科學實習人員,2014年加入Dropbox擔任資料科學研究人員及軟體工程師,隨後則在2016年加入提供先買後付服務的金融科技公司Affrim,並且在2018年加入OpenAI擔任研究人員,更2023年開始帶領OpenAI安全系統團隊,2024年則擔任安全研究部門副總裁。 而在OpenAI任職期間,翁荔也曾參與GPT-4人工智慧模型預先訓練、強化學習,以及讓模型運作結果符合設計預期目標的人工智慧對齊 (AI alignment)事宜,同時也在OpenAI人工智慧應用服務背後安全機制扮演重要角色。 今年9月中旬時,OpenAI宣布成立全新獨立董事會,藉此監督日前成立的安全委員會,同時也宣布執行長Sam Altman不再是安全委員會成員之一,意味將確保OpenAI提出的人工智慧技術解決方案將能更加安全。 After working at OpenAI for almost 7 years, I decide to leave. I learned so much and now I'm ready for ...

「Apple Intelligence」是蘋果佈局人工智慧應用市場的第一步,更讓Siri數位助理服務大幅升級

「Apple Intelligence」是蘋果佈局人工智慧應用市場的第一步,更讓Siri數位助理服務大幅升級

作為此次WWDC 2024真正的主軸,蘋果正式揭曉名為「Apple Intelligence」的人工智慧技術平台,同時也強調在用戶隱私以更高要求確保使用安全,另外也確認與OpenAI合作ChatGPT技術,藉此提升Siri數位助理服務功能。 ▲「Apple Intelligence」是蘋果佈局人工智慧應用市場的第一步 作為蘋果佈局「AI」市場的第一步 雖然蘋果過去一直強調致力深度學習等技術應用,但在當前的自動生成式人工智慧技術發展,顯然還是晚了其他競爭對手一步。 因此,「Apple Intelligence」將成為蘋果佈局人工智慧應用市場的第一步,而在相關說明中也透露與OpenAI的ChatGPT技術進行合作,意味將以最新的GPT-4o人工智慧模型運作。 此外,蘋果說明若使用者本身已經是ChatGPT Plus或企業版訂閱身分,亦可透過額外登入帳號方式取得進階使用功能。 ▲背後目前是以ChatGPT技術運作 如先前市場猜測,蘋果也確認未來將會整合更多人工智慧模型,因此未來也仍有可能與Google的Gemini等模型合作,但估計未來蘋果也會推出自有人工智慧模型,藉此將技術資源掌握在自身手上。 免費提供使用、強調所有運算都不會涉及隱私問題 至於「Apple Intelligence」將以免費形式提供使用,因此現階段不會有額外計費情形,但如果要以裝置端完成相關運算的話,就必須採用A17 Pro或M1以上規格處理器,因此現階段主要僅iPhone 15 Pro以上機種,或是搭載M1處理器以上規格的iPad或Mac機種。 而超過裝置端算力能處理部分,則會透過蘋果以私有雲架構形式的伺服器進行協同運算,更說明所有資料依然僅存放在使用者裝置,雲端協同運算部分僅只是進行算力輸出使用,不會另外儲存任何數據內容。 全新設計的Siri數位助理服務 推出「Apple Intelligence」之後,蘋果也不意外地宣布每天被全球用戶使用超過15億次的Siri數位助理服務將作更新,除了代表圖示及互動動畫重新作調整,背後更透過大型自然語言模型理解使用者口述或輸入內容,同時也能對應前後文內容判斷,藉此做出相應操作,例如幫忙撰寫內容、編輯照片,或是尋找特定相簿中的某個人。 ▲Siri數位助理服務換上全新識別圖示 ▲喚醒介面也與過往不同,變成在螢幕邊緣點亮的視覺效果 而藉由與更多App整合,Siri也能進一步執行特定App內的功能,甚至回答相關功能實際操作流程,同時蘋果也向開發者提供相關API資源,方便更多第三方App能與Siri服務串接。 ▲將對開發者提供SiriKit設計工具,藉此打造更多能與Siri整合互動的應用服務 ▲當前僅包含蘋果旗下書籍、瀏覽器、相機、閱讀器、檔案、郵件、相簿、白板等功能可透過Siri延伸控制,但蘋果接下來將開放更多資源讓開發者取用,藉此提升Siri使用第三方應用服務特定功能的能力 自動生成式人工智慧應用 雖然蘋果強調藉由人工智慧技術打造更多自然互動使用體驗,但也有不少功能採用目前市場常見的應用設計,例如自動產生文字內容、生成不同風格圖像,或是總結長篇文字內容重點,而蘋果也透過可自動生成不同表情貼圖的Genmoji,或是產生圖像內容的Image ...

OpenAI揭曉全新GPT-4o人工智慧模型,更快理解圖文、語音內容

OpenAI揭曉全新GPT-4o人工智慧模型,更快理解圖文、語音內容

在先前預告後,OpenAI正式揭曉其全新GPT-4o人工智慧模型,並且推出桌機版App及新版操作介面,另外也讓使用者能透過「Hey,ChatGPT」進行語音、影像識別等互動。 OpenAI說明,GPT-4o中的「o」源自「Omnimodel」 (全能模型)的首個字母,意味將能對應各類應用互動,同時學習資料源自先前超過1億人透過ChatGPT學習、創作或協作互動經驗,一樣支援影像識別,甚至也能透過記憶方式學習使用者曾經提過事項,藉此用於未來互動,此外也加入聲音辨識,以及圖表內容分析、製作能力,目前總計對應50種語言,約可覆蓋多達97%的全球網路使用人口。 而GPT-4o將免費開放使用,並且可透過API資源存取,讓更多開發者能藉此人工智慧模型打造更多應用服務,在英語文字與程式編碼處理速度幾乎等同GPT-4 Turbo效能表現,同時在非英語文字上的執行效能表現會更高,藉此讓使用成本降低50%,並且支援文字、音訊、圖像等任意組合輸入,進而可對應文字、音訊、圖像等任意組合輸出,更可在最短232毫秒、平均320毫秒時間內針對音訊輸入內容做出回應,幾乎與一般人在自然對話中的回應時間相近。 在進一步解說中,OpenAI表示在GPT-4o推出前的語音對話模式平均延遲,在GPT-3.5約為2.8秒,在GPT-4則約為5.4秒,主要是透過三個獨立模型運作構成,其中包含將音訊轉為文字,由GPT-3.5或GPT-4分析文字、做出回應,再將回應文字轉為語音念出,而此次推出的GPT-4o則是透過單一模型即可完成音訊轉文字、文字分析與文字轉音訊三個流程,因此能以相比GPT-4 Turbo約2倍快速度完成運作。 由於花費更短時間完成過往需要三個模型才能完成的工作流程,因此代表GPT-4o將能進一步分析使用者所發出語調、表情,進而判斷背後所代表情感,例如判斷使用者當下情緒是否開心,或是悲傷難過等。 此次示範內容中,OpenAI表示GPT-4o可以直接讓雙方各以英語、義大利語進行對談溝通,或是協助使用者透過圖像識別方式解決數學算式問題,另外也能判斷使用者臉部表情對應情緒為何。 另外,OpenAI同樣強調GPT-4o的使用安全性,標榜建立全新安全系統確保互動使用過程不會出現問題,並且強調在訓練過程採用自動化及人為評估,更結合社會心理學、偏見與公平,以及錯誤訊息等領域專家進行合作測試,避免GPT-4o出現不可預期的風險問題。 OpenAI表示,此次公布的GPT-4o將在接下來幾個星期內、幾個月內陸續公布相關技術基礎建設、訓練後的可用性,以及其他模式運作所需安全性,其中包含透過GPT-4o輸出音訊內容僅能選擇預設聲音,避免有心人士以模仿他人聲音進行不法事宜。 目前GPT-4o的文字與圖像處理能力將從即日起用於ChatGPT服務,並且免費開放所有人使用,而ChatGPT Plus訂閱用戶則可使用超過5倍的訊息量,至於語音互動功能則會向ChatGPT Plus開放使用,但初期僅先以alpha版測試內容提供。 蘋果可能是合作夥伴? 在此之前,蘋果已經傳出與OpenAI攜手合作,預計讓iOS 18中的Siri數位助理服務有全新互動體驗,或許將進一步結合GPT-4o人工智慧模型,藉此創造全新互動體驗。不過,具體公布內容還是要以蘋果公布為準。

OpenAI宣布成立日本辦公室,推出在地化GPT-4大型自然語言模型

OpenAI宣布成立日本辦公室,推出在地化GPT-4大型自然語言模型

OpenAI今日 (4/15)宣布於日本東京設立亞洲第一個辦公據點,並且針對日本市場使用需求推出在地化GPT-4大型自然語言模型,標榜運算處理能力為GPT-4 Turbo的4倍,處理日語內容速度更是GPT-4 Turbo的3倍。 設置於日本東京的辦公據點,將由原本AWS日本總裁長崎忠雄擔任負責人,將建立對外關係溝通、產品及服務規劃,以及相關營運團隊。 OpenAI預計在今年底於日本辦公室招募十幾名員工,同時也計畫向在地企業推廣ChatGPT Enterprise服務,讓更多日本在地企業能藉由人工智慧技術轉型發展。 而此次宣布在日本東京設立亞洲第一個辦公據點,不僅進一步擴大日本境內市場應用發展,並且透過強化日語理解能力,使其大型語言模型能更進一步分辨細微文化背景等差異,進而做出更正確決策內容及分析結果,更意味接下來OpenAI將透過日本辦公室擴展佈局整個亞洲市場。

微軟將Copilot服務也帶到iOS平台,讓iPhone及iPad機種也能使用

微軟將Copilot服務也帶到iOS平台,讓iPhone及iPad機種也能使用

不久前默默地將Copilot帶到Android平台之後,微軟稍早也在蘋果App Store上架Copilot服務App,讓iPhone及iPad機種也能使用此服務。 跟先前在Android平台推出版本一樣,在蘋果App Store上架的Copilot服務App,背後一樣是以OpenAI旗下技術運作。另一方面,微軟先前推出的Bing服務App接下來依然會並存提供使用,並且鎖定不同功能訴求,例如Bing服務仍著重在搜尋功能,而Copilot服務則聚焦在人工智慧互動。 其他差異,還包含Bing服務背後僅整合OpenAI大型自然語言模型GPT-4,而Copilot服務則額外具備DALL・E 3自動生成圖像功能,因此在功能應用上還是會有些差異。 至於OpenAI先前針對行動裝置推出的ChatGPT服務App,並不會因為微軟推出服務而受影響,但目前依然是以GPT-3.5運作為主。

OpenAI將於11月舉辦首次開發者活動,但不會公布GPT-5或GPT-4.5

OpenAI在中國境內申請多個「GPT-6」、「GPT-7」相關商標

雖然OpenAI尚未計畫推出GPT-5,但顯然已經在中國境內申請多個「GPT-5」、「GPT-6」、「GPT-7」相關商標,主要用於科學儀器、網站服務等項目。 相關商標專利是由OpenAI透過歐愛營運有限責任公司 (OPENAI OPCO LLC)提出申請,但目前仍處於審查階段。 目前OpenAI已經將主力放在GPT-4大型自然語言模型,並且應用在ChatGPT-4聊天機器人,後續更推出名為GPT-4 Turbo、可輸入更長、更複雜的文字內容解析的升級版大型語言模型,但尚未準備推出GPT-5大型自然語言模型。 不過,依照OpenAI執行長Sam Altman透露說法,目前確實已經投入下一款大型自然語言模型,但尚未確認具體確認推出時間,不過仍需要更多數據訓練此款模型,其中包含徵求網路上較難透過公開形式取得長篇寫作或對話數據。 而在中國境內申請「GPT-5」、「GPT-6」、「GPT-7」相關商標,顯然是避免名稱被他人搶註,進而影響後續名稱安排。

Google將於2023年開始啟用新版Chrome瀏覽器擴充功能平台,將影響諸多廣告封鎖擴充功能

Google原本計畫在12月初正式發表大型自然語言模型「Gemini」,目前延後至2024年初

先前有消息指稱Google原訂在今年11月正式推出的大型自然語言模型「Gemini」將會延後推出,而The Information網站更進一步指稱Google員訂在12月初於美國紐約、加州及華盛頓地區舉辦發表活動,但目前已經延後調整至2024年初。 而延後推出原因,可能包含針對非英文互動內容理解最佳化有關。不過,Google方面並未作任何回應。 至於在運算效率中,消息人士表示Google的「Gemini」整體執行表現優於OpenAI的GPT-4。Google副總裁,以及Bard與Google Assistant產品負責人蕭茜 (Sissie Hsiao)先前談到「Gemini」的時候,強調其有更高運算精準度,以及內容描述能力。 Google在今年Google I/O 2023說明「Gemini」最快會在今年內推出,預計藉此與OpenAI的GPT-4大型自然語言抗衡,甚至在不久前更開始向特定開發者、企業提供測試。但從目其狀況顯示,Google可能還需要多一點時間準備,以利此款大型自然語言能與市場競爭對手產品抗衡。 除了OpenAI,目前包含亞馬遜的AWS、微軟、Meta也都提出自有大型自然語言模型,因此Google有可能計畫透過更多時間準備,藉此讓「Gemini」運作效能有更大競爭力,並且提升Google旗下服務使用體驗。

Google將於2023年開始啟用新版Chrome瀏覽器擴充功能平台,將影響諸多廣告封鎖擴充功能

Google延後大型自然語言模型「Gemini」推出時程,至少要等到明年第二季

相關消息指稱,Google似乎已經確定延後推出其大型自然語言模型「Gemini」,甚至有可能延後到2024年第二季以後才會正式對外公布。 The Information網站引述兩名消息人士說法指出,Google原訂在今年11月正式推出的大型自然語言模型「Gemini」將會延後推出,同時Google也陸續對外通知合作夥伴、客戶此消息,甚至更表明在2024年第一季內可能都不會有正式推出消息,因此有可能會延後到第二季,甚至可能選在明年度的Google I/O 2024期間揭曉。 Google在今年Google I/O 2023說明「Gemini」最快會在今年內推出,預計藉此與OpenAI的GPT-4大型自然語言抗衡,甚至在不久前更開始向特定開發者、企業提供測試。但從目其狀況顯示,Google可能還需要多一點時間準備,以利此款大型自然語言能與市場競爭對手產品抗衡。 除了OpenAI,目前包含亞馬遜的AWS、微軟、Meta也都提出自有大型自然語言模型,因此Google有可能計畫透過更多時間準備,藉此讓「Gemini」運作效能有更大競爭力,並且提升Google旗下服務使用體驗。

第 1 至 3 頁 1 2 3

Welcome Back!

Login to your account below

Retrieve your password

Please enter your username or email address to reset your password.