Seagate今日 (11/6)與Dropbox在台舉辦座談會中,由Seagate亞太及日本區業務副總裁新妻太 (Futoshi Niizuma)與Dropbox基礎架構副總裁Ali Zafar分享如何運用資料推動人工智慧技術應用發展。
隨著人工智慧應用發展越來越廣泛,使得當今的儲存需求已經變得更為顯著,相較先前因為手機等裝置普及大量產生的照片、影片等影像資料儲存需求激增,目前在人工智慧應用發展下的儲存需求也變得更加顯著。
尤其目前許多人工智慧應用服務多半還是仰賴雲端協同運算,將資料存放在雲端,並且有效地存取使用也變得更加重要,藉此讓人工智慧能以更豐富、有用資料進行訓練,並且讓輸出內容變得更為可靠、準確。
而在人工智慧生成圖像、影像等內容可能大幅增加167倍之譜,並且將產生數百ZB級別資料量,Seagate標榜其提供硬碟儲存方案依然能對應更穩定、可靠表現,同時對比目前多數儲存設備依然能以更低的持有成本運作,因此也成為當前許多資料中心重要儲存媒介。
新妻太表示,檢視人工智慧如何在資料生成與消耗的循環過程中運作,藉此分析資料最佳儲存方式,將有助於讓更高品質的資料推動人工智慧訓練與持續改善,藉此讓人工智慧模型更為精進,並且能輸出更準確、可信度高的生成結果,因此在人工智慧持續發展之餘,儲存架構也必須持續跟著升級。
同時,有效規劃容量、存取資源對於處理飛速成長的資料也相當重要,更是管理大型自然語言模型訓練與資料密集型工作負載的必要條件。目前多數資料中心約90%比例的EB級別資料量及企業工作負載都是在硬碟上存取,而這樣的使用模式也將藉由人工智慧應用持續達成架構最佳化。
Ali Zafar則說明目前Dropbox服務提供的多EB Magic Pocket基礎架構高度採用Seagate硬碟作為儲存媒介,並且在持有成本、容量與效能之間取得平衡,藉此對應不同存取工作負載。
在Dropbox當前提供服務中,不少應用服務如結合人工智慧功能的通用搜尋工具Dropbox Dash,便是建構在與Seagate合作的儲存架構之上,藉由自行訓練的模型為基礎運作,並且以更有效率形式讓使用者以此工具搜尋存放在Dropbox服務內的資料內容、應用程式。