生活

Nvidia繪圖技術大會登台 擴大深度機械學習應用

結束上半年於美國舉辦的GTC 2015,Nvidia也在今日 (9/1)在台舉辦GTC TW 2015技術研討大會,藉此與台灣OEM廠商、合作夥伴進行交流,並且針對GPGPU平行運算應用、深度機械學習,以及應用電腦視覺的運算方式進行深入解說,讓開發者能藉由繪圖硬體加速運算等資源設計各類技術應用解決方案。

, Nvidia繪圖技術大會登台 擴大深度機械學習應用, mashdigi-科技、新品、趣聞、趨勢

其實應用GPGPU平行運算方式加速運算效率、應用類神經網絡的深度機械學習,以及衍生的電腦視覺技術應用,在過去幾年已經經常應用,但在顯示卡技術持續演進之下,讓開發者能藉由運算效能提昇,進而提昇整體數據分析效率,例如過往必須花費一個月的演算時間,在硬體技術成長之下,演變成僅需短短幾天即可完成計算。

而這樣的效能演進,自然也能反應在實際應用面,例如過往電腦視覺僅能正確識別單一文字,目前幾乎可利用更快的電腦識別技術確認複雜影像中的各類細節,甚至進一步藉由感知學習描述影響情境。而這樣的技術應用,目前已經分別進入眾多資料演算、手機功能,甚至是自動車系統等市場領域,透過GPU擔任平行運算角色,藉此讓裝置處理器可獲得額外運算資源,藉此達成運算效率加速、節能省電等目的。

, Nvidia繪圖技術大會登台 擴大深度機械學習應用, mashdigi-科技、新品、趣聞、趨勢

在今日 (9/1)在台舉辦的GTC TW 2015期間,Nvidia分別針對GPGPU平行運算應用、深度機械學習,以及應用電腦視覺的運算方式進行深入解說,讓開發者能藉由繪圖硬體加速運算等資源設計各類技術應用解決方案。

同時,現場也邀請香港科技大學計算機系主任楊強博士分享如何將GPGPU技術應用在微信 (WeChat)目前日益增長的服務內容,另外也透過Umbo CV、奇群科技分享旗下產品如何導入深度機械學習資源,藉此讓影像識別技術套用在本身產品。

楊強博士表示,由於微信在中國地區於短短三年時間內快速累積超過10億使用人口,同時每天活躍用戶更高達6億人之多,目前也在微信服務平台加入眾多功能,因此將形成系統伺服端極高的運算量負擔。

但在導入GPGPU的運算模式之後,除可進一步分攤整體運算負擔,同時可進一步針對使用者行為模式進行分析,在了解使用者平常與朋友互動、使用語言、上傳圖像等數據後,即可針對不同使用者投遞最合適行動廣告,另外也能藉由協作運算資源打造諸如拍照、聽聲搜尋,或是進一步結合眾多微信用戶協助,透過每人協助花費約1分鐘時間口述一段文字,即可將眾人口述內容統整製作一本有聲書,讓盲胞可透過聆聽方式進行「閱讀」。

, Nvidia繪圖技術大會登台 擴大深度機械學習應用, mashdigi-科技、新品、趣聞、趨勢

楊強博士也表示,深度機械學習的技術應用已經發展相當久的時間,但由於近期因行動裝置普及、雲端應用需求增加情況下,讓巨量數據運算分析比重越來越高,因此在導入GPGPU的平行運算概念將會越來越為普及,藉此提昇更快的大量運算效能。

而包含智慧監控系統且將在近期準備推出新品的Umbo CV,以及先前透過集資網站推出具備貓臉識別系統的CatFi (先前名稱為Bistro),均透過GPGPU等方式建立自有影像識別系統與採樣樣本,藉此透過深度機械學習方式讓系統清楚識別影像物件,例如Umbo CV提供監控系統可自動判斷攝影機拍攝影像是否出現異常情況,而CatFi則可在簡短3-5秒內完成建立特定貓臉特徵,藉此讓自動餵食系統可判斷不同隻貓是否已經餵食,以及是否過度餵食等,並且透過體重、餵食、給水情況判斷貓的健康是否出現異常等應用。

另外,美國康乃爾大學近期提出的類神經網絡技術的圖像分析應用,也是藉由電腦視覺認知方式,讓電腦系統了解不同藝術家繪畫風格、主要元素,藉此將其繪畫風格套用在不同作品,甚至可集結眾多藝術大師風格創造全新作品,此部份也同樣使用GPGPU平行運算技術資源,藉此縮短影像分析所需時間。

, Nvidia繪圖技術大會登台 擴大深度機械學習應用, mashdigi-科技、新品、趣聞、趨勢

[youtube https://www.youtube.com/watch?v=EeKdWCw43UA&w=800&h=450]

就目前電腦運算技術來看,GPGPU平行運算技術已經成為相當重要應用環節,其所伴隨的運算加速效率將可帶來更快速運算表現,進而可帶動電腦視覺應用、資料分析、深度學習等技術發展,藉此實現更多原本無法想像的功能應用,例如無人車駕駛系統、語言認知、影像認知等。

雖然Nvidia在建立各類電腦識別系統時,其採用樣本均使用公開數據庫資料為主,但針對有特定使用需求的電腦視覺識別應用,例如上述Umbo CV所提供機控系統可能會安裝在不同角度,甚至可能因為拍攝器材導入魚眼鏡頭僅能拍攝邊緣有形變現象的廣角畫面,或是CatFi識別內容僅以貓臉為主,一般而言還是會以自建資料庫為主。但針對更廣泛的技術應用層面來看,此類資料庫理論上仍可相互通用,藉此讓電腦視覺能更正確判斷影像物件,同時也能授權或開放讓更多開發者取用。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響