市場動態 生活 網路 觀察 軟體

微軟提出多型態大型語言模型「Kosmos-1」,往全能型人工智慧技術發展邁進一大步
將能同時理解文字與圖像內容

雖然近期與OpenAI合作將ChatGPT技術應用在新版Bing搜尋服務等產品,但微軟顯然並未停下自行建構大型語言模型的腳步。在稍早公布名為「Kosmos-1」的多型態大型語言模型,將能同時理解文字與圖像內容,藉此對應更複雜、多元的人工智慧技術應用。

人工智慧, 微軟提出多型態大型語言模型「Kosmos-1」,往全能型人工智慧技術發展邁進一大步<br><span style='color:#848482;font-size:16px;'>將能同時理解文字與圖像內容</span>, mashdigi-科技、新品、趣聞、趨勢

微軟表示,用於訓練「Kosmos-1」資料同樣源自網路,同時為了讓「Kosmos-1」能進一步理解圖像內容,研究人員更透過事先將圖像以文字內容加上大量標記,讓此大型語言模型可以進一步理解圖像內容,藉此實現多型態運作模式。

加入圖像內容理解能力之後,將有助於「Kosmos-1」識別文字以外的圖像內容,甚至進一步判斷動態影片描述內容。

在進一步朝多型態運作模式發展,微軟預期將能在全能型的人工智慧技術發展邁進一大步,不再讓現有人工智慧僅侷限對應特定領域應用發展。

不過,許多人其實也對全能型的人工智慧技術發展表示擔憂,認為發展過度「聰明」的人工智慧,有可能加速影響人類既有生活模式,甚至可能導致人類滅亡,但也有看法表示此類擔憂純屬多慮,認為此類技術發展過程仍會加上諸多保護機制,避免人工智慧影響加劇。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響