微軟提出多型態大型語言模型「Kosmos-1」，往全能型人工智慧技術發展邁進一大步 - mashdigi－科技、新品、趣聞、趨勢

市場動態生活網路觀察軟體

微軟提出多型態大型語言模型「Kosmos-1」，往全能型人工智慧技術發展邁進一大步
將能同時理解文字與圖像內容

2023-03-022023-03-02 楊又肇 (Mash Yang) Comment(0)

雖然近期與OpenAI合作將ChatGPT技術應用在新版Bing搜尋服務等產品，但微軟顯然並未停下自行建構大型語言模型的腳步。在稍早公布名為「Kosmos-1」的多型態大型語言模型，將能同時理解文字與圖像內容，藉此對應更複雜、多元的人工智慧技術應用。

微軟表示，用於訓練「Kosmos-1」資料同樣源自網路，同時為了讓「Kosmos-1」能進一步理解圖像內容，研究人員更透過事先將圖像以文字內容加上大量標記，讓此大型語言模型可以進一步理解圖像內容，藉此實現多型態運作模式。

加入圖像內容理解能力之後，將有助於「Kosmos-1」識別文字以外的圖像內容，甚至進一步判斷動態影片描述內容。

在進一步朝多型態運作模式發展，微軟預期將能在全能型的人工智慧技術發展邁進一大步，不再讓現有人工智慧僅侷限對應特定領域應用發展。

不過，許多人其實也對全能型的人工智慧技術發展表示擔憂，認為發展過度「聰明」的人工智慧，有可能加速影響人類既有生活模式，甚至可能導致人類滅亡，但也有看法表示此類擔憂純屬多慮，認為此類技術發展過程仍會加上諸多保護機制，避免人工智慧影響加劇。

楊又肇 (Mash Yang)

mashdigi.com網站創辦人兼主筆，同時也是科技新聞業流浪漢。

發表迴響取消回覆

更多內容

, vivo揭曉iQOO 5系列，提供120Hz畫面更新率、120W有線快充與120dB Hi-Fi聲音輸出, mashdigi－科技、新品、趣聞、趨勢

vivo揭曉iQOO 5系列，提供120Hz畫面更新率、120W有線快充與120dB Hi-Fi聲音輸出

2020-08-172020-08-17

, 亞太即日起加入900MHz頻段擴展4G連網速度、額外提供2G通話服務, mashdigi－科技、新品、趣聞、趨勢

亞太即日起加入900MHz頻段擴展4G連網速度、額外提供2G通話服務

2017-07-042017-07-04