(相關(guān)資料圖)
近日,微軟發(fā)布了一款名為可組合擴散模型(CoDi)的人工智能模型。這是一種獨特的、基于可組合擴散的人工智能模型,其設(shè)計目標(biāo)是互動和生成多模態(tài)內(nèi)容。 微軟設(shè)計CoDi的目標(biāo),是為了解決傳統(tǒng)單一模態(tài)AI模型的局限性。例如,在同步視頻和音頻的情況下,獨立生成的信息流拼接在一起時可能存在不一致和對齊的問題。CoDi采用了獨特的可組合生成策略,在擴散過程中對齊多模態(tài),從而生成相互交織的模式。更重要的是,CoDi能夠處理任意輸入模式并生成任意模態(tài)的內(nèi)容。 CoDi是由微軟Azure認(rèn)知服務(wù)研究團隊與北卡羅來納大學(xué)教堂山分校合作開發(fā)的,也是微軟項目i-Code的一部分,該項目使用人工智能來增強人機交互。對此項目感興趣的用戶可以深入了解。