Clip模型橫空出世,背後的意味非常明顯,這是影象與文字首次在最新的T方法上大規模進行融合理解。

當孟繁岐公開視覺T方法的時候,學界的所有人就已經預料到這個時刻的到來了。

只是沒有料到會如此之快。

其實也已經有一些研究組在比較小的資料集上進行了小打小鬧,比如可以模糊地控制生成圖片的

《重生之AI教父》356. 來自電商的外快

《》