186. 新建資料夾：擴散模型

章節報錯

除去孟繁岐在華國時推行的人臉識別方法已經大行其道，最近他在醫療影像診斷分析領域的一系列工作，其實也已經在加州的圈子裡率先展開了試用。

那句話怎麼說來著，【獲得了幾百名教授一致透過】。

尤其是灣區附近兩所最頂級的高校，斯坦福和伯克利兩個派系。由於他們在人工智慧比較沒落的時候仍舊堅持研究，因而也對這些遲到的果實感到格外珍惜。

斯坦福腫瘤方向的教授劉勇使用了這系列演算法之後，感到十分驚奇，這電腦明明一兩年前才剛剛學會分辨什麼是貓，怎麼現在突然就這麼生猛了？

尤其是比較難一點的病症，自己帶的幾個學生分辨起來一看就是十幾二十分鐘，這東西倒好，幾秒鐘就能給出一個答覆。

為此，他私下裡和孟繁岐聊過兩三次，大概瞭解了原理，也為他協調提供了不少資料作為支援。

有一次，劉勇教授向孟繁岐詢問道：“既然人工智慧已經可以對圖片中病變的種類，區域和輪廓都做出如此準確的分析判斷，那能不能幫忙把醫囑或者文字分析也給寫了？”

孟繁岐聽完頓時語塞，沒想到劉教授接受新事物的速度還挺快，已經做上白日夢了這是。

他只得實話告訴劉教授，別說語言和影象的結合的多模態了，目前語言模型本身都仍舊是一個相對急需突破的領域。

想要實現他需求的功能，恐怕還得幾年。

斯坦福的其他醫學教授，比如傑佛雷主任等人則非常看好孟繁岐阿爾法fold專案，尤其是傑佛雷，他曾經擔任二十多個臨床藥物研究的首席調查員，因而非常能夠理解這種蛋白質分析能力的價值。

傑佛雷是個大腦門，有點胖乎乎的中年男子，滿面紅光，對待學生十分熱情。

在得知孟繁岐的阿爾法fold專案很是缺乏高質量的蛋白質資料之後，也非常積極踴躍地提供了協助。

總體來說，斯坦福醫學派系對本校學生的的突破相當熱情，藉助著加州這兩所頂級高校的影響力，孟繁岐的成果正在慢慢地向外輻射。

只不過大量資料的準備，並不是區區幾天就可以有顯著成效的。

即便加州相關方面的教授集體支援，積累資料的速度仍舊遠遠要比孟繁岐所想的慢不少。

阿爾法fold專案的正式開啟時間，至少要往後延一到兩個月。

因而在開學前的這段時間，孟繁岐的蛋白質分析大計不得不進入了一段時間的停滯期。

“技術提的太快，就是會碰到這種問題。”孟繁岐有些無可奈何，別說很多領域還來不及接受和消化自己做出的能力提升。

這些地方原本積累的那點資料在新的技術面前，完全不夠看，數量實在太少了。

即便他們能夠及時調轉車頭，開始進行優質資料的積累和標註，肯定也是要一段時間的。

資料跟不上，孟繁岐即便理論再好，卻也難做出足夠好的效果，不足以讓人信服。

“我也算是搞了好個月的應用技術了，現在資料上要等一兩個月，看來是時候做點基礎工作，為以後鋪墊了。”

時隔多月，孟繁岐也算是終於被迫靜下心來，有了足夠的時間做一些基礎的理論方法，而不是急於做產品又或者是變現。

畢竟，往後的技術不管是AI生成語音，影象還是文字，目前的這些技術理論還有不小的缺陷和問題。

他計劃最近開發的，便是後來非常火熱的一款圖片生成技術，StableDiffusion的基礎部件，diffusion原理。

這是後來許多優質生成技術的基石，非常適合現在做準備。

擴散(diffusion)模型，這個比較不明覺厲的名詞，雖然後來知曉原理的人很少，但很多人卻都聽過這個名詞多次。

從AI繪圖軟體生成的作品打敗一眾人類藝術家，斬獲數字藝術類冠軍，到後來Midjourney，、Imagen、novelai等國內外平臺遍地開花。

越來越多的人都曾點開過相關網站，嘗試讓AI描繪腦海中的畫面，又或者是進行區域性的修改調整。

有以文生圖，各種神秘咒語召喚古神的，也有以圖生圖，鬧出各種神奇笑話的。

2022年，AI繪畫，AI生成影象，在短短几個月內數次進步。

每一次的進展突破都帶了了肉眼可見的提升，遠超人類的想象。

就在22年年關左右的時候，大家都還在嘲笑AI繪圖是什麼東西，實在太過醜陋了。

結果三個月後就發現事情似乎沒有那麼簡單，AI開始大量產出各種波濤胸湧的繪圖，這吸引了相當一部分人們的注意力。

那時不少人還在開玩笑說，雖然AI畫得不行，但你真別說，它對題材的把握還是非常不錯的嘛！水平不夠，題材來湊。

等再過三四個月，到22年底的時候，AI繪畫的水平和能力已經無人再去爭議了。

這回大家主要爭論的點又變了，變成了AI繪圖究竟是不是抄襲，AI水平和畫師究竟誰更強。

拋開到底誰更強這件說不清的事不談，單從大家爭論的這些內容就能看出，AI繪畫的能力確實進步得非常之快。

“平心而論，在AI生成這件事情上，GAN生成式方法是讓大家走了彎路的。”

雖然孟繁岐的GAN生成式辦法在學界廣受好評，建立起了很高的學術聲譽和知名度，FaceGAN的假臉生成效果也頗為驚豔，但最終真正讓AI製圖火起來的還是擴散模型。

“GAN辦法生成對抗的模式固然讓人感到驚為天人，但兩個網路彼此對抗學習，畢竟還是非常麻煩的事情。”孟繁岐思忖了一下，現在的大難題，資料是一方面，計算裝置則是另一方面。

本來自己提前釋出技術，顯示卡就已經很不夠用了。目前用GAN去針對某一個特定的事物，比如FaceGAN只做人臉還是比較可以的，但想要從文字直接生成，那難度可就大了。

擴散模型的原理其實並不難，主要是透過對照片新增噪聲，然後在這個過程中學習到當前圖片的各種特徵。之後再隨機生成一個服從高斯分佈的噪聲圖片，然後一步一步的減少噪聲直到生成預期圖片。

程式碼寫起來不是那麼困難，不過若是寫成論文，琢磨其中的原理，那裡面的數理邏輯和推導，夠孟繁岐喝一壺的。

“數學這方面....這兩天找韓辭和付院長他們幫幫忙吧，好久沒怎麼跟他們聯絡了。或者也可以請辛頓和李飛飛指點一下，這兩位都算是我的導師。”涉及數學問題，找數學專業人才自然放心。

李飛飛和辛頓雖然不是數學出身，但李飛飛有物理背景，辛頓更是領域內教父，兩者在這方面實力想必也很強。

新建了資料夾，孟繁岐剛準備開始工作，卻隱約感覺哪裡不對，自己好像遺忘了什麼事情。

半晌才想起來，自己的倒黴室友唐璜今天要到斯坦福附近來。

“這大半年過的，差點忘記我自己還是個學生了。”

高強度研發了三四個月的孟繁岐，感覺時間好像已經過去了一年多。

正好唐璜來了，就給自己放幾天假吧，來了也有幾周了，卻一直沒有好好逛過斯坦福的校園。