186. 新建資料夾:擴散模型
章節報錯
除去孟繁岐在華國時推行的人臉識別方法已經大行其道,最近他在醫療影像診斷分析領域的一系列工作,其實也已經在加州的圈子裡率先展開了試用。
那句話怎麼說來著,【獲得了幾百名教授一致透過】。
尤其是灣區附近兩所最頂級的高校,斯坦福和伯克利兩個派系。由於他們在人工智慧比較沒落的時候仍舊堅持研究,因而也對這些遲到的果實感到格外珍惜。
斯坦福腫瘤方向的教授劉勇使用了這系列演算法之後,感到十分驚奇,這電腦明明一兩年前才剛剛學會分辨什麼是貓,怎麼現在突然就這麼生猛了?
尤其是比較難一點的病症,自己帶的幾個學生分辨起來一看就是十幾二十分鐘,這東西倒好,幾秒鐘就能給出一個答覆。
為此,他私下裡和孟繁岐聊過兩三次,大概瞭解了原理,也為他協調提供了不少資料作為支援。
有一次,劉勇教授向孟繁岐詢問道:“既然人工智慧已經可以對圖片中病變的種類,區域和輪廓都做出如此準確的分析判斷,那能不能幫忙把醫囑或者文字分析也給寫了?”
孟繁岐聽完頓時語塞,沒想到劉教授接受新事物的速度還挺快,已經做上白日夢了這是。
他只得實話告訴劉教授,別說語言和影象的結合的多模態了,目前語言模型本身都仍舊是一個相對急需突破的領域。
想要實現他需求的功能,恐怕還得幾年。
斯坦福的其他醫學教授,比如傑佛雷主任等人則非常看好孟繁岐阿爾法fold專案,尤其是傑佛雷,他曾經擔任二十多個臨床藥物研究的首席調查員,因而非常能夠理解這種蛋白質分析能力的價值。
傑佛雷是個大腦門,有點胖乎乎的中年男子,滿面紅光,對待學生十分熱情。
在得知孟繁岐的阿爾法fold專案很是缺乏高質量的蛋白質資料之後,也非常積極踴躍地提供了協助。
總體來說,斯坦福醫學派系對本校學生的的突破相當熱情,藉助著加州這兩所頂級高校的影響力,孟繁岐的成果正在慢慢地向外輻射。
只不過大量資料的準備,並不是區區幾天就可以有顯著成效的。
即便加州相關方面的教授集體支援,積累資料的速度仍舊遠遠要比孟繁岐所想的慢不少。
阿爾法fold專案的正式開啟時間,至少要往後延一到兩個月。
因而在開學前的這段時間,孟繁岐的蛋白質分析大計不得不進入了一段時間的停滯期。
“技術提的太快,就是會碰到這種問題。”孟繁岐有些無可奈何,別說很多領域還來不及接受和消化自己做出的能力提升。
這些地方原本積累的那點資料在新的技術面前,完全不夠看,數量實在太少了。
即便他們能夠及時調轉車頭,開始進行優質資料的積累和標註,肯定也是要一段時間的。
資料跟不上,孟繁岐即便理論再好,卻也難做出足夠好的效果,不足以讓人信服。
“我也算是搞了好個月的應用技術了,現在資料上要等一兩個月,看來是時候做點基礎工作,為以後鋪墊了。”
時隔多月,孟繁岐也算是終於被迫靜下心來,有了足夠的時間做一些基礎的理論方法,而不是急於做產品又或者是變現。
畢竟,往後的技術不管是AI生成語音,影象還是文字,目前的這些技術理論還有不小的缺陷和問題。
他計劃最近開發的,便是後來非常火熱的一款圖片生成技術,StableDiffusion的基礎部件,diffusion原理。
這是後來許多優質生成技術的基石,非常適合現在做準備。
擴散(diffusion)模型,這個比較不明覺厲的名詞,雖然後來知曉原理的人很少,但很多人卻都聽過這個名詞多次。
從AI繪圖軟體生成的作品打敗一眾人類藝術家,斬獲數字藝術類冠軍,到後來Midjourney,、Imagen、novelai等國內外平臺遍地開花。
越來越多的人都曾點開過相關網站,嘗試讓AI描繪腦海中的畫面,又或者是進行區域性的修改調整。
有以文生圖,各種神秘咒語召喚古神的,也有以圖生圖,鬧出各種神奇笑話的。
2022年,AI繪畫,AI生成影象,在短短几個月內數次進步。
每一次的進展突破都帶了了肉眼可見的提升,遠超人類的想象。
就在22年年關左右的時候,大家都還在嘲笑AI繪圖是什麼東西,實在太過醜陋了。
結果三個月後就發現事情似乎沒有那麼簡單,AI開始大量產出各種波濤胸湧的繪圖,這吸引了相當一部分人們的注意力。
那時不少人還在開玩笑說,雖然AI畫得不行,但你真別說,它對題材的把握還是非常不錯的嘛!水平不夠,題材來湊。
等再過三四個月,到22年底的時候,AI繪畫的水平和能力已經無人再去爭議了。
這回大家主要爭論的點又變了,變成了AI繪圖究竟是不是抄襲,AI水平和畫師究竟誰更強。
拋開到底誰更強這件說不清的事不談,單從大家爭論的這些內容就能看出,AI繪畫的能力確實進步得非常之快。
“平心而論,在AI生成這件事情上,GAN生成式方法是讓大家走了彎路的。”
雖然孟繁岐的GAN生成式辦法在學界廣受好評,建立起了很高的學術聲譽和知名度,FaceGAN的假臉生成效果也頗為驚豔,但最終真正讓AI製圖火起來的還是擴散模型。
“GAN辦法生成對抗的模式固然讓人感到驚為天人,但兩個網路彼此對抗學習,畢竟還是非常麻煩的事情。”孟繁岐思忖了一下,現在的大難題,資料是一方面,計算裝置則是另一方面。
本來自己提前釋出技術,顯示卡就已經很不夠用了。目前用GAN去針對某一個特定的事物,比如FaceGAN只做人臉還是比較可以的,但想要從文字直接生成,那難度可就大了。
擴散模型的原理其實並不難,主要是透過對照片新增噪聲,然後在這個過程中學習到當前圖片的各種特徵。之後再隨機生成一個服從高斯分佈的噪聲圖片,然後一步一步的減少噪聲直到生成預期圖片。
程式碼寫起來不是那麼困難,不過若是寫成論文,琢磨其中的原理,那裡面的數理邏輯和推導,夠孟繁岐喝一壺的。
“數學這方面....這兩天找韓辭和付院長他們幫幫忙吧,好久沒怎麼跟他們聯絡了。或者也可以請辛頓和李飛飛指點一下,這兩位都算是我的導師。”涉及數學問題,找數學專業人才自然放心。
李飛飛和辛頓雖然不是數學出身,但李飛飛有物理背景,辛頓更是領域內教父,兩者在這方面實力想必也很強。
新建了資料夾,孟繁岐剛準備開始工作,卻隱約感覺哪裡不對,自己好像遺忘了什麼事情。
半晌才想起來,自己的倒黴室友唐璜今天要到斯坦福附近來。
“這大半年過的,差點忘記我自己還是個學生了。”
高強度研發了三四個月的孟繁岐,感覺時間好像已經過去了一年多。
正好唐璜來了,就給自己放幾天假吧,來了也有幾周了,卻一直沒有好好逛過斯坦福的校園。