第86章視覺新正規化

章節報錯

會議的主持人面帶笑容，宣佈孟繁岐隆重登場。

孟繁岐沉迷分成的計算，正在暢想美好的未來，完全沒有感覺到時間竟然過得如此之快。

連忙關掉谷歌的財報，緩步登臺。

看著臺下滿滿一教室的AI領域學者們，都翹首以盼，用十分期待的目光看著自己，孟繁岐發覺自己遠沒有想象的那麼緊張。

“大家好，這個報告的主題主要是應用於影象領域的深度殘差學習。我知道大家可能主要是為它在影象識別領域取得的成績而來的。”

說到這裡，孟繁岐頓了一秒，臺下響起了會心的笑聲。

“不過在這樣的場合，我個人並不希望花費太多的時間在具體的細節上面，相關的論文和程式碼在最近一段時間會陸續地開源，對細節感興趣的朋友可以自己去探索。”

與谷歌簽下合同之後，孟繁岐手頭的所有論文也就沒有繼續壓在手裡的必要了。

藉著釋出會和這次國際會議的熱度，他準備直接全部公之於眾。

當然，這部分內容現在需要先經過谷歌的首肯和內部審閱才可以釋出出去，以免它們可能導致谷歌的利益有損失。

不過由於這部分技術內容大都是影象演算法領域的，目前還沒有涉及到谷歌的關鍵利益。

若是等幾周後，孟繁岐將對谷歌推薦和廣告演算法的一系列策略做出來之後，想要公佈這部分技術，谷歌是萬萬不可能會答應的。

不涉及核心利益的情況下，谷歌在這些技術方面一向還是非常大方的，在經過傑夫和辛頓的審閱之後，孟繁岐已經準備先後把之前攢下的部分工作公佈出去。

在大會開始之前，以DreamNet為首的部分論文已經可以在arxiv上直接閱讀到。

剛才其他隊伍在上面介紹自己做法的時候，其實也有很多人像孟繁岐看財報一樣，在偷偷閱讀DreamNet的論文。

“雖然賽事的主題是影象的識別分類，但如此多學者聚集在一起的機會確實不多，我希望同時把其他方面的一些內容一起在這裡展示一下。”

視覺頂會有三個，分別是本次孟繁岐參加的國際計算機視覺大會，ICCV。

還有歐洲計算機視覺會議，ECCV，一個偏歐洲一點的會議。

這兩個都是兩年一辦，所以一年也只有兩次這樣國際頂級的會議機會。

唯一一個每年都舉辦的，是CVPR，國際計算機視覺和模式識別大會。

但它的舉辦地點基本上都在美國，簽證方面經常會有一些問題。

本次的機會比較難得，當然要多宣傳一下自己的工作。

“基於DreamNet的殘差思想，不僅在影象的識別分類上取得了巨大的突破，我同時也衍生出了它的一些變體，比如生成式網路，檢測網路，還有分割網路。”

識別分類有競賽結果，生成式網路的論文已經放出，而檢測的網路隨著白度的釋出會，大家也已經瞭解它的威力。

至於分割網路，則是這兩天隨著DreamNet的論文一起放出的U-Net工作。至此，可以說視覺類幾大任務的基礎正規化已經被孟繁岐奠基。

今後不論是識別分類，分割檢測，還是遷移生成，都很難繞得開這些輕便又好用的辦法了。

“可以看到，這種思想席捲視覺領域之後，使得目前主要的研究方向都有了顛覆性的突破。”

孟繁岐將這幾篇論文的主要試驗結論擺在了幻燈片的第二頁，就是要先以結果震撼眾人。

“顯然，這些演算法在諸多領域都與第二名拉開了巨大的差距，而相當一部分的功勞應當屬於殘差思想對網路深度的革命。”

“在10年11年，我們仍在使用人工設計的SIFT，HOG還有SVM，12年，阿里克斯的八層AlexNet取得了巨大的突破。”

“而今年，殘差思想引發的深度革命，使得訓練150+層的神經網路成為可能。”

“深度神經網路是很多工場景，尤其是視覺任務場景的基礎引擎和骨幹，這也是為什麼它能夠迅速影響幾個主流的任務。”

“從結構上看，DreamNet並沒有什麼特別的，比起之前每一層都單獨設計的網路，我其實故意希望它變得簡單，重複。”

孟繁岐身後的幻燈片展示了一個極其細長的圖案，這就是一百多層深的DreamNet結構圖。

放大展示它的基本設計，眾人發現，它的單層設計非常簡潔樸素，只採用了最常規的運算元操作。

長長的結構圖滾動了起來，觀眾們都發現，原來每一層並沒有任何區別，只是單純在重複。

由於一百多層的滾動需要太久，在這個嚴肅的場合顯得有些喜感，場內發出了一陣陣笑聲。

“那麼這裡就引出了一個問題，那就是是否單純地把網路做大作深，就總是可以取得更好的結果呢？”

孟繁岐的這個問題，直到2023年也沒有一個理論上的答覆，但很顯然，巨大的模型還在持續地創造一個個奇蹟。

不管是繪畫，對話，還是影象操作，都還遠沒有到達極限。

“我非常希望自己能夠清楚地從理論上告訴大家這個答案，但由於能力有限，我也只能給出自己的猜測，那就是Yes。”

“我相信，只要更多更好的GPU，更多更好的資料，以及更大大模型和更好的最佳化辦法，我們就可以持續地創造奇蹟。”

“而之前的網路在深度上遇到的阻礙，我認為並不是網路的能力問題，而是我們沒有找到合適的辦法去最佳化好它。”

讓網路多重複幾次，這是很多人都試過的事情，很顯然，得到的結果是比原本要差的。

這在傳統方法中，不是什麼奇怪的現象，很多人都將這個現象解釋為維度災難或者過擬合，沒有進行足夠深度的探索。

“稍加思索，這顯然是一個反直覺的現象，對於更深的網路，我們完全可以將小版本網路的所有引數複製進來，而多出來的部分只要什麼事情都不做，這個模型就至少不會更差。”

“但事實上，卻並非如此，我相信很多人都觀察到了這樣的普遍現象，那就是更深的模型反而變差了不少。”

第86章 視覺新正規化

第86章視覺新正規化