第50章 You Only Look Once: YOLO

章節報錯

李彥弘回想了一下，在當時交流面談的過程中，自己其實是主動權基本喪失的。

因為起初他的核心計劃其實是招募人才和打探DreamNet的技術細節。

而孟繁岐一上車，就很痛快地把DreamNet論文給了自己一版。

這件事情直接打亂了他的節奏，之後的每一步，又都在加劇這個過程。

搬出和阿里克斯以及辛頓的交流細節婉拒招聘，聊到AI模型的路線問題，引誘自己提出技術合作。

然後突然猛地就掏出一個如此驚世駭俗的演算法，彷彿此行本來根本沒打算提一樣。

“仔細回想一下，怎麼感覺有點像是魔術的手法。先轉移你的注意力，隱藏自己的真實意圖。然後再趁其不備，出擊騙到你。”

在餘愷為首的幾位技術人員強烈的質疑聲之下，李彥弘不由得不產生這樣的想法。

畢竟當時孟繁岐給出的只有一些實驗結果，沒有任何其他的情報。

如果情況真的如餘愷所說，效能的提升來自於DreamNet技術的下游應用，而檢測速度實際上未能提升的話，其實也算是很大的突破了。

只能沒有到值得他這個公司CEO直接介入的地步罷了。

不過“彷彿此行本來根本沒打算提一樣”這種感覺確實算不上冤枉孟繁岐，他原本的確打算用這個演算法直接和谷歌交涉。

但在李彥弘提出技術合作之後，孟繁岐略一思索，還是認為和白度先合作一次對自己來說非常有利。

首先，白度遠比谷歌缺AI技術，更有危機感。李彥弘也是親自出馬來和自己談，相同的技術，在白度能要到的價格更高。

其次，距離谷歌給自己意向書，才小几個月的時間，自己就能夠和白度有這樣的創舉和技術合作的話。能夠極大地提升自己的議價權和談判空間。

要知道，大點的公司內部也是派系林立，資源這種東西都是要靠搶的。

自己沒點歷史成績，沒點外部的關係，人生地不熟的到了矽谷，真要是計算資源上緊缺，那多耽誤事。

當然了，最最重要的還是看上了華國政府資源這一塊。

檢測技術是現階段政府機構潛在用途最廣的AI技術，不僅數以億記的攝像頭可以用檢測演算法智慧標註監控的重點時段，還是安全性更上幾層樓的高精度實時人臉檢測，都是非常龐大的市場。

自己計劃明年初去矽谷，想搭上華國官方的線，還是需要借力白度這樣的大型網際網路公司。

此時的白度不像十年後已經顯出很大的頹勢，目前白度和企鵝阿狸位列三甲，還是具有很大價值的。

李彥弘所考慮的同樣是這點，他對華國官方的瞭解也遠比孟繁岐更深，對其中潛在的機會十分渴望。

既然想要拿下這個方向，疑人不用，用人不疑，李彥弘這點魄力還是有的。

當然了，最主要的還是現在合同都沒簽呢。

“說白了，你們也沒什麼可擔憂的，我們驗收結果透過才會簽訂合同呢，到時候也是你們自己去審閱程式碼，復現結果。信不過別人你們還信不過自己嗎？”

李彥弘很快調整好了自己的心態，“我們直接持有這樣質疑的態度，是非常不可取的。一會人來了之後，我們還是要調整一下，注意方式方法。”

另一邊，對這邊內幕一無所知的孟繁岐，正準備前往白度的燕京總部。

作為重生人士的他，終究還是高估了現有的檢測技術。

第一個真正意義上將深度學習技術應用到目標檢測上的，應當是這個月剛剛提出來的R-CNN，也就是區域檢測神經網路。

在傳統演算法mAP值止步於30-40，不再繼續提升的情況下，R-CNN基於神經網路，一舉突破了60的mAP值。

它的R指得便是區域，檢測任務說白了，就是指出物體在圖片中的位置/區域。

而即便在14-15年，R-CNN系列作為領先的高效能演算法，他的推理時間也是奇慢無比的。

採用14年牛津大學的VGG網路作為結構的骨幹，需要整整幾十秒才能處理一張影象。也就沒有了任何實時的可能，只做學術研究之用，難以投入業界。

即便是一兩年後，屢次更新，升級迭代的快速版本FastR-CNN系列，也只有0.5和個位數的FPS。

而孟繁岐給出的演算法：YOLO。即便在448x448大小的影象上，速度也超過了80FPS。

如果採用最小的模型版本進行推理，速度甚至可以達到驚人的200幀。

多少人直到十年後，玩遊戲的時候顯示器都顯示不了100幀？

原本的初版YOLO技術其實在精確程度上還有所不足，畢竟，作為專注於速度的檢測技術，在效能上有所犧牲也是在所難免。

但孟繁岐開始接觸YOLO技術的時候，都已經出到V4了，等到2023年的時候，甚至都已經到了V7，V8。

很多細節上的問題，孟繁岐就是想犯錯都不知道該怎麼犯。

最開始記得的就是最佳化之後的技術。

此時此刻，比較常用的檢測技術是DPM，30FPS效能26.1mAP，100FPS效能僅為16.0mAP。

而這個月剛剛出來的R-CNN技術，效能雖然有一個質的突破，來到了50-60，但FPS已經到小數點後幾位去了，根本用不了。

孟繁岐交出的結果則是，69.5mAP，82FPS，58.3mAP，200FPS。

這已經不能說是普通的超越了，簡直是完爆中的完爆。

不過除了在這方面有所疏忽之外，孟繁岐實際上還是在有意識地想要做高這個效能。

縱觀自己掌握的所有AI技術，唯有檢測是現在階段變現最快的。

這個功能直接粗暴好理解，易於展示。

只需要接上攝像頭，給觀眾們實時地演示，這項AI技術可以流暢絲滑地檢測出螢幕中的桌椅，人物，動植物等常見物體，就能夠給觀眾最為直接的震撼。

像影象生成，語言對話等技術，還需要一定的時間，海量的資料和計算資源來支撐，自己才能夠實現這些技術。

而在實際的應用前景上，檢測技術不僅是現階段最容易落地的技術，它的未來前景也非常遼闊。

兩三年後搞自動駕駛的企業那是不計其數，如過江之鯽，數不勝數。

在檢測上盡力做出誇張的突破，很有助於此後自己在這個方向上的歷史地位，說白了其實就是更容易忽悠到錢。

只是他第一次把握刀法，經驗不足，沒有切好。不慎導致比較專業的人士對此有所誤會。