第50章 You Only Look Once: YOLO
章節報錯
李彥弘回想了一下,在當時交流面談的過程中,自己其實是主動權基本喪失的。
因為起初他的核心計劃其實是招募人才和打探DreamNet的技術細節。
而孟繁岐一上車,就很痛快地把DreamNet論文給了自己一版。
這件事情直接打亂了他的節奏,之後的每一步,又都在加劇這個過程。
搬出和阿里克斯以及辛頓的交流細節婉拒招聘,聊到AI模型的路線問題,引誘自己提出技術合作。
然後突然猛地就掏出一個如此驚世駭俗的演算法,彷彿此行本來根本沒打算提一樣。
“仔細回想一下,怎麼感覺有點像是魔術的手法。先轉移你的注意力,隱藏自己的真實意圖。然後再趁其不備,出擊騙到你。”
在餘愷為首的幾位技術人員強烈的質疑聲之下,李彥弘不由得不產生這樣的想法。
畢竟當時孟繁岐給出的只有一些實驗結果,沒有任何其他的情報。
如果情況真的如餘愷所說,效能的提升來自於DreamNet技術的下游應用,而檢測速度實際上未能提升的話,其實也算是很大的突破了。
只能沒有到值得他這個公司CEO直接介入的地步罷了。
不過“彷彿此行本來根本沒打算提一樣”這種感覺確實算不上冤枉孟繁岐,他原本的確打算用這個演算法直接和谷歌交涉。
但在李彥弘提出技術合作之後,孟繁岐略一思索,還是認為和白度先合作一次對自己來說非常有利。
首先,白度遠比谷歌缺AI技術,更有危機感。李彥弘也是親自出馬來和自己談,相同的技術,在白度能要到的價格更高。
其次,距離谷歌給自己意向書,才小几個月的時間,自己就能夠和白度有這樣的創舉和技術合作的話。能夠極大地提升自己的議價權和談判空間。
要知道,大點的公司內部也是派系林立,資源這種東西都是要靠搶的。
自己沒點歷史成績,沒點外部的關係,人生地不熟的到了矽谷,真要是計算資源上緊缺,那多耽誤事。
當然了,最最重要的還是看上了華國政府資源這一塊。
檢測技術是現階段政府機構潛在用途最廣的AI技術,不僅數以億記的攝像頭可以用檢測演算法智慧標註監控的重點時段,還是安全性更上幾層樓的高精度實時人臉檢測,都是非常龐大的市場。
自己計劃明年初去矽谷,想搭上華國官方的線,還是需要借力白度這樣的大型網際網路公司。
此時的白度不像十年後已經顯出很大的頹勢,目前白度和企鵝阿狸位列三甲,還是具有很大價值的。
李彥弘所考慮的同樣是這點,他對華國官方的瞭解也遠比孟繁岐更深,對其中潛在的機會十分渴望。
既然想要拿下這個方向,疑人不用,用人不疑,李彥弘這點魄力還是有的。
當然了,最主要的還是現在合同都沒簽呢。
“說白了,你們也沒什麼可擔憂的,我們驗收結果透過才會簽訂合同呢,到時候也是你們自己去審閱程式碼,復現結果。信不過別人你們還信不過自己嗎?”
李彥弘很快調整好了自己的心態,“我們直接持有這樣質疑的態度,是非常不可取的。一會人來了之後,我們還是要調整一下,注意方式方法。”
另一邊,對這邊內幕一無所知的孟繁岐,正準備前往白度的燕京總部。
作為重生人士的他,終究還是高估了現有的檢測技術。
第一個真正意義上將深度學習技術應用到目標檢測上的,應當是這個月剛剛提出來的R-CNN,也就是區域檢測神經網路。
在傳統演算法mAP值止步於30-40,不再繼續提升的情況下,R-CNN基於神經網路,一舉突破了60的mAP值。
它的R指得便是區域,檢測任務說白了,就是指出物體在圖片中的位置/區域。
而即便在14-15年,R-CNN系列作為領先的高效能演算法,他的推理時間也是奇慢無比的。
採用14年牛津大學的VGG網路作為結構的骨幹,需要整整幾十秒才能處理一張影象。也就沒有了任何實時的可能,只做學術研究之用,難以投入業界。
即便是一兩年後,屢次更新,升級迭代的快速版本FastR-CNN系列,也只有0.5和個位數的FPS。
而孟繁岐給出的演算法:YOLO。即便在448x448大小的影象上,速度也超過了80FPS。
如果採用最小的模型版本進行推理,速度甚至可以達到驚人的200幀。
多少人直到十年後,玩遊戲的時候顯示器都顯示不了100幀?
原本的初版YOLO技術其實在精確程度上還有所不足,畢竟,作為專注於速度的檢測技術,在效能上有所犧牲也是在所難免。
但孟繁岐開始接觸YOLO技術的時候,都已經出到V4了,等到2023年的時候,甚至都已經到了V7,V8。
很多細節上的問題,孟繁岐就是想犯錯都不知道該怎麼犯。
最開始記得的就是最佳化之後的技術。
此時此刻,比較常用的檢測技術是DPM,30FPS效能26.1mAP,100FPS效能僅為16.0mAP。
而這個月剛剛出來的R-CNN技術,效能雖然有一個質的突破,來到了50-60,但FPS已經到小數點後幾位去了,根本用不了。
孟繁岐交出的結果則是,69.5mAP,82FPS,58.3mAP,200FPS。
這已經不能說是普通的超越了,簡直是完爆中的完爆。
不過除了在這方面有所疏忽之外,孟繁岐實際上還是在有意識地想要做高這個效能。
縱觀自己掌握的所有AI技術,唯有檢測是現在階段變現最快的。
這個功能直接粗暴好理解,易於展示。
只需要接上攝像頭,給觀眾們實時地演示,這項AI技術可以流暢絲滑地檢測出螢幕中的桌椅,人物,動植物等常見物體,就能夠給觀眾最為直接的震撼。
像影象生成,語言對話等技術,還需要一定的時間,海量的資料和計算資源來支撐,自己才能夠實現這些技術。
而在實際的應用前景上,檢測技術不僅是現階段最容易落地的技術,它的未來前景也非常遼闊。
兩三年後搞自動駕駛的企業那是不計其數,如過江之鯽,數不勝數。
在檢測上盡力做出誇張的突破,很有助於此後自己在這個方向上的歷史地位,說白了其實就是更容易忽悠到錢。
只是他第一次把握刀法,經驗不足,沒有切好。不慎導致比較專業的人士對此有所誤會。