第103章 沒有困難就製造困難
章節報錯
孟繁岐決定創業的兩個方向,人臉識別和醫療AI,其中還是有緩急之分的。
人臉識別是一項已經應用了很久的技術,各方面都比較成熟,只是之前的方法比較傳統落後。
一旦孟繁岐做出一些突破之後,可以很快切入進戰場,展開收割,快速盈利。
而醫療AI還處於比較早期的階段,其中最麻煩的問題是這些醫療資料與病人隱私方面的倫理問題。
在最最基層的資料問題上,就有不小的阻礙,各方面的手續章程繁瑣。
雖然尚海公共衛生中心主動與自己聯絡了,不過這方面的事情恐怕不會推進得太快,需要徐徐圖之。
應當先行著手處理的是人臉識別演算法方面的事情,並且既然已經決定創業,自然要從商業的視角去考慮,而非是之前的學術角度。
孟繁岐瞭解這個時期最先進的人臉識別演算法,比如臉書的DeepFace,原本是基於阿里克斯網路做特徵提取,加入了分段仿射變換,使用了3D人臉建模來重現臉部特徵,對齊面部要素。
臉書在14年的這個方法是深度學習時代人臉識別演算法的奠基之作,影響力很強。
不過在孟繁岐看來,這個方法極其臃腫,引數多達上億個,雖然在一個大型人類資料集LFW上效能為97.35%,接近人類水準。
但對孟繁岐來說,將這個效能繼續提升到99.6%往上是十拿九穩的事情。
不過,從資料上可以明顯看到,這個指標剩餘的提升空間其實已經很小了,沒法很顯著地拉開差距。
從學術的角度去思考這個問題,自然是不要緊的,只要突破了世界紀錄,自然就是值得發表的研究。
可在工業界,思維卻不能這麼簡單。
效能相差無幾的情況下,還有太多其他因素需要考慮進來。
比如速度快慢,商業用途,對速度都有硬指標的要求,這一點孟繁岐非常有信心;再比如演算法的運算元是否比較常見?有些複雜的學術操作,在商業使用的時候並不方便,硬體裝置可能不支援,這點有可能會出問題。
其他諸如價格,使用難度,使用者介面的美觀程度,甚至於宣發的PPT做得唬不唬人,都很有可能成為外行人做出商業判斷的依據之一。
因此,孟繁岐覺得在人臉這個已經被比較成熟的問題上,單純只是自己這2個多點的技術突破只是較大的優勢,還不足以建立起絕對的優勢。
既然是創業的第一槍,不僅要成功,還必須大勝。
孟繁岐計劃要在這個領域構建起足夠強大的技術壁壘,至少要讓其他所有的科技巨頭們在大幾個月,甚至接近一年多的時間內退避三舍。
現在的人臉識別太簡單?老辦法就能做到96-97?
哥們給你上點強度,看看你到底能不能受得住!
孟繁岐的策略基於他最先公開的一篇論文,生成式對抗技術之上。
他計劃將基於殘差網路的對抗式生成網路做一些針對性調整,並拿現在業界最大的幾個人臉影象資料去訓練它們。
其最終目的,就是為了生成看上去栩栩如生,實際上根本就不存在的人臉影象。
等到這個生成模型成功訓練之後,孟繁岐便可以用它去對現在世面上的先進人臉識別演算法發起針對性的挑戰。
這些市面上的人臉演算法,許多都基於傳統的特徵方式,就連剛剛孟繁岐回憶到的DeepFace都還沒有釋出。
原本,它們最多就只有94-95左右的水平,距離孟繁岐可以做到的99.6差了不少。
在這樣的基礎之上,它們還完全不具備辨別生成式虛假影象的能力。
孟繁岐可以隨意地用各種虛假的人臉圖片去欺騙這些演算法,甚至可以針對某一些特定的面孔,去生成對應的人臉影象,並騙過基於這些演算法的各種安檢產品。
直接從安全性這個最根本的問題上徹底動搖對方的商用價值。
試想,既然現在市面上已經擁有這樣任意生成虛構面孔的演算法能力,而臉書的人臉識別技術竟然毫無對策,完全無法分辨。
這就帶來了巨大的隱患,真假不辨,產品識別成功放行透過的,誰都不確定到底是什麼鬼東西。
同時,這些產品的識別精確度,識別速度又都遠遠遜色於孟繁岐的技術產品。
在這樣的情況之下,所有的甲方,尤其是注重安全性的政府機構,都會做出最為明智的選擇。
而作為演算法設計者的孟繁岐,當然非常清楚這樣的生成策略會有什麼問題和漏洞,生成出來的影象又有什麼人類無法發現的規律。
孟繁岐的人臉識別演算法,將會同時具有首次突破人類水平的精確度,數十倍於目前世界一流演算法的檢測速度,以及當下獨一無二別無分號的偽造檢測能力。
與此同時,對孟繁岐的新計劃一無所知的臉書DeepFace團隊,正在集體研究孟繁岐的論文和程式碼,完全不清楚自己將會遭遇什麼。
“我們正在做的事情是首個將深度學習用於人臉識別的開創性工作,用到的資料規模也高達百萬,如果這個時候替換掉如此多的演算法元件,會不會耽誤太久時間?”DeepFace四人組中,楊明是唯一的華國人,他對此稍微有所擔憂。
“楊,現在孟的殘差網路已經席捲了整個AI界,如果我們還是使用去年的8層網路,這真的可以稱得上是首個將深度學習應用在人臉識別上的工作嗎?”沃夫人如其名,工作上很有狼性。
在他看來,孟繁岐對深度學習的核心,網路結構本身已經做出了革命性的突破。
如果不採用這種新的技術,那麼自己釋出出去的文章又或者是程式碼,根本就只是曇花一現,幾個月之後,一定到處都是基於孟繁岐殘差技術的版本。
既然已經意識到了自己的不足,那就一定要修正,不能怕麻煩,也不能怕時間不夠。
殘差網路開源釋出出來,就是幾天前的事情,所有人都在同一條起跑線上。
沒有什麼可擔憂的。
DeepFace團隊已經在這個方向上努力了大半年,如今只是更換一些元件,迅速地將終版的實驗迭代一下,這耽誤不了太久。
這麼久的技術積累,難道會別人隨意趕超不成?
“楊,你不必擔心,我們的主要步驟是檢測->校正->再表達->分類驗證,後面幾個步驟都已經相當成熟了,只是現在有了更好的特徵提取辦法。”
泰戈曼也出言安慰楊明,他知道這個新加入臉書的小夥子急需一些成績,“更換了方法之後,我們可以做得更好!”