119. 是收穫的季節
章節報錯
2014年的1月上旬,正值辭舊迎新之際,孟繁岐手頭的諸多事宜有快有慢,都恰巧在這個時間點上到了收穫的時候。
重生歸來之後,孟繁岐一直不確定自己這隻扇動翅膀的蝴蝶,究竟可以改變世界多少。
自己之所以可以取得這些資本,創辦這兩家公司,完全依賴於這個世界的人無法觀察到的另一個時空,這和“視界”這個物理意義頗有些類似。
並且,“視界”也與“世界”諧音,暗含了後續走向世界的決心。
因此,他將自己初次創辦的兩家公司,按照針對的技術方向分別註冊為,視界視覺技術有限公司和視界智慧醫療有限公司。
其中,智慧醫療完全還只是空殼,暫時沒有任何事情在推進當中。
而深度視覺這邊,雖然相機App,相關濾鏡、功能介面,和支付之類的功能已經在緊鑼密鼓地準備。
可實際上,真正核心的模型部分卻還在訓練當中。
孟繁岐在自己的公司那邊處理完起步初期的一些事務之後,再一次回到了谷歌尚海分部。
一方面是為了將推薦廣告演算法的後續兩板斧揮完,二是為了驗收一下自己的FaceGAN臉部生成模型。
“我這算不算是公器私用?”孟繁岐還真說不清楚。
FaceGAN是基於孟繁岐之前生成式網路的細分方向變體,主要用龐大的人臉影象資料集訓練而成,其目的是為了針對人臉這一單一的元素進行逼真的生成擬合。
該技術目前並不具有非常強力的變現效果,一是因為所支援的畫素還遠遠不夠,二是因為想要達到足夠好的效果,所需要的運算能力相當之大。
後續能夠做到影片換臉,AI作畫,各種圖片的風格切換又或者是圖片的高畫質修復之後,才具備實際商業價值。
因此,該技術將會是孟繁岐在與谷歌大腦簽訂合同之後,第一個貢獻出去的正經視覺技術成果。
雖然該版本不具備很高的商業價值,可其所實現的功能很有象徵意義,可以說已經給人類社會敲響了警鐘。
在當初伊恩遲了孟繁岐一步,提出這個想法的那一天,本吉奧就已經預測到了類似的難題,不遠的將來人們會開始面臨和人工智慧有關的倫理問題。
這些足以以假亂真的人工智慧生成內容究竟如何監管,如何定義,如何限制又如何處理。
人類在這方面還是一片空白。
加州山景城,接到孟繁岐發來的FaceGAN論文,辛頓頓時感到一陣寬慰。
前段時間他也聽說了,孟繁岐在谷歌尚海專營推薦廣告演算法,撈錢去了,這讓他非常痛心。
在他看來,這些撈錢的事情誰都可以去做,可孟繁岐的才能不用來推進人工智慧,尤其是視覺智慧,反而跟著廣告團隊去撈錢。
這簡直就是暴殄天物,瞎胡鬧!根本不像話。
可谷歌畢竟是一家商業公司,廣告又是拳頭營收產品。
辛頓作為僱員,於情於理不方便表達什麼意見,只得作罷。
此刻看到FaceGAN這個工作,得知孟繁岐還是在視覺智慧上非常用心的,頓時老懷大慰。
“孟!好久不見!很高興你在做推薦廣告演算法之餘,沒有忘記你的視覺演算法!”影片電話撥通之後,辛頓喜悅表情溢於言表。
“我剛剛看完了你的論文,你的想法和操作非常巧妙。將生成器輸入的隨機噪聲改為低解析度版本的人臉影象,讓生成器自己做上取樣和微調修復。”
孟繁岐的生成式技術已經公佈有兩個多月的時間了,目前為止卻還沒有特別像樣的跟進工作發表出來。
辛頓看了最為眼前一亮的,還得是GAN作者本人,孟繁岐針對人臉的這一系列操作。
“生成網路變種的潛力還是非常大的,我這次除了在結構和元件上做了一些微調,也對計量損失的函式稍微做了一些修改,增加了對抗損失以鼓勵生成器做出高解析度的人臉去欺騙判別器。”
孟繁岐和辛頓深入交流討論了一番,但都是“生成”這方面的內容。
GAN系列網路的另一個強大的功能,“編輯”,孟繁岐則故意沒有去提及。
這部分將會是相機App這幾個月的首要買點,孟繁岐並不希望節外生枝。
由於時間的關係,他沒有那麼多精力做非常詳盡的對比測試,並做出網站釋出。
細緻的實驗部分,以及[這些人都不存在]這個假臉生成網站,都被委託給了谷歌大腦團隊的其他同事去做。
隱而未發的隱藏層編輯功能,則和模型一起交給了自己的視界公司那邊,如此一來明天就可以有一個最初測試版本了。
“你又做了兩版推薦廣告演算法的更新?”周桓假期回來見到孟繁岐,招呼還沒打完呢,就聽到了一個讓自己下巴掉在地上的訊息。
“上回那個誇張的結果我到現在還沒能消化完呢。”陳灰在旁邊有些酸溜溜地說道,真是人比人會死啊。
自己兩人聖誕連著元旦過完都還沒能從先前的震驚當中緩過神來,這小子倒好,又帶來兩枚重磅炸彈來了。
“這回不會又鬧個雞飛狗跳吧?”周桓還記得上次的更新全部上線之後,雖然營收是增加了,可由於流量懲罰的打擊面太廣,相關的一些客服輔助員工全都被累爆了。
有不少缺德的垃圾場網站成員,裝作無辜的樣子不依不饒,非常折磨。
“這次還好,移動端的最佳化基本上是潤物細無聲的。語言理解方面也只是為了給使用者更好的搜尋體驗,影響不會像上次那麼大。”
谷歌和白度目前的搜尋模式,只是機器無法理解語言含義的臨時產物,過渡產物。
有點像電話發明前的電報,電話發明前曾有很多人覺得“電報已經足夠好了,沒有人會用電話這樣的東西”。
但電話才更接近人們的真實需求。
搜尋引擎也應該逐步擁有智慧,而非只是機械性地檢索使用者輸入的一字一句。
例如,相同的關鍵詞在不同的語句和語境當中含義完全不同,這個現象在中文中尤其嚴重。
早期網際網路使用者在搜尋東西的時候,經常使用幾個關鍵詞加空格的方式,就是因為搜尋引擎無法理解長句。
如果你的句子太長內容太多,搜尋出來的東西反而雜亂異常,或者乾脆搜不出來。
不過現在一切都不一樣了。
有了這個雛形的T方法模型,搜尋引擎不但可以處理長句。
並且還可以非常好的處理那些,一字之差,含義天差地別的情況。
當然了,那種一個字都不需要改變,卻又多種意思的,仍舊比較難辦。
比如[喜歡上一個人]就有至少四種截然不同的含義。