第41章 未來模型的大與小
章節報錯
“孟同學就完全不考慮加入白度嗎?”李彥弘表情波動了一剎那,但幾乎微不可查,“我想我應該是現在全華國最重視AI技術的CEO,我們白度也是全華國目前投入最大的公司。”
“你已經有了心儀的去處?還是說,你對條件有很高的要求?具體的情況我們可以再談嘛,直接跳過這個環節,是否太草率了一點。”李彥弘此時求才的心還是很誠的。
“我倒是沒有任何懷疑李總誠意或者財力的意思,我聽阿里克斯說李總去年出價的力度絕對是冠絕全場的。”這其實是虛張聲勢了,阿里克斯自然不會對外人說這種細節,不過在李彥弘聽來,這麼一個細節絕對大大增加了話語的可信度。
“雖然沒有提到比較具體的細節,但他說如果不是辛頓老師的背傷,其實他們很希望加入白度。”這個其實是後來辛頓自己訪談中透露的,孟繁岐使用了兩個細節,顯得自己已經和辛頓團隊非常熟悉,爭奪到了一定的主動權。
“你已經和谷歌大腦的人聯絡上了?”李彥弘想起去年競價的事情,還是一肚子氣,這件事真是晦氣。
原本白度最早提出的千萬美金已經幾乎打動辛頓了,教了一輩子書的辛頓哪裡見過這麼多錢,當即口頭表示了意向。
結果在正式簽署敲定之前,他那兩個學生攔住了自己的導師,出了個主意,三人成立了一家空殼公司,讓科技巨頭來競價,以收購的方式僱傭。
這一來一去,時間一耽誤,就給了谷歌操作的時間和空間。
最後的競價上,李彥弘明明沒有輸,只是對方三人心向谷歌。見谷歌出價已經高過自己的心理價位,就直接敲定了結果。
這麼辦事情,還競價什麼,直接跟谷歌去談唄?
雖然表面上白度的表現在那次事件中一直很體面,但李彥弘心裡還是有些不爽的。
當初谷歌拿下辛頓團隊是近水樓臺先得月,如今燕京出了一個不得了的本科生,學校還就在他白度的總部旁邊。
李彥弘覺得這是時來運轉,天道有輪迴。
加拿大離你美國近,燕京離你美國還近嗎?
因此李彥弘今天驅車前來會面,心情還是不錯的。
卻沒有想到,還沒聊幾句,竟然情況和走勢又要和去年一樣了。
“谷歌大腦確實已經給我發了意向書,條件相當優厚。”孟繁岐坦然相告,“實不相瞞,我基本上已經決意加入,因此先前說跳過招聘的部分,也是為了節約李總的時間。”
“孟同學,不管谷歌究竟給你開出什麼條件,你都可以拿他們的合同直接來白度就職。”李彥弘回想去年的情況,也不來回競價了,直接就給了一個封頂的條件。
“不論你能和谷歌談到什麼價位,我都多出百分之20。”李彥弘表情沉重,一字一句道。
去年為了辛頓團隊4000多萬美金愣是沒能拿下,今年這個本科生,谷歌怎麼也不可能出更高的價格。
李彥弘雖然嘴上說不論多少,其實還是有一個心理的底線,只要不超過他去年的開價,他都可以接受。
孟繁岐聽了心裡暗笑,若是真有魄力,就別管別人出價多少,直接報出個價位來才叫自信。
還得拿別的offer過來才能要價,怎麼聽都感覺有點缺乏定價能力的味道。
值得多少,自己竟然沒數嗎?還需要看別人的出價。
不過孟繁岐既然不打算加入,便也沒有多想這件事。
“李總,錢的事情當然很重要,但也不能說是全部。我和谷歌也沒有完全談完價格,目前他們給我開出的價格大概是千來萬美金。”
“我還有許多其他在意的因素,比如說學業,您可能也知道我休學了,但一直休著也不是個辦法,我總得找個斯坦福這樣的大學讀讀書吧。”
“當然了,這些其實都是我個人的事情,算是小事。更重要的事情是,華國目前的情況和氛圍,是否真的適合最前沿的AI技術發展。”
孟繁岐雖有重生的優勢,但有一位長者說得好。
人吶,就不知道,自己不可以預料。
一個人的命運啊,當然要靠自我奮鬥,但是也要考慮到歷史的程序。
“華國的氛圍是否適合最前沿的AI技術發展?此話怎講?”李彥弘如今也是走在開拓道路上,這件事情自然是他非常關心的事情。
“李總是這個時候唯一願意親自出馬來找我的人,我便也掏心掏肺跟您說幾句心裡話。”孟繁岐回顧了一下AI整體的發展脈絡,如此說道,“AlexNet和我的DreamNet現在徹底開啟了深度學習的大門,可以預見,在短時期內,各個方向和領域的AI模型效能將會有一個巨大的突破。”
“不錯,如今正是比拼時速的時候,一步快,則步步快。”李彥弘點頭稱是,肯定了這個前提。
“技術上的指標是一回事,從總體的趨勢上來看,如果想要真的把AI的技術落地,讓人們都可以使用,無非就是把模型做大或者做小。”
“做大或者做小...?你是指終端還是雲端兩種發展的方向?”李彥弘很快跟上了孟繁岐的思路。
“沒錯,學術研究的時候起初不會過多關注模型的引數量大小,和它的計算損耗。但實際投入使用的時候,則會必然分出極致最佳化縮減的小模型,和強調效能開放介面給人使用的雲端大模型。”
“在早期的時候,可能會反覆魔改和調整模型的結構和設計,讓模型儘可能快,儘可能好。但久而久之,隨著資料的積累,篩選,更高質量的標註,以及最重要的,更大的模型引數量。”
“規模極其龐大的模型,會在某一個臨界點徹底產生質變,讓絕大部分小模型失去價值。尤其是以語言語音類,和影象生成類模型。它們的使用體驗是無法向下的。”
孟繁岐回想起重生前,李總面對ChatGPT(3.5版本)和GPT-4,強行頂住壓力提早推出的大模型文心一言,不得不在心中嘆了口氣。
其實文心一言並不是一無是處,只是這種與人互動的智慧模型,如果相形見絀,就會顯得特別不堪一擊。