第91章 資料基建
章節報錯
會程結束後,一行人滯留西尼又遊玩了幾天,這段時間是難得的放鬆。
可惜歡樂的時光總是短暫的,除了孟繁岐和唐璜兩位休了學的人,其他的四位仍舊有學業在讀。
這次正常上課的時間,能和孟繁岐一同過來,已經是相當不容易了。
再拖延了幾天,終究還得趕回學校,否則掛上三四科也不是沒有可能。
孟繁岐有心提攜身邊人一把,但也不至於一路護送,讓人本科也別唸完,這個不現實。
這次帶他們過來,主要是讓他們見識瞭解一下AI界現在的情況和潛力。
準備繼續留在國內的劉旭,麥芒和秦慧三人,孟繁岐自然是有著自己的安排和打算的。
他希望幾人協助去做的最重要的事情,就是在國內建立一個優質中文資料庫。
這個東西是未來中文ChatGPT能夠取得成功最最關鍵的因素。
孟繁岐有信心憑藉自己的能力把西方AI界的資源盡數收入囊中,但他卻解決不了中文優質資料不足的這個根本難題。
這也是重生前,困擾華國諸多科技公司的最大原因,優質的中文資料遠少於英文。
而優質資料就是AI時代的石油。
華國網際網路起步晚,資料積累遜色一些是一方面,一個個都忙著在賺快錢則是另一方面。
這種白白投錢進去,收集資料,標註資料的髒活累活誰肯做呢?
為了中文和華國AI在四五年後的ChatGPT時代能夠跟上節奏,這件事就只能由孟繁岐提前佈局了。
這可是個黑洞一般吞噬金錢的大工程,一位員工的使用成本,一年少說就得十萬塊,招百來個人,一年過去就是數千萬。
收穫得只有一堆堆無情的資料,這件事情短期內不會有任何的營收。
四五年的長線,孟繁岐少說得砸三五個億進去,如果想要資料的質量和規模上精益求精,十幾個億進去也不是沒可能。
“還好跟谷歌簽了分成合約,否則真不知道哪裡去弄這些錢。”
孟繁岐感到了些許的壓力,仔細計算了幾筆賬之後,他意識到自己想做的事情成本似乎遠高於自己的想象。
給谷歌的推薦廣告演算法更新得儘快提上日程了。
“劉旭,麥芒,慧慧,情況大概就是這個樣子。三四個月後,我會跟你們具體再聯絡,你們先負責幫我在國內弄好資料收集這件事情。”
機場,孟繁岐和唐璜要去一趟尚海,其餘人則都是回燕京。
此次一別,以後見面的機會不會太多,因此孟繁岐交代了一下後面的大概計劃,“這個資料收集的任務,你們不需要考慮營收的事情,不要有壓力。這個公司的部門建設出來就不為了賺一分錢,營收的部分其他部門會去做,所有的支出我會負擔,工資肯定不會少了你們的。”
讓這幾位同學先幫助自己打理一下資料的收集事宜,孟繁岐簽了谷歌的大單,白度這裡的分成就不準備再往美國去轉了。
就留在燕京,投進去把中文資料的基建給做做好,不要做個繪圖還得轉成英文,鬧出什麼松鼠鱖魚,胸有成竹之類的笑話。
“先做好資料的基建,等以後有了其他機會,我再跟你們細聊。”
這個AI公司肯定會和白度有些合作,孟繁岐準備藉助自己的關係,從白度內部多搞點資料出來。
等他們幾個有一些經驗之後,跟隨技術部門的人和白度之間來往鍛鍊一下,明年有其他和國內大廠技術合作的機會和任務再交給他們稍微承擔一部分也不遲。
當然技術方面肯定會由孟繁岐全權負責。
主要還是這筆資料由熟悉的人去負責打理會比較放心。
“那...有機會來斯坦福交流唄。”韓辭前幾天並沒有給李飛飛一個確定的答覆,孟繁岐也不清楚她是怎麼想的。
按理說,燕京大學和鄂院士在國內的咖位夠大了,但韓辭很清楚,在應數的圈子裡做AI和統計,是絕對沒有跟著AI新時代的領軍人物孟繁岐的腳步,做AI理論和AI解釋性划算的。
光是前兩天展示的那個排場,沒有孟繁岐的實際效能突破在先,這點數理證明絕對是無人問津,門可羅雀的。
不過她此時思緒很亂,完全還沒有想明白這件事。
孟繁岐也沒有多說什麼,他相信也尊重韓辭自己的想法。
不多時,他與唐璜先登上了回國的航班。
這趟過來,除了孟繁岐與韓辭在AI學界聲名大噪之外,其餘四人當中收穫最大是唐璜。剩下三人只是逛逛,見了見世面。
作為當時孟繁岐賽時實驗裝置的贊助者,也作為前世引導孟繁岐走上AI道路的人,雖然混了一點,唐璜卻還是有資格將名字掛在參賽隊伍中。
而這也同樣為他贏得了入學斯坦福的門票,即便沒有全獎和直博的好待遇,斯坦福這所學校的檔次也遠勝過他原本計劃申請的那些學校。
有一個知根知底的朋友在身邊,別的不說,以後不少不大方便的事情都可以放心地交給他去辦。
況且唐璜在不少方面還是有些特長的,或者說也不算是特長。
比如熟悉二次元在任何時候似乎都說不上是什麼優勢。
除了這次專程前去尚海收割米忽悠一波股份之外,孟繁岐實在也想不出唐璜的這個屬性還有什麼用了。
雖然米忽悠此時仍舊沒有任何成功的跡象,可實際上這家只有幾個人的工作室已經成立了接近三年的時間了。
在11年初的時候,尚海交大的一間宿舍內,幾個還在讀的學生成立了米忽悠工作室。
誰也沒能想到,這家以二次元為主的遊戲公司後來能夠憑藉兩三款遊戲直接衝到2000億元的估值。
在新世紀所有起飛的網際網路類公司當中,米忽悠的獨樹一幟還不僅僅在於此。
最傳奇的部分在於,這家公司從始至終,都只接受過一次融資。
大家都經常看到類似這樣的新聞,某公司獲得B輪融資,估值上百億。
之所以融資,其實就是做事情缺錢。就如現在三位每個月領4000元工資的米忽悠創始人一樣。
天使輪、A輪、B輪、C輪、D輪融資,指得其實就是指融資的順序。
越到後面,公司的產品,盈利方式,規模等方面都越成熟,風險越小。想要取得同等股份,需要投入的資金也就越大。
尋常公司想要做大上市,融個四五輪都是非常尋常的事情,融資的規模幾個億都不算大。
而米忽悠從11年底到12年,輾轉了一年多的時間,卻一筆投資都沒有拉到。
由於三位創始人均為尚海交大科班成員,其實有許多投資人曾經對米忽悠起過興趣。
只可惜,二次元文化別說在當時,時至今日也難以算得上是市場主流。
尤其三位創始人濃度過高,成分很成問題。