第六章 組會
章節報錯
“哎呀,這麼晚了啊!抱歉抱歉,學長,我身邊沒什麼人跟我一起聊懸疑小說,今天遇到同好了就忍不住聊太多了。耽誤你看球了,真的很抱歉。”
“沒事啊,錄影什麼時候都能看,同好難求,我聊的也很開心,反倒要謝謝你。”
“哈哈哈[握手]。那今天就聊到這吧,也不早了,不打擾學長啦。”
“沒打擾,沒打擾。那晚安。”
“晚安[月亮]”
凌志放下手機,心滿意足。不過旋即想起來對峰哥有點愧疚,於是登入電腦微信,把陳峰發給他的資料下載下來,看看有多少量。
這時候,陳峰和高峰剛好聯袂回到宿舍。
“凌子,我給你發的資料看到了沒?你覺得好不好篩?”
所謂篩資料,實際上就是將特徵不明顯的圖片刪掉。比如某些眼球的病變區域小點密佈,那就是明顯特徵。有些似有非有,就不是明顯特徵,不利於模型的訓練過程,需要刪掉。
“額,我還在看。對了,你一下發給我2000張圖,這也太難頂了吧。”
凌志試圖轉移話題,不讓陳峰發現自己其實還沒篩。事實上凌志知道陳峰已經很辛苦了,他手上有上萬張圖片,而只給了自己2000張,他自己的工作量才是最重的。
陳峰也沒有察覺到什麼,自顧自地回答說:
“哦哦,沒事沒事兒,你慢慢篩,不急。篩多少算多少,到時候把篩過的給我就行。”
“那行,我知道了。”
凌志鬆了口氣,不過也暗自下定決心一定幫陳峰篩完。
在見識過陳峰處理資料集之前,凌志一直都覺得這是個費力不討好的活兒,應該很消耗精力。而事實上,在某一次喊他一起吃飯時。
“我去,你這刪資料刪得這麼麻溜的嘛。”
只見陳峰用滑鼠連續選中了一行圖片,沒有絲毫猶豫地刪除了。
“這太明顯了啊,我看了這麼多圖,感覺視野不是很清晰的一律幹掉,省得折磨自己。”
倒也不是說他這麼幹不好,但凌志知道如果是自己的話,肯定會一張圖一張圖地挨個看過去。某些圖不確定要不要刪,可能還要來回看好多遍才能下決定。不過話雖這麼說,資料基數的龐大決定了即便是他這麼去幹,也不免要消耗大量的時間和精力。但即便如此,凌志並不打算改變自己篩資料的風格。
凌志先去洗了個澡,洗完之後才發現林奇松也回來了,四人一天的科研生活都暫時告一段落。
“高峰,你上次陪老吳給本科生上課上得怎麼樣啊,後來也沒聽你說過。”
林奇松問道。
“哦哦,那個啊,別提了,上課那天簡直是車禍現場你知道麼。”
高峰站了起來,對著林奇松說道。我跟陳峰也挺感興趣,坐在自己的座位上側耳傾聽著。
“那天上課他自己都沒準備好,對著PPT說的話我都聽不大懂,有時候都不知道說啥。本科生預計來聽他講課的不少,大多都是想保研的學生。結果那天也不知道為啥有一小半沒來,中間還走了兩個,當時看得我直想笑。”
“哇!那老吳豈不是全程很尷尬?”
“那倒沒有,他講他的,底下學生聽不聽他也不管。”
“唉,你說我倆當時為啥就選了他當導師?”
“我也不知道啊,誰叫某人當時跟我極力宣傳老吳的豐功偉績的。”
“我當時也不知道啊,也沒問往屆的學長姐,看他官網介紹還行,就推薦給你了。”
“唉,我們也只能認命了,本科生不像我們,我們換導師成本很大,本科生就很隨意,說不來就不來了。”
凌志也有同感,導師選沒選對,對於自己的研究生生涯至關重要。而對於自己的導師王海波,凌志還是很滿意的。老王並不是網上一些選導師帖子裡提到的那種“放羊”導師,所謂“放羊”就是指不管學生,讓其自生自滅,這樣的導師顯然是不負責的。而如果硬是給老王管理學生的模式定個性的話,凌志覺得“半放養”是比較合適的。老王對於你自身的研究想法,實驗細節不會過多幹涉,但他會從大的方面把握你研究思路的準確性,以及研究進度的快慢,顯然是一位負責任的導師。總結來說就是平時不咋管你,但你自己要讓他對你研究啥心裡有數。
凌志覺得自己顯然是幸運的,在過去一年的相處中,凌志覺得王導和藹可親,雖然免不了有時候會有長輩的架子,但大多數時候還是平易近人的。想想網上流傳的那些碩博們被某些嚴苛的、不負責任的導師逼上畢不了業的絕路,有些甚至會輕生,凌志覺得自己很幸運,儘管當初自己選王導的時候也是兩眼一抹黑。
“所以你看麼,跟老吳坐在一間小小的實驗室壓力有多大。特別是坐在他旁邊的杜曜,整天愁眉苦臉。”
高峰說道。
林奇松無奈搖了搖頭,轉過頭開啟電腦,開始看自己的紀錄片。
一夜無話。
第二天一早,是凌志他們實驗室每週一度的組會。
凌志早早來到實驗室,把旁邊會議室的投影儀佈置好,然後把自己做的PPT拷進去,今天他要分享論文。
不一會兒,師門同學們陸陸續續都來到了實驗室,緊接著,導師王海波也到了。
凌志的導師王海波40出頭,今年剛剛評上了教授,正是志得意滿的時候。聽說家裡的小兒子也剛剛出生,正是雙喜臨門之時。雖然在計算機領域深耕多年,但並沒有拼過頭,頭頂的平頭髮型還是鬱鬱蔥蔥。行走在路上時總是腳步帶風,看見誰都一副笑眯眯的樣子。就是年紀逐漸上來了,頸椎經常性地不舒服,凌志想什麼時候有機會在教師節送王導一個按摩儀試試看,也算報答王導的教育之恩。
“今天有沒有人分享的?”
凌志沒有猶豫,說道:
“老師,我來吧。”
凌志開啟自己的PPT,毫不怯場地講道:
“今天給大家分享一下我最近階段性的實驗結果以及論文。”
……
“這是我的資料預處理過程,我大致分為了5個步驟,……”
“這是我對句子對匹配的實驗結果,兩個句子屬於同一人所釋出即為正樣本,不是同一人即為負樣本。……”
“你先等下,你分類所用的特徵都有哪些?”
老王問道。
“哦哦,我一會兒會詳細說,我現在僅僅是先把結果丟擲來。……”
“這個正樣本和負樣本的叫法合不合理嘞?這個實驗結果你們覺得怎麼樣?”
老王跟大家討論了一陣,然後讓凌志繼續。
“我使用的特徵是一個14個維度的向量,包括人工提取的特徵和神經網路提取的特徵。……”
凌志講PPT沿用了老王以前對學生們的教導——多用圖表,少用文字,凌志深以為然。事實上PPT本來就是用來突出重點的,如果往上面堆砌太多文字的話,講者容易對著PPT念,聽者也會覺得乏味,不會自己思考。而用圖片和少量文字突出重點,就比較容易讓聽眾們接受。
正如接下來凌志分享的論文,用一張圖說明了一句話中每個詞之間的遠近關係。
“比如現在有兩句話,‘他對媒體發表言論’以及‘他出席了新聞釋出會’。雖然這兩句話意思很接近,但我們如何用程式來進行打分判斷呢?我們應當將第一句話中的‘他’所對應的詞向量跟第二句話中的每個詞進行對比,找出意義最接近的那個。後面以此類推,‘媒體’對應‘新聞釋出會’,‘發表’對應‘出席’。就這樣透過詞向量之間相似度的計算,進而合併為兩個句子之間的相似度。”
凌志展示出兩個句子之間的相似度:0.912,大家很容易地理解了兩個句子之間的相似度是如何計算出的,因為圖上每個詞之間的距離遠近都非常清晰。
之後凌志開始解釋一些技術細節,包括每個詞的詞向量如何計算出來等等。
作為主講人,凌志非常清楚講解時需要詳略得當,所以不會過多闡述細節,只用圖表解釋了文章的核心思想。所以講好PPT確實不容易,細節不能太過深入,但也不能一帶而過,把握好一個度是很重要的。
隨著凌志分享完,說聲謝謝後,會議室裡大家不自覺地響起了掌聲。凌志有時候會注意到,一般在對大眾講話時,結尾加一句“謝謝”,會讓觀眾們不由自主地鼓掌。然而大家給他鼓掌並不是單純捧他場,而是確實覺得凌志講得好。
“不錯,實驗過程和細節講的很清楚,問題也分析的到位,論文也很值得借鑑。行,下一個,還有誰要講?”
凌志長舒一口氣,坐到其他位置上。有一個剛考上研究生,提前進來實驗室的師弟站了起來,開啟了自己的PPT。
“額,各位師兄師姐好,今天我想來講一篇論文,題目叫……”
很明顯有點緊張,不過凌志一點也不在意,當初自己也是這麼過來的嘛。
“這篇論文的演算法是這樣的,……”
“你等會兒,都跟你們講過了,不要把原論文列出的演算法英文虛擬碼直接貼到PPT裡面,你們這樣做誰會去看啊,那麼複雜。你應該像凌志那樣畫圖表現出來,這樣別人看起來才覺得簡單易懂,知道了嗎?不要讓我一再強調。”
“哦哦,抱歉老師,我以後一定注意。”
“行,那你繼續。”
於是師弟戰戰兢兢地講完了自己的論文,也不知道大家聽沒聽懂,最怕空氣突然安靜。
凌志沒覺得師弟有多差,差的話也就不會坐在那裡了,只不過第一次講解PPT,可能考慮不到觀眾們的感受。雖然自己也沒聽懂多少,但也不是很在意,反正也不是自己的研究方向。真要是跟自己密切相關,那就私下裡重讀論文,自己去理解。
想起剛進實驗室時候的自己,那時候參加組會,聽師兄師姐們講解PPT聽得暈暈乎乎的,組會之後狂查資料彌補概念。現在想想,倒不是看不起當初的自己,事實上了解自己不瞭解的概念也是很重要的。只不過自己當初的心態太過著急了,完全可以慢慢來。
不知不覺組會已經來到11點,老王又說了幾句場面話,上午的組會就宣告結束。