在清大念資訊碩士是什麼感覺(一):碩一上學期

這是我在清大念資應所的第一個學期,覺得有太多事情能夠紀錄,定期追蹤及檢討一下方向,目標一學期一篇,四篇結束這個系列~

目錄:
一、清大資應所介紹
二、關於找實驗室
三、關於修課
四、雜想
五、結論

一、清大資應所介紹

清大資應所,全名資訊系統與應用研究所。當初創所的定位是希望能夠結合資訊工程 + 其他領域(如藝術、音樂、財金等)。而這幾年慢慢跟資工靠攏,指導教授、課程內容幾乎重疊,所以在論壇中都會聽到資應 = 資工的說法。

來源: 清大資應所官網

而實際念了一學期後,具體差別有以下:

  1. 修課規定不同:資應所畢業所需 24 學分只需 9 學分是資訊相關(資工所、資應所、通訊所、資安所的課),其他課程可以跨所自由選擇;而資工則是 16 學分得是資訊相關
  2. 補修課程不同:如果大學非資工科系,需在畢業前自行補修相關課程且不算進畢業學分。資應所需補兩門課:計算機程式設計、資料結構;而資工所需補修三門課:作業系統、計算機結構,以及計算方法設計(演算法)
  3. 英文畢業門檻:資應所畢業門檻是多益 750 分,而資工所沒有英文門檻的畢業規定。

二、關於找實驗室

找實驗室離現在其實幾乎快滿一年了,當初工作到一半回來念書,無非也是想多看一點、多學一點,卻怕太硬擔心最後連畢業都有困難。(Dcard 上好多鬼故事啊~~)

放榜當下也丟了約莫十位老師左右,一周內跟老師面談、敲實驗室等。最後在陳宜欣老師的 Idea Lab 落腳。

過程還是因為沒有太多資工的基礎比較緊張。最後決定老師的 Lab 主要有幾個原因,一來是老師都把學生從零開始教,那些需要會的知識老師分別用三門課(高等資料庫、資料探勘、研究方法與報告技巧)一一傳授。二來是碩一上不用報 Paper,所以會有更多時間可以揣摩怎麼理解跟消化 Paper 的資訊。三來是實驗室學長姐人很好,很喜歡這裡的氣氛。最後宜欣老師是外籍生學院(IMPISA)的負責人,實驗室一半是外國人,所以也想在全外文的環境度過碩班生活。

一言以蔽之就是:

可以在友善的環境站穩腳步,尋找方向

缺點大概就是實驗室沒有基本薪水,老師也沒有保證兩年畢業。所以有經濟壓力(如我),或是真的很想準時畢業,自己就要找機會或積極些就是了。

我們 Lab 真的好多人 OAO

三、關於修課

這學期修了三門課,分別兩門是老師的高等資料庫、資料探勘,以及一堂自然語言處理實作。老實說,還真是不輕鬆。

這學期修的課,專案管理抵免三學分讚

高等資料庫有每周的課前小考、一份 Lab 作業、報兩次 Paper、一個期末專案跟一次期末考。老師前兩周把基礎資料庫很快地複習完一輪,當時我想說基礎的部分要自己補,幾乎天天都在看吳尚鴻老師的資料庫系統概論,後來發現方向差多了。

宜欣老師的高等資料庫主要是想涵蓋基本資料庫以外的內容,譬如多媒體、空間資料、圖資料庫等;而吳尚鴻老師的課主要是教怎麼刻一個資料庫。當時看 OCW 確實對於整個資料庫有更深的理解。

老師這門課重廣度,線上課重深度,後續因為要寫其他作業要補其他更大的坑而沒有把整個課程都看完。

期末報告超凱瑞組員們

第二門課是資料探勘,也是每周的課前小考、兩份 Lab 作業、報一次 Paper、一個競賽、一個期末考。教學內容教了 Classification、Clustering、Text Mining、Association Rule 等等。中間又因為有修自然語言處理實作,所以很多細節的概念都有被補充到。(甚至兩門課的作業還有重疊的地方。)

第三門課是自然語言處理實作,每周作業加一份期末專案,無考試。這堂課基本就是靠作業學習,我個人覺得跟資料探勘相輔相成:資料探勘教概念,自然語言處理實作寫程式。還記得這門課第三個作業就是要 Fine-Tune Bert 然後做 Testing 跟 Evaluation(總之就是一個完整深度學習訓練模型的作業)。但我根本連基礎的機器學習概念都沒有,所以把看到一半的資料庫概論丟到一旁,開始自學李宏毅老師的機器學習

這學期三門課的修課體驗還蠻不錯的,該學的都有學到。

四、雜想

小小反思一下這學期在腦中閃過的事情們。

覺得做得好的部分大概是

  1. 學了很多機器學習/深度學習的概念

還記得期初第一次進 meeting 學長報 Paper 完全聽不懂,什麼 Transformer、Attention 完全就是鴨子聽雷。至少現在能在概念上做討論了,而要能實際復現論文 Code 是接下來要努力的方向了。

2. 把英文畢業門檻處理完了
當初大學想說要考免修英文,必修的英文都沒上,結果大四下才在手忙腳亂準備托福。像上面說的資應有英文畢業門檻,想說多益 750 應該裸考就可以過了,就在十二月初快要開始忙起來(a.k.a.拖延症發作)之前去考試了。

總分還行,但閱讀出事了QQ

3. 作業繳交順利、團隊合作持續輸出

大概就是沒有躺分得太誇張,都有持續做事。而且作業進度也全部都在截止日期前繳出去;原本以為高等資料庫期末專案要連續熬夜,結果截止日期前一晚午夜前就收工,甚至自然語言處理的期末專案還早了三天交。

倒是在這過程中有蠻多要檢討的部分,其實期初有規劃了蠻大一張學習地圖(網路上很多類似的 Roadmap),大概率是想複製考研究所時做的事情。

期初原先的想法 | 來源: Bilibili 影片

結果後來被作業追著跑,能在截止日期前完成作業就很棒了。
事後回來確實是大部分議題都有在課堂涵蓋到,但很多都是只知道概念,實際 code 碰得不多(很偏重一直使用 Bert)。接下來可能要很有意識地把這些內容都變成工具箱(程式)的形式存放起來。

小小檢討覺得是自己 PDCA 亂掉之後的修復太慢,以及把課綱內容跟自學內容要好好的合併思考。

二來是角色上的選擇,專案類型的作業分量都不輕,這學期幾乎都是切成資料處理、模型採用與校正、網頁前端、網頁後端、資料庫。就自己的觀察會發現每個人都會固定在其中一個角色,像是同學 A 在多堂課都是負責做資料處理跟模型的部分。事後覺得校園中難能可貴的是嘗試的機會,應該要盡可能跨角色學習的,但也能明白截止日期這麼緊當然是做最擅長的部份就是。

三來是對於「Coding」想法的轉變。

之前很多經驗都是從寫網頁來的,寫好後端 API、串資料庫、送到前端顯示出來都是所見及所得。但來到了機器學習的實驗室,很多時候不太知道模型為什麼給出特定結果,就變得很勞力密集的調參數大師。

而且即便寫了一整個學期 Python 的作業,也沒有那種「變厲害」的感覺,我在猜或許是沒有衡量標準,也或許是做得東西都小小的,之後也要針對這部分進行加強。

最後是關於研究,這學期除了課堂上要求的 Paper 之外幾乎沒看幾篇,往後也要加強這部分的量。

五、結論

其實整體來說這學期蠻充實的。

幾乎每個同學身上都有各自擅長的技能,每次看到別人的成果都會被驚艷,重點是彼此之間都很樂意分享。雖然像上面說得沒有那種鑽很深(變強)的感覺,但在廣度上著實有很好的啟發!美中不足可能就是生活全部都被課業占滿了,沒有太多其他時間。

不過現在也是希望之後研究可以順利,早早畢業就好了。

--

--

楊智堯 ( Kevin Yang )

從電商及科技業務跳船的資訊研究生|期許在不同領域激起的浪花點綴成最美的一副人生圖。嘗試讓文字承載一些能量, 讓這世界或自己都因分享而更加勇敢。LinkedIn: https://www.linkedin.com/in/yangchihyao/