〇 溝上大翔
・ 負責主導研究與管理各項任務。
・ 對樂天飯店評論資料進行網路爬蟲(Scraping)。
・ 執行標註作業。
・ 建立資料集。
・ 團隊管理與任務分配
・ 為制定標註規則,建立測試用資料集。
・ 使用 Python構建對話式標註工具,整備標註作業的操作環境。
・ 比較標註結果並分析一致率,進一步整理出需改善之處。
・ 制定標註作業的詳細規則。
・ 資料品質控管與數據統整。
・ 用於報告書的簡報製作。
・ 執行模型比較實驗。
〇 高田朋希
・ 負責整體掌握、任務管理及工作分配。
・ 調整經由網路爬蟲取得的資料。
・ 建立並調整資料集。
・ 執行標註作業。
・ 撰寫報告書。
・ 制定標註作業的詳細規則
〇 甲斐陸都
・率先進行標註作業,並撰寫已完成標註的程式碼。
・提出並確定用於資料的標籤(Label),確立目前的標註方針。
・執行實際的標註作業。
・撰寫報告書。
・用於報告書的簡報製作。
〇 佐佐木華
○ 調整經由網路爬蟲取得的資料。
・執行標註作業。
・制定標註作業的詳細規則。
・撰寫報告書。
・用於報告書的海報製作。
・用於報告書的簡報製作。
・制定標註作業的詳細規則。
〇 小笠原伶晏
・用於報告書的網頁製作
・調整經由網路爬蟲取得的資料。
・執行標註作業。
・撰寫報告書。
〇 溝上大翔
在這次的畢業專題中,我擔任團隊協調者與專題推動者,從研究啟動、資料集建構
到模型實驗,深度參與了所有階段。我對自然語言處理領域一直抱有濃厚興趣,而禹
良治教授從研究方法到相關論文,都給予我細心而精準的指導,在此由衷表示感謝。
在團隊合作過程中,難免遇到意料之外的困難或意見分歧。透過這個專題,我培養
了與成員協作、靈活應對並解決問題的能力。
這次研究讓我在技術和團隊協作能力上都獲得了顯著成長。這不僅是大學四年學習
的總結,更為我未來的研究道路奠定了堅實基礎。我將以此為基礎,在研究所階段繼
續投入評論相關的自然語言處理研究。
〇 高田朋希
這次的畢業研究,是一項既充滿樂趣,同時也極具挑戰性的研究。
確定本研究的專題主題時,我們團隊成員首先探討了「我們最感興趣的領域」,
最終,基於成員的興趣,我們定下了「透過語言分析來建構 AI輔助用的數據集,並
驗證其有效性」這一目標。
隨著研究的深入,我們體認到主題的奧妙之處,同時也因為是多人的團隊,我們
面臨了極其困難的挑戰,例如整體任務的管理、以及發生延遲時如何擬定挽回計劃
等。尤其在考量所有成員的個別狀況的同時,要維持研究進度非常困難,因此,我
們頻繁地向指導教授請教,不斷地摸索解決方案。
然而,多虧了大家的堅持不懈與努力,雖然研究成果的評估上仍有許多改善空
間,但我們最終還是取得了巨大的成果——實際完成了數據集的建立,並成功進行
了AI模型的實作與運行。
透過這次的經驗,我的專業知識獲得了增長,這是理所當然的;除此之外,我更
培養了在多數人團隊中的協調性,以及當問題發生時,能邏輯性地找出解決方案的
實踐能力。我強烈地感覺到,這次畢業研究所獲得的寶貴經驗與成長,必將在未來
的活動中發揮作用。
〇 甲斐陸都
這次的研究過程,是一段既艱辛又充滿成就感的旅程。尤其是在標註作業中,最
讓我感到挑戰的,是「一致率始終難以提升」這件事。明明大家都依照規則進行標
註,卻因為日文表達的模糊性、語感上的差異、長句或委婉語的判斷不同,常常導
致兩個人標注的結果差異很大。
於是我們不斷回到原點、檢討標準──哪些詞應該排除、哪些形式應該統一,甚
至為了小小的語尾辭修正規則。每次以為「應該搞定了」,卻又在檢查中發現新的
不一致,只能再重來。有時候是一整份檔案重新命名、格式調整,有時候是一百筆
資料從頭標一次。深感這份作業真的不是只靠耐心就能解決,而是需要每一位成員
共同磨合、持續改善。
但是正因為有這樣不斷重做、反覆修正的過程,我們團隊在七個人一起工作、互
相討論、互相支持的過程中逐漸形成默契。大家一起分享心得、解決困難,努力讓
這個專案不僅完成,更可以說是「共同堆疊出來的成果」。
回顧整個過程,再怎麼辛苦,都換來一份無可取代的成就感。從一開始什麼都沒
有,到現在能確實呈現出一份針對日文情感分析的高品質資料集,我真心覺得這是
一段非常值得珍惜的經驗。
〇 佐佐木華
這次的畢業研究,從期中發表到最終發表,推動多項作業的過程,說實話,真的
很辛苦。然而,多虧了指導教授們和團隊成員的協助,以及為了解決作業困難所做
的各種努力,我們團隊才能全員一起,順利完成這項研究。
在本研究中,能夠以「在台灣的大學就讀的日本學生」這個獨特的視角,去發現
並著手解決「日本數據集不足」這個挑戰,我感到非常驕傲。
在製作最終報告書、海報、簡報(投影片)和網頁等資料時,我們四年級的全體成
員也都是團結一心,共同努力到最後才得以完成。
這次的畢業研究不僅是專業知識的學習,在「如何作為團隊的一員參與其中,並
進行順暢的溝通」這種更具實踐性的層面上,我也認為自己獲益良多,成長許多。
〇 小笠原伶晏
本研究歷時兩個學期,由 5 名四年級與 2 名三年級學生組成的 7 人團隊共同推
動。我本人是在暑假開始前的 6 月左右加入團隊,因此在初期階段,因爲年級差異
與經驗落差,面臨了「知識量不同」、「作業節奏不一致」、「對標註規則的理解
不一致」等協作層面的挑戰。特別是在 ABSA 的人工標註過程中,Aspect(面向
詞)、Opinion(評價詞)、Category(分類)的判斷標準與邊界,由於每位成員的
解讀不同,若缺乏共通認知便容易造成結果的嚴重分歧。因此,在教授的指導下,
我們多次展開討論,並於暑假期間每週固定召開會議,以統一標準並建立一致的作
業體系。最終,全體成員在保有自身作業風格的同時,也能彼此調整步伐,順利協
力完成大規模的標註任務,這讓我深刻體會到大型專案中「協作」與「溝通」的關
鍵性。
在技術面方面,透過這次專題,我深切感受到大量語料的人工標註是一項耗時且
極度需要專注與細緻判斷的工作。尤其是日文評論常具有主語省略、委婉語氣、多25
層次情感、強烈的語境依賴等特性,使得情感判斷比英文更加困難。例如,「もう
少し広いとよかった(如果能再大一點就好了)」表面上語氣溫和、甚至接近中
立,但實際上隱含負向情緒;又如「美味しくいただきました(非常美味地享用
了)」這種帶有敬語成分的表述是否應視為 Opinion,也需制定一致的標準。面對
這些語言特性,我們透過反覆的標註比較與錯誤分析,逐步掌握日文評論中情感的
微妙波動,並重新認識到「情緒並非正負二分,而是具有連續強度」這一重要概
念。這樣的理解在後續進行 VA(Valence/Arousal) 標註時發揮了極大作用,使我
能更精準地判斷語氣與情感強度。
展望未來,若要進行類似的大型標註專案,應在初期階段投入更多時間於「規則
制定」與「標註者訓練」,以便更早形成共同理解。此外,若能在部分情境下導入
半自動或輔助式標註工具,將有助於減輕人工作業負擔,同時維持資料品質。我期
望本次專題累積的經驗能成為後續研究與實務工作的參考,並促進未來日本語 ABSA
以及情感分析領域的發展。
透過長時間參與本專題的標註作業,我深刻體會到自然語言處理(NLP)領域中資
料品質的重要性。然而,同時我也強烈感受到自己希望能有更多機會直接參與資料
整備之外的技術性工作,例如系統開發、模型建構與調整等。特別是模型設計策
略、特徵處理、提示詞(prompt)最佳化、錯誤分析等實作層面的工夫,往往直接
影響模型性能,這些都是我未來希望能更深入參與的領域。接下來,我期望能挑戰
更多技術範疇,例如分析流程(pipeline)構築、模型訓練與推論、提示詞設計、
結果可視化等,並以同時理解「資料」與「系統」兩個面向的開發者為目標持續成
長。