附錄

附錄A. 實習(或專題)工作內容

〇 溝上大翔

・ 負責主導研究與管理各項任務。
・ 對樂天飯店評論資料進行網路爬蟲(Scraping)。
・ 執行標註作業。
・ 建立資料集。
・ 團隊管理與任務分配
・ 為制定標註規則,建立測試用資料集。
・ 使用 Python構建對話式標註工具,整備標註作業的操作環境。
・ 比較標註結果並分析一致率,進一步整理出需改善之處。
・ 制定標註作業的詳細規則。
・ 資料品質控管與數據統整。
・ 用於報告書的簡報製作。
・ 執行模型比較實驗。

〇 高田朋希

・ 負責整體掌握、任務管理及工作分配。
・ 調整經由網路爬蟲取得的資料。
・ 建立並調整資料集。
・ 執行標註作業。
・ 撰寫報告書。
・ 制定標註作業的詳細規則

〇 甲斐陸都

・率先進行標註作業,並撰寫已完成標註的程式碼。
・提出並確定用於資料的標籤(Label),確立目前的標註方針。
・執行實際的標註作業。
・撰寫報告書。
・用於報告書的簡報製作。

〇 佐佐木華
○ 調整經由網路爬蟲取得的資料。
・執行標註作業。
・制定標註作業的詳細規則。
・撰寫報告書。
・用於報告書的海報製作。
・用於報告書的簡報製作。
・制定標註作業的詳細規則。

〇 小笠原伶晏

・用於報告書的網頁製作
・調整經由網路爬蟲取得的資料。
・執行標註作業。
・撰寫報告書。

附錄B. 專題心得與建議

〇 溝上大翔
在這次的畢業專題中,我擔任團隊協調者與專題推動者,從研究啟動、資料集建構 到模型實驗,深度參與了所有階段。我對自然語言處理領域一直抱有濃厚興趣,而禹 良治教授從研究方法到相關論文,都給予我細心而精準的指導,在此由衷表示感謝。 在團隊合作過程中,難免遇到意料之外的困難或意見分歧。透過這個專題,我培養 了與成員協作、靈活應對並解決問題的能力。 這次研究讓我在技術和團隊協作能力上都獲得了顯著成長。這不僅是大學四年學習 的總結,更為我未來的研究道路奠定了堅實基礎。我將以此為基礎,在研究所階段繼 續投入評論相關的自然語言處理研究。

〇 高田朋希
這次的畢業研究,是一項既充滿樂趣,同時也極具挑戰性的研究。 確定本研究的專題主題時,我們團隊成員首先探討了「我們最感興趣的領域」, 最終,基於成員的興趣,我們定下了「透過語言分析來建構 AI輔助用的數據集,並 驗證其有效性」這一目標。 隨著研究的深入,我們體認到主題的奧妙之處,同時也因為是多人的團隊,我們 面臨了極其困難的挑戰,例如整體任務的管理、以及發生延遲時如何擬定挽回計劃 等。尤其在考量所有成員的個別狀況的同時,要維持研究進度非常困難,因此,我 們頻繁地向指導教授請教,不斷地摸索解決方案。 然而,多虧了大家的堅持不懈與努力,雖然研究成果的評估上仍有許多改善空 間,但我們最終還是取得了巨大的成果——實際完成了數據集的建立,並成功進行 了AI模型的實作與運行。 透過這次的經驗,我的專業知識獲得了增長,這是理所當然的;除此之外,我更 培養了在多數人團隊中的協調性,以及當問題發生時,能邏輯性地找出解決方案的 實踐能力。我強烈地感覺到,這次畢業研究所獲得的寶貴經驗與成長,必將在未來 的活動中發揮作用。

〇 甲斐陸都
這次的研究過程,是一段既艱辛又充滿成就感的旅程。尤其是在標註作業中,最 讓我感到挑戰的,是「一致率始終難以提升」這件事。明明大家都依照規則進行標 註,卻因為日文表達的模糊性、語感上的差異、長句或委婉語的判斷不同,常常導 致兩個人標注的結果差異很大。 於是我們不斷回到原點、檢討標準──哪些詞應該排除、哪些形式應該統一,甚 至為了小小的語尾辭修正規則。每次以為「應該搞定了」,卻又在檢查中發現新的 不一致,只能再重來。有時候是一整份檔案重新命名、格式調整,有時候是一百筆 資料從頭標一次。深感這份作業真的不是只靠耐心就能解決,而是需要每一位成員 共同磨合、持續改善。 但是正因為有這樣不斷重做、反覆修正的過程,我們團隊在七個人一起工作、互 相討論、互相支持的過程中逐漸形成默契。大家一起分享心得、解決困難,努力讓 這個專案不僅完成,更可以說是「共同堆疊出來的成果」。 回顧整個過程,再怎麼辛苦,都換來一份無可取代的成就感。從一開始什麼都沒 有,到現在能確實呈現出一份針對日文情感分析的高品質資料集,我真心覺得這是 一段非常值得珍惜的經驗。

〇 佐佐木華
這次的畢業研究,從期中發表到最終發表,推動多項作業的過程,說實話,真的 很辛苦。然而,多虧了指導教授們和團隊成員的協助,以及為了解決作業困難所做 的各種努力,我們團隊才能全員一起,順利完成這項研究。 在本研究中,能夠以「在台灣的大學就讀的日本學生」這個獨特的視角,去發現 並著手解決「日本數據集不足」這個挑戰,我感到非常驕傲。 在製作最終報告書、海報、簡報(投影片)和網頁等資料時,我們四年級的全體成 員也都是團結一心,共同努力到最後才得以完成。 這次的畢業研究不僅是專業知識的學習,在「如何作為團隊的一員參與其中,並 進行順暢的溝通」這種更具實踐性的層面上,我也認為自己獲益良多,成長許多。

〇 小笠原伶晏
本研究歷時兩個學期,由 5 名四年級與 2 名三年級學生組成的 7 人團隊共同推 動。我本人是在暑假開始前的 6 月左右加入團隊,因此在初期階段,因爲年級差異 與經驗落差,面臨了「知識量不同」、「作業節奏不一致」、「對標註規則的理解 不一致」等協作層面的挑戰。特別是在 ABSA 的人工標註過程中,Aspect(面向 詞)、Opinion(評價詞)、Category(分類)的判斷標準與邊界,由於每位成員的 解讀不同,若缺乏共通認知便容易造成結果的嚴重分歧。因此,在教授的指導下, 我們多次展開討論,並於暑假期間每週固定召開會議,以統一標準並建立一致的作 業體系。最終,全體成員在保有自身作業風格的同時,也能彼此調整步伐,順利協 力完成大規模的標註任務,這讓我深刻體會到大型專案中「協作」與「溝通」的關 鍵性。 在技術面方面,透過這次專題,我深切感受到大量語料的人工標註是一項耗時且 極度需要專注與細緻判斷的工作。尤其是日文評論常具有主語省略、委婉語氣、多25 層次情感、強烈的語境依賴等特性,使得情感判斷比英文更加困難。例如,「もう 少し広いとよかった(如果能再大一點就好了)」表面上語氣溫和、甚至接近中 立,但實際上隱含負向情緒;又如「美味しくいただきました(非常美味地享用 了)」這種帶有敬語成分的表述是否應視為 Opinion,也需制定一致的標準。面對 這些語言特性,我們透過反覆的標註比較與錯誤分析,逐步掌握日文評論中情感的 微妙波動,並重新認識到「情緒並非正負二分,而是具有連續強度」這一重要概 念。這樣的理解在後續進行 VA(Valence/Arousal) 標註時發揮了極大作用,使我 能更精準地判斷語氣與情感強度。 展望未來,若要進行類似的大型標註專案,應在初期階段投入更多時間於「規則 制定」與「標註者訓練」,以便更早形成共同理解。此外,若能在部分情境下導入 半自動或輔助式標註工具,將有助於減輕人工作業負擔,同時維持資料品質。我期 望本次專題累積的經驗能成為後續研究與實務工作的參考,並促進未來日本語 ABSA 以及情感分析領域的發展。 透過長時間參與本專題的標註作業,我深刻體會到自然語言處理(NLP)領域中資 料品質的重要性。然而,同時我也強烈感受到自己希望能有更多機會直接參與資料 整備之外的技術性工作,例如系統開發、模型建構與調整等。特別是模型設計策 略、特徵處理、提示詞(prompt)最佳化、錯誤分析等實作層面的工夫,往往直接 影響模型性能,這些都是我未來希望能更深入參與的領域。接下來,我期望能挑戰 更多技術範疇,例如分析流程(pipeline)構築、模型訓練與推論、提示詞設計、 結果可視化等,並以同時理解「資料」與「系統」兩個面向的開發者為目標持續成 長。