#llm | Airu Adachi

May 7, 2026 a-adachi Zenn

arXivの論文IDやURLを入力すると、論文の取得・読解・関連情報のWeb検索・日本語による解説台本の生成を肩代わりしてくれるWebアプリを作った報告。

地上デジタル放送における音声と字幕データを活用した放送内容のテキスト化と要約手法の検討

February 1, 2026 阿達藍留, 塚越柚季, 大向一輝研究報告人文科学とコンピュータ（CH）. 2026, vol. 2026-CH-140, no. 28, p. 1-6.

本研究は、日本の地上デジタル放送における音声書き起こしと字幕データをLLMによって統合・相互補完し、放送内容の高精度なテキスト化を行う手法を提案する。さらに、統合テキストからキーワード抽出と要約生成を行うことで、放送内容の効率的な分析や、デジタルアーカイブにおける映像資料のメタデータ拡充・検索性向上への貢献を目指す。

View

デジタルアーカイブにおける複数メタデータセット間の関連付けの自動化に関する検討：「大江健三郎文庫自筆原稿デジタルアーカイブ」を事例として

July 2, 2025 阿達藍留, 大向一輝デジタルアーカイブ学会誌. 2025, vol. 9, no. 3, p. e25-e31.

#メタデータ #LLM

本研究は、デジタルアーカイブ構築におけるメタデータ作成の効率化を目的として、「大江健三郎文庫自筆原稿デジタルアーカイブ」の実際のデータを対象に、複数の手法でデータセット間の関連付けの工程を再現し専門家による作業結果との一致率を評価した。書誌情報の完全一致、文字列の類似度の比較、大規模言語モデル（LLM）を用いた手法を比較検証した結果、刊行日の完全一致による手法が比較的高い正答率と短い処理時間を示した。一方、LLMを用いた手法は最も正答率が高い反面、処理時間が極めて長いという課題があった。これらの知見を基に、複数手法を組み合わせることで、正答率と処理時間のバランスが改善されることを実証した。

View

zundarXiv

#わかり方 #LLM

ずんだもんと四国めたんがarXivの論文を解説してくれるサイト

View