Publications / 研究成果

研究活動の成果・出版物・トーク・動画などをリストしてあります．
載せられていない研究成果が色々ある不完全なリストですが，暫定的に公開します (2025-11)．

研究内容についての質問があれば，著者や発表者まで気軽にご連絡ください．
ラボメンバーの連絡先はこちらを参照ください：ラボメンバー一覧 (Members)

International Conferences

Mutsumi Sasaki, Go Kamoda, Ryosuke Takahashi, Kosuke Sato, Benjamin Heinzerling, Keisuke Sakaguchi, and Kentaro Inui
Can Language Models Handle a Non-Gregorian Calendar?
In Proceedings of the 14th International Joint Conference on Natural Language Processing and the 4th Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics, pages 444-463, December 2025.
Poster, International Joint Conference on Natural Language Processing & Asia-Pacific Chapter of the Association for Computational Linguistics, 2025 (IJCNLP-AACL 2025). Mumbai, India, December 2025.
ACL Anthology arXiv
Tatsuro Inaba, Go Kamoda, Kentaro Inui, Masaru Isonuma, Yusuke Miyao, Yohei Oseki, Yu Takagi, and Benjamin Heinzerling
How a Bilingual LM Becomes Bilingual: Tracing Internal Representations with Sparse Autoencoders.
In Findings of the Association for Computational Linguistics: EMNLP 2025, pages 13458–13470, December 2025.
Poster, The 2025 Conference on Empirical Methods in Natural Language Processing (EMNLP 2025). Suzhou, China, November 2025.
ACL Anthology arXiv
Ryosuke Takahashi, Go Kamoda, Benjamin Heinzerling, Keisuke Sakaguchi, and Kentaro Inui
Understanding the Side Effects of Rank-One Knowledge Editing.
In Proceedings of the 8th BlackboxNLP Workshop: Analyzing and Interpreting Neural Networks for NLP, pages 189–205, November 2025.
Poster, BlackboxNLP 2025: The 8th Workshop on Analyzing and Interpreting Neural Networks for NLP (BlackboxNLP 2025). Suzhou, China, November 2025.
ACL Anthology arXiv
Masaki Sakata, Benjamin Heinzerling, Sho Yokoi, Takumi Ito, and Kentaro Inui
On Entity Identification in Language Models.
In Findings of the Association for Computational Linguistics: ACL 2025, pages 16717-16741, July 2025.
Poster, The 63rd Annual Meeting of the Association for Computational Linguistics (ACL 2025). Vienna, Austria, July 2025.
ACL Anthology arXiv
Makoto Shing, Kou Misaki, Han Bao, Sho Yokoi, and Takuya Akiba
TAID: Temporally Adaptive Interpolated Distillation for Efficient Knowledge Transfer in Language Models.
In The Thirteenth International Conference on Learning Representations, April 2025.
Poster, The Thirteenth International Conference on Learning Representations (ICLR 2025). Singapore, April 2025.
OpenReview
Hiroyuki Deguchi, Go Kamoda, Yusuke Matsushita, Chihiro Taguchi, Masaki Waga, Kohei Suenaga, and Sho Yokoi
SoftMatcha: A Soft and Fast Pattern Matcher for Billion-Scale Corpus Searches.
In The Thirteenth International Conference on Learning Representations, April 2025.
Poster, The Thirteenth International Conference on Learning Representations (ICLR 2025). Singapore, April 2025.
OpenReview Project Page

Domestic Conferences

米田優峻, 鴨田豪, 松下祐介, 末永幸平, 秋葉拓哉, 和賀正樹, 横井祥.
SoftMatcha 2: 一兆語規模のコーパスに対する柔らかく超高速な検索システム.
口頭発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
ポスター発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
論文 Project Page
山本悠士, 磯野真之介, 河原吉伸, 横井祥.
Mambaの"処理時間"はヒトの読み時間と符号する.
ポスター発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
論文
坂田将樹, Benjamin Heinzerling, 伊藤拓海, 横井祥, 乾健太郎.
言語モデルに線形に内在する階層的概念.
ポスター発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
論文
大橋諭貴, 木谷頼斗, 佐藤宏亮, 高橋良允, 鴨田豪, 山本悠士, 塩野大輝, 坂口慶祐, 小林悟郎.
注意機構における Attention Sink のバイアス項的解釈.
口頭発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
ポスター発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
論文
李宰成, 中石海, 横井祥.
タスク算術の誤差項とその解釈.
ポスター発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
論文
木谷頼斗, 大橋諭貴, 佐藤宏亮, 鴨田豪, 高橋良允, 山本悠士, 塩野大輝, 坂口慶祐, 小林悟郎.
Attention Sink および Massive Activation の発生機序の分解.
口頭発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
ポスター発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
論文
石峯拓海, 日野英逸, 横井祥.
単体複体を用いた次単語予測分布の幾何的解釈.
ポスター発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
論文
原知正, 栗田宙人, 今泉允聡, 乾健太郎, 横井祥.
なぜ平均プーリングはうまく動くのか？テキスト埋め込みの二次統計量の崩壊の定量化.
ポスター発表, 言語処理学会第32回年次大会 (NLP 2026). 宇都宮, 2026年3月.
論文
三原朋樹, 石川勲, 横井祥.
p進数を用いた単語埋め込みについて.
ポスター発表, 第28回情報論的学習理論ワークショップ (IBIS 2025). 沖縄, 2025年11月.
石峯拓海, 日野英逸, 横井祥.
言語モデルの最終隠れ状態のソフト分割可能な単体複体としての分析.
ポスター発表, 第28回情報論的学習理論ワークショップ (IBIS 2025). 沖縄, 2025年11月.
原知正, 栗田宙人, 今泉允聡, 乾健太郎, 横井祥.
なぜ一次モーメント情報のみ残したテキスト埋め込みはうまく動くのか？：単語埋め込み集合における二次モーメント情報の崩壊の分析.
ポスター発表, 第28回情報論的学習理論ワークショップ (IBIS 2025). 沖縄, 2025年11月.
風間正弘, 横井祥.
拡散言語モデルによる日本語縦読み文章生成.
ポスター発表, 第20回言語処理若手シンポジウム (YANS 2025). 浜松, 2025年9月.
鴨田豪, 熊谷雄介, 松井孝太, 横井祥.
密度比の直接推定に基づく言語モデルの出力較正.
ポスター発表, 第20回言語処理若手シンポジウム (YANS 2025). 浜松, 2025年9月.
原知正, 栗田宙人, 横井祥, 今泉允聡, 乾健太郎.
文長による内容語率の変化が引き起こす文ベクトルの品質低下.
In 人工知能学会全国大会論文集, pp.3G1GS603-3G1GS603, 2025年5月.
口頭発表, 2025年度人工知能学会全国大会 (第39回) (JSAI 2025). 大阪, 2025年5月.
論文
小林春斗, 原知正, 鴨田豪, 横井祥.
層の冗長性と層同士の独立性に基づく言語モデルの層交換の成否の特徴づけ.
In 言語処理学会第31回年次大会発表論文集, pp.1751-1756, 2025年3月.
口頭発表, 言語処理学会第31回年次大会 (NLP 2025). 長崎, 2025年3月.
言語処理学会第31回年次大会若手奨励賞 (20/487).
論文若手奨励賞
岸野稜, 山際宏明, 永田亮, 横井祥, 下平英寿.
不均衡最適輸送を用いた意味変化検出.
In 言語処理学会第31回年次大会発表論文集, pp.3916-3921, 2025年3月.
口頭発表, 言語処理学会第31回年次大会 (NLP 2025). 長崎, 2025年3月.
論文

Invited Talks

横井祥.
「確率的なオウム」にできること，またそれがなぜできるのかについて.
英語コーパス学会 (JAECS) 第51回大会基調講演
September 2025.
Benhamin Heinzerling, 横井祥, 小林悟郎.
言語モデルの内部機序：解析と解釈.
言語処理学会第31回年次大会チュートリアル講演
March 2025.
Slide

Books

ケヴィン P. マーフィー (著) / 持橋大地・鈴木大慈 (監訳) / 石黒勝彦, 伊藤伸志, 梶野洸, 黒木祐子, 小宮山純平, 佐藤竜馬, 鈴木大慈, 包含, 手嶋毅志, 幡谷龍一郎, 二見太, 南賢太郎, 持橋大地, 横井祥 (訳). (2025).
確率的機械学習：入門編 II ―非線形モデル―.
朝倉書店.
URL
ケヴィン P. マーフィー (著) / 持橋大地・鈴木大慈 (監訳) / 石黒勝彦, 伊藤伸志, 梶野洸, 黒木祐子, 小宮山純平, 佐藤竜馬, 鈴木大慈, 包含, 手嶋毅志, 幡谷龍一郎, 二見太, 南賢太郎, 持橋大地, 横井祥 (訳). (2025).
確率的機械学習：入門編 I ―基礎と線形モデル―.
朝倉書店.
URL
横井祥. (2025).
言語の表現空間の形, 数理科学 2025年10月号 No.748「データの幾何学と機械学習-データの「近さ」や「繋がり」を捉える-」.
サイエンス社.
URL