Ja | En

発表文献

国際会議

Phonological Tokenizer: Prosody-Aware Phonetic Token via Multi-Objective Fine-Tuning with Differentiable K-Means
Kentaro Onda, Hayato Futami, Yosuke Kashiwagi, Emiru Tsunoo, Shinji Watanabe
ICASSP2026 (Accepted) [arXiv]
Advanced Modeling of Interlanguage Speech Intelligibility Benefit with L1-L2 Multi-Task Learning Using Differentiable K-Means for Accent-Robust Discrete Token-Based ASR
Kentaro Onda, Satoru Fukayama, Daisuke Saito, Nobuaki Minematsu
ICASSP2026 (Accepted) [arXiv]
Benchmarking Prosody Encoding in Discrete Speech Tokens
Kentaro Onda, Satoru Fukayama, Daisuke Saito, Nobuaki Minematsu
ASRU2025 [arXiv]
Discrete Tokens Exhibit Interlanguage Speech Intelligibility Benefit: an Analytical Study Towards Accent-robust ASR Only with Native Speech Data
Kentaro Onda, Keisuke Imoto, Satoru Fukayama, Daisuke Saito, Nobuaki Minematsu
Interspeech2025 [ISCA Archive] [arXiv]
Prosodically Enhanced Foreign Accent Simulation by Discrete Token-based Resynthesis Only with Native Speech Corpora
Kentaro Onda, Keisuke Imoto, Satoru Fukayama, Daisuke Saito, Nobuaki Minematsu
Interspeech2025 [ISCA Archive] [arXiv]
Differentiable K-means for Fully-optimized Discrete Token-based ASR
Kentaro Onda, Yosuke Kashiwagi, Emiru Tsunoo, Hayato Futami, Shinji Watanabe
Interspeech2025 [ISCA Archive] [arXiv]
A Pilot Study of GSLM-based Simulation of Foreign Accentuation Only Using Native Speech Corpora
Kentaro Onda, Joonyong Park, Nobuaki Minematsu, Daisuke Saito
Interspeech2024 [ISCA Archive] [arXiv]

国内会議

下流タスク推論時におけるSSLモデル由来の音声離散トークンの確率分布的利用
恩田健太郎, 深山覚, 齋藤大輔, 峯松信明
日本音響学会第155回(2026年春季)研究発表会
外国語訛りに頑健な ASR の実現に向けた微分可能 k-means を用いた L1 と L2 のマルチタスク学習による interlanguage speech intelligibility benefitの高度な再現
恩田健太郎, 深山覚, 齋藤大輔, 峯松信明
音声言語シンポジウム2025 (奨励賞受賞)
音声離散トークンの韻律把握能力に関する分析的研究
恩田健太郎, 深山覚, 齋藤大輔, 峯松信明
日本音響学会第154回(2025年秋季)研究発表会
母語話者音声のみを用いた外国語訛りに頑健な自動音声認識の実現に向けた離散トークンの活用の検討
恩田健太郎, 深山覚, 井本桂右, 齋藤大輔, 峯松信明
日本音響学会第153回(2025年春季)研究発表会 (学生優秀発表賞受賞)
Modeling and Predicting Individual Learners' Performance of Prosody Imitation and its Use for Material Selection
程禧璦, 耿浩彭, 恩田健太郎, 齋藤大輔, 峯松信明
日本音響学会第153回(2025年春季)研究発表会
離散トークンの継続長予測に基づく母語話者音声コーパスのみを用いた外国語訛り音声合成手法の改善
恩田健太郎, 朴浚鎔, 井本桂右, 深山覚, 齋藤大輔, 峯松信明
音声言語シンポジウム2024
Analyzing Language Learners' Oral Imitation Through Machine Model of Oral Imitation with Foreign Accentuation
程禧璦, 恩田健太郎, 齋藤大輔, 峯松信明
日本音響学会第152回(2024年秋季)研究発表会
母語話者音声コーパスのみを用いた自己教師あり学習による外国語訛り音声の合成
恩田健太郎, 朴浚鎔, 齋藤大輔, 峯松信明
音学シンポジウム2024 (優秀発表賞受賞)
母語話者音声コーパスのみを用いた外国語訛りを有する合成音声の生成
恩田健太郎, 朴浚鎔, 峯松信明, 齋藤大輔
日本音響学会第151回(2024年春季)研究発表会

その他

Simulation of Foreign Accentuation by Discrete Symbol-based Resynthesis Using Only Native Speech Corpora
Kentaro Onda, Joonyong Park, Daisuke Saito, Nobuaki Minematsu
Eighth International Workshop on Symbolic-Neural Learning (SNL2024) (ポスターのみ)

予算

2025/10 - 2028/03
JST ACT-X
"構造的音韻論に基づく話者不変な音声の表現学習モデルの構築", 450万円
2024/07 - 2025/03
"母語話者音声コーパスのみを用いたデータ拡張による外国語訛りに頑健な自動音声認識システムの構築", 300万円

受賞

2025/12
第27回音声言語シンポジウム・第12回自然言語処理シンポジウム奨励賞(特別セッション)
2025/09
日本音響学会 学生優秀発表賞
2025/08
Interspeech2025 トラベルグラント, 1000ユーロ
2024/06
音学シンポジウム 優秀発表賞