Ja | En

発表文献

国際会議

Benchmarking Prosody Encoding in Discrete Speech Tokens
Kentaro Onda, Satoru Fukayama, Daisuke Saito, Nobuaki Minematsu
ASRU2025 (Accepted) [arXiv]
Discrete Tokens Exhibit Interlanguage Speech Intelligibility Benefit: an Analytical Study Towards Accent-robust ASR Only with Native Speech Data
Kentaro Onda, Keisuke Imoto, Satoru Fukayama, Daisuke Saito, Nobuaki Minematsu
Interspeech2025 [ISCA Archive] [arXiv]
Prosodically Enhanced Foreign Accent Simulation by Discrete Token-based Resynthesis Only with Native Speech Corpora
Kentaro Onda, Keisuke Imoto, Satoru Fukayama, Daisuke Saito, Nobuaki Minematsu
Interspeech2025 [ISCA Archive] [arXiv]
Differentiable K-means for Fully-optimized Discrete Token-based ASR
Kentaro Onda, Yosuke Kashiwagi, Emiru Tsunoo, Hayato Futami, Shinji Watanabe
Interspeech2025 [ISCA Archive] [arXiv]
A Pilot Study of GSLM-based Simulation of Foreign Accentuation Only Using Native Speech Corpora
Kentaro Onda, Joonyong Park, Nobuaki Minematsu, Daisuke Saito
Interspeech2024 [ISCA Archive] [arXiv]

国内会議

音声離散トークンの韻律把握能力に関する分析的研究
恩田健太郎, 深山覚, 齋藤大輔, 峯松信明
日本音響学会第154回(2025年秋季)研究発表会
母語話者音声のみを用いた外国語訛りに頑健な自動音声認識の実現に向けた離散トークンの活用の検討
恩田健太郎, 深山覚, 井本桂右, 齋藤大輔, 峯松信明
日本音響学会第153回(2025年春季)研究発表会 (学生優秀発表賞受賞)
Modeling and Predicting Individual Learners' Performance of Prosody Imitation and its Use for Material Selection
程禧璦, 耿浩彭, 恩田健太郎, 齋藤大輔, 峯松信明
日本音響学会第153回(2025年春季)研究発表会
離散トークンの継続長予測に基づく母語話者音声コーパスのみを用いた外国語訛り音声合成手法の改善
恩田健太郎, 朴浚鎔, 井本桂右, 深山覚, 齋藤大輔, 峯松信明
音声言語シンポジウム2024 (優秀発表賞受賞)
Analyzing Language Learners' Oral Imitation Through Machine Model of Oral Imitation with Foreign Accentuation
程禧璦, 恩田健太郎, 齋藤大輔, 峯松信明
日本音響学会第152回(2024年秋季)研究発表会
母語話者音声コーパスのみを用いた自己教師あり学習による外国語訛り音声の合成
恩田健太郎, 朴浚鎔, 齋藤大輔, 峯松信明
音学シンポジウム2024
母語話者音声コーパスのみを用いた外国語訛りを有する合成音声の生成
恩田健太郎, 朴浚鎔, 峯松信明, 齋藤大輔
日本音響学会第151回(2024年春季)研究発表会

その他

Simulation of Foreign Accentuation by Discrete Symbol-based Resynthesis Using Only Native Speech Corpora
Kentaro Onda, Joonyong Park, Daisuke Saito, Nobuaki Minematsu
Eighth International Workshop on Symbolic-Neural Learning (SNL2024) (ポスターのみ)

予算

2024/05
産総研 覚醒プロジェクト 採択
"母語話者音声コーパスのみを用いたデータ拡張による外国語訛りに頑健な自動音声認識システムの構築", 300万円

受賞

2025/09
日本音響学会 学生優秀発表賞
2025/08
Interspeech2025 トラベルグラント, 1000ユーロ
2024/06
音学シンポジウム 優秀発表賞