TOP  > Personal Info.

Researcher DataBase - Personal Information : KAI Atsuhiko

KAI Atsuhiko
Associate Professor
College of Engineering - Division of Mathematical and Systems Engineering
Faculty of Engineering - Department of Mathematical and Systems Engineering Graduate School of Integrated Science and Technology Department of Engineering - Mathematical and Systems Engineering Course
Graduate School of Medical Photonics - Cooperative Major in Medical Photonics Graduate School of Science and Technology,Research Division - Research of Informatics


image-profile
Last updated : 2025/03/29 2:05:13

Basic information on teaching staff

【Degrees earned】
Doctor(Engineering)  Toyohashi University of Technology   1996/3
【research area】
Informatics - Intelligent informatics
Informatics - Perceptual information processing
Informatics - Human interface and interaction
【research themes】
Automatic Speech Recognition and Spoken Language Processing (SLP) Systems
Robust Speech Recognition and Spoken Document Retrieval Systems
Automatic Captioning and SLP for Lecture Recording and Multimedia Data Utilization
Imagined Speech Recognition by Brainwave Signal
【Research Keyword】
Automatic Speech Recognition and Retrieval for Spontaneous Speech, Spoken Language Processing System, Automatic Speech Recognition for Noisy and Distant Speech, Automatic Captioning and Lecture Understanding Support System, Deep Learning Model for Speech and Language Processing, Imagined Speech Recognition by Brainwave Signal
【Academic societies you belong to】
・IEEE
【URL】
https://higo.msys.eng.shizuoka.ac.jp/
【Research Seeds】
[1]. 1.音声メディア利活用のための音声情報処理技術/2.遠隔マイク収録や雑音環境下を想定した適応学習や自動字幕化支援技術 ( 2019(FY) - ) [Category] 7.地域連携 [URL]
 

Research information

【Papers, etc.】
[1]. Adapting Large-Scale Pre-trained Models for Unified Dialect Speech Recognition Model
Acta Physica Polonica A 146/4 413-418 (2024) [Refereed] refereed [Internationally co-authored papers] non-internationally co-authored paper
[Lead author or co-author] author
[Author] Takumi Toyama, Atsuhiko Kai, Yuta Kamiya, Naoki Takahashi [URL] [DOI]
[2]. A Parameter-Efficient Multi-Step Fine-Tuning of Multilingual and Multi-Task Learning Model for Japanese Dialect Speech Recognition
Proc. 27th Conference of the Oriental COCOSDA International Committee for the Co-ordination and Standardisation of Speech Databases and Assessment Techniques (O-COCOSDA) / 1-6 (2024) [Refereed] refereed [Internationally co-authored papers] non-internationally co-authored paper
[Lead author or co-author] author
[Author] Yuta Kamiya, Shogo Miwa, Atsuhiko Kai [URL] [DOI]
[3]. Comparison of Large Pre-trained Models and Adaptation Methods for Japanese Dialects ASR
Proc. IEEE 13th Global Conference on Consumer Electronics (GCCE) / 811-814 (2024) [Refereed] refereed [Internationally co-authored papers] non-internationally co-authored paper
[Lead author or co-author] author
[Author] Naoki Takahashi, Shogo Miwa, Yuta Kamiya, Takumi Toyama, Raufun Nahar, Atsuhiko Kai [URL] [DOI]
[4]. Attention-based CNN and Relative Phase Feature Modeling for Improved Imagined Speech Recognition
Proc. Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2023) / 8-14 (2023) [Refereed] refereed [Internationally co-authored papers] non-internationally co-authored paper
[Lead author or co-author] author
[Author] Yoshiki Niimura, Jun Takemoto, Atsuhiko Kai, Seiichi Nakagawa [URL] [DOI]
[5]. Dialect Speech Recognition Modeling using Corpus of Japanese Dialects and Self-Supervised Learning-based Model XLSR
Proc. INTERSPEECH 2023 / 4928-4932 (2023) [Refereed] refereed [Internationally co-authored papers] non-internationally co-authored paper
[Lead author or co-author] author
[Author] Shogo Miwa, Atsuhiko Kai [URL] [DOI]
【Books, etc.】
[1]. Spoken Language Processing and Natural Language Processing
Corona Publishing Co., Ltd. (2018)
[Book type]book(research)
[Sole author, co-author, or author and editor] joint work
[Author]中川 聖一(編著),甲斐 充彦,ほか8名共著 [Range] Chapter 7 [REP page number] 231-251
[Notes] 初版第3刷(増補版、2018年9月発行), 書評者:荒木健治先生(北海道大学大学院), 掲載場所:電子情報通信学会誌 2013年8月号
[2]. IEICE Knowledgebase - Forest of Knowledge
The Institute of Electronics, Information and Communication Engineers (2018)
[Book type]book(educational)
[Sole author, co-author, or author and editor] contributor
[Author]甲斐充彦 [REP page number] 8群1編4章 4-1担当(8ページ)
[3]. Spoken Language Processing and Natural Language Processing
Corona Publishing Co., Ltd. (2013)
[Book type]book(research)
[Sole author, co-author, or author and editor] joint work
[Author]中川 聖一(編著),甲斐 充彦,ほか8名共著 [Range] Chapter 7 [REP page number] 201-220
[Notes] 初版第1刷(2013年3月発行), 書評者:荒木健治先生(北海道大学大学院), 掲載場所:電子情報通信学会誌 2013年8月号
[4]. Modern Speech Recognition Approaches with Case Studies
InTech (2012)
[Book type]book(research)
[Sole author, co-author, or author and editor] joint work
[Author]Longbiao Wang,Kyohei Odani,Atsuhiko Kai,Norihide Kitaoka,Seiichi Nakagawa
[Notes] 共著担当箇所(Chapter 7, "Dereverberation Based on Spectral Subtraction by Multi-channel LMS Algorithm for Hands-free Speech Recognition", pp.155-174) 当書籍
[5]. Spoken Language Systems
Ohmsha / IOS Press (2005)
[Book type]book(research)
[Sole author, co-author, or author and editor] joint work
[Author]Seiichi Nakagawa,Atsuhiko Kaiほか55名
[Notes] 共著担当箇所(第4章129-142)
【Academic conference/research presentations】
[1]. Assessing the Potential of Handcrafted Features for Imagined Speech Recognition Using Deep Learning Models
The 17th International Conference on Brain Informatics (BI2024) (2024/12/) other
[Presenter]Atsuhiko Kai, Yoshiki Niimura, Seiichi Nakagawa
[2]. 日本語諸方言コーパスを利用した 全国地域方言の言語モデルおよび識別モデルの構築と比較分析
日本音響学会2024年秋季研究発表会 (2024/9/5) other
[Presenter]神谷悠太, 甲斐充彦, Raufun Nahar, 中川聖一
[Notes] 日本音響学会
[3]. Attention-based CNN and Relative Phase Feature Modeling for Improved Imagined Speech Recognition
Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2023) (2023/11/1) other
[Presenter]Yoshiki Niimura, Jun Takemoto, Atsuhiko Kai, Seiichi Nakagawa
[URL of the repository, etc.]
[Notes] APSIPA
[4]. Attention ベース CNN と相対位相特徴による EEG に基づく想起音声認識の改善
第10回サイレント音声認識ワークショップ(SSRW2023) (2023/10/15) other
[Presenter]新村嘉基, 竹本 淳, 甲斐充彦, 中川聖一
[5]. ASR自動字幕の低コストな修正支援技術のリアルタイム化とオンライン評価
日本音響学会2023年秋季研究発表会 (2023/9/27) other
[Presenter]片岡諒弥, 甲斐充彦
[Notes] 日本音響学会
【Joint or funded research】
[1]. joint (with other institution)
leader ( 2015/7 ~ 2025/3 )
[2]. joint (with other institution)
leader ( 2012/4 ~ 2014/5 )
[3]. funded (public) 高度な検索機能を備えた“つぶやき音声”によるコミュニケーションシステムの構築
leader ( 2011/12 ~ 2012/7 )
[Partners] 独立行政法人科学技術振興機構
[Notes] 研究成果最適展開支援プログラムA-STEP・FSステージ探索タイプ
[4]. joint (with other institution)
member ( 2009/10 )
[5]. joint (with other institution) Research on Spoken Language Interface System
member ( 2000/4 )
【Grants-in-aid for Scientific Research
[1]. 方言音声データの分析と検索を可能にする諸方言に普遍な音声言語処理基盤モデルの構築 ( 2024/4 ~ 2027/3 ) Grant-in-Aid for Scientific Research (B) leader

[2]. 音声言語刺激と脳波の同時収録による脳波特徴表現獲得と想起音声認識 ( 2022/4 ~ 2025/3 ) Challenging Research(Exploratory) leader

[3]. 実環境音声認識のための深層学習と人手を併用する音声言語知識拡充フレームワーク ( 2018/4 ~ 2023/3 ) Grant-in-Aid for Scientific Research (C) leader

[4]. 音声ドキュメント内の検索とフィードバックに基づく高度なインデキシング機能の実現 ( 2013/4 ~ 2016/3 ) Grant-in-Aid for Scientific Research (C) leader

[5]. 対話音声認識における環境や話し方の影響評定を備えた音声理解システムの研究 ( 2011/4 ~ 2012/3 ) Grant-in-Aid for Scientific Research (C) leader

【Research Grants & Projects(except for KAKENHI)】
[1]. 大規模音声基盤モデルを用いた長期録音資源のクリーン化と音声検索精度の向上 (2023/11 - 2024/10 ) [Offer orgnization] 天野工業技術研究所 [System name] 2023年度研究助成金 [Role] principal investigator
[2]. (2014/10 - 2015/9 ) [Offer orgnization] 浜松科学技術研究振興会 [System name] 平成26年度村田基金研究助成金
[3]. 実世界環境における雑音・残響の動的変化に頑健な遠隔発話の音声認識 (2009/4 - 2010/3 ) [Offer orgnization] 浜松科学技術研究振興会 [System name] 科学技術研究助成金
[4]. 安全・便利な車内情報システムインタフェース (2007/9 - 2011/8 ) [Offer orgnization] 独立行政法人新エネルギー・産業技術総合開発機構(NEDO) [System name] 産業技術研究助成事業
[5]. 話し言葉音声理解システムのための多角的な信頼度分析に基づく仮説検証法の開発 (2005/3 - 2006/3 ) [Offer orgnization] (財)中部電力基礎技術研究所 [System name] 研究助成
【Awards & Honors】
[1]. IEEE GCCE2021 Outstanding Paper Award Robust Query-by-example Spoken Term Detection for Unknown Words Using Speech Retrieval-oriented E2E ASR Modeling (2021/10)
[Winner] Takumi Kurokawa, Atsuhiko Kai [Association] IEEE Consumer Technology Society
[Notes] 2021 IEEE 10th Global Conference on Consumer Electronics (GCCE2021)
[2]. (2013/9)
[Notes] 日本オペレーションズ・リサーチ学会
[3]. (1996/1)
[Notes] 社団法人電子情報通信学会東海支部
[4]. (1995/1)
[Notes] 財団法人電気通信普及財団
【Patents, etc.】
[1]. 対話理解装置 [Application Number] 2004204788 (2010/10/22) [Patent Number] 4610249
[2]. 対話理解装置 [Application Number] 2003-40053 (2009/4/17) [Patent Number] 4293340
【Holding academic or research conferences, etc.】
[1]. 第23回東海地区音声関連研究室修士論文中間発表会 (2019/8)
[Role at conference, etc.] is leader [Site of conference, etc.] 静岡大学浜松キャンパス
[Notes] 共催:電子情報通信学会東海支部、日本音響学会東海支部、映像情報メディア学会東海支部 参加大学:東海地区の11大学、参加者約150名
[2]. 日本音響学会2013年秋季研究発表会 (2013/9)
[Role at conference, etc.] other [Site of conference, etc.] 愛知県豊橋市
[Notes] 実行委員
[3]. Nanyang Technological Universityとの合同研究発表会 (2012/11)
[Role at conference, etc.] is leader [Site of conference, etc.] シンガポール
[Notes] 工学部プロジェクト「海外研究機関との研究室交流による国際的リーダーシップ人材育成」(SSSVプログラム)
[4]. 第14回東海地区音声関連研究室修論中間発表会 (2010/8)
[Role at conference, etc.] other [Site of conference, etc.] 静岡大学浜松キャンパス
[Notes] 学会主催者(静岡大学音声関連研究室後援:人工知能学会、電子情報通信学会東海支部、日本音響学会東海支部、情報処理学会東海支部、映像情報メディア学会東海支部)
【Other academic research activity】
[1]. 学術雑誌等の編集(電子情報通信学会「Special Section on Robust Speech Processing in Realistic Environment」英文論文小特集) (2007/6 - 2008/3 )
[Notes] 編集委員

Education related information

【Number of students advising】
2023(FY)
Number of undergraduate students(junior students) 0
Number of undergraduate students(senior students) 5
Number of master's course students : 6
2022(FY)
Number of undergraduate students(junior students) 1
Number of undergraduate students(senior students) 4
Number of master's course students : 5
Number of doctorate course students (main advisor) : 1 Number of doctorate course students (assistant advisor) : 1
2021(FY)
Number of undergraduate students(senior students) 6
Number of master's course students : 5
Number of doctorate course students (main advisor) : 1
2020(FY)
Number of undergraduate students(junior students) 0
Number of undergraduate students(senior students) 3
Number of master's course students : 6
Number of doctorate course students (main advisor) : 1
2019(FY)
Number of undergraduate students(junior students) 0
Number of undergraduate students(senior students) 6
Number of master's course students : 6
Number of doctorate course students (main advisor) : 1
【Prizes students you are advising won】
[1]. 日本音響学会東海支部優秀発表賞 (2023/12)
[Name of student who received the prize] 三輪祥吾 (Graduate School of Integrated Science and Technology)
[Name of organization that offered the prize] 日本音響学会東海支部
[2]. IEEE GCCE2021 Outstanding Paper Award (2021/10)
[Name of student who received the prize] 黒川拓海 (Graduate School of Integrated Science and Technology)
[Name of organization that offered the prize] IEEE Consumer Technology Society (CTSoc)
[3]. 2017年度IEEE CES West Japan Chapter Young Researcher Award(若手論文賞) (2017/12)
[Name of student who received the prize] 寺田侑司 (Graduate School of Integrated Science and Technology)
[Name of organization that offered the prize] IEEE Consumer Electronics Society West Japan Joint Chapter
[Notes] http://www.ieee-jp.org/section/kansai/chapter/ces/award.html
[4]. 第20回東海地区音声関連研究室修士論文発表会ポスター賞 (2016/8)
[Name of organization that offered the prize] 東海地区大学音声関連研究室合同(幹事校:名古屋大学)
[5]. 学生ポスター賞 (2015/12)
[Name of student who received the prize] 上田雄磨
[Name of organization that offered the prize] 電子情報通信学会音声研究会
【Information education-related information.】
[1]. 学内向け学習管理システム(LMS)の運用管理 (2014/10 - 2024/3 )
[Notes] 静岡大学統合認証(静大ID)に対応した学習管理システム(LMS)のMoodleサイトを学内向けにサービス提供するための運用管理を主担当(サイト名:LecShizu)、工学部内でのICT化による教育環境整備とオンライン授業活用を支援
[2]. 学科向けの学習管理システム(LMS)の運用管理 (2013/9 - 2014/9 )
[Notes] 静岡大学統合認証(静大ID)に対応した学習管理システム(LMS)のMoodleサイトをクラウドサーバ上で運用開始(サイト名:LecShizu)
[3]. 学科向けの学習管理システム(LMS)の運用管理 (2006/4 - 2013/8 )
[Notes] システム工学科向けに学習管理システム(LMS)のMoodleサイトの運用開始(サイト名:lecsys)

Contributions to society

【Seminar,Workshop, Event, etc.】
[1]. seminar 音声認識技術の基礎など (2019/6 - 2019/6 )
[Details] 音声認識技術の基礎など
[Notes] 東京都新宿区
[2]. coordination with high-schools H30年度高大連携実験実習講座 (2018/8 - 2018/8 )
[Details] 高校生向けの実験実習講座の一テーマ(コンピュータによる音声認識技術~音声分析から人工知能との関わりまで~)の講師
[Notes] 静岡大学浜松キャンパス(2日間)
[3]. seminar 音声認識技術の基礎など (2017/12 - 2017/12 )
[Details] 音声認識技術の基礎など
[Notes] 東京都新宿区
[4]. coordination with high-schools H29年度高大連携実験実習講座 (2017/8 - 2017/8 )
[Details] 高校生向けの実験実習講座の一テーマ(コンピュータによる音声認識技術 ~音声分析から確率モデル・人工知能との関わりまで~)の講師
[Notes] 静岡大学浜松キャンパス(2日間)
[5]. workshop 平成28年度東海・北陸地区国立大学法人等 技術職員合同研修(情報処理コース) (2016/9 - 2016/9 )
[Details] 研修テーマ「仮想環境を用いたMoodle活用体験」の講師
[Notes] 静岡大学浜松キャンパス
【News coverage】
[1]. newspaper 共同研究先が他社へ導入した⼈⼯知能システムに関するプレスリリース記事への掲載 (2018/1/30)
[Summary]共同研究先が他社へ導入したコールセンター通話音声認識の技術移転と実用化への技術協力
[Notes] 日本経済新聞
【Committees outside the university, etc.】
[1]. 浜松市児童福祉システム構築及び運用保守業務委託提案内容評価委員 (2015/5 - 2015/10 )
[2]. 音声言語情報処理研究運営委員会 (2014/4 - 2018/3 )
[Details of activities]運営委員
【Other social activities】
[1]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2023/11 - 2023/11 )
[Notes] 活動内容(2023年11月11,12日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)
[2]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2022/11 - 2022/11 )
[Notes] 活動内容(2022年11月12,13日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)
[3]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2019/11 - 2019/11 )
[Notes] 活動内容(2019年11月9,10日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)
[4]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2018/11 - 2018/11 )
[Notes] 活動内容(2018年11月10,11日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)
[5]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2017/11 - 2017/11 )
[Notes] 活動内容(2017年11月11,12日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)

International contributions

Others

【Special Notes】
1993- Engaged in research on spontaneous speech recognition 1996- Engaged in research on large-vocabulary speech recognition system 1996-1999 Engaged in development of large-vocabulary speech recognition and out-of-vocabulary processing algorithms 2000- Engaged in research on spontaneous speech recognition system, spoken language processing and spoken language interface systems 2010- Engaged in research on spoken document retrieval, robust speech recognition for distant speech and speaker diarization systems (Application of Deep learning and AI technologies)