トップページ  > 教員個別情報

静岡大学教員データベース - 教員個別情報 : 甲斐 充彦 (KAI Atsuhiko)

甲斐 充彦 (KAI Atsuhiko)
准教授
学術院工学領域 - 数理システム工学系列
工学部 - 数理システム工学科 大学院総合科学技術研究科工学専攻 - 数理システム工学コース
大学院光医工学研究科 - 光医工学共同専攻 創造科学技術研究部 - インフォマティクス部門


image-profile
最終更新日:2024/02/21 2:05:09

教員基本情報

【取得学位】
博士(工学)  豊橋技術科学大学   1996年3月
【研究分野】
情報通信 - 知能情報学
情報通信 - 知覚情報処理
情報通信 - ヒューマンインタフェース、インタラクション
【相談に応じられる教育・研究・社会連携分野】
音声メディア利活用のための音声情報処理技術応用
音声言語処理技術の応用によるコミュニケーション支援システム
自動音声認識技術の応用による自動字幕化(情報保障)やマルチメディアコンテンツ有効利用
【現在の研究テーマ】
自動音声認識システムや音声言語処理システムの基盤技術開発
実環境下の話し言葉の自動音声認識および検索技術の開発
音声言語処理技術を応用した講義やマルチメディアデータの自動字幕化やコンテンツ有効利用支援
脳波信号による想起音声認識
【研究キーワード】
話し言葉の自動音声認識・検索技術, 音声言語処理システム, 雑音環境や遠隔発話のための自動音声認識技術, 講義音声の自動字幕化と聴講支援(情報保障)システム, 音声言語処理のための深層学習モデル(ディープラーニング), 脳波信号による想起音声認識
【所属学会】
・情報処理学会
・日本音響学会
・IEEE
・人工知能学会
・電子情報通信学会
【個人ホームページ】
https://higo.msys.eng.shizuoka.ac.jp/
【研究シーズ】
[1]. 1.音声メディア利活用のための音声情報処理技術/2.遠隔マイク収録や雑音環境下を想定した適応学習や自動字幕化支援技術 ( 2019年度 - ) [分野] 7.地域連携 [URL]
 

研究業績情報

【論文 等】
[1]. Attention-based CNN and Relative Phase Feature Modeling for Improved Imagined Speech Recognition
Proc. Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2023) / 8-14 (2023年) [査読] 有 [国際共著論文] 該当しない
[責任著者・共著者の別] 責任著者
[著者] Yoshiki Niimura, Jun Takemoto, Atsuhiko Kai, Seiichi Nakagawa [URL] [DOI]
[2]. Dialect Speech Recognition Modeling using Corpus of Japanese Dialects and Self-Supervised Learning-based Model XLSR
Proc. INTERSPEECH 2023 / 4928-4932 (2023年) [査読] 有 [国際共著論文] 該当しない
[責任著者・共著者の別] 責任著者
[著者] Shogo Miwa, Atsuhiko Kai [URL] [DOI]
[3]. Domain Adaptation with Augmented Data by Deep Neural Network Based Method Using Re-Recorded Speech for Automatic Speech Recognition in Real Environment
Sensors 22/24 - 9945 (2022年) [査読] 有 [国際共著論文] 該当しない
[責任著者・共著者の別] 責任著者
[著者] Raufun Nahar, Shogo Miwa, Atsuhiko Kai [URL] [DOI]
[4]. Retrieval-oriented E2E ASR Modeling for Improved Query-by-example Spoken Term Detection
Proc. APSIPA Annual Summit and Conference (APSIPA ASC 2021) / 1037-1042 (2021年) [査読] 有 [国際共著論文] 該当しない
[責任著者・共著者の別] 責任著者
[著者] Takumi Kurokawa, Atsuhiko Kai [URL]
[5]. Robust Query-by-example Spoken Term Detection for Unknown Words Using Speech Retrieval-oriented E2E ASR Modeling
Proc. IEEE 10th Global Conference on Consumer Electronics (GCCE2021) / 342-343 (2021年) [査読] 有 [国際共著論文] 該当しない
[責任著者・共著者の別] 責任著者
[著者] Takumi Kurokawa, Atsuhiko Kai [URL] [DOI]
【著書 等】
[1]. 音声言語処理と自然言語処理(増補)
コロナ社 (2018年)
[著書の別]著書(研究)
[単著・共著・編著等の別] 共著
[著者]中川 聖一(編著),甲斐 充彦,ほか8名共著 [担当範囲] 7章 [担当頁] 231-251
[備考] 初版第3刷(増補版、2018年9月発行), 書評者:荒木健治先生(北海道大学大学院), 掲載場所:電子情報通信学会誌 2013年8月号
[2]. 電子情報通信学会知識ベース知識の森
電子情報通信学会 (2018年)
[著書の別]著書(教育)
[単著・共著・編著等の別] 分担執筆
[著者]甲斐充彦 [担当頁] 8群1編4章 4-1担当(8ページ)
[3]. 音声言語処理と自然言語処理
コロナ社 (2013年)
[著書の別]著書(研究)
[単著・共著・編著等の別] 共著
[著者]中川 聖一(編著),甲斐 充彦,ほか8名共著 [担当範囲] 7章 [担当頁] 201-220
[備考] 初版第1刷(2013年3月発行), 書評者:荒木健治先生(北海道大学大学院), 掲載場所:電子情報通信学会誌 2013年8月号
[4]. Modern Speech Recognition Approaches with Case Studies
InTech (2012年)
[著書の別]著書(研究)
[単著・共著・編著等の別] 共著
[著者]Longbiao Wang,Kyohei Odani,Atsuhiko Kai,Norihide Kitaoka,Seiichi Nakagawa
[備考] 共著担当箇所(Chapter 7, "Dereverberation Based on Spectral Subtraction by Multi-channel LMS Algorithm for Hands-free Speech Recognition", pp.155-174) 当書籍
[5]. Spoken Language Systems
オーム社/IOS Press (2005年)
[著書の別]著書(研究)
[単著・共著・編著等の別] 共著
[著者]Seiichi Nakagawa,Atsuhiko Kaiほか55名
[備考] 共著担当箇所(第4章129-142)
【学会発表・研究発表】
[1]. Attention-based CNN and Relative Phase Feature Modeling for Improved Imagined Speech Recognition
Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2023) (2023年11月1日) 招待講演以外
[発表者]Yoshiki Niimura, Jun Takemoto, Atsuhiko Kai, Seiichi Nakagawa
[URL]
[備考] APSIPA
[2]. Attention ベース CNN と相対位相特徴による EEG に基づく想起音声認識の改善
第10回サイレント音声認識ワークショップ(SSRW2023) (2023年10月15日) 招待講演以外
[発表者]新村嘉基, 竹本 淳, 甲斐充彦, 中川聖一
[3]. ASR自動字幕の低コストな修正支援技術のリアルタイム化とオンライン評価
日本音響学会2023年秋季研究発表会 (2023年9月27日) 招待講演以外
[発表者]片岡諒弥, 甲斐充彦
[備考] 日本音響学会
[4]. Dialect Speech Recognition Modeling using Corpus of Japanese Dialects and Self-Supervised Learning-based Model XLSR
Interspeech 2023 (2023年8月24日) 招待講演以外
[発表者]Shogo Miwa, Atsuhiko Kai
[URL]
[備考] ISCA
[5]. 自己教師有り学習モデルXLSRと日本語諸方言コーパスを利用した諸方言音声認識モデル
電子情報通信学会技術報告 (2023年3月1日) 招待講演以外
[発表者]三輪祥吾, 甲斐充彦
[URL]
[備考] 電子情報通信学会音声研究会
【共同・受託研究】
[1]. 国内共同研究 電話窓口サービスにおける通話分析のための音声情報処理技術の開発
代表 ( 2015年7月 ~ 2024年3月 )
[2]. 国内共同研究 外国語発話学習支援システムのための音声情報処理技術の研究開発
代表 ( 2012年4月 ~ 2014年5月 )
[3]. 出資金による受託研究 高度な検索機能を備えた“つぶやき音声”によるコミュニケーションシステムの構築
代表 ( 2011年12月 ~ 2012年7月 )
[相手先] 独立行政法人科学技術振興機構
[備考] 研究成果最適展開支援プログラムA-STEP・FSステージ探索タイプ
[4]. 国内共同研究 運転行動信号処理に関する研究
分担 ( 2009年10月 )
[5]. 国内共同研究 車載機器における音声言語インターフェースに関する研究
分担 ( 2000年4月 )
【科学研究費助成事業】
[1]. 音声言語刺激と脳波の同時収録による脳波特徴表現獲得と想起音声認識 ( 2022年4月 ~ 2025年3月 ) 挑戦的研究(萌芽) 代表

[2]. 実環境音声認識のための深層学習と人手を併用する音声言語知識拡充フレームワーク ( 2018年4月 ~ 2023年3月 ) 基盤研究(C) 代表

[3]. 音声ドキュメント内の検索とフィードバックに基づく高度なインデキシング機能の実現 ( 2013年4月 ~ 2016年3月 ) 基盤研究(C) 代表

[4]. 対話音声認識における環境や話し方の影響評定を備えた音声理解システムの研究 ( 2011年4月 ~ 2012年3月 ) 基盤研究(C) 代表

[5]. 対話音声認識における環境や話し方の影響評定を備えた音声理解システムの研究 ( 2010年4月 ~ 2011年3月 ) 基盤研究(C) 代表

【外部資金(科研費以外)】
[1]. 大規模音声基盤モデルを用いた長期録音資源のクリーン化と音声検索精度の向上 (2023年11月 - 2024年10月 ) [提供機関] 天野工業技術研究所 [制度名] 2023年度研究助成金 [担当区分] 研究代表者
[2]. (2014年10月 - 2015年9月 ) [提供機関] 浜松科学技術研究振興会 [制度名] 平成26年度村田基金研究助成金
[3]. 実世界環境における雑音・残響の動的変化に頑健な遠隔発話の音声認識 (2009年4月 - 2010年3月 ) [提供機関] 浜松科学技術研究振興会 [制度名] 科学技術研究助成金
[4]. 安全・便利な車内情報システムインタフェース (2007年9月 - 2011年8月 ) [提供機関] 独立行政法人新エネルギー・産業技術総合開発機構(NEDO) [制度名] 産業技術研究助成事業
[5]. 話し言葉音声理解システムのための多角的な信頼度分析に基づく仮説検証法の開発 (2005年3月 - 2006年3月 ) [提供機関] (財)中部電力基礎技術研究所 [制度名] 研究助成
【受賞】
[1]. IEEE GCCE2021 Outstanding Paper Award Robust Query-by-example Spoken Term Detection for Unknown Words Using Speech Retrieval-oriented E2E ASR Modeling (2021年10月)
[受賞者] 黒川拓海、甲斐充彦 [授与機関] IEEE Consumer Technology Society
[備考] 2021 IEEE 10th Global Conference on Consumer Electronics (GCCE2021)
[2]. 第3回日本オペレーションズ・リサーチ学会論文賞 (2013年9月)
[備考] 日本オペレーションズ・リサーチ学会
[3]. 平成7年度学生研究奨励賞 (1996年1月)
[備考] 社団法人電子情報通信学会東海支部
[4]. テレコムシステム技術学生賞 (1995年1月)
[備考] 財団法人電気通信普及財団
【特許 等】
[1]. 対話理解装置 [出願番号] 2004204788 (2010年10月22日) [特許番号] 4610249
[2]. 対話理解装置 [出願番号] 2003-40053 (2009年4月17日) [特許番号] 4293340
【学会・研究会等の開催】
[1]. 第23回東海地区音声関連研究室修士論文中間発表会 (2019年8月)
[役割] 責任者(議長、実行委員長等) [開催場所] 静岡大学浜松キャンパス
[備考] 共催:電子情報通信学会東海支部、日本音響学会東海支部、映像情報メディア学会東海支部 参加大学:東海地区の11大学、参加者約150名
[2]. 日本音響学会2013年秋季研究発表会 (2013年9月)
[役割] 責任者以外 [開催場所] 愛知県豊橋市
[備考] 実行委員
[3]. Nanyang Technological Universityとの合同研究発表会 (2012年11月)
[役割] 責任者(議長、実行委員長等) [開催場所] シンガポール
[備考] 工学部プロジェクト「海外研究機関との研究室交流による国際的リーダーシップ人材育成」(SSSVプログラム)
[4]. 第14回東海地区音声関連研究室修論中間発表会 (2010年8月)
[役割] 責任者以外 [開催場所] 静岡大学浜松キャンパス
[備考] 学会主催者(静岡大学音声関連研究室後援:人工知能学会、電子情報通信学会東海支部、日本音響学会東海支部、情報処理学会東海支部、映像情報メディア学会東海支部)
【その他学術研究活動】
[1]. 学術雑誌等の編集(電子情報通信学会「Special Section on Robust Speech Processing in Realistic Environment」英文論文小特集) (2007年6月 - 2008年3月 )
[備考] 編集委員

教育関連情報

【今年度担当授業科目】
[1]. 学部専門科目 情報科学入門 (2023年度 - 後期 )
[2]. 学部専門科目 プログラミング (2023年度 - 後期 )
[3]. 大学院科目(修士) メディア情報処理論 (2023年度 - 前期 )
[4]. 大学院科目(博士) 知的メディア処理論 (2023年度 - 前期 )
[5]. 全学教育科目(共通科目) 新入生セミナー (2023年度 - 前期 )
【指導学生数】
2023年度
卒研指導学生数(3年) 0 人
卒研指導学生数(4年) 5 人
修士指導学生数 6 人
2022年度
卒研指導学生数(3年) 1 人
卒研指導学生数(4年) 4 人
修士指導学生数 5 人
博士指導学生数(主指導) 1 人 博士指導学生数(副指導) 1 人
2021年度
卒研指導学生数(4年) 6 人
修士指導学生数 5 人
博士指導学生数(主指導) 1 人
2020年度
卒研指導学生数(3年) 0 人
卒研指導学生数(4年) 3 人
修士指導学生数 6 人
博士指導学生数(主指導) 1 人
2019年度
卒研指導学生数(3年) 0 人
卒研指導学生数(4年) 6 人
修士指導学生数 6 人
博士指導学生数(主指導) 1 人
【指導学生の受賞】
[1]. 日本音響学会東海支部優秀発表賞 (2023年12月)
[受賞学生氏名] 三輪祥吾 (総合科学技術研究科)
[授与団体名] 日本音響学会東海支部
[2]. IEEE GCCE2021 Outstanding Paper Award (2021年10月)
[受賞学生氏名] 黒川拓海 (総合科学技術研究科)
[授与団体名] IEEE Consumer Technology Society (CTSoc)
[3]. 2017年度IEEE CES West Japan Chapter Young Researcher Award(若手論文賞) (2017年12月)
[受賞学生氏名] 寺田侑司 (総合科学技術研究科)
[授与団体名] IEEE Consumer Electronics Society West Japan Joint Chapter
[備考] http://www.ieee-jp.org/section/kansai/chapter/ces/award.html
[4]. 第20回東海地区音声関連研究室修士論文発表会ポスター賞 (2016年8月)
[授与団体名] 東海地区大学音声関連研究室合同(幹事校:名古屋大学)
[5]. 学生ポスター賞 (2015年12月)
[受賞学生氏名] 上田雄磨
[授与団体名] 電子情報通信学会音声研究会
【その他教育関連情報】
[1]. 学内向け学習管理システム(LMS)の運用管理 (2014年10月 - 2024年3月 )
[備考] 静岡大学統合認証(静大ID)に対応した学習管理システム(LMS)のMoodleサイトを学内向けにサービス提供するための運用管理を主担当(サイト名:LecShizu)、工学部内でのICT化による教育環境整備とオンライン授業活用を支援
[2]. 学科向けの学習管理システム(LMS)の運用管理 (2013年9月 - 2014年9月 )
[備考] 静岡大学統合認証(静大ID)に対応した学習管理システム(LMS)のMoodleサイトをクラウドサーバ上で運用開始(サイト名:LecShizu)
[3]. 学科向けの学習管理システム(LMS)の運用管理 (2006年4月 - 2013年8月 )
[備考] システム工学科向けに学習管理システム(LMS)のMoodleサイトの運用開始(サイト名:lecsys)

社会活動

【講師・イベント等】
[1]. セミナー 音声認識技術の基礎など (2019年6月 - 2019年6月 )
[内容] 音声認識技術の基礎など
[備考] 東京都新宿区
[2]. 高大連携 H30年度高大連携実験実習講座 (2018年8月 - 2018年8月 )
[内容] 高校生向けの実験実習講座の一テーマ(コンピュータによる音声認識技術~音声分析から人工知能との関わりまで~)の講師
[備考] 静岡大学浜松キャンパス(2日間)
[3]. セミナー 音声認識技術の基礎など (2017年12月 - 2017年12月 )
[内容] 音声認識技術の基礎など
[備考] 東京都新宿区
[4]. 高大連携 H29年度高大連携実験実習講座 (2017年8月 - 2017年8月 )
[内容] 高校生向けの実験実習講座の一テーマ(コンピュータによる音声認識技術 ~音声分析から確率モデル・人工知能との関わりまで~)の講師
[備考] 静岡大学浜松キャンパス(2日間)
[5]. 研修会 平成28年度東海・北陸地区国立大学法人等 技術職員合同研修(情報処理コース) (2016年9月 - 2016年9月 )
[内容] 研修テーマ「仮想環境を用いたMoodle活用体験」の講師
[備考] 静岡大学浜松キャンパス
【報道】
[1]. 新聞 共同研究先が他社へ導入した⼈⼯知能システムに関するプレスリリース記事への掲載 (2018年1月30日)
[概要]共同研究先が他社へ導入したコールセンター通話音声認識の技術移転と実用化への技術協力
[備考] 日本経済新聞
【学外の審議会・委員会等】
[1]. 浜松市児童福祉システム構築及び運用保守業務委託提案内容評価委員 (2015年5月 - 2015年10月 )
[2]. 音声言語情報処理研究運営委員会 (2014年4月 - 2018年3月 )
[活動内容]運営委員
【その他社会活動】
[1]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2023年11月 - 2023年11月 )
[備考] 活動内容(2023年11月11,12日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)
[2]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2022年11月 - 2022年11月 )
[備考] 活動内容(2022年11月12,13日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)
[3]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2019年11月 - 2019年11月 )
[備考] 活動内容(2019年11月9,10日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)
[4]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2018年11月 - 2018年11月 )
[備考] 活動内容(2018年11月10,11日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)
[5]. おもしろ実験の展示(テーマ名:「音や声を使って遊ぼう!」) (2017年11月 - 2017年11月 )
[備考] 活動内容(2017年11月11,12日に開催されたテクノフェスタのおもしろ実験にてテーマ「音や声を使って遊ぼう!」での展示・デモを実施)

国際貢献実績

管理運営・その他

【特記事項】
1993- 自然発話のための音声認識・理解システムの研究に従事 1996- 大語彙連続音声認識システムの高速化・高精度化の研究に従事 1996-1999 大語彙音声認識システムと未知語処理のアルゴリズム及びソフトウェアの開発に関する研究に従事 2000- 対話音声認識システム、音声言語インタフェースに関する研究に従事 2010- 音声ドキュメント検索システム、会議や講義などの実環境や遠隔マイクを想定した音声認識システム、話者認識システム、話者ダイアライゼーションシステム、自動字幕・情報保障技術に関する研究(人工知能技術、深層学習の応用)