氏名

オガワ テツジ

小川 哲司

職名

教授 (https://researchmap.jp/read0205540/)

所属

(基幹理工学部)

プロフィール

2000年早稲田大学理工学部電気電子情報工学科卒業.2002年同大学大学院修士課程修了.2005年同大学大学院博士後期課程終了.博士(工学).2004--2007年早稲田大学理工学術院助手.2007年早稲田大学IT研究機構講師.2007--2012年早稲田大学高等研究所助教.現在,早稲田大学理工学術院准教授.その間,2012年,2013年米国ジョンズホプキンス大学訪問研究者,2014年,2015年チェコ共和国ブルノ工科大学訪問研究者.2012--2015年エジプト・日本科学技術大学(E-JUST)特任准教授.2012年より産業技術総合研究所人工知能研究センター客員研究員.音声・音響情報処理,画像・映像情報処理,IoT,パターン認識に関する研究に従事.IEEE,電子情報通信学会,情報処理学会,日本音響学会,日本機械学会,日本風力エネルギー学会,日本水産学会,日本畜産学会各会員.

連絡先

メールアドレス

メールアドレス
ogawa.tetsuji@waseda.jp

URL等

WebページURL

https://sites.google.com/site/ogatetsu/(個人ウェブサイト)

http://www.pcl.cs.waseda.ac.jp(研究室ウェブサイト)

研究者番号
70386598
ORCID ID
https://orcid.org/0000-0002-7316-2073

本属以外の学内所属

兼担

理工学術院(大学院基幹理工学研究科)

学内研究所等

知覚情報システム研究所

研究所員 2012年-2015年

知覚情報システム研究所

研究所員 2015年-2019年

波動場・コミュニケーション科学研究所

研究所員 2016年-

理工学術院総合研究所(理工学研究所)

兼任研究員 2018年-

学歴・学位

学歴

1996年04月-2000年03月 早稲田大学 理工学部 電気電子情報工学科
2000年04月-2002年03月 早稲田大学大学院 理工学研究科 電気工学専攻
2002年04月-2005年03月 早稲田大学大学院 理工学研究科 電気工学専攻

学位

博士(工学) 課程 早稲田大学 知覚情報処理

経歴

2004年04月-2007年03月早稲田大学理工学部 助手
2007年04月-2007年10月早稲田大学IT 研究機構 客員講師
2007年11月-2012年03月早稲田大学高等研究所 助教
2012年04月-早稲田大学理工学術院 准教授
2016年06月-産業技術総合研究所人工知能研究センター 客員研究員
2012年04月-2015年03月エジプト・日本科学技術大学 特任准教授
2012年06月-2012年09月ジョンズホプキンス大学 訪問研究者
2013年06月-2013年08月ジョンズホプキンス大学 訪問研究者
2014年06月-2014年07月ブルノ工科大学 訪問研究者
2015年05月-2015年08月ブルノ工科大学 訪問研究者

所属学協会

The Institute of Electrical and Electronics Engineers, Inc. (IEEE)

International Speech Communication Association (ISCA)

電子情報通信学会

情報処理学会

日本音響学会

日本機械学会

日本風力エネルギー学会

日本畜産学会

日本水産学会

委員歴・役員歴(学外)

2017年-電子情報通信学会 音声研究会専門委員
2017年-2017年第7回バイオメトリクスと認識・認証シンポジウムプログラム委員
2010年-2011年電子情報通信学会情報・システムソサイエティ誌 編集委員
2010年-2010年高度言語情報融合フォーラム(ALAGIN)若手研究者フォーラム実行委員
2009年-2010年第9回情報科学技術フォーラム(FIT)プログラム委員
2008年-2011年情報処理学会 音声言語情報処理研究会運営委員

受賞

早稲田大学ティーチングアワード総長賞

2018年02月授与機関:早稲田大学

APSIPA ASC2017 Poster Book Prizes

2017年12月授与機関:APSIPA ASC2017

情報処理学会 山下記念研究賞

2012年03月授与機関:情報処理学会

日本音響学会粟屋潔学術奨励賞

2011年03月授与機関:日本音響学会

BTAS2008 Best Paper Award

2008年10月授与機関:BTAS2008

研究分野

キーワード

音声・音響情報処理、画像・映像情報処理、IoT、パターン認識、機械学習

科研費分類

情報学 / 人間情報学 / 知能ロボティクス

共同研究希望テーマ

パターン認識技術の第1次産業への応用

希望連携機関:産学連携、民間を含む他機関等との共同研究等

目的:技術相談、受託研究、共同研究、その他

音声認識・音響信号処理

希望連携機関:産学連携、民間を含む他機関等との共同研究等

目的:技術相談、受託研究、共同研究、その他

異常予兆検知

希望連携機関:産学連携、民間を含む他機関等との共同研究等

目的:技術相談、受託研究、共同研究、その他

研究テーマ履歴

2000年04月-2005年03月時系列パターン認識用確率モデルの高精度化および構造最適化

研究テーマのキーワード:隠れマルコフモデル,部分隠れマルコフモデル,識別学習,遺伝的アルゴリズム

個人研究

2016年04月-風力発電設備の故障予兆検知

国内共同研究

2016年09月-気象・海洋情報を用いた漁獲量の予測

国内共同研究

2017年04月-映像情報を用いた牛の分娩予兆検知

国内共同研究

2015年09月-交通網のモニタリング

国際共同研究

2012年04月-メタ認知機能を持つ音声認識

国際共同研究

2016年04月-リカレントニューラルネットワーク言語モデルのドメイン適応

国内共同研究

2016年04月-頑健な特徴抽出(音韻情報と話者情報を分離するニューラルネットワーク)

国内共同研究

2010年04月-話者クラスタリング

国内共同研究

2006年04月-ロンバード音声認識

国内共同研究

2015年04月-高精度・低歪な音源分離・雑音除去

国内共同研究

2006年04月-実環境での利用を指向した小型・高速・頑健な音源分離技術

国内共同研究

2008年04月-性別・年齢推定

国内共同研究

論文

画像からの牛の状態識別に基づく分娩予兆検知

兵頭亮介,安田早希,斎藤奨,沖本裕典,中野鐵兵,赤羽誠,小林哲則,小川哲司

電子情報通信学会技術研究報告 (PRMU)2018年12月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

映像からの牛の分娩予兆行動検知に関する検討

菅原一真,中野鐵兵,赤羽誠,小林晢則,小川哲司

電子情報通信学会技術研究報告 (PRMU)2018年12月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

RNN言語モデルのためのドメイン属性情報を用いたゼロショット学習

芦川博人,森岡幹,俵直弘,小川厚徳,岩田具治,小川哲司,小林哲則

情報処理学会研究報告2018年12月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

正常稼働状態の表現学習に基づく風車異常検知

長谷川隆徳,緒方淳,村川正宏,小川哲司

第40回風力エネルギー利用シンポジウム予稿集2018年12月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

畳み込みニューラルネットワークに基づく風車異常検知システムにおける判断根拠の可視化に関する検討

佐伯真於,緒方淳,村川正宏,小川哲司

第40回風力エネルギー利用シンポジウム予稿集2018年12月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Adversarial autoencoder for reducing nonlinear distortion

Naohiro Tawara, Tetsunori Kobayashi, Masaru Fujieda, Kazuhiro Katagiri, Takashi Yazu, Tetsuji Ogawa

Proc. APSIPA2018査読有り2018年11月-

詳細

掲載種別:研究論文(国際会議プロシーディングス)

敵対的デノイジングオートエンコーダによる非線形ひずみ除去フィルタリング

俵直弘,小林哲則,藤枝大,片桐一浩,矢頭隆,小川哲司

日本音響学会講演論文集2018(秋季)p.159 - 1622018年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Acoustic feature representation based on timbre for fault detection of rotary machines

Kesaaki Menemura, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. SDPC2018査読有り2018年08月-

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Sequential fish catch forecasting using Bayesian state space models

Yuya Kokaki, Naohiro Tawara, Tetsunori Kobayashi, Kazuo Hashimoto, Tetsuji Ogawa

Proc. ICPR2018査読有りp.776 - 7812018年08月-

詳細

掲載種別:研究論文(国際会議プロシーディングス)

非線形ひずみ除去のための敵対的 denoising autoencoder

俵直弘,小林哲則,藤枝大,片桐一浩,矢頭隆,小川哲司

情報処理学会研究報告2018-SLP-123(1)p.1 - 72018年07月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:2188-8663

Tandem connectionist anomaly detection: Use of faulty vibration signals in feature representation learning

Takanori Hasegawa, Jun Ogata, Masahiro Murakawa, Tetsuji Ogawa

Proc. ICPHM2018査読有りp.1 - 72018年06月-

DOI

詳細

掲載種別:研究論文(国際会議プロシーディングス)

牛の分娩予兆として映像から観測可能な状態の検知

沖本祐典,菅原一真,齊藤奨,中野鐵兵,赤羽誠,小林哲則,小川哲司

人工知能学会全国大会論文集JSAI20182018年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1347-9881

AIで風車の異常を見つける:データ駆動型アプローチによる異常検知の最新動向

長谷川隆徳,緒方淳,村川正宏,小川哲司

日本風力エネルギー学会誌招待有り42(1)p.72 - 762018年05月-

詳細

掲載種別:研究論文(学術雑誌)ISSN:0387-6217

Language model domain adaptation via recurrent neural network with domain-shared and domain-specific representations

Tsuyoshi Morioka, Naohiro Tawara, Tetsuji Ogawa, Atsunori Ogawa, Tomoharu Iwata, Tetsunori Kobayashi

Proc. ICASSP2018査読有りp.6084 - 60882018年04月-

DOI

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Speaker invariant feature extraction for zero-resource languages with adversarial training

Taira Tsuchiya, Naohiro Tawara, Tetsunori Kobayashi, Tetsuji Ogawa

Proc. ICASSP2018査読有りp.2381 - 23852018年04月-

DOI

詳細

掲載種別:研究論文(国際会議プロシーディングス)

異種データ活用のための変換複合行列分解

土屋平,岩田具治,小川哲司

電子情報通信学会技術研究報告 (IBISML)117(475)p.41 - 482018年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

敵対的学習に基づく話者特徴抽出

俵直弘,土屋平,小川哲司,小林哲則

日本音響学会講演論文集2018(春季)p.141 - 1442018年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

話者正規化における言語非依存性とゼロリソース音声認識における効果

島田拓也,俵直弘,小川哲司,小林哲則

日本音響学会講演論文集2018(春季)p.109 - 1122018年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

敵対的マルチタスク学習を用いた話者の違いに頑健な特徴抽出とゼロリソース音素識別による評価

土屋平,俵直弘,小川哲司,小林哲則

日本音響学会講演論文集2018(春季)p.9 - 122018年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Exploiting end of sentences and speaker alternations in recurrent neural network-based language modeling for multiparty conversations

Hiroto Ashikawa, Naohiro Tawara, Asunori Ogawa, Tomoharu Iwata, Tetsunori Kobayashi, Tetsuji Ogawa

Proc. APSIPA2017査読有り2017年12月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

正常・損傷の表現学習に基づく風力発電システム異常検知技術の高度化

長谷川隆徳,緒方淳,村川正宏,小川哲司

第39回風力エネルギー利用シンポジウムp.371 - 3742017年12月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

正常・損傷の表現学習に基づく機械振動異常検知

長谷川隆徳,緒方淳,村川正宏,小川哲司

第16回評価・診断に関するシンポジウム講演論文集p.5 - 102017年11月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Waseda Meisei at TRECVID2017: Ad-hoc video search

Kazuya Ueki, Koji Hirakawa, Kotara Kikuchi, Tetsuji Ogawa, Tetsunori Kobayashi

Notebook paper of the TRECVID 2017 Workshop2017年11月-

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Adaptive training of vibration-based anomaly detector for wind turbine condition monitoring

Takanori Hasegawa, Jun Ogata, Masahiro Murakawa, Tetsunori Kobayashi, Tetsuji Ogawa

Proc. Annual Conference on PHM Society査読有りp.177 - 1842017年10月-

link

詳細

掲載種別:研究論文(国際会議プロシーディングス)

ドメイン依存・非依存の内部表現を有する再帰型ニューラルネットワーク言語モデル

森岡幹,俵直弘,小川哲司,小川厚徳,岩田具治,小林哲則

日本音響学会講演論文集2017(秋季)p.27 - 302017年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

複数人対話を対象としたRNN言語モデルにおける発話終端情報利用の有効性

芦川博人,俵直弘,小川厚徳,岩田具治,小林哲則,小川哲司

日本音響学会講演論文集2017(秋季)p.23 - 262017年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Real-time large-scale map matching using mobile phone data

Essam Algizawy, Tetsuji Ogawa, Ahmed Elmahdy

ACM Trans. Knowl. Discov. Data査読有り11(4)2017年08月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)

会話参加状態を考慮した振る舞いをするロボットのシステムアーキテクチャ

菅原一真,浅野秀平,赤川優斗,藤江真也,小川哲司,小林哲則

人工知能学会全国大会論文集JSAI20172017年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1347-9881

Associative memory model-based linear filtering and its application to tandem connectionist blind source separation

Motoi Omachi, Tetsuji Ogawa, Tetsunori Kobayashi

IEEE Trans. Acoust. Speech Lang. Process.査読有り25(3)p.637 - 6502017年03月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)

複数人対話のためのRNN言語モデルにおける発話終端と話者情報の利用法

芦川博人,俵直弘,小川厚徳,岩田具治,小川哲司,小林哲則

電子情報通信学会技術研究報告 (SP)116(477)p.287 - 2902017年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

国際会議INTERSPEECH2016参加報告

浅見太一,小川厚徳,小川哲司,大谷大和,倉田岳人,齋藤大輔,塩田さやか,篠原雄介,鈴木雅之,高道慎之介,南條浩輝,橋本佳,樋口卓哉,増村亮,吉野幸一郎,渡部晋治

情報処理学会研究報告2016-SLP-115(7)p.1 - 72017年02月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

A new efficient measure for accuracy prediction and its application to multistream-based unsupervised adaptation

Tetsuji Ogawa, Harish Mallidi, Emmanuel Dupoux, Jordan Cohen, Naomi Feldman, Hynek Hermansky

Proc. ICPR2016査読有りp.2222 - 22272016年12月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

複数人対話のための話者情報を用いたRNN言語モデル

芦川博人,森岡幹,小川厚徳,岩田具治,俵直弘,小川哲司,小林哲則

日本音響学会講演論文集2016(秋季)p.85 - 882016年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

少量データに頑健なニューラルネットワーク言語モデル

森岡幹,岩田具治,小川厚徳,俵直弘,小川哲司,小林哲則

日本音響学会講演論文集2016(秋季)p.89 - 922016年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Video semantic indexing using object detection derived features

Kotaro Kikuchi, Kazuya Ueki, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. EUSIPCO2016査読有りp.1288 - 12922016年08月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Nested Gibbs sampling for mixture-of-mixture model and its application to speaker clustering

Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Tetsunori Kobayashi

APSIPA Trans. Signal & Infor. Process.査読有り(5)2016年08月-

DOI

詳細

掲載種別:研究論文(学術雑誌)

ニューラルネットワークに基づく識別器の不確かさの推定とマルチストリーム音声認識への適用

小川哲司,Mallidi Harish,Vesely Karel,Hermansky Hynek

日本音響学会講演論文集2016(春季)p.67 - 702016年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

高次相関を考慮した音響特徴量のDNNに基づく音声認識での利用

小川哲司,小林哲則,新田恒雄

日本音響学会講演論文集2016(春季)p.161 - 1622016年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

連想記憶に基づく線形分離行列推定を用いたタンデム接続型音源分離

大町基,小川哲司,小林哲則,藤枝大,片桐一浩

日本音響学会講演論文集2016(春季)p.21 - 242016年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

国際会議INTERSPEECH2015参加報告

浅見太一,大谷大和,小川哲司,木下慶介,倉田岳人,齋藤大輔,塩田さやか,太刀岡勇気,中村静,増村亮,渡部晋治

情報処理学会研究報告2016-SLP-110(4)p.1 - 52016年02月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Uncertainty estimation of DNN classifiers

Sri Harish Mallidi, Tetsuji Ogawa, Hynek Hermansky

Proc. ASRU2015査読有りp.283 - 2882015年12月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

A sampling-based speaker clustering using utterance-oriented Dirichlet process mixture model and its evaluation on large-scale data

Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, Tetsunori Kobayashi

APSIPA Trans. Signal & Info. Process.査読有り(4)2015年10月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)

Bilinear map of filter-bank outputs for DNN-based speech recognition

Tetsuji Ogawa, Kenshiro Ueda, Kouichi Katsurada, Tetsunori Kobayashi, Tsuneo Nitta

Proc. INTERSPEECH2015査読有りp.16 - 202015年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Autoencoder based multi-stream combination for noise robust speech recognition

Sri Harish Mallidi, Tetsuji Ogawa, Karel Vesely, Phani Nidadavolu, Hynek Hermansky

Proc. INTERSPEECH2015査読有りp.3551 - 35552015年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Separation matrix optimization using associative memory model for blind source separation

Motoi Omachi, Tetsuji Ogawa, Tetsunori Kobayashi, Masaru Fujieda, Kazuhiro Katagiri

Proc. EUSIPCO2015査読有りp.1103 - 11072015年09月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

複数の文脈長を考慮したリカレントニューラルネットワークに基づく言語モデル

森岡幹,俵直弘,小川哲司,岩田具治,小川厚徳,堀貴明,小林哲則

日本音響学会講演論文集2015(秋季)p.17 - 202015年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

連想記憶に基づくブラインド音源分離のエコーキャンセリングへの応用

大町基, 小川哲司, 小林哲則, 藤枝大, 片桐一浩

日本音響学会講演論文集2015(秋季)p.593 - 5962015年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

スペクトラルクラスタリングに基づく話者クラスタリングのための因子分析法の効果の検証

俵直弘,小川哲司,小林哲則

日本音響学会講演論文集2015(秋季)p.173 - 1742015年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Feature extraction for rotary-machine acoustic diagnostics focused on period

Kesaaki Minemura, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. INTERNOISE2015査読有り2015年08月-

Scopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

国際会議ICASSP2015参加報告

岡本拓磨,小川哲司,落合翼,柏木陽佑,亀岡弘和,木下慶介,郡山知樹,齋藤大輔,篠崎隆宏,高木信二,滝口哲也,太刀岡勇気,俵直弘,橋本佳,藤本雅清,松田繁樹,三村正人,吉岡拓也,渡部晋治

情報処理学会研究報告2015-SLP-107(3)p.1 - 72015年07月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

A comparative study of spectral clustering for i-vector-based speaker clustering under noisy conditions

Naohiro Tawara, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. ICASSP2015査読有りp.2041 - 20452015年04月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Towards machines that know when they do not know: Summary of work done at 2014 Frederick Jelinek Memorial workshop

Hynek Hermansky, Lukas Burget, Jordan Cohen, Emmanuel Dupoux Naomi Feldman, John Godfrey, Sanjeev Khudanpur, Matthew Maciejewski, Sri Harish Mallidi, Anjali Menon, Tetsuji Ogawa, Vijayaditya Peddinti, Richard Rose, Richard Stern, Matthew Wiesner, Karel Vesely

Proc. ICASSP2015査読有りp.5009 - 50132015年04月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

テンソル積による基底変換に基づく音声認識に関する研究

上田賢次郎,小川哲司,小林哲則,桂田浩一,新田恒雄

日本音響学会講演論文集2015(春季)p.7 - 102015年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

連想記憶と線形分離フィルタを用いたブラインド音源分離

大町基,小川哲司,小林哲則,藤枝大,片桐一浩

情報処理学会研究報告2015-SLP-105(4)p.1 - 62015年02月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

i-vectorを用いたスペクトラルクラスタリングによる雑音環境下話者クラスタリング

俵直弘,小川哲司,小林哲則

情報処理学会研究報告2015-SLP-105(11)p.1 - 62015年02月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

国際会議INTERSPEECH2014,SLT2014参加報告

浅見太一,岩野公司,小川哲司,駒谷和範,齋藤大輔,篠田浩一,太刀岡勇気,東中竜一郎,福田隆,増村亮,渡部晋治

情報処理学会研究報告2015-SLP-105(7)p.1 - 62015年02月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Effect of frequency weighting on MLP-based speaker canonicalization

Yuichi Kubota, Motoi Omachi, Tetsuji Ogawa, Tetsunori Kobayashi, Tsuneo Nitta

Proc. INTERSPEECH2014査読有りp.2987 - 29912014年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

スペクトラルクラスタリングに基づく話者クラスタリング

俵直弘,小川哲司,小林哲則

日本音響学会講演論文集2014(秋季)p.95 - 982014年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

MLPを用いた話者正準化に基づく音声認識の検討

久保田雄一,大町基,小川哲司,小林哲則,新田恒雄

情報処理学会研究報告2014-SLP-102(8)p.1 - 62014年07月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

i-vectorを用いた話者認識

小川哲司,塩田さやか

日本音響学会誌招待有り70(6)p.332 - 3392014年06月-

DOI

詳細

掲載種別:研究論文(学術雑誌)ISSN:2432-2040

標準話者母音スペクトルへの変換に基づく話者正準化

久保田雄一,大町基,小川哲司,小林哲則,新田恒雄

日本音響学会講演論文集2014(春季)p.77 - 782014年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Vision based SLAM for humanoid robots: A survey

Walaa Gouda, Walid Gomaa, Tetsuji Ogawa

Proc. JEC-ECC2013査読有りp.170 - 1752013年12月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Integration of MKL-based and i-vector-based speaker verification by short utterances

Hideitsu Hino, Tetsuji Ogawa

Proc. ACPR2013査読有りp.562 - 5662013年11月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Blocked Gibbs sampling based multi-scale mixture model for speaker clustering on noisy data

Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, Tetsunori Kobayashi

Proc. MLSP2013査読有り2013年09月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

因子分析モデルに基づく話者照合の環境変動に対する頑健性の調査

福地佑介, 俵直弘, 小川哲司, 小林哲則

日本音響学会講演論文集2013(秋季)p.75 - 782013年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Stream selection and integration in multistream ASR using GMM-based performance monitoring

Tetsuji Ogawa, Feipeng Li, Hynek Hermansky

Proc. INTERSPEECH2013査読有りp.3332 - 33362013年08月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

話者認識で用いる機械学習

小川哲司,松井知子

日本音響学会誌招待有り69(7)p.349 - 3562013年07月-

DOI

詳細

掲載種別:研究論文(学術雑誌)ISSN:2432-2040

効率的なサンプリング手法を用いた話者モデリング

俵直弘,小川哲司,渡部晋治,中村篤,小林哲則

情報処理学会研究報告2013-SLP-97(2)p.1 - 82013年07月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

性能モニタリングに基づく多層パーセプトロンの適応的選択による雑音に頑健なマルチストリーム音声認識

小川哲司,Li Feipeng,Hermansky Hynek

日本音響学会講演論文集2013(春季)p.167 - 1702013年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

指向性を付与したマルチチャネルウィーナフィルタを前段に持つ音源分離方式の検討

大町基,小川哲司,赤桐健三,小林哲則

日本音響学会講演論文集2013(春季)p.937 - 9402013年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

話者認識技術の現状と課題

網野加苗,石原俊一,小川哲司,長内隆,黒岩眞吾,越仲孝文,篠田浩一,柘植覚,西田昌史,松井知子,王龍標

電子情報通信学会技術研究報告 (SP)招待有り112(450)p.63 - 702013年02月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

An improved entropy-based multiple kernel learning

Hideitsu Hino, Tetsuji Ogawa

Proc. ICPR2012査読有りp.1189 - 11922012年11月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:1051-4651

Fully Bayesian speaker clustering based on hierarchically structured utterance-oriented Dirichlet process mixture model

Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Atsushi Nakamura, Tetsunori Kobayashi

Proc. INTERSPEECH2012査読有りp.2166 - 21692012年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

i-vectorに基づく発話類似度を用いた非負値行列分解と話者クラスタリングへの適用

福地佑介, 俵直弘, 小川哲司, 小林哲則

情報処理学会研究報告2012-SLP-92(8)p.1 - 62012年07月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

クラウド時代の新しい音声研究パラダイム

秋葉友良,岩野公司,緒方淳,小川哲司,小野順貴,篠崎隆宏,篠田浩一,南條浩輝,西崎博光,西田昌史,西村竜一,原直,堀貴明

情報処理学会研究報告2012-SLP-92(4)p.1 - 72012年07月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:2186-2583

Fully Bayesian inference of multi-mixture Gaussian model and its evaluation using speaker clustering

Naohiro Tawara, Tetsuji Ogawa, Shinji Watanabe, Tetsunori Kobayashi

Proc. ICASSP2012査読有りp.5253 - 52562012年03月-

DOIScopus

階層的構造を持つディリクレ過程混合モデルを用いたフルベイズ話者クラスタリング

俵直弘,小川哲司,渡部晋治,中村篤,小林哲則

電子情報通信学会技術研究報告(IBISML)111(480)p.21 - 282012年03月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

話者照合における因子分析に基づく特徴抽出に関する評価

小川哲司,小林哲則

日本音響学会講演論文集2012(春季)p.197 - 1982012年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

発話単位DPMMを用いたフルベイズ話者クラスタリングと大規模データによる評価

俵直弘,小川哲司,渡部晋治,中村篤,小林哲則

日本音響学会講演論文集2012(春季)p.207 - 2102012年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

クラス内変動に頑健なカーネルマシンと話者照合への適用

小川哲司,日野英逸,村田昇,小林哲則

日本音響学会講演論文集2011(秋季)p.183 - 1862012年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Development and evaluation of Japanese Lombard speech corpus

Tetsuji Ogawa, Takanobu Nishiura, Takeshi Yamada, Norihide Kitaoka, and Tetsunori Kobayashi

Proc. Internoise2011査読有り招待有り2011年09月-

Scopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

CENSREC-4: An evaluation framework for distant-talking speech recognition under reverberant environments

Takahiro Fukumori, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Norihide Kitaoka, Takeshi Yamada, Kazumasa Yamamoto, Satoru Tsuge, Masakiyo Fujimoto, Tetsuya Takiguchi, Chiyomi Miyajima, Satoshi Tamura, Tetsuji Ogawa, Shigeki Matsuda, Shingo Kuroiwa, Kazuya Takeda, and Satoshi Nakamura

Acoust. Sci., & Tech.査読有り32(5)p.201 - 2102011年09月-

DOIlinkScopus

詳細

掲載種別:研究論文(学術雑誌)ISSN:1347-5177

Modified LSD 最小化に基づく空間フィルタキャリブレーション

田中信秋,小川哲司,小林哲則

日本音響学会講演論文集2011(秋季)p.33 - 362011年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

多重混合ガウス分布モデルにおけるフルベイズモデル推定手法の検討と話者クラスタリングによる評価

俵直弘,渡部晋治,小川哲司,小林哲則

日本音響学会講演論文集2011(秋季)p.175 - 1782011年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Speaker verification robust to intra-speaker variation using multiple kernel learning based on conditional entropy minimization

Tetsuji Ogawa, Hideitsu Hino, Noboru Murata, and Tetsunori Kobayashi

Proc. Interspeech2011査読有りp.2741 - 27442011年08月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Spatial filter calibration based on minimization of modified LSD

Nobuaki Tanaka, Tetsuji Ogawa, and Tetsunori Kobayashi

Proc. Interspeech2011査読有りp.1761 - 17642011年08月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Speaker clustering based on utterance-oriented Dirichelet process mixture model

Naohiro Tawara, Shinji Watanabe, Tetsuji Ogawa and Tetsunori Kobayashi

Proc. Interspeech2011査読有りp.2905 - 29082011年08月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Class-distance-based discriminant analysis and its application to supervised automatic age estimation

Tetsuji Ogawa, Kazuya Ueki, and Tetsunori Kobayashi

IEICE Trans. Inf. & Syst.査読有りE94-D(8)p.1683 - 16892011年08月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)ISSN:1745-1361

条件付きエントロピー最小化基準に基づくマルチカーネル学習を用いた発話スタイル変動に頑健な話者照合

小川哲司,日野英逸,村田昇,小林哲則

情報処理学会研究報告2011-SLP-87(3)p.1 - 62011年07月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Speaker recognition using multiple kernel learning based on conditional entropy minimization

Tetsuji Ogawa, Hideitsu Hino, Nima Reyhani, Noboru Murata, and Tetsunori Kobayashi

Proc. ICASSP2011査読有りp.2204 - 22072011年05月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

発話を単位としたディリクレ過程混合モデルに基づく話者クラスタリング

俵直弘,渡部晋治,小川哲司,小林哲則

日本音響学会講演論文集2011(春季)p.41 - 442011年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

マルチカーネル学習を用いた話者認識における最適化の検討

小川哲司,日野英逸,Nima Reyhani,村田昇,小林哲則

情報処理学会研究報告2010-SLP-84(27)p.1 - 62010年12月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

正方形マイクロホンアレイによる音源分離技術

矢頭隆,森戸誠,山田圭,小川哲司

情報処理51(11)p.1410 - 14162010年11月-

CiNii

詳細

掲載種別:研究論文(学術雑誌)ISSN:0447-8053

CENSREC-1-AV: An audio-visual corpus for noisy bimodal speech recognition

Satoshi Tamura, Chiyomi Miyajima, Norihide Kitaoka, Takeshi Yamada, Satoru Tsuge, Tetsuya Takiguchi, Kazumasa Yamamoto, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Masakiyo Fujimoto, Shigeki Matsuda, Tetsuji Ogawa, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura

Proc. AVSP2010査読有り2010年09月-

link

詳細

掲載種別:研究論文(国際会議プロシーディングス)

情報論的な最適化に基づくマルチカーネル学習を用いた話者認識

小川哲司,日野英逸,Nima Reyhani,村田昇,小林哲則

日本音響学会講演論文集2010(秋季)p.81 - 842010年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Development of zonal beamformer and its application to robot audition

Nobuaki Tanaka, Tetsuji Ogawa, Kenzo Akagiri, and Tetsunori Kobayashi

Proc. EUSIPCO2010査読有り2010年08月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:2219-5491

雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築

田村哲嗣,宮島千代美,北岡教英,武田一哉,山田武志,滝口哲也,柘植覚,山本一公,西浦敬信,中山雅人,傳田遊亀,藤本雅清,松田繁樹,小川哲司,黒岩眞吾,中村哲

情報処理学会研究報告2010-SLP-82(7)p.1 - 62010年07月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:2186-2583

Speech enhancement using a square microphone array in the presence of directional and diffuse noise

Tetsuji Ogawa, Shintaro Takada, Kenzo Akagiri, Tetsunori Kobayashi

IEICE Trans. Fundamentals査読有りE93-A(5)p.926 - 9352010年05月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)ISSN:0916-8508

CENSREC-1-AV: マルチモーダル音声認識コーパスの構築

田村哲嗣,宮島千代美,北岡教英,武田一哉,山田武志,滝口哲也,柘植覚,山本一公,西浦敬信,中山雅人,傳田遊亀,藤本雅清,松田繁樹,小川哲司,黒岩眞吾,中村哲

日本音響学会講演論文集2010(春季)p.219 - 2202010年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

会話ロボットとその聴覚機能

藤江真也,小川哲司,小林哲則

日本ロボット学会誌28(1)p.23 - 262010年01月-

CiNii

詳細

掲載種別:研究論文(学術雑誌)ISSN:0289-1824

Influence of Lombard effect: accuracy analysis of simulation-based assessments of noisy speech recognition systems for various recognition conditions

Tetsuji Ogawa, Tetsunori Kobayashi

IEICE Trans. Inf. & Syst.査読有りE92-D(11)p.2244 - 22522009年11月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)ISSN:0916-8532

Robot auditory system using head-mounted square microphone array

Kosuke Hosoya, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. IROS2009査読有りp.2736 - 27412009年10月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:2153-0858

ロンバード発声音声コーパスの設計と評価

小川哲司,川野弘,西浦敬信,山田武志,北岡教英,小林哲則

日本音響学会講演論文集2009(秋季)p.141 - 1442009年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

ゾーン強調型ビームフォーマの構築

田中信秋,細谷耕佑,小川哲司,小林哲則

日本音響学会講演論文集2009(秋季)p.153 - 1542009年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

音声認識利用者の発声方法誘導を行うエキスパートシステムの実装と評価

網田康裕,中野鐵兵,小川哲司,菊池英明,小林哲則

日本音響学会講演論文集2009(秋季)p.229 - 2302009年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

ロボット頭頂部に設置した小型正方形マイクロホンアレイによる音源定位

細谷耕佑,小川哲司,小林哲則

日本音響学会講演論文集2009(秋季)p.775 - 7782009年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

Direction-of-arrival estimation under noisy condition using four-line omni-directional microphones mounted on a robot head

Tetsuji Ogawa, Kosuke Hosoya, Kenzo Akagiri, Tetsunori Kobayashi

Proc. EUSIPCO2009査読有り2009年08月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

CENSREC-1-C: An evaluation framework for voice activity detection under noisy environments

N. Kitaoka, T. Yamada, S. Tsuge, C. Miyajima, K. Yamamoto, T. Nishiura, M. Nakayama, Y. Denda, M. Fujimoto, T. Takiguchi, T. Tamura, S. Matsuda, T. Ogawa, S. Kuroiwa, K. Takeda, S. Nakamura

Acoust. Sci., & Tech.査読有り30(5)p.363 - 3712009年08月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)

連続円動作の認識に基づくメニュー項目の選択法

橋口拓弥,藤江真也,小川哲司,中野鐵兵,小林哲則

画像の理解・認識シンポジウム(MIRU2009)予稿集IS3-70p.1846 - 18502009年07月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

騒音下音声認識システム評価におけるロンバード効果の影響の検証−ロンバード発声適応モデルを用いた評価−

小川哲司,小林哲則

日本音響学会講演論文集2009(春季)p.175 - 1762009年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

ロボットのためのハンズフリー音声認識システム

細谷耕介,小川哲司,藤江真也,渡辺大地,市川悠飛,谷山輝,小林哲則

情報処理学会研究報告2008-SLP-74p.7 - 122008年12月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:09196072

Class Distance Weighted Locality Preserving Projection for Automatic Age Estimation

Kazuya Ueki, Masakazu Miya, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. BTAS2008査読有り2008年10月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

雑音下音声認識評価ワーキンググループ活動報告:認識に影響する要因の個別評価環境(3)

北岡教英,山田武志,滝口哲也,柘植覚,山本一公,宮島千代美,西浦敬信,中山雅人,傳田遊亀,藤本雅清,田村哲嗣,松田繁樹,小川哲司,黒岩眞吾,武田一哉,中村哲

情報処理学会研究報告2008-SLP-73p.41 - 462008年10月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0919-6072

CENSREC-4: Development of Evaluation Framework for Distant-Talking Speech Recognition Under Reverberant Environments

Masato Nakayama, Takanobu Nishiura, Yuki Denda, Norihide Kitaoka, Kazumasa Yamamoto, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajuma, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Tetsuji Ogawa, Shigeki Matsuda, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura

Proc. Interspeech2008査読有りp.968 - 9712008年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Ears of the Robot: Noise Reduction Using Four-Line Ultra-Micro Omni-Directional Microphones Mounted on A Robot Head

Tetsuji Ogawa, Hirofumi Takeuchi, Shintaro Takada, Kenzo Akagiri, and Tetsunori Kobayashi

Proc. EUSIPCO2008査読有り2008年08月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:2219-5491

HMMの尤度パターンを利用したリスコアリングにおける次元圧縮法の検討

小川哲司,小林哲則

電子情報通信学会技術研究報告 (SP)108(142)p.73 - 782008年07月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

Ears of the Robot: Direction of Arrival Estimation Based on Pattern Recognition Using Robot-Mounted Microphones

Naoya Mochiki, Tetsuji Ogawa, Tetsunori Kobayashi

IEICE Trans on Information and Systems査読有りE91-D(5)p.1522 - 15302008年05月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)ISSN:0916-8532

Speech Enhancement Using Square Microphone Array for Mobile Devices

Shintaro Takada, Tetsuji Ogawa, Kenzo Akagiri, Tetsunori Kobayashi

Proc. ICASSP2008査読有りp.313 - 3162008年03月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:1520-6149

残響下音声認識評価基盤(CENSREC-4)の構築

西浦敬信,中山雅人,傳田遊亀,北岡教英,山本一公,山田武志,藤本雅清,柘植覚,宮島千代美,滝口哲也,田村哲嗣,小川哲司,松田繁樹,黒岩眞吾,武田一哉,中村哲

日本音響学会講演論文集2008(春季)p.175 - 1782008年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

ロボット頭部に設置した4系統小型無指向性マイクロホンによるハンズフリー音声認識

竹内寛史,高田晋太郎,小川哲司,赤桐健三,小林哲則,森戸誠

日本音響学会講演論文集2008(春季)p.155 - 1582008年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

HMM における尤度パターンの非対称性を利用した音声認識

加藤健一,小川哲司,小林哲則

日本音響学会講演論文集2008(春季)p.209 - 2122008年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

雑音下音声認識評価ワーキンググループ活動報告:認識に影響する要因の個別評価環境(2)

北岡教英,山田武志,滝口哲也,柘植覚,山本一公,宮島千代美,西浦敬信,中山雅人,傳田遊亀,藤本雅清,田村哲嗣,松田繁樹,小川哲司,黒岩眞吾,武田一哉,中村哲

情報処理学会研究報告2007-SLP-69p.1 - 62007年12月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0919-6072

Sound Source Separation using Null-Beamforming and Spectral Subtraction for Mobile Devices

Shintaro Takada, Satoshi Kanba, Tetsuji Ogawa, Kenzo Akagiri, Tetsunori Kobayashi

Proc. WASPAA2007査読有り2007年10月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:1931-1168

Ears of the Robot: Three Simultaneous Speech Segregation and Recognition Using Robot-Mounted Microphones

Naoya Mochiki, Tetsuji Ogawa, Tetsunori Kobayashi

IEICE Letter on Information and Systems査読有りE90-D(9)p.1465 - 14682007年09月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)ISSN:0916-8532

シミュレーションに基づく騒音下音声認識システム評価におけるロンバード効果の影響の検証−複数の認識タスク,騒音レベルに対する評価−

小川哲司,倉持公壮,小林哲則

日本音響学会講演論文集2007(秋季)p.195 - 1982007年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

テンプレート群からの確率的距離を用いた階層的音声認識の検討

加藤健一,小川哲司,小林哲則

日本音響学会講演論文集2007(秋季)p.147 - 1502007年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

指向性雑音と拡散性雑音の混在する環境を対象とした携帯端末向け音声強調の検討

高田晋太郎,小川哲司,赤桐健三,小林哲則

日本音響学会講演論文集2007(秋季)p.743 - 7462007年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

マクロな時間構造を持つテンプレート群からの確率的距離を用いた階層型音声認識

加藤健一,小川哲司,小林哲則

電子情報通信学会技術研究報告 (SP)107(116)p.79 - 842007年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

Adequency Analysis of Simulation-Based Assessment of Speech Recognition System

Tetsuji Ogawa, Satoshi Kanba, Tetsunori Kobayashi

Proc. ICASSP2007査読有りp.1153 - 11572007年04月-

DOIScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:1520-6149

空間フィルタとポストフィルタを用いた背景雑音抑圧

高田晋太郎,小川哲司,赤桐健三,小林哲則

日本音響学会講演論文集2007(春季)p.575 - 5762007年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

重み付きHLDA を用いた相補的識別器の構成

加藤健一,小川哲司,小林哲則

日本音響学会講演論文集2007(春季)p.39 - 402007年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合

加藤健一,小川哲司,小林哲則

情報処理学会研究報告2006(136 (SLP-64))p.203 - 2082006年12月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0919-6072

対話ロボットの動作に頑健な頭部ジェスチャ認識

中島慶,江尻康,藤江真也,小川哲司,松坂要佐,小林哲則

電子情報通信学会論文誌査読有りJ89-D(7)p.1514 - 15222006年09月-

CiNii

詳細

掲載種別:研究論文(学術雑誌)ISSN:1880-4535

Manifold HLDA and Its Application to Robust Speech Recognition

Toshiaki Kubo, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. ICSLP2006査読有りp.1949 - 19532006年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

A Method for Solving the Permutation Problem of Frequency-Domain BSS Using Reference Signal

Takashi Isa, Toshiyuki Sekiya, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. EUSIPCO2006査読有り2006年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:2219-5491

Source Separation Using Multiple Directivity Patterns Produced by ICA-based BSS

Takashi Isa, Toshiyuki Sekiya, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. EUSIPCO2006査読有り2006年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:2219-5491

シミュレーションに基づく騒音環境下音声認識におけるロンバード効果の 影響

小川哲司, 勘場智之, 小林哲則

日本音響学会講演論文集2006(秋季)p.101 - 1022006年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

時間連続性を利用した音源分離処理の高精度化

勘場智之, 小川哲司, 赤桐健三, 小林哲則

日本音響学会講演論文集2006(秋季)p.491 - 4922006年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

少数のマイクロホンを用いた携帯端末向け音源分離

高田晋太郎, 勘場智之, 小川哲司, 赤桐健三, 小林哲則

日本音響学会講演論文集2006(秋季)p.493 - 4942006年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

減算型アレイ処理とスペクトラルサブトラクションを用いた音源分離技術とその携帯電話への応用

高田晋太郎, 勘場智之, 小川哲司, 赤桐健三, 小林哲則

電子情報通信学会技術研究報告 (SP)106(123)p.7 - 122006年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

シミュレーションに基づく音声認識システム評価の妥当性の検証

小川哲司, 勘場智之, 小林哲則

電子情報通信学会技術研究報告 (SP)106(123)p.1 - 62006年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

Genetic Algorithm Based Optimization of Partly-Hidden Markov Model Structure Using Discriminative Criterion

Tetsuji Ogawa, Tetsunori Kobayashi

IEICE Trans on Information and Systems査読有りE89-D(3)p.939 - 9452006年03月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)ISSN:0916-8532

ロボット頭部に設置したマイクロホンによる環境変動に頑健な音源定位

久保俊明,持木南生也,小川哲司,小林哲則

人工知能学会研究会資料SIG-Challenge-0522p.89 - 942005年10月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Optimizing the Structure of Partly-Hidden Markov Models Using Weighted Likelihood-Ratio Maximization Criterion

Tetsuji Ogawa, Tetsunori Kobayashi

Proc. Interspeech2005査読有りp.3353 - 33562005年09月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

A Method for Solving the Permutation Problem of Frequency-domain Blind Source Separation using Reference Signal

Takashi Isa, Toshiyuki Sekiya, Tetsuji Ogawa and Tetsunori Kobayashi

Biennial on DSP for in-Vehicle and Mobile Systems査読有り2005年09月-

詳細

掲載種別:研究論文(国際会議プロシーディングス)

ロボット頭部に設置した4系統指向性マイクロホンによる音源定位におけるHLDA利用の効果

久保俊明, 持木南生也, 小川哲司, 小林哲則

日本音響学会講演論文集2005(秋季)p.717 - 7182005年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

BSSとスペクトラルサブトラクションの多段処理による音源分離

伊佐崇,関矢俊之,小川哲司,小林哲則

日本音響学会講演論文集2005(秋季)p.705 - 7062005年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1880-7658

An extension of the state-observation dependency in partly hidden Markov models and its application to continuous speech recognition

Tetsuji Ogawa and Tetsunori Kobayashi

Systems and Computers in Japan, Wiley36(8)p.31 - 392005年07月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)

Extension of Hidden Markov Models for Multiple Candidates and its Application to Gesture Recognition

Yosuke Sato, Tetsuji Ogawa and Testunori Kobayashi

IEICE Trans on Information and Systems査読有りE88-D(6)p.1239 - 12472005年06月-

DOIScopus

詳細

掲載種別:研究論文(学術雑誌)ISSN:0916-8532

マイク間のスペクトル強度比を利用した音源定位におけるHLDA利用の効果

久保俊明, 持木南生也, 小川哲司, 小林哲則

電子情報信学会技術研究報告 (SP)105(133)p.37 - 422005年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

参照信号によるパーミュテーション問題解決とSMDPの統合による周波数領域BSSの性能向上

伊佐崇,関矢俊之,小川哲司,小林哲則

電子情報信学会技術研究報告 (SP)105(133)p.31 - 362005年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

識別的基準と遺伝的アルゴリズムに基づく隠れ部分マルコフモデルの構造の最適化

小川哲司, 小林哲則

電子情報信学会技術研究報告 (SP)105(132)p.37 - 422005年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

重み付き尤度比最大基準に基づく部分隠れマルコフモデルの構造の最適化

小川哲司,小林哲則

日本音響学会講演論文集2005(春季)p.131 - 1322005年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

ロボット頭部に設置した4系統指向性マイクロホンによる音源定位

持木南生也, 関矢俊之, 小川哲司, 小林哲則

日本音響学会講演論文集2005(春季)p.609 - 6102005年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

ロボット頭部に設置した4系統指向性マイクロフォンによる音源定位および混合音声認識

持木南生也, 関矢俊之, 小川哲司, 小林哲則

人工知能学会研究会資料SIG-Challenge-0420-4p.21 - 272004年12月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Recognition of three simultaneous utterance of speech by four-line directivity microphone mounted on head of robot

Naoya Mochiki, Toshiyuki Sekiya, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. ICSLP2004査読有り2p.821 - 8242004年10月-

linkScopus

詳細

掲載種別:研究論文(国際会議プロシーディングス)

複数の指向特性を利用した音源分離における音源定位との統合

関矢俊之, 小川哲司, 小林哲則

日本音響学会講演論文集2004(秋季)p.617 - 6182004年10月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

部分隠れマルコフモデルにおける状態・出力依存関係の拡張 と連続音声認識への適用

小川哲司,小林哲則

電子情報通信学会論文誌査読有りJ87-DII(6)p.1216 - 12232004年06月-

CiNii

詳細

掲載種別:研究論文(学術雑誌)ISSN:0915-1923

ロボット頭部に設置した4系統指向性マイクロホンによる混合音声認識

持木南生也, 関矢俊之, 小川哲司, 小林哲則

日本音響学会講演論文集2004(春季)p.95 - 962004年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

雑音環境下における階層的音源分離の評価

関矢俊之, 澤田知寛, 小川哲司, 小林哲則

日本音響学会講演論文集2004(春季)p.99 - 1002004年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

階層的音源分離に基づく混合音声の認識

澤田知寛, 関矢俊之, 小川哲司, 小林哲則

人工知能学会研究会資料SIG-Challenge-0318-5p.27 - 322003年11月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)

Speech Recognition of Double Talk using SAFIA-based Audio Segregation

Toshiyuki Sekiya, Tetsuji Ogawa, Tetsunori Kobayashi

Proc. EUROSPEECH2003査読有りp.1285 - 12882003年09月-

link

詳細

掲載種別:研究論文(国際会議プロシーディングス)

Hybrid Modeling of PHMM and HMM for Speech Recognition

Tetsuji Ogawa, Tetsunori Kobayashi

Proc. ICASSP2003査読有り1p.140 - 1432003年05月-

DOI

詳細

掲載種別:研究論文(国際会議プロシーディングス)ISSN:1520-6149

マイクロフォンアレーを用いた混合音声認識

関矢俊之, 小川哲司, 小林哲則

電子情報信学会技術研究報告 (SP)103(93)p.13 - 182003年05月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

SAFIAによる同時発話音声の認識

関矢俊之, 芹沢新, 小川哲司, 小林哲則

日本音響学会講演論文集2003(春季)p.19 - 202003年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

Generalization of State-Observation-Dependency in Partly Hidden Markov Models

Tetsuji Ogawa, Tetsunori Kobayashi

Proc. ICSLP2002査読有りp.2673 - 26762002年09月-

link

詳細

掲載種別:研究論文(国際会議プロシーディングス)

部分隠れマルコフモデルの拡張と連続音声認識による評価

小川哲司, 小林哲則

日本音響学会講演論文集2002(秋季)p.51 - 522002年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

部分隠れマルコフモデルによる連続音声認識

小川哲司, 小林哲則

電子情報信学会技術研究報告 (SP)102(159)p.25 - 302002年06月-

CiNii

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:0913-5685

複数の話者依存モデルを用いた話者空間表現に基づく話者適応

牛久祐輔,小川哲司,小林哲則

日本音響学会講演論文集2001(秋季)p.129 - 1302001年10月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

音素単位の部分隠れマルコフモデルにおける状態・出力依存関係の一般化

小川哲司,小林哲則

日本音響学会講演論文集2000(秋季)p.19 - 202000年09月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

部分隠れマルコフモデルにおける状態・出力依存関係の一般化

小川哲司,古山純子,小林哲則

日本音響学会講演論文集2000(春季)p.155 - 1562000年03月-

詳細

掲載種別:研究論文(研究会,シンポジウム資料等)ISSN:1340-3168

書籍等出版物

人工知能学大辞典(話者認識・話者照合)

人工知能学会(編)(分担執筆)

共立出版2017年 07月-

詳細

事典・辞書総ページ数:1600担当ページ数:791--793ISBN:978-4-320-12420-2

音響キーワードブック(話者ダイアライゼーション)

日本音響学会(編集)(分担執筆)

コロナ社2016年 03月-

詳細

事典・辞書総ページ数:494担当ページ数:434--435ISBN:9784339008807ASIN:433900880X

講演・口頭発表等

定置網漁の日単位漁獲量予測モデリングにおける学習データ量と予測性能の関係の調査

堀内優佳,幸加木裕也,小林哲則,小川哲司

日本水産学会秋季大会2018年09月

詳細

国内会議口頭発表(一般)開催地:広島県・東広島市

情報工学から考えるIoTと畜産の未来

小川哲司

日本繁殖生物学会若手サマーセミナー合宿招待有り2018年08月

詳細

国内会議口頭発表(招待・特別)開催地:茨城県・笠間市

状態空間モデルを用いた定置網漁のための日単位漁獲量予測

小川哲司

マリンITワークショップ2018年08月

詳細

国内会議口頭発表(一般)開催地:北海道・函館市

Toward proactive forecasting for smart maintenance of infrastructure equipment and support for primary industry

Tetsuji Ogawa

7th Research Seminar in E-JUST(Egypt-Japan University of Science and Technology (E-JUST))招待有り2018年03月

詳細

国際会議口頭発表(招待・特別)開催地:Alexandria

定置網漁における漁獲過程モデルを用いたシロサケの日単位漁獲量予測

幸加木裕也,俵直弘,小林哲則,橋本和夫,小川哲司

日本水産学会春季大会2018年03月

詳細

国内会議口頭発表(一般)開催地:東京都・品川区

映像情報を用いた分娩時の牛の状態推定

沖本祐典,菅原一真,中野鐵兵,赤羽誠,小林哲則,小川哲司

日本畜産学会 第124回大会2018年03月

詳細

国内会議口頭発表(一般)開催地:東京都・文京区

人工知能研究の進展と課題

小川哲司

鹿児島ITビジネス研究会招待有り2017年09月

詳細

国内会議講義等開催地:鹿児島県・鹿児島市

深層学習を用いた出現音素の偏りに頑健な話者照合手法

佐藤洋輔,小川哲司,堀内靖雄,黒岩眞吾

電子情報通信学会総合大会2016年03月

詳細

国内会議ポスター発表開催地:福岡県・福岡市

High resolution traffic maps generation using cellular big data

Ahmed El-Mahdy, Essam Algizawy, Tetsuji Ogawa, Hisham Shishiny, Mohamed Badder, Keiji Kimura

NetMob20152015年04月

詳細

国際会議ポスター発表開催地:Boston

階層的発話生成モデルを用いた話者クラスタリングのためのフルベイズモデル推定手法の比較

俵直弘,小川哲司,渡部晋治,小林哲則

第14回情報論的学習理論ワークショップ(IBIS2011)2011年11月

詳細

国内会議ポスター発表開催地:奈良県・奈良市

クラス間距離に基づく判別分析と年齢推定システムへの適用

小川哲司,小林哲則

第13回情報論的学習理論ワークショップ(IBIS2010)2010年11月

詳細

国内会議ポスター発表開催地:東京都・目黒区

Sound source separation system and acoustic signal acquisition device

Tetsuji Ogawa

Leading Edge Japan 20092009年03月

詳細

国際会議公開講演開催地:New York

Multi-layer audio segregation and its application to double talk recognition

Toshiyuki Sekiya, Tomohiro Sawada, Tetsuji Ogawa, Tetsunori Kobayashi

SWIM, Lectures by Masters in Speech Processing2004年01月

詳細

国際会議口頭発表(一般)開催地:Honolulu

特許

整理番号:566

認識器構築システム、認識器構築方法、組立サービス提供システム、およびプログラム(日本)

小林 哲則, 中野 鐵兵, 藤江 真也, 小川 哲司

特願2006- 39907、特開2007-219175

整理番号:665

エコーキャンセラ及びエコーキャンセル方法(日本)

小林 哲則, 赤桐 健三, 藤江 真也, 小川 哲司

特願2006-331686、特開2008-147914

整理番号:948

音源分離装置、方法及びプログラム(日本, 中華人民共和国, アメリカ)

小林 哲則, 赤桐 健三, 小川 哲司

特願2009-282024、特開2011-124872、特許第4986248号

整理番号:949

音源分離装置、方法及びプログラム(日本)

赤桐 健三, 小川 哲司, 小林 哲則

特願2009-282025、特開2011-124873、特許第5170465号

整理番号:950

音源分離装置、プログラム及び方法(日本)

小林 哲則, 赤桐 健三, 小川 哲司

特願2009-282026、特開2011-123370、特許第5105336号

整理番号:1928

予測装置、予測方法および予測プログラム(日本)

小林 哲則, 小川 哲司, 森岡 幹

特願2017-135374、特開2019-016324

外部研究資金

科学研究費採択状況

研究種別:基盤研究(B)

動画に対する深い意味的注釈の付与

2017年04月-2021年03月

研究分野:図書館情報学・人文社会情報学

配分額:¥16250000

研究種別:挑戦的萌芽研究

人の発声機構を考慮した話者固有の情報の抽出と話者照合への応用に関する研究

2016年04月-2019年03月

研究分野:知覚情報処理

配分額:¥3380000

研究種別:

システム協調型適応学習に基づくパターン認識システムの全体最適化に関する研究

2013年-0月-2016年-0月

配分額:¥4810000

研究種別:

クラスタリングと教師なし適応学習に基づく時系列パターン認識システムの効率的な改善

2011年-0月-2013年-0月

配分額:¥3510000

研究種別:

モデル構造の逐次最適化機能を有するオンライン適応型パターン認識に関する研究

配分額:¥3380000

研究種別:基盤研究(B)

リズムある会話を可能とするコミュニケーションロボットに関する研究

2008年-2010年

研究分野:知覚情報処理・知能ロボティクス

配分額:¥15990000

研究種別:

相補的な識別器の生成とその統合に基づくパターン認識に関する研究

配分額:¥2730000

研究種別:

実世界劣化音声コーパスに基づく音声強調法の研究

配分額:¥18980000

研究種別:

状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

配分額:¥2500000

研究種別:基盤研究(B)

言語・パラ言語の生成・理解能力を有する会話システムに関する研究

2003年-2006年

研究分野:知覚情報処理・知能ロボティクス

配分額:¥13300000

研究種別:

動画に対する深い意味的注釈の付与

2017年-0月-2021年-0月

配分額:¥16250000

研究種別:

人の発声機構を考慮した話者固有の情報の抽出と話者照合への応用に関する研究

2016年-0月-2019年-0月

配分額:¥3380000

研究資金の受入れ状況

提供機関:総務省制度名:戦略的情報通信研究開発推進制度(SCOPE)・地域ICT振興型研究開発

局所的海洋データを活用した漁業の効率化の研究開発2017年04月-2020年03月

分担

学内研究制度

特定課題研究

部分隠れマルコフモデルによる自然発話音声認識

2004年度

研究成果概要: 本研究では、音声認識に用いる確率モデルとして一般的に用いられている隠れマルコフモデル(Hidden Markov Model; HMM)に代わる表現能力の高い確率モデルとして、部分隠れマルコフモデル(Partly-Hidden ... 本研究では、音声認識に用いる確率モデルとして一般的に用いられている隠れマルコフモデル(Hidden Markov Model; HMM)に代わる表現能力の高い確率モデルとして、部分隠れマルコフモデル(Partly-Hidden Markov Model; PHMM)を提案している。このPHMMは、状態と出力双方が過去の出力に依存する枠組みであるが、その構造は全てのモデルカテゴリで共通なものを用いてきた。そこで本年度は,重みつき尤度比最大基準に基づき、PHMM における状態と出力間の依存構造をモデルカテゴリ毎に最適に選択することを試みた。 尤度比最大化に基づくモデル構造選択の枠組みでは、正解カテゴリと不正解カテゴリが与える対数尤度の差を直接計算したものを目的関数として導入し、その値を最大にするようなモデル構造を選択する。ここで、尤度比を改善しても認識結果が変わりにくい、尤度比の値が大きな値を持つデータより、それが0に近い値を持つデータを対象として尤度比を改善することが重要であるため、尤度比の値が小さいときはその値をそのまま用い、尤度比の値が大きいときはある閾値で打ち切るように重み付けを行った。この重み付けされた尤度比を重みつき尤度比と呼び、ここでは重みつき尤度比を最大化するようにモデル構造の選択を行った。また本手法では、各々のカテゴリに帰属するデータに対して重みつき尤度比を最大化するのではなく、全てのカテゴリに対して取り得るモデル構造の組み合わせを考え、生成される膨大な数のモデル構造の組み合わせに対して重みつき尤度比を最大化する。そして、最大の重みつき尤度比を与える構造の組み合わせを、最適な構造と考える。しかし、このような膨大なパターンに対する全探索は現実的ではなく、遺伝的アルゴリズムを適用し、全探索おける近似解を与えることを試みた。 学会講演音声を対象とする連続音声認識実験により提案するモデル構造選択手法の有効性を評価したところ、モデル構造を行わないPHMMの誤りを削減することが示された。

エリア収音と深層学習を用いた高速・高精度・低歪の雑音除去フィルタ構成法

2017年度

研究成果概要:拡散性雑音が重畳された音声に対して低歪で高精度な雑音抑圧を実現する方式について検討を行った.そのために,申請者が研究を続けてきた音源分離技術であるエリア収音により目的音と拡散性雑音を分離した後,目的音に残留した雑音成分を抑圧するフ...拡散性雑音が重畳された音声に対して低歪で高精度な雑音抑圧を実現する方式について検討を行った.そのために,申請者が研究を続けてきた音源分離技術であるエリア収音により目的音と拡散性雑音を分離した後,目的音に残留した雑音成分を抑圧するフィルタの推定法を提案した.具体的には,エリア収音により分離した目的音と雑音のパワースペクトルから深層ニューラルネットワークによって線形フィルタの係数(厳密にはpriori SNR)を推定した.拡散性雑音下での雑音抑圧性能を雑音抑圧率および対数スペクトル距離により評価したところ,提案手法は双方の尺度で従来のマルチチャネルウィナーフィルタの性能を改善した.

メタ認知機能を有するパターン認識システムの構成法に関する研究

2016年度

研究成果概要: 人が持つメタ認知機能(知っているか否かを知る,どの程度知っているかを知る機能)を模倣することで,データの収集だけに頼らずに未知の入力に対して頑健に高い性能を与えるパターン認識方式の確立を目指す.本課題では,雑音下音声認識での評価... 人が持つメタ認知機能(知っているか否かを知る,どの程度知っているかを知る機能)を模倣することで,データの収集だけに頼らずに未知の入力に対して頑健に高い性能を与えるパターン認識方式の確立を目指す.本課題では,雑音下音声認識での評価を通じ,「メタ認知機能を有するパターン認識」の基本となる認識性能予測技術およびマルチストリーム型パターン認識アルゴリズムに焦点を当てて検討を行った. 異なる現象を扱うパターン認識システムをDNNにより多数構築しておき,そのうち最適なシステムをDNNの出力(事後確率)の時間変化量および自己符号化器の復元誤差に基づき選択して用いることで,環境変動に頑健な認識を実現した.

エリア収音と敵対的生成ネットワークを用いた多様な雑音に頑健な音声強調

2018年度共同研究者:俵 直弘

研究成果概要:エリア収音により生じた非線形歪を敵対的デノイジングオートエンコーダ (ADAE) により補正するポストフィルタ法を提案した.エリア収音は時間周波数マスキングに基づき目的音と妨害音を高精度に分離可能な技術であるが,非線形信号処理特有...エリア収音により生じた非線形歪を敵対的デノイジングオートエンコーダ (ADAE) により補正するポストフィルタ法を提案した.エリア収音は時間周波数マスキングに基づき目的音と妨害音を高精度に分離可能な技術であるが,非線形信号処理特有の不快な歪が発生するという問題がある.そこで,単チャネル音源強調において有効なADAEを用いて非線形歪を低減することを試みたところ,音質改善に有効であることが示された.また,分離処理前の観測信号や雑音情報をADAEの補助入力として用いるnoise-aware学習の枠組みを導入することで,強調信号の更なる品質改善が得られた.

現在担当している科目

科目名開講学部・研究科開講年度学期
工学系のモデリングA基幹理工学部2019春学期
工学系のモデリングA 【前年度成績S評価者用】基幹理工学部2019春学期
情報通信基礎基幹理工学部2019春学期
情報通信基礎 【前年度成績S評価者用】基幹理工学部2019春学期
情報理工学実験A基幹理工学部2019秋学期
情報理工学実験A 【前年度成績S評価者用】基幹理工学部2019秋学期
アルゴリズムとデータ構造A基幹理工学部2019春学期
アルゴリズムとデータ構造A基幹理工学部2019春学期
アルゴリズムとデータ構造 13前再基幹理工学部2019春学期
アルゴリズムとデータ構造A 【前年度成績S評価者用】基幹理工学部2019春学期
アルゴリズムとデータ構造 13前再 【前年度成績S評価者用】基幹理工学部2019春学期
情報理工学実験B基幹理工学部2019春学期
情報理工学実験B 【前年度成績S評価者用】基幹理工学部2019春学期
卒業論文A基幹理工学部2019通年
卒業論文A  【前年度成績S評価者用】基幹理工学部2019通年
卒業論文B基幹理工学部2019通年
卒業論文B  【前年度成績S評価者用】基幹理工学部2019通年
プロジェクト研究A基幹理工学部2019春学期
プロジェクト研究B基幹理工学部2019秋学期
論理回路基幹理工学部2019春学期
論理回路基幹理工学部2019春学期
論理回路 【前年度成績S評価者用】基幹理工学部2019春学期
論理回路  【前年度成績S評価者用】基幹理工学部2019春学期
情報通信実験A基幹理工学部2019秋学期
情報通信実験A 【前年度成績S評価者用】基幹理工学部2019秋学期
情報通信実験B基幹理工学部2019春学期
情報通信実験B 【前年度成績S評価者用】基幹理工学部2019春学期
情報通信実験C基幹理工学部2019秋学期
情報通信実験C 【前年度成績S評価者用】基幹理工学部2019秋学期
卒業論文A基幹理工学部2019通年
卒業論文A  【前年度成績S評価者用】基幹理工学部2019通年
卒業論文B基幹理工学部2019通年
卒業論文B  【前年度成績S評価者用】基幹理工学部2019通年
プロジェクト研究A基幹理工学部2019春学期
プロジェクト研究B基幹理工学部2019秋学期
Research Project B基幹理工学部2019春学期
Research Project B基幹理工学部2019春学期
Research Project B 【前年度成績S評価者用】基幹理工学部2019春学期
Research Project B 【S Grade】基幹理工学部2019春学期
Research Project C基幹理工学部2019秋学期
Research Project C基幹理工学部2019秋学期
Research Project C 【前年度成績S評価者用】基幹理工学部2019秋学期
Research Project C 【S Grade】基幹理工学部2019秋学期
Pattern Recognition and Machine Learning基幹理工学部2019春学期
Pattern Recognition and Machine Learning基幹理工学部2019春学期
Perceptual Computing基幹理工学部2019秋学期
Perceptual Computing基幹理工学部2019秋学期
Perceptual Computing基幹理工学部2019秋学期
Research Project A基幹理工学部2019秋学期
Research Project A基幹理工学部2019秋学期
Research Project D基幹理工学部2019春学期
Research Project D基幹理工学部2019春学期
Logic Circuits基幹理工学部2019秋学期
Logic Circuits基幹理工学部2019秋学期
Logic Circuits基幹理工学部2019秋学期
Logic Circuits基幹理工学部2019秋学期
Logic Circuits [S Grade]基幹理工学部2019秋学期
Computer Science and Communications Engineering Laboratory A基幹理工学部2019秋学期
Computer Science and Engineering Laboratory基幹理工学部2019秋学期
Computer Science and Engineering Laboratory基幹理工学部2019秋学期
Computer Science and Communications Engineering Laboratory A [S Grade]基幹理工学部2019秋学期
Introduction to Computers and Networks基幹理工学部2019春学期
修士論文(情報・通信)大学院基幹理工学研究科2019通年
Research on Media Intelligence大学院基幹理工学研究科2019通年
メディアインテリジェンス研究大学院基幹理工学研究科2019通年
Perceptual Computing大学院基幹理工学研究科2019秋学期
知覚情報システム大学院基幹理工学研究科2019秋学期
知覚情報システム 大学院基幹理工学研究科2019秋学期
Special Laboratory A in Computer Science and Communications Engineering大学院基幹理工学研究科2019春学期
情報理工・情報通信特別実験A大学院基幹理工学研究科2019春学期
Special Laboratory B in Computer Science and Communications Engineering大学院基幹理工学研究科2019秋学期
情報理工・情報通信特別実験B大学院基幹理工学研究科2019秋学期
Pattern Recognition and Machine Learning大学院基幹理工学研究科2019春学期
パターン認識と機械学習大学院基幹理工学研究科2019春学期
Seminar on Media Intelligence A大学院基幹理工学研究科2019春学期
メディアインテリジェンス演習A大学院基幹理工学研究科2019春学期
Seminar on Media Intelligence B大学院基幹理工学研究科2019秋学期
メディアインテリジェンス演習B大学院基幹理工学研究科2019秋学期
Seminar on Media Intelligence C大学院基幹理工学研究科2019春学期
メディアインテリジェンス演習C大学院基幹理工学研究科2019春学期
Seminar on Media Intelligence D大学院基幹理工学研究科2019秋学期
メディアインテリジェンス演習D大学院基幹理工学研究科2019秋学期
Master's Thesis (Department of Computer Science and Communications Engineering)大学院基幹理工学研究科2019通年
メディアインテリジェンス研究大学院基幹理工学研究科2019通年
情報理工・情報通信特別演習A大学院基幹理工学研究科2019春学期
情報理工・情報通信特別演習B大学院基幹理工学研究科2019秋学期