氏名

キクチ ヒデアキ

菊池 英明

職名

教授 (https://researchmap.jp/read0205443/)

所属

(人間科学部)

連絡先

メールアドレス

メールアドレス
kikuchi@waseda.jp

住所・電話番号・fax番号

住所
〒359-1192所沢市 三ヶ島2-579-15
電話番号
042-947-6843
fax番号
042-947-6843

URL等

WebページURL

https://sites.google.com/view/kikuchihideaki/home

http://www.f.waseda.jp/kikuchi/

研究者番号
70308261

本属以外の学内所属

兼担

人間科学学術院(大学院人間科学研究科)

理工学術院(大学院基幹理工学研究科)

研究院(研究機関)/附属機関・学校(グローバルエデュケーションセンター)

学内研究所等

知覚情報システム研究所

研究所員 2010年-2010年

空間科学研究所

研究員 2004年-2005年

音声_認識_基盤技術研究所

研究員 2005年-2009年

メディアネットワークセンター

兼任研究員 2010年-2010年

コミュニケーション科学研究所

研究員 2006年-2010年

メディアネットワークセンター

兼任研究員 2008年-2010年

応用脳科学研究所

研究所員 2010年-

波動コミュニケーション研究所

研究所員 2011年-2013年

知覚情報システム研究所

研究所員 2010年-2015年

知覚情報システム研究所

研究所員 2015年-2019年

波動場・コミュニケーション科学研究所

研究所員 2016年-

メディア研究所

研究所員 2013年-2017年

移民・エスニック文化研究所

研究所員 2013年-2018年

ことばの科学研究所

研究所員 2013年-2018年

ことばの科学研究所

研究所員 2018年-

応用脳科学研究所

研究所員 2014年-2019年

応用脳科学研究所

研究所員 2019年-

学歴・学位

学位

博士(情報科学) 早稲田大学

所属学協会

日本音響学会

人工知能学会

電子情報通信学会

情報処理学会

ヒューマンインタフェース学会

受賞

情報処理学会第53回全国大会大会優秀賞

1996年03月

研究分野

キーワード

音声科学、音声対話、ヒューマンエージェントインタラクション

科研費分類

情報学 / 人間情報学 / 知能情報学

研究テーマ履歴

音声言語をメディアとしたコミュニケーションモデルの探求およびそれを応用したヒューマンインタフェースの開発

個人研究

論文

肯定的/否定的発話態度の認識とその音声対話システムへの応用

藤江真也, 江尻康, 菊池英明, 小林哲則

電子情報通信学会論文誌J88-D-II(2)p.489 - 4982005年03月-

韻律情報を用いた発話態度認識とその対話システムへの応用

八木大三, 藤江真也, 菊池英明, 小林哲則

日本音響学会2005年春季研究発表会講演論文集p.65 - 662005年03月-

音声対話における発話の感情判別

小林季実子, 菊池英明, 白井克彦

日本音響学会2004年秋季研究発表会講演論文集p.281 - 2822004年09月-

韻律情報を利用した文章入力システムのための韻律制御モデル

大久保崇, 菊池英明, 白井克彦

日本音響学会2004年秋季研究発表会講演論文集p.133 - 1342004年09月-

早稲田大学eスクールの実践:大学教育におけるeラーニングの展望

向後千春, 松居辰則, 西村昭治, 浅田匡, 菊池英明, 金群, 野嶋栄一郎

第11回日本教育メディ ア学会年次大会発表論文集p.45 - 482004年10月-

Corpus of Spontaneous Japanese: Design, Annotation and XML Representation

Kikuo Maekawa, Hideaki Kikuchi, and Wataru Tsukahara

International Symposium on Large-scale Knowledge Resources (LKR2004)p.19 - 242004年03月-

Spoken Dialogue System Using Prosody As Para-Linguistic Information

FUJIE Shinya, YAGI Daizo, MATSUSAKA Yosuke, KIKUCHI Hideaki, KOBAYASHI Tetsunori

proc. of SP2004(International Conference Speech Prosody,2004)p.387 - 3902004年03月-

アイヌ語音声データベース

早稲田大学語学教育研究所2004年03月-

韻律情報を用いた肯定的/否定的態度の認識

八木大三, 藤江真也, 菊池英明, 小林哲則

日本音響学会2004年春季研究発表会講演論文集p.141 - 1422004年03月-

日本語話し言葉コーパス

国立国語研究所2004年03月-

Recognition of Para-Linguistic Information and Its Application to Spoken Dialogue System

FUJIE Shinya, EJIRI Yasushi, MATSUSAKA Yosuke, KIKUCHI Hideaki, KOBAYASHI Tetsunori

proc. of IEEE ASRU2003(Automatic Speech Recognition and Understanding Workshop)p.231 - 2362003年12月-

音声対話における韻律を用いた話題境界検出

大久保崇,菊池英明,白井克彦

電子情報通信学会技術報告103(519)p.235 - 2402003年12月-

日本語話し言葉コーパスの音声ラベリング

菊池英明, 前川喜久雄, 五十嵐陽介, 米山聖子, 藤本雅子

音声研究7(3)p.16 - 262003年12月-

パラ言語の理解能力を有する対話ロボット

藤江真也, 江尻康, 菊池英明, 小林哲則

情報処理学会音声言語情報処理研究会2003-SLP-48p.13 - 202003年10月-

パラ言語情報を用いた音声対話システム

藤江真也, 八木大三, 菊池英明, 小林哲則

日本音響学会2003年秋季研究発表会講演論文集p.39 - 402003年09月-

Evaluation of the effectiveness of "X-JToBI": A new prosodic labeling scheme for spontaneous Japanese speech

KIKUCHI Hideaki, MAEKAWA Kikuo

proc. of 15th Int'l Congress of Phonetic Sciencesp.579 - 5822003年08月-

Use of a large-scale spontaneous speech corpus in the study of linguistic variation

MAEKAWA Kikuo, KOISO Hanae, KIKUCHI Hideaki, YONEYAMA Kiyoko

proc. of 15th Int'l Congress of Phonetic Sciencesp.643 - 6442003年08月-

自発音声コーパスにおけるF0下降開始位置の分析

籠宮隆之,五十嵐陽介,菊池英明,米山聖子,前川喜久雄

日本音響学会2003年春季研究発表会講演論文集p.317 - 3182003年03月-

Performance of segmental and prosodic labeling of spontaneous speech

Kikuchi, H. and K. Maekawa

proc. of the ISCA & IEEE Workshop on Spontaneous Speech Processing and Recognition (SSPR2003)p.191 - 1942003年02月-

XMLを利用した『日本語話し言葉コーパス』(CSJ)の整合性検証

菊池英明, 塚原渉, 前川喜久雄

第3回話し言葉の科学と工学ワークショップ講演予稿集p.21 - 262003年02月-

『日本語話し言葉コーパス』(CSJ)のXML検索環境

塚原渉, 菊池英明, 前川喜久雄

第3回話し言葉の科学と工学ワークショップ講演予稿集p.15 - 202003年02月-

日本語自発音声韻律ラベリングスキームX-JToBIの能力検証

菊池英明, 前川喜久雄

人工知能学会言語・音声理解と対話処理研究会SIG-SLUD-A202-06p.33 - 372002年11月-

X-JToBI: An extended J_ToBI for spontaneous speech

Maekawa, K., H. Kikuchi, Y. Igarashi, and J. Venditti

proc. 7th International Congress on Spoken Language Processing (ICSLP2002)p.1545 - 15482002年10月-

自発音声韻律ラベリングスキームX-JToBIによるラベリング精度の検証

菊池英明, 前川喜久雄

日本音響学会2002年春季研究発表会講演論文集p.259 - 2602002年09月-

音声対話における心的状態変化の予測をともなうメタ発話生成機構

菊池英明, 白井克彦

情報処理学会論文誌Vol.43, No.7p.2130 - 21372002年07月-

大規模自発音声コーパス『日本語話し言葉コーパス』の仕様と作成

籠宮隆之,小磯花絵,小椋秀樹,山口昌也,菊池英明,間淵洋子,土屋菜穂子,斎藤美紀,西川賢哉,前川喜久雄

国語学会2002年度春季大会要旨集p.225 - 2322002年05月-

自発音声に対する音素自動ラベリング精度の検証

菊池英明, 前川喜久雄

日本音響学会2001年春季研究発表会講演論文集p.97 - 982002年03月-

日本語自発音声の韻律ラベリング体系: X-JToBI

前川喜久雄, 菊池英明, 五十嵐陽介

日本音響学会2002年春季研究発表会講演論文集p.313 - 3142002年03月-

自発音声に対する音素自動ラベリング精度の検証

菊池英明, 前川喜久雄

第2回話し言葉の科学と工学ワークショップ講演予稿集p.53 - 582002年02月-

日本語自発音声の韻律ラベリングスキーム: X-JToBI

菊池英明, 前川喜久雄, 五十嵐陽介

第2回話し言葉の科学と工学ワークショップ講演予稿集p.19 - 262002年02月-

X-JToBI: 自発音声の韻律ラベリングスキーム

前川喜久雄, 菊池英明, 五十嵐陽介

情報処理学会音声言語情報処理研究会SLP-39-23p.135 - 1402001年12月-

自発音声コーパスにおける印象評定とその要因

籠宮隆之, 槙洋一, 菊池英明, 前川喜久雄

日本音響学会2001年秋季研究発表会講演論文集p.381 - 3822001年09月-

多次元心的状態を扱う音声対話システムの構築

鈴木堅悟, 青山一美, 菊池英明, 白井克彦

情報処理学会音声言語情報処理研究会2001-SLP037p.13 - 182001年06月-

「日本語話し言葉コーパス」における書き起こしの方法とその基準について

小磯花絵, 土屋菜緒子, 間淵洋子, 斉藤美紀, 籠宮隆之, 菊池英明, 前川喜久雄

日本語科学Vol.9p.43 - 582001年04月-

自発音声に対するJ_ToBIラベリングの問題点検討

菊池英明, 籠宮隆之, 前川喜久雄, 竹内京子

日本音響学会2001年春季研究発表会講演論文集p.383 - 3842001年03月-

音声対話に基づく知的情報検索システム

菊池英明, 阿部賢司, 桐山伸也, 大野澄雄, 河原達也, 板橋秀一, 広瀬啓吉, 中川聖一, 堂下修二, 白井克彦, 藤崎博也

情報処理学会音声言語情報処理研究会2001-SLP-35p.85 - 902001年02月-

日本語音声への韻律ラベリング

菊池英明

人工知能学会研究会資料SIG-SLUD-A003-4p.21 - 242001年02月-

『日本語話し言葉コーパス』の構築における計算機利用

前川喜久雄, 菊池英明, 籠宮隆之, 山口昌也, 小磯花絵, 小椋秀

日本語学, 明治書院p.61 - 792001年-

『日本語話し言葉コーパス』の書き起こし基準について

小磯花絵, 土屋菜穂子, 間淵洋子, 斉藤美紀, 籠宮隆之, 菊池英明, 前川喜久雄

電子情報通信学会技術報告NLC2000-56, SP2000-104p.55 - 602000年12月-

Controlling Non-verbal Information in Speaker-change for Spoken Dialogue

proc. of IEEE Int'l. Conference on Systems, Man and Cybernetics2000年10月-

Designing a Domain Independent Platform of Spoken Dialogue System

proc. of Int'l. Conference on Spoken Language Processing2000年10月-

Improvement of Dialogue Efficiency by Dialogue Control Model According to Performance of Processes

proc. of Int'l. Conference on Spoken Language Processing2000年10月-

Modeling of Spoken Dialogue Control for Improvement of Dialogue Efficiency

proc. of IEEE Int'l. Conference on Systems, Man and Cybernetics2000年10月-

Overview of an Intelligent System for Information Retrieval Based on Human-Machine Dialogue through Spoken Language

proc. of Int'l. Conference on Spoken Language Processing2000年10月-

モノローグを対象とした自発音声コーパス:その設計について

第14回日本音声学会全国大会予稿集2000年10月-

大規模話し言葉コーパスにおける発話スタイルの諸相---書き起こしテキストの分析から---

日本音響学会2000年秋季研究発表会講演論文集2000年09月-

日本語話し言葉コーパスの設計

音声研究4月2日2000年08月-

音声対話システム汎用プラットフォームにおける行動管理部の構築

人工知能学会全国大会(第14回)6月8日2000年06月-

対話効率の向上を目的とした音声対話制御のモデル化

ヒューマンインタフェース学会誌Vol.2, No.22000年05月-

音声対話システム汎用プラットフォームの検討

情報処理学会音声言語情報処理研究会2000-SLP-302000年02月-

A Post-Processing of Speech for Hearing Impaired Integrate into Standard Digital Audio Decorders

proc. of Eurospeech1999年09月-

Improving Recognition Correct Rate of Important Words in Large Vocabulary Speech Recognition

proc. of Eurospeech1999年09月-

課題遂行対話における対話潤滑語の認定

人工知能学会誌Vol.14, No.51999年09月-

Controlling Dialogue Strategy According to Performance of Processes

proc. of ESCA Workshop Interactive Dialogue in Multi-modal Systems1999年05月-

音声対話システムにおける処理性能と対話戦略の関係についての一考察

日本音響学会講演論文集pp.109-1101999年03月-

システムの処理性能を考慮した対話制御方法の検討

人工知能学会 言語・音声理解と対話処理研究会予稿集pp.1-61999年02月-

人間型ロボットの対話インタフェースにおける発話交替時の非言語情報の制御

情報処理学会論文誌Vol.40, No.21999年02月-

Use of Nonverbal Information in Communication between Human and Robot

Proc. Of International Conference on Spoken Language Processing (ICSLP)pp.2351 - 23541998年12月-

非言語的現象の分析と対話処理 −電子メール討論

日本音響学会誌54, No.111998年11月-

Controlling Gaze of Humanoid in Communication with Human

Proc. Of International Conference on Intelligent Robots and Systems (IROS)1, pp.255-2601998年10月-

時間的制約を考慮した対話制御方法の実現方法

人工知能学会全国大会論文集37-07, pp.677-6781998年06月-

人間型対話インタフェースにおけるまばたき制御の検討

人工知能学会全国大会論文集15-14, pp.242-2451998年06月-

Multimodal Communication Between Human and Robot

Proc. Of International Wireless and Telecommunications Symposium (IWTS)pp.322-3251998年05月-

情報のら旋成長を支援するコミュニケーション形電子図書館

電子情報通信学会論文誌Vol.J81-D-II, No.51998年05月-

人間とロボットのコミュニケーションにおける非言語情報の利用

情報処理学会音声言語情報処理研究会資料21-7, pp.69-741998年05月-

時間的制約を考慮した対話制御方法の検討

日本音響学会講演論文集3-6-16, pp.113-1141998年03月-

音声を利用したマルチモーダルインタフェース

電子情報通信学会誌80;10, pp.1031-10351997年10月-

自由会話における時間的制約の影響の分析

電子情報通信学会技術研究報告SP97-55, pp.31-361997年10月-

複数ユーザとロボットの対話における非言語情報の役割

日本音響学会講演論文集3-1-13, pp.111-1121997年09月-

The Role of Non-Verbal Information in Spoken Dialogue between a Man and a Robot

International Conference on Speech Processing (ICSP) '97 Proceedings2, pp.539-5441997年08月-

ロボットとの対話における非言語情報の役割

人工知能学会全国大会論文集21-06, pp.433-4361997年06月-

音響学会員のためのインターネット概説

日本音響学会誌52巻8号1996年08月-

User Interface for a Digital Library to Support Construction of a "Virtual Personal Library"

proc. of ICMCS(International Conference on Multimedia Conputing and Systems)1996年06月-

Extensions of World-wide Aiming at the construction of a "Virtual Personal Library"

proc. of Seventh ACM Conf. on Hypertext1996年03月-

ハイパーメディア共有アーキテクチャ

情報処理学会全国大会講演論文集1996年03月-

ハイパーメディア共有アーキテクチャにおけるバージョン管理方式

情報処理学会全国大会講演論文集1996年03月-

情報処理学会第53回全国大会大会優秀賞

1996年03月-

Multimodal Interface Using Speech and Pointing Gestures, and Its Applications for Interior Design and PC Window Manipulation

proc. of IWHIT95 (International Workshop on Human Interface Technology 95)1995年10月-

Agent-typed Multimodal Interface Using Speech, Pointing Gestures, and CG

proc. of HCI(Human Conputer Interaction) International '951995年07月-

音声とペンを入力手段とするマルチモーダルインタフェースの構築

情報処理学会音声言語情報処理研究会SLP-7-181995年07月-

仮想個人図書館の構築を支援するユーザインタフェースの開発

電子情報通信学会春季大会講演論文集1995年03月-

マルチモーダルウインドウシステムの構築

第10回ヒューマンインタフェースシンポジウム論文集1994年10月-

音声・ポインティング・CGによるエージェント型ユーザインタフェースの試作と評価

第10回ヒューマンインタフェースシンポジウム論文集1994年10月-

音声・ポインティング・CGによるエージェント型ユーザインタフェースシステム

電子情報通信学会秋季大会講演論文集1994年09月-

音声対話インタフェースにおける発話権管理による割り込みへの対処

電子情報通信学会論文誌Vol.J77-D-II, No.81994年08月-

音声対話システムにおける発話権の制御

電子情報通信学会春季大会講演論文集Vol.D-1081993年03月-

Three Different LR Parsing Algorithm for Phoneme-Context-Dependent HMM-Based Continuous Speech Recognition

IEICE Trans. Inf. & Sys.Vol.E76-D, No.11993年01月-

ナビゲーションシステムにおける音声対話インタフェースの構成

人工知能学会言語・音声理解と対話処理研究会SIG-SLUD-9203-31992年10月-

音声インタフェース評価のための音声からの心情推定

ヒューマンインタフェース学会論文誌12(4)p.335 - 3432010年11月-2010年11月 

CiNii

詳細

ISSN:13447262

教師の連続的な音声言語の中で表現されるパラ言語情報の音声知覚

日本教育工学会論文誌34(4)p.429 - 4382011年03月-2011年03月 

CiNii

詳細

ISSN:13498290

概要:前川(2002)は朗読音声を用いて,被験者にパラ言語情報のカテゴリーを同定させる実験を行った.有賀ほか(2008)は前川の実験方法を用いて,教授行為における教師の自発音声の中からパラ言語情報のカテゴリーを抽出した.そのカテゴリーとは,発話の音声に伴うイントネーションの違いによって,例えば「気付かせ」「確認」「強制」などに分類したものを指している.但し,上記の研究はいずれもパラ言語情報のカテゴリーを再生した音声の部分だけを用いた実験である,しかし,実際には教室談話における音声言語コミュニケーションでは,音声言語は連続的な流れである.そこで,本研究では,実験条件の異なる3つの統制群,韻律群,文字群を設定して,パラ言語情報を表現している音声も含めた連続的音声言語を再生してそれぞれのグループに聞かせた場合に,被験者がどのようにパラ言語情報を知覚するかという実験を行った.その結果,3つの統制群,韻律群,文字群においてパラ言語情報のカテゴリーの知覚に明らかな違いが見られた.

自発音声におけるパラ言語情報のカテゴリーの評価語を用いた印象評定

音声研究14(2)p.25 - 342010年08月-2010年08月 

CiNii

詳細

ISSN:13428675

概要:An experiment on impression rating of paralinguistic information was conducted using categories of paralinguistic information expressed by teachers during teaching as speech stimuli. The aim of this study was to determine whether there are differences in the impression ratings of listeners subjected to paralinguistic information conveyed in the spontaneous speech of teachers. The experimental design involved preparing six categories of paralinguistic information as speech stimuli, and recording subject responses to 45 pairs of assessment words. Variability among subjects with regard to their impressions of categories of paralinguistic information was determined to exist.

9-215 早稲田大学における遠隔教育の現状(オーガナイズドセッション:オープンコースウエアとその活用-I,口頭発表論文)

工学教育研究講演会講演論文集23(59)p.436 - 4372011年08月-2011年08月 

CiNii

音声対話システムにおける継続欲求の高いインタラクションの要因(対話生成,<特集>人とエージェントのインタラクション論文)

電子情報通信学会論文誌. A, 基礎・境界95(1)p.27 - 362012年01月-2012年01月 

CiNii

詳細

ISSN:09135707

概要:我々は,ユーザが長期間利用し続けたい,対話継続欲求の高い音声対話システムのインタラクションの設計指針を得ることを目指している.従来研究では対話の新奇性を高めるために,話題を増やすなどのアプローチがとられてきたが,継続欲求の観点では十分な評価が行われておらず,有用性に疑問が残る.本研究の目的は,音声対話システムで利用可能な,新奇性によらない対話継続欲求向上の要因を解明することである.第一に人同士の対話を円滑化させる「社会性の高い対話」に着目し,会話分析によって要因を明確化した.第二に,相手の関心を引く「ユーモア表現を含む発話」に着目し,ユーモア発話を行う対話システムを構築して評価実験を行った.その結果,人同士の対話において相手の発話行動を限定しないこと,相手の話を聞いている実感を与えること,システム発話において意外性の高いユーモアを使うことが有効であった.

同一対象を叙述した話し言葉と書き言葉の比較(インタラクション分析,<特集>人とエージェントのインタラクション論文)

電子情報通信学会論文誌. A, 基礎・境界95(1)p.146 - 1562012年01月-2012年01月 

CiNii

詳細

ISSN:09135707

概要:本論文では,被験者が提示された一連のストーリーをもった複数コマからなる静止画像について説明することにより,同じ対象を叙述した話し言葉と書き言葉についての発話データを得る手法を提案する.実験の結果得られたデータを分析し,書き言葉と話し言葉という二つのモード間の差異,発話の送り手と受け手の間での画像を共有するか否かに依存したレジスタ間の差異について,各品詞の出現頻度,文のモーラ数,形態素のモーラ数,TTR(Type-Token Ratio,延べ語数に対する異なり語数の割合),発話の意味内容の比較という観点からの知見が得られ,本手法の有効性を評価することができた.

マルチタイムスケール音韻獲得モデルを用いた対乳児音声の特性解析(オーガナイズドセッション「第一・第二言語の獲得・学習にまつわる諸現象の分析と工学的応用」1,聴覚・音声・言語とその障害/一般)

電子情報通信学会技術研究報告. SP, 音声111(471)p.19 - 242012年03月-2012年03月 

CiNii

詳細

ISSN:0913-5685

概要:我々は自然な連続音声からの音韻獲得モデルを提案する.提案法は人が音声の時間的な変化を知覚するメカニズムを模擬しており,教師なしで入力された言語の音韻の数と境界を推定することができる.本研究では,人の言語獲得研究において議論される,対乳児発話音声(Infant Directed Speech, IDS)の特徴である「変動性」の役割を明確にするため,提案モデルを使用して対成人音声(Adult Directed Speech, ADS)とIDSを入力とした学習を行い,結果を比較した.その結果,IDSはADSに比べて無声破裂子音の認識率が有意に高かった.そのため,IDSは非定常な音素の音響特徴を強調し,その獲得を補助する可能性が示された.

音声の発話者印象情報の知覚・認知モデル構築(音声一般,聴覚・音声・言語とその障害/一般)

電子情報通信学会技術研究報告. SP, 音声111(471)p.89 - 942012年03月-2012年03月 

CiNii

詳細

ISSN:0913-5685

概要:音声は揮発性を持つにも関わらず,円滑な対話が実現されている.それは音声が言語情報の他にプロソディとして,実時間理解を支援する情報や感情・体調等の発話者の情報(発話者印象情報)を伝えるためと考える.本研究では聞き手が音声から発話者印象情報を理解する過程(知覚・認知過程)に着目し,モデルへの近似を行った.多様な発話者印象情報を捉えるために,声そのものの情報を共通基盤とした線型結合による3階層モデルを提案し,その実現可能性を検討した.結果,本研究の提案する枠組みによって(1)情報の繋がりを明瞭に記述し,(2)表現豊かな音声を捉えるモデルが確認された.

母子の身体接触を伴う遊びにおける動作と発話の時系列分析(あそび,「身体,あそび,コミュニケーション」及びコミュニケーション一般)

電子情報通信学会技術研究報告. HCS, ヒューマンコミュニケーション基礎111(464)p.3 - 72012年02月-2012年02月 

CiNii

詳細

概要:初期の母子間でみられる身体接触によるコミュニケーションに着目し,身体接触遊び場面に見られる反復動作と発声の時系列的特性を検討した.3組の乳児(4ヶ月齢)とその母親を対象とし,その家庭における身体接触遊び場面のビデオを撮影した.これらの映像において,母親が子の手足を持って反復的に動かして継続的に遊ぶ様子が3組の母子に共通してみられた.この反復的動作の周期(テンポ)は,動作に用いられる子の身体部位の範囲の拡がりに応じて長くなる傾向がみられた.母親が子からの接触と発声に応じて,この反復動作の種類を転換させて遊びを継続しようとする様子が観察された.反復動作の出現時間には言語と類似の階層関係が見られ,対話的コミュニケーション発達との関与が示唆された.

ポピュラー音楽における歌声の印象評価語を自動推定するシステム

情報処理学会研究報告. [音楽情報科学]2013(19)p.1 - 82013年08月-2013年08月 

CiNii

詳細

概要:本稿では,ポピュラー音楽における歌声を対象として,その音響信号から印象評価語を自動推定するシステムを提案する.従来,楽曲を対象としてそのムードを音響信号から自動推定したり,歌声の印象評価語と音響特徴量の関係について分析する研究はあったが,歌声の音響信号から印象語を自動推定する研究はなかった.本稿では,人が歌声を表現するために用いる印象評価語 47 語 (「心のこもった」 等) と,歌声の印象評価に関わる 3 因子 (独立性高く歌声を説明できる印象評価軸) である "迫力性", "丁寧さ", "明るさ" について,音響特徴量との関係を重回帰分析を用いてモデル化する.60 の歌声データを用いて,K 分割交差検定 (K = 6) でモデルの予測精度を評価した結果,モデルの決定係数 R2 について,「声量のある」 「激しい」 「弱い」 を 0.8 以上,「勢いがある」 「少女のような」 を0.7以上,「一生懸命な」 「かっこいい」 等の 7 語を 0.6 以上の精度で推定できるモデルが得られた.また,上述した歌声の 3 因子については,分析の結果,13 種類の音響特徴量が関係していることが分かり,それらのうち 9 種類は各因子に対して独立に関係するものであった.

8-329 早稲田大学における授業内容公開の取り組み : Waseda Vision 150に向けた課題を中心に(OS オープンコースウェアとその活用-I,口頭発表)

工学教育研究講演会講演論文集24(60)p.714 - 7152012年08月-2012年08月 

CiNii

音声対話における親密度と語彙の関係

情報処理学会研究報告. HCI, ヒューマンコンピュータインタラクション研究会報告2014(22)p.1 - 62014年03月-2014年03月 

CiNii

詳細

ISSN:09196072

概要:本研究では,人の話し言葉は親しさによってどのように変化するのかを調べた.調査に先立ち,分析に使用するデータとして大学生 9 名の初対面の時の対話データ (低親密度) と 6 ヶ月後の対話データ (高親密度) の 2 種類の対話データを準備した.その後,対話データの中から 3 ペアの話者に対して形容詞対の質問紙による評価を行った.その結果,23 の形容詞対のうち,「礼儀正しい」 「力強い」 「明るい」 「丁寧な」 「上手な」 「声の大きい」 「わかりやすい」 の 7 つの項目に差が見られた.また,初対面の時に使用される語彙と,知り合って半年経過した時に使用される語彙を比較した結果,初対面のデータでは 「です」 「ます」 「はい」 が多く,6 ヶ月後になると 「うん」 「おれ」 「けど」 「まじ」 が多くなるという結果が確認された.

音声対話における親密度と語彙の関係

情報処理学会研究報告. GN, [グループウェアとネットワークサービス]2014(22)p.1 - 62014年03月-2014年03月 

CiNii

詳細

ISSN:09196072

概要:本研究では,人の話し言葉は親しさによってどのように変化するのかを調べた.調査に先立ち,分析に使用するデータとして大学生 9 名の初対面の時の対話データ (低親密度) と 6 ヶ月後の対話データ (高親密度) の 2 種類の対話データを準備した.その後,対話データの中から 3 ペアの話者に対して形容詞対の質問紙による評価を行った.その結果,23 の形容詞対のうち,「礼儀正しい」 「力強い」 「明るい」 「丁寧な」 「上手な」 「声の大きい」 「わかりやすい」 の 7 つの項目に差が見られた.また,初対面の時に使用される語彙と,知り合って半年経過した時に使用される語彙を比較した結果,初対面のデータでは 「です」 「ます」 「はい」 が多く,6 ヶ月後になると 「うん」 「おれ」 「けど」 「まじ」 が多くなるという結果が確認された.

音声対話における親密度と語彙の関係

情報処理学会研究報告. EC, エンタテインメントコンピューティング2014(22)p.1 - 62014年03月-2014年03月 

CiNii

詳細

ISSN:09196072

概要:本研究では,人の話し言葉は親しさによってどのように変化するのかを調べた.調査に先立ち,分析に使用するデータとして大学生 9 名の初対面の時の対話データ (低親密度) と 6 ヶ月後の対話データ (高親密度) の 2 種類の対話データを準備した.その後,対話データの中から 3 ペアの話者に対して形容詞対の質問紙による評価を行った.その結果,23 の形容詞対のうち,「礼儀正しい」 「力強い」 「明るい」 「丁寧な」 「上手な」 「声の大きい」 「わかりやすい」 の 7 つの項目に差が見られた.また,初対面の時に使用される語彙と,知り合って半年経過した時に使用される語彙を比較した結果,初対面のデータでは 「です」 「ます」 「はい」 が多く,6 ヶ月後になると 「うん」 「おれ」 「けど」 「まじ」 が多くなるという結果が確認された.

音声対話における親密度と語彙の関係

情報処理学会研究報告. HCI, ヒューマンコンピュータインタラクション研究会報告2014(22)p.1 - 62014年03月-2014年03月 

CiNii

詳細

ISSN:09196072

概要:本研究では,人の話し言葉は親しさによってどのように変化するのかを調べた.調査に先立ち,分析に使用するデータとして大学生 9 名の初対面の時の対話データ (低親密度) と 6 ヶ月後の対話データ (高親密度) の 2 種類の対話データを準備した.その後,対話データの中から 3 ペアの話者に対して形容詞対の質問紙による評価を行った.その結果,23 の形容詞対のうち,「礼儀正しい」 「力強い」 「明るい」 「丁寧な」 「上手な」 「声の大きい」 「わかりやすい」 の 7 つの項目に差が見られた.また,初対面の時に使用される語彙と,知り合って半年経過した時に使用される語彙を比較した結果,初対面のデータでは 「です」 「ます」 「はい」 が多く,6 ヶ月後になると 「うん」 「おれ」 「けど」 「まじ」 が多くなるという結果が確認された.

音声対話における親密度と話し方の関係(力触覚の計算,手,一般)

中里 収;大城 裕志;菊池 英明

電子情報通信学会技術研究報告. HIP, ヒューマン情報処理112(483)p.109 - 1142013年03月-2013年03月 

CiNii

詳細

ISSN:0913-5685

概要:本研究では,人の話し方は親密度によってどのように変化するのかを調べた.評価に使用するデータとして,大学生の初対面の時の対話データ(低親密度)と知り合って6ヶ月後の対話データ(高親密度)の2種類の対話データを準備した.その後,3ペアの話者に対して評価実験を行い,被験者が話し方の印象を評価し,4つの因子「快活さ」「好ましさ」「話し上手」「速さ感」を抽出した.初対面の時の話し方の印象と,知り合って半年経過した時の話し方の印象を比較した結果,低親密度のデータでは話し相手にかかわらず因子ごとの得点は同じ傾向になり,親密度が高くなると話し相手によって得点が変化した.特に,親密度が高くなると「話し上手」因子の得点が高くなる傾向が見られた.

ポピュラー音楽のための歌唱音声評価尺度の構築 : アマチュア歌唱における検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)

金礪 愛;菊池 英明

電子情報通信学会技術研究報告. SP, 音声112(422)p.49 - 542013年01月-2013年01月 

CiNii

詳細

ISSN:0913-5685

概要:歌声に関する研究の発展に伴い、多様な歌声の印象を適切に評価できる尺度の需要は益々高まると考えられるため、本研究では「ポピュラー音楽における歌唱音声評価尺度」の構築を行った。今回は、アマチュア歌唱音声に対する有効性を検討し、3因子×4語、計12語からなる歌唱音声評価尺度を構築し、信頼性を確認した。また、歌唱音声評価に関わる因子として、話声とは異なる、歌唱音声独特の因子が観察された。

エージェントによるユーザ特性の把握が愛着感に与える影響(オーガナイズドセッション(一般講演),音声アプリケーション,一般)

小川 義人;原田 花歩;菊池 英明

電子情報通信学会技術研究報告. SP, 音声112(450)p.35 - 402013年02月-2013年02月 

CiNii

詳細

ISSN:0913-5685

概要:本研究では、エージェントによるユーザ特性の把握がエージェントへの愛着感および対話継続欲求に与える影響を考察する。近年、音声対話システムをユーザに長く使い続けてもらうための戦略が活発に研究されている。我々は、音声の韻律情報からユーザの活性度を推定し、推定結果に基づく発話へのユーザ応答より実際の活性度を取得、韻律と実際の活性度を次回以降の推定に用いる学習データとして蓄積し、徐々に推定精度を向上させていく音声対話システムを提案する。被験者実験の結果より、提案手法を用いることであらかじめ作成した判別基準のみを用いる手法よりも安定して状態判別精度が向上すること、状態判別精度が高いほどユーザはシステムが自分の特性を把握していると感じ、よりシステムに愛着を抱く傾向があることが明らかになった。

演技指示の工夫が与える音声表現への影響 : 表現豊かな演技音声表現の獲得を目指して

宮島 崇浩;菊池 英明;白井 克彦;大川 茂樹

音声研究17(3)p.10 - 232013年12月-2013年12月 

CiNii

詳細

ISSN:13428675

概要:This paper explains the procedure to enhance the expressiveness in acted speech. We designed our own "format of acting script" referring to the theory of drama and created 280 acting scripts. We presented these acting scripts as acting directions to three actresses and collected 840 speech data. For comparison, using typical emotional words as acting directions, we also collected 160 speech data from each actress. Then, we compared tendencies of various features of each data type and each speaker and found that our acting scripts are effective on the enhancement of expressiveness in acted speech psychologically/acoustically.

J-054 ロボット発話の話速・無音区間長の制御によるパーソナリティ認知と対話継続欲求の向上(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)

竹矢 有輝;小川 義人;菊池 英明

情報科学技術フォーラム講演論文集12(3)p.507 - 5082013年08月-2013年08月 

CiNii

E-037 音声から疲労程度を推定するスマートフォン用アプリケーションの開発(E分野:自然言語・音声・音楽)

青木 由希;宮島 崇浩;菊池 英明;塩見 格一

情報科学技術フォーラム講演論文集12(2)p.269 - 2702013年08月-2013年08月 

CiNii

音声対話システムに対するインタラクション継続欲求(オーガナイズドセッション:対話システムの評価【評価・分析】,音声・言語・対話,一般)

菊池 英明;宮澤 幸希;小川 義人;藤倉 将平

電子情報通信学会技術研究報告. SP, 音声113(220)p.21 - 262013年09月-2013年09月 

CiNii

詳細

ISSN:0913-5685

概要:音声対話システムの実用化が進む中で、日常で用いられるシステムやエンターテイメント性を要求されるシステムにおいては,ユーザが長期間利用し続けられる,対話継続欲求の高いデザインが求められると考え、3つの雑談対話システム構築を通じて対話継続欲求の向上を目指してきた。ユーモア発話の生成や、システム発話の発話速度の制御、そしてユーザ発話からのパーソナリティ推定に応じた発話生成がいずれも対話継続欲求の向上に効果的であることを確認した。従来、タスク指向の対話システムにおいてはタスク達成時間など効率が重視されることが多かったが、非タスク指向の対話システムではこのようなインタラクション継続欲求を高めるデザイン方法の確立が重要と考える。

非タスク指向対話システムにおけるマイクロブログを用いたユーモア発話の自動生成(マイクロブログ,第5回集合知シンポジウム)

藤倉 将平;小川 義人;菊池 英明

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション113(338)p.29 - 322013年11月-2013年11月 

CiNii

詳細

ISSN:0913-5685

概要:本研究では非タスク対話システムにTwitterを用いてユーモア発話を自動生成させることを目指している.これまでに対話継続欲求の高いシステムのデザイン手法の確立を目的とし,「次回も対話を行いたい」と感じる要因を分析した.その中でユーモアを扱うことは対話継続欲求について有効であることが示された.本論文ではTwitterからアイテム述語ペア,修飾-名詞ペアを抽出し,それを対話システムの知識とすることで,システムがリアリティの高い応答を行いユーモアを生成する手法を提案した.また評価実験において提案手法を用いる対話システムがユーモアを生成できることを確認した.

自動車運転環境下におけるユーザーの受諾行動を促すシステム提案の検討

宮澤 幸希;影谷 卓也;沈 睿;菊池 英明;小川 義人;端 千尋;太田 克己;保泉 秀明;三田村 健

人工知能学会論文誌25(6)p.723 - 7322010年-2010年

CiNii

詳細

ISSN:1346-0714

概要:In this study, we aim at clarification of the factor that promotes an user's acceptance of suggestion from an interactive agent in driving environment. Our aim is to figure out how human beings accept the encouragement from interaction objects, and also which kinds of dialogues or action controls are necessary for the design of car navigation system which makes suggestion and requests to drivers. Firstly, we had an experiment for collecting dialogue between humans in driving simulation environment, then we analyzed the drivers' acceptance and evaluation for the navigators. As the results, we found that the presence and reliability of the navigator highly relate to the acceptance of suggestion from the navigator. When navigators were next to drivers, the rate of drivers' suggestion acceptance rose. However, the stress of drivers increased. In addition, based on the linguistic and acoustic analysis of the navigators' utterances, we found out some points of designing system utterance of suggestion to promote user's acceptance. We found that expressing the grounds of suggestions, showing the exact numbers, and the wide pitch ranges, all highly relate to the acceptance of suggestions.

知識獲得モデルとしての自己組織化マップ:-連続音声からの教師なし音素体系の学習-

宮澤 幸希;白勢 彩子;馬塚 れい子;菊池 英明

知能と情報26(1)p.510 - 5202014年-2014年

CiNii

詳細

ISSN:1347-7986

概要:人の知識獲得のプロセスを計算論的に検証する目的で,大脳皮質感覚野の情報処理を模擬した自己組織化マップが用いられる.本論文の目的は,自己組織化マップを用いて,人の乳児が母国語の音素体系を獲得する過程を計算論的に解析することである.先行研究では自然な入力信号の分布特性(音素の出現頻度やフレーム数)が十分に考慮されていなかった.本研究では,自然な連続音声を入力としてシミュレーション実験を行なった.実験の結果,100秒程度の日本語の連続音声から,5 %(/u/)~92%(/s/)の精度で音素体系が獲得可能であることが示された.

音声言語コーパスにおける speaking style の自動推定―転記テキストに着目して―

沈 睿;菊池 英明

自然言語処理21(3)p.445 - 4642014年-2014年

CiNii

詳細

ISSN:1340-7619

概要:近年,計算機技術の進歩に伴って大規模言語データの蓄積と処理が容易となり,音声言語コーパスの構築と実用化の研究が盛んに行われている.我々は,speaking style に関心を持つ利用者に音声言語コーパスを探しやすくさせるために,音声言語コーパスの speaking style の自動推定を目指している.本研究では,1993 年に Eskenazi が提唱した speaking style の 3 尺度を導入し,従来の文体・ジャンルの判別や著者推定などの自然言語処理の分野で用いられた言語の形態論的特徴を手がかりとし,音声に付随する書き起こしテキスト(本論文では転記テキストと呼ぶ)に着目した speaking style 推定モデルの構築を試みた.具体的な手続きとしては,はじめに様々な音声言語コーパスから音声に付随する転記テキストを無作為に抽出する.次にこれらの転記テキストを刺激として用い,3 尺度の speaking style の評定実験を行う.そして,評定結果を目的変数,転記テキストの品詞・語種率と形態素パタンを説明変数とし,重回帰分析により 3 尺度それぞれの回帰モデルを求める.交差検定を行った結果,本研究の提案手法によって 3 尺度の内 2 尺度の speaking style 評定値を高い精度で推定できることを確認した.

母語対話の話者交替タイミング

市川 熹;大橋 浩輝;仲 真紀子;菊池 英明;堀内 靖雄;黒岩 眞吾

科学・技術研究5(1)p.113 - 1222016年-2016年

CiNii

詳細

ISSN:2186-4942

概要:母語話者の話者交替時の重複タイミング現象である話者移行適格場(TRP)に注目し、日本語と英語について、それぞれの母語話者とその言語を十分に習得している非母語話者の実時間対話を分析した。両言語ともに、対話者が母語話者の組み合わせ以外ではTRPの制約が成立していなかった。このことは、非母語話者が発信している言語情報は話者交替の予告情報にはならず、言語情報の裏に必然的に存在するプロソディにあることを示唆している。また日本語母語話者の5歳児と6歳児と成人の対話を分析し、さらに先行研究結果を参考にしたところ、日本語母語のTRPの制約は5歳児ころまでに獲得されることが推察された。母語話者の話者交替タイミング制御のモデルを提案した。

Constructing the corpus of infant-directed speech and infant-like robot-directed speech

Nakamura, Ryuji; Miyazawa, Kouki; Ishihara, Hisashi; Nishikawa, Ken'ya; Kikuchi, Hideaki; Asada, Minoru; Mazuka, Reiko

HAI 2015 - Proceedings of the 3rd International Conference on Human-Agent Interactionp.167 - 1692015年10月-2015年10月 

DOIScopus

詳細

概要:© 2015 ACM.The characteristics of the spoken language used to address infants have been eagerly studied as a part of the language acquisition research. Because of the uncontrollability factor with regard to the infants, the features and roles of infantdirected speech were tried to be revealed by the comparison of speech directed toward infants and that toward other listeners. However, they share few characteristics with infants, while infants have many characteristics which may derive the features of IDS. In this study, to solve this problem, we will introduce a new approach that replaces the infant with an infant-like robot which is designed to control its motions and to imitate its appearance very similar to a real infant. We have now recorded both infant-and infantlike robot-directed speech and are constructing both corpora. Analysis of these corpora is expected to contribute to the studies of infant-directed speech. In this paper, we discuss the contents of this approach and the outline of the corpora.

Humor utterance generation for non-task-oriented dialogue systems

Fujikura, Shohei; Ogawa, Yoshito; Kikuchi, Hideaki

HAI 2015 - Proceedings of the 3rd International Conference on Human-Agent Interactionp.171 - 1732015年10月-2015年10月 

DOIScopus

詳細

概要:© 2015 ACM.We propose a humor utterance generation method that is compatible with dialogue systems, to increase "desire of continuing dialogue". A dialogue system retrieves leading-item: noun pairs from Twitter as knowledge and attempts to select the most humorous reply using word similarity, which reveals that incongruity can be explained by the incongruity-resolution model. We consider the differences among individuals, and confirm the validity of the proposed method. Ex-perimental results indicate that high-incongruity replies are significantly effective against low-incongruity replies with a limited condition.

Assigning a Personality to a Spoken Dialogue Agent by Behavior Reporting

Ogawa, Yoshito; Kikuchi, Hideaki

New Generation Computing35(2)p.181 - 2092017年04月-2017年04月 

DOIScopus

詳細

ISSN:02883635

概要:© 2017, Ohmsha, Ltd. and Springer Japan. A method to assign a personality to a spoken dialogue agent is proposed and evaluated. The proposed method assigns a personality using agent reporting about behavior independent of interaction with a user. The proposed method attempts to assigning complex personalities. For this purpose, we have defined a behavior report dialogue and designed a personality assigning method using behavior reporting. The proposed method consists of three steps: collecting stereotypes between a personality and behavior through a questionnaire, designing the behavior report dialogue from the collected stereotypes, and agent reports about behavior at the start of interactions with a user. Experimental results show that the proposed method can assign a personality by repeating the behavior report dialogue, (the assigned personality is equivalent to the personality determined by the collected stereotypes) and that reporting behavior influences the assigned personality. In addition, we verified that the proposed method can assign “kind”, “judicious” and the five basic personalities defined in the Tokyo University Egogram Second Edition.

Vowels in infant-directed speech: More breathy and more variable, but not clearer

Miyazawa, Kouki; Miyazawa, Kouki; Shinya, Takahito; Martin, Andrew; Martin, Andrew; Kikuchi, Hideaki; Mazuka, Reiko; Mazuka, Reiko

Cognition166p.84 - 932017年09月-2017年09月 

DOIScopus

詳細

ISSN:00100277

概要:© 2017 Elsevier B.V. Infant-directed speech (IDS) is known to differ from adult-directed speech (ADS) in a number of ways, and it has often been argued that some of these IDS properties facilitate infants’ acquisition of language. An influential study in support of this view is Kuhl et al. (1997), which found that vowels in IDS are produced with expanded first and second formants (F1/F2) on average, indicating that the vowels are acoustically further apart in IDS than in ADS. These results have been interpreted to mean that the way vowels are produced in IDS makes infants’ task of learning vowel categories easier. The present paper revisits this interpretation by means of a thorough analysis of IDS vowels using a large-scale corpus of Japanese natural utterances. We will show that the expansion of F1/F2 values does occur in spontaneous IDS even when the vowels’ prosodic position, lexical pitch accent, and lexical bias are accounted for. When IDS vowels are compared to carefully read speech (CS) by the same mothers, however, larger variability among IDS vowel tokens means that the acoustic distances among vowels are farther apart only in CS, but not in IDS when compared to ADS. Finally, we will show that IDS vowels are significantly more breathy than ADS or CS vowels. Taken together, our results demonstrate that even though expansion of formant values occurs in spontaneous IDS, this expansion cannot be interpreted as an indication that the acoustic distances among vowels are farther apart, as is the case in CS. Instead, we found that IDS vowels are characterized by breathy voice, which has been associated with the communication of emotional affect.

書籍等出版物

"Spoken Language Systems", S. Nakagawa et al. (Eds.)

HATAOKA Nobuo, ANDO Haru, and KIKUCHI Hideaki

Ohmsha/IOS Press2005年-

詳細

ISBN:4-274-90637-x

"Voicing in Japanese," Van de Weijer, Nanjo, Nishihara (Eds.)

MAEKAWA Kikuo, KIKUCHI Hideaki

Mouton de Gruyter, Berlin and New York2006年-

"韻律を利用した対話状態の推定", 広瀬啓吉 編「韻律と音声言語情報処理」

菊池英明, 白井克彦

丸善2006年-

詳細

ISBN:4-621-07674-4

"音声コミュニケーションの分析単位 -ToBI-", 坊農真弓, 高梨克也編,「多人数インタラクションの分析手法」

菊池英明

オーム社2009年-

詳細

ISBN:4274207327

“Outline of J_ToBI”, in "COMPUTER PROCESSING OF ASIAN SPOKEN LANGUAGES"

KIKUCHI Hideaki

Americas Group Publications,U.S.2010年-

詳細

ISBN:0935047727

"音声対話システム", 白井克彦編著「音声言語処理の潮流」

菊池英明

コロナ社2010年-

詳細

ISBN:4339008104

"感情の音声表出", 石井克典監修「IoHを指向する感情・思考センシング技術」

菊池英明

CMC出版2019年-

詳細

ISBN:978-4-7813-1430-3

特許

整理番号:19

連続音声認識装置および方法(日本)

白井 克彦, 城崎 康夫, 菊池 英明

特願H11-281437、特開2001-109491

整理番号:481

音声認識装置及び音声認識用プログラム(日本)

白井 克彦, 菊池 英明, 大久保 崇

特願2005- 80732、特開2006-259641

整理番号:756

検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体(日本)

白井 克彦, 菊池 英明, 新関 一馬

特願2007-193700、特開2009- 31931

外部研究資金

科学研究費採択状況

研究種別:

インタラクティブ性の有無を考慮した話し言葉・書き言葉間の変換のための基礎的研究

2013年-0月-2016年-0月

配分額:¥4680000

研究種別:

円滑な母語対話を可能としている物理的要因の非母語話者対話との対比による探索

2012年-0月-2015年-0月

配分額:¥3900000

研究種別:

音声学的測定法と計算論モデル手法を融合した対乳児発話音声の解析

配分額:¥4810000

研究種別:

対話状況に応じた自発的コミュニケーション機構の研究

配分額:¥15360000

研究種別:

話し言葉コーパスに基づく言語変異現象の定量的分析

配分額:¥14800000

研究種別:

身体、アーティファクトを用いた効果的コミュニケーション過程の分析とFDへの応用

配分額:¥3700000

研究種別:

ブロードバンドを利用した新しい高等教育の有機的モデルとプロトタイプの開発

配分額:¥8300000

研究種別:

自発音声データに対する多元的アノテーション情報のXML化に関する研究

配分額:¥3900000

研究種別:

韻律制御に主体をおいた対話システム

配分額:¥54600000

研究種別:基盤研究(C)

音声対話システムに対するインタラクション欲求向上のためのユーザ印象空間の推定

2014年-2016年

研究分野:ヒューマンインタフェース・インタラクション

配分額:¥3900000

研究種別:

バーチャルリアリティ環境におけるオラリティの運用の検討

2017年-0月-2020年-0月

配分額:¥4680000

研究種別:

リアルタイムMRIおよびWAVEデータによる調音音声学の精緻化

2017年-0月-2020年-0月

配分額:¥17810000

研究種別:

コーパス言語学的手法に基づく会話音声の韻律特徴の体系化

2016年-0月-2020年-0月

配分額:¥16640000

研究種別:

音声対話システムに対するインタラクション欲求向上のためのユーザ印象空間の推定

2014年-0月-2017年-0月

配分額:¥3900000

研究種別:

アイヌ語諸方言の資料整備と音声音韻・文法・語彙の方言差の分析

2012年-0月-2015年-0月

配分額:¥4940000

学内研究制度

特定課題研究

生体情報を教師信号としたモデル学習による感情推定技術の高度化

2006年度

研究成果概要: 本研究では、音声からの心的状態の推定において話者の心的状況をより高い精度で推定するため、生体情報を教師信号としたモデル学習を行う“生理心理学的アプローチの導入”を提案する。 従来の感情推定は、モデル学習の際に実験者の判断による評... 本研究では、音声からの心的状態の推定において話者の心的状況をより高い精度で推定するため、生体情報を教師信号としたモデル学習を行う“生理心理学的アプローチの導入”を提案する。 従来の感情推定は、モデル学習の際に実験者の判断による評定結果が教師信号として用いられるため主観的方法であることが否めない。また推定の対象も基本的な感情にのみ重点が置かれてきた。 生体情報は、意図的な操作が入らず継時的な変化を捉えられることができるとされている。そのため、推定を行う際に実験の第一段階として生体信号を利用することで、多様で連続的な心情の変化を対象とすることができるようになり、またより客観的で精度の高い判断が可能になると思われる。 難度の異なる音読課題を2つ用意し、課題間における生体信号の反応の違いが音声の違いにも現れるのかを観察した。実験者の主観的評価によってストレス状態と判断された被験者の音声と、それらのうち生体信号の変化からもストレス状態にあると判断できた被験者の音声の比較を行う。 生体信号には、心的状態の推定へ利用できると思われた容積脈派(BVP)、心電図(EKG)、皮膚温(TEMP)、皮膚コンダクタンス(SC)を用いた。 音声の比較には、各音声からF0とパワーそれぞれの最大値、最小値、振幅、平均値、それに発話速度を加えた9つの特徴量を抽出し、これらを決定木学習に利用した。決定木学習には、C4.5アルゴリズムを使用し、交差検定を用いて評価を行う。 全データ(実験者の主観的評価のみによってストレス状態を判断した)で学習モデルを生成した場合平均63.9%であった判別率が、選別データ(主観的評価に加え、生体信号の変化からもストレス状態を判断した)で学習モデルを生成した場合には平均77.8%まで精度が向上した。 生体信号がストレス状態を判断するうえで一つの指標となり得ることを示唆する結果となった。本実験の結果、音声からの心的状態の推定を行う際に生体情報を利用することの有益性が実証された。

音声対話システム発話の音声言語的特徴制御によるインタラクション欲求向上

2013年度

研究成果概要:音声対話システムのシステム発話を制御することによってユーザに与える印象を変化させる技術の開発を目指している。本特定課題研究では、擬人化したシステムの自己開示によってパーソナリティを付与する手法に関する基礎研究を中心に進めた。実験を...音声対話システムのシステム発話を制御することによってユーザに与える印象を変化させる技術の開発を目指している。本特定課題研究では、擬人化したシステムの自己開示によってパーソナリティを付与する手法に関する基礎研究を中心に進めた。実験を通じて、自己開示量と内容によって特定のパーソナリティを付与できることを確認した。この成果は、ヒューマンインタフェース学会論文誌に査読論文として掲載された(「自己開示による音声対話エージェントへのパーソナリティ付与」)。他にも、マイクロブログからユーモア発話を自動生成する技術(「非タスク指向対話システムにおけるマイクロブログを用いたユーモア発話の自動生成」)、発話速度あるいは無音区間長を制御する手法(「ロボット発話の話速・無音区間長の制御によるパーソナリティ認知と対話継続欲求の向上」)を検討し、それぞれによってユーザがシステムに抱く印象がどのように変化するかを実験により調査した。いずれも国内学会にて成果を発表した。ユーザ発話における音声のプロソディを解析することによってユーザの心的状態を推定して、それに応じてシステムの振舞を変えることによってユーザが抱く愛着感を変化させられることを実験により確認し、この成果を国際会議にて発表した(「Effects of an Agent Feature Comprehension on the Emotional Attachment of Users」)。いずれの研究においても、ユーザが抱く印象を変化させるこれらの手法によって、音声対話システムに対するインタラクション継続欲求が向上することを確認している。このことを一旦整理して国内学会にて発表した(「音声対話システムに対するインタラクション継続欲求」)。こうした一連の研究成果を体系化してさらに幅広く応用可能な技術を開発するために、インタラクション継続欲求とユーザ印象空間の関係を明確にする必要性が生じている。そこで最終的に、本特定課題研究を経て、2014年度科学研究費の基盤(C)に「音声対話システムに対するインタラクション欲求向上のためのユーザ印象空間の推定」というテーマを申請して採択された。

海外研究活動

研究課題名: 音声言語における感情・評価・態度の解析技術高度化

2009年03月-2010年03月

機関: オハイオ州立大学(アメリカ)、北京大学(中国)

現在担当している科目

科目名開講学部・研究科開講年度学期
基礎ゼミ I 19人間科学部2019春学期
基礎ゼミ I 20人間科学部2019春学期
人間情報科学概論人間科学部2019春クォーター
人間計測・人間情報モデリング研究法 01人間科学部2019秋クォーター
人間計測・人間情報モデリング研究法 02人間科学部2019秋クォーター
人間計測・人間情報モデリング研究法 03人間科学部2019秋クォーター
人間計測・人間情報モデリング人間科学部2019春学期
言語情報科学人間科学部2019春学期
専門ゼミI(言語情報科学)人間科学部2019春学期
専門ゼミII(言語情報科学)人間科学部2019秋学期
人間情報科学概論 01人間科学部(通信教育課程)2019秋クォーター
人間情報科学概論 02人間科学部(通信教育課程)2019秋クォーター
言語情報科学 01人間科学部(通信教育課程)2019秋学期
言語情報科学 02人間科学部(通信教育課程)2019秋学期
言語情報科学研究指導 A大学院人間科学研究科2019春学期
言語情報科学研究指導 B大学院人間科学研究科2019秋学期
言語情報科学ゼミ(1) A大学院人間科学研究科2019春学期
言語情報科学ゼミ(1) B大学院人間科学研究科2019秋学期
言語情報科学ゼミ(2) A大学院人間科学研究科2019春学期
言語情報科学ゼミ(2) B大学院人間科学研究科2019秋学期
言語情報科学特論大学院人間科学研究科2019秋クォーター
在外日本人移民・日系人関連資料の活用―北米・ハワイを中心に大学院人間科学研究科2019夏季集中
言語情報科学研究指導(D) A大学院人間科学研究科2019春学期
言語情報科学研究指導(D) B大学院人間科学研究科2019秋学期

教育内容・方法の工夫

ゼミ研究発表会(3・4年ゼミ生対象)

2004年04月-

詳細

概要:春学期末と年末、ゼミ生は研究の進捗状況を発表し、年度末には4年生のみ卒業論文の発表を行う発表会を開催する。特に年度末の発表会では企業や卒業生も参加してポスター形式で実施するため、充実した議論が行われる。

ゼミでの学生各自PCの活用およびサーバ利用(ゼミ)

2002年09月-

詳細

概要:演習ⅠⅡで学生各自PCを活用。学生にパワーポイントでの発表を課したり、ビデオを見ながら、ワープロソフトwordでのノートテイキングを行なわせた。

ゼミでの高い目標設定(ゼミ)

2004年04月-

詳細

概要:学会発表・特許出願・ソフトウェア開発などの具体的目標をあらかじめ設定することで、高い目的意識の保持を促す。

パワーポイントを使った授業実践(ほぼ全ての科目)

2002年09月-

詳細

概要:全授業について、全ての回をPowerPointを使って実施した。授業で使用したファイルは学内LANのWebサイト上に置き、学生の自習を可能にした。スライドを印刷したものをレジメとして毎回配布した。

サーバ導入と学生利用権限の借用(ほぼ全ての科目)

2002年09月-

詳細

概要:課題の実施、提出、演習の実施などのために、サーバを導入し、合計100人を超える学生の利用権限を設定して管理運用を行う。履修学生の一部はさらに権限を利用してWebページを作成して情報発信するなど、積極的姿勢を見せた。

システム開発実習における個別の目標設定(「情報システム論及び実習」)

2002年09月-

詳細

概要:システム開発実習を伴う科目において、履修者自身が目標システムを設計して開発することにより、履修者の動機にあった実習を可能とする。

学生各自のPC使用による実践的教育(「プログラミングI」「プログラミングII」「コンピュータシステム入門」)

2003年04月-

詳細

概要:プログラミングや情報処理技術の教育において、履修学生全員が持参したPCを使用して実習を行うことにより、教育効果を上げ、より強固に身につくことを狙う。

複数クラス間のレベル調整を狙った共通テストの作成および実施(「プログラミングI」)

2003年04月-

詳細

概要:少人数教育が必要なプログラミング教育において、設定した複数クラス間でレベル差の著しい解離が生じないように、共通テストを作成して実施。

資格認定機関との提携に伴う適切な教材の使用(「プログラミングI」「プログラミングII」)

2003年04月-

詳細

概要:プログラミング教育において、一般に広く有効なプログラミング資格を認定する機関と提携し、それに伴って機関が発行する適切な教材を使用することにより、効率的なトレーニングコースを実施。

資格試験問題を用いた小テスト実施(「プログラミングI」)

2003年04月-

詳細

概要:プログラミングや情報処理技術の資格取得につながる科目において、実際の資格試験問題を用いて小テストを実施することにより、各自のレベルを確認するとともに動機を持たせることを狙う。

一貫したテーマに沿った情報処理技術教育(「情報処理I」)

2002年09月-2004年03月

詳細

概要:情報処理技術の修得においては目的意識を高くもつことが重要であるとの考えに基づき、グループごとに課題を設定して調査・分析・報告書作成・発表の過程を経て実践的に技術を指導。

個別添削指導(「プログラミングI」「プログラミングII」(通信教育課程))

2003年04月-

詳細

概要:課題を与え、提出させ、添削の上返却。プログラミング技術を個別に指導。

授業アンケートの実施

2002年09月-

詳細

概要:多様な履修動機が考えられる「情報システム論及び実習」「談話分析」で開講前アンケートを実施している。履修動機や他の履修科目を確認し、その結果を授業計画に反映させる。

その他教育活動

授業連絡Webページ設置(全ての科目)

詳細

概要:全ての科目において、授業の内容・連絡事項などを掲示するWebページを設置。授業計画の細かな修正を随時知らせたり、教材の訂正や、課題のヒントなど、きめ細かな教育指導を実現。