氏名

サギサカ ヨシノリ

匂坂 芳典

職名

教授

所属

(基幹理工学部)

連絡先

メールアドレス

メールアドレス
sagisaka@giti.waseda.ac.jp

URL等

WebページURL

http://www.sagisaka.giti.waseda.ac.jp

研究者番号
70339737

本属以外の学内所属

兼担

理工学術院(大学院基幹理工学研究科)

国際学術院(大学院国際コミュニケーション研究科)

研究院(研究機関)/附属機関・学校(グローバルエデュケーションセンター)

学内研究所等

理工学総合研究センター

兼任研究員 2003年-2006年

空間科学研究所

研究員 2004年-2005年

メディアネットワークセンター

兼任研究員 2008年-2010年

音声_認識_基盤技術研究所

研究員 2005年-2009年

知覚情報システム研究所

研究所員 2010年-2010年

メディアネットワークセンター

兼任研究員 2010年-2010年

知覚情報システム研究所

研究所員 2010年-2015年

知覚情報システム研究所

研究所員 2015年-2019年

ことばの科学研究所

研究所員 2013年-2018年

理工学術院総合研究所(理工学研究所)

兼任研究員 2006年-2018年

理工学術院総合研究所(理工学研究所)

兼任研究員 2018年-

学歴・学位

学歴

-1973年 早稲田大学 理工学部 物理学
-1975年 早稲田大学 理工学研究科 数理物理学

学位

博士(工学) 論文 早稲田大学

経歴

1975年-1986年日本電信電話公社(現NTT)武蔵野電気通信研究所 基礎研究部 研究員
1986年-1993年ATR自動翻訳電話研究所 主任研究員
1993年-1994年ATR音声翻訳研究所 第二研究室 室長
1993年-2000年ATR音声翻訳通信研究所 第二研究室 室長
1997年-2001年神戸大学大学院 自然科学研究科 連携講座 客員教授
2000年-2001年ATR音声言語通信研究所 第二研究室 室長
2001年-早稲田大学国際情報通信研究科 教授
2001年-ATR音声言語通信研究所 客員研究員

所属学協会

日本音響学会 評議員,海外渉外委員

日本音響学会 評議員,海外渉外委員

電子情報通信学会 論文誌編集委員,音声専門委員会委員

電子情報通信学会 論文誌編集委員,音声専門委員会委員

米国音響学会

IEEE 音声専門委員会委員

受賞

ESCA 2005年度 最優秀論文賞

2005年09月

科学技術庁長官表彰(研究功績者表彰)

2000年

電子情報通信学会 論文賞受賞

1996年

研究分野

キーワード

音声言語情報処理、音声認識、音声合成

科研費分類

情報学 / 人間情報学 / 知能ロボティクス

共同研究希望テーマ

音声言語科学に基づく言語・翻訳学習システム
音声合成

研究テーマ履歴

タスク独立型連続音声認識

研究テーマのキーワード:未登録語,連続音声認識,タスク独立型音声認識

機関内共同研究

音声生成・知覚の時間制御機構モデル

研究テーマのキーワード:時間制御,音韻時間長,韻律制御

国内共同研究

韻律情報処理の計算モデル

研究テーマのキーワード:韻律,音韻時間長,基本周波数制御

個人研究

論文

A Speech Translation System Applied to a Real-World Task/Domain and Its Evaluation Using Real-World Speech Data

Yoshinori Sagisaka

IEICE Trans.E84-D;1, pp.142-1542001年-

New Language Models Using Phrase Structures Extracted from Parse Trees

Yoshinori Sagisaka

EUROSPEECH20011,pp.697-7002001年-

Pronunciation Variant Analysis

Yoshinori Sagisaka

EUROSPEECH20011,pp.65-682001年-

Structured Language Model for Class Identification of Out-of-Vocabulary Words Arising from Multiple Word-Classes

Yoshinori Sagisaka

EUROSPEECH20011,pp.693-6962001年-

Evaluation of Mis-recognition Detection Using Confidence Measures

Yoshinori Sagisaka

ICSP20012,pp.685-6902001年-

A Language Model Reflected by the Relation between Phrase Structures

Yoshinori Sagisaka

ASJ Spring Meeting1,pp.195-1962001年-

A Language Model Adaptation Considering Multiple Dimensionality of Domain

Yoshinori Sagisaka

ASJ Spring Meeting1,pp.199-2002001年-

Decodoing with Sub-Word Network Models for Out-of-Vocabulary Words Recognition

Yoshinori Sagisaka

Technical Report of IEICE101;156,pp.7-122001年-

Multi-Class Composite N-gram Language Model Using Multiple word Clusters Word Successions

Yoshinori Sagisaka

Technical Report of IEICE101;156,pp.13-182001年-

Word Categorazation by MAP Interpolating Part-of-Speech and Word Connectivity Statistics

Yoshinori Sagisaka

IEICE TransactionsJ84-D-II;1,pp.41-472001年-

Speech Synthesis

Yoshinori Sagisaka

Journal of ASJ57;1,pp.11-202001年-

Pronunciation Variant Analysis using Speaking Style Parallel Corpus

Yoshinori Sagisaka

EUROSPEECH20011,pp.65-682001年-

Multi-Class Composite N-gram Language Model Using Multiple word

Yoshinori Sagisaka

EUROSPEECH20011,pp.25-282001年-

自動音韻セグメンタの時間精度評価−ラベル尤度との相関と誤差の音韻文脈依存症−

日本音響学会講演論文集pp.317-3182002年03月-

文音声における音韻長伸縮の許容度に対する文内位置の効果

日本音響学会講演論文集pp.421-4222002年03月-

話題と文型の違いを同時に考慮した言語も出る適応

電子情報通信学会論文誌J85-D-Ⅱ;8, pp.1284-12902002年08月-

大規模日本語音声データベースの構築と評価  

日本音響学会誌58;9, pp569-5782002年08月-

H. Yamamoto and Y. Sagisaka: Multi-Class Composite N-gram Language Model Based on Connection Direction

Yoshinori Sagisaka

Transaction of System and Computers in Japan, Vol.34, No. 7pp. 108-1142003年06月-

複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識

山本、小窪、菊井、小川、匂坂

電子情報通信学会論文誌 Vol.J87-D-II No.12pp. 2104-21112004年12月-

Prosody Control Modeling for Speech Technologies Speech recongnition and Speech Understanding 230

Yoshinori Sagisaka

WE-Heraeus-Seminar2000年-

Rules, but what for ? - Rule description as efficeent and robust abtraction of corpora and its optimization fitting to application purpose -

Y. Sagisaka, H. Uamamoto, M. Tsuzaki, and H. Kato

Proc. Of ICSLP'00, 3, pp. 448-4512000年-

Robust Speech Translation using fine keyword clustering

Y, Wakita, K. Matsui, and Y. Sagisaka

Proc. of MSC2000 (Workshop on Multi-Lingual Speech communication)pp. 79-822000年-

Cellular-phone Based Speech-to Speech Translation System ATR-MATRIx

R. Gruhn, H. Singer, H. Tsukada, M. Naito, A. Nishino, A. Nakamura, Y. Sagisaka, and S. Nakamura

Proc. of ICSLP'004, p. 448-4512000年-

Analysis of Acoustic Models Trainesd on a Large-Scale Speech Database

T. Matsui, M. Naito, Y. Sagisaka, K. Okuda, S. Nakamura

Proc. of ICSLP'002, pp. 503-5062000年-

Pronnciation Variants Description using Recognition Error Modeling with the Phonetic Derivation Hypotheses

H. Nakajima, Y. Sagisaka, and H. Yamamoto

Proc. of ICSLP'003, pp. 1093-10962000年-

A Hierarchical Language Model Incorporation Class-dependent Word Models for OOV Words recognition

K. Tanigaki, H. Yamamoto, Y. Sagisaka

Proc. of ICSLP'003, pp. 123-1262000年-

A Language Model for Conversational Speech Recognition Using Information Designed for Speech Translation

H. Yamamoto, K. Tanigaki, and Y. Sagisaka

Proc. of ICSLP'001, pp. 190-1932000年-

A Tagger-Aided Language Model with A Stack Decoder

R. Zhang, E. Black, A. Finch, and Y. Sagisaka

Proc. of ICSLP'001, pp. 250-2532000年-

An Embedded Knowledge Combination for Hybrid Language Modeling

S. Zhang, H. Yamamoto, and Y. Sagisaka

Proc. of ICSLP'001, pp. 182-1852000年-

仮説数による誤認識箇所確定尺度の評価

沖本、山本、匂坂

日本音響学会平成12年度秋季研究発表会論文集3-5-3, pp. 75-762000年-

ATR-MATRIXと人間との音声翻訳能力比較法の誤差に関する検討

菅谷、竹澤、匂坂、山本

日本音響学会平成12年度秋季研究発表会論文集3-5-10, pp. 89-902000年-

A Preliminary Investigation of Sub-Syllabic Modeling for Chinese Speech Recognition Based on HMNET

S. Zhang, J. Zhang, S. Nakamuura, Y. Sagisaka

日本音響学会平成12年度秋季研究発表会論文集2-Q-19, pp. 127-1282000年-

多重クラスTrigram構築のための効率的な自動クラスタリング手法

磯貝、白井、山本、匂坂

電子情報通信学会音声研究会 第二回音声言語シンポジウム Technical Report of IEICE100; 523, pp. 103-1072000年-

Chinese Speech Recognition Based on Clustered Acoustic Units

J. Zhang, S. Zhang, Y. Sagisaka, N. Nakamura

日本音響学会2001年春季研究発表会1, pp. 187-1882001年-

Modeling Segmental Context Effect for Chinese Speech Recognition

J. Zhang, S. Zhang, Y. Sagisaka, N. Nakamura

情報処理学会音声言語情報処理研究会研究報告 IPSJ SIG Notes, 2001-SLP-352001; 11, pp. 37-422001年-

句構造間の関係を反映した言語モデル

實廣、山本、山田、匂坂

日本音響学会 2001年春季研究発表会1, pp. 195-1962001年-

ドメインの多次元性を考慮した言語モデル適応

山本、匂坂

日本音響学会 2001年春季研究発表会1, pp. 199-2002001年-

Thai Speech Recognition by Acoustic Models Mapped from Japanese

Yoshinori Sagisaka

Proceedings of SNLP-Oriental COCOSDA2002pp.211-2162002年05月-

A statistical word model using word-class specific constraints for handling out-of vocabulary words in speech recognition

Yoshinori Sagisaka

Proceedings of SNLP-Oriental COCOSDA2002pp.37-432002年05月-

Spoken Language Translation Research at ATR

Yoshinori Sagisaka

Survey on Research and Development of Machine Translation in Asian Countriespp.177-1822002年05月-

認知計算モデルとしての音声技術 

電子情報通信学会技術研究報告 SP2002-29 pp.31-36 2002年05月-

構造化言語モデルとその実装 

電子情報通信学会技術研究報告SP2002-32 pp.49-542002年05月-

文中の音韻長伸縮の自然性許容に対する文節内位置の効果 

電子情報通信学会技術研究報告SP2002-75 pp.23-28 2002年08月-

Effects of Intra-phrase Position on Acceptability of Changes in Segmental Duration in Sentence Speech

Yoshinori Sagisaka

Proceedings of ICSLP-2002pp.761-7642002年09月-

タスク外語彙を含む音声の認識 

日本音響学会2002年秋季研究発表会講演論文集 pp143-1442002年09月-

対話音声における程度副詞に見られる基本周波数変化について 

日本音響学会2002年秋季研究発表会講演論文集 pp.341-3422002年09月-

文音声における音韻長伸縮の許容度に対する呼気段落内位置の効果 

日本音響学会2002年秋季研究発表会講演論文集 pp.433-4342002年09月-

Automatic phone segment alignment using statistical deviations from manual transcriptions

Yoshinori Sagisaka

FIRST PAN-AMERICAN/IBERIAN MEETING ON ACOUSTICS2002年12月-

発話情報を用いたF0制御パラメータの自動推定 

日本音響学会2003年春季研究発表会講演論文集 pp.299-3002003年03月-

日本人発話英語のリズム客観評価モデル 

日本音響学会2003年春季研究発表会講演論文集 pp.353-3542003年03月-

英語発話リズム客観評価に向けた音響特徴の分析 

日本音響学会2003年春季研究発表会講演論文集 pp.355-3562003年03月-

文音声における音韻長の制御特性と知覚特性の対応関係 

日本音響学会2003年春季研究発表会講演論文集 pp.467-4682003年03月-

Relationship between control precision and perceptual sensitivity to segmental duration

H. Kato, M. Muto, M. Tsuzaki and Y. Sagisaka

Proc. ICPhS 2003 (International Congress of Phonetic Sciences)pp. 2043-20462003年08月-

Analysis and Modeling of Syllable Duration for Thai Speech Synthesis

C. Hansakunbuntheung, V. Tesprasit, R. Siricharoenchai and Y. Sagisaka

Proc. Eurospeech 2003pp. 93-962003年09月-

Generation and perception of F0 markedness in conversational speech with adverbs expressing degrees

T. Yamashita and Y. Sagisaka

Proc. Eurospeech 2003pp. 173-1762003年09月-

Word Class Modeling for Speech Recognition with Out-of-Task Words Using a Hierarchical Language Model

Y. Ogawa, H. Yamamoto and Y. Sagisaka

Proc. Eurospeech 2003pp. 221-2242003年09月-

Corpus-Based Modeling of Naturalness Estimation in Timing Control for Non-Native Speech

M. Muto, Y. Sagisaka, T. Naito, D. Maeki, A. Kando and K. Shirai

Proc. Eurospeech 2003pp. 401-4042003年09月-

タスク外語彙のための構造化クラス言語モデル

小川、山本、匂坂、小窪、菊井

日本音響学会2003年秋季研究発表会講演論文集, Vol. I, 2-6-12pp. 83-842003年09月-

Analysis on syllable duration characteristics for Thai speech Synthesis

C. Hansakunbuntheung, V. Tesprasit, R. Siricharoenchai, M. Muto and Y. Sagisaka

日本音響学会2003年秋季研究発表会講演論文集, Vol. I, 3-8-2pp. 271-2722003年09月-

程度副詞F0に見られる対話音声の自然性知覚について

山下、匂坂

日本音響学会2003年秋季研究発表会講演論文集, Vol. I, 1-8-19pp. 341-3422003年09月-

Multi-class composite N-gram language model

H. Yamamoto, S. Isogai and Y. Sagisaka

Speech Communication 41pp. 369-3792003年10月-

A collection of onomatopoeias in Japanese sports

Y. Fujino, M. Kikkawa and Y. Sagisaka

Proc. Oriental COCOSDA 2003 (The International Committee for the Co-ordination and Standardisation of Speech Databases and Assesment Techniques)pp. 160-1632003年10月-

NECTEC-ATR Thai Speech Corpus

S. Kasuriya, V. Sornlertlamvanich, P. Cotsomrong, T. Jitsuhiro, G. Kikui and Y. Sagisaka

Proc. Oriental COCOSDA 2003 (The International Committee for the Co-ordination and Standardisation of Speech Databases and Assesment Techniques)2003年10月-

Out-of-Vocabulary Word Recognition with Hierarchical Doubly Markov Language Model

H. Kokubo, H. Yamamoto, Y. Ogawa and Y. Sagisaka

Proc. ASRU2003(Automatic Speech Recognition and Understanding Workshop)pp. 543-5472003年12月-

Automatic Extraction of F0 Control Parameters Using Utterance Information

H. Ogawa and Y. Sagisaka

Proc. Speech Prosody 2004pp. 447-4502004年03月-

Analysis of Segmental Duration for Thai Speech Synthesis

C.Hansakunbuntheung and Y. Sagisaka

Proc. Speech Prosody 2004pp. 479-4822004年03月-

文中の音韻長伸縮の自然性許容に対する発話速度の効果

武藤、加藤、津崎、匂坂

電子情報通信学会技術研究報告, SP2003-198pp. 31-362004年03月-

複数のマルコフモデルを用いた階層化言語モデルによる未登録語の認識

小窪、菊井、小川、山本、匂坂

日本音響学会2004年春季研究発表会講演論文集, Vol. I, 3-Q-22pp. 187-1882004年03月-

発話情報を用いたF0制御パラメータの自動抽出

小川、匂坂

日本音響学会2004年春季研究発表会講演論文集, Vol. I, 2-7-1pp. 265-2662004年03月-

発話情報語彙に基づく対話音声韻律制御の試み

山下、匂坂

日本音響学会2004年春季研究発表会講演論文集, Vol. I, 2-7-2pp. 267-2682004年03月-

日本人英語発話の客観評価モデル作成に向けた音響特徴量の分析

鈴木、前木、白井、武藤、匂坂

日本音響学会2004年春季研究発表会講演論文集, Vol. I, 3-7-19pp. 319-3202004年03月-

Sport・Onomatopoeiaの多様性とその音声特徴の分析

藤野、匂坂

日本音響学会2004年春季研究発表会講演論文集, Vol. I, 2-P-32pp. 393-3942004年03月-

文節内音韻長伸縮の許容度に対する発話速度の効果

武藤、加藤、津崎、匂坂

日本音響学会2004年春季研究発表会講演論文集, Vol. I, 2-6-5pp. 415-4162004年03月-

クラシック音楽を対象とした一般化調和解析による採譜支援法の提案

今井、匂坂

日本音響学会2004年春季研究発表会講演論文集, Vol. I, 2-9-2pp. 687-6882004年03月-

Effects of speaking rate on the acceptability of change in segmental duration within a phrase

M. Muto, H. Kato, M. Tsuzaki and Y. Sagisaka

The Journal of the Acoustical Society of America, Vol. 115, No. 5, Pt. 2 of 2pp. 26082004年05月-

基本周波数パタンに見られる発話態度の分析

苔縄、津崎、加藤、匂坂

情報処理学会研究報告, Vol. 2004, No. 74pp. 87-922004年07月-

未知固有表現を含む音声の認識

冨田、匂坂、沖本

日本音響学会2004年秋季研究発表会講演論文集,Vol. I, 2-1-2pp. 59-602004年09月-

統計的モデルに基づく日本人姓のアクセント自動推定

桃沢、匂坂

日本音響学会2004年秋季研究発表会講演論文集,Vol. I, 3-2-17pp. 349-3502004年09月-

多次元尺度構成法を用いた対話音声の基本周波数パタン分析

苔縄、匂坂、津崎、加藤

日本音響学会2004年秋季研究発表会講演論文集,Vol. I, 3-2-21pp. 357-3582004年09月-

Mis-recognized utterance detection using hierarchical language model

H. Yamamoto, G. Kikui and Y. Sagisaka

Proc. ICSLP 2004(International Conference on Speech Processing)pp. 1025-10282004年10月-

Effect of speaking rate on the acceptability of change in segmental duration

M. Muto, H. Kato, M. Tsuzaki and Y. Sagisaka

Proc. ICSLP 2004 (International Conference on Speech Processing)pp. 345-3482004年10月-

Analysis of the phone level contributions to objective evaluation of English speech by non-natives

Y. Suzuki, M. Muto, K. Shirai and Y. Sagisaka

Proc. ICSLP 2004 (International Conference on Speech Processing)pp. 1673-16762004年10月-

中国語単語音声からの基本周波数制御コマンドの自動抽出

李、匂坂

日本音響学会2005年春季研究発表会講演論文集, 1-1-11pp. 175-1762005年03月-

F0 control characterization by perceptual impressions on speaking attitude using Multiple Dimensional Scaling

Y. Kokenawa, M. Tsuzaki, H. Kato and Y. Sagisaka

ICASSP 2005 Philadelphia, SP-P1.3.(Ⅰ-273)pp. 273-2762005年03月-

Speech recognition of a named entity

T. Tomita, Y. Okimoto, H. Yamamoto and Y. Sagisaka

ICASSP 2005 Philadelphia, SP-P16.12(Ⅰ-1057)pp. 1057-10602005年03月-

音声合成のための規則とデータの表現、獲得、評価

電子情報通信学会論文誌 D-ⅡJ-83-D-Ⅱ; 11, pp. 2068-20762000年-

音声認識のための言語モデリング

日本計量学会第28回大会pp. 173-1742000年-

音声翻訳・合成・認識

日本学術振興会超集積化デバイス・システム第165委員会pp. 9-162000年-

Modeling and perception of temporal characteristics in speech (招待講演)

Yoshinori Sagisaka

Proc. ICPhS 2003 (International Congress of Phonetic Sciences)pp. 1-62003年08月-

Speech synthesis with attitude (招待講演)

Y. Sagisaka, T. Yamashita and Y. Kokenawa

Proc. Speech Prosody 2004pp. 401-4042004年03月-

Spoken language processing as computational human modeling (招待講演)

Yoshinori Sagisaka

Proc. ICSLT-O-COCOSDA2004pp. 161-1662004年11月-

人間科学としての音声言語研究

日本音声学会誌「音声研究」4; 3, pp. 64-652000年-

音声分野 5.音声合成

日本音響学会誌特集「音響学における20世紀の成果と21世紀に残された課題」57; 1, pp. 11-202001年-

日本語単語連鎖のアクセント規則

電子情報通信学会論文誌J66-D/7,849-8561983年-

規則による音声合成のための音韻時間長制御

電子情報通信学会論文誌J67-A/7,629-6361984年-

局所的な句構造によるポーズ挿入規則化の検討

電子情報通信学会論文誌79-D-(]G0002[)/9,1455-14631996年-

品詞および可変長単語列の複合N-gramの自動生成

電子情報通信学会論文誌J81-D-(]G0002[)/9,1929-19361998年-

特許

整理番号:275

発話評価装置及び発話評価方法(日本)

匂坂 芳典, 内藤 拓郎, 前木 大樹, 近藤 亜希

特願2003- 71915、特開2004-279799

整理番号:464

音声合成装置(日本)

匂坂 芳典, 桃澤 哲也

特願2005- 80568、特開2006-259620

整理番号:499

音声合成装置、音声処理装置、およびプログラム(日本)

匂坂 芳典, グリーンバーグ 陽子

特願2005-149423、特開2006-330060

整理番号:2059

韻律制御装置、韻律制御方法及びプログラム(日本)

匂坂 芳典, 高田 一眞

特願2018-133062、特開2020- 12867

外部研究資金

科学研究費採択状況

研究種別:

第二言語発話の時間韻律制御に見られる第一言語の定量的影響分析とモデル化

2011年-0月-2016年-0月

配分額:¥18720000

研究種別:

第二言語習得支援のための韻律知覚モデルの研究

2008年-0月-2013年-0月

配分額:¥18720000

研究種別:

人物像に応じた音声文法

配分額:¥44200000

研究種別:基盤研究(B)

実体モデルに基づく声質生成機構の構築

2007年-2010年

研究分野:知覚情報処理・知能ロボティクス

配分額:¥18070000

研究種別:基盤研究(B)

出力単語の語彙属性を用いた対話韻律制御に基づく音声合成

2006年-2009年

研究分野:知覚情報処理・知能ロボティクス

配分額:¥18280000

研究種別:

東アジア言語の音声コーパスおよび音声入出力評価手法の国際的協調に関する研究

配分額:¥2800000

研究種別:

人の知覚認知処理機構に基づく音声の時間的側面の数理モデル構築

配分額:¥49400000

研究種別:基盤研究(B)

未登録語を含むタスク外発話を受理する音声認識方式の研究

2002年-2005年

研究分野:知能情報学

配分額:¥14000000

研究種別:特定領域研究(B)

韻律制御に主体をおいた対話システム

2000年-2003年

配分額:¥54600000

研究種別:基盤研究(C)

音声言語における韻律構造の心理的実在性に関する通言語的研究

2011年-2013年

研究分野:言語学

配分額:¥5070000

研究種別:

音声言語における韻律構造の心理的実在性に関する通言語的研究

2011年-0月-2014年-0月

配分額:¥5070000

研究種別:

状況に基づく日本語話しことばの研究と、日本語教育のための基礎資料の作成

2011年-1月-2015年-0月

配分額:¥30940000

研究種別:

第二言語の時間的要素知覚・習得のための数理モデルの研究

2013年-0月-2017年-0月

配分額:¥4940000

研究資金の受入れ状況

実施形態:共同研究

韻律情報を利用した自然な対話システム2000年-

実施形態:受託教育

未登録語処理のための統計敵言語モデル2001年-

学内研究制度

特定課題研究

非母語音声の計算科学 -第二言語発話分析・評価を中心とした科学的解明とモデル化-

2010年度共同研究者:中野 美知子, 近藤 眞理子

研究成果概要: 本研究では非母語、特に外国語学習の対象となる第二言語発話音声の分析・評価を中心とした科学的解明を行うため、音声生成制御機構モデル、言語・音声学、音声言語情報処理技術、音声聴知覚、語学教育を統合した「非母語音声」の「計算科学」的研... 本研究では非母語、特に外国語学習の対象となる第二言語発話音声の分析・評価を中心とした科学的解明を行うため、音声生成制御機構モデル、言語・音声学、音声言語情報処理技術、音声聴知覚、語学教育を統合した「非母語音声」の「計算科学」的研究を行う。これにより、非母語音声の科学的理解、第二言語音声教育への展開を目指す。 まず、学習者音声の自動評価のために、母語話者英語音声と学習者音声の時間制御特性の相違により、学習者英語音声のタイミング制御特性を客観評価する尺度の検討を行った。音声サンプル毎の発話速度のばらつきを吸収する手始めとして、当該比較音素を含む音節長による時間長正規化法を試みた。日本人学習者の英語音声コーパスを用いた実験により、正規化した時間長差異と英語母語話者が与える主観評価との相関が正規化を施さないものに比べて上昇することが判明し、提案した方法の有効性を確認することができた。この実験結果により、音素時間長の制御に関与する要素による更なる精密な正規化を用いた客観尺度の可能性が広がった。 次に、韓国人日本語学習者の特殊拍学習実験を進め、特殊拍提示コンテキストの影響を測定した。この結果、孤立単語と文での提示双方において、学習効果が示されると共に、文を用いた場合の汎化学習傾向も明らかとなった。合わせて、提示コンテキストによる学習難易度の分析も進め、時間長知覚学習へのラウドネスの関与が示唆された。 さらに、以上の個々の研究検討に加え、AESOP(Asian English Speech cOrpus Project)研究コンソーシアムのメンバーとの打ち合わせを持ち、次年度からの本格的研究開始準備のため、昨年度、AESOPメンバーと設計した音声コーパスのテスト収録を行った。日本語を母語とする学生約60名の英語音声を収録し、一部のものについて音声認識技術を用いた音素アラインメントを行い、分析データの準備を進めた。

非母語音声生成・知覚・習得の計算科学

2011年度共同研究者:中野 美知子, 近藤 眞理子

研究成果概要:本研究では、母語によって異なる第二言語音声の生成・知覚現象を音声科学として理解し、音声言語教育に資するため、第二言語学習者に見られる音声生成の時間制御・知覚特性分析を目的とする。まず、学習者の時間長制御傾向を把握するため、日本人学...本研究では、母語によって異なる第二言語音声の生成・知覚現象を音声科学として理解し、音声言語教育に資するため、第二言語学習者に見られる音声生成の時間制御・知覚特性分析を目的とする。まず、学習者の時間長制御傾向を把握するため、日本人学習者英語音声区分の時間長を解析した。英語教師が学習者英語音声に付与した主観評価得点と、学習者音声と英語母語話者音声に見られる各音声区分の持続時間長の相違に対しての相関分析を行った。この結果、文中の強音節数が1、2、3と増加するにつれて、相関値は、各々0.34、0.49、0.68と上昇することが判明した。これから、英語音声の強勢と弱勢に基づくストレスタイミングの実現が、日本人学習者ではうまくなされておらず、複数のストレス(強音節)を有する音声サンプルほど明確な差異が生じていることが明らかとなり、客観的な測定量で能力差を定量的に評価する上での測定対象に対する配慮が必要であることが判明した。 また、言語による時間長制御の違いが、音素カテゴリの生成・知覚に与える影響を解析するため、促音と非促音、長母音と短母音といった、日本語学習者にとって学習が難しい特殊拍について分析した。韓国人日本語学習者に対し、特殊拍の知覚学習を種々の条件で実験し、学習者毎に学習前後の能力を比較した結果、発話テンポが異なる音声を用いた学習の優位性が示された。また、知覚判断特性の分析により、促音の誤答の傾向と音の大きさを表す感覚尺度であるラウドネスとの相関があることが明らかとなった。この結果により単に音声の時間長比較だけでなく、リズムやタイミングの知覚現象としての詳細解明の必要性が明らかとなった。 さらに、本研究が対象とする母語による違いの分析を可能とするため、第二言語作成と利用に関する共同研究コンソーシアムAESOP(Asian English Speech cOrpus Project)に参加するアジア圏研究者との連携を図り、台湾(新竹市)で国際ワークショップを開催すると共に、日本、中国、ミャンマーを母語とする英語音声コーパスの作成を進めた。また、ネパール、インドネシアといった、新たなAESOP参加国の研究者達と共通音声コーパス作成について準備を開始した。

海外研究活動

研究課題名: 対話音声の韻律および非母語話者音声の韻律制御のモデル化

2007年09月-2008年01月

機関: パリ第3大学 他(フランス)、チュラロンコーン大学(タイ)

現在担当している科目

科目名開講学部・研究科開講年度学期
数学講究A基幹理工学部2020春学期
数学講究A  【前年度成績S評価者用】基幹理工学部2020春学期
数学講究B基幹理工学部2020秋学期
数学講究B  【前年度成績S評価者用】基幹理工学部2020秋学期
数学特別講究A基幹理工学部2020春学期
数学特別講究B基幹理工学部2020秋学期
卒業研究基幹理工学部2020通年
応用数理概論基幹理工学部2020通年
応用数理概論  【前年度成績S評価者用】基幹理工学部2020通年
応用数理講究A基幹理工学部2020春学期
応用数理講究A 【前年度成績S評価者用】基幹理工学部2020春学期
応用数理講究B基幹理工学部2020秋学期
応用数理講究B 【前年度成績S評価者用】基幹理工学部2020秋学期
ことばの数理基幹理工学部2020春学期
プロジェクト研究基幹理工学部2020通年
Research Project B基幹理工学部2020春学期
Research Project B 【S Grade】基幹理工学部2020春学期
Research Project C基幹理工学部2020秋学期
Research Project C 【S Grade】基幹理工学部2020秋学期
Research Project A基幹理工学部2020秋学期
Research Project D基幹理工学部2020春学期
修士論文(数学応数)大学院基幹理工学研究科2020通年
Research on Computing Language and Speech大学院基幹理工学研究科2020通年
ことばの情報数理研究大学院基幹理工学研究科2020通年
ことばの情報数理理論大学院基幹理工学研究科2020秋学期
Seminar on Computing Language and Speech A大学院基幹理工学研究科2020春学期
ことばの情報数理演習A大学院基幹理工学研究科2020春学期
Seminar on Computing Language and Speech B大学院基幹理工学研究科2020秋学期
ことばの情報数理演習B大学院基幹理工学研究科2020秋学期
Seminar on Computing Language and Speech C大学院基幹理工学研究科2020春学期
ことばの情報数理演習C大学院基幹理工学研究科2020春学期
Seminar on Computing Language and Speech D大学院基幹理工学研究科2020秋学期
ことばの情報数理演習D大学院基幹理工学研究科2020秋学期
Master's Thesis (Department of Pure and Applied Mathematics)大学院基幹理工学研究科2020通年
ことばの情報数理研究大学院基幹理工学研究科2020通年
Human Information Processing大学院国際コミュニケーション研究科2020春学期
Speech Information Processing大学院国際コミュニケーション研究科2020春学期

教育内容・方法の工夫

教育内容・方法の工夫

詳細

概要:・テーマカレッジ「ことばの科学」:テーマカレッジ「ことばの科学」を開催し、教育と研究の連携を強化・西早稲田−本庄間遠隔授業 :西早稲田と本庄の二箇所に分かれス授業を円滑に進めるための教材準備・工夫

作成した教科書・教材・参考書

作成した教科書、教材、参考書

詳細

概要:・音声と文法Ⅲ くろしお出版 (共著) ・音声と文法Ⅳ くろしお出版 (共著)

その他教育活動

教育活動上特記すべき事項

詳細

概要:・プロジェクト研究所:「ことばの科学」研究推進のためプロジェクト研究所を設立、学際領域研究を展開