氏名

コバヤシ マナブ

小林 学

職名

教授

所属

(データ科学センター)

本属以外の学内所属

兼担

研究院(研究機関)/附属機関・学校(グローバルエデュケーションセンター)

学歴・学位

学位

博士

外部研究資金

科学研究費採択状況

研究種別:

大規模ラーニングアナリティクスを用いた初学者のためのプログラミング教育システム

2016年-0月-2019年-0月

配分額:¥4290000

研究種別:

大規模データ時代のビジネスアナリティクス手法に関する基礎的研究

2014年-0月-2017年-0月

配分額:¥15730000

研究種別:

統計的学習理論と凸最適化アルゴリズムに基づく大規模データの自動分類法に関する研究

2013年-0月-2016年-0月

配分額:¥4680000

研究種別:

学習データの与え方を改良した勾配法に基づく学習アルゴリズムとそのロバスト性の考察

2011年-0月-2014年-0月

配分額:¥3770000

研究種別:

高速通信網に対する情報通信の信頼性向上に関する研究

配分額:¥1900000

研究種別:

誤り訂正符号の軟判定復号法に関する研究

配分額:¥2200000

研究種別:

ビジネス価値創造のためのデータ解析プラットフォームと時変協調フィルタリングの研究

2019年-0月-2023年-0月

配分額:¥4420000

研究種別:

言語学習を対象とした時空を越えて相手を感じられる自学自習システムの開発

2019年-0月-2022年-0月

配分額:¥17810000

学内研究制度

特定課題研究

機械学習における統計的手段と数理最適化モデルの融合に関する研究

2018年度

研究成果概要: 本研究では顧客と商品に潜在クラスを仮定し,それらの潜在クラスの下で消費活動が行われる協調フィルタリング問題を対象とした.このとき潜在クラスがある期間で遷移する数理モデルの検討を行った.具体的にはパラメータの事前確率をディリクレ分... 本研究では顧客と商品に潜在クラスを仮定し,それらの潜在クラスの下で消費活動が行われる協調フィルタリング問題を対象とした.このとき潜在クラスがある期間で遷移する数理モデルの検討を行った.具体的にはパラメータの事前確率をディリクレ分布,消費活動の確率を多項分布とし,潜在クラスは一定期間ごとに隠れマルコフモデルに従って遷移するモデルを提案した.結果的にこのモデルの事後確率を最大化するパラメータは,平均場近似を用いることにより,効率的に解くことが可能となった.また数値シミュレーションによって仮定したパラメータと推定パラメータの評価を行ったところ,その誤差はごくごく小さくなることが確認できた.

潜在クラスモデルによるベイズ的協調フィルタリング

2019年度

研究成果概要:ビジネスアナリティクス分野において,協調フィルタリングはユーザと商品やサービスの関係を解析する上で非常に重要なツールである.通常の協調フィルタリングにおいては,ユーザの商品に対する消費行動がデータとなる.本研究ではユーザの属性情報...ビジネスアナリティクス分野において,協調フィルタリングはユーザと商品やサービスの関係を解析する上で非常に重要なツールである.通常の協調フィルタリングにおいては,ユーザの商品に対する消費行動がデータとなる.本研究ではユーザの属性情報や商品そのものの情報を合わせてベイズ的に取り扱う手法の開発を行った. 具体的には各ユーザ及び商品にディリクレ分布から発生する潜在クラスを仮定するとともに,ユーザと商品の各属性にもディリクレ分布から発生する潜在クラスを仮定する.これらの潜在クラスの組み合わせにより,消費行動が多項分布で生起する確率モデルの検討を行った.このモデルに対して,平均場近似の手法を用いることにより,精度高く真のパラメータを推定可能であることが分かった.

誤り訂正符号の軟判定復号法に関する研究

1998年度

研究成果概要: 本研究では情報通信の高信頼化を実現する誤り訂正符号に対する復号法の高速化,高信頼化を目的としている.誤り訂正符号の復号は,通信路情報を有効に利用する軟判定復号法と,通信路情報を0,1としか扱わない硬判定復号法に大別される.前者... 本研究では情報通信の高信頼化を実現する誤り訂正符号に対する復号法の高速化,高信頼化を目的としている.誤り訂正符号の復号は,通信路情報を有効に利用する軟判定復号法と,通信路情報を0,1としか扱わない硬判定復号法に大別される.前者の中でも,硬判定復号法の一種であり計算量の少ない限界距離復号法を,複数回用いる軟判定復号法は数多く提案されており,Chase復号法,TK復号法,KNH復号法はその代表的な手法である.これらの復号法の多くは漸近的に,最も復号誤り確率の小さい最ゆう復号法を達成するが,多くの計算量を要するという欠点をあわせ持つ. 一方,限界距離復号法では通常訂正不可能となるある種の誤りを,効果的に訂正する硬判定復号法(限界距離を超える復号法と呼ぶ)が従来提案されている.著者はこの復号法を効率化する手法を提案し,さらにその優れた特性を利用してこれを軟判定復号法へ効果的に応用した.その結果上で述べた従来の軟判定復号法より復号誤り確率・計算量を大幅に低減することができることを示した. また限界距離復号法は0, 1の通信路情報を用いて基本方程式と呼ばれる連立方程式を高速に解くことにより行われる.従来の軟判定復号法は,この限界距離復号法をおのおの独立に複数回用いるため,復号にかかる計算量は限界距離復号回数に比例する.これに対し本研究では,(1)おのおのの限界距離復号法において得られる基本方程式間の関係の導出し,(2)以前行った限界距離復号法の結果(基本方程式の解)から次に行う限界距離復号法の結果を直接求めるアルゴリズムを導出した.(3)さらにこのアルゴリズムを用いた効果的な軟判定復号法を提案した.また,提案した軟判定復号法に要する計算量及び復号誤り確率を解析し,その結果計算量・復号誤り確率が従来手法より大幅に改善されることを示した.

誤り訂正符号の軟判定復号法に関する研究

1999年度

研究成果概要: インターネット・携帯電話・衛星通信・DVD などに代表されるように、マルチメディア社会において情報通信の高信頼化を実現する誤り訂正符号化技術は必要不可欠な基礎技術となっている。誤り訂正符号に対する復号法は、通信路情報を有効に利用... インターネット・携帯電話・衛星通信・DVD などに代表されるように、マルチメディア社会において情報通信の高信頼化を実現する誤り訂正符号化技術は必要不可欠な基礎技術となっている。誤り訂正符号に対する復号法は、通信路情報を有効に利用する軟判定復号法と、通信路情報を0,1としか扱わない硬判定復号法に大別される。 前者の中でも、硬判定復号法の一種であり計算量の少ない限界距離復号法を、複数回用いる軟判定復号法は数多く提案されており、Chase復号法、TK復号法、KNH復号法はその代表的な手法である。これらの復号法の多くは漸近的に、最も復号誤り確率の小さい最ゆう復号法を達成するが、多くの計算量を要するという欠点をあわせ持つ。一方、限界距離復号法では通常訂正不可能となるある種の誤りを、効果的に訂正する硬判定復号法(限界距離を超える復号法と呼ぶ)が従来提案されている。私はこの復号法を効率化する手法を提案し、さらにその優れた特性を利用してこれを軟判定復号法へ効果的に応用した。その結果上で述べた従来の軟判定復号法より復号誤り確率・計算量を大幅に低減することができることを示した。この研究成果は電子情報通信学会論文誌(A)に採録されている。 また、厳密な最ゆう復号法を実現するアルゴリズムの中でもいくつかの著名な手法として誤り訂正符号の符号化を利用する復号法が研究されている。これは通信路から受信した系列の信頼度の高い位置を情報とみなし、この情報を少しづつ変化させながら複数回符号化を行うことにより候補符号語を出力し、ゆう度が最大となる最ゆう符号語を推定する復号法である。これにより復号に必要となる平均計算量の大幅な低減が従来実現されている。このような最ゆう復号法では、すべて複数回繰り返す符号化は毎回独立に行われる。従って復号法全体で必要な計算量は符号化の計算量に比例してしまう。また符号化を行い候補符号語を求めてから、その符号語のゆう度(事後確率に比例する)を独立に求めている。そこで本研究では(1)変化させる情報系列同士の非常に強い関連を用いて、以前候補符号語として出力された符号語を利用することにより次に出力すべき候補符号語を効率良く求めるアルゴリズムの導出、(2)ゆう度を出力するパターンを集合として分割し、この集合ごとにゆう度を求めることにより複数符号語のゆう度を同時に計算する手法の提案を行った。(結果的に(1)により1回あたりの符号化に必要となるビット演算はO(n2)からO(n)に減少した。また(2)によりさらに1/3程度実数値の加減算を低減することに成功している。ここで、nは符号長を表す。)これらの成果は情報理論とその応用学会において発表を行った。今後これらの提案復号法の計算量の理論的評価を行うことが必要である。またテスト誤りパターンの出力順序を提案アルゴリズムと適するように選択することにより、より計算量を低減することができる手法を開発することは今後の課題である。

誤り訂正符号における最ゆう復号法の効率化に関する研究

2000年度

研究成果概要: 本研究は携帯電話や衛星通信等の情報通信において、雑音の影響を取り除く誤り訂正符号に対する復号法を対象としている。中でも最ゆう復号法は復号誤り確率を最小とするが、最もゆう度の高い符号語を探索する必要があるため、多くの計算量を要する... 本研究は携帯電話や衛星通信等の情報通信において、雑音の影響を取り除く誤り訂正符号に対する復号法を対象としている。中でも最ゆう復号法は復号誤り確率を最小とするが、最もゆう度の高い符号語を探索する必要があるため、多くの計算量を要するという欠点をあわせ持つ。本研究はこの最ゆう復号法の計算量を従来手法よりさらに低減することを目的としている。従来効率的な最ゆう復号法として、誤り訂正符号の符号化を利用する復号法が知られている。これは通信路から受信した系列の信頼度の高い位置を情報シンボルとみなし、この情報シンボルを緩やかに変化させながら複数回符号化を行うことにより候補符号語を出力し、ゆう度が最大となる最ゆう符号語を探索する復号法である。これにより復号に必要となる平均計算量の大幅な低減が実現されている。 本研究では、従来独立に複数回繰り返していた符号化に対し、以前候補符号語として出力された符号語を利用することにより、次に出力すべき候補符号語を非常に効率良く求める手法を提案した。また従来符号化を行い、候補符号語を生成してからその符号語のゆう度(事後確率に比例する)を独立に求めていたのに対し、複数符号語のゆう度を同時に計算することによりさらなる計算量低減を実現した。これらの技術をAIの探索手法であるA*アルゴリズムを用いる最ゆう復号法に応用し、結果的に符号化する回数が低減され、かつ符号化1回に必要となる計算量も減少することにより、復号全体に必要となる計算量を大幅に低減した。 またゆう度を求めるためには候補符号語に対し実数上の演算が必要となるが、0、1のシンボル情報のみから、得られた符号語が最ゆうとはなりえないことを判定する十分条件を導き、これを符号語が得られるたびに判定することにより、数多くの不必要なゆう度計算のための実数演算量を低減した。 本研究により、従来計算量が問題となっている最ゆう復号法に対し、その効率化を実現することができた。これらの提案は、復号誤り確率の多少の劣化を許しても、更なる大幅な計算量の提言を実現する準最ゆう復号法へ応用することも容易に可能である。計算量低減の度合いの理論的保証が重要な今後の課題である。

現在担当している科目

科目名開講学部・研究科開講年度学期
統計リテラシーα 01グローバルエデュケーションセンター2020春クォーター
統計リテラシーα 02グローバルエデュケーションセンター2020夏クォーター
統計リテラシーα 03グローバルエデュケーションセンター2020秋クォーター
統計リテラシーα 04グローバルエデュケーションセンター2020冬クォーター
統計リテラシーα(商学部) 01グローバルエデュケーションセンター2020春クォーター
統計リテラシーα(商学部) 02グローバルエデュケーションセンター2020夏クォーター
統計リテラシーα(商学部) 03グローバルエデュケーションセンター2020秋クォーター
統計リテラシーα(商学部) 04グローバルエデュケーションセンター2020冬クォーター
データ科学入門α 01グローバルエデュケーションセンター2020春クォーター
データ科学入門α 02グローバルエデュケーションセンター2020夏クォーター
データ科学入門α 03グローバルエデュケーションセンター2020秋クォーター
データ科学入門α 04グローバルエデュケーションセンター2020冬クォーター
統計リテラシーβ 01グローバルエデュケーションセンター2020春クォーター
統計リテラシーβ 02グローバルエデュケーションセンター2020夏クォーター
統計リテラシーβ 03グローバルエデュケーションセンター2020秋クォーター
統計リテラシーβ 04グローバルエデュケーションセンター2020冬クォーター
統計リテラシーβ(商学部) 01グローバルエデュケーションセンター2020春クォーター
統計リテラシーβ(商学部) 02グローバルエデュケーションセンター2020夏クォーター
統計リテラシーβ(商学部) 03グローバルエデュケーションセンター2020秋クォーター
統計リテラシーβ(商学部) 04グローバルエデュケーションセンター2020冬クォーター
データ科学入門β 01グローバルエデュケーションセンター2020春クォーター
データ科学入門β 02グローバルエデュケーションセンター2020夏クォーター
データ科学入門β 03グローバルエデュケーションセンター2020秋クォーター
データ科学入門β 04グローバルエデュケーションセンター2020冬クォーター
統計リテラシーγ 01グローバルエデュケーションセンター2020春クォーター
統計リテラシーγ 02グローバルエデュケーションセンター2020夏クォーター
統計リテラシーγ 03グローバルエデュケーションセンター2020秋クォーター
統計リテラシーγ 04グローバルエデュケーションセンター2020冬クォーター
データ科学入門γ 01グローバルエデュケーションセンター2020春クォーター
データ科学入門γ 02グローバルエデュケーションセンター2020夏クォーター
データ科学入門γ 03グローバルエデュケーションセンター2020秋クォーター
データ科学入門γ 04グローバルエデュケーションセンター2020冬クォーター
統計リテラシーδ 01グローバルエデュケーションセンター2020春クォーター
統計リテラシーδ 02グローバルエデュケーションセンター2020夏クォーター
統計リテラシーδ 03グローバルエデュケーションセンター2020秋クォーター
統計リテラシーδ 04グローバルエデュケーションセンター2020冬クォーター
Rによる統計解析 01グローバルエデュケーションセンター2020春クォーター
Rによる統計解析 02グローバルエデュケーションセンター2020夏クォーター
Rによる統計解析 03グローバルエデュケーションセンター2020秋クォーター
Rによる統計解析 04グローバルエデュケーションセンター2020冬クォーター
データ科学入門δ 01グローバルエデュケーションセンター2020春クォーター
データ科学入門δ 02グローバルエデュケーションセンター2020夏クォーター
データ科学入門δ 03グローバルエデュケーションセンター2020秋クォーター
データ科学入門δ 04グローバルエデュケーションセンター2020冬クォーター
Statistics Literacy α 01グローバルエデュケーションセンター2020春クォーター
Statistics Literacy α 02グローバルエデュケーションセンター2020秋クォーター
Statistics Literacy β 01グローバルエデュケーションセンター2020春クォーター
Statistics Literacy β 02グローバルエデュケーションセンター2020秋クォーター
Statistics Literacy γ 01グローバルエデュケーションセンター2020春クォーター
Statistics Literacy γ 02グローバルエデュケーションセンター2020秋クォーター
データ科学のための数学 01グローバルエデュケーションセンター2020春クォーター
データ科学のための数学 02グローバルエデュケーションセンター2020夏クォーター
データ科学のための数学 03グローバルエデュケーションセンター2020秋クォーター
データ科学のための数学 04グローバルエデュケーションセンター2020冬クォーター
回帰と分類のデータ科学グローバルエデュケーションセンター2020冬クォーター
時系列のデータ科学グローバルエデュケーションセンター2020秋クォーター
情報セキュリティの現場論(学部生用)グローバルエデュケーションセンター2020夏クォーター
情報セキュリティの現場論グローバルエデュケーションセンター2020夏クォーター