説明: 説明: C:\Users\user\Desktop\img\head_img_slim.jpg

研究領域:自然言語処理(言語情報の有効活用に関する研究) 

自然言語処理とは,日本語や英語などの自然言語で書かれた文章を,コンピュータを利用して処理することです.社会の情報化が進展し大量の電子化文書が流通している現在,自然言語処理技術を利用した,必要な情報へ効率的にアクセスするための技術,重要な情報を抽出する技術,情報を他の有用な情報に変換する技術は,益々重要になっています.また,自然言語処理自体を高精度化するための知識も,大量の文書から抽出することも考えられます.本研究室では,このような,情報を有効活用するための技術について研究しています.

以下に現在進行中の具体的なテーマを挙げます.


自然言語処理の高精度化のための語意知識抽出に関する研究

自然言語処理技術はまだ完成された技術ではなく,解析誤りを犯します.解析の精度を上げるためには,語の意味に関する知識(単語の意味分類,格フレーム,事象間の含意関係など)が必要です.潜在的なカテゴリー(データ中に明示されていない情報)を有する統計的言語モデルを用いて,モデル選択やパラメタ推定により,大量の電子化文書からこれらの語意知識を抽出します.


必要な情報へ効率的にアクセスするための技術に関する研究

キーワード方式の検索は便利ですが,適切なキーワードを思いつかないとか,キーワードでヒットする文書が多すぎて確認が困難などの問題があります.科学技術論文の検索を対象として,潜在的なカテゴリを有する統計的言語モデルを用いた文書集合中のトピックの抽出,文書中の語の間の統語的/意味的関係の推定,照応解析,クラスタリングなどにより,必要な論文を効率的に検索するための支援技術について研究しています.


大量の文書に潜む重要な情報の抽出に関する研究

たとえば,機関リポジトリに登録された論文を利用した潜在的研究者クラスタの抽出(研究者間の共同研究を推進するのに役立ちます),意見文に潜むそれを発話した人の価値観の推定(社会科学での内容分析に役立ちます)などの研究を,潜在的カテゴリーを有する統計的言語モデルやSupport Vector Machineを用いた統計的なパターン認識により進めています.


自然言語処理技術を用いた英語学習支援

Web上には,様々な英文書があり,学習者にとって興味ある内容で適切な難易度の英語多読用教材を作成するための素材の宝庫です.自然言語処理技術を利用して,意味の塊ごとに句や節を順次提示したり,読み終えた後に行なう文章の内容に関する質問と答えの自動生成を行ったりする,英語学習の支援システムの開発を行っています.


 

ページの先頭へ↑