プロジェクト

 高度で柔軟な情報処理を実現するためには、自然言語情報・音声情報・画像情報などを統合してコンピュータで扱うことが益々重要になっています.我々のグループでは、機械翻訳および音声認識をコア技術に,多言語・多機能・多メディア知的システム(Multi-Lingual Multi-function Multi-media; MMM)に関する研究を行っています.自然言語処理、音声認識・話者認識、画像処理、e-Learning、聴覚心理応用、感性情報処理、言語を理解できる知的ロボットに関する研究を行っています.

New Projects

心豊工学(挑戦的萌芽研究)

1. Webから知識の獲得

Project Information

READING (Retriving nEws Around the worlD for dIscovery and kNowledge mininG) is a joint project between Ren-Lab. of the University of Tokushima and Falcon corporation. The project's goals are to create a self sufficient news retrieval and classification system. The news data and its classification results will be used in knowledge discovery and mining.

  • Project Plan [pdf] [doc]
  • Latest Demo [pdf] [doc]
Algorithm Information
  • News Classifier [pdf] [doc]
  • News Classifier Merits [pdf] [doc]
System Information
  • Server Setup [pdf]
  • News Classifier User Guide [pdf]
  • News Downloader User Guide [pdf]
Data
  • Latest SQL Backup [zip]
Data
  • MySQL Server [msi]
  • MySQL GUI Tools [msi]

2. 中国語情報の集成・要約・翻訳・活用

 現在,インターネット等を通じて大量の情報が溢れており,目まぐるしく変化する状況に対応して素早い意思決定を行うためには,大量の情報の中から情報を的確に取捨選択することが必須である。
 本研究は,中国語の信頼性が高く人気のあるサイトを選択し,このようなサイトを巡回し各々のサイトの構文特徴により,Webの文章(情報)を収集する。収集した記事(情報)をイベントごとにクラスタリングし,予め決めた種類,即ちカテゴリーに類別する。各カテゴリーにある記事(複数の記事,文書)を要約する。ここで,記事の時期・場所・人物など手かがりにも考慮し,要約文書を生成する。これらの大規模コーパス(要約文)は言語処理技術の成果として中国語情報の集成・要約・翻訳などのさまざまの言語処理システムの研究開発に活用できるのである

3. Ren-CECps Ver1.0

4. 観光ナビゲーション

 現在、任教授の開発している「中国人観光者にむける日本観光情報の質問回答システム」が従来のシステムの質を向上して,今回の研究開発にも一部流用できると考える。ベクトル空間モデル拡張手法が日本語の質問文の類似度計算に流用できると考える。さらに,日本で最初の国際電話用音声認識システムの開発者の黒岩助教授により開発されたノイズ解消アプローチが今回の研究開発のインターフェースに活かされると考える。

 質問応答とは,自然言語で書かれた質問に対して,組織化されていないテキスト集合から適した答えを探し出す技術である。Q&A技術に関しては,多くの研究が行なわれており,情報抽出,情報検索,自動要約,対話インタフェースなどの自然言語処理の各研究分野とも関連する技術である。我々は,自然言語特徴情報とベクトル空間モデルに基づく質問応答手法を提案した。システムの構成は図7に示すように,六つの部分からなる。ユーザインターフェースはユーザ(使用者)が自然な言葉で入力可能なシステムとの対話のインターフェースである。


図4 質問応答システムの構成

 本研究開発では,解答はグラフィカルユーザインターフェース(GUI)で示される他に,音声でも答えられる。将来的に携帯電話やPDAにも拡張する予定である。図5はイメージ図であり,図6は対応するサイトを再現できる機能である。


図5 質問回答のイメージ

図6 詳しく知りたいサイトの再現

5. 会話システム

 インターネットの情報(RSS,HTML,XMLなどの情報も含まれる)を利用し、知識のデータペースの構築を行い、完璧なデータペースを形成させる。ユーザーの質問に対して、形態素解析、文法分析、質問分類などの関連する処置を行い、自然かつ流れがいい回答文を生成させるのは本システムの特徴である。システムのDemoは図―7に参照せよ。

6. 顔表情認知システム

7. 英作文支援システム

8. 人間感情認知実験

9. 情報爆発時代における情報検索

10. アラビア語処理モデル

11.「論語」活用システム

12. 双方向教育システム

13. 知的ナビゲーション

14. スーパー関数に基づく機械翻訳

15. Unsupervised biomedical relation extraction

PAGE
TOP