Introduction研究テーマ

太田研究室では以下の研究に取り組んでいます。

Web情報検索ならびにWebマイニング

・Web空間の膨大な情報を効率よく検索するための検索支援の研究
検索結果のクラスタリング、要約、可視化、個人化(personalization)、検索語想起支援、クエリフリーサーチなど

・評判情報検索、マイニングに関する研究
Webから選択的に抽出した評判情報を活用した比較評価システムの開発など

・Blog検索、クラスタリングに関する研究
Blogの特性を利用したBlogクラスタリングやクラスタリングの個人化

電子図書館

・文書画像からの情報抽出に関する研究
国立情報学研究所の所蔵する約1000の学術論文誌のタイトルページの文書画像から書誌情報(論文題目、著者名など)を自動抽出する

・電子図書館とWebの連係
文書画像から抽出した書誌情報を介して、電子図書館と外の情報源(Web)を結びつける新たなサービスを考案する

・曖昧検索に関する研究
文書画像をOCR処理して得られるテキストに含まれる認識誤りを修正しなくてもそのまま検索できるようにする