経営情報学会 全国研究発表大会要旨集
2003年度秋季全国研究発表大会
会議情報
ベイズ統計を用いた文書ファイルの自動分析手法
*後藤 正幸伊藤 潤石田 崇酒井 哲也平澤 茂一
著者情報
会議録・要旨集 フリー

p. 47

詳細
抄録

近年,インターネット上には膨大な文書データが溢れており,すでに人間が全てを読んでそれらを体系化したり,必要な情報を分類整理することが困難になっている.そのため,従来からの情報検索技術の研究がさかんに行われており,目的に合致する情報を効率的に発見する試みが実用化されている.本稿では,情報検索技術の一手法である潜在意味的インデックシング(PLSI)という手法を用いて,文書データから知識発見を行う方法について述べる.そして文書データの解析では設定するモデルがデータ量に比べて相対的に複雑である点に着目し,ベイズ統計に基づく手法を提案する.さらにシミュレーション実験と応用実験を通じて,その性能を検討する.

著者関連情報
© 2003 経営情報学会
前の記事 次の記事
feedback
Top