p. 47
近年,インターネット上には膨大な文書データが溢れており,すでに人間が全てを読んでそれらを体系化したり,必要な情報を分類整理することが困難になっている.そのため,従来からの情報検索技術の研究がさかんに行われており,目的に合致する情報を効率的に発見する試みが実用化されている.本稿では,情報検索技術の一手法である潜在意味的インデックシング(PLSI)という手法を用いて,文書データから知識発見を行う方法について述べる.そして文書データの解析では設定するモデルがデータ量に比べて相対的に複雑である点に着目し,ベイズ統計に基づく手法を提案する.さらにシミュレーション実験と応用実験を通じて,その性能を検討する.