2006 年 18 巻 2 号 p. 161-172
本論文は, Webページ集合から個人ページを自動抽出する手法を提案, 評価する. 提案手法は評判情報検索に向けたコンテンツフィルタリングの一手法として位置づけられる. 未分類のWebページ集合から個人ページを抽出するため, 提案手法は個人ページで出現する4種類の特徴に着目する. 提案手法は, これらの特徴を量的に測定し, 測定結果に基づきページ集合に対しk-meansクラスタリングを適用し, ページをグループ分けする. さらに, これらのグループの中から, 個人ページで構成されるグループを検出する. 実験により個人ページの抽出精度を求めた結果, キーワード型検索エンジンを単独で使用する場合と比較して平均2.1倍の精度向上が確認できた.