知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
原著論文
Webページクラスタリングに基づく個人ページ収集法
林 貴宏片平 翔犬塚 敦史尾内 理紀夫
著者情報
ジャーナル フリー

2006 年 18 巻 2 号 p. 161-172

詳細
抄録

本論文は, Webページ集合から個人ページを自動抽出する手法を提案, 評価する. 提案手法は評判情報検索に向けたコンテンツフィルタリングの一手法として位置づけられる. 未分類のWebページ集合から個人ページを抽出するため, 提案手法は個人ページで出現する4種類の特徴に着目する. 提案手法は, これらの特徴を量的に測定し, 測定結果に基づきページ集合に対しk-meansクラスタリングを適用し, ページをグループ分けする. さらに, これらのグループの中から, 個人ページで構成されるグループを検出する. 実験により個人ページの抽出精度を求めた結果, キーワード型検索エンジンを単独で使用する場合と比較して平均2.1倍の精度向上が確認できた.

著者関連情報
© 2006 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top