経営情報学会 全国研究発表大会要旨集
2008年秋季全国研究発表大会
セッションID: I3-2
会議情報

Word Sequence Kernelに基づく剽窃文書発見手法
*道祖本 信哉雲居 玄道石田 崇平澤 茂一
著者情報
キーワード: 著作権侵害, 類似文書
会議録・要旨集 フリー

詳細
抄録

近年,情報技術の発達により,blog などWEB ページのデジタル文書の著作権侵害が問題となっている.しかし,デジタル文書の増加により剽窃文書を人手で調査するのは困難となっている.本研究では,対象とする文書から自動的に剽窃の疑いのある文書を発見する手法を提案する.この手法は,従来のSmith-Waterman アルゴリズムを用いた方法では検出しきれなかった部分の改善を図るために,Word Sequence Kernel(WSK) に基づいた剽窃文判定アルゴリズムを利用している.新聞記事やWeb ページ及びそれらを基に剽窃された文書を用い,評価実験を行い提案手法の有効性を示す.

著者関連情報
© 2008 経営情報学会
前の記事 次の記事
feedback
Top