近年,情報技術の発達により,blog などWEB ページのデジタル文書の著作権侵害が問題となっている.しかし,デジタル文書の増加により剽窃文書を人手で調査するのは困難となっている.本研究では,対象とする文書から自動的に剽窃の疑いのある文書を発見する手法を提案する.この手法は,従来のSmith-Waterman アルゴリズムを用いた方法では検出しきれなかった部分の改善を図るために,Word Sequence Kernel(WSK) に基づいた剽窃文判定アルゴリズムを利用している.新聞記事やWeb ページ及びそれらを基に剽窃された文書を用い,評価実験を行い提案手法の有効性を示す.