Lab' TTN (Théories, Textes, Numérique)

Algorithme de détection de plagiat

Analyse automatique de segments croisés dans les textes

WebXCopy est un algorithme qui exploite les possibilités des bibliothèques Full-Text d’XQuery pour détecter des segments lâches de plagiats dans des textes. Ce type d’analyse très courante permet notamment d’exploiter des ressources synonymiques pour identifier des « zones » de soupçon ou d’évaluer potentiellement le de gré, exprimé sous forme d’un score, de ressemblance ou de parenté entre deux fragments textuels. L’outil, réalisé grâce à Basex (http://basex.org) peut être exploité en ligne, mais cela reste limité par rapport à une mise en production massive comme cela a pu être fait au service de projets d’entreprises ou institutionnels.

Projet réalisé par Xavier-Laurent Salvador au sein de l’axe Humanités Numériques de TTN

Projet réalisé par Xavier-Laurent Salvador