Contrer détection d'IA
Comment distinguer si un texte a été écrit par un humain ou une IA ?
Il s’avère que les humains et les IA ont des “empreintes stylistiques” différentes que l’on peut mesurer et quantifier. Un peu comme reconnaître un robot à sa démarche trop régulière… Et oui, l’IA écrit avec une cadence métronomique qui la trahit aux yeux des algorithmes.
Les 5 caractéristiques les plus révélatrices sont:
- La plage de longueur des phrases. Nous les humains, écrivons parfois des phrases très courtes et parfois avec des phrases interminables qui partent dans tous les sens avant de revenir au sujet initial après un détour par nos pensées désordonnées. Au contraire, l’IA, elle, est plus constante.
- Le coefficient de variation des paragraphes. Nos paragraphes varient énormément en longueur, alors que ceux de l’IA sont plus réguliers.
- Le ratio de verbes. Les humains utilisent environ 16% de verbes contre 13% pour les IA, ce qui n’est pas une énorme différence, mais ça compte.
- La complexité grammaticale. Nos structures de phrases sont moins prévisibles.
- La variabilité des paragraphes. Et encore une fois, l’IA aime trop l’ordre et la régularité, ce qui la trahi…
L’algorithme qui détecte tout ça s’appelle Random Forest (littéralement “forêt aléatoire”), ce qui permet de compter chaque virgule et d’analyser chaque structure de phrase pour ensuite voir ce qui se répète le plus. Actuellement, Random Forest est à 98,3% de précision.
Source : What Is Random Forest? | IBM