Quel est le meilleur outil ou logiciel pour la stylométrie ?


Il existe de nombreux outils pour la recherche styométrique disponibles sur le web, mais la plupart d'entre eux sont orientés vers la recherche et nécessitent une certaine familiarité avec les langages de programmation qu'ils ont été développés. Afin de réduire votre liste, je vais me concentrer sur deux outils qui sont open source, ils ont une interface graphique descendante et fonctionnent dans toutes les plateformes OS:

  1. Le programme Java Graphical Authorship Attribution (JGAAP) : Un bel outil qui a été développé par Patrick Juola et ses collaborateurs dans les EVL Labs de l'Université Duquesne. Il est basé sur JAVA et utilise une interface graphique conviviale qui peut vous aider à sélectionner un grand nombre de caractéristiques stylométriques et à les entraîner à l'aide d'algorithmes d'apprentissage automatique de pointe dans votre corpus. Il prend en charge UTF8 et vous pouvez l'utiliser comme une boîte noire dans les problèmes d'attribution d'auteurs fermés et ouverts. Son dépôt GitHub où vous pouvez le télécharger la dernière version est ici : evllabs/JGAAP
  2. stylo R package : Il s'agit d'un paquet écrit pour le langage R. Il fournit des implémentations faciles à utiliser de diverses analyses établies dans le domaine de la stylistique computationnelle, notamment l'attribution d'auteurs non traditionnels, la reconnaissance des genres, le développement du style ("stylochronométrie"), etc. Le paquetage comprend un certain nombre de méthodes explicatives (mise à l'échelle multidimensionnelle, analyse en composantes principales, analyse en grappes, arbres de consensus bootstrap). De plus, un certain nombre de méthodes supervisées d'apprentissage automatique sont disponibles (Delta, machines à vecteurs de support, Bayes naïfs, k-voisins les plus proches, centroïdes rétrécis les plus proches). La fonction rolling.delta() analyse les travaux collaboratifs et tente de déterminer la paternité des fragments qui en sont extraits. La fonction rolling.classify() offre une interface plus flexible pour la classification séquentielle des œuvres collaboratives. La fonction oppose() effectue une analyse contrastive entre deux ensembles de textes donnés : entre autres, elle génère des listes de mots significativement préférés et évités par un ou plusieurs auteurs par rapport aux textes d'un autre auteur (ou d'un ensemble d'entre eux). Sa page CRAN est : CRAN - Package stylo

J'espère que ces références vous seront utiles.