effiSpin : logiciel gratuit de content spinning
Le logiciel effiSpin est un logiciel de content spinning français, en français et gratuit permettant de gérer facilement vos projets de spinning, avec contrôle de similarité intégré paramétrable, possibilité de créer des spins paramétrés (liés à une mini base de données sous forme de tableau) et avec aide à la saisie.
Qu’est-ce que le content spinning ?
Le content spinning est une technique de génération de texte ayant tous le même sens final, mais utilisant des mots et/ou des expressions-clé sélectionnées aléatoirement. On peut d’ailleurs traduire littéralement content spinning par « rotation de contenu ».
Pour ce faire, on utilise une syntaxe particulière par délimiteurs appelée spintax, à base d’accolades et de « pipes » (la barre verticale |) qui va permettre d’indiquer au logiciel générateur de spuns (nom donné aux variantes spinnées de notre texte de départ) quels sont les choix possibles pour un ensemble de mots.
Exemple :
J'ai {acheté|acquis} une {{belle |}{maison|demeure}|{maison|bâtisse|construction|demeure|habitation|résidence} {magnifique|confortable|extraordinaire}} {au toit|à la toiture} {rouge|pourpre}, {avec|présentant} un {grand|gigantesque|immense|imposant|impressionnant} {jardin|parc|potager}.
Ce qui donnerait par exemple :
J'ai acquis une belle maison au toit rouge, avec un gigantesque potager.
Ou encore :
J'ai acheté une résidence confortable à la toiture pourpre, présentant un immense jardin.
Il est bien entendu possible d’imbriquer sur plusieurs niveaux la spintax, de manière à obtenir des textes spinnés les moins similaires possibles. On pourra utiliser divers algorithmes de mesure de similarité afin de s’assurer que chaque version est suffisamment éloignée d’un point de vue sémantique.
Bien entendu, il est fortement conseillé de relire et corriger, le cas échéant, les textes obtenus, afin d’écarter notamment les fautes d’accord, très courantes sur ce genre de génération automatique de contenu.
Quels usages fait-on des textes spinnés ?
Toute personne ayant déjà entendu parler de référencement le sait : comme tous les moteurs de recherche, Google déteste le contenu dupliqué. Lorsqu’un texte doit être diffusé sur plusieurs sites web, par exemple lors d’une campagne de communités de presse en ligne afin de faire la promotion d’un site internet, il y a donc un danger réel de ne pas les voir indexés s’il y a un trop fort taux de similarité entre eux.
C’est là qu’intervient le content spinning : il permet lorsque bien manipulé de générer une grande quantité de textes à partir d’un modèle initial, qui pourront être utilisés sur n sites internet, sans risques de pénalité que ce soit.
Le temps passé à préparer le masterspin (texte initial permettant la génération des spuns) sera de toute façon sans commune mesure avec celui que l’on passera pour réécrire n fois le même texte, tout en s’assurant – grâce au contrôle de similarité – que les variantes sont suffisamment différentes pour ne pas attirer l’attention.
L’origine du logiciel effiSpin
C’est en 2010 que j’ai commencé à m’intéresser aux techniques dites black hat (interdites par Google), notamment pour la génération de contenus, puisque c’est à cette époque que l’on a commencé à parler sérieusement de qualité de contenu et surtout, de contrôle de contenu dupliqué.
J’ai découvert le content spinning comme étant un moyen simple, à partir d’une syntaxe accessible, de générer n versions d’un même texte, mais les outils alors disponibles étaient très limités, et surtout ne permettaient pas l’inclusion de variables, mon objectif étant la génération de fiches produit pour alimenter des sites e-commerce sans « trop » d’efforts rédactionnels.
C’est à ce moment que j’ai eu l’idée d’effiSpin ! J’ai donc commencé à travailler sur une première version assez basique, qui a très vite rencontré un vif succès lors de sa mise à disposition publique. Progressivement, je l’ai fait évoluer, toujours à la recherche de plus de productivité quant à la production de mes masterspins, qui n’étaient à cette époque jamais très volumineux.
J’utilise aujourd’hui une version privée et spécifique de mon logiciel, que je diffuserai probablement dans les mois à venir… quand j’en aurai le temps !
Fonctionnalités
Le contrôle de similarité s’appuie sur le mariage de l’algorithme de Kuhn-Munkres (qui permet de comparer les mots les plus semblables par pairs, d’une chaîne à l’autre) avec l’algorithme de Levenshtein, utilisé pour la comparaison mot à mot. Le tout est couplé à un filtrage des stopwords, permettant au final de faire un contrôle de similarité non pas sur la chaîne de caractères, mais le champs sémantique à proprement parler.
Captures d’écran et vidéos
On dit toujours que les images parlent mieux que les explications : voici quelques captures d’écran montrant les principales fonctionnalités de mon logiciel de content spinning.
Voici une présentation vidéo des fonctionnalités de base d’effiSpin :
Et voici une démonstration de l’usage des spins paramétrés, gros point fort d’effiSpin :
À découvrir également, mon outil pour la gestion des erreurs HTTP 404 : réaliser votre plan de redirections automatiquement, checkez les réponses HTTP et mettez à jour votre .htaccess en quelques clics !
Limites fonctionnelles
Le logiciel est actuellement prévu pour les spins de taille petite à moyenne, et ne gère pas les paragraphes (les sauts de ligne sont supprimés automatiquement). Du fait de sa nature même, l’algorithme de mesure de similarité n’est pas adapté aux gros spins (les performances s’effondrent littéralement dès que l’on dépasse les spins générant des variantes de +1000 caractères…)
La prochaine version majeure prendra en charge le multi-spin (spinning par paragraphes avec contrôle de similarité par paragraphe et « shaker » de paragraphes paramétrable), bien mieux adapté au contrôle de similarité mis en oeuvre.
Important : la sauvegarde des projets étant basée sur la sérialisation XML, les fichiers projets ne sont pas forcément compatibles d’une version à l’autre (c’est notamment le cas entre chaque version intégrant des nouveautés impliquant de nouvelles données !)
Caractéristiques techniques
Le logiciel est actuellement dans une version stable totalement fonctionnelle, mais non exempte de petits bugs en principe non bloquants. La diffusion est faite sous forme de fichier d’installation Windows MSI.
- Développé en VB.Net 2010
- Aucun besoin de base de données : les projets sont stockés au format XML
- Ne fonctionne que sous Windows (XP au supérieurs) ou simulateur Windows (testé sous Mac)
- Nécessite le .Net Framework 4.0, installable via le setup
- Pas de support technique sauf ici dans les commentaires, éventuellement (le prix de la gratuité !)
Téléchargement
Le fichier disponible en téléchargement ci-dessous est garanti sans virus ni malwares, et est destiné à fonctionner en environnement Windows.
Pour en savoir plus sur le content spinning et effiSpin
Retrouvez tous les détails de chaque mise à jour d’effiSpin, les articles techniques sur le content spinning, les règles de rédaction d’un masterspin, et toutes les ressources relatives à la génération de contenus avec le spinning.
Quelles fonctionnalités pour un logiciel de content spinning ?
Lorsque l’on est développeur de logiciels, il arrive souvent que notre vision se cantonne à…
Rédaction web : comment rédiger un bon masterspin ?
Employée par un nombre grandissant de personnes, la méthode du content spinning est de plus…
effiSpin : nouvelle version 1.1.5
Dernière mise à jour du logiciel de content spinning effiSpin, avec l’arrivée d’une subversion amenant…
effiSpin : nouvelle version 1.1.4
Dernière release de février pour l’application de content spinning effiSpin, avec pas mal de petites…
effiSpin : nouvelle version 1.1.3
Sortie de la nouvelle release intermédiaire d’effiSpin, mon application de spinning gratuite. Parmi les améliorations…