effiSpin : logiciel gratuit de content spinning

Le logiciel effiSpin est un logiciel de content spinning français, en français et gratuit permettant de gérer facilement vos projets de spinning, avec contrôle de similarité intégré paramétrable, possibilité de créer des spins paramétrés (liés à une mini base de données sous forme de tableau) et avec aide à la saisie.

Qu’est-ce que le content spinning ?

Le content spinning est une technique de génération de texte ayant tous le même sens final, mais utilisant des mots et/ou des expressions-clé sélectionnées aléatoirement. On peut d’ailleurs traduire littéralement content spinning par « rotation de contenu ».

Pour ce faire, on utilise une syntaxe particulière par délimiteurs appelée spintax, à base d’accolades et de « pipes » (la barre verticale |) qui va permettre d’indiquer au logiciel générateur de spuns (nom donné aux variantes spinnées de notre texte de départ) quels sont les choix possibles pour un ensemble de mots.

Exemple :

J'ai {acheté|acquis} une {{belle |}{maison|demeure}|{maison|bâtisse|construction|demeure|habitation|résidence} {magnifique|confortable|extraordinaire}} {au toit|à la toiture} {rouge|pourpre}, {avec|présentant} un {grand|gigantesque|immense|imposant|impressionnant} {jardin|parc|potager}. 

Ce qui donnerait par exemple :

J'ai acquis une belle maison au toit rouge, avec un gigantesque potager.

Ou encore :

J'ai acheté une résidence confortable à la toiture pourpre, présentant un immense jardin.

Il est bien entendu possible d’imbriquer sur plusieurs niveaux la spintax, de manière à obtenir des textes spinnés les moins similaires possibles. On pourra utiliser divers algorithmes de mesure de similarité afin de s’assurer que chaque version est suffisamment éloignée d’un point de vue sémantique.

Bien entendu, il est fortement conseillé de relire et corriger, le cas échéant, les textes obtenus, afin d’écarter notamment les fautes d’accord, très courantes sur ce genre de génération automatique de contenu.

Quels usages fait-on des textes spinnés ?

Toute personne ayant déjà entendu parler de référencement le sait : comme tous les moteurs de recherche, Google déteste le contenu dupliqué. Lorsqu’un texte doit être diffusé sur plusieurs sites web, par exemple lors d’une campagne de communités de presse en ligne afin de faire la promotion d’un site internet, il y a donc un danger réel de ne pas les voir indexés s’il y a un trop fort taux de similarité entre eux.

C’est là qu’intervient le content spinning : il permet lorsque bien manipulé de générer une grande quantité de textes à partir d’un modèle initial, qui pourront être utilisés sur n sites internet, sans risques de pénalité que ce soit.

Le temps passé à préparer le masterspin (texte initial permettant la génération des spuns) sera de toute façon sans commune mesure avec celui que l’on passera pour réécrire n fois le même texte, tout en s’assurant – grâce au contrôle de similarité – que les variantes sont suffisamment différentes pour ne pas attirer l’attention.

L’origine du logiciel effiSpin

C’est en 2010 que j’ai commencé à m’intéresser aux techniques dites black hat (interdites par Google), notamment pour la génération de contenus, puisque c’est à cette époque que l’on a commencé à parler sérieusement de qualité de contenu et surtout, de contrôle de contenu dupliqué.

J’ai découvert le content spinning comme étant un moyen simple, à partir d’une syntaxe accessible, de générer n versions d’un même texte, mais les outils alors disponibles étaient très limités, et surtout ne permettaient pas l’inclusion de variables, mon objectif étant la génération de fiches produit pour alimenter des sites e-commerce sans « trop » d’efforts rédactionnels.

C’est à ce moment que j’ai eu l’idée d’effiSpin ! J’ai donc commencé à travailler sur une première version assez basique, qui a très vite rencontré un vif succès lors de sa mise à disposition publique. Progressivement, je l’ai fait évoluer, toujours à la recherche de plus de productivité quant à la production de mes masterspins, qui n’étaient à cette époque jamais très volumineux.

J’utilise aujourd’hui une version privée et spécifique de mon logiciel, que je diffuserai probablement dans les mois à venir… quand j’en aurai le temps !

Fonctionnalités

  • Gestion de projets multi-fenêtrage avec sauvegarde/restauration
  • Aide à la saisie avec coloration syntaxique et contrôle de validité du spin
  • Dictionnaire des synonymes intégré NOUVEAU
  • Génération unitaire ou par lot
  • Gestion de l’historique de toutes les variantes générées du spin avec calcul des longueurs mini/maxi en mots et caractères
  • Export sélectif (limitation min/max du nombre de caractères ou de mots) vers presse-papier, fichier ou ensemble de fichiers (1 fichier par spin)
  • Contrôle de similarité réglable avec filtrage optionnel des stopwords (paramétrables)
  • Possibilité de générer des spins paramétrés (un spin par ligne de variables)

Le contrôle de similarité s’appuie sur le mariage de l’algorithme de Kuhn-Munkres (qui permet de comparer les mots les plus semblables par pairs, d’une chaîne à l’autre) avec l’algorithme de Levenshtein, utilisé pour la comparaison mot à mot. Le tout est couplé à un filtrage des stopwords, permettant au final de faire un contrôle de similarité non pas sur la chaîne de caractères, mais le champs sémantique à proprement parler.

Captures d’écran et vidéos

On dit toujours que les images parlent mieux que les explications : voici quelques captures d’écran montrant les principales fonctionnalités de mon logiciel de content spinning.

Spinning : cas simple
Spinning : cas simple
Paramétrage du contrôle de similarité
Paramétrage du contrôle de similarité
Spinning : génération par lot
Spinning : génération par lot
Gestion de l'historique des spins générés
Gestion de l’historique des spins générés
Spinning paramétré avec variables
Spinning paramétré avec variables
Assistance à la saisie via le moteur de synonymes open source intégré (Hunspell)
Assistance à la saisie via le moteur de synonymes open source intégré (Hunspell)

Voici une présentation vidéo des fonctionnalités de base d’effiSpin :

Et voici une démonstration de l’usage des spins paramétrés, gros point fort d’effiSpin :

À découvrir également, mon outil pour la gestion des erreurs HTTP 404 : réaliser votre plan de redirections automatiquement, checkez les réponses HTTP et mettez à jour votre .htaccess en quelques clics !

Limites fonctionnelles

Le logiciel est actuellement prévu pour les spins de taille petite à moyenne, et ne gère pas les paragraphes (les sauts de ligne sont supprimés automatiquement). Du fait de sa nature même, l’algorithme de mesure de similarité n’est pas adapté aux gros spins (les performances s’effondrent littéralement dès que l’on dépasse les spins générant des variantes de +1000 caractères…)

La prochaine version majeure prendra en charge le multi-spin (spinning par paragraphes avec contrôle de similarité par paragraphe et « shaker » de paragraphes paramétrable), bien mieux adapté au contrôle de similarité mis en oeuvre.

Important : la sauvegarde des projets étant basée sur la sérialisation XML, les fichiers projets ne sont pas forcément compatibles d’une version à l’autre (c’est notamment le cas entre chaque version intégrant des nouveautés impliquant de nouvelles données !)

Caractéristiques techniques

Le logiciel est actuellement dans une version stable totalement fonctionnelle, mais non exempte de petits bugs en principe non bloquants. La diffusion est faite sous forme de fichier d’installation Windows MSI.

  • Développé en VB.Net 2010
  • Aucun besoin de base de données : les projets sont stockés au format XML
  • Ne fonctionne que sous Windows (XP au supérieurs) ou simulateur Windows (testé sous Mac)
  • Nécessite le .Net Framework 4.0, installable via le setup
  • Pas de support technique sauf ici dans les commentaires, éventuellement (le prix de la gratuité !)

Téléchargement

Le fichier disponible en téléchargement ci-dessous est garanti sans virus ni malwares, et est destiné à fonctionner en environnement Windows.

Téléchargement gratuit logiciel de content spinning

Pour en savoir plus sur le content spinning et effiSpin

Retrouvez tous les détails de chaque mise à jour d’effiSpin, les articles techniques sur le content spinning, les règles de rédaction d’un masterspin, et toutes les ressources relatives à la génération de contenus avec le spinning.

SASU effi10

Cédric GIRARD
10 Rue Roger Douine – 10000 TROYES
06 66 44 92 58
cedric.effi10

Sur les réseaux sociaux

Retour en haut