Vous n'êtes pas identifié(e).
Hello,
Je suis sur un nouveau projet et travaille actuellement sur un MasterSpinn de tueur afin de générer environ 3000 textes correctement sans trop de DP.
Par le passé j'ai déjà généré environ 1000 tirages avec un bon masterspins grâce au tool de @jaffaar + le super logiciel Effispin
Le Masterspin comprenait un texte initial de 350 mots où chaque phrase comprenait 4 variations (toujours avec l'outii SEO Quartz de mister Jaffaar). Chaque bout de phrases comprenaient également des variations de mots (synonymes).
Avec l'outil Effispin j'ai donc pu laissé la bécane tourner pendant 2 jours afin qu'elle me calcule 1000 tirage (réglage à 1% de similarité max accepté dans le logiciel).
Une fois les tirages effectués : un petit coup de notepad++ et d'Excel pour compléter ma base de donnée (fiches produits ecommerce) avec les nouveaux texte.
J'ai un nouveau projet que j'aimerai lancer cette semaine. Cela consiste à générer 3000 textes différents à partir d'un texte de 400 mots.
Quelle est la meilleure méthode d'après vous ?
- Passer de 4 phrases/4 textes/4 synonymes à 8 phrases/8 textes/8 synonymes ?
- Garder la logique de 4 phrases/4 textes/4 synonymes mais sur plusieurs textes différents ?
Que feriez-vous ?
Yoshy
Passionné par l'univers du référencement naturel et du web en général
🔴 Hors ligne
Avec l'outil Effispin j'ai donc pu laissé la bécane tourner pendant 2 jours afin qu'elle me calcule 1000 tirage (réglage à 1% de similarité max accepté dans le logiciel).
Hello,
Comment t'as fait ? Moi, quand je tentais ne serait-ce que 60% de similarité avec Effispin pour quelques dizaines de textes, ça plantait lamentablement...Et pourtant, je travaillais le masterspin au max : il était fait avec amour et tout à la main avec énormément de variations. Faut que je change d'ordi ?
Rendez-nous le vieux du site AnswerThePublic !
🔴 Hors ligne
1% de similarité ! P...n ça c'est du spinning
J'ai pas spinné depuis longtemps, je sais pas si mon opinion suit l'état de l'art actuel, mais je faisais selon ta 2eme hypothèse. Je faisais un dizaine de textes pour le même projet que je spinnais ensuite.
La raison est la suivante : quand on rédige plusieurs textes différents ab initio, la sémantique interne est forcément plus variée, donc tu auras une plus grande variété en sortie.
Par contre 1% de similarité je savais pas que c'était possible, à moins que ta mesure soit moins exigeante?
🔴 Hors ligne
Effispin propose 0,80 en standard... mais ça plante des la première minute. En mettant à 1.00 ça tourne bien. Est ce bien 1% ? Je pense que oui
Passionné par l'univers du référencement naturel et du web en général
🔴 Hors ligne
Tu es sûr que la similarité n'est pas entre 0 et 1 au lieu de 0% et 100% ?
Quand on prend les outils de détection de plagiat, 10% est souvent considéré comme très différent, et grosso modo ça commence à présenter trop de similarité à 30%
Il se peut aussi que le tool n'arrive pas bien à calculer la similarité tout en faisant un travail correct. Regarde ce que ça donne avec les trucs courants (copyscape, smallseotools.com/plagiarism-checker)
🔴 Hors ligne
Sur le topo c’est indiqué : taux de similarité (%) : 0,80 en standard
Sors je ne sais pas je vous avoue que c’est incroyable 1% voir impossible... après la machine tourne pends’t 2 jours voir 3 suivant les textes... Processeur à 10% d’utilisation dommage !
Passionné par l'univers du référencement naturel et du web en général
🔴 Hors ligne
On est bien d'accord, 1% de similarité ou moins ça parait difficile.
Tu as fait un contrôle de similarité avec d'autres outils?
🔴 Hors ligne
J'ai fait des tests de similarité entre 2 textes de façon aléatoire. Opération répétée 3 fois.
Verdict : taux de similarité à 65% en moyenne. Ce qui est pas trop mal...
Ici ils précisent que 70% est déjà un taux acceptable : hxxps://outils-seo.alwaysdata.net/outils-contenu-editorial/calcul-similarite-contenu/
Passionné par l'univers du référencement naturel et du web en général
🔴 Hors ligne
Bon alors fais quand même gaffe : je suis jamais arrivé à trouver un consensus sur le % de similarité acceptable, d'autant plus que les mesures sont différentes. Le tool que tu utilises fait une moyenne, c'est déjà plus propre.
En lisant les articles, on trouve un pourcentage à pas dépasser de 40 à 70%.
Perso je dépasserai pas 30%, mais après tout dépend de l'utilisation.
🔴 Hors ligne
Effispin propose 0,80 en standard... mais ça plante des la première minute. En mettant à 1.00 ça tourne bien. Est ce bien 1% ? Je pense que oui
En fait, tu as mis 100 % de similarité acceptée donc normal que ça fonctionne !
0,8 ça équivaut à 80 % ce qui est déjà pas mal. Avec de très bons masterspins et de petits tirages tu peux arriver à 60% (0,6) de similarité ce qui est excellent, car le calcul de similarité de l'outil est très dur.
Dernière modification par teddy (2019-05-21 18:30:48)
Rendez-nous le vieux du site AnswerThePublic !
🔴 Hors ligne