Vous n'êtes pas identifié(e).

  • Contributions :
  • Vos boîtes de messages privés sont vides.

🟣 ♦️ OpenAI & Génération de texte


#1 2019-11-13 15:51:35

Mention Atomium
🥈 Grade : Soldier

Membre du CercleOfficierNarcissiqueIngénieur webStratège10likes
Lieu : Metz
Inscription : 2019-06-27
Messages : 150
Likes : 36

Sémantique
Développement PHP
Développement JAVA
Scraping

♦️ OpenAI & Génération de texte

Bonjour à tous,

Je ne souhaitais pas ouvrir une discussion publique sur un sujet aussi sensible que la génération de texte par IA (je pense que ce n'est pas une bonne idée d'armer les scripts kiddies avec des bazookas...).

Contexte :

J'ai fait pas mal de recherche sur l'IA afin de solutionner notre éternel probleme de contenu rédactionnel.
Je travaille depuis quelques jours sur OpenAI suite aux annonces d'Elon Munsk sur les réussites du projet. Mes tests se sont révélés fonctionnels, j'arrive à produire des articles sur les sujets de mon choix sans utiliser de spintax ou autres techniques en dur.

- Est-ce que d'autres dev sur le forum ont menés des travaux dans cette direction ?

Je réfléchis actuellement à son industrialisation. Mon but est de développer un outil permettant la rédaction d'un article de qualité humaine en moins d'une minute (étant gray-hat, je ne suis pas dans une démarche de bourrage d'articles, ça c'est déjà tout à fait fonctionnel).

1
J'aime ❤️

🔴 Hors ligne

#2 2019-11-13 20:00:02

Mention debutantseo
🥉 Grade : Scout

AuxiliaireNarcissiqueStratège50likes
Inscription : 2015-03-29
Messages : 953
Likes : 50

Netlinking
Rédaction
Comunity Management

Re : ♦️ OpenAI & Génération de texte

Bonjour
j ai trouvé ça   

https://talktotransformer.com/

0
J'aime ❤️

🔴 Hors ligne

#3 2019-11-13 20:17:42

Mention frcc78
🥈 Grade : Soldier

Membre du CercleOfficier250likes1000 messagesPhilantrope
Inscription : 2012-07-05
Messages : 1 161
Likes : 264

Re : ♦️ OpenAI & Génération de texte

je réfléchie à la théorie depuis quelques mois et avec tout le contenu en fr présent sur le web il y a sans doute moyen d'entrainer une IA pour modifier un article existant sans faute. Et couplé avec un peu de spin ca peut faire des miracles. Mais l'article que tu cite, ca créé un texte, ca ne fait pas un article dans la même thématique. Et comme je suis pas fort en programmation...

Dernière modification par frcc78 (2019-11-13 20:18:35)


Mon réseau pour publier chez moi : liste ici. Échange possible.

0
J'aime ❤️

🔴 Hors ligne

#4 2019-11-13 21:10:47

Mention Atomium
🥈 Grade : Soldier

Membre du CercleOfficierNarcissiqueIngénieur webStratège10likes
Lieu : Metz
Inscription : 2019-06-27
Messages : 150
Likes : 36

Sémantique
Développement PHP
Développement JAVA
Scraping

Re : ♦️ OpenAI & Génération de texte

@debutantseo > Yep je connais talktotransformer, il utilise la meme base applicative que moi.

@frcc78 > bah techniquement ce que tu décris est assez basique.
Pour te dire, mon premier test était de prendre des articles sur Google BERT, je les ai fait bouffer à mon IA.
Ensuite je lui ai créé des amorces de phrases :

"Google Bert est ..."
"La chose à retenir sur Bert est ..."
"Nous ne savons pas encore que..."

et le système m'a généré à chaque fois un paragraphe pertinent sans jamais copier les articles à l'origine de l'information. Donc à priori tant que l'échantillon de base est assez diversifié, il n'y a pas de souci de duplicate content. D'autant que le moteur est à la base entrainé sur un échantillon gigantesque afin d'être en mesure de produire des tournures qui ne sont pas dans les textes du training.

Donc, perso j'en suis là, je suis en train d'industrialiser les prefixes d'amorçages et j'ajoute des algos de traitement en sortie pour pouvoir construire des articles complets. Il n'est plus question ici de modifier, mais carrément de produire, et ça marche.

Par contre, je ne suis pas un expert en deep learning et je ne sais pas encore manipuler les codes de retour pour modifier les prévisions à la volée.

---

Je dispose déja d'une batterie d'applications que j'ai codé moi meme et qui me servent au quotidien en remplacement des semrush & co.
Je pense qu'en assemblant betement mon outil de detection des user-intents et mon IA de generation, je dois pouvoir nourir en automatique un blog et créer des articles pertinents autour de sujets, sans "aucune" action humaine. Il suffira en gros de spécifier la thématique de l'article et de corriger les fautes de français en sortie (les IA ne sont jamais entièrement fiables, il existe des impasses qui leur font mathématiquement faire de la merde).

---

Je pense que l'IA va succéder naturellement au spinning qui va bientôt arriver à péremption maintenant que google est en mesure de comprendre les textes. Une fois que google sera en mesure de "comprendre" le fond d'un texte, il pourra réverser cette compréhension pour créer des signatures afin de comparer les articles d'un site. S'il voit que X articles sont structurés différemments mais que l'information véhiculée est la meme, il saura très rapidement que la masse est sterile et que le spot a peu de valeur dans sa globalité. eLe spinning rejoindra alors les autres outils archeologiques d'ici 2022, et nous devrons nous préparer à scaller. D'où mes travaux.

Dernière modification par Atomium (2019-11-13 21:21:02)

0
J'aime ❤️

🔴 Hors ligne

#5 2019-11-13 21:51:07

Mention debutantseo
🥉 Grade : Scout

AuxiliaireNarcissiqueStratège50likes
Inscription : 2015-03-29
Messages : 953
Likes : 50

Netlinking
Rédaction
Comunity Management

Re : ♦️ OpenAI & Génération de texte

On peut bien générer un texte en anglais mais pas en français

0
J'aime ❤️

🔴 Hors ligne

#6 2019-11-13 22:14:28

Mention conquering_lion
🥉 Grade : Scout

Auxiliaire10likes
Inscription : 2013-05-23
Messages : 275
Likes : 16

Re : ♦️ OpenAI & Génération de texte

ptites libs sympatoches en ruby :

hxxps://github.com/maetl/calyx

et

hxxps://github.com/ccates83/ruby-markov-chain-text-generator

sur la deuxieme, en remplacant le corpus par du texte fr .. ca pourrait ptetre donner un truc big_smile

et sur le premier un format de grammaire qui pourrait inspirer éventuellement wink

module HelloWorld
  class Sentiment < Calyx::Grammar
    start '{happy_phrase}', '{sad_phrase}'
    happy_phrase '{happy_greeting} {happy_adj} world.'
    happy_greeting 'Hello', 'Hi', 'Hey', 'Yo'
    happy_adj 'wonderful', 'amazing', 'bright', 'beautiful'
    sad_phrase '{sad_greeting} {sad_adj} world.'
    sad_greeting 'Goodbye', 'So long', 'Farewell'
    sad_adj 'cruel', 'miserable'
  end
 

Dernière modification par conquering_lion (2019-11-13 22:24:40)

1
J'aime ❤️

🔴 Hors ligne

#7 2019-11-14 09:49:34

Mention Atomium
🥈 Grade : Soldier

Membre du CercleOfficierNarcissiqueIngénieur webStratège10likes
Lieu : Metz
Inscription : 2019-06-27
Messages : 150
Likes : 36

Sémantique
Développement PHP
Développement JAVA
Scraping

Re : ♦️ OpenAI & Génération de texte

debutantseo a écrit :

On peut bien générer un texte en anglais mais pas en français

> Pas un réel souci, j'ai accès à un module de traduction automatique dans mon pipeline via le Cloud Google.
Après si ça rentre dans le biz, on peut également coupler l'API DeepL qui donne de meilleurs conversions en FR.

conquering_lion a écrit :

ptites libs sympatoches en ruby :

hxxps://github.com/maetl/calyx
et
hxxps://github.com/ccates83/ruby-markov-chain-text-generator

Humm... Pas l'impression qu'on parle ici d'IA, je crois que c'est une bête génération aléatoire basée sur un arbre grammatical.

Dernière modification par Atomium (2019-11-14 09:56:29)

0
J'aime ❤️

🔴 Hors ligne

#8 2019-11-14 13:40:38

Mention NicolasWeb
🥈 Grade : Soldier

Membre du CercleOfficierStratège100likes1000 messages
Lieu : Besançon (France)
Inscription : 2015-09-30
Messages : 1 063
Likes : 180

Rédaction
Sémantique
Site Web

Re : ♦️ OpenAI & Génération de texte

Oui j'ai testé sans grand succès pour le moment.

J'utilise une librairie de génération de texte en Python basé sur un modèle de machine learning RRN backé par TensorFlow...

(j'ai rarement fait une phrase avec autant de "buzz word" d'un coup)

https://github.com/minimaxir/textgenrnn

Comme je pratique en local, il faut entraîner le modèle beaucoup de temps pour que cela fonctionne. Donc, malheureusement, cela ne fonctionne pas bien sur du texte puisque le résultat est plus qu'aléatoire.

J'ai testé sur de l'immobilier et ça donne rien de bien probant (avec entraînement pendant 30 heures sur un laptop grand public).

Exemple :

Laquel qu’autres travailleurs seuls constitunes demandants loué.

Les règles surpréparent, conditions des mesures fercet portent de penchers au vous n'allez pas nationais intéressanté un avéon, la réduction, il est génément pololidé ?

Jeune des banques de mes obserts (j’ai me profitant des règl

beau-demader en investos « période de danations en rénovation.
 Bonjour Le monde est enquisinatif félagé à 100 000 relas du mélice que les plus étés.
 Ces règles serts sont les invessisseurs.
Qu’il est en effort cherchoit peut être bien il faut sendrez aux conseils du terrain d’envisager un peu cons


Mais, j'ai des bons résultats sur de petites phrases.

J'ai testé avec un entraînement sur environ 3000 titres de films de SF et Fantastique extrait du site IMDB.
Voici ce que le programme a pu générer comme "nouveaux" titres :


Le monstre de la planète des morts-vivants
Le monstre des morts-vivants
Le chat de la mort
Le sang de la perdition
Le monstre des morts-vivants
Le chat de la planète des singes
La mort de la planète des temps
The Bang Park
Le dernier change
Dead Orge
The Dark Tapes
 

Perso, j'ai envie de voir ce que pourrait donner "La mort de la planète des temps" et "The Bang Park"... lol

En poussant un peu plus la génération, le truc se met à devenir assez créatif et à inventer des mots big_smile :


Shingeking: The Movie
Gintama
Le déchanélus
Les Mangars!
Eye-terre-impland
Tubby
 

L'explication c'est que j'ai entraîné mon modèle à écrire caractère par caractère les mots... Je m'y connais pas beaucoup, alors peut-être que je pourrais m'y prendre autrement.

Bref, dans mon cas, c'est amusant, mais pas bien utile. Le seul usage c'est que cela pourrait permettre d'être créatif sur les Web 2.0 avec des titres d'articles qui sortent des sentiers battus pour apporter de la diversité.

Dans les usages, j'y ait aussi pensé pour apporter de la diversité dans les ancres de liens pour des backlinks.

Comme tout cela est réalisé en local, il faut que je travaille maintenant online avec un service adéquat pour voir si je peux améliorer les choses avec du vrai texte.

0
J'aime ❤️

🔴 Hors ligne

#9 2019-11-14 18:02:51

Mention Atomium
🥈 Grade : Soldier

Membre du CercleOfficierNarcissiqueIngénieur webStratège10likes
Lieu : Metz
Inscription : 2019-06-27
Messages : 150
Likes : 36

Sémantique
Développement PHP
Développement JAVA
Scraping

Re : ♦️ OpenAI & Génération de texte

Démo de mon côté dont NicolasWeb est le héros :

Nicolas marche avec le sourire quand Olivier sort de sa voiture.
Il porte une toison de lin avec des lunettes réfléchissantes.
Ses épaules bleues et ses hanches fermes font de lui un homme quand il travaille seul avec ses doigts.
- Sa présence me trouble...

Ndlr : Ne t'étonne pas. Pour mes derniers tests, je me suis amusé à nourrir l'algo avec de la littérature érotique.
Mon IA génére des histoires déjantées dont mes amis sont les héros. big_smile

Dernière modification par Atomium (2019-11-14 18:03:28)

0
J'aime ❤️

🔴 Hors ligne

#10 2019-11-15 07:20:03

Mention NicolasWeb
🥈 Grade : Soldier

Membre du CercleOfficierStratège100likes1000 messages
Lieu : Besançon (France)
Inscription : 2015-09-30
Messages : 1 063
Likes : 180

Rédaction
Sémantique
Site Web

Re : ♦️ OpenAI & Génération de texte

@Atomium Je suis moi aussi troublé par ma propre présence dans ce message big_smile

Il faudrait voir ce que cela donne en fournissant des sujets SEO à ce type d'AI smile

0
J'aime ❤️

🔴 Hors ligne

#11 2019-11-15 14:30:13

Mention Atomium
🥈 Grade : Soldier

Membre du CercleOfficierNarcissiqueIngénieur webStratège10likes
Lieu : Metz
Inscription : 2019-06-27
Messages : 150
Likes : 36

Sémantique
Développement PHP
Développement JAVA
Scraping

Re : ♦️ OpenAI & Génération de texte

Déjà fait, c'est extrêmement pertinent.

0
J'aime ❤️

🔴 Hors ligne

#12 2020-10-26 08:41:48

Mention Sogliath
🥈 Grade : Soldier

Membre du CercleOfficierStratège250likesConsomateur de LiensMembre HospitalierPhilantrope
Inscription : 2019-12-06
Messages : 879
Likes : 470

Adminstration Serveur
Automatisation Web
Audit et Analyse
Netlinking Auto

Re : ♦️ OpenAI & Génération de texte

Du nouveau Atomium ?

0
J'aime ❤️

🔴 Hors ligne

#13 2020-10-26 20:17:01

Mention frcc78
🥈 Grade : Soldier

Membre du CercleOfficier250likes1000 messagesPhilantrope
Inscription : 2012-07-05
Messages : 1 161
Likes : 264

Re : ♦️ OpenAI & Génération de texte

La GPT3 est sortie récemment, l'IA apprend facilement avec très peu de data.
Atomium, aurais-tu des ressources en anglais ou fr sur comment utiliser cela, j'ai regardé le github mais bon pas trop le temps de m'y pencher plus en détails pour le moment...


Mon réseau pour publier chez moi : liste ici. Échange possible.

0
J'aime ❤️

🔴 Hors ligne

#14 2020-10-27 12:32:05

Mention poulpe_centriste
🥈 Grade : Soldier

Membre du CercleOfficier100likes
Inscription : 2018-07-03
Messages : 572
Likes : 168

Re : ♦️ OpenAI & Génération de texte

frcc78 a écrit :

La GPT3 est sortie récemment, l'IA apprend facilement avec très peu de data.
Atomium, aurais-tu des ressources en anglais ou fr sur comment utiliser cela, j'ai regardé le github mais bon pas trop le temps de m'y pencher plus en détails pour le moment...

L'API de GTP3 n'est pas toujours en closed beta ?

J'ai encore du mal à trouver un intérêt à GPT pour manipuler Google efficacement. Tu peux chier du contenu lisible pour un humain, certes. Mais il ne sera pas assez bon pour faire du copyrighting ou répondre de manière pertinente à une intention de requête complexe (une description de page produit, d'accord, mais répondre de manière pertinente à quelles sont les meilleures villes pour investir dans l'immobilier, non). Donc tu devras tout de même cloaker puisque ton contenu ne conviendra pas à l'intention de requête.

Si ta soupe actuelle (cloakée) marche suffisamment bien pour le moment pour atteindre les objectifs que tu lui as fixés, pourquoi s'emmerder avec GTP3 ? Surtout que si tu arrives déjà à faire de la bouillie de qualité, bien pertinente pour Google, ça marche super, couplé à un bon maillage.

Etant en plein dedans en ce moment, j'ai l'impression que les gains sont plutôt à faire au niveau de la granularité: pertinence et cohérence au niveau phrase, paragraphe, section, mise en page, visuels, couplé au maillage. Ce qui peut se régler en partie de manière assez simple (sous python) avec Sklearn|une matrice des similarité cosinus|un coup de DBSCAN.

GTP3, je pense, pourra t'offrir la cohérence (une page bien propre, qui parlera de manière très vague de ton sujet principal, avec des images en rapport), mais pas la pertinence pour Google. Tout simplement parce qu'il ne se base pas sur ce que Google va considérer comme pertinent pour l'intention de recherche. T'es toujours obligé de partir de la SERP pour suivre Google à la trace.

Pour faire du spamdexing et faire quelque chose d'assez diffus, qui fait son job tout doucement depuis la page 2 ou 3-4 pourquoi pas, après...

0
J'aime ❤️

🔴 Hors ligne

#15 2020-10-27 14:12:54

Mention frcc78
🥈 Grade : Soldier

Membre du CercleOfficier250likes1000 messagesPhilantrope
Inscription : 2012-07-05
Messages : 1 161
Likes : 264

Re : ♦️ OpenAI & Génération de texte

Effectivement, on ne sera pas sur du super qualitatif. Cependant, je pense plutot à de la réécriture d'article à partir d'une base. Par exemple, un sujet que tu découpes en plusieurs partie avec intro et conclusion. Tu écrits plusieurs fois chaque partie et plusieurs fois intro et conclu et plutot que de l'envoyer dans un logiciel de spin où l'on sait pertinemment qu'il va  te sortir un truc pas fameux (contrairement aux outils anglais car l'anglais est très facile et simple comme language), tu utilise l'IA pour te sortir un truc cohérents non pas pour chaque séquence de mots mais pour chaque séquence de phrase et avec un contextualisation ce qui ne peut être fait avec du spinning classique.


Mon réseau pour publier chez moi : liste ici. Échange possible.

0
J'aime ❤️

🔴 Hors ligne

#16 2020-10-27 15:41:58

Mention Jaffaar
🥇 Grade : Guardian

AdminMembre du Black LaboMembre du CercleOfficierForce PolyvalenteIngénieur webKilluavie1000likesConsomateur de Liens1000 messagesMembre HospitalierPhilantrope
Lieu : Consultant SEO / WEB
Inscription : 2012-06-01
Messages : 8 406
Likes : 1316

Développement PHP
Développement JS
Networking SEO
Social Engineering

Re : ♦️ OpenAI & Génération de texte

frcc78 a écrit :

pour chaque séquence de phrase et avec une contextualisation ce qui ne peut être fait avec du spinning classique.

Hello,
Cela fait longtemps que tu n'as pas testé d'outil de spinning classique non ?


Comment Ranker ?
Nouveauté : Ninja Web Pro Pack copies limitées !
Ebook : Ninjalinking 2022 (-25% : labo25e)           
Conseils stratégiques ou techniques ? ( Skype : jaffaarbh )

0
J'aime ❤️

🟢 En ligne

#17 2020-10-27 18:05:29

Mention frcc78
🥈 Grade : Soldier

Membre du CercleOfficier250likes1000 messagesPhilantrope
Inscription : 2012-07-05
Messages : 1 161
Likes : 264

Re : ♦️ OpenAI & Génération de texte

Oui Jaffar, ca fait longtemps mais j'ai toujours été déçu. Après, si c'est juste un dictionnaire de synonyme sur une thématique ca me va pas non plus !!

Le dernier Spin que j'ai fait y a un an je l'ai même pas utilisé pourtant il était très bien (fait à la mano plus ou moins et avec effispin). Faut trouver ou le poster et je suis pas assez hardcore pour poster ca même sur des sites ou je paie pour publier. A la base c'était pour mettre sur des web 2 en tiers 3.

J'ai vu des sites sur ereferer (certain que les sites appartiennent au même proprio car même thématique "entreprise" et ajouté en même temps )remplis d'articles de Spin pourri, ca passait en survolant mais une vrai catastrophe en s'y arrêtant... Je sais pas quel outil ils ont utilisé. Ereferer j'aime bien mais faut vraiment faire le tri.

Je sais que tu as un outil, c'est peut être le mieux parmi les FR mais crois moi que quand quelqu'un aura fait la même chose avec une IA (peut être toi) il n'y aura pas photo...

Dernière modification par frcc78 (2020-10-27 18:07:29)


Mon réseau pour publier chez moi : liste ici. Échange possible.

0
J'aime ❤️

🔴 Hors ligne

#18 2020-10-28 09:18:35

Mention poulpe_centriste
🥈 Grade : Soldier

Membre du CercleOfficier100likes
Inscription : 2018-07-03
Messages : 572
Likes : 168

Re : ♦️ OpenAI & Génération de texte

frcc78 a écrit :

Effectivement, on ne sera pas sur du super qualitatif. Cependant, je pense plutot à de la réécriture d'article à partir d'une base. Par exemple, un sujet que tu découpes en plusieurs partie avec intro et conclusion. Tu écrits plusieurs fois chaque partie et plusieurs fois intro et conclu et plutot que de l'envoyer dans un logiciel de spin où l'on sait pertinemment qu'il va  te sortir un truc pas fameux (contrairement aux outils anglais car l'anglais est très facile et simple comme language), tu utilise l'IA pour te sortir un truc cohérents non pas pour chaque séquence de mots mais pour chaque séquence de phrase et avec un contextualisation ce qui ne peut être fait avec du spinning classique.

Tu as essayé les paraphrasers qui trainent sur Github?

0
J'aime ❤️

🔴 Hors ligne

#19 2020-10-28 12:08:00

Mention frcc78
🥈 Grade : Soldier

Membre du CercleOfficier250likes1000 messagesPhilantrope
Inscription : 2012-07-05
Messages : 1 161
Likes : 264

Re : ♦️ OpenAI & Génération de texte

Non, du tout. Mais il y en a en francais ?


Mon réseau pour publier chez moi : liste ici. Échange possible.

0
J'aime ❤️

🔴 Hors ligne

#20 2020-10-28 14:33:21

Mention poulpe_centriste
🥈 Grade : Soldier

Membre du CercleOfficier100likes
Inscription : 2018-07-03
Messages : 572
Likes : 168

Re : ♦️ OpenAI & Génération de texte

frcc78 a écrit :

Non, du tout. Mais il y en a en francais ?

Sur étagère, avec un entrainement sur dataset en FR, je ne pense pas ?

0
J'aime ❤️

🔴 Hors ligne

Pied de page des forums