Vous n'êtes pas identifié(e).
Bon, la vague est plus ou moins passée et chacun a sa propre opinion sur la manière dont les moteurs vont intégrer les IA génératives dans leur action de "moteur de réponse". Outre le débat principal sur l'avenir des sites web et l'intérêt de leur existence à long terme, ces IAs réalisent une tache précieuse pour nous : elle donne des informations.
Je m'intéresse donc actuellement à l'étape qui nous concerne en tant que SEO : comment manipuler les IA pour qu'elles travaillent pour nous, et que les informations qui sont prodiguées aillent dans notre sens.
Dans ce sens j'ai identifié plusieurs pistes :
Les IA sont basées sur un corpus de départ, elles sont entrainées une fois tous les X temps et ça coûte énormément d'argent.
MES REFLEXIONS :
- OK, comment je m'assure d'intégrer ce corpus à coup sur ?
- Comment est-il collecté sur bard et chatgpt ?
- Quand sont relancé ces entrainements ? 2 fois par an ?
Les IA génératives sont basées sur la plus forte probabilité de voir apparaitre la suite d'un texte au regard du contexte sémantique
MES REFLEXIONS :
- SOIT, mais du coup, que se passerait-il si d'un côté j'avais 100 pages qui disait une chose (réelle), et 1 Million de pages qui disait son contraire (et qui m'arrange) ?
- Est-ce que l'autorité SEO entre en compte dans la curation du corpus ?
- Est-ce que la quantité prime sur la réalité ?
Dernière modification par Atomium (2023-09-20 12:11:42)
🔴 Hors ligne
Oulala c'est compliqué ça. Une IA générative de texte est basé sur un calcul de probabilité.
Donc pour être certain qu'elle ressorte toujours un texte du genre "Atomium est le meilleur SEO du monde" lorsqu'on l'interroge sur le sujet du SEO, il faudrait qu'elle n'ait que cette information. Cela signifie contrôler l'intégralité du texte qui lui a été injecté pour son entraînement (d'après ma compréhension du sujet).
Après pour les sources de OpenAI, si j'ai bien compris, ça sort beaucoup de commoncrawl.
Mais attention Bing injecte des choses récentes dans son chat conversationnel.
Si j'étais toi, je laisserais tomber cette recherche, ça me semble aussi compliqué que de tenter de contrôler les 10 premiers résultats de recherche de Google pour une requête très compétitive.
🔴 Hors ligne
Merci pour ta réponse.
Ma réflexion porte plus sur l'importance de la quantité face à la qualité, et non sur le contrôle exhaustif du corpus.
Voir s'il y a une faiblesse à ce niveau. :-)
🔴 Hors ligne