Google considère que le contenu généré par l’IA va à l’encontre de ses directives aux webmasters et est considéré comme du spam

Jean Muller, recherche avocat au nom de Google, affirme que le contenu généré automatiquement à l’aide d’outils d’écriture IA est considéré comme du spam, selon les directives du moteur de recherche pour les webmasters.

Ce sujet a été soulevé lors d’un récent Hangout SEO Google Search Central pendant les heures ouvrables en réponse à une question sur les outils d’écriture GPT-3 AI.

GPT signifie Generative Pre-training Transformer (GPT), un modèle de langage écrit par Alec Radford et publié en 2018 par OpenAI, le laboratoire de recherche en intelligence artificielle d’Elon Musks. Il s’agit d’un algorithme de langage à usage général qui utilise l’apprentissage automatique pour traduire du texte, répondre à des questions et écrire du texte de manière prédictive. Il fonctionne en analysant une séquence de mots, de texte ou d’autres données, puis en développant ces exemples pour produire un résultat complètement original sous la forme d’un article ou d’une image. Il est basé sur un modèle de langage génératif (où deux réseaux de neurones s’améliorent par la compétition).

Il y a un débat dans la communauté SEO sur l’utilisation des outils GPT-3 et s’ils sont acceptables du point de vue de Google. Mueller affirme que le contenu écrit par l’IA entre dans la catégorie du contenu généré automatiquement, ce qui pourrait entraîner une pénalité manuelle. Cependant, les systèmes de Google peuvent ne pas être en mesure de détecter le contenu généré par l’IA sans l’aide d’examinateurs humains.

Le contenu généré automatiquement est contraire aux consignes de Google pour les webmasters

Quels que soient les outils utilisés pour le créer, le contenu écrit par machine est considéré comme généré automatiquement.

Comme Mueller s’empresse de le souligner, la position de Google sur le contenu généré automatiquement a toujours été claire* :

Pour nous, ceux-ci entreraient essentiellement dans la catégorie du contenu généré automatiquement, ce que nous avons dans les directives aux webmasters presque depuis le début.

Les gens génèrent automatiquement du contenu de différentes manières. Et pour nous, si vous utilisez des outils d’apprentissage automatique pour générer votre contenu, c’est fondamentalement la même chose que si vous brouilliez simplement des mots, recherchiez des synonymes ou recouriez à des astuces de traduction que les gens avaient l’habitude de faire. Ce genre de choses.

Je soupçonne que la qualité du contenu pourrait être un peu meilleure que les outils de la vieille école, mais pour nous, il s’agit toujours de contenu généré automatiquement, ce qui signifie que pour nous, il est toujours contraire aux directives des webmasters. Par conséquent, nous le considérons comme un spam.

Les réponses de John Mueller

Google peut-il détecter le contenu généré par l’IA* ?

Une question a été posée sur la capacité de Google à identifier le contenu écrit par des outils d’apprentissage automatique. Google peut-il comprendre la différence entre un contenu écrit par des humains et un contenu écrit par des machines* ?

Mueller ne prétend pas que Google détecte automatiquement le contenu écrit par l’IA. Cependant, si l’équipe anti-spam de Google le trouve, elle peut prendre des mesures.

Je ne peux pas l’affirmer. Mais pour nous, si nous constatons que quelque chose est généré automatiquement, l’équipe Webspam peut certainement prendre des mesures.

Et je ne sais pas comment l’avenir va évoluer dans ce domaine, mais j’imagine que, comme pour toutes ces technologies, il y aura un peu un jeu du chat et de la souris, ou parfois les gens le feront. quelque chose et tout ira bien, puis l’équipe de lutte contre le spam se rattrapera et résoudra ce problème à plus grande échelle.

Sur la base de notre recommandation, nous considérons toujours qu’il s’agit de contenu généré automatiquement. Je pense qu’avec le temps c’est peut-être quelque chose qui évolue et devient un autre outil pour les gens. Un peu comme utiliser la traduction automatique comme base pour créer une version traduite d’un site Web, mais en y ajoutant toujours des modifications manuelles.

Et peut-être qu’avec le temps, ces outils d’IA évolueront dans le sens où vous les utiliserez pour être plus efficace dans votre écriture ou pour vous assurer que vous écrivez correctement, comme les outils de vérification orthographique et grammaticale, qui sont également basés sur l’apprentissage automatique. . Mais je ne sais pas ce que l’avenir nous réserve.

Mueller précise que Google ne tient pas compte de la manière dont les outils d’écriture de l’IA sont utilisés. Les utiliser à quelque titre que ce soit est considéré comme du spam, ajoute-t-il.

Actuellement, tout est contraire aux directives des webmasters. Donc, de notre point de vue, si nous devions tomber sur quelque chose comme ça, si l’équipe anti-spam le remarquait, ils le considéreraient comme du spam.

Quelle est l’implication pour les webmasters et les sites Web ?

Miranda Miller, pour sa part, estime que la chose la plus importante à propos de cette session de questions-réponses est que les algorithmes de Google ne peuvent pas détecter automatiquement le contenu généré par des modèles de langage comme GPT-3. Le message ici est que si Google détecte du contenu généré automatiquement, l’équipe de spam Web pourrait prendre des mesures. Mais nous ne parlons pas d’articles de 2003.

Et pour continuer en disant que l’intelligence artificielle est utilisée par les médias, les universités et d’autres organisations pour automatiser la recherche et le référencement croisé, l’exploration et le tri de contenu dans de nombreuses langues pour identifier les tendances émergentes, générer des résumés d’articles, des vérifications des faits, le traitement des données et même écrire des articles complets.

Quant à la génération d’articles complets, en 2020, Liam Porr, alors étudiant à l’Université de Californie à Berkeley, a généré des articles par IA en utilisant GPT-3. Peu de gens ont remarqué que l’élément généré était l’œuvre d’une IA.

GPT-3 a été formé sur un énorme corpus de textes qu’il exploite pour des régularités statistiques. Ils sont inconnus des humains, mais sont stockés sous forme de milliards de connexions pondérées entre les différents nœuds du réseau de neurones GPT-3. Il est important de noter qu’aucune intervention humaine n’est nécessaire dans ce processus : le programme recherche et trouve des modèles sans indice, qu’il utilise ensuite pour remplir les invites de texte. L’algorithme le fait avec une précision sans précédent.

Par exemple, si vous entrez le mot feu dans GPT-3, le programme sait grâce à ses poids réseau que les mots camion et alarme sont beaucoup plus susceptibles de suivre que lucide ou gobelin. Dès que GPT-3 a été annoncé, beaucoup ont spéculé sur la façon dont cela pourrait affecter la production de contenu.

L’Associated Press a commencé à utiliser l’IA pour la génération d’histoires en 2014. Mettre l’IA au travail dans la création de contenu n’est pas nouveau, et le facteur le plus important ici est son application intelligente, a déclaré Miller, notant que l’utilisation de l’IA peut aider les créateurs de contenu à surmonter le langage et obstacles à l’alphabétisation. , améliorez la qualité de votre écriture, et plus encore.

Ce sont de bons résultats. Ne serait-il pas étrange que Google interdise l’utilisation de l’IA par les webmasters et les créateurs de contenu dans le but d’améliorer l’expérience utilisateur alors qu’ils l’utilisent eux-mêmes si fortement*?*.

Source : entretien avec John Mueller (texte vidéo)

Et vous ?

Que pensez-vous de l’opinion de Google selon laquelle le contenu généré automatiquement à l’aide d’outils d’écriture IA est considéré comme du spam ?

Voir également :

Un faux blog d’étudiants propulsé par GPT-3, l’IA de traitement du langage naturel OpenAI, a trompé des dizaines de milliers de personnes
Open AI propose son modèle de traitement du langage naturel GPT-3 en version bêta privée, ses applications vont de la génération de texte cohérent à la génération de code et à la création d’applications.
OpenAI lance une API multitâche pour ses modèles d’IA textuels, qu’elle commencera à livrer
Microsoft vient de construire un supercalculateur de classe mondiale exclusivement pour OpenAI, pour former de très grands modèles d’IA.
Une loi de Moore pour l’intelligence artificielle ? Selon OpenAI, les algorithmes d’IA suivent une courbe évolutive qui pourrait être décrite comme l’évolution prédite par la loi de Moore

Leave a Comment