[ad_1]
Les heures de bureau SEO d’octobre de Google ont répondu s’il était acceptable d’utiliser du contenu traduit automatiquement qui a été examiné par un humain et soumis à des modifications d’édition mineures.
Google SEO – Épisode des heures de bureau
Cet épisode du hangout des heures de bureau suit un nouveau format où les questions sont soumises et les réponses sont données.
Les Googleurs qui répondent aux questions sont Lizzi Sassman et John Mueller.
Lizzi Sasman (@okaylizzi) est un rédacteur technique qui « s’occupe » de la documentation de Google Site Central.
Contrairement au format en direct précédent, où le public pose des questions en temps réel, il n’y a aucune possibilité de poser des questions de suivi.
Il en résulte des réponses faisant écho à la documentation de Google, et personne ne peut poser les questions restantes.
La personne qui posait la question était préoccupée par son contenu qui était traduit automatiquement à partir d’une autre langue.
Ils ont employé des éditeurs humains pour examiner le contenu jugé acceptable, à l’exception de modifications mineures.
Naturellement, la personne qui pose la question se demande si des « ajustements mineurs » suffisent à rendre le contenu acceptable pour Google.
Lizzi Sassman répond à la question d’une manière qui respecte strictement ce que stipule la documentation de Google.
Discutablement, la réponse aurait pu être clarifiée avec une question de suivi pour déterminer si des « ajustements mineurs » sont suffisants. Après tout, la question demande explicitement si des modifications mineures sont suffisantes pour Google.
La réponse implicite est peut-être d’utiliser votre jugement sur la qualité du contenu traduit.
Jugez par vous-même.
Le contenu modérément modifié et traduit par machine est-il acceptable ?
Ils ont demandé:
« Un site utilise la traduction automatique pour proposer des publications dans d’autres langues.
Le contenu est révisé par des traducteurs humains et ils sont souvent satisfaits de la qualité après les ajustements mineurs.
Est-ce que c’est bon pour Google ? »
Lizzi Sassman de Google a répondu :
« Eh bien, c’est bon d’entendre que les traducteurs humains sont satisfaits et c’est tout à fait correct pour Google tant qu’il y a un humain impliqué dans le processus de révision. C’est la clé.
La chose à laquelle vous voulez faire attention est de vous assurer que la qualité continue d’être bonne et de bien fonctionner pour les humains qui lisent le contenu.
La réponse ne dit pas spécifiquement si les modifications mineures sont correctes, mais seulement si les « traducteurs humains » sont bons avec cela, alors cela devrait être bon pour Google.
Se pourrait-il que Google ne vérifie pas si le contenu est traduit automatiquement mais s’appuie sur des signaux de qualité de contenu standard ?
Nous ne savons pas.
Le nouveau format des heures de bureau ne donne pas à la personne qui pose la question la possibilité de poser une question de suivi.
Règles anti-spam de Google
La documentation des développeurs de Google sur le contenu spammé mentionne des outils de traduction automatique de texte et indique explicitement qu’il s’agit de spam, sauf lorsqu’un élément humain est impliqué.
Voici ce qu’indique la documentation de Google :
« Des exemples de contenu généré automatiquement par du spam incluent :
Texte traduit par un outil automatisé sans révision ni curation humaine avant publication »
Il ressort donc clairement des directives publiées par Google que tant qu’un humain modifie le contenu traduit automatiquement, Google sera d’accord.
De plus, dans une vidéo Google Office-Hours d’avril 2022, John Mueller a mentionné comment le contenu généré par l’IA est considéré comme du spam, puis a mentionné le contenu traduit automatiquement.
Mueller a parlé des outils de génération de contenu de l’IA et les a comparés aux outils de traduction automatique.
À la minute 24:55 de la vidéo des heures de bureau d’avril 2022, Mueller a déclaré:
« Je pense, je ne sais pas, avec le temps, c’est peut-être quelque chose qui va évoluer, en ce sens que ça deviendra plus un outil pour les gens.
Un peu comme si vous utilisiez la traduction automatique comme base pour créer une version traduite d’un site Web.
Mais vous continuez… essentiellement à le parcourir manuellement.
Pourquoi un humain devrait-il vérifier le contenu traduit automatiquement ?
Comme mentionné ci-dessus, la préoccupation de Google est que le contenu référencé à partir des pages de résultats des moteurs de recherche (SERP) soit de haute qualité et que les utilisateurs en soient satisfaits.
Quelque chose qui n’a pas été discuté est que le contenu traduit contient des signatures qu’un algorithme de détection de traduction peut identifier.
La détection de contenu traduit par machine fait l’objet de recherches depuis de nombreuses années.
Un document de recherche de 2021 (Détection de texte traduit automatiquement grâce à la similarité du texte avec la traduction aller-retour – Téléchargement PDF) indique que le contenu traduit d’une langue à une autre peut être difficile à détecter pour les humains.
Par exemple, en utilisant 100 textes traduits, les évaluateurs humains n’ont pu identifier qu’un peu plus de la moitié des textes traduits.
Les chercheurs ont noté :
« La précision moyenne était de 53,3 % (55,0 % pour les locuteurs natifs et 52,0 % pour les locuteurs non natifs), ce qui était presque aléatoire. »
L’approche, appelée Text Similarity With Round-Trip Translation (TSRT), a surpassé les évaluateurs humains et a obtenu un score plus élevé que les détecteurs de traduction de pointe lorsque l’article a été publié en 2021.
Remarquablement, cette technique peut détecter la langue d’origine des textes traduits.
Il est également capable de déterminer quel algorithme de traduction a effectué la traduction.
Ils ont rapporté :
« Les résultats de l’évaluation montrent que la TSRT surpasse les autres méthodes, avec une précision allant jusqu’à 90,2 %.
De plus, TSRT pourrait également identifier le traducteur d’origine et la langue de traduction avec respectivement 93,3 % et 85,6 % de précision. »
Il n’est pas clair si Google peut détecter le contenu traduit et si Google essaie même ou non de détecter le contenu traduit.
Mais nous savons que la technologie pour le détecter existe. La technologie peut détecter le contenu traduit mieux que les humains et déterminer quel algorithme de traduction a effectué la traduction.
Si le fait que cela va à l’encontre des consignes aux webmasters et que l’expérience utilisateur peut être négative n’est pas suffisant pour motiver la modification de contenu traduit automatiquement, alors peut-être que le possibilité que Google analyse la qualité du contenu pour la traduction automatique peut être une raison pour donner à ce type de contenu un examen complet.
Citation
Écoutez le hangout Google Office Hours à 17:50 minutes.
Image sélectionnée par Shutterstock/g_tech
window.addEventListener( 'load', function() setTimeout(function() striggerEvent( 'load2' ); , 2000); );
window.addEventListener( 'load2', function()
if( sopp != 'yes' && addtl_consent != '1~' && !ss_u )
!function(f,b,e,v,n,t,s) if(f.fbq)return;n=f.fbq=function()n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments); if(!f._fbq)f._fbq=n;n.push=n;n.loaded=!0;n.version='2.0'; n.queue=[];t=b.createElement(e);t.async=!0; t.src=v;s=b.getElementsByTagName(e)[0]; s.parentNode.insertBefore(t,s)(window,document,'script', 'https://connect.facebook.net/en_US/fbevents.js');
if( typeof sopp !== "undefined" && sopp === 'yes' ) fbq('dataProcessingOptions', ['LDU'], 1, 1000); else fbq('dataProcessingOptions', []);
fbq('init', '1321385257908563');
fbq('track', 'PageView');
fbq('trackSingle', '1321385257908563', 'ViewContent', content_name: 'is-google-okay-with-minor-tweaks-to-machine-translations', content_category: 'news seo' );
);
[ad_2]
Source link -16