TECNOLOGÍA

La invasión del contenido AI en Internet: Un desafío global

Compártelo

Un reciente estudio realizado por investigadores del Amazon Web Services (AWS) AI Lab ha revelado un hecho alarmante: más de la mitad de las frases en Internet han sido traducidas a dos o más idiomas, y gran parte de este contenido es de baja calidad, generado por Inteligencia Artificial (IA). Aunque el estudio aún no ha sido revisado por pares, los resultados son sorprendentes.

La investigación sugiere que, en un esfuerzo por generar ingresos publicitarios basados en el clickbait, se está utilizando IA para crear contenido en inglés de baja calidad a gran escala, y luego se traduce a varios idiomas utilizando herramientas de traducción automática impulsadas por IA. Este proceso resulta en material cada vez peor, llenando regiones enteras de la web con versiones deterioradas y confusas.

Esto plantea un desafío particular para los “idiomas de menores recursos”, aquellos con menos datos disponibles para entrenar eficazmente los modelos de IA. Según los investigadores de AWS, estas traducciones generadas por máquinas constituyen una gran parte del contenido web total en dichos idiomas.

Este fenómeno no es exclusivo de una plataforma. Google, por ejemplo, ha tenido que enfrentarse a la persistencia de material generado por IA en sus búsquedas y algoritmos de Google News. Amazon también ha experimentado problemas con los listados de libros generados por IA y productos con títulos que contradicen las políticas de uso de OpenAI.

La prevalencia de este contenido generado por IA no solo afecta la usabilidad de la web, sino que también puede hacer casi imposible entrenar modelos avanzados de IA en idiomas de menores recursos a largo plazo. Para entrenar un modelo de Lenguaje de Gran Escala avanzado, los científicos de IA necesitan grandes cantidades de datos de alta calidad, generalmente obtenidos raspando la web. Si una parte significativa de Internet está inundada de traducciones de IA sin sentido, la posibilidad de entrenar modelos avanzados en idiomas menos comunes podría verse obstaculizada.

Este estudio destaca una preocupación creciente sobre cómo la proliferación de contenido de baja calidad generado por IA podría estar afectando negativamente la diversidad lingüística y la calidad de la información disponible en Internet.


Compártelo

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *