ChatGPT: ¿enemigo o aliado de la creación de contenidos en internet?
Si la inteligencia artificial ha demostrado su solvencia para reemplazar a coachers, analistas financieros, conductores o asistentes de compras, ¿también los periodistas y redactores están en riesgo? ¿Qué sucedería si la generación automática de textos se materializara a gran escala?, ¿beneficiaría o perjudicaría a la calidad del contenido de internet? El lanzamiento de ChatGPT ha puesto en ebullición al sector del posicionamiento en buscadores, por su impacto futurible en la creación de contenido textual, actividad central para miles de expertos y agencias de SEO que amenaza con automatizarse.
El pasado 30 de noviembre, la compañía californiana OpenAI presentó un chatbot de inteligencia artificial denominado ChatGPT —nombre que no lleva a engaño, fusión de la palabra chat o «conversar» y de las siglas de Generative Pre-trained Transformer—, capaz de «responder preguntas, admitir errores, desafiar las premisas incorrectas y rechazas solicitudes inapropiadas», citando a sus desarrolladores. En la práctica, las habilidades de ChatGPT son impresionantes: redactar una monografía, componer un poema ajustado a una métrica determinada, guionizar un vídeo de YouTube, ejercer de consejero personal, depurar un código existente o elaborar otro nuevo ad ovo en cualquier lenguaje de programación, etcétera.
Pero este chatbot no es como los demás. Hoy los bots conversacionales son ampliamente utilizados en sectores como la hostelería (Asksuite, Quicktext, Whistle, RateGain) o el comercio electrónico (Tidio, Chatfuel, Amelia, Botsify). Su tecnología, sin embargo, los aproxima más a un livechat automatizado que a una inteligencia en sentido estricto y sus interacciones con clientes dependen de una base de preguntas y respuestas predefinidas. Por sus avances en machine learning y en procesamiento del lenguaje natural, ChatGPT comparten muchas las virtudes de aclamadas IAs como Watson Assistant, AlphaCode o Cleverbot.
ChatGPT, un salto de gigante en chatbots de inteligencia artificial
ChatGPT se define como un chatbot de inteligencia artificial con capacidad para realizar operaciones complejas y tomar decisiones lógicas y acertadas con una supervisión mínima o nula, procediendo en forma de diálogo. Precisando este último punto, el formato dialogado reciben órdenes y consultas por un canal de entrada o input y reproduce sus respuestas y preguntas por un canal de salida o output. Y no se limita repetir una información dada, sino que cuestiona las premisas recibidas, contesta a cuestiones de seguimiento y reconoce errores propios y del usuario.
Pero ¿qué es ChatGPT, técnicamente? Este modelo de procesamiento lingüístico basado en IA se fundamenta en GPT-3.5 (Generative Pretrained Transformer 3) desarrollado por OpenAI, un instituto global de investigación de inteligencia artificial. Su arquitectura base es Transformer y cuenta con 175 millones de parámetros, siendo capaz de secuenciar largas cadenas de información.
Este prototipo de chat en español de OpenAI se integra dentro de los modelos de aprendizaje automático o machine learning denominados Large Language Models (LLMs). En resumidas cuentas, estos chatbots son entrenados para anticiparse a las consultas del usuario y predecir las palabras subsiguientes de una oración, de manera similar a la mente humana. En concreto, ChatGPT emplea un LLM bautizado como InstructGPT, entrenado intensivamente para recibir instrucciones complejas y procesar respuestas largas y elaboradas a cuestiones difíciles incluso para personas adultas.
Por qué ChatGPT no reemplazará a periodistas y redactores humanos
Que las IAs serán parte del futuro de la mayoría de industrias y sectores es una realidad. Pero los gurús del sector no concuerdan acerca de cuál será el impacto de esta tecnología y de sus aplicaciones en actividades tradicionalmente asumidas por seres humanos (programación, traducción y redacción de textos, etcétera). Kai-Fu Lee, presidente y consejero delegado de Sinovation Ventures, quizá sea uno de los más alarmistas al respecto, afirmando que la inteligencia artificial sustituirá el 40% de los empleos durante la próxima quincena.
«El principal potencial de la IA radica en la penetración en las empresas actuales a través de nuevas formas de solucionar los problemas, nuevos niveles de velocidad y precisión, una renovada eficacia y nuevas formas de trabajar y de ponderar lo que se puede hacer», puntualiza Lee en el artículo La inteligencia artificial y el futuro del trabajo para BBVA OpenMind. En este sentido, los generadores de texto por inteligencia artificial podrían ser la punta del iceberg.
¿Representan chatbots de inteligencia artificial como ChatGPT una amenaza para los creadores de contenido escrito? Una investigación de la Universidad de Stanford (EE. UU.) responde, en cierto modo, afirmativamente. Sus investigadores informaron de que un incremento de la masa de datos de entrenamiento consiguió que GPT-3 tradujera textos del inglés al francés con eficacia, un logro impresionante considerando que el modelo en cuestión no estaba aleccionado para realizar esta tarea. Este experimento viene a demostrar la extraordinaria versatilidad de GPT-3 y otros LLMs en desarrollo actualmente.
Pese a lo anterior, un análisis pormenorizado de ChatGPT revela carencias y limitaciones evidentes. En primer lugar, no es una herramienta tan infalible como pueda parecernos por el asombro generalizado de la prensa especializada. Ocasionalmente, sus respuestas demuestran ser imprecisas o contener errores, debido a la dificultad para identificar y juzgar una fuente de información como veraz o la ausencia de un entrenamiento supervisado que oriente adecuadamente sus respuestas. Por este motivo, plataformas como Stack Overflow han prohibido el uso de ChatGPT en su comunidad de usuarios para la resolución de problemas y dudas de código.
Otra de las debilidades de este chatbot de generación de texto con inteligencia artificial es la dificultad para sintetizar código y texto. Las respuestas de ChatGPT son a menudo excesivamente densas y prolijas, aportan informaciones demasiado secundarias y terciarias y tienden a espaciarse en la aportación de datos y detalles que frecuentemente resultan irrelevantes.
De mayor gravedad es la tendencia de ChatGPT a responder con informaciones susceptibles de generar algún tipo de daño al usuario, pese a haber sido diseñada específicamente para evitarlo. En palabras de sus creadores, «si bien hemos hecho esfuerzos para que el modelo rechace solicitudes inapropiadas, a veces responderá a instrucciones dañinas o exhibirá un comportamiento sesgado». Dicho de otra forma, si bien ChatGPT jamás explicará el paso a paso de la construcción de explosivos, puede favorecer el desarrollo de códigos maliciosos y del phising, esto último afirmado por la tecnológica de soluciones de ciberseguridad Check Point, que asegura que ChatGPT es muy capaz de participar de la creación de virus y otras amenazas, según ha noticiado TecnoXplora.
ChatGPT tampoco podría engañar a Google
Aunque ChatGPT es percibida como una seria amenaza para los profesionales dedicados al posicionamiento en buscadores, la realidad es que sus limitaciones actuales también impiden su uso como generador de texto inteligencia artificial en español y otros idiomas. La razón es simple: la información creada a partir de ChatGPT no es indetectable para PageRank de Google y otros algoritmos responsables de buscar e indexar contenido web.
Existe una confusión generalizada al respecto, que los medios de comunicación no ayudan a disipar (The New York Times soltaba el pasado mes de diciembre que «una nueva ola de bots de chat como ChatGPT utiliza inteligencia artificial que podría reinventar o incluso reemplazar el motor de búsqueda tradicional de Internet», una afirmación bastante sensacionalista). Incluso John Mueller, actual Webmaster Trends Analytics de Google, sembró dudas al respecto, pues a la pregunta de si el buscador propiedad de Alphabet podría diferenciar el contenido generado por una máquina y el de un humano, salió del paso con un «no puedo afirmar eso».
Sin embargo, Google, Bing y otros motores de búsqueda son perfectamente capaces de diferenciar las palabras y frases de un ser humano de las producidas artificialmente por una inteligencia artificial. Curiosamente, los desarrolladores de ChatGPT son en parte responsables de ello. Y es que el chatbot de OpenAI ha implementado una serie de marcas de agua criptográficas, destinadas a facilitar la identificación del contenido generado mediante ChatGPT. Citando al investigador Scott Aaronson, «básicamente, cada vez que GPT genera un texto largo, queremos que haya una señal secreta imperceptible en sus elecciones de palabras, que puede usar para probar más tarde que, sí, esto provino del ChatGPT».
Obligado es recordar que Google, en sus Políticas de spam de la búsqueda web, desaconseja tajantemente el «contenido generado automáticamente» con fines de posicionamiento SEO. Lo define como «aquel que se crea mediante programas informáticos sin aportar nada original ni añadir suficiente valor» y detalla asimismo que se sancionará el «texto traducido por una herramienta automática y el texto generado mediante procesos automatizados». Lógicamente, esto incluye cualquier hilo de respuestas de ChatGPT.
ChatGPT: una oportunidad presente que esconde una amenaza futura
ChatGPT, pese a ser un creador de textos sobre un tema o asunto determinado, presenta incontables oportunidades para desarrolladores y creadores de contenido, siendo en realidad un aliado del empleo digital, más que una amenaza para los recursos humanos de sectores que, lo quieran o no, se verán afectado por esta y otras IAs de procesamiento del lenguaje natural. Pero los efectos de esta tecnología, hoy incapaz de opacar la inventiva y dotes humanas, serán menos devastadores de lo que las voces más alarmistas sugieren.
Menos tranquilizadora es la situación a largo plazo, cuando este generador de textos online y otros de similares características se perfeccionen lo suficiente, al punto de suplir el 100% de la actividad de periodistas, traductores, programadores, etcétera, y no sólo un pequeño número de tareas repetitivas.
Tabla de contenidos