El ‘boom’ de las Inteligencias Artificiales generativas ha hecho que Internet esté cada vez más lleno de contenido generado por modelos como el famoso ChatGPT. Este tipo de herramientas son muy útiles, tanto para crear imágenes (como puede ser el caso de DALL-E), como para ayudarte a escribir mejores textos. De eso no hay duda.
Sin embargo, el abuso de las IA generativas también tiene consecuencias negativas, y es que muchas webs y creadores de contenido están inundando la red de textos escritos directamente por una máquina, con resultados de muy baja calidad y plagados de inexactitudes.
Cómo saber si un texto es original o ha sido escrito por una Inteligencia Artificial como ChatGPT
Google ya ha actualizado su algoritmo para penalizar contenidos de baja calidad escritos mediante Inteligencia Artificial. Ahora bien, tal y como explica la propia empresa en su blog, si el texto generado por la IA es de buena calidad, entonces no hay ningún problema y puede aparecer perfectamente en las primeras posiciones del buscador de Google.
Por tanto, es probable que veamos cada vez más artículos escritos por máquinas según vayan mejorando este tipo de tecnologías que imitan la escritura humana. ¿Cómo podemos detectarlas y diferenciarlas del resto de contenido creado por personas de carne y hueso?
Método #1: Revisa el texto e identifica los patrones más habituales
Si llevas un tiempo interactuando con herramientas como ChatGPT o el propio chat de Bing, te habrás dado cuenta que las IA todavía son muy predecibles. Tienen algunos “hábitos” o patrones que se repiten en casi todos sus textos, por lo que si somos capaces de identificar estos patrones podremos saber de manera más o menos efectiva si el texto lo ha escrito una máquina.
- “En resumen” y otras coletillas al final del texto: Esta es una de las pistas más elementales para detectar textos escritos por una IA como ChatGPT. En el párrafo del final casi siempre se concluye con un “En resumen”. Si un artículo o noticia incluye esta coletilla al final del texto, hay bastantes papeletas para que el autor se haya limitado a hacer un simple corta y pega de ChatGPT.
- Repetición de frases y palabras: Los textos escritos por una IA también suelen estar repletos de palabras y frases repetidas muchas veces. Las máquinas hacen esto para rellenar el espacio con palabras clave relevantes de cara a mejorar el SEO del artículo, pero muchas veces acaban cayendo en lo que se conoce como keyword stuffing, o lo que es lo mismo, una repetición exagerada de ciertas palabras clave.
- Datos falsos o imprecisos: Uno de los mayores problemas de las IA es que todavía cometen muchos errores a la hora de presentar una información como verídica. Los expertos lo llaman “alucinaciones”, y esto se debe a que las IA recogen datos de multitud de fuentes. Si la máquina no sabe la respuesta pero está obligada a decir algo, lo que hará será dar una respuesta basada en patrones, lo que muchas veces desemboca en una notable discrepancia con la realidad, o lo que es lo mismo, en un dato falso.
- Demasiadas frases cortas: Gran parte de los textos generados por Inteligencia Artificial contienen frases muy cortas. Esto es así porque la maquina intenta imitar la escritura humana, pero como todavía no es capaz de hacerlo al 100%, evita utilizar frases largas para que se note menos.
- Pocos enlaces de referencia: La versión gratuita de ChatGPT (que a día de hoy corresponde a la versión 3.5 de la aplicación), solo genera texto plano. Es decir, que no hay enlaces para citar a las fuentes o redirigir al usuario a otros sitios de interés. Aunque algunas IA sí que aportan los links que han utilizado como fuente, muchas veces suelen ser fuentes de poca autoridad.
- Ausencia de análisis: La mayoría de textos generados por IA no son más que una simple concatenación de hechos. La IA no se detendrá a analizarlos en profundidad ni será capaz de extraer conclusiones más allá de lo evidente. Esto es así porque las IA son muy buenas recogiendo datos, pero carecen de sentido crítico y no tienen opiniones propias.
- El autor del texto: ¿Quién ha firmado el texto que estás leyendo? ¿Ha escrito más artículos? Si es así, revísalos también. Si descubres que sus otros textos no tienen nada que ver, y que utiliza un estilo de escritura marcadamente diferentes, es posible que el texto “sospechoso” lo haya escrito una IA. Por otro lado, si todos los artículos del autor tienen un aroma robótico, es posible que ni siquiera haya una persona de carne y hueso detrás de ese autor desconocido.
Como podéis ver, ninguna de estas pistas es definitoria por sí misma, pero si encontramos un texto que cumpla tres o cuatro de estos patrones es probable que haya sido generado por una máquina.
Método #2: Utiliza un detector de textos generados por IA
Si el análisis manual del texto no nos arroja ninguna conclusión evidente y seguimos teniendo dudas de la autoría de un texto, siempre podemos utilizar una herramienta de detección automática.
OpenAI tiene su propio detector de textos, pero tiene una tasa de aciertos muy baja (alrededor del 26%). Se llama AI Text Classifier y lo podéis probar desde la web de OpenAI. Por suerte, existen más aplicaciones para detectar textos generados por IA, con tasas de acierto mucho más elevadas y fiables.
Un consejo antes de comenzar: después de probar estas herramientas me he dado cuenta de que funcionan mucho mejor si el texto que les damos para analizar está en inglés. Por tanto, es recomendable pasar antes por un traductor si nuestro texto está en español.
Undetectable AI
Este detector de IA es uno de los más eficaces, ya que utiliza los motores de otros 9 detectores de IA para saber si un texto ha sido generado por una Inteligencia Artificial. La aplicación es gratuita, acepta textos de hasta 50.000 caracteres y nos permite especificar el tipo y propósito del texto que vamos a analizar para obtener un resultado más apurado.
GPTZero
Esta herramienta de detección de textos IA analiza la complejidad de la escritura, así como la uniformidad de la longitud de las frases (recuerda que las IA normalmente escriben muchas frases cortas) para saber si los ha escrito una máquina. GPTZero es gratuito y también permite subir documentos, aunque tiene un límite de 5.000 caracteres (que podemos desbloquear registrándonos en la web).
Originality.ai
Esta es una herramienta de pago orientada al entorno profesional, y sirve tanto para detectar plagios como textos generados por IA. La herramienta de Originality.ai ha sido entrenada con GPT-4 y otros modelos de lenguaje para determinar si un texto es “predecible”, y por tanto ha sido escrito por un robot. Actualmente la aplicación funciona mediante un sistema de créditos, con el que podemos analizar 100 palabras por 0,01$.
Content at Scale
El detector de IA de Content at Scale es otra de las mejores herramientas disponibles en el sector. La aplicación ha sido entrenada con millones de datos y permite obtener resultados bastante fiables. Lo interesante de esta herramienta es que al realizar el análisis también resalta en rojo las frases y partes que pueden estar generadas por IA. El detector es gratuito y tiene un límite de 25.000 caracteres (alrededor de 4.000 palabras, que no es poco).
TruthChecker
TruthChecker es una herramienta diseñada para detectar las “alucinaciones” y datos falsos generados por ChatGPT y otros modelos similares basados en GPT-3.5 o superior. Eso sí, en este caso hablamos de una herramienta orientada al sector empresarial, y es necesario ponerse en contacto con los desarrolladores para poder probarla. En cualquier caso, una utilidad muy interesante para entornos académicos o que trabajan con la veracidad de la información.
El problema de muchas de estas herramientas de detección es que la tecnología para generar texto mediante IA no para de evolucionar. Estamos en un momento en el que el crecimiento de estos modelos de lenguaje es exponencial, y cada vez es más difícil diferenciarlos del contenido generado por un humano. Por tanto, este tipo de utilidades corren el peligro de quedarse obsoletas rápidamente.
Por tanto, si tienes dudas sobre si un texto ha sido escrito por una IA, prueba alguna de estas herramientas de detección automáticas, y si el resultado no te convence, revisa también los patrones de escritura que hemos mencionado al principio del post. Y por último, no te olvides tampoco de comprobar los datos más relevantes del texto para descartar “alucinaciones” y posible información falsa.