¿Cómo funcionan los detectores de IA?
Los detectores de IA, también conocidos como detectores de escritura de IA o detectores de contenido, son herramientas que pueden identificar si un texto ha sido escrito por un humano o por una solución de inteligencia artificial (IA) como ChatGPT.
Normalmente, un detector de IA utilizará algoritmos de aprendizaje automático entrenados en textos escritos por humanos y generados por IA para identificar patrones en el lenguaje natural y evaluar si un texto ha sido escrito por un humano o no.
Esto implica dividir el texto de entrada en segmentos, dar una puntuación a cada frase y, a continuación, utilizar estas puntuaciones para proporcionar una puntuación porcentual global que indique qué parte del texto cree que ha sido generada por la IA.
Para evaluar el contenido, los algoritmos utilizan técnicas como el procesamiento del lenguaje natural para evaluar la originalidad del texto. Dos de las medidas más importantes utilizadas son la perplejidad y la explosividad.
Perplejidad vs. Ráfaga
La perplejidad es una medida de lo impredecible o aleatorio que es un texto. Los grandes modelos lingüísticos (LLM) y las herramientas de creación de contenidos de IA están diseñados para crear textos de baja perplejidad, que son más predecibles pero tienen más sentido para el lector.
Los detectores de IA miden la perplejidad porque las puntuaciones bajas de perplejidad indican que una solución automatizada ha escrito un trozo de texto, mientras que una puntuación alta de perplejidad sugiere que lo ha escrito un usuario humano con más incoherencias en la elección del lenguaje.
Por otra parte, la explosividad se utiliza para evaluar la variación en la estructura y longitud de las frases. Se considera que los textos con una variación limitada en la estructura y longitud de las frases tienen una burstiness baja, mientras que los textos con más variación entre esas dos variables tienen una burstiness alta.
Los textos generados por la IA tienen menos explosividad, ya que producen frases de longitud media con una estructura más coherente. En comparación, los escritores humanos utilizarán frases de distinta longitud, con menos coherencia general.
¿Por qué son importantes los detectores de IA?
Los detectores de IA son herramientas importantes para ayudar a empresas, instituciones académicas y otras entidades que necesitan verificar que un texto está escrito por humanos.
Por ejemplo, los académicos pueden utilizar estas herramientas para ayudar a comprobar que los estudiantes están escribiendo sus propias redacciones, mientras que los profesionales del marketing pueden utilizarlas para asegurarse de que el contenido de pago se ha escrito desde cero, y los reclutadores pueden utilizarlas para comprobar que las solicitudes de los candidatos son auténticas.
Estas herramientas son cada vez más útiles ahora que ha aumentado la adopción de la IA. Sólo en el sector educativo, Turnitin descubrió que, de 65 millones de trabajos de estudiantes revisados, el 3,3% de todos los trabajos (más de 2 millones) habían sido marcados por contener un 80% o más de texto escrito con IA.
Del mismo modo, aunque es difícil determinar la prevalencia exacta del contenido en línea generado por IA, el servicio de seguimiento de la desinformación NewsGuard ha descubierto que 50 sitios de noticias en línea están escritos casi en su totalidad por software de inteligencia artificial.
Los datos expuestos anteriormente ponen de manifiesto que los contenidos generados por IA son frecuentes, y aunque esto no es necesariamente malo en determinadas circunstancias, hay otros ámbitos en los que no puede pasarse por alto, como la educación.
¿Son fiables los detectores de IA?
La fiabilidad de los detectores de IA depende de varios factores. Aunque algunos proveedores de soluciones como Originality AI y Turnitin afirman tener un 99% y un 98% de precisión al detectar contenidos creados por IA, la fiabilidad de un detector puede variar en función de varios factores.
Uno de los mayores problemas es que los usuarios pueden dar instrucciones a soluciones como ChatGPT, que está diseñada para eludir los detectores de contenido. Además, algunas personas también crean texto mixto, utilizando la IA para crear texto y luego editándolo o viceversa, en un intento de evitar la detección.
Al mismo tiempo, muchas soluciones son propensas a dar falsos positivos y pueden sugerir que los artículos escritos por humanos fueron escritos en realidad por un programa de IA. Esto puede ser extremadamente perjudicial si una organización o institución toma medidas contra un individuo basándose en esta evaluación.
Como resultado, los detectores de IA se utilizan mejor como herramienta para ayudar a resaltar el contenido que justifica una mayor investigación. Dicho esto, estas soluciones mejoran continuamente con el tiempo, por lo que existe la posibilidad de que su precisión aumente en un futuro próximo.
¿Cuáles son algunos ejemplos de detectores de IA?
Hoy en día, hay una amplia gama de detectores de IA disponibles en el mercado. GPTZero, Copyleaks, Scribbr, Undetectable AI y Turnitin ofrecen soluciones para detectar contenidos generados por IA. La precisión general de cada uno varía.
Estas herramientas también están diseñadas para diferentes casos de uso. Por ejemplo, GPTZero está entrenada para analizar la escritura de los estudiantes y la prosa académica para identificar contenidos creados con ChatGPT4 o GPT-4o.
Otras herramientas, como Copyleaks, ofrecen un enfoque de comprobación de contenidos más híbrido que ayuda a las instituciones educativas y empresariales con funciones nativas de detección de plagio.
¿Cómo debo responder al contenido generado por IA?
El contenido generado por IA no es necesariamente malo en sí mismo, por lo que corresponde a cada organización e institución evaluar si el uso de IA en un determinado contexto (y hasta cierto punto) indica mala conducta o deshonestidad.
Por ejemplo, si un estudiante utiliza ChatGPT para escribir una redacción y hacerla pasar por su propio trabajo, esto es un signo de mala conducta y de intención de engañar al corrector.
En última instancia, si un usuario tiene una puntuación de detección de IA o plagio inferior al 15%, entonces se considera generalmente aceptable para que la redacción se considere un trabajo original.
Referencias
- Turnitin AI Detection Rates: 3.3% of 65M Papers Reviewed Were Flagged as Majority AI Writing (Campus Technology)
- Nearly 50 news websites are ‘AI-generated’, a study says. Would I be able to tell? (The Guardian)
- Originality AI Plagiarism and Fact Checker (Originality.ai)
- Testing Turnitin’s New AI Detector: How Accurate Is It? (BestColleges)
- GPTZero Official Website (GPTZero)
- Copyleaks Official Website (Copyleaks)
- Scribbr Official Website (Scribbr)
- Undetectable AI Officlal Website (Undetectable AI)
- What Is The Percentage Of Plagiarism Allowed On Turnitin?