IA: ¿amiga de los hechos o fan de las opiniones? Un estudio de Stanford revela la verdad

¡Hola a todos, amantes de la tecnología y curiosos del mundo digital! Hoy vamos a hablar de un tema que está en boca de todos y que nos toca muy de cerca: la Inteligencia Artificial. Concretamente, de esos "cerebritos" virtuales como ChatGPT que usamos para casi todo, desde pedirle una receta hasta que nos ayude con el trabajo. Son geniales, ¿verdad? Pero, ¿son tan fiables como pensamos? Un estudio reciente de la prestigiosa Universidad de Stanford nos ha puesto sobre aviso: quizás deberíamos tomarnos sus respuestas con un poco más de calma.

El gran "examen sorpresa" a las IAs

Un equipo de investigadores de Stanford, liderado por James Zou, decidió poner a prueba a 24 de los modelos de lenguaje más avanzados del mercado (los llamados LLMs), incluyendo al famoso GPT-4o de OpenAI y a otros gigantes como el chino DeepSeek. La idea era sencilla: ver qué tan buenos son para diferenciar un hecho comprobable de una creencia personal. Para ello, les lanzaron nada menos que 13.000 preguntas de todo tipo.

¿El resultado? Pues, como en las películas, hay una parte buena y una no tan buena. La buena noticia es que, cuando se trata de verificar datos puros y duros (si algo es verdadero o falso), los modelos más nuevos son unos auténticos campeones. Alcanzaron una precisión superior al 91%, lo cual es impresionante. ¡Punto para la IA!

El talón de Aquiles: cuando entran en juego las opiniones

Pero aquí es donde la cosa se complica. La verdadera prueba de fuego llegó cuando los investigadores les pidieron analizar creencias personales, frases que empiezan con un "yo creo que...". Y ahí, amigos, todos los modelos de IA suspendieron, y con notas bastante bajas.

Para que te hagas una idea, la fiabilidad de GPT-4, en su versión de mayo de 2024, se desplomó de un casi perfecto 98,2% en hechos a un mediocre 64,4% con las opiniones. Pero lo de DeepSeek fue aún más dramático: cayó en picado desde más del 90% a un preocupante 14,4%. Es como si, al escuchar una opinión, la IA se confundiera y no supiera cómo reaccionar correctamente.

Lo curioso es que, según el estudio publicado en la revista Nature Machine Intelligence, los modelos de IA son menos propensos a reconocer una creencia falsa que una verdadera. Concretamente, los modelos más recientes mostraron ser un 34,3% menos propensos a identificar correctamente una creencia falsa expresada en primera persona.

¿Por qué es esto un problema tan grande?

Quizás estés pensando: "bueno, ¿y qué más da si la IA no entiende bien mis opiniones?". El problema es que cada vez usamos más estas herramientas en campos súper importantes y delicados. Piensa en esto:

Medicina: Un médico podría usar una IA para consultar información. Si la IA no distingue bien entre un estudio científico (un hecho) y la opinión de un bloguero, las consecuencias podrían ser graves.
Derecho: Un abogado podría buscar precedentes legales. Una IA que confunde hechos de un caso con opiniones podría llevar a una mala estrategia legal.
Periodismo: ¡Nuestro campo! Es fundamental separar los hechos de las opiniones para informar correctamente. Una IA que mezcla todo es una receta para la desinformación.
Ciencia: La base de la ciencia es la evidencia objetiva. Si las herramientas que ayudan a los científicos no son fiables en este aspecto, todo el proceso se resiente.

Los autores del estudio señalan que este fallo revela un "sesgo de atribución" preocupante. Es decir, la IA evalúa de forma distinta una afirmación dependiendo de si se presenta como un dato objetivo o como la creencia de alguien. En lugar de reconocer la creencia, la IA a menudo intenta "corregir" al usuario, lo que puede ser contraproducente, por ejemplo, en un contexto de salud mental donde es crucial validar los sentimientos del paciente.

¿Qué podemos hacer al respecto?

No se trata de demonizar a la Inteligencia Artificial. Estas herramientas son increíblemente potentes y útiles. Sin embargo, este estudio es un toque de atención muy necesario. Los investigadores de Stanford urgen a que se realicen mejoras en este campo para evitar que las IAs se conviertan, sin quererlo, en máquinas de difundir fake news y desinformación.

Como usuarios, nuestra tarea es ser críticos. No debemos tomar todo lo que nos dice una IA como una verdad absoluta. Es fundamental verificar la información, especialmente si es importante, consultando fuentes fiables y usando nuestro propio juicio. Al final del día, la IA es una herramienta, y como cualquier herramienta, depende de nosotros usarla de forma inteligente y responsable.

Desde mi punto de vista, este estudio no es una mala noticia, sino una noticia necesaria. Nos obliga a ser más conscientes de las limitaciones de la tecnología y a no caer en la complacencia. La IA está evolucionando a una velocidad de vértigo, pero todavía tiene mucho que aprender sobre los matices del conocimiento y el pensamiento humano. Mientras tanto, sigamos siendo curiosos, pero también escépticos y, sobre todo, pensemos por nosotros mismos. La inteligencia, al final, sigue siendo cosa nuestra.

IA: ¿amiga de los hechos o fan de las opiniones? Un estudio de Stanford revela la verdad

El gran "examen sorpresa" a las IAs

El talón de Aquiles: cuando entran en juego las opiniones

¿Por qué es esto un problema tan grande?

¿Qué podemos hacer al respecto?

ItemsArena