Los chatbots de IA muestran una gran creatividad, pero los humanos aún brillan en la prueba de pensamiento divergente

En un estudio innovador, los investigadores han descubierto la intrigante dinámica entre la creatividad humana y la inteligencia artificial (IA). Si bien los chatbots de IA, especialmente ChatGPT4, demostraron una creatividad excepcional, no superaron consistentemente a los participantes humanos más creativos. En cambio, los humanos mostraron una gama más amplia de potencial creativo, potencialmente relacionado con variaciones en las funciones ejecutivas y los procesos cognitivos.
Tradicionalmente, la creatividad se ha considerado un rasgo distintivo del ser humano, arraigado en procesos cognitivos complejos como la imaginación, el conocimiento y la capacidad de conectar conceptos aparentemente no relacionados. Sin embargo, a medida que la tecnología de la IA continúa avanzando, se ha vuelto cada vez más evidente que las máquinas poseen la capacidad de producir resultados creativos que rivalizan, y en ocasiones incluso superan, los logros humanos.
La autora del estudio, Simone Grassini, profesora asociada de la Universidad de Bergen, destacó la naturaleza transformadora de la era actual en IA y inteligencia artificial. Hizo hincapié en la necesidad de seguir investigando cómo las personas perciben las máquinas y hasta qué punto las máquinas pueden imitar las capacidades humanas.
Evaluar la creatividad con la tarea de usos alternativos.
Los investigadores llevaron a cabo su estudio utilizando la Tarea de Usos Alternativos (AUT), una evaluación de la creatividad ampliamente reconocida. En esta tarea, tanto los participantes humanos como los chatbots de IA tuvieron la tarea de generar usos únicos y creativos para objetos comunes como una cuerda, una caja, un lápiz y una vela. A los participantes humanos se les dio 30 segundos para generar tantas ideas creativas como fuera posible, mientras que a los chatbots se les indicó que produjeran una cantidad específica de ideas usando solo de 1 a 3 palabras por respuesta. Cada chatbot se sometió a pruebas 11 veces.
El estudio incluyó tres chatbots de IA: ChatGPT3, ChatGPT4 y Copy.Ai, junto con un grupo de 256 participantes humanos reclutados en la plataforma en línea Prolific. Los participantes humanos, todos hablantes nativos de inglés, tenían una edad promedio de 30,4 años, con un rango de 19 a 40 años.
Dos enfoques para evaluar la creatividad
Los investigadores emplearon dos enfoques distintos para evaluar la creatividad tanto en humanos como en chatbots de IA. Puntuaciones de distancia semántica: este método automatizado midió la originalidad de las respuestas midiendo qué tan diferentes eran de los usos comunes o esperados de los objetos.
Calificaciones subjetivas de la creatividad: Seis evaluadores humanos, sin saber qué respuestas generaba la IA, evaluaron la creatividad de las ideas en una escala de 5 puntos.
Los chatbots con IA destacan en la evaluación de la creatividad
Los hallazgos del estudio revelaron que los chatbots de IA, en particular ChatGPT3 y ChatGPT4, lograron consistentemente puntuaciones de distancia semántica más altas en comparación con los humanos. Esto indicó que produjeron respuestas más originales y menos convencionales que las de los participantes humanos. Además, los evaluadores humanos calificaron a los chatbots de IA, particularmente ChatGPT4, como más creativos en promedio que los participantes humanos.
Sin embargo, es fundamental tener en cuenta que, si bien los chatbots de IA funcionaron excepcionalmente bien, no superaron sistemáticamente a los participantes humanos más creativos. En algunos casos, individuos altamente creativos entre los participantes humanos pudieron competir con la IA para generar respuestas novedosas e imaginativas.
Grassini enfatizó la importancia de no sobreestimar las implicaciones del éxito de la IA en esta tarea de creatividad específica para trabajos complejos del mundo real que involucran creatividad. Imaginó un futuro en el que los chatbots de IA ayudarían a los humanos en sus funciones creativas en lugar de reemplazarlos por completo.
Entre los chatbots de IA, ChatGPT4 se destacó como el más creativo al considerar calificaciones subjetivas. Aunque no superó consistentemente a otros modelos de IA cuando se evaluó utilizando un algoritmo para medir la distancia semántica, recibió consistentemente puntuaciones de creatividad más altas por parte de evaluadores humanos.
Limitaciones y direcciones futuras
Los hallazgos del estudio se limitan a un tipo de comportamiento creativo y pueden no ser ampliamente aplicables a la creatividad como fenómeno complejo. Además, comparar la creatividad a nivel de proceso entre humanos y chatbots sigue siendo un desafío debido a la naturaleza opaca de los procesos internos de los chatbots.
Grassini señaló que es posible que los chatbots no muestren creatividad de la misma manera que los humanos, dependiendo potencialmente de respuestas memorizadas en lugar de la capacidad de generar ideas creativas. Dada la arquitectura de estos modelos, sigue siendo imposible comprender completamente sus procesos creativos.