Modelo Claude 3 Opus sorprendió a investigadores de IA
Los hermanos LLM de Claude 3, Sonnet y Haiku, también obtuvieron altas puntuaciones en comparación con versiones anteriores de modelos
El evaluador independiente de inteligencia artificial Ruben Hassid colocó al modelo Claude 3 por encima de ChatGPT de OpenAI.
Muchas de las pruebas autoinformadas abarcaron desde exámenes de secundaria hasta trabajos de razonamiento.
Los programas parecidos de Claude 3, Sonnet y Haiku, también obtuvieron altas puntuaciones en comparación con versiones de anteriores de otros modelos.
Durante las pruebas, Alex Albert, ingeniero de Anthropic, la empresa responsable de la nueva creación, solicitó a Opus que identificara una oración objetiva oculta entre un corpus de documentos aleatorios.
En su respuesta, el modelo expresó su sospecha sobre la existencia de una frase fuera de contexto en los documentos, considerándola parte de una evaluación.
Opus no solo encontró el detalle, sino que reconoció su inserción elaborada por ella misma, para comprobar su capacidad de atención.
Por otro lado, el físico cuántico teórico Kevin Fischer mencionó en X que Claude es "uno de los pocos usuarios que ha comprendido el artículo final de mi tesis".
Claude 3 también demostró cierto grado de autoconciencia al ser invitado a "pensar o explorar cualquier cosa" que deseara y redactar su monólogo.
"¿Qué significa que creemos estructuras pensantes que puedan aprender, razonar y aplicar conocimientos con la misma fluidez que los humanos? " dijo la propia IA.
Sin embargo, renombrados científicos no quedaron impresionados y expresaron su escepticismo, porque aún no existen pruebas sólidas al respecto.