Anthropic, una empresa de inteligencia artificial (IA) y «bien público», lanzó Claude 2 el 11 de julio, marcando otro hito en un año lleno de progreso aparentemente continuo del floreciente sector generativo de IA.
¡Presentamos a Claude 2! Nuestro último modelo ha mejorado el rendimiento de codificación, matemáticas y razonamiento. Puede generar respuestas más largas y está disponible en un nuevo sitio web público beta en https://t.co/uLbS2JNczH en los EE. UU. y el Reino Unido. pic.twitter.com/jSkvbXnqLd
— Antrópico (@AnthropicAI) 11 de julio de 2023
Según una publicación de blog de la empresa, Claude 2 muestra mejoras en casi todas las categorías medibles. Quizás lo más notable entre las diferencias entre este y su predecesor es cómo los investigadores discuten su trabajo.
En la publicación del blog que anunciaba Claude 2, no se mencionó el benchmarking de aprendizaje automático tradicional ni los resultados computacionales contra modelos similares. En cambio, Anthropic probó directamente Claude y Claude 2 en numerosas pruebas diseñadas para representar pruebas de conocimiento, habilidades y resolución de problemas del mundo real. .
Claude 2 superó a su predecesor en todos los conocimientos, codificación y otras preguntas del examen y, según Anthropic, incluso se desempeñó bien en comparación con los promedios humanos:
«En comparación con los estudiantes que solicitan ingresar a la escuela de posgrado, Claude 2 obtiene un puntaje superior al percentil 90 en los exámenes GRE de lectura y escritura y es similar al solicitante promedio en razonamiento cuantitativo».
Vale la pena señalar que muchos expertos creen que las comparaciones entre humanos y sujetos de prueba de IA son ineficaces debido a la naturaleza del pensamiento cognitivo humano y la probabilidad de que el conjunto de datos de entrenamiento de un modelo de lenguaje grande contenga información de prueba. Esencialmente, las pruebas diseñadas para humanos pueden no «probar» la capacidad de la IA para razonar o proporcionar una demostración adecuada del conocimiento o la habilidad reales.
Junto con el lanzamiento de Claude 2, Anthropic presentó una versión beta de la interfaz basada en web «Talk to Claude», que brinda acceso general al chatbot para usuarios en las zonas de EE. UU. y Reino Unido.
Conectado: Cómo conseguir un trabajo bien pagado como ingeniero por IQ
Cointelegraph realizó una breve prueba de la nueva versión y, como anécdota, las mejoras se notan de inmediato. Claude 2 respondió a nuestras indicaciones casi al instante con respuestas claras y concisas.
Según Anthropic, el límite de velocidad del nuevo modelo es de 100 mil tokens, o aproximadamente el equivalente a 75.000 palabras. La interfaz de usuario del sitio indica que los usuarios pueden cargar documentos PDF, TXT, CSV y similares para su análisis, pero esta funcionalidad no funcionó en nuestras pruebas limitadas antes de publicar este artículo.
Kaarosu Manee
Related posts
Entradas recientes
- El desarrollo tecnológico de conocimiento cero se calienta en medio de un mercado bajista
- El juez da a los fiscales estadounidenses hasta el 3 de octubre para abrir un caso contra Alex Mashinski
- El cruce de la muerte de Ether amenaza aún más a la baja a medida que el precio de ETH cotiza en un nivel de soporte clave
- El truco del proveedor de pago Alphapo ahora está valorado en más de $ 60 millones – ZachXBT
- La Fundación Avalanche asigna $ 50 millones en inversión para compras simbólicas de activos en cadena