Acabamos de lanzar SimpleQA Verified en Hugging Face 👀
Un estándar de factualidad de 1,000 prompts diseñado para evaluar el conocimiento y las capacidades de razonamiento de los LLM.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Acabamos de lanzar SimpleQA Verified en Hugging Face 👀
Un estándar de factualidad de 1,000 prompts diseñado para evaluar el conocimiento y las capacidades de razonamiento de los LLM.