- QVAC Genesis II se expande a 148 mil millones de tokens, impulsando la escala de conjuntos de datos educativos abiertos de IA.
- El razonamiento a nivel de opción mejora la claridad de la IA al analizar las elecciones correctas e incorrectas.
- La versión de acceso abierto soporta la IA descentralizada, permitiendo la investigación global sin restricciones.
Tether ha ampliado su impulso hacia la investigación abierta en inteligencia artificial con el lanzamiento de QVAC Genesis II, una importante mejora de su programa de datos educativos sintéticos. A través de su área de investigación en datos e IA, QVAC, la compañía amplió su conjunto de datos público hasta 148.000 millones de tokens. Esta expansión posiciona al proyecto como el mayor conjunto de datos educativo sintético disponible para el preentrenamiento en IA.
La actualización refleja un esfuerzo más amplio para mejorar cómo los sistemas de IA aprenden el razonamiento, no solo los patrones del lenguaje. En lugar de perseguir solo la escala, la iniciativa enfatiza el aprendizaje estructurado y la claridad de decisiones. En consecuencia, los investigadores ahora acceden a materiales formativos más profundos y diversos en distintas disciplinas de educación superior.
La expansión de conjuntos de datos se centra en la profundidad del razonamiento
QVAC Genesis II añade 107.000 millones de tokens y amplía su cobertura a 19 dominios académicos. Además de las asignaturas STEM anteriores, el conjunto de datos ahora incluye informática, química, estadística, aprendizaje automático, astronomía, geografía y econometría. El equipo también reconstruyó contenido de física a nivel universitario utilizando técnicas de generación mejoradas.
Por tanto, el conjunto de datos refleja ahora una progresión lógica más fuerte y un rigor académico más fuerte. Cada dominio se centra en la comprensión conceptual más que en la memorización. Además, el conjunto de datos pretende reducir la ambigüedad en las respuestas de la IA reforzando caminos de razonamiento claros.
Nuevo método fortalece el valor educativo
La versión introduce el Razonamiento a Nivel de Opción, un nuevo método de generación de datos. Este enfoque evalúa todas las posibles opciones de respuesta en preguntas de opción múltiple. Explica por qué las respuestas correctas tienen éxito y por qué las incorrectas fallan. Además, aborda los conceptos erróneos comunes directamente dentro de los datos.
Este método funciona junto con el marco anterior de Análisis de Fallas. Juntos, se aseguran de que cada ejemplo de formación aporte valor didáctico. Pruebas independientes muestran que los modelos entrenados en Génesis II ofrecen explicaciones más claras y mayor precisión de razonamiento.
El acceso abierto apoya la investigación en IA descentralizada
QVAC publicó el conjunto de datos ampliado bajo una licencia Creative Commons Atribución–No Comercial. Esta decisión apoya a investigadores académicos y desarrolladores independientes de todo el mundo. De manera significativa, el conjunto de datos sigue libre de restricciones propietarias que dominan el entrenamiento comercial de IA.
La estrategia de Tether está alineada con su objetivo más amplio de promover sistemas de IA descentralizados y locales. Al fortalecer las bases de los datos abiertos, la empresa pretende reducir las barreras a la innovación. En consecuencia, los desarrolladores pueden entrenar modelos fiables sin depender de una infraestructura centralizada en la nube.
Relacionado: Empresas vinculadas a Tethers compran la minería máxima de Northern Data por 200 millones de dólares
Disclaimer: The information presented in this article is for informational and educational purposes only. The article does not constitute financial advice or advice of any kind. Coin Edition is not responsible for any losses incurred as a result of the utilization of content, products, or services mentioned. Readers are advised to exercise caution before taking any action related to the company.