- QVAC Genesis II s’étend à 148 milliards de tokens, augmentant ainsi l’échelle des ensembles de données éducatives ouvertes en IA.
- Le raisonnement au niveau des options améliore la clarté de l’IA en analysant les choix corrects et incorrects.
- La version en libre accès prend en charge l’IA décentralisée, permettant la recherche mondiale sans restrictions.
Tether a élargi son orientation vers la recherche ouverte en intelligence artificielle avec la sortie de QVAC Genesis II, une amélioration majeure de son programme de données éducatives synthétiques. Grâce à sa branche de recherche en données et en IA, QVAC, l’entreprise a étendu son jeu de données public à 148 milliards de tokens. Cette expansion positionne le projet comme le plus grand jeu de données éducatif synthétique ouvertement disponible pour la pré-formation de l’IA.
Cette mise à jour reflète un effort plus large visant à améliorer la façon dont les systèmes d’IA apprennent le raisonnement, et pas seulement les schémas de langage. Au lieu de poursuivre uniquement l’échelle, l’initiative met l’accent sur l’apprentissage structuré et la clarté des décisions. Par conséquent, les chercheurs ont désormais accès à des supports de formation plus approfondis et plus diversifiés dans les disciplines de l’enseignement supérieur.
L’extension des jeux de données se concentre sur la profondeur du raisonnement
QVAC Genesis II ajoute 107 milliards de tokens et étend sa couverture à 19 domaines académiques. Outre les matières STEM antérieures, le jeu de données comprend désormais l’informatique, la chimie, les statistiques, l’apprentissage automatique, l’astronomie, la géographie et l’économétrie. L’équipe a également reconstruit le contenu de physique de niveau universitaire en utilisant des techniques de génération améliorées.
Ainsi, le jeu de données reflète désormais une progression logique plus forte et une rigueur académique plus forte. Chaque domaine vise la compréhension des concepts plutôt que la mémorisation. De plus, ce jeu de données vise à réduire l’ambiguïté dans les réponses de l’IA en renforçant des chemins de raisonnement clairs.
Nouvelle méthode renforce la valeur éducative
La version introduit le raisonnement au niveau des options, une nouvelle méthode de génération de données. Cette approche évalue chaque choix de réponse possible dans les questions à choix multiples. Cela explique pourquoi les bonnes réponses réussissent et pourquoi les incorrectes échouent. De plus, elle aborde les idées fausses courantes directement présentes dans les données.
Cette méthode fonctionne parallèlement au cadre antérieur d’analyse des défaillances. Ensemble, ils veillent à ce que chaque exemple d’entraînement apporte une valeur pédagogique. Des tests indépendants montrent que les modèles entraînés sur Genesis II offrent des explications plus claires et une précision de raisonnement plus élevée.
L’accès libre soutient la recherche en IA décentralisée
QVAC a publié l’ensemble de données étendu sous une licence Creative Commons Attribution–NonCommercial. Cette décision soutient les chercheurs universitaires et les développeurs indépendants à travers le monde. Fait significatif, le jeu de données reste exempt de restrictions propriétaires qui dominent l’entraînement commercial de l’IA.
La stratégie de Tether s’inscrit dans son objectif plus large de promotion de systèmes d’IA décentralisés et locaux. En renforçant les bases des données ouvertes, l’entreprise vise à réduire les barrières à l’innovation. Par conséquent, les développeurs peuvent entraîner des modèles fiables sans dépendre d’une infrastructure cloud centralisée.
Disclaimer: The information presented in this article is for informational and educational purposes only. The article does not constitute financial advice or advice of any kind. Coin Edition is not responsible for any losses incurred as a result of the utilization of content, products, or services mentioned. Readers are advised to exercise caution before taking any action related to the company.