- QVAC Genesis II расширяется до 148B токенов, увеличивая масштаб открытых образовательных наборов данных по искусственному интеллекту.
- Рассуждение на уровне вариантов повышает ясность ИИ, анализируя правильные и неправильные решения.
- Релиз с открытым доступом поддерживает децентрализованный ИИ, позволяя глобальным исследованиям без ограничений.
Tether расширила свою деятельность в области открытых исследований искусственного интеллекта, выпустив QVAC Genesis II — значительное обновление программы синтетических образовательных данных. Через своё подразделение по исследованиям данных и искусственного интеллекта QVAC компания расширила свой публичный набор данных до 148 миллиардов токенов. Это расширение позиционирует проект как крупнейший открытый синтетический образовательный набор данных для предварительного обучения ИИ.
Обновление отражает более широкие усилия по улучшению того, как системы ИИ учатся рассуждениям, а не только языковым шаблонам. Вместо того чтобы гоняться только за масштабом, инициатива делает акцент на структурированном обучении и ясности принятия решений. В результате исследователи теперь получают доступ к более глубоким и разнообразным учебным материалам в различных областях высшего образования.
Расширение набора данных сосредоточено на глубине рассуждения
QVAC Genesis II добавляет 107 миллиардов токенов и расширяет охват до 19 академических доменов. Помимо прежних STEM-предметов, в набор данных теперь входят информатика, химия, статистика, машинное обучение, астрономия, география и эконометрика. Команда также воссоздала материал по физике на уровне колледжа, используя усовершенствованные методы генерации.
Таким образом, набор данных теперь отражает более сильное логическое развитие и академическую строгость. Каждая область нацелена на понимание концепции, а не на запоминание. Кроме того, направлен на снижение неоднозначности в ответах ИИ, закрепляя чёткие пути рассуждения.
Новый метод усиливает образовательную ценность
Релиз вводит метод рассуждения на уровне опциона — новый метод генерации данных. Этот подход оценивает каждый возможный вариант ответа в вопросах с несколькими вариантами ответа. Она объясняет, почему правильные ответы успешны, а неправильные — нет. Кроме того, он напрямую решает распространённые заблуждения, содержащиеся в данных.
Этот метод работает параллельно с более ранним фреймворком анализа отказов. Вместе они гарантируют, что каждый обучающий пример приносит образовательную ценность. Независимые тесты показывают, что модели, обученные на Genesis II, дают более чёткие объяснения и более высокую точность рассуждения.
Открытый доступ поддерживает децентрализованные исследования ИИ
QVAC выпустила расширенный набор данных под лицензией Creative Commons Attribution–Non-Commercial. Это решение поддерживает академических исследователей и независимых разработчиков по всему миру. Примечательно, что набор данных остаётся свободным от собственных ограничений, которые доминируют в коммерческом обучении ИИ.
Стратегия Tether соответствует более широкой цели — продвижению децентрализованных и локальных систем ИИ. Укрепляя основы открытых данных, компания стремится снизить барьеры для инноваций. Таким образом, разработчики могут обучать надёжные модели без использования централизованной облачной инфраструктуры.
Связано: Компании, связанные с Tether, покупают пиковый майнинг Northern Data за $200 млн
Disclaimer: The information presented in this article is for informational and educational purposes only. The article does not constitute financial advice or advice of any kind. Coin Edition is not responsible for any losses incurred as a result of the utilization of content, products, or services mentioned. Readers are advised to exercise caution before taking any action related to the company.