Tether expande dados abertos de treinamento de IA com QVAC Genesis II

Tether expande dados abertos de treinamento em IA com o lançamento do QVAC Genesis II

Last Updated:
Tether expande dados abertos de treinamento de IA com QVAC Genesis II
  • O QVAC Genesis II expande para 148 bilhões de tokens, impulsionando a escala de conjunto de dados educacional abertos de IA.
  • O Raciocínio em Nível de Opção melhora a clareza da IA ao analisar escolhas corretas e erradas.
  • A versão de acesso aberto suporta IA descentralizada, possibilitando pesquisas globais sem restrições.

A Tether expandiu seu impulso para pesquisas abertas em inteligência artificial com o lançamento do QVAC Genesis II, uma grande atualização em seu programa de dados educacionais sintéticos. Por meio de seu braço de pesquisa em dados e IA, o QVAC, a empresa expandiu seu conjunto de dados público para 148 bilhões de tokens. Essa expansão posiciona o projeto como o maior conjunto de dados educacional sintético disponível abertamente para pré-treinamento de IA.

A atualização reflete um esforço mais amplo para melhorar como os sistemas de IA aprendem raciocínio, não apenas padrões de linguagem. Em vez de buscar apenas a escala, a iniciativa enfatiza o aprendizado estruturado e a clareza nas decisões. Consequentemente, os pesquisadores agora têm acesso a materiais de treinamento mais profundos e diversificados em diversas disciplinas do ensino superior.

A expansão do conjunto de dados foca na profundidade do raciocínio

O QVAC Genesis II adiciona 107 bilhões de tokens e amplia a cobertura para 19 domínios acadêmicos. Além das disciplinas STEM anteriores, o conjunto de dados agora inclui ciência da computação, química, estatística, aprendizado de máquina, astronomia, geografia e econometria. A equipe também reconstruiu conteúdo de física em nível universitário usando técnicas aprimoradas de geração.

Portanto, o conjunto de dados agora reflete uma progressão lógica mais forte e rigor acadêmico. Cada domínio foca na compreensão de conceitos, em vez da memorização. Além disso, o conjunto de dados visa reduzir a ambiguidade nas respostas da IA reforçando caminhos claros de raciocínio.

Novo método fortalece o valor educacional

O lançamento introduz o Reasoning em Nível de Opção (Option-Level Reasoning), um novo método de geração de dados. Essa abordagem avalia todas as possíveis opções de resposta em perguntas de múltipla escolha. Explica por que as respostas corretas têm sucesso e por que as incorretas falham. Além disso, ele aborda equívocos comuns diretamente nos dados.

Esse método funciona em conjunto com o framework anterior de Análise de Falhas. Juntos, garantem que cada exemplo de treinamento traga valor instrucional. Testes independentes mostram que modelos treinados no Gênesis II oferecem explicações mais claras e maior precisão de raciocínio.

Acesso Aberto Apoia Pesquisa em IA Descentralizada

O QVAC lançou o conjunto de dados expandido sob uma licença Creative Commons Atribuição–Não Comercial. Essa decisão apoia pesquisadores acadêmicos e desenvolvedores independentes em todo o mundo. Significativamente, o conjunto de dados permanece livre de restrições proprietárias que dominam o treinamento comercial de IA.

A estratégia da Tether está alinhada com seu objetivo mais amplo de promover sistemas de IA descentralizados e locais. Ao fortalecer as bases de dados abertos, a empresa busca reduzir as barreiras à inovação. Consequentemente, os desenvolvedores podem treinar modelos confiáveis sem depender de uma infraestrutura centralizada em nuvem.

Relacionado: Empresas vinculadas ao cabo compram o pico de mineração da Northern Data por US$ 200 milhões

Disclaimer: The information presented in this article is for informational and educational purposes only. The article does not constitute financial advice or advice of any kind. Coin Edition is not responsible for any losses incurred as a result of the utilization of content, products, or services mentioned. Readers are advised to exercise caution before taking any action related to the company.


CoinStats ad