- QVAC Genesis II diperluas ke 148B token, meningkatkan skala kumpulan data pendidikan AI terbuka.
- Penalaran Tingkat Opsi meningkatkan kejelasan AI dengan menganalisis pilihan yang benar dan salah.
- Rilis akses terbuka mendukung AI terdesentralisasi, memungkinkan penelitian global tanpa batasan.
Tether telah memperluas dorongannya ke dalam penelitian kecerdasan buatan terbuka dengan merilis QVAC Genesis II, peningkatan besar untuk program data pendidikan sintetisnya. Melalui cabang penelitian data dan AI, QVAC, perusahaan memperluas kumpulan data publiknya menjadi 148 miliar token. Ekspansi ini memposisikan proyek ini sebagai kumpulan data pendidikan sintetis terbesar yang tersedia secara terbuka untuk pra-pelatihan AI.
Pembaruan ini mencerminkan upaya yang lebih luas untuk meningkatkan cara sistem AI mempelajari penalaran, bukan hanya pola bahasa. Alih-alih mengejar skala saja, inisiatif ini menekankan pembelajaran terstruktur dan kejelasan keputusan. Akibatnya, para peneliti sekarang mendapatkan akses ke materi pelatihan yang lebih dalam dan lebih beragam di seluruh disiplin ilmu pendidikan tinggi.
Perluasan Dataset Berfokus pada Kedalaman Penalaran
QVAC Genesis II menambahkan 107 miliar token dan memperluas cakupan ke 19 domain akademik. Selain mata pelajaran STEM sebelumnya, kumpulan data sekarang mencakup ilmu komputer, kimia, statistik, pembelajaran mesin, astronomi, geografi, dan ekonometrika. Tim juga membangun kembali konten fisika tingkat perguruan tinggi menggunakan teknik generasi yang ditingkatkan.
Oleh karena itu, kumpulan data sekarang mencerminkan perkembangan logis yang lebih kuat dan ketelitian akademik. Setiap domain menargetkan pemahaman konsep daripada hafalan. Selain itu, kumpulan data bertujuan untuk mengurangi ambiguitas dalam respons AI dengan memperkuat jalur penalaran yang jelas.
Metode Baru Memperkuat Nilai Pendidikan
Rilis ini memperkenalkan Penalaran Tingkat Opsi, metode pembuatan data baru. Pendekatan ini mengevaluasi setiap pilihan jawaban yang mungkin dalam pertanyaan pilihan ganda. Ini menjelaskan mengapa jawaban yang benar berhasil dan mengapa jawaban yang salah gagal. Selain itu, ini membahas kesalahpahaman umum langsung di dalam data.
Metode ini bekerja bersama dengan kerangka kerja Analisis Kegagalan sebelumnya. Bersama-sama, mereka memastikan bahwa setiap contoh pelatihan memberikan nilai instruksional. Tes independen menunjukkan bahwa model yang dilatih pada Genesis II memberikan penjelasan yang lebih jelas dan akurasi penalaran yang lebih tinggi.
Akses Terbuka Mendukung Penelitian AI Terdesentralisasi
QVAC merilis kumpulan data yang diperluas di bawah lisensi Creative Commons Attribution–NonCommercial. Keputusan ini mendukung peneliti akademis dan pengembang independen di seluruh dunia. Secara signifikan, kumpulan data tetap bebas dari batasan kepemilikan yang mendominasi pelatihan AI komersial.
Strategi Tether sejalan dengan tujuan yang lebih luas untuk mempromosikan sistem AI terdesentralisasi dan lokal. Dengan memperkuat fondasi data terbuka, perusahaan bertujuan untuk menurunkan hambatan terhadap inovasi. Akibatnya, pengembang dapat melatih model yang andal tanpa bergantung pada infrastruktur cloud terpusat.
Terkait: Perusahaan Terkait Tether Membeli Penambangan Puncak Northern Data seharga $200 juta
Disclaimer: The information presented in this article is for informational and educational purposes only. The article does not constitute financial advice or advice of any kind. Coin Edition is not responsible for any losses incurred as a result of the utilization of content, products, or services mentioned. Readers are advised to exercise caution before taking any action related to the company.