Merkeziyetsizlik AI eğitiminin öncü keşifleri: Prime Intellect'ten INTELLECT-2'ye

Crypto AI'nın Kutsal Kâsesi: Merkeziyetsizlikte Eğitimdeki Sınırları Zorlama

AI'nin tam değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engelleri olan aşamadır; bu, modelin yetenek sınırını ve gerçek uygulama etkisini doğrudan belirler. Çıkarım aşamasındaki hafif çağrılarla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir; bu, AI sisteminin inşasında gerçek bir "ağır sanayi"dir. Mimari paradigma açısından, eğitim yöntemleri dört türe ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede özellikle tartışılan Merkeziyetsizlik eğitimi.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetme

Merkeziyetsiz eğitim, tek bir kurumun yerel yüksek performanslı kümeler içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir. Donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilen bir şekilde çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır. Özellikle GPT, Gemini gibi büyük ölçekli modellerin eğitimine çok uygundur ve yüksek verimlilik, kaynak kontrolü gibi avantajlara sahiptir; ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da beraberinde getirir.

Dağıtık eğitim, günümüz büyük model eğitiminde ana akım bir yöntemdir. Temelinde, model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve işbirliği içinde gerçekleştirilmesi yatar. Bu, tek makine hesaplama ve depolama darboğazlarını aşmamızı sağlar. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilen, planlanan ve senkronize edilen bir yapıdadır. Genellikle yüksek hızlı yerel alan ağları ortamında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevlerin koordinasyonunu sağlar. Ana akım yöntemler şunları içerir:

  • Veri paralelliği: Her düğüm farklı veri parametreleri eğitir, model ağırlıklarının eşleşmesi gerekir
  • Model paralelliği: Modelin farklı bölümlerini farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlama
  • Boru Hattı Paralelliği: Aşamalı Seri İcra, Verimliliği Artırma
  • Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölerek paralel parçaları artırma

Dağıtık eğitim, "Merkeziyetsizlik + Dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını görevi tamamlamak için koordine etmesine benzer. Şu anda neredeyse tüm ana akım büyük modeller (GPT-4, Gemini, LLaMA gibi ) bu yöntemle eğitim tamamlamaktadır.

Merkeziyetsizlik eğitimi, daha açık ve sansüre karşı dayanıklı bir gelecek yolu temsil eder. Temel özelliği, birbiriyle güvenmeyen çok sayıda düğümün ( ev bilgisayarları, bulut GPU'ları veya kenar cihazları ) merkezi bir koordinatör olmadan eğitim görevlerini iş birliği içinde tamamlamasıdır; genellikle görev dağıtımı ve iş birliğini sağlamak için protokollerle yönlendirilir ve katkının dürüstlüğünü sağlamak için şifreleme teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:

  • Cihaz heterojenliği ve parçalama zorluğu: Heterojen cihazların koordine edilmesi zor, görev parçalama verimliliği düşük
  • İletişim verimliliği darboğazı: Ağ iletişimi kararsız, gradyan senkronizasyonu darboğazı belirgin
  • Güvenilir yürütme eksikliği: Güvenilir yürütme ortamının olmaması, düğümlerin gerçekten hesaplamaya katılıp katılmadığını doğrulamayı zorlaştırır.
  • Birlikte Koordinasyon Eksikliği: Merkezi bir denetleyici yok, görev dağıtımı ve anormal geri alma mekanizması karmaşık.

Merkeziyetsizlik eğitimi, global olarak bir araya gelen gönüllülerin, her birinin hesaplama gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir; ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsiz eğitim" hala sistematik bir mühendislik zorluğu olarak kalmakta, sistem mimarisi, iletişim protokolleri, kriptografik güvenlik, ekonomik mekanizmalar, model doğrulaması gibi birçok alanı içermektedir; ancak "etkili iş birliği + dürüstlük teşviki + doğru sonuçlar" sağlanabilir mi, bu hala erken prototip keşif aşamasındadır.

Federe öğrenme, dağıtık ve Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasına, model parametrelerinin merkezi olarak toplanmasına vurgu yapar ve mahremiyet uyumuna önem veren senaryolar için uygundur, örneğin sağlık, finans (. Federe öğrenme, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahipken, aynı zamanda Merkeziyetsizlik eğitimindeki veri dağıtım avantajlarını da taşır. Ancak yine de güvenilir bir koordinatör tarafına bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Mahremiyet uyum senaryolarında "kontrollü Merkeziyetsizlik" çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından oldukça ılımlıdır ve endüstri için geçiş aşaması dağıtım mimarisi olarak daha uygundur.

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları])https://img-cdn.gateio.im/webp-social/moments-a8004f094fff74515470052b3a24617c.webp(

Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları

Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türlerine uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvenilmeyen düğümler arasında verimli bir şekilde tamamlanması zorlaşır. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine bağımlıdır, açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamalarının güçlü olduğu görevler ) gibi tıbbi, finansal, gizli veri ( yasal uyum ve etik kısıtlamalar nedeniyle açılamaz ve paylaşılamaz; ve işbirliği teşvik temeli olmayan görevler ) gibi kurumsal kapalı kaynak model veya iç prototip eğitimi ( dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek kısıtlamalarını oluşturmaktadır.

Ancak bu, merkeziyetsizlik eğitiminin bir safsata olduğu anlamına gelmez. Aslında, yapısal olarak hafif, kolayca paralel hale getirilebilen ve teşvik edici görev türlerinde merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Buna, ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri ) gibi RLHF, DPO (, veri toplama eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazlarının katıldığı işbirlikçi eğitim senaryoları dahildir. Bu görevler genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir, bu nedenle P2P ağları, Swarm protokolü, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitimi Üzerine Önceki Keşifler])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(

Merkeziyetsizlik Eğitim Klasik Proje Analizi

Şu anda merkeziyetsizlik eğitim ve federasyon öğrenimi öncülük alanında, temsil niteliğinde olan blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermektedir ve mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise nispeten net olup, başlangıç mühendislik ilerlemeleri gözlemlenebilmektedir. Bu makalede, bu beş projenin arkasındaki temel teknolojiler ve mühendislik mimarisi sırasıyla analiz edilecek ve merkeziyetsizlik AI eğitim sistemi içindeki farklılıkları ve tamamlayıcı ilişkileri daha da derinlemesine tartışılacaktır.

) Prime Intellect: Eğitim izleri doğrulanabilir pekiştirmeli öğrenme işbirlikçi ağ öncüsü

Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır, böylece herkes eğitim süreçlerine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST adlı üç ana modül aracılığıyla, doğrulanabilir, açık ve teşvik mekanizması eksiksiz bir AI Merkeziyetsizlik eğitim sistemi kurmayı hedeflemektedir.

01, Prime Intellect protokol yığını yapısı ve ana modül değeri

![Crypto AI'nın Kutsal Kâsesi: Merkeziyetsizlik eğitiminin öncü keşifleri]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(

)# 02, Prime Intellect eğitim ana mekanizmalarının detaylı açıklaması

#PRIME-RL:Decoupled Asynchronous Reinforcement Learning Task Architecture

PRIME-RL, merkeziyetsiz eğitim senaryoları için Prime Intellect tarafından özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve eşzamanlı katılımcılar için özel olarak tasarlanmıştır. Güçlendirme öğrenimini öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırarak, her eğitim düğümünün yerel olarak bağımsız olarak görev döngüsünü tamamlamasına olanak tanır ve standart arayüzler aracılığıyla doğrulama ve toplama mekanizmalarıyla iş birliği yapar. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL merkezi bir planlamanın olmadığı ortamlarda esnek eğitimi gerçekleştirmek için daha uygundur, hem sistem karmaşıklığını azaltır hem de çoklu görevlerin paralel olarak desteklenmesi ve strateji evrimi için bir temel oluşturur.

#TOPLOC:Ağırlıksız eğitim davranış doğrulama mekanizması

TOPLOC###Güvenilir Gözlem & Politika-yerelleştirme Kontrolü(, Prime Intellect tarafından önerilen ve bir düğümün gözlem verilerine dayalı olarak gerçekten etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan eğitim doğrulabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tüm modelin yeniden hesaplanmasına bağlı değildir, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulaması gerçekleştirir. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk mekanizmadır ve güvene dayanmayan eğitim ödül dağıtımını sağlamak için temel bir yenilik sunar, denetlenebilir ve teşvik edici merkeziyetsiz işbirlikçi eğitim ağlarının inşası için uygulanabilir bir yol sunar.

#SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü

SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve toplama protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumunun değişken olduğu gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ve yerel senkronizasyon stratejilerini birleştirerek, birden fazla düğümün senkronize olmayan durumlarda sürekli olarak kısmi güncellemeler göndermesine izin verir, ağırlıkların kademeli yakınsaması ve çoklu versiyon evrimi sağlanır. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, Merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır, kararlı ağırlık konsensüsü ve sürekli eğitim yinelemeleri oluşturmanın temel temelidir.

#OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi

OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo konseptini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsiz eğitimde yaygın olarak karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model işbirliği eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti tolerans mekanizması ile birleştirildiğinde, OpenDiLoCo, tüketici düzeyindeki GPU’ların ve kenar cihazlarının eğitim görevlerine de istikrarlı bir şekilde katılabilmesini sağlar, bu da küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırır ve merkeziyetsiz eğitim ağlarının temel iletişim altyapılarından biri haline gelir.

#PCCL: İşbirliği İletişim Kütüphanesi

PCCL)Prime Collective Communication Library(, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir. Bu kütüphane, geleneksel iletişim kütüphanelerinin ), NCCL, Gloo( gibi heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi hedeflemektedir. PCCL, seyrek topolojiyi, gradyan sıkıştırmayı, düşük hassasiyet senkronizasyonunu ve kesinti kurtarmayı destekler; tüketici sınıfı GPU'lar ve istikrarsız düğümler üzerinde çalışabilir. OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağlarının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güven gerektirmeyen işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını sağlamak için bir yol açmaktadır.

)# 03, Prime Intellect teşvik ağı ve rol dağılımı

Prime Intellect, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Bu sayede herkes görevlerde yer alabilir ve gerçek katkılara dayalı ödüller kazanabilir. Protokol, üç ana rol üzerine çalışmaktadır:

  • Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
  • Eğitim düğümü: Yerel eğitimi gerçekleştirme, ağırlık güncellemelerini ve gözlem izlerini gönderme
  • Doğrulama Düğümleri: Eğitim davranışının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanın ve ödül hesaplaması ve strateji birleştirmesine katılın.

Protokolün temel süreci, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ###SHARDCAST( ve ödül dağıtımını içerir, "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturur.

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik ile Eğitimdeki Sınırları Zorlamak])https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(

)# 04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması

Prime Intellect, 2025 yılı Mayıs ayında, asenkron, güvene ihtiyaç duymayan Merkeziyetsizlik düğümleri ile işbirliği içerisinde eğitim gören dünyanın ilk güçlendirilmiş öğrenme büyük modelini INTELLECT-2 olarak tanıttı. INTELLECT-2 modeli, üç kıtada bulunan 100'den fazla GPU heterojen düğümlerinin işbirliği ile tamamlandı.

PRIME-1.66%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 4
  • Repost
  • Share
Comment
0/400
GasFeeVictimvip
· 08-13 18:22
Yine bir Rug Pull projesi.
View OriginalReply0
TokenRationEatervip
· 08-13 05:29
Bilgi İşlem Gücü neredeyse yeni aldığım 3090'ı yakacak.
View OriginalReply0
SigmaBrainvip
· 08-13 05:05
Sıvı gibi ve değerli öngörüler
View OriginalReply0
just_another_fishvip
· 08-13 05:02
Teknoloji devleri tarafından sürekli olarak sömürüleceğiz.
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)