Kimi K2.6 Agent Sürüleri: Uzun Vadeli Orkestrasyon

Kimi K2.6, Moonshot AI'ın en yeni açık ağırlıklı modeli ve manşet parametre sayısı değil. Asıl mesele harness: Tek bir koşu 300 paralel alt-ajan doğurabiliyor ve on iki saat boyunca planı kaybetmeden 4.000 araç çağrısına kadar koordinasyon yapabiliyor. Mobil, otomasyon ve orkestrasyon ekipleri için bu, uzun vadeli agent sürülerinin bir araştırma demosu değil, varsayılan bir seçenek gibi durduğu ilk açık model. Bu rehber pratikte neyin değiştiğini ve sürü deseninin n8n, Hermes Workspace ve Sakana Conductor'un yanında nereye oturduğunu adım adım anlatıyor.

Bugün çoğu agent koşusu ilk yüz araç çağrısının ötesinde bir yerde dağılıyor. Bağlam kayıyor, planlar çürüyor, alt görevler birbirinin ayağına basıyor. Kimi K2.6 uzun vadeli problemi iki taraftan birden ele alıyor: 32B aktif parametreli ve 256K bağlam pencereli 1T parametreli bir MoE omurgası, yüzlerce izole alt-ajana işi dağıtan ve sonuçları tek bir plana geri eklemleyen bir sürü çalışma zamanıyla eşleşiyor. Model serbest bir lisans altında açık ağırlıklı; bu da otomasyon düzenlemeli bir ortama taşındığında önemli hâle geliyor.

30 Saniyelik Özet

Kimi K2.6, açık ağırlıklı bir 1T MoE modeli ve bir agent sürü harness'ı sunuyor. Tek bir koşu on iki saate uzayabiliyor, 300 paralel alt-ajana yayılabiliyor ve 4.000 koordineli araç çağrısını zincirleyebiliyor. Bugün birkaç düzine adımdan sonra çöken uzun süreli otomasyon için bu, planı sona kadar tutan ilk açık seçenek.

Kimi K2.6 Aslında Ne Getiriyor?

Kimi K2.6 tek bir model artefaktı değil. Bir model, bir harness ve uzun vade için ayarlanmış varsayılanlar topluluğu. Bir otomasyon ekibi için önemli olan parçalar:

32B aktif parametreli 1T MoE omurgası — 384 uzman, token başına 8 seçili artı 1 paylaşımlı uzman; her ileri geçiş toplam kapasiteye göre ucuz.
256K bağlam penceresi ve doğal çoklu modalite — uzun bir araç logunu, depo görüntüsünü ve ekran görüntüsü akışını aynı prompt'ta tutacak büyüklükte.
Uzun vadeli sürü çalışma zamanı — koşu başına 300 paralel alt-ajana ve 4.000 koordineli araç çağrısına kadar; on iki saatlik sürekli yürütme açıklanan hedef.
Kutudan çıkar çıkmaz INT4 nicelleştirme — yeniden eğitim olmadan daha düşük bellek ayak izi, modelin hyperscaler dışında barındırılmasını pratik kılıyor.
Agentik benchmark kazanımları — yayınlanan değerler arasında araçlarla HLE'de 54,0 ve SWE-Bench Pro'da 58,6; her ikisi de ağırlıklar kadar harness tarafından da taşınıyor.

Şekil önemli. Uzun bağlam, sürü yayılımı ve INT4 birbirinden bağımsız kollar. Bir ekip Kimi'nin ağırlıkları olmadan da sürü desenini benimseyebilir; ağırlıkları sürü harness'ı olmadan da kullanabilir. İlginç durum, ikisinin aynı anda gelmesi.

Uzun Vadeli Sürüler Tasarımı Neden Değiştiriyor?

Tek bir koşu 12 saatlik bir planı ve 300 alt-ajanı tutabilir hâle gelince, otomasyon ekibinin sorduğu sorular üç somut yönde kayıyor.

İş birimi büyüyor

Eskiden "tek bilet, tek agent çağrısı" olan bir görev artık "tüm bir epic, gözetimli bir sürü" olabiliyor. Maliyet hikâyesi de değişiyor: Uzun bir bağlam için bir kez ödemek, her seferinde aynı depoyu ve aynı araç listesini yeniden yükleyen binlerce kısa prompt için ödemekten çoğu zaman daha ucuz.

Planlar uzun ömürlü artefaktlara dönüşüyor

256K bağlam ve bir sürü alt-ajan ile planın kendisi kalıcı nesne hâline geliyor. Alt-ajanlar bitiyor, raporluyor ve emekli oluyor; ebeveyn agent koşunun belkemiğini tutuyor. Bu, sözleşme incelemesi, çok günlü göçler veya gece veri geri doldurmaları gibi uzun süreli otomasyonlara temiz bir şekilde oturuyor.

Hatalar yapısal olarak izole oluyor

1.800. adımda yanlış davranan bir alt-ajan eskiden bütün koşuyu zehirlerdi. İzole alt-ajanlarla ebeveyn agent kötü dalı bırakabilir, yerine yenisini başlatabilir ve planın geri kalanını bozulmadan sürdürebilir. Kayıp toplamdan ziyade yerel.

İlginç soru artık "model bunu yapabilir mi?" değil. "Harness bu 300 tanesini on iki saat dürüst tutabilir mi?". Kimi K2.6, ikinci sorunun daha zoru olduğu ilk açık cevap.

Kimi K2.6 ile Mevcut Yığınınız

Kimi K2.6; iş akışı aracınızı, telefon tarafındaki onay yüzeyinizi ya da dayanıklı çalışma zamanınızı değiştirmiyor. Bu yığının içinde uzun vadeli yürütme motoru olarak oturuyor. En net görünüm yan yana bakınca:

Katman	Araç	Sahip olduğu iş
Görsel iş akışı	n8n	Tetikleyiciler, entegrasyonlar, okunaklı akış adımları
Mobil orkestrasyon	Hermes Workspace	Telefon tarafında onaylar ve agent kontrol düzlemi
Yönlendirme	Sakana Conductor	Hangi alt görevi hangi modelin yapacağına karar verir
Dayanıklı çalışma zamanı	Cloudflare Project Think	Çökmeye dayanıklı yürütme, alt-ajanlar, kalıcı oturumlar
Uzun vadeli sürü	Kimi K2.6	Koşu başına 300 paralel alt-ajan, 4.000 koordineli araç çağrısı

Sınırlar gerçek. n8n okunaklı akışı tutmaya devam ediyor. Hermes telefondaki onay yüzeyine sahip olmaya devam ediyor. Project Think dayanıklı yürütmeye sahip olmaya devam ediyor. Kimi K2.6, akışın gerçekten uzun, dallanan, çok saatli bir koşuya ihtiyacı olan birkaç dalı için motor olarak takılıyor.

Halmob Tarzı Yığınlar İçin Beş Pratik Senaryo

Gözetimli sürüyle gece refactor'ları

Bir alt-ajan sürüsü, eski bir kod tabanının farklı parçalarını paralel olarak ele alıyor: biri bağımlılıkları yükseltiyor, diğeri testleri yeniden yazıyor, üçüncüsü bozuk import'ları düzeltiyor. Ebeveyn mimari planı tutuyor ve sabaha çalışmayı birleştiriyor; her alt-ajanın neye dokunduğunun net bir kaydıyla.

Uzun süreli n8n dalları

Bir n8n akışının uzun, dallanan kısımlarını (tedarikçi onboarding, çok şirketli fatura incelemesi, planlı göçler) bir Kimi K2.6 sürüsüne taşıyın. Görsel akış okunaklı harita olarak kalıyor. Saatlerce dikkat ve binlerce araç çağrısı gerektiren koşu parçasının sahibi model.

Telefon uyurken çalışan mobil asistanlar

Bir kullanıcı telefonda derin bir araştırma ya da planlama görevi istiyor ve cihazı kilitliyor. Sürü, onay yüzeyi olarak Hermes Workspace ile sunucu tarafında çalışıyor. Sabah olduğunda sonuç, alt-ajan çağrılarının izi ve açık sorular aynı thread'de bekliyor.

Çok tedarikçili veri geri doldurmaları

CRM, faturalama ve analitiğe dokunan büyük geri doldurmalar, bir tedarikçi rate-limit koyduğu ya da bir şema kaydığı için yarı yolda sıklıkla başarısız olur. Bir sürü tedarikçi başına bir alt-ajan atayıp hataları izole eder; ebeveynin sadece bozuk dilimi yeniden denemesini sağlar, bütün işi değil.

Sürü olarak operasyon runbook'ları

Uzun olay veya göç runbook'ları, her alt-ajanın bir bölüm sahibi olduğu bir sürüye dönüşüyor: kapasite, ağ, veri, iletişim. Ebeveyn sırayı uyguluyor, geri alma planını tutuyor ve Hermes üzerinden bir insan incelemecisine ne zaman tırmanılacağına karar veriyor.

Mobil Otomasyon İçin Neden Önemli?

Bir sürü çalışma zamanı, Hermes Workspace mobil ve agent orkestrasyonu yazımızda ve Cloudflare Project Think rehberinde anlattığımız mobil orkestrasyon hikâyesinin eksik motoru. Telefon onay yüzeyi. Project Think çökmeler boyunca koşuyu hayatta tutuyor. Kimi K2.6 ise gerçekten on iki saatlik faydalı işi, planı kaybetmeden doldurabilen parça.

Nasıl Başlarsınız?

1Moonshot sitesindeki Kimi K2.6 sürüm notlarını okuyun ve sürü çalışma zamanı referansına göz atın. Koşu başına alt-ajan bütçesine ve araç çağrısı bütçesine özellikle dikkat edin.
2Bugün yaklaşık elli araç çağrısı ya da bir saatte tavan yapan mevcut bir otomasyonu seçin. Uzun vadeli bir sürünün değerini hissetmenin en ucuz yeri burası.
3O akışı, iki ya da üç alt-ajanı olan tek bir ebeveyn agent içine sarın. İlk koşuda 300'e yayılma dürtüsüne direnin; sınırları net küçük bir sürü, büyük olandan daha çok şey öğretir.
4Her alt-ajan çağrısını enstrümante edin. Sürüyü daha sonra genişletmek ya da geri çekmek için kullanacağınız argüman bu log; ve onuncu saatte bir şey ters gittiğinde operasyon ekibinizin okuyacağı malzeme de bu.

Agent katmanını yeni harmanlıyorsanız, OpenClaw 101 yeni başlayanlar rehberimiz yapı taşlarını (araçlar, skill'ler, izinler, bellek) anlatıyor; Sakana Conductor çoklu agent orkestrasyonu yazısı ise hangi görevin Kimi K2.6'ya gideceğine karar veren yönlendirme katmanını kuruyor.

Son Söz

Kimi K2.6, ağırlıkların değil harness'ın manşet olduğu ilk açık model. 300 paralel alt-ajan, 4.000 koordineli araç çağrısı ve on iki saatlik koşular; uzun vadeli otomasyonu bir araştırma demosundan varsayılan desene dönüştürüyor. Şimdiden n8n, mobil orkestrasyon ve dayanıklı çalışma zamanıyla inşa eden bir ekip için bu, akışın uzun dallarının gerçekten bitmesini sağlayan motor.

Sonraki sprint'e taşıyacağınız soru basit. Mevcut otomasyonlarınızdan hangisi, her biri bir öncekini unutan kısa prompt'lar zinciri yerine, tek bir plan altında saatlerce koşan, gözetimli küçük bir sürü olarak daha iyi davranırdı?