DeepReinforce-dən yeni open-source AIkodlaşdırma modeli avtonom agentləri hədəfləyir
DeepReinforce-un Ornith adlı yeni open-source kodlaşdırma modeli, yalnız kodun növbəti sətrini təklif edən ənənəvi AI köməkçilərindən fərqlənir. Avtokompletasiya əvəzinə, o, insanın daim nəzarət etməsi olmadan, skriptlərin yazılmasından tutmuş tam pipeline-lərin işə salınmasına qədər, son nəticəyədək bütün tapşırıqları icra etmək üçün hazırlanıb. Model kod generasiyasını möhkəmləndirmə öyrənməsi (reinforcement learning) problemi kimi qiymətləndirir: mükafat uğurlu tapşırığın tamamlanmasından gəlir, yoxsa təlim məlumatlarına bənzərlikdən.
Ənənəvi modellər token proqnozlaşdırma dəqiqliyini optimallaşdırır — bu, chatbotlar üçün işləyir, amma agentə API-ləri birləşdirməyi, xətaları debug etməyi və iş bitənə qədər təkrar etməyi tapşıranda alınmır. Ornith isə bunu tərsinə çevirir: geribildirim yalnız bütöv bir tapşırıq uğurla yerinə yetiriləndə və ya uğursuz olanda verilir. Bu, modelin uzunmüddətli planlaşdırma və səhvdən qurtulma (error recovery) bacarıqlarını öyrənməsinə məcbur edir — avtonom proqram təminatı inkişafı üçün lazım olan əsas bacarıqlar. Yanaşma insanların kod öyrənməsinə bənzəyir: sintaksisi əzbərləmək yox, işlək layihələr qurmaqla.
Nəticələr tərtibatçı məhsuldarlığı ilə bitmir. AI agentləri tam strukturdan (full-stack) proqram təminatı yaratmaq səviyyəsinə çatdıqca, kod mülkiyyəti, audit izləri və təhlükəsizlik auditləri ilə bağlı suallar daha aktual olur. Bir AI agenti zərərli/risqli kodu göndərəndə kim məsuliyyət daşıyır? Sınaq-yanılma ilə öz-özünə yazan bir modeli necə auditiya edirsiniz? Bunlar sadəcə fərziyyə deyil — Ornith kimi open-weight modellər miqyaslandıqca ortaya çıxan tənzimləmə problemləridir.
Avtonom AI agentlər junior tərtibatçıları əvəz edəcək, yoxsa onların nəticəsini artıracaq? Fikrinizi aşağıda yazın. 👇
#OpenSourceAI #AIAgents #CodeGeneration