Модель для AI-кодування з відкритим кодом орієнтується на автономних агентів
Ornith — нова модель з відкритим кодом для програмування від DeepReinforce — відходить від звичних AI-асистентів, які лише підказують наступний рядок коду. Замість автодоповнення вона створена для виконання повних завдань від початку до кінця — від написання скриптів до запуску цілих пайплайнів без постійного супроводу людиною. Модель розглядає генерацію коду як задачу навчання з підкріпленням, де винагорода нараховується за успішне виконання завдання, а не за схожість із даними навчання.
Традиційні моделі оптимізують точність прогнозування токенів — це працює для чатботів, але не підходить, коли агенту потрібно поєднати API, налагодити помилки й ітеративно довести роботу до завершення. Ornith робить інакше: зворотний зв’язок вона отримує лише тоді, коли ціле завдання або вдалося, або зазнало невдачі. Це змушує модель вчитися далекостроковому плануванню та відновленню після помилок — саме тим навичкам, які потрібні для автономної розробки програмного забезпечення. Такий підхід схожий на те, як люди вчаться програмувати: через створення робочих проєктів, а не через заучування синтаксису.
Наслідки виходять за межі продуктивності розробників. Коли AI-агенти стають здатними створювати програмне забезпечення повного циклу, питання про авторство коду, журнали аудиту та результати перевірок безпеки набувають гостроти. Хто несе відповідальність, коли AI-агент випускає вразливий код? Як аудитувати модель, яка навчається «само собою» через спроби та помилки? Це не просто припущення — це вже майбутні регуляторні головні болі, адже відкрито доступні ваги на кшталт Ornith масштабуються.
Чи замінять автономні AI-агенти молодших розробників, чи радше посилять їхню роботу? Поділіться своєю думкою нижче. 👇
#OpenSourceAI #AIAgents #CodeGeneration