DeepReinforce 的新開源 AI 編碼模型瞄準自主智能體
Ornith 是來自 DeepReinforce 的一款新的開源代碼模型,它不同於傳統僅僅“建議下一行代碼”的 AI 助手。它並非自動補全,而是被設計來端到端執行完整任務——從編寫腳本到運行完整流水線,無需人工牽引。該模型將代碼生成視爲強化學習問題:獎勵來自成功完成任務,而不是與訓練數據的相似度。
傳統模型優化的是“令牌預測準確率”,這在聊天機器人場景中有效,但當你需要一個智能體去拼接 API、修復錯誤並不斷迭代直到工作完成時就行不通。Ornith 則反其道而行:只有當整個任務成功或失敗時,它纔會獲得反饋。這樣就迫使模型學習長時域規劃與錯誤恢復——也正是自主軟件開發所需的關鍵能力。其思路也類似人類學習編程:通過構建能運行的項目來掌握,而不是死記語法。
這種影響不止關乎開發者效率。隨着 AI 智能體逐漸具備從全棧到自動創建軟件的能力,關於代碼歸屬、審計追蹤以及安全審計的問題也變得更加迫切。當一個 AI 智能體交付了存在漏洞的代碼,責任由誰承擔?你又如何審計一個會通過試錯不斷“寫出自己”的模型?這些都不只是設想——隨着像 Ornith 這樣的開源權重模型規模擴大,它們正在變成即將到來的監管頭痛。
自主 AI 智能體會取代初級開發者,還是會放大他們的產出?在下方留言你的觀點吧。👇
#OpenSourceAI #AIAgents #CodeGeneration