由多名世界級程式設計競賽選手組成的金頭腦AI團隊Cognition,是一間總部位於美國的科技新創公司,迄今成立不到2個月,目前員工僅10人。而當中,年僅27歲的天才CEO名叫Scott Wu,據悉就是他展開融資,並在募得約2100萬美元(約新台幣6.6億元)後,開始與夥伴著手開發第一款產品Devin,目的是希望Devin協助全球工程團隊,將部分專案委託給AI生成,讓人類更專注於創意性的工作上。
因此,Scott Wu在Peter Thiel的風投基金Founders Fund,以及推特(Twitter)前CEO Elad Gil、Doordash,還有共同創辦Tony Xu等人投資下,成功讓Devin研發並問世。
而透過Cognition的設計,Devin已能在沙盒運算環境中,透過自身的Shell、程式碼編輯器與瀏覽器,自行處理軟體工程專案中多道步驟,包括規劃和執行需數千個決策的流程,並於Upwork平台上完成專案,透過編寫和偵測程式碼運行電腦視覺模型等工作,且自始自終不偏離作為「工程師」的相關作業,大幅改善過去多數AI模型到後來「漸漸偏離指令」或執行失準的情形。
因此Cognition也強調,人類使用者只需在Devin的聊天機器人介面中,輸入自然語言指令,讓AI逐步展開詳細的制定計劃,以解決各種軟體問題即可,用法可說相當直覺,跟現在一般民眾藉指令運用ChatGPT的概念有異曲同工之妙。
接著人類使用者只要運用開發工具著手項目,掌握編寫自身程式碼、修復bug、測試和報告等進度,並時刻關注Devin的執行狀況,幾乎就能完成軟體龐雜的一系列工作。
若過程中,人類使用者發現或感覺Devin有環節出錯,也能直接跳回聊天介面,再次對其下達指令,以修復各種問題。
Today we're excited to introduce Devin, the first AI software engineer.
— Cognition (@cognition_labs) March 12, 2024
Devin is the new state-of-the-art on the SWE-Bench coding benchmark, has successfully passed practical engineering interviews from leading AI companies, and has even completed real jobs on Upwork.
Devin is… pic.twitter.com/ladBicxEat
有鑑於此,Devin初登場,許多網友都對其可進行端到端的部署,運行程式碼以生成帶有隱藏訊息的圖像,並幫助人類使用者改善應用程式與網站,甚至查找和修復程式碼庫錯誤等功能嘖嘖稱奇,尤其是使用GitHub儲存庫來微調LLM,或學習使用不熟悉的開發技術等能力,種種都讓天底下所有工程師小白倍感壓力,直呼自己根本已遭取代。
當然工程師們會擔憂,也屬合情合理,畢竟不僅AI研發公司創業者Silas Alberti在推特發文,讚許Devin真的是一個能力非常強大的獨立自主系統,無論是快速設計出軟體原型或錯誤修正,包含視覺呈現等,表現都非常優秀;而AI公司Unify的創辦人Devin Plumb,也在貼文中逗趣提到,Devin把他的工作搶走了,連名字都是。
更讓人驚奇的是,透過SWE基準測試,若使用GitHub處理專案的相關問題來測試AI Devin,其已成功解決13.86%的案例,且完全無需人類介入或幫助。
相比Claude 2目前只能解決4.8%的問題;SWE-Llama-13b和GPT-4分別可解決3.97%和1.74%的問題,且上述模型仍需人類協助,Devin的表現簡直超乎水準。
因此Cognition才會如此期待,日後Devin繼續展現軟體開發上更多的可能性,並期許未來許多相關工作都能由AI來全面完成,人類只要擔任好監督一角。
It adds insult to injury to steal my job and my name https://t.co/HrLjs9IzJs
— Devin Plumb (@devin_plumb) March 12, 2024
當然話鋒一轉,Cognition也不忘重申,Devin誕生旨在與人類工程師攜手合作,提供即時更新、接受回饋,並就設計選擇來進行協作,因此Devin存在不為取代人類,而是補充人類的技能,使團隊更有效率。
所以現階段,Devin只針對少數客戶開放存取權限,還未完全公開,若有公司感興趣想進一步體驗,需寫信聯繫Cognition才有機會,不過未來,Cognition也預計會更全面的釋出Devin,民眾只要耐心等候,有招一日還是有機會使用看看的。