Skip to content
AI-Daily-Builder

태그 · #coding-agents

OpenAI, Ona(옛 Gitpod) 인수 — Codex 에이전트에 영속적이고 안전한 클라우드 환경 제공

읽어야 하는 이유 에이전트 코딩의 경쟁은 모델 품질에서 런타임으로 옮겨갔다. OpenAI가 사들이는 것은 지루하고 어려운 인프라 — 영속성, 샌드박스, 감사 — 이며, 그것이 똑똑한 에이전트를 배포 가능한 에이전트로 바꾼다.

OpenAI가 Ona — 옛 Gitpod로 알려진 클라우드 개발 환경 회사 — 를 인수해, Codex 에이전트가 영속적이고 고객이 통제하며 감사 가능한 환경에서 더 긴 작업을 수행하도록 한다.

xAI, Cursor 개발자 데이터로 튜닝한 1.5조 파라미터 Grok V9-Medium 훈련 완료

읽어야 하는 이유 핵심은 1.5조라는 파라미터 수가 아니라 훈련 코퍼스다. Cursor의 실제 개발자 워크플로로 프런티어 모델을 튜닝하는 것은 Claude와 Codex가 장악한 코딩 계층을 직접 노린 베팅이다. 가중치나 API가 나오기 전까지 벤치마크와 일정은 벤더 발표로 취급하라.

Musk는 xAI의 1.5조 파라미터 Grok V9-Medium이 훈련을 마쳤다고 밝혔다(5/25). 프로덕션 모델의 약 3배이며 Cursor 개발 데이터로 훈련, 6월 중순 공개 예정.

Cognition, 260억 밸류로 10억 달러 조달 —— "에이전트=인력" 베팅, 자사 코드 90%를 AI가 작성

읽어야 하는 이유 약 53배 ARR 배수는 "에이전트=도구"가 아니라 "에이전트=인력"에 거는 베팅이다. 플라이휠은 증명이자 리스크: Cognition은 Devin으로 자사 코드 약 90%를 쓰므로, 성장 스토리와 데모가 같은 것이다 —— 성장이 둔화되기 전까지는.

Devin 코딩 에이전트 개발사 Cognition이 260억 달러 밸류로 10억 달러 이상 조달(5/27) —— 8개월 만에 2.5배, ARR $492M, 자사 코드 약 90%를 AI가 작성.

Google Gemini 3.5 Flash, 에이전트 작업에서 지난 분기 Pro 플래그십을 능가

읽어야 하는 이유 신호는 가격-성능 역전. 버짓 급이 이제 「달러당 에이전트 처리량」에서 지난 분기 플래그십을 앞선다. 인프라를 Pro 급 가격으로 설계했다면, 코드 변경 없이 단위 경제성이 개선됐다.

I/O 2026: Flash 급 Gemini 3.5 Flash가 코딩+에이전트 벤치에서 Gemini 3.1 Pro를 능가. $1.50/$9 per 1M 토큰. Terminal-Bench 76.2% vs 70.3%. 4배 빠르고 반값.

xAI, Grok Build CLI 출시: 서브에이전트 8개 병렬, SWE-Bench 70.8%, $99 인트로 가격

읽어야 하는 이유 주목할 것은 벤치마크 점수가 아니라 「서브에이전트 8개 병렬」이라는 구조적 선택. 자리잡으면 비용 모델은 「태스크당 토큰」에서 「분당 태스크」로 뒤집힘 —— Claude Code/Codex 팀은 정확도가 아닌 처리량으로 재벤치마크해야 한다.

5/14 퍼블릭 베타. SWE-Bench 70.8%, 256K 컨텍스트, $0.20/$1.50 per 1M 토큰, $99 인트로. 서브에이전트 8개 병렬로 사파전.

커피