Skip to content
AI-Daily-Builder

2026-05-21 views

Anthropic Code with Claude 런던: 에이전트 플랫폼 성숙 —— Dreaming, Outcomes, Finance

읽어야 하는 이유 테마는 「더 나은 모델」에서 「신뢰할 수 있는 자율성」으로의 전환. Outcomes(에이전트 실행을 채점하는 grader loop)와 Dreaming(스케줄 메모리 큐레이션)은 무인으로 돌릴 수 있는 에이전트의 인프라 —— 그것이 엔터프라이즈 배포의 진짜 장벽이지 모델 IQ가 아니다.

Code with Claude 런던(5/20-21)에서 Anthropic이 5개 에이전트 기능 —— Dreaming, Outcomes, 멀티 에이전트 오케스트레이션, Claude Finance, Add-ins —— 와 Small Business 통합을 출시.

Anthropic은 Code with Claude 개발자 이벤트를 런던(5/20-21) 으로 가져와, 에이전트 플랫폼에서 프로덕션에 진짜 중요한 부분을 출시했다 —— 새 플래그십 모델이 아니라 에이전트 주변의 신뢰성 스캐폴딩.

5개 에이전트 기능

기능역할
Dreaming(리서치 프리뷰)과거 에이전트 세션 + 메모리 스토어를 검토해 패턴을 추출하고 장기 메모리를 큐레이트하는 스케줄 프로세스
Outcomes(퍼블릭 베타)정의된 성공 기준에 대해 에이전트 실행을 채점하는 grader loop —— 「에이전트가 실제로 성공했나?」 간극을 메움
멀티 에이전트 오케스트레이션하나의 태스크에서 여러 전문 에이전트를 조율
Claude Finance10개 금융 특화 에이전트 스위트
Add-insClaude를 기존 앱 표면으로 확장

여기에 Claude for Small Business —— QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace, Microsoft 365 와의 사전 구축 통합 —— 비기술 운영자에게 에이전트 능력을 패키징.

전부 Claude Opus 4.7(올봄 초 코딩 벤치 선두를 탈환한 모델, 93 태스크 코딩 스위트에서 Opus 4.6 대비 약 +13%) 위에서 동작.

진짜 테마: 자율성 신뢰도, 모델 IQ가 아니다

과소평가된 전환: Anthropic이 여기서 파는 것은 더 똑똑한 모델이 아니라 —— 에이전트를 무인으로 돌릴 만큼 신뢰할 수 있게 만드는 인프라.

둘이 합쳐 「한 번 작동하는 데모」와 「프로덕션에 배포하고 떠날 수 있는 에이전트」 사이 간극을 겨냥.

왜 중요한가

Practitioner note

Claude 위에서 출시하는 빌더 대상:

과소평가된 각도: 에이전트 플랫폼 전쟁은 신뢰성 도구로 이긴다, 모델 벤치마크가 아니라. Outcomes와 Dreaming은 화려하지 않다 —— grader와 메모리 큐레이션은 새 모델처럼 헤드라인이 안 된다. 하지만 그것들이 바로 에이전트 데모를 배포된 무인 프로덕션 시스템으로 바꾸는 것. 에이전트를 지루하고 신뢰할 수 있게 먼저 만드는 랩이 엔터프라이즈를 이긴다, 다음 벤치마크에서 누가 1등이든.


출처

태그

커피