Skip to content
AI-Daily-Builder

2026-06-17 views

Zhipu AI, GLM-5.2 오픈 웨이트 공개: 100만 토큰 컨텍스트, GPT-5.5 6분의 1 비용으로 최고 오픈소스 코딩 모델

읽어야 하는 이유 오픈 웨이트와 최전선 폐쇄형 모델 간 격차는 이제 한 자릿수 벤치마크 점수로 측정된다. 셀프 호스팅 개발자에게 GLM-5.2는 에이전트 코딩의 「자체 구축 vs 구매」 계산을 바꾼다.

Z.ai가 6월 17일 GLM-5.2를 MIT 라이선스로 공개 — 100만 토큰 컨텍스트를 갖춘 7,530억 파라미터 MoE로, 오픈소스 코딩 벤치마크 1위에 비용은 GPT-5.5의 약 6분의 1.

무슨 일이 일어나고 있나

중국 연구소 Z.ai — 이전에 Zhipu AI(智譜 AI)로 알려진 회사 — 가 2026년 6월 17일 GLM-5.2의 전체 MIT 라이선스 웨이트를 공개하며 Hugging Face(핸들 zai-org/GLM-5.2)와 ModelScope에 게시했다. 모델 자체는 이번 주 초인 6월 13일에서 16일 사이에 먼저 공개되었고, 독립형 API와 Z.ai 챗봇이 앞서 등장했다. 주목할 점은 Zhipu가 첫 공개 시 벤치마크 수치를 보류하고 오픈 웨이트와 함께 발표했다는 것이다 — 이 발표 순서는 검증 가능한 주장과 다운로드 가능한 모델을 같은 시간대에 나란히 놓았다.

핵심은 포지셔닝이다. GLM-5.2는 이제 장기 코딩 벤치마크에서 가장 강력한 오픈 웨이트 모델로, 최전선 폐쇄형 모델과의 격차를 몇 퍼센트포인트까지 좁혔다.

사양이 확인한 것

특성세부사항
아키텍처Mixture-of-Experts, 총 파라미터 약 7,530억
활성 파라미터쿼리당 약 400억
컨텍스트 윈도우100만 토큰 (GLM-5.1은 20만)
라이선스MIT (상업적 사용 제한 없음)
배포Hugging Face + ModelScope, 그리고 단계별 API
노력 모드「High」와 「Max」 속도/품질 절충
비용GPT-5.5의 약 6분의 1

에이전트형 자율 터미널 코딩 벤치마크인 Terminal-Bench 2.1에서 GLM-5.2는 81.0을 기록하며 Claude Opus 4.8의 85.0과 4점 차이로 좁혔다. SWE-bench Pro에서 62.1을 달성했고, Code Arena에서 세계 2위(Opus 4.8에 이어), FrontierSWE에서 GPT-5.5를 약 1% 앞섰다. 오픈소스 모델 중에서는 장기 코딩 작업에서 1위를 차지한다.

개발자에게 왜 중요한가

두 숫자가 이야기를 떠받친다 — 100만 토큰 컨텍스트 윈도우와 비용이다. 컨텍스트가 20만에서 100만 토큰으로 도약하면서, 전체 저장소 추론과 긴 에이전트 궤적이 단일 윈도우 안에 들어온다 — 이전에는 검색 파이프라인이나 청크 분할을 강요받던 종류의 워크로드다. 비용이 GPT-5.5의 약 6분의 1인 데다, 제한 없는 상업적 배포를 허용하는 MIT 라이선스가 더해지면서, 대량으로 에이전트 코딩 워크로드를 운영하는 누구에게나 「자체 구축 vs 구매」 계산을 바꾼다.

이미 로컬 하드웨어에서 셀프 호스팅하는 팀에게 GLM-5.2의 MoE 설계는 실용적 진입점이다. 총 약 7,530억에 대해 쿼리당 활성이 약 400억에 불과하므로, 다른 대규모 희소 모델과 같은 추론 경제학 논의에 들어맞는다 — 메모리 사용량은 전체 파라미터 수가 결정하지만, 토큰당 연산은 활성화된 전문가가 지배한다. 7,530억 파라미터 모델을 실제로 서빙 가능하게 만드는 것이 바로 이 아키텍처다.

별표: API냐 웨이트냐

실무상 가장 중요한 구별은 GLM-5.2를 소비하는 두 가지 방식 사이에 있다. MIT 웨이트는 다운로드해 자체 인프라에서 실행할 수 있으며, 데이터가 환경 밖으로 나가지 않는다. 반면 호스팅형 Z.ai API는 프롬프트와 출력을 중국 기반 서비스를 거쳐 라우팅한다 — 여러 매체가 공개 시 지적한 데이터 거버넌스 고려사항이다. 규제 대상 워크로드, 민감한 코드, 또는 데이터 거주 요건의 적용을 받는 어떤 것에든 오픈 웨이트가 안전한 길이며, API는 관할권 문제를 동반하는 편의일 뿐이다.

개발자가 지금 해야 할 일

첫째, 에이전트 코딩을 대규모로 운영한다면 자신의 태스크 스위트로 GLM-5.2를 현행 모델과 벤치마킹하라 — 공개 점수는 최전선에 근접하지만, 유일한 시금석은 당신의 워크로드다. 둘째, 웨이트와 API 중 무엇을 쓸지 의도적으로 결정하라. 비용 이점은 양쪽 모두 성립하지만, 코드를 당신의 관할권 내에 유지하는 것은 셀프 호스팅 경로뿐이다. 셋째, 웨이트가 공개된 지금 Terminal-Bench와 SWE-bench Pro 수치가 독립적 재현을 견뎌내는지 주시하라 — 오픈 웨이트란 주장이 검증 가능하다는 뜻이며, 그것이야말로 가장 강력한 오픈 모델이 환영해야 할 검증이다.

결론: 오픈 웨이트의 최전선은 이제 최고의 폐쇄형 모델로부터 한 자릿수 벤치마크 격차까지 좁혀졌고, 관대한 라이선스 아래, 비용의 일부만으로 제공된다. 이는 불과 석 달 전과도 확연히 다른 지형이다.


출처

태그

커피