2026년 4월, 중국 AI 랩에서 출시한 오픈소스 모델 GLM-5.1과 Kimi K2.6이 SWE-Bench Pro에서 GPT와 Claude를 앞질렀습니다. 다운로드하여 로컬에서 실행할 수 있고, 상업적 사용도 자유롭습니다. 토큰당 비용이 0원이라는 점이 모든 것을 바꿀 수 있습니다.
SWE-Bench Pro 기준 (2026년 4월)
무슨 일이 벌어졌나?
오픈소스가 정말 빅3를 이겼을까?
4월 7일 Z.ai(구 Zhipu AI)가 GLM-5.1을 출시했고, SWE-Bench Pro에서 58.4%를 기록했습니다. 이는 GPT-5.4(57.7%)와 Claude Opus 4.6(57.3%)을 넘는 수치입니다. 14일 후 Moonshot AI가 Kimi K2.6을 출시하며 58.6%로 GLM-5.1마저 앞질렀습니다. 실제 GitHub 이슈 해결 능력에서 오픈소스가 유료 클로즈드 모델을 앞선 것입니다.
왜 이게 중요한가?
이 모델들은 오픈 웨이트로, 누구나 다운로드하여 수정·배포·상업 사용이 가능합니다. 토큰당 API 비용을 내지 않고도 최고 수준의 AI를 사용할 수 있다는 의미입니다. OpenAI나 Anthropic에 의존하지 않는 자체 AI 인프라를 구축할 수 있는 길이 열린 것입니다.
일반 사용자에게 영향은?
지금 당장 쓸 수 있을까?
현실적으로 일반 사용자가 로컬에서 실행하기는 어렵습니다. GLM-5.1은 754B(7,540억 파라미터) 모델로, 고사양 GPU 여러 장이 필요합니다. 하지만 Alibaba Cloud, 화웨이 클라우드 등에서 API를 제공하기 시작했고, 비용은 Claude나 GPT의 1/5~1/10 수준입니다. 중장기적으로 AI 서비스의 가격 인하 압력으로 작용할 것입니다.
빅3는 어떻게 대응할까?
Claude는 Opus 4.7로 SWE-Bench Pro 64.3%를 달성하며 다시 1위를 탈환했습니다. OpenAI도 오픈소스 모델(gpt-oss 시리즈)을 발표하기 시작했고, Google도 Gemma 4를 공개했습니다. 오픈소스의 추격이 클로즈드 모델의 혁신 속도를 더 빠르게 만들고 있어, 결국 사용자에게 이득입니다.
빅3를 이긴 오픈소스 모델들
자주 묻는 질문 (FAQ)
Q1. 오픈소스 AI가 ChatGPT를 대체할 수 있나요?
벤치마크 특정 분야에서는 이미 앞서지만, ChatGPT의 통합 생태계(음성, 이미지, 플러그인, 앱)를 대체하기는 아직 어렵습니다. 코딩·분석 등 특정 작업에서는 대안이 될 수 있습니다.
Q2. 보안 걱정은 없나요?
오픈소스이므로 코드를 직접 검증할 수 있다는 장점이 있지만, 중국 랩 출신 모델에 대한 데이터 프라이버시 우려가 있습니다. 민감한 데이터를 다룬다면 자체 서버에서 로컬 실행하는 것이 안전합니다.
마무리
오픈소스 AI의 빅3 추월은 2026년 AI 업계 최대 이슈입니다. 단기적으로 일반 사용자에게 직접적 영향은 제한적이지만, 중장기적으로 AI 서비스 가격 인하와 경쟁 촉진으로 이어질 것입니다. 현재 시점에서 가장 강력한 모델들의 비교는 Claude vs GPT-5.5 vs Gemini 3파전을 참고하세요.