中 즈푸, 코딩 AI도 '미국의 벽' 뚫었다…제2 '딥시크 모먼트' 오나

머니투데이2026-06-26 14:43:27

사진출처=바이두 갈무리 중국의 생성형 AI 스타트업 '즈푸AI'의 코딩 AI 모델이 글로벌 주요 AI 모델 평가 순위 2위를 기록했다. 중국 AI 모델이 이 리스트 3위 이내에 든 것은 처음이다. 서방에서 개발된 추론 AI의 성능을 저비용으로도 따라잡을 수 있단 점을 증명한 딥시크에 이어 중국 AI 업계가 코딩 AI 시장에서도 '제 2의 딥시크 모먼트'를 촉발할 수 있단 분석이 나온다.

홍콩 사우스차이나모닝포스트(SCMP)는 즈푸의 신형 AI 모델 'GLM-5.2'가 프론트엔드 코딩 능력을 평가하는 아레나 순위에서 미국 앤트로픽의 '페이블 5'에 이어 세계 2위를 기록했다고 26일 보도했다.

지난 13일 공개된 'GLM-5.2'는 소프트웨어 개발을 돕는 생성형 AI 모델이다. 챗GPT처럼 사람과 대화도 가능하지만 핵심 성능은 개발자의 코딩 업무 지원이다. 코드를 작성하고 오류를 찾아 수정하며 프로그램을 설계하고 여러 단계를 스스로 계획해 실행하는 기능에 최적화돼있다. AI 개발 비서의 두뇌 역할을 하는 모델인 셈이다.

'GLM-5.2'를 개발한 즈푸는 중국에서 'AI 육소룡(6대 AI 스타트업)'으로 통한다. 2019년 칭화대학교 지식공정 연구팀에서 스핀오프한 기업이다. 알리바바와 텐센트, 메이퇀, 샤오미 등 중국 주요 IT 기업들이 즈푸의 핵심 투자자다. 지난해 1월 미국 상무부의 수출통제 명단에 포함됐다.

출시 후 글로벌 평가 순위 3위 안에 진입하자 미국 전문가들 사이에서도 'GLM-5.2'의 성능이 뛰어나단 평가가 나오기 시작한다. 메타와 구글 딥마인드 부사장을 지낸 맷 벨로소는 SNS를 통해 "하루 종일 GLM-5.2를 사용해봤는데 매일 사용할 수 있는 수준을 처음으로 충족한 오픈 모델"이라며 "(지난 4월 공개된 오픈AI의 GPT-5.5와 비교하면)중국 모델이 더 핵심만 말하고, 쓸데없이 장황하거나 빙빙 돌지 않고 필요한 일을 바로 수행한다"고 했다.

미국 브루킹스연구소의 카일 챈 연구원은 "GLM-5.2는 중국 AI의 새로운 딥시크 모멘트"라며 "미국보다 훨씬 적은 컴퓨팅 자원을 보유하고 있음에도 AI 성능 격차를 수개월 수준으로 좁혔다"고 말했다. 그는 "AI 서비스 비용이 급격히 높아지는 상황에서 즈푸가 GLM-5.2를 통해 거의 최첨단 수준의 성능을 오픈소스로 제공한 것은 시기적으로도 완벽했다"고 평가했다.

다만 'GLM-5.2'가 모든 면에서 미국 모델을 앞선 것은 아니라는게 전문가들의 분석이다. 소프트웨어 엔지니어링 능력을 평가하는 DeepSWE 벤치마크에서 GLM-5.2의 순위는 5위를 기록했다. 실제 사용 과정에서도 일부 한계가 확인됐다.

미국 데이터 소프트웨어 업체 스노우플레이크의 스리다르 라마스와미 최고경영자(CEO)는 "AI 코딩 플랫폼 코코에서 테스트한 결과, 전체적인 성능은 '클로드 오푸스 4.7'과 비슷했지만 작업을 너무 일찍 종료하거나 잘못된 내용을 지나치게 분석하는 문제 등이 나타났다"고 지적했다. 그는 "운영 비용은 앤트로픽 모델보다 약 48% 저렴하지만 미국 경쟁 모델보다 두 배 많은 토큰과 메모리를 사용하는 경향도 확인됐다"고 강조했다.

이와 관련, 즈푸 공동창업자인 탕제 수석과학자는 SNS를 통해 "강화학습에 더 많은 자원을 투입하면 성능을 더욱 끌어올릴 수 있다"고 밝혔다.