"AI 학습 연산량 33% 줄였다"…베슬AI 논문, 글로벌 학회서 채택
머니투데이
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]
AI(인공지능) 인프라 기업 베슬AI가 'ICML(국제 머신러닝 학회) 2026 SPIGM 워크숍'에 연구논문을 등재했다고 24일 밝혔다.
ICML은 NeurIPS, ICLR과 함께 머신러닝 분야 세계 3대 학회로 꼽힌다. 베슬AI의 남상대 연구원이 발표한 논문 'DLLM-JEPA: 마스크드 디퓨전 언어모델을 위한 결합 임베딩 예측 아키텍처'는 워크숍 포스터 세션에서 발표될 예정이다.
이번 연구는 언어모델 학습에 드는 데이터 구축과 연산 부담을 동시에 줄인 새로운 방법론 'DLLM-JEPA'를 제안했다. 기존 방식은 서로 다른 관점의 학습 데이터를 별도로 구축해야 했고, 학습 단계마다 연산도 두 차례 수행해야 했다.
DLLM-JEPA는 같은 문장에 마스킹 비율만 다르게 적용하는 것만으로 이 두 가지 부담을 동시에 없애 기존 대비 학습 연산량(FLOPs)을 33% 절감했다.
성능 개선 효과도 전 평가 항목에서 확인됐다. 수학 추론 벤치마크에서 LLaDA-8B 모델은 최대 18.7%포인트, Dream-7B 모델은 11.4%포인트 정확도가 높아졌다.
특히 성능 향상과 기존 능력 유지를 동시에 달성하는 '듀얼윈' 특성이 나타났다. 가중치 변화가 클수록 기존 능력 손실도 크다는 통념과 다른 결과도 확인했다.
남상대 연구원은 "학습 연산량을 줄이는 동시에 새로운 과제의 정확도를 높이고 기존 능력의 망각을 억제한 것, 이 세 가지를 한 번에 달성했다는 점이 이번 연구의 핵심"이라고 말했다.
베슬AI는 LLM과 생성모델, 피지컬 AI 및 월드모델 관련 연구를 지속할 계획이다. 자체 연구 성과와 AI 인프라 운영 경험을 연결해 대규모 AI 모델의 학습 효율을 높이고, 연구개발부터 실제 운영까지 이어지는 AI 워크로드 전반의 기술 경쟁력을 강화한다는 목표다.
베슬AI 관계자는 "이번 연구는 LLM과 피지컬 AI 두 영역의 핵심 기술을 하나의 방법론으로 연결했다는 점에서 의미가 있다"며 "학습 연산량 절감은 GPU(그래픽처리장치) 비용·시간 절감으로 직결된다"고 했다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']
조회 0·스크랩 0·공유 0
댓글이 없습니다.
첫번째 댓글을 남겨주세요.