생성형 AI 위한 'AWS 솔라 미니 SLM' 고도화됐다

업스테이지, 극내·외 기업에서 이미 사용하고 있는 도메인별 학습 데이터 활용해 솔라 미니 미세 조정
수천억 개의 파라미터 사용하는 LLM에 비해 경량으로 200억 개 미만의 파라미터 사용

 

[더테크=전수연 기자] AWS(Amazon Web Services)가 업스테이지(Upstage)에 자사 주력 제품인 솔라 미니 SLM(소형언어모델)을 제공하고 이를 통해 솔라 미니의 기술력이 향상됐다.

 

AWS는 업스테이지가 솔라 미니 SLM을 출시했다고 21일 밝혔다.

 

솔라 미니는 한국어, 영어로 이해, 요약, 번역, 새로운 콘텐츠 예측 등 다양한 언어 작업을 수행하도록 미세 조정(fine tunning)할 수 있는 다목적 모델이다. 추후 태국어, 일본어 등도 추가될 예정이며 사용자는 솔라 미니를 통해 자사 모델을 처음부터 훈련시킬 필요 없이 생성형 AI를 시작할 수 있다.

 

새롭게 출시되는 솔라 미니는 파운데이션 모델을 제공하는 ML 허브인 아마존 세이지메이커 점프스타트와 타사 소프트웨어 공급업체의 솔루션을 쉽게 배포할 수 있는 AWS의 디지털 카탈로그인 AWS 마켓플레이스에서 찾을 수 있다.

 

업스테이지 사용자는 메타버스 엔터테인먼트, 쿼라, 커넥트웨이브, 콴다 등 극내·외 기업에서 이미 사용하고 있는 도메인별 학습 데이터를 활용해 솔라 미니를 미세 조정할 수 있다.

 

언어 모델은 컨텍스트, 메모리 기능, 텍스트 생성을 제공해 생성형 AI 서비스를 지원한다. SLM은 수천억 개의 파라미터를 사용하는 LLM에 비해 경량으로 200억 개 미만의 파라미터를 사용한다.

 

솔라 미니는 107억 개의 파라미터로 구성된 더 작은 학습 데이터세트로 추론(학습된 ML 모델을 사용해 새로운 입력 데이터 예측을 수행하는 과정)을 합리적인 비용으로 실행할 수 있다.

 

업스테이지는 솔라 미니를 학습시키기 위해 우수한 컴퓨팅 성능과 비용 효율성을 갖춘 AWS를 선택했다. 한국어에 특화된 LLM 개발을 위해 ML 모델 개발, 배포 서비스인 아마존 세이지메이커를 활용했다.

 

업스테이지가 설립한 업계 얼라이언스 1T 클럽에서 제공한 데이터를 활용했으며 여기에는 업스테이지의 고급 데이터 전처리(입력 데이터를 학습에 사용하기 전 준비, 정리하는 단계)와 검색 증감 생성(RAG) 등의 미세 조정 기술을 사용했다.

 

이 데이터는 텍스트, 서적, 뉴스 기사, 보고서, 논문 등 저작권이 없는 다양한 고품질 한국어 학습데이터로 구성됐다. 또 문화 뉘앙스에 대한 솔라 미니의 이해를 발전시키는 동시에 응답의 정확도를 높여 잘못되거나 부적절한 답변을 생성하는 ‘AI 할루시네이션’을 방지한다.

 

이와 함께 솔라 미니는 작년 12월 글로벌 AI 플랫폼 허깅페이스의 오픈 LLM 리더보드에서 모델의 추론, 상식 추론, 할루시네이션 방지, 컨텍스트 이해, 사실 정확도 등을 아우르는 설계로 74.2점을 기록한 바 있다.

 

이는 솔라 미니가 더 큰 모델과 동등하거나 그 이상의 성능을 발휘해 복잡한 언어 작업을 수생할 수 있는 GPU 비용을 절감할 수 있는 것이다.

 

실제로 이커머스 솔루션 업체 커넥트웨이브는 자사 가격비교 웹사이트인 다나와, 에누리에서 전자상거래 현대화, 배송 추적, 문의, 반품 상담을 자동화하기 위해 14억 개의 제품에 대한 자체 데이터를 솔라 미니로 학습시켜 프라이빗 LLM을 구축했다.

 

에듀테크 기업 콴다는 업스테이지와 협력해 학생들에게 수학 능력을 향상시키는 데 필요한 도구를 제공하고 있다. 솔라 미니를 통해 수학 추론을 토대로 문제를 해결하고 설명과 함수를 공식화할 수 있는 특화 언어 모델을 개발하고 있다.

 


관련기사

22건의 관련기사 더보기

배너