셀렉트스타, 세계 최고 AI 학회 ‘EMNLP 2025’ 논문 3편 등재

AI 데이터·신뢰성 기술력 글로벌 인정

 

[더테크 이지영 기자]  AI 데이터 및 신뢰성 검증 전문기업 셀렉트스타 소속 연구진이 참여한 논문 3편이 세계 최고 권위의 자연어처리(NLP) 학회 ‘EMNLP 2025’에 공식 등재됐다.

 

이번 논문 채택은 셀렉트스타가 주력해온 AI 데이터 품질 향상과 신뢰성 검증 기술력을 국제적으로 인정받았다는 점에서 의미가 크다.

 

EMNLP는 국제언어학회(ACL) 산하의 세계 3대 NLP 학회 중 하나로, 매년 글로벌 빅테크와 주요 연구기관의 최신 AI 연구 성과가 발표되는 자리다.

 

올해는 전 세계에서 8,000편 이상이 접수됐으며, 약 39.5%만이 최종 채택되는 높은 경쟁률을 보였다. 셀렉트스타 연구진 5인이 참여한 논문 3편이 모두 통과했으며, 이 중 1편은 상위 22%에 해당하는 메인 논문으로 선정됐다.

 

셀렉트스타는 지난해 EMNLP 2023에서도 2편의 논문이 등재된 바 있어, 이번 성과로 총 5편의 논문을 국제 학회에 발표하게 됐다.

 

이는 국내 민간 AI 데이터 기업으로서는 이례적인 성과로, AI 데이터 신뢰성 검증 분야에서 독보적인 기술 리더십을 확보했다는 평가다.

 

이번에 채택된 논문들은 AI 시대의 핵심 과제인 데이터 편향 최소화, 추론 성능 고도화, 데이터 효율화에 초점을 맞췄다.

 

메인 논문으로 선정된 ‘CoBA: Counterbias Text Augmentation for Mitigating Various Spurious Correlations via Semantic Triples’는 대규모 언어모델을 활용해 자동 텍스트 증강 기술을 제시했다.

 

이를 통해 학습 데이터 내 편향을 완화하고 소수 집단의 표현을 보완해 모델의 공정성과 성능을 동시에 개선했다.

 

‘GRADE: Generating multi-hop QA and fine-gRAined Difficulty matrix for RAG Evaluation’ 논문은 여러 문서를 연속적으로 참조해야 하는 멀티홉 질의응답 구조와 난이도별 평가 프레임워크를 제안했다.

 

이 기술은 RAG 시스템의 추론력과 검색 능력을 정량적으로 평가할 수 있는 새로운 기준을 제시했다는 점에서 주목받았다.

 

또 다른 논문인 ‘CAC-CoT: Connector-Aware Compact Chain-of-Thought for Efficient Reasoning Data Synthesis Across Dual-System Cognitive Tasks’는 기존 연쇄 추론(Chain-of-Thought) 방식의 비효율성을 개선한 데이터 합성 기법을 소개했다.

 

적은 데이터와 자원으로도 고효율의 추론 데이터셋을 생성할 수 있도록 해 AI 학습의 효율성을 극대화했다.

 

셀렉트스타는 이번 연구 성과를 통해 AI 데이터의 편향성과 대규모 언어모델의 추론 신뢰성을 동시에 높일 수 있는 기술적 기반을 마련했다.

 

회사 측은 “논문에서 검증된 핵심 기술들이 향후 국가 차원의 ‘AI 파운데이션 모델 구축 프로젝트'에도 적용될 예정이며, 자사의 AI 신뢰성 검증 솔루션 ‘다투모 이밸'에도 반영해 기술적 확장성을 강화할 것”이라고 설명했다.

 

이번 논문에 참여한 셀렉트스타 연구진은 11월 4일부터 6일까지 중국 쑤저우에서 열리는 EMNLP 2025 학술대회에 참가해 각 논문별 포스터 세션을 진행하고 전 세계 연구자들과 교류에 나설 예정이다.

 

김세엽 셀렉트스타 대표는 “EMNLP 등재는 셀렉트스타의 AI 신뢰성 검증 기술력이 글로벌 학계에서 공인받은 결과”라며 “앞으로도 신뢰 가능한 AI 생태계 구축을 위해 기술 연구와 산업 적용을 지속하겠다”고 말했다.

 



배너