[더테크=전수연 기자] 패션 분야 DX 전문 기업 딜리셔스가 글로벌 컴퓨터 비전 학회에서 인공지능(AI) 이미지 관련 기술 논문을 공개한다.
딜리셔스는 ‘국제 컴퓨터 비전 학회(ICCV, International Conference on Computer Vision)’에서 이미지 검색 AI 기술 논문을 발표한다고 24일 밝혔다. ICCV는 유럽 컴퓨터 비전 학회(ECCV), 컴퓨터 비전 및 패턴인식 학회(CVPR)와 함께 세계 3대 컴퓨터 비전 확회 중 하나로 꼽힌다.
딜리셔스는 올 10월 프랑스 파리에서 개최되는 ICCV 2023 학술대회에서 ‘단일 네트워크로 다중 속성을 이해하는 컨디션 기반 크로스 어텐션 기법(conditional Cross Attention Network for Multi-Space Embedding without Entanglement in Only SINGLE Network)’ 연구 논문을 공개한다.
기존에는 이미지 내 객체의 속성(옷의 색상, 소재, 기장 등)을 이해하고 구분하기 위해 각 속성별 AI 모델이 필요했다. 이번 연구 논문은 세계 최초로 트랜스포머 모델에 맞게 이미지 검색용 속성 가이드를 제시해 ICCV에 채택됐다.
딜리셔스 AI 연구원은 여러 속성 중 구분하고자 하는 기준점의 가이드를 부여해 해당 부분에 집중해 이미지를 인식하는 모델 구조를 설계했다. 예를 들어 옷소매 길이를 기준으로 속성값을 구분하고자 한다면 팔 부분에 더 집중하도록 가이드를 부여하는 것이다. 이 기술은 서버 내 GPU 메모리 사용을 줄이고 속도를 높일 수 있다.
이와 함께 딜리셔스는 트랜스포머 모델의 구조적 특징에 맞는 컨디션 기반 크로스 어텐션 기법을 설계했다. CNN(Convolutional Neural Network) 구조에 맞는 컨디션 기반 어텐션 기법은 기존에 연구됐었지만, 트랜스포머 모델 구조에 최적화된 방법이 제시된 것은 이번 논문이 세계 최초라는 것이 딜리셔스 측 설명이다.