[서울=뉴스프리존]조은정 기자=LG AI연구원은 2월 1일부터 4월까지 '제로샷 이미지 캡셔닝'(Zero-Shot Image Captioning)을 주제로 'LG 글로벌 AI(인공지능) 챌린지'를 온라인 개최한다. 대회는 LG AI연구원과 공동연구센터에서 '엑사원'(EXAONE)을 연구 중인 서울대학교 AI대학원, 이미지 캡셔닝 AI의 상용화 서비스를 공동 준비 중인 셔터스톡이 참여한다.

LG의 초거대 멀티모달 AI 엑사원이 생성한 캡션 예시 (자료=LG)
LG의 초거대 멀티모달 AI 엑사원이 생성한 캡션 예시 (자료=LG)

제로샷 이미지 캡셔닝은 AI가 처음 접하는 요소가 포함된 이미지를 보고 학습한 데이터를 유추해 텍스트로 설명하는 기술이다. 예를 들어 토끼 여러 마리와 고양이 한 마리가 함께 있는 모습을 보고 생김새와 특성의 공통점, 차이점을 학습한 뒤 '토끼도 털은 있지만 고양이와는 다르게 귀가 길고, 뒷다리가 발달했다'고 설명하는 것과 비슷하다.

한편, LG AI연구원은 6월 캐나다 밴쿠버에서 열리는 'CVPR(Computer Vision and Pattern Recognition) 2023' 학회에서 '제로샷 이미지 캡셔닝 평가의 새로운 개척자들'(New Frontiers for Zero-Shot Image Captioning Evaluation)을 주제로 워크샵을 진행한다. LG 글로벌 AI 챌린지 최종 수상팀은 워크샵에서 성과 발표의 기회가 주어진다.

LG AI연구원 김승환 비전랩장은 "LG AI연구원은 현재 생성형 AI 뿐 아니라, 객체를 인식하는 기술 수준을 넘어 인간 수준으로 영상까지 이해하는 AI로 퀀텀 점프할 수 있는 가능성을 확인했다. 이번 대회를 통해 전 세계 AI 연구자들과 함께 연구의 의의와 필요성, 그리고 확장 가능성에 관해 함께 논의하는 장을 만들고자 한다"고 말했다.

SNS 기사보내기
뉴스프리존을 응원해주세요.

이념과 진영에서 벗어나 우리의 문제들에 대해 사실에 입각한 해법을 찾겠습니다.
더 나은 세상을 함께 만들어가요.

정기후원 하기
기사제보
저작권자 © 뉴스프리존 무단전재 및 재배포 금지