[서울=뉴스프리존]조은정 기자=LG AI연구원은 2월 1일부터 4월까지 '제로샷 이미지 캡셔닝'(Zero-Shot Image Captioning)을 주제로 'LG 글로벌 AI(인공지능) 챌린지'를 온라인 개최한다. 대회는 LG AI연구원과 공동연구센터에서 '엑사원'(EXAONE)을 연구 중인 서울대학교 AI대학원, 이미지 캡셔닝 AI의 상용화 서비스를 공동 준비 중인 셔터스톡이 참여한다.

제로샷 이미지 캡셔닝은 AI가 처음 접하는 요소가 포함된 이미지를 보고 학습한 데이터를 유추해 텍스트로 설명하는 기술이다. 예를 들어 토끼 여러 마리와 고양이 한 마리가 함께 있는 모습을 보고 생김새와 특성의 공통점, 차이점을 학습한 뒤 '토끼도 털은 있지만 고양이와는 다르게 귀가 길고, 뒷다리가 발달했다'고 설명하는 것과 비슷하다.
한편, LG AI연구원은 6월 캐나다 밴쿠버에서 열리는 'CVPR(Computer Vision and Pattern Recognition) 2023' 학회에서 '제로샷 이미지 캡셔닝 평가의 새로운 개척자들'(New Frontiers for Zero-Shot Image Captioning Evaluation)을 주제로 워크샵을 진행한다. LG 글로벌 AI 챌린지 최종 수상팀은 워크샵에서 성과 발표의 기회가 주어진다.
LG AI연구원 김승환 비전랩장은 "LG AI연구원은 현재 생성형 AI 뿐 아니라, 객체를 인식하는 기술 수준을 넘어 인간 수준으로 영상까지 이해하는 AI로 퀀텀 점프할 수 있는 가능성을 확인했다. 이번 대회를 통해 전 세계 AI 연구자들과 함께 연구의 의의와 필요성, 그리고 확장 가능성에 관해 함께 논의하는 장을 만들고자 한다"고 말했다.

기사 잘 보셨나요? 독자님의 응원이 기자에게 큰 힘이 됩니다.
후원회원이 되어주세요. 독자님의 후원금은 모두 기자에게 전달됩니다.
정기후원은 모든 기자들에게 전달됩니다.