KPI뉴스 - "말하면 바로 찾아준다"…UNIST, 5초만에 사물 인식하는 AI기술 개발

  • 흐림해남21.1℃
  • 구름많음홍천22.8℃
  • 흐림완도20.6℃
  • 비여수21.0℃
  • 구름많음인제22.9℃
  • 맑음파주23.9℃
  • 흐림장수18.6℃
  • 흐림대관령17.6℃
  • 구름많음속초18.7℃
  • 흐림울진21.4℃
  • 흐림순창군20.2℃
  • 구름많음수원21.4℃
  • 흐림영주22.1℃
  • 비울산19.7℃
  • 맑음철원23.1℃
  • 흐림충주21.3℃
  • 흐림양산시21.8℃
  • 흐림부안19.5℃
  • 흐림제주20.8℃
  • 흐림영월21.7℃
  • 구름많음목포20.8℃
  • 흐림봉화21.0℃
  • 흐림흑산도20.6℃
  • 흐림북강릉18.5℃
  • 흐림북창원22.0℃
  • 흐림고창20.0℃
  • 구름많음이천22.7℃
  • 흐림안동22.0℃
  • 흐림광양시20.4℃
  • 흐림성산20.5℃
  • 흐림청송군21.6℃
  • 흐림강릉18.9℃
  • 흐림장흥20.7℃
  • 맑음동두천24.0℃
  • 흐림김해시20.7℃
  • 비창원22.0℃
  • 구름많음보령23.6℃
  • 흐림광주21.1℃
  • 흐림남원19.5℃
  • 흐림영천20.8℃
  • 맑음강화23.2℃
  • 흐림경주시20.8℃
  • 비북부산21.5℃
  • 흐림진주20.7℃
  • 흐림양평22.9℃
  • 흐림세종21.1℃
  • 흐림전주20.2℃
  • 흐림대전21.9℃
  • 흐림울릉도20.3℃
  • 흐림통영21.3℃
  • 흐림동해20.1℃
  • 흐림순천19.0℃
  • 흐림부산20.9℃
  • 흐림거제21.6℃
  • 흐림구미22.6℃
  • 흐림정읍20.2℃
  • 흐림정선군22.0℃
  • 흐림밀양21.1℃
  • 구름많음서울23.8℃
  • 흐림대구21.5℃
  • 흐림포항20.0℃
  • 흐림고산19.3℃
  • 구름많음춘천23.5℃
  • 흐림영덕20.1℃
  • 흐림서청주20.6℃
  • 흐림서귀포22.7℃
  • 흐림금산20.4℃
  • 흐림추풍령19.7℃
  • 흐림보성군21.2℃
  • 흐림거창20.9℃
  • 흐림임실19.4℃
  • 흐림군산20.0℃
  • 흐림함양군20.6℃
  • 구름많음북춘천23.3℃
  • 흐림청주21.7℃
  • 구름많음홍성22.8℃
  • 흐림남해21.2℃
  • 구름많음천안21.3℃
  • 흐림산청20.2℃
  • 흐림태백18.6℃
  • 구름많음서산21.2℃
  • 흐림의령군21.4℃
  • 흐림강진군20.8℃
  • 흐림합천20.9℃
  • 흐림고창군20.0℃
  • 구름많음원주21.4℃
  • 흐림상주21.6℃
  • 흐림의성22.6℃
  • 흐림문경21.4℃
  • 맑음인천23.3℃
  • 흐림제천21.2℃
  • 흐림영광군20.0℃
  • 맑음백령도16.4℃
  • 흐림진도군19.5℃
  • 흐림부여21.2℃
  • 흐림보은21.0℃
  • 흐림고흥19.8℃

"말하면 바로 찾아준다"…UNIST, 5초만에 사물 인식하는 AI기술 개발

최재호 기자
기사승인 : 2026-06-08 08:58:43
초고속·초경량 자연어 기반 3D 공간 인식 기술
기존보다 최대 400배 빠르고 메모리 64배 절감

증강현실 화면이나 로봇이 보는 3차원 공간에서 사용자가 원하는 물체를 텍스트 입력으로 찾아내는 인공지능 기술이 울산과학기술원 연구팀에 의해 새롭게 개발됐다. 

 

▲ 주경돈 교수(왼쪽)와 방재훈 연구원. [울산과기원 제공]

 

'흰색 소파' '라면 위 달걀'과 같은 텍스트를 입력하면, AI가 3D 복원 공간 안에서 해당 물체의 위치와 영역을 찾아낸다. 메모리 효율과 처리 속도를 크게 높여 로봇이 물체를 실시간으로 파악하거나, 증강현실 화면에서 원하는 대상을 바로 선택하고 편집할 수 있게 됐다.


UNIST는 인공지능대학원 주경돈 교수팀이 사용자가 입력한 다양한 말이나 문장을 바탕으로 AI가 3D 복원 공간 속 대상을 찾아내는 '오픈어휘 기반 3D 공간 인식 기술'인 'LightSplat'을 개발했다고 8일 밝혔다.


로봇이나 증강현실 기술에서는 카메라로 들어온 2D 이미지를 기계가 인식할 수 있는 위치·색·투명도 정보를 가진 작은 점 입자(가우시안)들이 모인 3D 공간으로 복원한다. 3D 공간 인식은 이렇게 복원된 공간에서 어떤 물체가 어디에 있고, 어느 영역을 차지하는지를 찾는 기술이다.


연구팀이 개발한 기술은 사용자가 입력한 자연어를 기반으로 3D 공간에서 대상을 찾아내는 오픈어휘 3D 공간 인식 기술이다. 의자, 책상, 문처럼 미리 정해진 범주의 물체만 찾는 방식과 달리, '흰색 소파'나 '라면 위 달걀'처럼 더 구체적이고 다양한 표현을 통해 원하는 대상을 찾을 수 있다.


이 기술은 기존 오픈어휘 3D 공간 인식 기술 대비 메모리 사용량을 64분의 1 수준으로 낮췄다. 또 3D 가우시안에 의미 정보를 연결해 사람이 쓰는 자연어로 검색할 수 있는 상태로 만드는 시간도 약 5초로 줄였는데, 이는 기존 최신 기술보다 50~400배 빠른 속도다.

 

기존 기술이 3D 공간의 각 점 입자마다 긴 숫자 형태의 언어 특징값을 저장하는 것과 달리, LightSplat은 각 점 입자에 2바이트짜리 짧은 인덱스만 붙인 덕분이다. 

 

▲ [연구그림] ScanNet 데이터셋을 이용한 3D 의미 분할 실험 결과. 라면 위의 달걀, 찻잔, 주걱 등을 기존보다 더 정확하게 인식하는 것을 보여주는 그림. [유니스트 제공]

 

실제 의미 정보는 별도 표에 저장해두고 필요할 때 인덱스를 통해 찾아보는 방식이라, 3D 공간을 표현하는 데 필요한 메모리를 크게 줄일 수 있다. 또 인덱스를 붙일 때는 실제 물체를 표현하는 데 영향을 주는 점만 골라 붙이고, 서로 다른 이미지에 흩어진 같은 물체 정보는 하나로 묶어 3D 공간을 자연어로 검색 가능한 상태로 만드는 시간을 줄였다.


메모리 사용량과 검색 준비 시간을 줄였음에도 인식 성능은 기존 기술보다 뛰어났다. LERF-OVS와 DL3DV-OVS 데이터셋을 각각 이용한 실험에서, 라면 위에 올라간 달걀이나 유리잔에 담긴 차처럼 작은 대상부터, 멀리 있는 자동차, 사무실 가구처럼 크기와 배치가 다른 물체까지 또렷하게 구분해 낼 수 있었다. 또 ScanNet의 3D 의미 분할 실험에서는 19개 분류 기준 mIoU 37.11을 기록했다. mIoU는 AI가 찾은 물체 영역이 실제 정답 영역과 얼마나 겹치는지를 보는 지표다.


제1저자인 방재훈 연구원은 "오픈어휘 3D 사물 인식 기술을 실제로 쓰려면 정확도뿐 아니라 속도와 메모리 효율을 함께 확보해야 한다는 점에서 이번 연구는 의미 있는 성과"라고 설명했다.


주경돈 교수는 "사람의 말로 지시를 바로 수행할 수 있는 인간-기계 상호작용이 강화된 로봇 개발, 텍스트로 대상을 바로 지정해 편집을 돕는 AR·VR 콘텐츠 제작, 디지털 트윈 기술 등에 적용 가능할 것"이라고 기대했다.


연구 수행은 과학기술정보통신부 및 정보통신기획평가원(IITP)의 인공지능대학원 지원사업(UNIST), AI Star Fellowship Program, LG AI STAR Talent Development Program for Leading Large-Scale Generative AI Models in the Physical AI Domain, 과학기술정보통신부 InnoCORE 사업 등의 지원을 받아 이뤄졌다.


연구 결과는 컴퓨터 비전 분야 최고 권위 학회인 CVPR 2026(Conference on Computer Vision and Pattern Recognition)에 채택됐다. CVPR 2026은 지난 6월 3일부터 5일간 미국 덴버에서 열렸다.

 

KPI뉴스 / 최재호 기자 choijh1992@kpinews.kr  

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]