KPI뉴스 - 텍스트 바꾸면 음성·영상 수정되는 AI기술 나와

  • 흐림함양군21.9℃
  • 흐림의성23.4℃
  • 구름많음정읍25.7℃
  • 맑음북강릉21.0℃
  • 흐림문경23.6℃
  • 맑음속초22.0℃
  • 흐림울진20.3℃
  • 맑음서울28.3℃
  • 구름많음부여25.4℃
  • 흐림남해21.9℃
  • 구름많음천안25.2℃
  • 흐림북부산21.0℃
  • 구름많음홍성26.4℃
  • 구름많음서산26.9℃
  • 구름많음보은21.4℃
  • 흐림부안26.1℃
  • 흐림순창군23.5℃
  • 흐림상주22.5℃
  • 흐림북창원22.0℃
  • 흐림보성군23.3℃
  • 흐림양산시22.0℃
  • 구름많음대전24.4℃
  • 맑음이천27.3℃
  • 흐림포항20.3℃
  • 흐림진도군22.6℃
  • 구름많음전주25.7℃
  • 흐림안동22.8℃
  • 맑음영월27.5℃
  • 구름많음금산23.3℃
  • 구름많음고창군24.3℃
  • 흐림합천22.7℃
  • 흐림고산21.8℃
  • 구름많음청주26.3℃
  • 흐림진주23.1℃
  • 흐림순천21.0℃
  • 흐림경주시19.5℃
  • 흐림장흥22.2℃
  • 맑음동해20.8℃
  • 흐림의령군23.1℃
  • 맑음동두천28.8℃
  • 흐림통영21.1℃
  • 구름많음보령27.2℃
  • 맑음춘천26.9℃
  • 구름많음광주25.5℃
  • 비울릉도19.8℃
  • 구름많음해남22.5℃
  • 흐림대구20.8℃
  • 구름많음목포23.1℃
  • 구름많음임실23.3℃
  • 흐림영천20.8℃
  • 맑음인제25.2℃
  • 맑음대관령17.9℃
  • 흐림여수21.1℃
  • 흐림울산19.5℃
  • 구름많음고창25.5℃
  • 박무흑산도22.6℃
  • 흐림청송군20.5℃
  • 맑음철원28.2℃
  • 맑음봉화22.2℃
  • 구름많음영광군24.2℃
  • 맑음양평26.6℃
  • 맑음정선군22.9℃
  • 흐림성산20.0℃
  • 비제주21.0℃
  • 맑음제천24.7℃
  • 흐림구미23.4℃
  • 맑음백령도24.3℃
  • 구름많음강진군22.4℃
  • 구름많음군산25.4℃
  • 맑음북춘천26.8℃
  • 흐림광양시21.6℃
  • 흐림추풍령20.7℃
  • 맑음원주27.5℃
  • 흐림장수20.2℃
  • 맑음강릉21.8℃
  • 맑음충주26.9℃
  • 구름많음영주24.0℃
  • 맑음홍천26.1℃
  • 맑음강화26.9℃
  • 흐림거제20.8℃
  • 맑음수원27.4℃
  • 흐림거창22.1℃
  • 구름많음서청주25.2℃
  • 흐림밀양23.9℃
  • 흐림완도22.6℃
  • 흐림영덕18.8℃
  • 흐림부산21.5℃
  • 구름많음세종24.4℃
  • 맑음인천28.7℃
  • 맑음파주29.2℃
  • 흐림김해시21.2℃
  • 흐림산청21.2℃
  • 비서귀포19.9℃
  • 맑음태백19.2℃
  • 흐림고흥22.1℃
  • 구름많음남원23.4℃
  • 흐림창원21.5℃

텍스트 바꾸면 음성·영상 수정되는 AI기술 나와

김들풀
기사승인 : 2019-06-11 11:08:33
스탠포드·프린스턴대, 막스플랑크·어도비연구소 등 공동 개발

영화를 찍을 때 배우가 대사를 실수하면 해당 장면을 다시 촬영해야 한다. 그런데 인공지능(AI)이 해당 영상에서 말하고 있는 내용을 텍스트만 바꿔주면 영상과 음성이 동시에 수정되는 기술이 나왔다.

이 기술은 스탠포드대학과 막스플랑크 정보과학연구소, 프린스턴대학, 어도비연구소(Adobe Research) 연구원들이 공동으로 개발했다.

연구 결과는 지난 4일, 코넬대학 공개형 논문 초고 저장소 '아카이브(arXiv.org)'에 '텍스트 기반 음성 및 비디오 편집(Text-based Editing of Talking-head Video)'이라는 제목으로 게재됐다.


다음 동영상을 보면 실제로 어떤식으로 수정할 수 있는지 알 수 있다. 



영상을 보면 여성이"애플의 주가는 종가 191.45달러를 기록했다"라는 대사를 말하고 있다. 이후 해당 문장을 "애플의 주가는 종가 182.25달러를 기록했다"고 수정하자 인공지능 시스템이 여성의 얼굴과 음성을 동시에 편집해 자연스러운 영상으로 수정됐다.


이 기술의 AI 시스템은 동영상을 입력하면 그 음성을 음소에 따라 분해하고 음소는 텍스트와 연결한다. 이후 텍스트를 수정하면 다른 음성에서 필요한 음소를 찾아 수정된 음성을 만들어준다. 이와 동시에 말하고 있는 사람의 얼굴 모델을 생성하고 수정된 음성에 따라 영상을 추적해 합성한다.


▲ 텍스트 기반 음상· 영상 수정 기술 개념도 [아카이브(arXiv.org)] 


이 기술을 응용하면 배우가 영화 촬영에서 불량화면(NG)를 내도 해당 동영상을 쉽게 수정할 수 있어 영상 촬영, 편집과정 등의 비용 절감은 물론 물리적 시간을 현저히 줄일 수 있다.


한편, 지난달 구글 AI 연구팀은 영화의 처음과 마지막 프레임 사이에 중간 프레임을 생성하는 AI를 개발해 공개한 바 있다.

 
KPI뉴스 / 김들풀 전문기자 itnews@kpinews.kr


[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]