KPI뉴스 - 텍스트 바꾸면 음성·영상 수정되는 AI기술 나와

  • 맑음서청주14.9℃
  • 맑음남원16.8℃
  • 맑음보성군11.5℃
  • 맑음봉화12.2℃
  • 맑음대구19.2℃
  • 맑음거제16.3℃
  • 구름많음서산13.9℃
  • 맑음천안13.9℃
  • 맑음원주17.2℃
  • 맑음태백13.6℃
  • 구름많음강화12.8℃
  • 맑음안동16.2℃
  • 맑음광주17.3℃
  • 맑음구미17.0℃
  • 구름많음인제17.9℃
  • 맑음흑산도12.1℃
  • 맑음서귀포16.2℃
  • 맑음울진17.6℃
  • 맑음남해14.8℃
  • 구름많음서울16.6℃
  • 맑음부산15.7℃
  • 맑음강릉21.5℃
  • 맑음고산15.1℃
  • 구름많음부여13.0℃
  • 맑음의령군16.9℃
  • 구름많음대관령13.8℃
  • 맑음북부산14.7℃
  • 맑음순천11.6℃
  • 맑음완도13.7℃
  • 맑음전주16.0℃
  • 구름많음동두천14.1℃
  • 맑음경주시17.3℃
  • 맑음북강릉20.4℃
  • 맑음진주14.8℃
  • 맑음영월14.3℃
  • 맑음고창군13.1℃
  • 맑음의성14.4℃
  • 구름많음춘천17.6℃
  • 맑음제주16.3℃
  • 맑음밀양16.1℃
  • 맑음울산14.8℃
  • 맑음거창14.5℃
  • 구름많음속초20.7℃
  • 맑음보령13.0℃
  • 맑음성산15.2℃
  • 맑음정읍13.8℃
  • 맑음울릉도17.1℃
  • 맑음진도군12.5℃
  • 맑음북창원16.4℃
  • 구름많음인천15.8℃
  • 맑음목포15.5℃
  • 맑음산청15.5℃
  • 구름많음철원14.8℃
  • 맑음충주15.1℃
  • 구름많음홍천15.3℃
  • 맑음청주18.7℃
  • 맑음양평17.7℃
  • 맑음부안14.9℃
  • 맑음대전16.8℃
  • 맑음문경18.4℃
  • 맑음제천14.2℃
  • 맑음강진군12.9℃
  • 맑음합천17.5℃
  • 맑음고흥11.2℃
  • 맑음통영15.3℃
  • 흐림백령도14.9℃
  • 맑음양산시14.3℃
  • 맑음포항20.3℃
  • 맑음수원15.0℃
  • 맑음이천17.3℃
  • 맑음고창13.3℃
  • 맑음영덕16.2℃
  • 맑음광양시14.5℃
  • 맑음상주19.3℃
  • 맑음순창군15.3℃
  • 맑음영주17.5℃
  • 맑음여수15.9℃
  • 맑음세종14.9℃
  • 맑음창원15.4℃
  • 맑음장수12.5℃
  • 맑음함양군13.3℃
  • 맑음장흥14.4℃
  • 맑음김해시15.7℃
  • 맑음추풍령16.0℃
  • 맑음영천15.9℃
  • 맑음해남11.2℃
  • 맑음정선군13.7℃
  • 맑음금산14.7℃
  • 맑음동해19.5℃
  • 구름많음파주13.0℃
  • 맑음청송군13.4℃
  • 맑음군산13.7℃
  • 맑음임실12.9℃
  • 맑음홍성14.3℃
  • 맑음영광군13.8℃
  • 맑음보은15.4℃
  • 구름많음북춘천16.9℃

텍스트 바꾸면 음성·영상 수정되는 AI기술 나와

김들풀
기사승인 : 2019-06-11 11:08:33
스탠포드·프린스턴대, 막스플랑크·어도비연구소 등 공동 개발

영화를 찍을 때 배우가 대사를 실수하면 해당 장면을 다시 촬영해야 한다. 그런데 인공지능(AI)이 해당 영상에서 말하고 있는 내용을 텍스트만 바꿔주면 영상과 음성이 동시에 수정되는 기술이 나왔다.

이 기술은 스탠포드대학과 막스플랑크 정보과학연구소, 프린스턴대학, 어도비연구소(Adobe Research) 연구원들이 공동으로 개발했다.

연구 결과는 지난 4일, 코넬대학 공개형 논문 초고 저장소 '아카이브(arXiv.org)'에 '텍스트 기반 음성 및 비디오 편집(Text-based Editing of Talking-head Video)'이라는 제목으로 게재됐다.


다음 동영상을 보면 실제로 어떤식으로 수정할 수 있는지 알 수 있다. 



영상을 보면 여성이"애플의 주가는 종가 191.45달러를 기록했다"라는 대사를 말하고 있다. 이후 해당 문장을 "애플의 주가는 종가 182.25달러를 기록했다"고 수정하자 인공지능 시스템이 여성의 얼굴과 음성을 동시에 편집해 자연스러운 영상으로 수정됐다.


이 기술의 AI 시스템은 동영상을 입력하면 그 음성을 음소에 따라 분해하고 음소는 텍스트와 연결한다. 이후 텍스트를 수정하면 다른 음성에서 필요한 음소를 찾아 수정된 음성을 만들어준다. 이와 동시에 말하고 있는 사람의 얼굴 모델을 생성하고 수정된 음성에 따라 영상을 추적해 합성한다.


▲ 텍스트 기반 음상· 영상 수정 기술 개념도 [아카이브(arXiv.org)] 


이 기술을 응용하면 배우가 영화 촬영에서 불량화면(NG)를 내도 해당 동영상을 쉽게 수정할 수 있어 영상 촬영, 편집과정 등의 비용 절감은 물론 물리적 시간을 현저히 줄일 수 있다.


한편, 지난달 구글 AI 연구팀은 영화의 처음과 마지막 프레임 사이에 중간 프레임을 생성하는 AI를 개발해 공개한 바 있다.

 
KPI뉴스 / 김들풀 전문기자 itnews@kpinews.kr


[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]