KPI뉴스 - 애플은 못하는 AI 통역…삼성 '갤럭시 AI' 지원 언어 연내 20개로

  • 흐림여수16.9℃
  • 맑음보령9.6℃
  • 맑음원주12.9℃
  • 흐림안동15.3℃
  • 흐림고창11.6℃
  • 맑음부여10.4℃
  • 흐림장흥14.1℃
  • 맑음강화11.9℃
  • 흐림북부산17.6℃
  • 흐림통영17.7℃
  • 맑음동두천10.1℃
  • 흐림경주시17.8℃
  • 구름많음충주13.1℃
  • 흐림진도군12.5℃
  • 흐림천안12.8℃
  • 맑음백령도10.7℃
  • 흐림북창원18.3℃
  • 맑음속초15.0℃
  • 맑음인제11.6℃
  • 흐림함양군15.2℃
  • 구름많음고산13.7℃
  • 흐림구미16.5℃
  • 흐림서청주12.7℃
  • 흐림밀양18.9℃
  • 구름많음보은12.8℃
  • 구름많음금산12.8℃
  • 맑음인천11.9℃
  • 맑음양평13.8℃
  • 맑음동해16.8℃
  • 구름많음목포12.6℃
  • 흐림부산17.6℃
  • 흐림봉화14.1℃
  • 흐림울산17.5℃
  • 구름많음장수11.7℃
  • 구름많음광주13.3℃
  • 맑음제천12.5℃
  • 맑음영월13.2℃
  • 맑음대관령9.5℃
  • 맑음홍성10.6℃
  • 흐림추풍령13.3℃
  • 구름많음대전12.6℃
  • 흐림태백11.9℃
  • 흐림산청16.3℃
  • 흐림양산시18.3℃
  • 맑음춘천11.4℃
  • 흐림김해시17.7℃
  • 흐림청주13.5℃
  • 흐림창원17.5℃
  • 흐림광양시15.7℃
  • 구름많음정읍12.0℃
  • 맑음이천12.3℃
  • 흐림울진16.3℃
  • 맑음영광군11.8℃
  • 흐림남원13.0℃
  • 흐림제주14.8℃
  • 구름많음정선군13.2℃
  • 맑음북강릉13.4℃
  • 비울릉도15.0℃
  • 흐림거제17.4℃
  • 맑음서울11.9℃
  • 맑음수원11.3℃
  • 흐림의령군17.4℃
  • 흐림청송군14.5℃
  • 흐림완도14.1℃
  • 흐림진주16.6℃
  • 흐림성산15.0℃
  • 맑음강릉16.8℃
  • 맑음서산8.6℃
  • 흐림보성군14.9℃
  • 맑음문경13.8℃
  • 흐림임실11.9℃
  • 맑음세종11.1℃
  • 흐림합천17.6℃
  • 맑음파주8.9℃
  • 맑음군산11.1℃
  • 구름많음전주11.4℃
  • 흐림거창15.3℃
  • 흐림순창군13.0℃
  • 흐림영덕16.6℃
  • 흐림해남13.3℃
  • 흐림순천13.6℃
  • 맑음북춘천10.3℃
  • 구름많음영주13.6℃
  • 맑음부안12.3℃
  • 흐림상주14.8℃
  • 흐림강진군13.6℃
  • 흐림남해17.4℃
  • 맑음흑산도11.8℃
  • 흐림의성15.4℃
  • 맑음고창군11.6℃
  • 맑음철원11.9℃
  • 흐림대구15.8℃
  • 흐림포항19.0℃
  • 흐림고흥15.2℃
  • 흐림서귀포16.9℃
  • 맑음홍천12.4℃
  • 흐림영천15.8℃

애플은 못하는 AI 통역…삼성 '갤럭시 AI' 지원 언어 연내 20개로

김윤경 IT전문기자
기사승인 : 2024-06-25 13:19:38
표준언어·방언·성조 연구하며 AI 언어 모델 고도화
전세계 20여 R&D 센터서 언어 모델 연구·개발
문화 이해·지식 갖추도록 갤럭시 AI 기능 개선 추진

삼성전자가 '갤럭시 AI'의 지원 언어를 연내 20개로 확대하며 언어 모델 고도화를 추진한다.

인공지능(AI) 통역 기능은 애플이 구현하지 못한 삼성전자의 고유 경쟁력으로 갤럭시 스마트폰의 최대 강점으로 꼽힌다.
 

▲ 삼성리서치 요르단 연구소(SRJO)의 연구원. [삼성전자 제공]

 

삼성전자는 갤럭시 AI의 언어 모델 고도화를 위해 총 20여 R&D(연구개발) 센터에서 언어 모델 연구·개발에 매진하고 있다고 25일 밝혔다.

R&D센터에서는 세계 여러나라의 표준 언어는 물론 지역 방언까지 연구하며 AI를 통한 통역 및 소통 지원에 주력한다.

현재 갤럭시 AI에서 지원하는 언어는 16개다. 한국어, 중국어(간체), 영어, 프랑스어, 독일어, 힌디어, 이탈리아어, 일본어, 폴란드어, 포르투갈어, 스페인어, 태국어, 베트남어, 아랍어, 인도네시아어, 러시아어에 대한 통·번역이 온디바이스(기기에 기능 내장) 방식으로 제공된다.


삼성전자는 연내 스웨덴어, 네덜란드어, 루마니아어, 튀르키예어를 추가, 총 20개 언어를 지원할 계획이다.
 

▲ 삼성리서치 요르단 연구소의 '갤럭시 AI' 언어 개발 담당자들. [삼성전자 제공]

 

갤럭시 AI 언어 모델은 △언어의 특성과 문법에 대한 정량 평가 △ 문화에 대한 지식과 이해를 검증하는 정성 평가를 거쳐 공개된다.

삼성전자가 특히 공들이는 언어는 아랍어와 베트남어, 스페인어, 인도네시아 언어다. 이들은 전세계 다수가 사용 중이나 방언이 많고 문화적 특수성으로 연구와 이해가 쉽지 않다는 공통점이 있다.

아랍어는 20여개국 4억명 이상이 사용 중인 세계 6번째 보편 언어다. 하지만 현대 표준 아랍어인 풋스하(Fusha)와 일상생활에서 사용하는 방언인 암미야(Ammiyya)를 모두 학습해야 하는 어려움이 있어 통번역에 어려움이 많다. 아랍어 방언은 총 30여 종에 달한다.

갤럭시AI의 아랍어 통번역 기능은 삼성리서치 요르단 연구소(SRJO)가 원어민들로 팀을 구성, 음성 데이터 수집과 텍스트화, 데이터 선별, 고급 모델링 기술을 적용해 세상에 나올 수 있었다.

베트남어도 통번역이 쉽지 않다. 베트남어는 전세계 약 1억명이 사용하지만 무려 여섯 가지의 성조가 있어 미세한 차이 인식이 필수적이다.

삼성리서치 베트남 연구소(SRV)는 한 단어를 0.02초 전후로 자르고 데이터베이스화한 후 이를 정교하게 다듬고 정제하는 과정을 거쳤다.

▲ 삼성리서치 인도네시아 연구소(SRIN) '갤럭시 AI' 언어 연구원들이 통번역 기능을 검수하고 있다. [삼성전자 제공]

 

중남미 공통 언어인 스페인어는 22개국을 특성을 고유하게 반영하고 있어 별도 작업이 필요하다. 대표적으로 수영장이라는 단어를 멕시코는 '알베르카(alberca)', 아르헨티나와 파라과이, 우루과이는 ' 필레타(pileta)', 콜롬비아와 볼리비아, 베네수엘라는 '피시나(piscina)'라고 표현한다.

삼성리서치 브라질 연구소(SRBR)도 중남미 국가의 스페인어 차이를 이해할 수 있도록 각 국가의 오디오와 텍스트 등 방대한 양의 데이터를 수집해 관리하고 지속적으로 개선했다.

인구 2억 8000만 명인 인도네시아 언어는 문장의 맥락 이해에 집중했다.

삼성리서치 인도네시아 연구소(SRIN)는 인간의 뇌가 학습하는 과정과 유사한 '인공신경망번역(NMT)' 방식을 적용, 단어가 아닌 문장 단위로 언어를 학습시켜 갤럭시 AI가 의사소통의 맥락과 규칙을 이해할 수 있도록 했다.

삼성전자 관계자는 "갤럭시 AI가 언어를 넘어 문화 이해력, 지식까지 갖출 수 있도록 기능을 고도화하고 세계인들이 언어장벽 해소를 위해 지원 언어의 수를 지속 확대할 방침"이라고 밝혔다.

 

KPI뉴스 / 김윤경 기자 yoon@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김윤경 IT전문기자
김윤경 IT전문기자
기자 페이지

기자의 인기기사