KPI뉴스 - 애플은 못하는 AI 통역…삼성 '갤럭시 AI' 지원 언어 연내 20개로

  • 흐림부여22.9℃
  • 흐림봉화20.7℃
  • 흐림양평23.4℃
  • 흐림의령군20.7℃
  • 흐림경주시20.5℃
  • 흐림대구21.1℃
  • 흐림문경22.8℃
  • 흐림장수22.1℃
  • 흐림진도군21.4℃
  • 흐림제천21.6℃
  • 흐림고흥20.4℃
  • 흐림구미23.5℃
  • 흐림울진18.8℃
  • 흐림청송군22.3℃
  • 흐림광주22.6℃
  • 비부산21.2℃
  • 흐림인제22.4℃
  • 흐림서산24.7℃
  • 흐림북강릉18.9℃
  • 흐림북창원21.7℃
  • 흐림장흥20.4℃
  • 흐림보령23.1℃
  • 흐림순천19.5℃
  • 흐림거제19.7℃
  • 흐림합천20.8℃
  • 비제주23.2℃
  • 흐림밀양22.5℃
  • 흐림군산23.0℃
  • 흐림보성군21.0℃
  • 비북부산21.6℃
  • 흐림완도22.2℃
  • 흐림부안23.8℃
  • 흐림고산20.8℃
  • 흐림서청주23.8℃
  • 흐림추풍령21.2℃
  • 흐림이천24.1℃
  • 흐림속초18.8℃
  • 흐림산청20.2℃
  • 흐림철원23.5℃
  • 흐림상주22.5℃
  • 흐림수원25.0℃
  • 흐림성산21.9℃
  • 흐림영덕19.2℃
  • 흐림동두천24.4℃
  • 흐림거창20.7℃
  • 흐림안동22.7℃
  • 흐림통영19.6℃
  • 흐림고창22.6℃
  • 흐림홍천23.3℃
  • 흐림강릉19.0℃
  • 흐림영주21.6℃
  • 비흑산도19.9℃
  • 흐림대전24.2℃
  • 흐림대관령17.6℃
  • 흐림포항19.8℃
  • 흐림보은22.8℃
  • 흐림청주25.3℃
  • 구름많음울릉도19.6℃
  • 비여수20.1℃
  • 흐림고창군22.9℃
  • 흐림양산시22.0℃
  • 흐림홍성25.1℃
  • 흐림춘천23.9℃
  • 흐림의성23.2℃
  • 흐림광양시20.8℃
  • 흐림전주24.0℃
  • 흐림순창군21.8℃
  • 흐림서울25.1℃
  • 흐림태백17.9℃
  • 흐림임실20.9℃
  • 흐림남해20.4℃
  • 흐림북춘천24.0℃
  • 흐림진주20.2℃
  • 비서귀포22.1℃
  • 흐림세종23.9℃
  • 흐림영월22.8℃
  • 흐림김해시20.9℃
  • 흐림동해19.1℃
  • 흐림인천24.5℃
  • 비창원20.7℃
  • 흐림충주24.1℃
  • 흐림금산22.9℃
  • 흐림정읍23.9℃
  • 흐림영천21.3℃
  • 흐림천안23.8℃
  • 흐림강화23.7℃
  • 흐림해남21.7℃
  • 흐림영광군22.2℃
  • 흐림함양군21.3℃
  • 흐림목포21.7℃
  • 흐림파주24.3℃
  • 흐림강진군21.0℃
  • 흐림울산20.0℃
  • 구름많음백령도23.2℃
  • 흐림정선군20.5℃
  • 흐림남원21.9℃
  • 흐림원주23.8℃

애플은 못하는 AI 통역…삼성 '갤럭시 AI' 지원 언어 연내 20개로

김윤경
기사승인 : 2024-06-25 13:19:38
표준언어·방언·성조 연구하며 AI 언어 모델 고도화
전세계 20여 R&D 센터서 언어 모델 연구·개발
문화 이해·지식 갖추도록 갤럭시 AI 기능 개선 추진

삼성전자가 '갤럭시 AI'의 지원 언어를 연내 20개로 확대하며 언어 모델 고도화를 추진한다.

인공지능(AI) 통역 기능은 애플이 구현하지 못한 삼성전자의 고유 경쟁력으로 갤럭시 스마트폰의 최대 강점으로 꼽힌다.
 

▲ 삼성리서치 요르단 연구소(SRJO)의 연구원. [삼성전자 제공]

 

삼성전자는 갤럭시 AI의 언어 모델 고도화를 위해 총 20여 R&D(연구개발) 센터에서 언어 모델 연구·개발에 매진하고 있다고 25일 밝혔다.

R&D센터에서는 세계 여러나라의 표준 언어는 물론 지역 방언까지 연구하며 AI를 통한 통역 및 소통 지원에 주력한다.

현재 갤럭시 AI에서 지원하는 언어는 16개다. 한국어, 중국어(간체), 영어, 프랑스어, 독일어, 힌디어, 이탈리아어, 일본어, 폴란드어, 포르투갈어, 스페인어, 태국어, 베트남어, 아랍어, 인도네시아어, 러시아어에 대한 통·번역이 온디바이스(기기에 기능 내장) 방식으로 제공된다.


삼성전자는 연내 스웨덴어, 네덜란드어, 루마니아어, 튀르키예어를 추가, 총 20개 언어를 지원할 계획이다.
 

▲ 삼성리서치 요르단 연구소의 '갤럭시 AI' 언어 개발 담당자들. [삼성전자 제공]

 

갤럭시 AI 언어 모델은 △언어의 특성과 문법에 대한 정량 평가 △ 문화에 대한 지식과 이해를 검증하는 정성 평가를 거쳐 공개된다.

삼성전자가 특히 공들이는 언어는 아랍어와 베트남어, 스페인어, 인도네시아 언어다. 이들은 전세계 다수가 사용 중이나 방언이 많고 문화적 특수성으로 연구와 이해가 쉽지 않다는 공통점이 있다.

아랍어는 20여개국 4억명 이상이 사용 중인 세계 6번째 보편 언어다. 하지만 현대 표준 아랍어인 풋스하(Fusha)와 일상생활에서 사용하는 방언인 암미야(Ammiyya)를 모두 학습해야 하는 어려움이 있어 통번역에 어려움이 많다. 아랍어 방언은 총 30여 종에 달한다.

갤럭시AI의 아랍어 통번역 기능은 삼성리서치 요르단 연구소(SRJO)가 원어민들로 팀을 구성, 음성 데이터 수집과 텍스트화, 데이터 선별, 고급 모델링 기술을 적용해 세상에 나올 수 있었다.

베트남어도 통번역이 쉽지 않다. 베트남어는 전세계 약 1억명이 사용하지만 무려 여섯 가지의 성조가 있어 미세한 차이 인식이 필수적이다.

삼성리서치 베트남 연구소(SRV)는 한 단어를 0.02초 전후로 자르고 데이터베이스화한 후 이를 정교하게 다듬고 정제하는 과정을 거쳤다.

▲ 삼성리서치 인도네시아 연구소(SRIN) '갤럭시 AI' 언어 연구원들이 통번역 기능을 검수하고 있다. [삼성전자 제공]

 

중남미 공통 언어인 스페인어는 22개국을 특성을 고유하게 반영하고 있어 별도 작업이 필요하다. 대표적으로 수영장이라는 단어를 멕시코는 '알베르카(alberca)', 아르헨티나와 파라과이, 우루과이는 ' 필레타(pileta)', 콜롬비아와 볼리비아, 베네수엘라는 '피시나(piscina)'라고 표현한다.

삼성리서치 브라질 연구소(SRBR)도 중남미 국가의 스페인어 차이를 이해할 수 있도록 각 국가의 오디오와 텍스트 등 방대한 양의 데이터를 수집해 관리하고 지속적으로 개선했다.

인구 2억 8000만 명인 인도네시아 언어는 문장의 맥락 이해에 집중했다.

삼성리서치 인도네시아 연구소(SRIN)는 인간의 뇌가 학습하는 과정과 유사한 '인공신경망번역(NMT)' 방식을 적용, 단어가 아닌 문장 단위로 언어를 학습시켜 갤럭시 AI가 의사소통의 맥락과 규칙을 이해할 수 있도록 했다.

삼성전자 관계자는 "갤럭시 AI가 언어를 넘어 문화 이해력, 지식까지 갖출 수 있도록 기능을 고도화하고 세계인들이 언어장벽 해소를 위해 지원 언어의 수를 지속 확대할 방침"이라고 밝혔다.

 

KPI뉴스 / 김윤경 기자 yoon@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김윤경
김윤경

기자의 인기기사