KPI뉴스 - 엔씨소프트-고려대, AI 대화 데이터셋 공개한다

  • 맑음고흥5.5℃
  • 맑음밀양7.3℃
  • 맑음동두천8.7℃
  • 맑음서귀포14.2℃
  • 맑음속초7.8℃
  • 맑음부산12.4℃
  • 맑음포항8.8℃
  • 맑음고창7.0℃
  • 맑음영주4.6℃
  • 맑음강화7.5℃
  • 맑음제주12.6℃
  • 맑음해남5.6℃
  • 맑음홍성8.3℃
  • 맑음파주4.8℃
  • 맑음성산11.5℃
  • 맑음구미6.0℃
  • 맑음통영10.8℃
  • 맑음문경5.4℃
  • 맑음의령군4.2℃
  • 맑음인천11.0℃
  • 맑음경주시5.1℃
  • 맑음북춘천5.9℃
  • 맑음진주5.0℃
  • 맑음목포10.5℃
  • 맑음임실5.4℃
  • 맑음청주12.5℃
  • 맑음군산8.2℃
  • 맑음천안5.7℃
  • 맑음김해시11.2℃
  • 맑음상주6.1℃
  • 맑음제천4.3℃
  • 맑음함양군3.4℃
  • 맑음울진9.0℃
  • 맑음창원11.0℃
  • 맑음양산시10.3℃
  • 맑음정선군4.2℃
  • 맑음북강릉7.4℃
  • 맑음영광군7.5℃
  • 맑음광양시11.1℃
  • 맑음대전9.6℃
  • 맑음보령8.5℃
  • 맑음북창원10.6℃
  • 맑음북부산9.6℃
  • 맑음울산7.9℃
  • 박무백령도7.6℃
  • 맑음흑산도10.8℃
  • 맑음부여6.3℃
  • 맑음충주6.6℃
  • 맑음동해7.2℃
  • 맑음춘천6.4℃
  • 맑음합천5.6℃
  • 맑음이천8.3℃
  • 맑음순천4.4℃
  • 맑음양평8.5℃
  • 맑음광주11.4℃
  • 맑음영천4.4℃
  • 맑음홍천6.8℃
  • 맑음진도군10.5℃
  • 맑음철원6.1℃
  • 맑음여수12.7℃
  • 맑음순창군6.9℃
  • 맑음봉화1.5℃
  • 맑음수원8.0℃
  • 맑음의성3.9℃
  • 맑음대관령3.9℃
  • 맑음금산4.8℃
  • 맑음고산12.5℃
  • 맑음안동4.8℃
  • 맑음인제5.3℃
  • 맑음장흥6.1℃
  • 맑음강진군7.8℃
  • 맑음거제7.5℃
  • 맑음서산6.1℃
  • 맑음남해10.8℃
  • 맑음추풍령4.5℃
  • 맑음서울12.2℃
  • 맑음전주9.3℃
  • 맑음부안8.6℃
  • 맑음서청주6.2℃
  • 맑음고창군7.8℃
  • 맑음영덕4.2℃
  • 맑음남원6.6℃
  • 맑음원주8.4℃
  • 맑음청송군1.5℃
  • 맑음울릉도10.0℃
  • 맑음영월5.6℃
  • 맑음대구7.0℃
  • 맑음정읍7.8℃
  • 맑음거창2.7℃
  • 맑음보성군8.4℃
  • 맑음완도9.4℃
  • 맑음장수2.9℃
  • 맑음보은5.2℃
  • 맑음강릉8.0℃
  • 맑음산청5.1℃
  • 맑음세종8.6℃
  • 맑음태백4.2℃

엔씨소프트-고려대, AI 대화 데이터셋 공개한다

김해욱
기사승인 : 2022-04-14 15:12:25
임희석 교수 연구팀과 공동연구 진행 엔씨소프트가 임희선 고려대학교 교수 연구팀과 공동으로 구축한 AI(인공지능) 대화 데이터 '포커스 데이터셋(FoCus Dataset, For Customized conversation dataset)을 공개했다고 14일 밝혔다.

포커스 데이터셋은 이용자 개인의 페르소나(지혜와 자유의사를 갖는 독립된 인격적 실체)와 외부 지식 모두를 활용하는 세계 최초의 AI 대화 데이터셋이다. 약 8000여 개의 주제를 다룬 1만5000개 이상의 대화로 구성됐다.

▲ 엔씨소프트와 임희석 고려대학교 교수 연구팀이 공동개발한 'FoCus Dataset'(For Customized conversation dataset)의 대화 방식 참고 이미지. [엔씨소프트 제공]

이 데이터셋이 적용된 AI는 대화하는 이용자의 경험, 선호, 소유, 흥미 등을 파악해 위키피디아와 같은 곳에서 이야기 중인 주제에 대해 최신 지식을 실시간으로 습득, 관련 대화가 자연스럽게 이어지도록 한다.

엔씨소프트는 "기존의 일반적인 대용량 언어모델은 학습, 추론에 상당한 비용이 소요됨에도 실시간 지식을 반영하는 것에 한계가 있다"며 "포커스데이터셋은 이러한 거대 언어 모델 없이도 같은 성능의 대화 기술 구현이 가능한 것이 특징"이라고 설명했다.

엔씨소프트와 고려대 공동연구팀은 지난 2월 인공지능 학회 'AAAI 2022'에 참가해 관련 연구 논물을 게재하고 발표한 바 있다. 올해  10월에는 세계 전사언어학회 'COLING 2022'에서 데이터 활용 경진 대회 등의 연구 성과를 공유하는 워크샵을 개최할 예정이다.

이연수 엔씨소프트 랭귀지 에이랩(Language AI Lab) 실장은 "최근 NLP(Language AI Lab) 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 대화 기술들이 제안되고 있다"며 "연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정했고 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이뤄지길 기대한다"고 말했다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱
김해욱

기자의 인기기사