KPI뉴스 - 엔씨소프트-고려대, AI 대화 데이터셋 공개한다

  • 맑음홍성6.0℃
  • 맑음속초7.2℃
  • 맑음청주11.8℃
  • 맑음대전8.8℃
  • 맑음대구6.4℃
  • 맑음경주시4.4℃
  • 맑음이천7.3℃
  • 맑음동해7.2℃
  • 맑음영덕4.2℃
  • 맑음보성군7.4℃
  • 맑음거창1.8℃
  • 맑음정읍7.3℃
  • 맑음완도10.1℃
  • 맑음울릉도10.0℃
  • 맑음서산6.0℃
  • 맑음고창6.3℃
  • 맑음통영10.1℃
  • 맑음봉화0.6℃
  • 맑음해남5.1℃
  • 맑음제주12.3℃
  • 맑음금산4.3℃
  • 맑음고창군7.4℃
  • 맑음추풍령3.7℃
  • 맑음김해시9.1℃
  • 맑음영월4.6℃
  • 맑음파주4.4℃
  • 맑음부여6.0℃
  • 맑음상주5.0℃
  • 맑음태백3.7℃
  • 맑음원주7.8℃
  • 박무백령도9.3℃
  • 맑음홍천6.0℃
  • 맑음고산12.6℃
  • 맑음서귀포14.6℃
  • 맑음정선군3.7℃
  • 맑음안동5.9℃
  • 맑음인천10.8℃
  • 맑음부산12.4℃
  • 맑음문경4.7℃
  • 맑음광주10.5℃
  • 맑음흑산도10.7℃
  • 맑음청송군0.9℃
  • 맑음성산11.1℃
  • 맑음북춘천5.1℃
  • 맑음수원7.4℃
  • 맑음순천3.9℃
  • 맑음충주5.8℃
  • 맑음부안9.1℃
  • 맑음춘천6.1℃
  • 맑음세종7.8℃
  • 맑음동두천7.8℃
  • 맑음밀양7.6℃
  • 맑음북강릉7.2℃
  • 맑음전주8.8℃
  • 맑음진주4.3℃
  • 맑음여수12.8℃
  • 맑음임실5.2℃
  • 맑음양산시9.3℃
  • 맑음광양시10.4℃
  • 맑음장흥5.2℃
  • 맑음서울11.7℃
  • 맑음영천3.7℃
  • 맑음남원6.2℃
  • 맑음강화5.7℃
  • 맑음남해10.7℃
  • 맑음창원11.7℃
  • 맑음영광군7.0℃
  • 맑음구미5.4℃
  • 맑음의성3.1℃
  • 맑음강진군7.7℃
  • 맑음보은4.1℃
  • 맑음장수2.5℃
  • 맑음합천4.7℃
  • 맑음영주4.0℃
  • 맑음천안5.3℃
  • 맑음고흥5.0℃
  • 맑음함양군2.8℃
  • 맑음보령7.0℃
  • 맑음거제7.5℃
  • 맑음울산7.3℃
  • 맑음목포11.1℃
  • 맑음서청주6.3℃
  • 맑음울진5.9℃
  • 맑음철원5.5℃
  • 맑음군산8.3℃
  • 맑음대관령4.0℃
  • 맑음양평8.2℃
  • 맑음북부산9.9℃
  • 맑음강릉7.5℃
  • 맑음제천3.6℃
  • 맑음순창군6.4℃
  • 맑음진도군10.8℃
  • 맑음인제4.6℃
  • 맑음산청4.5℃
  • 맑음북창원10.2℃
  • 맑음의령군3.5℃
  • 맑음포항8.5℃

엔씨소프트-고려대, AI 대화 데이터셋 공개한다

김해욱
기사승인 : 2022-04-14 15:12:25
임희석 교수 연구팀과 공동연구 진행 엔씨소프트가 임희선 고려대학교 교수 연구팀과 공동으로 구축한 AI(인공지능) 대화 데이터 '포커스 데이터셋(FoCus Dataset, For Customized conversation dataset)을 공개했다고 14일 밝혔다.

포커스 데이터셋은 이용자 개인의 페르소나(지혜와 자유의사를 갖는 독립된 인격적 실체)와 외부 지식 모두를 활용하는 세계 최초의 AI 대화 데이터셋이다. 약 8000여 개의 주제를 다룬 1만5000개 이상의 대화로 구성됐다.

▲ 엔씨소프트와 임희석 고려대학교 교수 연구팀이 공동개발한 'FoCus Dataset'(For Customized conversation dataset)의 대화 방식 참고 이미지. [엔씨소프트 제공]

이 데이터셋이 적용된 AI는 대화하는 이용자의 경험, 선호, 소유, 흥미 등을 파악해 위키피디아와 같은 곳에서 이야기 중인 주제에 대해 최신 지식을 실시간으로 습득, 관련 대화가 자연스럽게 이어지도록 한다.

엔씨소프트는 "기존의 일반적인 대용량 언어모델은 학습, 추론에 상당한 비용이 소요됨에도 실시간 지식을 반영하는 것에 한계가 있다"며 "포커스데이터셋은 이러한 거대 언어 모델 없이도 같은 성능의 대화 기술 구현이 가능한 것이 특징"이라고 설명했다.

엔씨소프트와 고려대 공동연구팀은 지난 2월 인공지능 학회 'AAAI 2022'에 참가해 관련 연구 논물을 게재하고 발표한 바 있다. 올해  10월에는 세계 전사언어학회 'COLING 2022'에서 데이터 활용 경진 대회 등의 연구 성과를 공유하는 워크샵을 개최할 예정이다.

이연수 엔씨소프트 랭귀지 에이랩(Language AI Lab) 실장은 "최근 NLP(Language AI Lab) 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 대화 기술들이 제안되고 있다"며 "연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정했고 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이뤄지길 기대한다"고 말했다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱
김해욱

기자의 인기기사