KPI뉴스 - 엔씨소프트-고려대, AI 대화 데이터셋 공개한다

  • 맑음완도22.8℃
  • 맑음목포18.8℃
  • 맑음고창군23.1℃
  • 맑음광양시22.4℃
  • 맑음광주22.1℃
  • 맑음상주19.5℃
  • 맑음이천20.1℃
  • 맑음문경19.8℃
  • 맑음울릉도16.7℃
  • 맑음고흥21.4℃
  • 맑음거제20.7℃
  • 맑음북강릉20.6℃
  • 맑음속초14.1℃
  • 맑음영광군22.2℃
  • 맑음해남22.6℃
  • 맑음영월20.7℃
  • 맑음정읍22.2℃
  • 구름많음서귀포21.5℃
  • 맑음안동20.5℃
  • 맑음전주22.3℃
  • 맑음흑산도19.6℃
  • 맑음금산20.8℃
  • 맑음북춘천20.5℃
  • 맑음홍천20.8℃
  • 맑음청주22.1℃
  • 맑음태백20.8℃
  • 맑음남해19.0℃
  • 맑음영주20.2℃
  • 맑음충주21.1℃
  • 맑음양평19.2℃
  • 맑음창원21.0℃
  • 맑음동해15.9℃
  • 맑음포항17.8℃
  • 맑음양산시23.2℃
  • 맑음보은20.0℃
  • 맑음동두천22.2℃
  • 맑음인천20.7℃
  • 맑음김해시22.3℃
  • 맑음서청주20.7℃
  • 맑음철원21.0℃
  • 맑음강진군23.0℃
  • 맑음부안22.5℃
  • 맑음파주20.6℃
  • 맑음제천19.2℃
  • 맑음구미20.1℃
  • 맑음경주시21.0℃
  • 맑음통영21.0℃
  • 맑음북창원22.4℃
  • 맑음부산22.2℃
  • 맑음고창23.1℃
  • 맑음의령군19.9℃
  • 맑음춘천19.9℃
  • 맑음부여21.1℃
  • 맑음대관령20.4℃
  • 맑음밀양21.6℃
  • 맑음청송군21.9℃
  • 맑음강화20.4℃
  • 맑음순천22.6℃
  • 맑음서산22.0℃
  • 맑음남원21.1℃
  • 맑음홍성22.9℃
  • 맑음보령18.6℃
  • 맑음여수19.5℃
  • 맑음정선군21.4℃
  • 맑음순창군21.8℃
  • 맑음봉화20.9℃
  • 맑음산청21.5℃
  • 맑음서울22.3℃
  • 맑음울산19.5℃
  • 맑음인제20.7℃
  • 맑음대구19.6℃
  • 맑음영천20.8℃
  • 맑음합천21.1℃
  • 구름많음고산17.6℃
  • 맑음의성21.7℃
  • 맑음울진16.4℃
  • 맑음진주20.4℃
  • 맑음천안20.7℃
  • 맑음백령도15.3℃
  • 맑음세종20.9℃
  • 맑음성산18.3℃
  • 맑음장수21.5℃
  • 맑음장흥22.2℃
  • 맑음수원21.3℃
  • 맑음임실22.8℃
  • 맑음영덕19.4℃
  • 맑음대전21.7℃
  • 맑음보성군20.1℃
  • 맑음추풍령20.8℃
  • 맑음거창21.5℃
  • 맑음진도군20.4℃
  • 맑음원주21.6℃
  • 맑음제주18.5℃
  • 맑음북부산23.1℃
  • 맑음군산20.8℃
  • 맑음함양군21.5℃
  • 맑음강릉20.0℃

엔씨소프트-고려대, AI 대화 데이터셋 공개한다

김해욱
기사승인 : 2022-04-14 15:12:25
임희석 교수 연구팀과 공동연구 진행 엔씨소프트가 임희선 고려대학교 교수 연구팀과 공동으로 구축한 AI(인공지능) 대화 데이터 '포커스 데이터셋(FoCus Dataset, For Customized conversation dataset)을 공개했다고 14일 밝혔다.

포커스 데이터셋은 이용자 개인의 페르소나(지혜와 자유의사를 갖는 독립된 인격적 실체)와 외부 지식 모두를 활용하는 세계 최초의 AI 대화 데이터셋이다. 약 8000여 개의 주제를 다룬 1만5000개 이상의 대화로 구성됐다.

▲ 엔씨소프트와 임희석 고려대학교 교수 연구팀이 공동개발한 'FoCus Dataset'(For Customized conversation dataset)의 대화 방식 참고 이미지. [엔씨소프트 제공]

이 데이터셋이 적용된 AI는 대화하는 이용자의 경험, 선호, 소유, 흥미 등을 파악해 위키피디아와 같은 곳에서 이야기 중인 주제에 대해 최신 지식을 실시간으로 습득, 관련 대화가 자연스럽게 이어지도록 한다.

엔씨소프트는 "기존의 일반적인 대용량 언어모델은 학습, 추론에 상당한 비용이 소요됨에도 실시간 지식을 반영하는 것에 한계가 있다"며 "포커스데이터셋은 이러한 거대 언어 모델 없이도 같은 성능의 대화 기술 구현이 가능한 것이 특징"이라고 설명했다.

엔씨소프트와 고려대 공동연구팀은 지난 2월 인공지능 학회 'AAAI 2022'에 참가해 관련 연구 논물을 게재하고 발표한 바 있다. 올해  10월에는 세계 전사언어학회 'COLING 2022'에서 데이터 활용 경진 대회 등의 연구 성과를 공유하는 워크샵을 개최할 예정이다.

이연수 엔씨소프트 랭귀지 에이랩(Language AI Lab) 실장은 "최근 NLP(Language AI Lab) 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 대화 기술들이 제안되고 있다"며 "연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정했고 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이뤄지길 기대한다"고 말했다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱
김해욱

기자의 인기기사