KPI뉴스 - "생성형 AI 학습데이터 공개 의무화해야"

  • 구름많음북강릉24.9℃
  • 구름많음수원23.0℃
  • 흐림통영22.7℃
  • 구름많음이천24.0℃
  • 구름많음상주24.6℃
  • 구름많음청주25.2℃
  • 맑음울릉도21.4℃
  • 흐림북춘천22.8℃
  • 구름많음순천21.8℃
  • 구름많음영주20.9℃
  • 흐림홍천22.7℃
  • 구름많음남원24.1℃
  • 흐림문경23.5℃
  • 맑음정선군20.4℃
  • 흐림진주22.8℃
  • 흐림인천23.8℃
  • 흐림고산22.7℃
  • 흐림북창원23.4℃
  • 흐림여수22.8℃
  • 흐림정읍23.8℃
  • 흐림서청주23.9℃
  • 흐림제주27.2℃
  • 흐림거제22.8℃
  • 구름많음강화22.1℃
  • 흐림창원22.1℃
  • 흐림의령군23.4℃
  • 흐림안동25.2℃
  • 구름많음울진24.1℃
  • 흐림고흥22.7℃
  • 흐림인제21.4℃
  • 흐림영천24.5℃
  • 흐림구미24.3℃
  • 흐림춘천22.8℃
  • 흐림동두천22.3℃
  • 흐림고창23.0℃
  • 흐림영덕23.4℃
  • 구름많음강릉25.8℃
  • 흐림홍성23.8℃
  • 흐림진도군22.9℃
  • 비서귀포23.7℃
  • 흐림북부산22.9℃
  • 구름많음장흥22.5℃
  • 맑음태백18.5℃
  • 흐림광주23.8℃
  • 흐림서울24.4℃
  • 흐림부산23.2℃
  • 흐림보성군22.9℃
  • 안개흑산도19.8℃
  • 흐림거창23.1℃
  • 흐림보은22.6℃
  • 흐림청송군22.2℃
  • 구름많음해남23.4℃
  • 흐림성산23.6℃
  • 구름많음목포23.4℃
  • 흐림보령24.3℃
  • 흐림포항25.8℃
  • 구름많음장수22.6℃
  • 흐림임실23.2℃
  • 흐림군산24.3℃
  • 구름많음의성22.8℃
  • 구름많음강진군22.7℃
  • 흐림산청22.5℃
  • 흐림대구24.9℃
  • 흐림밀양23.9℃
  • 흐림금산23.8℃
  • 흐림광양시22.9℃
  • 흐림추풍령21.6℃
  • 맑음동해23.4℃
  • 흐림양평24.1℃
  • 흐림전주25.2℃
  • 흐림대전24.6℃
  • 구름많음부안23.9℃
  • 흐림서산23.5℃
  • 흐림울산23.2℃
  • 흐림부여23.7℃
  • 흐림고창군23.1℃
  • 흐림합천23.5℃
  • 흐림김해시22.9℃
  • 흐림양산시23.6℃
  • 흐림제천21.8℃
  • 흐림완도22.7℃
  • 구름많음파주21.6℃
  • 흐림경주시23.8℃
  • 흐림영월21.8℃
  • 구름많음원주25.3℃
  • 구름많음봉화19.4℃
  • 구름많음철원23.2℃
  • 구름많음충주25.0℃
  • 흐림남해22.6℃
  • 흐림영광군23.1℃
  • 흐림속초23.5℃
  • 흐림천안23.6℃
  • 구름많음순창군23.7℃
  • 구름많음대관령17.5℃
  • 흐림함양군23.3℃
  • 흐림세종23.7℃
  • 구름많음백령도21.9℃

"생성형 AI 학습데이터 공개 의무화해야"

김채연 기자
기사승인 : 2024-12-16 16:07:14
언론단체, AI기본법안 의견서 제출

한국신문협회·한국신문방송편집인협회·한국기자협회·한국인터넷신문협회·한국온라인신문협회 등 언론 5개 단체는 16일 국회 과학기술정보방송통신위원회·법제사법위원회, 문화체육관광부 등에 '인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안(과방위 대안)'에 대한 의견서를 제출하고, 인공지능(AI) 사업자의 학습데이터 공개 의무화를 촉구했다.

 

▲ 한국인터넷신문협회 로고

 

언론단체는 의견서에서 이번 제정안이 AI 사업자가 지켜야 할 투명성, 안전성, 의무사항과 딥페이크 범죄 예방을 위한 AI 생성물 워터마크 의무화 등을 규정한 것은 적절한 조치라고 평가했다.

 

그러나 언론단체는 "생성형 AI 사업자가 AI 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관하고 공개하도록 하는 규정이 빠져있다"고 지적했다.

 

특히 "학습데이터 공개를 의무화하지 않는 것은 생성형 AI 사업자의 데이터 무단 이용을 허용해 저작권자의 권리를 심각하게 침해하게 된다"고 우려했다.

 

또한 "저작권자는 자신의 저작물이 어디에, 어떻게 사용됐는지 알 권리를 잃게 될 뿐만 아니라, 정당한 대가 요구도 어려워진다"고 설명했다.

 

언론단체는 이에 따라 "생성형 AI 사업자가 최대한 학습 데이터를 투명하게 밝히고 저작권자가 열람할 수 있도록 해야 한다"며 "생성형 AI 사업자 입장에서도 본인들의 기술에 대한 신뢰도를 높이려면 학습 데이터와 학습 방식 등을 투명하게 공개하는 것이 바람직하다"고 강조했다.

 

이어 AI기본법안 제31조(인공지능 투명성 확보 의무)에 다음 조항을 신설할 것을 제안했다.

 

△ 인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관해야 하며, 이를 공개하여야 한다. 공개에 관하여 필요한 사항은 대통령령으로 정한다.

 

△ 인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 대해 저작권자가 열람을 요청할 경우 관련 자료를 제공하여야 한다.

 

끝으로 언론단체는 생성형 AI 학습데이터 공개 의무화의 근거로 미국과 EU의 사례를 들었다. 미국은 2024년 4월 하원에서 발의된 '학습데이터 공개에 관한 법안'을 통해 학습데이터 요약본을 저작권청에 제출하도록 하고 있다. EU도 지난 3월 제정한 'AI법'에서 AI 기업들이 학습 및 훈련 과정에서 사용한 데이터에 대한 상세 내용을 공개하도록 규정하고 있다.

 

다음은 '인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안(과방위 대안)'에 대한 언론단체 의견서 전문.

 

'인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안

(과방위 대안)'에 대한 언론단체 의견서

 

▢ 이번 제정안(AI기본법안)은 AI 사업자가 지켜야 할 투명성, 안전성, 의무 등 AI 시대 신뢰기반을 조성하기 위한 기본 사항과 AI 기술이 악용돼 발생할 수 있는 딥페이크 범죄를 예방하기 위해 AI 생성물에 '워터마크'(식별 표시)를 의무화하도록 하고 있습니다.

 

▢ 이는 생성형AI의 환각 현상과 편향성을 예방하기 위한 적절한 조치라고 봅니다.

 

▢ 생성형 AI의 생성물이 신뢰성을 확보하기 위해서는 학습용 데이터의 품질이 무엇보다 중요합니다. 또한 가장 믿을 수 있는 고품질의 데이터는 언론사가 생산하는 뉴스 콘텐츠입니다.

 

▢ 하지만 이번 제정안은 생성형AI의 학습데이터와 학습 방법 공개 등에 관한 사항이 빠져 있습니다. 어떤 데이터를 학습했는지 불투명한 상황에서 AI 생성물의 품질을 신뢰하기 어렵습니다.

 

▢ 학습데이터 공개를 의무화하지 않는 것은 기술기업의 데이터 무단 이용을 허용해 결국 저작권자의 권리를 심각하게 침해하게 됩니다.

 

▢ 저작권자는 자신의 저작물이 어디에, 어떻게, 어떤 방식으로 사용됐고 결과물에는 어떤 방식으로 작용하게 되는지에 관해 알 권리를 잃게 됩니다. 뿐만아니라 기술기업이 학습데이터를 공개하지 않은 상황에서 저작권자는 정당한 대가 요구가 어려워집니다.

 

▢ 따라서 생성형AI 기업이 최대한 학습 데이터를 투명하게 밝히고 저작권자가 열람할 수 있도록 해야 합니다.

 

▢ 생성형AI 기업 입장에서도 AI 결과물의 신뢰도를 높이려면 학습 데이터와 학습 방식 등을 투명하게 공개하는 것이 바람직합니다.

 

▢ 미국의 경우 2024년 4월 하원에서 발의된 '학습데이터 공개에 관한 법안(Generative AI Copyright Disclosure Act of 2024, H.R.7913, Schiff 의원 발의)'은 학습데이터의 요약(summary)을 미국 US Copyright Office(USCO)의 장(Register)에게 제출하는 형태로 학습데이터를 공개하도록 하고 있음을 참고할 필요가 있습니다.

 

▢ EU도 지난 3월 제정한 'AI법(AI Act)'에서 AI 기업들이 EU의 저작권법을 준수하고 AI모델 학습 및 훈련 과정에서 사용한 데이터에 대한 상세한 내용을 공개하도록 하고 있습니다.

 

▢ 따라서, 이번 제정안을 다음과 같이 개정해야 합니다.

 

 

현행

개정 의견

15(인공지능 학습용데이터 관련 시책의 수립 등)

~(생 략)

<신 설>

 

 

 

 

(생 략)

(생 략)

15(인공지능 학습용데이터 관련 시책의 수립 등)

~ 좌 동

과학기술정보통신부장관은 통합제공시스템에 학습용데이터를 제공하는 원저작권자의 권리를 보호하고, 합리적인 저작권 제공의 대가 산정 기준을 만들어 대가를 지급해야 한다.

좌 동

좌 동

27(인공지능 윤리원칙 등) 정부는 인공지능윤리의 확산을 위하여 다음 각 호의 사항을 포함하는 인공지능 윤리원칙(이하 "윤리원칙"이라 한다)을 대통령령으로 정하는 바에 따라 제정ㆍ공표할 수 있다.

1. ~ 3. (생 략)

4. <신 설>

27(인공지능 윤리원칙 등) 정부는 인공지능윤리의 확산을 위하여 다음 각 호의 사항을 포함하는 인공지능 윤리원칙(이하 "윤리원칙"이라 한다)을 대통령령으로 정하는 바에 따라 제정ㆍ공표할 수 있다.

1. ~ 3. 좌 동

4. 인공지능 기술이 불러올 법적·제도적·윤리적 분쟁이 최소화될 수 있도록 인공지능사업자 및 해당 단체 종사자 등에 대한 지침 마련 및 교육

31(인공지능 투명성 확보 의무)

인공지능사업자는 고영향 인공지능 또는 생성형 인공지능을 이용한 제품 또는 서비스를 제공하려는 경우 제품 또는 서비스가 해당 인공지능에 기반하여 운용된다는 사실을 이용자에게 사전에 고지하여야 한다.

<신 설>

 

 

 

 

<신 설>

 

 

 

(생 략)

(생 략)

(생 략)

31(인공지능 투명성 확보 의무)

좌 동

 

 

 

 

 

인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관해야 하며, 이를 공개하여야 한다. 공개에 관하여 필요한 사항은 대통령령으로 정한다.

인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 대해 저작권자가 열람을 요청할 경우 관련 자료를 제공하여야 한다.

좌 동

좌 동

좌 동

 

 

 KPI뉴스 / 김채연 기자 cykim01@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김채연 기자
김채연 기자
기자 페이지

기자의 인기기사