KPI뉴스 - 카카오브레인, 이미지 생성 AI모델 '알큐트랜스포머' 오픈소스로 공개

  • 맑음속초7.2℃
  • 맑음강릉7.5℃
  • 맑음동두천7.8℃
  • 맑음부안9.1℃
  • 맑음서귀포14.6℃
  • 맑음보령7.0℃
  • 맑음보은4.1℃
  • 맑음영천3.7℃
  • 맑음전주8.8℃
  • 맑음부여6.0℃
  • 맑음성산11.1℃
  • 맑음창원11.7℃
  • 맑음봉화0.6℃
  • 맑음추풍령3.7℃
  • 맑음흑산도10.7℃
  • 맑음울산7.3℃
  • 맑음순천3.9℃
  • 맑음남원6.2℃
  • 맑음제주12.3℃
  • 맑음해남5.1℃
  • 맑음남해10.7℃
  • 맑음북부산9.9℃
  • 맑음순창군6.4℃
  • 맑음울릉도10.0℃
  • 맑음광양시10.4℃
  • 맑음제천3.6℃
  • 박무백령도9.3℃
  • 맑음동해7.2℃
  • 맑음고창6.3℃
  • 맑음북강릉7.2℃
  • 맑음장흥5.2℃
  • 맑음문경4.7℃
  • 맑음영주4.0℃
  • 맑음대전8.8℃
  • 맑음상주5.0℃
  • 맑음양산시9.3℃
  • 맑음의령군3.5℃
  • 맑음의성3.1℃
  • 맑음군산8.3℃
  • 맑음여수12.8℃
  • 맑음서산6.0℃
  • 맑음밀양7.6℃
  • 맑음포항8.5℃
  • 맑음구미5.4℃
  • 맑음양평8.2℃
  • 맑음홍성6.0℃
  • 맑음영광군7.0℃
  • 맑음금산4.3℃
  • 맑음춘천6.1℃
  • 맑음북춘천5.1℃
  • 맑음보성군7.4℃
  • 맑음대관령4.0℃
  • 맑음서울11.7℃
  • 맑음임실5.2℃
  • 맑음태백3.7℃
  • 맑음강진군7.7℃
  • 맑음함양군2.8℃
  • 맑음거창1.8℃
  • 맑음영월4.6℃
  • 맑음천안5.3℃
  • 맑음안동5.9℃
  • 맑음충주5.8℃
  • 맑음정선군3.7℃
  • 맑음청송군0.9℃
  • 맑음장수2.5℃
  • 맑음합천4.7℃
  • 맑음파주4.4℃
  • 맑음인천10.8℃
  • 맑음서청주6.3℃
  • 맑음수원7.4℃
  • 맑음완도10.1℃
  • 맑음대구6.4℃
  • 맑음청주11.8℃
  • 맑음광주10.5℃
  • 맑음원주7.8℃
  • 맑음고흥5.0℃
  • 맑음세종7.8℃
  • 맑음목포11.1℃
  • 맑음울진5.9℃
  • 맑음진주4.3℃
  • 맑음산청4.5℃
  • 맑음정읍7.3℃
  • 맑음강화5.7℃
  • 맑음영덕4.2℃
  • 맑음경주시4.4℃
  • 맑음고산12.6℃
  • 맑음이천7.3℃
  • 맑음북창원10.2℃
  • 맑음진도군10.8℃
  • 맑음거제7.5℃
  • 맑음홍천6.0℃
  • 맑음철원5.5℃
  • 맑음부산12.4℃
  • 맑음통영10.1℃
  • 맑음김해시9.1℃
  • 맑음고창군7.4℃
  • 맑음인제4.6℃

카카오브레인, 이미지 생성 AI모델 '알큐트랜스포머' 오픈소스로 공개

김해욱
기사승인 : 2022-04-19 11:06:22
지난해 공개했던 모델보다 2배 성능 향상
6월 CVPR 2022에서 관련 논문 발표
카카오브레인이 이미지 생성 AI(인공지능) 모델인 '알큐트랜스포머(RQ-Transformer)'를 오픈소스 커뮤니티 '깃허브'(GitHub)에 공개했다고 19일 밝혔다.

알큐트랜스포머는 텍스트를 입력하면 그에 맞는 이미지를 출력해 주는 역할을 한다. 2021년 12월에 공개했던 초거대 멀티모달(multimodal, 다모드) 인공지능인 'minDALL-E'(민달리)의 업그레이드 버전이다. 모델의 크기는 과거에 비해 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘어났다.

▲ 카카오브레인이 이미지 생성 AI(인공지능)모델 'RQ-Transformer'를 오픈소스 커뮤니티인 '깃허브'(GitHub)에 공개했다. [카카오브레인 제공]

카카오는 "3D프린터처럼 형상을 만들어내는 방식을 AI모델에 적용했다고 생각하면 된다"며 "이미지 압축으로 인한 손실이 적고 이미지 출력 계산에 들어가는 시간과 비용도 줄였다"고 설명했다. 이어 "독자 개발 기술을 기반으로 앞으로도 적은 비용으로 더 많은 데이터를 학습할 수 있도록 연구 개발을 이어나갈 것"이라고 했다.

'minDALL-E'와는 달리 RQ-Transformer는 카카오브레인의 독자 기술로 개발됐다. 고해상도 이미지를 2차원 코드맵으로 표현한 과거와 달리 RQ-Transformer는 3차원의 코드맵으로 표현됐다.

카카오브레인은 오는 6월에 열릴 'CVPR 2022'(국제 컴퓨터 비전 및 패턴인식 학술대회)에서 RQ-Transformer 기술 관련 논문을 발표할 예정이다.

김일두 카카오브레인 대표는 "카카오브레인이 공개한 AI 모델은 인간과 컴퓨터가 자유롭게 대화하는 미래를 향해 나아가는 첫 시작일 것"이라고 말했다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱
김해욱

기자의 인기기사