로고
  • 로그인
  • 회원가입
  • 경제금융
  • 산업IT
    • 산업
    • IT/과학
    • 중소기업
    • 자동차
  • 라이프
    • 생활일반
    • 제약바이오
    • 패션뷰티
    • 여행레저
  • 연예
    • 방송
    • 영화
    • 음악
    • 해외연예
    • 일반
  • 프로야구
    • 야구
    • 해외야구
  • 해외축구
    • 해외축구
    • 축구
  • 스포츠
    • 배구
    • 농구
    • 골프
    • e스포츠
    • 격투기
    • 스포츠종합
  • 사진/영상
    • 연예
    • 스포츠
    • 경제산업
    • 영상
  • 랭킹빌더
  • 다음 공유
  • 페이스북 공유
  • 유튜브 공유
  • 검
검색
마이데일리 메뉴닫기
  • 최신기사

  • 경제금융

  • 산업IT

    • 산업
    • IT/과학
    • 중소기업
    • 자동차
  • 라이프

    • 생활일반
    • 제약바이오
    • 패션뷰티
    • 여행레저
  • 사회

    • 사회일반
    • 지역
    • 보건
  • 연예

    • 방송
    • 영화
    • 음악
    • 해외연예
    • 일반
  • 스포츠

    • 배구
    • 농구
    • 골프
    • e스포츠
    • 격투기
    • 스포츠종합
  • 프로야구

    • 야구
    • 해외야구
  • 해외축구

    • 해외축구
    • 축구
  • 화제

  • 오피니언

  • 기자연재

  • 사진/영상

    • 연예
    • 스포츠
    • 라이프
    • 영상
  • 돈버는퀴즈

  • 랭킹빌더

IT일반

카카오, 통합 멀티모달 언어모델 ‘카나나-o’ 성능 공개

시간2025-05-01 10:09:46 박성규 기자 psk@mydaily.co.kr
  • 0
  • 가
  • 가
  • 카카오톡에 공유하기카카오톡
  • 페이스북에 공유하기페이스북
  • 트위터 공유하기트위터
  • 네이버블로그에 공유하기URL복사
  • 네이버블로그에 공유하기네이버블로그
URL복사

카카오가 통합 멀티모달 언어모델 ‘카나나-o’와 오디오 언어모델 ‘카나나-a’의 성능과 개발 후기를 공개했다. /카카오
카카오가 통합 멀티모달 언어모델 ‘카나나-o’와 오디오 언어모델 ‘카나나-a’의 성능과 개발 후기를 공개했다. /카카오

[마이데일리 = 박성규 기자] 카카오가 통합 멀티모달 언어모델 ‘카나나-o’와 오디오 언어모델 ‘카나나-a’의 성능과 개발 후기를 공개했다고 1일 밝혔다.

카나나-o는 국내 첫 텍스트와 음성, 이미지까지 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 모델이다. 텍스트, 음성, 이미지 중 어떠한 조합으로 질문을 입력하더라도 처리 가능하며, 상황에 맞는 텍스트나 자연스러운 음성으로 응답 가능한 구조로 설계됐다.

카카오는 모델 병합 기술을 기반으로 이미지 처리에 특화된 모델 ‘카나나-v’와 오디오 이해 및 생성에 특화된 ‘카나나-a’ 모델을 통합, 단기간 내 효율적으로 카나나-o를 개발했다.

통합 후에는 이미지, 오디오, 텍스트 데이터를 동시에 학습하는 병합 학습을 통해 시각과 청각 정보를 동시에 이해하고, 텍스트와 연결 지을 수 있도록 통합 훈련을 거쳤다. 이러한 과정을 통해 기존 LLM 구조에서 이미지 이해 능력과 음성 인식과 합성, 감정 이해 등 고도화된 오디오 능력을 확장시킨 통합 멀티모달 언어모델이 구현됐다.

이러한 개발 과정을 거친 카나나-o는 음성 감정 인식 기술을 통해 사용자의 의도를 올바르게 해석하고, 상황에 맞는 적절한 반응과 답변을 제공해준다.

대규모 한국어 데이터셋을 활용해 한국어의 특수한 발화 구조, 억양, 어미 변화 등을 정밀하게 반영하기도 했다. 스트리밍 방식의 음성합성 기술을 적용해 사용자가 긴 대기 시간 없이 응답을 제공하는 강점도 보유했다.

카나나-o는 한국어 및 영어 벤치마크에서 글로벌 최고 모델들과 유사 수준을 기록했으며, 한국어 벤치마크에서는 높은 우위를 보였다.

카카오는 향후 카나나-o를 통해 △다중 턴 대화 처리 △양방향 데이터 동시 송수신 기술 대응 능력 강화 △부적절한 응답 방지를 위한 안전성 확보 등을 목표로 연구 개발을 지속해 갈 계획이다.

김병학 카카오 카나나 성과리더는 “독자적인 멀티모달 기술을 바탕으로 자사 인공지능 기술 경쟁력을 강화하는 한편, 지속적 연구 결과 공유를 통해 국내 AI 생태계 발전에 꾸준히 기여할 계획”이라고 말했다.

박성규 기자 psk@mydaily.co.kr
- ⓒ마이데일리(www.mydaily.co.kr). 무단전재&재배포 금지 -

  • 썸네일

    '영국남자♥' 국가비, 딸 줄리와 다정한 투샷… 입 주변 잔뜩 묻히고도 ‘해맑’

  • 썸네일

    박하선, 늘씬 수영복 몸매로 "수영 좋아, (류)수영" 넘치는 남편사랑

  • 썸네일

    신현준, "장군의 아들 20세 꽃미모 소환... 좋은 배우는 좋은 사람"

  • 썸네일

    나혜미, 생후 3개월 둘째 공개…♥에릭 "내 강아지들 심쿵"

댓글

등록

[ 300자 이내 / 현재: 0자 ]

현재 총 0개의 댓글이 있습니다.

많이 본 뉴스

  • ‘이상순♥’ 이효리 “섹시한거 보다 이게 더 좋아, 그래야 오래 가”

  • 박보검, 양관식 그 자체…"내 딸이 남친과 여행? 절대 NO" [1박 2일]

  • 나혜미, 생후 3개월 둘째 공개…♥에릭 "내 강아지들 심쿵"

  • 박하선 "'하이킥' 신세경 役 불합격…노안이라 떨어져" [아형]

  • 신현준, "장군의 아들 20세 꽃미모 소환... 좋은 배우는 좋은 사람"

베스트 추천

  • '영국남자♥' 국가비, 딸 줄리와 다정한 투샷… 입 주변 잔뜩 묻히고도 ‘해맑’

  • 임영웅, 아이돌차트 평점랭킹 218주 연속 1위 '역대급 기록 매주 경신'

  • 박하선, 늘씬 수영복 몸매로 "수영 좋아, (류)수영" 넘치는 남편사랑

  • 신현준, "장군의 아들 20세 꽃미모 소환... 좋은 배우는 좋은 사람"

다른 사람들이 많이 본 기사

  • 70kg 감량 후 급사과한 방송인, 왜?

  • 입마개 안 한 개에 물린 초등2학년 딸

  • 방송에서 훌러덩 퍼포먼스 펼친 대세여돌

  • 틈만 나면 뽀뽀한다는 연예인 잉꼬부부

  • 살 빼려다 진짜 죽을 뻔했다는 유명 연예인

해외이슈

  • 썸네일

    ‘유튜브 대박→몸값 상승’ 추성훈, 여기까지 갔다

  • 썸네일

    “바람 피운 휴 잭맨은 배신자”, 이혼소송 13살 연상 전부인 열받았다[해외이슈]

기자 연재

  • 썸네일

    김치피자탕수육 같은, 따끈한 '하이파이브' [강다윤의 프리뷰]

  • 썸네일

    '김연경 떠나보내는 아쉬움'에 한동안 움직이지 않았지만…감독과 선수로의 마지막 인사 [곽경훈의 현장]

인터뷰

  • 썸네일

    '소주전쟁' 바이런 만 "이제훈, 영어 대사 힘들었을 텐데…진지하고 꼼꼼해" [MD인터뷰②]

  • 썸네일

    '소주전쟁' 바이런 만 "캐스팅 제의 잘못 온 줄…대본 읽고 흥미 높아져" [MD인터뷰①]

  • 썸네일

    '하이파이브' 이재인 "흥행 공약? 무대인사서 발차기…연습 좀 했다" [MD인터뷰②]

  • 썸네일

    '하이파이브' 이재인 "개봉까지 꽤 걸려…달라진 모습 위해 5kg 감량" [MD인터뷰②]

  • 회사소개
  • 고객센터
  • 광고·제휴문의
  • 이용약관
  • 개인정보취급방침
  • 이메일무단수집거부
  • 사이트맵
  • RSS 서비스
마이데일리

등록번호 : 서울 아00063 | 등록일 : 2005년 9월 15일 | 발행일자 : 2004년 11월 29일 | 발행·편집인 : 이석희
청소년 보호 책임자 : 김민희 마이데일리(주) 서울시 중구 을지로 11길 15, 408호 마이데일리 (수표동, 동화빌딩)(우: 04543)
편집국대표전화 : 02-785-2935 | 전략기획실대표전화 : 02-785-2932
마이데일리의 모든 콘텐츠(사진,영상,기사)는 저작권법의 보호를 받은 바, 무단 전재와 복사, 배포,
자동화된 수단(로봇·봇, 스크래퍼 등)을 이용한 수집 등을 금합니다.