◘ FIDELI

한국어 음성인식기술(ver. 1.2)

구봉88 2019. 7. 8. 01:09
기술명 한국어 음성인식기술(ver. 1.2)
 기술개요○  소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 한국어 음성인식 기술을 개발하였음.
○  한국어 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○  다양한 사업모델 창출을 위하여 기술이전을 통하여 관련업체 및 기관에 적극적으로 보급함으로써 관련 시장확대 촉진 및 글로벌 경쟁력을 제고
 기술이전목적
및 필요성

○  한국어 음성인식 기술은 지니톡 대국민 시범서비스 및 평창 올림픽 공식 자동통번역 서비스 지원을 통해 실증 검증을 수행하였으며 자동통역서비스, 인공지능 스피커, 음성 챗봇 서비스, 강의용 음성인식, 스마트홈, 스마트 가전, 군사용 음성인식 등 다양한 응용 분야에서 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○  Google, 뉘앙스 등 글로벌 경쟁기술이 국내 한국어 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함
 기술의 특징 및 장점○  한국어를 대상으로 딥러닝 기술을 활용한 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식
○  음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 부호복원 및 오류수정 기술 등 다양한 요소기술로 구성된 복합기술
○  대화체 문장 등 일상 생활 영역에 특화되었으며, 높은 정밀도의 음성인식 성능 확보
○  API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이
○  ‘지니톡’ 대국민 시범서비스 실시를 통하여 시스템 안정성 및 활용성 확인 완료
 기술성숙도(TRL)단 계 : 8     기술성숙도(TRL)
 활용방안 및
기대성과

○  다양한 응용업체가 한국어 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○  ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고
 기술이전 내용 및 범위○  한국어 연속 음성인식 엔진 (Cento6.0, Ubunt14.04버전 이상, 엔진 라이브러리, 서버-클라이언트 샘플 바이너리, 16kHz 및 8kHz 지원(단, 샘플링 주파수에 따라 별도 기술이전 계약이 필요함)
  - wFST 기반 고속탐색 기술 (최적화된 wFST 이미지를 이용하여 입력 음성을 텍스트로 실시간으로 고속 변환하는 기술)      CPU 기반, core당 1채널 지원       최소 사양 : Intel 2세대 샌디브릿지(2011년 말 출시) AVX(Advanced Vector eXtensions) 지원 CPU
  - 딥러닝 기반 음향모델 (한국어 음성으로부터 음소단위 발음 특성을 학습한 음향모델. 기본 베이스라인 모델 제공)
  - N-gram 기반 언어모델 (한국어 텍스트로부터 단어 간의 문법적 관계를 추출한 통계모델. 기본 베이스라인 모델 제공)
○  엔진 튜닝 도구 (Centos6.0이상 리눅스 이상, 바이너리 제공)
  - 전처리 및 발음변환 기술 (숫자, 심볼 등이 포함된 문장으로부터 한글표현으로 변환하고, 단어의 발음을 추출하는 기술. 단, 특수 코드 등 예외 입력에 대해 별도 처리 필요) 
  - 언어모델 튜닝 기술 (새로운 영역에서 추출한 문장표현을 기존 언어모델에 튜닝하는 기술. 오픈소스인 SRI toolkit 이용)
  - 음향모델 튜닝 기술 (새로운 발성환경에서 수집한 음성데이터를 기존 음향모델에 튜닝하는 딥러닝 학습 기술. 오픈소스인 Kaldi 이용)
  - wFST 이미지 최적화 기술 (새로운 음향/언어모델로부터 최적화된 이미지 생성 기술)
○  한국어 음성인식 소프트웨어(기본 베이스라인 음향모델/언어모델 binary 및 음성인식 엔진 튜닝 도구 포함)
○  관련 기술문서 및 지적재산권(별도 기재)
관련지적재산권
레이아웃
특허 2
1) 음성 인식 시스템 및 방법
   (출원번호 : 2017-0047408) 
2) 음성인식을 위한 텍스트 정규화 장치 및 그 방법
   (출원번호 : 2016-0150610) 
한국어 음성인식 엔진튜닝 도구 등 프로그램 3
한국어 음성인식 후처리기술문서 4
 첨부파일 002설명회 발표자료 (한국어 음성인식기술(ver 1.2)).pptx





실시권 허용범위비독점적 통상실시권
계약기간계약체결일로부터 5 년간
기술료조건
(부가세별도)
※ 경상기술료
레이아웃
구분중소기업중견기업대기업
착수기본료(천원)120,000 240,000 240,000
매출정률사용료(%)1.253.755
※중소기업 또는 중견기업 기술료조건을 적용받고자 하는 경우에는 중소기업확인증 또는 중견기업확인증 제출 필요
기술전수교육1  개월  /  2,157 천원정(부가세별도)
기타특기사항* 기술료 특수조건
○ 샘플링 주파수 추가 계약의 경우
 -  상기 착수 기본료는 샘플링 주파수 8kHz 또는 16kHz 1건에 대한 착수 기본료이며 최초 계약 이후 다른 샘플링 주파수를 추가 계약할 경우 해당 착수 기본료를 중소기업 50,000(천원), 중견기업 및 대기업 100,000(천원)으로 계약함.
  - 샘플링 주파수 8kHz 및 16kHz 동시 계약의 경우 착수기본료를 중소기업 170,000(천원), 중견기업 및 대기업 340,000(천원)으로 계약함
○ 선행 기술에 대한 추가 계약의 경우
 -  선행 기술을 이전 또는 출자 받은 업체의 추가 샘플링 주파수 계약의 경우 해당 착수 기본료를 중소기업 50,000(천원), 중견기업 및 대기업 100,000(천원)으로 계약함.
 - 선행 기술의 정의
          : 지니톡 대화체 음성인식 기술 2015 - 기술 이전
          : 다국어 음성언어처리 기술(2015) - 기술 출자



기술관련
레이아웃
기술개발
발표당시
음성지능연구그룹 윤승 ( 042-860-5835 , syun@etri.re.kr )
현재 지능정보연구본부 윤승 ( 042-860-5835 , syun@etri.re.kr )
계약관련
레이아웃
기술개발
발표당시
기술이전실 김영규 ( 042-860-4960 , kyk@etri.re.kr )
현재 기술이전실 김영규 ( 042-860-4960 , kyk@etri.re.kr )