한국어 음성인식기술(ver. 1.2)

◘ FIDELI

한국어 음성인식기술(ver. 1.2)

구봉88 2019. 7. 8. 01:09

기술명

한국어 음성인식기술(ver. 1.2)

기술개요

○  소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 한국어 음성인식 기술을 개발하였음.
○  한국어 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임.
○  다양한 사업모델 창출을 위하여 기술이전을 통하여 관련업체 및 기관에 적극적으로 보급함으로써 관련 시장확대 촉진 및 글로벌 경쟁력을 제고

기술이전목적
및 필요성

○ 한국어 음성인식 기술은 지니톡 대국민 시범서비스 및 평창 올림픽 공식 자동통번역 서비스 지원을 통해 실증 검증을 수행하였으며 자동통역서비스, 인공지능 스피커, 음성 챗봇 서비스, 강의용 음성인식, 스마트홈, 스마트 가전, 군사용 음성인식 등 다양한 응용 분야에서 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함.
○ Google, 뉘앙스 등 글로벌 경쟁기술이 국내 한국어 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함

기술의 특징 및 장점

○  한국어를 대상으로 딥러닝 기술을 활용한 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식
○  음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 부호복원 및 오류수정 기술 등 다양한 요소기술로 구성된 복합기술
○  대화체 문장 등 일상 생활 영역에 특화되었으며, 높은 정밀도의 음성인식 성능 확보
○  API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이
○  ‘지니톡’ 대국민 시범서비스 실시를 통하여 시스템 안정성 및 활용성 확인 완료

기술성숙도(TRL)

단 계 : 8

활용방안 및
기대성과

○ 다양한 응용업체가 한국어 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대
○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고

기술이전 내용 및 범위

○  한국어 연속 음성인식 엔진 (Cento6.0, Ubunt14.04버전 이상, 엔진 라이브러리, 서버-클라이언트 샘플 바이너리, 16kHz 및 8kHz 지원(단, 샘플링 주파수에 따라 별도 기술이전 계약이 필요함)
  - wFST 기반 고속탐색 기술 (최적화된 wFST 이미지를 이용하여 입력 음성을 텍스트로 실시간으로 고속 변환하는 기술)      CPU 기반, core당 1채널 지원       최소 사양 : Intel 2세대 샌디브릿지(2011년 말 출시) AVX(Advanced Vector eXtensions) 지원 CPU
  - 딥러닝 기반 음향모델 (한국어 음성으로부터 음소단위 발음 특성을 학습한 음향모델. 기본 베이스라인 모델 제공)
  - N-gram 기반 언어모델 (한국어 텍스트로부터 단어 간의 문법적 관계를 추출한 통계모델. 기본 베이스라인 모델 제공)
○  엔진 튜닝 도구 (Centos6.0이상 리눅스 이상, 바이너리 제공)
  - 전처리 및 발음변환 기술 (숫자, 심볼 등이 포함된 문장으로부터 한글표현으로 변환하고, 단어의 발음을 추출하는 기술. 단, 특수 코드 등 예외 입력에 대해 별도 처리 필요)
  - 언어모델 튜닝 기술 (새로운 영역에서 추출한 문장표현을 기존 언어모델에 튜닝하는 기술. 오픈소스인 SRI toolkit 이용)
  - 음향모델 튜닝 기술 (새로운 발성환경에서 수집한 음성데이터를 기존 음향모델에 튜닝하는 딥러닝 학습 기술. 오픈소스인 Kaldi 이용)
  - wFST 이미지 최적화 기술 (새로운 음향/언어모델로부터 최적화된 이미지 생성 기술)
○  한국어 음성인식 소프트웨어(기본 베이스라인 음향모델/언어모델 binary 및 음성인식 엔진 튜닝 도구 포함)
○  관련 기술문서 및 지적재산권(별도 기재)

관련지적재산권

레이아웃

특허 2건
1) 음성 인식 시스템 및 방법 (출원번호 : 2017-0047408) 2) 음성인식을 위한 텍스트 정규화 장치 및 그 방법 (출원번호 : 2016-0150610)
한국어 음성인식 엔진튜닝 도구 등 프로그램 3건
한국어 음성인식 후처리 등 기술문서 4건

첨부파일

002설명회 발표자료 (한국어 음성인식기술(ver 1.2)).pptx

기
술
이
전
조
건

실시권 허용범위

비독점적 통상실시권

계약기간

계약체결일로부터 5 년간

기술료조건
(부가세별도)

※ 경상기술료

레이아웃

구분	중소기업	중견기업	대기업
착수기본료(천원)	120,000	240,000	240,000
매출정률사용료(%)	1.25	3.75	5

※중소기업 또는 중견기업 기술료조건을 적용받고자 하는 경우에는 중소기업확인증 또는 중견기업확인증 제출 필요

기술전수교육

1 개월 / 2,157 천원정(부가세별도)

기타특기사항

* 기술료 특수조건
○ 샘플링 주파수 추가 계약의 경우
-  상기 착수 기본료는 샘플링 주파수 8kHz 또는 16kHz 1건에 대한 착수 기본료이며 최초 계약 이후 다른 샘플링 주파수를 추가 계약할 경우 해당 착수 기본료를 중소기업 50,000(천원), 중견기업 및 대기업 100,000(천원)으로 계약함.
  - 샘플링 주파수 8kHz 및 16kHz 동시 계약의 경우 착수기본료를 중소기업 170,000(천원), 중견기업 및 대기업 340,000(천원)으로 계약함
○ 선행 기술에 대한 추가 계약의 경우
-  선행 기술을 이전 또는 출자 받은 업체의 추가 샘플링 주파수 계약의 경우 해당 착수 기본료를 중소기업 50,000(천원), 중견기업 및 대기업 100,000(천원)으로 계약함.
- 선행 기술의 정의
          : 지니톡 대화체 음성인식 기술 2015 - 기술 이전
          : 다국어 음성언어처리 기술(2015) - 기술 출자

세
부
문
의

기술관련

레이아웃

기술개발 발표당시	음성지능연구그룹 윤승 ( 042-860-5835 , syun@etri.re.kr )
현재	지능정보연구본부 윤승 ( 042-860-5835 , syun@etri.re.kr )

계약관련

레이아웃

기술개발 발표당시	기술이전실 김영규 ( 042-860-4960 , kyk@etri.re.kr )
현재	기술이전실 김영규 ( 042-860-4960 , kyk@etri.re.kr )

'◘ FIDELI' 카테고리의 다른 글

상담품질평가를 위한 딥러닝 기반 오픈소스 활용 음성문자변환 엔진 개발 (0)	2019.08.13
딥러닝기반 실시간 표정인식 기술 (0)	2019.07.08
참고 응용 융합 특허 (0)	2019.04.23
참고 공고 (0)	2019.04.17
선정과제 추가 참고 (0)	2019.04.11

현재글한국어 음성인식기술(ver. 1.2)

2022 기술경영의 미래를 함께하는 사람들

창업, 숯불 착화기, 기술개발 지원, 구매조건부, Rnd, 국민발전소기업, 자금지원, 창업지원, 정책자금, 중국유학,

Today :
Yesterday :

2022 기술경영의 미래를 함께하는 사람들