기술명 | 한국어 음성인식기술(ver. 1.2) | ||||||||||||||
기술개요 | ○ 소프트웨어콘텐츠연구소 지능정보연구본부 음성지능연구그룹에서는 한국어 음성인식 기술을 개발하였음. ○ 한국어 음성인식 기술은 딥러닝 기술 및 대용량 데이터에 기반하여 실현되는 고난이도 융복합 기술임. ○ 다양한 사업모델 창출을 위하여 기술이전을 통하여 관련업체 및 기관에 적극적으로 보급함으로써 관련 시장확대 촉진 및 글로벌 경쟁력을 제고 | ||||||||||||||
기술이전목적 및 필요성 | ○ 한국어 음성인식 기술은 지니톡 대국민 시범서비스 및 평창 올림픽 공식 자동통번역 서비스 지원을 통해 실증 검증을 수행하였으며 자동통역서비스, 인공지능 스피커, 음성 챗봇 서비스, 강의용 음성인식, 스마트홈, 스마트 가전, 군사용 음성인식 등 다양한 응용 분야에서 상용화 수준에 이르렀다고 판단하여 기술이전을 실시하고자 함. ○ Google, 뉘앙스 등 글로벌 경쟁기술이 국내 한국어 음성 인식 시장을 선점하기 이전에 기술이전을 실시하여 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 함 | ||||||||||||||
기술의 특징 및 장점 | ○ 한국어를 대상으로 딥러닝 기술을 활용한 명령어 및 자연어 기반의 대어휘 음성인식 및 대화체 연속 음성을 인식 ○ 음향모델링, 언어모델링, 디코딩, 음성검출, 음성특징추출, 문장코퍼스 정제기술, 시스템 통합기술, 부호복원 및 오류수정 기술 등 다양한 요소기술로 구성된 복합기술 ○ 대화체 문장 등 일상 생활 영역에 특화되었으며, 높은 정밀도의 음성인식 성능 확보 ○ API규격 및 활용예제 코드 제공으로 용도별 클라이언트 응용프로그램 개발 용이 ○ ‘지니톡’ 대국민 시범서비스 실시를 통하여 시스템 안정성 및 활용성 확인 완료 | ||||||||||||||
기술성숙도(TRL) | 단 계 : 8 | ||||||||||||||
활용방안 및 기대성과 | ○ 다양한 응용업체가 한국어 음성 인식 기술 관련 비즈니스 모델을 개발하게 함으로서 국내외 SW산업 신시장 창출 기대 ○ ETRI는 기술이전업체와 공동으로 기술 상용화 시 문제점을 공유하고 해결 노력을 기울임으로써 기술의 완성도를 제고 | ||||||||||||||
기술이전 내용 및 범위 | ○ 한국어 연속 음성인식 엔진 (Cento6.0, Ubunt14.04버전 이상, 엔진 라이브러리, 서버-클라이언트 샘플 바이너리, 16kHz 및 8kHz 지원(단, 샘플링 주파수에 따라 별도 기술이전 계약이 필요함) - wFST 기반 고속탐색 기술 (최적화된 wFST 이미지를 이용하여 입력 음성을 텍스트로 실시간으로 고속 변환하는 기술) CPU 기반, core당 1채널 지원 최소 사양 : Intel 2세대 샌디브릿지(2011년 말 출시) AVX(Advanced Vector eXtensions) 지원 CPU - 딥러닝 기반 음향모델 (한국어 음성으로부터 음소단위 발음 특성을 학습한 음향모델. 기본 베이스라인 모델 제공) - N-gram 기반 언어모델 (한국어 텍스트로부터 단어 간의 문법적 관계를 추출한 통계모델. 기본 베이스라인 모델 제공) ○ 엔진 튜닝 도구 (Centos6.0이상 리눅스 이상, 바이너리 제공) - 전처리 및 발음변환 기술 (숫자, 심볼 등이 포함된 문장으로부터 한글표현으로 변환하고, 단어의 발음을 추출하는 기술. 단, 특수 코드 등 예외 입력에 대해 별도 처리 필요) - 언어모델 튜닝 기술 (새로운 영역에서 추출한 문장표현을 기존 언어모델에 튜닝하는 기술. 오픈소스인 SRI toolkit 이용) - 음향모델 튜닝 기술 (새로운 발성환경에서 수집한 음성데이터를 기존 음향모델에 튜닝하는 딥러닝 학습 기술. 오픈소스인 Kaldi 이용) - wFST 이미지 최적화 기술 (새로운 음향/언어모델로부터 최적화된 이미지 생성 기술) ○ 한국어 음성인식 소프트웨어(기본 베이스라인 음향모델/언어모델 binary 및 음성인식 엔진 튜닝 도구 포함) ○ 관련 기술문서 및 지적재산권(별도 기재) | ||||||||||||||
관련지적재산권 |
| ||||||||||||||
첨부파일 | 002설명회 발표자료 (한국어 음성인식기술(ver 1.2)).pptx | ||||||||||||||
기 술 이 전 조 건 | 실시권 허용범위 | 비독점적 통상실시권 | |||||||||||||
계약기간 | 계약체결일로부터 5 년간 | ||||||||||||||
기술료조건 (부가세별도) | ※ 경상기술료
| ||||||||||||||
기술전수교육 | 1 개월 / 2,157 천원정(부가세별도) | ||||||||||||||
기타특기사항 | * 기술료 특수조건 ○ 샘플링 주파수 추가 계약의 경우 - 상기 착수 기본료는 샘플링 주파수 8kHz 또는 16kHz 1건에 대한 착수 기본료이며 최초 계약 이후 다른 샘플링 주파수를 추가 계약할 경우 해당 착수 기본료를 중소기업 50,000(천원), 중견기업 및 대기업 100,000(천원)으로 계약함. - 샘플링 주파수 8kHz 및 16kHz 동시 계약의 경우 착수기본료를 중소기업 170,000(천원), 중견기업 및 대기업 340,000(천원)으로 계약함 ○ 선행 기술에 대한 추가 계약의 경우 - 선행 기술을 이전 또는 출자 받은 업체의 추가 샘플링 주파수 계약의 경우 해당 착수 기본료를 중소기업 50,000(천원), 중견기업 및 대기업 100,000(천원)으로 계약함. - 선행 기술의 정의 : 지니톡 대화체 음성인식 기술 2015 - 기술 이전 : 다국어 음성언어처리 기술(2015) - 기술 출자 | ||||||||||||||
세 부 문 의 | 기술관련 |
| |||||||||||||
계약관련 |
|
'◘ FIDELI' 카테고리의 다른 글
상담품질평가를 위한 딥러닝 기반 오픈소스 활용 음성문자변환 엔진 개발 (0) | 2019.08.13 |
---|---|
딥러닝기반 실시간 표정인식 기술 (0) | 2019.07.08 |
참고 응용 융합 특허 (0) | 2019.04.23 |
참고 공고 (0) | 2019.04.17 |
선정과제 추가 참고 (0) | 2019.04.11 |