KR20140080089A - 음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법 - Google Patents

음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법 Download PDF

Info

Publication number
KR20140080089A
KR20140080089A KR1020120149520A KR20120149520A KR20140080089A KR 20140080089 A KR20140080089 A KR 20140080089A KR 1020120149520 A KR1020120149520 A KR 1020120149520A KR 20120149520 A KR20120149520 A KR 20120149520A KR 20140080089 A KR20140080089 A KR 20140080089A
Authority
KR
South Korea
Prior art keywords
corpus
change
filtering
sentence
speech recognition
Prior art date
Application number
KR1020120149520A
Other languages
English (en)
Inventor
권오윤
김재철
윤승일
이천성
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020120149520A priority Critical patent/KR20140080089A/ko
Priority to US14/025,276 priority patent/US20140180688A1/en
Publication of KR20140080089A publication Critical patent/KR20140080089A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명은 음성인식장치에 관한 것으로, 수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하는 정제부와 상기 도메인의 말뭉치에 대해 상기 음성인식장치의 기능별 수집 기본문장을 추출하는 추출부를 포함하는 말뭉치 처리부, 상기 추출된 기본문장을 상기 음성인식장치의 기능별로 저장한 데이터베이스, 사용자의 말뭉치를 수신하는 말뭉치 수신부, 및 상기 수신 말뭉치를 상기 추출부에서 추출하여 얻은 수신 기본문장과 상기 데이터 베이스에 저장된 수집 기본문장을 비교하여 사용자의 말뭉치가 의도하는 기능을 판단하는 제어부를 포함하는 구성할 수 있다.
본 발명에 의하면 음성인식장치는 다양한 사용자의 다양한 명령에 대한 사용자 의도를 명확히 인식하여 실행할 수 있다.

Description

음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법 {A SPEECH RECOGNITION DEVICE AND SPEECH RECOGNITION METHOD, DATABASE FOR THE SPEECH RECOGNITION DEVICW, AND CONSTRUCTING METHOD OF THE DATABASE FOR THE SPEECH RECOGNITION DEVICE}
본 발명은 대화시스템에서 사용하는 말뭉치에 대해 정제, 추출, 및 확장하고, 그 확장 방법으로 언어학적으로 대화시스템 관점의 구어체 특징, 문형 단계에 기반한 체계적 확장을 가능하게 하는 확장양식(paraphrasing template)을 이용하는 음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법에 관한 것이다.
최근 입력장치를 통해 직접 문자나 단축키를 통해 제어하던 방식에서 벗어나, 사용자의 환경에 따라 편리하게 음성을 이용하여 기기들을 제어하는 음성인식장치가 개발되고 있다.
그러나, 이러한 음성인식장치는 단일어(Monolingual)가 아닌 이중어(Bilingual) 기반의 동일 의미를 갖는 문장으로의 단순 번역문 생성 목적이나, 정보 검색을 위해 주어진 문장 내 키워드의 중의성 제거 목적으로 이용되고 있다.
이러한 종래의 음성인식장치는 단순하게 사용자의 발화(이하 ‘말뭉치’라 칭함)를 단순히 번역하거나 검색 용도로는 사용가능하나, 다양한 사용자가 사용하는 다양한 문장들로 구성된 말뭉치는 인식할 수는 없다.
또한, 다른 종래의 음성인식장치로는 장치의 기능과 사용자가 사전 설정한 말뭉치를 서로 연계시켜 인식하는 방법을 적용한 예가 있다. 예를 들면, 텔레비전(TV)에서 예를 들면‘티브이 켜져라’또는‘티브이 꺼져라’라는 말뭉치를 텔레비전 기능의 온(ON) 또는 오프(OFF) 명령으로 인식하도록 사전 설정할 수 있다. 그러나, 만일 사용자 또는 다른 사용자가‘텔레비전이 보고 싶다’또는 ‘잠을 자러 가자’라는 은유적인 발화를 한다면 텔레비전은 동작하지 않는다.
본 발명의 목적은 다양한 사용자의 다양한 말뭉치에도 정확히 사용자의 의도를 인식할 수 있는 음성인식장치 및 음성인식방법을 제공하는 것이다.
본 발명의 다른 목적은 사용자들의 다양한 발화 말뭉치를 목적에 맞게 정제, 추출, 확장을 통하여 말뭉치를 풍부하게 함으로써 음성 인식률 성능이 우수한 음성인식장치 및 음성인식방법을 제공하는 것이다.
본 발명의 또 다른 목적은 사용자의 말뭉치를 정제 및 추출하여 얻어진 기본문장으로 기초로 다양한 사용자의 많은 말뭉치로 체계적으로 확장하여 저장한 음성인식장치용 데이터베이스를 제공하는 것이다.
본 발명의 또 다른 목적은 사용자의 말뭉치를 정제, 추출, 및 확장하여 기능별로 풍부한 말뭉치 데이터를 체계적으로 얻을 수 있도록 하는 음성인식장치용 데이터베이스 구축방법을 제공하는 것이다.
상술한 목적을 달성하기 위한 본 발명의 일실시예에 따른 음성인식장치는, 수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하는 정제부와 상기 도메인의 말뭉치에 대해 상기 음성인식장치의 기능별 수집 기본문장을 추출하는 추출부를 포함하는 말뭉치 처리부, 상기 추출된 기본문장을 상기 음성인식장치의 기능별로 저장한 데이터베이스, 사용자의 말뭉치를 수신하는 말뭉치 수신부, 및 상기 수신 말뭉치를 상기 추출부에서 추출하여 얻은 수신 기본문장과 상기 데이터 베이스에 저장된 수집 기본문장을 비교하여 사용자의 말뭉치가 의도하는 기능을 판단하는 제어부를 포함하여 구성할 수 있다.
상기 음성인식장치는 제어부에서 판단한 기능을 실행하는 기능실행부를 더 포함할 수 있다.
상기 말뭉치 처리부는 추출된 수집 기본문장을 확장하여 확장 수집 말뭉치들을 생성하는 확장부를 더 포함하는 것이 바람직하다.
상기 확장부는 추출된 수신 기본문장을 확장하여 확장 수신 말뭉치들을 생성할 수 있다.
상기 제어부는 상기 확장 수신 말뭉치를 상기 확장 수집 말뭉치들과 비교하여 일치하는 확장 수집 말뭉치의 기능으로 사용자의 말뭉치가 의도하는 기능을 판단할 수 있다.
상기 정제부는 상기 수집 말뭉치 또는 수신 말뭉치의 주행 및 핵심개체를 분석하여 사용자 목적에 해당하는 도메인(domain)으로 구분하는 것이 바람직하다.
상기 추출부는 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행할 수 있다.
상기 추출부는 순차적으로 문법적 오류 필터링, 서술어 필터링 및 어휘변경 필터링을 수행하는 것을 바람직하다.
상기 확장부의 확장 수집 말뭉치 생성은 상기 추출부의 수집 기본문장 추출의 역순에 따라 수행될 수 있다.
상기 확장부의 확장 수신 말뭉치 생성은 상기 추출부의 수신 기본문장 추출의 역순에 따라 수행될 수 있다.
상기 확장부는 확장 템플릿(paraphrasing template)을 사용하는 것이 바람직하다.
상기 확장 템플릿(paraphrasing template)의 가로축은 간접표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 하나를 적용하고, 세로축은 간접 표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 다른 나머지를 적용하는 것이 바람직하다.
본 발명의 일실시예에 따른 음성인식방법은, 수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하는 단계, 상기 도메인의 말뭉치에 대해 상기 음성인식장치의 기능별 수집 기본문장을 추출하는 단계, 상기 추출된 기본문장을 상기 음성인식장치의 기능별로 저장하는 단계, 사용자의 말뭉치를 수신하는 단계, 및 상기 수신 말뭉치로부터 추출한 수신 기본문장과 상기 저장된 수집 기본문장을 비교하여 사용자의 말뭉치가 의도하는 기능을 판단하는 단계를 포함할 수 있다.
상기 음성인식방법은 판단한 기능을 실행하는 단계를 더 포함할 수 있다.
상기 음성인식방법은 상기 추출된 수집 기본문장을 확장하여 확장 수집 말뭉치들을 생성하는 단계를 더 포함할 수 있다.
상기 음성인식방법은 상기 추출된 수신 기본문장을 확장하여 확장 수신 말뭉치들을 생성하는 단계를 더 포함할 수 있다.
상기 음성인식방법은 상기 확장 수신 말뭉치를 상기 확장 수집 말뭉치들과 비교하여, 일치하는 상기 확장 수집 말뭉치의 기능을 사용자의 말뭉치가 의도하는 기능을 판단하는 단계를 더 포함할 수 있다.
상기 도메인 구분 단계는 상기 수집 말뭉치 또는 수신 말뭉치의 주행 및 핵심개체를 분석하여 사용자 목적에 해당하는 도메인(domain)으로 구분할 수 있다.
상기 추출 단계는 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행할 수 있다.
상기 추출 단계는 순차적으로 문법적 오류 필터링, 서술어 필터링 및 어휘변경 필터링을 수행하는 것이 바람직하다.
상기 확장 수집 말뭉치 생성 단계는 상기 수집 기본문장 추출 단계의 역순에 따라 수행할 수 있다.
상기 확장 수신 말뭉치 생성 단계는 상기 수신 기본문장 추출의 역순에 따라 수행할 수 있다.
상기 확장 수집 말뭉치 또는 확장 수신 말뭉치 생성단계는 확장 템플릿(paraphrasing template)을 사용할 수 있다.
상기 확장 템플릿(paraphrasing template)의 가로축은 간접표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 하나를 적용하고, 세로축은 간접 표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 다른 나머지를 적용하는 것이 바람직하다.
본 발명의 일실시예에 따른 음성인식장치용 데이터베이스는, 수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하고, 상기 도메인의 말뭉치에 대해 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행하여 추출된 수집 기본문장을 포함할 수 있다.
상기 데이터베이스는 상기 추출된 수집 기본문장을 확장하여 생성한 확장 수집 말뭉치 데이터를 더 포함할 수 있다.
상기 데이터베이스는 상기 음성인식장치에 수신된 수신 말뭉치로부터 추출된 수신 기본문장 데이터를 더 포함할 수 있다.
상기 데이터베이스는 상기 수신 기본문장으로부터 확장된 확장 말뭉치 데이터를 더 포함할 수 있다.
상기 도메인 구분은 상기 수집 말뭉치 또는 수신 말뭉치의 주행 및 핵심개체를 분석하여 결정하는 것이 바람직하다.
상기 추출은 순차적으로 문법적 오류 필터링, 서술어 필터링 및 어휘변경 필터링을 수행하는 것이 바람직하다.
상기 확장 수집 말뭉치 데이터는 상기 수집 기본문장 추출의 역순에 따라 확장되는 것이 바람직하다.
상기 확장 수신 말뭉치 데이터는 상기 수신 기본문장 추출의 역순에 따라 확장되는 것이 바람직하다.
상기 확장 수집 말뭉치 데이터는 확장 템플릿(paraphrasing template)을 사용하여 얻는 것이 바람직하다.
상기 확장 수신 말뭉치 데이터는 확장 템플릿(paraphrasing template)을 사용하여 얻는 것이 바람직하다.
상기 확장 템플릿(paraphrasing template)의 가로축은 간접표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 하나를 적용하고, 세로축은 간접 표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 다른 나머지를 적용할 수 있다.
본 발명의 일실시예에 따른 음성인식장치용 데이터베이스의 구축방법은, 수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하여 정제하는 단계, 상기 도메인의 말뭉치에 대해 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행하여 수집 기본문장을 추출하는 단계, 및 상기 추출된 수집 기본문장을 기능별로 저장하는 단계를 포함할 수 있다.
상기 구축방법은 상기 추출된 수집 기본문장을 확장하여 확장 수집 말뭉치 데이터를 생성하는 단계를 더 포함할 수 있다.
상기 구축방법은 상기 음성인식장치에 수신된 수신 말뭉치로부터 수신 기본문장 데이터를 추출하는 단계를 더 포함할 수 있다.
상기 구축방법은 상기 수신 기본문장으로부터 확장 말뭉치 데이터를 생성하는 단계를 더 포함할 수 있다.
상기 정제단계는 상기 수집 말뭉치 또는 수신 말뭉치의 주행 및 핵심개체를 분석하는 것이 바람직하다.
상기 추출 단계는 순차적으로 문법적 오류 필터링, 서술어 필터링 및 어휘변경 필터링을 수행하는 것이 바람직하다.
상기 확장 수집 말뭉치 생성단계는 상기 수집 기본문장 추출 단계의 역순에 따라 수행될 수 있다.
상기 확장 수신 말뭉치 생성단계는 상기 수신 기본문장 추출 단계의 역순에 따라 수행될 수 있다.
상기 확장 수집 말뭉치 생성단계는 확장 템플릿(paraphrasing template)을 사용할 수 있다.
상기 확장 수신 말뭉치 생성단계는 확장 템플릿(paraphrasing template)을 사용할 수 있다.
상기 확장 템플릿(paraphrasing template)의 가로축은 간접표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 하나를 적용하고, 세로축은 간접 표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 다른 나머지를 적용하는 것이 바람직하다.
본 발명의 음성인식장치는 다양한 사용자의 다양한 말뭉치에도 정확히 사용자의 의도를 인식할 수 있다.
또한, 음성인식장치의 기능과 관련한 다양하고 풍부한 데이터를 기능으로 묶어 저장할 수 있다.
본 발명에 의한 데이터베이스는 사용자의 말뭉치를 정제 및 추출하여 얻어진 기본문장으로 기초로 다양한 사용자의 많은 말뭉치로 체계적으로 확장하여 저장할 수 있다.
본 발명에 의한 데이터베이스 구축방법은 사용 중에도 데이터베이스의 데이터를 용이하게 확장할 수 있다.
도 1은 본 발명의 실시예에 따른 음성인식장치의 블록도,
도 2는 본 발명의 제1실시예에 따른 음성인식방법을 나타내는 흐름도,
도 3은 본 발명의 제2실시예에 따른 음성인식방법을 나타내는 흐름도,
도 4는 본 발명에 따른 사용자 말뭉치 처리 흐름을 나타내는 도,
도 5는 본 발명에 따른 말뭉치 정/추출단계를 나타내는 흐름도,
도 6은 본 발명에 따른 확장 단계를 나타내는 흐름도,
도 7은 단일 기본문장에 대한 확장 템플릿을 나타내는 도, 및
도 8은 복수 기본문장에 대한 확장 템플릿을 나타내는 흐름도이다.
이하에서는 첨부도면을 참조하여 본 발명에 대해 상세히 설명한다. 이하 실시예에서는 본 발명의 사상과 직접적인 관련이 있는 구성들에 관해서만 설명하며, 그 외의 구성에 관해서는 설명을 생략한다. 그러나, 본 발명의 사상이 적용된 장치 또는 시스템을 구현함에 있어서, 이와 같이 설명이 생략된 구성이 불필요함을 의미하는 것이 아님을 밝힌다.
‘말뭉치(corpus)’라는 용어는 말이나 글로 발화되거나 표현된 실제로 사용된 언어 자료를 모아 놓은 것을 말한다. 비록 ‘말뭉치’는 모아 놓은 것을 의미할지라도 단일의 발화(문)를 포함하는 것으로 정의한다.
도 1은 본 발명의 일실시예에 따른 음성인식장치(100)를 나타낸 블록도이다. 음성인식장치(100)는 인간이 특정 의도(목적)를 갖고 말한 발화, 즉 말뭉치를 수신하는 말뭉치 수신부(110), 상기 말뭉치를 처리하는 말뭉치 처리부(120), 상기 말뭉치를 처리하여 기본 문장 또는 확장된 말뭉치를 저장하는 저장부(DB), 음성인식장치(100)의 각 구성부품들을 제어하는 제어부(140), 및 상기 제어부의 제어 하에 수신된 사용자 말뭉치의 의도, 즉 음성인식장치(100)의 기능들 중 하나를 파악하여 실행하는 기능실행부(150)를 포함하여 구성할 수 있다.
말뭉치 수신부(110)는 예를 들면 사용자의 발화, 즉 말뭉치를 마이크를 통해 직접 음성 신호로, 키보드나 마우스와 같은 입력장치를 통해 문자화 또는 코드화한 신호로, 통신부(미도시)를 통해 말뭉치 데이터로 수신할 수 있다.
말뭉치 처리부(120)는 상기 말뭉치 수신부(110)를 통해 수신된 말뭉치를 사용자의 발화목적에 맞는 도메인(domain)으로 구분하는 정제부(122), 상기 말뭉치로부터 기본 문장을 추출하는 추출부(124) 및 기본문장으로부터 확장 템플릿(Paraphrasing Template)을 사용하여 확장하여 새로운 말뭉치를 생성하는 확장부(126)를 포함한다.
상기 정제부(122)는 수신된 말뭉치, 즉 사용자 발화문의 주행 및 핵심 개체를 분석한 후 발화 목적에 맞는 도메인으로 구분할 수 있다. 예를 들면, 대화형 TV시스템에서 사용자가 발화한 ‘텔레비전이 보고 싶다’라는 말뭉치는 그 의도가 TV의 온(ON)에 있으므로 이를 ‘TV 온(ON)’ 기능으로 분류할 수 있다. 또 다른 예로서, 드라마를 시청하는 사용자가 ‘자러 간다’라고 한 말뭉치는 그 의도가 TV의 오프(OFF)에 있으므로 이를 ‘TV 오프(OFF)’ 기능으로 분류할 수 있다. 이와 같이 사용자의 말뭉치를 의도하는 목적과 음성인식장치(1)의 기능을 매칭시켜 분류할 수 있다.
추출부(124)는 말뭉치의 문법적 오류 필터링, 수식어 필터링, 서술어 필터링, 어순변경 필터링, 문형변경 필터링, 어휘변경 필터링, 간접 표현(비유적) 필터링 중 적어도 하나를 수행하여 기본 문장을 추출할 수 있다. 예를 들면, ‘텔레비전이 보고 싶다’와 ‘자러 가자’는 말뭉치는 TV 기능과 연계된 기본 문장으로 각각 ‘TV를 켜다’와 ‘TV를 끄다’를 추출할 수 있다.
확장부(126)는 추출부(124)를 통하여 추출된 기본 문장으로부터 확장 양식(template)을 이용하여 다양한 형태로 말뭉치를 생성할 수 있다. 확장방법은 상술한 추출 순서를 역으로 하여 진행할 수 있다. 예를 들면 추출이 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 순으로 진행되었다면, 확장은 간접표현 필터링, 수식어 필터링, 어순변경 필터링, 문형변경 필터링, 어휘변경 필터링, 서술어 필터링, 및 문법적 오류 필터링 순으로 이루어질 수 있다.
저장부(130)는 상기 말뭉치 처리부(120)에서 처리한 데이터, 즉 추출된 기본문장 데이더, 확장된 말뭉치 데이터 등이 저장되는 데이터베이스를 포함할 수 있다. 또한 저장부(130)는 제어부(140)의 처리 및 제어를 위한 프로그램, 입/출력되는 데이터들의 임시 저장을 위한 기능을 수행할 수도 있다.
저장부(130, DB)는 수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하고, 상기 도메인의 말뭉치에 대해 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행하여 추출된 수집 기본문장 데이터를 포함할 수 있다.
또한 저장부(130, DB)는 상기 추출된 수집 기본문장을 확장하여 생성한 확장 수집 말뭉치 데이터, 상기 음성인식장치에 수신된 수신 말뭉치로부터 추출된 수신 기본문장 데이터, 및 확장 수신 말뭉치 데이터를 더 포함할 수 있다.
저장부(130)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory) 자기메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
제어부(140)는 음성인식장치(110)의 각 구성요소들을 제어할 수 있다. 예를 들면 말뭉치 수신부(110)를 제어하여 말뭉치를 수신하고, 말뭉치 처리부(120)를 제어하여 수신된 말뭉치를 처리하여 음성인식장치(100)의 기능에 따라 기본문장을 추출하고 이 기본 문장으로부터 다양한 말뭉치로의 확장을 수행할 수 있다.
제어부(140)는 상기 저장부(DB)를 제어하여 추출된 기본 문장과 확장된 말뭉치를 저장할 수 있다.
제어부(140)는 말뭉치 수신부(110)로부터 수신된 말뭉치를 저장부(130)에 저장된 말뭉치와 비교하여 수신된 말뭉치의 의도, 즉 음성인식장치의 기능을 파악할 수 있다. 물론, 수신된 말뭉치로부터 기본 문장을 추출하여 저장부(130)에 저장된 기본문장과 비교할 수도 있다.
제어부(140)는 수신된 말뭉치의 의도를 파악한 후 후술하는 기능실행부(150)를 제어하여 말뭉치가 의도하는 음성인식장치(100)의 가능을 실행하도록 할 수 있다.
기능실행부(150)는 제어부(140)의 제어 하에 수신된 말뭉치의 의도를 실행하는 부분이다. 예를 들면 대화형 TV의 경우 수신된 말뭉치가 TV를 켜는 의도로 파악될 경우 TV를 온(ON)시키는 전원부(미도시)가 이에 해당할 것이다. 도한, 에어컨의 경우 수신된 말뭉치의 의도가 바람의 방향을 사용자 측으로 돌려달라는 의도로 파악되면 풍향조절부(미도시)가 해당될 것이다.
이하 도 2 및 도 3을 참조하여 음성인식방법을 상세히 설명하면 다음과 같다.
먼저 말뭉치를 수집하여 해당 말뭉치가 의도하는 기능을 파악하여 기능에 맞는 도메인(domain)으로 구분한다(S211). 말뭉치가 의도하는 기능은 음성인식장치(100)의 기능을 말하는 것으로, 사용자가 음성인식장치(100)에 요구하는 사항이다. 예를 들면, 대화형 TV의 경우는 기본적인 전원 온, 오프, 채널변경, 구체적인 프로그램의 채널, 예약, 녹화, 알람 등등 사용자가 원하는 기능이 될 것이다.
상술한 바와 같이 말뭉치에 해당하는 기능을 할당한 후, 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링을 수행하여 수집 기본 문장을 추출한다(S212).
상기 추출된 수집 기본 문장을 저장부(DB, 130)에 저장하여 데이터베이스로 활용한다(S213).
이후 말뭉치 수신부(110)를 통해 사용자가 원하는 기능 실행명령에 해당하는 말뭉치를 수신한다(S214).
상기 수신된 말뭉치를 상기 추출과 유사한 방법으로 수신 기본 문장을 추출한다(S215).
제어부(140)는 상기 수신된 수신 기본 문장과 저장부(130)에 저장된 수집 기본 문장을 비교하여, 상기 수신 기본 문장과 일치하는 수집 기본문장이 있는지를 확인한다(S216).
만일 해당하는 수집 기본 문장이 존재하면 해당 수집 기본 문장의 기능을 기능실행부(150)를 통하여 수행한다(S217).
만일 해당하는 수집 기본 문장이 존재하지 않으면 수신 기본 문장을 기능에 맞는 도메인으로 구분한다(S218).
기능 분류된 수신 기본 문장을 저장부(130)에 저장하여 데이터베이스화 한다(S219).
이어서, 수신 기본 문장을 확장하여 수신 말뭉치를 생성한 후(S220), 확장 수신말뭉치를 저장부(130)에 저장하여 데이터베이스화 한다.
이와 같이, 말뭉치를 수집하여 기본 문장을 추출하여 기능병 기본문장을 데이터베이스화 한 후에, 수신된 말뭉치로부터 수신 기본 문장을 추출하여 데이터베이스(DB)의 수집 기본 문장과 비교하여 수신된 말뭉치의 의도를 파악할 수 있다. 만일 수신된 말뭉치가 수집되지 않은 말뭉치에 해당하면 해당 수신 말뭉치를 데이터베이스에 새롭게 추가할 수도 있다.
도 3은 다른 실시예에 따른 음성인식방법을 나타낸 흐름도이다.
먼저 말뭉치를 수집하여 해당 말뭉치가 의도하는 기능을 파악하여 기능에 맞는 도메인(domain)으로 구분한다(S311). 예를 들면, 대화형 에어컨의 경우는 기본적인 전원 온, 오프, 온도 변경, 풍향변경, 예약 등등 사용자가 원하는 기능이 될 것이다.
상술한 바와 같이 말뭉치에 해당하는 기능을 할당한 후, 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링을 수행하여 수집 기본 문장을 추출한다(S312).
상기 추출된 수집 기본 문장을 저장부(DB, 130)에 저장하여 데이터베이스로 활용한다(S313).
상기 추출된 기본 문장을 토대로 확장 양식을 이용하여 수집 말뭉치를 생성한다(S314).
상기 확장된 수집 말뭉치들을 저장부(130)에 저장하여 데이터베이스화 한다(S315).
이후 말뭉치 수신부(110)를 통해 사용자가 원하는 음성인식장치(100)의 기능 실행명령에 해당하는 말뭉치를 수신한다(S316).
상기 수신된 말뭉치를 상기 추출과 유사한 방법으로 음성인식장치(100)의 기능과 관련시켜 수신 기본 문장을 추출한다(S317).
상기 추출된 수신 기본 문장을 기초로 확장 양식을 이용하여 확장하여 새로운 말뭉치들을 생성한다(S318).
저장부(130)에 상기 확장된 말뭉치들을 저장하여 데이터베이스화 한다(S319).
제어부(140)는 상기 저장된 수신 말뭉치와 저장된 수집 말뭉치들을 비교하여, 상기 수신 말뭉치들과 일치하는 수집 말뭉치들이 있는지를 확인한다(S320).
만일 해당하는 수집 말뭉치가 존재하면 해당 수집 말뭉치의 기능을 기능실행부(150)를 통하여 수행한다(S321).
도 3에는 별도로 표시하지 않았지만, 해당하는 수집 말뭉치가 존재하지 않으면 도 2의 단계 S218-S221을 수행하여 말뭉치 데이터를 신규로 추가할 수 있다.
상술한 바와 같이, 수집된 말뭉치를 토대로 기능과 연계된 수집 기본 문장과 확장된 수집 말뭉치들로 데이터베이스를 구성하고, 사용자의 명령어로서 수신된 말뭉치를 토대로 기능별 수신 기본 문장과 확장된 수신 말뭉치들을 추가하여 데이터베이스를 구성한 후에, 상기 저장된 수신 말뭉치와 저장된 수집 말뭉치들을 비교하여, 상기 수신 말뭉치들과 일치하는 수집 말뭉치들이 있는지를 확인함으로써 보다 폭 넓은 대상들을 비교할 수 있어 인식률을 높일 수 있다. 즉, 수집 기본문장과 수신 기본 문장을 비교하는 것에 비해 확장되어 저장된 많은 수의 수집 말뭉치와 확장된 수신 말뭉치를 비교하는 것이 그 정확도는 높아질 수 있다.
이하 음성인식장치용 데이터베이스 구축방법을 도 4 내지 8을 참조하여 상세히 설명하면 다음과 같다.
도 4는 본 발명에 따른 말뭉치의 정제, 추출 및 확장과정을 간략하게 나타낸 것이다. 먼저 수집된 말뭉치들 각각에 대해 사용자의 발화 목적에 따라 기능 도메인으로 구분하여 아래의 다양한 단계를 거쳐 기본문장을 정제 및 추출한다(400, 410). 이와 같이 정제 및 추출된 수집 기본 문장을 확장 양식을 사용하여 확장하여 확장된 수집 말뭉치를 생성한다(500,510).
도 5에 나타낸 바와 같이 말뭉치를 정제 및 추출하는 방법을 상세히 설명하면 다음과 같다.
사용자의 발화 목적의 기능 도메인에 따라 수집 말뭉치가 해당하는 기능 도메인을 확인한다(S411)
해당 도메인의 여러 말뭉치로부터 문법적 오류여부 검토한다(S412). 예를 들면 말뭉치는 철자, 맞춤법, 띄어쓰기, 시제표기 등을 확인할 수 있다.
의미상 부가적인 명사 반복 수식구조, 형용사 및 부사 수식어 등을 제거하는 수식어 필터링을 수행한다(S413).
용언을 분석 및 제거하여 기본 어간을 파악하는 서술어 필터링을 수행한다(S414). 보다 구체적으로 서술어 필터링은 동사와 형용사의 어간 및 어미 변형, 대화체 종류(예: 명령형 해라체) 기반의 대화체 특징적 어휘(예: 축약어, 음운교체, 감탄사, 비표준어, 외래어의 비표준적 표기)를 제거할 수 있다.
주요 문장 구성 성분 및 키워드 기반으로 어순 변경 유무를 확인하는 어순변경 필터링을 수행한다(S415). 예를 들면, ‘(주어)+(목적어)+서술어’, ‘ (목적어)+(주어)+보조/주서술어’, ‘서술어+목적어’ 또는 ‘(목적어)+보조서술어+(주어)+주서술어’, ‘근간성분(주어) 생략’ 등이 있다.
문법 구조가 변경된 문형을 제거하는 문형변경 필터링을 수행한다(S416). 예를 들면, ‘안’부정, ‘못’부정문, 짧은 부정문, 긴 부정문, 이중 부정문, ‘이, 히, 리, 기’피동문 등이 있다.
서술어(1순위), 키워드(2순위)대상 수집된 말뭉치의 동의어, 유의어, 반의어, 약어, 신조어 등에 대해 어휘변경 필터링을 수행한다(S417). 이 때, 동의어, 유의어, 반의어 확인은 사전 DB를 기준하는 것이 바람직하다. 약어, 신조어는 실제 사용 및 사용빈도가 높은 용어조사 DB 기준할 수 있다.
직접화행, 간접화행, 간접표현(비유적 표현)의 말뭉치에 대해 본래의 그 의미에 해당하는 것으로 수정하여 간접표현 필터링을 수행한다(S418).
상술한 바와 같은 많은 추출단계를 거쳐 포괄적 동일 의미의 다수 말뭉치에 대해 수집 기본 문장을 추출할 수 있다(S419).
상술한 추출의 각 수행 단계들은 무작위로 이루어질 수도 있으나, 순차적으로 진행하는 것이 바람직하다. 예를 들면, 문법적 오류 필터링, 서술어 필터링, 및 어휘변경 필터링을 기본 순서로 하고 나머지 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링을 임의로 수행할 수 있다.
도 6은 추출된 기본 문장으로 다수의 말뭉치들을 확장하여 생성하는 과정을 나타낸 것이다. 기본적으로 상기 추출단계의 역순으로 진행하는 것이 바람직하다.
먼저 기본 문장을 추출단계에서 얻는다(S511). 이미 추출된 기본 문장을 활용할 수도 있다.
기본 문장에 대해 직접화행, 간접화행, 간접표현(비유적 표현)을 고려하여 변경을 수행한다(S512).
서술어(1순위), 키워드(2순위)대상의 동의어, 유의어, 반의어, 약어, 신조어 등으로 어휘변경을 수행한다(S513). 이 때 추출단계에서와 마찬가지로, 동의어, 유의어, 반의어 확인은 사전 DB를 기준으로 하고, 약어, 신조어는 실제 사용 및 사용빈도가 높은 용어조사 DB 기준할 수 있다.
기본 문장에 대해 문법 구조를 변경하는 문형변경을 수행한다(S514). 예를 들면, ‘안’부정, ‘못’부정문, 짧은 부정문, 긴 부정문, 이중 부정문, ‘이, 히, 리, 기’피동문 등이 있다.
주요 문장 구성 성분 및 키워드 기반으로 어순 변경을 수행한다(S515). 예를 들면, ‘(주어)+(목적어)+서술어’, ‘ (목적어)+(주어)+보조/주서술어’, ‘서술어+목적어’ 또는 ‘(목적어)+보조서술어+(주어)+주서술어’, ‘근간성분(주어) 생략’ 등이 있다.
어간 변형을 통하여 서술어 변경을 수행한다(S516). 보다 구체적으로 서술어 변경은 동사와 형용사의 어간 및 어미 변형, 대화체 종류(예: 명령형 해라체) 기반의 대화체 특징적 어휘(예: 축약어, 음운교체, 감탄사, 비표준어, 외래어의 비표준적 표기)를 추가할 수 있다.
의미상 부가적인 명사 반복 수식구조, 형용사 및 부사 수식어 등을 추가 하는 수식어 변경을 수행한다(S517).
상술한 변경 및 추가를 통해 만들어진 말뭉치에 대해 문법적 오류여부 검토한다(S518). 예를 들면 말뭉치는 철자, 맞춤법, 띄어쓰기, 시제표기 등을 확인할 수 있다.
마지막으로 완성된 말뭉치에 대한 의미 보존성을 검토한다(S519).
상술한 기본 문장의 확장은 확장 양식(paraphrasing template)을 이용하여 이루어질 수 있다.
도 7과 8은 확장 양식(paraphrasing template)의 예를 나타낸 것으로 가로축은 다양한 어미변화, 어간 변화 등의 서술어 변화를 기재하고, 세로축은 를 간접표현(직/간접 화행 표현), 어휘변경, 문형변경, 어순변경, 주어생략을 설정할 수 있다. 물론, 이러한 가로축과 세로축의 배치는 변경될 수 있다.
도 7은 단일의 기본 문장에 대한 확장 양식(paraphrasing template)을 나타낸 것이다.
기본 문장을 기준으로 가로축 제1열에 대한 세로축의 간접표현(직/간접 화행 표현), 어휘변경, 문형변경, 어순변경, 주어생략과 관련 된 기본 문장 확장을 수행할 수 있다.
상기 기본 문장 및 확장 기본 문장에 대해 제2열의 어미변화 1를 적용하여 확장할 수 있다.
계속해서 상기 기본 문장 및 확장 기본 문장에 대해 제3열 어미변화2, 제4열 어간변화, 제5열 서술어 외 변화를 적용하여 확장할 수 있다.
도 8은 다수의 기본 문장에 대한 확장 양식(paraphrasing template)을 나타낸 것이다.
기본 문장, 즉 주어+목적어+동사 구조에 대한 제3열 주요 어미변화인 어미변화1, 어미변화 2, 어간변화, 서술어 외 변화에 대한 다수의 기본 문장을 기준으로 2행 간접표현(직/간접 화행 표현), 3행 어휘변경, 4행 문형변경1, 5행 문형변경 2, 6행 어순변경1, 7행 어순 변경2, 8행 주어생략을 적용하여 확장을 수행할 수 있다.
이와 같이 1개 또는 다수의 기본 문장을 토대로 매우 방대한 변화를 적용하여 말뭉치를 확장하는 것이 가능하다.
상기한 실시예는 예시적인 것에 불과한 것으로, 당해 기술 분야의 통상의 지식을 가진 자라면 다양한 변형 및 균등한 타 실시예가 가능하다. 따라서, 본 발명의 진정한 기술적 보호범위는 하기의 특허청구범위에 기재된 발명의 기술적 사상에 의해 정해져야 할 것이다.
100: 음성인식장치
110: 말뭉치 수신부
120: 말뭉치 처리부
130: 저장부
140: 제어부
150: 기능실행부

Claims (46)

  1. 음성인식장치에 있어서,
    수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하는 정제부와 상기 도메인의 말뭉치에 대해 상기 음성인식장치의 기능별 수집 기본문장을 추출하는 추출부를 포함하는 말뭉치 처리부;
    상기 추출된 기본문장을 상기 음성인식장치의 기능별로 저장한 데이터베이스;
    사용자의 말뭉치를 수신하는 말뭉치 수신부; 및
    상기 수신 말뭉치를 상기 추출부에서 추출하여 얻은 수신 기본문장과 상기 데이터 베이스에 저장된 수집 기본문장을 비교하여 사용자의 말뭉치가 의도하는 기능을 판단하는 제어부를 포함하는 것을 특징으로 하는 음성인식장치.
  2. 제1항에 있어서,
    상기 제어부에서 판단한 기능을 실행하는 기능실행부를 더 포함하는 것을 특징으로 하는 음성인식장치
  3. 제1항에 있어서,
    상기 말뭉치 처리부는 추출된 수집 기본문장을 확장하여 확장 수집 말뭉치들을 생성하는 확장부를 더 포함하는 것을 특징으로 하는 음성인식장치.
  4. 제3항에 있어서,
    상기 확장부는 추출된 수신 기본문장을 확장하여 확장 수신 말뭉치들을 생성하는 것을 특징으로 하는 음성인식장치.

  5. 제4항에 있어서,
    상기 제어부는 상기 확장 수신 말뭉치를 상기 확장 수집 말뭉치들과 비교하여 사용자의 말뭉치가 의도하는 기능을 판단하는 것을 특징으로 하는 음성인식장치.
  6. 제1항에 있어서,
    상기 정제부는 상기 수집 말뭉치 또는 수신 말뭉치의 주행 및 핵심개체를 분석하여 사용자 목적에 해당하는 도메인(domain)으로 구분하는 것을 특징으로 하는 음성인식장치.
  7. 제1항에 있어서,
    상기 추출부는 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행하는 것을 특징으로 하는 음성인식장치.
  8. 제7항에 있어서,
    상기 추출부는 순차적으로 문법적 오류 필터링, 서술어 필터링 및 어휘변경 필터링을 수행하는 것을 특징으로 하는 음성인식장치.
  9. 제3항에 있어서.
    상기 확장부의 확장 수집 말뭉치 생성은 상기 추출부의 수집 기본문장 추출의 역순에 따라 수행되는 것을 특징으로 하는 음성인식장치.
  10. 제4항에 있어서.
    상기 확장부의 확장 수신 말뭉치 생성은 상기 추출부의 수신 기본문장 추출의 역순에 따라 수행되는 것을 특징으로 하는 음성인식장치.
  11. 제9항 또는 10항에 있어서,
    상기 확장부는 확장 템플릿(paraphrasing template)을 사용하는 것을 특징으로 하는 음성인식장치.
  12. 제11항에 있어서,
    상기 확장 템플릿(paraphrasing template)의 가로축은 간접표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 하나를 적용하고, 세로축은 간접 표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 다른 나머지를 적용하는 것을 특징으로 하는 음성인식장치.
  13. 음성인식방법에 있어서,
    수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하는 단계;
    상기 도메인의 말뭉치에 대해 상기 음성인식장치의 기능별 수집 기본문장을 추출하는 단계;
    상기 추출된 기본문장을 상기 음성인식장치의 기능별로 저장하는 단계;
    사용자의 말뭉치를 수신하는 단계; 및
    상기 수신 말뭉치로부터 추출한 수신 기본문장과 상기 저장된 수집 기본문장을 비교하여 사용자의 말뭉치가 의도하는 기능을 판단하는 단계를 포함하는 것을 특징으로 하는 음성인식방법.
  14. 제13항에 있어서,
    상기 판단한 기능을 실행하는 단계를 더 포함하는 것을 특징으로 하는 음성인식방법.
  15. 제13항에 있어서,
    상기 추출된 수집 기본문장을 확장하여 확장 수집 말뭉치들을 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성인식방법.
  16. 제13항에 있어서,
    상기 추출된 수신 기본문장을 확장하여 확장 수신 말뭉치들을 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성인식방법.
  17. 제16항에 있어서,
    상기 확장 수신 말뭉치를 상기 확장 수집 말뭉치들과 비교하여 사용자의 말뭉치가 의도하는 기능을 판단하는 것을 특징으로 하는 음성인식방법.
  18. 제13항에 있어서,
    상기 도메인 구분 단계는 상기 수집 말뭉치 또는 수신 말뭉치의 주행 및 핵심개체를 분석하여 사용자 목적에 해당하는 도메인(domain)으로 구분하는 것을 특징으로 하는 음성인식방법.
  19. 제13항에 있어서,
    상기 추출 단계는 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행하는 것을 특징으로 하는 음성인식방법.
  20. 제19항에 있어서,
    상기 추출 단계는 순차적으로 문법적 오류 필터링, 서술어 필터링 및 어휘변경 필터링을 수행하는 것을 특징으로 하는 음성인식방법.
  21. 제15항에 있어서.
    상기 확장 수집 말뭉치 생성 단계는 상기 수집 기본문장 추출 단계의 역순에 따라 수행되는 것을 특징으로 하는 음성인식방법.
  22. 제16항에 있어서.
    상기 확장 수신 말뭉치 생성 단계는 상기 수신 기본문장 추출의 역순에 따라 수행되는 것을 특징으로 하는 음성인식방법.
  23. 제21항 또는 22항에 있어서,
    상기 확장 수집 말뭉치 또는 확장 수신 말뭉치 생성단계는 확장 템플릿(paraphrasing template)을 사용하는 것을 특징으로 하는 음성인식방법.
  24. 제23항에 있어서,
    상기 확장 템플릿(paraphrasing template)의 가로축은 간접표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 하나를 적용하고, 세로축은 간접 표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 다른 나머지를 적용하는 것을 특징으로 하는 음성인식방법.
  25. 음성인식장치용 데이터베이스에 있어서,
    수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하고, 상기 도메인의 말뭉치에 대해 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행하여 추출된 수집 기본문장 데이터를 포함하는 것을 특징으로 하는 음성인식장치용 데이터베이스.
  26. 제25항에 있어서,
    상기 추출된 수집 기본문장을 확장하여 생성한 확장 수집 말뭉치 데이터를 더 포함하는 것을 특징으로 하는 음성인식장치용 데이터베이스.
  27. 제25항에 있어서,
    상기 음성인식장치에 수신된 수신 말뭉치로부터 추출된 수신 기본문장 데이터를 더 포함하는 것을 특징으로 하는 음성인식장치용 데이터베이스.
  28. 제27항에 있어서,
    상기 수신 기본문장으로부터 확장된 확장 말뭉치 데이터를 더 포함하는 것을 특징으로 하는 음성인식장치용 데이터베이스.
  29. 제25항에 있어서,
    상기 도메인 구분은 상기 수집 말뭉치 또는 수신 말뭉치의 주행 및 핵심개체를 분석하여 결정된 것을 특징으로 하는 음성인식장치용 데이터베이스.
  30. 제25항에 있어서,
    상기 추출은 순차적으로 문법적 오류 필터링, 서술어 필터링 및 어휘변경 필터링을 수행하는 것을 특징으로 하는 음성인식장치용 데이터베이스.
  31. 제26항에 있어서.
    상기 확장 수집 말뭉치 데이터는 상기 수집 기본문장 추출의 역순에 따라 수행되어 얻어진 것을 특징으로 하는 음성인식장치용 데이터베이스.
  32. 제27항에 있어서,
    상기 확장 수신 말뭉치 데이터는 상기 수신 기본문장 추출의 역순에 따라 수행되어 얻어진 것을 특징으로 하는 음성인식장치용 데이터베이스.
  33. 제31항에 있어서,
    상기 확장 수집 말뭉치 데이터는 확장 템플릿(paraphrasing template)을 사용하여 얻어진 것을 특징으로 하는 음성인식장치용 데이터베이스.
  34. 제32항에 있어서,
    상기 확장 수신 말뭉치 데이터는 확장 템플릿(paraphrasing template)을 사용하여 얻어진 것을 특징으로 하는 음성인식장치용 데이터베이스.
  35. 제33항 또는 제34항에 있어서,
    상기 확장 템플릿(paraphrasing template)의 가로축은 간접표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 하나를 적용하고, 세로축은 간접 표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 다른 나머지를 적용하는 것을 특징으로 하는 음성인식장치용 데이터베이스.
  36. 음성인식장치용 데이터베이스의 구축방법에 있어서,
    수집된 말뭉치를 상기 음성인식장치의 기능에 맞는 도메인으로 구분하여 정제하는 단계;
    상기 도메인의 말뭉치에 대해 문법적 오류 필터링, 서술어 필터링, 어휘변경 필터링, 문형변경 필터링, 어순변경 필터링, 수식어 필터링 및 간접표현 필터링 중 적어도 하나를 수행하여 수집 기본문장을 추출하는 단계; 및
    상기 추출된 수집 기본문장을 기능별로 저장하는 단계를 포함하는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  37. 제36항에 있어서,
    상기 추출된 수집 기본문장을 확장하여 확장 수집 말뭉치 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  38. 제36항에 있어서,
    상기 음성인식장치에 수신된 수신 말뭉치로부터 수신 기본문장 데이터를 추출하는 단계를 더 포함하는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  39. 제38항에 있어서,
    상기 수신 기본문장으로부터 확장 말뭉치 데이터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  40. 제36항에 있어서,
    상기 정제단계는 상기 수집 말뭉치 또는 수신 말뭉치의 주행 및 핵심개체를 분석하여 이루어지는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  41. 제36항에 있어서,
    상기 추출 단계는 순차적으로 문법적 오류 필터링, 서술어 필터링 및 어휘변경 필터링을 수행하는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  42. 제37항에 있어서.
    상기 확장 수집 말뭉치 생성단계는 상기 수집 기본문장 추출 단계의 역순에 따라 수행되어 얻어진 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  43. 제39항에 있어서,
    상기 확장 수신 말뭉치 생성단계는 상기 수신 기본문장 추출 단계의 역순에 따라 수행되어 얻어진 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  44. 제42항에 있어서,
    상기 확장 수집 말뭉치 생성단계는 확장 템플릿(paraphrasing template)을 사용하는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  45. 제43항에 있어서,
    상기 확장 수신 말뭉치 생성단계는 확장 템플릿(paraphrasing template)을 사용하는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
  46. 제44항 또는 제45항에 있어서,
    상기 확장 템플릿(paraphrasing template)의 가로축은 간접표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 하나를 적용하고, 세로축은 간접 표현, 서술어 변경, 어휘변경, 문형변경, 어순변경, 수식어 변경, 문형변경 중 다른 나머지를 적용하는 것을 특징으로 하는 음성인식장치용 데이터베이스의 구축방법.
KR1020120149520A 2012-12-20 2012-12-20 음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법 KR20140080089A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120149520A KR20140080089A (ko) 2012-12-20 2012-12-20 음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법
US14/025,276 US20140180688A1 (en) 2012-12-20 2013-09-12 Speech recognition device and speech recognition method, data base for speech recognition device and constructing method of database for speech recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120149520A KR20140080089A (ko) 2012-12-20 2012-12-20 음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법

Publications (1)

Publication Number Publication Date
KR20140080089A true KR20140080089A (ko) 2014-06-30

Family

ID=50975670

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120149520A KR20140080089A (ko) 2012-12-20 2012-12-20 음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법

Country Status (2)

Country Link
US (1) US20140180688A1 (ko)
KR (1) KR20140080089A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019103518A1 (ko) * 2017-11-24 2019-05-31 삼성전자주식회사 전자 장치 및 그 제어 방법
KR102041618B1 (ko) * 2019-02-25 2019-11-06 (주)미디어코퍼스 인공지능 음성인식을 위한 기계학습 기반 자연어 말뭉치 구축 서비스 제공 시스템 및 방법
KR102041621B1 (ko) * 2019-02-25 2019-11-06 (주)미디어코퍼스 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법
KR102122081B1 (ko) * 2019-05-02 2020-06-26 주식회사 다이얼로그디자인에이전시 인공지능 음성인식 기반 검수기 및 분석기의 상호학습을 통한 자연어 말뭉치 구축 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7269221B2 (ja) * 2018-03-27 2023-05-08 ソニーグループ株式会社 情報処理装置、情報処理方法、送信装置、及び送信方法
US10748526B2 (en) * 2018-08-28 2020-08-18 Accenture Global Solutions Limited Automated data cartridge for conversational AI bots
CN109739493A (zh) * 2019-01-18 2019-05-10 宜创(北京)科技有限公司 数据库操作语句的生成方法、装置、电子设备及存储介质
CN111681647B (zh) * 2020-06-10 2023-09-05 北京百度网讯科技有限公司 用于识别词槽的方法、装置、设备以及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7729918B2 (en) * 2001-03-14 2010-06-01 At&T Intellectual Property Ii, Lp Trainable sentence planning system
US7546235B2 (en) * 2004-11-15 2009-06-09 Microsoft Corporation Unsupervised learning of paraphrase/translation alternations and selective application thereof
US20070106499A1 (en) * 2005-08-09 2007-05-10 Kathleen Dahlgren Natural language search system
US8099287B2 (en) * 2006-12-05 2012-01-17 Nuance Communications, Inc. Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands
WO2009055819A1 (en) * 2007-10-26 2009-04-30 Honda Motor Co., Ltd. Improving free-speech command classification for car navigation system
US8229735B2 (en) * 2008-06-27 2012-07-24 Microsoft Corporation Grammar checker for visualization
US8250052B2 (en) * 2008-12-08 2012-08-21 Continental Airlines, Inc. Geospatial data interaction
KR20130015472A (ko) * 2011-08-03 2013-02-14 삼성전자주식회사 디스플레이장치, 그 제어방법 및 서버
US9082403B2 (en) * 2011-12-15 2015-07-14 Microsoft Technology Licensing, Llc Spoken utterance classification training for a speech recognition system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019103518A1 (ko) * 2017-11-24 2019-05-31 삼성전자주식회사 전자 장치 및 그 제어 방법
US11455990B2 (en) 2017-11-24 2022-09-27 Samsung Electronics Co., Ltd. Electronic device and control method therefor
KR102041618B1 (ko) * 2019-02-25 2019-11-06 (주)미디어코퍼스 인공지능 음성인식을 위한 기계학습 기반 자연어 말뭉치 구축 서비스 제공 시스템 및 방법
KR102041621B1 (ko) * 2019-02-25 2019-11-06 (주)미디어코퍼스 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법
KR102122081B1 (ko) * 2019-05-02 2020-06-26 주식회사 다이얼로그디자인에이전시 인공지능 음성인식 기반 검수기 및 분석기의 상호학습을 통한 자연어 말뭉치 구축 방법

Also Published As

Publication number Publication date
US20140180688A1 (en) 2014-06-26

Similar Documents

Publication Publication Date Title
KR20140080089A (ko) 음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법
CN110517663B (zh) 一种语种识别方法及识别系统
Karpov et al. Large vocabulary Russian speech recognition using syntactico-statistical language modeling
US8380505B2 (en) System for recognizing speech for searching a database
Fantinuoli Speech recognition in the interpreter workstation
US20170199867A1 (en) Dialogue control system and dialogue control method
US20190156826A1 (en) Interactive representation of content for relevance detection and review
US8255220B2 (en) Device, method, and medium for establishing language model for expanding finite state grammar using a general grammar database
CN114580382A (zh) 文本纠错方法以及装置
Sitaram et al. Experiments with Cross-lingual Systems for Synthesis of Code-Mixed Text.
KR102372069B1 (ko) 언어학습을 위한 양국어 자유 대화 시스템 및 방법
Lefevre et al. Cross-lingual spoken language understanding from unaligned data using discriminative classification models and machine translation.
US20150178274A1 (en) Speech translation apparatus and speech translation method
Yılmaz et al. Building a unified code-switching ASR system for South African languages
Arslan et al. A detailed survey of Turkish automatic speech recognition
Ostrogonac et al. Morphology-based vs unsupervised word clustering for training language models for Serbian
Juhár et al. Recent progress in development of language model for Slovak large vocabulary continuous speech recognition
Ngo et al. Phonology-augmented statistical framework for machine transliteration using limited linguistic resources
Abushariah et al. Bilingual automatic speech recognition: A review, taxonomy and open challenges
Modipa et al. Two sepedi-english code-switched speech corpora
TWI270792B (en) Speech-based information retrieval
Price et al. Combining linguistic with statistical methods in modeling prosody
KR20130126570A (ko) 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체
CN116052655A (zh) 音频处理方法、装置、电子设备和可读存储介质
Sreeram et al. A Novel Approach for Effective Recognition of the Code-Switched Data on Monolingual Language Model.

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid