KR20190125578A - 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템 - Google Patents

유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템 Download PDF

Info

Publication number
KR20190125578A
KR20190125578A KR1020180049548A KR20180049548A KR20190125578A KR 20190125578 A KR20190125578 A KR 20190125578A KR 1020180049548 A KR1020180049548 A KR 1020180049548A KR 20180049548 A KR20180049548 A KR 20180049548A KR 20190125578 A KR20190125578 A KR 20190125578A
Authority
KR
South Korea
Prior art keywords
command
natural language
language processing
speech recognition
voice
Prior art date
Application number
KR1020180049548A
Other languages
English (en)
Other versions
KR102458063B1 (ko
Inventor
이영한
송혁
조충상
양종열
고민수
Original Assignee
전자부품연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전자부품연구원 filed Critical 전자부품연구원
Priority to KR1020180049548A priority Critical patent/KR102458063B1/ko
Publication of KR20190125578A publication Critical patent/KR20190125578A/ko
Application granted granted Critical
Publication of KR102458063B1 publication Critical patent/KR102458063B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템이 제공된다. 본 발명의 실시예에 따른 음성 처리 방법은, 음성 명령을 입력 받고, 입력된 음성 명령을 인식하며, 인식된 명령을 다른 표현으로 수정하고, 수정된 명령을 처리한다. 이에 의해, 음성 인식 오류로 인한 자연어 처리 실패를 방지하여, 인공지능 서비스의 인식 정확도를 높일 수 있게 된다.

Description

유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템{Similarity based Speech Recognition and Natural Language Processing Method and System}
본 발명은 인공지능 관련 기술에 관한 것으로, 더욱 상세하게는 음성 인식 및 자연어 처리를 위한 방법 및 시스템에 관한 것이다.
일반적으로, 음성 인식과 자연어 처리를 통합한 시스템에서는, 두 가지 처리 기법을 연동시킨 것이 아닌 파이프라인 형태로 구성하고 때문에, 음성 인식 결과를 받아서 자연어 처리 기술의 입력으로 활용하게 된다.
도 1은 기존의 시스템에 의한 음성 인식과 자연어 처리 과정을 예시한 도면이다. 도 1에 도시된 바와 같이, 기존의 시스템에서는 음성 인식을 통해 출력된 텍스트 문장을 자연어 처리의 입력 문장으로 활용한다.
이에 따라, 음성 인식 기술의 인식 정확도에 따라 전체 시스템의 성능 영향을 받는다. 특히, 음성 인식 정확도는 단어 기반으로 인식/오인식을 구분하는 반면, 자연어 처리 기술에서는 단어 하나 오차에 따라 문장의 의미가 달라질 수 있기 때문에 일부 오인식된 단어가 음성 인식기를 통해 출력될 경우 자연어 처리 기술은 의도에 맞도록 동작하지 않을 가능성이 매우 높다.
그 결과, 음성 인식 오류로 인해, 자연어 처리가 실패하는 경우가 빈번하게 발생하는데, 이는 전체적인 시스템의 성능을 저하시키는 문제를 유발하는 바, 이를 해소시키기 위한 방안의 모색이 요청된다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 음성 인식 오류로 인한 자연어 처리 실패를 방지하기 위한 방안으로, 음성 인식 기술과 자연어 처리 기술을 연동하여 처리하는 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 음성 처리 방법은, 음성 명령을 입력 받는 단계; 입력된 음성 명령을 인식하는 단계; 인식된 명령을 다른 표현으로 수정하는 단계; 수정된 명령을 처리하는 단계;를 포함한다.
그리고, 수정 단계는, 인식된 명령이 정해진 표현으로 저장되어 있지 않은 경우, 다른 표현으로 수정할 수 있다.
또한, 수정 단계는, 인식된 명령에 포함된 단어 중 정해진 표현으로 저장되어 있지 않은 단어를 유사 단어로 교체할 수 있다.
그리고, 수정 단계는, 인식된 명령에 포함된 단어를 발음이 유사한 단어로 교체할 수 있다.
또한, 수정 단계는, 인식된 명령에 포함된 단어를 의미가 유사한 단어로 교체할 수 있다.
그리고, 본 발명의 일 실시예에 따른, 음성 처리 방법은, 명령 처리 결과를 출력하는 단계;를 더 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른, 음성 처리 방법은, 텍스트로 입력받는 단계; 입력된 명령을 다른 표현으로 수정하는 단계; 수정된 명령을 처리하는 단계;를 더 포함할 수 있다.
한편, 본 발명의 다른 실시예에 따른, 음성 처리 시스템은, 음성 명령을 입력 받는 입력부; 입력된 음성 명령을 인식하고, 인식된 명령을 다른 표현으로 수정하며, 수정된 명령을 처리하는 프로세서;를 포함한다.
이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 음성 인식 기술과 자연어 처리 기술을 유기적으로 연결함으로써, 음성 인식 오류로 인한 자연어 처리 실패를 방지하여, 인공지능 서비스의 인식 정확도를 높일 수 있게 된다.
도 1은 기존의 시스템에 의한 음성 인식과 자연어 처리 과정을 예시한 도면,
도 2는 본 발명의 일 실시예에 따른 음성 인식 및 자연어 처리 방법의 개념 설명에 제공되는 도면,
도 3은 본 발명의 일 실시예에 따른 음성 인식 및 자연어 처리 방법의 설명에 제공되는 흐름도,
도 4는 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 과정의 일 예를 제시한 도면,
도 5는 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 과정의 다른 예를 제시한 도면, 그리고,
도 6은 본 발명의 다른 실시예에 따른 음성 인식 및 자연어 처리 시스템의 블럭도이다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 2는 본 발명의 일 실시예에 따른 음성 인식 및 자연어 처리 방법의 개념 설명에 제공되는 도면이다.
도 2에 나타낸 바와 같이, 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 방법은, 음성 인식의 출력 값과 자연어 처리에서 사용하는 문장의 유사도를 기반으로 처리가 이루어진다.
즉, 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 방법에서는, 음성 인식 결과들을 그대로 활용하는 것이 아니라 유사도를 도출할 수 있는 형태로 변형하여 자연어 처리에서 사용하는 언어 형태에 적응하도록 결과를 도출하여, 인공지능 서비스를 제공한다.
도 3은 본 발명의 일 실시예에 따른 음성 인식 및 자연어 처리 방법의 설명에 제공되는 흐름도이다.
도 3에 도시된 바와 같이, 음성 인식을 위해, 먼저 음성 명령을 입력 받고(S110), S110단계에서 입력된 음성 명령을 인식한다(S120). 다음, S120단계에서 인식된 명령을 다른 표현으로 수정한다(S130).
S130단계에서의 명령 수정은, S120단계에서 인식된 명령이 정해진 표현으로 기저장되어 있지 않은 명령이 대상이 된다.
구체적으로, 인식된 명령에 포함된 단어 중 정해진 표현으로 기저장되어 있지 않은 단어를 유사 단어로 교체하게 된다. S130단계에서의 명령 수정에 대해서는, 도 4와 도 5를 참조하여 상세히 후술한다.
이후, S130단계에서 수정된 명령을 처리하고(S140), S140단계에서의 명령 처리 결과를 출력한다(S150).
도 4에는 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 과정의 일 예를 제시하였다. 도 4에 나타난 바와 같이, 음성 인식 과정에서 "대성전자 경계 설정해주세요."를 "대성전자 경제 설정해주세요."로 잘못 인식하게 되는 오류가 발생하였다.
인식된 명령에 포함된 단어들 중 정해진 표현으로 기저장되어 있는 단어인 "대성 전자"와 "설정해주세요"에 대해서는 수정이 가해지지 않는다.
하지만, 인식된 명령에 포함된 단어들 중 정해진 표현으로 기저장되어 있지 않은 단어, 즉, 자연어 처리 표현에 존재하지 않는 단어인 "경제"에 대해서는 자연어 처리 표현에 존재하는 단어들 중 발음이 유사한 단어인 "경계"로 교체하게 된다.
이에 의해, 잘못 인식된 "대성전자 경제 설정해주세요."가 "대성전자 경계 설정해주세요."로 바르게 수정되어, 자연어 처리가 수행된다.
도 5에는 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 과정의 다른 예를 제시하였다. 도 5에서는 음성 인식 과정에 문제가 없지만, 입력된 음성 명령이 자연어 처리 표현에 존재하지 않는다는 문제가 있다.
인식된 명령에 포함된 단어들 중 정해진 표현으로 기저장되어 있는 단어인 "대성 전자"와 "설정해주세요"에 대해서는 수정이 가해지지 않는다.
하지만, 인식된 명령에 포함된 단어들 중 정해진 표현으로 기저장되어 있지 않은 단어, 즉, 자연어 처리 표현에 존재하지 않는 단어인 "보안"에 대해서는 자연어 처리 표현에 존재하는 단어들 중 의미가 유사한 단어(인 "경계"로 교체하게 된다.
의미가 유사한 단어는 워드 임베딩 기법을 활용하여 추출 가능한데, 그 밖의 다른 기법을 사용하는 것을 배제하지 않는다.
이에 의해, 잘못 명령된 "대성전자 보안 설정해주세요."가 "대성전자 경계 설정해주세요."로 바르게 수정되어, 자연어 처리가 수행된다.
도 6은 본 발명의 다른 실시예에 따른 음성 인식 및 자연어 처리 시스템의 블럭도이다.
본 발명의 실시예에 따른 음성 인식 및 자연어 처리 시스템은, 도 6에 도시된 바와 같이, 통신부(210), 출력부(220), 프로세서(230), 입력부(240) 및 저장부(250)를 포함하는 컴퓨팅 시스템으로 구현 가능하다.
통신부(210)는 외부 기기와 통신하고 외부 네트워크에 액세스하기 위한 통신 수당니다.
입력부(240)는 키보드, 키패드 등의 문자 입력 수단 외에 음성으로 명령을 입력 받기 위한 마이크를 포함한다. 출력부(220)는 음성 인식 및 자연어 처리 결과를 표시하기 위한 디스플레이이다.
프로세서(230)는 도 2와 도 3에 제시된 유사도 기반의 음성 인식 및 자연어 처리 방법을 수행한다. 저장부(250)는 프로세서(230)가 음성 인식 및 자연어 처리를 수행함에 있어 필요한 저장 공간을 제공한다.
지금까지, 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템에 대해 바람직한 실시예들을 들어 상세히 설명하였다.
위 실시예에서는, 음성 인식의 출력과 자연어 처리의 입력 사이에 텍스트 단위에서의 변형 뿐만 아니라 텍스트 유사도 단위를 포함하여 변형하는 기법을 제시하였다.
위 실시예에서의 명령 입력은 음성을 통해 이루어지는 것을 상정하였으나, 이는 예시적인 것에 불과하다. 음성이 아닌 텍스트로 명령을 입력받는 경우에도 입력된 명령을 다른 표현으로 수정하여 처리하는 것이 가능하며, 이 경우에도 본 발명의 기술적 사상이 적용될 수 있다.
나아가, 본 발명의 실시예에 따른 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템은 한국어 뿐만 아니라 빅데이터로 학습 가능한 모든 언어에서 처리가 가능하며, 이 경우에도 전체 시스템의 성능을 향상시킬 수 있다.
음성 인식 기술의 출력 텍스트 외의 정보를 활용하지 않고 적응형 구현이 가능하기 때문에 자연어 처리 기술을 개발하는데 있어 음성 인식 기술에 종속적이지 않은 개발이 가능한 장점도 존재한다.
지금까지, 음성 인식 기술과 자연어 처리 기술을 연동하여 제공하는 기법을 제시하였다. 음성 인식 기술과 자연어 처리 기술을 유기적으로 연결함으로써 인공지능 서비스의 인식 정확도를 높일 수 있다.
한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
210 : 통신부
220 : 출력부
230 : 프로세서
240 : 입력부
250 : 저장부

Claims (8)

  1. 음성 명령을 입력 받는 단계;
    입력된 음성 명령을 인식하는 단계;
    인식된 명령을 다른 표현으로 수정하는 단계;
    수정된 명령을 처리하는 단계;를 포함하는 것을 특징으로 하는 음성 처리 방법.
  2. 청구항 1에 있어서,
    수정 단계는,
    인식된 명령이 정해진 표현으로 저장되어 있지 않은 경우, 다른 표현으로 수정하는 것을 특징으로 하는 음성 처리 방법.
  3. 청구항 2에 있어서,
    수정 단계는,
    인식된 명령에 포함된 단어 중 정해진 표현으로 저장되어 있지 않은 단어를 유사 단어로 교체하는 것을 특징으로 하는 음성 처리 방법.
  4. 청구항 3에 있어서,
    수정 단계는,
    인식된 명령에 포함된 단어를 발음이 유사한 단어로 교체하는 것을 특징으로 하는 음성 처리 방법.
  5. 청구항 3에 있어서,
    수정 단계는,
    인식된 명령에 포함된 단어를 의미가 유사한 단어로 교체하는 것을 특징으로 하는 음성 처리 방법.
  6. 청구항 1에 있어서,
    명령 처리 결과를 출력하는 단계;를 더 포함하는 것을 특징으로 하는 음성 처리 방법.
  7. 청구항 1에 있어서,
    텍스트로 입력받는 단계;
    입력된 명령을 다른 표현으로 수정하는 단계;
    수정된 명령을 처리하는 단계;를 더 포함하는 것을 특징으로 하는 음성 처리 방법.
  8. 음성 명령을 입력 받는 입력부;
    입력된 음성 명령을 인식하고, 인식된 명령을 다른 표현으로 수정하며, 수정된 명령을 처리하는 프로세서;를 포함하는 것을 특징으로 하는 음성 처리 시스템.
KR1020180049548A 2018-04-30 2018-04-30 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템 KR102458063B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180049548A KR102458063B1 (ko) 2018-04-30 2018-04-30 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180049548A KR102458063B1 (ko) 2018-04-30 2018-04-30 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20190125578A true KR20190125578A (ko) 2019-11-07
KR102458063B1 KR102458063B1 (ko) 2022-10-25

Family

ID=68579014

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180049548A KR102458063B1 (ko) 2018-04-30 2018-04-30 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102458063B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060057921A (ko) * 2004-11-24 2006-05-29 한국전자통신연구원 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법
KR20140005639A (ko) * 2012-07-05 2014-01-15 삼성전자주식회사 전자 장치 및 이의 음성 인식 오류 수정 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060057921A (ko) * 2004-11-24 2006-05-29 한국전자통신연구원 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법
KR20140005639A (ko) * 2012-07-05 2014-01-15 삼성전자주식회사 전자 장치 및 이의 음성 인식 오류 수정 방법

Also Published As

Publication number Publication date
KR102458063B1 (ko) 2022-10-25

Similar Documents

Publication Publication Date Title
CN107220235B (zh) 基于人工智能的语音识别纠错方法、装置及存储介质
CN107293296B (zh) 语音识别结果纠正方法、装置、设备及存储介质
KR102589637B1 (ko) 기계 번역 방법 및 장치
US20190043504A1 (en) Speech recognition method and device
JP6334815B2 (ja) 学習装置、方法、プログラムおよび音声対話システム
WO2017127296A1 (en) Analyzing textual data
WO2010150464A1 (ja) 情報分析装置、情報分析方法、及びコンピュータ読み取り可能な記録媒体
WO2006138386A2 (en) Collocation translation from monolingual and available bilingual corpora
WO2022121251A1 (zh) 文本处理模型训练方法、装置、计算机设备和存储介质
US9588967B2 (en) Interpretation apparatus and method
CN111737991B (zh) 文本断句位置的识别方法及系统、电子设备及存储介质
CN108228574B (zh) 文本翻译处理方法及装置
CN110704597B (zh) 对话系统可靠性校验方法、模型生成方法及装置
CN109785846B (zh) 单声道的语音数据的角色识别方法及装置
CN113743101B (zh) 文本纠错方法、装置、电子设备和计算机存储介质
KR20180062003A (ko) 음성 인식 오류 교정 방법
WO2021051877A1 (zh) 人工智能面试中获取输入文本和相关装置
CN111326144B (zh) 语音数据处理方法、装置、介质和计算设备
CN115169329A (zh) 一种基于Bert的中文文本纠错方法、设备及存储介质
CN113160820A (zh) 语音识别的方法、语音识别模型的训练方法、装置及设备
CN114999463B (zh) 语音识别方法、装置、设备及介质
CN110991155B (zh) 文本修正方法、设备及介质
KR102458063B1 (ko) 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템
CN115858776A (zh) 一种变体文本分类识别方法、系统、存储介质和电子设备
AU2021238965B2 (en) Speech recognition and training for data inputs

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E90F Notification of reason for final refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant