KR20190125578A

KR20190125578A - 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템

Info

Publication number: KR20190125578A
Application number: KR1020180049548A
Authority: KR
Inventors: 이영한; 송혁; 조충상; 양종열; 고민수
Original assignee: 전자부품연구원
Priority date: 2018-04-30
Filing date: 2018-04-30
Publication date: 2019-11-07
Also published as: KR102458063B1

Abstract

유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템이 제공된다. 본 발명의 실시예에 따른 음성 처리 방법은, 음성 명령을 입력 받고, 입력된 음성 명령을 인식하며, 인식된 명령을 다른 표현으로 수정하고, 수정된 명령을 처리한다. 이에 의해, 음성 인식 오류로 인한 자연어 처리 실패를 방지하여, 인공지능 서비스의 인식 정확도를 높일 수 있게 된다.

Description

유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템{Similarity based Speech Recognition and Natural Language Processing Method and System}

본 발명은 인공지능 관련 기술에 관한 것으로, 더욱 상세하게는 음성 인식 및 자연어 처리를 위한 방법 및 시스템에 관한 것이다.

일반적으로, 음성 인식과 자연어 처리를 통합한 시스템에서는, 두 가지 처리 기법을 연동시킨 것이 아닌 파이프라인 형태로 구성하고 때문에, 음성 인식 결과를 받아서 자연어 처리 기술의 입력으로 활용하게 된다.

도 1은 기존의 시스템에 의한 음성 인식과 자연어 처리 과정을 예시한 도면이다. 도 1에 도시된 바와 같이, 기존의 시스템에서는 음성 인식을 통해 출력된 텍스트 문장을 자연어 처리의 입력 문장으로 활용한다.

이에 따라, 음성 인식 기술의 인식 정확도에 따라 전체 시스템의 성능 영향을 받는다. 특히, 음성 인식 정확도는 단어 기반으로 인식/오인식을 구분하는 반면, 자연어 처리 기술에서는 단어 하나 오차에 따라 문장의 의미가 달라질 수 있기 때문에 일부 오인식된 단어가 음성 인식기를 통해 출력될 경우 자연어 처리 기술은 의도에 맞도록 동작하지 않을 가능성이 매우 높다.

그 결과, 음성 인식 오류로 인해, 자연어 처리가 실패하는 경우가 빈번하게 발생하는데, 이는 전체적인 시스템의 성능을 저하시키는 문제를 유발하는 바, 이를 해소시키기 위한 방안의 모색이 요청된다.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 음성 인식 오류로 인한 자연어 처리 실패를 방지하기 위한 방안으로, 음성 인식 기술과 자연어 처리 기술을 연동하여 처리하는 방법을 제공함에 있다.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 음성 처리 방법은, 음성 명령을 입력 받는 단계; 입력된 음성 명령을 인식하는 단계; 인식된 명령을 다른 표현으로 수정하는 단계; 수정된 명령을 처리하는 단계;를 포함한다.

그리고, 수정 단계는, 인식된 명령이 정해진 표현으로 저장되어 있지 않은 경우, 다른 표현으로 수정할 수 있다.

또한, 수정 단계는, 인식된 명령에 포함된 단어 중 정해진 표현으로 저장되어 있지 않은 단어를 유사 단어로 교체할 수 있다.

그리고, 수정 단계는, 인식된 명령에 포함된 단어를 발음이 유사한 단어로 교체할 수 있다.

또한, 수정 단계는, 인식된 명령에 포함된 단어를 의미가 유사한 단어로 교체할 수 있다.

그리고, 본 발명의 일 실시예에 따른, 음성 처리 방법은, 명령 처리 결과를 출력하는 단계;를 더 포함할 수 있다.

또한, 본 발명의 일 실시예에 따른, 음성 처리 방법은, 텍스트로 입력받는 단계; 입력된 명령을 다른 표현으로 수정하는 단계; 수정된 명령을 처리하는 단계;를 더 포함할 수 있다.

한편, 본 발명의 다른 실시예에 따른, 음성 처리 시스템은, 음성 명령을 입력 받는 입력부; 입력된 음성 명령을 인식하고, 인식된 명령을 다른 표현으로 수정하며, 수정된 명령을 처리하는 프로세서;를 포함한다.

이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 음성 인식 기술과 자연어 처리 기술을 유기적으로 연결함으로써, 음성 인식 오류로 인한 자연어 처리 실패를 방지하여, 인공지능 서비스의 인식 정확도를 높일 수 있게 된다.

도 1은 기존의 시스템에 의한 음성 인식과 자연어 처리 과정을 예시한 도면,
도 2는 본 발명의 일 실시예에 따른 음성 인식 및 자연어 처리 방법의 개념 설명에 제공되는 도면,
도 3은 본 발명의 일 실시예에 따른 음성 인식 및 자연어 처리 방법의 설명에 제공되는 흐름도,
도 4는 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 과정의 일 예를 제시한 도면,
도 5는 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 과정의 다른 예를 제시한 도면, 그리고,
도 6은 본 발명의 다른 실시예에 따른 음성 인식 및 자연어 처리 시스템의 블럭도이다.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.

도 2는 본 발명의 일 실시예에 따른 음성 인식 및 자연어 처리 방법의 개념 설명에 제공되는 도면이다.

도 2에 나타낸 바와 같이, 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 방법은, 음성 인식의 출력 값과 자연어 처리에서 사용하는 문장의 유사도를 기반으로 처리가 이루어진다.

즉, 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 방법에서는, 음성 인식 결과들을 그대로 활용하는 것이 아니라 유사도를 도출할 수 있는 형태로 변형하여 자연어 처리에서 사용하는 언어 형태에 적응하도록 결과를 도출하여, 인공지능 서비스를 제공한다.

도 3은 본 발명의 일 실시예에 따른 음성 인식 및 자연어 처리 방법의 설명에 제공되는 흐름도이다.

도 3에 도시된 바와 같이, 음성 인식을 위해, 먼저 음성 명령을 입력 받고(S110), S110단계에서 입력된 음성 명령을 인식한다(S120). 다음, S120단계에서 인식된 명령을 다른 표현으로 수정한다(S130).

S130단계에서의 명령 수정은, S120단계에서 인식된 명령이 정해진 표현으로 기저장되어 있지 않은 명령이 대상이 된다.

구체적으로, 인식된 명령에 포함된 단어 중 정해진 표현으로 기저장되어 있지 않은 단어를 유사 단어로 교체하게 된다. S130단계에서의 명령 수정에 대해서는, 도 4와 도 5를 참조하여 상세히 후술한다.

이후, S130단계에서 수정된 명령을 처리하고(S140), S140단계에서의 명령 처리 결과를 출력한다(S150).

도 4에는 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 과정의 일 예를 제시하였다. 도 4에 나타난 바와 같이, 음성 인식 과정에서 "대성전자 경계 설정해주세요."를 "대성전자 경제 설정해주세요."로 잘못 인식하게 되는 오류가 발생하였다.

인식된 명령에 포함된 단어들 중 정해진 표현으로 기저장되어 있는 단어인 "대성 전자"와 "설정해주세요"에 대해서는 수정이 가해지지 않는다.

하지만, 인식된 명령에 포함된 단어들 중 정해진 표현으로 기저장되어 있지 않은 단어, 즉, 자연어 처리 표현에 존재하지 않는 단어인 "경제"에 대해서는 자연어 처리 표현에 존재하는 단어들 중 발음이 유사한 단어인 "경계"로 교체하게 된다.

이에 의해, 잘못 인식된 "대성전자 경제 설정해주세요."가 "대성전자 경계 설정해주세요."로 바르게 수정되어, 자연어 처리가 수행된다.

도 5에는 본 발명의 실시예에 따른 음성 인식 및 자연어 처리 과정의 다른 예를 제시하였다. 도 5에서는 음성 인식 과정에 문제가 없지만, 입력된 음성 명령이 자연어 처리 표현에 존재하지 않는다는 문제가 있다.

하지만, 인식된 명령에 포함된 단어들 중 정해진 표현으로 기저장되어 있지 않은 단어, 즉, 자연어 처리 표현에 존재하지 않는 단어인 "보안"에 대해서는 자연어 처리 표현에 존재하는 단어들 중 의미가 유사한 단어(인 "경계"로 교체하게 된다.

의미가 유사한 단어는 워드 임베딩 기법을 활용하여 추출 가능한데, 그 밖의 다른 기법을 사용하는 것을 배제하지 않는다.

이에 의해, 잘못 명령된 "대성전자 보안 설정해주세요."가 "대성전자 경계 설정해주세요."로 바르게 수정되어, 자연어 처리가 수행된다.

도 6은 본 발명의 다른 실시예에 따른 음성 인식 및 자연어 처리 시스템의 블럭도이다.

본 발명의 실시예에 따른 음성 인식 및 자연어 처리 시스템은, 도 6에 도시된 바와 같이, 통신부(210), 출력부(220), 프로세서(230), 입력부(240) 및 저장부(250)를 포함하는 컴퓨팅 시스템으로 구현 가능하다.

통신부(210)는 외부 기기와 통신하고 외부 네트워크에 액세스하기 위한 통신 수당니다.

입력부(240)는 키보드, 키패드 등의 문자 입력 수단 외에 음성으로 명령을 입력 받기 위한 마이크를 포함한다. 출력부(220)는 음성 인식 및 자연어 처리 결과를 표시하기 위한 디스플레이이다.

프로세서(230)는 도 2와 도 3에 제시된 유사도 기반의 음성 인식 및 자연어 처리 방법을 수행한다. 저장부(250)는 프로세서(230)가 음성 인식 및 자연어 처리를 수행함에 있어 필요한 저장 공간을 제공한다.

지금까지, 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템에 대해 바람직한 실시예들을 들어 상세히 설명하였다.

위 실시예에서는, 음성 인식의 출력과 자연어 처리의 입력 사이에 텍스트 단위에서의 변형 뿐만 아니라 텍스트 유사도 단위를 포함하여 변형하는 기법을 제시하였다.

위 실시예에서의 명령 입력은 음성을 통해 이루어지는 것을 상정하였으나, 이는 예시적인 것에 불과하다. 음성이 아닌 텍스트로 명령을 입력받는 경우에도 입력된 명령을 다른 표현으로 수정하여 처리하는 것이 가능하며, 이 경우에도 본 발명의 기술적 사상이 적용될 수 있다.

나아가, 본 발명의 실시예에 따른 유사도 기반의 음성 인식 및 자연어 처리 방법 및 시스템은 한국어 뿐만 아니라 빅데이터로 학습 가능한 모든 언어에서 처리가 가능하며, 이 경우에도 전체 시스템의 성능을 향상시킬 수 있다.

음성 인식 기술의 출력 텍스트 외의 정보를 활용하지 않고 적응형 구현이 가능하기 때문에 자연어 처리 기술을 개발하는데 있어 음성 인식 기술에 종속적이지 않은 개발이 가능한 장점도 존재한다.

지금까지, 음성 인식 기술과 자연어 처리 기술을 연동하여 제공하는 기법을 제시하였다. 음성 인식 기술과 자연어 처리 기술을 유기적으로 연결함으로써 인공지능 서비스의 인식 정확도를 높일 수 있다.

한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

210 : 통신부
220 : 출력부
230 : 프로세서
240 : 입력부
250 : 저장부

Claims

음성 명령을 입력 받는 단계;
입력된 음성 명령을 인식하는 단계;
인식된 명령을 다른 표현으로 수정하는 단계;
수정된 명령을 처리하는 단계;를 포함하는 것을 특징으로 하는 음성 처리 방법.
청구항 1에 있어서,
수정 단계는,
인식된 명령이 정해진 표현으로 저장되어 있지 않은 경우, 다른 표현으로 수정하는 것을 특징으로 하는 음성 처리 방법.
청구항 2에 있어서,
수정 단계는,
인식된 명령에 포함된 단어 중 정해진 표현으로 저장되어 있지 않은 단어를 유사 단어로 교체하는 것을 특징으로 하는 음성 처리 방법.
청구항 3에 있어서,
수정 단계는,
인식된 명령에 포함된 단어를 발음이 유사한 단어로 교체하는 것을 특징으로 하는 음성 처리 방법.
청구항 3에 있어서,
수정 단계는,
인식된 명령에 포함된 단어를 의미가 유사한 단어로 교체하는 것을 특징으로 하는 음성 처리 방법.
청구항 1에 있어서,
명령 처리 결과를 출력하는 단계;를 더 포함하는 것을 특징으로 하는 음성 처리 방법.
청구항 1에 있어서,
텍스트로 입력받는 단계;
입력된 명령을 다른 표현으로 수정하는 단계;
수정된 명령을 처리하는 단계;를 더 포함하는 것을 특징으로 하는 음성 처리 방법.
음성 명령을 입력 받는 입력부;
입력된 음성 명령을 인식하고, 인식된 명령을 다른 표현으로 수정하며, 수정된 명령을 처리하는 프로세서;를 포함하는 것을 특징으로 하는 음성 처리 시스템.