KR102383429B1 - 음성 인식 처리 장치 및 방법, 그리고 차량 시스템 - Google Patents

음성 인식 처리 장치 및 방법, 그리고 차량 시스템 Download PDF

Info

Publication number
KR102383429B1
KR102383429B1 KR1020170069569A KR20170069569A KR102383429B1 KR 102383429 B1 KR102383429 B1 KR 102383429B1 KR 1020170069569 A KR1020170069569 A KR 1020170069569A KR 20170069569 A KR20170069569 A KR 20170069569A KR 102383429 B1 KR102383429 B1 KR 102383429B1
Authority
KR
South Korea
Prior art keywords
voice recognition
text message
voice
name
recognition result
Prior art date
Application number
KR1020170069569A
Other languages
English (en)
Other versions
KR20180133078A (ko
Inventor
조재민
Original Assignee
현대자동차주식회사
기아 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사, 기아 주식회사 filed Critical 현대자동차주식회사
Priority to KR1020170069569A priority Critical patent/KR102383429B1/ko
Publication of KR20180133078A publication Critical patent/KR20180133078A/ko
Application granted granted Critical
Publication of KR102383429B1 publication Critical patent/KR102383429B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mechanical Engineering (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 음성 인식 처리 장치 및 방법, 그리고 차량 시스템에 관한 것이다. 본 발명에 따른 장치는, 문자 메시지 전송 기능이 실행되면, 사용자로부터 발화된 음성 데이터를 차량 단말 및 서버로 각각 전송하여 음성 인식 처리를 요청하고, 상기 차량 단말 및 상기 서버 내 음성인식 엔진의 음성인식 결과로부터 수신자 이름 및 문자 메시지 내용을 확인하여 문자 메시지를 구성하는 음성인식 처리부, 및 상기 차량 단말 내 음성인식 엔진의 제2 음성인식 결과에 기초하여 상기 서버 내 음성인식 엔진의 제1 음성인식 결과로부터 확인된 수신자 이름을 보정하는 보정부를 포함한다.

Description

음성 인식 처리 장치 및 방법, 그리고 차량 시스템{APPARATUS AND METHOD FOR SPEECH RECOGNITION PROCESSING, VEHICLE SYSTEM}
본 발명은 음성 인식 처리 장치 및 방법, 그리고 차량 시스템에 관한 것이다.
차량 내 디바이스에서 특정인에게 문자 보내기 기능을 사용하기 위해서는 서버의 음성인식 기술이 필요하다. 종래에는, 문자 메시지를 송신할 수신자에 대한 음성인식 정확도를 높이기 위해 블루투스 혹은 와이파이 등을 통해 사용자 단말에 접근하여 폰북 데이터를 다운로드하고, 다운로드 한 폰북 데이터를 서버로 전송해야 했다.
하지만, 폰북 데이터의 크기가 큰 경우에는 음성인식 진입 시까지의 속도 지연이 발생하고, 폰북 데이터를 서버로 전송하기 위해 별도의 데이터 패킷을 소모해야 했다.
또한, 서버의 네트워크 통신 상태가 불안정한 경우에는 음성인식 정확도 및/또는 성공률이 낮아질 수 있다. 또한, 서버에 폰북 정보가 없는 경우 대용량의 이름 정보에서 음성인식 결과와 매칭되는 이름을 검색해야 하므로 응답 속도 지연이 발생하였다.
한국등록특허 제10-1684554호
본 발명의 목적은, 폰북 데이터를 전송하지 않고 음성인식 결과에 대한 정확도를 높이도록 한, 음성 인식 처리 장치 및 방법, 그리고 차량 시스템을 제공함에 있다.
본 발명의 다른 목적은, 서버 내 음성인식 엔진의 음성인식 결과로부터 확인된 수신자의 이름을 차량 단말 내 음성인식 엔진의 음성 인식 결과에 기초하여 보정함으로써 수신자 이름에 대한 음성인식 정확도가 향상되도록 한, 음성 인식 처리 장치 및 방법, 그리고 차량 시스템을 제공함에 있다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재들로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기의 목적을 달성하기 위한 본 발명의 일 실시예에 따른 음성 인식 처리 장치는, 문자 메시지 전송 기능이 실행되면, 사용자로부터 발화된 음성 데이터를 차량 단말 및 서버로 각각 전송하여 음성 인식 처리를 요청하고, 상기 차량 단말 및 상기 서버 내 음성인식 엔진의 음성인식 결과로부터 수신자 이름 및 문자 메시지 내용을 확인하여 문자 메시지를 구성하는 음성인식 처리부, 및 상기 차량 단말 내 음성인식 엔진의 제2 음성인식 결과에 기초하여 상기 서버 내 음성인식 엔진의 제1 음성인식 결과로부터 확인된 수신자 이름을 보정하는 보정부를 포함하는 것을 특징으로 한다.
상기 음성인식 처리부는, 상기 제1 음성인식 결과로부터 수신자 이름 및 문자 메시지 내용을 확인하고, 상기 제2 음성인식 결과로부터 수신자 이름을 확인하는 것을 특징으로 한다.
상기 제2 음성인식 결과는, 상기 음성 데이터에 대해 음성 인식된 텍스트와 상기 차량 단말 내 폰북 DB에 저장된 폰북 데이터의 텍스트 매칭을 통해 인식된 결과인 것을 특징으로 한다.
상기 보정부는, 상기 제1 음성인식 결과 및 상기 제2 음성인식 결과로부터 확인된 수신자 이름이 서로 상이한 경우, 상기 제2 음성인식 결과에 대한 신뢰도에 따라 상기 제1 음성인식 결과로부터 확인된 수신자 이름을 보정하는 것을 특징으로 한다.
상기 보정부는, 상기 제2 음성인식 결과에 대한 신뢰도가 기준치를 초과하면 제2 음성인식 결과에 기초하여 상기 서버 내 음성인식 엔진의 제1 음성인식 결과로부터 확인된 수신자 이름을 보정하는 것을 특징으로 한다.
상기 보정부는, 상기 제2 음성인식 결과에 대한 신뢰도가 기준치 이하이면, 상기 제1 음성인식 결과로부터 확인된 수신자 이름과 폰북 데이터의 이름을 매칭하여 상기 제1 음성인식 결과로부터 확인된 수신자 이름을 보정하는 것을 특징으로 한다.
상기 음성인식 처리부는, 상기 보정된 수신자 이름 및 상기 제1 음성인식 결과로부터 확인된 문자 메시지 내용에 기초하여 최종 문자 메시지를 구성하는 것을 특징으로 한다.
상기 음성인식 처리부는, 상기 서버의 네트워크 통신 상태에 따라 상기 제1 음성인식 결과가 수신되지 않은 경우, 상기 사용자에게 문자 메시지 내용에 대한 재발화를 요청하는 메시지를 출력하는 것을 특징으로 한다.
상기 음성인식 처리부는, 상기 제1 음성인식 결과로부터 상기 문자 메시지 내용의 확인이 불가한 경우, 상기 사용자에게 문자 메시지 내용에 대한 재발화를 요청하는 메시지를 출력하는 것을 특징으로 한다.
상기 음성인식 처리부는, 상기 사용자에 의해 재발화된 음성에 대한 음성 인식 결과 및 상기 제2 음성인식 결과로부터 확인된 수신자 이름에 기초하여 최종 문자 메시지를 구성하는 것을 특징으로 한다.
상기 음성인식 처리부는, 상기 구성된 문자 메시지를 디스플레이 화면을 통해 출력하고, 사용자의 응답에 따라 상기 구성된 문자 메시지를 전송하는 것을 특징으로 한다.
또한, 본 발명의 일 실시예에 따른 장치는, 문자 메시지와 관련된 게이트 명령 및 폰북 데이터의 이름을 상기 음성인식 엔진의 발음열로 변환하고, 상기 변환된 발음열에 기초하여 음성인식 트리를 구성하는 음성인식 트리 생성부를 더 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위한 본 발명의 일 실시예에 따른 음성 인식 처리 방법은, 문자 메시지 전송 기능이 실행되면, 사용자로부터 발화된 음성 데이터를 차량 단말 및 서버로 각각 전송하여 음성 인식 처리를 요청하는 단계, 상기 서버 내 음성인식 엔진의 제1 음성인식 결과 및 상기 차량 단말 내 음성인식 엔진의 제2 음성인식 결과에 기초하여 수신자 이름 및 문자 메시지 내용을 확인하는 단계, 제2 음성인식 결과에 기초하여 상기 서버 내 음성인식 엔진의 제1 음성인식 결과로부터 확인된 수신자 이름을 보정하는 단계, 및 상기 보정된 수신자 이름 및 상기 제1 음성인식 결과로부터 확인된 문자 메시지 내용에 기초하여 최종 문자 메시지를 구성하는 단계를 포함하는 것을 특징으로 한다.
또한, 상기의 목적을 달성하기 위한 본 발명의 일 실시예에 따른 차량 시스템은, 음성인식 엔진 및 폰북 데이터가 저장된 폰북 DB를 구비하고, 입력된 음성 데이터에 대한 상기 음성인식 엔진의 음성인식 결과와 상기 폰북 데이터의 텍스트 매칭을 통해 음성 인식을 수행하는 차량 단말, 음성인식 엔진을 구비하고, 입력된 음성 데이터에 대한 음성 인식을 수행하는 서버, 및 상기 음성 데이터에 대해 상기 서버로부터 수신된 제1 음성인식 결과에 기초하여 수신자 이름 및 문자 메시지 내용을 확인하고, 상기 차량 단말로부터 수신된 제2 음성인식 결과에 기초하여 수신자 이름을 확인하고, 상기 제2 음성인식 결과에 기초하여 상기 제1 음성인식 결과로부터 확인된 수신자 이름을 보정하여 문자 메시지를 구성하는 음성 인식 처리 장치를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 폰북 데이터를 전송하지 않고 음성인식 결과에 대한 정확도를 높이는 효과가 있으며, 서버 내 음성인식 엔진의 음성인식 결과로부터 확인된 수신자의 이름을 차량 단말 내 음성인식 엔진의 음성 인식 결과에 기초하여 보정함으로써 수신자 이름에 대한 음성인식 정확도를 향상시킬 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 처리 장치가 적용된 시스템을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 음성 인식 처리 장치의 구성을 도시한 도면이다.
도 3 내지 도 5는 본 발명의 일 실시예에 따른 음성 인식 처리 장치의 동작을 설명하는데 참조되는 실시예를 도시한 도면이다.
도 6 내지 도 9는 본 발명의 일 실시예에 따른 음성 인식 처리 방법에 대한 동작 흐름을 도시한 도면이다.
도 10은 본 발명의 일 실시예에 따른 방법이 실행되는 컴퓨팅 시스템을 도시한 도면이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 실시예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다.
본 발명의 실시예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 처리 장치가 적용된 시스템을 도시한 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 시스템은 차량 단말(10), 서버(50) 및 음성 인식 처리 장치(100)를 포함할 수 있다.
차량 단말(10)은 차량에 구비된 제어 단말로서, 일 예로 차량의 헤드 유닛이 해당될 수 있다. 차량 단말(10)은 음성 인식 처리 장치(100)와 통신 인터페이스를 통해 연결되며, 음성 인식 처리 장치(100)의 요청에 의해 음성인식을 수행할 수 있다. 이에, 차량 단말(10)은 음성인식 엔진을 구비하고, 음성 인식 처리 장치(100)의 요청에 의해 입력된 음성 데이터에 대한 음성 인식을 수행한다. 차량 단말(10)은 음성인식 엔진에 의한 음성 인식 결과를 음성 인식 처리 장치(100)로 전송한다. 이하에서는, 차량 단말(10)에 구비된 음성인식 엔진을 제2 엔진이라 칭하여 설명한다.
또한, 차량 단말(10)은 사용자의 폰북 데이터가 저장된 폰북 DB(11)를 포함할 수 있다. 폰북 DB(11)는 사용자에 의해 수동 입력된 폰북 데이터가 저장될 수 있으며, 통신 인터페이스를 통해 외부로부터 수신된 폰북 데이터가 저장될 수도 있다. 일 예로, 차량 단말(10)은 차량 내 사용자 단말(미도시)과 통신 연결된 경우, 통신 연결된 사용자 단말로부터 폰북 데이터를 수신하여 폰북 DB(11)에 저장할 수 있다.
차량 단말(10)은 음성 인식 처리 장치(100)의 요청이 있는 경우에 폰북 DB(11)에 등록된 일부 또는 전체의 폰북 데이터를 음성 인식 처리 장치(100)로 전송할 수 있다.
서버(50)는 문자 보내기 기능을 지원한다. 서버(50)는 음성 인식 처리 장치(100)와 통신 인터페이스를 통해 연결되며, 음성 인식 처리 장치(100)의 요청에 의해 음성인식을 수행할 수 있다. 이에, 서버(50)는 음성인식 엔진을 구비하고, 음성 인식 처리 장치(100)의 요청에 의해 입력된 음성 데이터에 대한 음성 인식을 수행한다. 서버(50)는 음성인식 엔진에 의한 음성 인식 결과를 음성 인식 처리 장치(100)로 전송한다. 이하에서는, 서버(50)에 구비된 음성인식 엔진을 제1 엔진이라 칭하여 설명한다.
음성 인식 처리 장치(100)는 사용자에 의해 문자 보내기 기능이 선택되면, 사용자에 의해 발화된 음성에 대한 음성 인식 결과를 이용하여 문자 메시지를 구성할 수 있다. 또한, 음성 인식 처리 장치(100)는 구성된 문자 메시지를 서버(50)를 통해 전송하거나, 문자 메시지의 전송을 처리하는 차량 내 제어유닛으로 해당 문자 메시지를 전송할 수 있다.
음성 인식 처리 장치(100)는 사용자에 의해 발화된 음성에 대한 음성 인식 처리를 위해 차량 단말(10) 및 서버(50)로 음성 데이터를 전송한다. 이때, 음성 인식 처리 장치(100)는 제1 엔진 및 제2 엔진의 음성 인식 결과를 조합하여 문자 메시지를 구성하기 위한 수신자 이름 및 문자 메시지 내용을 분석하고, 최종 문자 메시지를 구성할 수 있다. 음성 인식 처리 장치(100)의 세부 구성은 도 2를 참조하여 더욱 상세히 설명한다.
본 발명에 따른 음성 인식 처리 장치(100)는 차량의 내부에 구현될 수 있다. 이때, 장치(100)는 차량의 내부 제어유닛들과 일체로 형성될 수 있으며, 별도의 장치로 구현되어 별도의 연결 수단에 의해 차량의 제어유닛들과 연결될 수도 있다.
도 2는 본 발명의 일 실시예에 따른 음성 인식 처리 장치의 구성을 도시한 도면이다.
도 2를 참조하면, 음성 인식 처리 장치(100)는 제어부(110), 인터페이스부(120), 통신부(130), 저장부(140), 음성인식 트리 생성부(150), 음성인식 처리부(160) 및 보정부(170)를 포함할 수 있다. 여기서, 제어부(110)는 음성 인식 처리 장치(100)의 각 구성요소들 간에 전달되는 신호를 처리할 수 있다.
인터페이스부(120)는 사용자로부터의 제어 명령을 입력 받기 위한 입력수단과 음성 인식 처리 장치(100)의 동작 상태 및 결과 등을 출력하는 출력수단을 포함할 수 있다.
여기서, 입력수단은 키 버튼을 포함할 수 있으며, 마우스, 조이스틱, 조그셔틀, 스타일러스 펜 등을 포함할 수도 있다. 또한, 입력수단은 디스플레이 상에 구현되는 소프트 키를 포함할 수도 있다. 또한, 입력수단은 사용자로부터 발화된 음성을 입력 기 위한 마이크를 더 포함할 수도 있다.
출력수단은 디스플레이를 포함할 수 있으며, 스피커와 같은 음성출력수단을 포함할 수도 있다. 이때, 터치 필름, 터치 시트, 터치 패드 등의 터치 센서가 디스플레이에 구비되는 경우, 디스플레이는 터치 스크린으로 동작하며, 입력수단과 출력수단이 통합된 형태로 구현될 수 있다.
이때, 디스플레이는 액정 디스플레이(Liquid Crystal Display, LCD), 박막 트랜지스터 액정 디스플레이(Thin Film Transistor-Liquid Crystal Display, TFT LCD), 유기 발광 다이오드(Organic Light-Emitting Diode, OLED), 플렉시블 디스플레이(Flexible Display), 전계 방출 디스플레이(Feld Emission Display, FED), 3차원 디스플레이(3D Display) 중에서 적어도 하나를 포함할 수 있다.
통신부(130)는 차량에 구비된 전장품 및/또는 제어유닛들과의 통신 인터페이스를 지원하는 통신모듈을 포함할 수 있다. 일 예로서, 통신모듈은 차량 단말(10)과 통신 연결되어 차량 단말(10)로 음성 데이터를 전송하고, 차량 단말(10)로부터의 음성 인식 결과를 수신할 수 있다. 또한, 통신모듈은 차량 단말(10)에 등록된 폰북 데이터를 수신할 수도 있다. 또한, 통신모듈은 차량에 구비된 마이크를 통해 입력된 사용자의 음성 데이터를 수신할 수도 있다.
여기서, 통신모듈은 CAN(Controller Area Network) 통신, LIN(Local Interconnect Network) 통신, 플렉스레이(Flex-Ray) 통신 등의 차량 네트워크 통신을 지원하는 모듈을 포함할 수 있다.
또한, 통신모듈은 무선 인터넷 접속을 위한 모듈 또는 근거리 통신(Short Range Communication)을 위한 모듈을 포함할 수도 있다. 여기서, 무선 인터넷 기술로는 무선랜(Wireless LAN, WLAN), 와이브로(Wireless Broadband, Wibro), 와이파이(Wi-Fi), 와이맥스(World Interoperability for Microwave Access, Wimax) 등이 포함될 수 있으며, 근거리 통신 기술로는 블루투스(Bluetooth), 지그비(ZigBee), UWB(Ultra Wideband), RFID(Radio Frequency Identification), 적외선통신(Infrared Data Association, IrDA) 등이 포함될 수 있다.
일 예로서, 통신모듈은 서버(50)와 통신 연결되어 서버(50)로 음성 데이터를 전송하고, 서버(50)로부터의 음성 인식 결과를 수신할 수 있다. 또한, 통신모듈은 사용자 단말과 통신 연결되어, 사용자 단말에 등록된 폰북 데이터를 수신할 수 있다.
저장부(140)는 음성 인식 처리 장치(100)가 동작하는데 필요한 데이터 및/또는 알고리즘 등을 저장할 수 있다.
저장부(140)는 차량 단말(10) 또는 사용자 단말로부터 수신된 폰북 데이터가 저장될 수 있다. 또한, 저장부(140)는 음성인식 트리를 구성하기 위한 명령 및 설정값이 저장될 수 있으며, 문자 메시지와 관련된 발음열 및 폰북의 이름과 관련된 발음열에 대해 구성된 음성인식 트리가 저장될 수 있다. 또한, 저장부(140)는 음성 인식을 처리하고, 음성 인식 결과로부터 문자 메시지를 구성하기 위한 명령 및/또는 알고리즘이 저장될 수 있다.
여기서, 저장부(140)는 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), PROM(Programmable Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory)와 같은 저장매체를 포함할 수 있다.
음성인식 트리 생성부(150)는 문자 메시지와 관련된 게이트 명령에 대한 발음열 및 폰북의 이름에 대한 발음열을 이용하여 음성인식 트리를 구성하고, 구성된 음성인식 트리를 저장부(140)에 저장한다.
여기서, 음성인식 트리 생성부(150)는 문자 메시지와 관련된 게이트 명령(gate command)을 미리 설정하고, 음성인식 엔진용 발음열로 변환한다. 이때, 음성인식 트리 생성부(150)는 변환된 발음열을 이용하여 문자 메시지와 관련된 게이트 명령에 대한 음성인식 트리를 구성할 수 있다. 또한, 음성인식 트리 생성부(150)는 저장부(140)에 저장된 폰북 데이터의 이름을 로딩하여 음성인식 엔진용 발음열로 변환한다. 음성인식 트리 생성부(150)는 변환된 발음열을 이용하여 폰북에 대한 음성인식 트리를 구성할 수 있다.
음성인식 트리 생성부(150)에 의해 구성된 음성인식 트리에 대한 실시예는 도 3을 참조하도록 한다.
도 3을 참조하면, 음성인식 트리 생성부(150)는 (a)에 도시된 바와 같이, 사전에 문자 메시지와 관련된 게이트 명령(gate command)을 "send msg <Name>, text msg <Name> … >"과 같은 형식으로 설정할 수 있다.
또한, 음성인식 트리 생성부(150)는 저장부(140)에 저장된 폰북 데이터로부터 'James', 'Jorge', 'Jesus'와 같은 이름을 로딩한다. 이후, 음성인식 트리 생성부(150)는 (b)에 도시된 바와 같이, 문자 메시지와 관련된 게이트 명령 및 폰북의 이름을 음성인식 엔진용 발음열로 변환하여 음성인식 트리를 구성할 수 있다.
음성인식 처리부(160)는 문자 메시지 전송 기능이 실행되고 사용자로부터 발화된 음성이 입력되면, 입력된 음성 데이터를 통신부(130)를 통해 차량 단말(10) 및 서버(50)로 각각 전송한다.
이때, 음성인식 처리부(160)는 서버(50)로부터 제1 엔진에 의한 제1 음성인식 결과가 수신되면, 수신된 제1 음성인식 결과로부터 수신자 이름 및 문자 메시지 내용을 분석한다.
또한, 음성인식 처리부(160)는 차량 단말(10)로부터 제2 엔진에 의한 제2 음성인식 결과가 수신되면, 수신된 제2 음성인식 결과로부터 수신자 이름을 확인한다.
이때, 보정부(170)는 제2 음성인식 결과 또는 폰북 데이터를 이용하여 제1 음성인식 결과로부터 확인된 수신자 이름을 보정할 수 있다.
일 예로, 보정부(170)는 제1 음성인식 결과로부터 확인된 수신자 이름이 제2 음성인식 결과로부터 확인된 수신자 이름과 상이한 경우, 제2 음성인식 결과로부터 확인된 수신자 이름을 이용하여 제1 음성인식 결과로부터 확인된 수신자 이름을 보정할 수 있다.
다른 예로, 보정부(170)는 제1 음성인식 결과로부터 확인된 수신자 이름이 제2 음성인식 결과로부터 확인된 수신자 이름과 상이한 경우, 제2 음성인식 결과에 대한 신뢰도를 확인한다. 이때, 보정부(170)는 제2 음성인식 결과에 대해 확인된 신뢰도가 기준치를 초과하는 경우에 제2 음성인식 결과로부터 확인된 수신자 이름을 이용하여 제1 음성인식 결과로부터 확인된 수신자 이름을 보정할 수 있다.
한편, 보정부(170)는 제2 음성인식 결과에 대해 확인된 신뢰도가 기준치 이하인 경우에 제1 음성인식 결과로부터 확인된 수신자 이름과 폰북 데이터의 이름을 매칭하여 제1 음성인식 결과로부터 확인된 수신자 이름을 보정할 수도 있다.
따라서, 음성인식 처리부(160)는 보정부(170)에 의해 보정된 수신자 이름과, 제1 음성인식 결과로부터 확인된 문자 메시지 내용을 이용하여 최종 문자 메시지를 구성하고, 디스플레이 화면을 통해 출력할 수 있다.
상기 동작에 의해 음성인식 처리부(160)에서 최종 구성된 문자 메시지를 전송하는 실시예는 도 4를 참조하도록 한다.
도 4를 참조하면, (a)는 사용자로부터 발화되어 입력된 음성을 나타낸 것이다. 음성인식 처리부(160)는 (a)에 도시된 바와 같이 사용자로부터 발화된 음성 "Send Message to James I'm on the way. See you soon"이 입력되면, 해당 음성 데이터를 차량 단말(10) 및 서버(50)로 전송한다.
이때, 서버(50)의 제1 엔진은 사용자의 음성 데이터에 대한 음성 인식을 수행하여 (b)에 도시된 도면부호 411과 같이 수신자 이름을 'Jane'으로 인식하고, 도면부호 415과 같이 문자 메시지 내용을 'I'm on the way. See you soon'로 인식할 수 있다. 따라서, 서버(50)는 사용자의 음성 데이터에 대한 제1 음성인식 결과를 음성 인식 처리 장치(100)로 전송할 수 있다.
또한, 차량 단말(10)의 제2 엔진은 사용자의 음성 데이터에 대해 음성 인식된 텍스트와, 폰북 DB(11)에 등록된 폰북 데이터의 텍스트 매칭을 통해 (c)에 도시된 도면부호 421과 같이 수신자 이름을 'James'로 인식할 수 있다. 따라서, 차량 단말(10)은 사용자의 음성 데이터에 대한 제2 음성인식 결과를 음성 인식 처리 장치(100)로 전송할 수 있다.
여기서, 제2 엔진은 폰북 DB(11)에 등록된 폰북 데이터와의 텍스트 매칭을 통해 수신자 이름을 인식하기 때문에, 제2 엔진에 의해 인식된 수신자 이름은 제1 엔진에 의해 인식된 수신자 이름 보다 정확도가 높을 수 있다. 따라서, 음성인식 처리부(160)는 제1 음성인식 결과로부터 확인된 문자 메시지 내용 'I'm on the way. See you soon'과, 제2 음성인식 결과로부터 확인된 수신자 이름 'James'에 근거하여 최종 문자 메시지를 구성한다.
이때, 음성인식 처리부(160)는 (d)에 도시된 바와 같이, 최종 구성된 문자 메시지에 근거하여 ["I'm on the way. See you soon" Would you like to send this message to James?]와 같은 내용을 디스플레이 화면을 통해 출력하여 사용자에게 문자 메시지 내용 및 수신자 이름을 확인할 수 있다.
이때, 음성인식 처리부(160)는 디스플레이 화면에 출력된 최종 문자 메시지에 대한 사용자의 응답에 따라 최종 구성된 문자 메시지를 통신부(130)를 통해 수신자 단말로 전송하거나, 문자 메시지의 전송을 처리하는 차량 내 제어유닛으로 전송할 수 있다.
한편, 서버(50)의 제1 엔진이 음성 인식을 수행하는 중 통신 네트워크의 상태 악화로 인해 제1 엔진이 일부 음성만 인식하거나 음성 인식 자체가 불가능할 수 있다. 또한, 서버(50)가 제1 음성인식 결과를 음성 인식 처리 장치(100)로 송신하는 중 음성 인식 처리 장치(100)와 서버(50) 간 통신 네트워크의 상태 악화로 인해 음성 인식 처리 장치(100)가 제1 음성인식 결과를 수신하지 못할 수 있다.
이와 같이, 음성인식 처리부(160)는 제1 음성인식 결과가 없고 제2 음성인식 결과만 있는 경우, 제2 음성인식 결과로부터 수신자의 이름을 확인하고, 문자 메시지의 내용 확인을 위해 사용자에게 문자 메시지 내용의 발화를 요청할 수 있다. 이때, 음성인식 처리부(160)는 문자 메시지 내용의 발화를 요청하는 메시지를 디스플레이 화면을 통해 출력할 수 있다.
사용자에 의해 문자 메시지 내용이 재발화되면, 음성인식 처리부(160)는 재발화된 음성을 이용하여 음성 인식 처리를 다시 수행할 수 있다. 이때, 음성인식 처리부(160)는 서버(50)로 재발화된 음성을 전송하여 문자 메시지 내용에 대한 음성 인식 결과를 재수신할 수 있으며, 통신 네트워크의 상태에 따라 차량 단말(10)로 재발화된 음성을 전송하여 문자 메시지 내용에 대한 음성 인식 결과를 수신할 수도 있다.
따라서, 음성인식 처리부(160)는 수신자 이름과, 재수신된 음성인식 결과로부터 확인된 문자 메시지 내용을 이용하여 최종 문자 메시지를 구성하고, 디스플레이 화면을 통해 출력할 수 있다.
상기 동작에 의해 음성인식 처리부(160)에서 최종 구성된 문자 메시지를 전송하는 실시예는 도 5를 참조하도록 한다.
도 5를 참조하면, (a)는 사용자로부터 발화되어 입력된 음성을 나타낸 것이다. 음성인식 처리부(160)는 (a)에 도시된 바와 같이 사용자로부터 발화된 음성 "Send Message to James I'm on the way. See you soon"이 입력되면, 해당 음성 데이터를 차량 단말(10) 및 서버(50)로 전송한다. 한편, 서버(50)의 통신 네트워크의 상태 악화로 인해 서버(50)의 제1 엔진으로부터 도면부호 511의 수신자 이름 및 문자 메시지 내용의 인식이 불가할 수 있다.
한편, 차량 단말(10)의 제2 엔진은 사용자의 음성 데이터에 대해 음성 인식된 텍스트와, 폰북 DB(11)에 등록된 폰북 데이터의 텍스트 매칭을 통해 (b)에 도시된 도면부호 521과 같이 수신자 이름을 'James'로 인식할 수 있다. 따라서, 차량 단말(10)은 사용자의 음성 데이터에 대한 제2 음성인식 결과를 음성 인식 처리 장치(100)로 전송할 수 있다.
이에, 음성인식 처리부(160)는 제1 음성인식 결과를 수신하지 못하였으므로, (c)에 도시된 바와 같이 문자 메시지 내용의 재발화를 요청하는 메시지 [Network is not available, please say the message you want to send.]를 디스플레이 화면을 통해 출력할 수 있다.
따라서, (d)에 도시된 바와 같이, 사용자로부터 'I'm on the way. See you soon'이 재발화되면, 음성인식 처리부(160)는 제2 음성인식 결과로부터 확인된 수신자 이름 'James' 및 사용자에 의해 재발화된 문자 메시지 내용에 대한 음성 인식 결과에 근거하여 최종 문자 메시지를 구성한다.
이때, 음성인식 처리부(160)는 (e)에 도시된 바와 같이, 최종 구성된 문자 메시지에 근거하여 ["I'm on the way. See you soon" Would you like to send this message to James?]와 같은 내용을 디스플레이 화면을 통해 출력하여 사용자에게 문자 메시지 내용 및 수신자 이름을 확인할 수 있다.
이때, 음성인식 처리부(160)는 디스플레이 화면에 출력된 최종 문자 메시지에 대한 사용자의 응답에 따라 최종 구성된 문자 메시지를 통신부(130)를 통해 수신자 단말로 전송하거나, 문자 메시지의 전송을 처리하는 차량 내 제어유닛으로 전송할 수 있다.
상기에서와 같이 동작하는 본 실시예에 따른 음성 인식 처리 장치(100)는 독립적인 하드웨어 장치 형태로 구현될 수 있으며, 적어도 하나 이상의 프로세서(processor)로서 마이크로프로세서나 범용 컴퓨터 시스템과 같은 다른 하드웨어 장치에 포함된 형태로 구동될 수 있다.
상기와 같이 구성되는 본 발명에 따른 음성 인식 처리 장치의 동작 흐름을 보다 상세히 설명하면 다음과 같다.
도 6은 본 발명에 따른 음성인식 트리 구성 동작에 대한 흐름을 나타낸 도면이다.
도 6을 참조하면, 음성 인식 처리 장치(100)는 문자 메시지와 관련된 게이트 명령(gate command)을 설정하고(S10), 문자 메시지와 관련된 게이트 명령을 음성인식 엔진용 발음열로 변환한다(S20). 또한, 음성 인식 장치는 폰북 데이터의 이름을 로딩하고(S30), 로딩된 이름을 음성인식 엔진용 발음열로 변환한다(S40).
이후, 음성 인식 처리 장치(100)는 'S20' 및 'S40' 과정에서 변환된 발음열을 이용하여 문자 메시지와 관련된 게이트 명령 및 폰북에 대한 음성인식 트리를 구성하여(S50), 저장할 수 있다(S60).
도 7은 본 발명의 제1 실시예에 따른 음성 인식 처리 방법의 동작 흐름을 나타낸 도면이다.
도 7을 참조하면, 음성 인식 처리 장치(100)는 문자 메시지 전송 기능이 실행되고(S100), 사용자로부터 발화된 음성이 입력되면(S110), 입력된 음성 데이터를 차량 단말(10) 및 서버(50) 내 음성인식 엔진으로 각각 전송한다(S120).
이때, 음성 인식 처리 장치(100)는 서버(50)로부터 제1 엔진에 의한 제1 음성인식 결과가 수신되면(S130), 수신된 제1 음성인식 결과로부터 수신자 이름 및 문자 메시지 내용을 분석한다(S140).
또한, 음성 인식 처리 장치(100)는 차량 단말(10)로부터 제2 엔진에 의한 제2 음성인식 결과가 수신되면(S150), 수신된 제2 음성인식 결과로부터 수신자 이름을 확인한다(S160).
이때, 음성 인식 처리 장치(100)는 제2 음성인식 결과를 이용하여 제1 음성인식 결과로부터 확인된 수신자 이름을 보정한다(S170).
이후, 음성 인식 처리 장치(100)는 'S170' 과정에서 보정된 수신자 이름과, 'S140' 과정에서 확인된 문자 메시지 내용을 이용하여 최종 문자 메시지를 구성하고, 디스플레이 화면을 통해 출력하여 최종 문자 메시지를 확인한다(S180). 이때, 음성 인식 처리 장치(100)는 'S180' 과정에서 확인된 문자 메시지를 수신자 단말로 전송하거나, 문자 메시지의 전송을 처리하는 차량 내 제어유닛으로 전송할 수 있다(S190).
도 8은 본 발명의 제1 실시예에 따른 음성 인식 처리 방법의 동작 흐름을 나타낸 도면이다.
도 8을 참조하면, 음성 인식 처리 장치(100)는 문자 메시지 전송 기능이 실행되고(S200), 사용자로부터 발화된 음성이 입력되면(S210), 입력된 음성 데이터를 차량 단말(10) 및 서버(50) 내 음성인식 엔진으로 각각 전송한다(S220).
이때, 음성 인식 처리 장치(100)는 서버(50)로부터 제1 엔진에 의한 제1 음성인식 결과가 수신되면(S230), 수신된 제1 음성인식 결과로부터 수신자 이름 및 문자 메시지 내용을 분석한다(S240).
또한, 음성 인식 처리 장치(100)는 차량 단말(10)로부터 제2 엔진에 의한 제2 음성인식 결과가 수신되면(S250), 수신된 제2 음성인식 결과로부터 수신자 이름을 확인한다(S260).
이때, 음성 인식 처리 장치(100)는 제1 음성인식 결과로부터 확인된 수신자 이름이 제2 음성인식 결과로부터 확인된 수신자 이름과 상이한 경우, 제2 음성인식 결과에 대한 신뢰도를 확인한다. 제2 음성인식 결과에 대해 확인된 신뢰도가 기준치를 초과하는 경우(S270), 음성 인식 처리 장치(100)는 제2 음성인식 결과를 이용하여 제1 음성인식 결과로부터 확인된 수신자 이름을 보정한다(S280).
반면, 음성 인식 처리 장치(100)는 제2 음성인식 결과에 대해 확인된 신뢰도가 기준치 이하인 경우(S270), 폰북 데이터를 호출하고(S290), 제1 음성인식 결과로부터 확인된 수신자 이름과 폰북 데이터의 이름을 매칭하여(S300), 제1 음성인식 결과로부터 확인된 수신자 이름을 보정한다(S310).
이후, 음성 인식 처리 장치(100)는 'S280' 또는 'S310' 과정에서 보정된 수신자 이름과, 'S240' 과정에서 확인된 문자 메시지 내용을 이용하여 최종 문자 메시지를 구성하고, 디스플레이 화면을 통해 출력하여 최종 문자 메시지를 확인한다(S320). 이때, 음성 인식 처리 장치(100)는 'S320' 과정에서 확인된 문자 메시지를 수신자 단말로 전송하거나, 문자 메시지의 전송을 처리하는 차량 내 제어유닛으로 전송할 수 있다(S330).
도 9는 본 발명의 제3 실시예에 따른 음성 인식 처리 방법의 동작 흐름을 나타낸 도면이다.
도 9를 참조하면, 음성 인식 처리 장치(100)는 문자 메시지 전송 기능이 실행되고(S400), 사용자로부터 발화된 음성이 입력되면(S410), 입력된 음성 데이터를 차량 단말(10) 및 서버(50) 내 음성인식 엔진으로 각각 전송한다(S420).
이때, 음성 인식 처리 장치(100)는 통신 네트워크의 상태 악화 등으로 인해 서버(50)로부터 제1 엔진에 의한 제1 음성인식 결과가 수신되지 않고(S430), 차량 단말(10)로부터 제2 엔진에 의한 제2 음성인식 결과만 수신되었다면(S440), 수신된 제2 음성인식 결과로부터 수신자 이름을 확인한다(S450).
음성 인식 처리 장치(100)는 서버(50)로부터 제1 음성인식 결과를 수신하지 못하였으므로, 사용자에게 문자 메시지 내용의 재발화를 요청하고(S460), 사용자에 의해 재발화된 음성에 대한 음성 인식 결과에 근거하여 문자 메시지 내용을 확인한다(S470).
이후, 음성 인식 처리 장치(100)는 'S450' 과정에서 확인된 수신자 이름과, 'S470' 과정에서 확인된 문자 메시지 내용을 이용하여 최종 문자 메시지를 구성하고, 디스플레이 화면을 통해 출력하여 최종 문자 메시지를 확인한다(S480). 이때, 음성 인식 처리 장치(100)는 'S480' 과정에서 확인된 문자 메시지를 수신자 단말로 전송하거나, 문자 메시지의 전송을 처리하는 차량 내 제어유닛으로 전송할 수 있다(S490).
도 10은 본 발명의 일 실시예에 따른 방법이 실행되는 컴퓨팅 시스템을 도시한 도면이다.
도 10을 참조하면, 컴퓨팅 시스템(1000)은 버스(1200)를 통해 연결되는 적어도 하나의 프로세서(1100), 메모리(1300), 사용자 인터페이스 입력 장치(1400), 사용자 인터페이스 출력 장치(1500), 스토리지(1600), 및 네트워크 인터페이스(1700)를 포함할 수 있다.
프로세서(1100)는 중앙 처리 장치(CPU) 또는 메모리(1300) 및/또는 스토리지(1600)에 저장된 명령어들에 대한 처리를 실행하는 반도체 장치일 수 있다. 메모리(1300) 및 스토리지(1600)는 다양한 종류의 휘발성 또는 불휘발성 저장 매체를 포함할 수 있다. 예를 들어, 메모리(1300)는 ROM(Read Only Memory) 및 RAM(Random Access Memory)을 포함할 수 있다.
따라서, 본 명세서에 개시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서(1100)에 의해 실행되는 하드웨어, 소프트웨어 모듈, 또는 그 2개의 결합으로 직접 구현될 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM과 같은 저장 매체(즉, 메모리(1300) 및/또는 스토리지(1600))에 상주할 수도 있다. 예시적인 저장 매체는 프로세서(1100)에 커플링되며, 그 프로세서(1100)는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서(1100)와 일체형일 수도 있다. 프로세서 및 저장 매체는 주문형 집적회로(ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.
따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
10: 차량 단말 11: 폰북 DB
15: 음성인식 엔진 50: 서버
55: 음성인식 엔진 100: 음성 인식 처리 장치
110: 제어부 120: 인터페이스부
130: 통신부 140: 저장부
150: 음성인식 트리 생성부 160: 음성인식 처리부
170: 보정부

Claims (21)

  1. 문자 메시지 전송 기능이 실행되면,
    문자 메시지와 관련된 게이트 명령 및 폰북 데이터에 포함된 하나 이상의 이름을 음성인식 엔진용 발음열로 변환하고, 상기 음성인식 엔진용 발음열에 기초하여 음성인식 트리를 구성하는 음성인식 트리 생성부; 및
    사용자로부터 발화된 음성 데이터를 차량 단말 및 서버로 각각 전송하여 음성 인식 처리를 요청하고, 상기 음성인식 트리를 기반으로, 상기 서버 내 제1 음성인식 엔진을 통해 생성된 제1 음성인식 결과로부터 문자 메시지 내용을 확인하고,
    상기 음성인식 트리를 기반으로, 상기 차량 단말 내 제2 음성인식 엔진을 통해, 음성 인식된 상기 음성 데이터에 포함된 수신자 이름과 상기 차량 단말 내 폰북 DB에 저장된 폰북 데이터에 포함된 하나 이상의 이름 사이의 텍스트 매칭을 통해 생성된 제2 음성인식 결과로부터 상기 수신자 이름을 확인하고,
    상기 확인된 문자 메시지 내용 및 상기 확인된 수신자 이름에 기초하여 최종 문자 메시지를 구성하는 음성인식 처리부;
    를 포함하는 것을 특징으로 하는 음성 인식 처리 장치.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 청구항 1에 있어서,
    상기 제2 음성인식 결과에 대한 신뢰도가 기준치 이하인 경우,
    상기 음성인식 처리부를 통해 상기 음성인식 트리를 기반으로, 상기 제1 음성인식 결과로부터 더 확인된 수신자 이름으로, 상기 최종 문자 메시지의 기초가 되는 상기 수신자 이름을 보정하는 보정부를 더 포함하고,
    상기 음성인식 처리부는,
    상기 보정된 수신자 이름에 기초하여 상기 구성된 최종 문자 메시지를 변경하는 것을 특징으로 하는 음성 인식 처리 장치.
  7. 삭제
  8. 청구항 1에 있어서,
    상기 음성인식 처리부는,
    상기 서버의 네트워크 통신 상태에 따라 상기 제1 음성인식 결과가 수신되지 않은 경우, 상기 사용자에게 상기 문자 메시지 내용에 대한 재발화를 요청하는 메시지를 출력하는 것을 특징으로 하는 음성 인식 처리 장치.
  9. 청구항 1에 있어서,
    상기 음성인식 처리부는,
    상기 제1 음성인식 결과로부터 상기 문자 메시지 내용의 확인이 불가한 경우, 상기 사용자에게 상기 문자 메시지 내용에 대한 재발화를 요청하는 메시지를 출력하는 것을 특징으로 하는 음성 인식 처리 장치.
  10. 청구항 8 또는 청구항 9에 있어서,
    상기 음성인식 처리부는,
    상기 사용자에 의해 재발화된 음성에 대한 제1 음성 인식 결과로부터 확인된 문자 메시지 내용 및 상기 확인된 수신자 이름에 기초하여 상기 최종 문자 메시지를 구성하는 것을 특징으로 하는 음성 인식 처리 장치.
  11. 청구항 1에 있어서,
    상기 음성인식 처리부는,
    상기 구성된 최종 문자 메시지를 디스플레이 화면을 통해 출력하고, 상기 사용자의 응답에 따라 상기 구성된 최종 문자 메시지를 전송하는 것을 특징으로 하는 음성 인식 처리 장치.
  12. 삭제
  13. 문자 메시지 전송 기능이 실행되면,
    문자 메시지와 관련된 게이트 명령 및 폰북 데이터에 포함된 하나 이상의 이름을 음성인식 엔진용 발음열로 변환하는 단계;
    상기 음성인식 엔진용 발음열에 기초하여 음성인식 트리를 구성하는 단계;
    사용자로부터 발화된 음성 데이터를 차량 단말 및 서버로 각각 전송하여 음성 인식 처리를 요청하는 단계;
    상기 음성인식 트리를 기반으로, 상기 서버 내 제1 음성인식 엔진의 제1 음성인식 결과로부터 문자 메시지 내용을 확인하는 단계;
    상기 음성인식 트리를 기반으로, 상기 차량 단말 내 제2 음성인식 엔진을 통해, 음성 인식된 상기 음성 데이터에 포함된 수신자 이름과 상기 차량 단말 내 폰북 DB에 저장된 폰북 데이터에 포함된 하나 이상의 이름 사이의 텍스트 매칭을 통해 생성된 제2 음성인식 결과로부터 상기 수신자 이름을 확인하는 단계; 및
    상기 확인된 문자 메시지 내용 및 상기 확인된 수신자 이름에 기초하여 최종 문자 메시지를 구성하는 단계;
    를 포함하는 것을 특징으로 하는 음성 인식 처리 방법.
  14. 삭제
  15. 삭제
  16. 청구항 13에 있어서,
    상기 제2 음성인식 결과에 대한 신뢰도가 기준치 이하인 경우,
    상기 음성인식 트리를 이용하여, 상기 제1 음성인식 결과로부터 상기 수신자 이름을 확인하는 단계; 및
    상기 제1 음성인식 결과로부터 확인된 수신자 이름으로 상기 최종 문자 메시지의 기초가 되는 상기 수신자 이름을 보정하고, 상기 보정된 수신자 이름 및 상기 확인된 문자 메시지 내용에 기초하여 상기 구성된 최종 문자 메시지를 변경하는 단계;
    를 더 포함하는 것을 특징으로 하는 음성 인식 처리 방법.
  17. 청구항 13에 있어서,
    상기 서버의 네트워크 통신 상태에 따라 상기 제1 음성인식 결과가 수신되지 않거나 상기 제1 음성인식 결과로부터 상기 문자 메시지 내용의 확인이 불가한 경우, 상기 사용자에게 상기 문자 메시지 내용에 대한 재발화를 요청하는 메시지를 출력하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식 처리 방법.
  18. 청구항 17에 있어서,
    상기 사용자에 의해 재발화된 음성에 대한 제1 음성 인식 결과로부터 확인된 문자 메시지 내용 및 상기 확인된 수신자 이름에 기초하여 상기 최종 문자 메시지를 구성하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식 처리 방법.
  19. 청구항 13에 있어서,
    상기 구성된 최종 문자 메시지를 디스플레이 화면을 통해 출력하는 단계; 및
    상기 출력된 최종 문자 메시지에 대한 상기 사용자의 응답에 따라 상기 구성된 최종 문자 메시지를 전송하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식 처리 방법.
  20. 삭제
  21. 제1 음성인식 엔진을 포함하고, 입력된 음성 데이터에 대하여 상기 제1 음성인식 엔진을 통해 제1 음성인식 결과를 생성하는 서버;
    제2 음성인식 엔진 및 폰북 데이터가 저장된 폰북 DB를 포함하고, 상기 제2 음성인식 엔진을 통해, 상기 입력된 음성 데이터에 포함된 수신자 이름과 폰북 데이터에 포함된 하나 이상의 이름 사이의 텍스트 매칭을 통해 제2 음성인식 결과를 생성하는 차량 단말; 및
    문자 메시지와 관련된 게이트 명령 및 상기 폰북 데이터에 포함된 하나 이상의 이름을 음성인식 엔진용 발음열로 변환하고, 상기 음성인식 엔진용 발음열에 기초하여 음성인식 트리를 구성하고, 상기 음성인식 트리를 기반으로, 상기 서버로부터 수신된 상기 제1 음성인식 결과로부터 문자 메시지 내용을 확인하고, 상기 차량 단말로부터 수신된 상기 제2 음성인식 결과로부터 상기 수신자 이름을 확인하고, 상기 확인된 문자 메시지 내용 및 상기 확인된 수신자 이름에 기초하여 최종 문자 메시지를 구성하는 음성 인식 처리 장치;
    를 포함하는 것을 특징으로 하는 차량 시스템.
KR1020170069569A 2017-06-05 2017-06-05 음성 인식 처리 장치 및 방법, 그리고 차량 시스템 KR102383429B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170069569A KR102383429B1 (ko) 2017-06-05 2017-06-05 음성 인식 처리 장치 및 방법, 그리고 차량 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170069569A KR102383429B1 (ko) 2017-06-05 2017-06-05 음성 인식 처리 장치 및 방법, 그리고 차량 시스템

Publications (2)

Publication Number Publication Date
KR20180133078A KR20180133078A (ko) 2018-12-13
KR102383429B1 true KR102383429B1 (ko) 2022-04-07

Family

ID=64671214

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170069569A KR102383429B1 (ko) 2017-06-05 2017-06-05 음성 인식 처리 장치 및 방법, 그리고 차량 시스템

Country Status (1)

Country Link
KR (1) KR102383429B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111752169A (zh) * 2019-03-27 2020-10-09 广州汽车集团股份有限公司 一种车载终端控制方法、装置及系统
KR102491951B1 (ko) * 2022-10-12 2023-01-27 서울교통공사 지적확인환호 미이행 경보시스템 및 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8364481B2 (en) * 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
KR20140054643A (ko) * 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
KR101684554B1 (ko) 2015-08-20 2016-12-08 현대자동차 주식회사 음성 다이얼링 시스템 및 그 방법

Also Published As

Publication number Publication date
KR20180133078A (ko) 2018-12-13

Similar Documents

Publication Publication Date Title
KR102552486B1 (ko) 차량의 음성인식 장치 및 방법
US10850745B2 (en) Apparatus and method for recommending function of vehicle
US8676582B2 (en) System and method for speech recognition using a reduced user dictionary, and computer readable storage medium therefor
CN111095400A (zh) 选择系统和方法
WO2014096506A1 (en) Method, apparatus, and computer program product for personalizing speech recognition
US10580403B2 (en) Method for controlling operation of an agricultural machine and system thereof
US7526286B1 (en) System and method for controlling a computer via a mobile device
US20160004501A1 (en) Audio command intent determination system and method
KR20210016815A (ko) 복수의 지능형 에이전트를 관리하는 전자 장치 및 그의 동작 방법
KR102383429B1 (ko) 음성 인식 처리 장치 및 방법, 그리고 차량 시스템
JP6787269B2 (ja) 音声認識システム及び音声認識方法
US20190304456A1 (en) Storage medium, spoken language understanding apparatus, and spoken language understanding method
KR20200053341A (ko) 차량 및 그 제어방법
JP7343087B2 (ja) 音声認識の方法、装置、およびデバイス、並びにコンピュータ可読記憶媒体
US20160048759A1 (en) Method and system for providing information via an intelligent user interface
KR102474804B1 (ko) 음성 인식 제어 장치, 그를 포함한 시스템 및 그 방법
US11151995B2 (en) Electronic device for mapping an invoke word to a sequence of inputs for generating a personalized command
JP6904225B2 (ja) 情報処理装置
US20220286757A1 (en) Electronic device and method for processing voice input and recording in the same
US20130013297A1 (en) Message service method using speech recognition
JP2012063526A (ja) 端末装置、音声認識方法および音声認識プログラム
CN114360549A (zh) 语音识别纠错方法、装置及电子设备、存储介质
US11646031B2 (en) Method, device and computer-readable storage medium having instructions for processing a speech input, transportation vehicle, and user terminal with speech processing
KR102474806B1 (ko) 음성 인식 장치 및 방법, 그리고 차량 시스템
CN107195298B (zh) 根本原因分析以及校正系统和方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right