KR20050077806A - 음성 대화 실행 방법 및 음성 대화 시스템 - Google Patents
음성 대화 실행 방법 및 음성 대화 시스템 Download PDFInfo
- Publication number
- KR20050077806A KR20050077806A KR1020050008381A KR20050008381A KR20050077806A KR 20050077806 A KR20050077806 A KR 20050077806A KR 1020050008381 A KR1020050008381 A KR 1020050008381A KR 20050008381 A KR20050008381 A KR 20050008381A KR 20050077806 A KR20050077806 A KR 20050077806A
- Authority
- KR
- South Korea
- Prior art keywords
- voice conversation
- voice
- sds
- conversation
- user
- Prior art date
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47L—DOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
- A47L23/00—Cleaning footwear
- A47L23/22—Devices or implements resting on the floor for removing mud, dirt, or dust from footwear
- A47L23/24—Rigid cleaning-gratings; Tread plates or scrapers for cleaning the soles of footwear
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60N—SEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
- B60N3/00—Arrangements or adaptations of other passenger fittings, not otherwise provided for
- B60N3/04—Arrangements or adaptations of other passenger fittings, not otherwise provided for of floor mats or carpets
- B60N3/048—Arrangements or adaptations of other passenger fittings, not otherwise provided for of floor mats or carpets characterised by their structure
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Abstract
본 발명은 특히 차량 환경에서 음성 대화 시스템(SDS)과 적어도 하나의 전자 장치를 제어하는 사용자 간에 음성 대화를 실행하는 방법에 관한 것으로서, 상기 SDS가 소정의 중지 명령의 수신 시에 음성 대화를 인터럽트하는 단계 및 상기 SDS가 소정의 계속 명령의 수신 시에 음성 대화를 계속하는 단계를 포함한다. 또한, 본 발명은 음성 대화를 인터럽트하는 수단 및 인터럽트된 음성 대화를 계속하는 수단을 포함한다.
Description
본 발명은 음성 대화 시스템(SDS)과 적어도 하나의 전자 장치를 제어하는 사용자 간에 음성 대화를 실행하는 방법 및 적어도 하나의 전자 장치를 제어하는 사용자와 음성 대화를 실행하는 음성 대화 시스템(SDS)에 관한 것이다.
음성 대화 시스템은 인간 사용자와 머신 또는 전자 장치 간의 인터페이스를 나타냄으로써, 사용자는 음성 명령을 분석하고 컨트롤 명령을 필터링하여 이를 머신 또는 전자 장치에 전송하는 SDS에 음성 명령을 제공함으로써 머신을 제어할 수 있다. 이러한 SDS 및 사용자에 의해 실행되는 음성 대화는 통상 SDS가 음성 입력 요청을 출력하는 단계; 사용자로부터의 음성 입력을 대기하는 단계; 및 사용자로부터 음성 입력을 수신하는 단계를 포함한다. 전체 음성 대화를 실행하기 위해서, 이들 단계는 그 후 필요할 만큼 수회 반복되어 사용자가 제공하기를 원하는 모든 컨트롤 명령을 SDS에 의해 제어가능한 머신 또는 전자 장치에 제공한다. 이러한 SDS는 차량 안에서 사용되어, 예를 들어 사용자가 운전시 시선을 돌리는 일없이 그의 차량의 적어도 일부의 전자 장치, 예를 들면, 라디오, 네비게이션 시스템 또는 기후 컨트롤 등을 제어할 수 있는 능력을 제공한다.
그러나, 공지된 SDS는 다음 문제를 나타낸다. 구두 입력에 대한 요청 후에, SDS는 사용자에게 알려서 입력을 대기한다. 그가 다른 것에 몰두하고 있기 때문에, 예를 들어, 그가 트래픽에 집중하여야 하기 때문에 입력 대기가 사용자에게 제공되지 않는 경우, SDS는 음성 입력 대기를 중단하고 애플리케이션을 셧다운시킨다. 따라서, 사용자로부터 수신된 미리 주어진 정보 상실되어 사용자가 그의 동작을 진행시키기 위해서는 애플리케이션을 다시 개시하여야 한다.
따라서, 본 발명의 목적은 SDS와 사용자 간의 음성 대화를 실행하는 방법과 상술한 문제점을 극복하는 SDS를 제공하는 것이며, 이에 따라, 보다 편하게 음성 대화를 실행하는 방법과 SDS를 제공하는 것이다.
이 목적은 청구항 제1항에 따른 음성 대화와 청구항 제14항에 따른 SDS를 실행하는 방법으로 해결된다.
따라서, 특히 차량 환경에서 음성 대화 시스템(SDS)과 적어도 하나의 전자 장치를 제어하는 사용자 간에 음성 대화를 실행하는 방법으로서,
SDS가 소정의 중지 명령의 수신 시에 음성 대화를 인터럽트하는 단계; 및
SDS가 소정의 계속 명령의 수신 시에 음성 대화를 계속하거나 또는 SDS가 소정의 취소의 수신 시에 음성 대화를 수신하는 단계를 포함한다.
본 발명의 방법에 따르면, 임의의 시점에서 음성 대화를 인터럽트할 수 있고 추후 시점에서 이를 계속할 수 있다. 여기서 "계속"이라는 용어는 음성 대화는 처음부터 재시작되지 않고, 예를 들면, 사용자로부터 이전에 제공된 음성 입력 중 일부가 예를 들면 내부 스토리지 수단에 저장된 SDS에 여전히 이용가능하게 되어, SDS가 인터럽트 이전에 모든 이들 입력을 다시 요청할 필요가 없게 된다. 그 결과, 계속하는 대신, 사용자는 또한 인터럽트된 음성 대화에 대하여 개시 및 추후의 것의 취소를 요청할 수 있다.
음성 대화를 실행하는 방법의 바람직한 실시예에 따르면, 음성 대화를 계속하는 단계는 음성 대화의 일부를 반복하는 단계를 포함할 수 있다. 실제, 음성 대화는 또한 인터럽트된 위치에서 정확하게 계속될 수 있지만, 음성 대화의 일부를 반복되는 것이 바람직한 환경일 수 있다.
예를 들면, 음성 대화의 일부를 반복함으로써, 사용자는 인터럽트 이전에 그/그녀의 입력에 대한 SDS로부터의 정보를 수신할 수 있으며, 이에 따라, 그/그녀에게 음성 대화를 계속하게 된다. SDS는 예를 들어 디스플레이를 사용하는 광학적으로 및/또는 음성적으로 정보를 제공할 수 있다.
또한, 예를 들면, 음성 대화가 네비게이션 시스템에의 주소 입력에 대한 것인 경우, 논리부가 첫째, 도시를, 다음에는, 거리 및 거리번호와 같은 여러 논리부로 나뉠 수 있다. 이러한 음성 대화는, 음성 대화를 인터럽트한 후에, 음성 대화가 인터럽트가 발생하는 위치에 따라 이들 논리부 중 하나를 개시하는 것으로 계속될 수 있는 것이 바람직하다. 제2 논리부 내의 해당 예에서, 거리명은 미리 주어지지만 거리번호는 주어지지 않은 경우, 음성 대화는 사용자에게 거리번호를 요청하는 것으로 진행할 수 있다. 음성 대화의 일부를 반복함으로써, 그가 이전에 입력하는 모든 세부사항을 명심할 필요가 없기 때문에 그의 입력을 계속하기에 보다 용이해진다.
다른 실시예에 따르면, 음성 대화 계속 단계는, 특히 사용자로부터의 대응 명령의 수신 시에, SDS가 음성 대화를 인터럽트하기 전에 SDS의 적어도 최종 출력을 출력하는 단계 및/또는 SDS가 음성 대화를 인터럽트하기 전에 사용자로부터 수신된 적어도 마지막 음성 입력을 출력하는 단계 및/또는 SDS가 사용자로부터의 음성 입력을 대기하는 단계를 포함할 수 있다.
이러한 특징을 제공함으로써, 사용자는 음성 대화가 인터럽트된 위치를 기억하는 것을 지원받는다. 예를 들면, SDS는 대응하여 수신된 음성 입력으로 음성 입력에 대한 최종 요청을 반복하고 음성 입력에 대한 추후 요청으로 반복할 수 있거나, 또는, 이미 제공된 음성 입력 모드를 SDS가 반복한 후 최종 요청을 반복하거나 음성 입력에 대한 다음 요청을 진행할 수 있다. 또다른 변형에서, 이미 제공된 음성 입력과 음성 입력에 대한 최종 요청을 반복한 후에, SDS는 사용자로부터 대응 음성 입력을 대기한다.
또한, 사용자는 음성 대화가 인터럽트된 위치 및/또는 그/그녀에게 이미 주어진 정보의 유형을 상기시킬 수 있게 하는 SDS로부터의 정보를 요청할 수 있다.
따라서, 음성 대화가 인터럽트된 위치 및/또는 사용자에 의해 SDS에 제공된 정보의 유형에 대한 정보를 SDS가 제공함에 따라 SDS의 사용자 친화성이 향상된다.
특히, 본 발명에서는, 음성 대화의 계속 단계는 사용자에게 인터럽트된 음성 대화가 계속되고 있음을 통지하는 단계를 포함하는 것이 바람직하다. 이는 특정 계속 출력이 SDS에 의해 사용자에게 주어져서 그에게 추후 이전에 인터럽트된 음성 대화가 계속됨을 알리는 것을 의미한다. 따라서, SDS의 사용자 친화성이 또한 향상된다.
바람직한 실시예에서, 음성 대화를 인터럽트 및/또는 계속하는 단계는 전자 장치의 대응 명령의 수신 시에 또는 사용자의 대응 음성 또는 촉각 명령의 수신 시에 SDS에 의해 실행될 수 있다. 여기서, 결과적으로 SDS가 제어가능하지 않은 전자 장치는 SDS에게 중지 또는 계속 명령을 제공할 수 있다.
따라서, 음성 대화는 전자 장치에 의해 인터럽트될 수 있으며, 반면에, 사용자로부터 동작에 의해 인터럽트될 수 있다. 예를 들면, 트래픽이 너무 많고 보다 많은 주의가 사용자로부터 필요한 경우, 사용자는 "중지" 등의 음성 명령을 줄 수 있거나 이는 음성 대화 시스템의 컨트롤 키를 활성화하여 대화를 인터럽트할 수 있다. 그 후, 인터럽트된 음성 대화를 계속하기를 원하는 경우, "계속" 또는 SDS의 컨트롤 키의 활성 등의 음성 명령은 음성 대화의 계속을 이끌 수 있다. 음성 대화를 인터럽트 또는 계속할 많은 가능성으로 인해, 사용자 친화성이 더욱 향상된다.
일 실시예에 따르면, 본 발명의 방법은 후속 음성 대화를 개시하는 단계를, 특히, 제1 음성 대화의 인터럽트 동안 상이한 전자 장치를 제어하는 단계를 더 포함한다. 새로운 상태 위치의 네비게이션 시스템으로의 입력이 인커밍 전화 통화에 의해 인터럽트되는 상기 예에서, 전화 대화 동안 사용자는 새로운 주소 또는 전화번호를 그의 전화기에 저장하기를 원하는 경우를 생각할 수 있으며, 이에 따라, 본 발명은, 제1 인터럽트된 음성 대화가 이미 있는 경우에 대해서도 음성 대화 시스템을 사용하여 새로운 주소 또는 전화 번호를 저장할 수 있는 기회를 갖는다. 이러한 가능성으로, 사용자는 인터럽트된 음성 대화가 있는지를 걱정할 필요가 없게 된다.
다른 실시예에 따르면, 인터럽트된 음성 대화 중 하나를 계속하는 단계는, 사용자에게 계속되는 음성 대화를, 특히, 음성 대화에 의해 제어될 전자 장치의 식별자를 출력하여 통지하는 단계를 포함할 수 있다. 여러 음성 대화가 인터럽트되고 사용자가 이들 음성 대화 중 하나를 계속하는 경우, SDS는 사용자에게 어느 음성 대화를 계속할 지를 통지하는 것이 바람직하다. 이는 예를 들면 음성 대화에 의해 제어될 적어도 전자 장치의 명칭을 알림으로써 행해진다. 따라서, 사용자는 어느 유형의 음성 대화가 여전히 인터럽트되고 어느 음성 대화가 계속될 지를 걱정할 필요가 없다.
특히, 일 실시예에서, 본 방법은 인터럽트된 음성 대화의 식별자를 디스플레이하는 단계, 특히, 음성 대화의 인터럽트 동안 음성 대화에 의해 제어될 전자 장치의 이름을 디스플레이하는 단계를 포함할 수 있다. SDS는 디스플레이에 접속될 수 있으며, 이 디스플레이는 SDS의 결합된 일부일 수 있고, 음성 대화의 인터럽트 동안, 이 디스플레이는 어느 음성 대화가 현재 인터럽트되는 지를 사용자에게 계속 알리는데 사용된다. 이는 또한 어느 음성 대화가 인터럽트되어 계속될 수 있는지를 사용자에게 인지할 수 있다.
변형예에서, 본 방법은 대응 음성 대화의 인터럽트 동안 SDS에 의해 제어가능한 전자 장치의 현재 동작을 인터럽트하는 단계를 포함할 수 있다. 예를 들면, 사용자가 라디오를 제어하기 위해서 SDS와 현재 대화하고 전화기가 인커밍 호출을 수신하여 SDS에 중지 명령을 제공하는 경우에는, 라디오의 동작은 또한 인터럽트되어 전화기 통화 동안 백그라운드 잡음 레벨이 감소될 수 있기 때문에 사용자 친화도를 더욱 향상시킨다.
다른 실시예에서, 본 방법은 대응 음성 대화의 인터럽트 동안 SDS에 의해 제어가능한 전자 장치에 컨트롤 명령을 전송하는 단계를 포함한다. 예를 들면, 음성 대화가 하나의 CD를 다른 CD로 교환하기 위해서 컴팩트 디스크(CD) 교환기를 제어하는데 사용되고, 사용자가 그가 CD를 바꾸기를 원한다고 SDS에 말한 후에 그러나 새로운 CD를 말하지 전에 대화의 인터럽트를 결정하는 경우, SDS는 플레이어의 현재 CD에서 저장소로 제거하라고 CD 플레이어에 지시하고 새로운 CD에 대한 다음 명령을 대기하라는 컨트롤 명령을 전자 장치에 이미 제공할 수 있다. 이렇게 함으로써, 일단 사용자가 음성 대화를 계속 한다고 결정하여 시스템에 그가 듣기 원하는 CD를 말하는 경우, 새로운 CD를 들을 수 있을 때까지의 대기 시간이 감소될 수 있다. 이는 또한 전체 시스템의 사용자 친화도를 향상시킨다. 다른 예에서, 대기 시간을 더욱 감소시키기 위해서, 인터럽트 동안 음성 대화에 관련된 전자 장치가 원격으로 정보를 계속 다운로드할 수 있다.
음성 대화의 취소 단계는 인터럽트된 음성 대화가 취소되었음을 사용자에게 통지하는 단계를 포함하는 것이 바람직하다. 이는 그가 이전에 인터럽트된 음성 대화가 취소되었음을 알리는 특정 출력이 사용자에게 제공됨을 의미한다. 따라서, SDS의 사용자 친화도가 더욱 향상된다.
일 실시예에 따르면, 음성 대화를 취소하는 단계는 사용자의 대응 음성 또는 촉각 명령의 수신 시에 수행된다. 사용자의 선호도에 따라, 취소는 음성 또는 손으로 수행될 수 있다.
또한, 본 발명은 이전에 언급된 청구항 중 하나의 방법의 단계들을 수행하게 하는 컴퓨터 실행가능 명령을 갖는 하나 이상의 컴퓨터 판독가능 매체를 포함하는 컴퓨터 프로그램 제품을 포함할 수 있다.
또한, 본 발명은, 음성 대화를 인터럽트하는 수단과 인터럽트된 음성 대화를 계속하는 수단을 포함하는 적어도 하나 이상의 전자 장치를 제어하는 사용자와 음성 대화를 수행하는 음성 대화 시스템(SDS)를 제공한다. 따라서, SDS는 임의의 시점에서 음성 대화를 인터럽트하고 추후 시점에서 계속할 수 있는 가능성을 제공한다.
일 실시예에서, 계속 수단은 음성 대화가 인터럽트된 위치에서 계속되거나 음성 대화의 일부를 반복하여 계속될 수 있도록 구성될 수 있다. 이러한 구성에 의해, 음성 대화의 처음부터 다시 시작할 필요없이 인터럽트된 위치 직후부터 또는 대화의 일부를 반복하여 음성 대화를 계속할 수 있다.
일 실시예에서, 음성 대화를 인터럽트하는 수단 및/또는 음성 대화를 계속하는 수단은 컨트롤 키를 포함할 수 있다. 두개의 추가 컨트롤 키는 인터럽트용 및 계속용으로 제공되거나, 또는 단지 하나의 추가 컨트롤 키가 제1 활성화시에 음성 대화가 인터럽트되고 제2 활성화시에 언트럽트된 음성 대화가 계속되도록 구성되게 제공될 수 있으며, 또는, SDS를 온 및 오프 스위치하는데 사용되는 푸시 톡(PTT; push to talk) 레버가 인터럽트 및 계속 키로서 추가 구성될 수 있다. PTT 레버가 활성화되는 방식에 따라, SDD가 오프되거나 대화가 인터럽트 또는 계속되며, 여기서, 예를 들면, 상이한 활성화가 오랜 동안 키를 활성화하여 SDS를 오프시키기 위해 오랜 동안 키를 활성화시키고 음성 대화를 인터럽트 또는 계속하기 위해 짧은 시간 동안 활성화할 수 있다.
다른 실시예에서, 음성 대화를 인터럽트하는 수단은 음성 중지 명령의 수신 시에 음성 대화가 인터럽트되도록 구성될 수 있으며, 인터럽트된 음성 대화를 계속하는 수단은 음성 계속 명령의 수신 시에 인터럽트된 음성 대화가 계속되도록 구성될 수 있다. 따라서, 음성 대화를 인터럽트 또는 계속하는데 키가 사용될 수 있을 뿐만 아리라 대응 음성 명령이 사용되어 SDS의 사용자 친화도를 더욱 향상시킨다.
음성 대화를 인터럽트하는 수단은 전자 장치의 중지 명령의 수신 시에 음성 명령이 인터럽트되도록 구성될 수 있으며, 및/또는 음성 대화를 계속하는 수단은 전자 장치로부터의 계속 명령의 수신 시에 음성 대화가 계속되도록 구성될 수 있다. 따라서, 사용자는 음성 대화를 인터럽트할 수 있을 뿐만 아니라, 반드시 음성 대화에 의해 제어가능한 장치일 필요는 없지만 SDS에 접속된 임의의 전자 장치일 수 있는 하나의 전자 장치를 인터럽트할 수도 있다. 일 예로서, 사용자는 네비게이션 시스템을 제어하는 음성 대화를 수행할 수 있으며, 새로운 타겟 주소를 입력하고, 이 대화 동안 전화기는 인커밍 호출을 수신하여 SDS에 인터럽트 명령을 제공하여 음성 대화를 인터럽트하고 사용자에게 인커밍 전화 통화에 대하여 알린다. 일단 전화 통화가 종료되면, 전화기는 SDS에 계속 명령을 제공하여 인터럽트된 음성 대화가 계속될 수 있다.
변형예로서, SDS는 제1 음성 대화의 인터럽트 동안 특히 상이한 전자 장치를 제어하는 제2 음성 대화가 실행되도록 구성될 수 있다. 새로운 타겟 위치의 네비게이션으로의 입력이 인커밍 전화 통화에 의해 인터럽트되는 상술한 예에서, 전화 대화 동안 사용자가 새로운 주소 또는 전화번호를 전화기에 저장하는 경우를 생각하면, 이러한 특징은 제1 인터럽트된 음성 대화가 이미 있는 경우에도 SDS를 사용하여 새로운 주소 또는 전화 번호를 저장할 수 있게 한다. 이러한 가능성으로 인해, 사용자는 이미 인터럽트된 음성 대화가 있는지를 고려할 필요가 없다.
바람직한 실시예에서, SDS는 사용자로부터 음성 입력을 저장하는 저장 수단을 더 포함할 수 있으며, 계속 수단은 인터럽트된 음성 대화가 계속되는 경우 저장된 음성 입력 중 적어도 일부가 출력되도록 구성될 수 있다. 이러한 구성으로, SDS는 정보 또는 정보의 일부를 입력할 수 있어, 사용자는 인터럽트된 음성 대화의 내용에 대하여 인지함으로써, 시스템의 사용자 친화도를 향상시킨다.
일 실시예에서, SDS는 인터럽트된 음성 대화가 계속되는 경우 사용자에게 인터럽트된 음성 대화가 지속될 것임을 알리는 메시지가 츨력되도록 구성된다. 이러한 구성으로, SDS는 사용자에게 후추 음성 대화가 계속될 수 있음을 상기하므로, 사용자는 음성 대화의 상태를 기억할 필요가 없어 시스템의 사용자 친화도를 더욱 향상시킬 수 있다.
변형예에서, SDS는 음성 대화의 인터럽트 동안 특히 인터럽트된 음성 대화에 의해 제어될 전자 장치의 이름 등의 인터럽트된 음성 대화의 식별자가 디스플레이되도록 구성될 수 있다. SDS는 인터럽트된 음성 대화의 식별자 및 진행중인 음성 대화의 식별자를 디스플레이하는 디스플레이 수단을 포함하기 때문에, 단지 디스플레이를 봄으로써 사용자가 어느 음성 대화가 현재 인터럽트되는지를 알 수 있어, SDS의 사용자 친화도를 더욱 향상시킨다.
SDS는 인터럽트된 음성 대화를 취소하는 수단을 더 포함하는 것이 바람직하며, 취소 수단은 특히 컨트롤 키를 포함하고 음성 취소 명령의 수신 시에 음성 대화를 취소하도록 구성된다. 따라서, 사용자가 대화를 계속하기를 원하지 않은 경우 SDS는 인터럽트된 대화를 취소할 수 있다.
또한, 본 발명은 청구항 제24항에 따른 정보 및 엔터테인먼트 시스템에 관한 것이다. 따라서, 헤드부 및 적어도 하나의 전자 장치를 포함하는 정보 및 엔터테인먼트 시스템이 제공되며, 여기서, 헤드부는 적어도 하나의 전자 장치를 제어하는 수단 및 상술한 음성 대화 시스템에 따른 음성 대화 시스템(SDS)을 포함하고, 적어도 하나의 전자 장치 중 적어도 하나는 SDS에 의해 제어가능하다. 본 발명에 따른 SDS를 제공함으로써, 정보 및 엔터테인먼트 시스템에서 상술한 이점이 정보 및 엔터테인먼트 시스템에 포함됨에 따라 사용자 친화도가 상당히 향상될 수 있다.
정보 및 엔터테인먼트 시스템의 적어도 하나의 전자 장치는, 텔레비전 장치, 및/또는 라디오 장치, 및/또는 컴팩트 카세트 플레이 장치, 및/또는 컴팩트 디스크 플레이 장치, 및/또는 슈퍼 오디오 컴팩트 디스크 플레이 장치, 및/또는 디지털 다기능 디스크 플레이 장치, 및/또는 MPEG 오디오 레이어 3 플레이 장치, 및/또는 개인용 컴퓨터, 및/또는 플레이 컨솔 및/또는 전화기, 및/또는 적어도 하나의 정보 장치, 특히 네비게이션 시스템 및/또는 온보드 컴퓨터를 포함하는 아날로그 또는 디지털 오디오 신호를 재생하는 적어도 하나의 엔터테이먼트 장치를 포함할 수 있다.
바람직한 실시예에서, 헤드부는 소정의 제2 컨트롤 키 특히 제2 대화에 의해 제어될 전자 장치의 중지 키의 활성화시에 음성 대화가 인터럽트되도록 구성될 수 있다. 따라서, SDS의 컨트롤 키 또는 음성 명령은 음성 대화 뿐만 아니라 음성 대화에 의해 제어될 수 있는 전자 장치의 키의 활성화를 인터럽트하는데 사용된다. 사용자는 그가 음성 대화에 의해 제어하는 전자 장치의 중지 버튼을 직관적으로 푸시할 수 있음에 따라, 이러한 음성 대화를 인터럽트할 추가 가능성은 사용자 친화도를 향상시키며, 전자 장치의 동작 뿐만 아니라 음성 대화를 인터럽트할 수 있다.
다른 변형예에서, 헤드부 또는 음성 대화에 의해 제어될 적어도 하나의 전자 장치는 음성 대화가 인터럽트되는 경우 전자 장치의 동작이 인터럽트되도록 구성될 수 있다. 예를 들면, 음성 대화는 하나의 CD를 다른 CD로 교환하기 위해서 컴팩트 디스크(CD) 교환기를 제어하는데 사용되며, 사용자는 그가 CD를 스위치하길 원한다고 SDS에게 언급한 후에 어느 것이 새로운 CD일 수 있는지를 말하기 전에 대화를 인터럽트를 결정하고, SDS는 CD 플레이어에 플레이어에서 저장소로 제거하여 새로운 CD에 대한 다음 명령을 대기하게 하는 전자 장치에 컨트롤 명령을 제공한다. 이렇게 함으로써, 일단 사용자가 음성 대화를 계속하고 시스템에 그가 듣기를 원하는 CD를 시스템에 알리는 경우, 그가 새로운 CD를 들을 수 있을 때까지 대기 시간은 감소될 수 있다. 다른 예에서, 대기 시간을 감소하기 위해서, 인터럽트 동안 음성 대화에 대한 전자 장치는 원격에서 정보를 계속 다운로드할 수 있다. 이는 또한 전체 시스템의 사용자 친화도를 향상시킨다.
변형예에 따르면, 헤드부 또는 음성 대화에 의해 제어될 수 있는 적어도 하나의 전자 장치는 적어도 하나의 전자 장치가 음성 대화가 인터럽트된 경우에도 계속 동작하도록 구성될 수 있다. 예를 들면, 사용자가 라디오를 제어하기 위해서 SDS와 현재 대화하고, 전화기가 인커밍 호출을 수신하여 SDS에 중지 명령을 제공하는 경우, 라디오 동작이 또한 인터럽트되어 전화 통안 백그라운드 잡음 레벨이 감소될 수 있으며, 사용자 친화도를 더욱 향상시킬 수 있다.
SDS의 디스플레이는 터치 스크린일 수 있으며 SDS는 인터럽트된 음성 대화의 식별을 스크린부가 계속 디스플레이하도록 구성될 수 있다. 또한, SDS는 터치 스크린의 다른 부분의 접촉 시에 인터럽트된 음성 대화의 터치 스크린이 취소되도록 구성될 수 있다. 이에 따라, 터치 스크린은 대화가 진행 중임을 사용자에게 알리고 대응하는 디스플레이부를 접촉하여 인터럽트된 하나 이상의 음성 대화를 결국 취소함으로써 사용자가 인터럽트된 음성 대화의 용이하게 계속할 수 있게 하는 3개의 역할을 만족한다.
다른 실시예에서, 음성 대화 시스템은 각각의 인터럽트된 음성 대화가 상이한 제3 컨트롤 키에 기인하고 제2 컨트롤 키의 활성화 시에 대응 음성 대화가 계속되도록 구성된 제3 컨트롤 키를 더 포함한다. 모든 인터럽트되고 진행 중인 음성 대화를 나타내는 디스플레이와 함께, 제3 컨트롤 키는 그가 계속하기를 원할 수 있는 음성 대화로 사용자가 계속할 수 있는 용이한 방식을 제공한다.
또한, 본 발명은 상술한 바와 같은 SDS에 차량, 특히 차에 제공한다. 더욱이, 본 발명은 또한 차량, 특히 차에 상술한 바와 같은 SDS의 사용에 관한 것이다.
또한, 본 발명은 상술한 바와 같은 정보 엔터테인먼트 시스템을 차량, 특히 차에 제공한다. 또한, 본 발명은 차량, 특히 차에 상술한 바와 같은 정보 및 엔터테인먼트 시스템의 사용에 관한 것이다.
본 발명의 방법과 정보 및 엔터테인먼트 시스템과 SDS의 다음 예들을 첨부 도면을 참조하여 설명한다.
도 1은 본 발명에 따른 정보 및 엔터테인먼트 시스템(1)의 일 실시예를 포함하는 차량의 조정실을 나타낸다. 정보 및 엔터테인먼트 시스템은 컴팩트 디스크(CD) 플레이어(5), 또는 변형 디지털 다기능 디스크(DVD) 플레이어 또는 컴팩트 카세트(CC) 플레이어를 포함하는 무선 장치(3), 네비케이션 시스템(7), 기후 컨트롤(9), 및 차량(미도시)에 고정된 전화기일 수 있는 전화기 또는 이동 전화기 홀더(13)에 의해 지지되는 이동 전화(11) 및 보드 컴퓨터(15) 등의 여러 전자 장치를 포함한다. 상술한 전자 장치는 단지 일 예이며 텔레비전, 인터넷 접속 장치 또는 컴퓨터 게임 콘솔이 정보 및 엔터테인먼트 시스템의 일부일 수 있다.
정보 및 엔터테인먼트 시스템(1)은 본 발명에 따른 음성 대화 시스템(SDS; 18)을 포함하는 헤드부(17)를 더 포함한다. 헤드부(17)는 이들 전자 장치에/로부터 컨트롤 명령을 전송하고 수신한다. 상기 실시예의 SDS(18)는 후방 미러(21)에 배치되지만 상이한 위치 또는 여러 다른 위치에 제공될 수 있는 마이크로폰(19)을 입력 수단으로서 포함한다. 예를 들면, 마이크로폰(19)은 각 승객에 인접하여 배치되는 것을 생각할 수 있다.
SDS(18)는 이 실시예에서, 핸들(25) 상에 위치한 컨트롤 키(23)와 또한 정보 엔터테인먼트 시스템(17)의 일부인 멀티미디어 스크린(29)에 근접하여 컨트롤 키(27)를 더 포함하며, SDS(18)의 출력 수단으로서 동작한다. 추가 출력 수단으로서, 스피커(31)가 제공된다. 전자 장치는 각각 네비게이션 시스템(7), 라디오 및 CD 플레이어 장치(3), 기후 컨트롤(9), 및 이동 전화 또는 전화기(11)를 제어하는 컨트롤 키(33, 35, 37, 및 39)에 의해 제어될 수 있다. 정보 및 엔터테인먼트 시스템(1)이 SDS(18)를 사용하여 전자 장치를 제어하는 방식은 사용자와 SDS 간의 음성 대화를 수행하는 방법의 일 실시예를 나타내는 도 3을 참조하여 상세히 설명한다.
도 2는 본 발명의 SDS(18)의 실시예를 나타내고 정보 및 엔터테인먼트 시스템(1)의 일부일 수 있는 블록도를 나타낸다. 도 1에서 도시된 것과 동일한 참조번호를 갖는 구성요소는 대응 요소를 나타내며, 도 1의 설명에 상술한 속성은 도 2의 설명에 포함된다.
SDS(18)는, 음성 분석부(40), 음성 대화부(42), 음성 대화 인터럽트 수단(44), 인터럽트 음성 대화 계속 수단(46), 및 인터럽트 음성 대화 취소 수단(47) 등의 여러 요소를 포함한다.
음성 분석부(40)는 마이크로폰(19)에 의해 수신된 데이터를 분석한다. 분석은 백그라운드 잡음을 제거하여 음성 입력을 필터하는 것을 포함한다.
음성 대화부(42)는 음성 분석부(40), 음성 대화 인터럽트 수단(44), 인터럽트 음성 대화를 계속 수단(46), 및 인터럽트 음성 대화 취소 수단(47), SDS를 온 또는 오프 스위치하는 동작을 하는 푸시 톡 레버(PTT; 48), 출력 수단(29, 31), 및 전자 장치(50)에 연결된다.
음성 대화부(42)는 후에 분석되고 전자 장치(50)에 헤드부(17; 도 2에 미도시)를 통해 전송되는 컨트롤 명령으로서 식별되는 음성 분석부(40)로부터의 음성 입력을 수신한다. 음성 입력에 대한 정보 또는 요청은 스피커(31) 또는 멀티미디어 스크린(29)을 통해 사용자에게 음성 대화부(42)에 의해 출력된다.
음성 대화 인터럽트 수단(44)은 음성 분석부(40)로부터 또는 중지 컨트롤 키(52), 또는 전자 장치(54)로부터 중시 명령의 수신 시에 중지 신호를 음성 대화를 인터럽트하는 음성 대화부(42)에 전송한다.
인터럽트 음성 대화 계속 수단(46)은 음성 분석부(40), 즉 계속 컨트롤 키(56), 또는 전자 장치(54)로부터 계속 명령의 수신 시에 계속 신호를 인터럽트 음성 대화를 계속하는 음성 대화부(42)에 전송한다.
인터럽트 음성 대화 취소 수단(47)은 음성 분석부(40), 즉 취소 컨트롤 키(57)로부터 취소 명령의 수신 시에 취소 신호를 음성 대화부(42)에 전송하여 인터럽트 음성 대화를 취소한다.
변형예에서, 음성 대화부(42)는 사용자로부터 수신된 음성 입력을 저장하는 저장부(58)를 포함할 수 있다.
SDS(18)의 도시된 실시예에서, 4개의 독립 컨트롤 키(48, 52, 56 및 57)이 도시되어 있다. 그러나, 다른 실시예에서, 일부 키는 하나의 키로 결합되거나 이러한 키가 활성화되는 다른 방식으로 결합되어 상이한 기능이 수행될 수 있다. 예를 들면, 중지 명령과 계속 명령은 하나의 결합된 컨트롤 키에 의해 제공될 수 있다. 결합 컨트롤 키의 제1 활성화 시에, 대화가 인터럽트되는 반면에 컨트롤 키의 제2 활성화시에는 음성 대화가 계속된다. 또다른 변형예에서, 모든 4개의 컨트롤 키(48, 52, 56 및 57)이 하나의 컨트롤 키에 결합되어, 키가 활성화되는 방식에 따라 온/오프 기능이 수행될 수 있거나 중지/계속 기능 또는 취소가 수행될 수 있다. 또한, 도시된 컨트롤 키(48, 52, 56, 57) 뿐만 아니라, 도 1에 도시된 전자 장치(3, 5, 7, 9, 11, 13, 15)에서의 컨트롤 키는 중지 컨트롤 키와 계속 컨트롤 키의 역할을 충족할 수 있다. 예를 들면, CD 플레이어의 경우, 중지 키는 음성에 대한 중지 컨트롤 및 계속 컨트롤 키의 역할을 수행할 수 있다.
도시된 실시예에서, SDS(18)는 단지 하나의 전자 장치(46)를 제어하고 있다. 그러나, 도 1에서, SDS(18)는 하나 이상의 전자 장치(헤드부(17)과 함께)을 제어하는데 사용될 수 있으며 하나 이상의 전자 장치는 중지 및 계속 명령을 제공할 수 있다.
다른 변형예에서, 음성 대화부(42)는 제1 음성 대화의 인터럽트 동안 특히 상이한 전자 장치를 제어하는 제2 음성 대화가 개시되도록 구성된다.
도 3은 전자 장치를 제어하기 위해서 SDS와 사용자 간의 음성 대화를 수행하는 방법의 일 실시예를 나타낸다. 도 3에 나타낸 프로세스는 도 2에 도시된 바와 같은 SDS(18) 및/또는 도 1에 나타낸 바와 같은 정보 및 엔터테인먼트 시스템에 의해 수행될 수 있다.
단계 60에서, 사용자가 음성 대화 요청을 하였는지를 점검한다. 이를 위해, 사용자는 푸시 톡 레버(48)를 활성화한다. 음성 대화 요청이 SDS에 의해 수신되는 경우, 프로세스는 단계 62에 진행하여, SDS(18)가 사용자로부터 음성 입력을 요청한다. 단계 62 후에, 음성 대화부(42)는 음성 입력을 대기한다. 단계 64는 음성 입력이 음성 대화부(42)에 의해 수신되었는지를 점검하고 그러한 경우 단계 66에서 제공된 음성 입력이 중지 명령 또는 전자 장치를 제어하는 컨트롤 명령을 포함하는지를 점검한다.
제공된 음성 입력이 중지 명령을 포함하는 경우, 대화가 인터럽트된다. 프로세스는 단계 68에 진행하여 명령 입력이 수신되었는지를 점검한다. 음성 대화의 인터럽트 동안, 멀티미디어 스크린(29)은 예를 들어 전자 장치의 이름일 수 있는 인터럽트된 음성 대화의 식별자를 디스플레이할 수 있다. 인터럽트 동안, 특히 상이한 전자 장치를 제어하는 역할을 할 수 있는 제2 음성 대화가 개시될 수 있다 (도 3에는 미도시).
변형예에서, 음성 대화의 인터럽트 동안, 대응 전자 장치는 또한 그 동작에서 인터럽트될 수 있다. 이를 위해, 헤드부(17) 또는 SDS(18)는 대응하는 컨트롤 명령을 전자 장치에 제공하여 전자 장치의 동작의 인터럽트를 야기한다. 다른 변형예에서, 음성 대화의 인터럽트 동안, SDS(18)는 전자 장치가 사용자로부터의 추가 명령이 필요없게 되는 동작을 이미 수행할 수 있도록 전자 장치에 컨트롤 명령을 전송한다. 예를 들면, 네비게이션 정보를 획득하기 위해서 사용자가 새로운 타겟 위치를 네비게이션 시스템으로 입력하기 원하지만 도시만을 언급하고 아직 거리는 언급하지 않은 후에 음성 대화를 인터럽트하는 경우, 네비게이션 시스템은 음성 대화의 인터럽트 동안 그 도시에 도달하는 최적의 방법을 미리 계산할 수 있으며, 또는, 네비게이션 시스템이 원격 서버로부터 최종 목적지 및 현재 위치에 따라 대응 지도를 다운로드하도록 구성되는 경우에, 네비게이션 시스템은 대응 지도를 미리 다운로드할 수 있다.
명령이 단계 68에서 수신된 경우, 프로세스는 69에 진행하여 계속 명령 또는 취소 명령이 수신되었는지를 점검한다. 취소 명령의 수신 시에, 프로세스와 이에 다른 대화가 종료한다. 마지막으로, SDS는 사용자에게 대화가 취소되었음을 알리는 메시지를 출력한다.
계속 명령의 수신 시에, 프로세스는 단계 70으로 진행한다. 계속 명령은 계속 키(56)(상술한 바와 같이, PTT 레버(48)와 함께 결합됨)의 활성이거나, 음성 분석부(40)가 마이크로폰(19)으로부터 수신된 신호를 계속 분석하여 사용자로부터 계속 명령을 필터하는 경우, 음성 명령일 수 있다. 단계 70에서, SDS(18)는 사용자에게 계속될 수 있는 음성 대화에 대한 정보를 제공한다. 특히, SDS(18)는 음성 또는 광학적으로 인터럽트된 음성 대화의 식별자를 출력할 수 있으며 및/또는 인터럽트 이전에 이미 수행된 음성 대화의 일부를 출력할 수 있다. 특히, SDS(18)는 사용자의 이미 제공된 음성 입력의 내용을 반복할 수 있다. 변형예에서, 이러한 정보는 또한 사용자로부터의 요청에 대한 출력일 수 있다.
그 후, 프로세스는 SDS(18)가 사용자로부터 대응하는 음성 입력을 아직 수신하지 않은 입력에 대한 최종 요청이 반복된다. 입력 요청이 반복되는 경우 사용되는 용어는 처음 사용된 용어와 비교하여 상이할 수 있기 때문에 사용자에게 계속된 음성 대화임을 상기시킨다. 그 후, 프로세스는 상술한 단계 64 및 66으로 진행하며, 단계 66에서 SDS(18)는 컨트롤 명령을 수신하는 경우 프로세스는 단계 72로 진행하며, 여기서, 컨트롤 명령은 직접 또는 헤드부(17)를 통해 전자 장치에 전송된다. 컨트롤 명령은 그 후 저자 장치에 의해 수행된다.
단계 74에서, 대화 종료가 도달했는지를 점검한다. 도달하지 않은 경우, 대화 종료가 도달할 때까지 음성 대화는 단계 62 내지 74를 반복한다.
음성 대화를 수행하는 본 방법의 상술한 실시예에서, 중지 명령은 음성 명령을 사용하여 사용자에 의해 수행된다. 또한, 이러한 중지 명령은 중지 키(52)를 사용하여 주어질 수 있다. 중지 키(52)의 사용은 임의의 시점에서 상술한 프로세스가 인터럽트될 수 있는 이점이 있다. 더욱이, 상술한 바와 같이, 음성 대화는 전자 장치 중 하나로부터 SDS(18)에 의해 수신되는 중지 명령 후에 인터럽트될 수 있으며, 또한, 프로세스는 전자 장치 중 하나로부터 계속 명령의 수신 시에 계속할 수 있다.
도 4는 음성 대화의 인터럽트 동안 스크린(29) 상에 디스플레이된 정보의 일 예를 나타낸다. 스크린(29) 상에 두개의 인터럽트된 대화가 표시되며, 이중 하나는 전화 통화이며 다른 하나는 네비게이션 시스템에 대한 것이다. 인터럽트된 음성 대화 각각은 컨트롤 키(80, 82)(컨트롤 키(27)의 일부)에 기인한다. 컨트롤 키(80)의 활성화 시에, 전화 통화에 대하여 인터럽트된 음성 대화와 컨트롤 키(82)의 활성화 시에, 네비게이션 시스템에 대하여 인터럽트된 음성 대화가 계속된다. 더욱이, 도 2에 대하여 상술한 컨트롤 키(48, 52, 56, 및 57)에 대응하는 4개의 컨트롤 키가 예시되어 있다.
이하, 본 발명에 따른 음성 대화를 예를 설명한다.
예 1
사용자(음성 입력) | SDS (음성 출력) | |
100 | 전화 통화 | |
101 | 번호를 말하세요 | |
102 | 0173 | |
103 | 0173 그리고? | |
104 | 중지 | |
105 | 음성 대화 중지 | |
106 | 계속 | |
107 | 전화 번호 다이얼 | |
108 | 0173 그리고? | |
109 | 3994 | |
110 | 3994 | |
111 | 번호 01733944가 다이얼됩니다 |
예 1은 전화 통화를 행하는 음성 대화에 관한 것이다. 열 1은 사용자로부터 입력된 음성을 나타내고 열 2는 SDS로부터의 음성 출력이다. 단계 1-2에서 영역 코드를 입력한 후, 사용자는 단계 104에서 대화 인터럽트를 요청하면, 이는 사용자에 의해 수행될 수 있는 촉각 중지 명령일 수 있다. 이 후, 음성 대화는 인터럽트되어 사용자가 단계 106에서 계속 명령을 제공한 후에만 계속된다. 단계 107에서, 그 후, SDS는 사용자에게 어느 음성 정보가 인터럽트되었는지를 알리고 단계 108에서 사용자에 의해 주어진 최종 입력을 반복한다. 그 후, 사용자는 전화번호의 나머지 부분을 계속 입력하여 단계 111에서 SDS는 다이얼될 번호를 반복하고 대응 컨트롤 명령을 전화기에 전송한다.
단계 103 및 110에서 볼 수 있는 바와 같이, 이 음성 대화에서, SDS는 사용자로부터 주어진 음성 입력을 반복한다.
예 2
사용자(음성 입력) | SDS (음성 출력) | |
200 | 전화 통화 | |
201 | 번호를 말하세요 | |
202 | 0173 | |
203 | 0173 그리고? | |
204 | 중지 | |
205 | 음성 대화 중지 | |
206 | 라디오 컨트롤 | |
207 | 라디오 컨트롤 온 | |
208 | 볼륨을 2지점 내림 | |
209 | 볼륨을 2지점 내림 | |
210 | 계속 및 최종 입력 반복 | |
211 | 전화 번호 다이얼 | |
212 | 0173 그리고? | |
213 | 3994 | |
214 | 3994 | |
215 | 번호 01733944가 다이얼됩니다 |
제2 음성 대화 예에서, 단계 200 내지 205와 단계 211 내지 215는 제1 예에 대응하고 이에 따라 상세히 후술하지 않는다. 두 음성 대화의 차이는 사용자가 제1 대화의 인터럽트 동안 제2 음성 대화를 개시한다는 점이다. 단계 206에서, 사용자는 라디오에 대한 음성 대화의 수행을 요청한다. 단계 208에서, 그는 단계 209에서 실제 수행된 라디오의 볼륨의 변경을 요청함으로써, 제2 음성 대화를 종료한다. 단계 210에서, 사용자는 그 후 전화 통화에 대한 제1 인터럽트 음성 대화의 계속 요청하고 SDS를 요청하여 그에게 필수 정보를 제공하여 제1 음성 대화가 인터럽트된 위치를 알 수 있다.
예 3
사용자(음성 입력) | SDS(음성 출력) | 기타 전자 장치(예: 전화기) | |
300 | 라디오 컨트롤 | ||
301 | 라디오 컨트롤 온 | ||
302 | 라디오 방송국 변경 | ||
303 | 어떤 라디오 방송국? | ||
304 | 인커밍 전화 통화 | ||
305 | 음성 대화 중지 | ||
306 | 전화 통화 종료 | ||
307 | 어떤 라디오 국? | ||
308 | FM 98.1 | ||
309 | 라디오 방송국을 FM98.1으로 변경 |
예 3에서, 사용자는 그가 듣고 있는 라디오 방송국을 변경하기 위해서 음성 대화를 수행한다. 단계304에서, 이러한 음성 대화는 인커밍 전화 통화로 인해 종료된다. 인커밍 전화 통화의 수신 시에, 전화기는 중지 명령은 음성 대화를 차례로 인터럽트하는 SDS에 전송한다. 전화 통화가 종료되자마자, 전화기는 SDS에 계속 명령을 전송하여 그 후 음성 대화가 계속된다(307 내지 309).
마지막으로, 추가 단계는 단계 305에서 존재할 수 있으며, SDS는 음성 대화는 전화 통화로 인해 인터럽트될 수 있음을 사용자에게 알린다.
대화의 인터럽트 동안, SDS(18)는 라디오 동작을 인터럽트하는 라디오에 컨트롤 명령을 전송할 수 있으므로 전화 통화는 라디오의 백그라운드 잡음에 의해 방해되지 않을 수 있다.
사용자(음성 입력) | SDS(음성 출력) | SDS(디스플레이) | |
400 | 새로운 타겟 위치 | ||
401 | 위치를 말하세요 | ||
402 | U-L-M | ||
403 | 디스플레이에서 번호 하나를 고르세요 | ||
404 | 1. Ulm2. Ulmen3. Ulmenhausen | ||
405 | 중지 | ||
406 | 대화 네비게이션 중지 | ||
407 | 계속 | ||
408 | 디스플레이에서 번호 하나를 고르세요 | ||
409 | 1. Ulm2. Ulmen3. Ulmenhausen | ||
410 | 하나 | ||
411 | 새로운 타겟 위치 Ulm |
예 4는 사용자와 SDS 간의 음성 대화를 나타내며, 여기서 SDS는 음성 출력을 가질 뿐만 아니라 디스플레이를 또한 포함한다. 이 예는 네비게이션 시스템으로의 새로운 타겟 위치의 입력을 다룬다. 단계 402에서, 사용자는 타겟 위치의 첫 글자를 입력하고, 다음 단계 403에서, SDS는 이들 글자를 포함하는 여러 위치를 발견하여 이들 위치가 SDS에 접속된 멀티미디어 스크린 상에 디스플레이된다고 알린다. 또한, 사용자는 대응 번호를 알림으로써 이들 위치 중 하나를 선택할 수 있다. 단계 405에서, 음성 대화는 그 후 사용자로부터 대응 음성 중지 명령으로 인해 인터럽트된다. 인터럽트 동안, 멀티미디어 스크린(29)은 네비게이션 음성 대화가 인터럽트되었음을 나타낸다. 사용자로부터의 계속 명령 후에, SDS는 음성 입력에 대한 마지막 요청을 반복하고 스크린은 위치에 대한 동일 선택을 디스플레이한다. 그 후, 사용자는 이들 위치 중 하나를 선택하여 새로운 타겟 위치가 네비게이션 시스템에 입력될 수 있다.
변형예에서, 네비게이션 시스템은 음성 대화의 인터럽트 동안 3개의 가능 위치에 대한 네비게이션 정보를 미리 생성할 수 있다. 일단 음성 대화가 계속되고 사용자가 선택을 행한 경우, 네비게이션 시스템은 애플리케이션을 가속화하는 대응 네비게이션 정보를 즉시 제안할 수 있다.
변형예에서, 상술한 예들 모두 인터럽트된 음성 대화는 음성 또는 촉각 취소 명령을 제공하여 사용자에 의해 취소될 수 있다.
본 발명의 정보 엔터테인먼트 시스템, SDS(18), 및 방법에 대한 상술한 실시예는 차량 환경의 경우를 설명하였다. 그러나, 사용자 간의 음성 대화를 수행하는 본 발명의 SDS 및 방법은 사용자와 휴대용 디지털 단말(PDA) 간의 대화, 또는 전화를 통한 컴퓨터 기반 대화의 경우에 대해서도 적용될 수 있다. 통상, 본 발명에 따른 음성 대화는 임의의 전자 장치의 동작을 제공하는데 적용될 수 있다.
상술한 본 발명에 따르면, 임의의 시점에서 음성 대화를 인터럽트할 수 있고 추후 시점에서 음성 대화를 계속할 수 있으며, 전화기 통화 동안 백그라운드 잡음 레벨이 감소되고, 인터럽트 동안 음성 대화에 관련된 전자 장치가 원격으로 정보를 계속 다운로드해서 대기 시간을 감소되며, 사용자 친화도를 향상시킬 수 있다.
도 1은 본 발명에 따른 음성 대화 시스템을 포함하는 헤드부에 의해 제어되는 여러 전자 장치를 나타내는 차량의 대시보드를 나타내는 도면.
도 2는 본 발명에 따른 SDS의 실시예를 나타내고 헤드 유일의 일부일 수 있는 블록도.
도 3은 본 발명의 일 실시예에 따른 음성 대화를 실행하는 방법을 나타내는 기능 블록도로서, 중지 명령이 사용자로부터 입력되는 음성에 의해 제공되는 도면.
도 4는 본 발명의 일 실시예에 따른 SDS의 인터럽트된 음성 대화를 나타내는 스크린과 컨트롤 키를 나타내는 도면.
<도면의 주요 부분에 대한 부호의 설명>
3, 5, 7, 9, 11, 15: 전자 장치
18: 음성 대화 시스템
23, 27, 48, 56: 컨트롤 키
40: 음성 분석부
42: 음성 대화부
44: 음성 대화 인터럽트 수단
46: 음성 대화 계속 수단
58: 저장 수단
Claims (26)
- 특히 차량 환경에서 음성 대화 시스템(SDS; 18)과 적어도 하나의 전자 장치(3, 5, 7, 9, 11, 15)를 제어하는 사용자 간에 음성 대화를 실행하는 방법에 있어서,상기 SDS(18)가 소정의 중지 명령의 수신 시에 상기 음성 대화를 인터럽트하는 단계(66); 및상기 SDS(18)가 소정의 계속 명령의 수신 시에 상기 음성 대화를 계속하거나(68) 상기 SDS가 소정의 취소 명령의 수신 시에 상기 음성 대화를 취소하는 단계(69)를 포함하는 음성 대화 실행 방법.
- 제1항에 있어서,상기 음성 대화 계속 단계는, 상기 음성 대화의 일부를 반복하는 단계(70)를 포함하는 것인 음성 대화 실행 방법.
- 제2항에 있어서,상기 음성 대화 계속 단계는, 상기 SDS가 상기 음성 대화를 인터럽트하기 전에 상기 SDS의 적어도 마지막 출력을 출력하는 단계, 및/또는 상기 SDS가 상기 음성 대화를 인터럽트하기 전에 상기 사용자로부터 수신된 적어도 마지막 음성 입력을 출력하는 단계, 및/또는 상기 SDS가 특히 상기 사용자로부터의 대응 명령의 수신 시에 상기 사용자로부터의 음성 입력을 대기하는 단계를 포함하는 것인 음성 대화 실행 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서,상기 음성 대화 계속 단계는 상기 사용자에게 인터럽트된 음성 대화가 계속됨을 통지하는 단계를 포함하는 것인 음성 대화 실행 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서,상기 음성 대화를 인터럽트하는 단계 및/또는 상기 음성 대화를 계속하는 단계는, 상기 사용자의 대응하는 음성 또는 촉각 명령의 수신 시에 또는 전자 장치(3, 5, 7, 9, 11, 15)의 대응하는 명령의 수신 시에 상기 SDS(18)에 의해 실행되는 것인 음성 대화 실행 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서,특히 상이한 전자 장치(3, 5, 7, 9, 11, 15)를 제어하는 추가 음성 대화를 개시하는 단계를 더 포함하는 것인 음성 대화 실행 방법.
- 제6항에 있어서,상기 인터럽트된 음성 대화 중 하나를 계속하는 단계는, 특히 상기 음성 대화에 의해 제어될 상기 전자 장치(3, 5, 7, 9, 11, 15)의 식별자를 출력함으로써, 상기 사용자에게 상기 음성 대화의 계속을 통지하는 단계를 포함하는 것인 음성 대화 실행 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서,상기 음성 대화의 인터럽트 동안 상기 인터럽트된 음성 대화의 식별자, 특히 상기 음성 대화에 의해 제어될 전자 장치(3, 5, 7, 9, 11, 15)의 이름을 디스플레이하는 단계를 포함하는 것인 음성 대화 실행 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서,상기 대응하는 음성 대화의 인터럽트 동안 상기 SDS(18)가 제어가능한 상기 전자 장치(3, 5, 7, 9, 11, 15)의 현재 동작을 인터럽트하는 단계를 포함하는 것인 음성 대화 실행 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서,상기 대응하는 음성 대화의 인터럽트 동안 상기 SDS(18)가 제어가능한 상기 전자 장치(3, 5, 7, 9, 11, 15)에 컨트롤 명령을 전송하는 단계를 포함하는 것인 음성 대화 실행 방법.
- 제1항에 있어서,상기 음성 대화를 취소하는 단계는 상기 사용자에게 인터럽트된 음성 대화가 취소됨을 통지하는 단계를 포함하는 것인 음성 대화 실행 방법.
- 제1항 또는 제11항에 있어서,상기 음성 대화를 취소하는 단계는 상기 사용자의 대응하는 음성 또는 촉각 명령의 수신 시에 실행되는 것인 음성 대화 실행 방법.
- 제1항 내지 제12항 중 어느 한 항의 방법의 단계들을 수행하게 하는 컴퓨터 실행가능 명령을 갖는 하나 이상의 컴퓨터 판독가능 매체를 포함하는 컴퓨터 프로그램 제품.
- 적어도 하나의 전자 장치(3, 5, 7, 9, 11, 15)를 제어하는 사용자와 음성 대화를 실행하는 음성 대화 시스템(SDS; 18)에 있어서,상기 음성 대화를 인터럽트하는 수단(44); 및상기 인터럽트된 음성 대화를 계속하는 수단(46)을 포함하는 음성 대화 시스템.
- 제14항에 있어서,상기 계속 수단(46)은 상기 음성 대화가 인터럽트된 위치에서 계속되도록 또는 상기 음성 대화가 상기 음성 대화의 일부를 반복하여 계속되도록 구성되는 것인 음성 대화 시스템.
- 제14항 또는 제15항에 있어서,상기 음성 대화 인터럽트 수단(44) 및/또는 상기 음성 대화 계속 수단(46)은 컨트롤 키(48, 56, 23, 27)를 포함하는 것인 음성 대화 시스템.
- 제14항 내지 제16항 중 어느 한 항에 있어서,상기 음성 대화 인터럽트 수단(44)은 음성 중지 명령의 수신 시에 상기 음성 대화가 인터럽트되도록 구성되고, 및/또는상기 인터럽트된 음성 대화 계속 수단(46)은 음성 계속 명령의 수신 시에 상기 인터럽트된 음성 대화가 계속되도록 구성되는 것인 음성 대화 시스템.
- 제14항 내지 제17항 중 어느 한 항에 있어서,상기 음성 대화 인터럽트 수단(44)은 전자 장치(3, 5, 7, 9, 11, 15)로부터 중지 명령의 수신 시에 상기 음성 대화가 인터럽트되도록 구성되고, 및/또는상기 음성 대화 계속 수단(46)은 전자 장치(3, 5, 7, 9, 11, 15)로부터 계속 명령의 수신 시에 상기 음성 대화가 계속되도록 구성되는 것인 음성 대화 시스템.
- 제14항 내지 제18항 중 어느 한 항에 있어서,제1 음성 대화의 인터럽트 동안 제2 음성 대화가 실행되도록 구성되며,상기 제2 음성 대화는 특히 상이한 전자 장치(3, 5, 7, 9, 11, 15)를 제어하기 위한 것인 음성 대화 시스템.
- 제14항 내지 제19항 중 어느 한 항에 있어서,사용자로부터의 음성 입력을 저장하는 저장 수단(58)을 더 포함하며,상기 SDS는 인터럽트된 음성 대화가 계속되는 경우, 상기 저장된 음성 입력의 적어도 일부가 출력되도록 구성되는 것인 음성 대화 시스템.
- 제14항 내지 제20항 중 어느 한 항에 있어서,인터럽트된 음성 대화가 계속되는 경우, 상기 사용자에게 인터럽트된 음성 대화가 계속될 것임을 통지하는 메시지가 출력되도록 구성되는 것인 음성 대화 시스템.
- 제19항 내지 제21항 중 어느 한 항에 있어서,상기 음성 대화의 인터럽트 동안, 특히, 상기 인터럽트된 음성 대화에 의해 제어될 상기 전자 장치(3, 5, 7, 9, 11, 15)의 이름을 포함하는 상기 인터럽트된 음성 대화의 식별자가 디스플레이되도록 구성되는 것인 음성 대화 시스템.
- 제14항 내지 제22항 중 어느 한 항에 있어서,상기 인터럽트된 음성 대화를 취소하는 수단(47)을 더 포함하며,특히 상기 취소 수단(47)은 컨트롤 키(57)를 포함하고 및/또는 음성 취소 명령의 수신 시에 상기 음성 대화를 취소하도록 구성되는 것인 음성 대화 시스템.
- 정보 및 엔터테인먼트 시스템에 있어서,헤드부(17) 및 적어도 하나의 전자 장치(3, 5, 7, 9, 11, 15)를 포함하며,상기 헤드부는 상기 적어도 하나의 전자 장치(3, 5, 7, 9, 11, 15)를 제어하는 수단 및 제14항 내지 제23항 중 어느 한 항에 따른 음성 대화 시스템(SDS; 18)을 포함하고, 상기 적어도 하나의 전자 장치(3, 5, 7, 9, 11, 15) 중 적어도 하나는 상기 SDS(18)에 의해 제어가능한 것인 정보 및 엔터테인먼트 시스템.
- 제24항에 있어서,상기 헤드부(18) 또는 상기 음성 대화에 의해 제어될 적어도 하나의 전자 장치(3, 5, 7, 9, 11, 15)는, 상기 음성 대화가 인터럽트되는 경우 상기 전자 장치(3, 5, 7, 9, 11, 15)의 동작이 인터럽트되도록 구성되는 것인 정보 및 엔터테인먼트 시스템.
- 제24항에 있어서,상기 헤드부(18) 또는 상기 음성 대화에 의해 제어될 적어도 하나의 전자 장치(3, 5, 7, 9, 11, 15)는, 상기 음성 대화가 인터럽트되는 경우에도 상기 전자 장치(3, 5, 7, 9, 11, 15)가 계속 동작하도록 구성되는 것인 정보 및 엔터테인먼트 시스템.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04001949.9 | 2004-01-29 | ||
EP04001949A EP1560200B8 (en) | 2004-01-29 | 2004-01-29 | Method and system for spoken dialogue interface |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20050077806A true KR20050077806A (ko) | 2005-08-03 |
Family
ID=34639412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050008381A KR20050077806A (ko) | 2004-01-29 | 2005-01-29 | 음성 대화 실행 방법 및 음성 대화 시스템 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7454351B2 (ko) |
EP (1) | EP1560200B8 (ko) |
JP (1) | JP2005215694A (ko) |
KR (1) | KR20050077806A (ko) |
CN (1) | CN1655233B (ko) |
AT (1) | ATE415684T1 (ko) |
CA (1) | CA2494795C (ko) |
DE (1) | DE602004017955D1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9618352B2 (en) | 2014-03-27 | 2017-04-11 | Electronics And Telecommunications Research Institute | Apparatus and method for controlling navigator via speech dialogue |
US10115392B2 (en) | 2010-06-03 | 2018-10-30 | Visteon Global Technologies, Inc. | Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system |
Families Citing this family (260)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6630800A (en) | 1999-08-13 | 2001-03-13 | Pixo, Inc. | Methods and apparatuses for display and traversing of links in page character array |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
US20040073690A1 (en) | 2002-09-30 | 2004-04-15 | Neil Hepworth | Voice over IP endpoint call admission |
US7359979B2 (en) | 2002-09-30 | 2008-04-15 | Avaya Technology Corp. | Packet prioritization and associated bandwidth and buffer management techniques for audio over IP |
US7669134B1 (en) | 2003-05-02 | 2010-02-23 | Apple Inc. | Method and apparatus for displaying information during an instant messaging session |
US7978827B1 (en) | 2004-06-30 | 2011-07-12 | Avaya Inc. | Automatic configuration of call handling based on end-user needs and characteristics |
US20060271520A1 (en) * | 2005-05-27 | 2006-11-30 | Ragan Gene Z | Content-based implicit search query |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8214219B2 (en) * | 2006-09-15 | 2012-07-03 | Volkswagen Of America, Inc. | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
US7984440B2 (en) * | 2006-11-17 | 2011-07-19 | Sap Ag | Interactive audio task system with interrupt recovery and confirmations |
PL2091784T3 (pl) | 2006-12-20 | 2012-07-31 | Johnson Controls Tech Co | System i sposób zdalnego odtwarzania obrazu |
WO2008079889A2 (en) | 2006-12-20 | 2008-07-03 | Johnson Controls Technology Company | System and method for providing route calculation and information to a vehicle |
US9587958B2 (en) | 2007-01-23 | 2017-03-07 | Visteon Global Technologies, Inc. | Mobile device gateway systems and methods |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
ITFI20070177A1 (it) | 2007-07-26 | 2009-01-27 | Riccardo Vieri | Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento. |
DE102007036425B4 (de) | 2007-08-02 | 2023-05-17 | Volkswagen Ag | Menügesteuertes Mehrfunktionssystem insbesondere für Fahrzeuge |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US8595642B1 (en) | 2007-10-04 | 2013-11-26 | Great Northern Research, LLC | Multiple shell multi faceted graphical user interface |
US8364694B2 (en) | 2007-10-26 | 2013-01-29 | Apple Inc. | Search assistant for digital media assets |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
WO2009073806A2 (en) * | 2007-12-05 | 2009-06-11 | Johnson Controls Technology Company | Vehicle user interface systems and methods |
US9324230B2 (en) | 2008-12-04 | 2016-04-26 | Gentex Corporation | System and method for configuring a wireless control system of a vehicle using induction field communication |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8327272B2 (en) | 2008-01-06 | 2012-12-04 | Apple Inc. | Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8289283B2 (en) | 2008-03-04 | 2012-10-16 | Apple Inc. | Language input interface on a device |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8352268B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis |
US8352272B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for text to speech synthesis |
US8355919B2 (en) | 2008-09-29 | 2013-01-15 | Apple Inc. | Systems and methods for text normalization for text to speech synthesis |
US8218751B2 (en) | 2008-09-29 | 2012-07-10 | Avaya Inc. | Method and apparatus for identifying and eliminating the source of background noise in multi-party teleconferences |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8396714B2 (en) | 2008-09-29 | 2013-03-12 | Apple Inc. | Systems and methods for concatenation of words in text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10387140B2 (en) | 2009-07-23 | 2019-08-20 | S3G Technology Llc | Modification of terminal and service provider machines using an update server machine |
DE102009051882A1 (de) * | 2009-11-04 | 2011-05-05 | Volkswagen Ag | Verfahren und Vorrichtung zur Spracheingabe für ein Fahrzeug |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8977584B2 (en) | 2010-01-25 | 2015-03-10 | Newvaluexchange Global Ai Llp | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8639516B2 (en) | 2010-06-04 | 2014-01-28 | Apple Inc. | User-specific noise suppression for voice quality improvements |
US20110307250A1 (en) * | 2010-06-10 | 2011-12-15 | Gm Global Technology Operations, Inc. | Modular Speech Recognition Architecture |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US9104670B2 (en) | 2010-07-21 | 2015-08-11 | Apple Inc. | Customized search or acquisition of digital media assets |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
KR101715381B1 (ko) * | 2010-11-25 | 2017-03-10 | 삼성전자 주식회사 | 전자장치 및 그 제어방법 |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US9077813B2 (en) | 2012-02-29 | 2015-07-07 | International Business Machines Corporation | Masking mobile message content |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
CN102855873A (zh) * | 2012-08-03 | 2013-01-02 | 海信集团有限公司 | 一种控制电子设备的方法及电子设备 |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
USRE47974E1 (en) * | 2012-11-28 | 2020-05-05 | Google Llc | Dialog system with automatic reactivation of speech acquiring mode |
RU2530267C2 (ru) * | 2012-11-28 | 2014-10-10 | Общество с ограниченной ответственностью "Спиктуит" | Способ коммуникации пользователя с информационной диалоговой системой |
US9570090B2 (en) * | 2015-05-26 | 2017-02-14 | Google Inc. | Dialog system with automatic reactivation of speech acquiring mode |
US9530409B2 (en) | 2013-01-23 | 2016-12-27 | Blackberry Limited | Event-triggered hands-free multitasking for media playback |
CN113470640B (zh) | 2013-02-07 | 2022-04-26 | 苹果公司 | 数字助理的语音触发器 |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
EP2973002B1 (en) | 2013-03-15 | 2019-06-26 | Apple Inc. | User training by intelligent digital assistant |
KR102057795B1 (ko) | 2013-03-15 | 2019-12-19 | 애플 인크. | 콘텍스트-민감성 방해 처리 |
CN105027197B (zh) | 2013-03-15 | 2018-12-14 | 苹果公司 | 训练至少部分语音命令系统 |
DE102013006173A1 (de) * | 2013-04-10 | 2014-10-16 | Audi Ag | Verfahren und Vorrichtung zur proaktiven Dialogführung |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
US9640182B2 (en) * | 2013-07-01 | 2017-05-02 | Toyota Motor Engineering & Manufacturing North America, Inc. | Systems and vehicles that provide speech recognition system notifications |
AU2014306221B2 (en) | 2013-08-06 | 2017-04-06 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
JP6411017B2 (ja) | 2013-09-27 | 2018-10-24 | クラリオン株式会社 | サーバ、及び、情報処理方法 |
US20150115849A1 (en) * | 2013-10-24 | 2015-04-30 | Regal Beloit America, Inc. | System and method for pausing and resuming an operation of a motor |
US9698999B2 (en) * | 2013-12-02 | 2017-07-04 | Amazon Technologies, Inc. | Natural language control of secondary device |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
DE102014002543A1 (de) * | 2014-02-22 | 2015-08-27 | Audi Ag | Verfahren zur Erfassung wenigstens zweier zu erfassender Informationen mit zu verknüpfendem Informationsgehalt durch eine Sprachdialogeinrichtung, Sprachdialogeinrichtung und Kraftfahrzeug |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
CN105138110A (zh) * | 2014-05-29 | 2015-12-09 | 中兴通讯股份有限公司 | 语音交互方法及装置 |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
AU2015266863B2 (en) | 2014-05-30 | 2018-03-15 | Apple Inc. | Multi-command single utterance input method |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9248841B1 (en) * | 2014-11-24 | 2016-02-02 | Ford Global Technologies, Llc | Methods and apparatus for state dependent micro-interaction fulfillment |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
CN104536673B (zh) * | 2014-12-11 | 2017-09-15 | 广东好帮手电子科技股份有限公司 | 读取车机微信接受音频信息的方法及系统 |
US9792901B1 (en) * | 2014-12-11 | 2017-10-17 | Amazon Technologies, Inc. | Multiple-source speech dialog input |
US9911415B2 (en) * | 2014-12-19 | 2018-03-06 | Lenovo (Singapore) Pte. Ltd. | Executing a voice command during voice input |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10431215B2 (en) * | 2015-12-06 | 2019-10-01 | Voicebox Technologies Corporation | System and method of conversational adjustment based on user's cognitive state and/or situational state |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9922655B2 (en) | 2016-05-31 | 2018-03-20 | International Business Machines Corporation | System, method, and recording medium for controlling dialogue interruptions by a speech output device |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
KR102515996B1 (ko) * | 2016-08-26 | 2023-03-31 | 삼성전자주식회사 | 음성 인식을 위한 전자 장치 및 그 제어 방법 |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
GB2558669B (en) * | 2017-01-17 | 2020-04-22 | Jaguar Land Rover Ltd | Communication control apparatus and method |
KR102338990B1 (ko) * | 2017-01-23 | 2021-12-14 | 현대자동차주식회사 | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 |
US10178603B2 (en) * | 2017-02-20 | 2019-01-08 | International Business Machines Corporation | Pausing functions of an assistant device during an active telephone call |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10269351B2 (en) * | 2017-05-16 | 2019-04-23 | Google Llc | Systems, methods, and apparatuses for resuming dialog sessions via automated assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10535360B1 (en) * | 2017-05-25 | 2020-01-14 | Tp Lab, Inc. | Phone stand using a plurality of directional speakers |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US11178280B2 (en) * | 2017-06-20 | 2021-11-16 | Lenovo (Singapore) Pte. Ltd. | Input during conversational session |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
EP3564948A4 (en) * | 2017-11-02 | 2019-11-13 | Sony Corporation | INFORMATION PROCESSING DEVICE AND INFORMATION PROCESSING METHOD |
US10636424B2 (en) * | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
EP3616081A1 (en) | 2018-03-05 | 2020-03-04 | Google LLC. | Transitioning between prior dialog contexts with automated assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
KR102192144B1 (ko) * | 2018-11-30 | 2020-12-17 | 엘지전자 주식회사 | 차량 제어장치 및 차량 제어방법 |
JP2020160725A (ja) * | 2019-03-26 | 2020-10-01 | 株式会社東海理化電機製作所 | 音声対話装置、入力装置及び出力装置 |
JP2020157854A (ja) * | 2019-03-26 | 2020-10-01 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN110001558A (zh) * | 2019-04-18 | 2019-07-12 | 百度在线网络技术(北京)有限公司 | 用于控制车辆的方法和装置 |
EP3924962A1 (en) * | 2019-05-06 | 2021-12-22 | Google LLC | Automated calling system |
KR20190089128A (ko) * | 2019-07-10 | 2019-07-30 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
KR20190118996A (ko) * | 2019-10-01 | 2019-10-21 | 엘지전자 주식회사 | 음성 처리 방법 및 음성 처리 장치 |
KR20210050901A (ko) * | 2019-10-29 | 2021-05-10 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
JP7407046B2 (ja) * | 2020-03-26 | 2023-12-28 | 本田技研工業株式会社 | 音声出力の制御方法および音声出力制御装置 |
CN114255757A (zh) * | 2020-09-22 | 2022-03-29 | 阿尔卑斯阿尔派株式会社 | 语音信息处理装置及语音信息处理方法 |
DE102020129601A1 (de) | 2020-11-10 | 2022-05-12 | nxtbase technologies GmbH | Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe |
DE102020129605A1 (de) | 2020-11-10 | 2022-05-12 | nxtbase technologies GmbH | Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe |
US11955137B2 (en) | 2021-03-11 | 2024-04-09 | Apple Inc. | Continuous dialog with a digital assistant |
CN114863929B (zh) * | 2022-07-11 | 2022-10-21 | 深圳市人马互动科技有限公司 | 语音交互方法、装置、系统、计算机设备和存储介质 |
Family Cites Families (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4625081A (en) * | 1982-11-30 | 1986-11-25 | Lotito Lawrence A | Automated telephone voice service system |
US4827520A (en) | 1987-01-16 | 1989-05-02 | Prince Corporation | Voice actuated control system for use in a vehicle |
JPH06259090A (ja) * | 1993-03-09 | 1994-09-16 | Nec Corp | 音声対話システム |
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
US5799279A (en) | 1995-11-13 | 1998-08-25 | Dragon Systems, Inc. | Continuous speech recognition of text and commands |
US6073101A (en) | 1996-02-02 | 2000-06-06 | International Business Machines Corporation | Text independent speaker recognition for transparent command ambiguity resolution and continuous access control |
DE19608869C2 (de) | 1996-03-07 | 1998-03-26 | Daimler Benz Ag | Bediensystem, insbesondere für Komponenten in einem Kraftfahrzeug |
US6208932B1 (en) | 1996-09-30 | 2001-03-27 | Mazda Motor Corporation | Navigation apparatus |
US6658466B1 (en) * | 1996-10-16 | 2003-12-02 | Ncr Corporation | Method and apparatus for integrating remote human interactive assistance function into software systems |
US6073013A (en) | 1996-11-04 | 2000-06-06 | Qualcomm Incorporated | Method and apparatus for performing position-based call processing in a mobile telephone system |
US6169789B1 (en) | 1996-12-16 | 2001-01-02 | Sanjay K. Rao | Intelligent keyboard system |
US6041300A (en) | 1997-03-21 | 2000-03-21 | International Business Machines Corporation | System and method of using pre-enrolled speech sub-units for efficient speech synthesis |
CA2292959A1 (en) | 1997-05-06 | 1998-11-12 | Speechworks International, Inc. | System and method for developing interactive speech applications |
GB2325110B (en) | 1997-05-06 | 2002-10-16 | Ibm | Voice processing system |
FI972723A0 (fi) | 1997-06-24 | 1997-06-24 | Nokia Mobile Phones Ltd | Mobila kommunikationsanordningar |
US6138098A (en) | 1997-06-30 | 2000-10-24 | Lernout & Hauspie Speech Products N.V. | Command parsing and rewrite system |
JP2976939B2 (ja) * | 1997-07-14 | 1999-11-10 | 日本電気株式会社 | 移動体通信システム |
DE69712485T2 (de) | 1997-10-23 | 2002-12-12 | Sony Int Europe Gmbh | Sprachschnittstelle für ein Hausnetzwerk |
JP3505982B2 (ja) * | 1997-10-24 | 2004-03-15 | 日産自動車株式会社 | 音声対話装置 |
US6012030A (en) | 1998-04-21 | 2000-01-04 | Nortel Networks Corporation | Management of speech and audio prompts in multimodal interfaces |
CN1302409A (zh) | 1998-05-07 | 2001-07-04 | Art-高级技巧识别技术有限公司 | 车辆部件的手写与话音控制 |
US6236968B1 (en) | 1998-05-14 | 2001-05-22 | International Business Machines Corporation | Sleep prevention dialog based car system |
JP3157788B2 (ja) | 1998-11-12 | 2001-04-16 | 埼玉日本電気株式会社 | 携帯型情報端末 |
US6246981B1 (en) | 1998-11-25 | 2001-06-12 | International Business Machines Corporation | Natural language task-oriented dialog manager and method |
US6044925A (en) * | 1998-11-30 | 2000-04-04 | Sahyoun; Joseph Yaacoub | Passive speaker |
US6931446B1 (en) | 1998-12-14 | 2005-08-16 | International Business Machines Corporation | Methods, systems and computer program products for policy based network control of characteristics of user sessions |
GB2347823A (en) | 1999-03-01 | 2000-09-13 | Motorola Ltd | Paying for cellular communications service when roaming |
US6396481B1 (en) | 1999-04-19 | 2002-05-28 | Ecrio Inc. | Apparatus and method for portable handwriting capture |
US6505155B1 (en) | 1999-05-06 | 2003-01-07 | International Business Machines Corporation | Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy |
US6584439B1 (en) | 1999-05-21 | 2003-06-24 | Winbond Electronics Corporation | Method and apparatus for controlling voice controlled devices |
EP1063636A3 (en) | 1999-05-21 | 2001-11-14 | Winbond Electronics Corporation | Method and apparatus for standard voice user interface and voice controlled devices |
US6345254B1 (en) | 1999-05-29 | 2002-02-05 | International Business Machines Corp. | Method and apparatus for improving speech command recognition accuracy using event-based constraints |
AUPQ141999A0 (en) | 1999-07-05 | 1999-07-29 | Worldlingo.Com Pty Ltd | Communication processing system |
US6499015B2 (en) | 1999-08-12 | 2002-12-24 | International Business Machines Corporation | Voice interaction method for a computer graphical user interface |
US6658388B1 (en) | 1999-09-10 | 2003-12-02 | International Business Machines Corporation | Personality generator for conversational systems |
US6598020B1 (en) | 1999-09-10 | 2003-07-22 | International Business Machines Corporation | Adaptive emotion and initiative generator for conversational systems |
US6658646B1 (en) * | 1999-09-29 | 2003-12-02 | Lucent Technologies Inc. | Multiple interface scripting language |
US6442522B1 (en) | 1999-10-12 | 2002-08-27 | International Business Machines Corporation | Bi-directional natural language system for interfacing with multiple back-end applications |
US6594630B1 (en) | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
EP1104978A1 (de) | 1999-11-30 | 2001-06-06 | TELEFONAKTIEBOLAGET LM ERICSSON (publ) | Verfahren und Vorrichtung zur Anwahl von Diensten |
GB9929284D0 (en) | 1999-12-11 | 2000-02-02 | Ibm | Voice processing apparatus |
US6748361B1 (en) | 1999-12-14 | 2004-06-08 | International Business Machines Corporation | Personal speech assistant supporting a dialog manager |
GB9930731D0 (en) | 1999-12-22 | 2000-02-16 | Ibm | Voice processing apparatus |
SE519537C2 (sv) | 2000-01-21 | 2003-03-11 | Richard Granberg | Elektronisk anordning med tryckkänslig bildskärm och förskjutbart tangentborg |
US6654720B1 (en) | 2000-05-09 | 2003-11-25 | International Business Machines Corporation | Method and system for voice control enabling device in a service discovery network |
FR2808915B1 (fr) | 2000-05-15 | 2005-06-10 | Nacam | Dispositif de commande a distances d'organes ou d'equipements de vehicule automobile |
US6422522B1 (en) | 2000-06-05 | 2002-07-23 | Jeffrey K. Woollen | Stand for supporting a musical instrument |
US6741963B1 (en) | 2000-06-21 | 2004-05-25 | International Business Machines Corporation | Method of managing a speech cache |
WO2002005264A1 (de) | 2000-07-07 | 2002-01-17 | Siemens Aktiengesellschaft | Sprachgesteuerte anordnung und verfahren zur spracheingabe und -erkennung |
US6925495B2 (en) | 2000-07-13 | 2005-08-02 | Vendaria Media, Inc. | Method and system for delivering and monitoring an on-demand playlist over a network using a template |
DE10041456A1 (de) | 2000-08-23 | 2002-03-07 | Philips Corp Intellectual Pty | Verfahren zum Steuern von Geräten mittels Sprachsignalen, insbesondere bei Kraftfahrzeugen |
US6785651B1 (en) | 2000-09-14 | 2004-08-31 | Microsoft Corporation | Method and apparatus for performing plan-based dialog |
CN1173498C (zh) | 2000-10-13 | 2004-10-27 | 国际商业机器公司 | 语音允许的蓝牙设备管理和访问装置及有关控制方法 |
JP2002135696A (ja) * | 2000-10-23 | 2002-05-10 | Matsushita Electric Ind Co Ltd | 情報配信再生システム、情報配信方法、情報再生方法、情報記録方法、情報配信装置、情報再生装置、情報記録装置、記録媒体、および作業装置。 |
DE60133529T2 (de) | 2000-11-23 | 2009-06-10 | International Business Machines Corp. | Sprachnavigation in Webanwendungen |
US20020067839A1 (en) | 2000-12-04 | 2002-06-06 | Heinrich Timothy K. | The wireless voice activated and recogintion car system |
US6950793B2 (en) | 2001-01-12 | 2005-09-27 | International Business Machines Corporation | System and method for deriving natural language representation of formal belief structures |
US7257537B2 (en) | 2001-01-12 | 2007-08-14 | International Business Machines Corporation | Method and apparatus for performing dialog management in a computer conversational interface |
US7127402B2 (en) | 2001-01-12 | 2006-10-24 | International Business Machines Corporation | Method and apparatus for converting utterance representations into actions in a conversational system |
US7085723B2 (en) | 2001-01-12 | 2006-08-01 | International Business Machines Corporation | System and method for determining utterance context in a multi-context speech application |
EP1231798B1 (en) | 2001-02-07 | 2007-01-24 | NTT DoCoMo, Inc. | Language selecting method and mobile communication system |
JP3919210B2 (ja) * | 2001-02-15 | 2007-05-23 | アルパイン株式会社 | 音声入力案内方法及び装置 |
US7171365B2 (en) | 2001-02-16 | 2007-01-30 | International Business Machines Corporation | Tracking time using portable recorders and speech recognition |
GB2372864B (en) | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US6907119B2 (en) | 2001-03-08 | 2005-06-14 | Qwest Communications International, Inc. | Automated business directory assistance |
US6801897B2 (en) | 2001-03-28 | 2004-10-05 | International Business Machines Corporation | Method of providing concise forms of natural commands |
US6832196B2 (en) | 2001-03-30 | 2004-12-14 | International Business Machines Corporation | Speech driven data selection in a voice-enabled program |
CA2344904A1 (en) | 2001-04-23 | 2002-10-23 | Bruno Richard Preiss | Interactive voice response system and method |
US20030005159A1 (en) | 2001-06-07 | 2003-01-02 | International Business Machines Corporation | Method and system for generating and serving multilingual web pages |
US20020198699A1 (en) | 2001-06-21 | 2002-12-26 | International Business Machines Corporation | Apparatus, system and method for providing open source language translation |
US7289962B2 (en) | 2001-06-28 | 2007-10-30 | International Business Machines Corporation | Compressed list presentation for speech user interfaces |
US20030040899A1 (en) | 2001-08-13 | 2003-02-27 | Ogilvie John W.L. | Tools and techniques for reader-guided incremental immersion in a foreign language text |
US6984176B2 (en) | 2001-09-05 | 2006-01-10 | Pointstreak.Com Inc. | System, methodology, and computer program for gathering hockey and hockey-type game data |
US6721633B2 (en) | 2001-09-28 | 2004-04-13 | Robert Bosch Gmbh | Method and device for interfacing a driver information system using a voice portal server |
JP3963698B2 (ja) * | 2001-10-23 | 2007-08-22 | 富士通テン株式会社 | 音声対話システム |
US7099829B2 (en) | 2001-11-06 | 2006-08-29 | International Business Machines Corporation | Method of dynamically displaying speech recognition system information |
US6922200B1 (en) | 2001-11-30 | 2005-07-26 | Oracle International Corporation | Delivering a graphical object to a browser |
US6704396B2 (en) | 2002-02-27 | 2004-03-09 | Sbc Technology Resources, Inc. | Multi-modal communications method |
US20030191646A1 (en) | 2002-04-08 | 2003-10-09 | D'avello Robert F. | Method of setting voice processing parameters in a communication device |
US20040198326A1 (en) | 2002-04-09 | 2004-10-07 | Vijay Hirani | Personalized language announcements |
US7174298B2 (en) | 2002-06-24 | 2007-02-06 | Intel Corporation | Method and apparatus to improve accuracy of mobile speech-enabled services |
US20040078762A1 (en) | 2002-10-17 | 2004-04-22 | Taiwan Semiconductor Manufacturing Co., Ltd. | Multi-lingual information server apparatus and method for operation thereof |
US7197331B2 (en) | 2002-12-30 | 2007-03-27 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
US7536293B2 (en) | 2003-02-24 | 2009-05-19 | Microsoft Corporation | Methods and systems for language translation |
US7451129B2 (en) | 2003-03-31 | 2008-11-11 | Google Inc. | System and method for providing preferred language ordering of search results |
US8301436B2 (en) | 2003-05-29 | 2012-10-30 | Microsoft Corporation | Semantic object synchronous understanding for highly interactive interface |
US20040264677A1 (en) | 2003-06-30 | 2004-12-30 | Horvitz Eric J. | Ideal transfer of call handling from automated systems to human operators based on forecasts of automation efficacy and operator load |
EP1524778A1 (en) | 2003-10-15 | 2005-04-20 | Harman Becker Automotive Systems GmbH | Method for communicating information from a server to a user via a mobile communication device running a dialog script |
-
2004
- 2004-01-29 DE DE602004017955T patent/DE602004017955D1/de not_active Expired - Lifetime
- 2004-01-29 AT AT04001949T patent/ATE415684T1/de not_active IP Right Cessation
- 2004-01-29 EP EP04001949A patent/EP1560200B8/en not_active Expired - Lifetime
-
2005
- 2005-01-26 US US11/044,815 patent/US7454351B2/en active Active
- 2005-01-27 CA CA2494795A patent/CA2494795C/en active Active
- 2005-01-29 KR KR1020050008381A patent/KR20050077806A/ko not_active Application Discontinuation
- 2005-01-31 CN CN2005100542203A patent/CN1655233B/zh active Active
- 2005-01-31 JP JP2005024580A patent/JP2005215694A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10115392B2 (en) | 2010-06-03 | 2018-10-30 | Visteon Global Technologies, Inc. | Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system |
US9618352B2 (en) | 2014-03-27 | 2017-04-11 | Electronics And Telecommunications Research Institute | Apparatus and method for controlling navigator via speech dialogue |
Also Published As
Publication number | Publication date |
---|---|
ATE415684T1 (de) | 2008-12-15 |
CA2494795C (en) | 2014-07-08 |
US7454351B2 (en) | 2008-11-18 |
EP1560200B1 (en) | 2008-11-26 |
CN1655233B (zh) | 2012-04-11 |
US20050267759A1 (en) | 2005-12-01 |
EP1560200A1 (en) | 2005-08-03 |
JP2005215694A (ja) | 2005-08-11 |
DE602004017955D1 (de) | 2009-01-08 |
CN1655233A (zh) | 2005-08-17 |
EP1560200B8 (en) | 2009-08-05 |
CA2494795A1 (en) | 2005-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20050077806A (ko) | 음성 대화 실행 방법 및 음성 대화 시스템 | |
JP7093181B2 (ja) | 車両ベースのマルチモーダルインターフェース | |
EP1555652B1 (en) | Activation of a speech dialogue system | |
US20060262103A1 (en) | Human machine interface method and device for cellular telephone operation in automotive infotainment systems | |
WO2003078930A1 (fr) | Dispositif de navigation a bord d'un vehicule | |
JP6016365B2 (ja) | 情報処理装置 | |
EP1560199A1 (en) | Multi-modal data input | |
GB2440766A (en) | Voice recognition controlled system for providing a disclaimer to be acknowledged before allowing operation of a vehicle navigation system | |
KR20070008615A (ko) | 특히 차량을 위해, 목록 항목과 정보 시스템 또는엔터테인먼트 시스템을 선택하는 방법 | |
JP2020160180A (ja) | 表示制御装置、表示制御方法およびプログラム | |
JP2017049698A (ja) | 入力装置、表示装置、入力装置の制御方法およびプログラム | |
JP2001042891A (ja) | 音声認識装置、音声認識搭載装置、音声認識搭載システム、音声認識方法、及び記憶媒体 | |
JP3731499B2 (ja) | 音声認識制御装置、及び車載用情報処理装置 | |
JP4171924B2 (ja) | 機器制御システム | |
JP4530881B2 (ja) | 入力制御装置、および入力制御方法 | |
JP2005121563A (ja) | 車載用ナビゲーション装置およびその装置への入力方法 | |
JP2005208798A (ja) | 情報提供端末、および情報提供方法 | |
US11449167B2 (en) | Systems using dual touch and sound control, and methods thereof | |
JP2017190995A (ja) | 電子機器 | |
JP2004009834A (ja) | 車両用操作表示装置 | |
KR100520528B1 (ko) | 터치 스크린이 채용된 차량용 단말기 | |
JP4028076B2 (ja) | 機器制御システム、及び車載用機器 | |
WO2023153314A1 (ja) | 車内機器制御装置、車内機器制御方法 | |
KR20060131286A (ko) | 자동차 핸들과 차량정보 단말기의 인터페이스 장치와 방법 | |
JP6509077B2 (ja) | 情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |