CN114530149A - 车辆及其控制方法 - Google Patents

车辆及其控制方法 Download PDF

Info

Publication number
CN114530149A
CN114530149A CN202111288088.8A CN202111288088A CN114530149A CN 114530149 A CN114530149 A CN 114530149A CN 202111288088 A CN202111288088 A CN 202111288088A CN 114530149 A CN114530149 A CN 114530149A
Authority
CN
China
Prior art keywords
named entity
information
domain
vehicle
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111288088.8A
Other languages
English (en)
Inventor
朴宰奭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Motor Co
Kia Corp
Original Assignee
Hyundai Motor Co
Kia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyundai Motor Co, Kia Corp filed Critical Hyundai Motor Co
Publication of CN114530149A publication Critical patent/CN114530149A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/023Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for transmission of signals between vehicle parts or subsystems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • G01C21/3629Guidance using speech or audio output, e.g. text-to-speech
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • General Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Navigation (AREA)

Abstract

本发明涉及车辆及其控制方法,该车辆包括:语音处理器,被配置成将用户的话语命令转换成文本信息,并基于文本信息识别与话语命令相对应的域和命名实体;数据库,被配置存储与域和命名实体相对应的应答文本;扬声器;以及控制器,被配置成接收与域和命名实体相对应的信息,基于与域和命名实体相对应的信息来更正存储在数据库中的应答文本,并控制扬声器以输出经更正的应答文本。

Description

车辆及其控制方法
技术领域
本发明涉及一种能够与用户交换对话的车辆及其控制方法,更具体涉及一种能够响应于用户的话语命令来输出更明智响应语音的车辆及其控制方法。
背景技术
语音识别系统是能够识别用户的话语并提供与所识别话语对应的服务的系统。
最近,已经提供使用语音识别系统的各种类型的对话服务。特别地,当车辆内部的乘员说出用于控制车辆的各种电子装置的命令时,可以根据乘员的意图来控制车辆的各种电子装置。此外,在输入乘员的话语命令时,车辆响应于语音命令,通过输出响应语音来通知乘员是否识别命令。然而,响应于乘员的话语命令的车辆的响应语音,是根据每个转换成声音的命令映射到数据库的文本,这可能会给乘员带来相当普通和平庸的感觉。
发明内容
本发明的目的在于提供一种能够响应于用户的话语命令来输出更明智响应语音的车辆及其控制方法。
根据本发明一个方面提供一种车辆,包括:语音处理器,被配置成将用户的话语命令转换成文本信息,并基于文本信息识别与话语命令相对应的域和命名实体。车辆还包括数据库,被配置成存储与域和命名实体相对应的应答文本。车辆还包括扬声器以及控制器,其中控制器被配置成接收与域和命名实体相对应的信息,基于与域和命名实体相对应的信息来更正存储在数据库中的应答文本,并控制扬声器以输出经更正的应答文本。
当域是导航装置并且命名实体是地点名称时,与域和命名实体相对应的信息包括命名实体的目的地设定历史信息、命名实体的类别信息、具有命名实体的地点的位置信息、车辆的位置信息以及当前时间信息中的至少一个。
控制器可更正存储在数据库中的应答文本,以包含与将命名实体设置成目的地的时间与话语命令的输入时间之间的时段相关联的短语。
控制器可更正存储在数据库中的应答文本,以包含与命名实体的类别信息相关联的短语。
当车辆位于距第一预设地点的预设距离内并且具有命名实体的地点对应于第二预设地点时,控制器可更正存储在数据库中的应答文本以包含与第一预设地点和第二预设地点相对应的预设短语。
控制器可更正存储在数据库中的应答文本,以包含与当前时间信息相对应的预设短语。
当域是移动通信装置并且命名实体是指示家庭的名称时,与域和命名实体相对应的信息可包含用于修饰命名实体的多个修饰符的信息。控制器可更正存储在数据库中的应答文本,以包含多个修饰符中的任何一个修饰符。
当域是车辆控制系统并且命名实体是指示控制目标装置的名称时,与域和命名实体相对应的信息可包含天气信息和车辆系统的激活信息中的至少一个。
当用于操作控制目标装置的条件与天气信息不匹配或者该条件与车辆系统的激活信息不匹配时,控制器可更正应答文本以改变成包含与天气信息相关联的第一短语或与车辆系统的激活信息相关联的第二短语的疑问句。
该车辆还可包括通信器,被配置成向控制目标装置发送控制命令。控制器可控制通信器,以便仅在操作控制目标装置的条件与天气信息相匹配或者条件与车辆系统的激活信息相匹配时,向控制目标装置发送与话语命令相对应的控制命令。
本发明另一方面提供一种用于控制车辆的方法,所述方法包括将用户的话语命令转换成文本信息并基于文本信息识别与话语命令相对应的域和命名实体。控制车辆的方法还包括接收与域和命名实体相对应的信息。控制车辆的方法还包括基于与域和命名实体相对应的信息,更正存储在数据库中的应答文本。控制车辆的方法还包括控制扬声器以输出经更正的应答文本。
当域是导航装置并且命名实体是地点名称时,与域和命名实体相对应的信息可包含命名实体的目的地设定历史信息、命名实体的类别信息、具有命名实体的地点的位置信息、车辆的位置信息以及当前时间信息中的至少一个。
基于与域和命名实体相对应的信息更正存储在数据库中的应答文本的步骤,可包括更正存储在数据库中的应答文本以包含与将命名实体设置成目的地的时间与话语命令的输入时间之间的时段相关联的短语。
基于与域和命名实体相对应的信息更正存储在数据库中的应答文本的步骤,可包括更正存储在数据库中的应答文本以包含与命名实体的类别信息相关联的短语。
当车辆位于距第一预设地点的预设距离内并且具有命名实体的地点对应于第二预设地点时,基于与域和命名实体相对应的信息更正存储在数据库中的应答文本的步骤,可包括更正存储在数据库中的应答文本以包含与第一预设地点和第二预设地点相对应的预设短语。
基于与域和命名实体相对应的信息更正存储在数据库中的应答文本的步骤,可包括更正存储在数据库中的应答文本以包含与当前时间信息相关联的预设短语。
当域是移动通信装置并且命名实体是指示家庭的名称时,与域和命名实体相对应的信息可包含用于修饰命名实体的多个修饰符的信息。基于与域和命名实体相对应的信息更正存储在数据库中的应答文本的步骤,可包括更正存储在数据库中的应答文本以包含多个修饰符中的任何一个修饰符。
当域是车辆控制系统并且命名实体是指示控制目标装置的名称时,与域和命名实体相对应的信息可包括天气信息和车辆系统的激活信息中的至少一个。
当用于操作控制目标装置的条件与天气信息不匹配或者条件与车辆系统的激活信息不匹配时,基于与域和命名实体相对应的信息更正存储在数据库中的应答文本的步骤可包括更正应答文本以改变成包含与天气信息相关联的第一短语或与车辆系统的激活信息相关联的第二短语的疑问句。
所述方法还包括以下步骤:仅在操作控制目标装置的条件与天气信息相匹配或者条件与车辆系统的激活信息相匹配时,向控制目标装置发送与话语命令相对应的控制命令。
附图说明
通过以下结合附图对实施例的详细描述,本发明的这些和/或其他方面将变得显而易见,其中:
图1是根据实施例的车辆的控制框图;
图2是根据实施例的用于控制车辆的方法的流程图;
图3是当用户输入用以控制导航装置的话语命令时用于控制车辆的方法的流程图;
图4是当用户输入用以控制移动通信装置的话语命令时用于控制车辆的方法的流程图;
图5是当用户输入用以控制车辆控制系统的话语命令时用于控制车辆的方法的流程图。
具体实施方式
在整个说明书中,相同的附图标记指代相同元件。并未对本发明实施例中的所有元件进行描述,并且省略了本领域中所公知的描述或在实施例中彼此重叠内容的描述。
应该进一步理解,术语“连接”及其类似词语表示直接和间接地连接,并且间接连接包括通过无线通信网络的连接。
除非另有提及,否则术语“包括”、“包含”及类似词语,是包容或开放式的,不排除额外的、未记载的元件或方法步骤。应该进一步理解,术语“部件”及其类似词语指的是一个部件与另一个部件接触的情况以及在两个部件之间存在另一个部件的情况。
应该理解,除非上下文另有明确规定,否则单数形式也包括复数引用。
在说明书中使用的诸如“~单元”、“~组”、“~块”、“~部”和“~模块”等术语,可以实施为软件或硬件。诸如“~单元”、“~组”、“~块”、“~部”和“~模块”等术语,可以指处理至少一种功能或操作的单元。另外,诸如“~单元”、“~组”、“~块”、“~部”和“~模块”等术语,使用在诸如现场可编程门阵列(FPGA)/应用特定集成电路(ASIC)的至少一件硬件,或者存储在存储器中的至少一个软件或处理器中。当本发明的组件、装置、元件等被描述为具有目的或执行操作、功能等时,在本文中应考虑该组件、装置或元件作为“被配置成”以满足该目的或执行该操作或功能。
用于方法步骤的附图标记仅用于便于说明,而不是限制步骤的顺序。因此,除非上下文清楚说明,否则所写的顺序可以其他方式实践。
下面将参照附图详细描述本发明的原理和实施例。
图1是根据实施例的车辆的控制框图。
参考图1,根据实施例的车辆1包括麦克风M、语音处理器10、控制器20、数据库30、扬声器S、通信器40、导航装置50以及车辆控制系统60。
麦克风M可以接收用户的话语命令,并生成与话语命令相对应的电信号。
为此目的,麦克风M可以设置在车辆1内,以从车辆1接收声音,并且可以使用多个麦克风来接收所有乘员的声音。
麦克风M可以将用户的话语命令转换成电信号,并将其发送到语音处理器10。
语音处理器10可以包括对话管理器,通过分析将经由麦克风M输入的用户话语命令转换成文本信息的语音转文本(STT)引擎,确定包含在话语命令中的用户意图和文本。
对话管理器可通过将自然语言理解应用到文本,掌握与话语命令对应的用户意图。
具体地,通过以文本形式对话语命令执行语素分析,对话管理器将输入字符串转换为语素串。此外,对话管理器可以从话语命令识别命名实体。命名实体是一个适当的名词,例如人名、地名、组织名称、时间、日期、金钱、指示家庭的名称,以及车辆1的各种电子装置的名称。识别命名实体是识别句子中的命名实体并确定所识别的命名实体的类型的任务。通过识别命名实体并掌握句子的含义,对话管理器可以从句子中提取重要关键字。
此外,对话管理器可以从用户的话语命令中识别域。该域可以识别用户发出的语言的主题,例如,要控制的装置类型可以是域。因此,域可以是车辆1内的电子装置,例如导航装置50、车辆控制系统60或者用户的移动通信装置100。另外,包括各种主题的域,例如文本、导航、时间表、天气、交通和车辆控制可以存储在数据库30中。
导航装置50可以指代通过接收用户输入的目的地并搜索到达目的地的路线来向用户提供最佳行驶路线的任何装置。
例如,导航装置50可以指车辆1的音频视频导航(AVN)装置,还可以包含导航功能的外部终端装置。
换句话说,尽管在图1中移动通信装置100和导航装置50被单独地示出,但是当移动通信装置100执行导航功能并执行与车辆1的短程通信和/或远程通信时,移动通信装置100也可以是导航装置50的一个示例。
移动通信装置100可以指能够执行与车辆1的短程通信和/或远程通信的任何装置。例如,移动通信装置100可以包括智能电话。
车辆控制系统60可以指能够驱动车辆1的各种电子装置的多个控制装置。例如,车辆控制系统60可包括用于驱动车辆1的空调机的空调机控制装置,用于打开和关闭车辆1的窗户的窗户控制装置,用于激活/停止车辆系统的模式激活系统(例如后座对话模式和后座睡眠模式等)。
后座对话模式是驾驶员和后座乘员使用设置在车辆1的驾驶员座中的麦克风和设置在后座中的扬声器进行通信的一种模式。后座睡眠模式是后座乘员通过关闭设置在后座中的扬声器执行睡眠的模式。
对话管理器可以分析用户的言语行为的对话行为。言语行为分析是分析用户的话语的意图的任务。言语行为分析的目的是理解话语的意图,例如用户是否询问问题、提出要求、响应或表达简单的情绪。
对话管理器可以基于诸如域、命名实体、以及与用户的话语命令相对应的言语行为的信息来识别用户的意图,并且可以提取与用户的意图相对应的动作。
例如,当用户的识别意图是[执行空调机]时,相应的动作可被定义为“空调机(对象)_ON(运算符)”。当用户的识别意图是[打开窗户]时,相应的动作可被定义为“窗户(对象)_OPEN(运算符)”。
基于从语音处理器10接收的各种信息,控制器20可以通过通信器40将控制信号发送到车辆控制系统60,或者通过通信器40向导航装置50发送控制信号。
例如,当控制器20从语音处理器10接收诸如“执行空调机”的动作数据时,控制器20可以将用于打开空调机的控制信号发送到空调机控制装置。
此外,控制器20可以将与域和命名实体相对应的应答文本转换成语音信号,并基于从语音处理器10接收的域数据和命名实体数据控制扬声器S输出应答文本。为此目的,扬声器S可以指能够基于语音信号输出语音(即,音频输出)的任何装置,并且可以设置在车辆1内的乘员可以收听输出语音而不限制数量的位置上。
控制器20可以包括文本转语音(TTS)引擎,以将应答文本转换成语音信号。TTS引擎可以将应答文本转换成语音信号,并且控制器20可以将语音信号传送到扬声器S。
数据库30可以存储与多个域和多个命名实体或其组合中的每一个相对应的应答文本。
例如,数据库30可以存储文本“我将引导您去A”,作为与诸如“请求通过导航装置50引导路线”的域以及诸如“特定地点名称(例如,A)的命名实体相对应的应答文本。
作为另一示例,数据库30可以存储文本“我要给A打电话”,作为与诸如“请求通过移动通信装置100打电话”的域和诸如“特定人名(例如A)”的命名实体相对应的应答文本。
作为另一示例,数据库30可以存储文本“我要与A共享我车辆的位置”,作为诸如“请求通过移动通信装置100共享当前位置”的域以及诸如“特定人名(例如,A)”的命名实体相对应的应答文本。
作为另一示例,数据库30可以存储文本“我要打开空调机”,作为与诸如“通过车辆控制系统60执行电气装置”的域以及诸如“空调机”的命名实体相对应的应答文本。
作为另一示例,数据库30可以存储文本“我要打开后座对话模式”,作为与诸如“通过车辆控制系统60激活车辆系统”的域以及诸如“后座对话”的命名实体相对应的应答文本。
在从语音处理器10接收到域和命名实体时,控制器20可以通过通信器40请求与域和命名实体相对应的信息。
当域是导航装置50而命名实体是一个地名时,与域和命名实体相对应的信息可以包括命名实体的目的地设定历史信息、命名实体的类别信息、具有命名实体的地点的位置信息和车辆1的位置信息或当前时间信息中的至少一个。
在这种情况下,控制器20可以通过通信器40从导航装置50接收上述信息中的至少一项信息,并且可以通过外部服务器接收上述信息中的至少一项信息。
另外,当域是移动通信装置100而命名实体是指示家庭的名称时,与域和命名实体相对应的信息可以包含用于修饰命名实体的多个修饰符的有关信息。
在这种情况下,用于修饰命名实体的多个修饰符可以存储在数据库30中,并且控制器20可以从数据库30接收与多个修饰符有关的信息。
另外,当域是车辆控制系统60而命名实体是指示控制目标装置的名称时,与域和命名实体相对应的信息可以包含天气信息或车辆系统的激活信息中的至少一项。
控制器20可以通过通信器40从车辆控制系统60接收上述信息中的至少一种信息,并且可以通过外部服务器接收上述信息中的至少一种信息。
当控制器20接收到与域和命名实体相对应的信息时,可以基于与域和命名实体相对应的信息来控制扬声器S以更正存储在数据库30中的应答文本,并且扬声器S可以被控制为输出经更正的应答文本。
根据实施例的车辆1可以包括至少一个存储器,用于存储执行上述操作以及后续要描述操作的程序和相关数据,并且可以包括用于执行所存储程序的至少一个处理器。
语音处理器10和控制器20也可以分别使用单独的存储器和处理器,并且它们中的一部分或者全部也可以共享存储器和处理器。
此外,控制器20的TTS引擎也可以使用单独的存储器和处理器。
此外,数据库30可以包括诸如只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、电擦除可编程只读存储器(EEPROM)、闪存的非易失性存储器,以及诸如静态随机存取存储器(S-RAM)、动态随机存取存储器(D-RAM)的易失性存储器。根据要存储的信息类型,可以存储在非易失性存储器或易失性存储器中。
根据实施例的通信器40可以包括用于与车辆1中的各种电子装置通信的车辆通信网络和/或用于与移动通信装置100和/或外部服务器通信的短程通信模块,和/或用于与移动通信装置100通信的远程通信模块。
例如,通信器40可以通过车辆通信网络与导航装置50和车辆控制系统60交换各种数据/命令。
车辆通信网络可以采用以太网、媒体面向系统传输(MOST)、FlexRay、控制器局域网络(CAN),本地互连网络(LIN)等通信方法。
除了WiFi和无线宽带(Wibro)之外,远程通信模块还可以包括用于以无线通信方法连接到因特网网络的各种无线通信模块中的至少一个,例如,用于移动通信的全球系统(GSM)、码分多址(CDMA)、宽带码分多址(WCDMA)、通用移动电信系统(UMTS)、时分多址(TDMA)、长期演进(LTE)、4G移动通信、5G移动通信等。
短距离通信模块可以包括用于在短程中使用无线通信网络发送和接收信号中的各种短距离通信模块中的至少一种,例如蓝牙模块、红外通信模块、射频识别(RFID)通信模块、无线本地接入网络(WLAN)通信模块、NFC通信模块、ZigBee通信模块、Z波通信模块、Wi-Fi直通通信模块等。
此外,通信器40可包括用于向自由空间发送无线电信号或者从自由空间接收无线电信号的天线,用于调制要发送的数据或者解调所接收的无线电信号的调制器/解调器,等等。
控制器20可以与导航装置50和车辆控制系统60不经过通信器40而直接交换数据/命令,并且可以通过通信器40与扬声器S交换数据/命令。
在上文中已经描述了车辆1的各种部件。在下文中将参照图2~5描述利用如上的车辆1的组件的车辆1的控制方法。
图2是根据实施例的用于控制车辆的方法的流程图。
参照图2,麦克风M可以接收用户的话语命令,将所接收的话语命令转换成电信号,并将接收的话语命令传送到语音处理器10。换句话说,语音处理器10可以从麦克风M接收电信号形式的用户话语命令(1000)。
语音处理器10可以将用户的话语命令转换为文本信息,并基于文本信息识别与话语命令相对应的域和命名实体(1100)。
例如,当用户的话语命令是“将我引导到江南站”时,语音处理器10可以将“导航装置50”提取为域,并将“江南站”提取为命名实体。
语音处理器10可以向控制器20发送关于域和命名实体的信息,并且控制器20可以从车辆1的各种电子装置或外部服务器请求关于域和命名实体的信息。
此后,控制器20可以接收关于域和命名实体的信息(1200),并且可以基于与域和命名实体相对应的信息更正存储在数据库30中的应答文本(1300)。
例如,控制器20可以将特定短语添加到存储在数据库30中的应答文本,或者删除特定短语,并进一步更正应答文本的句子形式。
例如,在一些情况下,控制器20可以将不是问题类型的应答文本更正为问题类型的句子。
下面参考图3-图5详细描述与域和命名实体相对应的信息。
控制器20可以将经更正的应答文本转换成语音信号,并将语音信号发送到扬声器S。
换句话说,控制器20可以控制扬声器S以语音(即,音频)响应的形式输出经更正的应答文本(1400)。
在下文中详细描述控制器20更正应答文本的各种实施例。
图3是当用户输入用以控制导航装置的话语命令时用于控制车辆的方法的流程图。
参考图3,当基于从语音处理器10接收的信息域是导航装置50并且命名实体对应于地点名称(2000为是),控制器20可以请求以下中的至少一个:来自导航装置50和/或外部服务器的用于命名实体的目的地设定历史信息(2100),命名实体的类别信息(2200),具有命名实体的地点的位置信息(2300),以及车辆1的位置信息或当前时间信息。
作为示例,语音处理器10可以通过处理诸如“将我引导到江南站”的用户的话语命令,来识别诸如“导航装置50”的域以及诸如“江南站”的命名实体。作为另一示例,语音处理器10可以通过处理诸如“我们家”的用户的话语命令,来识别诸如“导航装置50”的域以及诸如“家”的命名实体。
目的地设定历史信息是关于为命名实体设置目的地的历史信息,并且可以包括为命名实体设置目的地的时间和/或次数的有关信息。
类别信息是命名实体的类别的有关信息,并且是指示当具有命名实体的地方属于诸如餐馆、咖啡馆、汽车中心、银行、市场、药房、加油站、咖啡馆、便利店、电影院、游乐园、露营地、地铁站等各种类别中的哪种类别的信息。
例如,当域是导航装置50并且命名实体是江南站时,控制器20可以请求江南站的目的地设定历史信息、江南站的类别信息、江南站的位置信息、或者来自导航装置50和/或外部服务器的当前时间信息中的至少一个。
当存在命名实体的目的地设定历史时(2100中为“是”),控制器20可以更正存储在数据库30中的应答文本以包括与将命名实体设置成目的地的时间与话语命令的输入时间之间的时段相关的短语(2150)。
例如,当将命名实体设置成目的地的时间为2020/07/04,并且话语命令的输入时间为2020/09/07时,控制器20可以更正存储在数据库30中的应答文本以包括短语“两个月”。
例如,当存储在数据库30中的应答文本是“我将引导您到[命名实体]”时,控制器20可以将应答文本更正为“大约「两个月」以来您一直要去,我会立即引导您”。
作为另一示例,当将命名实体设置成目的地的次数正在增加时,控制器20响应应答文本“「这几天」您「经常」去[命名实体],我会立即引导您”。
当存在用于命名实体的类别信息(2200中为“是”的示例)时,控制器20可以更正存储在数据库30中的应答文本以包括与命名实体的类别信息相关联的短语,并且在这种情况下,可以通过反映当前时间信息来更正应答文本(2250)。
例如,当命名实体的类别是餐馆时,控制器20可以更正应答文本以包括短语“餐馆”,这是与餐馆有关的短语。
作为示例,当存储在数据库30中的应答文本是“我将指导您到[命名实体]”时,控制器20可以将应答文本更正为“这不是著名的「餐馆」吗?我会立即引导您”。
在这种情况下,控制器20可以更正存储在数据库30中的应答文本,以包括与当前时间信息相对应的预设短语。
例如,当当前时间在上午11点至下午3点之间时,控制器20可以更正应答文本以包括与“午餐”相关的预设短语。
例如,当命名实体的类别是餐馆时且当前时间在上午11点至下午3点之间时,控制器20可以更正应答文本“有著名的「餐馆」吗?享受美味的「午餐」吧”。
当车辆1位于与第一预设地点的预设距离内时,并且具有命名实体的地点对应于第二预设地点(示例2300中为“是”),控制器20可以更正存储在数据库30中的应答文本以包括与第一预设地点和第二预设地点相对应的预设短语(2350)。
第一预设地点和第二预设地点可以包括用户输入到导航装置50的兴趣地点。
例如,第一预设地点可被设置为“工作”,并且第二预设地点可被设置为“家”,并且诸如“感谢您的努力”和“感谢您做了很棒的工作”等短语可被存储为与工作和家相对应的预设短语。
预设距离可被设定为大约1km,并且当车辆1是假定在第一预设地点附近的合理距离时,可以使用但不限于此。
例如,当第一预设地点是公司并且第二预设地点被设定为家时,当车辆1位于距“公司”1km内并且具有命名实体的地点对应于“家”时,控制器20可以将应答文本更正成:“感谢您做了很棒的工作。我会立即引导您回家。”
如上,控制器20可以控制扬声器S以语音响应的形式输出经更正的应答文本(2500)。
当其不与上述示例相对应时,控制器20可以控制扬声器S以输出存储在数据库30中的应答文本(2400)。
根据本发明的实施例,当用户向导航装置50输入话语命令时,可以根据各种情况提供各种响应声音。
图4是当用户输入用于控制移动通信装置的话语命令时用于控制车辆1的方法的流程图。
参考图4,当基于从语音处理器10接收的信息域是移动通信装置100并且命名实体与指示家庭的名称相对应时(3000中为“是”的示例),控制器20可以请求与多个修饰符有关的信息,用以修饰来自外部服务器和/或数据库30和/或移动通信装置100的命名实体。
作为示例,语音处理器10可以通过处理诸如“给妈妈打电话”的用户的话语命令,识别诸如“移动通信装置100”的域以及诸如“妈妈”的命名实体。
指示家庭成员的名称可包括诸如“女儿、儿子、妈妈、爸爸、丈夫、妻子”等正式名称,以及“女士、公主、王子、另一半、我的爱、亲爱的、漂亮的”等非正式名称。
另外,当域是移动通信装置100时,可包括诸如“电话功能、短信功能、汽车位置共享功能”的域作为更具体的域分类。
当域被分类成电话功能时,存储在数据库30中的应答文本可以是“我要给[命名实体]打电话”,并且当域被分类成短信功能时,存储在数据库30中的应答文本可以是“我要给[命名实体]发短信”。当域是汽车位置共享功能时,存储在数据库30中的应答文本可以是“我要与[命名实体]共享汽车位置”。
外部服务器和/或移动通信装置100和/或数据库30可以向控制器20发送与每个家庭名称相对应的多个修饰符有关的信息,并且控制器20可以接收与多个修饰符有关的信息并随机选择多个修饰符中的任何一个修饰符(3100)。
例如,作为对应于“妻子”的多个修饰符,可存在“心爱的”、“生命另一半”等,并且控制器20可以从多个修饰符中随机选择任何一个修饰符。
作为另一示例,作为对应于“漂亮的”的多个修饰符,可存在“我”、“宝号1号”等,并且控制器20可以随机地选择多个修饰符中的任何一个。
控制器20可以修改存储在数据库30中的应答文本,以包括多个修饰符中的任何一个(3200)。
例如,当“妻子”包含在命名实体中并且域被确定为“通过移动通信装置100打电话”时,控制器20可以将应答文本更正成“我要给我“心爱的”妻子打电话”。
此后,控制器20可以控制扬声器S以语音形式输出更正的应答文本,以便包括修饰符(3300)。
根据本发明的实施例,当用户通过移动通信装置100输入话语命令时,可以根据人的各种名称提供各种响应声音。
图5是当用户输入用以控制车辆控制系统的话语命令时用于控制车辆的方法的流程图。
参考图5,当基于从语音处理器10接收的信息域是车辆控制系统60并且命名实体不对应于指示控制目标装置的名称时(4000中为“否”),控制器20可以控制扬声器S以输出与存储在数据库30中的话语命令相对应的应答文本(4050)。
此外,即使在控制目标装置的操作条件与天气信息相匹配(4100中为“否”)且还与车辆系统的激活信息相匹配(4200中为“否”)时,控制器20也可以控制扬声器S以输出对应于存储在数据库30中的话语命令的应答文本(4300)。
当基于从语音处理器10接收的信息域是车辆控制系统60并且命名实体对应于指示控制目标装置的名称时(4000中为“是”的示例),控制器20可以向外部服务器和/或车辆控制系统60请求天气信息(4100)和/或车辆系统的激活信息(4200)中至少一个的有关信息。
例如,语音处理器10可以通过处理用户的诸如“打开窗户”的话语命令,识别诸如“车辆控制系统60”的域以及诸如“窗户”的命名实体。
如上所述,车辆控制系统60可以指用于控制车辆1的各种电子装置的电子控制装置,并且控制目标装置可以指由电子控制装置控制的目标装置。
例如,车辆控制系统60可以是用于打开和关闭窗户的“窗户控制装置”,或者用于打开和关闭天窗的“天窗控制装置”,并且控制目标装置可以是“窗户”或“天窗”。
天气信息可以指与车辆1的当前位置的天气有关的信息,并且可以包括诸如细颗粒物信息、湿度信息、多雨天气信息等各种信息。
当控制器20确定用以操作控制目标装置的条件与天气信息不匹配时(4100中为“是”的示例),可以修改存储在数据库30中的应答文本以包括与天气信息相关联的第一短语(4150)。
在这种情况下,控制器20可以将应答文本修改成问题类型句子。
与天气信息相关联的第一短语可以指通知用户当前天气信息的短语。
操作控制目标装置的条件可以存储在数据库30中。
例如,在数据库30中,诸如“细颗粒物的正常状态或良好状态”的条件,可被存储为“打开窗户或天窗的条件”。
在数据库30中,文本“我要打开窗户”可被存储为与包括“窗户”的命名实体以及诸如“通过窗户控制装置打开窗户”的域相对应的应答文本。
当包含在天气信息中的细颗粒物状态处于糟糕状态时,控制器20可以将与包括“窗户”的命名实体以及诸如“通过窗户控制装置打开窗户”的域相对应的应答文本更正成“当前「细颗粒物」处于糟糕状态。您还想「打开窗户」吗?”。
当控制目标装置的操作条件和车辆系统的激活信息不匹配时(4200中为“是”),控制器20可以更正应答文本以包含与车辆系统的激活信息相关联的第二短语(4250)。
在这种情况下,控制器20可以将应答文本更正为问题类型句子。
车辆系统的激活信息可以指设置在车辆1中的各种模式被激活的信息。例如,设置在车辆1中的各种模式可以指车辆1的各种模式,例如“后座对话模式”、“后座睡眠模式”、“内部循环模式”、“外部空气循环模式”等。
换句话说,车辆系统的激活信息可以包括当前后座对话模式是否处于运行状态,后座睡眠模式是否处于运行状态,内部循环模式是否处于运行状态,或者室外空气循环模式是否处于运行状态的信息。
与车辆系统的激活信息相关联的第二短语可以指向用户通知当前车辆系统的激活信息的短语。
操作控制目标装置的条件可以存储在数据库30中。
作为示例,数据库30可以将“后座睡眠模式关闭状态”的条件存储为“用于开启后座对话模式的条件”。
在数据库30中,文本“我要开启后座对话系统”可被存储为与包含诸如“后座对话”的单词的命名实体以及诸如“操作后座对话系统”的域相对应的应答文本。
当后座睡眠模式处于运行状态时,控制器20可以将与包含“后座对话”的命名实体以及诸如“操作后座对话系统”的域相对应的应答文本更正成“当前,「后座睡眠模式」开启。您还想要「改变到后座对话模式吗?」”。
控制器20可以控制扬声器S,使得更正的应答文本以语音形式输出(4400)。
另外,只有在操作控制目标装置的条件和天气信息相匹配时,或者在操作控制目标装置的条件和车辆系统的激活信息相匹配时,可以控制通信器40向控制目标装置发送与话语命令相对应的控制命令。
例如,当后座对话模式处于运行状态时,控制器20可以不响应于用户的话语命令来操作后座对话系统以打开后座对话模式。
换句话说,当确定出控制目标装置的操作是不恰当的,控制器20可以输出应答文本,以语音形式询问用户的确定意图,并且可以暂停与话语命令相对应的控制命令的发送,直到接受用户的明确意图。
此外,考虑到天气信息和车辆系统的激活信息,控制器20可以确定控制目标装置的操作条件。作为示例,数据库30可以将“当湿度为80%或更高时内部循环模式处于运行状态”的条件存储为空调机的操作条件。
当用户在湿度超过80%且外部空气循环模式处于运行状态的情况下输入诸如“打开空调机”的话语命令时,控制器20可以将诸如“我要打开空调机”的应答文本更正成“当前“湿度”非常高,打开空调机并切换到「内部循环模式」怎么样?”。
根据实施例的车辆1和控制车辆1的方法,可以通过在考虑周围环境的情况下输出各种响应声音来向用户提供便利性和兴趣。
通过上面的描述显而易见,根据本发明,通过诱导乘员的有趣情绪,可以改善语音识别系统的可用性。
另外,当乘客的话语命令不恰当时,可以重新确认用户的话语命令的意图。
车辆及其控制方法的例子不限于此,上述实施例本质上仅仅是示例和代表性的。尽管已经出于说明的目的而描述了本发明的实施例,但是本领域普通技术人员应该理解,在不脱离本发明的范围和精神的情况下,还可以进行各种修改、添加和替换。因此,本发明实施例的上述描述并非出于限制的目的。

Claims (20)

1.一种车辆,包括:
语音处理器,被配置成将用户的话语命令转换成文本信息,并基于所述文本信息识别与所述话语命令相对应的域和命名实体;
数据库,被配置成存储与所述域和所述命名实体相对应的应答文本;
扬声器;以及
控制器,被配置成接收与所述域和所述命名实体相对应的信息,基于与所述域和所述命名实体相对应的信息来更正存储在所述数据库中的应答文本,并控制所述扬声器以输出经更正的应答文本。
2.根据权利要求1所述的车辆,其中,当所述域是导航装置并且所述命名实体是地点名称时,与所述域和所述命名实体相对应的信息包括所述命名实体的目的地设定历史信息、所述命名实体的类别信息、具有所述命名实体的地点的位置信息、所述车辆的位置信息以及当前时间信息中的至少一个。
3.根据权利要求2所述的车辆,其中,所述控制器被配置成更正存储在所述数据库中的应答文本,以包含与将所述命名实体设置成目的地的时间与所述话语命令的输入时间之间的时段相关联的短语。
4.根据权利要求2所述的车辆,其中,所述控制器被配置成更正存储在所述数据库中的应答文本,以包含与所述命名实体的类别信息相关联的短语。
5.根据权利要求2所述的车辆,其中,当所述车辆位于距第一预设地点的预设距离内并且具有所述命名实体的地点对应于第二预设地点时,所述控制器被配置成更正存储在所述数据库中的应答文本以包含与所述第一预设地点和所述第二预设地点相对应的预设短语。
6.根据权利要求2所述的车辆,其中,所述控制器被配置成更正存储在所述数据库中的应答文本,以包含与所述当前时间信息相对应的预设短语。
7.根据权利要求1所述的车辆,其中,当所述域是移动通信装置并且所述命名实体是指示家庭的名称时,与所述域和所述命名实体相对应的信息包含用于修饰所述命名实体的多个修饰符的信息,并且
其中,所述控制器被配置成更正存储在所述数据库中的应答文本,以包含所述多个修饰符中的任何一个修饰符。
8.根据权利要求1所述的车辆,其中,当所述域是车辆控制系统并且所述命名实体是指示控制目标装置的名称时,与所述域和所述命名实体相对应的信息包含天气信息和车辆系统的激活信息中的至少一个。
9.根据权利要求8所述的车辆,其中,当用于操作所述控制目标装置的条件与天气信息不匹配或者所述条件与所述车辆系统的激活信息不匹配时,所述控制器被配置成更正应答文本以改变成包含与天气信息相关联的第一短语或与所述车辆系统的激活信息相关联的第二短语的疑问句。
10.根据权利要求8所述的车辆,还包括:通信器,被配置成向所述控制目标装置发送控制命令,
其中,所述控制器被配置成控制所述通信器,以便仅在操作所述控制目标装置的条件与所述天气信息相匹配或者所述条件与所述车辆系统的激活信息相匹配时,向所述控制目标装置发送与所述话语命令相对应的控制命令。
11.一种用于控制车辆的方法,所述方法包括以下步骤:
将用户的话语命令转换成文本信息;
基于所述文本信息识别与所述话语命令相对应的域和命名实体;
接收与所述域和所述命名实体相对应的信息;
基于与所述域和所述命名实体相对应的信息,更正存储在数据库中的应答文本;以及
控制扬声器以输出经更正的应答文本。
12.根据权利要求11所述的方法,其中,当所述域是导航装置并且所述命名实体是地点名称时,与所述域和所述命名实体相对应的信息包含所述命名实体的目的地设定历史信息、所述命名实体的类别信息、具有所述命名实体的地点的位置信息、所述车辆的位置信息以及当前时间信息中的至少一个。
13.根据权利要求12所述的方法,其中,基于与所述域和所述命名实体相对应的信息更正存储在所述数据库中的应答文本的步骤,包括更正存储在所述数据库中的应答文本以包含与将所述命名实体设置成目的地的时间与所述话语命令的输入时间之间的时段相关联的短语。
14.根据权利要求12所述的方法,其中,基于与所述域和所述命名实体相对应的信息更正存储在所述数据库中的应答文本的步骤,包括更正存储在所述数据库中的应答文本以包含与所述命名实体的类别信息相关联的短语。
15.根据权利要求12所述的方法,其中,当所述车辆位于距第一预设地点的预设距离内并且具有所述命名实体的地点对应于第二预设地点时,基于与所述域和所述命名实体相对应的信息更正存储在所述数据库中的应答文本的步骤包括更正存储在所述数据库中的应答文本以包含与所述第一预设地点和所述第二预设地点相对应的预设短语。
16.根据权利要求12所述的方法,其中,基于与所述域和所述命名实体相对应的信息更正存储在所述数据库中的应答文本的步骤,包括更正存储在所述数据库中的应答文本以包含与所述当前时间信息相关联的预设短语。
17.根据权利要求11所述的方法,其中,当所述域是移动通信装置并且所述命名实体是指示家庭的名称时,与所述域和所述命名实体相对应的信息包含用于修饰所述命名实体的多个修饰符的信息,并且
其中,基于与所述域和所述命名实体相对应的信息更正存储在所述数据库中的应答文本的步骤,包括更正存储在所述数据库中的应答文本以包含所述多个修饰符中的任何一个修饰符。
18.根据权利要求11所述的方法,其中,当所述域是车辆控制系统并且所述命名实体是指示控制目标装置的名称时,与所述域和所述命名实体相对应的信息包括天气信息和车辆系统的激活信息中的至少一个。
19.根据权利要求18所述的方法,其中,基于与所述域和所述命名实体相对应的信息更正存储在所述数据库中的应答文本的步骤,包括当用于操作所述控制目标装置的条件与天气信息不匹配或者所述条件与所述车辆系统的激活信息不匹配时,控制器被配置成更正应答文本以改变成包含与天气信息相关联的第一短语或与所述车辆系统的激活信息相关联的第二短语的疑问句。
20.根据权利要求18所述的方法,还包括以下步骤:
仅在操作所述控制目标装置的条件与所述天气信息相匹配或者所述条件与所述车辆系统的激活信息相匹配时,向所述控制目标装置发送与所述话语命令相对应的控制命令。
CN202111288088.8A 2020-11-03 2021-11-02 车辆及其控制方法 Pending CN114530149A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0145026 2020-11-03
KR1020200145026A KR20220059629A (ko) 2020-11-03 2020-11-03 차량 및 그의 제어방법

Publications (1)

Publication Number Publication Date
CN114530149A true CN114530149A (zh) 2022-05-24

Family

ID=81184225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111288088.8A Pending CN114530149A (zh) 2020-11-03 2021-11-02 车辆及其控制方法

Country Status (4)

Country Link
US (1) US20220139390A1 (zh)
KR (1) KR20220059629A (zh)
CN (1) CN114530149A (zh)
DE (1) DE102021212375A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240082632A (ko) 2022-12-02 2024-06-11 김소연 Ai기능이 적용된 2d 및 3d 웹툰 파츠 플랫폼

Family Cites Families (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5055939A (en) * 1987-12-15 1991-10-08 Karamon John J Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track
US5925090A (en) * 1996-08-16 1999-07-20 Alpine Electronics, Inc. Sign text display method and apparatus for vehicle navigation system
US6243683B1 (en) * 1998-12-29 2001-06-05 Intel Corporation Video control of speech recognition
US6567775B1 (en) * 2000-04-26 2003-05-20 International Business Machines Corporation Fusion of audio and video based speaker identification for multimedia information access
JP4584434B2 (ja) * 2000-10-03 2010-11-24 株式会社東海理化電機製作所 音声ガイダンス切替装置
JP4348852B2 (ja) * 2000-10-31 2009-10-21 ソニー株式会社 ナビゲーション装置
US6571169B2 (en) * 2001-03-16 2003-05-27 Alpine Electronics, Inc. Destination input method in navigation system and navigation system
JP4993648B2 (ja) * 2001-03-30 2012-08-08 アイシン・エィ・ダブリュ株式会社 経路情報配信システム
JP3902483B2 (ja) * 2002-02-13 2007-04-04 三菱電機株式会社 音声処理装置及び音声処理方法
US7472063B2 (en) * 2002-12-19 2008-12-30 Intel Corporation Audio-visual feature fusion and support vector machine useful for continuous speech recognition
US20040220705A1 (en) * 2003-03-13 2004-11-04 Otman Basir Visual classification and posture estimation of multiple vehicle occupants
US7957542B2 (en) * 2004-04-28 2011-06-07 Koninklijke Philips Electronics N.V. Adaptive beamformer, sidelobe canceller, handsfree speech communication device
AU2005292243B2 (en) * 2004-10-01 2011-03-10 Telecommunication Systems, Inc. Off board navigation solution
JP5134876B2 (ja) * 2007-07-11 2013-01-30 株式会社日立製作所 音声通信装置及び音声通信方法並びにプログラム
US20090055180A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method for optimizing speech recognition in a vehicle
JP4926916B2 (ja) * 2007-11-07 2012-05-09 キヤノン株式会社 情報処理装置、情報処理方法、およびコンピュータプログラム
US8219387B2 (en) * 2007-12-10 2012-07-10 Microsoft Corporation Identifying far-end sound
JP2011524975A (ja) * 2008-05-29 2011-09-08 トムトム インターナショナル ベスローテン フエンノートシャップ 可聴情報に関連する地図情報を変更するナビゲーション装置及び方法
KR101001846B1 (ko) * 2008-07-02 2010-12-17 팅크웨어(주) 음소거 제어 방법 및 장치
US8624962B2 (en) * 2009-02-02 2014-01-07 Ydreams—Informatica, S.A. Ydreams Systems and methods for simulating three-dimensional virtual interactions from two-dimensional camera images
CN102117221A (zh) * 2009-12-31 2011-07-06 上海博泰悦臻电子设备制造有限公司 音频应用冲突的管理方法和管理器
US8374791B2 (en) * 2010-01-27 2013-02-12 Navteq B.V. Method of operating a navigation system to provide route guidance
JP2011186351A (ja) * 2010-03-11 2011-09-22 Sony Corp 情報処理装置、および情報処理方法、並びにプログラム
US9183560B2 (en) * 2010-05-28 2015-11-10 Daniel H. Abelow Reality alternate
US9396385B2 (en) * 2010-08-26 2016-07-19 Blast Motion Inc. Integrated sensor and video motion analysis method
US8700392B1 (en) * 2010-09-10 2014-04-15 Amazon Technologies, Inc. Speech-inclusive device interfaces
US20130030811A1 (en) * 2011-07-29 2013-01-31 Panasonic Corporation Natural query interface for connected car
US10154361B2 (en) * 2011-12-22 2018-12-11 Nokia Technologies Oy Spatial audio processing apparatus
BR112014015844A8 (pt) * 2011-12-26 2017-07-04 Intel Corp determinação das entradas de áudio e visuais de ocupantes baseada em veículo
US9432633B2 (en) * 2011-12-28 2016-08-30 Pelco, Inc. Visual command processing
US8913103B1 (en) * 2012-02-01 2014-12-16 Google Inc. Method and apparatus for focus-of-attention control
US9922646B1 (en) * 2012-09-21 2018-03-20 Amazon Technologies, Inc. Identifying a location of a voice-input device
US9008641B2 (en) * 2012-12-27 2015-04-14 Intel Corporation Detecting a user-to-wireless device association in a vehicle
US9747898B2 (en) * 2013-03-15 2017-08-29 Honda Motor Co., Ltd. Interpretation of ambiguous vehicle instructions
DE102013004444A1 (de) * 2013-03-16 2014-09-18 Rainer Schader Navigationssystem
KR20140146965A (ko) * 2013-06-18 2014-12-29 삼성전자주식회사 디스플레이 장치, 서버를 포함하는 변환 시스템 및 디스플레이 장치의 제어 방법
US9680934B2 (en) * 2013-07-17 2017-06-13 Ford Global Technologies, Llc Vehicle communication channel management
US9892745B2 (en) * 2013-08-23 2018-02-13 At&T Intellectual Property I, L.P. Augmented multi-tier classifier for multi-modal voice activity detection
US20150112593A1 (en) * 2013-10-23 2015-04-23 Apple Inc. Humanized Navigation Instructions for Mapping Applications
JP6148163B2 (ja) * 2013-11-29 2017-06-14 本田技研工業株式会社 会話支援装置、会話支援装置の制御方法、及び会話支援装置のプログラム
US9582246B2 (en) * 2014-03-04 2017-02-28 Microsoft Technology Licensing, Llc Voice-command suggestions based on computer context
KR102216048B1 (ko) * 2014-05-20 2021-02-15 삼성전자주식회사 음성 명령 인식 장치 및 방법
JP6464449B2 (ja) * 2014-08-29 2019-02-06 本田技研工業株式会社 音源分離装置、及び音源分離方法
US20160061617A1 (en) * 2014-09-02 2016-03-03 Microsoft Corporation Providing in-navigation search results that reduce route disruption
US20160100092A1 (en) * 2014-10-01 2016-04-07 Fortemedia, Inc. Object tracking device and tracking method thereof
US9881610B2 (en) * 2014-11-13 2018-01-30 International Business Machines Corporation Speech recognition system adaptation based on non-acoustic attributes and face selection based on mouth motion using pixel intensities
US9741342B2 (en) * 2014-11-26 2017-08-22 Panasonic Intellectual Property Corporation Of America Method and apparatus for recognizing speech by lip reading
DE102015210430A1 (de) * 2015-06-08 2016-12-08 Robert Bosch Gmbh Verfahren zum Erkennen eines Sprachkontexts für eine Sprachsteuerung, Verfahren zum Ermitteln eines Sprachsteuersignals für eine Sprachsteuerung und Vorrichtung zum Ausführen der Verfahren
WO2017003452A1 (en) * 2015-06-30 2017-01-05 Nuance Communications, Inc. Method and apparatus for processing user input
US9764694B2 (en) * 2015-10-27 2017-09-19 Thunder Power Hong Kong Ltd. Intelligent rear-view mirror system
US9832583B2 (en) * 2015-11-10 2017-11-28 Avaya Inc. Enhancement of audio captured by multiple microphones at unspecified positions
US9973887B2 (en) * 2016-01-21 2018-05-15 Google Llc Sharing navigation data among co-located computing devices
EP3414759B1 (en) * 2016-02-10 2020-07-01 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
ES2713685T3 (es) * 2016-04-26 2019-05-23 Nokia Technologies Oy Métodos, aparatos y programas informáticos relativos a la modificación de una característica asociada a una señal de audio separada
US10089071B2 (en) * 2016-06-02 2018-10-02 Microsoft Technology Licensing, Llc Automatic audio attenuation on immersive display devices
US10152969B2 (en) * 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10482899B2 (en) * 2016-08-01 2019-11-19 Apple Inc. Coordination of beamformers for noise estimation and noise suppression
JP6631445B2 (ja) * 2016-09-09 2020-01-15 トヨタ自動車株式会社 車両用情報提示装置
US10403279B2 (en) * 2016-12-21 2019-09-03 Avnera Corporation Low-power, always-listening, voice command detection and capture
US20180190282A1 (en) * 2016-12-30 2018-07-05 Qualcomm Incorporated In-vehicle voice command control
WO2018132273A1 (en) * 2016-12-30 2018-07-19 Harman International Industries, Incorporated Voice recognition system
WO2018147687A1 (en) * 2017-02-10 2018-08-16 Samsung Electronics Co., Ltd. Method and apparatus for managing voice-based interaction in internet of things network system
US10332515B2 (en) * 2017-03-14 2019-06-25 Google Llc Query endpointing based on lip detection
JP7337699B2 (ja) * 2017-03-23 2023-09-04 ジョイソン セイフティ システムズ アクイジション エルエルシー 口の画像を入力コマンドと相互に関連付けるシステム及び方法
US20190037363A1 (en) * 2017-07-31 2019-01-31 GM Global Technology Operations LLC Vehicle based acoustic zoning system for smartphones
JP6827629B2 (ja) * 2017-08-10 2021-02-10 トヨタ自動車株式会社 情報提供装置、情報提供システム
US10374816B1 (en) * 2017-12-13 2019-08-06 Amazon Technologies, Inc. Network conference management and arbitration via voice-capturing devices
US20190237067A1 (en) * 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US20190355352A1 (en) * 2018-05-18 2019-11-21 Honda Motor Co., Ltd. Voice and conversation recognition system
US20210318125A1 (en) * 2018-06-11 2021-10-14 King Abdullah University Of Science And Technology Millimeter-wave radar-based autonomous navigation system
EP3607274B1 (en) * 2018-06-26 2021-10-06 Google LLC Interfacing between digital assistant applications and navigation applications
EP3797262A1 (en) * 2018-09-06 2021-03-31 Google LLC Navigation directions with a familiar location as an intermediate destination
US11105648B2 (en) * 2018-12-12 2021-08-31 Verizon Patent And Licensing Inc. Geospatial navigation methods and systems for automatically suspending navigational guidance provided to a user of a mobile navigation device
US10949886B2 (en) * 2019-03-12 2021-03-16 Xevo Inc. System and method for providing content to a user based on a predicted route identified from audio or images
KR102226132B1 (ko) * 2019-07-23 2021-03-09 엘지전자 주식회사 헤드셋 및 그의 구동 방법
US11789457B1 (en) * 2019-12-11 2023-10-17 Amazon Technologies, Inc. System for collision detection in autonomous mobile device
WO2021178731A1 (en) * 2020-03-04 2021-09-10 Karl Denninghoff Neurological movement detection to rapidly draw user attention to search results
US11768083B2 (en) * 2020-05-15 2023-09-26 Apple Inc. User interfaces for providing navigation directions

Also Published As

Publication number Publication date
DE102021212375A1 (de) 2022-05-05
KR20220059629A (ko) 2022-05-10
US20220139390A1 (en) 2022-05-05

Similar Documents

Publication Publication Date Title
US10380992B2 (en) Natural language generation based on user speech style
US10679620B2 (en) Speech recognition arbitration logic
KR102518543B1 (ko) 사용자의 발화 에러 보정 장치 및 그 방법
US9679557B2 (en) Computer-implemented method for automatic training of a dialogue system, and dialogue system for generating semantic annotations
US10490207B1 (en) Automated speech recognition using a dynamically adjustable listening timeout
US9202465B2 (en) Speech recognition dependent on text message content
US10255913B2 (en) Automatic speech recognition for disfluent speech
CN106816149A (zh) 车辆自动语音识别系统的优先化内容加载
JP2017097373A (ja) 音声認識処理のための方法、車載システム及び不揮発性記憶媒体
US20180074661A1 (en) Preferred emoji identification and generation
JP2009530666A (ja) 外部ユーザの自動音声認識、口述、録音および再生を提供する方法
CN109920410B (zh) 用于基于车辆的环境确定推荐的可靠性的装置和方法
CN105609109A (zh) 混合式自动语音识别
US20180075842A1 (en) Remote speech recognition at a vehicle
US20190147855A1 (en) Neural network for use in speech recognition arbitration
CN114530149A (zh) 车辆及其控制方法
US11996099B2 (en) Dialogue system, vehicle, and method of controlling dialogue system
CN111797208A (zh) 对话系统,电子设备和用于控制对话系统的方法
US20230298581A1 (en) Dialogue management method, user terminal and computer-readable recording medium
US11955123B2 (en) Speech recognition system and method of controlling the same
US20240127810A1 (en) Dialogue Management Method, Dialogue Management System, And Computer-Readable Recording Medium
KR102441066B1 (ko) 차량의 음성생성 시스템 및 방법
US11417326B2 (en) Hub-dialogue system and dialogue processing method
US20230206916A1 (en) Service management system and service management method for a vehicle
CN112349284A (zh) 通知控制系统、通知控制装置、通知控制方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination