CN106205616A - 具有语音识别功能的车辆和音箱主机、及语音识别方法 - Google Patents

具有语音识别功能的车辆和音箱主机、及语音识别方法 Download PDF

Info

Publication number
CN106205616A
CN106205616A CN201510325607.1A CN201510325607A CN106205616A CN 106205616 A CN106205616 A CN 106205616A CN 201510325607 A CN201510325607 A CN 201510325607A CN 106205616 A CN106205616 A CN 106205616A
Authority
CN
China
Prior art keywords
data
telephone book
word
vehicle
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510325607.1A
Other languages
English (en)
Other versions
CN106205616B (zh
Inventor
林奎亨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Motor Co
Original Assignee
Hyundai Motor Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyundai Motor Co filed Critical Hyundai Motor Co
Publication of CN106205616A publication Critical patent/CN106205616A/zh
Application granted granted Critical
Publication of CN106205616B publication Critical patent/CN106205616B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及具有语音识别功能的车辆和音箱主机、及语音识别方法。具有语音识别功能的车辆包括:无线通信单元,被配置为无线发送和接收数据;语音识别单元,被配置为将从特定用户输入的语音信号转换为数字信号并从数字信号提取语音数据;文本转换器,被配置为将语音数据转换为文本;以及控制单元,被配置为当与移动通信终端的无线连接被确认时请求并且从车辆中的移动通信终端接收电话簿数据,并且通过组合电话簿数据和预期将作为语音信号从用户输入的补充数据以及通过在电话簿数据和补充数据的组合中删除重复数据来生成实例数据。

Description

具有语音识别功能的车辆和音箱主机、及语音识别方法
技术领域
本公开内容的实施方式涉及具有语音识别的车辆和音箱主机(headunit)及语音识别方法。
背景技术
已开发出考虑用户方便和安全的各种车辆安全设备。具体地,音箱主机在车辆中提供多媒体服务,诸如涉及音频、视频、导航等的功能。导航功能被配置为引导驾驶员沿着一路线到达由驾驶员选择的目的地,并且提供有关目的地周围的位置的信息。同时,多媒体功能可以允许通过有线或无线通信连接到驾驶员或乘客的移动通信终端。
关于使用移动通信终端,通常为了乘客的安全而提供由语音识别功能发起的呼叫连接服务。语音识别功能涉及通过将语音转换为数据来选择与受到语音识别的命令列表具有最大相似性的宾语(object)的技术。识别性能和识别率可根据受到识别的命令的数量以及组合各种命令的方法而改变。因此,可能需要更高效地进行语音识别的处理方法。
发明内容
本公开内容的一方面提供一种具有被配置为改进语音识别率的语音识别方法的音箱主机和车辆以及用于语音识别的方法,其中语音从用户输入。本发明的另外方面部分地将在以下的说明中进行阐述,部分地将从以下说明变得明显或者可通过所公开的实施方式的实践而得知。
根据本公开内容的实施方式,一种具有语音识别功能的车辆包括:无线通信单元,被配置为无线发送和接收数据;语音识别单元,被配置为将从特定用户输入的语音信号转换为数字信号并且从数字信号中提取语音数据;文本转换器,被配置为将语音数据转换为文本;以及控制单元,被配置为在与移动通信终端的无线连接被确认时,请求并且从车辆中的移动通信终端接收电话簿数据,并且通过组合电话簿数据和预期将作为语音信号从用户输入的补充数据以及通过删除在电话簿数据和补充数据的组合中的重复数据来生成实例数据。
控制单元可以进一步被配置为删除在电话簿数据和补充数据的组合的单个组合中与另一单词具有相同功能的单词。
当语音数据为韩语时,具有相同功能的单词可以是重复单词或重复后置词。
当语音数据为英语时,具有相同功能的单词可以是重复单词或重复前置词。
控制单元可以进一步被配置为删除在电话簿数据和补充数据的组合的不同组合中的相同句子。
电话簿数据可以包括主语形式的命令,并且补充数据可以包括宾语或动词类型的命令。
控制单元可以进一步被配置为从实例数据中提取与语音数据对应的命令,并且基于所提取的命令向移动通信终端请求呼叫。
此外,根据本公开内容的实施方式,一种具有语音识别功能的音箱主机包括:无线通信单元,被配置为无线发送和接收数据;语音识别单元,被配置为将从特定用户输入的语音信号转换为数字信号并且从数字信号中提取语音数据;文本转换器,被配置为将语音数据转换为文本;以及控制单元,被配置为在与移动通信终端的无线连接被确认时请求并且从车辆中的移动通信终端接收电话簿数据,并且通过组合电话簿数据和预期将作为语音信号从用户输入的补充数据并且通过删除在电话簿数据和补充数据的组合中的重复数据来生成实例数据。
控制单元可以进一步被配置为删除在电话簿数据和补充数据的组合的单个组合中与另一单词具有相同功能的单词。
当语音数据为韩语时,具有相同功能的单词可以是重复单词或重复后置词。
当语音数据为英语时,具有相同功能的单词可以是重复单词或重复前置词。
控制单元可以进一步被配置为删除在电话簿数据和补充数据的组合的不同组合中的相同句子。
此外,根据本公开内容的实施方式,一种语音识别方法包括:当车辆无线连接到移动通信终端时,请求或从车辆中的移动通信终端接收电话簿数据;组合电话簿数据和预期将作为语音信号从用户输入的补充数据;以及通过删除在电话簿数据和补充数据的组合中的重复数据来生成实例数据。
生成实例数据可包括删除在电话簿数据和补充数据的组合的单个组合中与另一单词具有相同功能的单词。
当语音数据为韩语时,具有相同功能的单词可以是重复单词或重复后置词。
当语音数据为英语时,具有相同功能的单词可以是重复单词或重复前置词。
生成实例数据可包括删除在电话簿数据和补充数据的组合的不同组合中的相同句子。
电话簿数据可包括主语形式的命令,并且补充数据可以包括宾语或动词类型的命令。
语音识别方法可以进一步包括在生成实例数据之后,将从用户输入的语音信号转换为数字信号;从数字信号中提取语音数据;将所提取的语音数据转换为文本;以及从实例数据中提取与语音数据对应的命令。
语音识别方法可以进一步包括基于所提取的命令向移动通信终端请求呼叫。
附图说明
通过以下结合附图进行的实施方式的说明,本发明的这些和/或其他方面将变得显然且更容易理解,在附图中:
图1是示出在车辆中提供语音识别服务的组件之间的关系的示图;
图2是详细地示出车辆的构造的框图;
图3是示出图2的控制单元的构造的框图;
图4至图7是示出了根据本公开内容的实施方式的生成实例数据方法的示图;
图8和图9是示出了根据本公开内容的实施方式的生成实例数据方法的示图;
图10是示出了车辆中的语音识别方法的示图;
图11是详细地示出了音箱主机的构造的框图;以及
图12是示出语音识别方法的流程图。
具体实施方式
现在将参考附图更全面地描述本公开内容,在附图中示出了本公开内容的实施方式。然而,本公开内容可体现为不同的形式,并且不应被解释为局限于本文所阐述的实施方式。相反,提供这些实施方式从而使本公开内容变得详尽和完整,并且将向本领域技术人员充分地传达本公开内容的构思。图中的相同参考标号指代相同元件,并且因此将省略它们的描述。在本公开内容的说明中,如果确定涉及本公开内容的实施方式的常用的技术或结构的详细描述可能使本文中的主题晦涩,则将省略其详细描述。应理解,尽管术语第一、第二、第三等在本文中可用于描述各种元件、组件、区域、层和/或部分,但这些元件、组件、区域、层和/或部分不应被这些术语所限定。这些术语仅用于将一个元件、组件、区域、层或部分与另一个区域、层或部分区分开。
本文所使用的措辞仅是出于描述特定实施方式的目的,而并非旨在限制本公开内容。除非在上下文中另有明确规定,否则在本文中使用的单数形式“一(a)”、“一个(an)”以及“该(the)”也旨在包括复数形式。要进一步理解的是,术语“包括(comprises)”和/或“包含(comprising)”在本说明书中使用时,是指存在所述特征、整体、步骤、操作、元件和/或组件,但是不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组。在本文中使用的术语“和/或”包括一个或多个相关列出项的任何和所有组合。
应当理解,本文中所使用的术语“车辆(vehicle)”或“车辆的(vehicular)”或其他类似术语包括广义的机动车辆,诸如包括运动型多用途车辆(SUV)、公共汽车、卡车、各种商用车辆的载客车辆;包括各种小船、海船的船只;航天器等;并且包括混合动力车辆、电动车辆、插电混合动力车辆、氢动力车辆和其他替代燃料车辆(例如,燃料来源于非汽油能源),如本文所指的,混合动力车辆是具有两种或更多动力源的车辆,例如汽油动力和电动车辆。
此外,应当理解的是,可以通过至少一个控制单元执行一个或多个以下方法或其方面。术语“控制单元”可以指包括存储器和处理器的硬件设备。存储器被配置为存储程序指令,而处理器具体地被编程为执行程序指令以执行在下文进一步描述的一个或多个处理。另外,如将由本领域的普通技术人员所理解的,应该理解的是,下文的方法可通过包括控制单元的装置结合一个或多个其他组件来执行。
现在参考本公开内容的实施方式,图1是示出在车辆中提供语音识别服务的组件之间的关系的示图。如图1所示,当具有移动通信终端200的乘客乘坐车辆100时,具有语音识别功能的车辆100可以通过无线通信连接到移动通信终端200而请求电话簿数据。
车辆100可以从移动通信终端200下载电话簿数据,并且除了电话簿数据之外,车辆100可以通过组合电话簿数据和预期作为语音信号从用户输入的补充数据来生成具有预期作为语音命令而从用户输入的可能性的实例数据。为此,车辆100可以从电话簿数据和补充数据的组合中删除组合中具有相同功能的单词(word,词),或者可以从电话簿数据和补充数据的组合中删除各种组合中的相同句子。因此,可以充分地减少实例数据。车辆100也可以通过基于从用户输入的语音数据从实例数据提取命令来执行呼叫服务。
移动通信终端200可以包括移动电话、个人数字助理(PDA)、智能电话、或其他具有移动通信功能的各种便携式终端。移动通信终端200可以具有唯一的标识,诸如MAC地址或蓝牙设备地址(BD地址),并且当操作音箱主机时,该唯一标识可被用于用户认证。
图2是详细地示出车辆的构造的框图,以及图3是示出图2的控制单元的构造的框图。如图2所示,具有语音识别功能的车辆100可包括无线通信单元110、输入单元120、存储单元130、语音识别单元140、文本转换器150、显示单元160以及控制单元170。
无线通信单元110可以被配置为发送/接收无线数据。无线通信单元110可以通过无线通信连接到在车辆100中放置的移动通信终端200。具体地,为了安全,可以通过用户标识来注册移动通信终端200,但不限于此。
输入单元120可以被配置为输入用于车辆100的各种控制信息,并且可以接收启动和终止音箱主机的信息、音箱主机中的操作服务的选择信息。当显示单元160设有触摸识别功能时,可以通过显示单元160输入控制信息。此外,可以通过单独设置的按钮输入控制信息。
音箱主机可以被配置为提供各种多媒体服务,包括车辆100中的导航功能。例如,为了车辆100的驾驶员的方便起见,音箱主机可以在车辆100中提供与例如音频、视频和导航有关的多媒体服务。音箱主机可以通过无线通信连接到车辆100中的乘客的移动通信终端来提供多媒体服务。
存储单元130可以存储预期通过语音信号从用户输入的补充数据、实例数据和与车辆100有关的各种数据。语音识别单元140可以将从用户输入的语音信号转换为数字信号,并且可以从数字信号中提取语音数据。虽然未示出,但是车辆100可以设置有麦克风以从用户输入语音。
此外,语音识别单元140可以将所提取的语音数据发送至文本转换器150。文本转换器150可以将语音数据转换为文本。
显示单元160可以被配置为显示与车辆100有关的各种信息。例如,显示单元160可以输出关于路线的引导信息(导航功能)、根据音频或视频系统的操作的音乐和图像的名称、或者与车辆100的操作有关的各种消息。
控制单元170在确认已连接到无线通信时,可以向移动通信终端200请求电话簿数据或者从移动通信终端200接收电话簿数据,并且可以通过组合所接收的电话簿数据和预期作为语音信号的形式从用户输入的补充数据来生成实例数据。控制单元170可以通过从电话簿数据和补充数据的组合删除重复数据而生成实例数据。具体地,控制单元170可包括电话簿数据接收器171、实例数据生成器173、数据提取器175以及服务处理器177。
当在无线通信单元110从车辆100内部的移动通信终端200无线接收信息时,电话簿数据接收器171可以发送一信号以从移动通信终端200请求电话簿数据。电话簿数据接收器171可以下载从移动通信终端200发送的电话簿数据。这时,显示单元160可以显示该电话簿数据正被下载,但不限于此。可以省去显示该电话簿数据正被下载。
电话簿数据可以包括联系人,诸如姓名、别名、地名、地点别名等以将联系人信息和电话号码进行区分,但不限于此。根据本公开内容的实施方式,用于生成实例数据的电话簿数据可以是联系人姓名。
实例数据生成器173可以通过组合所接收的电话簿数据和预期作为语音信号的形式从用户输入的补充数据来生成实例数据。实例数据生成器173也可以从电话簿数据和补充数据的组合中删除重复数据。具体地,实例数据生成器173可以从电话簿数据和补充数据的组合删除单个组合中具有相同功能的单词,或可以从电话簿数据和补充数据的组合删除彼此不同的组合中的相同句子。实例数据生成器173也可以通过基于后置词将与宾语和动词对应的命令分开来生成数据。在韩语的情况下,可能的是,各种前缀和后缀被加入相同的名词或动词。当生成实例数据时,加入各个宾语和动词的相同后置词可能重复出现,并且因此相同的后置词可能是无效数据。有效数据实际上可能不被使用,但是当识别语音时可能被比较。因此,无效数据可能引起误识别或降低语音识别率。因此,当生成实例数据时,可以通过删除重复的后置词来尽可能减少所生成的数据的量,从而可以改善识别率。
在下文中,将参考图4至图7、图8和图9以及图10描述实施方式,图4至图7示出了根据本公开内容的实施方式的生成实例数据方法,图8和图9示出了根据本公开内容的另一个实施方式的生成实例数据方法,图10示出了车辆中的语音识别方法。
如图4所示,电话簿数据可包括主语形式的命令,并且补充数据可包括宾语或动词形式的命令,但不限于此。例如,电话簿数据可以是联系人姓名,诸如Hong gil dong(洪吉童)和Lee sun sin(李舜臣),在补充数据中的宾语可以是“to home”、“home”(住宅),并且在补充数据中的动词可以是“call”、“to call”(呼叫)。除了电话簿数据之外,补充数据也可以是预期在识别语音时由用户告知的并且可以预先存储在存储单元130中的文本。具体地,实例数据生成器173可以组合电话簿数据和补充数据。
如图5所示,通过组合两个电话簿数据(例如,Hong gil dong、Lee sunsin)、三个补充数据中的宾语(例如,home、to home、for home)以及三个补充数据中的动词(例如,call、to call、for call)总共可生成电话簿数据和补充数据的十八个组合。因为用户对呼叫这同一动作而使用的命令可能是各种各样的,诸如“call to home”、“call home(呼叫住宅)”,所以设定数个宾语和数个动词。
如图6所示,两个电话簿数据、三个补充数据中的宾语和三个补充数据中的动词组合的结果可以生成诸如“call Hong gil dong home”的有效生成数据,可以生成诸如“call to Hong gil dong home”的无效数据,或者可以生成有效重复数据。无效数据和有效重复数据可能是在与从用户输入的语音数据进行比较时延迟了命令提取时间的原因。因此,实例数据生成器173可以删除电话簿数据和补充数据的组合中的单个组合中具有相同功能的单词(word)。实例数据生成器173可以在电话簿数据和补充数据的组合中删除不同组合中的相同句子。如果语音数据是韩语,则具有相同功能的单词可能是重复的单词、或重复的后置词,但不限于此。
参考图6,实例数据生成器173可以通过删除在电话簿数据和补充数据的组合(例如,“call at Hong gil dong home”、“call at at Hong gil donghome”、“call at to Hong gil dong home”、“call Hong gil dong home”、“callat Hong gil dong home”、“call to Hong gil dong home”、“call to Hong gildong home”、“call to at Hong gil dong home”、“call to to Hong gil donghome”、“call at Lee sun sin home”、“call at at Lee sun sin home”、“call atto Lee sun sin home”、“call Lee sun sin home”、“call at Lee sun sin home”、“call to Lee sun sin home”、“call to Lee sun sin home”、“call to at Lee sunsin home”、“call to to Lee sun sin home”等)中重复的后置词(例如,to to、to at、at to、at at等)或重复句子而生成实例数据(例如,“call Hong gil donghome”、“call to Hong gil dong home”、“call at Hong gil dong home”、“callLee sun sin home”、“call to Lee sun sin home”、“call at Lee sun sin home”等)。当电话簿数据包括宾语以及姓名时,实例数据生成器173可以通过删除重复的单词来防止实例数据中的宾语重复。
参考图7,实例数据生成器173可以通过删除电话簿数据(例如,Honggil dong home等)和补充数据中的宾语(例如,at home、home、to home等)以及补充数据中的动词(例如,call、call at、call to等)的组合(“callat Hong gil dong home”、“call at at Hong gil dong home”、“call at to Honggil dong home”、“call Hong gil dong home”、“call at Hong gil dong home”、“call to Hong gil dong home”、“call to Hong gil dong home”、“call to atHong gil dong home”、“call to to Hong gil dong home”等)中重复的后置词或重复句子而生成实例数据(例如,“call Hong gil dong home”、“call toHong gil dong home”、“call at Hong gil dong home”等)。当语音数据是英语时,具有相同功能的单词可以是重复单词或重复前置词,但不限于此。
如图8所示,实例数据生成器173可以删除在电话簿数据和补充数据的组合(例如,“Call smith Home home”、“Call smith to Home home”、“Call to smith Home home”、“Call to smith to Home home”等)中重复的前置词。可以由用户根据英语语法来设定重复前置词中删除的前置词。
如图9所示,实例数据生成器173可以删除在电话簿数据(例如,Smith home等)、补充数据中的宾语(例如,“home”、“to home”等)以及补充数据中的动词(例如,“call”、“call to”等)的组合(例如,“Call smithHome home”、“Call smith to Home home”、“Call to smith Home home”、“Call to smith to Home home”等)中的重复单词。如上所述,可以显著地降低实例数据的数量,使得可以降低将语音数据与实例数据进行比较的时间周期。因此,可以迅速地提取命令。数据提取器175可以从实例数据提取与语音数据对应的实例数据作为命令。服务处理器177可以基于所提取的命令向移动通信终端200请求连接呼叫。
例如,如图10所示,车辆100可以在显示单元160上以文本或语音输出引导消息,诸如“语音识别准备就绪”。当用户输入诸如“call to Honggil dong home(呼叫洪吉童住宅)”的语音时,车辆100可以提取与实例数据对应的命令并且可以使用移动通信终端200尝试进行呼叫。
图11详细地示出了音箱主机的构造的框图。在下文中将省略与在图2中示出的那些部件相同的部件的描述。
如图11所示,具有语音识别功能的音箱主机300可以被配置为在车辆100中提供包括导航功能的多媒体服务。音箱主机300可包括无线通信单元310、输入单元320、存储单元330、语音识别单元340、文本转换器350、显示单元360以及控制单元370。
例如,为了车辆100的驾驶员的方便起见,音箱主机300可以在车辆100中提供多媒体服务,诸如汽车音频功能、视频功能和导航功能。此外,音箱主机300可以通过使用无线通信连接到车辆100中的用户的移动通信终端来提供服务。
无线通信单元310可被配置为无线接收/发送无线数据。无线通信单元310可以通过无线通信连接到在车辆100中放置的移动通信终端200。无线通信单元310可以连接到为了安全而通过用户标识注册的移动通信终端200,但不限于此。
输入单元320可以被配置为输入用于音箱主机300的各种控制信息,并且可以接收启动和终止音箱主机的信息、音箱主机中的操作服务的选择信息。当显示单元360设有触摸识别功能时,可以通过显示单元360输入控制信息。此外,可以通过单独设置的按钮输入控制信息。
存储单元330可以存储预期通过语音信号从用户输入的补充数据、实例数据和与音箱主机300有关的各种数据。语音识别单元340可以将从用户输入的语音信号转换为数字信号,并且可以从数字信号中提取语音数据。语音识别单元340可以将所提取的语音数据发送至文本转换器350。文本转换器350可以将语音数据转换为文本。
显示单元360可以被配置为显示与音箱主机300有关的各种信息。例如,显示单元360可以输出关于路线的引导信息(导航功能)、根据音频或视频系统的操作的音乐的名称、或者与音箱主机300的操作有关的各种消息。
当确认已连接到无线通信时,控制单元370可以向移动通信终端200请求电话簿数据或者从移动通信终端接收电话簿数据,并且可以通过组合所接收的电话簿数据和预期作为语音信号的形式从用户输入的补充数据来生成实例数据。控制单元370可以通过从电话簿数据和补充数据的组合删除重复数据而生成实例数据。控制单元370可以删除在电话簿数据和补充数据的组合中具有相同功能的单词。
例如,当语音数据是韩语时,具有相同功能的单词可能是重复单词或重复后置词,当语音数据是英语时,具有相同功能的单词可能是重复单词或重复前置词。控制单元370可以删除电话簿数据和补充数据的不同组合中的相同句子。
图12示出了语音识别方法的流程图。如图12所示,当通过无线通信连接到移动通信终端200时,车辆100可以向移动通信终端200请求电话簿数据或者从移动通信终端200接收电话簿数据(S101)。电话簿数据可以是主语形式的命令。车辆100可以组合电话簿数据和预期将作为语音信号从用户输入的补充数据(S103)。补充数据可以是宾语和动词形式的命令。车辆100也可以通过删除在电话簿数据和补充数据的组合中重复的数据而生成实例数据(S105)。
这时,车辆100可以删除在电话簿数据和补充数据的单个组合中具有相同功能的单词。例如,车辆100可以删除重复的后置词,诸如在句子“callat at Hong gil dong home”中的“at”。当语音数据是韩语时,具有相同功能的单词可能是重复的单词或重复的后置词。当语音数据是英语时,具有相同功能的单词可能是重复的单词或重复的前置词。车辆100可以删除电话簿数据和补充数据的不同组合中的相同句子。例如,当生成重复的句子时,诸如“call to Hong gil dong home”和“call to Hong gil dong home”,车辆100可以删除他们中任一个并且可以降低实例数据的数量。
此外,车辆100可以将从用户输入的语音信号转换为数字信号(S107)。具体地,在生成实例数据完成之后,车辆100准备识别语音的情况下,如图10所示,车辆100可以输出诸如“语音识别准备就绪”的消息。车辆100可以通过麦克风(未示出)从用户接收语音。车辆100可以从数字信号中提取语音数据(S109),并且车辆100可以将所提取的语音数据转换为文本(S111)。
车辆100可以从实例数据中提取命令(S113),其中,命令/实例数据与被转换为文本的语音数据对应。这时,与实例数据对应的语音数据可能是在多个实例数据之中与语音数据最匹配的实例。然后,车辆100可以基于所提取的命令向移动通信终端200请求呼叫(S115)。
当执行音箱主机的各种服务时,以及当请求通过使用车辆中的移动通信终端呼叫时可以执行上述语音识别方法。作为通过以上描述显然的是,根据所提出的具有语音识别的音箱主机和车辆及其语音识别方法,当基于移动通信终端的电话簿数据生成用于与从用户输入的语音数据进行比较的实例数据时,可以删除重复的数据。因此,可以优化实例数据的数量,使得可以改善语音识别率。
虽然以上已经示出并且描述了本公开内容的实施方式,但是本领域技术人员应当认识到,在不背离本公开内容的原理和精神的前提下,可以对这些实施方式做出改变,而本发明的范围在权利要求及其等同物中限定。

Claims (20)

1.一种具有语音识别功能的车辆,包括:
无线通信单元,被配置为无线发送和接收数据;
语音识别单元,被配置为将从特定用户输入的语音信号转换为数字信号并且从所述数字信号提取语音数据;
文本转换器,被配置为将所述语音数据转换为文本;以及
控制单元,被配置为在与移动通信终端的无线连接被确认时请求并且从所述车辆中的所述移动通信终端接收电话簿数据,并且通过组合所述电话簿数据与预期将作为语音信号从用户输入的补充数据以及通过删除所述电话簿数据和所述补充数据的组合中的重复数据来生成实例数据。
2.根据权利要求1所述的车辆,其中:
所述控制单元进一步被配置为删除与所述电话簿数据和所述补充数据的所述组合的单个组合中的另一单词具有相同功能的单词。
3.根据权利要求2所述的车辆,其中:
当所述语音数据为韩语时,所述具有相同功能的单词是重复单词或重复后置词。
4.根据权利要求2所述的车辆,其中:
当所述语音数据为英语时,所述具有相同功能的单词是重复单词或重复前置词。
5.根据权利要求1所述的车辆,其中:
所述控制单元进一步被配置为删除所述电话簿数据和所述补充数据的所述组合的不同组合中的相同句子。
6.根据权利要求1所述的车辆,其中:
所述电话簿数据包括主语形式的命令,并且
所述补充数据包括宾语或动词形式的命令。
7.根据权利要求1所述的车辆,其中:
所述控制单元进一步被配置为从所述实例数据提取与所述语音数据对应的命令,并且基于所提取的命令向所述移动通信终端请求呼叫。
8.一种具有语音识别功能的音箱主机,包括:
无线通信单元,被配置为无线发送和接收数据;
语音识别单元,被配置为将从特定用户输入的语音信号转换为数字信号并且从所述数字信号提取语音数据;
文本转换器,被配置为将所述语音数据转换为文本;以及
控制单元,被配置为在与移动通信终端的无线连接被确认时请求并且从车辆中的所述移动通信终端接收电话簿数据,并且通过组合所述电话簿数据与预期将作为语音信号从用户输入的补充数据以及通过删除所述电话簿数据和所述补充数据的组合中的重复数据来生成实例数据。
9.根据权利要求8所述的音箱主机,其中:
所述控制单元进一步被配置为删除与所述电话簿数据和所述补充数据的所述组合的单个组合中的另一单词具有相同功能的单词。
10.根据权利要求9所述的音箱主机,其中:
当所述语音数据为韩语时,所述具有相同功能的单词是重复单词或重复后置词。
11.根据权利要求9所述的音箱主机,其中:
当所述语音数据为英语时,所述具有相同功能的单词是重复单词或重复前置词。
12.根据权利要求8所述的音箱主机,其中:
所述控制单元进一步被配置为删除所述电话簿数据和所述补充数据的所述组合的不同组合中的相同句子。
13.一种语音识别方法,包括以下步骤:
当车辆无线连接到移动通信终端时,请求或者从所述车辆中的所述移动通信终端接收电话簿数据;
组合所述电话簿数据和预期将作为语音信号从用户输入的补充数据;以及
通过删除所述电话簿数据和所述补充数据的组合中的重复数据来生成实例数据。
14.根据权利要求13所述的语音识别方法,其中,生成所述实例数据包括:
删除与所述电话簿数据和所述补充数据的所述组合的单个组合中的另一单词具有相同功能的单词。
15.根据权利要求14所述的语音识别方法,其中:
当所述语音数据为韩语时,所述具有相同功能的单词是重复单词或重复后置词。
16.根据权利要求14所述的语音识别方法,其中:
当所述语音数据为英语时,所述具有相同功能的单词是重复单词或重复前置词。
17.根据权利要求13所述的语音识别方法,其中,生成所述实例数据包括:
删除所述电话簿数据和所述补充数据的所述组合的不同组合中的相同句子。
18.根据权利要求13所述的语音识别方法,其中:
所述电话簿数据包括主语形式的命令,并且
所述补充数据包括宾语或动词形式的命令。
19.根据权利要求13所述的语音识别方法,进一步包括以下步骤:
在生成所述实例数据之后,将从用户输入的语音信号转换为数字信号;
从所述数字信号提取语音数据;
将所提取的语音数据转换为文本;以及
从所述实例数据中提取与所述语音数据对应的命令。
20.根据权利要求19所述的语音识别方法,进一步包括:
基于所提取的命令向所述移动通信终端请求呼叫。
CN201510325607.1A 2014-11-05 2015-06-12 具有语音识别功能的车辆和音箱主机、及语音识别方法 Active CN106205616B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020140152563A KR101594835B1 (ko) 2014-11-05 2014-11-05 음성인식 기능을 갖는 차량 및 헤드유닛과 이를 위한 음성 인식방법
KR10-2014-0152563 2014-11-05

Publications (2)

Publication Number Publication Date
CN106205616A true CN106205616A (zh) 2016-12-07
CN106205616B CN106205616B (zh) 2021-04-27

Family

ID=55457773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510325607.1A Active CN106205616B (zh) 2014-11-05 2015-06-12 具有语音识别功能的车辆和音箱主机、及语音识别方法

Country Status (3)

Country Link
US (1) US20160125878A1 (zh)
KR (1) KR101594835B1 (zh)
CN (1) CN106205616B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046045A (zh) * 2019-04-03 2019-07-23 百度在线网络技术(北京)有限公司 语音唤醒的数据包处理方法和装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9837081B2 (en) * 2014-12-30 2017-12-05 Microsoft Technology Licensing, Llc Discovering capabilities of third-party voice-enabled resources
KR102371188B1 (ko) * 2015-06-30 2022-03-04 삼성전자주식회사 음성 인식 장치 및 방법과 전자 장치
KR102518543B1 (ko) * 2017-12-07 2023-04-07 현대자동차주식회사 사용자의 발화 에러 보정 장치 및 그 방법
CN110418245B (zh) * 2018-04-28 2021-03-19 深圳市冠旭电子股份有限公司 一种降低蓝牙音箱反应延迟的方法、装置及终端设备
JP7465700B2 (ja) * 2020-03-27 2024-04-11 株式会社デンソーテン 車載装置および車載装置における音声処理方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050143134A1 (en) * 2003-12-30 2005-06-30 Lear Corporation Vehicular, hands-free telephone system
US6934675B2 (en) * 2001-06-14 2005-08-23 Stephen C. Glinski Methods and systems for enabling speech-based internet searches
US20070100602A1 (en) * 2003-06-17 2007-05-03 Sunhee Kim Method of generating an exceptional pronunciation dictionary for automatic korean pronunciation generator
CN101129056A (zh) * 2005-01-07 2008-02-20 约翰逊控制技术公司 用于在车内从无线电话中获取并处理电话簿信息的免提系统和方法
CN101253547A (zh) * 2005-04-29 2008-08-27 摩托罗拉公司 语音对话方法和系统
US20090313016A1 (en) * 2008-06-13 2009-12-17 Robert Bosch Gmbh System and Method for Detecting Repeated Patterns in Dialog Systems
CN201892945U (zh) * 2010-05-19 2011-07-06 朱万政 智能电子服务员
CN103077715A (zh) * 2011-09-20 2013-05-01 苹果公司 合并语音辨识结果
CN103187058A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 车内语音对话系统
US20130332460A1 (en) * 2012-06-06 2013-12-12 Derek Edwin Pappas Structured and Social Data Aggregator
CN103544952A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 语音自适应方法、装置及系统
CN104106113A (zh) * 2012-02-16 2014-10-15 大陆汽车有限责任公司 用于使数据列表语音化的方法与语音控制的用户界面
CN104123936A (zh) * 2013-04-25 2014-10-29 伊莱比特汽车公司 对话系统自动训练方法、对话系统及用于车辆的控制装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101318674B1 (ko) * 2011-08-01 2013-10-16 한국전자통신연구원 엔그램을 이용한 단어 의미 인식 장치
JP2014086808A (ja) * 2012-10-22 2014-05-12 Alpine Electronics Inc 車載システム

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934675B2 (en) * 2001-06-14 2005-08-23 Stephen C. Glinski Methods and systems for enabling speech-based internet searches
US20070100602A1 (en) * 2003-06-17 2007-05-03 Sunhee Kim Method of generating an exceptional pronunciation dictionary for automatic korean pronunciation generator
US20050143134A1 (en) * 2003-12-30 2005-06-30 Lear Corporation Vehicular, hands-free telephone system
CN101129056A (zh) * 2005-01-07 2008-02-20 约翰逊控制技术公司 用于在车内从无线电话中获取并处理电话簿信息的免提系统和方法
CN101253547A (zh) * 2005-04-29 2008-08-27 摩托罗拉公司 语音对话方法和系统
US20090313016A1 (en) * 2008-06-13 2009-12-17 Robert Bosch Gmbh System and Method for Detecting Repeated Patterns in Dialog Systems
CN201892945U (zh) * 2010-05-19 2011-07-06 朱万政 智能电子服务员
CN103077715A (zh) * 2011-09-20 2013-05-01 苹果公司 合并语音辨识结果
CN103187058A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 车内语音对话系统
CN104106113A (zh) * 2012-02-16 2014-10-15 大陆汽车有限责任公司 用于使数据列表语音化的方法与语音控制的用户界面
US20130332460A1 (en) * 2012-06-06 2013-12-12 Derek Edwin Pappas Structured and Social Data Aggregator
CN103544952A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 语音自适应方法、装置及系统
CN104123936A (zh) * 2013-04-25 2014-10-29 伊莱比特汽车公司 对话系统自动训练方法、对话系统及用于车辆的控制装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KRIS DEMUYNCK等: ""Integrating meta-information into exemplar-based speech recognition with segmental conditional random fields"", 《 2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 *
王玺源: "" 基于HMM语音识别算法和IOS平台的移动客户端实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046045A (zh) * 2019-04-03 2019-07-23 百度在线网络技术(北京)有限公司 语音唤醒的数据包处理方法和装置

Also Published As

Publication number Publication date
US20160125878A1 (en) 2016-05-05
KR101594835B1 (ko) 2016-02-17
CN106205616B (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
CN106205616A (zh) 具有语音识别功能的车辆和音箱主机、及语音识别方法
US7158871B1 (en) Handwritten and voice control of vehicle components
JP6585154B2 (ja) 単一音響モデルと自動アクセント検出を用いたテキスト規則ベースの複数アクセントの音声認識
KR102249392B1 (ko) 사용자 맞춤형 서비스를 위한 차량 기기 제어 장치 및 방법
US9420431B2 (en) Vehicle telematics communication for providing hands-free wireless communication
CN103853703B (zh) 一种信息处理方法及电子设备
US20130117021A1 (en) Message and vehicle interface integration system and method
KR101664080B1 (ko) 음성 다이얼링 시스템 및 방법
CN101576901B (zh) 搜索请求的产生方法
CN109903770A (zh) 用于校正用户的话语错误的装置及其方法
US20150056951A1 (en) Vehicle telematics unit and method of operating the same
CN104575499B (zh) 移动终端的声控方法及移动终端
CN104978015A (zh) 具有语种自适用功能的导航系统及其控制方法
CN106991106A (zh) 减少由切换输入模态所引起的延迟
CN105426357A (zh) 语音快速选择方法
CN107808667A (zh) 声音识别装置以及声音识别方法
CN104144192A (zh) 语音交互方法、装置及车载通讯终端
CN104106113A (zh) 用于使数据列表语音化的方法与语音控制的用户界面
CN103838713A (zh) 一种基于正则表达式的语义分析方法
CN110019740A (zh) 车载终端的交互方法、车载终端、服务器和存储介质
CN105987707B (zh) 将导航目标数据输入到导航系统中
CN110767219A (zh) 语义更新方法、装置、服务器和存储介质
CN103559242A (zh) 语音输入信息的方法及终端设备
CN109889998A (zh) 发送文字信息的方法和装置、系统、车辆及可读存储介质
CN102883016A (zh) 车载消息传递

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant