CN113535308A - 语言调整方法、装置、电子设备及介质 - Google Patents

语言调整方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN113535308A
CN113535308A CN202110850157.3A CN202110850157A CN113535308A CN 113535308 A CN113535308 A CN 113535308A CN 202110850157 A CN202110850157 A CN 202110850157A CN 113535308 A CN113535308 A CN 113535308A
Authority
CN
China
Prior art keywords
language
information
target
voice information
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110850157.3A
Other languages
English (en)
Inventor
刘新
严丽玲
金武超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Launch Technology Co Ltd
Original Assignee
Shenzhen Launch Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Launch Technology Co Ltd filed Critical Shenzhen Launch Technology Co Ltd
Priority to CN202110850157.3A priority Critical patent/CN113535308A/zh
Publication of CN113535308A publication Critical patent/CN113535308A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Navigation (AREA)

Abstract

本申请适用于计算机技术领域,提供了语言调整方法,包括:获取目标车辆内的语音信息;根据语音信息确定语音信息的来源位置,其中,来源位置为目标车辆中的座位位置;根据座位位置确定对应的目标设备;判断语音信息是否与目标设备的语言信息匹配;若不匹配,则根据语音信息调整目标设备的语言信息。本申请可以自动调整目标设备的语言,有助于提高对提供语音服务的设备的语言进行调整的效率。

Description

语言调整方法、装置、电子设备及介质
技术领域
本申请属于计算机技术领域,尤其涉及一种语言调整方法、装置、电子设备及介质。
背景技术
随着社会的发展,人们生活水平的提高,车辆越来越成为人们出行的重要交通工具,车辆的功能也越来越多,越来越智能。实际应用中,提供语音服务的设备,如车辆的导航或者其他车载设备,通常设置有多语言系统,该设备可以采用多种类型的语言,比如普通话、英语等,为用户提供语音服务。实际应用中,用户可以根据需求,事先手动为提供语音服务的设备选取某一种语言作为工作语言,这样,提供语音服务的设备可以采用所选取的语言为用户提供语音服务。
由于事先手动调整语言的方式不够灵活,因此,相关技术中,需要提高对提供语音服务的设备的语言进行调整的效率。
发明内容
本申请实施例提供了语言调整方法、装置、电子设备及介质,旨在解决相关技术中对提供语音服务的设备的语言进行调整的效率不够高的问题。
第一方面,本申请实施例提供了一种语言调整方法,该方法包括:
获取目标车辆内的语音信息;
根据语音信息确定语音信息的来源位置,其中,来源位置为目标车辆中的座位位置;
根据座位位置确定对应的目标设备;
判断语音信息是否与目标设备的语言信息匹配;
若不匹配,则根据语音信息调整目标设备的语言信息。
进一步地,获取目标车辆内的语音信息,包括:
响应于检测到目标车辆中增加落座人员,获取落座人员的语音信息。
进一步地,在判断语音信息是否与目标设备的语言信息匹配之前,还包括:
根据至少两种语音信息建立语言数据库,语言数据库包括语言类型,语言类型包括地方语言类型、国际语言类型。
进一步地,判断语音信息是否与目标设备的语言信息匹配,包括:
根据语音信息的特征,在语言数据库中确定语音信息对应的语言类型;
根据语音信息的特征及对应的语言类型,确定目标语言;
判断所确定的目标语言是否与目标设备的当前语言一致;
若一致,则确定语音信息与目标设备的语言信息匹配。
进一步地,方法还包括:
若目标车辆内存在至少两种不同语言的语音信息进行交互,则将获取到的、与目标设备对应语言不同的交互语音信息,转换为与目标设备对应语言相同的语音信息,以及控制目标设备输出转换后的交互语音信息。
进一步地,方法还包括:
响应于检测到目标车辆中增加落座人员且获取不到落座人员的语音信息,通过以下任意一项或多项确定落座人员的目标语言:
获取目标车辆的当前所处位置信息,将当前所处位置信息指示的位置处的常用语言信息,确定为落座人员的目标语言;
将落座人员的落座位置对应的上一语言信息,确定为落座人员的目标语言;
获取落座人员的人脸图像,识别人脸图像中呈现的人物,将预先存储的该人物的语言信息,确定为落座人员的目标语言。
进一步地,在若不匹配,则根据语音信息调整目标设备的语言信息之后,还包括:
控制目标设备输出调整后的语言信息。
第二方面,本申请实施例提供了一种语言调整装置,该装置包括:
信息获取单元,用于获取目标车辆内的语音信息;
信息确定单元,用于根据语音信息确定语音信息的来源位置,其中,来源位置为目标车辆中的座位位置;
设备确定单元,用于根据座位位置确定对应的目标设备;
信息判断单元,用于判断语音信息是否与目标设备的语言信息匹配;
信息调整单元,用于若不匹配,则根据语音信息调整目标设备的语言信息。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述语言调整方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现上述语言调整方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面中任一项的语言调整方法。
本申请实施例与相关技术相比存在的有益效果是:在获取到目标车辆内的语音信息时,自动识别语音信息的来源位置及来源位置对应的目标设备,在语音信息与目标设备的语言信息不匹配时,自动采用语音信息对应的语言,对目标设备的语言信息进行调整,可以自动调整目标设备的语言,有助于提高对提供语音服务的设备的语言进行调整的效率。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的语言调整方法应用的系统架构图;
图2是本申请一实施例提供的语言调整方法的流程示意图;
图3是本申请一实施例提供的语言调整装置的结构示意图;
图4是本申请一实施例提供的电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
为了说明本申请的技术方案,下面通过以下实施例来进行说明。
如图1所示,系统架构可以包括车辆101、车载终端设备102。其中,车载终端设备102通常设置于车辆101上,且车辆101与车载终端设备102通常通过车辆上的通讯接口,如,车载自动诊断系统(On Board Diagnostics,OBD)接口,实现可通信连接,从而实现数据和/或信令的交互。
车辆101可以是各种车辆。例如,无人车、小汽车、大卡车等。需要指出的是,车辆101也可以是各种其它交通工具。例如,飞机、轮船。
车载终端设备102可以是各种电子设备。实践中,车载终端设备102可以获取车辆101内的语音信息;根据语音信息确定语音信息的来源位置,其中,来源位置为车辆101中的座位位置;根据座位位置确定对应的目标设备;判断语音信息是否与目标设备的语言信息匹配;若不匹配,则根据语音信息调整目标设备的语言信息。
需要说明的是,本实施例所提供的语言调整方法一般由车载终端设备102执行。应该理解,图1中的车辆和车载终端设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的车辆和车载终端设备。
参考图2,为本申请实施例提供的一种语言调整方法的流程示意图,如图2所示的语言调整方法,包括:
步骤201,获取目标车辆内的语音信息。
其中,目标车辆通常是车载终端设备所在的车辆。语音信息通常是指包括语言内容的语音信息。作为示例,语音信息中可以包括但不限于以下至少一项:数字、字母、汉字等。
在本实施例中,语言调整方法的执行主体通常为电子设备(例如图1所示的车载终端设备102)。
这里,在目标车辆内的用户发出语音信息时,如,唱歌、打电话、与车内其他用户交谈等,上述执行主体可以通过自带的语音接收设备,或者是通过通信连接的语音接收设备,获取到该语音信息。
实际应用中,可以在目标车辆的每个座位位置处分别设置语音接收设备,实现获取到目标车辆内的语音信息。也可以在目标车辆的预设位置处,如前挡风玻璃的顶部中心位置,设置语音接收设备,实现获取到目标车辆内的语音信息。还可以在车载终端设备内部安装语音接收设备,实现获取到目标车辆内的语音信息。
实践中,语音接收设备可以是单个麦克风,也可以是麦克风阵列。其中,麦克风阵列通常是由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。需要指出的是,采用麦克风阵列进行语音信号的采集可以利用多个麦克风接收到声波的相位之间的差异对声波进行过滤,能最大限度将环境背景声音清除掉,从而达到降噪的效果。
实际应用中,上述执行主体通常在满足启动条件时,启动执行上述获取目标车辆内的语音信息的步骤。启动条件通常是预先设定的条件。启动条件可以包括但不限于:车门关闭,增加落座人员,车辆启动,预设按键被点击。需要指出的是,仅在满足启动条件的情况下执行步骤201,可以节约计算资源。
步骤202,根据语音信息确定语音信息的来源位置。
其中,来源位置为目标车辆中的座位位置。
实际应用中,目标车辆可以为四座车辆,六座车辆,七座车辆等。若目标车辆为四座车辆,则来源位置可以包括:驾驶座位置,副驾驶座位置,后排右座位置,后排左座位置。
这里,上述执行主体可以采用现有技术或者未来发展中的技术提取语音信息的特征,然后基于所提取的特征确定语音信息的来源位置。作为示例,上述执行主体可以将语音信息输入预先训练的神经网络模型,例如卷积神经网络(Convolutional Neural Network,CNN)、残差网络(ResNet)等,以得到语音信息的来源位置。
步骤203,根据座位位置确定对应的目标设备。
其中,目标设备为向来源位置的用户提供语音服务的设备。实践中,目标设备通常设置于对应座位位置处。举例来说,若目标设备甲为向驾驶座位置的用户提供语音服务的设备,则目标设备甲通常设置于驾驶座位置处,如,可以设置于驾驶座位置的正前方。实际应用中,一个座位位置处可以设置一个目标设备。
可选地,目标设备可以包括但不限于以下至少一项:导航设备,音频播放设备,视频播放设备。导航设备通常是用于导航的设备。音频播放设备通常是用于播放音频的设备。视频播放设备通常是用于播放视频的设备。实践中,驾驶座位置处的目标设备可以为导航设备,驾驶座位置之外的座位位置处的目标设备可以为视频播放设备、音频播放设备等。
这里,上述执行主体在得到座位位置后,可以直接确定座位位置对应的目标设备。
步骤204,判断语音信息是否与目标设备的语言信息匹配。
这里,目标设备的语言信息通常是用于指示目标设备的工作语言的信息。
这里,上述执行主体可以采用现有技术或者未来发展中的技术提取语音信息的特征,然后基于所提取的特征确定语音信息的所属语言。然后,上述执行主体可以采用该语言与目标设备的当前的工作语言进行比较,从而判断语音信息是否与目标设备的语言信息匹配。作为示例,若语音信息的所属语言与目标设备的当前的工作语言一致,则认为语音信息与目标设备的语言信息匹配。反之,若语音信息的所属语言与目标设备的当前的工作语言不一致,则认为语音信息与目标设备的语言信息不匹配。
步骤205,若不匹配,则根据语音信息调整目标设备的语言信息。
这里,若语音信息与目标设备的语言信息不匹配,则上述执行主体可以采用上述语音信息对应的语言对目标设备的语言信息进行调整。实践中,上述执行主体通常是将目标设备的语言信息调整为与上述语音信息对应的语言一致。如,若上述语音信息对应的语言为粤语,则上述执行主体可以将目标设备的语言信息调整为粤语。
本实施例提供的方法,在获取到目标车辆内的语音信息时,自动识别语音信息的来源位置及来源位置对应的目标设备,在语音信息与目标设备的语言信息不匹配时,自动采用语音信息对应的语言对目标设备的语言信息进行调整,可以自动调整目标设备的语言,有助于提高对提供语音服务的设备的语言进行调整的效率。
在本申请的各个实施例的可选的实现方式中,在判断语音信息是否与目标设备的语言信息匹配之前,还可以包括:
根据至少两种语音信息建立语言数据库,语言数据库包括语言类型,语言类型包括但不限于地方语言类型、国际语言类型。
这里,每种语言类型可以包括多种不同的语言。作为示例,地方语言类型可以包括但不限于普通话,客家话,四川话,粤语,东北话等。国际语言类型可以包括但不限于普通话,英语,法语,日语等。
在上述实现方式中,上述判断语音信息是否与目标设备的语言信息匹配,可以包括:首先,根据语音信息的特征,在语言数据库中确定语音信息对应的语言类型。然后,根据语音信息的特征及对应的语言类型,确定目标语言。之后,判断所确定的目标语言是否与目标设备的当前语言一致。最后,若一致,则确定语音信息与目标设备的语言信息匹配。
其中,上述当前语言通常是目标设备的语言信息指示的语言。
这里,上述执行主体可以采用现有技术或者未来发展中的技术提取语音信息的特征,然后,基于该特征确定该语言信息在语言数据库中对应的语言类型。之后,上述执行主体可以采用语音信息的特征、语音信息对应的语言类型,确定该语音信息的发出者的语言,得到目标语言。最后,上述执行主体可以将目标语言与目标设备的当前语言进行比较,以确定二者是否一致。若目标语言与目标设备的当前语言一致,则上述执行主体可以确定语音信息与目标设备的语言信息匹配。反之,若目标语言与目标设备的当前语言不一致,则上述执行主体可以确定语音信息与目标设备的语言信息不匹配。
在本申请的各个实施例的可选的实现方式中,获取目标车辆内的语音信息,包括:响应于检测到目标车辆中增加落座人员,获取落座人员的语音信息。
其中,落座人员可以是驾驶员也可以是乘客。
这里,上述执行主体可以通过传感器检测到目标车辆中是否增加落座人员。作为示例,目标车辆的每个座位处可以预设压力传感器,上述执行主体可以通过检测到压力传感器的变化确定增加落座人员及其位置。作为另一示例,上述执行主体也可以通过分析摄像头所采集的目标车辆内部的实时图像的方式,确定是否检测到增加落座人员。
上述执行主体在检测到目标车辆中增加落座人员时,启动执行获取落座人员的语音信息,从而对落座位置处的目标设备的语言进行相应调整,可以实现有针对性地对目标设备的语言进行调整,有助于进一步提高对提供语音服务的设备的语言进行调整的效率。
在一些可选的实现方式中,在上述获取落座人员的语音信息之后,还可以包括:获取落座人员的人脸图像,以及将语音信息所属语言与人脸图像关联存储。
这里,上述执行主体可以通过摄像头采集落座人员的人脸图像。在得到落座人员的语音信息且识别得到语音信息所属语言后,可以将人脸图像和语言关联,以及将关联后的人脸图像和语言进行存储。
这样,在该落座人员下一次落座时,尤其是落座后检测不到该落座人员的语音信息时,可以通过对新获取的人脸图像和所存储的人脸图像进行比较,确定出该落座人员及该落座人员的语言类型,从而可以实现将该落座人员的语言作为落座位置处的目标设备的语言,有助于进一步提高对提供语音服务的设备的语言进行调整的效率。
在本申请的各个实施例的可选的实现方式中,上述语言调整方法还可以包括如下步骤:若目标车辆内存在至少两种不同语言的语音信息进行交互,则将获取到的、与目标设备对应语言不同的交互语音信息,转换为与目标设备对应语言相同的语音信息,以及控制目标设备输出转换后的交互语音信息。
其中,上述交互语音信息,通常是一个用户与其它用户交互的语音信息。
实际应用中,目标车辆中可能有多个用户,且多个用户所使用的语言可能不是同一种类型,如,有人说普通话,有人说粤语,还有人说闽南语。此时,上述执行主体可以在接收到交互语音信息后,根据各个座位位置处的目标设备对应的语言,对该交互语音信息进行语言转换。具体地,针对每个目标设备,若交互语音信息对应的语言与该目标设备对应的语言一致,则无需转换,直接输出即可,而若交互语音信息对应的语言与该目标设备对应的语言不一致,则需要将交互语音信息转换为目标设备对应语言相同的语音信息,以及输出语言转换后的交互语音信息。这样,可以促进目标车辆中的不同语言的多个用户进行无障碍沟通。
举例来说,若目标车辆中有三个用户,分别为甲,乙,丙。甲所在的座位位置为A,乙所在的座位位置为B,丙所在的座位位置为C。若座位位置A对应的语言为四川话,座位位置B对应的语言为四川话,座位位置C对应的语言为粤语,则上述执行主体在接收到座位位置A的交互语音信息时,可以将用户甲的交互语音信息转换成粤语形式,以及控制座位位置C处的目标设备输出转换后的交互语音信息。
这里,上述执行主体可以采用现有技术中的语音翻译技术,将获取到的语音翻译成文字语言后再将文字语言转换成另一种类型的语音,以得到与目标位置对应的语言适配的语音信息。在进行语音转换之后,上述执行主体可以将转换得到的语音信息通过目标位置处的目标设备输出。这样,目标位置处的用户可以获取到该转换得到的语音信息。这样,可以实现同一车辆中的不同语言用户之间可以顺畅沟通。
在本申请的各个实施例的可选的实现方式中,上述语言调整方法还可以包括如下步骤:响应于检测到目标车辆中增加落座人员且获取不到落座人员的语音信息,通过以下第一项至第三项中的任意一项或多项确定落座人员的目标语言。
其中,上述获取不到落座人员的语音信息通常是指在预设时间长度内,如,5分钟,没有获取到落座人员的语音信息。上述目标语言通常是指落座人员的语言。
第一项,获取目标车辆的当前所处位置信息,将当前所处位置信息指示的位置处的常用语言信息,确定为落座人员的目标语言。
其中,当前所处位置信息通常是用于指示当前时刻的位置的信息。实践中,当前所处位置信息通常是所指示位置对应的位置坐标。
这里,上述执行主体可以通过目标车辆的全球定位系统(Global PositioningSystem,GPS)获取到目标车辆当前所处位置信息。然后,可以将当前所处位置信息指示的位置处的常用语言,作为落座人员的目标语言。作为示例,若当前所处位置信息指示的位置为成都,则可以将四川话作为落座人员的目标语言。若当前所处位置信息指示的位置为英国,则可以将英语作为落座人员的目标语言。
第二项,将落座人员的落座位置对应的上一语言信息,确定为落座人员的目标语言。
这里,针对每个座位位置,上述执行主体可以记录该座位位置对应的语言。这样,在该座位位置在下一次有人落座且获取不到落座人员的语音信息时,可以将所记录的语言作为落座人员的目标语言。
举例来说,针对某一座位位置,若该座位位置在第m次有人落座时,检测到落座人员的语言为日语。若该座位位置在第m+1次有人落座时获取不到落座人员的语音信息,此时可以将第m次的语言作为第m+1次落座的落座人员的目标语言。
第三项,获取落座人员的人脸图像,识别人脸图像中呈现的人物,将预先存储的该人物的语言信息,确定为落座人员的目标语言。
这里,上述执行主体可以在检测到增加落座人员时,采用摄像头采集落座人员的人脸图像。这样,上述执行主体可以通过对人脸图像进行人脸识别,识别得到图像中所呈现的人物的身份。若预先存储有该人物的语言,则可以直接将该人物的语言作为落座人员的目标语言。
本实现方式中,在检测到目标车辆中增加落座人员且获取不到落座人员的语音信息时,可以通过多种方式确定落座人员的目标语言,从而将该落座人员的语言作为落座位置处的目标设备的语言。有助于进一步提高对提供语音服务的设备的语言进行调整的效率。
在本申请的各个实施例的可选的实现方式中,在若不匹配,则根据语音信息调整目标设备的语言信息之后,还包括:
控制目标设备输出调整后的语言信息。
这里,在语音信息与目标设备的语言信息不匹配时,上述执行主体可以向目标设备发送信息输出指令,以控制目标设备输出调整后的语言信息。上述信息输出指令通常是用于控制目标设备输出调整后的语言信息的指令。
这里,目标设备输出调整后的语言信息,可以便于目标设备对应的座位位置处的、用户能够确定目标设备的当前的工作语言是否满足用户需求,有助于提升用户体验。
进一步参考图3,对应于上文实施例的语言调整方法,图3为本申请实施例提供的语言调整装置300的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图3,该装置包括:
信息获取单元301,用于获取目标车辆内的语音信息;
信息确定单元302,用于根据语音信息确定语音信息的来源位置,其中,来源位置为目标车辆中的座位位置;
设备确定单元303,用于根据座位位置确定对应的目标设备;
信息判断单元304,用于判断语音信息是否与目标设备的语言信息匹配;
信息调整单元305,用于若不匹配,则根据语音信息调整目标设备的语言信息。
在一些实施例中,信息获取单元301具体用于:响应于检测到目标车辆中增加落座人员,获取落座人员的语音信息。
在一些实施例中,装置还包括类型建立单元(图中未示出)。其中,类型建立单元,用于根据至少两种语音信息建立语言数据库,语言数据库包括语言类型,语言类型包括地方语言类型、国际语言类型。
在一些实施例中,信息判断单元304具体用于:根据语音信息的特征,在语言数据库中确定语音信息对应的语言类型;根据语音信息的特征及对应的语言类型,确定目标语言;判断所确定的目标语言是否与目标设备的当前语言一致;若一致,则确定语音信息与目标设备的语言信息匹配。
在一些实施例中,装置还包括信息转换单元(图中未示出)。其中,信息转换单元,用于若目标车辆内存在至少两种不同的语音信息进行交互,则将获取到的、与目标设备对应语言不同的交互语音信息,转换为与目标设备对应语言相同的语音信息,以及控制目标设备输出转换后的交互语音信息。
在一些实施例中,装置还包括语言确定单元(图中未示出)。其中,语言确定单元,用于响应于检测到目标车辆中增加落座人员且获取不到落座人员的语音信息,通过以下任意一项或多项确定落座人员的目标语言:
获取目标车辆的当前所处位置信息,将当前所处位置信息指示的位置处的常用语言信息,确定为落座人员的目标语言;
将落座人员的落座位置对应的上一语言信息,确定为落座人员的目标语言;
获取落座人员的人脸图像,识别人脸图像中呈现的人物,将预先存储的该人物的语言信息,确定为落座人员的目标语言。
在一些实施例中,装置还包括信息输出单元(图中未示出)。其中,信息输出单元,用于控制目标设备输出调整后的语言信息。
本实施例提供的装置,在获取到目标车辆内的语音信息时,自动识别语音信息的来源位置及来源位置对应的目标设备,在语音信息与目标设备的语言信息不匹配时,自动采用语音信息对应的语言对目标设备的语言信息进行调整,可以自动调整目标设备的语言,有助于提高对提供语音服务的设备的语言进行调整的效率。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
进一步参考图4,图4为本申请一实施例提供的电子设备400的结构示意图。如图4所示,该实施例的电子设备400包括:至少一个处理器401(图4中仅示出一个处理器)、存储器402以及存储在存储器402中并可在至少一个处理器401上运行的计算机程序403,例如语言调整程序。处理器401执行计算机程序403时实现上述任意各个方法实施例中的步骤。处理器401执行计算机程序403时实现上述各个语言调整方法的实施例中的步骤。处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能,例如图3所示单元301至305的功能。
示例性的,计算机程序403可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器402中,并由处理器401执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序403在电子设备400中的执行过程。例如,计算机程序403可以被分割成信息获取单元,信息确定单元,设备确定单元,信息判断单元,信息调整单元,各单元具体功能在上述实施例中已有描述,此处不再赘述。
电子设备400可以是服务器、台式电脑、平板电脑、云端服务器和移动终端等计算电子设备。电子设备400可包括,但不仅限于,处理器401,存储器402。本领域技术人员可以理解,图4仅仅是电子设备400的示例,并不构成对电子设备400的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子设备还可以包括输入输出电子设备、网络接入电子设备、总线等。
所称处理器401可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器402可以是电子设备400的内部存储单元,例如电子设备400的硬盘或内存。存储器402也可以是电子设备400的外部存储电子设备,例如电子设备400上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器402还可以既包括电子设备400的内部存储单元也包括外部存储电子设备。存储器402用于存储计算机程序以及电子设备所需的其他程序和数据。存储器402还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。其中,计算机可读存储介质可以是非易失性的,也可以是易失性的。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种语言调整方法,其特征在于,所述方法包括:
获取目标车辆内的语音信息;
根据所述语音信息确定所述语音信息的来源位置,其中,所述来源位置为所述目标车辆中的座位位置;
根据所述座位位置确定对应的目标设备;
判断所述语音信息是否与所述目标设备的语言信息匹配;
若不匹配,则根据所述语音信息调整所述目标设备的语言信息。
2.根据权利要求1所述的方法,其特征在于,所述获取目标车辆内的语音信息,包括:
响应于检测到所述目标车辆中增加落座人员,获取所述落座人员的语音信息。
3.根据权利要求1所述的方法,其特征在于,在所述判断所述语音信息是否与所述目标设备的语言信息匹配之前,还包括:
根据至少两种所述语音信息建立语言数据库,所述语言数据库包括语言类型,所述语言类型包括地方语言类型、国际语言类型。
4.根据权利要求3所述的方法,其特征在于,所述判断所述语音信息是否与所述目标设备的语言信息匹配,包括:
根据所述语音信息的特征,在所述语言数据库中确定所述语音信息对应的语言类型;
根据所述语音信息的特征及对应的语言类型,确定目标语言;
判断所确定的目标语言是否与所述目标设备的当前语言一致;
若一致,则确定所述语音信息与所述目标设备的语言信息匹配。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述目标车辆内存在至少两种不同语言的语音信息进行交互,则将获取到的、与目标设备对应语言不同的交互语音信息,转换为与目标设备对应语言相同的语音信息,以及控制目标设备输出转换后的交互语音信息。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于检测到所述目标车辆中增加落座人员且获取不到所述落座人员的语音信息,通过以下任意一项或多项确定所述落座人员的目标语言:
获取所述目标车辆的当前所处位置信息,将所述当前所处位置信息指示的位置处的常用语言信息,确定为所述落座人员的目标语言;
将所述落座人员的落座位置对应的上一语言信息,确定为所述落座人员的目标语言;
获取所述落座人员的人脸图像,识别所述人脸图像中呈现的人物,将预先存储的该人物的语言信息,确定为所述落座人员的目标语言。
7.根据权利要求1-6中任一项所述的方法,其特征在于,在所述若不匹配,则根据所述语音信息调整所述目标设备的语言信息之后,还包括:
控制所述目标设备输出调整后的语言信息。
8.一种语言调整装置,其特征在于,所述装置包括:
信息获取单元,用于获取目标车辆内的语音信息;
信息确定单元,用于根据所述语音信息确定所述语音信息的来源位置,其中,所述来源位置为所述目标车辆中的座位位置;
设备确定单元,用于根据所述座位位置确定对应的目标设备;
信息判断单元,用于判断所述语音信息是否与所述目标设备的语言信息匹配;
信息调整单元,用于若不匹配,则根据所述语音信息调整所述目标设备的语言信息。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
CN202110850157.3A 2021-07-27 2021-07-27 语言调整方法、装置、电子设备及介质 Pending CN113535308A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110850157.3A CN113535308A (zh) 2021-07-27 2021-07-27 语言调整方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110850157.3A CN113535308A (zh) 2021-07-27 2021-07-27 语言调整方法、装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN113535308A true CN113535308A (zh) 2021-10-22

Family

ID=78089162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110850157.3A Pending CN113535308A (zh) 2021-07-27 2021-07-27 语言调整方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN113535308A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115431762A (zh) * 2022-03-25 2022-12-06 北京罗克维尔斯科技有限公司 多屏幕交互方法、装置、设备及计算机可读存储介质
CN115620721A (zh) * 2022-12-05 2023-01-17 山东盖特航空科技有限公司 一种获取音频记录的系统及获取方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101532849A (zh) * 2009-04-23 2009-09-16 深圳市凯立德计算机系统技术有限公司 具有语言选择功能的导航系统及方法
CN105758414A (zh) * 2016-02-17 2016-07-13 广东小天才科技有限公司 切换车载导航的语言的方法及装置
CN105957516A (zh) * 2016-06-16 2016-09-21 百度在线网络技术(北京)有限公司 多语音识别模型切换方法及装置
CN106951209A (zh) * 2017-03-29 2017-07-14 联想(北京)有限公司 一种控制方法、装置及电子设备
CN107734160A (zh) * 2017-09-30 2018-02-23 合肥学院 一种基于智能手机的语言互助方法
CN109542569A (zh) * 2018-11-26 2019-03-29 Oppo(重庆)智能科技有限公司 设置显示语言的方法、装置、终端及存储介质
CN110928588A (zh) * 2019-11-19 2020-03-27 珠海格力电器股份有限公司 调整终端配置的方法、装置、移动终端和存储介质
CN111142999A (zh) * 2019-12-24 2020-05-12 深圳市元征科技股份有限公司 一种设备语言选择方法、系统、装置及计算机存储介质
CN112017631A (zh) * 2020-08-21 2020-12-01 江苏扬航绳网带有限公司 一种确定使用语言的方法及移动终端
CN112835661A (zh) * 2019-11-25 2021-05-25 奥迪股份公司 车载辅助系统、包括其的车辆及相应的方法和介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101532849A (zh) * 2009-04-23 2009-09-16 深圳市凯立德计算机系统技术有限公司 具有语言选择功能的导航系统及方法
CN105758414A (zh) * 2016-02-17 2016-07-13 广东小天才科技有限公司 切换车载导航的语言的方法及装置
CN105957516A (zh) * 2016-06-16 2016-09-21 百度在线网络技术(北京)有限公司 多语音识别模型切换方法及装置
CN106951209A (zh) * 2017-03-29 2017-07-14 联想(北京)有限公司 一种控制方法、装置及电子设备
CN107734160A (zh) * 2017-09-30 2018-02-23 合肥学院 一种基于智能手机的语言互助方法
CN109542569A (zh) * 2018-11-26 2019-03-29 Oppo(重庆)智能科技有限公司 设置显示语言的方法、装置、终端及存储介质
CN110928588A (zh) * 2019-11-19 2020-03-27 珠海格力电器股份有限公司 调整终端配置的方法、装置、移动终端和存储介质
CN112835661A (zh) * 2019-11-25 2021-05-25 奥迪股份公司 车载辅助系统、包括其的车辆及相应的方法和介质
CN111142999A (zh) * 2019-12-24 2020-05-12 深圳市元征科技股份有限公司 一种设备语言选择方法、系统、装置及计算机存储介质
CN112017631A (zh) * 2020-08-21 2020-12-01 江苏扬航绳网带有限公司 一种确定使用语言的方法及移动终端

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115431762A (zh) * 2022-03-25 2022-12-06 北京罗克维尔斯科技有限公司 多屏幕交互方法、装置、设备及计算机可读存储介质
CN115620721A (zh) * 2022-12-05 2023-01-17 山东盖特航空科技有限公司 一种获取音频记录的系统及获取方法

Similar Documents

Publication Publication Date Title
CN111966320B (zh) 用于车辆的多模态交互方法、存储介质以及电子设备
US12046237B2 (en) Speech interaction method and apparatus, computer readable storage medium and electronic device
US9552815B2 (en) Speech understanding method and system
EP3955245A1 (en) Apparatus, method and program for parsing an utterance using a speaker feature vector
CN108447488B (zh) 增强语音识别任务完成
US20180074661A1 (en) Preferred emoji identification and generation
CN102693725A (zh) 依赖于文本信息语境的语音识别
CN113535308A (zh) 语言调整方法、装置、电子设备及介质
CN110619897A (zh) 一种会议纪要生成的方法及车载录音系统
CN109302486B (zh) 一种根据车内环境推送音乐的方法和系统
CN112585674B (zh) 信息处理装置、信息处理方法和存储介质
CN113539265B (zh) 一种控制方法、装置、设备及存储介质
CN113889091A (zh) 语音识别方法、装置、计算机可读存储介质及电子设备
CN113674754A (zh) 基于音频的处理方法和装置
US8452599B2 (en) Method and system for extracting messages
CN109243457B (zh) 基于语音的控制方法、装置、设备及存储介质
CN115352361A (zh) 一种车辆用隔窗对话方法、装置和车辆
CN115953996A (zh) 一种基于车内用户信息生成自然语言的方法及装置
CN111724793A (zh) 一种车载视频通话方法与系统
CN115050375A (zh) 一种设备的语音操作方法、装置和电子设备
US20220122613A1 (en) Methods and systems for detecting passenger voice data
US20240304201A1 (en) Audio-based processing method and apparatus
CN117995168A (zh) 一种用于ipa的语音处理方法和系统
CN116994569A (zh) 一种语音识别方法及装置
CN116705027A (zh) 语音信息处理方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination