CN108492819A - 语言练习方法、装置、智能车载终端及存储介质 - Google Patents
语言练习方法、装置、智能车载终端及存储介质 Download PDFInfo
- Publication number
- CN108492819A CN108492819A CN201810278851.0A CN201810278851A CN108492819A CN 108492819 A CN108492819 A CN 108492819A CN 201810278851 A CN201810278851 A CN 201810278851A CN 108492819 A CN108492819 A CN 108492819A
- Authority
- CN
- China
- Prior art keywords
- text
- language exercise
- vehicle
- voice
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000015654 memory Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000000903 blocking effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/052—Detecting movement of traffic to be counted or controlled with provision for determining speed or overspeed
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/04—Electrically-operated educational appliances with audible presentation of the material to be studied
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Theoretical Computer Science (AREA)
- Electrically Operated Instructional Devices (AREA)
- Navigation (AREA)
Abstract
本发明涉及智能汽车技术领域,提供一种语言练习方法、装置、智能车载终端及存储介质,所述方法包括:接收用户发送的语言练习请求;基于语言练习请求,获取车速传感器采集的第一车速;当第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音;获取车载传声器采集的与第一语音对应的用户练习语音,并对用户练习语音进行语音识别得到语言练习文本;依据语言练习文本,从所述多个模板文本中确定出与所述语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。本发明通过与汽车进行对话练习,从而方便用户在开车上下班的路上以及开车出差途中,尤其是遇到长时间堵车时利用零碎时间练习口语。
Description
技术领域
本发明涉及智能汽车技术领域,具体而言,涉及一种语言练习方法、装置、智能车载终端及存储介质。
背景技术
如今的汽车功能已经不仅仅是传统的代步功能,随着时代的发展,新型技术的不断开发,汽车也越来越智能化。随着国人不断走出国门,外国人不断的来中国旅游、经商,随时随地的学习英语就显得特别重要。由于工作繁忙,许多人往往没有多余时间练习口语,不能在开车上下班的路上以及出差途中,尤其是遇到长时间堵车时,方便地利用零碎时间练习口语。
发明内容
本发明实施例的目的在于提供一种语言练习方法、装置、智能车载终端及存储介质,用以解决用户不能在开车上下班的路上以及出差途中,尤其是遇到长时间堵车时,方便地利用零碎时间练习口语的问题。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种语言练习方法,应用于智能车载终端,智能车载终端与车速传感器电连接,智能车载终端包括车载传声器和车载发声器,并预先存储有多个模板文本;所述方法包括:接收用户发送的语言练习请求;基于语言练习请求,获取车速传感器采集的第一车速;当第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音;获取车载传声器采集的与第一语音对应的用户练习语音,并对用户练习语音进行语音识别得到语言练习文本;依据语言练习文本,从所述多个模板文本中确定出与所述语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。
第二方面,本发明实施例还提供了一种语言练习装置,所述装置包括接收模块、获取模块、输出模块、识别模块和匹配模块。其中,接收模块用于接收用户发送的语言练习请求;获取模块用于基于语言练习请求,获取车速传感器采集的第一车速;输出模块用于当第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音;识别模块用于获取车载传声器采集的与第一语音对应的用户练习语音,并对用户练习语音进行语音识别得到语言练习文本;匹配模块,用于依据语言练习文本,从多个模板文本中确定出与语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。
第三方面,本发明实施例还提供了一种智能车载终端,所述智能车载终端包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的语言练习方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述语言练习方法。
相对现有技术,本发明实施例提供的一种语言练习方法、装置、智能车载终端及存储介质,当用户需要语言练习时发送语言练习请求,接收用户发送的语言练习请求,然后响应该语言练习请求,获取车速传感器采集的第一车速,再判断第一车速是否小于预设阈值,当第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音,接下来用户根据该第一语音,发出与该第一语音对应的用户练习语音,车载传声器采集该用户练习语音并对该用户练习语音进行语音识别得到语言练习文本,再依据该语言练习文本,从多个模板文本中确定出与该语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。与现有技术相比,本发明实施例通过与汽车进行对话练习,从而方便用户在开车上下班的路上以及开车出差途中,尤其是遇到长时间堵车时利用零碎时间练习口语。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例提供的智能车载终端的方框示意图。
图2示出了本发明实施例提供的语言练习方法流程图。
图3为图2示出的步骤S104的子步骤流程图。
图4为图2示出的步骤S105的子步骤流程图。
图5示出了本发明实施例提供的语言练习装置的方框示意图。
图标:100-智能车载终端;101-存储器;102-存储控制器;103-处理器;104-外设接口;105-车载传声器;106-车载发声器;107-显示装置;200-语言练习装置;201-接收模块;202-获取模块;203-输出模块;204-识别模块;205-匹配模块;206-采集模块;207-停止模块;208-显示模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1示出了本发明实施例提供的智能车载终端100的方框示意图。智能车载终端100可以用于实现和用户进行口语练习,可以是智能手机、车载电脑、汽车上的组合仪表或多媒体主机等等。所述智能车载终端100包括存储器101、存储控制器102、处理器103、外设接口104、车载传声器105、车载发声器106、显示装置107。
存储器101、存储控制器102及处理器103各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。语言练习装置200包括至少一个可以软件或固件(firmware)的形式存储于存储器101中或固化在所述智能车载终端100的操作系统(operating system,OS)中的软件功能模块。处理器103用于执行存储器101中存储的可执行模块,例如语言练习装置200所包括的软件功能模块及计算机程序等。
其中,存储器101可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器101用于存储程序,所述处理器103在接收到执行指令后,执行所述程序。
处理器103可以是一种集成电路芯片,具有信号处理能力。上述的处理器103可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)、语音处理器以及视频处理器等;还可以是数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器103也可以是任何常规的处理器等。
车载传声器105用于采集语言练习请求的语音及用户练习语音,并将该用户练习语音发送至智能车载终端100,以使智能车载终端100开启语言练习功能,实现用户和汽车之间进行口语练习。车载传声器105是用于汽车的传声器,是将声音信号转换为电信号的能量转换器件。车载传声器105可以是车载麦克风、车载话筒、车载微音器等,在本发明实施例中,车载传声器105可以是车载麦克风。
车载发声器106是用于汽车的发声器,是将电能转变为声音的器材,用于将对语言练习请求的回应语音和将语言练习文本转换后的语言练习语音进行输出。车载发声器106可以是车载喇叭、车载扬声器等,在本发明实施例中,车载发声器106可以是车载扬声器。
显示装置107是汽车上的一种人机接口设备,用于显示智能车载终端100的用户界面,同时可以通过触摸方式接收用户的语言练习请求,也可以配置语言练习的语种,练习主题、预设阈值、预设周期等,还可以将语言练习文本、以及与语言练习文本匹配的目标模板文本均进行显示,显示装置107可以是触摸屏。
第一实施例
请参照图2,图2示出了本发明实施例提供的语言练习方法流程图。本发明第一实施例的语言练习方法应用于智能车载终端100中,语言练习方法处理方法包括以下步骤:
步骤S101,接收用户发送的语言练习请求。
在本发明实施例中,语言练习请求是由用户触发的、用于启动利用语言练习方法实现的语言练习功能的命令请求,其中,语言练习请求可以是用户通过车载传声器105发出的语音命令,也可以是用户通过智能车载终端100的用户界面发出的操作命令,也可以是用户通过与智能车载终端100电连接的汽车方向盘上的按键的键控命令。
步骤S102,基于所述语言练习请求,获取车速传感器采集的第一车速。
在本发明实施例中,智能车载终端100接收到语言练习请求后,在确定进入语言练习功能之前,首先获取车速传感器采集的第一车速,其中,第一车速是智能车载终端100接收到语言练习请求后获取的车速传感器采集的汽车的当前车速。
步骤S103,当第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音。
在本发明实施例中,预设阈值指在不影响安全驾驶车辆的情况下,车内乘客或者驾驶人和汽车进行语言练习时汽车可以达到的最高时速,例如,预设阈值可以设置为25km/h。练习主题指预先通过智能车载终端100的用户界面设置的语言练习涉及的特定场景,例如,问路、购物、天气等等。获取到第一车速时,将第一车速和预设阈值进行比较,当第一车速小于预设阈值时,智能车载终端100按照练习主题通过车载发声器106输出第一语音,等待用户回应,当第一车速大于或等于预设阈值时,车载发声器106不会输出第一语音。
需要说明的是,当第一车速小于预设阈值时,智能车载终端100也可以发送提示信息给用户,提示信息可以是通过车载发声器106发出的语音提示、或者通过显示装置107发出的显示提示,然后再按照练习主题通过车载发声器106输出第一语音,等待用户回应,例如,车载发声器106播报“语言练习开始”,或者显示装置107显示“语言练习开始”。
步骤S104,获取车载传声器采集的与第一语音对应的用户练习语音,并对用户练习语音进行语音识别得到语言练习文本。
在本发明实施例中,智能车载终端100按照练习主题通过车载发声器106输出第一语音后,用户对第一语音进行语音响应,智能车载终端100首先获取车载传声器105采集的用户对第一语音进行语音响应的用户练习语音,然后对用户练习语音进行语音识别得到语言练习文本,语音识别的目的是将用户发出的语音转换为智能车载终端100可读的字符序列的文本。对用户练习语音进行语音识别的方法可以包括:
首先,对用户练习语音进行预处理,消除噪声带来的影响,并将用户练习语音进行声学特征提取,得到语言练习音频数据。声学特征提取既可以对用户练习语音进行信息压缩,又便于后续的语音识别。
其次,将语言练习音频数据输入预先建立的音频识别模型中进行处理得到与所述语言练习音频数据对应的语言练习文本,首先计算用户练习语音对应到音节的概率,得到用户练习语音的音节序列,然后根据多个音节序列,计算出对应的单词序列的概率,最后选出用户练习语音中音节序列概率及单词序列概率均最高的单词序列作为语音识别的结果,即与所述语言练习音频数据对应的语言练习文本。
请参照图3,步骤S104还可以包括以下子步骤:
子步骤S1041,将所述用户练习语音转换为语言练习音频数据。
在本发明实施例中,首先,通过消除噪声及信道失真对用户练习语音进行语音增强。其次,对语音增强后的用户练习语音进行分帧,并对每一帧进行傅里叶变换以提取到每一帧的特征向量,用户练习语音每一帧的特征向量即构成语言练习音频数据。例如,用户练习语音是“你好”,分帧后得到“你”和“好”两帧语音,则语言练习音频数据可以包括“你”的特征向量和“好”的特征向量。
子步骤S1042,将语言练习音频数据输入预先建立的音频识别模型,以得到与语言练习音频数据对应的语言练习文本。
在本发明实施例中,音频识别模型包括声学模型、语言模型及搜索空间,其中,声学模型是对大量的样本语音的声学特征进行统计建模后得到的,用于计算用户练习语音对应到音节的概率。语言模型是通过训练大量文本样本、并利用概率统计的方法对单词内在的统计规律进行建模得到的,用于根据多个音节序列计算对应的单词序列的概率。
搜索空间是以音节为节点组成的音节级的网络,搜索空间的建立过程如下:首先,以语言练习文本中可能出现的单词为节点组成单词级网络,其中,语言练习文本中可能出现的单词可以依据语言练习语音涉及的特定场景预先确定,例如,如果特定场景是商务接待,则常见的单词包括酒店、国家、城市等;然后,再对单词级网络进行音节扩展得到对应的音节级网络,该音节级网络即为搜索空间,例如,单词网络是“hotel”,则扩展得到的音节级网络可以是“ho”对应的音节和“tel”对应的音节。
将语言练习音频数据输入预先建立的音频识别模型进行语音识别的过程是:将语言练习音频数据输入至搜索空间,根据声学模型和语音模型在搜索空间中确定出概率最高的单词序列,将该单词序列作为语言练习音频数据对应的语言练习文本。
步骤S105,依据语言练习文本,从所述多个模板文本中确定出与所述语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。
在本发明实施例中,模板文本是预先存储在智能车载终端100上与练习场景关联的多个文本,智能车载终端100上预先存储有练习场景库,练习场景库是包括了练习主题、以及与该练习主题关联的场景关键词,在对用户练习语音进行语音识别得到语言练习文本后,首先根据练习主题,从练习场景库中找到与练习主题关联的场景关键词,依据场景关键词从语言练习文本中提取出与场景关键词匹配的文本关键词,再根据文本关键词从多个模板文本中找到与语言练习文本匹配的目标模板文本。
请参照图4,步骤S105还可以包括以下子步骤:
子步骤S1051,从语言练习文本中提取出与练习主题相关的文本关键词。
在本发明实施例中,智能车载终端100上预先存储有练习场景库,练习场景库是包括了练习主题、以及与该练习主题关联的场景关键词的数据库,该数据库可以保存在智能车载终端100上,例如,练习主题是天气,则与天气关联的场景关键词可以是“晴朗、多云、阴天、下雨、下雪、降温”等等。在语言练习文本中提取出与练习主题相关的文本关键词的方法可以是:
首先,依据练习主题,从练习场景库中找到与练习主题关联的场景关键词。
然后,依据场景关键词,从语言练习文本中提取出与场景关键词匹配的文本关键词。
在本发明实施例中,与场景关键词匹配的文本关键词可以是与场景关键词相同的单词或字。
需要说明的是,练习场景库也可以保存在与智能车载终端100通信连接的练习场景数据库服务端上,智能车载终端100将练习主题发送至练习场景数据库服务端,以使练习场景数据库服务端从练习场景库中获取与该练习主题关联的场景关键词,并将该场景关键词发送至智能车载终端100。
子步骤S1052,依据文本关键词,从多个模板文本中确定出与语言练习文本匹配的目标模板文本。
在本发明实施例中,模板文本是包含了至少一个场景关键词的一段文本,例如,场景关键词是“晴朗、多云、阴天、下雨、下雪、降温”,则“今天天气晴朗”就是一个模板文本,多个模板文本保存在模板文本数据库中,模板文本数据库保存在智能车载终端100上。得到文本关键词之后,首先从多个模板文本中找出包含该文本关键词最多的模板文本,然后从包含该文本关键词最多的模板文本中按预设顺序选取其中一个模板文本作为目标模板文本,预设顺序选取可以是随机选取,也可以是顺序选取。
需要说明的是,模板文本数据库也可以保存在模板文本数据库服务端,智能车载终端100将文本关键词发送至模板文本数据库服务端,以使模板文本数据库服务端在模板文本数据库中找出与语言练习文本匹配的目标模板文本,并将该目标模板文本发送至智能车载终端100。
在本发明实施例中,用户在和智能车载终端100进行口语对话的同时,汽车速度可能在不断变化,例如,用户发送的语言练习请求时,当前是严重堵车的情况,因此车速小于预设阈值,用户和智能车载终端100进行口语对话练习,经过一段时间后,拥堵逐渐消除,车速也在不断变化,出于安全性考虑,智能车载终端100周期性地获取车速传感器采集的第一车速,当第一车速大于或者等于预设阈值时,停止所述车载发声器106的语音输出,以结束口语对话练习,因此,本发明实施例还可以包括步骤S106。
步骤S106,按照预设周期获取车速传感器采集的第一车速。
在本发明实施例中,预设周期可以由用户预先通过智能车载终端100用户界面设置。
步骤S107,当第一车速大于或等于预设阈值时达到预定阈值时停止车载发声器的语音输出。
在本发明实施例中,当第一车速大于或等于预设阈值时在停止车载发声器106的语音输出的同时,也可以发送提示信息给用户,提示信息可以是通过车载发声器106发出的语音提示、或者通过显示装置107发出的显示提示,例如,预设阈值是35km/h,车载发声器106播报“因当前车速大于35公里每小时,语言练习结束”,或者显示装置107显示“因当前车速大于35公里每小时,语言练习结束”。
在本发明实施例中,智能车载终端100得到语言练习文本后,可以将该语言练习文本以语音方式输出,也就是说,智能车载终端100首先将语言练习文本转换成语言练习音频,并通过车载发声器106输出。另外,用户很可能由于噪声等没有及时听到语言练习音频或者用户需要查看该语言练习音频对应的单词,为了提高用户体验,可以将语言练习文本、以及与语言练习文本匹配的目标模板文本用显示装置107进行显示,因此,本发明实施例还可以包括步骤S108。
步骤S108,将语言练习文本、以及与语言练习文本匹配的目标模板文本均进行显示。
在本发明实施例中,智能车载终端100除了将语言练习文本转换成语言练习音频,并通过车载发声器106输出之外,还可以通过车载显示装置107将语言练习文本、以及与语言练习文本匹配的目标模板文本均进行显示,以在用户由于噪声等没有听到语言练习文本时或者需要查看该语言练习音频对应的单词是可以通过显示装置107看到语言练习文本,提高用户体验。
与现有技术相比,本发明实施例具有以下有益效果:
首先,接收用户发送的语言练习请求,语言练习请求的形式既可以是语音、也可以是操作、或者是按键,形式多样,方便用户在不同场景下发起。
然后,基于所述语言练习请求,获取车速传感器采集的第一车速。
第三,当第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器106输出第一语音,设置预设阈值考虑了语言练习进行对汽车安全性的影响,只有在当前车速处于安全车速的情况下才可以进行语言练习,提高了用户及汽车的安全。
第四,获取车载传声器105采集的与第一语音对应的用户练习语音,并对用户练习语音进行语音识别得到语言练习文本。
第五,依据语言练习文本,从多个模板文本中确定出与语言练习文本匹配的目标模板文本,并通过车载发声器106以语音方式进行输出,用户可以根据车载发声器106发出的语音判断自己的发音是否标准、语法是否正确,达到了语言练习的目的。
第六,按照预设周期获取车速传感器采集的第一车速;当第一车速大于或等于预设阈值时达到预定阈值时停止车载发声器106的语音输出,考虑到车速是一直变化的,出于用户和汽车的安全性考虑,以免语言练习对行车造成安全隐患,因此,当车速大于或等于预设阈值时停止车载发声器106的语音输出,也可以提示用户当前车速达到预设阈值,语言练习停止,增加用户使用的安全性和友好性。
最后,将语言练习文本、以及与语言练习文本匹配的目标模板文本均进行显示,除了通过语音形式输出目标模板文本,同时以显示形式将语言练习文本、以及与语言练习文本匹配的目标模板文本均进行输出,满足不同场景下用户对输出的需求,提升了用户的使用体验。
第二实施例
请参照图5,图5示出了本发明实施例提供的语言练习装置200的方框示意图。语言练习装置200应用于智能车载终端100,其包括接收模块201;获取模块202;输出模块203;识别模块204;匹配模块205;采集模块206;停止模块207;显示模块208。
接收模块201,用于接收用户发送的语言练习请求。
获取模块202,用于基于语言练习请求,获取车速传感器采集的第一车速。
输出模块203,用于当第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音。
识别模块204,用于获取车载传声器采集的与第一语音对应的用户练习语音,并对用户练习语音进行语音识别得到语言练习文本。
在本发明实施例中,识别模块204具体用于,将用户练习语音转换为语言练习音频数据;将语言练习音频数据输入预先建立的音频识别模型,以得到与语言练习音频数据对应的语言练习文本。
匹配模块205,用于依据语言练习文本,从多个模板文本中确定出与语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。
在本发明实施例中,匹配模块205具体用于,从语言练习文本中提取出与练习主题相关的文本关键词;依据文本关键词,从多个模板文本中确定出与语言练习文本匹配的目标模板文本。
采集模块206,用于按照预设周期获取车速传感器采集的第一车速。
停止模块207,用于当第一车速大于或等于预设阈值时达到预定阈值时停止车载发声器的语音输出。
显示模块208,用于将语言练习文本、以及与语言练习文本匹配的目标模板文本均进行显示。
本发明实施例还揭示了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器103执行时实现本发明前述实施例揭示的语言练习方法。
综上所述,本发明提供的一种语言练习方法、装置、智能车载终端及存储介质,所述方法包括:接收用户发送的语言练习请求;基于语言练习请求,获取车速传感器采集的第一车速;当第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音;获取车载传声器采集的与第一语音对应的用户练习语音,并对用户练习语音进行语音识别得到语言练习文本;依据语言练习文本,从所述多个模板文本中确定出与所述语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。与现有技术相比,本发明通过与汽车进行对话练习,从而方便用户在开车上下班的路上以及开车出差途中,尤其是遇到长时间堵车时利用零碎时间练习口语。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
Claims (10)
1.一种语言练习方法,其特征在于,应用于智能车载终端,所述智能车载终端与车速传感器电连接,所述智能车载终端包括车载传声器和车载发声器,并预先存储有多个模板文本;
所述方法包括:
接收用户发送的语言练习请求;
基于所述语言练习请求,获取所述车速传感器采集的第一车速;
当所述第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音;
获取所述车载传声器采集的与所述第一语音对应的用户练习语音,并对所述用户练习语音进行语音识别得到语言练习文本;
依据所述语言练习文本,从所述多个模板文本中确定出与所述语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。
2.如权利要求1所述的方法,其特征在于,所述对所述用户练习语音进行语音识别得到语言练习文本的步骤,包括:
将所述用户练习语音转换为语言练习音频数据;
将所述语言练习音频数据输入预先建立的音频识别模型,以得到与所述语言练习音频数据对应的语言练习文本。
3.如权利要求1所述的方法,其特征在于,所述依据所述语言练习文本,从所述多个模板文本中确定出与所述语言练习文本匹配的目标模板文本的步骤包括:
从所述语言练习文本中提取出与所述练习主题相关的文本关键词;
依据所述文本关键词,从所述多个模板文本中确定出与所述语言练习文本匹配的目标模板文本。
4.如权利要求3所述的方法,其特征在于,所述智能车载终端预先存储有练习场景库,所述练习场景库包括练习主题、以及与该练习主题关联的场景关键词;
从所述语言练习文本中提取出与所述练习主题相关的文本关键词的步骤,包括:
依据所述练习主题,从所述练习场景库中找到与所述练习主题关联的场景关键词;
依据所述场景关键词,从所述语言练习文本中提取出与所述场景关键词匹配的文本关键词。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
按照预设周期获取所述车速传感器采集的第一车速;
当所述第一车速大于或等于预设阈值时达到预定阈值时停止所述车载发声器的语音输出。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
将所述语言练习文本、以及与语言练习文本匹配的目标模板文本均进行显示。
7.一种语言练习装置,其特征在于,应用于智能车载终端,所述智能车载终端与车速传感器电连接,所述智能车载终端包括车载传声器和车载发声器,并预先存储有多个模板文本;
所述装置包括:
接收模块,用于接收用户发送的语言练习请求;
获取模块,用于基于所述语言练习请求,获取所述车速传感器采集的第一车速;
输出模块,用于当所述第一车速小于预设阈值时,按照预先设置的练习主题通过车载发声器输出第一语音;
识别模块,用于获取所述车载传声器采集的与所述第一语音对应的用户练习语音,并对所述用户练习语音进行语音识别得到语言练习文本;
匹配模块,用于依据所述语言练习文本,从所述多个模板文本中确定出与所述语言练习文本匹配的目标模板文本,并通过车载发声器以语音方式进行输出。
8.如权利要求7所述的装置,其特征在于,所述识别模块具体用于:
将所述用户练习语音转换为语言练习音频数据;
将所述语言练习音频数据输入预先建立的音频识别模型,以得到与所述语言练习音频数据对应的语言练习文本。
9.一种智能车载终端,其特征在于,所述智能车载终端包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810278851.0A CN108492819B (zh) | 2018-03-30 | 2018-03-30 | 语言练习方法、装置、智能车载终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810278851.0A CN108492819B (zh) | 2018-03-30 | 2018-03-30 | 语言练习方法、装置、智能车载终端及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108492819A true CN108492819A (zh) | 2018-09-04 |
CN108492819B CN108492819B (zh) | 2020-07-07 |
Family
ID=63317333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810278851.0A Active CN108492819B (zh) | 2018-03-30 | 2018-03-30 | 语言练习方法、装置、智能车载终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108492819B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492126A (zh) * | 2018-11-02 | 2019-03-19 | 廊坊市森淼春食用菌有限公司 | 一种智能交互方法及装置 |
CN110491372A (zh) * | 2019-07-22 | 2019-11-22 | 平安科技(深圳)有限公司 | 一种反馈信息生成方法、装置、存储介质和智能设备 |
CN110503941A (zh) * | 2019-08-21 | 2019-11-26 | 北京隐虚等贤科技有限公司 | 语言能力评测方法、装置、系统、计算机设备及存储介质 |
CN111091008A (zh) * | 2019-05-28 | 2020-05-01 | 广东小天才科技有限公司 | 一种听写提示内容的确定方法及电子设备 |
CN111369966A (zh) * | 2018-12-06 | 2020-07-03 | 阿里巴巴集团控股有限公司 | 一种用于个性化语音合成的方法和装置 |
CN111639223A (zh) * | 2020-05-26 | 2020-09-08 | 广东小天才科技有限公司 | 一种用于口语练习的虚拟对象的音频生成方法及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208173A (ja) * | 2004-01-20 | 2005-08-04 | Victor Co Of Japan Ltd | 話速変換装置及び音声信号伝送システム |
US20070055528A1 (en) * | 2005-08-30 | 2007-03-08 | Dmitry Malyshev | Teaching aid and voice game system |
CN101604355A (zh) * | 2008-06-11 | 2009-12-16 | 联盈资讯股份有限公司 | 一种碎时学习系统及其方法 |
KR20120076617A (ko) * | 2010-12-07 | 2012-07-09 | 현대모비스 주식회사 | 어학 학습 기능을 구비한 avn 시스템 및 이를 이용한 어학 학습 서비스 제공 방법 |
CN106057023A (zh) * | 2016-06-03 | 2016-10-26 | 北京光年无限科技有限公司 | 一种面向智能机器人的儿童教学方法和装置 |
CN106297785A (zh) * | 2016-08-09 | 2017-01-04 | 董文亮 | 一种基于车联网的智能服务系统 |
CN107037589A (zh) * | 2017-03-30 | 2017-08-11 | 河南工学院 | 一种场景式外文翻译和学习系统 |
-
2018
- 2018-03-30 CN CN201810278851.0A patent/CN108492819B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208173A (ja) * | 2004-01-20 | 2005-08-04 | Victor Co Of Japan Ltd | 話速変換装置及び音声信号伝送システム |
US20070055528A1 (en) * | 2005-08-30 | 2007-03-08 | Dmitry Malyshev | Teaching aid and voice game system |
CN101604355A (zh) * | 2008-06-11 | 2009-12-16 | 联盈资讯股份有限公司 | 一种碎时学习系统及其方法 |
KR20120076617A (ko) * | 2010-12-07 | 2012-07-09 | 현대모비스 주식회사 | 어학 학습 기능을 구비한 avn 시스템 및 이를 이용한 어학 학습 서비스 제공 방법 |
CN106057023A (zh) * | 2016-06-03 | 2016-10-26 | 北京光年无限科技有限公司 | 一种面向智能机器人的儿童教学方法和装置 |
CN106297785A (zh) * | 2016-08-09 | 2017-01-04 | 董文亮 | 一种基于车联网的智能服务系统 |
CN107037589A (zh) * | 2017-03-30 | 2017-08-11 | 河南工学院 | 一种场景式外文翻译和学习系统 |
Non-Patent Citations (3)
Title |
---|
TERUHISA MISU等: "Situated language understanding for a spoken dialog system within vehicles", 《COMPUTER SPEECH & LANGUAGE》 * |
刘韵华: "基于碎片时间的第二语言微学习特征分析", 《现代语文(语言研究版)》 * |
马玉红: "移动微学习在高职英语教学中的应用与启示", 《陕西教育(高教)》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492126A (zh) * | 2018-11-02 | 2019-03-19 | 廊坊市森淼春食用菌有限公司 | 一种智能交互方法及装置 |
CN109492126B (zh) * | 2018-11-02 | 2022-03-01 | 廊坊市森淼春食用菌有限公司 | 一种智能交互方法及装置 |
CN111369966A (zh) * | 2018-12-06 | 2020-07-03 | 阿里巴巴集团控股有限公司 | 一种用于个性化语音合成的方法和装置 |
CN111091008A (zh) * | 2019-05-28 | 2020-05-01 | 广东小天才科技有限公司 | 一种听写提示内容的确定方法及电子设备 |
CN110491372A (zh) * | 2019-07-22 | 2019-11-22 | 平安科技(深圳)有限公司 | 一种反馈信息生成方法、装置、存储介质和智能设备 |
CN110503941A (zh) * | 2019-08-21 | 2019-11-26 | 北京隐虚等贤科技有限公司 | 语言能力评测方法、装置、系统、计算机设备及存储介质 |
CN110503941B (zh) * | 2019-08-21 | 2022-04-12 | 北京隐虚等贤科技有限公司 | 语言能力评测方法、装置、系统、计算机设备及存储介质 |
CN111639223A (zh) * | 2020-05-26 | 2020-09-08 | 广东小天才科技有限公司 | 一种用于口语练习的虚拟对象的音频生成方法及电子设备 |
CN111639223B (zh) * | 2020-05-26 | 2024-04-19 | 广东小天才科技有限公司 | 一种用于口语练习的虚拟对象的音频生成方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108492819B (zh) | 2020-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108492819A (zh) | 语言练习方法、装置、智能车载终端及存储介质 | |
JP6613347B2 (ja) | 情報をプッシュする方法及び装置 | |
CN108595443A (zh) | 同声翻译方法、装置、智能车载终端及存储介质 | |
CN108428446A (zh) | 语音识别方法和装置 | |
CN108281138B (zh) | 年龄判别模型训练及智能语音交互方法、设备及存储介质 | |
CN110047481A (zh) | 用于语音识别的方法和装置 | |
CN108364650B (zh) | 语音识别结果的调整装置及方法 | |
CN107393554A (zh) | 一种声场景分类中融合类间标准差的特征提取方法 | |
CN111261151B (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN108470034A (zh) | 一种智能设备服务提供方法及系统 | |
CN108062212A (zh) | 一种基于场景的语音操作方法及装置 | |
CN201919034U (zh) | 基于网络的语音提醒的系统 | |
CN112581938B (zh) | 基于人工智能的语音断点检测方法、装置和设备 | |
CN111178081B (zh) | 语义识别的方法、服务器、电子设备及计算机存储介质 | |
CN111916088B (zh) | 一种语音语料的生成方法、设备及计算机可读存储介质 | |
CN108039175A (zh) | 语音识别方法、装置及服务器 | |
CN108091323A (zh) | 用于自语音中识别情感的方法与装置 | |
CN108053023A (zh) | 一种自动式意图分类方法及装置 | |
CN112053692A (zh) | 语音识别处理方法、装置及存储介质 | |
Chakroun et al. | New approach for short utterance speaker identification | |
CN109887490A (zh) | 用于识别语音的方法和装置 | |
CN113658586A (zh) | 语音识别模型的训练方法、语音交互方法及装置 | |
CN108446403A (zh) | 语言练习方法、装置、智能车载终端及存储介质 | |
CN111261149B (zh) | 语音信息识别方法和装置 | |
US20070192097A1 (en) | Method and apparatus for detecting affects in speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |