CN105551493A - 儿童语音机器人数据处理方法、装置及儿童语音机器人 - Google Patents
儿童语音机器人数据处理方法、装置及儿童语音机器人 Download PDFInfo
- Publication number
- CN105551493A CN105551493A CN201510857710.0A CN201510857710A CN105551493A CN 105551493 A CN105551493 A CN 105551493A CN 201510857710 A CN201510857710 A CN 201510857710A CN 105551493 A CN105551493 A CN 105551493A
- Authority
- CN
- China
- Prior art keywords
- information
- response result
- robot
- obtains
- children speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000004044 response Effects 0.000 claims abstract description 170
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 28
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 28
- 230000026676 system process Effects 0.000 claims abstract description 27
- 230000008569 process Effects 0.000 claims abstract description 22
- 230000005540 biological transmission Effects 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 11
- 230000003993 interaction Effects 0.000 abstract description 8
- 238000007906 compression Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- KKIMDKMETPPURN-UHFFFAOYSA-N 1-(3-(trifluoromethyl)phenyl)piperazine Chemical compound FC(F)(F)C1=CC=CC(N2CCNCC2)=C1 KKIMDKMETPPURN-UHFFFAOYSA-N 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008131 children development Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种儿童语音机器人数据处理方法、装置及儿童语音机器人,其中方法包括:对接收的用户输入语音信息进行预处理,获得第一信息;将第一信息经网络模块上传至服务器;接收由服务器将第一信息发至问答系统处理后的应答结果,应答结果通过服务器按照预设协议发送;将应答结果进行解码及语音合成后输出。这种对用户输入语音信息进行处理并获取相应应答结果的方法,不受儿童语音机器人本地预存音频的局限,可极大的提高机器人与用户交互过程中的灵活性和智能性。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种儿童语音机器人数据处理方法、装置及儿童语音机器人。
背景技术
随着人们对玩具的可玩性要求越来越高,玩具向具有互动式的智能玩具发展,语言类玩具应运而生。
传统针对儿童开发的语音类玩具以早教机和故事机为主,支持用户手动操作按钮,以及通过简单的语音提示完成对本地固定语音的提取及输出。即:功能上实现输入语音与有限的预设语音条目进行匹配,技术实现上局限于将输入语音数据与预设的语音数据进行简单的波形匹配,并将相应预置的固定音频输出。
然而,现有的语音类玩具存在与用户语音沟通丰富度匮乏,数据处理灵活性不足,智能化程度低的问题。
发明内容
本发明提供儿童语音机器人数据处理方法、装置及儿童语音机器人,用以解决现有技术中的语音玩具只有固定音频输出,缺少灵活性且程度低的问题。
本发明第一方面提供一种儿童语音机器人数据处理方法,包括:
对接收的用户输入语音信息进行预处理,获得第一信息;
将第一信息经网络模块上传至服务器;
接收由服务器将第一信息发至问答系统处理后的应答结果,应答结果通过服务器按照预设协议发送;
将应答结果进行解码及语音合成后输出。
进一步的,对接收的用户输入语音信息进行预处理,获得第一信息,具体包括:
对用户输入语音信息进行录音,获得第一录音信息;
对第一录音信息进行数字编码并压缩,获得第一信息。
本发明第二方面提供一种儿童语音机器人数据处理方法,包括:
接收由儿童语音机器人预处理并经网络模块上传的第一信息;
将第一信息发至问答系统处理,获得应答结果;
将应答结果按照预设协议发送至儿童语音机器人,并由儿童语音机器人将应答结果进行解码及语音合成后输出。
进一步的,将第一信息发至问答系统处理,获得应答结果,具体包括:
将第一信息进行语音识别,获得第二信息;
将第二信息置于问答系统中进行语义解析,获得第三信息;
根据第三信息生成应答结果,应答结果为文本格式或语音格式。
本发明第三方面提供一种儿童语音机器人数据处理方法,包括:
儿童语音机器人对接收的用户输入语音信息进行预处理,获得第一信息,并将第一信息经网络模块上传至服务器;
服务器接收第一信息,并将第一信息发至问答系统处理,获得应答结果;
服务器将应答结果按照预设协议发送至儿童语音机器人;
儿童语音机器人接收应答结果,并将应答结果进行解码及语音合成后输出。
进一步,儿童语音机器人对接收的用户输入语音信息进行预处理,获得第一信息,具体包括:
儿童语音机器人对用户输入语音信息进行录音,获得第一录音信息;
儿童语音机器人对第一录音信息进行数字编码并压缩,获得第一信息。
进一步的,服务器接收第一信息,并将第一信息发至问答系统处理,获得应答结果,具体包括:
将第一信息进行语音识别,获得第二信息;
将第二信息置于问答系统中进行语义解析,获得第三信息;
根据第三信息生成应答结果,应答结果为文本格式或语音格式。
本发明第四方面提供一种儿童语音机器人数据处理装置,包括:
第一信息获取模块,用于对接收的用户输入语音信息进行预处理,获得第一信息;
第一信息上传模块,用于将第一信息经网络模块上传至服务器;
应答结果接收模块,用于接收由服务器将第一信息发至问答系统处理后的应答结果,应答结果通过服务器按照预设协议发送;
应答结果输出模块,用于将应答结果进行解码及语音合成后输出。
进一步的,第一信息获取模块具体包括:
第一录音信息获取子模块,用于对用户输入语音信息进行录音,获得第一录音信息;
第一录音信息处理子模块,用于对第一录音信息进行数字编码并压缩,获得第一信息。
本发明第五方面提供一种儿童语音机器人数据处理装置,包括:
第一信息接收模块,用于接收由儿童语音机器人预处理后并经网络模块上传的第一信息;
应答结果获取模块,用于将第一信息发至问答系统处理,获得应答结果;
应答结果发送模块,用于将应答结果按照预设协议发送至儿童语音机器人,并由儿童语音机器人将应答结果进行解码及语音合成后输出。
进一步的,应答结果获取模块具体包括:
语音识别子模块,用于将第一信息进行语音识别,获得第二信息;
语义解析子模块,用于将第二信息置于问答系统中进行语义解析,获得第三信息;
应答结果生成子模块,用于根据第三信息生成应答结果,应答结果为文本格式或语音格式。
本发明第六方面提供一种儿童语音机器人,包括:
机器人外壳,机器人外壳中设置有上位机及下位机,机器人外壳表面设置有录音设备及语音播放设备,其中,上位机包括处理器及存储器,下位机控制录音设备及语音播放设备;处理器通过总线与下位机相连;处理器与存储器之间通过总线相连;下位机通过总线与录音设备及语音播放设备相连;
存储器用于存放数据和程序;
录音设备用于对用户输入语音信息进行录音;
语音播放设备用于播放语音;
处理器用于执行存储器存储的程序,以执行上述第一方面提供的方法。
本发明提供的儿童语音机器人数据处理方法、装置及儿童语音机器人,机器人对接收的用户输入语音信息进行预处理,获得第一信息,然后将第一信息经网络模块上传至服务器,之后接收由服务器将第一信息发至问答系统处理后的应答结果,并将应答结果进行解码及语音合成后输出,这种对用户输入语音信息进行处理并获取相应应答结果的方法,不受儿童语音机器人本地预存音频的局限,可极大的提高机器人与用户交互过程中的灵活性和智能性。
附图说明
在下文中将基于实施例并参考附图来对本发明进行更详细的描述。其中:
图1为根据本发明实施例一的儿童语音机器人数据处理方法的流程示意图;
图2为根据本发明实施例二的儿童语音机器人数据处理方法的流程示意图;
图3为根据本发明实施例三的儿童语音机器人数据处理方法的流程示意图;
图4为根据本发明实施例四的儿童语音机器人数据处理方法的流程示意图;
图5为根据本发明实施例五的儿童语音机器人数据处理方法所应用的系统结构示意图;
图6为根据本发明实施例五的儿童语音机器人数据处理方法的流程示意图;
图7为根据本发明实施例六的儿童语音机器人数据处理方法的流程示意图;
图8为根据本发明实施例七的儿童语音机器人数据处理方法的流程示意图;
图9为根据本发明实施例八的儿童语音机器人数据处理装置的结构示意图;
图10为根据本发明实施例九的儿童语音机器人数据处理装置的结构示意图;
图11为根据本发明实施例十的儿童语音机器人数据处理装置的结构示意图;
图12为根据本发明实施例十一的儿童语音机器人的结构示意图。
在附图中,相同的部件使用相同的附图标记。附图并未按照实际的比例绘制。
具体实施方式
下面将结合附图对本发明作进一步说明。
实施例一
本实施例的执行主体为儿童语音机器人,本实施例中的方法用于儿童语音机器人中。
图1为根据本发明实施例一的儿童语音机器人数据处理方法的流程示意图,如图1所示,本发明提供一种儿童语音机器人数据处理方法,包括:
步骤101,对接收的用户输入语音信息进行预处理,获得第一信息。
具体的,第一信息可为语音信息或者文字信息,即儿童语音机器人(以下称为机器人)对于用户说话,或者文字输入都能接收,如可在机器人中设置一个录音模块,用于对用户的语音进行录音,或者在机器人中设置一个文字模块,用于用户输入文字,该文字模块可为触摸屏,可通过手写输入文字,也可为键盘,通过按键输入文字,还可为带图画的触摸屏,点击相应图画,文字模块自动产生相应文字。
步骤102,将第一信息经网络模块上传至服务器。
具体的,机器人获得第一信息后,通过网络模块将第一信息发送给服务器,在机器人中设置的网络模块,专门用于机器人与服务器之间的信息传输,机器人也可通过网络模块接收服务器发送过来的信息,此处的服务器可为云服务器。
步骤103,接收由服务器将第一信息发至问答系统处理后的应答结果,应答结果通过服务器按照预设协议发送。
具体的,机器人接收服务器发送过来的应答结果,其中,服务器接收到第一信息之后,将第一信息发至问答系统,获得应答结果后,再将应答结果发送给机器人。问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。预设协议为机器人与服务器之间通信的传送协议,例如可为传输控制协议/因特网互联协议(TransmissionControlProtocol/InternetProtocol,简称TCP/IP)、简单文件传输协议或称小型文件传输协议(TrivialFileTransferProtocol,简称TFTP)、动态主机配置协议(DynamicHostConfigurationProtocol,简称DHCP)、文件传输协议(FileTransferProtocol,简称FTP)等常用的传输协议。
步骤104,将应答结果进行解码及语音合成后输出。
具体的,为了便于传输,应答结果在传送时需要进行编码,机器人在收到该应答结果后,首先需要将其恢复到编码前的状态,即首先对应答结果解码,由于解码后的数据不能直接进行播放,所以还需要将解码后的应答结果进行语音合成之后再输出,即将应答结果以语音的形式输出,以完成对用户的应答处理。
本发明提供的儿童语音机器人数据处理方法,机器人对接收的用户输入语音信息进行预处理,获得第一信息,然后将第一信息经网络模块上传至服务器,之后接收由服务器将第一信息发至问答系统处理后的应答结果,并将应答结果进行解码及语音合成后输出,这种对用户输入语音信息进行处理并获取相应应答结果的方法,不受儿童语音机器人本地预存音频的局限,可极大的提高机器人与用户交互过程中的灵活性和智能性。
实施例二
本实施例是在上述实施例的基础上进行的补充说明。
图2为根据本发明实施例二的儿童语音机器人数据处理方法的流程示意图,如图2所示,本实施例提供一种儿童语音机器人数据处理方法,包括:
步骤201,对用户输入语音信息进行录音,获得第一录音信息。
具体的,用户在与机器人沟通时,机器人会对用户的输入语音信息进行录音,从而获得第一录音信息。
步骤202,对第一录音信息进行数字编码并压缩,获得第一信息。
具体的,第一录音信息无法直接发送到服务器,为了便于传输,需要对第一录音信息进行编码,使之成为数字信号,同时为了减少传输的数据量,提高传输速率,还需要对该数字信号进行压缩处理,以提高机器人对用户输入语音信息的反应速度。对第一录音信息进行数字编码并压缩后获得的结果称为第一信息。
步骤203,将第一信息经网络模块上传至服务器。
步骤204,接收由服务器将第一信息发至问答系统处理后的应答结果,应答结果通过服务器按照预设协议发送。
步骤205,将应答结果进行解码及语音合成后输出。
上述步骤203-步骤205具体可参见实施例一中步骤102-104的相应描述,在此不再赘述。
本发明提供的儿童语音机器人数据处理方法,通过对用户输入语音信息进行录音,然后进行数字编码并压缩处理,获得第一信息,以减少传输的数据量,提高传输速率,为用户输入语音信息上传服务器做好准备。之后将第一信息经网络模块上传至服务器后,接收由服务器返回的应答结果,并将应答结果进行解码及语音合成后输出,这种对用户输入语音信息进行处理并获取相应应答结果的方法,不受儿童语音机器人本地预存音频的局限,可极大的提高机器人与用户交互过程中的灵活性和智能性。
实施例三
本实施例的执行主体为服务器,本实施例中的方法用于服务器端。
图3为根据本发明实施例三的儿童语音机器人数据处理方法的流程示意图,如图3所示,本实施例提供一种儿童语音机器人数据处理方法,包括:
步骤301,接收由儿童语音机器人预处理并经网络模块上传的第一信息。
具体的,第一信息可为语音信息或者文字信息,由儿童语音机器人发送过来。本步骤可完成服务器接收第一信息,与实施例一中的步骤101是对应关系,步骤101可完成儿童语音机器人发送第一信息。服务器中也设置有一个网络模块,该网络模块专门用于服务器与儿童语音机器人之间的信息传输。
步骤302,将第一信息发至问答系统处理,获得应答结果。
具体的,服务器接收到第一信息后,发送到问答系统进行处理。问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。问答系统收到第一信息后,将按照问答系统本身的设定开始在自身数据库中进行搜索,以获得与第一信息对应的应答结果,应答结果可为语音信息或文字信息。
步骤303,将应答结果按照预设协议发送至儿童语音机器人,并由儿童语音机器人将应答结果进行解码及语音合成后输出。
具体的,此处预设协议与儿童语音机器人端的预设协议可相同,也可兼容,以便服务器与儿童语音机器人之间的信息传输能够安全可靠。在传送信息时,具体由服务器的网络模块将应答结果发送给儿童语音机器人的网络模块。当然应答结果在发送之前也需要进行编码,使之成为数字信号,同时为了减少传输的数据量,提高传输速率,还需要对该数字信号进行压缩处理。
本发明提供的儿童语音机器人数据处理方法用于服务器端,服务器接收儿童语音机器人上传的第一信息后,将第一信息发送至问答系统,由问答系统处理获得应答结果,服务器再将应答结果发送回儿童语音机器人,这种对儿童语音机器人发送来的第一信息进行处理并获取相应应答结果的方法,由于应答结果是通过问答系统获得的,而问答系统中的数据库可以包含大量的信息,并且数据库还可实时更新,所以本发明提供的方法不受儿童语音机器人本地预存音频的局限,可极大的提高机器人与用户交互过程中的灵活性和智能性。
实施例四
本实施例是在实施例三的基础上进行的补充说明。
图4为根据本发明实施例四的儿童语音机器人数据处理方法的流程示意图,如图4所示,本实施例提供一种儿童语音机器人数据处理方法,包括:
步骤401,接收由儿童语音机器人预处理并经网络模块上传的第一信息。
本步骤与实施例三的步骤301相同,具体详情可参见步骤301中的描述。
步骤402,将第一信息进行语音识别,获得第二信息。
具体的,语音识别的目的是将用户语音中的词汇内容转换为计算机可读的输入,例如二进制编码或者字符序列。虽然儿童语音机器人发送过来的第一信息已经经过预处理,即第一信息为经过压缩处理的数字信号,但是还不能为计算机可读,所以此处服务器还需对接收到的第一信息进行语音识别,使其转换为计算机可读的信息,即第二信息。
步骤403,将第二信息置于问答系统中进行语义解析,获得第三信息。
具体的,将第二信息输入问答系统中进行语义解析,即对第二信息进行关键字识别,以便进行后续处理,第三信息即为关键字信息。此处的问答系统可置于服务器中,也可作为独立于服务器的问答系统而存在。
步骤404,根据第三信息生成应答结果,应答结果为文本格式或语音格式。
具体的,根据第三信息在问答系统中搜索,问答系统中设置有数据库,数据库可实时更新。在问答系统数据库中根据第三信息搜索到的结果可能有多个,此时需要对这多个结果进行分析判断,最后选定最佳的一个结果作为应答结果。应答结果为文本格式或语音格式,即应答结果为文字或者语音。
步骤405,将应答结果按照预设协议发送至儿童语音机器人,并由儿童语音机器人将应答结果进行解码及语音合成后输出。
本步骤与实施例三的步骤303相同,具体详情可参见步骤303中的描述。
实施例五
本实施例提供一种儿童语音机器人数据处理方法,该方法应用于儿童语音机器人和服务器组成的系统中,图5为根据本发明实施例五的儿童语音机器人数据处理方法所应用的系统结构示意图,如图5所示,该系统包括:儿童语音机器人1101和服务器1102。
图6为根据本发明实施例五的儿童语音机器人数据处理方法的流程示意图,如图6所示,本发明提供一种儿童语音机器人数据处理方法,包括:
步骤501,儿童语音机器人1101对接收的用户11输入语音信息进行预处理,获得第一信息,并将第一信息经网络模块上传至服务器1102。
具体的,第一信息可为语音信息或者文字信息,即儿童语音机器人1101(以下称为机器人)对于用户11说话,或者文字输入都能接收,如可在机器人1101中设置一个录音模块,用于对用户11的语音进行录音,或者在机器人1101中设置一个文字模块,用于用户11输入文字,该文字模块可为触摸屏,可通过手写输入文字,也可为键盘,通过按键输入文字,还可为带图画的触摸屏,点击相应图画,文字模块自动产生相应文字。
机器人1101获得第一信息后,通过网络模块将第一信息发送给服务器1102,在机器人1101中设置的网络模块,专门用于机器人1101与服务器1102之间的信息传输,机器人1101也可通过网络模块接收服务器1102发送过来的信息。
步骤502,服务器1102接收第一信息,并将第一信息发至问答系统处理,获得应答结果。
具体的,第一信息可为语音信息或者文字信息,由机器人1101发送过来。服务器1102中也设置有一个网络模块,该网络模块专门用于服务器1102与机器人1101之间的信息传输。
服务器1102接收到第一信息后,发送到问答系统进行处理。问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户11用自然语言提出的问题。问答系统收到第一信息后,将按照问答系统本身的设定开始在自身数据库中进行搜索,以获得与第一信息对应的应答结果,应答结果可为语音信息或文字信息。
步骤503,服务器1102将应答结果按照预设协议发送至儿童语音机器人1101。
具体的,服务器1102端的预设协议与机器人1101端的预设协议可相同,也可兼容,以便服务器1102与机器人1101之间的信息传输能够安全可靠。在传送信息时,具体由服务器1102的网络模块将应答结果发送给儿童语音机器人1101的网络模块。当然应答结果在发送之前也需要进行编码,使之成为数字信号,同时为了减少传输的数据量,提高传输速率,还需要对该数字信号进行压缩处理。
步骤504,儿童语音机器人1101接收应答结果,并将应答结果进行解码及语音合成后输出。
具体的,机器人接收服务器1102发送过来的应答结果,为了便于传输,应答结果在传送时需要进行编码,机器人1101在收到该应答结果后,首先需要将其恢复到编码前的状态,即首先对应答结果解码,由于解码后的数据不能直接进行播放,所以还需要将解码后的应答结果进行语音合成之后再输出,即将应答结果以语音的形式输出,以完成对用户11的应答处理。
实施例六
本实施例是在上述实施例五的基础上进行的补充说明。
图7为根据本发明实施例六的儿童语音机器人数据处理方法的流程示意图,如图7所示,本发明提供一种儿童语音机器人数据处理方法,包括:
步骤601,儿童语音机器人对用户输入语音信息进行录音,获得第一录音信息。
具体的,用户在与机器人沟通时,机器人会对用户的输入语音信息进行录音,从而获得第一录音信息。
步骤602,儿童语音机器人对第一录音信息进行数字编码并压缩,获得第一信息。
具体的,第一录音信息无法直接发送到服务器,为了便于传输,需要对第一录音信息进行编码,使之成为数字信号,同时为了减少传输的数据量,提高传输速率,还需要对该数字信号进行压缩处理,以提高机器人对用户输入语音信息的反应速度。对第一录音信息进行数字编码并压缩后获得的结果称为第一信息。
步骤603,儿童语音机器人将第一信息经网络模块上传至服务器。
具体的,机器人获得第一信息后,通过网络模块将第一信息发送给服务器,在机器人中设置的网络模块,专门用于机器人与服务器之间的信息传输,机器人也可通过网络模块接收服务器发送过来的信息。
步骤604,服务器将第一信息进行语音识别,获得第二信息。
具体的,语音识别的目的是将用户语音中的词汇内容转换为计算机可读的输入,例如二进制编码或者字符序列。虽然儿童语音机器人发送过来的第一信息已经经过预处理,即第一信息为经过压缩处理的数字信号,但是还不能为计算机可读,所以此处服务器还需对接收到的第一信息进行语音识别,使其转换为计算机可读的信息,即第二信息。
步骤605,服务器将第二信息置于问答系统中进行语义解析,获得第三信息。
具体的,将第二信息输入问答系统中进行语义解析,即对第二信息进行关键字识别,以便进行后续处理,第三信息即为关键字信息。此处的问答系统可置于服务器中,也可作为独立于服务器的问答系统而存在。
步骤606,服务器根据第三信息生成应答结果,应答结果为文本格式或语音格式。
具体的,根据第三信息在问答系统中搜索,问答系统中设置有数据库,数据库可实时更新。在问答系统数据库中根据第三信息搜索到的结果可能有多个,此时需要对这多个结果进行分析判断,最后选定最佳的一个结果作为应答结果。应答结果为文本格式或语音格式,即应答结果为文字或者语音。
步骤607,服务器将应答结果按照预设协议发送至儿童语音机器人。
本步骤与实施例五中步骤503一致,在此不再赘述。
步骤608,儿童语音机器人接收应答结果,并将应答结果进行解码及语音合成后输出。
本步骤与实施例五中步骤504一致,在此不再赘述。
实施例七
本实施例是与实施例一对应的装置实施例,用于执行实施例一中的儿童语音机器人数据处理方法。
图8为根据本发明实施例七的儿童语音机器人数据处理系统的装置示意图,如图8所示,本发明提供一种儿童语音机器人数据处理装置,包括:第一信息获取模块701、第一信息上传模块702、应答结果接收模块703和应答结果输出模块704。
其中,第一信息获取模块701,用于对接收的用户输入语音信息进行预处理,获得第一信息;
第一信息上传模块702,用于将第一信息经网络模块上传至服务器;
应答结果接收模块703,用于接收由服务器将第一信息发至问答系统处理后的应答结果,应答结果通过服务器按照预设协议发送;
应答结果输出模块704,用于将应答结果进行解码及语音合成后输出。
本实施例是与实施例一对应的装置实施例,具体可参见实施例一中相应的描述,在此不再赘述。
本发明提供的儿童语音机器人数据处理装置,第一信息获取模块701对接收的用户输入语音信息进行预处理,获得第一信息,然后第一信息上传模块702将第一信息经网络模块上传至服务器,之后应答结果接收模块703接收由服务器将第一信息发至问答系统处理后的应答结果,应答结果输出模块704将应答结果进行解码及语音合成后输出,这种对用户输入语音信息进行处理并获取相应应答结果的装置,不受儿童语音机器人本地预存音频的局限,可极大的提高机器人与用户交互过程中的灵活性和智能性。
实施例八
本实施例是在实施例七的基础上进行的补充说明。
本实施例是与实施例二对应的装置实施例,用于执行实施例二中的儿童语音机器人数据处理方法。
图9为根据本发明实施例八的儿童语音机器人数据处理装置的结构示意图,如图9所示,本发明提供一种儿童语音机器人数据处理装置,包括:第一信息获取模块801、第一信息上传模块802、应答结果接收模块803和应答结果输出模块804。
第一信息获取模块801,用于对接收的用户输入语音信息进行预处理,获得第一信息。
具体的,第一信息获取模块801包括:第一录音信息获取子模块8011和第一录音信息处理子模块8012。其中,第一录音信息获取子模块8011,用于对用户输入语音信息进行录音,获得第一录音信息。第一录音信息处理子模块8012,用于对第一录音信息进行数字编码并压缩,获得第一信息。
第一信息上传模块802,用于将第一信息经网络模块上传至服务器;
应答结果接收模块803,用于接收由服务器将第一信息发至问答系统处理后的应答结果,应答结果通过服务器按照预设协议发送;
应答结果输出模块804,用于将应答结果进行解码及语音合成后输出。
本实施例是与实施例一对应的装置实施例,具体可参见实施例一中相应的描述,在此不再赘述。
本发明提供的儿童语音机器人数据处理装置,通过第一录音信息获取子模块8011对用户输入语音信息进行录音,然后利用第一录音信息处理子模块8012进行数字编码并压缩,获得第一信息,以减少传输的数据量,提高传输速率,为用户输入语音信息上传服务器做好准备。之后第一信息上传模块802将第一信息经网络模块上传至服务器,应答结果接收模块803接收由服务器返回的应答结果,应答结果输出模块804将应答结果进行解码及语音合成后输出,这种对用户输入语音信息进行处理并获取相应应答结果的装置,不受儿童语音机器人本地预存音频的局限,可极大的提高机器人与用户交互过程中的灵活性和智能性。
实施例九
本实施例是与实施例三对应的装置实施例,用于执行实施例三中的儿童语音机器人数据处理方法。
图10为根据本发明实施例九的儿童语音机器人数据处理装置的结构示意图,如图10所示,本发明提供一种儿童语音机器人数据处理装置,包括:第一信息接收模块901、应答结果获取模块902和应答结果发送模块903。
其中,第一信息接收模块901,用于接收由儿童语音机器人预处理后并经网络模块上传的第一信息。
应答结果获取模块902,用于将第一信息发至问答系统处理,获得应答结果。
应答结果发送模块903,用于将应答结果按照预设协议发送至儿童语音机器人,并由儿童语音机器人将应答结果进行解码及语音合成后输出。
本实施例是与实施例三对应的装置实施例,具体可参见实施例三中相应的描述,在此不再赘述。
实施例十
本实施例是在实施例九的基础上进行的补充说明。
本实施例是与实施例四对应的装置实施例,用于执行实施例四中的儿童语音机器人数据处理方法。
图11为根据本发明实施例十的儿童语音机器人数据处理装置的结构示意图,如图11所示,本发明提供一种儿童语音机器人数据处理装置,包括:第一信息接收模块1001、应答结果获取模块1002和应答结果发送模块1003。
其中,第一信息接收模块1001,用于接收由儿童语音机器人预处理后并经网络模块上传的第一信息。
应答结果获取模块1002,用于将第一信息发至问答系统处理,获得应答结果。
具体的,应答结果获取模块1002包括:语音识别子模块10021、语义解析子模块10022和应答结果生成子模块10023。
语音识别子模块10021,用于将所述第一信息进行语音识别,获得第二信息。
语义解析子模块10022,用于将所述第二信息置于所述问答系统中进行语义解析,获得第三信息。
应答结果生成子模块10023,用于根据所述第三信息生成应答结果,所述应答结果为文本格式或语音格式。
应答结果发送模块1003,用于将应答结果按照预设协议发送至儿童语音机器人,并由儿童语音机器人将应答结果进行解码及语音合成后输出。
本实施例是与实施例四对应的系统实施例,具体可参见实施例四中相应的描述,在此不再赘述。
本发明提供的儿童语音机器人数据处理装置,第一信息接收模块1001接收儿童语音机器人上传的第一信息后,语音识别子模块10021将第一信息进行语音识别后发送到语义解析子模块10022中进行语义解析,应答结果生成子模块10023利用问答系统生成应答结果后,应答结果发送模块1003将应答结果发送给儿童语音机器人,由于应答结果是通过问答系统获得的,而问答系统中的数据库可以包含大量的信息,并且数据库还可实时更新,所以本发明提供的装置不受儿童语音机器人本地预存音频的局限,可极大的提高机器人与用户交互过程中的灵活性和智能性。
实施例十一
图12为根据本发明实施例十一的儿童语音机器人的结构示意图,如图12所示,本发明提供一种儿童语音机器人包括:机器人外壳13,机器人外壳13中设置有上位机1301及下位机1302,机器人外壳13表面设置有录音设备1303及语音播放设备1304,其中,上位机1301包括处理器1及存储器2,下位机1302控制录音设备1303及语音播放设备1304;处理器1通过总线3与下位机1302相连;下位机1302通过总线3与录音设备1303及语音播放设备1304相连;存储器2用于存放数据和程序;录音设备1303用于对用户输入语音信息进行录音;语音播放设备1304用于播放语音;处理器1用于执行存储器2存储的程序,以执行上述实施例一或实施例二中的方法。
虽然已经参考优选实施例对本发明进行了描述,但在不脱离本发明的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,各个实施例中所提到的各项技术特征均可以任意方式组合起来。本发明并不局限于文中公开的特定实施例,而是包括落入权利要求的范围内的所有技术方案。
Claims (12)
1.一种儿童语音机器人数据处理方法,其特征在于,包括:
对接收的用户输入语音信息进行预处理,获得第一信息;
将所述第一信息经网络模块上传至服务器;
接收由所述服务器将所述第一信息发至问答系统处理后的应答结果,所述应答结果通过所述服务器按照预设协议发送;
将所述应答结果进行解码及语音合成后输出。
2.根据权利要求1所述的儿童语音机器人数据处理方法,其特征在于,所述对接收的用户输入语音信息进行预处理,获得第一信息,具体包括:
对所述用户输入语音信息进行录音,获得第一录音信息;
对所述第一录音信息进行数字编码并压缩,获得所述第一信息。
3.一种儿童语音机器人数据处理方法,其特征在于,包括:
接收由儿童语音机器人预处理并经网络模块上传的第一信息;
将所述第一信息发至问答系统处理,获得应答结果;
将所述应答结果按照预设协议发送至所述儿童语音机器人,并由所述儿童语音机器人将所述应答结果进行解码及语音合成后输出。
4.根据权利要求3所述的儿童语音机器人数据处理方法,其特征在于,将所述第一信息发至问答系统处理,获得应答结果,具体包括:
将所述第一信息进行语音识别,获得第二信息;
将所述第二信息置于所述问答系统中进行语义解析,获得第三信息;
根据所述第三信息生成应答结果,所述应答结果为文本格式或语音格式。
5.一种儿童语音机器人数据处理方法,其特征在于,包括:
所述儿童语音机器人对接收的用户输入语音信息进行预处理,获得第一信息,并将所述第一信息经网络模块上传至服务器;
所述服务器接收所述第一信息,并将所述第一信息发至问答系统处理,获得应答结果;
所述服务器将所述应答结果按照预设协议发送至所述儿童语音机器人;
所述儿童语音机器人接收所述应答结果,并将所述应答结果进行解码及语音合成后输出。
6.根据权利要求5所述的儿童语音机器人数据处理方法,其特征在于,所述儿童语音机器人对接收的用户输入语音信息进行预处理,获得第一信息,具体包括:
所述儿童语音机器人对所述用户输入语音信息进行录音,获得第一录音信息;
所述儿童语音机器人对所述第一录音信息进行数字编码并压缩,获得第一信息。
7.根据权利要求5所述的儿童语音机器人数据处理方法,其特征在于,所述服务器接收所述第一信息,并将所述第一信息发至问答系统处理,获得应答结果,具体包括:
将所述第一信息进行语音识别,获得第二信息;
将所述第二信息置于所述问答系统中进行语义解析,获得第三信息;
根据所述第三信息生成应答结果,所述应答结果为文本格式或语音格式。
8.一种儿童语音机器人数据处理装置,其特征在于,包括:
第一信息获取模块,用于对接收的用户输入语音信息进行预处理,获得第一信息;
第一信息上传模块,用于将所述第一信息经网络模块上传至服务器;
应答结果接收模块,用于接收由所述服务器将所述第一信息发至问答系统处理后的应答结果,所述应答结果通过所述服务器按照预设协议发送;
应答结果输出模块,用于将所述应答结果进行解码及语音合成后输出。
9.根据权利要求8所述的儿童语音机器人数据处理装置,其特征在于,所述第一信息获取模块具体包括:
第一录音信息获取子模块,用于对所述用户输入语音信息进行录音,获得第一录音信息;
第一录音信息处理子模块,用于对所述第一录音信息进行数字编码并压缩,获得第一信息。
10.一种儿童语音机器人数据处理系统装置,其特征在于,包括:
第一信息接收模块,用于接收由儿童语音机器人预处理后并经网络模块上传的第一信息;
应答结果获取模块,用于将所述第一信息发至问答系统处理,获得应答结果;
应答结果发送模块,用于将所述应答结果按照预设协议发送至所述儿童语音机器人,并由所述儿童语音机器人将所述应答结果进行解码及语音合成后输出。
11.根据权利要求10所述的儿童语音机器人数据处理装置,其特征在于,所述应答结果获取模块具体包括:
语音识别子模块,用于将所述第一信息进行语音识别,获得第二信息;
语义解析子模块,用于将所述第二信息置于所述问答系统中进行语义解析,获得第三信息;
应答结果生成子模块,用于根据所述第三信息生成应答结果,所述应答结果为文本格式或语音格式。
12.一种儿童语音机器人,其特征在于,包括:
机器人外壳,所述机器人外壳中设置有上位机及下位机,所述机器人外壳表面设置有录音设备及语音播放设备,其中,所述上位机包括处理器及存储器,所述下位机控制录音设备及语音播放设备;所述处理器通过总线与所述下位机相连;所述下位机通过所述总线与所述录音设备及所述语音播放设备相连;
所述存储器用于存放数据和程序;
所述录音设备用于对用户输入语音信息进行录音;
所述语音播放设备用于播放语音;
所述处理器用于执行所述存储器存储的所述程序,以执行所述权利要求1或2所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510857710.0A CN105551493A (zh) | 2015-11-30 | 2015-11-30 | 儿童语音机器人数据处理方法、装置及儿童语音机器人 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510857710.0A CN105551493A (zh) | 2015-11-30 | 2015-11-30 | 儿童语音机器人数据处理方法、装置及儿童语音机器人 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105551493A true CN105551493A (zh) | 2016-05-04 |
Family
ID=55830642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510857710.0A Pending CN105551493A (zh) | 2015-11-30 | 2015-11-30 | 儿童语音机器人数据处理方法、装置及儿童语音机器人 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105551493A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202238A (zh) * | 2016-06-30 | 2016-12-07 | 马根昌 | 真实人物模拟方法 |
CN106952646A (zh) * | 2017-02-27 | 2017-07-14 | 深圳市朗空亿科科技有限公司 | 一种基于自然语言的机器人交互方法和系统 |
CN107028274A (zh) * | 2017-04-11 | 2017-08-11 | 重庆银钢科技(集团)有限公司 | 一种头盔及利用头盔进行互动的方法 |
CN107644639A (zh) * | 2016-07-21 | 2018-01-30 | 北京快乐智慧科技有限责任公司 | 一种语音交互的方法和系统 |
CN107784879A (zh) * | 2017-11-01 | 2018-03-09 | 北京酷我科技有限公司 | 一种故事内容交互式播放系统及方法 |
CN107995249A (zh) * | 2016-10-27 | 2018-05-04 | 中兴通讯股份有限公司 | 一种语音播报的方法和装置 |
WO2018102980A1 (zh) * | 2016-12-06 | 2018-06-14 | 吉蒂机器人私人有限公司 | 语音交互方法、装置及系统 |
CN109524001A (zh) * | 2018-12-28 | 2019-03-26 | 北京金山安全软件有限公司 | 一种信息处理方法、装置及儿童穿戴设备 |
CN111524508A (zh) * | 2019-02-03 | 2020-08-11 | 上海蔚来汽车有限公司 | 语音对话系统以及语音对话实现方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030038921A (ko) * | 2001-11-07 | 2003-05-17 | 주식회사 보이스콤넷 | 독립적 음성처리를 위한 음성인식 시스템 |
CN102831482A (zh) * | 2012-08-01 | 2012-12-19 | 浙江兴旺宝明通网络有限公司 | 针对泵阀行业的一种基于智能问答的启发式询问系统 |
CN103198155A (zh) * | 2013-04-27 | 2013-07-10 | 俞志晨 | 一种基于移动终端的智能问答交互系统及方法 |
CN104424290A (zh) * | 2013-09-02 | 2015-03-18 | 佳能株式会社 | 基于语音的问答系统和用于交互式语音系统的方法 |
CN104809197A (zh) * | 2015-04-24 | 2015-07-29 | 同程网络科技股份有限公司 | 基于智能机器人的在线问答方法 |
-
2015
- 2015-11-30 CN CN201510857710.0A patent/CN105551493A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030038921A (ko) * | 2001-11-07 | 2003-05-17 | 주식회사 보이스콤넷 | 독립적 음성처리를 위한 음성인식 시스템 |
CN102831482A (zh) * | 2012-08-01 | 2012-12-19 | 浙江兴旺宝明通网络有限公司 | 针对泵阀行业的一种基于智能问答的启发式询问系统 |
CN103198155A (zh) * | 2013-04-27 | 2013-07-10 | 俞志晨 | 一种基于移动终端的智能问答交互系统及方法 |
CN104424290A (zh) * | 2013-09-02 | 2015-03-18 | 佳能株式会社 | 基于语音的问答系统和用于交互式语音系统的方法 |
CN104809197A (zh) * | 2015-04-24 | 2015-07-29 | 同程网络科技股份有限公司 | 基于智能机器人的在线问答方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202238A (zh) * | 2016-06-30 | 2016-12-07 | 马根昌 | 真实人物模拟方法 |
CN107644639A (zh) * | 2016-07-21 | 2018-01-30 | 北京快乐智慧科技有限责任公司 | 一种语音交互的方法和系统 |
CN107995249A (zh) * | 2016-10-27 | 2018-05-04 | 中兴通讯股份有限公司 | 一种语音播报的方法和装置 |
WO2018102980A1 (zh) * | 2016-12-06 | 2018-06-14 | 吉蒂机器人私人有限公司 | 语音交互方法、装置及系统 |
CN109429522A (zh) * | 2016-12-06 | 2019-03-05 | 吉蒂机器人私人有限公司 | 语音交互方法、装置及系统 |
CN106952646A (zh) * | 2017-02-27 | 2017-07-14 | 深圳市朗空亿科科技有限公司 | 一种基于自然语言的机器人交互方法和系统 |
CN107028274A (zh) * | 2017-04-11 | 2017-08-11 | 重庆银钢科技(集团)有限公司 | 一种头盔及利用头盔进行互动的方法 |
CN107784879A (zh) * | 2017-11-01 | 2018-03-09 | 北京酷我科技有限公司 | 一种故事内容交互式播放系统及方法 |
CN109524001A (zh) * | 2018-12-28 | 2019-03-26 | 北京金山安全软件有限公司 | 一种信息处理方法、装置及儿童穿戴设备 |
CN111524508A (zh) * | 2019-02-03 | 2020-08-11 | 上海蔚来汽车有限公司 | 语音对话系统以及语音对话实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105551493A (zh) | 儿童语音机器人数据处理方法、装置及儿童语音机器人 | |
JP2019102063A (ja) | ページ制御方法および装置 | |
JP2021103328A (ja) | 音声変換方法、装置及び電子機器 | |
US10930288B2 (en) | Mobile device for speech input and text delivery | |
CN104485105A (zh) | 一种电子病历生成方法和电子病历系统 | |
CN104488027A (zh) | 声音处理系统以及终端装置 | |
CN103730116A (zh) | 在智能手表上实现智能家居设备控制的系统及其方法 | |
CN107040452B (zh) | 一种信息处理方法、装置和计算机可读存储介质 | |
CN101502094A (zh) | 用于手语图形解释器的方法和系统 | |
WO2020253064A1 (zh) | 语音的识别方法及装置、计算机设备、存储介质 | |
CN103474068A (zh) | 实现语音命令控制的方法、设备及系统 | |
US11749255B2 (en) | Voice question and answer method and device, computer readable storage medium and electronic device | |
WO2014026629A1 (zh) | 多媒体教育平台的实现方法及多媒体教育平台系统 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN103744836A (zh) | 一种人机对话方法及装置 | |
CN106896933B (zh) | 将语音输入转换成文本输入的方法、装置和语音输入设备 | |
WO2021227308A1 (zh) | 一种视频资源的生成方法和装置 | |
CN101763756A (zh) | 基于网络的交互式智能外语听写训练系统和方法 | |
CN104932862A (zh) | 基于语音识别的多角色交互方法 | |
CN102347026B (zh) | 基于自然语音识别的音频、视频或音视频点播方法和系统 | |
CN101114283A (zh) | 旅游机 | |
CN114064943A (zh) | 会议管理方法、装置、存储介质及电子设备 | |
CN110633357A (zh) | 语音交互方法、装置、设备和介质 | |
CN113542797A (zh) | 视频播放中的互动方法、装置及计算机可读存储介质 | |
CN108766429B (zh) | 语音交互方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160504 |
|
RJ01 | Rejection of invention patent application after publication |