CN106782547A - 一种基于语音识别的机器人语义识别系统 - Google Patents

一种基于语音识别的机器人语义识别系统 Download PDF

Info

Publication number
CN106782547A
CN106782547A CN201510819404.8A CN201510819404A CN106782547A CN 106782547 A CN106782547 A CN 106782547A CN 201510819404 A CN201510819404 A CN 201510819404A CN 106782547 A CN106782547 A CN 106782547A
Authority
CN
China
Prior art keywords
language
user
semantics recognition
identified
semantics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510819404.8A
Other languages
English (en)
Other versions
CN106782547B (zh
Inventor
祝铭明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yutou Technology Hangzhou Co Ltd
Original Assignee
Yutou Technology Hangzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yutou Technology Hangzhou Co Ltd filed Critical Yutou Technology Hangzhou Co Ltd
Priority to CN201510819404.8A priority Critical patent/CN106782547B/zh
Publication of CN106782547A publication Critical patent/CN106782547A/zh
Application granted granted Critical
Publication of CN106782547B publication Critical patent/CN106782547B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于语音识别的机器人语义识别系统,包括:语音识别单元,用于识别用户的语音信息,并将所述语音信息转化成待识别的自然语言;语言接收单元,用于接收所述待识别的自然语言;语义识别单元,用于识别所述语言接收单元接收的所述待识别的自然语言,并反馈关联于所述待识别的自然语言的多个语义识别结果;语义确认单元,根据用户语言习惯和与所述待识别的自然语言的相似度大小从所述语义识别单元反馈的多个语义识别结果中确认最终的语义识别结果。上述技术方案的有益效果:使用户操作机器人更加方便,也使得机器人的可操作性更好更智能化。

Description

一种基于语音识别的机器人语义识别系统
技术领域
本发明涉及机器人语义识别,尤其涉及一种基于语音识别的机器人语义识别系统。
背景技术
目前,很多家庭都拥有机器人,但是很多时候机器人并不能准确识别用户对其发出的指示,使用户操作机器人不方便,这样的机器人并不能满足用户对其智能化方便性方面的要求。
发明内容
针对现有的机器人语义识别技术存在的上述问题,现提供一种基于语音识别的机器人语义识别系统的技术方案,具体如下:
一种基于语音识别的机器人语义识别系统,其中,包括:
语音识别单元,用于识别用户的语音信息,并将所述语音信息转化成待识别的自然语言;
语言接收单元,用于接收所述待识别的自然语言;
语义识别单元,用于识别所述语言接收单元接收的所述待识别的自然语言,并反馈关联于所述待识别的自然语言的多个语义识别结果;
语义确认单元,根据用户语言习惯和与所述待识别的自然语言的相似度大小从所述语义识别单元反馈的多个语义识别结果中确认最终的语义识别结果。
优选的,所述语义识别系统还包括:
用户语言存储单元,用于存储所述语义确认单元确认的最终的语义识别结果。
优选的,所述语义识别系统还包括:
用户语言习惯创建单元,提取所述用户语言存储单元中最终的语义识别结果中的高频句式特征和高频关键词创建所述用户语言习惯。
优选的,所述语义确认单元包括:
第一排序模块,根据与所述待识别语言的相似度对所述语义识别单元反馈的多个语义识别结果进行排序,即生成语义相似表;
第二排序模块,根据所述用户语言习惯,对所述第一排序模块生成的所述语义相似表进行综合排序,并将综合排序最前面的三个语义识别结果生成语义综合表;
优选的,所述语义确认单元还包括:
语音反馈模块,根据所述语义综合表中关联于所述待识别的自然语言的语义识别结果生成反馈语言,并通过所述语音识别单元转化成反馈语音;
用户确认模块,用户确认关联于所述语义综合表的所述反馈语音与所述待识别的自然语言一致/不一致。
优选的,所述用户确认模块中,如用户确认关联于所述语义综合表的所述反馈语音与所述待识别的自然语言一致,则将所述反馈语言相对应的所述反馈语言存入所述用户语言存储单元。
优选的,所述用户确认模块中,如用户确认关联于所述语义综合表的所述反馈语音与所述待识别的自然语言均不一致,则所述语义识别系统提示用户重新录入语音。
上述技术方案的有益效果:提供一种基于语音识别的机器人语义识别系统,使用户操作机器人更加方便,也使得机器人的可操作性更好更智能化。
附图说明
图1为本发明的较佳的实施例中,一种基于语音识别的机器人语义识别系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
本发明的较佳的实施例中,基于现有技术中存在的上述问题,提供一种基于语音识别的机器人语义识别系统1,其结构如图1,具体包括:
语音识别单元2,用于识别用户的语音信息,并将语音信息转化成待识别的自然语言;
语言接收单元3,用于接收待识别的自然语言;
语义识别单元4,用于识别语言接收单元3接收的待识别的自然语言,并反馈关联于待识别的自然语言的多个语义识别结果;
语义确认单元5,根据用户语言习惯和与待识别的自然语言的相似度大小从语义识别单元4反馈的多个语义识别结果中确认最终的语义识别结果。
在上述较佳的实施例中,首先,语音识别单元2对用户发出的语音信息进行识别并转化成自然语言,即待识别的自然语言;然后,语义识别单元4对语言接收单元3接收的待识别的自然语言进行语义识别,并反馈关联于待识别的自然语言的多个语义识别结果;,然后,语义确认单元5中的第一排序模块51根据与待识别的自然语言的相似度进行第一次排序生成语义相似表,第二排序模块52于语义相似表基础上根据用户语言习惯进行第二次排序生成语义综合表;然后,语音反馈模块53根据语义综合表生成与之关联的反馈语言,并转化成于用户可听见的反馈语音;最后,在用户确认模块54中,由用户来确认最终的识别结果。
本发明的较佳的实施例中,语义识别系统1还包括:
用户语言存储单元6,用于存储语义确认单元确认的最终的语义识别结果。
本发明的较佳的实施例中,语义识别系统1还包括:
用户语言习惯创建单元7,提取用户语言存储单元6中最终的语义识别结果中的高频句式特征和高频关键词创建用户语言习惯。机器人记录用户的语言习惯,更方便于分析和执行用户录入的语音指令。
本发明的较佳的实施例中,语义确认单元5包括:
第一排序模块51,根据与待识别语言的相似度对语义识别单元反馈的多个语义识别结果进行排序,即生成语义相似表;
第二排序模块52,根据用户语言习惯,对第一排序模块51生成的语义相似表进行综合排序,并将综合排序最前面的三个语义识别结果生成语义综合表;
本发明的较佳的实施例中,语义确认单元5还包括:
语音反馈模块53,根据语义综合表中关联于待识别的自然语言的语义识别结果生成反馈语言,并通过语音识别单元2转化成反馈语音;
用户确认模块54,用户确认关联于语义综合表的反馈语音与待识别的自然语言一致/不一致。
本发明的较佳的实施例中,用户确认模块54中,如用户确认关联于语义综合表的反馈语音与待识别的自然语言一致,则将反馈语言相对应的反馈语言存入用户语言存储单元6。
本发明的较佳的实施例中,用户确认模块54中,如用户确认关联于语义综合表的反馈语音与待识别的自然语言均不一致,则语义识别系统1提示用户重新录入语音。
在上述较佳的实施例中,用户亲自确认自己发出的语音信息,这大大提高了语义识别系统语义识别的准确性;同时,如果用户想取消之前发出的语音指令,则可以直接否定掉关联于语义综合表的所有反馈语音,然后重新录入语音信息,提高了机器人的可操作性和方便性。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (7)

1.一种基于语音识别的机器人语义识别系统,其特征在于,包括:
语音识别单元,用于识别用户的语音信息,并将所述语音信息转化成待识别的自然语言;
语言接收单元,用于接收所述待识别的自然语言;
语义识别单元,用于识别所述语言接收单元接收的所述待识别的自然语言,并反馈关联于所述待识别的自然语言的多个语义识别结果;
语义确认单元,根据用户语言习惯和与所述待识别的自然语言的相似度大小从所述语义识别单元反馈的多个语义识别结果中确认最终的语义识别结果。
2.如权利要求1所述的基于语音识别的机器人语义识别系统,其特征在于,所述语义识别系统还包括:
用户语言存储单元,用于存储所述语义确认单元确认的最终的语义识别结果。
3.如权利要求1所述的基于语音识别的机器人语义识别系统,其特征在于,所述语义识别系统还包括:
用户语言习惯创建单元,提取所述用户语言存储单元中最终的语义识别结果中的高频句式特征和高频关键词创建所述用户语言习惯。
4.如权利要求1所述的基于语音识别的机器人语义识别系统,其特征在于,所述语义确认单元包括:
第一排序模块,根据与所述待识别语言的相似度对所述语义识别单元反馈的多个语义识别结果进行排序,即生成语义相似表;
第二排序模块,根据所述用户语言习惯,对所述第一排序模块生成的所述语义相似表进行综合排序,并将综合排序最前面的三个语义识别结果生成语义综合表。
5.如权利要求1所述的基于语音识别的机器人语义识别系统,其特征在于,所述语义确认单元还包括:
语音反馈模块,根据所述语义综合表中关联于所述待识别的自然语言的语义识别结果生成反馈语言,并通过所述语音识别单元转化成反馈语音;
用户确认模块,用户确认关联于所述语义综合表的所述反馈语音与所述待识别的自然语言一致/不一致。
6.如权利要求5所述的基于语音识别的机器人语义识别系统,其特征在于,所述用户确认模块中,如用户确认关联于所述语义综合表的所述反馈语音与所述待识别的自然语言一致,则将所述反馈语言相对应的所述反馈语言存入所述用户语言存储单元。
7.如权利要求5所述的基于语音识别的机器人语义识别系统,其特征在于,所述用户确认模块中,如用户确认关联于所述语义综合表的所述反馈语音与所述待识别的自然语言均不一致,则所述语义识别系统提示用户重新录入语音。
CN201510819404.8A 2015-11-23 2015-11-23 一种基于语音识别的机器人语义识别系统 Active CN106782547B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510819404.8A CN106782547B (zh) 2015-11-23 2015-11-23 一种基于语音识别的机器人语义识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510819404.8A CN106782547B (zh) 2015-11-23 2015-11-23 一种基于语音识别的机器人语义识别系统

Publications (2)

Publication Number Publication Date
CN106782547A true CN106782547A (zh) 2017-05-31
CN106782547B CN106782547B (zh) 2020-08-07

Family

ID=58963091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510819404.8A Active CN106782547B (zh) 2015-11-23 2015-11-23 一种基于语音识别的机器人语义识别系统

Country Status (1)

Country Link
CN (1) CN106782547B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107195303A (zh) * 2017-06-16 2017-09-22 北京云知声信息技术有限公司 语音处理方法及装置
CN107424611A (zh) * 2017-07-07 2017-12-01 歌尔科技有限公司 语音交互方法及装置
CN108010526A (zh) * 2017-12-08 2018-05-08 北京奇虎科技有限公司 语音处理方法及装置
CN109545203A (zh) * 2018-12-14 2019-03-29 深圳壹账通智能科技有限公司 语音识别方法、装置、设备和存储介质
CN110265019A (zh) * 2019-07-03 2019-09-20 中通智新(武汉)技术研发有限公司 一种语音识别的方法及语音机器人系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7668716B2 (en) * 2005-05-05 2010-02-23 Dictaphone Corporation Incorporation of external knowledge in multimodal dialog systems
CN103000173A (zh) * 2012-12-11 2013-03-27 优视科技有限公司 一种语音交互方法及装置
CN103971681A (zh) * 2014-04-24 2014-08-06 百度在线网络技术(北京)有限公司 一种语音识别方法及系统
CN104391673A (zh) * 2014-11-20 2015-03-04 百度在线网络技术(北京)有限公司 语音交互方法和装置
CN104464723A (zh) * 2014-12-16 2015-03-25 科大讯飞股份有限公司 一种语音交互方法及系统
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7668716B2 (en) * 2005-05-05 2010-02-23 Dictaphone Corporation Incorporation of external knowledge in multimodal dialog systems
CN103000173A (zh) * 2012-12-11 2013-03-27 优视科技有限公司 一种语音交互方法及装置
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN103971681A (zh) * 2014-04-24 2014-08-06 百度在线网络技术(北京)有限公司 一种语音识别方法及系统
CN104391673A (zh) * 2014-11-20 2015-03-04 百度在线网络技术(北京)有限公司 语音交互方法和装置
CN104464723A (zh) * 2014-12-16 2015-03-25 科大讯飞股份有限公司 一种语音交互方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107195303A (zh) * 2017-06-16 2017-09-22 北京云知声信息技术有限公司 语音处理方法及装置
CN107195303B (zh) * 2017-06-16 2021-08-20 云知声智能科技股份有限公司 语音处理方法及装置
CN107424611A (zh) * 2017-07-07 2017-12-01 歌尔科技有限公司 语音交互方法及装置
CN107424611B (zh) * 2017-07-07 2021-10-15 歌尔科技有限公司 语音交互方法及装置
CN108010526A (zh) * 2017-12-08 2018-05-08 北京奇虎科技有限公司 语音处理方法及装置
CN108010526B (zh) * 2017-12-08 2021-11-23 北京奇虎科技有限公司 语音处理方法及装置
CN109545203A (zh) * 2018-12-14 2019-03-29 深圳壹账通智能科技有限公司 语音识别方法、装置、设备和存储介质
CN110265019A (zh) * 2019-07-03 2019-09-20 中通智新(武汉)技术研发有限公司 一种语音识别的方法及语音机器人系统

Also Published As

Publication number Publication date
CN106782547B (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
CN104238991B (zh) 语音输入匹配方法及装置
CN106782547A (zh) 一种基于语音识别的机器人语义识别系统
EP3633521A1 (en) Knowledge-based question answering system for the diy domain
US20210366459A1 (en) Hotword-Aware Speech Synthesis
WO2017177901A1 (zh) 一种语义匹配方法及智能设备
KR101213835B1 (ko) 음성 인식에 있어서 동사 에러 복원
US11756532B2 (en) Intelligence-driven virtual assistant for automated idea documentation
RU2014111971A (ru) Способ и система голосового интерфейса
CN104267922B (zh) 一种信息处理方法及电子设备
JP2016156845A (ja) ユーザ対話システムと共にユーザ操作を支援する対話支援プログラム、サーバ及び方法
US10664755B2 (en) Searching method and system based on multi-round inputs, and terminal
WO2016023317A1 (zh) 一种语音信息的处理方法及终端
WO2017000809A1 (zh) 一种语言交互方法
CN102968987A (zh) 一种语音识别方法及系统
CN109829052A (zh) 一种基于人机交互的开放式对话方法和系统
US20200265843A1 (en) Speech broadcast method, device and terminal
WO2006107586A3 (en) Method and system for interpreting verbal inputs in a multimodal dialog system
CN101533401A (zh) 声音数据检索系统以及声音数据的检索方法
CN103186522B (zh) 电子设备及其自然语言分析方法
WO2017166626A1 (zh) 归一化方法、装置和电子设备
CN106897290A (zh) 一种建立关键词模型的方法及装置
WO2021103902A1 (zh) 一种对话响应方法及装置
CN104007836A (zh) 一种手写字输入的处理方法及终端设备
CN104679733A (zh) 一种语音对话翻译方法、装置及系统
CN109359298A (zh) 表情符推荐方法、系统及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant