CN111814490A - 一种机器人自学习提升语义识别能力的方法与系统 - Google Patents

一种机器人自学习提升语义识别能力的方法与系统 Download PDF

Info

Publication number
CN111814490A
CN111814490A CN202010506782.1A CN202010506782A CN111814490A CN 111814490 A CN111814490 A CN 111814490A CN 202010506782 A CN202010506782 A CN 202010506782A CN 111814490 A CN111814490 A CN 111814490A
Authority
CN
China
Prior art keywords
question
keywords
cloud server
robot
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010506782.1A
Other languages
English (en)
Inventor
郭志扬
张发兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Aoxin Technology Co ltd
Original Assignee
Jiangsu Aoxin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Aoxin Technology Co ltd filed Critical Jiangsu Aoxin Technology Co ltd
Priority to CN202010506782.1A priority Critical patent/CN111814490A/zh
Publication of CN111814490A publication Critical patent/CN111814490A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种机器人自学习提升语义识别能力的方法包括:通过机器人终端接收到用户的提问语音信息,将所述提问语音信息传送至云端服务器,云端服务器将语音信息传送给语音网关,语音网关将提问语音信息识别转换为提问文字语句,进而回传给云端服务器,云端服务器将提问文字语句传送给关键词分析网关,关键词分析网关进行对提问文字语句提取提问关键词,进而给云端服务器返回若干个提问关键词,云端服务器选取1至5个权重较大的关键词,与题库中预先存好的关键词做匹配,若完全匹配则云端服务器向机器人终端发送命令,让机器人终端发控制机器人回答题库中的答案。

Description

一种机器人自学习提升语义识别能力的方法与系统
技术领域
本发明涉及一种自学习提升语义识别能力的方法,具体是一种机器人自学习提升语义识别能力的方法。
背景技术
机器人是一种能够半自主或全自主工作的智能机器,具有感知、决策、执行等基本特征,可以辅助甚至替代人类完成危险、繁重、复杂的工作,提高工作效率与质量,服务人类生活,扩大或延伸人的活动及能力范围。
而机器人按照控制方式分类 可分为:操作型机器人、程控型机器人、示教再现型机器人、数控型机器人、感觉控制型机器人、适应控制型机器人、学习控制型机器人、智能机器人。
现有的机器人有许多放置在各大商场进行取代人工进行对用户问题进行回答,而现有机器人基本通过人工预先进行对机器人录入问题与答案,而无法进行对用户问题和答案进行学习,进而使得现有的机器人使用率降低。
发明内容
发明目的:提供一种机器人自学习提升语义识别能力的方法,以解决现有技术存在的上述问题。
技术方案:一种机器人自学习提升语义识别能力的方法,包括:
步骤1、机器人终端接收到用户的提问语音信息,将所述提问语音信息传送至云端服务器;
步骤2、云端服务器将语音信息传送给语音网关,语音网关将提问语音信息识别转换为提问文字语句,进而回传给云端服务器;
步骤3、云端服务器将提问文字语句传送给关键词分析网关,关键词分析网关进行对提问文字语句提取提问关键词,进而给云端服务器返回若干个提问关键词;
步骤4、云端服务器选取1至5个权重较大的关键词,与题库中预先存好的关键词做匹配,若完全匹配则云端服务器向机器人终端发送命令,让机器人终端发控制机器人回答题库中的答案;
步骤5、若没有完全匹配,则判断提问关键词匹配失败数量;
步骤6、 当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题;
步骤7、当提问关键词匹配失败数量为1 时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题;
步骤8、用户判断机器人屏幕上显示的相似问题中有无相同问题,若无则可放弃选择;当机器人屏幕上显示的相似问题有相同问题时,用户点击选中一个相同问题,机器人通过云端服务器调取答案回答用户;
步骤9、而当机器人屏幕上显示的相似问题中无相同问题时,云端服务器将用户提问问题中相差的那个关键词作为并列关键词,填入用户选中问题题库中并列关键词位置中去,作为题库中的临时并列关键词;
步骤10、云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核,审核通过则变更为正式并列关键词;当审核不通过时,系统管理员可以修改或删除临时并列关键词。
在进一步的实施例中,所述云端服务器题库中保存了若干个问题及答案,每个问题设置A、B、C、D、E五级主关键词空间,用于存放每个问题相对应的1至5个主关键词,每级主关键词设置8个并列关键词空间,用于存放各级主关键词相对应的并列关键词,通过设计云端服务器题库件对若干问题件预先录入,以及给与8个并列关键词空间用户提出不同问题的关键词进行存储,进而使得机器人具有自行学习的空间。
在进一步的实施例中,所述步骤3中还包括关键词分析网关提取关键词步骤,步骤如下:
步骤301、首先进行对步骤2提问语音信息识别转换为提问文字语句进行预处理的处理步骤;所述处理步骤包括分词、去除停用词,然后将分词、去除停用词后剩下的词语作为关键词的候选词;
步骤302、当提问文字语句预处理完成后,进行构建无向有权图;
步骤303、当无向有权图构建完成后进行图排序;
在进一步的实施例中,使用步骤301预处理之后,候选词被表示为图的顶点,如果两个词在一个句子内同时出现,则两个候选词表示的图顶点之间存在边,而边的权重值为两个候选词之间的词引值;
文本中词语
Figure 100002_DEST_PATH_IMAGE001
Figure 719157DEST_PATH_IMAGE002
的引力
Figure 100002_DEST_PATH_IMAGE003
计算公式如下:
Figure 624797DEST_PATH_IMAGE004
=
Figure 100002_DEST_PATH_IMAGE005
其中,
Figure 820462DEST_PATH_IMAGE006
表示词语
Figure 63224DEST_PATH_IMAGE001
在文本中出现的频率,
Figure 100002_DEST_PATH_IMAGE007
表示词语
Figure 866095DEST_PATH_IMAGE002
在文本中出现 的频率,
Figure 145898DEST_PATH_IMAGE008
表示为词语
Figure 431123DEST_PATH_IMAGE001
Figure 211998DEST_PATH_IMAGE002
之间的欧氏距离;
而经常以固定模式出现的多个词语为一个短语,即某个模式出现的频率越高,这个模 式为短语的可能性越高,而两个样本的间的相关性通常用
Figure 100002_DEST_PATH_IMAGE009
系数进行表示,
Figure 869375DEST_PATH_IMAGE009
系数定 义如下:
Figure 100002_DEST_PATH_IMAGE011
其中,
Figure 788921DEST_PATH_IMAGE012
表示为词语
Figure 594065DEST_PATH_IMAGE001
Figure 178631DEST_PATH_IMAGE002
共同出现的频率;
此时使用
Figure 100002_DEST_PATH_IMAGE013
算法进行图排序;在有权重的
Figure 457559DEST_PATH_IMAGE013
算法中,边的权重值越 高,顶点的得分将越高,此时选取得分最高的1至5个主关键词。
一种机器人自学习提升语义识别能力的系统,包括:
用于接收客户的提问语音,并发送回答语音或/和合成视频的机器人终端;
用于将提问语音信息识别转换为提问文字语句的语音网关;
用于分析提取提问文字语句关键词的分析网关;
以及用于存储问题及存放每个问题相对应的1至5个主关键词和用于存放各级主关键词相对应的并列关键词的云端服务器。
在进一步的实施例中,所述云端服务器包括:处理器、录音单元、触控显示单元和通信单元,所述处理器分别与所述录音单元、所述触控显示单元和通信单元连接;
在进一步的实施例中,所述录音单元用于获取客户的提问语音;所述触控显示单元用于客户操作以及播放视频;所述通信单元用于与所述云端服务器进行数据传输。
在进一步的实施例中,所述云端服务器包括:
用于接收所述机器人终端发送的数据、及向所述机器人终端发送数据的接收推送模块;
用于将所述提问语句从云端服务器中的题库中匹配对应的答案语音或答案视频的匹配模块;当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题;
当提问关键词匹配失败数量为1 时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题;
用于存储客户的提问语音、回答语音、回答文字、合成视频和关键词的存储模块。
在进一步的实施例中,所述语音网关包括用于识别提问语音信息的语音识别模块;用于纠错语音识别模块识别语音信息错误的纠错模块;所述纠错模块与云端服务器电信连接,通过云端服务器预先录入的问题进行匹配对比,进而将语音识别模块识别错误的提问文字语句纠改为云端服务器内相近问题,进而通过触控显示进行显示给用户,以供用户选择。
有益效果:本发明公开了一种机器人自学习提升语义识别能力的方法,通过机器人终端接收到用户的提问语音信息,将所述提问语音信息传送至云端服务器,云端服务器将语音信息传送给语音网关,语音网关将提问语音信息识别转换为提问文字语句,进而回传给云端服务器,云端服务器将提问文字语句传送给关键词分析网关,关键词分析网关进行对提问文字语句提取提问关键词,进而给云端服务器返回若干个提问关键词,云端服务器选取1至5个权重较大的关键词,与题库中预先存好的关键词做匹配,若完全匹配则云端服务器向机器人终端发送命令,让机器人终端发控制机器人回答题库中的答案,若没有完全匹配,则判断提问关键词匹配失败数量,当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题,当提问关键词匹配失败数量为1 时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题,用户判断机器人屏幕上显示的相似问题中有无相同问题,若无则可放弃选择;当机器人屏幕上显示的相似问题有相同问题时,用户点击选中一个相同问题,机器人通过云端服务器调取答案回答用户,而当机器人屏幕上显示的相似问题中无相同问题时,云端服务器将用户提问问题中相差的那个关键词作为并列关键词,填入用户选中问题题库中并列关键词位置中去,作为题库中的临时并列关键词,云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核,审核通过则变更为正式并列关键词;当审核不通过时,系统管理员可以修改或删除临时并列关键词,机器人通过以上方法接受用户培训,不断增强理解用户不同方式问话语义的能力,使机器人变得更聪明。
附图说明
图1是本发明的结构示意图。
图2是本发明的关键词匹配流程示意图。
图3是本发明的机器人自学习提升语义识别能力系统结构示意图。
具体实施方式
经过申请人的研究分析,出现这一问题(现有机器人使用率降低)的原因在于,现有的机器人有许多放置在各大商场进行取代人工进行对用户问题进行回答,而现有机器人基本通过人工预先进行对机器人录入问题与答案,而无法进行对用户问题和答案进行学习,进而使得现有的机器人使用率降低,而本发明通过机器人终端接收到用户的提问语音信息,将所述提问语音信息传送至云端服务器,云端服务器将语音信息传送给语音网关,语音网关将提问语音信息识别转换为提问文字语句,进而回传给云端服务器,云端服务器将提问文字语句传送给关键词分析网关,关键词分析网关进行对提问文字语句提取提问关键词,进而给云端服务器返回若干个提问关键词,云端服务器选取1至5个权重较大的关键词,与题库中预先存好的关键词做匹配,若完全匹配则云端服务器向机器人终端发送命令,让机器人终端发控制机器人回答题库中的答案,若没有完全匹配,则判断提问关键词匹配失败数量,当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题,当提问关键词匹配失败数量为1 时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题,用户判断机器人屏幕上显示的相似问题中有无相同问题,若无则可放弃选择;当机器人屏幕上显示的相似问题有相同问题时,用户点击选中一个相同问题,机器人通过云端服务器调取答案回答用户,而当机器人屏幕上显示的相似问题中无相同问题时,云端服务器将用户提问问题中相差的那个关键词作为并列关键词,填入用户选中问题题库中并列关键词位置中去,作为题库中的临时并列关键词,云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核,审核通过则变更为正式并列关键词;当审核不通过时,系统管理员可以修改或删除临时并列关键词,机器人通过以上方法接受用户培训,不断增强理解用户不同方式问话语义的能力,使机器人变得更聪明。
一种机器人自学习提升语义识别能力的方法,包括:
步骤1、机器人终端接收到用户的提问语音信息,将所述提问语音信息传送至云端服务器;
步骤2、云端服务器将语音信息传送给语音网关,语音网关将提问语音信息识别转换为提问文字语句,进而回传给云端服务器;
步骤3、云端服务器将提问文字语句传送给关键词分析网关,关键词分析网关进行对提问文字语句提取提问关键词,进而给云端服务器返回若干个提问关键词;
步骤4、云端服务器选取1至5个权重较大的关键词,与题库中预先存好的关键词做匹配,若完全匹配则云端服务器向机器人终端发送命令,让机器人终端发控制机器人回答题库中的答案;
步骤5、若没有完全匹配,则判断提问关键词匹配失败数量;
步骤6、 当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题;
步骤7、当提问关键词匹配失败数量为1 时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题;
步骤8、用户判断机器人屏幕上显示的相似问题中有无相同问题,若无则可放弃选择;当机器人屏幕上显示的相似问题有相同问题时,用户点击选中一个相同问题,机器人通过云端服务器调取答案回答用户;
步骤9、而当机器人屏幕上显示的相似问题中无相同问题时,云端服务器将用户提问问题中相差的那个关键词作为并列关键词,填入用户选中问题题库中并列关键词位置中去,作为题库中的临时并列关键词;
步骤10、云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核,审核通过则变更为正式并列关键词;当审核不通过时,系统管理员可以修改或删除临时并列关键词。
所述云端服务器题库中保存了若干个问题及答案,每个问题设置A、B、C、D、E五级主关键词空间,用于存放每个问题相对应的1至5个主关键词,每级主关键词设置8个并列关键词空间,用于存放各级主关键词相对应的并列关键词。
所述步骤3中还包括关键词分析网关提取关键词步骤,步骤如下:
步骤301、首先进行对步骤2提问语音信息识别转换为提问文字语句进行预处理的处理步骤;所述处理步骤包括分词、去除停用词,然后将分词、去除停用词后剩下的词语作为关键词的候选词;
步骤302、当提问文字语句预处理完成后,进行构建无向有权图;
步骤303、当无向有权图构建完成后进行图排序;
使用步骤301预处理之后,候选词被表示为图的顶点,如果两个词在一个句子内同时出现,则两个候选词表示的图顶点之间存在边,而边的权重值为两个候选词之间的词引值;
文本中词语
Figure 344743DEST_PATH_IMAGE001
Figure 168343DEST_PATH_IMAGE002
的引力
Figure 431965DEST_PATH_IMAGE003
计算公式如下:
Figure 922989DEST_PATH_IMAGE004
=
Figure 981075DEST_PATH_IMAGE005
其中,
Figure 557550DEST_PATH_IMAGE006
表示词语
Figure 857819DEST_PATH_IMAGE001
在文本中出现的频率,
Figure 937770DEST_PATH_IMAGE007
表示词语
Figure 432337DEST_PATH_IMAGE002
在文本中出现 的频率,
Figure 964949DEST_PATH_IMAGE008
表示为词语
Figure 570374DEST_PATH_IMAGE001
Figure 176936DEST_PATH_IMAGE002
之间的欧氏距离;
而经常以固定模式出现的多个词语为一个短语,即某个模式出现的频率越高,这个模 式为短语的可能性越高,而两个样本的间的相关性通常用
Figure 967037DEST_PATH_IMAGE009
系数进行表示,
Figure 629356DEST_PATH_IMAGE009
系数定 义如下:
Figure 897527DEST_PATH_IMAGE011
其中,
Figure 827436DEST_PATH_IMAGE012
表示为词语
Figure 991701DEST_PATH_IMAGE001
Figure 498906DEST_PATH_IMAGE002
共同出现的频率;
此时使用
Figure 242871DEST_PATH_IMAGE013
算法进行图排序;在有权重的
Figure 292867DEST_PATH_IMAGE013
算法中,边的权重值越 高,顶点的得分将越高,此时选取得分最高的1至5个主关键词。
一种机器人自学习提升语义识别能力的系统,包括:
用于接收客户的提问语音,并发送回答语音或/和合成视频的机器人终端;
用于将提问语音信息识别转换为提问文字语句的语音网关;
用于分析提取提问文字语句关键词的分析网关;
以及用于存储问题及存放每个问题相对应的1至5个主关键词和用于存放各级主关键词相对应的并列关键词的云端服务器。
所述云端服务器包括:处理器、录音单元、触控显示单元和通信单元,所述处理器分别与所述录音单元、所述触控显示单元和通信单元连接;
所述录音单元用于获取客户的提问语音;所述触控显示单元用于客户操作以及播放视频;所述通信单元用于与所述云端服务器进行数据传输。
所述云端服务器包括:
用于接收所述机器人终端发送的数据、及向所述机器人终端发送数据的接收推送模块;
用于将所述提问语句从云端服务器中的题库中匹配对应的答案语音或答案视频的匹配模块;当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题;
当提问关键词匹配失败数量为1 时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题;
用于存储客户的提问语音、回答语音、回答文字、合成视频和关键词的存储模块。
所述语音网关包括用于识别提问语音信息的语音识别模块;用于纠错语音识别模块识别语音信息错误的纠错模块;所述纠错模块与云端服务器电信连接,通过云端服务器预先录入的问题进行匹配对比,进而将语音识别模块识别错误的提问文字语句纠改为云端服务器内相近问题,进而通过触控显示进行显示给用户,以供用户选择。
工作原理说明:机器人终端接收到用户的提问语音信息,将所述提问语音信息传送至云端服务器;云端服务器将语音信息传送给语音网关,语音网关将提问语音信息识别转换为提问文字语句,进而回传给云端服务器;云端服务器将提问文字语句传送给关键词分析网关,关键词分析网关进行对提问文字语句提取提问关键词,进而给云端服务器返回若干个提问关键词;云端服务器选取1至5个权重较大的关键词,与题库中预先存好的关键词做匹配,若完全匹配则云端服务器向机器人终端发送命令,让机器人终端发控制机器人回答题库中的答案;若没有完全匹配,则判断提问关键词匹配失败数量;当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题;当提问关键词匹配失败数量为1时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题;用户判断机器人屏幕上显示的相似问题中有无相同问题,若无则可放弃选择;当机器人屏幕上显示的相似问题有相同问题时,用户点击选中一个相同问题,机器人通过云端服务器调取答案回答用户;而当机器人屏幕上显示的相似问题中无相同问题时,云端服务器将用户提问问题中相差的那个关键词作为并列关键词,填入用户选中问题题库中并列关键词位置中去,作为题库中的临时并列关键词;云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核,审核通过则变更为正式并列关键词;当审核不通过时,系统管理员可以修改或删除临时并列关键词。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。

Claims (9)

1.一种机器人自学习提升语义识别能力的方法,其特征是,包括:
步骤1、机器人终端接收到用户的提问语音信息,将所述提问语音信息传送至云端服务器;
步骤2、云端服务器将语音信息传送给语音网关,语音网关将提问语音信息识别转换为提问文字语句,进而回传给云端服务器;
步骤3、云端服务器将提问文字语句传送给关键词分析网关,关键词分析网关进行对提问文字语句提取提问关键词,进而给云端服务器返回若干个提问关键词;
步骤4、云端服务器选取1至5个权重较大的关键词,与题库中预先存好的关键词做匹配,若完全匹配则云端服务器向机器人终端发送命令,让机器人终端发控制机器人回答题库中的答案;
步骤5、若没有完全匹配,则判断提问关键词匹配失败数量;
步骤6、 当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题;
步骤7、当提问关键词匹配失败数量为1 时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题;
步骤8、用户判断机器人屏幕上显示的相似问题中有无相同问题,若无则可放弃选择;当机器人屏幕上显示的相似问题有相同问题时,用户点击选中一个相同问题,机器人通过云端服务器调取答案回答用户;
步骤9、而当机器人屏幕上显示的相似问题中无相同问题时,云端服务器将用户提问问题中相差的那个关键词作为并列关键词,填入用户选中问题题库中并列关键词位置中去,作为题库中的临时并列关键词;
步骤10、云端服务器定期将临时并列关键词批量提交机器人系统管理员作审核,审核通过则变更为正式并列关键词;当审核不通过时,系统管理员可以修改或删除临时并列关键词。
2.根据权利要求1所述的一种机器人自学习提升语义识别能力的方法,其特征是: 所述云端服务器题库中保存了若干个问题及答案,每个问题设置A、B、C、D、E五级主关键词空间,用于存放每个问题相对应的1至5个主关键词,每级主关键词设置8个并列关键词空间,用于存放各级主关键词相对应的并列关键词。
3.根据权利要求1所述的一种机器人自学习提升语义识别能力的方法,其特征是: 所述步骤3中还包括关键词分析网关提取关键词步骤,步骤如下:
步骤301、首先进行对步骤2提问语音信息识别转换为提问文字语句进行预处理的处理步骤;所述处理步骤包括分词、去除停用词,然后将分词、去除停用词后剩下的词语作为关键词的候选词;
步骤302、当提问文字语句预处理完成后,进行构建无向有权图;
步骤303、当无向有权图构建完成后进行图排序。
4.根据权利要求3所述的一种机器人自学习提升语义识别能力的方法,其特征是:使用步骤301预处理之后,候选词被表示为图的顶点,如果两个词在一个句子内同时出现,则两个候选词表示的图顶点之间存在边,而边的权重值为两个候选词之间的词引值;
文本中词语
Figure DEST_PATH_IMAGE001
Figure 611250DEST_PATH_IMAGE002
的引力
Figure DEST_PATH_IMAGE003
计算公式如下:
Figure 730516DEST_PATH_IMAGE004
=
Figure DEST_PATH_IMAGE005
其中,
Figure 356407DEST_PATH_IMAGE006
表示词语
Figure 990651DEST_PATH_IMAGE001
在文本中出现的频率,
Figure DEST_PATH_IMAGE007
表示词语
Figure 494444DEST_PATH_IMAGE002
在文本中出现 的频率,
Figure 202637DEST_PATH_IMAGE008
表示为词语
Figure 94370DEST_PATH_IMAGE001
Figure 888014DEST_PATH_IMAGE002
之间的欧氏距离;
而经常以固定模式出现的多个词语为一个短语,即某个模式出现的频率越高,这个模 式为短语的可能性越高,而两个样本的间的相关性通常用
Figure DEST_PATH_IMAGE009
系数进行表示,
Figure 962542DEST_PATH_IMAGE009
系数定 义如下:
Figure DEST_PATH_IMAGE011
其中,
Figure 525242DEST_PATH_IMAGE012
表示为词语
Figure 853455DEST_PATH_IMAGE001
Figure 134395DEST_PATH_IMAGE002
共同出现的频率;
此时使用
Figure DEST_PATH_IMAGE013
算法进行图排序;在有权重的
Figure 245570DEST_PATH_IMAGE013
算法中,边的权重值越高, 顶点的得分将越高,此时选取得分最高的1至5个主关键词。
5.一种机器人自学习提升语义识别能力的系统,其特征是,包括:
用于接收客户的提问语音,并发送回答语音或/和合成视频的机器人终端;
用于将提问语音信息识别转换为提问文字语句的语音网关;
用于分析提取提问文字语句关键词的分析网关;
以及用于存储问题及存放每个问题相对应的1至5个主关键词和用于存放各级主关键词相对应的并列关键词的云端服务器。
6.根据权利要求5所述的一种机器人自学习提升语义识别能力的系统,其特征在于,所述云端服务器包括:处理器、录音单元、触控显示单元和通信单元,所述处理器分别与所述录音单元、所述触控显示单元和通信单元连接。
7.根据权利要求6所述的一种机器人自学习提升语义识别能力的系统,其特征在于,所述录音单元用于获取客户的提问语音;所述触控显示单元用于客户操作以及播放视频;所述通信单元用于与所述云端服务器进行数据传输。
8.根据权利要求5所述的一种机器人自学习提升语义识别能力的系统,其特征在于,所述云端服务器包括:
用于接收所述机器人终端发送的数据、及向所述机器人终端发送数据的接收推送模块;
用于将所述提问语句从云端服务器中的题库中匹配对应的答案语音或答案视频的匹配模块;当提问关键词匹配失败数量大于1时,则云端服务器认定此提问为新问题;
当提问关键词匹配失败数量为1 时,则云端服务器认定此提问的问题与题库中已有的问题为相似问题,并将相似问题以文字方式传送给机器人,机器人在屏幕上显示所有相似问题;
用于存储客户的提问语音、回答语音、回答文字、合成视频和关键词的存储模块。
9.根据权利要求5所述的一种机器人自学习提升语义识别能力的系统,其特征在于,所述语音网关包括用于识别提问语音信息的语音识别模块;用于纠错语音识别模块识别语音信息错误的纠错模块;所述纠错模块与云端服务器电信连接,通过云端服务器预先录入的问题进行匹配对比,进而将语音识别模块识别错误的提问文字语句纠改为云端服务器内相近问题,进而通过触控显示进行显示给用户,以供用户选择。
CN202010506782.1A 2020-06-05 2020-06-05 一种机器人自学习提升语义识别能力的方法与系统 Withdrawn CN111814490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010506782.1A CN111814490A (zh) 2020-06-05 2020-06-05 一种机器人自学习提升语义识别能力的方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010506782.1A CN111814490A (zh) 2020-06-05 2020-06-05 一种机器人自学习提升语义识别能力的方法与系统

Publications (1)

Publication Number Publication Date
CN111814490A true CN111814490A (zh) 2020-10-23

Family

ID=72844678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010506782.1A Withdrawn CN111814490A (zh) 2020-06-05 2020-06-05 一种机器人自学习提升语义识别能力的方法与系统

Country Status (1)

Country Link
CN (1) CN111814490A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417129A (zh) * 2021-01-22 2021-02-26 北京新广视通科技有限公司 一种具有ai学习功能的智能快速应答方法及设备
CN112565061A (zh) * 2020-12-04 2021-03-26 上海航翼网络科技有限公司 一种应用于协同系统的ai机器人系统
CN116244496A (zh) * 2022-12-06 2023-06-09 山东紫菜云数字科技有限公司 一种基于产业链的资源推荐方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112565061A (zh) * 2020-12-04 2021-03-26 上海航翼网络科技有限公司 一种应用于协同系统的ai机器人系统
CN112417129A (zh) * 2021-01-22 2021-02-26 北京新广视通科技有限公司 一种具有ai学习功能的智能快速应答方法及设备
CN116244496A (zh) * 2022-12-06 2023-06-09 山东紫菜云数字科技有限公司 一种基于产业链的资源推荐方法
CN116244496B (zh) * 2022-12-06 2023-12-01 山东紫菜云数字科技有限公司 一种基于产业链的资源推荐方法

Similar Documents

Publication Publication Date Title
US11334635B2 (en) Domain specific natural language understanding of customer intent in self-help
CN110162611B (zh) 一种智能客服应答方法及系统
CN111814490A (zh) 一种机器人自学习提升语义识别能力的方法与系统
WO2019046528A1 (en) METHOD AND SYSTEM FOR LEARNING CHARACTERISTICS AND RESPONSE TO INTERACTIVE QUERY WITH AUTOMATIC UPDATE
CN111159367B (zh) 一种信息处理方法及相关设备
US20230394247A1 (en) Human-machine collaborative conversation interaction system and method
US11847615B2 (en) System and method for job profile matching
CN110610705A (zh) 一种基于人工智能的语音交互提示器
CN111078856B (zh) 一种群聊对话处理方法、装置及电子设备
CN112685550B (zh) 智能问答方法、装置、服务器及计算机可读存储介质
US11995523B2 (en) Systems and methods for determining training parameters for dialog generation
CN112017694A (zh) 语音数据的评测方法和装置、存储介质和电子装置
CN109492085A (zh) 基于数据处理的答案确定方法、装置、终端及存储介质
CN113205046B (zh) 题册识别方法、系统、装置及介质
CN110053055A (zh) 一种机器人及其回答问题的方法、存储介质
CN114297359A (zh) 一种对话意图识别方法、装置、电子设备及可读存储介质
EP4030355A1 (en) Neural reasoning path retrieval for multi-hop text comprehension
CN114004283A (zh) 文本对抗攻击方法、装置、设备和存储介质
CN117456995A (zh) 一种养老服务机器人的交互方法及系统
CN117332054A (zh) 表格问答处理方法、装置及设备
WO2020144636A1 (en) Artificial intelligence system for business processes
CN113792133B (zh) 判题方法、装置、电子设备和介质
CN116303951A (zh) 对话处理方法、装置、电子设备和存储介质
CN116089578A (zh) 智能问答数据自动标注方法、系统及存储介质
CN111611354B (zh) 人机对话控制方法、装置、服务器及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201023

WW01 Invention patent application withdrawn after publication