CN105487663B - 一种面向智能机器人的意图识别方法和系统 - Google Patents
一种面向智能机器人的意图识别方法和系统 Download PDFInfo
- Publication number
- CN105487663B CN105487663B CN201510857709.8A CN201510857709A CN105487663B CN 105487663 B CN105487663 B CN 105487663B CN 201510857709 A CN201510857709 A CN 201510857709A CN 105487663 B CN105487663 B CN 105487663B
- Authority
- CN
- China
- Prior art keywords
- user
- intention
- score value
- intended
- population characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种面向智能机器人的意图识别方法和系统。该方法包括:获取待识别的输入信息;通过领域模型对所述待识别的输入信息进行意图识别得到潜在意图,所述潜在意图至少有一个;调用群体特征库,基于群体特征针对所述潜在意图进行排序,得到用户当前群体意图;调用用户个性特征库,基于个性化特征针对所述用户当前群体意图以及所述潜在意图进行排序,确定用户当前意图。本申请在用户与智能机器人的问答过程中基于群体特征排序获得用户的群体意图,在完成群体意图识别之后再通过个性化特征排序获得用户的个性化意图,从而识别到符合用户特征的意图,为用户提供更人性化和个性化的服务。
Description
技术领域
本发明涉及智能服务技术领域,具体地说,涉及一种面向智能机器人的个性化意图识别方法和系统。
背景技术
意图识别是人工智能和自然语言处理领域中的一个倍受关注的研究方向,主要用于识别用户的行为意图。例如,在问答对话中,提问者每句话都带有一定的意图,应答方则根据对方的意图进行回答。
面向问答的意图识别技术可应用在搜索引擎、智能语音助手、聊天机器人、自动客服、和专家系统等场景下。特别是在聊天机器人中,意图识别是整个系统的重要组成部分,通过分析用户意图来了解用户想询问的具体内容,再给出相应的答案。
目前的意图识别系统虽然能在一定程度上识别用户意图并进行与该意图相符的智能交互。但是由于用户表达方式的多样性和用户意图的多重可能歧义性,尚不能准确识别用户意图。特别是随着用户对个性化的需求要求越来越强烈,对个性化意图识别的期望也随之提高。用户不仅需要得到群体化的服务,更需要得到根据用户的性格偏好、年龄性别职业和语言行为习惯等特性给出的更人性化和个性化的服务。
发明内容
本发明的目的之一在于解决现有的面向问答的意图识别系统尚不能准确识别用户意图的技术缺陷。
本发明的实施例首先提供一种面向智能机器人的意图识别方法,包括以下步骤:
获取待识别的输入信息;
通过领域模型对所述待识别的输入信息进行意图识别得到潜在意图,所述潜在意图至少有一个;
调用群体特征库,基于群体特征针对所述潜在意图进行排序,得到用户当前群体意图;
调用用户个性化特征库,基于个性化特征针对所述用户当前群体意图以及所述潜在意图进行排序,确定用户当前意图。
在一个实施例中,所述获取待识别的输入信息的步骤包括:
采集用户输入的语音信息并提取用户参数;
将所述语音信息和所述用户参数转换为文本格式信息;
对所述文本格式信息进行预处理得到所述待识别的输入信息。
在一个实施例中,所述确定用户当前意图的步骤中包括:
在基于个性化特征的排序结果中存在分值最高的目标意图,且该目标意图与分值排序为第二位的个性化意图之间的分值差超出预设值的情况下,确定该目标意图为用户当前意图。
在一个实施例中,所述确定用户当前意图的步骤中还包括:
在基于个性化特征的排序结果中存在分值最高的目标意图,而该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,利用上下文系统输出针对用户当前意图的提问信息;
接收对所述提问信息的用户反馈信息,根据该反馈信息获得用户当前意图。
在一个实施例中,还包括:
采集互联网数据更新群体特征库;以及/或者
从接收到的用户反馈信息中提取多数用户的当前意图,更新所述群体特征库。
在一个实施例中,还包括:积累所述用户参数以及/或者所述用户反馈信息,更新所述个性化特征库。
本发明的实施例还提供一种面向智能机器人的意图识别系统,包括:
获取模块,其配置为获取待识别的输入信息;
意图识别模块,其配置为通过领域模型对所述待识别的输入信息进行意图识别得到潜在意图,所述潜在意图至少有一个;
群体特征排序模块,其配置为调用群体特征库,基于群体特征针对所述潜在意图进行排序,得到用户当前群体意图;
个性化特征排序模块,其配置为调用用户个性化特征库,基于个性化特征针对所述用户当前群体意图以及所述潜在意图进行排序,确定用户当前意图。
在一个实施例中,所述获取模块还包括:
采集子模块,其配置为采集用户输入的语音信息并提取用户参数;
转换子模块,其配置为将所述语音信息和所述用户参数转换为文本格式信息;
预处理子模块,其配置为对所述文本格式信息进行预处理得到所述待识别的输入信息。
在一个实施例中,所述个性化特征排序模块中还包括:
分值判断子模块,其配置为在基于个性化特征的排序结果中存在分值最高的目标意图,且该目标意图与分值排序为第二位的个性化意图之间的分值差超出预设值的情况下,确定该目标意图为用户当前意图。
在一个实施例中,所述个性化特征排序模块中还包括:
问题输出子模块,其配置为在基于个性化特征的排序结果中存在分值最高的目标意图,而该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,利用上下文系统输出针对用户当前意图的提问信息;
反馈接收子模块,其配置为接收对所述提问信息的用户反馈信息,根据该反馈信息获得用户当前意图。
在一个实施例中,还包括:
第一群体特征更新模块,其配置为采集互联网数据更新群体特征库;以及/或者
第二群体特征更新模块,其配置为从接收到的用户反馈信息中提取多数用户的当前意图,更新所述群体特征库。
在一个实施例中,还包括:
个性化特征更新模块,其配置为积累所述用户参数以及/或者所述用户反馈信息,更新所述个性化特征库。
本发明的实施例可以在用户与智能机器人的问答过程中基于群体特征排序获得用户的群体意图,在完成群体意图识别之后再通过个性化特征排序获得用户的个性化意图,从而识别到符合用户特征的意图,为用户提供更人性化和个性化的服务。
在不能准确确定个性化的用户意图时,智能机器人能发起提问与用户进行交互,从用户对问题的反馈中获得最终的用户意图。还能通过互联网数据和用户群体中多数的反馈信息更新群体特征库,并通过积累用户参数和用户反馈更新个性化特征库,以使得后续的意图识别过程更符合用户特征。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例一的意图识别方法的步骤流程图;
图2a为本发明实施例二的个性化特征排序方法的流程图;
图2b为本发明实施例二的个性化特征排序方法的另一种流程图;
图2c为本发明实施例二的个性化特征排序方法的又一种流程图;
图3为本发明实施例三的意图识别系统的结构图;
图4a为本发明实施例四的分值判断子模块的结构示意图;
图4b为本发明实施例四的分值判断子模块的另一种结构示意图;
图4c为本发明实施例四的分值判断子模块的又一种结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下结合附图对本发明作进一步地详细说明。
以下结合说明书附图对本发明的实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不相冲突的情况下,本发明的实施例中的特征可以相互结合。
本发明的实施例提供一种个性化的意图识别方法和系统,可以广泛用于智能语音助手、聊天机器人、自动客服和专家系统等智能服务系统,能够将群体特征意图识别与个性化特征意图识别结合来对用户输入的信息进行分析,从而准确地判断出更符合用户个体属性的意图。
在本发明的实施例中,采用用户参数表示用户个体特征,包括原生属性、行为习惯和个性化属性不同种类。例如,原生属性包括年龄、性别、生日、爱好、星座和家乡等这些原始信息;而行为习惯包括职业、交通出行方式、起床时间、饮食口味和经常活动地点等伴随用户生活方式可能发生改变的属性;此外,个性化属性表示与用户喜好或者使用需求相关的偏好。
例如,如果用户爱好中包括“音乐”,那么该用户的对涉及“音乐”的应用具有较高的个体倾向性,在该用户输入信息为“晚秋”时,意图识别的结果是“音乐播放意图”。再比如,如果用户日常的出行习惯为驾车出行,那么该用户对涉及“地图”的应用具有较高的个体倾向性,在用户输入信息为“北京”时,意图识别的结果是“获取前地点到北京的导航路径”,或者“显示北京地图中的拥堵状态”。其中,当用户的出行习惯发生改变之后,也就是个性化属性发生改变之后,对用户意图的判断结果会相应发生改变。
基于上述分析,以下实施例提供的意图识别方法和系统还能够跟随用户个体特征的变化,及时调整群体特征库和个性化特征库以输出更符合用户需求的意图识别结果。
实施例一
本实施例提供一种意图识别方法,以下参照图1对该方法的步骤流程进行说明。
首先获取待识别的输入信息(S110)。具体来说,先采集用户输入的语音信息并提取用户参数,再将语音信息和用户参数转换为文本格式信息。其中,用户输入的语音信息例如为请求、指令或者聊天类的语音,从中可以提取到上文所述的用户的原生属性、行为习惯和个性化属性等,获得例如用户的年龄、性别、身份、职业、家乡和喜好等这些用户参数。
还需要对文本格式信息进行预处理,从而得到待识别的输入信息。预处理操作可以包括去噪处理、智能纠错、分词处理和命名实体识别等。其中,去噪处理主要是过滤掉无效词、停止词等无意义的词,过滤后不影响用户输入的意图;纠错处理是根据拼音纠错、统计纠错、语义纠错等方式将用户误输入或者语音识别错误的输入进行纠错处理,得出相对准确的输入;分词处理和命名实体识别是通过隐马尔科夫模型等方式对用户输入进行分词,并对各词性进行标注,同时对于命名实体也进行相应的标注。
例如用户输入“去西直门”,则通过分词后可得到趋向性动词“去”和名词“西直门”,同时得到“西直门”的命名实体是地名。
需要说明的是,本实施例不仅能够利用用户自行输入的语音信息提取表征个体特性的用户参数,识别用户个性化的意图倾向(例如,对播放音乐的倾向,或者对导航路径的倾向);还能够通过后续的处理步骤自动对用户的参数特征进行挖掘和补充。这将在下文中详细说明。
在获取到待识别的输入信息之后,通过领域模型对所述待识别的输入信息进行意图识别得到潜在意图(S120)。这些潜在意图至少有一个,包括用户所有可能的意图,例如用户输入“北京”,经过意图识别后得到用户的潜在意图是了解“北京百科”的意图,获取“北京地图”的意图或者了解“北京天气”的意图等。
在一个优选的示例中,通过对各个领域各自的数据进行训练得出上述的领域模型,其本质上是一种归类模型,利用语义归类算法能够将用户输入的命令归类到不同的领域。如用户输入“宫保鸡丁”,通过语义归类算法判定用户意图可能跟餐馆、菜谱和百科有关系。所述的语义归类算法是一个通过使用正则表达式、句法分析、语法分析或者关键词解析等方式来实现的语义相似度计算方式,其数据基础则是训练领域模型的大量用户数据和领域数据。
随后调用群体特征库,基于群体特征针对所述潜在意图进行排序,得到用户的当前群体意图(S130)。该群体特征库包括群体的兴趣爱好、知识、意图倾向性等,群体特征越明显,倾向性的强度排序就会越加靠前。具体而言,群体化特征库中包括群体知识库(如歌手、菜谱名称和电影名称等)、热点信息(如屌丝、美眉、菜鸟等热门词汇)和群体化特征(如对于“北京”,群体意图中了解“北京百科”的倾向性明显高于了解“北京天气”的倾向性)。
本步骤中优选采用计分值对所有可能的潜在意图进行排序,分值越高的潜在意图表示群体倾向性越高。
例如,用户输入信息为“北京”,对于大众而言大多数人会倾向于了解北京的百科知识;而生活在北京或者近期需要到北京旅行、出差的用户则倾向于了解北京的天气。因此,“了解北京百科知识”的潜在意图的分值会高于“了解北京天气”的潜在意图,从而确定“了解北京百科知识”为用户当前的群体意图。
再比如,用户输入信息为“晚秋”,多数人会倾向于了解晚秋季节的天气状况,而音乐爱好者可能倾向于搜索“晚秋”这首歌曲。从而在本步骤中基于群体特征进行排序后,“了解晚秋季节的天气状况”的潜在意图的分值会高于“搜索晚秋这首歌曲”的潜在意图的分值,最终确定“了解晚秋季节的天气状况”为用户当前的群体意图。
为了准确判断出更符合用户个体属性的个性化意图,还要调用用户个性化特征库,基于个性化特征针对用户当前群体意图以及潜在意图进行排序(S140),以确定用户当前意图。
个性化特征库包括所有用户参数,至少包括上文所述的用户个体的原生属性、行为习惯和个性化属性等等。例如,原生属性包括年龄、性别、生日、爱好、星座和家乡等这些原始信息;而行为习惯包括职业、交通出行方式、起床时间、饮食口味和经常活动地点等伴随用户生活方式可能发生改变的属性;此外,个性化属性表示与用户喜好或者使用需求相关的偏好。
个性化特征库可以通过用户自定义、系统对用户请求进行统计分析、用户个性化选择(当不明确用户意图时,针对系统询问问题的回答)等方式来获取。通常,系统接收到的用户信息越丰富,则获取到的个性化知识也会越多。用户的个性化选择越多,用户个性化的意图倾向性也越明显,这是按照个性化特征进行强度排序的重要依据。
在一个优选的示例中,同样根据计分值对基于个性化特征识别到的个性化意图进行排序。其中,计分值最高的定义为目标意图,其表示最符合用户特征的意图。此外,基于个性化特征还识别到计分值排在第二位的个性化意图。
随后,根据计分值判断是否可以确定明确的用户意图(S150)。具体而言,在目标意图与分值排序为第二位的个性化意图之间的分值差足够大,且分值差超出预设值的情况下,说明用户的目标意图足够明显,将该目标意图确定为用户当前的意图并进行输出(S160)。这时输出的用户意图为舍弃了群体化特征而凸显用户个体属性的意图,更符合用户个性特征。
另外,在该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,表明用户的目标意图不是很明显,基于系统的自动排序不能确定用户的当前意图。此时需要利用上下文系统输出针对用户当前意图的提问信息,接收对所述提问信息的用户反馈信息(S170),根据该反馈信息获得用户当前意图。
或者,在基于个性化特征的排序结果中存在分值最高的至少一个目标意图的情况下,同样表示不能确定用户的当前意图,这时也需要执行步骤S170利用上下文系统向用户提问,根据用户的反馈信息获得用户的当前意图。关于系统通用的上下文系统,因其是本领域技术人员公知的技术,在此不再对其进行详细的赘述。
若用户个性化特征库存在有用户的用户属性、行为习惯或个性化属性,当系统再次接收到输入信息时,则需返回的与用户属性、行为习惯或个性化属性相关的意图分值较高。
此处仍以用户输入信息为“晚秋”为例进行说明。在步骤120中识别到可能的潜在意图有“搜索晚秋这首歌曲”和“搜索晚秋这部电影”,在步骤S130中确定“了解晚秋季节的天气状况”为用户当前的群体意图。在步骤S140中若用户个性化特征库中存储了个性化属性为“音乐”,则“搜索晚秋这首歌曲”的分值最高,为用户的目标意图;“搜索晚秋这部电影”的分值排序为第二位,也是一种个性化意图。
接下来,在步骤S150中若判断出“搜索晚秋这首歌曲”的分值与“搜索晚秋这部电影”的分值相差足够大,则可以确定“搜索晚秋这首歌曲”为符合用户特征的用户意图。可以看出,这时的意图识别结果已将“了解晚秋季节的天气状况”这个群体意图舍弃。
相反地,如果在步骤S150中若判断出“搜索晚秋这首歌曲”的分值与“搜索晚秋这部电影”的分值相差不大,或者,在步骤S140中“搜索晚秋这首歌曲”的分值与“搜索晚秋这部电影”的分值同样为最高分值,则执行步骤S170,利用上下文系统与用户进行主动交互。
此外,本实施例的方法还包括对群体化特征库进行更新的步骤(S180),结合互联网数据和用户数据,促进群体特征库的积累。具体而言,采集网络群体数据,对网络群体数据进行分析以提取群体特征和群体意图倾向性,对群体化特征库进行更新。对于互联网数据的分析包括对群体知识库的分析,如:歌手、菜谱名称、电影名称等等,也包括对当前热点信息的分析,如“屌丝”等,同时也包括对用户群体意图倾向性的分析,如对于“北京”,群体意图中北京百科的意图倾向性明显高于天气。
以及/或者,从接收到的用户反馈信息中提取多数用户的当前意图,更新所述群体特征库。也就是说,将确定出的具有个性化的用户意图反馈至群体化特征库,单一用户的倾向性意图会对其所属群体的群体意图产生影响,从而提高在群体意图识别步骤(S130)中识别结果的准确性。
此外,本实施例的方法还包括积累所述用户参数以及/或者所述用户反馈信息,对个性化特征库进行更新的步骤(S190)。对采集到的用户输入信息,以及/或者用户对提问的反馈信息进行挖掘,获取用户属性、行为习惯和个性化属性,对个性化特征库进行更新。
其中,对用户信息进行收集包括用户的位置信息、声音信息、网络信息以及用户输入的职业、年龄、性别、爱好等;同时对用户数据进行挖掘,通过对用户的提问数据进行挖掘,分析出用户的兴趣爱好、行为习惯等,促进个性化特征库的积累;最后还对用户回答进行分析,分析用户意图的倾向性。从而在个性化特征库中补充新的可能意图,并根据更新后的个性化特征库对用户意图进行分析和排序。用户个性化特征库可以结构化和非结构化的方式存储数据,关于用户个性化特征库的数据存储方式,因其是本领域技术人员公知的技术,在此不再对其进行详细的赘述。
至此为止完成意图识别方法的整个流程,采用对用户个性化的意图分析,当接收用户输入时,能够根据用户的性格偏好、年龄性别职业、语言行为习惯、知识特征等特性给出更人性化和个性化的服务。
实施例二
考虑到用户参数的多样化,本实施例主要提供在步骤S140中采用的几种个性化特征排序的方法,用于在不同的应用场景中选择性特定的用户参数进行排序,以增强个性化意图识别的应用灵活性。以下依照图2a至图2c对各种排序方法的步骤流程进行说明。
在图2a中,按照先后顺序依次调用用户个性化特征库中的用户原生属性、行为习惯和个性化属性,当在步骤S120和S130中识别到的潜在意图和群体意图能够匹配这些用户参数时,则确定为个性化意图并为其赋予一定的分值。这样以来,一种潜在意图或群体意图匹配到的用户参数越多,则其被赋予的分值的累计值越高。
而在图2b中,先为用户原生属性、行为习惯和个性化属性分别赋予权重系数x、y和z,再按照先后顺序依次调用用户个性化特征库中的用户原生属性、行为习惯和个性化属性。其中各个系数的数值大小可以根据智能机器人的需求进行调整。例如,在某一公司内部用户的行为习惯比较近似,则可以减小行为习惯的权重系数y,而增大权重系数x和z,从而增强用户原生属性和个性化属性在个性化意图判断中的比重,这样使得基于个性化特征的意图排序结果具备较强的适应性。
图2c是一种极端的示例,在用户的行为习惯完全相同的情况下可以完全忽略这一参数,也就是将权重系数y的取值设定为0。这样仅仅选择用户属性和个性化特征进行组合来排序,方法更为简单。
实施例三
本实施例提供一种意图识别系统。如图3所示,该系统主要包括获取模块310、意图识别模块320、群体特征排序模块330和个性化特征排序模块340。
获取模块310配置为获取待识别的输入信息。具体来说,获取模块310包括采集子模块311、转换子模块312和预处理子模块313。其中,采集子模块311配置为采集用户输入的语音信息并提取用户参数;转换子模块312配置为将所述语音信息和所述用户参数转换为文本格式信息;预处理子模块313配置为对所述文本格式信息进行预处理得到所述待识别的输入信息。
意图识别模块320配置为通过领域模型对所述待识别的输入信息进行意图识别得到潜在意图,所述潜在意图至少有一个。
群体特征排序模块330配置为调用群体特征库,基于群体特征针对所述潜在意图进行排序,得到用户当前群体意图。该群体特征库包括群体的兴趣爱好、知识、意图倾向性等,群体特征越明显,倾向性的强度排序就会越加靠前。优选采用计分值对所有可能的潜在意图进行排序,分值越高的潜在意图表示群体倾向性越高。
个性化特征排序模块340配置为调用用户个性化特征库,基于个性化特征针对所述用户当前群体意图以及所述潜在意图进行排序,确定用户当前意图。
需要说明的是,个性化特征排序模块340主要采用计分值对基于个性化特征识别到的个性化意图进行排序,此外还能通过上下文系统主动输出针对用户当前意图的提问信息,
如图3所示,个性化特征排序模块340包括分值判断子模块341、问题输出子模块342、反馈接收子模块343和意图输出子模块344。其中,分值判断子模块341用于基于个性化特征的排序结果中存在分值最高的目标意图,且该目标意图与分值排序为第二位的个性化意图之间的分值差超出预设值的情况下,确定该目标意图为用户当前意图。
此外,在该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,表明用户的目标意图不是很明显,基于系统的自动排序不能确定用户的当前意图。此时,由问题输出子模块342和反馈接收子模块343配合,通过对用户主动提问询问用户的意图。
具体的,问题输出子模块342在基于个性化特征的排序结果中存在分值最高的目标意图,而该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,利用上下文系统输出针对用户当前意图的提问信息。反馈接收子模块343用于接收对所述提问信息的用户反馈信息,根据该反馈信息获得用户当前意图。
进而意图输出子模块344将分值判断子模块341确定的用户意图,或者反馈接收子模块343接收的用户意图输出。
此外,本实施例的意图识别系统还包括第一群体更新模块351和/或第二群体更新模块352。第一群体更新模块351采集互联网数据更新群体特征库,第二群体更新模块352从接收到的用户反馈信息中提取多数用户的当前意图,更新所述群体特征库。
本实施例的意图识别系统还包括个性化特征更新模块360,其配置为积累所述用户参数以及/或者所述用户反馈信息,更新所述个性化特征库。
本实施例提供的意图识别系统采用对用户个性化的意图分析,当接收用户输入时,能够根据用户的性格偏好、年龄性别职业、语言行为习惯、知识特征等特性给出更人性化和个性化的服务。
实施例四
考虑到用户参数的多样化,本实施例主要提供在个性化特征排序模块340中分值判断子模块341的几种不同实现形式,用于在不同的应用场景中选择性特定的用户参数进行排序,以增强个性化意图识别的应用灵活性。
图4a为分值判断子模块341的一种结构。原生属性匹配单元411、行为习惯匹配单元412和个性化属性匹配单元413分别按照先后顺序依次调用用户个性化特征库中的用户原生属性、行为习惯和个性化属性,当意图识别模块320和群体特征排序模块330识别到的潜在意图和群体意图能够匹配这些参数时,确定为个性化意图并为其赋予一定的分值。累计单元414则将每种个性化意图被赋予的分值进行累计。
图4b为分值判断子模块341的另一种结构。权重设定单元428先为用户原生属性、行为习惯和个性化属性分别赋予权重系数x、y和z,再由原生属性匹配单元421、行为习惯匹配单元422和个性化属性匹配单元423分别按照先后顺序依次调用用户个性化特征库中的用户原生属性、行为习惯和个性化属性。当意图识别模块320和群体特征排序模块330识别到的潜在意图和群体意图能够匹配这些参数时,确定为个性化意图。
原生属性匹配单元421根据权重系数x为个性化意图赋予分值,相应的,行为习惯匹配单元422根据权重系数y为个性化意图赋予分值,个性化属性匹配单元423根据权重系数z为个性化意图赋予分值。随后,累计单元424则将每种个性化意图被赋予的分值进行累计。
其中各个系数的数值大小可以根据智能机器人的需求进行调整,使得基于个性化特征的意图排序结果具备较强的适应性。
图4c为分值判断子模块341的又一种结构。在用户的行为习惯完全相同的情况下可以完全忽略这一参数,也就是权重设定单元438将权重系数y的取值设定为0。这样,原生属性匹配单元431根据权重系数x为个性化意图赋予分值,个性化属性匹配单元433根据权重系数z为个性化意图赋予分值,累计单元434则将每种个性化意图被赋予的分值进行累计。这样仅仅选择用户属性和个性化特征进行组合来排序,实现更为简单。
虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (12)
1.一种面向智能机器人的意图识别方法,其特征在于,包括以下步骤:
获取待识别的输入信息;
通过领域模型对所述待识别的输入信息进行意图识别得到潜在意图,所述潜在意图至少有一个,包括用户所有可能的意图,其中,领域模型是通过对各个领域各自的数据进行训练得出的,其本质上是一种归类模型,利用语义归类算法将用户输入的命令归类到不同的领域;
调用群体特征库,基于群体特征针对所述潜在意图进行排序,得到用户当前群体意图;
调用用户个性化特征库,基于个性化特征针对所述用户当前群体意图以及所述潜在意图进行排序,确定用户当前意图。
2.如权利要求1所述的意图识别方法,其特征在于,所述获取待识别的输入信息的步骤包括:
采集用户输入的语音信息并提取用户参数;
将所述语音信息和所述用户参数转换为文本格式信息;
对所述文本格式信息进行预处理得到所述待识别的输入信息。
3.如权利要求2所述的意图识别方法,其特征在于,所述确定用户当前意图的步骤中包括:
在基于个性化特征的排序结果中存在分值最高的目标意图,且该目标意图与分值排序为第二位的个性化意图之间的分值差超出预设值的情况下,确定该目标意图为用户当前意图。
4.如权利要求3所述的意图识别方法,其特征在于,所述确定用户当前意图的步骤中还包括:
在基于个性化特征的排序结果中存在分值最高的目标意图,而该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,利用上下文系统输出针对用户当前意图的提问信息;
接收对所述提问信息的用户反馈信息,根据该反馈信息获得用户当前意图。
5.如权利要求4所述的意图识别方法,其特征在于,还包括:
采集互联网数据更新群体特征库;以及/或者
从接收到的用户反馈信息中提取多数用户的当前意图,更新所述群体特征库。
6.如权利要求5所述的意图识别方法,其特征在于,还包括:
积累所述用户参数以及/或者所述用户反馈信息,更新所述个性化特征库。
7.一种面向智能机器人的意图识别系统,其特征在于,包括:
获取模块,其配置为获取待识别的输入信息;
意图识别模块,其配置为通过领域模型对所述待识别的输入信息进行意图识别得到潜在意图,所述潜在意图至少有一个,包括用户所有可能的意图,其中,领域模型是通过对各个领域各自的数据进行训练得出的,其本质上是一种归类模型,利用语义归类算法将用户输入的命令归类到不同的领域;
群体特征排序模块,其配置为调用群体特征库,基于群体特征针对所述潜在意图进行排序,得到用户当前群体意图;
个性化特征排序模块,其配置为调用用户个性化特征库,基于个性化特征针对所述用户当前群体意图以及所述潜在意图进行排序,确定用户当前意图。
8.如权利要求7所述的意图识别系统,其特征在于,所述获取模块还包括:
采集子模块,其配置为采集用户输入的语音信息并提取用户参数;
转换子模块,其配置为将所述语音信息和所述用户参数转换为文本格式信息;
预处理子模块,其配置为对所述文本格式信息进行预处理得到所述待识别的输入信息。
9.如权利要求8所述的意图识别系统,其特征在于,所述个性化特征排序模块中还包括:
分值判断子模块,其配置为在基于个性化特征的排序结果中存在分值最高的目标意图,且该目标意图与分值排序为第二位的个性化意图之间的分值差超出预设值的情况下,确定该目标意图为用户当前意图。
10.如权利要求9所述的意图识别系统,其特征在于,所述个性化特征排序模块中还包括:
问题输出子模块,其配置为在基于个性化特征的排序结果中存在分值最高的目标意图,而该目标意图与分值排序为第二位的个性化意图之间的分值差低于预设值的情况下,利用上下文系统输出针对用户当前意图的提问信息;
反馈接收子模块,其配置为接收对所述提问信息的用户反馈信息,根据该反馈信息获得用户当前意图。
11.如权利要求10所述的意图识别系统,其特征在于,还包括:
第一群体特征更新模块,其配置为采集互联网数据更新群体特征库;以及/或者
第二群体特征更新模块,其配置为从接收到的用户反馈信息中提取多数用户的当前意图,更新所述群体特征库。
12.如权利要求11所述的意图识别系统,其特征在于,还包括:
个性化特征更新模块,其配置为积累所述用户参数以及/或者所述用户反馈信息,更新所述个性化特征库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510857709.8A CN105487663B (zh) | 2015-11-30 | 2015-11-30 | 一种面向智能机器人的意图识别方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510857709.8A CN105487663B (zh) | 2015-11-30 | 2015-11-30 | 一种面向智能机器人的意图识别方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105487663A CN105487663A (zh) | 2016-04-13 |
CN105487663B true CN105487663B (zh) | 2018-09-11 |
Family
ID=55674687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510857709.8A Active CN105487663B (zh) | 2015-11-30 | 2015-11-30 | 一种面向智能机器人的意图识别方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105487663B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489566A (zh) * | 2019-08-22 | 2019-11-22 | 上海软中信息系统咨询有限公司 | 一种智能导诊服务机器人的导诊方法 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10229687B2 (en) * | 2016-03-10 | 2019-03-12 | Microsoft Technology Licensing, Llc | Scalable endpoint-dependent natural language understanding |
WO2018000205A1 (zh) * | 2016-06-28 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种基于多意图的多技能包问答方法、系统和机器人 |
WO2018000270A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种基于用户画像的个性化回答生成方法及系统 |
CN106489148A (zh) * | 2016-06-29 | 2017-03-08 | 深圳狗尾草智能科技有限公司 | 一种基于用户画像的意图场景识别方法及系统 |
WO2018000279A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 基于导流的意图识别方法和系统 |
CN106537294A (zh) * | 2016-06-29 | 2017-03-22 | 深圳狗尾草智能科技有限公司 | 一种机器人交互内容的生成方法、系统及机器人 |
CN106503189B (zh) * | 2016-10-31 | 2020-03-03 | 北京百度网讯科技有限公司 | 基于人工智能的搜索系统优化方法和装置 |
CN108073600B (zh) * | 2016-11-11 | 2022-06-03 | 阿里巴巴集团控股有限公司 | 一种智能问答交互方法、装置以及电子设备 |
CN106844429B (zh) * | 2016-12-12 | 2020-01-14 | 北京光年无限科技有限公司 | 一种用于机器人的互联网辅助应用方法 |
CN106845624A (zh) * | 2016-12-16 | 2017-06-13 | 北京光年无限科技有限公司 | 与智能机器人的应用程序有关的多模态交互方法及系统 |
CN106649762A (zh) * | 2016-12-27 | 2017-05-10 | 竹间智能科技(上海)有限公司 | 基于追问问题与反馈信息的意图识别方法、系统 |
CN108268555A (zh) * | 2017-01-03 | 2018-07-10 | 中国移动通信有限公司研究院 | 一种信息处理方法及装置 |
CN106951468B (zh) * | 2017-03-02 | 2018-12-28 | 腾讯科技(深圳)有限公司 | 对话生成方法及装置 |
US10798027B2 (en) * | 2017-03-05 | 2020-10-06 | Microsoft Technology Licensing, Llc | Personalized communications using semantic memory |
CN106997342B (zh) * | 2017-03-27 | 2020-08-18 | 上海奔影网络科技有限公司 | 基于多轮交互的意图识别方法和装置 |
CN107180115A (zh) * | 2017-06-28 | 2017-09-19 | 上海与德通讯技术有限公司 | 机器人的交互方法及系统 |
CN107679062B (zh) * | 2017-07-31 | 2021-02-05 | 石河子大学 | 一种推理群体意图的方法及电子设备 |
CN107621874B (zh) * | 2017-08-01 | 2021-03-30 | 北京光年无限科技有限公司 | 内容分发方法及系统 |
CN107515857B (zh) * | 2017-08-31 | 2020-08-18 | 科大讯飞股份有限公司 | 基于定制技能的语义理解方法及系统 |
CN108319485A (zh) * | 2018-01-29 | 2018-07-24 | 出门问问信息科技有限公司 | 信息交互方法、装置、设备及存储介质 |
CN109561225A (zh) * | 2018-12-04 | 2019-04-02 | 合肥天骋电子商务有限公司 | 一种智能语音导航集中系统 |
CN109783733B (zh) * | 2019-01-15 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 用户画像生成装置及方法、信息处理装置及存储介质 |
CN110096570B (zh) * | 2019-04-09 | 2021-03-30 | 苏宁易购集团股份有限公司 | 一种应用于智能客服机器人的意图识别方法及装置 |
CN110232114A (zh) * | 2019-05-06 | 2019-09-13 | 平安科技(深圳)有限公司 | 语句意图识别方法、装置及计算机可读存储介质 |
CN110955675B (zh) * | 2019-10-30 | 2023-12-19 | 中国银联股份有限公司 | 机器人对话方法、装置、设备及计算机可读存储介质 |
CN111177296B (zh) * | 2019-12-30 | 2022-12-06 | 科大讯飞股份有限公司 | 信息推荐方法、装置、电子设备及计算机存储介质 |
WO2023272502A1 (zh) * | 2021-06-29 | 2023-01-05 | 华为技术有限公司 | 一种人机交互方法及装置、设备及车辆 |
CN115373283A (zh) * | 2022-07-29 | 2022-11-22 | 青岛海尔科技有限公司 | 控制指令的确定方法及装置、存储介质及电子装置 |
CN116163620B (zh) * | 2023-02-28 | 2024-08-06 | 重庆长安汽车股份有限公司 | 一种车辆门窗智慧开关方法、系统、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103078995A (zh) * | 2012-12-18 | 2013-05-01 | 苏州思必驰信息科技有限公司 | 一种在移动终端使用的可定制的个性化应答方法和系统 |
CN104951077A (zh) * | 2015-06-24 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法、装置和终端设备 |
CN105094315A (zh) * | 2015-06-25 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机智能聊天的方法和装置 |
-
2015
- 2015-11-30 CN CN201510857709.8A patent/CN105487663B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103078995A (zh) * | 2012-12-18 | 2013-05-01 | 苏州思必驰信息科技有限公司 | 一种在移动终端使用的可定制的个性化应答方法和系统 |
CN104951077A (zh) * | 2015-06-24 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法、装置和终端设备 |
CN105094315A (zh) * | 2015-06-25 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机智能聊天的方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489566A (zh) * | 2019-08-22 | 2019-11-22 | 上海软中信息系统咨询有限公司 | 一种智能导诊服务机器人的导诊方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105487663A (zh) | 2016-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105487663B (zh) | 一种面向智能机器人的意图识别方法和系统 | |
CN106682090B (zh) | 主动交互实现装置、方法及智能语音交互设备 | |
CN109918650B (zh) | 自动生成采访稿的采访智能机器人装置及智能采访方法 | |
CN104615608B (zh) | 一种数据挖掘处理系统及方法 | |
CN107316643A (zh) | 语音交互方法及装置 | |
CN109543722A (zh) | 一种基于情感分析模型的情感趋势预测方法 | |
CN107169001A (zh) | 一种基于众包反馈和主动学习的文本分类模型优化方法 | |
CN104933113A (zh) | 一种基于语义理解的表情输入方法和装置 | |
CN104464733A (zh) | 一种语音对话的多场景管理方法及装置 | |
KR102218468B1 (ko) | 텍스트의 내용 및 감정 분석에 기반한 답변 추천 시스템 및 방법 | |
CN106250553A (zh) | 一种服务推荐方法及终端 | |
CN106649849A (zh) | 文本信息库建立方法和装置、以及搜索方法、装置和系统 | |
CN110462676A (zh) | 电子装置、其控制方法和非暂态计算机可读记录介质 | |
CN111199149B (zh) | 一种对话系统的语句智能澄清方法及系统 | |
CN107103093B (zh) | 一种基于用户行为和情感分析的短文本推荐方法及装置 | |
CN108388553A (zh) | 对话消除歧义的方法、电子设备及面向厨房的对话系统 | |
CN109902235A (zh) | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 | |
CN111914157A (zh) | 一种基于用户偏好的旅游方案生成方法和系统 | |
CN109918409A (zh) | 一种设备画像构建方法、装置、存储介质及设备 | |
CN112988970A (zh) | 一种服务于智能问答系统的文本匹配算法 | |
CN114706966A (zh) | 基于人工智能的语音交互方法、装置、设备及存储介质 | |
CN110362664A (zh) | 一种对聊天机器人faq知识库存储与匹配的方法及装置 | |
Thiengburanathum et al. | A decision tree based recommendation system for tourists | |
CN115203393A (zh) | 一种对话应答方法及其系统、电子设备、存储介质 | |
CN112215629B (zh) | 基于构造对抗样本的多目标广告生成系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |