CN109783736B - 一种意图推测方法及系统 - Google Patents
一种意图推测方法及系统 Download PDFInfo
- Publication number
- CN109783736B CN109783736B CN201910046977.XA CN201910046977A CN109783736B CN 109783736 B CN109783736 B CN 109783736B CN 201910046977 A CN201910046977 A CN 201910046977A CN 109783736 B CN109783736 B CN 109783736B
- Authority
- CN
- China
- Prior art keywords
- intention
- current
- class
- corpus information
- intent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于数据处理技术领域,公开了一种意图推测方法及系统,其方法包括:获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型;获取当前用户输入的当前语料信息;识别所述当前语料信息对应的当前意图;根据所述当前意图及所述意图推测模型,推测用户下一步的意图。本发明通过大量语料信息建立的意图推测模型可提高意图推测的准确率,以便更好地向用户推荐相应的内容,提高用户的使用体验。
Description
技术领域
本发明属于数据处理技术领域,特别涉及一种意图推测方法及系统。
背景技术
随着网联网技术的迅速发展,基于互联网的应用越来越多,例如娱乐类应用、即时通讯类应用、电子商务类应用等。在目前的一些应用中,如娱乐类应用、电子商务类应用等,应用开发公司为了提高自身在行业内的竞争力,需要开发更多的实用功能,以给用户提供更好的服务。
目前,为了给用户更好的使用体验,很多应用都开发了推荐功能,现有的推荐功能一般是根据用户的用户信息、历史行为和个人喜好等信息来进行推荐,但是由于用户的历史行为和个人喜好无法准确地反映用户的下一步意图,因此,同样无法准确地向用户进行推荐。
发明内容
本发明的目的是提供一种意图推测方法及系统,通过大量语料信息建立的意图推测模型来推测用户下一步的意图,可提高意图推测的准确率。
本发明提供的技术方案如下:
一方面,提供一种意图推测方法,包括:
获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型;
获取当前用户输入的当前语料信息;
识别所述当前语料信息对应的当前意图;
根据所述当前意图及所述意图推测模型,推测用户下一步的意图。
进一步优选地,所述根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型具体包括:
根据意图类型对所述意图进行分类,得到多个大类意图集合;
根据每个大类意图集合中的意图之间的关联关系和每个大类意图集合中的意图对应的语料信息产生的时间,得到每个大类意图集合对应的意图推测模型;
所述根据所述当前意图及所述意图推测模型,推测用户下一步的意图具体包括:
根据所述当前意图确定所述当前意图对应的大类意图;
根据所述大类意图查找到对应的大类意图集合作为目标大类意图集合;
根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图。
进一步优选地,所述根据每个大类意图集合中的意图之间的关联关系和每个大类意图集合中的意图对应的语料信息产生的时间,得到每个大类意图集合对应的意图推测模型具体包括:
分析每个大类意图集合中的意图之间的关联关系;
根据每个大类意图集合中的意图对应的语料信息产生的时间,对每个大类意图集合中的意图进行排序,得到每个大类意图集合对应的意图推测模型。
进一步优选地,所述根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图具体包括:
在所述目标大类意图集合中查找与所述当前意图相匹配的意图作为目标意图;
根据所述目标大类意图集合对应的意图推测模型,得到与所述目标意图相关联的下一步意图;
根据所述目标意图相关联的下一步意图推测用户下一步的意图。
进一步优选地,所述识别所述当前语料信息对应的当前意图具体包括:
对所述当前语料信息进行分词,提取出所述当前语料信息中的当前关键词;
根据预先建立的关键词的概率分布和所述当前关键词,识别所述当前语料信息对应的当前意图。
另一方面,还提供一种意图推测系统,包括:
语料获取模块,用于获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
意图推测模型生成模块,用于根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型;
当前信息获取模块,用于获取当前用户输入的当前语料信息;
意图识别模块,用于识别所述当前语料信息对应的当前意图;
意图推测模块,用于根据所述当前意图及所述意图推测模型,推测用户下一步的意图。
进一步优选地,所述意图推测模型生成模块包括:
意图分类单元,用于根据意图类型对所述意图进行分类,得到多个大类意图集合;
意图推测模型生成单元,用于根据每个大类意图集合中的意图之间的关联关系和每个大类意图集合中的意图对应的语料信息产生的时间,得到每个大类意图集合对应的意图推测模型;
所述意图推测模块包括:
大类意图确定单元,用于根据所述当前意图确定所述当前意图对应的大类意图;
大类意图查找单元,用于根据所述大类意图查找到对应的大类意图集合作为目标大类意图集合;
意图推测单元,用于根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图。
进一步优选地,所述意图推测模型生成单元包括:
关联关系分析子单元,用于分析每个大类意图集合中的意图之间的关联关系;
意图排序子单元,用于根据每个大类意图集合中的意图对应的语料信息产生的时间,对每个大类意图集合中的意图进行排序,得到每个大类意图集合对应的意图推测模型。
进一步优选地,所述意图推测单元包括:
目标意图查找子单元,用于在所述目标大类意图集合中查找与所述当前意图相匹配的意图作为目标意图;
关联意图获取子单元,用于根据所述目标大类意图集合对应的意图推测模型,得到与所述目标意图相关联的下一步意图;
意图推测子单元,用于根据所述目标意图相关联的下一步意图推测用户下一步的意图。
进一步优选地,所述意图识别模块包括:
关键词提取单元,用于对所述当前语料信息进行分词,提取出所述当前语料信息中的当前关键词;
意图识别单元,用于根据预先建立的关键词的概率分布和所述当前关键词,识别所述当前语料信息对应的当前意图。
与现有技术相比,本发明提供的一种意图推测方法及系统具有以下有益效果:
1、本发明中,通过收集大量语料信息以及语料信息对应的意图和产生的时间建立包含了意图与时间的关系的意图推测模型,当获取到当前用户输入的语料信息时,即可根据当前用户的当前意图和预先建立的意图推测模型的逻辑,推测用户下一步的意图;本发明通过大量语料信息建立的意图推测模型可提高意图推测的准确率,以便更好地向用户推荐相应的内容,提高用户的使用体验。
2、在本发明一优选实施例中,根据意图出现的频率给同一时间点产生的多个意图赋予权重值,以实现根据大数据来推测用户下一步的意图,从而提高意图推测的准确率。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种意图推测方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种意图推测方法的第一实施例的流程示意图;
图2是本发明一种意图推测方法的第二实施例的流程示意图;
图3是本发明一种意图推测方法的第三实施例的流程示意图;
图4是本发明一种意图推测方法的第四实施例的流程示意图;
图5是本发明一种意图推测方法的第五实施例的流程示意图;
图6是本发明一种意图推测系统的一个实施例的结构示意框图。
附图标号说明
100、语料获取模块; 200、意图推测模型生成模块;
210、意图分类单元; 220、意图推测模型生成单元;
221、关联关系分析子单元; 222、意图排序子单元;
300、当前信息获取模块; 400、意图识别模块;
410、关键词提取单元; 420、意图识别单元;
500、意图推测模块; 510、大类意图确定单元;
520、大类意图查找单元; 530、意图推测单元;
531、目标意图查找子单元; 532、关联意图获取子单元;
533、意图推测子单元。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
根据本发明提供的第一实施例,如图1所示,一种意图推测方法,包括:
S100获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
S200根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型;
S300获取当前用户输入的当前语料信息;
S400识别所述当前语料信息对应的当前意图;
S500根据所述当前意图及所述意图推测模型,推测用户下一步的意图。
具体地,本实施例先获取大量用户在使用某一应用时产生的语料信息,语料信息可以是语音输入的信息也可以是文字输入的信息,应用可以是搜索APP、视频APP、购物APP、娱乐类APP等。并获取每条语料信息对应的意图和产生的时间。例如,用户A在使用设备1时,记录下用户A文字输入或语音输入的语料信息和输入的时间(产生的时间),然后识别出该语料信息的意图并记录下来。通过收集不同设备上记录的语料信息、语料信息对应的意图和产生的时间,即可得到大量用户的语料信息及每条语料信息对应的意图和产生的时间。
然后分析每条语料信息对应的意图之间的关联关系,并根据意图之间的关联关系和每条语料信息产生的时间得到意图推测模型,即意图推测模型中包含了意图与时间的关系。
当获取到当前用户输入的当前语料信息后,先识别出当前语料信息的当前意图(即用户的当前意图),然后根据预先建立的意图推测模型和用户的当前意图,推测用户下一步的意图,即根据意图推测模型中包含的意图与时间的关系以及用户的当前意图推测用户下一步的意图,以便更好地向用户推荐相应的内容。
本实施例中,通过收集大量语料信息以及语料信息对应的意图和产生的时间建立包含了意图与时间的关系的意图推测模型,当获取到当前用户输入的语料信息时,即可根据当前用户的当前意图和预先建立的意图推测模型的逻辑,推测用户下一步的意图;本发明通过大量语料信息建立的意图推测模型可提高意图推测的准确率,以便更好地向用户推荐相应的内容,提高用户的使用体验。
根据本发明提供的第二实施例,如图2所示,一种意图推测方法,包括:
S100获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
S210根据意图类型对所述意图进行分类,得到多个大类意图集合;
S220根据每个大类意图集合中的意图之间的关联关系和每个大类意图集合中的意图对应的语料信息产生的时间,得到每个大类意图集合对应的意图推测模型;
S300获取当前用户输入的当前语料信息;
S400识别所述当前语料信息对应的当前意图;
S510根据所述当前意图确定所述当前意图对应的大类意图;
S520根据所述大类意图查找到对应的大类意图集合作为目标大类意图集合;
S530根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图。
具体地,在建立意图推测模型时,可先根据意图类型对意图进行分类,得到多个大类意图集合,例如大类意图可以分为:音乐、视频、游戏、体育、美食、医疗、娱乐等;大类意图还可以为视频中的电视剧、电影、综艺、动漫等。
每个大类意图集合中包括该大类意图下的多种意图,例如,若大类意图为视频,则大类意图集合中包括的意图可以为电视剧、电影、综艺、动漫、而电视剧中又包括各种类型的剧集,同样电影包括各种类型的电影。因此,各个大类意图集合中的意图之间存在关联关系,根据每个大类意图集合中的意图之间的关联关系和意图对应的语料信息产生的时间,就可得到每个大类意图集合对应的意图推测模型,即每个大类意图对应一个意图推测模型。
当获取到当前用户输入的当前语料信息后,先识别当前语料信息对应的当前意图,然后根据当前意图确定当前意图对应的大类意图。再根据当前意图对应的大类意图查找到对应的大类意图集合作为目标大类意图集合,然后根据目标大类意图集合对应的意图推测模型和当前意图推测用户下一步的意图,即根据目标大类意图集合中的意图之间的关联关系以及意图与时间的关系推测用户下一步的意图。
根据本发明提供的第三实施例,如图3所示,一种意图推测方法,包括:
S100获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
S210根据意图类型对所述意图进行分类,得到多个大类意图集合;
S221分析每个大类意图集合中的意图之间的关联关系;
S222根据每个大类意图集合中的意图对应的语料信息产生的时间,对每个大类意图集合中的意图进行排序,得到每个大类意图集合对应的意图推测模型;
S300获取当前用户输入的当前语料信息;
S400识别所述当前语料信息对应的当前意图;
S510根据所述当前意图确定所述当前意图对应的大类意图;
S520根据所述大类意图查找到对应的大类意图集合作为目标大类意图集合;
S530根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图。
具体地,本实施例以建立一个大类意图集合(当前大类意图集合)的意图推测模型为例进行说明。先分析当前大类意图集合中的意图之间的关联关系,意图之间的关联关系包括同级关系和上下级关系,然后根据当前大类意图集合中的意图对应的语料信息产生的时间,对当前大类意图集合中的意图进行排序,得到当前大类意图集合对应的意图推测模型,意图推测模型中。
示例性地,当前大类意图集合中的意图包括意图1、意图2、意图3、意图4、意图5、意图6和意图7,意图1、意图2和意图3之间具有关联关系,意图4、意图5、意图6和意图7之间具有关联关系,即认为意图1、意图2和意图3属于同一子类型的意图,意图4、意图5、意图6和意图7属于同一子类型的意图,上述意图按产生的时间顺序进行排序得到意图2、意图5、意图1、意图3、意图4、意图6和意图7,将同一子类型的意图1、意图2和意图3按产生的时间顺序进行排序得到意图2、意图1和意图3,将同一子类型的意图4、意图5、意图6和意图7按产生的时间顺序进行排序得到意图5、意图4、意图6和意图7,通过上述方法即可得到多个子类型的意图排序,多个子类型的意图排序即组成了当前大类意图集合对应的意图推测模型。
若同一子类型的意图排序在同一时间点产生多个意图,则根据意图在大量语料信息中出现的频率为同一时间点产生的多个意图赋予权重,例如,在意图4之后的时间点B同时产生了意图5、意图6和意图7,则统计意图5、意图6和意图7对应的语料信息在大量语料信息中出现的频率,然后根据频率为意图5、意图6和意图7赋予权重值。同一时间点可以为一小段时间,如可将在10s内产生的意图都视为是在同一时间点产生的意图。
本实施例中,根据意图出现的频率给同一时间点产生的多个意图赋予权重值,以实现根据大数据来推测用户下一步的意图,从而提高意图推测的准确率。
根据本发明提供的第四实施例,如图4所示,一种意图推测方法,包括:
S100获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
S210根据意图类型对所述意图进行分类,得到多个大类意图集合;
S221分析每个大类意图集合中的意图之间的关联关系;
S222根据每个大类意图集合中的意图对应的语料信息产生的时间,对每个大类意图集合中的意图进行排序,得到每个大类意图集合对应的意图推测模型;
S300获取当前用户输入的当前语料信息;
S400识别所述当前语料信息对应的当前意图;
S510根据所述当前意图确定所述当前意图对应的大类意图;
S520根据所述大类意图查找到对应的大类意图集合作为目标大类意图集合;
S531在所述目标大类意图集合中查找与所述当前意图相匹配的意图作为目标意图;
S532根据所述目标大类意图集合对应的意图推测模型,得到与所述目标意图相关联的下一步意图;
S533根据所述目标意图相关联的下一步意图推测用户下一步的意图。
具体地,根据当前意图对应的大类意图查找到目标大类意图集合后,在目标大类意图集合中查找与当前意图相匹配的意图,然后根据目标大类意图集合对应的意图推测模型,得到与该相匹配的意图相关联的下一步意图,最后根据目标意图相关联的下一步意图推测用户下一步的意图。
示例性地,若目标意图为意图4,在意图推测模型中意图4对应的子类型的意图排序为意图5、意图4、意图6和意图7,根据意图4即可推测用户下一步的意图为6。
当在意图推测模型中,意图4的下一时间点同时对应多个意图时,可根据对应的多个意图的权重值来推测用户的下一步意图,如选择权重值最高的意图作为用户下一步的意图。
根据本发明提供的第五实施例,如图5所示,一种意图推测方法,包括:
S100获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
S200根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型;
S300获取当前用户输入的当前语料信息;
S410对所述当前语料信息进行分词,提取出所述当前语料信息中的当前关键词;
S420根据预先建立的关键词的概率分布和所述当前关键词,识别所述当前语料信息对应的当前意图;
S500根据所述当前意图及所述意图推测模型,推测用户下一步的意图。
具体地,本实施例中,可先根据大数据建立关键词的概率分布,然后根据预先建立的关键词的概率分布和当前关键词,识别当前语料信息对应的当前意图。
在从当前语料信息中提取关键词时,先对当前语料信息进行分词标注,得到当前语料信息对应的分词后的词语以及每个词语的词性,然后根据每个词语的词性,从所有词语中提取出关键词,本实施例中,提取出的关键词为分词后得到的所有词语中的名词。
例如,语料信息1为“猴子吃香蕉”,则从语料信息1中提取出的关键词为“猴子”和“香蕉”;若语料信息2为“鲸鱼为什么会喷水”,则从语料信息2中提取出的关键词为“鲸鱼”;若语料信息3为“周杰伦的歌曲”,则从语料信息3中提取出的关键词为“周杰伦”和“歌曲”。
建立关键词的概率分布时,先收集大量的语料信息,形成语料库,然后对每条语料信息进行处理,提取每条语料信息中的关键词,即可得到大量的关键词,然后统计每个关键词出现的频率,根据每个关键词出现的频率对所有关键词进行排序,得到所有关键词的频率分布,即根据大数据分析,得到提取出的所有关键词的频率分布。
当获取到当前语料信息后,先提取出当前语料信息中的当前关键词,然后根据关键词的频率分布,在当前关键词中查找出目标当前关键词。
示例性地,例如大量语料信息包括语料1、语料2和语料3,从语料1中提取出的关键词为关键词1和关键词2;从语料2中提取出的关键词为关键词1和关键词3;从语料3中提取出的关键词为关键词1和关键词4;从语料4中提取出的关键词为关键词2和关键词4。
统计关键词1、关键词2、关键词3和关键词4在语料中出现的频率即为:关键词1出现的频率为3次,关键词2出现的频率为2次,关键词3出现的频率为1次,关键词4出现的频率为2次,根据关键词出现的频率对关键词进行排序即可得到关键词1、关键词2、关键词4、关键词3。
当从当前语料信息中提取出的当前关键词为关键词1和关键词2,根据关键词1和关键词2的概率分布,确定出的目标当前关键词为关键词1,根据关键词1即可确定当前语料信息对应的意图。
本实施例中,先根据大量的语料信息形成关键词的频率分布,然后从用户输入的当前语料信息中提取出当前关键词,最后根据预先形成的关键词的频率分布,从当前关键词中提取出目标当前关键词,即可得到当前语料信息最可能的意图,本发明根据大数据得到的关键词的频率分布来识别得到用户最可能的意图,以提高意图识别的准确率的概率,并可提高用户的使用体验。
当然,除了可使用本实施例的方法来识别当前语料信息对应的意图,还可以使用现有技术中的正则表达式等方法来识别当前语料信息对应的意图。
根据本发明提供的第六实施例,如图6所示,一种意图推测系统,包括:
语料获取模块100,用于获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
意图推测模型生成模块200,用于根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型;
当前信息获取模块300,用于获取当前用户输入的当前语料信息;
意图识别模块400,用于识别所述当前语料信息对应的当前意图;
意图推测模块500,用于根据所述当前意图及所述意图推测模型,推测用户下一步的意图。
具体地,本实施例先获取大量用户在使用某一应用时产生的语料信息,语料信息可以是语音输入的信息也可以是文字输入的信息,应用可以是搜索APP、视频APP、购物APP、娱乐类APP等。并获取每条语料信息对应的意图和产生的时间。例如,用户A在使用设备1时,记录下用户A文字输入或语音输入的语料信息和输入的时间(产生的时间),然后识别出该语料信息的意图并记录下来。通过收集不同设备上记录的语料信息、语料信息对应的意图和产生的时间,即可得到大量用户的语料信息及每条语料信息对应的意图和产生的时间。
然后分析每条语料信息对应的意图之间的关联关系,并根据意图之间的关联关系和每条语料信息产生的时间得到意图推测模型,即意图推测模型中包含了意图与时间的关系。
当获取到当前用户输入的当前语料信息后,先识别出当前语料信息的当前意图(即用户的当前意图),然后根据预先建立的意图推测模型和用户的当前意图,推测用户下一步的意图,即根据意图推测模型中包含的意图与时间的关系以及用户的当前意图推测用户下一步的意图,以便更好地向用户推荐相应的内容。
本实施例中,通过收集大量语料信息以及语料信息对应的意图和产生的时间建立包含了意图与时间的关系的意图推测模型,当获取到当前用户输入的语料信息时,即可根据当前用户的当前意图和预先建立的意图推测模型的逻辑,推测用户下一步的意图;本发明通过大量语料信息建立的意图推测模型可提高意图推测的准确率,以便更好地向用户推荐相应的内容,提高用户的使用体验。
优选地,所述意图推测模型生成模块200包括:
意图分类单元210,用于根据意图类型对所述意图进行分类,得到多个大类意图集合;
意图推测模型生成单元220,用于根据每个大类意图集合中的意图之间的关联关系和每个大类意图集合中的意图对应的语料信息产生的时间,得到每个大类意图集合对应的意图推测模型;
所述意图推测模块500包括:
大类意图确定单元510,用于根据所述当前意图确定所述当前意图对应的大类意图;
大类意图查找单元520,用于根据所述大类意图查找到对应的大类意图集合作为目标大类意图集合;
意图推测单元530,用于根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图。
具体地,在建立意图推测模型时,可先根据意图类型对意图进行分类,得到多个大类意图集合,例如大类意图可以分为:音乐、视频、游戏、体育、美食、医疗、娱乐等;大类意图还可以为视频中的电视剧、电影、综艺、动漫等。
每个大类意图集合中包括该大类意图下的多种意图,例如,若大类意图为视频,则大类意图集合中包括的意图可以为电视剧、电影、综艺、动漫、而电视剧中又包括各种类型的剧集,同样电影包括各种类型的电影。因此,各个大类意图集合中的意图之间存在关联关系,根据每个大类意图集合中的意图之间的关联关系和意图对应的语料信息产生的时间,就可得到每个大类意图集合对应的意图推测模型,即每个大类意图对应一个意图推测模型。
当获取到当前用户输入的当前语料信息后,先识别当前语料信息对应的当前意图,然后根据当前意图确定当前意图对应的大类意图。再根据当前意图对应的大类意图查找到对应的大类意图集合作为目标大类意图集合,然后根据目标大类意图集合对应的意图推测模型和当前意图推测用户下一步的意图,即根据目标大类意图集合中的意图之间的关联关系以及意图与时间的关系推测用户下一步的意图。
优选地,所述意图推测模型生成单元220包括:
关联关系分析子单元221,用于分析每个大类意图集合中的意图之间的关联关系;
意图排序子单元222,用于根据每个大类意图集合中的意图对应的语料信息产生的时间,对每个大类意图集合中的意图进行排序,得到每个大类意图集合对应的意图推测模型。
具体地,本实施例以建立一个大类意图集合(当前大类意图集合)的意图推测模型为例进行说明。先分析当前大类意图集合中的意图之间的关联关系,意图之间的关联关系包括同级关系和上下级关系,然后根据当前大类意图集合中的意图对应的语料信息产生的时间,对当前大类意图集合中的意图进行排序,得到当前大类意图集合对应的意图推测模型,意图推测模型中。
示例性地,当前大类意图集合中的意图包括意图1、意图2、意图3、意图4、意图5、意图6和意图7,意图1、意图2和意图3之间具有关联关系,意图4、意图5、意图6和意图7之间具有关联关系,即认为意图1、意图2和意图3属于同一子类型的意图,意图4、意图5、意图6和意图7属于同一子类型的意图,上述意图按产生的时间顺序进行排序得到意图2、意图5、意图1、意图3、意图4、意图6和意图7,将同一子类型的意图1、意图2和意图3按产生的时间顺序进行排序得到意图2、意图1和意图3,将同一子类型的意图4、意图5、意图6和意图7按产生的时间顺序进行排序得到意图5、意图4、意图6和意图7,通过上述方法即可得到多个子类型的意图排序,多个子类型的意图排序即组成了当前大类意图集合对应的意图推测模型。
若同一子类型的意图排序在同一时间点产生多个意图,则根据意图在大量语料信息中出现的频率为同一时间点产生的多个意图赋予权重,例如,在意图4之后的时间点B同时产生了意图5、意图6和意图7,则统计意图5、意图6和意图7对应的语料信息在大量语料信息中出现的频率,然后根据频率为意图5、意图6和意图7赋予权重值。同一时间点可以为一小段时间,如可将在10s内产生的意图都视为是在同一时间点产生的意图。
本实施例中,根据意图出现的频率给同一时间点产生的多个意图赋予权重值,以实现根据大数据来推测用户下一步的意图,从而提高意图推测的准确率。
优选地,所述意图推测单元530包括:
目标意图查找子单元531,用于在所述目标大类意图集合中查找与所述当前意图相匹配的意图作为目标意图;
关联意图获取子单元532,用于根据所述目标大类意图集合对应的意图推测模型,得到与所述目标意图相关联的下一步意图;
意图推测子单元533,用于根据所述目标意图相关联的下一步意图推测用户下一步的意图。
具体地,根据当前意图对应的大类意图查找到目标大类意图集合后,在目标大类意图集合中查找与当前意图相匹配的意图,然后根据目标大类意图集合对应的意图推测模型,得到与该相匹配的意图相关联的下一步意图,最后根据目标意图相关联的下一步意图推测用户下一步的意图。
示例性地,若目标意图为意图4,在意图推测模型中意图4对应的子类型的意图排序为意图5、意图4、意图6和意图7,根据意图4即可推测用户下一步的意图为6。
当在意图推测模型中,意图4的下一时间点同时对应多个意图时,可根据对应的多个意图的权重值来推测用户的下一步意图,如选择权重值最高的意图作为用户下一步的意图。
优选地,所述意图识别模块400包括:
关键词提取单元410,用于对所述当前语料信息进行分词,提取出所述当前语料信息中的当前关键词;
意图识别单元420,用于根据预先建立的关键词的概率分布和所述当前关键词,识别所述当前语料信息对应的当前意图。
具体地,本实施例中,可先根据大数据建立关键词的概率分布,然后根据预先建立的关键词的概率分布和当前关键词,识别当前语料信息对应的当前意图。
在从当前语料信息中提取关键词时,先对当前语料信息进行分词标注,得到当前语料信息对应的分词后的词语以及每个词语的词性,然后根据每个词语的词性,从所有词语中提取出关键词,本实施例中,提取出的关键词为分词后得到的所有词语中的名词。
例如,语料信息1为“猴子吃香蕉”,则从语料信息1中提取出的关键词为“猴子”和“香蕉”;若语料信息2为“鲸鱼为什么会喷水”,则从语料信息2中提取出的关键词为“鲸鱼”;若语料信息3为“周杰伦的歌曲”,则从语料信息3中提取出的关键词为“周杰伦”和“歌曲”。
建立关键词的概率分布时,先收集大量的语料信息,形成语料库,然后对每条语料信息进行处理,提取每条语料信息中的关键词,即可得到大量的关键词,然后统计每个关键词出现的频率,根据每个关键词出现的频率对所有关键词进行排序,得到所有关键词的频率分布,即根据大数据分析,得到提取出的所有关键词的频率分布。
当获取到当前语料信息后,先提取出当前语料信息中的当前关键词,然后根据关键词的频率分布,在当前关键词中查找出目标当前关键词。
示例性地,例如大量语料信息包括语料1、语料2和语料3,从语料1中提取出的关键词为关键词1和关键词2;从语料2中提取出的关键词为关键词1和关键词3;从语料3中提取出的关键词为关键词1和关键词4;从语料4中提取出的关键词为关键词2和关键词4。
统计关键词1、关键词2、关键词3和关键词4在语料中出现的频率即为:关键词1出现的频率为3次,关键词2出现的频率为2次,关键词3出现的频率为1次,关键词4出现的频率为2次,根据关键词出现的频率对关键词进行排序即可得到关键词1、关键词2、关键词4、关键词3。
当从当前语料信息中提取出的当前关键词为关键词1和关键词2,根据关键词1和关键词2的概率分布,确定出的目标当前关键词为关键词1,根据关键词1即可确定当前语料信息对应的意图。
本实施例中,先根据大量的语料信息形成关键词的频率分布,然后从用户输入的当前语料信息中提取出当前关键词,最后根据预先形成的关键词的频率分布,从当前关键词中提取出目标当前关键词,即可得到当前语料信息最可能的意图,本发明根据大数据得到的关键词的频率分布来识别得到用户最可能的意图,以提高意图识别的准确率的概率,并可提高用户的使用体验。
当然,除了可使用本实施例的方法来识别当前语料信息对应的意图,还可以使用现有技术中的正则表达式等方法来识别当前语料信息对应的意图。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种意图推测方法,其特征在于,包括:
获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型;
获取当前用户输入的当前语料信息;
识别所述当前语料信息对应的当前意图;
根据所述当前意图及所述意图推测模型,推测用户下一步的意图。
2.根据权利要求1所述的一种意图推测方法,其特征在于,所述根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型具体包括:
根据意图类型对所述意图进行分类,得到多个大类意图集合;
根据每个大类意图集合中的意图之间的关联关系和每个大类意图集合中的意图对应的语料信息产生的时间,得到每个大类意图集合对应的意图推测模型;
所述根据所述当前意图及所述意图推测模型,推测用户下一步的意图具体包括:
根据所述当前意图确定所述当前意图对应的大类意图;
根据所述大类意图查找到对应的大类意图集合作为目标大类意图集合;
根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图。
3.根据权利要求2所述的一种意图推测方法,其特征在于,所述根据每个大类意图集合中的意图之间的关联关系和每个大类意图集合中的意图对应的语料信息产生的时间,得到每个大类意图集合对应的意图推测模型具体包括:
分析每个大类意图集合中的意图之间的关联关系;
根据每个大类意图集合中的意图对应的语料信息产生的时间,对每个大类意图集合中的意图进行排序,得到每个大类意图集合对应的意图推测模型。
4.根据权利要求3所述的一种意图推测方法,其特征在于,所述根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图具体包括:
在所述目标大类意图集合中查找与所述当前意图相匹配的意图作为目标意图;
根据所述目标大类意图集合对应的意图推测模型,得到与所述目标意图相关联的下一步意图;
根据所述目标意图相关联的下一步意图推测用户下一步的意图。
5.根据权利要求1-4任一项所述的一种意图推测方法,其特征在于,所述识别所述当前语料信息对应的当前意图具体包括:
对所述当前语料信息进行分词,提取出所述当前语料信息中的当前关键词;
根据预先建立的关键词的概率分布和所述当前关键词,识别所述当前语料信息对应的当前意图。
6.一种意图推测系统,其特征在于,包括:
语料获取模块,用于获取大量语料信息,并获取每条语料信息对应的意图和产生的时间;
意图推测模型生成模块,用于根据每条语料信息产生的时间和所述意图之间的关联关系,得到意图推测模型;
当前信息获取模块,用于获取当前用户输入的当前语料信息;
意图识别模块,用于识别所述当前语料信息对应的当前意图;
意图推测模块,用于根据所述当前意图及所述意图推测模型,推测用户下一步的意图。
7.根据权利要求6所述的一种意图推测系统,其特征在于,所述意图推测模型生成模块包括:
意图分类单元,用于根据意图类型对所述意图进行分类,得到多个大类意图集合;
意图推测模型生成单元,用于根据每个大类意图集合中的意图之间的关联关系和每个大类意图集合中的意图对应的语料信息产生的时间,得到每个大类意图集合对应的意图推测模型;
所述意图推测模块包括:
大类意图确定单元,用于根据所述当前意图确定所述当前意图对应的大类意图;
大类意图查找单元,用于根据所述大类意图查找到对应的大类意图集合作为目标大类意图集合;
意图推测单元,用于根据所述当前意图和所述目标大类意图集合对应的意图推测模型,推测用户下一步的意图。
8.根据权利要求7所述的一种意图推测系统,其特征在于,所述意图推测模型生成单元包括:
关联关系分析子单元,用于分析每个大类意图集合中的意图之间的关联关系;
意图排序子单元,用于根据每个大类意图集合中的意图对应的语料信息产生的时间,对每个大类意图集合中的意图进行排序,得到每个大类意图集合对应的意图推测模型。
9.根据权利要求8所述的一种意图推测系统,其特征在于,所述意图推测单元包括:
目标意图查找子单元,用于在所述目标大类意图集合中查找与所述当前意图相匹配的意图作为目标意图;
关联意图获取子单元,用于根据所述目标大类意图集合对应的意图推测模型,得到与所述目标意图相关联的下一步意图;
意图推测子单元,用于根据所述目标意图相关联的下一步意图推测用户下一步的意图。
10.根据权利要求6-9任一项所述的一种意图推测系统,其特征在于,所述意图识别模块包括:
关键词提取单元,用于对所述当前语料信息进行分词,提取出所述当前语料信息中的当前关键词;
意图识别单元,用于根据预先建立的关键词的概率分布和所述当前关键词,识别所述当前语料信息对应的当前意图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910046977.XA CN109783736B (zh) | 2019-01-18 | 2019-01-18 | 一种意图推测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910046977.XA CN109783736B (zh) | 2019-01-18 | 2019-01-18 | 一种意图推测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109783736A CN109783736A (zh) | 2019-05-21 |
CN109783736B true CN109783736B (zh) | 2022-03-08 |
Family
ID=66501605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910046977.XA Active CN109783736B (zh) | 2019-01-18 | 2019-01-18 | 一种意图推测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109783736B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021056467A1 (zh) * | 2019-09-27 | 2021-04-01 | 京东方科技集团股份有限公司 | 信息查询方法及显示装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102368256A (zh) * | 2010-09-30 | 2012-03-07 | 微软公司 | 基于用户意图提供建议 |
CN103544143A (zh) * | 2012-07-17 | 2014-01-29 | 三星电子株式会社 | 用于推荐文本的方法和设备 |
CN108446374A (zh) * | 2018-03-16 | 2018-08-24 | 北京三快在线科技有限公司 | 用户意图预测方法、装置、电子设备、存储介质 |
CN108804532A (zh) * | 2018-05-03 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 一种查询意图的挖掘和查询意图的识别方法、装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9767201B2 (en) * | 2011-12-06 | 2017-09-19 | Microsoft Technology Licensing, Llc | Modeling actions for entity-centric search |
-
2019
- 2019-01-18 CN CN201910046977.XA patent/CN109783736B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102368256A (zh) * | 2010-09-30 | 2012-03-07 | 微软公司 | 基于用户意图提供建议 |
CN103544143A (zh) * | 2012-07-17 | 2014-01-29 | 三星电子株式会社 | 用于推荐文本的方法和设备 |
CN108446374A (zh) * | 2018-03-16 | 2018-08-24 | 北京三快在线科技有限公司 | 用户意图预测方法、装置、电子设备、存储介质 |
CN108804532A (zh) * | 2018-05-03 | 2018-11-13 | 腾讯科技(深圳)有限公司 | 一种查询意图的挖掘和查询意图的识别方法、装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109783736A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009228B (zh) | 一种内容标签的设置方法、装置及存储介质 | |
CN107609101B (zh) | 智能交互方法、设备及存储介质 | |
CN107818781B (zh) | 智能交互方法、设备及存储介质 | |
US9785888B2 (en) | Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information | |
KR102288249B1 (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
CN110232149B (zh) | 一种热点事件检测方法和系统 | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
CN111444326B (zh) | 一种文本数据处理方法、装置、设备以及存储介质 | |
KR101983975B1 (ko) | 문장 분류에 기반하는 문서 자동분류 방법 및 그 장치 | |
CN112395506A (zh) | 一种资讯推荐方法、装置、电子设备和存储介质 | |
CN107797984A (zh) | 智能交互方法、设备及存储介质 | |
CN111428028A (zh) | 基于深度学习的信息分类方法及相关设备 | |
CN106126605B (zh) | 一种基于用户画像的短文本分类方法 | |
CN113254643B (zh) | 文本分类方法、装置、电子设备和 | |
CN110597987A (zh) | 一种搜索推荐方法及装置 | |
CN112035688B (zh) | 资源搜索方法及装置、搜索设备及存储介质 | |
CN113806588A (zh) | 搜索视频的方法和装置 | |
CN112380451A (zh) | 一种基于大数据的喜好内容推荐方法 | |
JP6042790B2 (ja) | トレンド分析装置、トレンド分析方法およびトレンド分析プログラム | |
CN109783736B (zh) | 一种意图推测方法及系统 | |
CN107092679B (zh) | 一种特征词向量获得方法、文本分类方法及装置 | |
Patil et al. | Automatic generation of emotions for social networking websites using text mining | |
CN112163415A (zh) | 针对反馈内容的用户意图识别方法、装置及电子设备 | |
CN115827990A (zh) | 搜索方法及装置 | |
CN112565903B (zh) | 视频推荐方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |