CN109002469B - 一种基于广义点集距离的信息个性化推荐及提示方法 - Google Patents

一种基于广义点集距离的信息个性化推荐及提示方法 Download PDF

Info

Publication number
CN109002469B
CN109002469B CN201810595845.8A CN201810595845A CN109002469B CN 109002469 B CN109002469 B CN 109002469B CN 201810595845 A CN201810595845 A CN 201810595845A CN 109002469 B CN109002469 B CN 109002469B
Authority
CN
China
Prior art keywords
distance
user
objects
prompt
numerical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810595845.8A
Other languages
English (en)
Other versions
CN109002469A (zh
Inventor
黄文俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oking Information Industry Co ltd
Original Assignee
Guangdong Oking Information Industry Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oking Information Industry Co ltd filed Critical Guangdong Oking Information Industry Co ltd
Priority to CN201810595845.8A priority Critical patent/CN109002469B/zh
Publication of CN109002469A publication Critical patent/CN109002469A/zh
Application granted granted Critical
Publication of CN109002469B publication Critical patent/CN109002469B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于广义点集距离的信息个性化推荐及提示方法,包括如下步骤;步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;步骤B,设置距离函数;步骤C,计算距离值d并推送相关信息;若距离值d=0,直接向其推送相关信息;若距离值d不为0,如果用户设定的是阈值提示法,则对距离值d小于阈值t的所有对象推送欠缺条件提示;如果用户设定的是数量提示法,则对距离值d最小的p个对象推送欠缺条件提示;如果用户同时设定两种提示法,则推送阈值提示法和数量提示法推送结果的合集。本发明兼容更多数据类型,提高推送的精准度和用户的区分度。

Description

一种基于广义点集距离的信息个性化推荐及提示方法
技术领域
本发明涉及个性化推荐系统技术领域,具体涉及一种基于广义点集距离的信息个性化推荐及提示方法。
背景技术
个性化推荐系统旨在依据一定的算法向用户提供个性化的信息服务和决策支持,目前广泛应用在新闻推荐、商务推荐、娱乐推荐、学习推荐、生活推荐、决策支持等多个领域。
得益于广泛的应用,个性化推荐已成为学术界与工业界的研究热点。已有的信息个性化推荐技术包括基于协同过滤的推荐系统、基于点集距离的推荐系统等,后者是最接近本发明的现有技术。
基于协同过滤的推荐系统利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,但对于新信息、新用户推荐效果较差,即存在“冷启动”问题。
基于点集距离的推荐系统,适合对具有标签的信息进行个性化推荐,即直接向符合该标签的用户推荐信息,本质就是当点集距离为0时,推荐该信息,这里的点就是用户属性,集就是符合拟推荐信息适用的用户属性集合(范围)。该方法仅用面向数值属性的普通点集距离,未包括其它距离方法,如海明距离等;并且该方法未对“差点就符合推荐要求”的用户进行推荐及提示其欠缺条件。
发明内容
本发明的目的在于针对现有技术中的不足之处,提供一种兼容更多数据类型,对接近个性化推荐要求的用户,给出其欠缺条件提示的基于广义点集距离的信息个性化推荐及提示方法。
为达此目的,本发明采用以下技术方案:
一种基于广义点集距离的信息个性化推荐及提示方法,包括如下步骤;
步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;
步骤B,设置距离函数;根据实际使用的点集距离设计相应的距离函数d(x,y);设推荐信息适用的用户属性集合(即广义点集距离的“集”)为x,某用户属性(即广义点集距离的“点”)为y,并令ximin表示数值属性范围xi的最小值,令ximax表示数值属性范围xi的最大值,令yi表示用户属性的第i个数值属性的值;所述用户属性包括m个数值属性(即0≤i≤m)和n个非数值属性(其中m≥0,n≥0,并且m+n≥1),广义点集的所述距离函数d(x,y)表示如下:
Figure BDA0001692151050000021
其中c(xi,yi)为用户对非数值属性自行定义的距离函数;
Figure BDA0001692151050000022
步骤C,计算距离值d并推送相关信息;若距离值d=0,则符合精准推荐条件,直接向其推送相关信息;若距离值d不为0,则不直接推送信息,根据用户设定的提示法作相应处理;如果用户设定的是阈值提示法,则对距离值d小于阈值t的所有对象推送欠缺条件提示;如果用户设定的是数量提示法,则对距离值d最小的p个对象推送欠缺条件提示;如果用户同时设定阈值提示法和数量提示法,则推送阈值提示法和数量提示法推送结果的合集。
更进一步的说明,对距离值d小于阈值t的所有对象推送欠缺条件提示信息时,使用逐个计算距离并推送或对所有对象计算距离之后,一次性对距离值d小于阈值t的所有对象批量推送的方法;对距离值d最小的p个对象推送欠缺条件提示信息时,逐个计算距离并保留距离值最小的p个对象,再一次性批量推送。
更进一步的说明,进行逐个计算距离并保留最小的p个对象这一操作时,根据距离值建立大根堆结构,维护最小的p个对象在所述大根堆上。
更进一步的说明,所述距离函数适用数值属性时还可以采用的包括欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数;假设数据x、y分别有N个数值属性,则欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数的计算方法分别如下:
欧氏距离:
Figure BDA0001692151050000031
曼哈顿距离:
Figure BDA0001692151050000032
标准化欧氏距离:
Figure BDA0001692151050000033
其中
Figure BDA0001692151050000034
是第i维度的方差。
更进一步的说明,所述距离函数适用非数值属性时,若用户属性为字符串的表现形式,则使用海明距离或编辑距离的计算方式,或用户自定义的计算方式;海明距离的计算公式为:
Figure BDA0001692151050000035
其中a、b为字符串;
编辑距离的计算公式为:
Figure BDA0001692151050000041
其中a、b为字符串。
更进一步的说明,步骤A中,若用户选择提示方法但没设置欠缺条件提示距离阈值t或欠缺条件提示数量p,则使用预设的缺省值。
更进一步的说明,步骤C中,推送的阈值提示法和数量提示法推送结果的合集为阈值提示法和数量提示法推送结果的并集,且对重复的单个推送对象不再重复推送。
更进一步的说明,进行逐个计算距离并保留最小的p个对象这一操作时,还可以使用插入排序,或者在所有对象计算完之后,使用快速排序或归并排序的方式。
更进一步的说明,用户可对所述距离函数d(x,y)进行修正改进,对数值属性和非数值属性设定权重加成;
权重加成的计算公式为:
Figure BDA0001692151050000042
其中w1、w2、w3分别为对象x、y的第1、2、3个属性的权重。
更进一步的说明,当用户属性为非数值属性时,若实际的用户属性在设定的用户属性集合中,则距离值为0;若实际的用户属性不在设定的用户属性集合中,则距离值由用户自定义的距离函数c(xi,yi)计算得出。
本发明的有益效果:
(1)将普通的点集距离发展为广义点集距离,以兼容更多数据类型。
(2)兼顾信息精准推荐与欠缺条件提示信息推送,对接近个性化推荐要求的用户进行排序,给出其欠缺条件提示,提高推送的精准度和用户的区分度。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的一个实施例的流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
如图1所示,一种基于广义点集距离的信息个性化推荐及提示方法,包括如下步骤;
步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;
步骤B,设置距离函数;根据实际使用的点集距离设计相应的距离函数d(x,y);设推荐信息适用的用户属性集合(即广义点集距离的“集”)为x,某用户属性(即广义点集距离的“点”)为y,并令ximin表示数值属性范围xi的最小值,令ximax表示数值属性范围xi的最大值,令yi表示用户属性的第i个数值属性的值;所述用户属性包括m个数值属性(即0≤i≤m)和n个非数值属性(其中m≥0,n≥0,并且m+n≥1),广义点集的所述距离函数d(x,y)表示如下:
Figure BDA0001692151050000061
其中c(xi,yi)为用户对非数值属性自行定义的距离函数;
Figure BDA0001692151050000062
步骤C,计算距离值d并推送相关信息;若距离值d=0,则符合精准推荐条件,直接向其推送相关信息;若距离值d不为0,则不直接推送信息,根据用户设定的提示法作相应处理;如果用户设定的是阈值提示法,则对距离值d小于阈值t的所有对象推送欠缺条件提示;如果用户设定的是数量提示法,则对距离值d最小的p个对象推送欠缺条件提示;如果用户同时设定阈值提示法和数量提示法,则推送阈值提示法和数量提示法推送结果的合集。
将用户属性分为数值类和非数值类两大类,从而将普通的点集距离发展为广义点集距离,可以兼容更多数据类型。对于数值属性的用户属性进行系统预设距离函数的计算或通过用户自行设定的距离函数进行运算,对于非数值属性的用户属性进行自行设定的距离函数的运算。通过对运算结果的分析,用户从阈值提示法和数量提示法至少选择一个方式对完全符合以及接近个性化推荐要求的用户给出其欠缺条件提示。例如信息推荐的要求是年龄30-50岁(这是一个集合,包括30、31、32……50一共21个整数),而拟推荐对象的年龄是28岁,那么可以使用28与30的差的绝对值与信息推荐要求年龄跨度的商为距离函数,这个距离的值d为0.1(即|28-30|/(50-30)=0.1)。而如果拟推荐对象的年龄是32,由于32包含在集合30-50岁中,因此它们的距离值d是0。从而可以将完全符合推荐要求的用户和接近推荐要求的用户进行区分,并分别进行推送,使用户推送的区分度和精准度更高。
更进一步的说明,对距离值d小于阈值t的所有对象推送欠缺条件提示信息时,使用逐个计算距离并推送或对所有对象计算距离之后,一次性对距离值d小于阈值t的所有对象批量推送的方法;对距离值d最小的p个对象推送欠缺条件提示信息时,逐个计算距离并保留距离值最小的p个对象,再一次性批量推送。
由于阈值提示法需要分别计算每一个对象的距离值,然后逐个进行比对判断,因此逐个发送或批量发送不会影响程序的运行。而数量提示法必须从所有对象中挑选处距离值最小的p个对象,因此必须将全部对象的距离值计算出来后进行排序然后再批量发送才能保证程序的正常运行。
更进一步的说明,进行逐个计算距离并保留最小的p个对象这一操作时,根据距离值建立大根堆结构,维护最小的p个对象在所述大根堆上。
堆排序是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。可以利用数组的特点快速定位指定索引的元素。堆分为大根堆和小根堆,是完全二叉树。而大根堆的要求是每个节点的值都不大于其父节点的值。在数组的非降序排序中,需要使用的就是大根堆,因为根据大根堆的要求可知,最大的值一定在堆顶。因此可以满足距离计算的需求。
更进一步的说明,所述距离函数适用数值属性时还可以采用的包括欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数;
假设数据x、y分别有N个数值属性,则欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数的计算方法分别如下:
欧氏距离:
Figure BDA0001692151050000081
曼哈顿距离:
Figure BDA0001692151050000082
标准化欧氏距离:
Figure BDA0001692151050000083
其中
Figure BDA0001692151050000084
是第i维度的方差。
用户可以根据数值的类型选取最合适的距离函数来达到最佳的运算结果。
更进一步的说明,所述距离函数适用非数值属性时,若用户属性为字符串的表现形式,则使用海明距离或编辑距离的计算方式,或用户自定义的计算方式;
海明距离:在信息论中,两个等长字符串之间的海明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。例如:10101和00110从第一位开始依次有第一位、第四、第五位不同,即总共有3位不同,则海明距离为3。字符串a、b的海明距离为它们异或之后“1”的数量,即:
Figure BDA0001692151050000085
编辑距离:编辑距离又称为Levenshtein距离,指的是由一个字符串转成另一个字符串所需的最少编辑操作次数。允许的编辑操作有三种:把一个字符替换成另一个字符,插入一个字符,删除一个字符。设字符串a、b的长度分别为i、j,则它们的编辑leva,b(i,j)为:
Figure BDA0001692151050000086
更进一步的说明,步骤A中,若用户选择提示方法但没设置欠缺条件提示距离阈值t或欠缺条件提示数量p,则使用预设的缺省值。
如果用户忘记设置对应的参数值时,预设的缺省值可以保证程序仍可以继续运行。提供了程序正常运行的保证,也便利了用户的操作。
更进一步的说明,步骤C中,推送的阈值提示法和数量提示法推送结果的合集为阈值提示法和数量提示法推送结果的并集,且对重复的单个推送对象不再重复推送。
若阈值提示法的推送对象为甲、乙、丙,而数量提示法的推送对象为丙、丁,那么总的推送对象就是甲、乙、丙、丁,并且每个对象各仅推送一次欠缺条件提示信息,对丙也只推送一次。这样的方式可以避免推送对象接收到重复的推送。
更进一步的说明,进行逐个计算距离并保留最小的p个对象这一操作时,还可以使用插入排序,或者在所有对象计算完之后,使用快速排序或归并排序的方式。
堆排序和插入排序的好处在于,可以一个一个插进这个含有p个对象的队列来排序,并且一直只保留到目前为止最小的p个,其它的则舍弃。而快速排序和归并排序,必须把所有对象都拿来一起排序,时间开销较大(因为它把所有对象都排了,而堆排序和插入排序只排了最小的p个)。
更进一步的说明,用户可对所述距离函数d(x,y)进行修正改进,对数值属性和非数值属性设定权重加成。
例如,假设对象x、y各由3个属性(可以是数值属性或者非数值属性)构成,计算距离时各个属性的权重分别是w1、w2、w3,则它们的加权距离为:
Figure BDA0001692151050000091
更进一步的说明,当用户属性为非数值属性时,若实际的用户属性在设定的用户属性集合中,则距离值为0;若实际的用户属性不在设定的用户属性集合中,则距离值由用户自定义的距离函数c(xi,yi)计算得出。
例如集合S={本科生,硕士生,博士生},点p=本科生,那么S与p的距离为0;另外,如果集合S={本科生,硕士生,博士生},点p=中学生,那么S与p的距离将不为0,该距离值由用户自行定义。增加了对非数值属性的用户属性的适应度,可以兼容更多数据类型。
以上内容仅为本发明的较佳实施例,对于本领域的普通技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:包括如下步骤;
步骤A,设置参数;用户从阈值提示法和数量提示法中至少选择一项作为提示方法,并设置对应的欠缺条件提示距离阈值t或欠缺条件提示数量p;
步骤B,设置距离函数;根据实际使用的点集距离设计相应的距离函数d(x,y);设推荐信息适用的用户属性集合为x,某用户属性为y,并令ximin表示数值属性范围xi的最小值,令ximax表示数值属性范围xi的最大值,令yi表示用户属性的第i个数值属性的值;所述用户属性包括m个数值属性和n个非数值属性,其中0≤i≤m,m≥0,n≥0,并且m+n≥1,广义点集的所述距离函数d(x,y)表示如下:
Figure FDA0003164660780000011
其中c(xi,yi)为用户对非数值属性自行定义的距离函数;
Figure FDA0003164660780000012
步骤C,计算距离值d并推送相关信息;若距离值d=0,则符合精准推荐条件,直接向其推送相关信息;若距离值d不为0,则不直接推送信息,根据用户设定的提示法作相应处理;如果用户设定的是阈值提示法,则对距离值d小于阈值t的所有对象推送欠缺条件提示;如果用户设定的是数量提示法,则对距离值d最小的p个对象推送欠缺条件提示;如果用户同时设定阈值提示法和数量提示法,则推送阈值提示法和数量提示法推送结果的合集。
2.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:对距离值d小于阈值t的所有对象推送欠缺条件提示信息时,使用逐个计算距离并推送或对所有对象计算距离之后,一次性对距离值d小于阈值t的所有对象批量推送的方法;对距离值d最小的p个对象推送欠缺条件提示信息时,逐个计算距离并保留距离值最小的p个对象,再一次性批量推送。
3.根据权利要求2所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:进行逐个计算距离并保留最小的p个对象这一操作时,根据距离值建立大根堆结构,维护最小的p个对象在所述大根堆上。
4.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:所述距离函数适用数值属性时还可以采用包括欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数;
假设数据x、y分别有N个数值属性,则欧氏距离、曼哈顿距离或标准化欧氏距离表示的距离函数的计算方法分别如下:
欧氏距离:
Figure FDA0003164660780000021
曼哈顿距离:
Figure FDA0003164660780000022
标准化欧氏距离:
Figure FDA0003164660780000031
其中
Figure FDA0003164660780000032
是第i维度的方差。
5.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:所述距离函数适用非数值属性时,若用户属性为字符串的表现形式,则使用海明距离或编辑距离的计算方式,或用户自定义的计算方式;
海明距离的计算公式为:
Figure FDA0003164660780000033
其中a、b为字符串;
编辑距离的计算公式为:
Figure FDA0003164660780000034
其中a、b为字符串。
6.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:步骤A中,若用户选择提示方法但没设置欠缺条件提示距离阈值t或欠缺条件提示数量p,则使用预设的缺省值。
7.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:步骤C中,推送的阈值提示法和数量提示法推送结果的合集为阈值提示法和数量提示法推送结果的并集,且对重复的单个推送对象不再重复推送。
8.根据权利要求2所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:进行逐个计算距离并保留最小的p个对象这一操作时,还可以使用插入排序,或者在所有对象计算完之后,使用快速排序或归并排序的方式。
9.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:用户可对所述距离函数d(x,y)进行修正改进,对数值属性和非数值属性设定权重加成;
权重加成的计算公式为:
Figure FDA0003164660780000041
其中w1、w2、w3分别为对象x、y的第1、2、3个属性的权重。
10.根据权利要求1所述的一种基于广义点集距离的信息个性化推荐及提示方法,其特征在于:当用户属性为非数值属性时,若实际的用户属性在设定的用户属性集合中,则距离值为0;若实际的用户属性不在设定的用户属性集合中,则距离值由用户自定义的距离函数c(xi,yi)计算得出。
CN201810595845.8A 2018-06-11 2018-06-11 一种基于广义点集距离的信息个性化推荐及提示方法 Active CN109002469B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810595845.8A CN109002469B (zh) 2018-06-11 2018-06-11 一种基于广义点集距离的信息个性化推荐及提示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810595845.8A CN109002469B (zh) 2018-06-11 2018-06-11 一种基于广义点集距离的信息个性化推荐及提示方法

Publications (2)

Publication Number Publication Date
CN109002469A CN109002469A (zh) 2018-12-14
CN109002469B true CN109002469B (zh) 2021-08-31

Family

ID=64601238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810595845.8A Active CN109002469B (zh) 2018-06-11 2018-06-11 一种基于广义点集距离的信息个性化推荐及提示方法

Country Status (1)

Country Link
CN (1) CN109002469B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012226704A (ja) * 2011-04-22 2012-11-15 Xing Inc 歌唱情報処理装置及び歌唱情報処理プログラム
CN103761237A (zh) * 2013-12-04 2014-04-30 南京邮电大学 一种基于用户特征及其信任度的协同过滤推荐方法
CN104111946A (zh) * 2013-04-19 2014-10-22 腾讯科技(深圳)有限公司 基于用户兴趣的聚类方法和装置
CN104424187A (zh) * 2013-08-19 2015-03-18 腾讯科技(深圳)有限公司 一种向客户端用户推荐好友的方法及装置
CN104731887A (zh) * 2015-03-13 2015-06-24 东南大学 一种协同过滤中的用户相似度度量方法
CN105095476A (zh) * 2015-08-12 2015-11-25 西安电子科技大学 基于Jaccard均衡距离的协同过滤推荐方法
CN105678590A (zh) * 2016-02-07 2016-06-15 重庆邮电大学 一种面向社交网络基于云模型的topN推荐方法
CN106484876A (zh) * 2016-10-13 2017-03-08 中山大学 一种基于典型度和信任网络的协同过滤推荐方法
CN106777200A (zh) * 2016-12-23 2017-05-31 Tcl集团股份有限公司 项目推荐的方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012226704A (ja) * 2011-04-22 2012-11-15 Xing Inc 歌唱情報処理装置及び歌唱情報処理プログラム
CN104111946A (zh) * 2013-04-19 2014-10-22 腾讯科技(深圳)有限公司 基于用户兴趣的聚类方法和装置
CN104424187A (zh) * 2013-08-19 2015-03-18 腾讯科技(深圳)有限公司 一种向客户端用户推荐好友的方法及装置
CN103761237A (zh) * 2013-12-04 2014-04-30 南京邮电大学 一种基于用户特征及其信任度的协同过滤推荐方法
CN104731887A (zh) * 2015-03-13 2015-06-24 东南大学 一种协同过滤中的用户相似度度量方法
CN105095476A (zh) * 2015-08-12 2015-11-25 西安电子科技大学 基于Jaccard均衡距离的协同过滤推荐方法
CN105678590A (zh) * 2016-02-07 2016-06-15 重庆邮电大学 一种面向社交网络基于云模型的topN推荐方法
CN106484876A (zh) * 2016-10-13 2017-03-08 中山大学 一种基于典型度和信任网络的协同过滤推荐方法
CN106777200A (zh) * 2016-12-23 2017-05-31 Tcl集团股份有限公司 项目推荐的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《数据挖掘技术在个性化web中的应用研究》;陈雪刚;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20130715(第7期);第I138-776页 *

Also Published As

Publication number Publication date
CN109002469A (zh) 2018-12-14

Similar Documents

Publication Publication Date Title
CN110162593B (zh) 一种搜索结果处理、相似度模型训练方法及装置
CN108509425A (zh) 一种基于新颖度的中文新词发现方法
CN106649783B (zh) 一种同义词挖掘方法和装置
CN109446885B (zh) 一种基于文本的元器件识别方法、系统、装置和存储介质
WO2003012685A2 (en) A data quality system
CN109829478B (zh) 一种基于变分自编码器的问题分类方法和装置
US20150199567A1 (en) Document classification assisting apparatus, method and program
CN111460102B (zh) 一种基于自然语言处理的图表推荐系统及方法
CN104951435A (zh) 聊天过程中智能显示关键词的方法及装置
CN110941720A (zh) 一种基于知识库的特定人员信息纠错方法
CN110765266B (zh) 一种裁判文书相似争议焦点合并方法及系统
CN114328939B (zh) 基于大数据的自然语言处理模型构建方法
CN115600605A (zh) 一种中文实体关系联合抽取方法、系统、设备及存储介质
CN114547232A (zh) 一种低标注成本的嵌套实体识别方法及系统
CN109002469B (zh) 一种基于广义点集距离的信息个性化推荐及提示方法
CN108427769B (zh) 一种基于社交网络的人物兴趣标签提取方法
CN110874408A (zh) 模型训练方法、文本识别方法、装置及计算设备
CN111310066B (zh) 一种基于主题模型和关联规则算法的好友推荐方法及系统
CN113420219A (zh) 用于查询信息纠错的方法、装置、电子设备及可读存储介质
CN109726286B (zh) 一种基于lda主题模型的图书自动分类方法
CN110765108A (zh) 一种基于群智数据融合的假消息早期检测方法
CN113672804A (zh) 推荐信息生成方法、系统、计算机设备及存储介质
CN112784040A (zh) 基于语料库的垂直行业文本分类方法
US7577649B2 (en) Engine for validating proposed changes to an electronic entity
CN111274379B (zh) 一种spo的选择方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant