具体实施方式
为使本发明实施例的目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参见图1,本发明实施例提供了一种兴趣点关联标记的方法,包括如下步骤:
S101:根据关联标记规则搭建神经网络。
神经网络(NNs)或称作连接模型(Connectionist Model),是模拟人脑神经元工作原理而实现的计算机机器学习模型,神经网络以对大脑的生理研究成果为基础的,其目的在于模拟大脑的某些机理与机制,实现某个方面的功能。
神经网络是由大量的简单基本元件--神经元节点相互连接而成的自适应非线性动态系统。每个神经元节点的结构和功能相对比较简单,但大量神经元组合产生的神经网络行为却可以非常复杂。
本步骤中,根据关联标记规则搭建神经网络的方法可以包括:
首先,根据关联标记规则选取兴趣点关联标记所需的兴趣点属性。
然后,根据所述兴趣点关联标记所需的兴趣点属性创建神经元节点及各神经元节点间连接关系。
关联标记规则可以根据兴趣点关联标记的应用场景进行设置,假设某应用场景可以是按各个城市对各连锁店分店兴趣点进行关联标记,比如,将北京的各真维斯服装连锁店的各分店兴趣点进行关联标记,则,关联标记规则便可以设置为按城市标记连锁店分店兴趣点。相应的,此时根据关联标记规则选取兴趣点关联标记所需的兴趣点属性便可以是兴趣点的名称、类型和城市。
根据兴趣点属性创建神经元节点,并建立各神经元节点间连接关系,具体为,以能够实现按关联标记规则对兴趣点进行关联标记处理为原则,结合兴趣点关联标记所需的兴趣点属性,确定所需的神经元节点,以及神经元节点内部逻辑和各神经元节点之间的连接关系,完成对神经网络的搭建。
本发明实施例可以根据关联标记规则的不同搭建不同的神经网络,使得能够非常灵活的应用于各种不同的兴趣点关联标记场景中,也就是说,对于不同的兴趣点关联标记应用场景,可以很方便的根据不同的关联标记规则搭建神经网络,并利用兴趣点样本数据对其进行训练以便对待处理兴趣点进行处理,自动实现对其进行关联标记,应用非常灵活。
S102:利用兴趣点样本数据对所述神经网络进行训练。
实际应用中,该步骤可以具体包括:
依次将各兴趣点样本数据的属性信息传入所述神经网络,分别与预置的关联词表中的属性信息进行匹配,得到所述神经网络的计算结果,根据各计算结果调整神经网络中神经元节点的内部参数和各神经元节点之间的连接权值。
需要说明的是,在搭建神经网络时,选取的兴趣点关联标记所需的兴趣点属性,与后续步骤中在判断待处理兴趣点是否需要进行关联标记时输入神经网络的输入参数,优选的在内容上是一致的。在实际应用中,对神经网络进行训练的样本数据的输入参数可以包括兴趣点属性等多种信息,这里优选的,选用兴趣点样本数据的属性信息对神经网络进行训练。
其中,神经元节点的内部参数是用于表示各神经元节点的内部逻辑的参数,连接权值是用于表示各神经元节点之间的连接强弱的参数。
对神经网络的训练目的是调整神经元节点的内部参数和各神经元节点之间的连接权值,以使神经网络对任何的输入都能得到期望的输出。比如,训练的方式可以是,样本数据输入后,分别与预置的关联词表中的信息进行匹配,得到所述神经网络的计算结果,经神经网络计算后输出的结果若正确,则将各神经元节点的内部参数和连接权值上调一些,若输出结果错误,则将各神经元节点的内部参数和连接权值下调一些,这样,通过多个样本数据的处理结果对神经网络中神经元节点的内部参数和各神经元节点之间的连接权值进行调整后,神经网络处理的正确率将大大提高。这说明该神经网络对兴趣点样本数据的学习训练已经获得成功,已将对兴趣点属性的处理关系分布记忆在各神经元节点的内部参数和连接权值上。当神经网络再次接收到包括待处理兴趣点的兴趣点属性时,便能够作出迅速、准确的判断和识别。一般说来,神经网络中所含的神经元个数越多,则它能记忆、识别的信息也就越多。
通常,在对兴趣点关联标记方法中预先根据关联标记规则搭建好神经网络并对其进行训练,这样,在实际应用中,便可以对各待处理兴趣点进行处理,判断是否需要进行关联标记,而无需每次执行对待处理兴趣点处理时都再次搭建神经网络和对其进行训练的操作。
另外,需要说明的是,根据关联标记规则的变化,步骤S101和步骤S102可以调整和扩展神经网络,通过重新训练实现对新的关联标记规则的适应和扩展,以便在新的应用场景中实现对待处理兴趣点进行关联标记处理,使得本发明实施例具备较高的灵活性、适应性和扩展性。
S103:接收包括待处理兴趣点信息的输入参数。
其中,输入参数可以包括兴趣点属性等参数信息。
S104:经训练的所述神经网络对所述输入参数进行处理,判断所述待处理的兴趣点是否需要进行关联标记。
本步骤中,经训练的所述神经网络对所述输入参数进行处理,判断所述待处理的兴趣点是否需要进行关联标记可以包括:
所述输入参数按照所述神经网络中各神经元节点的内部参数和各神经元节点之间的连接权值输入相应神经元节点,所述神经元节点判断所述输入参数与预置的关联词表中的信息是否匹配,是则确定所述待处理的兴趣点需要进行关联标记,否则确定所述待处理的兴趣点不需要进行关联标记。
S105:步骤S104中的判断结果为是,则对所述待处理的兴趣点进行标记。
实际应用中,对兴趣点的标记方法可以有多种,比如对于相关联的兴趣点均采用标记相同的标识,比如,对于北京市内的各真维斯服装分店均标记为相同的标识,对于北京市内的各东来顺火锅分店均标记为另一种相同的标识,这样,可以基于这种关联标识实现很多其他的功能,比如,用户在查询某连锁店的分店兴趣点时,可以将标记有相同标识的其它分店信息进行一并展示,以进一步提高用户体验;或者在对电子地图的数据处理过程中,当某连锁店的某些信息发生变化时,可以利用这种关联关系对标记有相同标识的各分店兴趣点的某些信息一并更新,等等。
可见,本发明实施例中,采用神经网络,通过对其进行训练,能够模拟人的思维对包括待处理兴趣点信息的输入参数进行处理,实现对其的关联标记,从而可以通过计算机自动实现对兴趣点的关联标记问题,在处理速度上有巨大提高,使得关联标记效率大大提高;另外,本发明实施例可以根据关联标记规则的不同搭建不同的神经网络,使得能够非常灵活的应用于各种不同的兴趣点关联标记场景中,也就是说,对于不同的兴趣点关联标记应用场景,可以很方便的根据不同的关联标记规则搭建神经网络,并利用兴趣点样本数据对其进行训练以便对待处理兴趣点进行处理,自动实现对其进行关联标记,同理,本发明实施例也可以根据关联标记规则的变化,调整和扩展神经网络,通过重新训练实现对新的关联标记规则的适应和扩展,因此具有较高的适应性和高的扩展性。
为进一步说明本发明实施例提供的兴趣点关联标记方法,参见图2,提供一个具体实例,即连锁店分店兴趣点关联标记的方法,包括如下步骤:
S201:根据关联标记规则搭建神经网络。
具体应用中,假设关联标记规则具体为按城市标记连锁店分店兴趣点,则所述根据关联标记规则搭建神经网络包括:
根据所述关联标记规则,选取连锁店分店兴趣点关联标记所需的兴趣点属性包括名称、类型和城市;
根据所述兴趣点属性创建名称相似判断神经元、类型相似判断神经元、城市相似判断神经元、以及连锁店分店关联判断神经元;并建立上述各神经元之间的连接关系:所述名称相似判断神经元分别与类型相似判断神经元和城市相似判断神经元相连,所述类型相似判断神经元和城市相似判断神经元分别与所述连锁店分店关联判断神经元相连。
参见图3,本实例中,神经网络具体为三阶神经网络模型,包括输入层、中间层和输出层。其中输入层用于输入兴趣点的名称、类型和城市参数。中间层包括:名称相似判断神经元、类型相似判断神经元和城市相似判断神经元三个神经元节点。输出层包括连锁店分店关联判断神经元。三阶神经网络模型中,各层次之间以及各神经元之间的连接关系请参见图3。
S202:利用历史连锁店分店兴趣点关联数据样本对所述神经网络进行训练。
具体的,依次将各兴趣点样本数据的名称、类型和城市信息作为兴趣点属性传入上述神经网络,分别与预置的关联词表中的信息进行匹配,得到各样本的计算结果,根据各计算结果调整神经网络中神经元节点的内部参数和各神经元节点之间的连接权值。
通常,在对连锁店分店兴趣点关联标记方法中,预先根据关联标记规则搭建好神经网络并对其进行训练,这样,在实际应用中,便可以对各待处理兴趣点进行处理,判断是否需要进行关联标记,而无需每次执行对待处理兴趣点处理时都再次搭建神经网络和对其进行训练的操作。
S203:接收包括待处理兴趣点信息的输入参数。
其中,输入参数可以包括兴趣点属性等参数信息。
S204:经训练的所述神经网络对所述输入参数进行处理,判断所述待处理兴趣点是否为连锁店分店兴趣点。
参见图4,步骤S204具体可以包括如下子步骤:
S401:当名称相似判断神经元接收到包括待处理兴趣点名称、类型和城市信息的输入参数时,比对待处理兴趣点名称和预置的关联词表中记录的名称信息;若比对结果为不相似,则执行步骤S405;若所述比对结果为相似,则执行步骤S402。
S402:类型相似判断神经元比对待处理兴趣点类型和关联词表中记录的类型信息,城市相似判断神经元比对待处理兴趣点城市和关联词表中记录的城市信息;
S403:连锁店分店关联判断神经元判断类型相似判断神经元和城市相似判断神经元的比对结果,若比对结果均为相似,则执行步骤S404,否则执行步骤S405。
S404:确定所述待处理的兴趣点是连锁店分店兴趣点,结束。
S405:确定所述待处理的兴趣点不是连锁店分店兴趣点,结束。
关联词表包括名称信息、连锁店类型以及连锁店所在城市等信息。其中,关联词表中记录的名称信息包括连锁店官方名称、连锁店别名、连锁店名称缩写以及连锁店歧义名。具体的:
连锁店官方名称:指连锁店的全名,优选的是官方中文全名,也可以是多个全称的集合。
连锁店别名:如常用的英文名等,可以有多个。
连锁店名称缩写:可以有多个。
连锁店歧义名:不是该连锁店,但是名称与该连锁店有包含关系的兴趣点名,需要进行排除,可以有多个。如“心如家常菜”就是“如家”的歧义名。
连锁店类型:比如品牌服装、火锅等。
连锁店所在城市:比如北京、上海等。
为了后文描述方便,设:
连锁店官方名称记为:cn;
连锁店别名记为:ca,当有多个别名ca1、ca2...,统一记为向量CA;
连锁店名称缩写记为:cb,当有多个缩写cb1、cb2...,统一记为向量CB;
连锁店歧义名记为:cd,当有多个歧义名cd1、cd2...,统一记为向量CD;
连锁店类型记为:type;
连锁店所在城市记为:city。
则,连锁店关联词表可记为:
{
cn1:{
ca:CA1,
cb:CB1,
cd:CD1,
type:t1,
city:c1
},
cn2:{
ca:CA2,
cb:CB2,
cd:CD2,
type:t2,
city:c2
},
}
进一步的,所述比对所述待处理兴趣点名称和预置的关联词表中记录的名称信息包括:
从待处理兴趣点的名称中提取名称主干;
将所述名称主干与关联词表中的连锁店官方名称、连锁店别名、连锁店名称缩写进行匹配;
若所述主干名称与其均不匹配,则确认比对结果不相似;
若所述名称主干与其中之一匹配,则将所述名称主干与连锁店歧义名进行匹配,若匹配,则确认比对结果不相似,否则确认比对结果相似。
参见图5,比对所述待处理兴趣点名称和预置的关联词表中记录的名称信息的一种具体实现方式可以包括如下子步骤:
S501:根据待处理兴趣点名称中的特殊符号提取名称主干。
S502:比对所述名称主干是否与关联词表中的连锁店官方名称匹配,是则执行步骤S505;否则执行步骤S503。
S503:比对所述名称主干是否与关联词表中的连锁店别名匹配,是则执行步骤S505;否则执行步骤S504。
S504:比对所述名称主干是否与关联词表中的连锁店名称缩写匹配,是则执行步骤S505;否则执行步骤S507。
S505:比对所述名称主干是否与关联词表中的连锁店歧义名匹配,是则执行步骤S507;否则执行步骤S506。
S506:确认比对结果为相似,结束。
S507:确认比对结果为不相似,结束。
其中,根据待处理兴趣点名称中的特殊符号提取名称主干可以是:如果兴趣点名称是“肯德基(苏州街店)”、“肯德基苏州街店”、“肯德基[苏州街店]”等格式时,根据其中的特殊符号“()”“_”“[]”等提取出名称主干“肯德基”,如果是“肯德基苏州街店”,因为不包含特殊符号,则提取后的结果还是“肯德基苏州街店”,直接提交到后续处理模块。
通过名称相似判断神经元匹配处理后,如果匹配成功,即某兴趣点的名称满足目标连锁店名称的要求,则将成功信息传递到类型相似判断神经元和城市相似判断神经元。其中成功的信号包括:匹配上的连锁店官方名称cn,对应的类型t,城市c。否则,返回Null,结束。
由于现实生活中兴趣点的数量巨大,兴趣点的类型都是人工后期标记上去的,因此,某连锁店分店兴趣点的类型有可能出现前后标记不一样的情况,比如,关联词表中,“东来顺火锅”的类型可能被标记为火锅,而待处理兴趣点“东来顺火锅_苏州街店”的类型可能被标记为中餐,待处理兴趣点“东来顺火锅_望京店”的类型可能被标记为家常菜,等等。为了减小这种人为失误对自动关联的影响,本发明实施例中采用一种基于类型层级结构的类型相似度修正算法,具体的,可以包括:
首先,根据所述待处理兴趣点类型与所述关联词表中记录的类型之间的步长计算类型相似度。
然后,判断所述类型相似度是否满足预设范围,是则确定比对结果为相似,否则确定比对结果为不相似。
参见图6,示出一种兴趣点类型的层级结构,假设待处理兴趣点类型t1被标记为C1,关联词表中记录的类型t2为D1,则参见图7,图6所示层级结构中t1到t2的步长L为4,根据步长4计算类型相似度,当类型相似度满足预设范围,则确定比对结果为相似,否则为不相似。
利用步长计算类型相似度的方法有很多,实际应用中,本领域技术人员可以根据不同的应用需求,采用不同的算法实现根据步长计算相似度,本发明实施例对此并不限制。本发明实施例中利用如下公式计算:
根据上述公式,t1和t2之间的类型相似度为0.2。
基于图6所示层级结构,可以根据经验设置类型相似度的预设范围大于等于0.3,故t2和t1之间的类型相似度不满足预设范围,确定比对结果为不相似。
本发明实施例中,城市相似判断神经元比对所述待处理兴趣点城市和所述关联词表中记录的城市信息具体可以是,直接采用字符串匹配的方式进行比对。
连锁店分店关联判断神经元将类型相似判断神经元和城市相似判断神经元的比对结果,做二进制逻辑与运算,当且仅当返回的信息都是“1”的时候,连锁店分店关联判断神经元返回成功信息,表示输入的兴趣点是连锁店,且成功信息包括其关联的连锁店cn在对应的连锁店关联词典中的所有数据,如ca,cd,type等。否则返回Null,表示输入的兴趣点不是某连锁店分店。
S205:若步骤S204的判断结果为是,则对所述待处理兴趣点进行连锁店分店兴趣点关联标记。
实际应用中,对兴趣点的标记方法可以有多种,比如对于相关联的兴趣点均采用标记相同的标识,比如,对于北京市内的各真维斯服装分店均标记为相同的标识,对于北京市内的各东来顺火锅分店均标记为另一种相同的标识,这样,可以基于这种关联标识实现很多其他的功能,比如,用户在查询某连锁店的分店兴趣点时,可以将标记有相同标识的其它分店信息进行一并展示,以进一步提高用户体验;或者在对电子地图的数据处理过程中,当某连锁店的某些信息发生变化时,可以利用这种关联关系对标记有相同标识的各分店兴趣点的某些信息一并更新,等等。
可见,本发明实施例中,采用神经网络,通过对其进行训练,能够模拟人的思维判断待处理兴趣点与某连锁店的关联关系,可以通过计算机自动实现对兴趣点的关联标记,在处理速度上有巨大提高,使得关联标记效率大大提高;另外,本发明实施例中,通过匹配连锁店关联词表来进行名称相似判断,由于可以根据实际情况的变化对连锁店关联词表进行更新,使得名称相似判断也能够根据实际情况的变化更加准确;基于类型层级结构的类型相似度修正方法,使得类型相似判断结果更加准确。
需要说明的是,本实例中,仅给出了可以根据按城市标记连锁店分店兴趣点关联标记规则搭建神经网络,通过利用历史数据对其进行训练后,便可以应用于按城市标记连锁店分店兴趣点关联标记的场景中了。实际应用中,可以根据关联标记规则的不同搭建不同的神经网络,比如关联标记规则是对连锁店分店兴趣点进行关联标记(不需要区分城市),则此时搭建的神经网络可以由名称相似判断神经元、类型相似判断神经元和连锁店分店关联判断神经元组成即可,按照兴趣点样本数据对该神经网络训练后,便可以直接应用于对连锁店分店兴趣点关联标记的场景中了。可见,本发明实施例能够非常灵活的应用于各种不同的兴趣点关联标记场景中,对于不同的兴趣点关联标记应用场景,可以很方便的根据不同的关联标记规则搭建神经网络,并利用兴趣点样本数据对其进行训练以便对待处理兴趣点进行处理,自动实现对其进行关联标记,同理,本发明实施例也可以根据关联标记规则的变化,调整和扩展神经网络,通过重新训练实现对新的关联标记规则的适应和扩展,因此具有较高的适应性和高的扩展性。
举例说明,设有类型层级结构如图8所示,连锁店分店兴趣点关联词典如下:
{
″真维斯服装″:
{
ca:[″jeanswest″],
cb:[″真维斯″],
cd:[],
type:[″品牌服装″],
city:″北京市″
},
″如家快捷酒店″:
{
ca:[],
cb:[″如家″,″如家酒店″],
cd:[″心如家常菜″],
type:[″经济型连锁酒店″],
city:″北京市″
},
″东来顺火锅″:
{
ca:[],
cb:[″东来顺″,″东来顺饭庄″],
cd:[″京东来顺饭庄″],
type:[″火锅″],
city:″北京市″
}
}
待处理的兴趣点输入参数如表1:
表1
ID |
名称 |
类型 |
城市 |
1 |
jeanswest |
品牌服装 |
北京市 |
2 |
心如家常菜 |
家常菜 |
北京市 |
3 |
东来顺 |
火锅 |
北京市 |
4 |
如家酒店 |
经济型连锁店 |
北京市 |
对于兴趣点1,处理过程参见图9所示,最终的判断结果为兴趣点1是“真维斯”连锁店分店,需要对其进行连锁店分店兴趣点关联标记。
对于兴趣点2做同样处理,因为“心如家常菜”和如家快捷酒店的缩写“如家”匹配,但是同时和歧义名“心如家常菜”匹配,所以名称相似判断返回Null,最终结果是兴趣点2不是连锁店分店,无需对其进行连锁店分店兴趣点关联标记。
对于兴趣点3,“东来顺”和连锁店缩写名“东来顺”匹配,且类型、城市也匹配,因此,判断结果为该兴趣点是“东来顺”连锁店分店,需要对其进行连锁店分店兴趣点关联标记。
最终结果如表2所示:
表2
ID |
名称 |
类型 |
城市 |
所属连锁店 |
1 |
jeanswest |
品牌服装 |
北京市 |
真维斯服装 |
2 |
心如家常菜 |
家常菜 |
北京市 |
Null |
3 |
东来顺 |
火锅 |
北京市 |
东来顺火锅 |
4 |
如家酒店 |
经济型连锁店 |
北京市 |
如家快捷酒店 |
其中Null表示该兴趣点不属于任何连锁店。
参见图10,本发明实施例还提供了一种兴趣点关联标记装置,包括:
搭建模块1001,用于根据关联标记规则搭建神经网络。
训练模块1002,用于利用兴趣点样本数据对所述神经网络进行训练。
处理模块1003,用于当接收到包括待处理兴趣点信息的输入参数时,经训练的所述神经网络对所述输入参数进行处理,判断所述待处理的兴趣点是否需要进行关联标记。
标记模块1004,用于当所述处理模块1003的判断结果为是时,对所述待处理的兴趣点进行标记。
需要说明的是,本发明实施例提供的兴趣点关联标记装置可以包括一个或多个实体装置,具体的,上述搭建模块、训练模块、处理模块及标记模块可以在一个实体装置上实现,也可以分别在多个实体装置上实现,比如,搭建模块和训练模块在一个实体装置上实现,处理模块和标记模块在另一个实体装置上实现,当然,实际应用中,上述四个功能模块也可以分别在三个及以上个实体装置上实现,本发明实施例对此不做限制。
参见图11,本发明的一个实施例中,所述搭建模块1001可以包括:
选取子模块10011,用于根据关联标记规则,选取兴趣点关联标记所需的兴趣点属性;
创建子模块10012,用于根据所述兴趣点关联标记所需的兴趣点属性创建神经元节点及各神经元节点间连接关系。
需要说明的是,在搭建神经网络时,选取的兴趣点关联标记所需的兴趣点属性,与后续步骤中在判断待处理兴趣点是否需要进行关联标记时输入神经网络的输入参数,优选的在内容上是一致的。在实际应用中,对神经网络进行训练的样本数据的输入参数可以包括兴趣点属性等多种信息,这里优选的,选用兴趣点样本数据的属性信息对神经网络进行训练。
也就是说,根据兴趣点属性创建神经元节点,并建立各神经元节点间连接关系,具体为,以能够实现按关联标记规则对兴趣点进行关联标记处理为原则,结合兴趣点关联标记所需的兴趣点属性,确定所需的神经元节点,以及神经元节点内部逻辑和各神经元节点之间的连接关系,完成对神经网络的搭建。
本发明实施例可以根据关联标记规则的不同搭建不同的神经网络,使得能够非常灵活的应用于各种不同的兴趣点关联标记场景中,也就是说,对于不同的兴趣点关联标记应用场景,可以很方便的根据不同的关联标记规则搭建神经网络,并利用兴趣点样本数据对其进行训练以便对待处理兴趣点进行处理,自动实现对其进行关联标记,应用非常灵活。
本发明的一个实施例中,所述训练模块1002具体用于:
依次将各兴趣点样本数据的兴趣点属性传入所述神经网络,分别与预置的关联词表中的属性信息进行匹配,得到所述神经网络的计算结果,根据各计算结果调整神经网络中神经元节点的内部参数和各神经元节点之间的连接权值。
其中,神经元节点的内部参数是用于表示各神经元节点的内部逻辑的参数,连接权值是用于表示各神经元节点之间的连接强弱的参数。
对神经网络的训练目的是调整神经元节点的内部参数和各神经元节点之间的连接权值,以使神经网络对任何的输入都能得到期望的输出。比如,训练的方式可以是,样本数据输入后,分别与预置的关联词表中的信息进行匹配,得到所述神经网络的计算结果,经神经网络计算后输出的结果若正确,则将各神经元节点的内部参数和连接权值上调一些,若输出结果错误,则将各神经元节点的内部参数和连接权值下调一些,这样,通过多个样本数据的处理结果对神经网络中神经元节点的内部参数和各神经元节点之间的连接权值进行调整后,神经网络处理的正确率将大大提高。这说明该神经网络对兴趣点样本数据的学习训练已经获得成功,已将对兴趣点属性的处理关系分布记忆在各神经元节点的内部参数和连接权值上。当神经网络再次接收到包括待处理兴趣点的兴趣点属性时,便能够作出迅速、准确的判断和识别。一般说来,神经网络中所含的神经元个数越多,则它能记忆、识别的信息也就越多。
通常,在对兴趣点关联标记方法中预先根据关联标记规则搭建好神经网络并对其进行训练,这样,在实际应用中,便可以对各待处理兴趣点进行处理,判断是否需要进行关联标记,而无需每次执行对待处理兴趣点处理时都再次搭建神经网络和对其进行训练的操作。
另外,需要说明的是,根据关联标记规则的变化,步骤S101和步骤S102可以调整和扩展神经网络,通过重新训练实现对新的关联标记规则的适应和扩展,以便在新的应用场景中实现对待处理兴趣点进行关联标记处理,使得本发明实施例具备较高的灵活性、适应性和扩展性。
本发明的一个实施例中,所述处理模块1003具体用于:
所述输入参数按照所述神经网络中各神经元节点的内部参数和各神经元节点之间的连接权值输入相应神经元节点,所述神经元节点判断所述输入参数与预置的关联词表中的信息是否匹配,是则确定所述待处理的兴趣点需要进行关联标记,否则确定所述待处理的兴趣点不需要进行关联标记。
实际应用中,对兴趣点的标记方法可以有多种,比如对于相关联的兴趣点均采用标记相同的标识,比如,对于北京市内的各真维斯服装分店均标记为相同的标识,对于北京市内的各东来顺火锅分店均标记为另一种相同的标识,这样,可以基于这种关联标识实现很多其他的功能,比如,用户在查询某连锁店的分店兴趣点时,可以将标记有相同标识的其它分店信息进行一并展示,以进一步提高用户体验;或者在对电子地图的数据处理过程中,当某连锁店的某些信息发生变化时,可以利用这种关联关系对标记有相同标识的各分店兴趣点的某些信息一并更新,等等。
可见,本发明实施例中,采用神经网络,通过对其进行训练,能够模拟人的思维对包括待处理兴趣点信息的输入参数进行处理,实现对其的关联标记,从而可以通过计算机自动实现对兴趣点的关联标记问题,在处理速度上有巨大提高,使得关联标记效率大大提高;另外,本发明实施例可以根据关联标记规则的不同搭建不同的神经网络,使得能够非常灵活的应用于各种不同的兴趣点关联标记场景中,也就是说,对于不同的兴趣点关联标记应用场景,可以很方便的根据不同的关联标记规则搭建神经网络,并利用兴趣点样本数据对其进行训练以便对待处理兴趣点进行处理,自动实现对其进行关联标记,同理,本发明实施例也可以根据关联标记规则的变化,调整和扩展神经网络,通过重新训练实现对新的关联标记规则的适应和扩展,因此具有较高的适应性和高的扩展性。
另外,参见图12,本发明实施例还提供了一种连锁店分店兴趣点关联标记装置,包括:
搭建模块1201,用于根据关联标记规则搭建神经网络。
具体应用中,假设所述关联标记规则具体为按城市标记连锁店分店兴趣点,参见图13,所述搭建模块1201包括:
选取子模块12011,用于根据所述关联标记规则,选取连锁店分店兴趣点关联标记所需的兴趣点属性包括名称、类型和城市;
创建子模块12012,用于根据所述兴趣点属性创建名称相似判断神经元、类型相似判断神经元、城市相似判断神经元、以及连锁店分店关联判断神经元;并建立上述各神经元之间的连接关系:所述名称相似判断神经元分别与类型相似判断神经元和城市相似判断神经元相连,所述类型相似判断神经元和城市相似判断神经元分别与所述连锁店分店关联判断神经元相连。
训练模块1202,用于利用历史连锁店分店兴趣点关联数据样本对所述神经网络进行训练。
处理模块1203,用于当接收到包括待处理兴趣点信息的输入参数时,经训练的所述神经网络对所述输入参数进行处理,判断所述待处理兴趣点是否为连锁店分店兴趣点。
本发明实施例中,参见图14,所述处理模块1203可以包括:
名称相似判断子模块12031,用于当所述名称相似判断神经元接收到包括待处理兴趣点名称、类型和城市信息的输入参数时,比对所述待处理兴趣点名称和预置的关联词表中记录的名称信息;若比对结果为不相似,则确定所述待处理的兴趣点不是连锁店分店兴趣点;
类型相似判断子模块12032,用于当所述名称相似判断子模块12031的判断结果为相似时,所述类型相似判断神经元比对所述待处理兴趣点类型和所述关联词表中记录的类型信息;
城市相似判断子模块12033,用于当所述名称相似判断子模块12031的判断结果为相似时,所述城市相似判断神经元比对所述待处理兴趣点城市和所述关联词表中记录的城市信息;
关联判断子模块12034,用于所述连锁店分店关联判断神经元判断所述类型相似判断神经元和所述城市相似判断神经元的比对结果,若比对结果均为相似,则确定所述待处理的兴趣点是连锁店分店兴趣点,否则确定所述待处理的兴趣点不是连锁店分店兴趣点。
需要说明的是,所述关联词表中记录的名称信息可以包括连锁店官方名称、连锁店别名、连锁店名称缩写以及连锁店歧义名;参见图15,所述名称相似判断子模块12031包括:
主干提取单元1501,用于从待处理兴趣点的名称中提取名称主干;
第一匹配单元1502,用于将所述名称主干与关联词表中的连锁店官方名称、连锁店别名、连锁店名称缩写进行匹配;若所述主干名称与其均不匹配,则确认比对结果不相似;
第二匹配单元1503,用于若所述第一匹配单元1502的匹配结果为名称主干与其中之一匹配,则将所述名称主干与连锁店歧义名进行匹配,若匹配,则确认比对结果不相似,否则确认比对结果相似。
具体实现中,名称相似判断子模块的一种实现方式可以是包括:
主干提取单元,用于根据待处理兴趣点名称中的特殊符号提取名称主干。
其中,根据待处理兴趣点名称中的特殊符号提取名称主干可以是:如果兴趣点名称是“肯德基(苏州街店)”、“肯德基_苏州街店”、“肯德基[苏州街店]”等格式时,根据其中的特殊符号“()”“_”“[]”等提取出名称主干“肯德基”,如果是“肯德基苏州街店”,因为不包含特殊符号,则提取后的结果还是“肯德基苏州街店”,直接提交到后续处理模块。
官方名称匹配单元,用于比对所述名称主干是否与关联词表中的连锁店官方名称匹配。
别名匹配单元,用于当所述官方名称匹配单元的匹配结果为否时,比对所述名称主干是否与关联词表中的连锁店别名匹配。
缩写匹配单元,用于当所述别名匹配单元的匹配结果为否时,比对所述名称主干是否与关联词表中的连锁店名称缩写匹配,若匹配结果为否,则确认比对结果为不相似。
歧义名匹配单元,用于当所述官方名称匹配单元、别名匹配单元或缩写匹配单元的匹配结果为是时,比对所述名称主干是否与关联词表中的连锁店歧义名匹配,是则确认比对结果为不相似;否则确认比对结果为相似。
由于现实生活中兴趣点的数量巨大,兴趣点的类型都是人工后期标记上去的,因此,某连锁店分店兴趣点的类型有可能出现前后标记不一样的情况,比如,关联词表中,“东来顺火锅”的类型可能被标记为火锅,而待处理兴趣点“东来顺火锅_苏州街店”的类型可能被标记为中餐,待处理兴趣点“东来顺火锅_望京店”的类型可能被标记为家常菜,等等。为了减小这种人为失误对自动关联的影响,参见图16,本发明实施例中,所述类型相似判断子模块12032可以包括:
相似度计算单元1601,用于当所述名称相似判断子模块的判断结果为相似时,根据所述待处理兴趣点类型与所述关联词表中记录的类型之间的步长计算类型相似度;
相似确认单元1602,用于判断所述类型相似度是否满足预设范围,是则确定比对结果为相似,否则确定比对结果为不相似。
在本发明实施例中,城市相似判断神经元比对所述待处理兴趣点城市和所述关联词表中记录的城市信息具体可以是,直接采用字符串匹配的方式进行比对。
标记模块1204,用于当所述处理模块的判断结果为是时,对所述待处理兴趣点进行连锁店分店兴趣点关联标记。
需要说明的是,本发明实施例提供的兴趣点关联标记装置可以包括一个或多个实体装置,具体的,上述搭建模块、训练模块、处理模块及标记模块可以在一个实体装置上实现,也可以分别在多个实体装置上实现,比如,搭建模块和训练模块在一个实体装置上实现,处理模块和标记模块在另一个实体装置上实现,当然,实际应用中,上述四个功能模块也可以分别在三个及以上个实体装置上实现,本发明实施例对此不做限制。
可见,本发明实施例中,采用神经网络,通过对其进行训练,能够模拟人的思维判断待处理兴趣点与某连锁店的关联关系,可以通过计算机自动实现对兴趣点的关联标记,在处理速度上有巨大提高,使得关联标记效率大大提高;另外,本发明实施例中,通过匹配连锁店关联词表来进行名称相似判断,由于可以根据实际情况的变化对连锁店关联词表进行更新,使得名称相似判断也能够根据实际情况的变化更加准确;基于类型层级结构的类型相似度修正方法,使得类型相似判断结果更加准确。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以保存于一计算机可读取保存介质中,所述的保存介质,如:ROM/RAM、磁碟、光盘等。
以上对本发明所提供的兴趣点、连锁店分店兴趣点关联标记的方法与装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。