CN108733665A - 基于特征和语义的景点信息匹配方法及装置 - Google Patents

基于特征和语义的景点信息匹配方法及装置 Download PDF

Info

Publication number
CN108733665A
CN108733665A CN201710240811.2A CN201710240811A CN108733665A CN 108733665 A CN108733665 A CN 108733665A CN 201710240811 A CN201710240811 A CN 201710240811A CN 108733665 A CN108733665 A CN 108733665A
Authority
CN
China
Prior art keywords
matched
sight spot
matching
sight
matches
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710240811.2A
Other languages
English (en)
Inventor
江浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Elongnet Information Technology Beijing Co Ltd
Original Assignee
Elongnet Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Elongnet Information Technology Beijing Co Ltd filed Critical Elongnet Information Technology Beijing Co Ltd
Priority to CN201710240811.2A priority Critical patent/CN108733665A/zh
Publication of CN108733665A publication Critical patent/CN108733665A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本公开涉及一种基于特征和语义的景点信息匹配方法、基于特征和语义的景点信息匹配装置、计算机可读存储介质以及电子设备。所述的景点信息匹配方法包括:判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。本公开能有效降低人工匹配的成本,并提升匹配准确率和匹配效率。

Description

基于特征和语义的景点信息匹配方法及装置
技术领域
本公开涉及数据处理技术领域,具体涉及一种基于特征和语义的景点信息匹配方法、基于特征和语义的景点信息匹配装置、计算机可读存储介质以及电子设备。
背景技术
现有旅游网站上的旅游景点、酒店、饭店等产品通常都会接入多个渠道的产品来源,但是不同来源的同一产品的基础数据信息经常会有所差别。以旅游景点产品为例,各个供应商对接的景点和门票资源数据每天都会有新景点上线和资源售完等产品状态变化。由于实际的景点数量的变化并不频繁,所以各个供应商的景点数据会有大量重复,需要把不同供应商的同一景点信息识别出来,进行产品数据的匹配和整合。实际情况中同一景点各个供应商提供的基础数据基本都不一致或部分信息缺失,包括名称,地址等都有差别,给自动化大量数据情况下的景点的匹配工作带来了困难。
例如,同一景点北京故宫在供应商A叫“故宫”,供应商B叫“故宫博物院”,供应商C叫“北京故宫”;另一景点嘉兴南湖风景区在供应商A叫“南湖景区”,供应商B叫“南湖风景名胜区”且双方地址描述也不相同。目前全部景点数据平均在2.1w,每天都有数据变化需要重新匹配,全部靠人力分析每人1天最多匹配200个景点,每次需要20人/天左右的工作量且需要定期重复,成本很高。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于特征和语义的景点信息匹配方法、基于特征和语义的景点信息匹配装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种基于特征和语义的景点信息匹配方法,包括:
判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;
在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;
结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
在本公开的一种示例性实施例中,所述结合所述待匹配景点名称与所述可匹配对象名称的匹配结果包括:
在判断所述待匹配景点名称与所述可匹配对象名称相匹配时,判断所述待匹配景点位置与所述可匹配对象位置的距离差是否小于第一阈值;
在判断所述距离差小于所述第一阈值时,判定所述待匹配景点与所述可匹配对象匹配成功。
在本公开的一种示例性实施例中,所述判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象包括:
获取待匹配景点列表中的一所述待匹配景点;
检测数据库中是否存在位于所述待匹配景点的预设范围内的所述可匹配对象,并将存在的所述可匹配对象生成一对象列表;
检测所述对象列表中的可匹配对象与所述待匹配景点的基础特征是否匹配。
在本公开的一种示例性实施例中,在判定所述待匹配景点与所述可匹配目标匹配成功时,所述方法还包括:
将所述待匹配景点信息从所述待匹配景点列表中删除。
在本公开的一种示例性实施例中,所述方法还包括:
在判断所述待匹配景点名称与所述可匹配对象名称不匹配时,判断所述待匹配景点名称与所述可匹配对象名称的相似度是否大于预设值;
在判断所述待匹配景点名称与所述可匹配对象名称的相似度大于预设值时,检测所述待匹配景点位置与所述可匹配对象位置的距离差是否小于第二阈值;
在判断所述距离差小于所述第二阈值时,判定所述待匹配景点与所述可匹配对象匹配成功。
在本公开的一种示例性实施例中,所述判断所述待匹景点名称与所述可匹配对象名称的相似度是否大于预设值包括:
对所述数据库中各对象的名称进行分词处理,并建立分词字典树;
对所述待匹配景点的名称进行分词处理,并生成一分词数组;
建立搜索式并遍历所述名称分词数组,根据所述搜索式在所述分词字典树中搜索并获取搜索结果;
遍历所述搜索结果,获取一可匹配对象;
计算所述待匹配景点与所述可匹配对象的名称相似度,并判断所述名称相似度是否满足预设值。
在本公开的一种示例性实施例中,所述判断所述待匹配景点名称与所述可匹配目标名称是否匹配包括:
判断所述待匹配景点名称与所述可匹配目标名称是否完全相同或者为包含关系。
在本公开的一种示例性实施例中,所述基础特征包括:所述待匹配景点和所述可匹配对象的所在城市和/或所属星级。
在本公开的一种示例性实施例中,所述方法还包括:
通过所述待匹配景点和所述可匹配对象的经纬度信息确定其位置信息。
根据本公开的第二方面,提供一种基于特征和语义的景点信息匹配装置,包括:
可匹配对象查询模块,用于判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;
名称判断模块,用于在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;
结果判定模块,用于结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的的基于特征和语义的景点信息匹配方法。
根据本公开的第四方面,提供一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行以下操作:
判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;
在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;
结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
本公开的一种实施例所提供的景点信息匹配方法中,通过依次判断待匹配景点的预设范围内是否存在可匹配对象,以及存在的可匹配对象与待匹配景点的基础特征、名称是否匹配,并结合名称匹配结果判断所述待匹配景点与可匹配对象的最终匹配结果,从而实现对景点产品信息的自动匹配,减少人工匹配的工作量,提高匹配效率。由于只需人工介入不匹配的景点信息和匹配结果不确定的景点信息,从而有效降低产品和运营的人力成本;并且,通过设置多个特征进行匹配,从而有效保证匹配结果的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出本公开示例性实施例中一种基于特征和语义的景点信息匹配方法示意图;
图2示意性示出本公开示例性实施例中一种判断是否存在可匹配对象的方法示意图;
图3示意性示出本公开示例性实施例中另一种基于特征和语义的景点信息匹配方法流程图;
图4示意性示出本公开示例性实施例中一种景点名称语义搜索流程图;
图5示意性示出本公开示例性实施例中一种基于特征和语义的景点信息匹配装置组成示意图;
图6示意性示出本公开示例性实施例中一种基于特征和语义的景点信息匹配装置的另一种示意图;
图7示意性示出本公开示例性实施例中一种基于特征和语义的景点信息匹配装置的再一种示意图;
图8示意性示出本公开示例性实施例中一景点信息示意图;
图9示意性示出本公开示例性实施例中一景点另一种信息示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本示例实施方式中首先提供了一种基于特征和语义的景点信息匹配方法,可以应用于旅游网站上对于景点产品信息的匹配。参考图1中所示,所述基于特征和语义的景点信息匹配方法可以包括以下步骤:
步骤S1,判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;
步骤S2,在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;
步骤S3,结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
本示例实施方式所提供的景点信息匹配方法中,通过依次判断待匹配景点的预设范围内是否存在可匹配对象,以及存在的可匹配对象与待匹配景点的基础特征、名称是否匹配,并结合名称匹配结果判断所述待匹配景点与可匹配对象的最终匹配结果,从而实现对景点信息和产品的自动匹配,减少人工匹配的工作量,提高匹配效率。由于只需人工介入不匹配的景点信息和匹配结果不确定的景点信息,从而有效降低产品和运营的人力成本;并且,通过设置多个特征进行匹配,从而有效保证匹配结果的准确率。
下面,将结合图2至图5对本示例实施方式中的基于特征和语义的景点信息匹配方法的各个步骤进行更详细的说明。
步骤S1,判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象。
本示例实施方式中,参考图2所示,上述的步骤S1具体可以包括以下内容:
步骤S11,获取待匹配景点列表中的一所述待匹配景点;
步骤S12,检测数据库中是否存在位于所述待匹配景点的预设范围内的所述可匹配对象,并将存在的所述可匹配对象生成一对象列表;
步骤S13,检测所述对象列表中的可匹配对象与所述待匹配景点的基础特征是否匹配。
在对待匹配景点进行信息匹配时,可以为所有的待匹配景点生成一待匹配景点列表,并对列表中的待匹配景点逐一进行匹配,从而方便处理和记录。在判断所述待匹配景点的预设范围内的可匹配对象时,可以通过经纬度信息来确定所述待匹配景点和所述可匹配对象的位置坐标信息,预设范围可以根据具体需求设定,例如:50千米、100千米等范围。同时,上述待匹配景点和可匹配对象的基础特征可以是所在城市或所属星级,也可以是利用上述的两种特征同时作为基础特征来判断。通过设置多个特征作为判断标准,能够提高判断的准确性。
在本公开的其他示例性实施方式中,上述的基础特征同样还可以包括:营业时间、最大容纳客人数量、价格、所在商圈、所属行政区域或品牌等基础信息中的一种或多种,本公开在此不做特殊限定。
步骤S2,在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配。
本示例实施方式中,当判断待匹配景点位置坐标的预设范围内存在可匹配对象时,可在数据库中获取这些可匹配对象的数据信息,并生成一对应的可匹配对象列表,对可匹配列表中的各可匹配对象依次进行判断名称是否匹配。
上述的判断所述待匹配景点名称与所述可匹配目标名称是否匹配可以包括:判断名称是否相同,或名称为包含关系。例如:待匹配景点A的名称为:故宫,可匹配对象B的名称为:故宫博物院,则待匹配景点A与可匹配对象B的名称为包含关系,此时可判断为名称匹配。
步骤S3,结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
本示例实施方式中,参考图3所示内容,上述的步骤S3可以包括以下步骤:
步骤S31,在判断所述待匹配景点名称与所述可匹配对象名称相匹配时,判断所述待匹配景点位置与所述可匹配对象位置的距离差是否小于第一阈值;
步骤S32,在判断所述距离差小于所述第一阈值时,判定所述待匹配景点与所述可匹配对象匹配成功。
在判断待匹配景点与可匹配对象的的基础特征相同后,判断两者的名称是否相同或为包含关系。当判断两者名称完全相同时后,再根据两者的经纬度信息计算两者之间的距离,并将该距离差与第一阈值进行比较,例如:可以设定第一阈值为10千米或15千米等数值。举例来说,景点A名称:水立方,景点B名称:水立方;在判断景点A和景点B名称完全相同时,计算两者位置信息的距离差是否小于所述第一阈值;在上述距离差小于第一阈值时,则可以判定为两个景点信息匹配成功,即所述待匹配景点与该可匹配对象信息匹配成功。此时,所述待匹配景点与该可匹配对象可作为完全匹配策略。
或者,当判断待匹配景点与可匹配对象的的基础特征相同后,判断两者的名称为包含关系时,即较长的名称包含较短的名称;此时,由于名称为包含关系,可以设定所述的第一阈值为较小的数值,以保证判断的准确性,例如:设定所述第一阈值为3千米或5千米。举例而言,景点A的名称为:南湖景区,景点B的名称为:南湖风景名胜区。在判断景点A和景点B名称为完全包含关系时,计算两者位置信息的距离差是否小于所述第一阈值。当判断两者的距离差小于该第一阈值时,则可以判定为两个景点信息匹配成功,即所述待匹配景点与该可匹配对象信息匹配成功。此时,所述待匹配景点与该可匹配对象可作为完全包含匹配策略。
通过依次判断待匹配景点与可匹配对象的所述城市、所属星级、名称及距离,从多个维度对两者之间的匹配度进行判断,保证了判断结果的准确性。
基于上述内容,本示例实施方式中,参考图3所示,上述的基于特征和语义的景点信息匹配方法还可以包括:
步骤S41,在判断所述待匹配景点名称与所述可匹配对象名称不匹配时,判断所述待匹配景点名称与所述可匹配对象名称的相似度是否大于预设值;
步骤S42,在判断所述待匹配景点名称与所述可匹配对象名称的相似度大于预设值时,检测所述待匹配景点位置与所述可匹配对象位置的距离差是否小于第二阈值;
步骤S43,在判断所述距离差小于所述第二阈值时,判定所述待匹配景点与所述可匹配对象匹配成功。
在判断所述待匹配景点名称与所述可匹配对象的基础特征匹配后,但判断待匹配景点名称与所述可匹配对象的名称不匹配时,可以判断两者的名称的相似度是否大于预设值。在两者名称的相似度满足预设值时,再根据两者的经纬度信息计算距离差是否小于第二阈值,由于两者名称不同,为保证匹配结果的准确性,可以限定第二阈值为更小的数值,例如:1千米、2千米或3千米等数值。并在判断同时满足名称相似度和距离差的限定时,判定位两者信息匹配成功。此时,所述待匹配景点与该可匹配对象可作为语义匹配策略。
举例来说,参考图8、图9所示,图8景点名称为“西山国家级风景名胜区”,图9景点名称为“西山风景名胜区”,两者景点名称不同,位置信息不同,但实则是同一景点产品,此种情形即可通过语义匹配策略完成判断。
本示例实施方式中,上述的判断所述待匹景点名称与所述可匹配对象名称的相似度是否大于预设值包括以下步骤:
对数据库中各对象的名称进行分词处理,并建立分词字典树;
对所述待匹配景点的名称进行分词处理,并生成一分词数组;
建立搜索式并遍历所述名称分词数组,根据所述搜索式在所述分词字典树中搜索并获取搜索结果;
遍历所述搜索结果,获取一可匹配对象;
计算所述待匹配景点与所述可匹配对象的名称相似度,并判断所述名称相似度是否满足预设值。
具体来说,参考图5所示,在进行语义搜索与相似度计算时,首先需要提前对数据库中的已有景点数据进行分词,构建成字典树结构(双数组Trie树结构),字典的基本格式为:
[单词][词性A][A的频次][词性B][B的频次]…
对待匹配景点名称进行分词后,在景点字典库中搜索,字典的搜索推荐逻辑通过通用的编辑距离和拼音匹配算法进行匹配度高的优先返回。为了提高计算效率,可以不要求对字典库里的每个景点进行遍历计算,而使用变步长的返回结果数量,来缩短计算距离。例如:第一次搜索只要求返回结果为前50个。假设返回结果用matcheArray[50]来表示,再遍历matchArray[50]根据分词搜索的匹配结果计算匹配度并保存。计算公式可以是简单的公共字符占比乘以权重,不考虑字序。
基于上述内容,本本示例实施方式中,上述的基于特征和语义的景点信息匹配方法还可以包括:
步骤S5,在判定所述待匹配景点与所述可匹配目标匹配成功时,将所述待匹配景点信息从所述待匹配景点列表中删除。
当判断数据库中存在与所述待匹配景点相匹配的可以匹配对象时,将两者的匹配信息合并,并从所述待匹配景点列表中将上述的待匹配景点信息删除,进行下一项待匹配景点的匹配,避免对列表中的景点重复操作。
在本公开的其他示例性实施方式中,参考图3所示,上述的基于特征和语义的景点信息匹配方法还可以包括:
步骤S6,将匹配失败的待匹配景点作为新的景点信息添加至数据库中,并建立相应的景点数据信息。
通过将匹配失败的景点数据在数据库中自动新建景点产品信息,可以有效的避免因匹配失败而删除产品信息的错误操作发生,提升匹配结果的准确性;同时可以更大程度的减少人工操作,降低人力成本。
举例来说,在本示例实施方式中,上述的基于特征和语义的景点信息匹配方法可以包括以下内容:
1)从待匹配景点列表DSList中获取待匹配景点S1的经纬度信息,调用经纬度+距离参数(100km)在现有景点的数据库中进行搜索,得到S1附近范围的景点列表SList。
2)遍历SList,获取可匹配对象S2。
3)根据完全匹配策略,对S1和S2的所属城市、景区级别和名称与距离进行判断。
4)如果不符合完全匹配策略,则重复进行步骤2),直到SList遍历结束或根据所示完全匹配策略可以判断S1与S2匹配,则终止遍历,在DSList中删除S1景点。
5)如果DSList不为空,从中重新获取待匹配景点S1的经纬度信息,调用经纬度+距离参数(50km)在现有景点的数据库中进行搜索,得到S1附近范围的景点列表SList。
6)遍历SList,获取可匹配对象S2。
7)根据完全包含匹配策略,对S1和S2的所属城市、景区级别和名称与距离进行判断。
8)如果不符合所述完全包含匹配策略,则重复进行步骤5),直到SList遍历结束或根据所述完全匹配策略可以判断S1与S2匹配,则终止遍历,在DSList中删除S1景点。
9)如果DSList不为空,对现有景点数据库中的数据构建分词字典树SDic。
10)设定搜索结果数量srn1=50和匹配阈值alpha1=0.95。
11)从DSList获取待匹配景点S1,并对S1的景点名称进行分词得到S1的分词数组S1List:S1A,S1B…。
12)遍历S1List,取出新的分词S1A,生成搜索式:
searchTitle=searchTitle+S1A
13)使用searchTitle在SDic中搜索返回搜索结果srList。
14)遍历搜索结果srList,获取可匹配对象S2。
15)计算S1与S2的相似匹配度:
a)对S1.name和S2.name进行预处理,去掉空格标点符号等无意义字符,得到S1.name_new,S2.name_new;
b)计算S1.name.new和S2.name_new中的公共字符数量commonN;
c)计算:
commonN*1.0/maxLen(S1.name.new,S2.name_new)*minLen
(S1.name,S2.name)/maxLen(S1.name,S2.name)-(S1.name.len==S2.name.len?0:0.01),
得出相似度x。
16)判断x是否大于alpha,如果大于则记录到匹配结果数组rList中。
17)遍历完S1List后,判断rList是否为空,如果不为空则根据语义匹配策略其余条件判断,如果其余条件判断也通过则匹配成功,如果其余条件不能同时满足则记为不确定是否匹配结果。
18)如果rList为空,调整搜索结果数量srn1=50*2和匹配阈值alpha1=0.95-0.01,重复步骤11)。如果已经调整过2次rList结果依然为空,则可以认为匹配失败。
19)将DSList中剩余的景点作为确定不匹配景点。
本公开提供的景点信息匹配方法,能够针对产品信息的结构,通过先利用上述的完全匹配策略、完全包含策略对待匹配景点列表中的待匹配景点依次进行判断,可以筛选和匹配大部分的相似数据,能大幅缩小最后需要进行语义匹配的数据量。通过利用上述的三种策略对供应商的景点产品信息进行匹配处理,可以匹配并确定大部分的产品,只需人工匹配少量的不确定结果以及确定不匹配结果,从而大幅减少产品和运营的人力成本,并且有效提高匹配效率。
当然,在本公开的其他示例性实施例中,上述的景点信息匹配方法中的具体数据也可以根据具体情况采用其他数值的数据,本公开在此不做特殊限定。同样的,本公开提供的匹配策略和信息匹配方法也可以应用于酒店、饭店、商店、车站等产品的信息匹配中。
需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
进一步的,参考图5所示,本示例的实施方式中还提供了一种基于特征和语义的景点信息匹配装置2,包括:可匹配对象查询模块21、名称判断模块22以及结果判定模块23。其中:
所述可匹配对象查询模块可以用于判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;
所述名称判断模块可以用于在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;
所述结果判定模块可以用于结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
上述中各基于特征和语义的景点信息匹配装置的单元的具体细节已经在对应的基于特征和语义的景点信息匹配方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
进一步的,本示例的另一实施方式中还提供了一种基于特征和语义的景点信息匹配装置。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明的用于保持数据一致性的装置可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的用于虚拟角色名称推荐方法中的步骤。例如,所述处理器可以执行如图1中所示的步骤S1:判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;步骤S2:在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;步骤S3:结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
参考图6,应用上述基于特征和语义的景点信息匹配方法的终端装置300可以包括以下一个或多个组件:处理组件302,存储器304,电源组件306,多媒体组件308,音频组件310,输入/输出(I/O)的接口312,传感器组件314,以及通信组件316。
处理组件302通常控制终端装置300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件302可以包括一个或多个处理器320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件302可以包括一个或多个模块,便于处理组件302和其他组件之间的交互。例如,处理组件302可以包括多媒体模块,以方便多媒体组件304和处理组件302之间的交互。
存储器304被配置为存储各种类型的数据以支持在设备300的操作。这些数据的示例包括用于在终端装置300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件306为终端装置300的各种组件提供电力。电源组件306可以包括电源管理系统,一个或多个电源,及其他与为终端装置300生成、管理和分配电力相关联的组件。
多媒体组件308包括在所述终端装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当设备300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(MIC),当终端装置300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。
I/O接口312为处理组件302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件314包括一个或多个传感器,用于为移动终端终端装置300提供各个方面的状态评估。例如,传感器组件314可以检测到设备300的打开/关闭状态,组件的相对定位,例如所述组件为移动终端终端装置300的显示器和小键盘,传感器组件314还可以检测移动终端终端装置300或移动终端终端装置300一个组件的位置改变,用户与移动终端终端装置300接触的存在或不存在,移动终端终端装置300方位或加速/减速和移动终端终端装置300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件316被配置为便于终端装置300和其他设备之间有线或无线方式的通信。终端装置300可以接入基于通信标准的无线网络,如WiFi,2G,3G或4G,或它们的组合。在一个示例性实施例中,通信组件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在本示例性实施例中,终端装置300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的用于保持数据一致性的方法中的步骤,例如,所述终端设备可以执行如图1中所示的步骤S1:判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;步骤S2:在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;步骤S3:结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
参考图7所示,描述了根据本发明的实施方式的用于虚拟角色名称推荐的程序产品40,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

Claims (10)

1.一种基于特征和语义的景点信息匹配方法,其特征在于,包括:
判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;
在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;
结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
2.根据权利要求1所述的基于特征和语义的景点信息匹配方法,其特征在于,所述结合所述待匹配景点名称与所述可匹配对象名称的匹配结果包括:
在判断所述待匹配景点名称与所述可匹配对象名称相匹配时,判断所述待匹配景点位置与所述可匹配对象位置的距离差是否小于第一阈值;
在判断所述距离差小于所述第一阈值时,判定所述待匹配景点与所述可匹配对象匹配成功。
3.根据权利要求1或2所述的基于特征和语义的景点信息匹配方法,其特征在于,所述判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象包括:
获取待匹配景点列表中的一所述待匹配景点;
检测数据库中是否存在位于所述待匹配景点的预设范围内的所述可匹配对象,并将存在的所述可匹配对象生成一对象列表;
检测所述对象列表中的可匹配对象与所述待匹配景点的基础特征是否匹配:
在判定所述待匹配景点与所述可匹配目标匹配成功时,将所述待匹配景点信息从所述待匹配景点列表中删除。
4.根据权利要求2所述的基于特征和语义的景点信息匹配方法,其特征在于,所述方法还包括:
在判断所述待匹配景点名称与所述可匹配对象名称不匹配时,判断所述待匹配景点名称与所述可匹配对象名称的相似度是否大于预设值;
在判断所述待匹配景点名称与所述可匹配对象名称的相似度大于预设值时,检测所述待匹配景点位置与所述可匹配对象位置的距离差是否小于第二阈值;
在判断所述距离差小于所述第二阈值时,判定所述待匹配景点与所述可匹配对象匹配成功。
5.根据权利要求4所述的基于特征和语义的景点信息匹配方法,其特征在于,所述判断所述待匹景点名称与所述可匹配对象名称的相似度是否大于预设值包括:
对数据库中各对象的名称进行分词处理,并建立分词字典树;
对所述待匹配景点的名称进行分词处理,并生成一分词数组;
建立搜索式并遍历所述名称分词数组,根据所述搜索式在所述分词字典树中搜索并获取搜索结果;
遍历所述搜索结果,获取一可匹配对象;
计算所述待匹配景点与所述可匹配对象的名称相似度,并判断所述名称相似度是否满足预设值。
6.根据权利要求1所述的基于特征和语义的景点信息匹配方法,其特征在于,所述判断所述待匹配景点名称与所述可匹配目标名称是否匹配包括:
判断所述待匹配景点名称与所述可匹配目标名称是否完全相同或者为包含关系。
7.根据权利要求1所述的基于特征和语义的景点信息匹配方法,其特征在于,所述基础特征包括:所述待匹配景点和所述可匹配对象的所在城市和/或所属星级。
8.一种基于特征和语义的景点信息匹配装置,其特征在于,包括:
可匹配对象查询模块,用于判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;
名称判断模块,用于在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;
结果判定模块,用于结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
9.一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现根据权利要求1至7中任一项所述的基于特征和语义的景点信息匹配方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行以下操作:
判断一待匹配景点位置的预设范围内是否存在基础特征与所述待匹配景点相匹配的可匹配对象;
在判断存在基础特征与所述待匹配景点相匹配的可匹配对象时,判断所述待匹配景点名称与所述可匹配对象名称是否匹配;
结合所述待匹配景点名称与所述可匹配对象名称的匹配结果,判断所述待匹配景点与所述可匹配对象是否匹配。
CN201710240811.2A 2017-04-13 2017-04-13 基于特征和语义的景点信息匹配方法及装置 Pending CN108733665A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710240811.2A CN108733665A (zh) 2017-04-13 2017-04-13 基于特征和语义的景点信息匹配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710240811.2A CN108733665A (zh) 2017-04-13 2017-04-13 基于特征和语义的景点信息匹配方法及装置

Publications (1)

Publication Number Publication Date
CN108733665A true CN108733665A (zh) 2018-11-02

Family

ID=63925037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710240811.2A Pending CN108733665A (zh) 2017-04-13 2017-04-13 基于特征和语义的景点信息匹配方法及装置

Country Status (1)

Country Link
CN (1) CN108733665A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340580A (zh) * 2020-02-05 2020-06-26 深圳市道旅旅游科技股份有限公司 房型的确定方法、装置、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8954561B2 (en) * 2009-01-26 2015-02-10 Google Inc. System and method of displaying search results based on density
CN104537027A (zh) * 2014-12-19 2015-04-22 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN104751232A (zh) * 2015-04-27 2015-07-01 携程计算机技术(上海)有限公司 酒店自动匹配方法
CN104778171A (zh) * 2014-01-10 2015-07-15 携程计算机技术(上海)有限公司 字符串匹配系统及方法
CN105045888A (zh) * 2015-07-28 2015-11-11 浪潮集团有限公司 一种用于hmm的分词训练语料标注方法
CN103886082B (zh) * 2014-03-26 2017-02-08 百度在线网络技术(北京)有限公司 对兴趣点的位置信息进行校验的方法和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8954561B2 (en) * 2009-01-26 2015-02-10 Google Inc. System and method of displaying search results based on density
CN104778171A (zh) * 2014-01-10 2015-07-15 携程计算机技术(上海)有限公司 字符串匹配系统及方法
CN103886082B (zh) * 2014-03-26 2017-02-08 百度在线网络技术(北京)有限公司 对兴趣点的位置信息进行校验的方法和设备
CN104537027A (zh) * 2014-12-19 2015-04-22 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN104751232A (zh) * 2015-04-27 2015-07-01 携程计算机技术(上海)有限公司 酒店自动匹配方法
CN105045888A (zh) * 2015-07-28 2015-11-11 浪潮集团有限公司 一种用于hmm的分词训练语料标注方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
龚健雅: "《对地观测数据处理与分析研究进展》", 31 December 2007 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340580A (zh) * 2020-02-05 2020-06-26 深圳市道旅旅游科技股份有限公司 房型的确定方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
EP2784646B1 (en) Method and Device for Executing Application
US20200394216A1 (en) Method and device for video processing, electronic device, and storage medium
CN102822826A (zh) 创建和传播注释的信息
CN104268129B (zh) 消息回复的方法及装置
KR20160048708A (ko) 통신 메시지 인식 방법, 장치, 프로그램 및 저장매체
CN110147467A (zh) 一种文本描述的生成方法、装置、移动终端及存储介质
CN105095427A (zh) 搜索推荐方法和装置
CN107423386A (zh) 生成电子卡片的方法及装置
CN109144285A (zh) 一种输入方法和装置
CN105373580A (zh) 主题显示方法及装置
CN106128440A (zh) 一种歌词显示处理方法、装置、终端设备及系统
CN112417318A (zh) 一种兴趣点的状态确定方法、装置、电子设备及介质
CN109634913A (zh) 文档的存储方法、装置及电子设备
CN109388699A (zh) 输入方法、装置、设备及存储介质
CN110929176A (zh) 一种信息推荐方法、装置及电子设备
EP3261324A1 (en) Method and device for application switching
CN108572979A (zh) 一种位置服务方法和装置、一种用于位置服务的装置
CN113190307A (zh) 控件添加方法、装置、设备及存储介质
CN111178055B (zh) 语料识别方法、装置、终端设备和介质
CN105843865B (zh) 媒体文件播放方法及装置
CN106055671B (zh) 一种多媒体数据处理方法及其设备
CN107729439A (zh) 获取多媒体数据的方法、装置和系统
CN108733665A (zh) 基于特征和语义的景点信息匹配方法及装置
WO2020140472A1 (zh) 时区确定方法、装置、可穿戴设备及系统
CN105512231A (zh) 联系人搜索方法、装置和终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181102

RJ01 Rejection of invention patent application after publication