CN110895555B - 数据检索方法和装置、存储介质及电子装置 - Google Patents
数据检索方法和装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN110895555B CN110895555B CN201811068831.7A CN201811068831A CN110895555B CN 110895555 B CN110895555 B CN 110895555B CN 201811068831 A CN201811068831 A CN 201811068831A CN 110895555 B CN110895555 B CN 110895555B
- Authority
- CN
- China
- Prior art keywords
- text
- retrieval
- matching
- matching logic
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据检索方法和装置、存储介质及电子装置。其中,该方法包括:获取数据检索请求,其中,数据检索请求中携带有用于进行商标检索的检索文本信息;从所配置的检索匹配逻辑集合中,确定出与检索文本信息关联的至少两种目标检索匹配逻辑;按照目标检索匹配逻辑,提取出检索文本信息的文本特征,并获取与文本特征相匹配的文本检索结果,其中,文本检索结果中包括按照目标检索匹配逻辑检索得到的商标图片;对文本检索结果进行整合,得到与数据检索请求对应的检索结果,其中,检索结果中包括与检索文本信息相匹配的商标序列。本发明解决了相关技术中存在的数据检索的准确性低的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种数据检索方法和装置、存储介质及电子装置。
背景技术
目前,在很多检索平台所提供的数据检索方法中,通常是利用传统的布尔运算来直接匹配出对应的检索结果。如在获取到用于检索的检索文本之后,检索服务器往往只能检索出与上述检索文本完全一致的商标,而遗漏与该检索文本相似的其他商标,使得检索结果出现漏检,从而导致数据检索的准确性较低的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据检索方法和装置、存储介质及电子装置,以至少解决相关技术中存在的数据检索的准确性低的技术问题。
根据本发明实施例的一个方面,提供了一种数据检索方法,包括:获取数据检索请求,其中,上述数据检索请求中携带有用于进行商标检索的检索文本信息;从所配置的检索匹配逻辑集合中,确定出与上述检索文本信息关联的至少两种目标检索匹配逻辑,其中,上述目标检索匹配逻辑用于指示使用上述检索文本信息进行检索时所使用的匹配条件;按照上述目标检索匹配逻辑,提取出上述检索文本信息的文本特征,并获取与上述文本特征相匹配的文本检索结果,其中,上述文本检索结果中包括按照上述目标检索匹配逻辑检索得到的商标图片;对上述文本检索结果进行整合,得到与上述数据检索请求对应的检索结果,其中,上述检索结果中包括与上述检索文本信息相匹配的商标序列。
根据本发明实施例的另一方面,还提供了一种数据检索装置,包括:获取单元,用于获取数据检索请求,其中,上述数据检索请求中携带有用于进行商标检索的检索文本信息;确定单元,用于从所配置的检索匹配逻辑集合中,确定出与上述检索文本信息关联的至少两种目标检索匹配逻辑,其中,上述目标检索匹配逻辑用于指示使用上述检索文本信息进行检索时所使用的匹配条件;提取单元,用于按照上述目标检索匹配逻辑,提取出上述检索文本信息的文本特征,并获取与上述文本特征相匹配的文本检索结果,其中,上述文本检索结果中包括按照上述目标检索匹配逻辑检索得到的商标图片;整合单元,用于对上述文本检索结果进行整合,得到与上述数据检索请求对应的检索结果,其中,上述检索结果中包括与上述检索文本信息相匹配的商标序列。
根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述数据检索方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的数据检索方法。
在本发明实施例中,采用了获取数据检索请求;从所配置的检索匹配逻辑集合中,确定出与上述检索文本信息关联的至少两种目标检索匹配逻辑;按照上述目标检索匹配逻辑,提取出上述检索文本信息的文本特征,并获取与上述文本特征相匹配的文本检索结果;对上述文本检索结果进行整合,得到与上述数据检索请求对应的检索结果的方法。在上述方法中,由于在获取到了携带有检索文本信息的数据检索请求后,从配置的检索匹配逻辑集合中确定出了至少两种目标检索匹配逻辑,从而可以根据上述目标检索匹配逻辑提取出检索文本信息的文本特征,并根据文本特征进行检索,得到文本检索结果,以及对文本检索结果进行整合得到包括商标序列的检索结果。也就是说,上述方法中由于通过确定的与检索文本信息关联的目标检索匹配逻辑来确定文本特征,并对文本特征进行检索,从而可以检索出与检索文本信息相关联的多个商标信息,避免了检索结果的大量遗漏,提高了数据检索的准确性。进而解决了相关技术中存在的数据检索的准确性低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的数据检索方法的流程示意图;
图2是根据本发明实施例的一种可选的数据检索方法的示意图;
图3是根据本发明实施例的另一种可选的数据检索方法的示意图;
图4是根据本发明实施例的又一种可选的数据检索方法的示意图;
图5是根据本发明实施例的又一种可选的数据检索方法的示意图;
图6是根据本发明实施例的一种可选的数据检索装置的结构示意图;
图7是根据本发明实施例的一种可选的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种数据检索方法,可选地,作为一种可选的实施方式,如图1所示,上述数据检索方法包括:
S102,获取数据检索请求,其中,数据检索请求中携带有用于进行商标检索的检索文本信息;
S104,从所配置的检索匹配逻辑集合中,确定出与检索文本信息关联的至少两种目标检索匹配逻辑,其中,目标检索匹配逻辑用于指示使用检索文本信息进行检索时所使用的匹配条件;
S106,按照目标检索匹配逻辑,提取出检索文本信息的文本特征,并获取与文本特征相匹配的文本检索结果,其中,文本检索结果中包括按照目标检索匹配逻辑检索得到的商标图片;
S108,对文本检索结果进行整合,得到与数据检索请求对应的检索结果,其中,检索结果中包括与检索文本信息相匹配的商标序列。
可选地,上述数据检索方法可以但不限于应用于对商标进行检索的过程中。以对商标进行检索的过程为例,上述检索文本信息可以但不限于为商标名称。在获取到携带有商标名称的数据检索请求后,从配置的检索匹配逻辑集合中确定出至少两种目标检索匹配逻辑,并使用确定出的目标检索匹配逻辑确定商标名称的文本特征,以及对文本特征进行检索,得到文本检索结果。并根据文本检索结果得到携带有商标序列的检索结果。
需要说明的是,相关技术中,在对商标进行检索的过程中,检索服务器往往只能检索出与上述检索文本完全一致的商标,而遗漏与该检索文本相似的其他商标,使得检索结果出现漏检,从而导致数据检索的准确性较低。而本实施例中,由于在获取到了携带有检索文本信息的数据检索请求后,从配置的检索匹配逻辑集合中确定出了至少两种目标检索匹配逻辑,从而可以根据上述目标检索匹配逻辑提取出检索文本信息的文本特征,并根据文本特征进行检索,得到文本检索结果,以及对文本检索结果进行整合得到包括商标序列的检索结果。也就是说,上述方法中由于通过确定的与检索文本信息关联的目标检索匹配逻辑来确定文本特征,并对文本特征进行检索,从而可以检索出与检索文本信息相关联的多个商标信息,避免了检索结果的大量遗漏,提高了数据检索的准确性。
作为一种可选的实施方案,对文本检索结果进行整合,得到与数据检索请求对应的检索结果包括:
S1,利用为每种目标检索匹配逻辑所配置的权重,确定与文本检索结果中所包含的对象商标图片相匹配的整合系数,其中,整合系数用于指示对象商标图片在检索结果中的显示位置;
S2,根据整合系数对与目标检索匹配逻辑对应的文本检索结果中所包含的对象商标图片进行整合,得到商标序列。
可选地,以目标检索匹配逻辑为三种,检索文本信息为商标为例,每一种目标检索匹配逻辑对应一个权重,用于表示该目标检索匹配逻辑的重要性。在获取到数据检索请求后,获取数据检索请求中携带的商标名称,并获取三种目标检索匹配逻辑。根据三种目标检索匹配逻辑,提取出商标名称中的文本特征,并对文本特征进行检索,得到商标图片。例如,得到的商标图片有多个,则将每一个商标图片作为对象商标图片。根据权重计算每一个对象商标图片的整合系数,根据整合系数决定对象商标图片在商标序列中的位置。从而对多个对象商标图片进行排序,得到商标序列。
通过本实施例,通过利用每一种目标检索匹配逻辑的权重,确定整合系数,从而可以根据整合系数确定对象商标图片的商标序列,提高了数据检索的准确性。
作为一种可选的实施方案,利用为每种目标检索匹配逻辑所配置的权重,确定与文本检索结果中所包含的对象商标图片相匹配的整合系数包括:
S1,获取文本检索结果中所指示的对象商标图片的相似度,其中,相似度用于指示在按照目标检索匹配逻辑检索到对象商标图片的情况下,对象商标图片与检索文本信息之间的相似程度;
S2,利用为每种目标检索匹配逻辑所配置的权重,对对象商标图片的相似度进行加权求和,得到对象商标图片的整合系数。
可选地,上述整合系数可以为大于等于0的数。
可选地,任意一张对象商标图片的每一个目标检索匹配逻辑对应一个相似度。例如,以目标检索匹配逻辑为3个,检索文本信息为商标名称为例,在获取到数据检索请求之后,提取出数据检索请求中的商标名称,根据三个目标检索匹配逻辑,得到与商标名称对应的文本特征。并对文本特征进行检索,得到商标图片。商标图片中的每一个对象商标图片包含有三个相似度,每一个相似度与目标检索匹配逻辑对应。根据每一个目标检索匹配逻辑的权重与相似度,计算得到对象商标图片的整合系数。如图2所示,通过步骤S202获取到每一个目标检索匹配逻辑的权重,通过步骤S204获取到每一个目标检索匹配逻辑对应的相似度,通过步骤S206,根据上述权重对上述相似度进行加权求和计算,得到整合系数。
通过本实施例,通过获取到对象商标图片的相似度,并根据权重对相似度进行加权求和得到整合系数,从而提高了获取到整合系数的准确性,进一步提高了对数据进行检索的检索准确性。
作为一种可选的实施方案,根据整合系数对与目标检索匹配逻辑对应的文本检索结果中所包含的对象商标图片进行整合,得到商标序列包括:
S1,按照整合系数对通过至少两种目标检索匹配逻辑检索到的全部对象商标图片进行排序;
S2,获取整合系数大于第一阈值的对象商标图片,作为用于推送给客户端进行显示的商标序列。
可选地,以检索文本信息为风岚为例,如图3所示,待检索内容处显示有检索文本信息302,同时界面上还显示有检索按钮304,用于触发后进行检索,上传按钮306,用于触发后重新上传待检索内容,取消按钮308,用于触发后消除现有的待检索内容。在经过检索之后,得到三个对象商标图片,分别为凤岚,整合系数为0.8,冯蓝,整合系数为0.7,风山风,整合系数为0.5。设置第一阈值为0.6,因此,在商标序列中包含风岚和冯蓝,显示商标序列,显示结果如图3所示。
通过本实施例,通过获取整合系数大于第一阈值的对象商标图片并推送给客户端进行显示,从而提高了显示的商标序列的准确度,进一步提高了数据检索的准确度。
作为一种可选的实施方案,按照目标检索匹配逻辑,提取出检索文本信息的文本特征包括:
S1,在目标检索匹配逻辑包括部分文本匹配逻辑的情况下,对检索文本信息进行分字处理,得到用于进行检索的索引字段,作为与部分文本匹配逻辑相匹配的文本特征;
S2,在目标检索匹配逻辑包括文本读音匹配逻辑的情况下,获取与检索文本信息匹配的拼音信息;对拼音信息进行分字处理,得到用于进行检索的索引字母字段,作为与文本读音匹配逻辑相匹配的文本特征;
S3,在目标检索匹配逻辑包括文本字形匹配逻辑的情况下,通过字形识别模型识别出与检索文本信息匹配的字结构信息,其中,字形识别模型为使用样本文字进行机器训练后得到的用于识别字结构的模型;将字结构信息作为与文本字形匹配逻辑相匹配的文本特征;
S4,在目标检索匹配逻辑包括文本语种匹配逻辑的情况下,将检索文本信息按照目标语种进行文本转换,得到目标检索文本信息;对目标检索文本信息进行分字处理,得到用于进行检索的目标索引字母字段,作为与文本语种匹配逻辑相匹配的文本特征;
S5,在目标检索匹配逻辑包括文本语义匹配逻辑的情况下,通过语义分析模型分析出与检索文本信息匹配的语义信息,其中,语义分析模型为使用样本文本进行机器训练后得到的用于进行语义分析的模型;将语义信息作为与文本语义匹配逻辑相匹配的文本特征。
可选地,上述字结构信息可以但不限于包括字的偏旁、部首、笔画等。
例如,以检索文本信息为泰山源为例,如图4所示,在获取到泰山源之后,根据部分文本匹配逻辑,将泰山源进行分词,得到文本特征;或者在获取到泰山源之后,根据文本读音匹配逻辑,将泰山源的拼音信息进行分词,得到文本特征;或者在获取到泰山源之后,根据文本字形匹配逻辑,使用字形识别模型识别泰山源,得到文本特征;或者在获取到泰山源之后,根据文本语种匹配逻辑,将泰山源进行语种转换,,得到文本特征;或者在获取到泰山源之后,根据文本语义匹配逻辑,将泰山源输入到语义分析模型中,有语义分析模型得到泰山源的语义,将语义信息作为文本特征。
通过本实施例,通过按照不同的目标检索匹配逻辑获取文本特征,从而提高了获取文本特征的准确度,进一步提高了对数据进行检索的准确性。
作为一种可选的实施方案,获取与文本特征相匹配的文本检索结果包括:
S1,在目标检索匹配逻辑包括部分文本匹配逻辑的情况下,利用索引字段按照以下至少一种匹配方式获取与部分文本匹配逻辑对应的文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度;获取相似度大于第二阈值的对象商标图片,存入与部分文本匹配逻辑对应的文本检索结果中;
S2,在目标检索匹配逻辑包括文本读音匹配逻辑的情况下,利用索引字母字段按照以下至少一种匹配方式获取与文本读音匹配逻辑对应的文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度;获取相似度大于第三阈值的对象商标图片,存入与文本读音匹配逻辑对应的文本检索结果中;
S3,在目标检索匹配逻辑包括文本字形匹配逻辑的情况下,利用字结构信息按照以下至少一种匹配方式获取与文本字形匹配逻辑对应的文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度;获取相似度大于第四阈值的对象商标图片,存入与文本字形匹配逻辑对应的文本检索结果中;
S4,在目标检索匹配逻辑包括文本语种匹配逻辑的情况下,利用目标索引字母字段按照以下至少一种匹配方式获取与文本字形匹配逻辑对应的文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度;获取相似度大于第五阈值的对象商标图片,存入与文本语种匹配逻辑对应的文本检索结果中;
S5,在目标检索匹配逻辑包括文本语义匹配逻辑的情况下,利用语义信息获取数据库中的商标图片与检索文本信息之间的语义向量距离;根据语义向量距离确定与文本检索结果中的对象商标图片对应的相似度;获取相似度大于第六阈值的对象商标图片,存入与文本字形匹配逻辑对应的文本检索结果中。
例如,继续结合上述检索文本信息为泰山源的情况进行说明。如图5所示,在对泰山源进行检索获取到一个对象商标图片,对象商标图片为泰山原。则对于每一个目标检索匹配逻辑,都包含一个对应的相似度。而文本语义匹配逻辑的相似度根据语义向量距离决定,其余匹配逻辑的相似度根据完全匹配、首尾匹配、命中匹配、命中字符数匹配的权重决定。在获取到上述相似度后,将相似度大于第二阈值的对象商标图片存入到文本检索结果中。
通过本实施例,通过使用不同的匹配手段得到对应的文本检索结果,从而提高了获取文本检索结果的准确性,进一步提高了数据检索的准确性。
作为一种可选的实施方案,利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度包括:
S1,利用为每种匹配方式配置的权重,对与对象商标图片对应的对象相似度进行加权求和,得到对象商标图片的相似度,其中,对象相似度用于指示按照一种匹配方式检索到的对象商标图片与检索文本信息之间的相似程度。
可选地,继续结合上述检索文本信息为泰山源,对象商标图片为泰山原的情况进行说明。上述完全匹配、首尾匹配、命中匹配、命中字符数匹配每一种匹配手段对应一个对象相似度,而根据对象相似度与匹配方式的权重进行加权求和可以得到匹配逻辑的相似度。
通过本实施例,通过为每一种匹配方式设置对象相似度,并根据对象相似度与匹配方式的权重得到每一种目标检索匹配逻辑的相似度,从而提高了对数据进行检索的准确度。
作为一种可选的实施方案,从所配置的检索匹配逻辑集合中,确定出与检索文本信息关联的至少两种目标检索匹配逻辑包括:
S1,获取检索文本信息的属性信息;
S2,根据属性信息确定出目标检索匹配逻辑,其中,目标检索匹配逻辑包括:部分文本匹配逻辑、文本读音匹配逻辑、文本字形匹配逻辑、文本语种匹配逻辑和文本语义匹配逻辑。
可选地,上述属性信息可以但不限于为获取检索文本信息的语种、格式、拼音、语义、字形等信息,然后,根据上述信息匹配目标检索匹配逻辑。
通过本实施例,通过在获取到检索文本信息后,根据检索文本信息的属性信息确定目标检索匹配逻辑,从而提高了数据检索的准确度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述数据检索方法的数据检索装置。如图6所示,该装置包括:
(1)获取单元602,用于获取数据检索请求,其中,数据检索请求中携带有用于进行商标检索的检索文本信息;
(2)确定单元604,用于从所配置的检索匹配逻辑集合中,确定出与检索文本信息关联的至少两种目标检索匹配逻辑,其中,目标检索匹配逻辑用于指示使用检索文本信息进行检索时所使用的匹配条件;
(3)提取单元606,用于按照目标检索匹配逻辑,提取出检索文本信息的文本特征,并获取与文本特征相匹配的文本检索结果,其中,文本检索结果中包括按照目标检索匹配逻辑检索得到的商标图片;
(4)整合单元608,用于对文本检索结果进行整合,得到与数据检索请求对应的检索结果,其中,检索结果中包括与检索文本信息相匹配的商标序列。
可选地,上述数据检索装置可以但不限于应用于对商标进行检索的过程中。以对商标进行检索的过程为例,上述检索文本信息可以但不限于为商标名称。在获取到携带有商标名称的数据检索请求后,从配置的检索匹配逻辑集合中确定出至少两种目标检索匹配逻辑,并使用确定出的目标检索匹配逻辑确定商标名称的文本特征,以及对文本特征进行检索,得到文本检索结果。并根据文本检索结果得到携带有商标序列的检索结果。
需要说明的是,相关技术中,在对商标进行检索的过程中,检索服务器往往只能检索出与上述检索文本完全一致的商标,而遗漏与该检索文本相似的其他商标,使得检索结果出现漏检,从而导致数据检索的准确性较低。而本实施例中,由于在获取到了携带有检索文本信息的数据检索请求后,从配置的检索匹配逻辑集合中确定出了至少两种目标检索匹配逻辑,从而可以根据上述目标检索匹配逻辑提取出检索文本信息的文本特征,并根据文本特征进行检索,得到文本检索结果,以及对文本检索结果进行整合得到包括商标序列的检索结果。也就是说,上述方法中由于通过确定的与检索文本信息关联的目标检索匹配逻辑来确定文本特征,并对文本特征进行检索,从而可以检索出与检索文本信息相关联的多个商标信息,避免了检索结果的大量遗漏,提高了数据检索的准确性。
作为一种可选的实施方案,上述整合单元包括:
(1)第一确定模块,用于利用为每种目标检索匹配逻辑所配置的权重,确定与文本检索结果中所包含的对象商标图片相匹配的整合系数,其中,整合系数用于指示对象商标图片在检索结果中的显示位置;
(2)整合模块,用于根据整合系数对与目标检索匹配逻辑对应的文本检索结果中所包含的对象商标图片进行整合,得到商标序列。
可选地,以目标检索匹配逻辑为三种,检索文本信息为商标为例,每一种目标检索匹配逻辑对应一个权重,用于表示该目标检索匹配逻辑的重要性。在获取到数据检索请求后,获取数据检索请求中携带的商标名称,并获取三种目标检索匹配逻辑。根据三种目标检索匹配逻辑,提取出商标名称中的文本特征,并对文本特征进行检索,得到商标图片。例如,得到的商标图片有多个,则将每一个商标图片作为对象商标图片。根据权重计算每一个对象商标图片的整合系数,根据整合系数决定对象商标图片在商标序列中的位置。从而对多个对象商标图片进行排序,得到商标序列。
通过本实施例,通过利用每一种目标检索匹配逻辑的权重,确定整合系数,从而可以根据整合系数确定对象商标图片的商标序列,提高了数据检索的准确性。
作为一种可选的实施方案,上述确定模块包括:
(1)第一获取子模块,用于获取文本检索结果中所指示的对象商标图片的相似度,其中,相似度用于指示在按照目标检索匹配逻辑检索到对象商标图片的情况下,对象商标图片与检索文本信息之间的相似程度;
(2)第一加权求和子模块,用于利用为每种目标检索匹配逻辑所配置的权重,对对象商标图片的相似度进行加权求和,得到对象商标图片的整合系数。
可选地,上述整合系数可以为大于等于0的数。
可选地,任意一张对象商标图片的每一个目标检索匹配逻辑对应一个相似度。例如,以目标检索匹配逻辑为3个,检索文本信息为商标名称为例,在获取到数据检索请求之后,提取出数据检索请求中的商标名称,根据三个目标检索匹配逻辑,得到与商标名称对应的文本特征。并对文本特征进行检索,得到商标图片。商标图片中的每一个对象商标图片包含有三个相似度,每一个相似度与目标检索匹配逻辑对应。根据每一个目标检索匹配逻辑的权重与相似度,计算得到对象商标图片的整合系数。如图2所示,通过步骤S202获取到每一个目标检索匹配逻辑的权重,通过步骤S204获取到每一个目标检索匹配逻辑对应的相似度,通过步骤S206,根据上述权重对上述相似度进行加权求和计算,得到整合系数。
通过本实施例,通过获取到对象商标图片的相似度,并根据权重对相似度进行加权求和得到整合系数,从而提高了获取到整合系数的准确性,进一步提高了对数据进行检索的检索准确性。
作为一种可选的实施方案,上述整合模块包括:
(1)排序子模块,用于按照整合系数对通过至少两种目标检索匹配逻辑检索到的全部对象商标图片进行排序;
(2)第二获取子模块,用于获取整合系数大于第一阈值的对象商标图片,作为用于推送给客户端进行显示的商标序列。
可选地,以检索文本信息为风岚为例,如图3所示,待检索内容处显示有检索文本信息302,同时界面上还显示有检索按钮304,用于触发后进行检索,上传按钮306,用于触发后重新上传待检索内容,取消按钮308,用于触发后消除现有的待检索内容。在经过检索之后,得到三个对象商标图片,分别为凤岚,整合系数为0.8,冯蓝,整合系数为0.7,风山风,整合系数为0.5。设置第一阈值为0.6,因此,在商标序列中包含风岚和冯蓝,显示商标序列,显示结果如图3所示。
通过本实施例,通过获取整合系数大于第一阈值的对象商标图片并推送给客户端进行显示,从而提高了显示的商标序列的准确度,进一步提高了数据检索的准确度。
作为一种可选的实施方案,上述提取单元包括:
(1)第一处理模块,用于在目标检索匹配逻辑包括部分文本匹配逻辑的情况下,对检索文本信息进行分字处理,得到用于进行检索的索引字段,作为与部分文本匹配逻辑相匹配的文本特征;
(2)第二处理模块,用于在目标检索匹配逻辑包括文本读音匹配逻辑的情况下,获取与检索文本信息匹配的拼音信息;对拼音信息进行分字处理,得到用于进行检索的索引字母字段,作为与文本读音匹配逻辑相匹配的文本特征;
(3)识别模块,用于在目标检索匹配逻辑包括文本字形匹配逻辑的情况下,通过字形识别模型识别出与检索文本信息匹配的字结构信息,其中,字形识别模型为使用样本文字进行机器训练后得到的用于识别字结构的模型;将字结构信息作为与文本字形匹配逻辑相匹配的文本特征;
(4)第三处理模块,用于在目标检索匹配逻辑包括文本语种匹配逻辑的情况下,将检索文本信息按照目标语种进行文本转换,得到目标检索文本信息;对目标检索文本信息进行分字处理,得到用于进行检索的目标索引字母字段,作为与文本语种匹配逻辑相匹配的文本特征;
(5)分析模块,用于在目标检索匹配逻辑包括文本语义匹配逻辑的情况下,通过语义分析模型分析出与检索文本信息匹配的语义信息,其中,语义分析模型为使用样本文本进行机器训练后得到的用于进行语义分析的模型;将语义信息作为与文本语义匹配逻辑相匹配的文本特征。
可选地,上述字结构信息可以但不限于包括字的偏旁、部首、笔画等。
例如,以检索文本信息为泰山源为例,如图4所示,在获取到泰山源之后,根据部分文本匹配逻辑,将泰山源进行分词,得到文本特征;或者在获取到泰山源之后,根据文本读音匹配逻辑,将泰山源的拼音信息进行分词,得到文本特征;或者在获取到泰山源之后,根据文本字形匹配逻辑,使用字形识别模型识别泰山源,得到文本特征;或者在获取到泰山源之后,根据文本语种匹配逻辑,将泰山源进行语种转换,,得到文本特征;或者在获取到泰山源之后,根据文本语义匹配逻辑,将泰山源输入到语义分析模型中,有语义分析模型得到泰山源的语义,将语义信息作为文本特征。
通过本实施例,通过按照不同的目标检索匹配逻辑获取文本特征,从而提高了获取文本特征的准确度,进一步提高了对数据进行检索的准确性。
作为一种可选的实施方案,上述获取单元包括:
(1)第一获取模块,用于在目标检索匹配逻辑包括部分文本匹配逻辑的情况下,利用索引字段按照以下至少一种匹配方式获取与部分文本匹配逻辑对应的文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;第二确定模块,用于利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度;第二获取模块,用于获取相似度大于第二阈值的对象商标图片,存入与部分文本匹配逻辑对应的文本检索结果中;
(2)第三获取模块,用于在目标检索匹配逻辑包括文本读音匹配逻辑的情况下,利用索引字母字段按照以下至少一种匹配方式获取与文本读音匹配逻辑对应的文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;第二确定模块,用于利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度;第四获取模块,用于获取相似度大于第三阈值的对象商标图片,存入与文本读音匹配逻辑对应的文本检索结果中;
(3)第五获取模块,用于在目标检索匹配逻辑包括文本字形匹配逻辑的情况下,利用字结构信息按照以下至少一种匹配方式获取与文本字形匹配逻辑对应的文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;第二确定模块,用于利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度;第六获取模块,用于获取相似度大于第四阈值的对象商标图片,存入与文本字形匹配逻辑对应的文本检索结果中;
(4)第七获取模块,用于在目标检索匹配逻辑包括文本语种匹配逻辑的情况下,利用目标索引字母字段按照以下至少一种匹配方式获取与文本字形匹配逻辑对应的文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;第二确定模块,用于利用为每种匹配方式配置的权重,确定与文本检索结果中的对象商标图片对应的相似度;第八获取模块,用于获取相似度大于第五阈值的对象商标图片,存入与文本语种匹配逻辑对应的文本检索结果中;
(5)第九获取模块,用于在目标检索匹配逻辑包括文本语义匹配逻辑的情况下,利用语义信息获取数据库中的商标图片与检索文本信息之间的语义向量距离;第三确定模块,用于根据语义向量距离确定与文本检索结果中的对象商标图片对应的相似度;第十获取模块,用于获取相似度大于第六阈值的对象商标图片,存入与文本字形匹配逻辑对应的文本检索结果中。
例如,继续结合上述检索文本信息为泰山源的情况进行说明。如图5所示,在对泰山源进行检索获取到一个对象商标图片,对象商标图片为泰山原。则对于每一个目标检索匹配逻辑,都包含一个对应的相似度。而文本语义匹配逻辑的相似度根据语义向量距离决定,其余匹配逻辑的相似度根据完全匹配、首尾匹配、命中匹配、命中字符数匹配的权重决定。在获取到上述相似度后,将相似度大于第二阈值的对象商标图片存入到文本检索结果中。
通过本实施例,通过使用不同的匹配手段得到对应的文本检索结果,从而提高了获取文本检索结果的准确性,进一步提高了数据检索的准确性。
作为一种可选的实施方案,上述第二确定模块包括:
(1)第二加权求和子模块,用于利用为每种匹配方式配置的权重,对与对象商标图片对应的对象相似度进行加权求和,得到对象商标图片的相似度,其中,对象相似度用于指示按照一种匹配方式检索到的对象商标图片与检索文本信息之间的相似程度。
可选地,继续结合上述检索文本信息为泰山源,对象商标图片为泰山原的情况进行说明。上述完全匹配、首尾匹配、命中匹配、命中字符数匹配每一种匹配手段对应一个对象相似度,而根据对象相似度与匹配方式的权重进行加权求和可以得到匹配逻辑的相似度。
通过本实施例,通过为每一种匹配方式设置对象相似度,并根据对象相似度与匹配方式的权重得到每一种目标检索匹配逻辑的相似度,从而提高了对数据进行检索的准确度。
作为一种可选的实施方案,上述确定单元包括:
(1)第十一获取模块,用于获取检索文本信息的属性信息;
(2)第四确定模块,用于根据属性信息确定出目标检索匹配逻辑,其中,目标检索匹配逻辑包括:部分文本匹配逻辑、文本读音匹配逻辑、文本字形匹配逻辑、文本语种匹配逻辑和文本语义匹配逻辑。
可选地,上述属性信息可以但不限于为获取检索文本信息的语种、格式、拼音、语义、字形等信息,然后,根据上述信息匹配目标检索匹配逻辑。
通过本实施例,通过在获取到检索文本信息后,根据检索文本信息的属性信息确定目标检索匹配逻辑,从而提高了数据检索的准确度。
根据本发明实施例的又一个方面,还提供了一种用于实施上述数据检索方法的电子装置,如图7所示,该电子装置包括存储器702和处理器704,该存储器702中存储有计算机程序,该处理器704被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取数据检索请求,其中,数据检索请求中携带有用于进行商标检索的检索文本信息;
S2,从所配置的检索匹配逻辑集合中,确定出与检索文本信息关联的至少两种目标检索匹配逻辑,其中,目标检索匹配逻辑用于指示使用检索文本信息进行检索时所使用的匹配条件;
S2,按照目标检索匹配逻辑,提取出检索文本信息的文本特征,并获取与文本特征相匹配的文本检索结果,其中,文本检索结果中包括按照目标检索匹配逻辑检索得到的商标图片;
S4,对文本检索结果进行整合,得到与数据检索请求对应的检索结果,其中,检索结果中包括与检索文本信息相匹配的商标序列。
可选地,本领域普通技术人员可以理解,图7所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图7其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图7中所示更多或者更少的组件(如网络接口等),或者具有与图7所示不同的配置。
其中,存储器702可用于存储软件程序以及模块,如本发明实施例中的数据检索方法和装置对应的程序指令/模块,处理器704通过运行存储在存储器702内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的数据检索方法。存储器702可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器702可进一步包括相对于处理器704远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器702具体可以但不限于用于存储检索文本信息与商标序列等信息。作为一种示例,如图7所示,上述存储器702中可以但不限于包括上述数据检索装置中的获取单元602、确定单元604、提取单元606及整合单元608。此外,还可以包括但不限于上述数据检索装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置706用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置706包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置706为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还包括:显示器708,用于显示商标序列;和连接总线710,用于连接上述电子装置中的各个模块部件。
根据本发明的实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取数据检索请求,其中,数据检索请求中携带有用于进行商标检索的检索文本信息;
S2,从所配置的检索匹配逻辑集合中,确定出与检索文本信息关联的至少两种目标检索匹配逻辑,其中,目标检索匹配逻辑用于指示使用检索文本信息进行检索时所使用的匹配条件;
S2,按照目标检索匹配逻辑,提取出检索文本信息的文本特征,并获取与文本特征相匹配的文本检索结果,其中,文本检索结果中包括按照目标检索匹配逻辑检索得到的商标图片;
S4,对文本检索结果进行整合,得到与数据检索请求对应的检索结果,其中,检索结果中包括与检索文本信息相匹配的商标序列。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (14)
1.一种数据检索方法,其特征在于,包括:
获取数据检索请求,其中,所述数据检索请求中携带有用于进行商标检索的检索文本信息;
从所配置的检索匹配逻辑集合中,确定出与所述检索文本信息关联的至少两种目标检索匹配逻辑,其中,所述目标检索匹配逻辑用于指示使用所述检索文本信息进行检索时所使用的匹配条件;
按照所述目标检索匹配逻辑,提取出所述检索文本信息的文本特征,并获取与所述文本特征相匹配的文本检索结果,其中,所述文本检索结果中包括按照所述目标检索匹配逻辑检索得到的商标图片;
对所述文本检索结果进行整合,得到与所述数据检索请求对应的检索结果,其中,所述检索结果中包括与所述检索文本信息相匹配的商标序列;
所述按照所述目标检索匹配逻辑,提取出所述检索文本信息的文本特征包括:在所述目标检索匹配逻辑包括部分文本匹配逻辑的情况下,对所述检索文本信息进行分字处理,得到用于进行检索的索引字段,作为与所述部分文本匹配逻辑相匹配的所述文本特征;在所述目标检索匹配逻辑包括文本读音匹配逻辑的情况下,获取与所述检索文本信息匹配的拼音信息;对所述拼音信息进行分字处理,得到用于进行检索的索引字母字段,作为与所述文本读音匹配逻辑相匹配的所述文本特征;在所述目标检索匹配逻辑包括文本字形匹配逻辑的情况下,通过字形识别模型识别出与所述检索文本信息匹配的字结构信息,其中,所述字形识别模型为使用样本文字进行机器训练后得到的用于识别字结构的模型;将所述字结构信息作为与所述文本字形匹配逻辑相匹配的所述文本特征;在所述目标检索匹配逻辑包括文本语种匹配逻辑的情况下,将所述检索文本信息按照目标语种进行文本转换,得到目标检索文本信息;对所述目标检索文本信息进行分字处理,得到用于进行检索的目标索引字母字段,作为与所述文本语种匹配逻辑相匹配的所述文本特征;在所述目标检索匹配逻辑包括文本语义匹配逻辑的情况下,通过语义分析模型分析出与所述检索文本信息匹配的语义信息,其中,所述语义分析模型为使用样本文本进行机器训练后得到的用于进行语义分析的模型;将所述语义信息作为与所述文本语义匹配逻辑相匹配的所述文本特征;
获取与所述文本特征相匹配的文本检索结果包括:在所述目标检索匹配逻辑包括部分文本匹配逻辑的情况下,利用所述索引字段按照以下至少一种匹配方式获取与所述部分文本匹配逻辑对应的所述文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度;获取所述相似度大于第二阈值的所述对象商标图片,存入与所述部分文本匹配逻辑对应的所述文本检索结果中;在所述目标检索匹配逻辑包括文本读音匹配逻辑的情况下,利用所述索引字母字段按照以下至少一种匹配方式获取与所述文本读音匹配逻辑对应的所述文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度;获取所述相似度大于第三阈值的所述对象商标图片,存入与所述文本读音匹配逻辑对应的所述文本检索结果中;在所述目标检索匹配逻辑包括文本字形匹配逻辑的情况下,利用所述字结构信息按照以下至少一种匹配方式获取与所述文本字形匹配逻辑对应的所述文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度;获取所述相似度大于第四阈值的所述对象商标图片,存入与所述文本字形匹配逻辑对应的所述文本检索结果中;在所述目标检索匹配逻辑包括文本语种匹配逻辑的情况下,利用所述目标索引字母字段按照以下至少一种匹配方式获取与所述文本字形匹配逻辑对应的所述文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度;获取所述相似度大于第五阈值的所述对象商标图片,存入与所述文本语种匹配逻辑对应的所述文本检索结果中;在所述目标检索匹配逻辑包括文本语义匹配逻辑的情况下,利用所述语义信息获取数据库中的商标图片与所述检索文本信息之间的语义向量距离;根据所述语义向量距离确定与所述文本检索结果中的对象商标图片对应的相似度;获取所述相似度大于第六阈值的所述对象商标图片,存入与所述文本字形匹配逻辑对应的所述文本检索结果中。
2.根据权利要求1所述的方法,其特征在于,所述对所述文本检索结果进行整合,得到与所述数据检索请求对应的检索结果包括:
利用为每种所述目标检索匹配逻辑所配置的权重,确定与所述文本检索结果中所包含的对象商标图片相匹配的整合系数,其中,所述整合系数用于指示所述对象商标图片在所述检索结果中的显示位置;
根据所述整合系数对与所述目标检索匹配逻辑对应的所述文本检索结果中所包含的对象商标图片进行整合,得到所述商标序列。
3.根据权利要求2所述的方法,其特征在于,所述利用为每种所述目标检索匹配逻辑所配置的权重,确定与所述文本检索结果中所包含的对象商标图片相匹配的整合系数包括:
获取所述文本检索结果中所指示的所述对象商标图片的相似度,其中,所述相似度用于指示在按照所述目标检索匹配逻辑检索到所述对象商标图片的情况下,所述对象商标图片与所述检索文本信息之间的相似程度;
利用为每种所述目标检索匹配逻辑所配置的权重,对所述对象商标图片的相似度进行加权求和,得到所述对象商标图片的所述整合系数。
4.根据权利要求2所述的方法,其特征在于,所述根据所述整合系数对与所述目标检索匹配逻辑对应的所述文本检索结果中所包含的对象商标图片进行整合,得到所述商标序列包括:
按照所述整合系数对通过至少两种所述目标检索匹配逻辑检索到的全部对象商标图片进行排序;
获取所述整合系数大于第一阈值的所述对象商标图片,作为用于推送给客户端进行显示的所述商标序列。
5.根据权利要求1所述的方法,其特征在于,所述利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度包括:
利用为每种所述匹配方式配置的权重,对与所述对象商标图片对应的对象相似度进行加权求和,得到与所述文本检索结果中的所述对象商标图片对应的所述相似度,其中,所述对象相似度用于指示按照一种所述匹配方式检索到的所述对象商标图片与所述检索文本信息之间的相似程度。
6.根据权利要求1所述的方法,其特征在于,所述从所配置的检索匹配逻辑集合中,确定出与所述检索文本信息关联的至少两种目标检索匹配逻辑包括:
获取所述检索文本信息的属性信息;
根据所述属性信息确定出所述目标检索匹配逻辑,其中,所述目标检索匹配逻辑包括:部分文本匹配逻辑、文本读音匹配逻辑、文本字形匹配逻辑、文本语种匹配逻辑和文本语义匹配逻辑。
7.一种数据检索装置,其特征在于,包括:
获取单元,用于获取数据检索请求,其中,所述数据检索请求中携带有用于进行商标检索的检索文本信息;
确定单元,用于从所配置的检索匹配逻辑集合中,确定出与所述检索文本信息关联的至少两种目标检索匹配逻辑,其中,所述目标检索匹配逻辑用于指示使用所述检索文本信息进行检索时所使用的匹配条件;
提取单元,用于按照所述目标检索匹配逻辑,提取出所述检索文本信息的文本特征,并获取与所述文本特征相匹配的文本检索结果,其中,所述文本检索结果中包括按照所述目标检索匹配逻辑检索得到的商标图片;
整合单元,用于对所述文本检索结果进行整合,得到与所述数据检索请求对应的检索结果,其中,所述检索结果中包括与所述检索文本信息相匹配的商标序列;
所述提取单元包括:第一处理模块,用于在所述目标检索匹配逻辑包括部分文本匹配逻辑的情况下,对所述检索文本信息进行分字处理,得到用于进行检索的索引字段,作为与所述部分文本匹配逻辑相匹配的所述文本特征;第二处理模块,用于在所述目标检索匹配逻辑包括文本读音匹配逻辑的情况下,获取与所述检索文本信息匹配的拼音信息;对所述拼音信息进行分字处理,得到用于进行检索的索引字母字段,作为与所述文本读音匹配逻辑相匹配的所述文本特征;识别模块,用于在所述目标检索匹配逻辑包括文本字形匹配逻辑的情况下,通过字形识别模型识别出与所述检索文本信息匹配的字结构信息,其中,所述字形识别模型为使用样本文字进行机器训练后得到的用于识别字结构的模型;将所述字结构信息作为与所述文本字形匹配逻辑相匹配的所述文本特征;第三处理模块,用于在所述目标检索匹配逻辑包括文本语种匹配逻辑的情况下,将所述检索文本信息按照目标语种进行文本转换,得到目标检索文本信息;对所述目标检索文本信息进行分字处理,得到用于进行检索的目标索引字母字段,作为与所述文本语种匹配逻辑相匹配的所述文本特征;分析模块,用于在所述目标检索匹配逻辑包括文本语义匹配逻辑的情况下,通过语义分析模型分析出与所述检索文本信息匹配的语义信息,其中,所述语义分析模型为使用样本文本进行机器训练后得到的用于进行语义分析的模型;将所述语义信息作为与所述文本语义匹配逻辑相匹配的所述文本特征;
所述获取单元包括:第一获取模块, 用于在所述目标检索匹配逻辑包括部分文本匹配逻辑的情况下,利用所述索引字段按照以下至少一种匹配方式获取与所述部分文本匹配逻辑对应的所述文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;第二确定模块,用于利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度;第二获取模块,用于获取所述相似度大于第二阈值的所述对象商标图片,存入与所述部分文本匹配逻辑对应的所述文本检索结果中;第三获取模块, 用于在所述目标检索匹配逻辑包括文本读音匹配逻辑的情况下,利用所述索引字母字段按照以下至少一种匹配方式获取与所述文本读音匹配逻辑对应的所述文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;第二确定模块,用于利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度;第四获取模块, 用于获取所述相似度大于第三阈值的所述对象商标图片,存入与所述文本读音匹配逻辑对应的所述文本检索结果中;第五获取模块, 用于在所述目标检索匹配逻辑包括文本字形匹配逻辑的情况下,利用所述字结构信息按照以下至少一种匹配方式获取与所述文本字形匹配逻辑对应的所述文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;第二确定模块,用于利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度;第六获取模块, 用于获取所述相似度大于第四阈值的所述对象商标图片,存入与所述文本字形匹配逻辑对应的所述文本检索结果中;第七获取模块, 用于在所述目标检索匹配逻辑包括文本语种匹配逻辑的情况下,利用所述目标索引字母字段按照以下至少一种匹配方式获取与所述文本字形匹配逻辑对应的所述文本检索结果:完全匹配、首尾匹配、命中匹配、命中字符数匹配;第二确定模块,用于利用为每种所述匹配方式配置的权重,确定与所述文本检索结果中的对象商标图片对应的相似度;第八获取模块, 用于获取所述相似度大于第五阈值的所述对象商标图片,存入与所述文本语种匹配逻辑对应的所述文本检索结果中;
第九获取模块, 用于在所述目标检索匹配逻辑包括文本语义匹配逻辑的情况下,利用所述语义信息获取数据库中的商标图片与所述检索文本信息之间的语义向量距离;第三确定模块,用于根据所述语义向量距离确定与所述文本检索结果中的对象商标图片对应的相似度;第十获取模块,用于获取所述相似度大于第六阈值的所述对象商标图片,存入与所述文本字形匹配逻辑对应的所述文本检索结果中。
8.根据权利要求7所述的装置,其特征在于,所述整合单元包括:
第一确定模块,用于利用为每种所述目标检索匹配逻辑所配置的权重,确定与所述文本检索结果中所包含的对象商标图片相匹配的整合系数,其中,所述整合系数用于指示所述对象商标图片在所述检索结果中的显示位置;
整合模块,用于根据所述整合系数对与所述目标检索匹配逻辑对应的所述文本检索结果中所包含的对象商标图片进行整合,得到所述商标序列。
9.根据权利要求8所述的装置,其特征在于,所述确定模块包括:
第一获取子模块,用于获取所述文本检索结果中所指示的所述对象商标图片的相似度,其中,所述相似度用于指示在按照所述目标检索匹配逻辑检索到所述对象商标图片的情况下,所述对象商标图片与所述检索文本信息之间的相似程度;
第一加权求和子模块,用于利用为每种所述目标检索匹配逻辑所配置的权重,对所述对象商标图片的相似度进行加权求和,得到所述对象商标图片的所述整合系数。
10.根据权利要求9所述的装置,其特征在于,所述整合模块包括:
排序子模块,用于按照所述整合系数对通过至少两种所述目标检索匹配逻辑检索到的全部对象商标图片进行排序;
第二获取子模块,用于获取所述整合系数大于第一阈值的所述对象商标图片,作为用于推送给客户端进行显示的所述商标序列。
11.根据权利要求7所述的装置,其特征在于,所述第二确定模块包括:
第二加权求和子模块,用于利用为每种所述匹配方式配置的权重,对与所述对象商标图片对应的对象相似度进行加权求和,得到与所述文本检索结果中的所述对象商标图片对应的所述相似度,其中,所述对象相似度用于指示按照一种所述匹配方式检索到的所述对象商标图片与所述检索文本信息之间的相似程度。
12.根据权利要求7所述的装置,其特征在于,所述确定单元包括:
第十一获取模块,用于获取所述检索文本信息的属性信息;
第四确定模块,用于根据所述属性信息确定出所述目标检索匹配逻辑,其中,所述目标检索匹配逻辑包括:部分文本匹配逻辑、文本读音匹配逻辑、文本字形匹配逻辑、文本语种匹配逻辑和文本语义匹配逻辑。
13.一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至6任一项中所述的方法。
14.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811068831.7A CN110895555B (zh) | 2018-09-13 | 2018-09-13 | 数据检索方法和装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811068831.7A CN110895555B (zh) | 2018-09-13 | 2018-09-13 | 数据检索方法和装置、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110895555A CN110895555A (zh) | 2020-03-20 |
CN110895555B true CN110895555B (zh) | 2022-06-14 |
Family
ID=69785454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811068831.7A Active CN110895555B (zh) | 2018-09-13 | 2018-09-13 | 数据检索方法和装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110895555B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112767925B (zh) * | 2020-12-24 | 2023-02-17 | 贝壳技术有限公司 | 语音信息识别方法及装置 |
CN112766269B (zh) * | 2021-03-04 | 2024-03-12 | 深圳康佳电子科技有限公司 | 一种图片文本检索方法、智能终端及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102542000A (zh) * | 2011-12-07 | 2012-07-04 | 北京风灵创景科技有限公司 | 一种联系人检索的方法及其设备 |
CN104219362A (zh) * | 2013-05-30 | 2014-12-17 | 腾讯科技(深圳)有限公司 | 搜索联系人的方法和装置 |
CN104809142B (zh) * | 2014-01-29 | 2018-03-23 | 北京瑞天科技有限公司 | 商标查询系统和方法 |
CN104021229B (zh) * | 2014-06-25 | 2017-07-25 | 厦门大学 | 一种用于商标图像检索的形状表示与匹配方法 |
US10467256B2 (en) * | 2015-08-04 | 2019-11-05 | Google Llc | Automatic query pattern generation |
CN105426530B (zh) * | 2015-12-15 | 2017-05-10 | 徐庆 | 一种商标检索方法、装置和系统 |
CN106777177A (zh) * | 2016-12-22 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 检索方法和装置 |
CN106649851A (zh) * | 2016-12-30 | 2017-05-10 | 徐庆 | 近似商标查询结果排序方法、装置及其商标服务器 |
-
2018
- 2018-09-13 CN CN201811068831.7A patent/CN110895555B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110895555A (zh) | 2020-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112199375B (zh) | 跨模态的数据处理方法、装置、存储介质以及电子装置 | |
CN108920457B (zh) | 地址识别方法和装置及存储介质 | |
CN109086394B (zh) | 搜索排序方法、装置、计算机设备和存储介质 | |
CN108681390B (zh) | 信息交互方法和装置、存储介质及电子装置 | |
CN110149551B (zh) | 媒体文件播放方法和装置、存储介质及电子装置 | |
CN111460327B (zh) | 兴趣地搜索方法及装置、存储介质、计算机设备 | |
CN112328823A (zh) | 多标签分类模型的训练方法、装置、电子设备及存储介质 | |
CN112199526B (zh) | 一种多媒体内容发布的方法、装置、电子设备及存储介质 | |
CN111552767A (zh) | 搜索方法、搜索装置以及计算机设备 | |
CN110895555B (zh) | 数据检索方法和装置、存储介质及电子装置 | |
CN111782841A (zh) | 图像搜索方法、装置、设备和计算机可读介质 | |
CN110889045A (zh) | 标签分析方法、装置及计算机可读存储介质 | |
CN112883235A (zh) | 视频内容的搜索方法、装置、计算机设备及存储介质 | |
CN110968664A (zh) | 一种文书检索方法、装置、设备及介质 | |
CN111126457A (zh) | 信息的获取方法和装置、存储介质和电子装置 | |
CN114168768A (zh) | 图像检索方法及相关设备 | |
CN110929057A (zh) | 图像处理方法、装置和系统、存储介质及电子装置 | |
CN107679055B (zh) | 信息检索方法、服务器及可读存储介质 | |
CN112749258A (zh) | 数据搜索的方法和装置、电子设备和存储介质 | |
CN112417210A (zh) | 健身视频的查询方法、装置、终端和存储介质 | |
CN112434173A (zh) | 搜索内容输出方法、装置、计算机设备及可读存储介质 | |
CN109376581B (zh) | 对象关系识别方法和装置、存储介质及电子装置 | |
CN111753197A (zh) | 新闻要素的提取方法、装置、计算机设备和存储介质 | |
CN115759293A (zh) | 模型训练方法、图像检索方法、装置及电子设备 | |
CN111008304B (zh) | 关键词的生成方法和装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210119 Address after: 17c, 14 / F, unit 3, building 3, No.48, Zhichun Road, Haidian District, Beijing 100098 Applicant after: Beijing Blue lantern fish Intelligent Technology Co.,Ltd. Address before: 1411 Junyue Pavilion, 9 Yannan Road, Fuqiang community, Huaqiangbei street, Futian District, Shenzhen, Guangdong 518031 Applicant before: Shenzhen Blue Lantern Fish Intelligent Technology Co.,Ltd. |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |