CN111782942B - 基于品牌保护的搜索方法及装置 - Google Patents

基于品牌保护的搜索方法及装置 Download PDF

Info

Publication number
CN111782942B
CN111782942B CN202010589314.5A CN202010589314A CN111782942B CN 111782942 B CN111782942 B CN 111782942B CN 202010589314 A CN202010589314 A CN 202010589314A CN 111782942 B CN111782942 B CN 111782942B
Authority
CN
China
Prior art keywords
brand
service carrier
search
search results
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010589314.5A
Other languages
English (en)
Other versions
CN111782942A (zh
Inventor
王俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010589314.5A priority Critical patent/CN111782942B/zh
Publication of CN111782942A publication Critical patent/CN111782942A/zh
Application granted granted Critical
Publication of CN111782942B publication Critical patent/CN111782942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供了一种基于品牌保护的搜索方法及装置。在搜索方法中,获取用于搜索服务载体的查询语句,使用查询语句进行语义扩展搜索来得到第一搜索结果集,对查询语句进行品牌保护识别以确定针对当前搜索是否需要品牌保护,在确定需要品牌保护且需要保护的品牌是第一品牌时,从品牌知识图谱中查询第一品牌的关联服务载体,所述关联服务载体包括竞品服务载体,从第一搜索结果集中过滤与竞品服务载体匹配的搜索结果,得到第二搜索结果集,以及输出第二搜索结果集。

Description

基于品牌保护的搜索方法及装置
技术领域
本说明书实施例涉及信息搜索领域,具体地,涉及基于品牌保护的搜索方法及装置。
背景技术
搜索引擎是互联网时代下最常用的工具之一,搜索引擎可以帮助用户获取到自己想了解的信息。用户只需提供关键词、查询语句等查询信息便能获得相关的搜索结果信息。
搜索引擎可以采用包括垂直搜索、广域搜索等多种搜索方式,搜索引擎还可以针对特定领域或特定内容进行搜索。例如,针对特定领域的搜索会将搜素范围限定在该特定领域中,从而得到的搜索结果都属于特定领域的信息。
无论采用哪一种搜索方式,在进行搜索时,为了丰富搜索结果,除了搜索与提供的查询信息紧密相关的搜索结果信息以外,还会搜索若干查询信息的其他关联信息,并将这些其他关联信息作为搜索结果反馈给用户。比如,搜索一个品牌时,除了反馈该品牌的相关信息以外,还会反馈与该品牌关联的其他品牌的相关信息,从而为用户提供更丰富的搜索结果。
发明内容
鉴于上述,本说明书实施例提供了一种基于品牌保护的搜索方法及装置。在该搜索方法中,使用查询语句进行语义扩展搜索来得到第一搜索结果集,并且对查询语句进行品牌保护识别以确定是否需要进行品牌保护,在确定需要进行品牌保护时,从品牌知识图谱中查询竞品服务载体,并从第一搜索结果集中过滤与竞品服务载体匹配的搜索结果并输出过滤后的第一搜索结果集,从而使得所输出的搜索结果中不包含与竞品服务载体匹配的搜索结果。利用该搜索方法,可以在使用语义扩展搜索得到扩展搜索结果的情况下,避免呈现竞品的服务载体,从而实现品牌保护。
根据本说明书实施例的一个方面,提供了一种基于品牌保护的搜索方法,包括:获取用于搜索服务载体的查询语句,所述查询语句包括用于表征服务载体归属的第一语句要素;使用所述查询语句进行语义扩展搜索来得到第一搜索结果集;对所述查询语句进行品牌保护识别,以确定针对当前查询是否需要品牌保护;在确定需要品牌保护且需要保护的品牌是第一品牌时,从品牌知识图谱中查询所述第一品牌的关联服务载体,所述关联服务载体包括竞品服务载体,其中,所述品牌知识图谱包括节点和边,所述节点包括品牌节点和服务载体节点,所述边用于表征所连接的两个节点之间的关联关系;从所述第一搜索结果集中过滤与所述竞品服务载体匹配的搜索结果,得到第二搜索结果集;以及输出所述第二搜索结果集。
可选地,在上述方面的一个示例中,所述语义扩展包括针对所述第一语句要素的语义扩展。
可选地,在上述方面的一个示例中,所述查询语句包括用于表征服务载体的第二语句要素,所述语义扩展还包括针对所述第二语句要素的语义扩展。
可选地,在上述方面的一个示例中,所述关联服务载体还包括品牌相关服务载体,所述搜索方法还包括:从所述第二搜索结果集中获取与所述品牌相关服务载体匹配的搜索结果,得到第三搜索结果集;以及输出所述第二搜索结果集包括:输出所述第三搜索结果集。
可选地,在上述方面的一个示例中,所述关联服务载体还包括品牌相关服务载体,所述搜索方法还包括:根据所述品牌相关服务载体,对所述第二搜索结果集中的搜索结果进行混序处理。
可选地,在上述方面的一个示例中,根据所述品牌相关服务载体,对所述第二搜索结果集中的各个搜索结果进行混序处理包括:根据所述第二搜索结果集中的搜索结果与所述第一品牌的品牌相关性,确定该搜索结果的混序处理参数;以及根据所述品牌相关服务载体以及搜索结果的混序处理参数,对所述第二搜索结果集中的搜索结果进行混序处理。
可选地,在上述方面的一个示例中,所述品牌相关服务载体包括:与所述第一品牌相关的第一品牌相关服务载体,与第二品牌相关的第二品牌相关服务载体以及与第三品牌相关的第三品牌相关服务载体,所述第二品牌是所述第一品牌的关联品牌,以及所述第三品牌是所述第一品牌的友商品牌,与所述第一品牌相关服务载体匹配的搜索结果的混序处理参数优于与所述第二品牌相关服务载体匹配的搜索结果的混序处理参数,与所述第二品牌相关服务载体匹配的搜索结果的混序处理参数由于与所述第三品牌相关服务载体匹配的搜索结果的混序处理参数,以及与第三品牌相关服务载体匹配的搜索结果的混序处理参数优于不与相关服务载体匹配的搜索结果的混序处理参数。
可选地,在上述方面的一个示例中,根据所述品牌相关服务载体,对所述第二搜索结果集中的搜索结果进行混序处理包括:对所述第二搜索结果集中的与所述品牌相关服务载体匹配的搜索结果进行提序处理,和/或,对所述第二搜索结果集中的与所述品牌相关服务载体不匹配的搜索结果进行降序处理。
可选地,在上述方面的一个示例中,对所述查询语句进行品牌保护识别,以确定针对当前查询是否需要品牌保护包括:利用品牌库来对所述查询语句进行文本相似度识别,以确定是否需要品牌保护,其中,所述品牌库包括各个品牌对应的品牌词和/或品牌匹配词。
可选地,在上述方面的一个示例中,所述品牌知识图谱还包括行业节点和/或主体节点。
可选地,在上述方面的一个示例中,所述品牌知识图谱通过以下方式中的至少一种方式来进行学习更新:数据算法挖掘;品牌认证;品牌标注;和爬虫抓取品牌关系。
根据本说明书实施例的另一方面,还提供一种基于品牌保护的搜索装置,包括:查询语句获取单元,获取用于搜索服务载体的查询语句,所述查询语句包括用于表征服务载体归属的第一语句要素;语义扩展搜索单元,使用所述查询语句进行语义扩展搜索来得到第一搜索结果集;品牌保护识别单元,对所述查询语句进行品牌保护识别,以确定针对当前查询是否需要品牌保护;关联服务载体查询单元,在确定需要品牌保护且需要保护的品牌是第一品牌时,从品牌知识图谱中查询所述第一品牌的关联服务载体,所述关联服务载体包括竞品服务载体,其中,所述品牌知识图谱包括节点和边,所述节点包括品牌节点和服务载体节点,所述边用于表征所连接的两个节点之间的关联关系;搜索结果处理单元,从所述第一搜索结果集中过滤与所述竞品服务载体匹配的搜索结果,得到第二搜索结果集;以及搜索结果输出单元,输出所述第二搜索结果集。
可选地,在上述方面的一个示例中,所述语义扩展包括针对所述第一语句要素的语义扩展。
可选地,在上述方面的一个示例中,所述查询语句包括用于表征服务载体的第二语句要素,所述语义扩展还包括针对所述第二语句要素的语义扩展。
可选地,在上述方面的一个示例中,所述关联服务载体还包括品牌相关服务载体,所述搜索结果处理单元进一步从所述第二搜索结果集中获取与所述品牌相关服务载体匹配的搜索结果,得到第三搜索结果集。以及所述搜索结果输出单元输出所述第三搜索结果集。
可选地,在上述方面的一个示例中,所述关联服务载体还包括品牌相关服务载体,所述搜索结果处理单元进一步根据所述品牌相关服务载体,对所述第二搜索结果集中的搜索结果进行混序处理。
可选地,在上述方面的一个示例中,所述搜索结果处理单元:根据所述第二搜索结果集中的搜索结果与所述第一品牌的品牌相关性,确定该搜索结果的混序处理参数;以及根据所述品牌相关服务载体以及搜索结果的混序处理参数,对所述第二搜索结果集中的搜索结果进行混序处理。
可选地,在上述方面的一个示例中,所述品牌相关服务载体包括:与所述第一品牌相关的第一品牌相关服务载体,与第二品牌相关的第二品牌相关服务载体以及与第三品牌相关的第三品牌相关服务载体,所述第二品牌是所述第一品牌的关联品牌,以及所述第三品牌是所述第一品牌的友商品牌,与所述第一品牌相关服务载体匹配的搜索结果的混序处理参数优于与所述第二品牌相关服务载体匹配的搜索结果的混序处理参数,与所述第二品牌相关服务载体匹配的搜索结果的混序处理参数优于与所述第三品牌相关服务载体匹配的搜索结果的混序处理参数,以及与第三品牌相关服务载体匹配的搜索结果的混序处理参数优于不与相关服务载体匹配的搜索结果的混序处理参数。
可选地,在上述方面的一个示例中,所述搜索结果处理单元:对所述第二搜索结果集中的与所述品牌相关服务载体匹配的搜索结果进行提序处理,和/或,对所述第二搜索结果集中的与所述品牌相关服务载体不匹配的搜索结果进行降序处理。
可选地,在上述方面的一个示例中,所述品牌保护识别单元利用品牌库来对所述查询语句进行文本相似度识别,以确定是否需要品牌保护,其中,所述品牌库包括各个品牌对应的品牌词和/或品牌匹配词。
根据本说明书实施例的另一方面,还提供一种电子设备,包括:至少一个处理器;以及存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的基于品牌保护的搜索方法。
根据本说明书实施例的另一方面,还提供一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的基于品牌保护的搜索方法。
附图说明
通过参照下面的附图,可以实现对于本说明书内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。
图1示出了根据本说明书实施例的品牌知识图谱的一个示例的示意图。
图2示出了根据本说明书实施例的品牌知识图谱的另一个示例的示意图。
图3示出了根据本说明书实施例的基于品牌保护的搜索方法的一个示例的流程图。
图4示出了根据本说明书实施例的第二搜索结果集经过混序处理后得到的搜索结果序列的一个示例的示意图。
图5示出了根据本说明书实施例的第二搜索结果集经过混序处理后得到的搜索结果序列的另一个示例的示意图。
图6示出了根据本说明书实施例的第二搜索结果集经过混序处理后得到的搜索结果序列的另一个示例的示意图。
图7示出了根据本说明书实施例的基于品牌保护的搜索装置的一个示例的方框图。
图8示出了根据本说明书实施例的用于实现基于品牌保护的搜索方法的电子设备的方框图。
具体实施方式
以下将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
在本说明书中,术语“服务载体”可以是指能够为用户提供业务服务(例如,网络服务)的载体。服务载体例如可以采用应用程序的形式来呈现。服务载体的示例可以包括但不限于小程序、公众号、应用中心的应用等。不同的服务载体可以提供不同的业务服务功能。例如,小程序可以实现应用所具有的查看、下单、购买等相关功能,公众号可以提供相关的资讯信息。
服务载体可以由业务提供方创建。每个业务提供方可以创建多个不同的服务载体。比如,业务提供方“中通公司”可以创建中通小程序、中通公众号、中通官网等。此外,针对同一类型的服务载体,业务提供方也可以创建多个服务载体。例如,针对服务载体“公众号”,“中通公司”可以创建“公众号A”、“公众号B”等。
此外,业务提供方可以具有品牌,并且所具有的品牌可以包括一个或者多个。每个品牌可以与一个或多个服务载体对应。例如,一个品牌可以具有对应的公众号、小程序等。以品牌“中通”为例,品牌“中通”可以具有服务载体“中通公众号”、“中通小程序”和“中通官网”。
在本说明书中,同一业务提供方所具有的品牌之间称为关联品牌。例如,假设中通公司具有品牌A和品牌B,则品牌A和品牌B互称为关联品牌。此外,业务提供方还可以具有竞争对手,例如,圆通是中通的竞争对手。竞争对手所具有的品牌称为业务提供方所具有的品牌的竞品品牌(简称为“竞品”)。例如,假设中通公司具有品牌A,圆通公司是中通公司的竞争对手,并且具有品牌B1和B2,则品牌B1和B2是品牌A的竞品。此外,业务提供方还可以具有友商对手。友商对手例如可以是互相合作的业务提供方。例如,如果顺丰与中通之间建立合作关系,则顺丰是中通的友商对手。友商对手所具有的品牌可以称为友商品牌。例如,顺丰所具有的品牌可以称为中通所具有的品牌的友商品牌。
此外,为了实现本说明书的实施例所提供的基于品牌保护的搜索方案,需要创建并维护品牌知识图谱。品牌知识图谱可以包括节点和边。节点可以包括品牌节点和服务载体节点,并且边用于表征所连接的两个节点之间的关联关系。相应地,品牌知识图谱可以包括品牌节点与品牌节点之间的关联关系以及品牌节点与服务载体节点之间的关联关系。品牌节点与品牌节点之间的关联关系例如可以包括关联品牌关系、友商品牌关系和/或竞品关系。品牌节点与服务载体节点之间的关联关系例如可以表示服务载体节点属于品牌节点。
图1示出了根据本说明书实施例的品牌知识图谱100的一个示例的示意图。如图1所示,A1、A2、A3和A4是品牌节点,以及B1、B2、B3、B4和B5是服务载体节点。品牌节点A1、A2、A3和A4分别用于表征品牌A1、品牌A2、品牌A3和品牌A4。品牌节点A1分别与服务载体节点B1、服务载体节点B2之间存在边连接,表示服务载体节点B1和服务载体节点B2所表征的服务载体属于品牌A1。同样地,品牌节点A2、A3和A4分别与服务载体节点B3、服务载体节点B4和服务载体节点B5之间存在边连接,表示服务载体节点B3所表征的服务载体属于品牌A2,服务载体节点B4所表征的服务载体属于品牌A3,以及服务载体节点B5所表征的服务载体属于品牌A4。
在图1示出的品牌知识图谱中,品牌节点之间还存在边连接,例如,品牌节点A1与品牌节点A2和A4之间存在边连接,以及品牌节点A2与品牌节点A1、A3和A4之间存在边连接,则品牌节点A1与品牌节点A2和A3之间存在关联关系,以及品牌节点A2与品牌节点A1、A3和A4之间存在关联关系。此外,在品牌知识图谱包括多种品牌关联关系的情况下,例如,在包括关联品牌关系、友商品牌关系和竞品关系的情况下,针对品牌节点之间的边连接还可以设置属性值,每种属性值对应一种品牌关联关系。例如,属性值“1”对应“竞品关系”,属性值“0.5”对应“友商品牌关系”,以及属性值“0”对应“关联品牌关系”。要说明的是,使用属性值来表征不同的品牌关联关系,仅仅是一种实现示例。也可以采用其它合适的方式来表征品牌之间的不同品牌关联关系。
此外,除了品牌节点和服务载体节点以外,品牌知识图谱还可以包括行业节点和/主体节点。行业节点用于表征行业,比如,金融行业、物流行业、酒店行业、服务行业等。主体节点用于表示公司、企业或机构的主体名称,比如,中通快递股份有限公司、上海圆通速递有限公司、韵达快运(物流)有限公司、顺丰速运有限公司等。
当品牌知识图谱包括行业节点时,行业节点与品牌节点之间的边连接表示品牌节点所表征的品牌属于行业节点所表征的行业,以及行业节点与服务载体节点之间的边连接表示服务载体节点所表征的服务载体与行业节点所表征的行业有关联。服务载体与行业之间的关联包括服务载体提供该行业相关的服务。
当品牌知识图谱包括主体节点时,品牌节点与主体节点之间的边连接表示品牌节点所表征的品牌与主体节点所表征的主体之间存在关联。品牌与主体之间的关联关系可以包括:品牌属于该主体,或者品牌被主体使用等。主体节点与服务载体节点之间的边连接表示服务载体节点所表征的服务载体属于主体节点所表征的主体。
图2示出了根据本说明书实施例的品牌知识图谱200的另一个示例的示意图。图2所示的品牌知识图谱包括行业节点C1和主体节点D1。行业节点C1所表征的行业是“物流行业”,品牌节点A4所表征的品牌是“中通”,服务载体节点B5表征的服务载体是“中通公众号”,则行业节点C1与品牌节点A4之间的边连接表示品牌“中通”属于“物流行业”,行业节点C1与服务载体节点B5之间的边连接表示“中通公众号”提供物流行业的物流资讯服务。
主体节点D1所表征的主体是“中通快递股份有限公司”,品牌节点A3所表征的品牌是“中通”,服务载体节点B4表征的服务载体是“中通公众号”,则主体节点D1与品牌节点A3之间存在边连接表示品牌“中通”属于“中通快递股份有限公司”,以及主体节点D1与服务载体B5之间有边表示“中通公众号”属于“中通快递股份有限公司”。
品牌知识图谱中的主体节点可以被使用来确定两个品牌之间是否是关联品牌关系。具体地,与同一主体节点连接的各个品牌节点之间是关联品牌关系。以图2为例,品牌节点A2和品牌节点A3都与主体节点D1连接,则可以确定品牌A2与品牌A3之间是关联品牌关系。
在本说明书实施例的一个示例中,品牌知识图谱可以是预先创建的,在品牌知识图谱维护时,还可以对品牌知识图谱进行学习更新,以确保所使用的品牌知识图谱中用于表征的品牌、服务载体等的节点以及关联关系都是最新的,从而可以更加精确地进行品牌保护。
品牌知识图谱进行学习更新的方式可以采用数据算法挖掘、品牌认证、品牌标注以及爬虫抓取品牌关系等方式中的至少一种。品牌认证可以是基于国家品牌认证标准来进行认证。品牌标注包括人工标注、基于品牌库的机器标注等。
下面结合图3到图6详细描述根据本说明书的实施例的基于品牌保护的搜索方法及装置。
图3示出了根据本说明书实施例的基于品牌保护的搜索方法300的一个示例的流程图。本说明书实施例提供的搜索方法可以由搜索装置来执行。在一个示例中,该搜索装置可以是执行全网搜索的搜索装置,即,利用网络上共享的所有共享数据库进行全网搜索的搜索装置。在另一示例中,该搜索装置也可以是在有限数据库范围内执行搜索的搜索装置。比如,搜索装置可以是由某应用系统提供的搜索装置,该搜索装置使用该应用系统或者应用系统联盟内的数据库来执行搜索。这里,应用系统联盟可以是该应用系统与其他数据库提供方之间建立的联盟,每个联盟成员都授权使用联盟中所有成员的数据库。
在块310,获取用于搜索服务载体的查询语句。
查询语句可以由至少一个语句要素构成,语句要素可以是分词或分词集合,分词集合中包括至少两个分词。例如,查询语句是“中通公众号”,该查询语句包括的分词分别是“中通”和“公众号”,则该查询语句由两个语句要素“中通”和“公众号”构成。
在本说明书中,查询语句可以包括第一语句要素,第一语句要素是用于表征服务载体归属的语句要素,例如,上文中提及的“中通”。服务载体归属可以是品牌归属或者主体归属,即,服务载体属于哪个品牌或者哪个主体。第一语句要素例如可以包括品牌名称、品牌的缩写名称、不同语种表述的品牌名称以及品牌匹配词等中的至少一种。
品牌名称例如可以包括品牌对应的注册商标名称、品牌具有广泛知名度的名称等。对于同一品牌名称,可以用不同语种来表述,利用各个语种表述的是同一品牌,由此,由不同语种表述的第一语句要素可以表征该品牌。比如,一个品牌可以用中文、英文以及日文三个语种来表述,这三个语种所表述的文字都可以表征该品牌。品牌匹配词是与品牌名称之间具有匹配关系的分词。
此外,在另一示例中,查询语句还可以包括第二语句要素,第二语句要素用于表征服务载体。第二语句要素可以包括服务载体名称、服务载体的缩写名称、服务载体的匹配词以及用不同语种表述的服务载体名称等中的至少一种。例如,查询语句是“中通公众号”,则该查询语句中的第一语句要素是“中通”,以及第二语句要素是“公众号”。
在本说明书实施例中,查询语句用于搜索服务载体。所得到的搜索结果可以是服务载体的链接,或者服务载体的标识,此时,服务载体的标识可以是有限数据库范围内某个数据库中存储的服务载体对应的键值。
在网络平台的场景下,网络平台可以对应有服务载体数据库,不同的网络平台对应的服务载体数据库中的服务载体可以不同,在网络平台上的搜索是在对应的服务载体数据中的范围内执行的。当用户在网络平台的搜索引擎上输入查询语句时,搜索到的针对查询语句的服务载体都是网络平台对应的服务载体数据库中的服务载体。
例如,银联平台对应的服务载体数据库中包括中通品牌的小程序和公众号,微信平台对应的服务载体数据库中包括中通品牌的小程序。当分别利用查询语句“中通”分别在银联平台和微信平台上进行搜索时,银联平台输出的搜索结果集中包括中通的小程序和公众号,而微信平台输出的搜索结果集中包括中通的小程序。
在获取到查询语句后,在块320,可以使用查询语句进行语义扩展搜索来得到第一搜索结果集。
在一个示例中,针对查询语句的语义扩展可以包括针对查询语句中的第一语句要素的语义扩展。
针对第一语句要素的语义扩展可以是针对第一语句要素中包括的分词或分词集进行语义扩展。例如,第一语句要素是“众通快递”,则对该第一语句要素进行语义扩展后所得到的扩展结果可以包括:中通快递、圆通快递、申通快递等。
此外,根据第一语句要素表征的品牌,对第一语句要素的语义扩展可以认为是对该品牌的语义扩展。针对品牌的语义扩展所得到的扩展结果可以包括该品牌的关联品牌、友商品牌、竞品和/或无关品牌等。例如,第一语句要素是“中通”,则对第一语句要素“中通”进行语义扩展后得到的扩展结果可以包括“中通”的友商品牌“顺丰”,竞品“圆通”和/或无关品牌“申通”等。
在另一个示例中,在查询语句还包括第二语句要素时,针对查询语句的语义扩展还可以包括针对第二语句要素的语义扩展。
第二语句要素表征的服务载体是一种类型的服务载体,在针对第二语句要素进行语义扩展时,可以基于第二语句要素所表征的服务载体类型来扩展出其他的服务载体类型。
针对第二语句要素的语义扩展可以根据服务载体的功能来进行语义扩展,具体地,对于第二语句要素表征的服务载体的全部或部分功能,其他类型的服务载体也能够实现这些功能,则可以将该其他类型的服务载体作为扩展的服务载体。
例如,小程序作为一种应用可以实现下单和购买功能,应用中心的应用也具有下单和购买功能。当第二语句要素表征小程序时,针对第二语句要素的语义扩展可以扩展出应用中心的应用。
此外,针对第二语义要素的语义扩展还可以是根据第一语义要素表征的品牌来进行语义扩展。具体地,第二语义要素表征的服务载体属于第一语义要素表征的品牌,如果该品牌对应有多个服务载体,则可以将该多个服务载体中的除第二语义要素表征的服务载体以外的其他服务载体作为扩展的服务载体。
例如,第二语义要素表征的服务载体是公众号,第一语义要素表征的品牌对应的服务载体包括公众号、小程序和应用中心的应用,则针对第二语义要素的语义扩展所扩展出来的服务载体包括小程序和应用中心的应用。
在本说明书中,语义扩展搜索可以是全网搜索,也可以是有限数据库范围内的搜索。例如,在搜索引擎由某个网络平台提供的情况下,可以在该网络平台所具有的数据库或可使用的数据库中进行语义扩展搜索。
所得到的第一搜索结果集包括各个与服务载体对应的搜索结果。第一搜索结果集中的各个搜索结果根据对应的得分来进行排序的。搜索结果的得分可以采用本领域的适合方式来确定出。例如,所述得分例如可以根据服务载体与查询语句的相关程度来得出,相关程度较高的服务载体所对应的搜索结果的得分较高,而相关程度较低的服务载体所对应的搜索结果的得分较低。
在一个示例中,在使用查询语句进行搜索前,可以对查询语句进行文本预处理,以提高针对查询语句的搜索效率和准确度。针对查询语句的文本预处理可以包括如下步骤。可以先对查询语句进行切词处理,在一个示例中,可以使用常用词语库对查询语句进行切词处理,以将查询语句分解成词语,常用词语库中包括若干常用的词语。接着,对查询语句进行纠错处理,纠错处理包括对错别字的纠正、将拼音转换成对应的汉字等处理。然后,对查询语句进行主干提取处理,以去掉对查询语句没有贡献作用的字词,比如,标点符号、语气助词、感叹词等。经过上述文本预处理后可以得到针对查询语句的各个词语,使用这些词语进行搜索,以得到针对查询语句的服务载体。
上述块320的操作可以由搜索引擎来执行,具体地,用户在搜索引擎中输入查询语句,搜索引擎对查询语句进行文本预处理、语义扩展等处理,并在服务载体数据库中查询与查询语句关联的服务载体,再根据服务载体与查询语句的相关性对查询到的服务载体打分,然后按照打分从高到低的顺序对查询到的服务载体进行排序,并将排序后的服务载体序列作为第一搜索结果集输出。
然后,在块330,对查询语句进行品牌保护识别,以确定针对当前查询是否需要品牌保护。在确定不需要品牌保护时,执行块340的操作。在确定需要品牌保护时,执行块350的操作。
在本说明书实施例的一个示例中,可以利用品牌库来对查询语句进行文本相似度识别,以确定是否需要品牌保护。品牌库可以包括各个品牌对应的品牌词和/或与品牌词能够匹配的品牌匹配词。品牌库可以是基于国家品牌认证标准形成的。
具体地,将查询语句与品牌库中的品牌词和/或品牌匹配词进行匹配,并计算查询语句与各个词的文本相似度。当所计算出的文本相似度中存在大于指定相似度阈值的文本相似度时,可以确定针对当前查询需要品牌保护。
在一个示例中,品牌库中的品牌词以及品牌匹配词对应的相似度阈值可以相同。在另一个示例中,品牌库中的品牌词对应的相似度阈值可以小于品牌匹配词对应的相似度阈值。也就是说,相比于查询语句与品牌词之间的文本相似度来说,查询语句与品牌匹配词之间的文本相似度需要更高才可以确定需要品牌保护。
例如,在预先设置的品牌库中,品牌“圆通”对应的品牌词包括圆通,品牌匹配词包括:圆通云、圆通速递、圆通快递和圆通货运、元通、园通和YUANTONG等。品牌词对应的相似度阈值是70%,品牌匹配词对应的相似度阈值是80%。当查询语句为“圆甬”时,经过文本相似度计算出“圆甬”与“圆通”的文本相似度为85%,则可以确定针对该查询语句需要品牌保护。当查询语句为“YUNTONG”时,经过文本相似度计算可以知道该“YUNTONG”与品牌库中“圆通”对应的各个品牌词的相似度均小于70%,而与品牌匹配词“YUANTONG”的文本相似度为90%,则可以确定针对该查询语句需要品牌保护。
在本说明书实施例的另一个示例中,品牌知识图谱中的品牌节点具有节点属性信息,节点属性信息包括品牌节点表征的品牌对应的品牌词和品牌匹配词。利用品牌知识图谱中各个品牌节点的品牌词和品牌匹配词,可以对查询语句进行文本相似度识别。该示例中的品牌知识图谱与下面块350的操作中使用的品牌知识图谱可以是同一个品牌知识图谱。
在块340,输出第一搜索结果集。
在确定需要品牌保护且需要保护的品牌是第一品牌时,在块350,从品牌知识图谱中查询出第一品牌的关联服务载体。
第一品牌是查询语句中的第一语句要素能够表征的品牌。第一品牌的关联服务载体可以包括竞品服务载体,竞品服务载体是第一品牌的竞品品牌对应的服务载体。例如,第一品牌是中通,中通的竞品品牌包括圆通,则竞品服务载体包括圆通的服务载体,比如,圆通公众号,圆通小程序等。
在查询出第一品牌的关联服务载体后,在块360,从第一搜索结果集中过滤与竞品服务载体匹配的搜索结果,得到第二搜索结果集。
例如,查询语句是“中通小程序”,第一品牌是中通,所得到的第一搜索结果集中包括:中通小程序、中通公众号、圆通小程序和圆通公众号,而圆通是中通的竞品,因此从品牌知识图谱中查询出的第一品牌的竞品服务载体包括圆通小程序、圆通公众号和圆通应用中心的应用,则与竞品服务载体匹配的服务载体包括圆通小程序和圆通公众号,则从第一搜索结果集中过滤该两个服务载体,得到包括中通小程序和中通公众号的第二搜索结果集。
最后,在块370,输出第二搜索结果集
输出的第二搜索结果集中的搜索结果可以是搜索结果序列,搜索结果序列的排序依据可以是搜索引擎的得分,即,按照得分从高到底的顺序对各个搜索结果进行排序,从而得到搜索结果序列。
通过本说明书实施例提供的上述搜索方法,从第一搜索结果集中过滤与第一品牌的竞品的服务载体匹配的搜索结果,使得输出的搜索结果中不包括与竞品服务载体对应的搜索结果,从而避免向用户提供与竞品服务载体对应的搜索结果,由此对需要保护的第一品牌进行品牌保护。
在本说明书实施例的一个示例中,除了竞品服务载体以外,从品牌知识图谱中查询出的关联服务载体还可以包括品牌相关服务载体。品牌相关服务载体可以包括与第一品牌的关联品牌和/或友商品牌对应的服务载体。
在一个示例中,在关联服务载体包括品牌相关服务载体的情况下,在得到第二搜索结果集后,还可以从第二搜索结果集中获取与品牌相关服务载体匹配的搜索结果,得到第三搜索结果集,所得到的第三搜索结果集中仅仅包括第一品牌的品牌相关服务载体。然后,输出所得到的第三搜索结果集。
例如,查询语句是“中通公众号”,第一搜索结果集包括:中通公众号、中通小程序、中通官网、顺丰公众号、顺丰小程序、圆通公众号、圆通小程序、韵达公众号和申通小程序,其中,顺丰和韵达是中通的友商品牌,圆通是中通的竞品,以及申通与中通之间是品牌无关关系。经过上述处理后,所得到的第二搜索结果集包括:中通公众号、中通小程序、中通官网、顺丰公众号、顺丰小程序、韵达公众号和申通小程序。所得到的第三搜索结果集包括:中通公众号、中通小程序、中通官网、顺丰公众号、顺丰小程序和韵达公众号。
从上面可以看出,第三搜索结果集中的搜索结果数量少于甚至是远远少于第一搜索结果集的搜索结果数量。此外,第三搜索结果集中的搜索结果中的服务载体都是与查询语句的相关性最大的服务载体,由此可以在品牌保护的基础上,为用户提供更加精准的搜索结果。
在另一个示例中,在关联服务载体包括品牌相关服务载体的情况下,在得到第二搜索结果集后,可以根据品牌相关服务载体来对第二搜索结果集中的搜索结果进行混序处理。在一个示例中,对第二搜索结果集中的搜索结果进行混序处理可以包括:对第二搜索结果集中的与品牌相关服务载体匹配的各个搜索结果进行提序处理,和/或对第二搜索结果集中的搜索结果进行混序处理可以包括:对第二搜索结果集中的不与品牌相关服务载体匹配的各个搜索结果进行降序处理。利用上述混序处理,可以使得与品牌相关服务载体匹配的搜索结果排序相对靠前,而非品牌相关服务载体对应的搜索结果排序相对靠后。
图4示出了根据本说明书实施例的第二搜索结果集经过混序处理后得到的搜索结果序列的一个示例的示意图。
如图4所示,在混序处理之前,第二搜索结果集400中各个搜索结果的排序为:品牌相关服务载体搜索结果A,非品牌相关服务载体搜索结果a,品牌相关服务载体搜索结果B,非品牌相关服务载体搜索结果b,品牌相关服务载体搜索结果C,以及非品牌相关服务载体搜索结果c。
在进行混序处理时,可以对第二搜索结果集中的与品牌相关服务载体匹配的搜索结果进行提序处理。以图4为例,对第二搜索结果集400进行混序处理时,分别将第二搜索结果集400中的品牌相关服务载体搜索结果B和品牌相关服务载体搜索结果C进行提序处理,以将品牌相关服务载体搜索结果B的排序提升至第二,将品牌相关服务载体搜索结果C的排序提升至第三,其他非品牌相关服务载体搜索结果的排序相应的下降,由此得到第二搜索结果集400’。
或者,在进行混序处理时,可以对第二搜索结果集中的与品牌相关服务载体不匹配的各个搜索结果进行降序处理。以图4为例,对第二搜索结果集400进行混序处理时,分别将第二搜索结果集400中的非品牌相关服务载体搜索结果a和非品牌相关服务载体搜索结果b进行降序处理,以将非品牌相关服务载体搜索结果b的排序下降至第五,将非品牌相关服务载体搜索结果a的排序下降至第四,其他品牌相关服务载体搜索结果的排序相应的上升,由此得到第二搜索结果集400’。
此外,在本说明书的其它实施例中,也可以对第二搜索结果集中的与品牌相关服务载体匹配的各个搜索结果进行提序处理,同时对第二搜索结果集中的与品牌相关服务载体不匹配的各个搜索结果进行降序处理。以图4为例,对第二搜索结果集400进行混序处理时,对品牌相关服务载体搜索结果B和品牌相关服务载体搜索结果C进行提序处理,同时对非品牌相关服务载体搜索结果a和非品牌相关服务载体搜索结果b进行降序处理,由此得到第二搜索结果集400’。
通过该示例中的混序处理,不仅针对搜索结果起到了品牌保护的作用,而且在输出的搜索结果集中,使得需要保护的第一品牌对应的品牌相关服务载体的排序优先于其他服务载体,从而强化了需要保护的第一品牌。此外,品牌相关服务载体是与查询语句相关性较高的服务载体,将相关性高的搜索结果优先呈现给用户,提升了用户体验。
在另一个示例中,第二搜索结果集中的搜索结果可以具有混序处理参数。相应地,在进行混序处理(提序或降序处理)时,可以根据第二搜索结果集中的搜索结果与第一品牌的品牌相关性,确定该搜索结果的混序处理参数;并且根据品牌相关服务载体以及搜索结果的混序处理参数,对第二搜索结果集中的搜索结果进行混序处理。
品牌相关性是搜索结果与第一品牌的相关程度,搜索结果能直接呈现出第一品牌,则与第一品牌的品牌相关性最大。搜索结果没有品牌或者呈现的品牌与第一品牌之间没有任何关联,则该搜索结果与第一品牌的品牌相关性最小。
在上述示例中,根据品牌相关性所确定的混序处理参数可以反映搜索结果与第一品牌的相关程度,进而在根据混序处理参数进行的混序处理中将品牌相关性作为排序的其中一个影响因子,最终在经过混序处理后的排序结果中体现出针对第一品牌的品牌保护。
在本说明书中,品牌相关服务载体可以包括:与第一品牌相关的第一品牌相关服务载体,与第二品牌相关的第二品牌相关服务载体以及与第三品牌相关的第三品牌相关服务载体。这里,第二品牌是第一品牌的关联品牌,以及第三品牌是第一品牌的友商品牌。
针对上述三类品牌,与第一品牌相关服务载体匹配的搜索结果与第一品牌的品牌相关性最大,与第二品牌相关服务载体匹配的搜索结果与第一品牌的品牌相关性次之,与第三品牌相关服务载体匹配的搜索结果与第一品牌的品牌相关性最小。基于此,与第一品牌相关服务载体匹配的搜索结果的混序处理参数优于与第二品牌相关服务载体匹配的搜索结果的混序处理参数,与第二品牌相关服务载体匹配的搜索结果的混序处理参数优于与第三品牌相关服务载体匹配的搜索结果的混序处理参数,以及与第三品牌相关服务载体匹配的搜索结果的混序处理参数优于不与相关服务载体匹配的搜索结果的混序处理参数。
在一个示例中,混序处理参数可以包括排序优先级。例如,可以根据搜索结果与第一品牌的品牌相关性,给搜索结果赋予排序优先级。例如,可以将第一品牌的服务载体所对应的搜索结果赋予第一优先级,关联品牌的服务载体所对应的搜索结果赋予第二优先级,友商品牌的服务载体所对应的搜索结果赋予第三优先级,以及非品牌相关服务载体所对应的搜索结果赋予第四优先级。第一优先级到第四优先级的排序优先级依次降低,即,排序优先级高的搜索结果排在排序优先级低的所有搜索结果之前。例如,第一优先级的搜索结果排在第二优先级的所有搜索结果之前。每个优先级的搜索结果相互之间的排序可以保持不变。
图5示出了根据本说明书实施例的第二搜索结果集经过混序处理后得到的搜索结果序列的另一个示例的示意图。如图5所示,第二搜索结果集400包括3个品牌相关服务载体搜索结果(A,B和C)和3个非品牌相关服务载体搜索结果(a,b和c),其中,第一品牌搜索结果A是第一品牌相关服务载体的搜索结果,友商品牌搜索结果B是友商品牌相关服务载体的搜索结果,以及关联品牌搜索结果C是关联品牌相关服务载体的搜索结果。在这种情况下,第一品牌搜索结果A被赋予第一优先级,关联品牌搜索结果C被赋予第二优先级,友商品牌搜索结果B被赋予第三优先级,以及搜索结果a、b和c被赋予第四优先级。在混序处理之前的搜索结果排序如图5中的左图所示的情况下,在经过混序处理后,可以得到图5中的右图所示的搜索结果排序结果。
上述示例中的混序处理依据排序优先级,第二搜索结果集中的每个搜索结果被赋予一个排序优先级,根据排序优先级进行混序处理更直接且更直观,无需再进行其他计算,从而可以提高混序处理效率。此外,同一类型的服务载体对应的搜索结果被赋予相同优先级,因此,一般来说优先级的数量会少于甚至远远少于第二搜索结果集中的搜索结果的数量,在根据排序优先级进行混序处理时,具有相同优先级的搜索结果可以作为一个整体来排序,进而可以仅针对优先级数量的搜索结果整体来进行排序,从而降低了排序的复杂度。
在另一示例中,混序处理参数可以是排序增量。在搜索结果排序是基于得分进行排序的情况下,排序增量可以是得分增量。第一品牌的服务载体所对应的搜索结果被赋予第一排序增量,关联品牌的服务载体所对应的搜索结果被赋予第二排序增量,以及友商品牌的服务载体所对应的搜索结果被赋予第三排序增量,其中,第一排序增量>第二排序增量>第三排序增量。此外,非品牌相关服务载体所对应的搜索结果可以被赋予第四排序增量,第四排序增量小于第三排序增量,第四排序增量可以为0或者负值。
在这种情况下,可以根据排序增量来对搜索结果的得分进行调整,并且基于调整后的得分来对第二搜索结果集中的搜索结果重新进行排序,并呈现经过重新排序后的搜索结果。
图6示出了本说明书实施例的第二搜索结果集经过混序处理后得到的搜索结果序列的另一个示例的示意图。如图6所示,第二搜索结果集600包括3个品牌相关服务载体搜索结果(A,B和C)和1个非品牌相关服务载体搜索结果(a),其中,第一品牌搜索结果A是第一品牌相关服务载体的搜索结果,友商品牌搜索结果B是友商品牌相关服务载体的搜索结果,以及关联品牌搜索结果C是关联品牌相关服务载体的搜索结果。在进行语义扩展搜索得到搜索结果并进行结果评分时,第一品牌搜索结果A的得分为80,搜索结果a的得分为75,友商品牌搜索结果B的得分为72,关联品牌搜索结果C的得分为70。经过混序处理之前的搜索结果排序如图6中的左图所示。
在进行混序处理时,第一品牌搜索结果A的得分增量为20,友商品牌搜索结果B的得分增量为10,关联品牌搜索结果C的得分增量为15,以及搜索结果a的得分增量为-5。经过混序处理后,第一品牌搜索结果A的得分为100,搜索结果a的得分为70,友商品牌搜索结果B的得分为82,关联品牌搜索结果C的得分为85。由此,得到图6中的右图所示的排序结果。
上述示例中将排序增量作为混序处理参数,由于排序增量的可调范围较广且可调步长较小,进而可以精确地为检索结果赋予相应的排序增量,精确的排序增量可以精确地反映检索结果与第一品牌的品牌相关度,由此对第二搜索结果集中的搜索结果重新进行排序也会更精确。
在另一个示例中,混序处理参数可以是用于排序调整的权重系数。第一品牌的服务载体所对应的搜索结果赋予第一权重系数,关联品牌的服务载体所对应的搜索结果赋予第二权重系数,以及友商品牌的服务载体所对应的搜索结果赋予第三权重系数,其中,第一权重系数>第二权重系数>第三系数。
在这种情况下,可以根据权重系数来对搜索结果的得分进行调整,并且基于调整后的得分来对第二搜索结果集中的搜索结果重新进行排序,并呈现经过重新排序后的搜索结果。
同样以图6为例,在进行混序处理时,第一品牌搜索结果A的权重系数为1.5,友商品牌搜索结果B的权重系数为1.2,关联品牌搜索结果C的权重系数为1.4,以及非品牌相关服务载体搜索结果a的权重系数为1。经过混序处理后,第一品牌搜索结果A的得分为120,非品牌相关服务载体搜索结果a的得分为70,友商品牌搜索结果B的得分为86.4,关联品牌搜索结果C的得分为98。由此,得到图6中的右图所示的排序结果。
在上述两个示例中,排序增量和权重系数都可以反映搜索结果与第一品牌的品牌相关度,并且排序增量和权重系数都用于对搜索结果的得分进行调整,使得调整后的搜索结果的得分中能够体现与第一品牌的品牌相关度,进而在最后的搜索结果排序中品牌相关度较高的搜索结果的排序会靠前,从而实现针对第一品牌的品牌保护。
在一个示例中,与第一品牌相关服务载体匹配的多个搜索结果的混序处理参数可以相同或不同,与第二品牌相关服务载体匹配的多个搜索结果的混序处理参数可以相同或不同,以及与第三品牌相关服务载体匹配的多个搜索结果的混序处理参数可以相同或不同。当针对第一品牌相关服务载体、第二品牌相关服务载体或第三品牌相关服务载体匹配的多个搜索结果的混序处理参数不同时,每个搜索结果的混序处理参数可以根据该搜索结果与第一品牌之间的品牌相关性来确定。
例如,第二搜索结果集中与第一品牌相关服务载体匹配的搜索结果包括第一品牌相关服务载体搜索结果A、B和C,A、B和C三者对应的混序处理参数相同,都设置为P1。在另一种情况中,搜索结果A、B和C与第一品牌之间的品牌相关度不同,其中,搜索结果A的品牌相关度最小,搜索结果C的品牌相关度最大,则可以将搜索结果A的混序处理参数设置为P1,搜索结果B的混序处理参数设置为P2,以及搜索结果C的混序处理参数设置为P3,其中,P1<P2<P3。
图7示出了根据本说明书实施例的基于品牌保护的搜索装置700的一个示例的方框图。如图7所示,搜索装置700可以包括查询语句获取单元710、语义扩展搜索单元720、品牌保护识别单元730、关联服务载体查询单元740、搜索结果处理单元750和搜索结果输出单元760。
查询语句获取单元710被配置为获取用于搜索服务载体的查询语句,该查询语句可以包括用于表征服务载体归属的第一语句要素。查询语句获取单元710的操作可以参考上面参照图3描述的块310的操作。
语义扩展搜索单元720被配置为使用查询语句进行语义扩展搜索来得到第一搜索结果集。语义扩展搜索单元720的操作可以参考上面参照图3描述的块320的操作。在一个示例中,语义扩展包括针对第一语句要素的语义扩展。在另一个示例中,查询语句可以包括用于表征服务载体的第二语句要素,语义扩展还可以包括针对第二语句要素的语义扩展。
品牌保护识别单元730被配置为对查询语句进行品牌保护识别,以确定针对当前搜索是否需要品牌保护。品牌保护识别单元730的操作可以参考上面参照图3描述的块330的操作。在一个示例中,品牌保护识别单元730可以被配置为利用品牌库来对查询语句进行文本相似度识别,以确定是否需要品牌保护,其中,品牌库可以包括各个品牌对应的品牌词和/或品牌匹配词。
关联服务载体查询单元740被配置为在确定需要品牌保护且需要保护的品牌是第一品牌时,从品牌知识图谱中查询第一品牌的关联服务载体,关联服务载体包括竞品服务载体,其中,品牌知识图谱可以包括节点和边,节点可以包括品牌节点和服务载体节点,边可以用于表征所连接的两个节点之间的关联关系。关联服务载体查询单元740的操作可以参考上面参照图3描述的块350的操作。
搜索结果处理单元750被配置为从第一搜索结果集中过滤与竞品服务载体匹配的搜索结果,得到第二搜索结果集。搜索结果处理单元750的操作可以参考上面参照图3描述的块360的操作。
搜索结果输出单元760被配置为输出第二搜索结果集。搜索结果输出单元760的操作可以参考上面参照图3描述的块370的操作。
在一个示例中,关联服务载体还可以包括品牌相关服务载体,搜索结果处理单元750进一步可以从第二搜索结果集中获取与品牌相关服务载体匹配的搜索结果,得到第三搜索结果集。相应地,搜索结果输出单元760输出第三搜索结果集。
在另一个示例中,关联服务载体还可以包括品牌相关服务载体,搜索结果处理单元750进一步可以根据品牌相关服务载体,对第二搜索结果集中的搜索结果进行混序处理。相应地,搜索结果输出单元760输出经过混序处理后的搜索结果
在另一个示例中,搜索结果处理单元750还可以被配置为根据第二搜索结果集中的搜索结果与第一品牌的品牌相关性,确定该搜索结果的混序处理参数;以及根据品牌相关服务载体以及搜索结果的混序处理参数,对第二搜索结果集中的搜索结果进行混序处理。
在另一个示例中,品牌相关服务载体可以包括:与第一品牌相关的第一品牌相关服务载体,与第二品牌相关的第二品牌相关服务载体以及与第三品牌相关的第三品牌相关服务载体,第二品牌是第一品牌的关联品牌,以及第三品牌是第一品牌的友商品牌。与第一品牌相关服务载体匹配的搜索结果的混序处理参数优于与第二品牌相关服务载体匹配的搜索结果的混序处理参数,与第二品牌相关服务载体匹配的混序处理参数优于与第三品牌相关服务载体匹配的搜索结果的混序处理参数,以及与第三品牌相关服务载体匹配的搜索结果的混序处理参数优于不与相关服务载体匹配的搜索结果的混序处理参数。
在另一个示例中,搜索结果处理单元750还可以被配置为:对第二搜索结果集中的与品牌相关服务载体匹配的搜索结果进行提序处理,和/或,对第二搜索结果集中的与品牌相关服务载体不匹配的搜索结果进行降序处理。
以上参照图1到图7,对根据本说明书实施例的基于品牌保护的搜索方法及装置的实施例进行了描述。
本说明书实施例的基于品牌保护的搜索装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将存储器中对应的计算机程序指令读取到内存中运行形成的。在本说明书实施例中,基于品牌保护的搜索装置例如可以利用电子设备实现。
图8示出了本说明书实施例的用于实现基于品牌保护的搜索方法的电子设备800的方框图。
如图8所示,电子设备800可以包括至少一个处理器810、存储器(例如,非易失性存储器)820、内存830和通信接口840,并且至少一个处理器810、存储器820、内存830和通信接口840经由总线850连接在一起。至少一个处理器810执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器810:获取用于搜索服务载体的查询语句,该查询语句包括用于表征服务载体归属的第一语句要素;使用查询语句进行语义扩展搜索来得到第一搜索结果集;对查询语句进行品牌保护识别,以确定针对当前搜索是否需要品牌保护;在确定需要品牌保护且需要保护的品牌是第一品牌时,从品牌知识图谱中查询第一品牌的关联服务载体,该关联服务载体包括竞品服务载体,其中,品牌知识图谱包括节点和边,节点包括品牌节点和服务载体节点,边用于表征所连接的两个节点之间的关联关系;从第一搜索结果集中过滤与竞品服务载体匹配的搜索结果,得到第二搜索结果集;以及输出第二搜索结果集。
应该理解,在存储器中存储的计算机可执行指令当执行时使得至少一个处理器810进行本说明书的各个实施例中以上结合图1-7描述的各种操作和功能。
根据一个实施例,提供了一种例如机器可读介质的程序产品。机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本说明书的各个实施例中以上结合图1-7描述的各种操作和功能。
具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本说明书实施例的一部分。
本说明书各部分操作所需的计算机程序代码可以用任意一种或多种程序语言编写,包括面向对象编程语言,如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB、NET以及Python等,常规程序化编程语言如C语言、Visual Basic 2003、Perl、COBOL 2002、PHP以及ABAP,动态编程语言如Python、Ruby和Groovy,或者其他编程语言等。该程序编码可以在用户计算机上运行,或者作为独立的软件包在用户计算机上运行,或者部分在用户计算机上运行另一部分在远程计算机运行,或者全部在远程计算机或服务器上运行。在后一种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或者在云计算环境中,或者作为服务使用,比如软件即服务(SaaS)。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
以上结合附图详细描述了本说明书的实施例的可选实施方式,但是,本说明书的实施例并不限于上述实施方式中的具体细节,在本说明书的实施例的技术构思范围内,可以对本说明书的实施例的技术方案进行多种简单变型,这些简单变型均属于本说明书的实施例的保护范围。
本说明书内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本说明书内容。对于本领域普通技术人员来说,对本说明书内容进行的各种修改是显而易见的,并且,也可以在不脱离本说明书内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本说明书内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims (16)

1.一种基于品牌保护的搜索方法,包括:
获取用于搜索服务载体的查询语句,所述查询语句包括用于表征服务载体归属的第一语句要素;
使用所述查询语句进行语义扩展搜索来得到第一搜索结果集;
对所述查询语句进行品牌保护识别,以确定针对当前搜索是否需要品牌保护;
在确定需要品牌保护且需要保护的品牌是第一品牌时,从品牌知识图谱中查询所述第一品牌的关联服务载体,所述关联服务载体包括竞品服务载体,其中,所述品牌知识图谱包括节点和边,所述节点包括品牌节点和服务载体节点,所述边用于表征所连接的两个节点之间的关联关系;
从所述第一搜索结果集中过滤与所述竞品服务载体匹配的搜索结果,得到第二搜索结果集;以及
输出所述第二搜索结果集,
其中,所述关联服务载体还包括品牌相关服务载体,所述品牌相关服务载体包括:与所述第一品牌相关的第一品牌相关服务载体,与第二品牌相关的第二品牌相关服务载体以及与第三品牌相关的第三品牌相关服务载体,所述第二品牌是所述第一品牌的关联品牌,以及所述第三品牌是所述第一品牌的友商品牌,
所述搜索方法还包括:
根据所述第二搜索结果集中的搜索结果与所述第一品牌的品牌相关性,确定该搜索结果的混序处理参数;以及
根据所述品牌相关服务载体以及各个搜索结果的混序处理参数,对所述第二搜索结果集中的搜索结果进行混序处理,
其中,与所述第一品牌相关服务载体匹配的搜索结果的混序处理参数优于与所述第二品牌相关服务载体匹配的搜索结果的混序处理参数,与所述第二品牌相关服务载体匹配的搜索结果的混序处理参数优于与所述第三品牌相关服务载体匹配的搜索结果的混序处理参数,以及与第三品牌相关服务载体匹配的搜索结果的混序处理参数优于不与相关服务载体匹配的搜索结果的混序处理参数。
2.如权利要求1所述的搜索方法,其中,所述语义扩展包括针对所述第一语句要素的语义扩展。
3.如权利要求2所述的搜索方法,其中,所述查询语句包括用于表征服务载体的第二语句要素,所述语义扩展还包括针对所述第二语句要素的语义扩展。
4.如权利要求1所述的搜索方法,还包括:
从所述第二搜索结果集中获取与所述品牌相关服务载体匹配的搜索结果,得到第三搜索结果集;以及
输出所述第二搜索结果集包括:
输出所述第三搜索结果集。
5.如权利要求1到4中任一所述的搜索方法,其中,根据所述品牌相关服务载体以及各个搜索结果的混序处理参数,对所述第二搜索结果集中的搜索结果进行混序处理包括:
对所述第二搜索结果集中的与所述品牌相关服务载体匹配的搜索结果进行提序处理,和/或,
对所述第二搜索结果集中的与所述品牌相关服务载体不匹配的搜索结果进行降序处理。
6.如权利要求1所述的搜索方法,其中,对所述查询语句进行品牌保护识别,以确定针对当前查询是否需要品牌保护包括:
利用品牌库来对所述查询语句进行文本相似度识别,以确定是否需要品牌保护,其中,所述品牌库包括各个品牌对应的品牌词和/或品牌匹配词。
7.如权利要求1所述的搜索方法,其中,所述品牌知识图谱还包括行业节点和/或主体节点。
8.如权利要求1所述的搜索方法,其中,所述品牌知识图谱通过以下方式中的至少一种方式来进行学习更新:
数据算法挖掘;
品牌认证;
品牌标注;和
爬虫抓取品牌关系。
9.一种基于品牌保护的搜索装置,包括:
查询语句获取单元,获取用于搜索服务载体的查询语句,所述查询语句包括用于表征服务载体归属的第一语句要素;
语义扩展搜索单元,使用所述查询语句进行语义扩展搜索来得到第一搜索结果集;
品牌保护识别单元,对所述查询语句进行品牌保护识别,以确定针对当前搜索是否需要品牌保护;
关联服务载体查询单元,在确定需要品牌保护且需要保护的品牌是第一品牌时,从品牌知识图谱中查询所述第一品牌的关联服务载体,所述关联服务载体包括竞品服务载体,其中,所述品牌知识图谱包括节点和边,所述节点包括品牌节点和服务载体节点,所述边用于表征所连接的两个节点之间的关联关系;
搜索结果处理单元,从所述第一搜索结果集中过滤与所述竞品服务载体匹配的搜索结果,得到第二搜索结果集;以及
搜索结果输出单元,输出所述第二搜索结果集,
其中,所述关联服务载体还包括品牌相关服务载体,所述品牌相关服务载体包括:与所述第一品牌相关的第一品牌相关服务载体,与第二品牌相关的第二品牌相关服务载体以及与第三品牌相关的第三品牌相关服务载体,所述第二品牌是所述第一品牌的关联品牌,以及所述第三品牌是所述第一品牌的友商品牌,
所述搜索结果处理单元进一步:
根据所述第二搜索结果集中的搜索结果与所述第一品牌的品牌相关性,确定该搜索结果的混序处理参数;以及
根据所述品牌相关服务载体以及搜索结果的混序处理参数,对所述第二搜索结果集中的搜索结果进行混序处理,
其中,与所述第一品牌相关服务载体匹配的搜索结果的混序处理参数优于与所述第二品牌相关服务载体匹配的搜索结果的混序处理参数,与所述第二品牌相关服务载体匹配的搜索结果的混序处理参数优于与所述第三品牌相关服务载体匹配的搜索结果的混序处理参数,以及与第三品牌相关服务载体匹配的搜索结果的混序处理参数优于不与相关服务载体匹配的搜索结果的混序处理参数。
10.如权利要求9所述的搜索装置,其中,所述语义扩展包括针对所述第一语句要素的语义扩展。
11.如权利要求10所述的搜索装置,其中,所述查询语句包括用于表征服务载体的第二语句要素,所述语义扩展还包括针对所述第二语句要素的语义扩展。
12.如权利要求9所述的搜索装置,其中,所述搜索结果处理单元进一步从所述第二搜索结果集中获取与所述品牌相关服务载体匹配的搜索结果,得到第三搜索结果集,并且所述搜索结果输出单元输出所述第三搜索结果集。
13.如权利要求9到12中任一所述的搜索装置,其中,所述搜索结果处理单元:
对所述第二搜索结果集中的与所述品牌相关服务载体匹配的搜索结果进行提序处理,和/或,
对所述第二搜索结果集中的与所述品牌相关服务载体不匹配的搜索结果进行降序处理。
14.如权利要求9所述的搜索装置,其中,所述品牌保护识别单元利用品牌库来对所述查询语句进行文本相似度识别,以确定是否需要品牌保护,其中,所述品牌库包括各个品牌对应的品牌词和/或品牌匹配词。
15.一种电子设备,包括:
至少一个处理器,以及
与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1到8中任一所述的方法。
16.一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如权利要求1到8中任一所述的方法。
CN202010589314.5A 2020-06-24 2020-06-24 基于品牌保护的搜索方法及装置 Active CN111782942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010589314.5A CN111782942B (zh) 2020-06-24 2020-06-24 基于品牌保护的搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010589314.5A CN111782942B (zh) 2020-06-24 2020-06-24 基于品牌保护的搜索方法及装置

Publications (2)

Publication Number Publication Date
CN111782942A CN111782942A (zh) 2020-10-16
CN111782942B true CN111782942B (zh) 2024-04-19

Family

ID=72759774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010589314.5A Active CN111782942B (zh) 2020-06-24 2020-06-24 基于品牌保护的搜索方法及装置

Country Status (1)

Country Link
CN (1) CN111782942B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010042983A1 (en) * 2008-10-14 2010-04-22 Remarqueble Pty Ltd Search, analysis and categorization
KR20150131413A (ko) * 2014-05-14 2015-11-25 이정행 광고 컨텐츠에 대한 분석 서비스를 제공하는 방법 및 장치
CN109522465A (zh) * 2018-10-22 2019-03-26 国家电网公司 基于知识图谱的语义搜索方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8301633B2 (en) * 2007-10-01 2012-10-30 Palo Alto Research Center Incorporated System and method for semantic search

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010042983A1 (en) * 2008-10-14 2010-04-22 Remarqueble Pty Ltd Search, analysis and categorization
KR20150131413A (ko) * 2014-05-14 2015-11-25 이정행 광고 컨텐츠에 대한 분석 서비스를 제공하는 방법 및 장치
CN109522465A (zh) * 2018-10-22 2019-03-26 国家电网公司 基于知识图谱的语义搜索方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向服务行业的垂直搜索语义模型改进方法;潘丽芳;李慧;李菲;;山西师范大学学报(自然科学版)(第03期);全文 *

Also Published As

Publication number Publication date
CN111782942A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN109033101B (zh) 标签推荐方法及装置
US10565533B2 (en) Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches
US8666984B2 (en) Unsupervised message clustering
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
EP1209582A2 (en) Document retrieval method and system and computer readable storage medium
CN103688260B (zh) 在实体解析系统中搜索实体的方法、计算机系统和装置
CN110637316B (zh) 用于预期对象识别的系统和方法
US20230306047A1 (en) Search system for providing search results using query understanding and semantic binary signatures
US8954378B2 (en) Data model optimization
CN111813930B (zh) 相似文档检索方法及装置
CN112347340B (zh) 信息搜索方法、装置和计算机设备
CN110569328A (zh) 实体链接方法、电子装置及计算机设备
US11017002B2 (en) Description matching for application program interface mashup generation
CN112115232A (zh) 一种数据纠错方法、装置及服务器
US20160140182A1 (en) Systems and methods for parsing search queries
CN110765761A (zh) 基于人工智能的合同敏感词校验方法、装置及存储介质
JP2001256253A (ja) 文書フィルタリング方法および装置
CN112417175A (zh) 面向维修工单的文档检索方法、系统、计算机及存储介质
WO2014062192A1 (en) Performing a search based on entity-related criteria
CN114491079A (zh) 知识图谱构建和查询方法、装置、设备和介质
US11550786B1 (en) System, method, and computer program for converting a natural language query to a structured database update statement
CN111782942B (zh) 基于品牌保护的搜索方法及装置
CN113312523B (zh) 字典生成、搜索关键字推荐方法、装置和服务器
JP5832869B2 (ja) カテゴリーマッチングを用いたキーワード抽出システムおよびキーワード抽出方法
US20140195561A1 (en) Search method and information managing apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40039480

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant