CN112650914A - 一种长尾关键词识别方法、关键词搜索方法及计算机设备 - Google Patents

一种长尾关键词识别方法、关键词搜索方法及计算机设备 Download PDF

Info

Publication number
CN112650914A
CN112650914A CN202011620258.3A CN202011620258A CN112650914A CN 112650914 A CN112650914 A CN 112650914A CN 202011620258 A CN202011620258 A CN 202011620258A CN 112650914 A CN112650914 A CN 112650914A
Authority
CN
China
Prior art keywords
keyword
keywords
long
atomic
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011620258.3A
Other languages
English (en)
Inventor
宋字林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sekorm Component Network Co Ltd
Original Assignee
Shenzhen Sekorm Component Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sekorm Component Network Co Ltd filed Critical Shenzhen Sekorm Component Network Co Ltd
Priority to CN202011620258.3A priority Critical patent/CN112650914A/zh
Publication of CN112650914A publication Critical patent/CN112650914A/zh
Priority to US17/553,858 priority patent/US20220207064A1/en
Priority to EP21216420.6A priority patent/EP4024231A1/en
Priority to JP2021209618A priority patent/JP7350364B2/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种长尾关键词识别方法、关键词搜索方法及计算机设备。该长尾关键词识别方法包括:S101、接收检索关键词,通过历史词库识别出检索关键词包含原子关键词的数量,其中历史词库包括多个原子关键词和每个原子关键词的权重值;S102、若检索关键词包含至少两个原子关键词,则将检索关键词作为组合关键词,根据组合关键词中所有原子关键词的权重值计算组合关键词的长尾权重值。本发明能有效识别出长尾关键词,并计算长尾关键词的长尾权重值,提高搜索过程中命中目标的精度。

Description

一种长尾关键词识别方法、关键词搜索方法及计算机设备
技术领域
本发明涉及搜索领域,更具体地说,涉及一种长尾关键词识别方法、关键词搜索方法及计算机设备。
背景技术
用户在互联网获取各种信息,通常是通过输入一个或多个搜索关键词,通过搜索引擎获取相关的信息。例如,参考附图1,搜索引擎中预建搜索关键词a和搜索关键词b的对应关系,即搜索关键词a对应文档1、文档2和文档3,搜索关键词b对应文档3、文档4、文档5和文档6。当用户输入搜索关键词b时,搜索引擎根据预建搜索关键词a和搜索关键词b的对应关系查找到搜索关键词b对应的文档3、文档4、文档5和文档6。
在用户同时输入两个或两个以上搜索关键词时,如果搜索引擎中没有所有搜索关键词匹配的资料,则如何将不同搜索关键词对应的资料进行优先级排序,以推荐给用户更符合预期的结果,是搜索领域长期存在的问题。现有技术简单通过每个搜索关键词的字数多少来确定搜索关键词的长尾属性,这种方式容易出现错误判定,搜索精度不高。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种长尾关键词识别方法、关键词搜索方法及计算机设备。
本发明解决其技术问题所采用的技术方案是:构造一种长尾关键词识别方法,包括:
S101、接收检索关键词,通过历史词库识别出所述检索关键词包含原子关键词的数量,其中所述历史词库包括多个所述原子关键词和每个所述原子关键词的权重值;
S102、若所述检索关键词包含至少两个所述原子关键词,则将所述检索关键词作为组合关键词,根据所述组合关键词中所有所述原子关键词的权重值计算所述组合关键词的长尾权重值。
进一步,在本发明所述的长尾关键词识别方法中,所述步骤S102中根据所述组合关键词中所有所述原子关键词的权重值计算所述组合关键词的长尾权重值包括:
S1021、判断所述组合关键词的所有所述原子关键词之间是否有词语包含关系;
S1022、若是,则剔除所述词语包含关系对应的原子关键词中权重值低的原子关键词,保留权重值高的原子关键词;
S1023、根据所述组合关键词中剩余所述原子关键词的权重值计算所述组合关键词的长尾权重值。
进一步,在本发明所述的长尾关键词识别方法中,在所述步骤S1022之后所述步骤S1023之前还包括:
S1024、判断所述组合关键词中保留所述原子关键词的数量;
S1025、若保留至少两个所述原子关键词,则执行所述步骤S1023;
S1026、若保留一个所述原子关键词,则将所述检索关键词作为原子关键词存储到所述历史词库中,并设置对应权重值。
进一步,在本发明所述的长尾关键词识别方法中,所述步骤S1023包括:将所述组合关键词中剩余所述原子关键词的权重值之和作为所述组合关键词的长尾权重值。
进一步,在本发明所述的长尾关键词识别方法中,在所述步骤S101之后还包括:
S103、若所述检索关键词包含一个所述原子关键词,则将所述检索关键词作为原子关键词存储到所述历史词库中,并设置对应权重值。
进一步,在本发明所述的长尾关键词识别方法中,所述步骤S102中根据所述组合关键词中所有所述原子关键词的权重值计算所述组合关键词的长尾权重值包括:
将所述组合关键词中所有所述原子关键词的权重值之和作为所述组合关键词的长尾权重值。
另外,本发明还提供一种关键词搜索方法,包括:
S201、搜索框接收用户输入的至少两个检索关键词;
S202、使用如上述的长尾关键词识别方法计算出每个所述检索关键词的长尾权重值。
进一步,在本发明所述的关键词搜索方法中,在所述步骤S202之后还包括:
S203、将所述长尾权重值最大的所述检索关键词作为长尾关键词,查找与所述长尾关键词对应的搜索结果。
进一步,在本发明所述的关键词搜索方法中,在所述步骤S202之后还包括:
S204、查找与每个所述检索关键词对应的搜索结果,所述搜索结果按照所述长尾权重值从高到低进行排序。
另外,本发明还提供一种计算机设备,包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器中存储的计算机程序以实现如上述的长尾关键词识别方法,或如上述的关键词搜索方法。
实施本发明的一种长尾关键词识别方法、关键词搜索方法及计算机设备,具有以下有益效果:本发明能有效识别出长尾关键词,并计算长尾关键词的长尾权重值,提高搜索过程中命中目标的精度。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是现有技术中关键词检索过程的流程图;
图2是一实施例提供的一种长尾关键词识别方法的流程图;
图3是一实施例提供的一种长尾关键词识别方法的流程图;
图4是一实施例提供的一种长尾关键词识别方法的流程图;
图5是一实施例提供的一种长尾关键词识别方法的流程图;
图6是一实施例提供的一种关键词搜索方法的流程图;
图7是一实施例提供的一种关键词搜索方法的流程图;
图8是一实施例提供的一种关键词搜索方法的流程图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
在一优选实施例中,参考图2,本实施例的长尾关键词识别方法包括下述步骤:
S101、接收检索关键词,通过历史词库识别出检索关键词包含原子关键词的数量,其中历史词库包括多个原子关键词和每个原子关键词的权重值。历史词库中原子关键词由人工设置或由机器学习得到,每个原子关键词对应有权重值。在接收到检索关键词后,按照历史词库中存储的原子关键词对检索关键词进行拆分,得到检索关键词对应的一个或多个原子关键词。拆分过程中,可能存在词语包含关系,即一个原子关键词包含另一个原子关键词;例如,检索关键词为“工业控制器”,其中“控制器”和“控制”都为原子关键词,且“控制器”和“控制”形成词语包含关系,即“控制器”包含“控制”。可以理解的,并非检索关键词的每个字都有对应的原子关键词;例如,检索关键词为“控制器”,而历史词库中仅有“控制”这个原子关键词,则检索关键词为“控制器”对应的原子关键词是“控制”。
S102、若检索关键词包含至少两个原子关键词,则将检索关键词作为组合关键词,根据组合关键词中所有原子关键词的权重值计算组合关键词的长尾权重值。将检索关键词拆分为原子关键词后,可能得到一个或多个原子关键词,若检索关键词包含至少两个原子关键词,则将检索关键词作为组合关键词,根据组合关键词中所有原子关键词的权重值计算组合关键词的长尾权重值。作为选择,将组合关键词中所有原子关键词的权重值之和作为组合关键词的长尾权重值,也可使用其他计算方法计算组合关键词中所有原子关键词的权重值对应的长尾权重值。
本实施例能有效识别出长尾关键词,并计算长尾关键词的长尾权重值,提高搜索过程中命中目标的精度。
在一些实施例中,参考图3,本实施例的长尾关键词识别方法中在步骤S101之后还包括:
S103、若检索关键词包含一个原子关键词,则将检索关键词作为原子关键词存储到历史词库中,并设置对应权重值。将检索关键词拆分为原子关键词后,可能得到一个或多个原子关键词,若检索关键词包含一个原子关键词,则可将该检索关键词作为原子关键词存储到历史词库中,并设置对应权重值。例如,检索关键词为“控制器”,而历史词库中仅有“控制”这个原子关键词,则可将检索关键词“控制器”作为新的原子关键词存储到历史词库中,并设置对应权重值。经过长期用户输入积累,可使历史词库更加符合用户习惯。
在一些实施例中,参考图4,在本实施例的长尾关键词识别方法中,步骤S102中根据组合关键词中所有原子关键词的权重值计算组合关键词的长尾权重值包括:
S1021、判断组合关键词的所有原子关键词之间是否有词语包含关系。拆分过程中,可能存在词语包含关系,即一个原子关键词包含另一个原子关键词;例如,检索关键词为“工业控制器”,其中“控制器”和“控制”都为原子关键词,且“控制器”和“控制”形成词语包含关系,即“控制器”包含“控制”。
S1022、若组合关键词的所有原子关键词之间有词语包含关系,则剔除词语包含关系对应的原子关键词中权重值低的原子关键词,保留权重值高的原子关键词。需要说明的是,本实施例并非以原子关键词的字数多少来进行剔除,即并非一定剔除字数少的原子关键词;而是以原子关键词的权重值为标准进行剔除,即比较组合关键词中所有原子关键词的权重值的大小,剔除词语包含关系对应的原子关键词中权重值低的原子关键词,保留权重值高的原子关键词。例如原子关键词“控制器”和“控制”形成词语包含关系,若“控制器”的权重值大于“控制”的权重值,则剔除原子关键词“控制”;若“控制器”的权重值小于“控制”的权重值,则剔除原子关键词“控制器”。
S1023、根据组合关键词中剩余原子关键词的权重值计算组合关键词的长尾权重值。剔除一部分原子关键词后,根据组合关键词中剩余原子关键词的权重值计算组合关键词的长尾权重值。作为选择,将组合关键词中剩余原子关键词的权重值之和作为组合关键词的长尾权重值,也可使用其他计算方法计算组合关键词中剩余原子关键词的权重值对应的长尾权重值。
本实施例进一步考虑原子关键词之间有词语包含关系,剔除权重值低的原子关键词,确保搜索范围更加精准,提高搜索过程中命中目标的精度。
在一些实施例中,参考图5,本实施例的长尾关键词识别方法中在步骤S1022之后步骤S1023之前还包括:
S1024、判断组合关键词中保留原子关键词的数量。剔除一部分原子关键词后,组合关键词中保留原子关键词可能为一个或多个。
S1025、若保留至少两个原子关键词,则执行步骤S1023。
S1026、若保留一个原子关键词,则将检索关键词作为原子关键词存储到历史词库中,并设置对应权重值。
在一优选实施例中,参考图6,本实施例还提供一种关键词搜索方法,包括:
S201、搜索框接收用户输入的至少两个检索关键词。搜索框为检索入口,用户可在搜索框中输入想要检索的内容,可通过空格或其他预设隔离字符来区分不同的检索关键词,在识别到用户输入两个或两个以上检索关键词时,才使用上述实施例的长尾关键词识别方法计算出每个检索关键词的长尾权重值;若用户仅输入一个搜索关键词,可使用现有技术进行检索即可。
S202、使用如上述实施例的长尾关键词识别方法计算出每个检索关键词的长尾权重值。
本实施例能有效识别出长尾关键词,并计算长尾关键词的长尾权重值,提高搜索过程中命中目标的精度。
在一些实施例中,参考图7,本实施例的关键词搜索方法中,在步骤S202之后还包括:S203、将长尾权重值最大的检索关键词作为长尾关键词,查找与长尾关键词对应的搜索结果。本实施例仅选取长尾权重值最大的检索关键词来检索,可将检索范围最小化且精确化。后台服务器保存有每个长尾关键词对应的内容,后台服务器查找与长尾关键词对应的搜索结果,返回至浏览器供用户查看。
在一些实施例中,参考图8,本实施例的关键词搜索方法中,在步骤S202之后还包括:S204、查找与每个检索关键词对应的搜索结果,搜索结果按照长尾权重值从高到低进行排序。对于一些检索关键词,如果仅采用长尾权重值最大的检索关键词,可能存在检索结果较少的情况,所以可采用所有检索关键词全部检索的策略,但需要对检索结果进行排序,即搜索结果按照长尾权重值从高到低进行排序。将搜索结果按照长尾权重值从高到低进行排序,以使用户想到看到的内容排列在前,方便用户查看。
在一优选实施例中,本实施例的计算机设备包括存储器和处理器;存储器用于存储计算机程序;处理器用于执行存储器中存储的计算机程序以实现如上述实施例的长尾关键词识别方法,或如上述实施例的关键词搜索方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据此实施,并不能限制本发明的保护范围。凡跟本发明权利要求范围所做的均等变化与修饰,均应属于本发明权利要求的涵盖范围。

Claims (10)

1.一种长尾关键词识别方法,其特征在于,包括:
S101、接收检索关键词,通过历史词库识别出所述检索关键词包含原子关键词的数量,其中所述历史词库包括多个所述原子关键词和每个所述原子关键词的权重值;
S102、若所述检索关键词包含至少两个所述原子关键词,则将所述检索关键词作为组合关键词,根据所述组合关键词中所有所述原子关键词的权重值计算所述组合关键词的长尾权重值。
2.根据权利要求1所述的长尾关键词识别方法,其特征在于,所述步骤S102中根据所述组合关键词中所有所述原子关键词的权重值计算所述组合关键词的长尾权重值包括:
S1021、判断所述组合关键词的所有所述原子关键词之间是否有词语包含关系;
S1022、若是,则剔除所述词语包含关系对应的原子关键词中权重值低的原子关键词,保留权重值高的原子关键词;
S1023、根据所述组合关键词中剩余所述原子关键词的权重值计算所述组合关键词的长尾权重值。
3.根据权利要求2所述的长尾关键词识别方法,其特征在于,在所述步骤S1022之后所述步骤S1023之前还包括:
S1024、判断所述组合关键词中保留所述原子关键词的数量;
S1025、若保留至少两个所述原子关键词,则执行所述步骤S1023;
S1026、若保留一个所述原子关键词,则将所述检索关键词作为原子关键词存储到所述历史词库中,并设置对应权重值。
4.根据权利要求2所述的长尾关键词识别方法,其特征在于,所述步骤S1023包括:将所述组合关键词中剩余所述原子关键词的权重值之和作为所述组合关键词的长尾权重值。
5.根据权利要求1所述的长尾关键词识别方法,其特征在于,在所述步骤S101之后还包括:
S103、若所述检索关键词包含一个所述原子关键词,则将所述检索关键词作为原子关键词存储到所述历史词库中,并设置对应权重值。
6.根据权利要求1所述的长尾关键词识别方法,其特征在于,所述步骤S102中根据所述组合关键词中所有所述原子关键词的权重值计算所述组合关键词的长尾权重值包括:
将所述组合关键词中所有所述原子关键词的权重值之和作为所述组合关键词的长尾权重值。
7.一种关键词搜索方法,其特征在于,包括:
S201、搜索框接收用户输入的至少两个检索关键词;
S202、使用如权利要求1至6任一项所述的长尾关键词识别方法计算出每个所述检索关键词的长尾权重值。
8.根据权利要求7所述的关键词搜索方法,其特征在于,在所述步骤S202之后还包括:
S203、将所述长尾权重值最大的所述检索关键词作为长尾关键词,查找与所述长尾关键词对应的搜索结果。
9.根据权利要求7所述的关键词搜索方法,其特征在于,在所述步骤S202之后还包括:
S204、查找与每个所述检索关键词对应的搜索结果,所述搜索结果按照所述长尾权重值从高到低进行排序。
10.一种计算机设备,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器中存储的计算机程序以实现如权利要求1至6任一项所述的长尾关键词识别方法,或如权利要求7至9任一项所述的关键词搜索方法。
CN202011620258.3A 2020-12-30 2020-12-30 一种长尾关键词识别方法、关键词搜索方法及计算机设备 Pending CN112650914A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202011620258.3A CN112650914A (zh) 2020-12-30 2020-12-30 一种长尾关键词识别方法、关键词搜索方法及计算机设备
US17/553,858 US20220207064A1 (en) 2020-12-30 2021-12-17 Long-tail keyword identification method, keywoard search method, and computer apparatus
EP21216420.6A EP4024231A1 (en) 2020-12-30 2021-12-21 Long-tail keyword identification method, keywoard search method, and computer apparatus
JP2021209618A JP7350364B2 (ja) 2020-12-30 2021-12-23 コンピュータ機器が実行するロングテールキーワードの識別方法、キーワード検索方法及びコンピュータ機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011620258.3A CN112650914A (zh) 2020-12-30 2020-12-30 一种长尾关键词识别方法、关键词搜索方法及计算机设备

Publications (1)

Publication Number Publication Date
CN112650914A true CN112650914A (zh) 2021-04-13

Family

ID=75366721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011620258.3A Pending CN112650914A (zh) 2020-12-30 2020-12-30 一种长尾关键词识别方法、关键词搜索方法及计算机设备

Country Status (4)

Country Link
US (1) US20220207064A1 (zh)
EP (1) EP4024231A1 (zh)
JP (1) JP7350364B2 (zh)
CN (1) CN112650914A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116842168A (zh) * 2023-08-30 2023-10-03 汉王科技股份有限公司 跨领域问题处理方法、装置、电子设备及存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004110271A (ja) * 2002-09-17 2004-04-08 Ntt Data Technology Corp 類似文書検索方法
CN101196900A (zh) * 2007-12-27 2008-06-11 中国移动通信集团湖北有限公司 一种基于元数据的信息检索方法
US20090125505A1 (en) * 2007-11-13 2009-05-14 Kosmix Corporation Information retrieval using category as a consideration
CN102456058A (zh) * 2010-11-02 2012-05-16 阿里巴巴集团控股有限公司 类目信息提供方法及装置
CN103092856A (zh) * 2011-10-31 2013-05-08 阿里巴巴集团控股有限公司 搜索结果排序方法及设备、搜索方法及设备
CN103106282A (zh) * 2013-02-27 2013-05-15 王义东 一种网页搜索与展示的方法
CN103123624A (zh) * 2011-11-18 2013-05-29 阿里巴巴集团控股有限公司 确定中心词的方法及装置、搜索方法及装置
CN103678629A (zh) * 2013-12-19 2014-03-26 北京大学 一种地理位置敏感的搜索引擎方法和系统
CN103699625A (zh) * 2013-12-20 2014-04-02 北京百度网讯科技有限公司 基于关键词进行检索的方法及装置
CN104268175A (zh) * 2014-09-15 2015-01-07 乐视网信息技术(北京)股份有限公司 一种数据搜索的装置及其方法
CN106651535A (zh) * 2016-12-29 2017-05-10 北京奇虎科技有限公司 一种地域性应用挖掘方法及装置
CN107315823A (zh) * 2017-07-04 2017-11-03 北京京东尚科信息技术有限公司 基于电子商务的数据处理方法与装置
CN108009293A (zh) * 2017-12-26 2018-05-08 北京百度网讯科技有限公司 视频标签生成方法、装置、计算机设备和存储介质
CN108846037A (zh) * 2018-05-29 2018-11-20 天津字节跳动科技有限公司 提示搜索词的方法和装置
CN110287307A (zh) * 2019-05-05 2019-09-27 浙江吉利控股集团有限公司 一种搜索结果排序方法、装置及服务器

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ138199A0 (en) * 1999-07-02 1999-07-29 Telstra R & D Management Pty Ltd A search system
US20020073079A1 (en) * 2000-04-04 2002-06-13 Merijn Terheggen Method and apparatus for searching a database and providing relevance feedback
WO2010096986A1 (zh) * 2009-02-27 2010-09-02 华为技术有限公司 移动搜索方法及装置
JP6164596B2 (ja) * 2015-09-25 2017-07-19 データ・サイエンティスト株式会社 キーワードターゲティングシステム、キーワードターゲティング装置、サーバ装置、キーワードターゲティング方法、及びプログラム
CN111831786A (zh) * 2020-07-24 2020-10-27 刘秀萍 完善主题词的全文数据库精准高效检索方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004110271A (ja) * 2002-09-17 2004-04-08 Ntt Data Technology Corp 類似文書検索方法
US20090125505A1 (en) * 2007-11-13 2009-05-14 Kosmix Corporation Information retrieval using category as a consideration
CN101196900A (zh) * 2007-12-27 2008-06-11 中国移动通信集团湖北有限公司 一种基于元数据的信息检索方法
CN102456058A (zh) * 2010-11-02 2012-05-16 阿里巴巴集团控股有限公司 类目信息提供方法及装置
JP2014532928A (ja) * 2011-10-31 2014-12-08 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 検索結果をランク付けする方法および装置ならびに検索方法および装置
CN103092856A (zh) * 2011-10-31 2013-05-08 阿里巴巴集团控股有限公司 搜索结果排序方法及设备、搜索方法及设备
CN103123624A (zh) * 2011-11-18 2013-05-29 阿里巴巴集团控股有限公司 确定中心词的方法及装置、搜索方法及装置
CN103106282A (zh) * 2013-02-27 2013-05-15 王义东 一种网页搜索与展示的方法
CN103678629A (zh) * 2013-12-19 2014-03-26 北京大学 一种地理位置敏感的搜索引擎方法和系统
CN103699625A (zh) * 2013-12-20 2014-04-02 北京百度网讯科技有限公司 基于关键词进行检索的方法及装置
CN104268175A (zh) * 2014-09-15 2015-01-07 乐视网信息技术(北京)股份有限公司 一种数据搜索的装置及其方法
CN106651535A (zh) * 2016-12-29 2017-05-10 北京奇虎科技有限公司 一种地域性应用挖掘方法及装置
CN107315823A (zh) * 2017-07-04 2017-11-03 北京京东尚科信息技术有限公司 基于电子商务的数据处理方法与装置
WO2019007352A1 (zh) * 2017-07-04 2019-01-10 北京京东尚科信息技术有限公司 基于电子商务的数据处理方法与装置
CN108009293A (zh) * 2017-12-26 2018-05-08 北京百度网讯科技有限公司 视频标签生成方法、装置、计算机设备和存储介质
CN108846037A (zh) * 2018-05-29 2018-11-20 天津字节跳动科技有限公司 提示搜索词的方法和装置
CN110287307A (zh) * 2019-05-05 2019-09-27 浙江吉利控股集团有限公司 一种搜索结果排序方法、装置及服务器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116842168A (zh) * 2023-08-30 2023-10-03 汉王科技股份有限公司 跨领域问题处理方法、装置、电子设备及存储介质
CN116842168B (zh) * 2023-08-30 2023-11-14 汉王科技股份有限公司 跨领域问题处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
US20220207064A1 (en) 2022-06-30
EP4024231A1 (en) 2022-07-06
JP2022104892A (ja) 2022-07-12
JP7350364B2 (ja) 2023-09-26

Similar Documents

Publication Publication Date Title
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
CA2638558A1 (en) Topic word generation method and system
CN110098961B (zh) 一种数据质量评估方法、装置及存储介质
EP2631815A1 (en) Method and device for ordering search results, method and device for providing information
US20160364428A1 (en) Database update and analytics system
CN109190014B (zh) 一种正则表达式生成方法、装置及电子设备
CN106844482B (zh) 一种基于搜索引擎的检索信息匹配方法及装置
US9317606B1 (en) Spell correcting long queries
CN117171331B (zh) 基于大型语言模型的专业领域信息交互方法、装置及设备
CN112650914A (zh) 一种长尾关键词识别方法、关键词搜索方法及计算机设备
JP5324677B2 (ja) 類似文書検索支援装置及び類似文書検索支援プログラム
CN112528703A (zh) 一种识别表格结构的方法、装置及电子设备
JP5179564B2 (ja) クエリセグメント位置決定装置
CN110287284B (zh) 语义匹配方法、装置及设备
CN114003685B (zh) 分词位置索引构建方法及其装置、文档检索方法及其装置
CN105893397A (zh) 一种视频推荐方法及装置
JP4479745B2 (ja) 文書の類似度補正方法、プログラムおよびコンピュータ
CN111737397A (zh) 信息处理装置、文档管理系统、记录媒体及信息处理方法
JP2020071678A (ja) 情報処理装置、制御方法、プログラム
CN113468339A (zh) 基于知识图谱的标签提取方法、系统、电子设备及介质
CN115917527A (zh) 文档检索装置、文档检索系统、文档检索程序、以及文档检索方法
US10552459B2 (en) Classifying a document using patterns
AU2021289542B2 (en) Refining a search request to a content provider
CN112084290B (zh) 一种数据检索方法、装置、设备及存储介质
US20230122609A1 (en) Automatically evaluating summarizers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination