CN106909647B - 一种数据检索方法及装置 - Google Patents

一种数据检索方法及装置 Download PDF

Info

Publication number
CN106909647B
CN106909647B CN201710094018.6A CN201710094018A CN106909647B CN 106909647 B CN106909647 B CN 106909647B CN 201710094018 A CN201710094018 A CN 201710094018A CN 106909647 B CN106909647 B CN 106909647B
Authority
CN
China
Prior art keywords
data
retrieval
module
index table
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710094018.6A
Other languages
English (en)
Other versions
CN106909647A (zh
Inventor
林利炜
卢雪兵
吴剑英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FUJIAN RONGJI SOFTWARE Co Ltd
Original Assignee
FUJIAN RONGJI SOFTWARE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FUJIAN RONGJI SOFTWARE Co Ltd filed Critical FUJIAN RONGJI SOFTWARE Co Ltd
Priority to CN201710094018.6A priority Critical patent/CN106909647B/zh
Publication of CN106909647A publication Critical patent/CN106909647A/zh
Application granted granted Critical
Publication of CN106909647B publication Critical patent/CN106909647B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种数据检索方法及装置,其中方法包括如下步骤,接收用户输入的检索内容信息,根据字典树对所述检索内容信息进行最大切词得到切词结果,根据切词结果在索引表中匹配数据字段,根据索引表中数据字段的分值计算各个数据字段对应的检索结果的总分值,根据总分值对检索结果进行排序。

Description

一种数据检索方法及装置
技术领域
本发明涉及数据检索领域,尤其涉及一种根据权限控制筛选需要结果的检索方法。
背景技术
目前对于数据库中的某个字段的内容的检索匹配,大部分都采用数据库中具有的操作,比如INSTR、LIKE等数据库操作语言进行模糊查询;也有的使用数据库提供的全文检索功能。
其中,INSTR、LIKE操作是对数据库中的某个字段的值进行匹配查询,全文检索是将字段中的值经过处理后,生成索引,然后对字段中的所有值进行统计,并且可以得出匹配得分。
使用LUCENE/SOLR等搜索引擎,先切词索引,以实现快速的文字搜索,同时可以搜索排序更加贴近语义,但是权限过滤并不擅长
在实际项目中,我们对于一些数据的查询往往具有权限域的,具有相应的权限,才能查询到权限内的数据结果。
发明内容
INSTR、LIKE操作可能会吃掉数据库服务器大部分的cpu,并且有时候即使我们在表中已经建立了索引,它还是会不走索引的,这就会导致查询速度变慢。
oracle mssql等数据库内的检索返回数据量庞大,不会进行结果优化,我们无法根据查询到的内容与关键字之间的相关度进行排序,将用户更想要的内容优先显示。
数据库提供的全文检索,单字会搜索不到结果,关键字断字也搜索不到结果。不能进行通过权限域控制查询结果的显示。
同时目前的搜索引擎、数据库全文检索,都不是实时结果查询,而是得定期提交内容或者重新建立索引。并且权限结合的时候,一旦基础权限数据改变,要么大量改变相关数据的权限信息,送索引很慢,要么搜索的时候需要跨库链接,非常缓慢。
为此,需要提供一种新的检索方法,解决现有技术的上述问题。
为实现上述目的,发明人提供了一种数据检索方法,包括如下步骤,接收用户输入的检索内容信息,根据字典树对所述检索内容信息进行最大切词得到切词结果,根据切词结果在索引表中匹配数据字段,根据索引表中数据字段的分值计算各个数据字段对应的检索结果的总分值,根据总分值对检索结果进行排序。
进一步地,还包括步骤,根据用户的权限信息对检索结果进行筛选显示。
具体地,还包括步骤,验证用户权限信息。
进一步地,还包括步骤,建立基础表,所述基础表包括数据、数据对应的权限信息;所述数据用于作为检索结果显示,
还包括步骤,根据用户的权限信息及数据对应的权限信息对检索结果进行筛选显示。
进一步地,还包括步骤,建立索引表,对基础表中的数据进行切词得到数据字段,将数据字段、数据字段的分值及其对应的数据存储进索引表中。
具体地,所述数据字段的分值计算方法为:
Figure BDA0001229813370000021
具体地,所述基础表还包括数据对应的编号。
一种数据检索装置,包括接收模块、切词模块、匹配模块、分值计算模块、排序模块;
所述接收模块用于接收用户输入的检索内容信息,所述切词模块用于根据字典树对所述检索内容信息进行最大切词得到切词结果,所述匹配模块用于根据切词结果在索引表中匹配数据字段,所述分值计算模块用于根据索引表中数据字段的分值计算各个数据字段对应的检索结果的总分值,所述排序模块用于根据总分值对检索结果进行排序。
进一步地,还包括筛选模块,所述筛选模块用于根据用户的权限信息对检索结果进行筛选显示。
具体地,还包括验证模块,所述验证模块用于验证用户权限信息。
进一步地,还包括基础表建立模块,所述基础表建立模块用于建立基础表,所述基础表包括数据、数据对应的权限信息;所述数据用于作为检索结果显示,
还包括筛选模块,所述筛选模块用于根据用户的权限信息及数据对应的权限信息对检索结果进行筛选显示。
进一步地,还包括索引表建立模块,所述索引表建立模块用于建立索引表,具体用于对基础表中的数据进行切词得到数据字段,将数据字段、数据字段的分值及其对应的数据存储进索引表中。
具体地,所述数据字段的分值计算方法为:
进一步地,所述基础表还包括数据对应的编号。
区别于现有技术,上述技术方案通过建立索引,使查询速度更快,能够根据与查询的关键字相关度进行排序显示,支持的查询结果更准确,可通过权限域控制查询结果。
附图说明
图1为本发明具体实施例所述的数据检索方法流程图;
图2为本发明具体实施例所述的字典树示例图;
图3为本发明具体实施方式所述的数据检索装置模块图
附图标记说明:
300、接收模块;
302、切词模块;
304、分值计算模块;
306、匹配模块;
308、排序模块;
310、筛选模块;
312、验证模块;
314、基础表建立模块;
316、索引表建立模块。
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
请参阅图1,为本发明一种数据检索方法流程图,包括如下步骤,S104接收用户输入的检索内容信息,S106根据字典树对所述检索内容信息进行最大切词得到切词结果,S108根据切词结果在索引表中匹配数据字段,根据索引表中数据字段的分值计算各个数据字段对应的检索结果的总分值,S110根据总分值对检索结果进行排序。具体的,所述检索内容信息为任意字符信息,字典树的类型与检索内容信息的语言对应,以中文简体为例,则字典树为拼音字典树,用倒序法进行填充字典树,方便之后最大化匹配。
图2给出了sang、gang、san的字典树实例。这里我们以sangang进行说明匹配方法,这里sangang会被最大化匹配为san’gang而不是sang‘ang。因为我们倒序匹配到第一个a的时候,其前面的字符为g,从字典树发现a有子节点g、s,所以可以得知这个g能跟后面的ang组成最大化拼音。所以这边就匹配成gang而不是ang,然后继续匹配,知道发现s前面没有字符了,所以sangang就会被匹配成san’gang。假如我们想将sangang匹配成sang’ang我们只需要用’将他们分隔下就可以。
所述切词结果为检索内容信息根据字典树的切分,中文切成单字,拼音则根据拼音字典树进行最大切词,其他语言类似;将输入的值进行简单切词:汉字切成单字、双字,拼音通过字典树进行匹配。例如在进行步骤S104时,用户想要查询张*颖”这个人,我们突然忘了中间那个字是什么。这时候我们输入“张颖”或者拼音“zhangying”,这里将输入的值切词为:张、颖、张颖或者zhang、ying、zhangying。所述索引表包括了切词结果的分数计算规则,一般来说,切词结果与检索结果越相近,则得分越高,因此最终与切词结果,即与检索内容越像的检索结果,就会被排序显示出来,通过上述步骤,解决了检索内容通过切分词快速查找,快速排序的问题。提高了现有检索引擎的查找速度。
在其他一些实施例中,用户在使用本发明方法时候可以进行用户权限信息的验证步骤,如输入账号密码等,进一步地,本发明还包括步骤,根据用户的权限信息对检索结果进行筛选显示。例如某些账户只能显示低安全性的数据,高级账户可以显示更高安全性的数据等等。
在图1所示的进一步的实施例中,基础表、索引表可以按照如下述方式建立,步骤S100,建立基础表,所述基础表包括数据、数据对应的权限信息;所述数据用于作为检索结果显示,
如,以数据是姓名为例,数据对应的权限信息为三位数字,见下表,
Figure BDA0001229813370000051
Figure BDA0001229813370000061
具体地,所述基础表还包括数据对应的编号。为了将姓名与权信息进行对应,可以在基础表中增加“编号”属性,在编号为01的姓名中,001代表第一部门001001代表第一部门第一小组。
在具体地实施例中,还包括步骤,根据用户的权限信息(账号密码或用户本身的权限等级)及数据对应的权限信息(三位一级)对检索结果进行筛选显示。这样,部门级的权限能查询到该部门下的所有人。小组级的权限仅能查询到小组内成员。
进一步的实施例中,还包括步骤S102,建立索引表,对基础表中的数据进行切词得到数据字段,将数据字段、数据字段的分值及其对应的数据存储进索引表中。
字段的分值算法只需要与数据重合度正相关即可,在我们的具体实施例中,所述数据字段的分值计算方法为:
Figure BDA0001229813370000062
这里拿编号01权限001的张晨颖为例。
张晨颖的切词结果为张、晨、颖、张晨、晨颖
所以
张、晨、颖、zhang、chen、ying的分值为结果取整为577
张晨、晨颖、zhangchen、chenying的分值为
Figure BDA0001229813370000064
结果取整为816。
将字段对应的编号、切词结果、分值存储进索引表,如下:
字段 编号 分值
01 577
zhang 01 577
张晨 01 816
在我们的实施例中,索引表给出了不同数据如01下可分的不同字段的对应分值都存储进了索引表,结合之前的实施例,步骤S108能够具体化,如下所述,包括步骤从索引表中查出各个切词结果的分值,并且通过分组统计每个编号的总分值,并降序排序。
到索引表中找出关键字的值是张或者颖或者张颖或者值是zhang、ying、zhangying,找出符合条件的数据,并通过编号进行分组统计分值,按照分值大到小排序。
这里,由于拼音和对应的汉字的分值是一样的,因此通过拼音查询到的结果,也是和上表一样。
编号 分值
04 1414
02 1154
03 577
01 577
随后进行步骤,根据基础表中的权限设定,进行对结果进行筛选;
通过第四步得到符合关键字搜索结果的编号和分值,接下来就是对于权限内的人员筛选,这里我们具有的权限是部门一,也就是只要人员的权限是001开头的就是我们权限内的人员。所以我们由基础表和索引表的结合比对,得出编号为01、02、03在权限内,通过分值排序得出他们的分值由高到低为02、03、01,所以将基础表中编号为02、03、01的数据当做结果返回,即
张晨颖、
余晨颖、
徐颖星。
随后根据匹配结果得到符合条件的编号,通过使用这些编号查询基础表中的数据,将查询到的结果进行显示,供用户选择。
上述实施例中降序排序得到结果为(02/张晨颖、03/余晨颖、01/徐颖星),可得知权限域内张晨颖与关键字匹配度最高,符合我们的要求。故将它们按分值高低显示,供客户选择。
通过上述方法,建立索引表,将检索细化为多个字段并有对应分值,在用户输入检索内容切词后直接对应字段进行匹配计算分值,能够有效地提高检索的效率。使查询速度更快,能够根据与查询的关键字相关度进行排序显示,支持的查询结果更准确,可通过权限域控制查询结果。
一种数据检索装置,包括接收模块300、切词模块302、分值计算模块304、匹配模块306、排序模块308;
所述接收模块用于接收用户输入的检索内容信息,所述切词模块用于根据字典树对所述检索内容信息进行最大切词得到切词结果,所述分值计算模块用于根据索引表计算各个切词结果的分值,所述匹配模块用于根据切词结果在索引表中匹配数据字段,所述分值计算模块用于根据索引表中数据字段的分值计算各个数据字段对应的检索结果的总分值,所述排序模块用于根据总分值对检索结果进行排序。上述装置达到了通过切词查找快速检索,提高了现有检索装置的检索速度。
进一步的实施例中,还包括筛选模块310,所述筛选模块用于根据用户的权限信息对检索结果进行筛选显示。通过筛选模块能够更方便结果的展示及用户的使用。
具体的实施例中,还包括验证模块312,所述验证模块用于验证用户权限信息。
进一步地,还包括基础表建立模块314,所述基础表建立模块用于建立基础表,所述基础表包括数据、数据对应的权限信息;所述数据用于作为检索结果显示,
还包括筛选模块310,所述筛选模块用于根据用户的权限信息及数据对应的权限信息对检索结果进行筛选显示。
进一步地,还包括索引表建立模块316,所述索引表建立模块用于建立索引表,具体用于对基础表中的数据进行切词得到数据字段,将数据字段、数据字段的分值及其对应的数据存储进索引表中。通过建立基础表及索引表,将检索细化为多个字段并有对应分值,在用户输入检索内容切词后直接对应字段进行匹配计算分值,能够有效地提高检索的效率。
具体地,所述数据字段的分值计算方法为:
Figure BDA0001229813370000091
进一步地,所述基础表还包括数据对应的编号。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括……”或“包含……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外,在本文中,“大于”、“小于”、“超过”等理解为不包括本数;“以上”、“以下”、“以内”等理解为包括本数。
本领域内的技术人员应明白,上述各实施例可提供为方法、装置、或计算机程序产品。这些实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。上述各实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机设备可读取的存储介质中,用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备,包括但不限于:个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等;所述的存储介质,包括但不限于:RAM、ROM、磁碟、磁带、光盘、闪存、U盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。
上述各实施例是参照根据实施例所述的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到计算机设备的处理器以产生一个机器,使得通过计算机设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机设备以特定方式工作的计算机设备可读存储器中,使得存储在该计算机设备可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机设备上,使得在计算机设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已经对上述各实施例进行了描述,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改,所以以上所述仅为本发明的实施例,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围之内。

Claims (10)

1.一种数据检索方法,其特征在于,包括如下步骤,接收用户输入的检索内容信息,根据字典树对所述检索内容信息进行最大切词得到切词结果,根据切词结果在索引表中匹配数据字段,根据索引表中数据字段的分值计算各个数据字段对应的检索结果的总分值,根据总分值对检索结果进行排序;还包括步骤,建立基础表,所述基础表包括数据、数据对应的权限信息;所述数据用于作为检索结果显示,根据用户的权限信息及数据对应的权限信息对检索结果进行筛选显示;还包括步骤,建立索引表,对基础表中的数据进行切词得到数据字段,将数据字段、数据字段的分值及其对应的数据存储进索引表中。
2.根据权利要求1所述的数据检索方法,其特征在于,还包括步骤,根据用户的权限信息对检索结果进行筛选显示。
3.根据权利要求2所述的数据检索方法,其特征在于,还包括步骤,验证用户权限信息。
4.根据权利要求1所述的数据检索方法,其特征在于,所述数据字段的分值计算方法为:
Figure FDA0002151117710000011
5.根据权利要求1所述的数据检索方法,其特征在于,所述基础表还包括数据对应的编号。
6.一种数据检索装置,其特征在于,包括接收模块、切词模块、匹配模块、分值计算模块、排序模块;
所述接收模块用于接收用户输入的检索内容信息,所述切词模块用于根据字典树对所述检索内容信息进行最大切词得到切词结果,所述匹配模块用于根据切词结果在索引表中匹配数据字段,所述分值计算模块用于根据索引表中数据字段的分值计算各个数据字段对应的检索结果的总分值,所述排序模块用于根据总分值对检索结果进行排序,
还包括基础表建立模块,所述基础表建立模块用于建立基础表,所述基础表包括数据、数据对应的权限信息;所述数据用于作为检索结果显示,
还包括筛选模块,所述筛选模块用于根据用户的权限信息及数据对应的权限信息对检索结果进行筛选显示;
还包括索引表建立模块,所述索引表建立模块用于建立索引表,具体用于对基础表中的数据进行切词得到数据字段,将数据字段、数据字段的分值及其对应的数据存储进索引表中。
7.根据权利要求6所述的数据检索装置,其特征在于,还包括筛选模块,所述筛选模块用于根据用户的权限信息对检索结果进行筛选显示。
8.根据权利要求7所述的数据检索装置,其特征在于,还包括验证模块,所述验证模块用于验证用户权限信息。
9.根据权利要求6所述的数据检索装置,其特征在于,所述数据字段的分值计算方法为:
Figure FDA0002151117710000021
10.根据权利要求6所述的数据检索装置,其特征在于,所述基础表还包括数据对应的编号。
CN201710094018.6A 2017-02-21 2017-02-21 一种数据检索方法及装置 Active CN106909647B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710094018.6A CN106909647B (zh) 2017-02-21 2017-02-21 一种数据检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710094018.6A CN106909647B (zh) 2017-02-21 2017-02-21 一种数据检索方法及装置

Publications (2)

Publication Number Publication Date
CN106909647A CN106909647A (zh) 2017-06-30
CN106909647B true CN106909647B (zh) 2020-01-03

Family

ID=59209218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710094018.6A Active CN106909647B (zh) 2017-02-21 2017-02-21 一种数据检索方法及装置

Country Status (1)

Country Link
CN (1) CN106909647B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363768A (zh) * 2018-02-07 2018-08-03 深圳壹账通智能科技有限公司 一种基于Lucene的文档搜索方法、存储介质和服务器
CN110310731A (zh) * 2019-07-08 2019-10-08 苏州阿基米德网络科技有限公司 一种信息匹配查询系统及其查询方法
CN110866085A (zh) * 2019-11-04 2020-03-06 北京百分点信息科技有限公司 数据反馈方法与装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101526956A (zh) * 2009-03-30 2009-09-09 清华大学 基于内容引用的网页搜索结果排序方法
CN102770863A (zh) * 2010-02-24 2012-11-07 三菱电机株式会社 检索装置以及检索程序
CN103186650A (zh) * 2011-12-30 2013-07-03 中国移动通信集团四川有限公司 一种搜索方法和装置
CN106354721A (zh) * 2015-07-14 2017-01-25 杭州海康威视系统技术有限公司 基于权限的检索方法和装置
CN106407267A (zh) * 2016-08-26 2017-02-15 广州慧睿思通信息科技有限公司 一种基于全文检索的数据分类与数据检索的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9177019B2 (en) * 2009-05-19 2015-11-03 Sap Se Computer system for optimizing the processing of a query

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101526956A (zh) * 2009-03-30 2009-09-09 清华大学 基于内容引用的网页搜索结果排序方法
CN102770863A (zh) * 2010-02-24 2012-11-07 三菱电机株式会社 检索装置以及检索程序
CN103186650A (zh) * 2011-12-30 2013-07-03 中国移动通信集团四川有限公司 一种搜索方法和装置
CN106354721A (zh) * 2015-07-14 2017-01-25 杭州海康威视系统技术有限公司 基于权限的检索方法和装置
CN106407267A (zh) * 2016-08-26 2017-02-15 广州慧睿思通信息科技有限公司 一种基于全文检索的数据分类与数据检索的方法及装置

Also Published As

Publication number Publication date
CN106909647A (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
US9448992B2 (en) Natural language search results for intent queries
WO2021068610A1 (zh) 资源推荐的方法、装置、电子设备及存储介质
JP5575902B2 (ja) クエリのセマンティックパターンに基づく情報検索
CN108304444B (zh) 信息查询方法及装置
US9613165B2 (en) Autocomplete searching with security filtering and ranking
US20170161375A1 (en) Clustering documents based on textual content
US20120072462A1 (en) Processing of categorized product information
US20110225161A1 (en) Categorizing products
CN110968800B (zh) 一种信息推荐方法、装置、电子设备及可读存储介质
CN106909647B (zh) 一种数据检索方法及装置
CN110968789B (zh) 电子书推送方法、电子设备及计算机存储介质
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
US9501559B2 (en) User-guided search query expansion
CN110569419A (zh) 问答系统优化方法、装置、计算机设备及存储介质
US10565188B2 (en) System and method for performing a pattern matching search
CN113468441A (zh) 基于权重调整的搜索排序方法、装置、设备及存储介质
US11526672B2 (en) Systems and methods for term prevalance-volume based relevance
CN106294784B (zh) 资源搜索方法及装置
US10261972B2 (en) Methods and systems for similarity matching
CN111831938A (zh) 信息显示方法、装置、电子设备及介质
US9646094B2 (en) System and method for performing a multiple pass search
CN108182201B (zh) 基于重点关键词的应用拓展方法和装置
US11886409B1 (en) Searchable catalog of columnar numerical data
US10474714B2 (en) Method and component for classifying resources of a database
CN110909130B (zh) 文本主题提取分析方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant