CN113407586A - 数据检索方法、装置、办公系统、存储介质及电子设备 - Google Patents
数据检索方法、装置、办公系统、存储介质及电子设备 Download PDFInfo
- Publication number
- CN113407586A CN113407586A CN202110808521.XA CN202110808521A CN113407586A CN 113407586 A CN113407586 A CN 113407586A CN 202110808521 A CN202110808521 A CN 202110808521A CN 113407586 A CN113407586 A CN 113407586A
- Authority
- CN
- China
- Prior art keywords
- library
- target
- data source
- sub
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000000875 corresponding effect Effects 0.000 claims description 51
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 230000002596 correlated effect Effects 0.000 claims description 4
- 230000002035 prolonged effect Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 8
- 230000006399 behavior Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000008676 import Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种数据检索方法、装置、办公系统、存储介质及电子设备,涉及数据处理技术领域,尤其涉及智能搜索领域。具体实现方案为:获取目标关键词;利用目标关键词,在预设索引库包括的多个数据源中进行检索,得到多个数据源的检索结果;响应于预设检索库包括目标关键词,根据预设检索库,获取目标关键词对应的目标数据源;重配置多个数据源的全局排序权重,其中,重配置后的目标数据源的排序权重大于多个数据源中其他数据源的排序权重;按照排序权重从大到小的顺序,显示多个数据源的检索结果。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及智能搜索领域。
背景技术
随着时代的发展及技术的进步,应用于企业内部的即时通讯办公系统开始在市场上萌芽。这类办公系统高度整合了企业内部的各种应用场景和业务需求,账户登录并操作该办公系统,能够完成企业内部的沟通、办公、学习和会议等多种行为。
对于大型企业内部的办公系统来说,其具有多样功能,并且存储了海量信息。因为多样功能和海量信息的存在,对所有有效信息的检索能力,成为企业内部的办公系统的一种基础技术能力。
发明内容
本公开提供了一种数据检索方法、装置、办公系统、存储介质及电子设备。
根据本公开的第一方面,提供了一种数据检索方法,包括:
获取目标关键词;
利用所述目标关键词,在预设索引库包括的多个数据源中进行检索,得到所述多个数据源的检索结果;
响应于预设检索库包括所述目标关键词,根据所述预设检索库,获取所述目标关键词对应的目标数据源;
重配置所述多个数据源的全局排序权重,其中,重配置后的所述目标数据源的排序权重大于所述多个数据源中其他数据源的排序权重;
按照排序权重从大到小的顺序,显示所述多个数据源的检索结果。
根据本公开的第二方面,提供了一种数据检索装置,包括:
第一获取单元,用于获取目标关键词;
第一检索单元,用于利用所述目标关键词,在预设索引库包括的多个数据源中进行检索,得到所述多个数据源的检索结果;
第二获取单元,用于响应于预设检索库包括所述目标关键词,根据所述预设检索库,获取所述目标关键词对应的目标数据源;
调权单元,用于重配置所述多个数据源的全局排序权重,其中,重配置后的所述目标数据源的排序权重大于所述多个数据源中其他数据源的排序权重;
显示单元,用于按照排序权重从大到小的顺序,显示所述多个数据源的检索结果。
根据本公开的第三方面,提供了一种办公系统,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一所述的数据检索方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一所述的数据检索方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一所述的数据检索方法。
根据本公开的第六方面,提供了一种电子设备,包括如第三方面所述的办公系统。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例提供的一种楼层示意图;
图2是本公开实施例提供的数据检索方法的第一种示意图;
图3是本公开实施例提供的数据源入库的一种示意图;
图4是本公开实施例提供的数据检索方法的第二种示意图;
图5是本公开实施例提供的数据检索方法的第三种示意图;
图6是本公开实施例提供的数据检索装置的一种示意图;
图7是用来实现本公开实施例的数据检索方法的办公系统的第一种框图;
图8是用来实现本公开实施例的数据检索方法的办公系统的第二种框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
为便于理解,下面对本公开实施例中出现的词语进行解释。
一个数据源:为企业内部的即时通讯办公系统(以下简称为办公系统)的一个垂类场景的数据源,也可以理解为该垂类场景的检索数据源,即一个类别的数据源。在企业内部的办公系统中,有以下多个垂类场景的数据源:人员、群组、服务号、应用、消息记录、文档和企业知识等。
楼层:在办公系统的全局检索的检索方式下,每个类别的数据源的检索结果顺序排列,类似楼房中一层层楼,因此,将每个类别的数据源的检索结果称为楼层。如图1所示的楼层示意图,基于全局检索的检索方式,办公系统利用检索词“会议室”展现多个楼层,如群聊楼层(即群聊数据源的检索结果)、会议室楼层(即会议室数据源的检索结果)以及应用楼层(即应用数据源的检索结果)。
本公开实施例中,办公系统包括但不限于:员工楼层、应用楼层、聊天记录楼层和文档楼层等。在员工楼层对应的员工数据源中,存储了企业内所有员工的信息;在应用楼层对应的应用数据源中,存储了企业内所有在线应用的信息;在聊天记录楼层对应的聊天记录数据源中,存储了企业内所有员工的聊天记录;在文档楼层对应的文档数据源中,存储了企业内员工在线使用的所有文档。
点击位置为:在所显示的所有检索结果中,账户点击的目标检索结果的楼层排序位置。仍以图1所示的楼层为例进行说明,若账户点击的目标检索结果为群聊楼层,则点击位置为1;若账户点击的目标检索结果为会议室楼层,则点击位置为2;若账户点击的目标检索结果为应用楼层,则点击位置为3。
随着时代的发展及技术的进步,应用于企业内部的即时通讯办公系统(以下简称为办公系统)开始在市场上萌芽。这类办公系统高度整合了企业内部的各种应用场景和业务需求,账户登录并操作该办公系统,能够完成企业内部的沟通、办公、学习和会议等多种行为。
在企业内部的办公系统中,可以构建以上多个垂类场景的检索引擎,进而账户通过检索引擎,精准找到需要沟通的人员、群组、需要编辑的文档、以及需要使用的应用工具等。
相关技术中,办公系统中含有以上多个垂类场景的入口,进入垂类场景后,账户可以在该垂类场景中进行垂类检索。
这种基于多个垂类场景的检索方式的好处是:目标单一直接,信息量较少,易于寻找到账户想要的检索结果。
这种基于多个垂类场景的检索方式的坏处是:检索路径过长,账户想要进行检索时,首先找到垂类场景的入口,进入垂类场景后,再找到垂类场景下的检索入口,之后才能进行检索;若办公系统设计时本身垂类场景的入口过于深入或复杂,账户使用办公系统进行检索的难度将很高。
基于这种原因,在办公系统中开放全局检索入口,即从一个入口进入,可以检索到办公系统内高频使用的多个类别的数据。在办公系统内的全局检索入口内,账户输入检索词后,获取到每个类别数据源的检索结果,并按照从上往下顺序排序,展现每个类别数据源的检索结果,其中,每个类别数据源的检索结果的排序往往是固定的。
虽然能够通过培养账户习惯,来提高这种基于全局检索的检索方式的检索效率,但当账户想找排序靠后的检索结果时,在首位展现的检索结果中,甚至是首屏展现的检索结果中,无法命中目标检索结果,需要账户拖动检索框到靠后的位置,才能找到目标检索结果。这使得账户寻找目标检索结果的路径较长。
特别是,检索词越简单,匹配召回的检索结果越多,在排序靠前的检索结果干扰下,账户寻找目标检索结果的路径越长。
为解决上述问题,本公开实施例提供了一种基于全局检索的数据检索方法,如图2所示。该方法包括如下步骤:
步骤S21,获取目标关键词。
办公系统通过全局检索入口,获取目标关键词。
本申请实施例,账户登录办公系统后,可以直接在办公系统的全局检索入口内输入需要检索的检索词,即目标关键词;还可以。
另一个可选的实施例中,账户登录办公系统后,该账户可以通过鼠标或键盘等设备,在办公系统的全局检索入口内输入需要检索的检索词,即目标关键词。
步骤S22,利用目标关键词,在预设索引库包括的多个数据源中进行检索,得到多个数据源的检索结果。
办公系统中设置了预设索引库。该预设索引库包括多个类别的数据源,这多个类别的数据源中的数据能够被账户输入的关键词检索召回。
办公系统获取到目标关键词后,针对预设索引库包括的每个数据源,将目标关键词与该数据源进行匹配,得到与目标关键词匹配的检索结果。预设索引库包括多个数据源,则办公系统获取到多个数据源的检索结果。
步骤S23,响应于预设检索库包括目标关键词,根据预设检索库,获取目标关键词对应的目标数据源。
本公开实施例中,办公系统中设置了预设检索库,该预设检索库包括关键词和数据源的对应关系,其中,对应关系包括的数据源为:输入关键词进行检索时,容易被账户点击的数据源。其中,账户点击的数据源可以理解为账户点击的检索结果所属的数据源。
办公系统中预先设定每个数据源的排序权重,即多个数据源的检索结果的排序的固定的。办公系统获取到目标关键词后,检测预设检索库中是否存在包括目标关键词的对应关系。若存在包括目标关键词的对应关系,即预设检索库包括目标关键词,则办公系统可确定预设检索库包括的目标关键词对应的目标数据源为容易被账户点击的数据源,获取目标关键词对应的目标数据源。
步骤S24,重配置多个数据源的全局排序权重,其中,重配置后的目标数据源的排序权重大于多个数据源中其他数据源的排序权重。
办公系统获取到目标数据源后,重配置多个数据源的全局排序权重。其中,重配置局排序权重的方式可以采用以下方式中任一种:
1)调高目标数据源的全局排序权重,上述多个数据源中除目标数据源外的其他数据源的全局排序权重不变。
2)目标数据源的全局排序权重不变,上述多个数据源中除目标数据源外的其他数据源的全局排序权重调低。
3)调高目标数据源的全局排序权重,上述多个数据源中除目标数据源外的其他数据源的全局排序权重调低。
步骤S25,按照排序权重从大到小的顺序,显示多个数据源的检索结果。
本公开实施例中,排序权重越大,数据源的检索结果的排序位置越靠前。办公系统重配置多个数据源的全局排序权重,重配置后的目标数据源的排序权重大于多个数据源中其他数据源的排序权重,这样就使得容易被账户点击的目标数据源的检索结果显示在了首位,进而可以提高账户在首位找到目标检索结果的概率,有效减少了账户检索到目标检索结果的路径长度,提高了检索的效率。
此外,由于办公系统将容易被账户点击的目标数据源的排序位置更为靠前,账户获取到需要的检索结果的平均点击位置降低,进而提高了账户对办公系统的满意度。
在本公开的一个实施例中,为满足账户的个性化需求,为账户提供个性化的检索结果,预设检索库可以包括全命中检索子库、常用检索子库和高频检索子库中的一个或多个子库。
其中,全命中检索子库包括的关键词为:对应数据源中常用字段所包括的关键词,常用字段为:用于数据检索的概率高于预设概率阈值的字段。
常用检索子库包括的关键词为:在第一预设时间段内,单个账户登录时输入次数高于第一预设次数的关键词;常用检索子库包括的关键词对应的数据源为:单个账户登录时输入该关键词的情况下所点击的数据源;
高频检索子库包括的关键词为:在第二预设时间段内,多个账户登录时对应数据源的点击次数大于第二预设次数的关键词。
为便于描述,下面将全命中检索子库包括的关键词简称为命中关键词,常用检索子库包括的关键词简称为常用关键词,高频检索子库包括的关键词包括的关键词简称为常用关键词。
下面对上述3个子库进行详细说明。
(1)命中关键词为:数据源中常用字段所包括的关键词。对于某一数据源,若该数据源中某一字段信息的检索概率高于预设概率阈值,则该字段可以理解为常用字段。检索概率为进行数据检索来获取该数据源的检索结果的概率。预设概率阈值可以根据实际需求进行设定。例如,预设概率阈值可以为0.8、0.9或0.95等。
本公开实施例中,命中关键词为使得每个类别的数据源最容易被检索到的字段。例如,员工数据源的姓名字段,应用数据源的应用名字段等。
办公系统在将多个类别的数据源导入预设索引库时,针对每个类别的数据源,提取命中关键词,并将命中关键词导入全命中检索子库。例如,如图3所示,办公系统将多个数据源导入预设索引库和全命中检索子库。账户向办公系统输入目标关键词后,办公系统将目标关键词与预设索引库进行匹配,召回顺序排列的多个楼层;将目标关键词与全命中检索子库进行匹配,重配置多个数据源的排序权重,进而展示检索结果。
当某一类别的数据源发生变化时,对全命中检索子库中该类别的数据源的命中关键词进行更新。
例如,办公系统将“张三”、“李四”和“王五”等员工数据导入预设索引库时,将员工数据的姓名字段同步导入全命中检索子库;当员工离职时,删除预设索引库中该员工的数据,也同步删除全命中检索子库中该员工的姓名字段;当员工入职时,增加预设索引库中该员工的数据,也同步增加全命中检索子库中该员工的姓名字段。
办公系统将“无线投屏”、“周报”和“打车”等应用数据导入预设索引库时,将应用数据的应用名称字段同步导入全命中检索子库;当应用删除时,删除预设索引库中该应用的数据,也同步删除全命中检索子库中该应用的应用名称字段;当应用增加时,增加预设索引库中的该应用的数据,也同步增加全命中检索子库中该应用的应用名称字段。
本公开实施例中,全命中检索子库包括目标关键词指的是:全命中检索子库包括的关键词即为目标关键词。
例如,全命中检索子库包括“无线投屏”。若目标关键词为“无线投屏”,则全命中检索子库包括目标关键词,应用数据源为目标数据源。若目标关键词为“投屏”,“投屏”与“无线投屏”不同,则全命中检索子库不包括目标关键词,应用数据源不是目标数据源。
(2)常用关键词为:在第一预设时间段内,单个账户登录时输入次数高于第一预设次数的关键词。
第一预设时间段可以根据实际需求进行设定。例如,第一预设时间段可以为4个月、5个月或6个月等。第一预设次数阈值可以根据实际需求进行设定。例如,第一预设次数阈值可以为2、3或4等。
本公开实施例中,办公系统可以采用行为日志,收集账户的检索行为。办公系统分析行为日志,可以得到账户使用哪些关键词进行检索,以及选中了哪个楼层。办公系统定期分析行为得到第一预设时间段内该账户的常用关键词,并记录账户使用每个常用关键词时点击的楼层,以此得到上述账户的常用关键词,以及常用关键词对应的数据源。
在本公开的一个实施例中,常用关键词与至少一个数据源对应,且每个数据源设置有概率得分。其中,概率得分为单个账户登录时输入该关键词的情况下点击该数据源的得分。
例如,常用关键词、数据源和概率得分的对应关系包括:{账户1,关键词1,(数据源1,概率得分80),(数据源2,概率得分90)},{账户1,关键词2,(数据源2,概率得分80),(数据源3,概率得分95)},{账户2,关键词1,(数据源1,概率得分75),(数据源3,概率得分85)}。
本公开实施例中,上述数据源的概率得分可以根据如下至少一项信息确定:
第一预设时间段内单个账户登录时输入关键词的情况下,点击数据源的次数;
单个账户登录时输入关键词的情况下,最近一次点击数据源的时刻至当前时刻的时长。
本申请实施例中,在单个账户登录时输入关键词的情况下,单个账户点击某个数据源的次数越多,即该账户点击集中在某个楼层越多,当前该账户点击该楼层的概率得分就越高;该账户最近一次点击某个数据源的时刻至当前时刻的时长越短,即最近一次点击某个楼层距今时间越近,当前该账户点击该楼层的概率得分也越高。
基于上述概率得到,若常用检索子库包括目标关键词,则该常用检索子库中目标关键词对应的目标数据源可以为:目标关键词对应的数据源中,概率得分最高且概率得分高于预设得分阈值的数据源。
其中,预设得分阈值可以根据实际需求进行设定。
(3)高频检索关键词为:在第二预设时间段内,多个账户登录时对应数据源的点击次数大于第二预设次数的关键词。
第二预设时间段可以根据实际需求进行设定。例如,第二预设时间段可以为2个月、3个月或4个月等。
第二预设次数可以根据实际需求进行设定。例如,第二预设次数可以为200、300、400或1000等。
本公开实施例中,办公系统可以采用行为日志,收集所有账户的检索行为。办公系统定期分析行为得到第二预设时间段内多个账户的高频关键词,以及输入该高频关键词时所有账户点击的楼层。若输入高频关键词时,多个账户集中点击某一楼层,则将该高频关键词存储为该楼层的高频关键词。
在本公开的一个实施例中,高频关键词与至少一个数据源对应。这种情况下,若高频检索子库包括目标关键词,该目标关键词对应多个目标数据源,则重配置后的目标数据源的排序权重与点击次数正相关,即目标数据源的点击次数越高,重配置后的该目标数据源的排序权重越大
例如,高频关键词、数据源和点击次数的对应关系包括:{会议,群组楼层的点击次数为20万次,应用楼层的点击次数为5万次,消息记录楼层的点击次数为1万次}。则重配置后:群组的排序权重为权重1,应用楼层的排序权重为权重2,消息记录楼层的排序权重为权重3,权重1>权重2>权重3。
上述点击次数为:账户登录时输入关键词的情况下,点击数据源的次数。
在本公开的一个实施例中,办公系统可以采用key-value形式的存储上述高频关键词和数据源的对应关系。其中,Key为高频检索词,value为按照点击次数从大到小排序的多个楼层,这多个楼层以链表形式存储。
例如,使用高频检索词“会议”时,群组楼层的点击次数为20万次,应用楼层的点击次数为5万次,消息记录楼层的点击次数为1万次,则可以存储为:{会议;群组楼层,应用楼层,消息记录楼层}。
在本申请的一个实施例中,预设检索库包括全命中检索子库、常用检索子库和高频检索子库;这种情况下,如图4所示,数据检索方法还可以包括步骤S230,步骤S23可以细化为步骤S231。
步骤S230,依次在全命中检索子库、常用检索子库和高频检索子库中检索目标关键词;响应于检索到目标关键词,确定预设检索库包括目标关键词。
本公开实施例中,办公系统依次在全命中检索子库、常用检索子库和高频检索子库中检索目标关键词。
具体可以包括:办公系统在全命中检索子库检索目标关键词;
若在全命中检索子库中检索到目标关键词,则不再在常用检索子库和高频检索子库中检索目标关键词,确定预设检索库包括目标关键词;
若在全命中检索子库中未检索到目标关键词,则在常用检索子库检索目标关键词;
若在常用检索子库中检索到目标关键词,则不再在高频检索子库中检索目标关键词,确定预设检索库包括目标关键词;
若在常用检索子库中未检索到目标关键词,则在高频检索子库检索目标关键词;
若在高频检索子中检索到目标关键词,则确定预设检索库包括目标关键词;
若在高频检索子中未检索到目标关键词,则确定预设检索库不包括目标关键词,可以根据相关技术显示检索结果。
步骤S231,根据目标子库,获取目标关键词对应的目标数据源。
其中,目标子库为:全命中检索子库、常用检索子库和高频检索子库中,检索到目标关键词的子库。
下面结合图5所示流程,对本公开实施例提供的数据检索方法进行详细说明。
步骤S51,办公系统将多个类别的数据源导入预设索引库,并针对每个类别的数据源,提取命中关键词,将命中关键词导入全命中检索子库。
步骤S52,账户向办公系统输入目标关键词。
步骤S53,办公系统将目标关键词与预设索引库进行匹配,召回顺序排列的多个楼层。
步骤S54,办公系统检测目标关键词是否命中全命中检索子库。若是,则执行步骤S55。若否,则执行步骤S57。
步骤S54具体可以为,办公系统检测全命中检索子库是否包括目标关键词。若是,则执行步骤S55。若否,则执行步骤S57。
步骤S55,办公系统重配置多个数据源的排序权重。例如,办公系统将目标数据源对应的楼层调至首位。
办公系统重配置多个数据源的排序权重,实现楼层的调权排序。
步骤S56,办公系统展示检索结果。
步骤S57,办公系统检测目标关键词是否命中常用检索子库。若是,则执行步骤S58。若否,则执行步骤S59。
步骤S57具体可以为,办公系统检测常用检索子库是否包括目标关键词。若是,则执行步骤S58。若否,则执行步骤S59。
步骤S58,办公系统检测常用检索子库中目标关键词对应的目标数据源的概率得分是否大于预设得分阈值。若是,则执行步骤S55。若否,则执行步骤S59。
步骤S59,办公系统检测目标关键词是否命中高频检索子库。若是,则执行步骤S55。若否,则执行步骤S56。
步骤S59具体可以为,办公系统检测高频检索子库是否包括目标关键词。若是,则执行步骤S55。若否,则执行步骤S56。
步骤S510,办公系统获取账户的行为日志。
步骤S511,办公系统在账户粒度进行个性化分析,得到每个账户的常用关键词。基于此,可以得到常用检索子库。
该步骤S511,可以分析得到单个账户的行为习惯,进而单个账户的常用关键词,以及常用关键词对应的数据源,便于满足账户的个性化检索。
步骤S512,办公系统在关键词粒度进行整体分析,得到多个账户的高频关键词。基于此,可以得到高频检索子库。
该步骤S512,可以分析得到多个账户的行为习惯,进而多个账户的高频关键词,以及高频关键词对应的数据源。
利用上述步骤S510-S512得到常用检索子库和高频检索子库,办公系统可以执行上述步骤S57和步骤S59。
上述步骤S51-S512部分描述相对简单,具体可参见上述图2-4部分的描述。
基于上述数据检索方法,本公开实施例还提供了一种数据检索装置,如图6所示,该装置包括:
第一获取单元61,用于获取目标关键词;
第一检索单元62,用于利用目标关键词,在预设索引库包括的多个数据源中进行检索,得到多个数据源的检索结果;
第二获取单元63,用于响应于预设检索库包括目标关键词,根据预设检索库,获取目标关键词对应的目标数据源;
调权单元64,用于重配置多个数据源的全局排序权重,其中,重配置后的目标数据源的排序权重大于多个数据源中其他数据源的排序权重;
显示单元65,用于按照排序权重从大到小的顺序,显示多个数据源的检索结果。
其中,预设检索库可以包括全命中检索子库、常用检索子库和高频检索子库中的一个或多个子库;
全命中检索子库包括的关键词为:对应数据源中常用字段所包括的关键词,常用字段为:用于数据检索的概率高于预设概率阈值的字段;
常用检索子库包括的关键词为:在第一预设时间段内,单个账户登录时输入次数高于第一预设次数的关键词;常用检索子库包括的关键词对应的数据源为:单个账户登录时输入该关键词的情况下所点击的数据源;
高频检索子库包括的关键词为:在第二预设时间段内,多个账户登录时对应数据源的点击次数大于第二预设次数的关键词。
其中,常用检索子库包括的关键词对应的数据源设置有概率得分,概率得分为单个账户登录时输入该关键词的情况下点击该数据源的得分;
常用检索子库中目标关键词对应的目标数据源为:目标关键词对应的数据源中,概率得分最高且概率得分高于预设得分阈值的数据源。
其中,上述数据检索装置还可以包括:
第一确定单元,用于根据目标信息,确定数据源的概率得分;
目标信息包括以下至少一项信息:
第一预设时间段内单个账户登录时输入关键词的情况下,点击数据源的次数;
单个账户登录时输入关键词的情况下,最近一次点击数据源的时刻至当前时刻的时长。
其中,高频检索子库包括多个目标数据源;
重配置后的目标数据源的排序权重与点击次数正相关。
其中,预设检索库包括全命中检索子库、常用检索子库和高频检索子库;上述数据检索装置还可以包括:
第二检索单元,用于依次在全命中检索子库、常用检索子库和高频检索子库中检索目标关键词;
第二确定单元,用于响应于检索到目标关键词,确定预设检索库包括目标关键词;
第二获取单元63,具体可以用于:
根据目标子库,获取目标关键词对应的目标数据源;
其中,目标子库为:全命中检索子库、常用检索子库和高频检索子库中,检索到目标关键词的子库。
本公开实施例中,排序权重越大,数据源的检索结果的排序位置越靠前。办公系统重配置多个数据源的全局排序权重,重配置后的目标数据源的排序权重大于多个数据源中其他数据源的排序权重,这样就使得容易被账户点击的目标数据源的检索结果显示在了首位,进而可以提高账户在首位找到目标检索结果的概率,有效减少了账户检索到目标检索结果的路径长度,提高了检索的效率。
此外,由于办公系统将容易被账户点击的目标数据源的排序位置更为靠前,账户获取到需要的检索结果的平均点击位置降低,进而提高了账户对办公系统的满意度。
本公开的技术方案中,所涉及的账户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开实施例还提供了一种办公系统、一种可读存储介质、一种计算机程序产品和一种电子设备。
图7示出了可以用来实施本公开的实施例的示例办公系统700的示意性框图。办公系统旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。办公系统还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,办公系统700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储办公系统700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
办公系统700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许办公系统700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如上述数据检索方法。例如,在一些实施例中,上述数据检索方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到办公系统700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的数据检索方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述数据检索方法。
根据本公开的实施例,本公开实施例还提供了一种办公系统,如图8所示,包括:
至少一个处理器801;以及
与至少一个处理器801通信连接的存储器802;其中,
存储器802存储有可被至少一个处理器801执行的指令,所述指令被至少一个处理器801执行,以使至少一个处理器801能够执行上述任一所述的数据检索方法。
根据本公开的实施例,本公开实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一所述的数据检索方法。
根据本公开的实施例,本公开实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一所述的数据检索方法。
根据本公开的实施例,本公开实施例还提供了一种电子设备,包括上述任一实施例中的办公系统。
本公开实施例提供的电子设备重配置多个数据源的全局排序权重,重配置后的目标数据源的排序权重大于多个数据源中其他数据源的排序权重,这样就使得容易被账户点击的目标数据源的检索结果显示在了首位,进而可以提高账户在首位找到目标检索结果的概率,有效减少了账户检索到目标检索结果的路径长度,提高了检索的效率。
此外,由于办公系统将容易被账户点击的目标数据源的排序位置更为靠前,账户获取到需要的检索结果的平均点击位置降低,进而提高了账户对办公系统的满意度。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与账户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向账户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),账户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与账户的交互;例如,提供给账户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自账户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形账户界面或者网络浏览器的账户计算机,账户可以通过该图形账户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (16)
1.一种数据检索方法,包括:
获取目标关键词;
利用所述目标关键词,在预设索引库包括的多个数据源中进行检索,得到所述多个数据源的检索结果;
响应于预设检索库包括所述目标关键词,根据所述预设检索库,获取所述目标关键词对应的目标数据源;
重配置所述多个数据源的全局排序权重,其中,重配置后的所述目标数据源的排序权重大于所述多个数据源中其他数据源的排序权重;
按照排序权重从大到小的顺序,显示所述多个数据源的检索结果。
2.根据权利要求1所述的方法,其中,所述预设检索库包括全命中检索子库、常用检索子库和高频检索子库中的一个或多个子库;
所述全命中检索子库包括的关键词为:对应数据源中常用字段所包括的关键词,所述常用字段为:用于数据检索的概率高于预设概率阈值的字段;
所述常用检索子库包括的关键词为:在第一预设时间段内,单个账户登录时输入次数高于第一预设次数的关键词;所述常用检索子库包括的关键词对应的数据源为:所述单个账户登录时输入该关键词的情况下所点击的数据源;
所述高频检索子库包括的关键词为:在第二预设时间段内,多个账户登录时对应数据源的点击次数大于第二预设次数的关键词。
3.根据权利要求2所述的方法,其中,所述常用检索子库包括的关键词对应的数据源设置有概率得分,所述概率得分为所述单个账户登录时输入该关键词的情况下点击该数据源的得分;
所述常用检索子库中所述目标关键词对应的目标数据源为:所述目标关键词对应的数据源中,概率得分最高且概率得分高于预设得分阈值的数据源。
4.根据权利要求3所述的方法,其中,所述方法还包括:
根据目标信息,确定数据源的概率得分;
所述目标信息包括以下至少一项信息:
所述第一预设时间段内所述单个账户登录时输入关键词的情况下,点击数据源的次数;
所述单个账户登录时输入关键词的情况下,最近一次点击数据源的时刻至当前时刻的时长。
5.根据权利要求2所述的方法,其中,所述高频检索子库包括多个目标数据源;
重配置后的目标数据源的排序权重与点击次数正相关。
6.根据权利要求2-5任一项所述的方法,其中,所述预设检索库包括所述全命中检索子库、所述常用检索子库和所述高频检索子库;所述方法还包括:
依次在所述全命中检索子库、所述常用检索子库和所述高频检索子库中检索所述目标关键词;
响应于检索到所述目标关键词,确定所述预设检索库包括所述目标关键词;
所述响应于预设检索库包括所述目标关键词,根据所述预设检索库,获取所述目标关键词对应的目标数据源,包括:
根据目标子库,获取所述目标关键词对应的目标数据源;
其中,所述目标子库为:所述全命中检索子库、所述常用检索子库和所述高频检索子库中,检索到所述目标关键词的子库。
7.一种数据检索装置,包括:
第一获取单元,用于获取目标关键词;
第一检索单元,用于利用所述目标关键词,在预设索引库包括的多个数据源中进行检索,得到所述多个数据源的检索结果;
第二获取单元,用于响应于预设检索库包括所述目标关键词,根据所述预设检索库,获取所述目标关键词对应的目标数据源;
调权单元,用于重配置所述多个数据源的全局排序权重,其中,重配置后的所述目标数据源的排序权重大于所述多个数据源中其他数据源的排序权重;
显示单元,用于按照排序权重从大到小的顺序,显示所述多个数据源的检索结果。
8.根据权利要求7所述的装置,其中,所述预设检索库包括全命中检索子库、常用检索子库和高频检索子库中的一个或多个子库;
所述全命中检索子库包括的关键词为:对应数据源中常用字段所包括的关键词,所述常用字段为:用于数据检索的概率高于预设概率阈值的字段;
所述常用检索子库包括的关键词为:在第一预设时间段内,单个账户登录时输入次数高于第一预设次数的关键词;所述常用检索子库包括的关键词对应的数据源为:所述单个账户登录时输入该关键词的情况下所点击的数据源;
所述高频检索子库包括的关键词为:在第二预设时间段内,多个账户登录时对应数据源的点击次数大于第二预设次数的关键词。
9.根据权利要求8所述的装置,其中,所述常用检索子库包括的关键词对应的数据源设置有概率得分,所述概率得分为所述单个账户登录时输入该关键词的情况下点击该数据源的得分;
所述常用检索子库中所述目标关键词对应的目标数据源为:所述目标关键词对应的数据源中,概率得分最高且概率得分高于预设得分阈值的数据源。
10.根据权利要求9所述的装置,其中,所述装置还包括:
第一确定单元,用于根据目标信息,确定数据源的概率得分;
所述目标信息包括以下至少一项信息:
所述第一预设时间段内所述单个账户登录时输入关键词的情况下,点击数据源的次数;
所述单个账户登录时输入关键词的情况下,最近一次点击数据源的时刻至当前时刻的时长。
11.根据权利要求8所述的装置,其中,所述高频检索子库包括多个目标数据源;
重配置后的目标数据源的排序权重与点击次数正相关。
12.根据权利要求8-11任一项所述的装置,其中,所述预设检索库包括所述全命中检索子库、所述常用检索子库和所述高频检索子库;所述装置还包括:
第二检索单元,用于依次在所述全命中检索子库、所述常用检索子库和所述高频检索子库中检索所述目标关键词;
第二确定单元,用于响应于检索到所述目标关键词,确定所述预设检索库包括所述目标关键词;
所述第二获取单元,具体用于:
根据目标子库,获取所述目标关键词对应的目标数据源;
其中,所述目标子库为:所述全命中检索子库、所述常用检索子库和所述高频检索子库中,检索到所述目标关键词的子库。
13.一种办公系统,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
16.一种电子设备,包括如权利要求13所述的办公系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110808521.XA CN113407586B (zh) | 2021-07-16 | 2021-07-16 | 数据检索方法、装置、办公系统、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110808521.XA CN113407586B (zh) | 2021-07-16 | 2021-07-16 | 数据检索方法、装置、办公系统、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113407586A true CN113407586A (zh) | 2021-09-17 |
CN113407586B CN113407586B (zh) | 2023-09-22 |
Family
ID=77686770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110808521.XA Active CN113407586B (zh) | 2021-07-16 | 2021-07-16 | 数据检索方法、装置、办公系统、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113407586B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114117253A (zh) * | 2021-11-19 | 2022-03-01 | 北京达佳互联信息技术有限公司 | 群组搜索方法、装置、设备以及存储介质 |
CN114154072A (zh) * | 2021-12-08 | 2022-03-08 | 北京度友信息技术有限公司 | 检索方法、装置、电子设备以及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050109106A (ko) * | 2004-05-13 | 2005-11-17 | 엔에이치엔(주) | 통합 검색 결과를 효율적으로 제공하는 검색 서비스 제공방법 및 시스템 |
CN104778266A (zh) * | 2015-04-22 | 2015-07-15 | 无锡天脉聚源传媒科技有限公司 | 一种多数据源搜索的方法及装置 |
CN105302810A (zh) * | 2014-06-12 | 2016-02-03 | 北京搜狗科技发展有限公司 | 一种信息搜索方法和装置 |
WO2020019565A1 (zh) * | 2018-07-27 | 2020-01-30 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、电子设备和存储介质 |
CN111125408A (zh) * | 2019-10-11 | 2020-05-08 | 平安科技(深圳)有限公司 | 基于特征提取的搜索方法、装置、计算机设备和存储介质 |
US20200364233A1 (en) * | 2019-05-15 | 2020-11-19 | WeR.AI, Inc. | Systems and methods for a context sensitive search engine using search criteria and implicit user feedback |
CN112087371A (zh) * | 2020-09-10 | 2020-12-15 | 北京百度网讯科技有限公司 | 一种即时通讯群组的搜索方法、装置、设备和存储介质 |
-
2021
- 2021-07-16 CN CN202110808521.XA patent/CN113407586B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050109106A (ko) * | 2004-05-13 | 2005-11-17 | 엔에이치엔(주) | 통합 검색 결과를 효율적으로 제공하는 검색 서비스 제공방법 및 시스템 |
CN105302810A (zh) * | 2014-06-12 | 2016-02-03 | 北京搜狗科技发展有限公司 | 一种信息搜索方法和装置 |
CN104778266A (zh) * | 2015-04-22 | 2015-07-15 | 无锡天脉聚源传媒科技有限公司 | 一种多数据源搜索的方法及装置 |
WO2020019565A1 (zh) * | 2018-07-27 | 2020-01-30 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、电子设备和存储介质 |
US20200364233A1 (en) * | 2019-05-15 | 2020-11-19 | WeR.AI, Inc. | Systems and methods for a context sensitive search engine using search criteria and implicit user feedback |
CN111125408A (zh) * | 2019-10-11 | 2020-05-08 | 平安科技(深圳)有限公司 | 基于特征提取的搜索方法、装置、计算机设备和存储介质 |
CN112087371A (zh) * | 2020-09-10 | 2020-12-15 | 北京百度网讯科技有限公司 | 一种即时通讯群组的搜索方法、装置、设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
彭朝晖;张俊;王珊;: "S-CBR:基于数据库模式展现数据库关键词检索结果", 软件学报, no. 02 * |
申亚鹏: "基于用户反馈的多源非结构化数据集成研究", 中国优秀硕士学位论文全文数据库 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114117253A (zh) * | 2021-11-19 | 2022-03-01 | 北京达佳互联信息技术有限公司 | 群组搜索方法、装置、设备以及存储介质 |
CN114154072A (zh) * | 2021-12-08 | 2022-03-08 | 北京度友信息技术有限公司 | 检索方法、装置、电子设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113407586B (zh) | 2023-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11397772B2 (en) | Information search method, apparatus, and system | |
CN113407586B (zh) | 数据检索方法、装置、办公系统、存储介质及电子设备 | |
CN112989023A (zh) | 标签推荐方法、装置、设备、存储介质及计算机程序产品 | |
KR102307380B1 (ko) | 자연어 처리 기반 콜센터 지원 시스템 및 방법 | |
CN112818230A (zh) | 内容推荐方法、装置、电子设备和存储介质 | |
CN111666292A (zh) | 用于检索地理位置的相似度模型建立方法和装置 | |
CN110880128A (zh) | 异常信息挖掘方法、装置、系统及终端设备 | |
CN112765452A (zh) | 搜索推荐方法、装置及电子设备 | |
CN114417194A (zh) | 推荐系统排序方法、参数预测模型训练方法及装置 | |
CN115619245A (zh) | 一种基于数据降维方法的画像构建和分类方法及系统 | |
CN112084150A (zh) | 模型训练、数据检索方法,装置,设备以及存储介质 | |
CN114417118A (zh) | 一种异常数据处理方法、装置、设备以及存储介质 | |
US11921702B2 (en) | Issue rank management in an issue tracking system | |
CN116881219A (zh) | 数据库的优化处理方法、装置、电子设备及存储介质 | |
CN115858815A (zh) | 确定映射信息的方法、广告推荐方法、装置、设备及介质 | |
CN113918577B (zh) | 数据表识别方法、装置、电子设备及存储介质 | |
US11947545B2 (en) | Systems and methods for configuring data stream filtering | |
CN114491232B (zh) | 信息查询方法、装置、电子设备和存储介质 | |
CN111723201A (zh) | 一种用于文本数据聚类的方法和装置 | |
CN112905743B (zh) | 文本对象检测的方法、装置、电子设备和存储介质 | |
CN114238745A (zh) | 一种提供搜索结果的方法及装置、电子设备和介质 | |
CN114862479A (zh) | 信息推送方法、装置、电子设备和介质 | |
CN113595770A (zh) | 群组点击率预估方法、装置、电子设备和存储介质 | |
CN112800315A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112052402A (zh) | 信息推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |