CN107291930A - 权重数的计算方法 - Google Patents

权重数的计算方法 Download PDF

Info

Publication number
CN107291930A
CN107291930A CN201710517706.9A CN201710517706A CN107291930A CN 107291930 A CN107291930 A CN 107291930A CN 201710517706 A CN201710517706 A CN 201710517706A CN 107291930 A CN107291930 A CN 107291930A
Authority
CN
China
Prior art keywords
label
weight number
search
methods described
search string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710517706.9A
Other languages
English (en)
Inventor
张玉娇
王加锋
冯方方
孙健
刘斌
付强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universal Wisdom Technology Beijing Co Ltd
Original Assignee
Universal Wisdom Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universal Wisdom Technology Beijing Co Ltd filed Critical Universal Wisdom Technology Beijing Co Ltd
Priority to CN201710517706.9A priority Critical patent/CN107291930A/zh
Publication of CN107291930A publication Critical patent/CN107291930A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及一种权重数的计算方法,所述方法包括,服务器设定不同标签的对应权重;将搜索字符串中的字段按照标签进行搜索查询;获取不同标签的对应查询命中次数;计算每一个标签的命中次数和对应权重的乘积作为该标签的权重数;将所有标签的权重数之和作为该字段的总权重数;按照总权重数的大小作为相关度对搜索结果进行排序。本发明可以更好的根据用户需求提供搜索结果,获取和用户提问相关性更高的信息,提升用户的使用体验。

Description

权重数的计算方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种权重数的计算。
背景技术
随着信息时代的到来,服务器中存储的文件越来越多;用户可以使用终端从服务器中获取用户感兴趣的文件。为了提高用户的体验,服务器还可以为用户推荐用户感兴趣的文件。目前,服务器在为用户推荐文件时,统计的是服务器中每个文件的点击率,根据每个文件的点击率,选择点击率最高的文件,向用户推荐选择的文件。这种推荐方法不能很好地匹配用户需求,会出现推荐的内容和用户搜索内容不相符的情况。
发明内容
为解决现有技术存在的问题,本发明提供了一种权重数的计算方法,所述方法包括,
服务器设定不同标签的对应权重;
将搜索字符串中的字段按照标签进行搜索查询;
获取不同标签的对应查询命中次数;
计算每一个标签的命中次数和对应权重的乘积作为该标签的权重数;
将所有标签的权重数之和作为该字段的总权重数;
按照总权重数的大小作为相关度对搜索结果进行排序。
进一步地,所述标签包括关键字标签和分类标签。
进一步地,所述方法还包括,所述服务器按照每个标签的权重数的大小作为相关度对搜索结果进行排序。
进一步地,所述方法还包括,同类标签的权重数相近。
进一步地,所述方法还包括索引单元将数据库的数据生成索引信息。
进一步地,所述方法还包括检索单元对搜索字符串进行搜索,所述检索单元对搜索字符串的标签与索引信息进行匹配。
本发明可以更好的根据用户需求提供搜索结果,获取和用户提问相关性更高的信息,提升用户的使用体验。
附图说明
图1为本发明实施例提供的权重数的计算方法的流程图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
图1为本发明权重数的计算方法的流程图,如图所示:所述方法包括,
步骤101:服务器设定不同标签的对应权重。
本发明用于对搜索结果进行排序,即对搜索结果进行设定。为了加快搜索的过程,本发明预先对数据库中所有的数据进行分析,提取数据库中所有字段中存在的标签,并对各个标签设置相应的权重值。比如关键字标签的权重值可以设为“10”,节目标签的权重值可以设为“7”等。
进一步地,所述标签包括关键字标签和分类标签。
进一步地,所述方法还包括,同类标签的权重数相近。
具体的,标签预先被分为不同的类别,比如关键字标签和分类标签。不同分类的标签,其权重值不同。相同分类的标签,其权重值相同或相近。
步骤102:将搜索字符串中的字段按照标签进行搜索查询。
客户端将搜索字符串提交到服务器后,服务器提取搜索字符串中包括的标签,并将搜索字符串中包括的标签在服务器中进行搜索,当搜索字符串中的标签和服务器中预存字段的标签向对应时,则认为该字段是搜索字符串的一个命中结果:,若有多个字段的标签和搜索字符串的标签具有对应关系时,则认为该搜索字符串有多个命中结果。
步骤103:获取不同标签的对应查询命中次数;
用户需要进行搜索时,可以在客户端输入搜索字符串,该搜索字符串应当包括了待搜索问题或者待搜索对象的关键字。客户端接收到所述搜索字符串后,将该搜索字符串发送给所述检索单元进行检索。
当搜索字符串有多个命中结果时,则需要对命中结果进行排序。现有技术是对命中结果按照点击率来进行排序。本发明首先需要获取搜索字符串中各个标签与服务器中字段的标签的命中次数,例如搜索字符串中的标签“电影”在服务器中某字段中出现了5次,则该标签的命中次数为5。
步骤104:计算每一个标签的命中次数和对应权重的乘积作为该标签的权重数。
当获取到各个标签的命中次数后,计算该标签的命中次数和其相应的权重值的乘积,得到的值作为该标签的权重数。标签相同的情况下,权重值越高,即该标签出现的次数越多。
步骤105:将所有标签的权重数之和作为该字段的总权重数。
当得到各个标签的权重值时,将各个标签的权重值想加,得到服务器中某一命中结果的总权重数,例如某一字段电影标签的权重值为10,总共出现了5次;解说标签的权重值为7,共出现了3次,则该字段的总权重数为71。
步骤106:按照总权重数的大小作为相关度对搜索结果进行排序。
服务器中与搜索字符串的标签有重合的字段作为搜索结果,对所述搜索结果的总权重数计算完毕后进行排序,总权重数越高则相关度越高,即用户感兴趣的可能性越大。反之,则相关度越低。
进一步地,所述方法还包括,所述服务器按照每个标签的权重数的大小作为相关度对搜索结果进行排序。
如果用户有按照标签来查看搜索结果的需求,也可以按照标签的权重数来对搜索结果进行排序。当选择的标签不同时,搜索结果的排序也不同。可以直观的看到各个标签的相关度的情况。
进一步地,所述方法还包括索引单元将数据库的数据生成索引信息。
所述服务器中设置有索引单元,所述索引单元对数据库中的字段进行解析,获取标签和每个字段中各个标签的出现次数,随后生成索引信息,该索引信息即用于和搜索字符串的标签进行匹配,如果二者的标签重合度较高即相关度较高,否则相关度低。当获取到相关度高的索引信息后,再从服务器获取该索引信息对应的字段,即得到搜索字符串的搜索结果。
进一步地,所述客户端还可以发送预定义信息至数据库,所述预定义信息包括创建逻辑和更新逻辑,所述数据库向客户端发送反馈信息。
具体的,所述客户端还可以向数据库发送预定义信息,该预定义信息包括创建逻辑和更新逻辑。所述创建逻辑和更新逻辑都是采用了本发明的通过计算权重对所述结果进行排序的方法。
所述数据库接收到所述预定义信息后,向客户端发送有关于信息是否送达的反馈信息,所述创建逻辑和更新逻辑是有关于索引单元如何创建或者更新索引信息的,因此所述数据库接收到所述创建逻辑和更新逻辑后,将所述创建逻辑和更新逻辑发送到所述索引单元,索引单元接收到所述创建逻辑和更新逻辑后,按照所述创建逻辑和更新逻辑进行索引信息的创建和更新。
所述索引单元生成索引信息后,将所述索引信息发送至检索单元,以便进行下一步的搜索匹配操作。当索引单元生成新的索引信息时,也将新的索引信息发送至检索单元。
具体来讲,索引单元不仅能创建索引信息,还应当能够实时对已经创建的索引信息进行更新,可以是按照一定的时间间隔进行更新,也可以是检测到数据库发生了数据的变化而进行更新。索引单元的数据来源不只是一个数据库,而是一个由数个数据库组成的数据源,由于数据库更新速度很快,因此可以设定一个时间阈值,到了该时间阈值后,索引单元即对数据库的原索引信息进行更新。或者当数据库发送了数据的变更时,索引单元可以获取到该数据变更信息,当数据变更满足了更新条件时,索引单元对数据库的原索引信息进行更新处理。所述更新处理可以包括在原索引信息基础上的删除、增加和修改。
进一步地,所述方法还包括检索单元对搜索字符串进行搜索,所述检索单元对搜索字符串的标签与索引信息进行匹配。
当客户端提交了搜索字符串后,检索单元首先提取搜索字符串中所包含的标签,并将所包含的标签和索引信息中包含的标签进行匹配,索引信息中包含的标签不必与搜索字符串的标签完全一样,可以是同类标签或者是相近标签,或者是下位标签。例如搜索字符串的标签为电影时,索引信息的标签为“007”也应包含在搜索字符串的标签内。索引信息中包含的标签可以少于搜索字符串的标签,也可以多于搜索字符串的标签,就数量上而言,二者的标签数量也不必完全一样。但是若标签的数量和种类都完全一样,那应当属于相关度极高的索引信息。
所述检索单元接收到客户端发送的搜索字符串并获取到搜索字符串中包括的关键字或者标签后,根据该标签和关键字与检索单元中的索引信息进行匹配,若所述搜索字符串的关键字或者标签与某条索引信息的关键字或者标签的重合度较高,则认为该索引信息所对应的字段与所述搜索字符串的匹配度较高。如上所述得到一系列的字段,即搜索结果并将所述搜索结果发送给所述客户端。
实施例:
客户端提交搜索字符串“三生三世十里桃花”至检索单元,检索单元对“三生三世十里桃花”所具有的标签进行解析,比如有“电视剧”、“抄袭”、“唐七公子”、“大风刮过”等标签,其中“电视剧”为第一类标签,其权重值为10,“抄袭”为第二类标签,其权重值为7,“唐七公子”和“大风刮过”为第三类标签,其权重值为5。
设若检索单元检索到第一个字段,该字段包含有上述四个标签,且“电视剧”出现了8次,“抄袭”出现了4次,“唐七公子”和“大风刮过”共出现了13次,则“电视剧”的权重数为80,“抄袭”的权重数为28,“唐七公子”和“大风刮过”的权重数为65,总权重数为173。
设若检索单元检索到第二个字段,该字段包含有上述四个标签中的三个,“电视剧”出现了11次,“唐七公子”和“大风刮过”共出现了9次,则“电视剧”的权重数为110,“唐七公子”和“大风刮过”的权重数为45,总权重数为155。
设若检索单元检索到第三个字段,该字段包含有上述四个标签中的三个,“电视剧”出现了1次,“抄袭”出现了3次,“大风刮过”出现了12次,则“电视剧”的权重数为10,“抄袭”的权重数为21,“大风刮过”的权重数为60,总权重数为91。
按照总权重数的大小来判断相关度的大小,则总权重数越大意味着相关度越大,即顺序应当为第一个字段、第二个字段、第三个字段。搜索结果在客户端上的显示顺序应当与总权重数的大小顺序相同。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种权重数的计算方法,其特征在于,所述方法包括,
服务器设定不同标签的对应权重;
将搜索字符串中的字段按照标签进行搜索查询;
获取不同标签的对应查询命中次数;
计算每一个标签的命中次数和对应权重的乘积作为该标签的权重数;
将所有标签的权重数之和作为该字段的总权重数;
按照总权重数的大小作为相关度对搜索结果进行排序。
2.根据权利要求1所述的方法,其特征在于,所述标签包括关键字标签和分类标签。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括,所述服务器按照每个标签的权重数的大小作为相关度对搜索结果进行排序。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括,同类标签的权重数相近。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括索引单元将数据库的数据生成索引信息。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括检索单元对搜索字符串进行搜索,所述检索单元对搜索字符串的标签与索引信息进行匹配。
CN201710517706.9A 2017-06-29 2017-06-29 权重数的计算方法 Pending CN107291930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710517706.9A CN107291930A (zh) 2017-06-29 2017-06-29 权重数的计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710517706.9A CN107291930A (zh) 2017-06-29 2017-06-29 权重数的计算方法

Publications (1)

Publication Number Publication Date
CN107291930A true CN107291930A (zh) 2017-10-24

Family

ID=60099115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710517706.9A Pending CN107291930A (zh) 2017-06-29 2017-06-29 权重数的计算方法

Country Status (1)

Country Link
CN (1) CN107291930A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587568A (zh) * 2018-11-01 2019-04-05 北京奇艺世纪科技有限公司 视频播放方法、装置、计算机可读存储介质
CN110532451A (zh) * 2019-06-26 2019-12-03 平安科技(深圳)有限公司 针对政策文本的检索方法和装置、存储介质、电子装置
CN111061983A (zh) * 2019-12-17 2020-04-24 上海冠勇信息科技有限公司 一种侵权数据抓取优先级的评估方法及其网络监控系统
CN111813902A (zh) * 2020-05-21 2020-10-23 车智互联(北京)科技有限公司 智能应答方法、系统及计算设备

Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1584884A (zh) * 2003-08-20 2005-02-23 富士通株式会社 检索结构化文档的数据的设备和方法
CN101963966A (zh) * 2009-07-24 2011-02-02 李占胜 一种为搜索结果添加标签的搜索结果分类方法
CN102043812A (zh) * 2009-10-13 2011-05-04 北京大学 一种医疗信息的检索方法及系统
CN102622451A (zh) * 2012-04-16 2012-08-01 上海交通大学 电视节目标签自动生成系统
CN102622358A (zh) * 2011-01-27 2012-08-01 天脉聚源(北京)传媒科技有限公司 一种搜索信息的方法和系统
CN102867001A (zh) * 2011-07-05 2013-01-09 腾讯科技(北京)有限公司 获取信息的方法和装置
CN102880687A (zh) * 2012-09-14 2013-01-16 北京大学 基于标签技术的个人交互数据检索方法及其系统
CN102955813A (zh) * 2011-08-29 2013-03-06 中国移动通信集团四川有限公司 一种信息搜索方法和系统
CN103106199A (zh) * 2011-11-09 2013-05-15 中国移动通信集团四川有限公司 文本检索方法和装置
CN103268345A (zh) * 2013-05-27 2013-08-28 慈文传媒集团股份有限公司 影视数据的检索方法及装置
CN103279513A (zh) * 2013-05-22 2013-09-04 百度在线网络技术(北京)有限公司 产生内容标签的方法、提供多媒体内容信息的方法及装置
CN103593336A (zh) * 2013-10-30 2014-02-19 中国运载火箭技术研究院 一种基于语义分析的知识推送系统及方法
CN103617213A (zh) * 2013-11-19 2014-03-05 北京奇虎科技有限公司 识别新闻网页属性特征的方法和系统
CN103714088A (zh) * 2012-10-09 2014-04-09 深圳市世纪光速信息技术有限公司 搜索词获取方法、服务器、搜索词推荐方法及系统
CN103810168A (zh) * 2012-11-06 2014-05-21 深圳市世纪光速信息技术有限公司 检索应用的方法、装置及终端
CN104462307A (zh) * 2014-11-28 2015-03-25 深圳市中兴移动通信有限公司 终端中对象的搜索方法和装置
CN105677684A (zh) * 2014-11-21 2016-06-15 华东师范大学 一种基于外部数据源对用户生成内容进行语义标注的方法
CN105843918A (zh) * 2016-03-25 2016-08-10 前锦网络信息技术(上海)有限公司 一种从职位数据库中快速筛选职位的方法
CN105893440A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关联应用的推荐方法及装置
CN106202186A (zh) * 2016-06-27 2016-12-07 百度在线网络技术(北京)有限公司 基于人工智能的服务推荐方法和装置
CN106528716A (zh) * 2016-10-26 2017-03-22 腾讯音乐娱乐(深圳)有限公司 一种多媒体搜索内容的推荐方法和装置
CN106709052A (zh) * 2017-01-06 2017-05-24 电子科技大学 一种基于关键词的主题网络爬虫设计方法

Patent Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1584884A (zh) * 2003-08-20 2005-02-23 富士通株式会社 检索结构化文档的数据的设备和方法
CN101963966A (zh) * 2009-07-24 2011-02-02 李占胜 一种为搜索结果添加标签的搜索结果分类方法
CN102043812A (zh) * 2009-10-13 2011-05-04 北京大学 一种医疗信息的检索方法及系统
CN102622358A (zh) * 2011-01-27 2012-08-01 天脉聚源(北京)传媒科技有限公司 一种搜索信息的方法和系统
CN102867001A (zh) * 2011-07-05 2013-01-09 腾讯科技(北京)有限公司 获取信息的方法和装置
CN102955813A (zh) * 2011-08-29 2013-03-06 中国移动通信集团四川有限公司 一种信息搜索方法和系统
CN103106199A (zh) * 2011-11-09 2013-05-15 中国移动通信集团四川有限公司 文本检索方法和装置
CN102622451A (zh) * 2012-04-16 2012-08-01 上海交通大学 电视节目标签自动生成系统
CN102880687A (zh) * 2012-09-14 2013-01-16 北京大学 基于标签技术的个人交互数据检索方法及其系统
CN103714088A (zh) * 2012-10-09 2014-04-09 深圳市世纪光速信息技术有限公司 搜索词获取方法、服务器、搜索词推荐方法及系统
CN103810168A (zh) * 2012-11-06 2014-05-21 深圳市世纪光速信息技术有限公司 检索应用的方法、装置及终端
CN103279513A (zh) * 2013-05-22 2013-09-04 百度在线网络技术(北京)有限公司 产生内容标签的方法、提供多媒体内容信息的方法及装置
CN103268345A (zh) * 2013-05-27 2013-08-28 慈文传媒集团股份有限公司 影视数据的检索方法及装置
CN103593336A (zh) * 2013-10-30 2014-02-19 中国运载火箭技术研究院 一种基于语义分析的知识推送系统及方法
CN103617213A (zh) * 2013-11-19 2014-03-05 北京奇虎科技有限公司 识别新闻网页属性特征的方法和系统
CN105677684A (zh) * 2014-11-21 2016-06-15 华东师范大学 一种基于外部数据源对用户生成内容进行语义标注的方法
CN104462307A (zh) * 2014-11-28 2015-03-25 深圳市中兴移动通信有限公司 终端中对象的搜索方法和装置
CN105893440A (zh) * 2015-12-15 2016-08-24 乐视网信息技术(北京)股份有限公司 一种关联应用的推荐方法及装置
CN105843918A (zh) * 2016-03-25 2016-08-10 前锦网络信息技术(上海)有限公司 一种从职位数据库中快速筛选职位的方法
CN106202186A (zh) * 2016-06-27 2016-12-07 百度在线网络技术(北京)有限公司 基于人工智能的服务推荐方法和装置
CN106528716A (zh) * 2016-10-26 2017-03-22 腾讯音乐娱乐(深圳)有限公司 一种多媒体搜索内容的推荐方法和装置
CN106709052A (zh) * 2017-01-06 2017-05-24 电子科技大学 一种基于关键词的主题网络爬虫设计方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587568A (zh) * 2018-11-01 2019-04-05 北京奇艺世纪科技有限公司 视频播放方法、装置、计算机可读存储介质
CN110532451A (zh) * 2019-06-26 2019-12-03 平安科技(深圳)有限公司 针对政策文本的检索方法和装置、存储介质、电子装置
CN110532451B (zh) * 2019-06-26 2023-08-29 平安科技(深圳)有限公司 针对政策文本的检索方法和装置、存储介质、电子装置
CN111061983A (zh) * 2019-12-17 2020-04-24 上海冠勇信息科技有限公司 一种侵权数据抓取优先级的评估方法及其网络监控系统
CN111061983B (zh) * 2019-12-17 2024-01-09 上海冠勇信息科技有限公司 一种侵权数据抓取优先级的评估方法及其网络监控系统
CN111813902A (zh) * 2020-05-21 2020-10-23 车智互联(北京)科技有限公司 智能应答方法、系统及计算设备
CN111813902B (zh) * 2020-05-21 2024-02-23 车智互联(北京)科技有限公司 智能应答方法、系统及计算设备

Similar Documents

Publication Publication Date Title
US20210209109A1 (en) Method, apparatus, device, and storage medium for intention recommendation
US9317613B2 (en) Large scale entity-specific resource classification
KR101793222B1 (ko) 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트
US8190556B2 (en) Intellegent data search engine
Bi et al. Inferring the demographics of search users: Social data meets search queries
Nahar et al. Sentiment analysis for effective detection of cyber bullying
CN108881194A (zh) 企业内部用户异常行为检测方法和装置
US8041733B2 (en) System for automatically categorizing queries
CN110532451A (zh) 针对政策文本的检索方法和装置、存储介质、电子装置
CN103902597B (zh) 确定目标关键词所对应的搜索相关性类别的方法和设备
EP2560111A2 (en) Systems and methods for facilitating the gathering of open source intelligence
CN107291930A (zh) 权重数的计算方法
CN106156372B (zh) 一种互联网网站的分类方法及装置
US20080040342A1 (en) Data processing apparatus and methods
Rao Data mining and clustering techniques
CN108874996A (zh) 网站分类方法及装置
CN107229645A (zh) 信息处理方法、服务平台及客户端
Qabajeh et al. A dynamic rule-induction method for classification in data mining
CN105975547B (zh) 基于内容与位置特征的近似web文档检测方法
CN112749330B (zh) 信息推送方法、装置、计算机设备和存储介质
CN103955480B (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
CN109857952A (zh) 一种具有分类显示的搜索引擎及快速检索方法
Sharma et al. A study of tree based machine learning techniques for restaurant reviews
CN114254615A (zh) 组卷方法、装置、电子设备和存储介质
Cao et al. Fake reviewer group detection in online review systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171024

WD01 Invention patent application deemed withdrawn after publication