CN115470255A - 一种基于数据处理的信息检索分析系统 - Google Patents
一种基于数据处理的信息检索分析系统 Download PDFInfo
- Publication number
- CN115470255A CN115470255A CN202211161670.2A CN202211161670A CN115470255A CN 115470255 A CN115470255 A CN 115470255A CN 202211161670 A CN202211161670 A CN 202211161670A CN 115470255 A CN115470255 A CN 115470255A
- Authority
- CN
- China
- Prior art keywords
- information
- viewing
- time
- user
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 14
- 238000012163 sequencing technique Methods 0.000 claims abstract description 6
- 238000001514 detection method Methods 0.000 claims description 12
- 238000007689 inspection Methods 0.000 claims description 11
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于数据处理的信息检索分析系统,涉及数据处理技术领域,公开了包括数据采集模块、检类推荐模块、信息推荐模块,通过设置检类推荐模块,可以根据用户之前信息检索的查看记录计算获取得到同类信息的优推值,并在该用户后续检索时将不同类型的信息排序显示在用户的终端,方便用户在后续检索过程中,根据用户的检索习惯,快速选择并查看检索信息,设置信息推荐模块,将优检信息显示在用户的终端上的对应所属分类的第一位置,避免出现某个信息长时间未被检索查看而导致后续难以检索出的情况。
Description
技术领域
本发明涉及数据处理技术领域,更具体地说,它涉及一种基于数据处理的信息检索分析系统。
背景技术
数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
信息检索是用户进行信息查询和获取的主要方式,是查找信息的方法和手段,所以在数据处理过程中必然需要进行的就是信息检索。目前的信息检索系统检索在多类型的信息检索过程中,用户无法快速的找到自己需要的类型信息,导致信息的检索效率并不高。并且有些信息因为检索方法等原因会导致长时间未被查看以及检索出来,进而导致这种信息以后会越来越难被检索出来。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种基于数据处理的信息检索分析系统。
为实现上述目的,本发明提供了如下技术方案:
一种基于数据处理的信息检索分析系统,包括数据采集模块、检类推荐模块、信息推荐模块;
所述数据采集模块用于对用户信息以及检索信息进行采集,并将用户信息与检索信息发送至服务器中进行存储;
所述检类推荐模块用于根据用户之前信息检索的查看记录计算获取得到同类信息的优推值,并在该用户后续检索时将不同类型的信息排序显示在用户的终端,具体为:
步骤一:获取得到系统当前时间之前用户每次信息检索的查看记录,并将查看记录中的每条信息标记为历史参考信息,获取得到历史参考信息的查看时长;
步骤二:获取得到历史参考信息的所属类型,并将系统当前时间之前同类历史参考信息的查看时长进行求和处理并取均值,获取得到同类查看均时并标记为Td;
步骤三:将每次信息检索的同类历史参考信息的查看开始时间与查看结束时间按照时间先后顺序进行排序,并获取得到同类查看均隔并标记为Tp;
步骤四:获取得到系统当前时间之前同类历史参考信息的查看次数,并标记为Cs;
步骤六:将同类信息根据优推值的数值大小由大至小进行排序,并将对应的同类信息的所属分类排序显示在用户的终端,如工业信息的优推值>农业信息的优推值>军事信息的优推值>政治信息的优推值,将工业信息排序显示在用户手机终端的第一页,并根据顺序依次将农业信息、军事信息、政治信息排序显示在用户的终端;
所述信息推荐模块用于将优检信息显示在用户的终端上的对应所属分类的第一位置。
进一步的,历史参考信息的查看时长通过下述步骤获取得到:获取得到每条信息的查看开始时间与查看结束时间,将每条信息的查看结束时间与查看开始时间进行时间差值计算,获取得到查看时长。
进一步的,同类查看均隔通过下述步骤获取得到:将时间在前的同类历史参考信息的查看开始时间标记为Ta,查看结束时间标记为Tz,将时间在后的同类历史参考信息的查看开始时间标记为Tm,查看结束时间标记为Tn,利用公式获取得到同类历史参考信息的同类查看均隔Tp。
进一步的,所述信息推荐模块用于将优检信息显示在用户的终端上的对应所属分类的第一位置,具体为:
步骤一:获取得到信息的录入时间,将系统当前时间与录入时间进行时间差值计算,获取得到录入时长,并标记为Bh;
步骤二:获取得到系统当前时间前一个月每个信息每日的查看次数,设定每个信息每日的查看次数对应一个预期查看次数,将信息每日的查看次数与预期查看次数进行比对,当信息每日的查看次数小于预期查看次数时,将该信息每日的查看次数标记为失落查看次数,将预期查看次数与失落查看次数进行差值计算获取得到预期查看差次,并标记为Pv;设置预期查看差次系数为Km;
Km,m=1,2,3,…m;K1<K2<K3<…<Km,设定每个预期查看差次系数均对应一个预期查看差次的范围,包括(0,P1],(P1,P2],……,(Pv-1,Pv],当Pv∈(0,P1],则对应的预期查看差次系数为K1;
步骤三:将录入时长、查看异值进行归一化处理,利用公式获取得到信息的优检值,其中b1、b2均为预设比例系数,将信息的优检值根据所属分类进行分类,并将同类型信息中优检值最大的信息标记为优检信息,将优检信息显示在用户的终端上的对应所属分类的第一位置。
进一步的,所述用户信息包括用户之前信息检索的查看记录。
与现有技术相比,本发明具备以下有益效果:
1、设置检类推荐模块,可以根据用户之前信息检索的查看记录计算获取得到同类信息的优推值,并在该用户后续检索时将不同类型的信息排序显示在用户的终端,方便用户在后续检索过程中,根据用户的检索习惯,快速选择并查看检索信息;
2、设置信息推荐模块,将优检信息显示在用户的终端上的对应所属分类的第一位置,避免出现某个信息长时间未被检索查看而导致后续难以检索出的情况。
附图说明
图1为本发明检类推荐模块的原理框图;
图2为本发明信息推荐模块的原理框图。
具体实施方式
实施例1
参照图1,一种基于数据处理的信息检索分析系统,包括数据采集模块、检类推荐模块;
数据采集模块用于对用户信息以及检索信息进行采集,并将用户信息与检索信息发送至服务器中进行存储;
检类推荐模块用于根据用户之前信息检索的查看记录计算获取得到同类信息的优推值,并在该用户后续检索时将不同类型的信息排序显示在用户的终端,具体为:
步骤一:获取得到系统当前时间之前用户每次信息检索的查看记录,并将查看记录中的每条信息标记为历史参考信息,获取得到历史参考信息的查看时长;
步骤二:获取得到历史参考信息的所属类型,并将系统当前时间之前同类历史参考信息的查看时长进行求和处理并取均值,获取得到同类查看均时并标记为Td;
步骤三:将每次信息检索的同类历史参考信息的查看开始时间与查看结束时间按照时间先后顺序进行排序,并获取得到同类查看均隔并标记为Tp;
步骤四:获取得到系统当前时间之前同类历史参考信息的查看次数,并标记为Cs;
步骤六:将同类信息根据优推值的数值大小由大至小进行排序,并将对应的同类信息的所属分类排序显示在用户的终端,如工业信息的优推值>农业信息的优推值>军事信息的优推值>政治信息的优推值,将工业信息排序显示在用户手机终端的第一页,并根据顺序依次将农业信息、军事信息、政治信息排序显示在用户的终端;
信息推荐模块用于将优检信息显示在用户的终端上的对应所属分类的第一位置。
历史参考信息的查看时长通过下述步骤获取得到:获取得到每条信息的查看开始时间与查看结束时间,将每条信息的查看结束时间与查看开始时间进行时间差值计算,获取得到查看时长。
同类查看均隔通过下述步骤获取得到:将时间在前的同类历史参考信息的查看开始时间标记为Ta,查看结束时间标记为Tz,将时间在后的同类历史参考信息的查看开始时间标记为Tm,查看结束时间标记为Tn,利用公式获取得到同类历史参考信息的同类查看均隔Tp。
用户信息包括用户之前信息检索的查看记录。
实施例2
参照图2,在实施例1的基础上,还包括信息推荐模块,信息推荐模块用于将优检信息显示在用户的终端上的对应所属分类的第一位置,具体为:
步骤一:获取得到信息的录入时间,将系统当前时间与录入时间进行时间差值计算,获取得到录入时长,并标记为Bh;
步骤二:获取得到系统当前时间前一个月每个信息每日的查看次数,设定每个信息每日的查看次数对应一个预期查看次数,将信息每日的查看次数与预期查看次数进行比对,当信息每日的查看次数小于预期查看次数时,将该信息每日的查看次数标记为失落查看次数,将预期查看次数与失落查看次数进行差值计算获取得到预期查看差次,并标记为Pv;设置预期查看差次系数为Km;
Km,m=1,2,3,…m;K1<K2<K3<…<Km,设定每个预期查看差次系数均对应一个预期查看差次的范围,包括(0,P1],(P1,P2],……,(Pv-1,Pv],当Pv∈(0,P1],则对应的预期查看差次系数为K1;
步骤三:将录入时长、查看异值进行归一化处理,利用公式获取得到信息的优检值,其中b1、b2均为预设比例系数,将信息的优检值根据所属分类进行分类,并将同类型信息中优检值最大的信息标记为优检信息,将优检信息显示在用户的终端上的对应所属分类的第一位置。
工作原理:
设置检类推荐模块,可以根据用户之前信息检索的查看记录计算获取得到同类信息的优推值,并在该用户后续检索时将不同类型的信息排序显示在用户的终端,方便用户在后续检索过程中,根据用户的检索习惯,快速选择并查看检索信息,设置信息推荐模块,将优检信息显示在用户的终端上的对应所属分类的第一位置,避免出现某个信息长时间未被检索查看而导致后续难以检索出的情况。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本模板的保护范围。
Claims (5)
1.一种基于数据处理的信息检索分析系统,其特征在于,包括数据采集模块、检类推荐模块、信息推荐模块;
所述数据采集模块用于对用户信息以及检索信息进行采集,并将用户信息与检索信息发送至服务器中进行存储;
所述检类推荐模块用于根据用户之前信息检索的查看记录计算获取得到同类信息的优推值,并在该用户后续检索时将不同类型的信息排序显示在用户的终端,具体为:
步骤一:获取得到系统当前时间之前用户每次信息检索的查看记录,并将查看记录中的每条信息标记为历史参考信息,获取得到历史参考信息的查看时长;
步骤二:获取得到历史参考信息的所属类型,并将系统当前时间之前同类历史参考信息的查看时长进行求和处理并取均值,获取得到同类查看均时并标记为Td;
步骤三:将每次信息检索的同类历史参考信息的查看开始时间与查看结束时间按照时间先后顺序进行排序,并获取得到同类查看均隔并标记为Tp;
步骤四:获取得到系统当前时间之前同类历史参考信息的查看次数,并标记为Cs;
步骤六:将同类信息根据优推值的数值大小由大至小进行排序,并将对应的同类信息的所属分类排序显示在用户的终端;
所述信息推荐模块用于将优检信息显示在用户的终端上的对应所属分类的第一位置。
2.根据权利要求1所述的一种基于数据处理的信息检索分析系统,其特征在于,历史参考信息的查看时长通过下述步骤获取得到:获取得到每条信息的查看开始时间与查看结束时间,将每条信息的查看结束时间与查看开始时间进行时间差值计算,获取得到查看时长。
4.根据权利要求3所述的一种基于数据处理的信息检索分析系统,其特征在于,所述信息推荐模块用于将优检信息显示在用户的终端上的对应所属分类的第一位置,具体为:
步骤一:获取得到信息的录入时间,将系统当前时间与录入时间进行时间差值计算,获取得到录入时长,并标记为Bh;
步骤二:获取得到系统当前时间前一个月每个信息每日的查看次数,设定每个信息每日的查看次数对应一个预期查看次数,将信息每日的查看次数与预期查看次数进行比对,当信息每日的查看次数小于预期查看次数时,将该信息每日的查看次数标记为失落查看次数,将预期查看次数与失落查看次数进行差值计算获取得到预期查看差次,并标记为Pv;设置预期查看差次系数为Km;
Km,m=1,2,3,…m;K1<K2<K3<…<Km,设定每个预期查看差次系数均对应一个预期查看差次的范围,包括(0,P1],(P1,P2],……,(Pv-1,Pv],当Pv∈(0,P1],则对应的预期查看差次系数为K1;
5.根据权利要求4所述的一种基于数据处理的信息检索分析系统,其特征在于,所述用户信息包括用户之前信息检索的查看记录。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211161670.2A CN115470255A (zh) | 2022-09-22 | 2022-09-22 | 一种基于数据处理的信息检索分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211161670.2A CN115470255A (zh) | 2022-09-22 | 2022-09-22 | 一种基于数据处理的信息检索分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115470255A true CN115470255A (zh) | 2022-12-13 |
Family
ID=84335162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211161670.2A Pending CN115470255A (zh) | 2022-09-22 | 2022-09-22 | 一种基于数据处理的信息检索分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115470255A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116567068A (zh) * | 2023-07-10 | 2023-08-08 | 深圳比特耐特信息技术股份有限公司 | 一种基于大数据的信息管理方法及系统 |
CN117457164A (zh) * | 2023-11-06 | 2024-01-26 | 南京康讯信息技术有限公司 | 一种医疗数据分类管理系统 |
-
2022
- 2022-09-22 CN CN202211161670.2A patent/CN115470255A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116567068A (zh) * | 2023-07-10 | 2023-08-08 | 深圳比特耐特信息技术股份有限公司 | 一种基于大数据的信息管理方法及系统 |
CN116567068B (zh) * | 2023-07-10 | 2023-09-15 | 深圳比特耐特信息技术股份有限公司 | 一种基于大数据的信息管理方法及系统 |
CN117457164A (zh) * | 2023-11-06 | 2024-01-26 | 南京康讯信息技术有限公司 | 一种医疗数据分类管理系统 |
CN117457164B (zh) * | 2023-11-06 | 2024-09-10 | 江苏鼎驰电子科技有限公司 | 一种医疗数据分类管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115470255A (zh) | 一种基于数据处理的信息检索分析系统 | |
CN101119326B (zh) | 一种即时通信会话记录的管理方法及装置 | |
CN112348602B (zh) | 一种基于大数据的广告自动化投放管理系统 | |
CN110334111B (zh) | 一种多维轨迹分析方法及装置 | |
CN110807085B (zh) | 故障信息的查询方法及装置、存储介质、电子装置 | |
TWI453608B (zh) | System and method for managing a large number of multiple data | |
CN109656973A (zh) | 一种目标对象关联分析方法及装置 | |
CN114092056A (zh) | 项目管理方法、装置、电子设备、存储介质及产品 | |
CN111191046A (zh) | 一种实现信息搜索的方法、装置、计算机存储介质及终端 | |
US20070271245A1 (en) | System and method for searching a database | |
CN113568934A (zh) | 一种数据查询方法、装置、电子设备和存储介质 | |
CN114817730B (zh) | 一种大数据情境下的资讯活动信息推荐系统及方法 | |
CN109828991B (zh) | 一种多时空条件下查询排序方法、装置、设备和存储介质 | |
CN117076692A (zh) | 一种档案在线管理方法及系统 | |
CN106326408A (zh) | 一种通过检索和分析生成笔录的方法、系统和终端 | |
CN114676336B (zh) | 一种智能分类便于进行检索查找的网络搜索系统 | |
CN116401434A (zh) | 一种网络数据信息智能提取系统 | |
CN115563189A (zh) | 一种基于数据挖掘技术的海量数据查询方法 | |
CN114817518A (zh) | 基于大数据档案识别的证照办理方法、系统及介质 | |
CN109934740B (zh) | 一种专利监控方法及装置 | |
CN113343105A (zh) | 一种关键词页面管理系统、方法、设备以及计算机可读存储介质 | |
CN113032657A (zh) | 一种快速选择企业推广中核心市场的方法 | |
CN206557835U (zh) | 一种室内快速定位的快递管理系统 | |
KR101147508B1 (ko) | 검색식 추천 장치 및 방법 | |
CN108572997B (zh) | 一种具有网络属性的多源数据的整合存储系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20221213 |
|
WD01 | Invention patent application deemed withdrawn after publication |