CN116975314B - 一种电子档案智能查询方法与系统 - Google Patents

一种电子档案智能查询方法与系统 Download PDF

Info

Publication number
CN116975314B
CN116975314B CN202311237707.XA CN202311237707A CN116975314B CN 116975314 B CN116975314 B CN 116975314B CN 202311237707 A CN202311237707 A CN 202311237707A CN 116975314 B CN116975314 B CN 116975314B
Authority
CN
China
Prior art keywords
file
search
user
determining
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311237707.XA
Other languages
English (en)
Other versions
CN116975314A (zh
Inventor
梁尔真
袁学群
夏磊
吴存锋
郑望献
周蕾
蔡利华
曹军
王园
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Xinghan Information Technology Ltd By Share Ltd
Original Assignee
Zhejiang Xinghan Information Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Xinghan Information Technology Ltd By Share Ltd filed Critical Zhejiang Xinghan Information Technology Ltd By Share Ltd
Priority to CN202311237707.XA priority Critical patent/CN116975314B/zh
Publication of CN116975314A publication Critical patent/CN116975314A/zh
Application granted granted Critical
Publication of CN116975314B publication Critical patent/CN116975314B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种电子档案智能查询方法与系统,属于档案管理技术领域,具体包括:通过历史点击数据、历史浏览数据以及调取数据进行电子档案的质量分的评估,并根据所述质量分进行疑似问题档案以及用户的档案检索范围的确定,将用户在设定时间内的检索条件作为参考检索条件,并将相似度满足要求的参考检索条件作为相似检索条件,获取档案检索范围内的备选档案与参考档案的相似度以及质量分,并结合参考档案的用户热度以及所对应的相似检索条件的相似度进行备选档案的推荐值以及检索结果的输出,实现了对检索结果的动态调整。

Description

一种电子档案智能查询方法与系统
技术领域
本发明属于档案管理技术领域,尤其涉及一种电子档案智能查询方法与系统。
背景技术
电子档案在存档完成后,为了便于电子档案的检索和利用,现有的档案保存机构往往都设置有电子档案查询系统,因此如何提升档案查询的准确率和效率,进一步提升电子档案的利用效率成为亟待解决的技术问题。
为了提升电子档案的查询的准确率和效率,现有技术方案中给出了基于检索用户的历史相似检索条件下的档案的匹配情况进行检索用户在指定条件下的档案检索结果的输出,具体的,在发明专利CN202111416544.2《智能调取电子档案的方法、装置、电子设备和存储介质》、发明专利CN202310700528.9《一种基于云端存储的加密式档案资料的检索方法》均给出了类似的技术手段,但是上述现有技术手段中却存在以下技术问题:
当检索结果不能令人满意时,检索人员往往会尝试更改检索词或者减少检索词的方式重新尝试得到检索结果,与历史相似检索条件相比,此时用户在不同的检索条件下的不同档案的点击浏览情况更能反应当前的用户的检索结果的需求,因此若不能结合上述因素对档案检索的检索结果进行动态调整,则有可能导致检索的效率和准确性不能令人满意。
现有技术中均未考虑对问题档案的识别,并将其在检索结果中进行排除,具体的,若某一个档案的点击浏览数据较多,但是却从未被当做是匹配档案,则该档案存在问题的可能性明显更大,因此若不能进行问题档案的识别,则同样有可能导致检索的效率和准确性不能令人满意。
针对上述技术问题,本发明提供了一种电子档案智能查询方法与系统。
发明内容
为实现本发明目的,本发明采用如下技术方案:
根据本发明的一个方面,提供了一种电子档案智能查询方法。
一种电子档案智能查询方法,其特征在于,具体包括:
S11通过历史点击数据、历史浏览数据以及调取数据进行电子档案的质量分的评估,并根据所述质量分进行疑似问题档案以及用户的档案检索范围的确定;
S12根据所述用户的检索条件判断用户在预设时间内是否存在检索记录,若是,则进入下一步骤,若否,则通过档案的质量分、档案与检索条件的匹配情况以及所述用户的历史提取档案进行检索结果的输出;
S13将用户在设定时间内的检索条件作为参考检索条件,并通过用户的检索条件与参考检索条件的相似度确定存在相似度满足要求的参考检索条件时,将所述相似度满足要求的参考检索条件作为相似检索条件并进入下一步骤;
S14通过不同的相似检索条件下的用户的浏览数据和点击数据进行档案的用户热度的确定,并结合所述相似检索条件的相似度进行所述不同的相似检索条件下的参考档案的输出,获取所述档案检索范围内的备选档案与所述参考档案的相似度以及质量分,并结合所述参考档案的用户热度以及所对应的相似检索条件的相似度进行所述备选档案的推荐值以及检索结果的输出。
进一步的技术方案在于,所述电子档案的历史点击数据包括但不限于历史点击人数、历史点击次数以及不同的历史点击人员的历史点击次数。
进一步的技术方案在于,所述电子档案的历史浏览数据包括但不限于历史浏览人数、历史浏览时长以及不同的历史浏览人员的历史浏览时长。
进一步的技术方案在于,通过所述电子档案的历史点击人数以及历史点击次数确定是否能够进行电子档案的质量分的评估,具体包括:
当所述电子档案的历史点击人数小于点击人数最小限定值或者所述电子档案的历史点击次数小于点击次数最小限定值时,则确定无法继续进行所述电子档案的质量分的评估。
进一步的技术方案在于,所述电子档案的质量分的评估的具体步骤为:
通过所述电子档案的历史点击数据进行所述电子档案的历史点击次数小于预设次数的历史点击人数的确定,并结合所述电子档案的历史点击人数以及历史点击次数进行所述电子档案的点击热度的确定;
通过所述电子档案的历史浏览数据进行所述电子档案的历史浏览时长小于预设时长的历史浏览人数的确定,并结合所述电子档案的历史浏览人数以及历史浏览时长进行所述电子档案的浏览热度的确定;
通过所述电子档案的浏览热度以及点击热度进行所述电子档案的调用次数限定值以及调用人数限定值的确定,通过所述电子档案的调取数据进行所述电子档案的历史调用次数以及历史调用人数的确定,并判断是否所述电子档案的历史调用人数小于所述调用人数限定值且所述电子档案的历史调用次数小于所述调用次数限定值,若是,则确定所述电子档案为疑似问题档案,若否,则进入下一步骤;
通过所述电子档案的历史调用人数与所述调用人数限定值的比值、所述电子档案的历史调用次数与所述调用次数限定值的比值以及所述电子档案的历史调用次数大于预设调用次数的历史调用人数进行所述电子档案的质量分的确定。
进一步的技术方案在于,当所述电子档案的质量分不满足要求时,则确定所述电子档案为疑似问题档案,并将除去所述问题电子档案的电子档案作为档案检索范围。
进一步的技术方案在于,所述用户的检索条件与参考检索条件的相似度确定的方法为:
将所述用户的检索条件的检索词作为本次检索词,将所述用户的参考检索条件的检索词作为参考检索词,并判断所述本次检索词是否存在所述参考检索词中没有的检索词,若是,则进入下一步骤,若否,则通过所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定;
将与所述参考检索词不一致的本次检索词作为不一致检索词,并通过所述不一致检索词与所述参考检索词的语义相似度将所述不一致检索词划分为相似语义检索词以及不相似语义检索词,并判断所述不一致检索词中是否包含所述不相似语义检索词,若是,则进入下一步骤,若否,则通过所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定;
获取所述本次检索词中的不相似语义检索词的数量以及在所述本次检索词的数量占比,并结合所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定。
第二方面,本发明提供了一种电子档案智能查询系统,采用上述的一种电子档案智能查询方法,其特征在于,具体包括:
问题档案确定模块;检索结果调整模块;其中所述检索结果调整模块包括检索记录获取模块、相似检索条件评估模块、检索结果输出模块;
其中所述问题档案确定模块负责通过历史点击数据、历史浏览数据以及调取数据进行电子档案的质量分的评估,并根据所述质量分进行疑似问题档案以及用户的档案检索范围的确定;
所述检索记录获取模块负责根据所述用户的检索条件判断用户在预设时间内是否存在检索记录;
所述相似检索条件评估模块负责将用户在设定时间内的检索条件作为参考检索条件,并通过用户的检索条件与参考检索条件的相似度确定存在相似度满足要求的参考检索条件时,将所述相似度满足要求的参考检索条件作为相似检索条件并进入下一步骤;
所述检索结果输出模块负责通过不同的相似检索条件下的用户的浏览数据和点击数据进行档案的用户热度的确定,并结合所述相似检索条件的相似度进行所述不同的相似检索条件下的参考档案的输出,获取所述档案检索范围内的备选档案与所述参考档案的相似度以及质量分,并结合所述参考档案的用户热度以及所对应的相似检索条件的相似度进行所述备选档案的推荐值以及检索结果的输出。
本发明的有益效果在于:
通过根据质量分进行疑似问题档案以及用户的档案检索范围的确定,既考虑到不同的档案的提取情况和浏览情况的差异性,实现了对问题档案的确定,同时通过对档案检索范围的确定,也使得整体的检索下和准确性得到进一步的提升。
通过对参考检索条件的相似度以及相似检索条件的确定,不仅考虑到不同的参考条件的相似情况的差异,同时实现了对相似度较高的相似检索条件的确定,也为进一步实现对检索结果的差异化调整奠定了基础。
通过进行备选档案的推荐值,并根据备选档案的推荐值进行检索结果的输出,不仅考虑到不同的备选档案与相似检索条件下的参考档案的相似性,同时还考虑到不同的备选档案的质量分,实现了对备选档案的准确评估,保证了检索结果的准确性和可靠性。
其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显;
图1是一种电子档案智能查询方法的流程图;
图2是电子档案的质量分的评估的具体步骤的流程图;
图3是另外一种的电子档案的质量分的评估的具体步骤的流程图;
图4是用户的检索条件与参考检索条件的相似度确定的方法的流程图;
图5是不同的相似检索条件下的参考档案的确定的方法的流程图;
图6是推荐值确定的方法的流程图;
图7是一种电子档案智能查询系统的框架图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
申请人发现,现有技术方案中往往根据检索系统中自身的或者其它检索用户的历史检索条件下的档案的匹配结果对当前的检索条件下的检索结果进行调整,但是用户在不同的时间的检索需求存在巨大的差异,当用户在一定时间内,具体的可以为10分钟或者5分钟以内,若检索条件下的检索结果不够满意时,会通过更改关键词或者缩小关键词的方式再次检索,因此在相邻的检索过程中,用户的档案浏览或者点击数据可以在一定程度上反应用户的真实档案需求,与历史检索条件下的匹配档案相比,更具有参考价值。
同时申请人发现,对于检索过程中频繁被人浏览或者点击的档案,若提取次数或者匹配次数较少时,其存在质量问题的可能性很大,因此若不能对存在质量问题的档案筛选,也会导致检索效率变慢。
针对上述技术问题,申请人采用以下技术方案:
首先通过电子档案的浏览点击数据与提取数据进行质量分的评估,具体的可以通过正常电子档案的浏览人数与提取人数的比值、电子档案的浏览人数与提取人数的比值实现对电子档案的质量分的评估,并根据质量分进行档案检索范围的确定;
根据用户的检索条件和身份判断一定时间内是否存在检索记录,具体的可以选取10分钟到20分钟以内的检索记录,当存在时,进入下一步骤;
根据检索记录进行参考检索条件的确定,根据参考检索条件与检索条件的检索词的相似性进行相似检索条件的确定,其中参考检索条件与检索条件的检索词的相似性可以根据参考检索条件与检索条件的检索词的一致的数量与参考检索条件的数量的比值进行确定;
当获取相似检索条件后,根据不同的相似检索条件下的档案的浏览点击数据进行档案的用户热度的确定,结合相似检索条件的相似性进行参考档案的确定,并通过档案与参考档案的相似性和质量分进行推荐值的确定,并将推荐值较大的档案作为检索结果输出。其中推荐值可以根据档案与参考档案的相似性和质量分进行归一化处理后的均值进行确定。
为便于理解,下面将通过方法类实施例和系统类实施例进行方案的说明。
为解决上述问题,根据本发明的一个方面,如图1所示,提供了根据本发明的一个方面,提供了一种电子档案智能查询方法,其特征在于,具体包括:
S11通过历史点击数据、历史浏览数据以及调取数据进行电子档案的质量分的评估,并根据所述质量分进行疑似问题档案以及用户的档案检索范围的确定;
在本实施例中,通过根据电子档案的浏览点击数据以及提取数据进行电子档案的质量分的评估,可以将质量不高的电子档案剔除,提升档案检索的效率。
具体的,所述电子档案的历史点击数据包括但不限于历史点击人数、历史点击次数以及不同的历史点击人员的历史点击次数。
具体的,所述电子档案的历史浏览数据包括但不限于历史浏览人数、历史浏览时长以及不同的历史浏览人员的历史浏览时长。
在其中的一个可能的实施例中,如图2所示,上述步骤S11中的所述电子档案的质量分的评估的具体步骤为:
S21通过电子档案的历史点击数据进行所述电子档案的历史点击人数以及历史点击次数的确定,并通过所述电子档案的历史点击人数以及历史点击次数确定是否能够进行电子档案的质量分的评估,若是,则进入步骤S23,若否,则进入步骤S22;
当电子档案的历史点击人数以及历史点击次数均较少时,此时由于数据量较少,无法实现对电子档案的质量分的评估。
具体的,通过所述电子档案的历史点击人数以及历史点击次数确定是否能够进行电子档案的质量分的评估,具体包括:
当所述电子档案的历史点击人数小于点击人数最小限定值或者所述电子档案的历史点击次数小于点击次数最小限定值时,则确定无法继续进行所述电子档案的质量分的评估。
S22通过所述电子档案的历史浏览数据进行所述电子档案的历史浏览人数以及历史浏览时长的确定,并通过所述电子档案的历史浏览人数以及历史浏览时长确定是否能够进行电子档案的质量分的评估,若是,则进入步骤S23,若否,则暂时无法进行所述电子档案的质量分的评估,并通过初始预设质量分进行所述电子档案的质量分的确定;
S23通过所述电子档案的历史点击数据进行所述电子档案的历史点击次数小于预设次数的历史点击人数的确定,并结合所述电子档案的历史点击人数以及历史点击次数进行所述电子档案的点击热度的确定;
S24通过所述电子档案的历史浏览数据进行所述电子档案的历史浏览时长小于预设时长的历史浏览人数的确定,并结合所述电子档案的历史浏览人数以及历史浏览时长进行所述电子档案的浏览热度的确定;
S25通过所述电子档案的调取数据进行所述电子档案的历史调用次数以及历史调用人数的确定,并结合所述电子档案的历史调用次数大于预设调用次数的历史调用人数进行所述电子档案的调用热度的确定,通过所述电子档案的调用热度、浏览热度以及点击热度进行所述电子档案的质量分的确定。
在可能的一种实施例中,电子档案的点击热度可以根据电子档案的历史点击次数小于预设次数的历史点击人数、所述电子档案的历史点击人数以及历史点击次数与所有的电子档案的该项数据的均值的比值分别得到电子档案的历史点击次数小于预设次数的历史点击人数的点击热度、所述电子档案的历史点击人数的点击热度以及历史点击次数的点击热度,并根据电子档案的历史点击次数小于预设次数的历史点击人数的点击热度、所述电子档案的历史点击人数的点击热度以及历史点击次数的点击热度的乘积进行电子档案的点击热度的确定。
在另外一种可能的实施例中,电子档案的调用热度、电子档案的浏览热度均可以通过上述实施例中的电子档案的点击热度的确定方式进行确定,并根据子档案的调用热度与浏览热度的比值、调用热度与点击热度的比值的乘积进行所述电子档案的质量分的确定。
在另外一种可能的实施例中,如图3所示,上述步骤S11的所述电子档案的质量分的评估的具体步骤为:
通过所述电子档案的历史点击数据进行所述电子档案的历史点击次数小于预设次数的历史点击人数的确定,并结合所述电子档案的历史点击人数以及历史点击次数进行所述电子档案的点击热度的确定;
通过所述电子档案的历史浏览数据进行所述电子档案的历史浏览时长小于预设时长的历史浏览人数的确定,并结合所述电子档案的历史浏览人数以及历史浏览时长进行所述电子档案的浏览热度的确定;
通过所述电子档案的浏览热度以及点击热度进行所述电子档案的调用次数限定值以及调用人数限定值的确定,通过所述电子档案的调取数据进行所述电子档案的历史调用次数以及历史调用人数的确定,并判断是否所述电子档案的历史调用人数小于所述调用人数限定值且所述电子档案的历史调用次数小于所述调用次数限定值,若是,则确定所述电子档案为疑似问题档案,若否,则进入下一步骤;
通过所述电子档案的历史调用人数与所述调用人数限定值的比值、所述电子档案的历史调用次数与所述调用次数限定值的比值以及所述电子档案的历史调用次数大于预设调用次数的历史调用人数进行所述电子档案的质量分的确定。
在其中一种可能的实施例中,电子档案的调用次数限定值以及调用人数限定值可以通过其它的电子档案在设定的浏览热度以及点击热度下的调用次数的均值以及调用人数的均值进行确定。
具体的,当所述电子档案的质量分不满足要求时,则确定所述电子档案为疑似问题档案,并将除去所述问题电子档案的电子档案作为档案检索范围。
S12根据所述用户的检索条件判断用户在预设时间内是否存在检索记录,若是,则进入下一步骤,若否,则通过档案的质量分、档案与检索条件的匹配情况以及所述用户的历史提取档案进行检索结果的输出;
需要说明的是,上述步骤S12中的通过档案的质量分、档案与检索条件的匹配情况以及所述用户的历史提取档案进行检索结果的输出,具体包括:
通过所述档案与所述检索条件的匹配情况进行所述档案的匹配的检索条件的数量的确定,并根据所述档案的匹配的检索条件的数量进行所述档案的匹配度以及匹配档案的确定;
通过匹配的检索条件的数量与检索条件的数量的和的比值进行所述档案的匹配度的确定。
判断所述匹配档案中是否存在用户的历史提取档案,若是,则将所述匹配档案中的用户的历史提取档案作为历史检索结果,并进入下一步骤,若否,则直接进入下一步骤;
将排除所述历史检索结果的匹配档案作为剩余匹配档案,并判断所述剩余匹配档案中是否存在匹配度以及质量分均满足要求的剩余匹配档案,若是,则将所述匹配度以及质量分均满足要求的剩余匹配档案作为筛选检索结果,并进入下一步骤,若否,则直接进入下一步骤;
将排除所述筛选检索结果的剩余匹配档案作为其它匹配档案,并通过所述其它匹配档案的匹配度以及质量分进行所述其它匹配档案的档案匹配值的确定,并通过所述其它匹配档案的档案匹配值进行匹配检索结果的确认;
通过所述匹配检索结果、筛选检索结果以及历史检索结果进行检索结果的输出。
在其中的一个可能的实施例中,通过所述其它匹配档案的匹配度以及质量分的和进行所述其它匹配档案的档案匹配值的确定,并当档案匹配值满足要求后,再将其作为匹配检索结果。
需要说明的是,在进行其它匹配档案的档案匹配值的确定之前,需要对所述其它匹配档案的匹配度以及质量分进行归一化处理。
S13将用户在设定时间内的检索条件作为参考检索条件,并通过用户的检索条件与参考检索条件的相似度确定存在相似度满足要求的参考检索条件时,将所述相似度满足要求的参考检索条件作为相似检索条件并进入下一步骤;
需要说明的是,如图4所示,在上述步骤S13中的所述用户的检索条件与参考检索条件的相似度确定的方法为:
将所述用户的检索条件的检索词作为本次检索词,将所述用户的参考检索条件的检索词作为参考检索词,并判断所述本次检索词是否存在所述参考检索词中没有的检索词,若是,则进入下一步骤,若否,则通过所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定;
将与所述参考检索词不一致的本次检索词作为不一致检索词,并通过所述不一致检索词与所述参考检索词的语义相似度将所述不一致检索词划分为相似语义检索词以及不相似语义检索词,并判断所述不一致检索词中是否包含所述不相似语义检索词,若是,则进入下一步骤,若否,则通过所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定;
获取所述本次检索词中的不相似语义检索词的数量以及在所述本次检索词的数量占比,并结合所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定。
在另外一种可能的实施例中,可以直接通过本次检索词中的相似语义检索词的数量在所述本次检索词的数量占比进行相似度的确定。
S14通过不同的相似检索条件下的用户的浏览数据和点击数据进行档案的用户热度的确定,并结合所述相似检索条件的相似度进行所述不同的相似检索条件下的参考档案的输出,获取所述档案检索范围内的备选档案与所述参考档案的相似度以及质量分,并结合所述参考档案的用户热度以及所对应的相似检索条件的相似度进行所述备选档案的推荐值以及检索结果的输出。
在其中的一个可能的实施例中,如图5所示,上述步骤S14中的所述不同的相似检索条件下的参考档案的确定的方法为:
根据所述相似检索条件下的档案的用户的浏览数据以及点击数据进行所述档案的浏览情况以及点击情况的确定,并通过所述档案的浏览情况以及点击情况确定所述档案是否被浏览或者点击,若是,则将所述档案作为筛选参考档案,若否,则确定所述档案不属于参考档案;
通过所述筛选参考档案在所述相似检索条件下的用户的浏览数据进行在所述相似检索条件下的所述筛选参考档案的用户的浏览时长的确定,并结合在所述相似检索条件下的所述筛选参考档案的用户的点击次数进行所述筛选参考档案在所述相似检索条件下的当前用户热度的确定,判断所述筛选参考档案在所述相似检索条件下的当前用户热度是否满足要求,若是,则进入下一步骤,若否,则确定所述档案不属于参考档案;
在其中的一个可能的实施例中,可以通过筛选参考档案的用户的点击次数进行筛选参考档案的排名的确定,通过筛选参考档案的用户的浏览时长进行筛选参考档案的浏览排名的确定,通过排名和浏览排名的最大值进行筛选参考档案在所述相似检索条件下的当前用户热度的确定。
通过所述筛选参考档案在所有的相似检索条件下的用户的浏览数据进行所述筛选参考档案的用户的总体浏览时长的确定,并结合在所有的相似检索条件下的所述筛选参考档案的用户的总体点击次数进行所述筛选参考档案的总体用户热度的确定;
在其中的一个可能的实施例中,筛选参考档案的总体用户热度的确定也可以采用上述的当前用户热度的确定的具体实施例。
通过所述筛选参考档案在所述相似检索条件下的当前用户热度以及所述总体用户热度进行所述筛选参考档案的用户热度的确定,并判断所述筛选参考档案的用户热度是否大于预设热度值,若是,则确定所述筛选参考档案属于参考档案,若否,则进入下一步骤;
通过所述筛选参考档案的用户热度以及所述相似检索条件的相似度进行所述筛选参考档案的参考值的确定,并根据所述筛选参考档案的参考值确定所述筛选参考档案是否属于参考档案。
进一步的,在进行所述筛选参考档案的用户热度的确定之前,当所述筛选参考档案在所述相似检索条件下的当前用户热度以及所述总体用户热度均小于最小热度预设值时,则无需进行所述筛选参考档案的用户热度的确定,并确定所述筛选参考档案不属于参考档案。
具体的,如图6所示,上述步骤S14中的所述推荐值确定的方法为:
根据所述档案检索范围内的备选档案与所述参考档案的标题的关键词的匹配数量进行所述档案检索范围内的备选档案与所述参考档案的相似度的确定,并判断所述档案检索范围内的备选档案与所述参考档案的相似度确定所述备选档案是否相似,若是,则进入下一步骤,若否,则确定所述备选档案无法作为检索结果的输出;
根据所述参考档案的用户热度以及所述参考档案所对应的相似检索条件的相似度进行所述参考档案所对应的备选档案的相似度限定量的确定,判断所述档案检索范围内的备选档案与所述参考档案的相似度是否满足所述相似度限定量的要求,若是,则进入下一步骤,若否,则确定所述备选档案无法作为检索结果的输出;
通过所述备选档案与所述参考档案的相似度以及所述备选档案的质量分进行所述备选档案的自身推荐值的确定,并根据所述参考档案的用户热度以及所述参考档案所对应的相似检索条件的相似度进行所述备选档案的参考推荐值的确定;
通过所述备选档案的自身推荐值以及所述参考推荐值进行所述备选档案的推荐值的确定。
另一方面,如图7所示,本发明提供了一种电子档案智能查询系统,采用上述的一种电子档案智能查询方法,其特征在于,具体包括:
问题档案确定模块;检索结果调整模块;其中所述检索结果调整模块包括检索记录获取模块、相似检索条件评估模块、检索结果输出模块;
其中所述问题档案确定模块负责通过历史点击数据、历史浏览数据以及调取数据进行电子档案的质量分的评估,并根据所述质量分进行疑似问题档案以及用户的档案检索范围的确定;
所述检索记录获取模块负责根据所述用户的检索条件判断用户在预设时间内是否存在检索记录;
所述相似检索条件评估模块负责将用户在设定时间内的检索条件作为参考检索条件,并通过用户的检索条件与参考检索条件的相似度确定存在相似度满足要求的参考检索条件时,将所述相似度满足要求的参考检索条件作为相似检索条件并进入下一步骤;
所述检索结果输出模块负责通过不同的相似检索条件下的用户的浏览数据和点击数据进行档案的用户热度的确定,并结合所述相似检索条件的相似度进行所述不同的相似检索条件下的参考档案的输出,获取所述档案检索范围内的备选档案与所述参考档案的相似度以及质量分,并结合所述参考档案的用户热度以及所对应的相似检索条件的相似度进行所述备选档案的推荐值以及检索结果的输出。
通过上述实施例,本发明主要具有以下有益效果:
通过根据质量分进行疑似问题档案以及用户的档案检索范围的确定,既考虑到不同的档案的提取情况和浏览情况的差异性,实现了对问题档案的确定,同时通过对档案检索范围的确定,也使得整体的检索下和准确性得到进一步的提升。
通过对参考检索条件的相似度以及相似检索条件的确定,不仅考虑到不同的参考条件的相似情况的差异,同时实现了对相似度较高的相似检索条件的确定,也为进一步实现对检索结果的差异化调整奠定了基础。
通过进行备选档案的推荐值,并根据备选档案的推荐值进行检索结果的输出,不仅考虑到不同的备选档案与相似检索条件下的参考档案的相似性,同时还考虑到不同的备选档案的质量分,实现了对备选档案的准确评估,保证了检索结果的准确性和可靠性。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (6)

1.一种电子档案智能查询方法,其特征在于,具体包括:
通过历史点击数据、历史浏览数据以及调取数据进行电子档案的质量分的评估,并根据所述质量分进行疑似问题档案以及用户的档案检索范围的确定;
所述电子档案的质量分的评估的具体步骤为:
通过所述电子档案的历史点击数据进行所述电子档案的历史点击次数小于预设次数的历史点击人数的确定,并结合所述电子档案的历史点击人数以及历史点击次数进行所述电子档案的点击热度的确定;
通过所述电子档案的历史浏览数据进行所述电子档案的历史浏览时长小于预设时长的历史浏览人数的确定,并结合所述电子档案的历史浏览人数以及历史浏览时长进行所述电子档案的浏览热度的确定;
通过所述电子档案的浏览热度以及点击热度进行所述电子档案的调用次数限定值以及调用人数限定值的确定,通过所述电子档案的调取数据进行所述电子档案的历史调用次数以及历史调用人数的确定,并判断是否所述电子档案的历史调用人数小于所述调用人数限定值且所述电子档案的历史调用次数小于所述调用次数限定值,若是,则确定所述电子档案为疑似问题档案,若否,则进入下一步骤;
通过所述电子档案的历史调用人数与所述调用人数限定值的比值、所述电子档案的历史调用次数与所述调用次数限定值的比值以及所述电子档案的历史调用次数大于预设调用次数的历史调用人数进行所述电子档案的质量分的确定;
当所述电子档案的质量分不满足要求时,则确定所述电子档案为疑似问题档案,并将除去问题电子档案的电子档案作为档案检索范围;
根据所述用户的检索条件判断用户在预设时间内是否存在检索记录,若是,则进入下一步骤,若否,则通过档案的质量分、档案与检索条件的匹配情况以及所述用户的历史提取档案进行检索结果的输出;
将用户在设定时间内的检索条件作为参考检索条件,并通过用户的检索条件与参考检索条件的相似度确定存在相似度满足要求的参考检索条件时,将所述相似度满足要求的参考检索条件作为相似检索条件并进入下一步骤;
通过不同的相似检索条件下的用户的浏览数据和点击数据进行档案的用户热度的确定,并结合所述相似检索条件的相似度进行所述不同的相似检索条件下的参考档案的输出,获取所述档案检索范围内的备选档案与所述参考档案的相似度以及质量分,并结合所述参考档案的用户热度以及所对应的相似检索条件的相似度进行所述备选档案的推荐值以及检索结果的输出;
所述不同的相似检索条件下的参考档案的确定的方法为:
根据所述相似检索条件下的档案的用户的浏览数据以及点击数据进行所述档案的浏览情况以及点击情况的确定,并通过所述档案的浏览情况以及点击情况确定所述档案是否被浏览或者点击,若是,则将所述档案作为筛选参考档案,若否,则确定所述档案不属于参考档案;
通过所述筛选参考档案在所述相似检索条件下的用户的浏览数据进行在所述相似检索条件下的所述筛选参考档案的用户的浏览时长的确定,并结合在所述相似检索条件下的所述筛选参考档案的用户的点击次数进行所述筛选参考档案在所述相似检索条件下的当前用户热度的确定,判断所述筛选参考档案在所述相似检索条件下的当前用户热度是否满足要求,若是,则进入下一步骤,若否,则确定所述档案不属于参考档案;
通过所述筛选参考档案在所有的相似检索条件下的用户的浏览数据进行所述筛选参考档案的用户的总体浏览时长的确定,并结合在所有的相似检索条件下的所述筛选参考档案的用户的总体点击次数进行所述筛选参考档案的总体用户热度的确定;
通过所述筛选参考档案在所述相似检索条件下的当前用户热度以及所述总体用户热度进行所述筛选参考档案的用户热度的确定,并判断所述筛选参考档案的用户热度是否大于预设热度值,若是,则确定所述筛选参考档案属于参考档案,若否,则进入下一步骤;
通过所述筛选参考档案的用户热度以及所述相似检索条件的相似度进行所述筛选参考档案的参考值的确定,并根据所述筛选参考档案的参考值确定所述筛选参考档案是否属于参考档案;
在进行所述筛选参考档案的用户热度的确定之前,当所述筛选参考档案在所述相似检索条件下的当前用户热度以及所述总体用户热度均小于最小热度预设值时,则无需进行所述筛选参考档案的用户热度的确定,并确定所述筛选参考档案不属于参考档案。
2.如权利要求1所述的一种电子档案智能查询方法,其特征在于,所述电子档案的历史点击数据包括但不限于历史点击人数、历史点击次数以及不同的历史点击人员的历史点击次数。
3.如权利要求1所述的一种电子档案智能查询方法,其特征在于,所述电子档案的历史浏览数据包括但不限于历史浏览人数、历史浏览时长以及不同的历史浏览人员的历史浏览时长。
4.如权利要求1所述的一种电子档案智能查询方法,其特征在于,通过档案的质量分、档案与检索条件的匹配情况以及所述用户的历史提取档案进行检索结果的输出,具体包括:
通过所述档案与所述检索条件的匹配情况进行所述档案的匹配的检索条件的数量的确定,并根据所述档案的匹配的检索条件的数量进行所述档案的匹配度以及匹配档案的确定;
判断所述匹配档案中是否存在用户的历史提取档案,若是,则将所述匹配档案中的用户的历史提取档案作为历史检索结果,并进入下一步骤,若否,则直接进入下一步骤;
将排除所述历史检索结果的匹配档案作为剩余匹配档案,并判断所述剩余匹配档案中是否存在匹配度以及质量分均满足要求的剩余匹配档案,若是,则将所述匹配度以及质量分均满足要求的剩余匹配档案作为筛选检索结果,并进入下一步骤,若否,则直接进入下一步骤;
将排除所述筛选检索结果的剩余匹配档案作为其它匹配档案,并通过所述其它匹配档案的匹配度以及质量分进行所述其它匹配档案的档案匹配值的确定,并通过所述其它匹配档案的档案匹配值进行匹配检索结果的确认;
通过所述匹配检索结果、筛选检索结果以及历史检索结果进行检索结果的输出。
5.如权利要求1所述的一种电子档案智能查询方法,其特征在于,所述用户的检索条件与参考检索条件的相似度确定的方法为:
将所述用户的检索条件的检索词作为本次检索词,将所述用户的参考检索条件的检索词作为参考检索词,并判断所述本次检索词是否存在所述参考检索词中没有的检索词,若是,则进入下一步骤,若否,则通过所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定;
将与所述参考检索词不一致的本次检索词作为不一致检索词,并通过所述不一致检索词与所述参考检索词的语义相似度将所述不一致检索词划分为相似语义检索词以及不相似语义检索词,并判断所述不一致检索词中是否包含所述不相似语义检索词,若是,则进入下一步骤,若否,则通过所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定;
获取所述本次检索词中的不相似语义检索词的数量以及在所述本次检索词的数量占比,并结合所述用户的本次检索词的数量以及所述参考检索词的数量进行所述用户的检索条件与参考检索条件的相似度的确定。
6.一种电子档案智能查询系统,采用权利要求1-5任一项所述的一种电子档案智能查询方法,其特征在于,具体包括:
问题档案确定模块;检索结果调整模块;其中所述检索结果调整模块包括检索记录获取模块、相似检索条件评估模块、检索结果输出模块;
其中所述问题档案确定模块负责通过历史点击数据、历史浏览数据以及调取数据进行电子档案的质量分的评估,并根据所述质量分进行疑似问题档案以及用户的档案检索范围的确定;
所述检索记录获取模块负责根据所述用户的检索条件判断用户在预设时间内是否存在检索记录;
所述相似检索条件评估模块负责将用户在设定时间内的检索条件作为参考检索条件,并通过用户的检索条件与参考检索条件的相似度确定存在相似度满足要求的参考检索条件时,将所述相似度满足要求的参考检索条件作为相似检索条件并进入下一步骤;
所述检索结果输出模块负责通过不同的相似检索条件下的用户的浏览数据和点击数据进行档案的用户热度的确定,并结合所述相似检索条件的相似度进行所述不同的相似检索条件下的参考档案的输出,获取所述档案检索范围内的备选档案与所述参考档案的相似度以及质量分,并结合所述参考档案的用户热度以及所对应的相似检索条件的相似度进行所述备选档案的推荐值以及检索结果的输出。
CN202311237707.XA 2023-09-25 2023-09-25 一种电子档案智能查询方法与系统 Active CN116975314B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311237707.XA CN116975314B (zh) 2023-09-25 2023-09-25 一种电子档案智能查询方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311237707.XA CN116975314B (zh) 2023-09-25 2023-09-25 一种电子档案智能查询方法与系统

Publications (2)

Publication Number Publication Date
CN116975314A CN116975314A (zh) 2023-10-31
CN116975314B true CN116975314B (zh) 2023-12-22

Family

ID=88473477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311237707.XA Active CN116975314B (zh) 2023-09-25 2023-09-25 一种电子档案智能查询方法与系统

Country Status (1)

Country Link
CN (1) CN116975314B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117453852B (zh) * 2023-12-25 2024-04-16 浙江星汉信息技术股份有限公司 基于云端存储的档案更新管理方法
CN117648349B (zh) * 2024-01-29 2024-04-09 河北省中医院 档案调用方法及平台

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109949885A (zh) * 2019-03-12 2019-06-28 重庆医事通科技发展有限公司 一种远程医疗档案数据聚合优化系统和优化管理方法
CN112487150A (zh) * 2020-12-11 2021-03-12 航天信息股份有限公司 档案管理方法、系统、存储介质及电子设备
CN112836029A (zh) * 2021-01-27 2021-05-25 润联软件系统(深圳)有限公司 一种基于图的文档检索方法、系统及其相关组件
CN114153795A (zh) * 2021-11-25 2022-03-08 北京融安特智能科技股份有限公司 智能调取电子档案的方法、装置、电子设备和存储介质
KR20230014035A (ko) * 2021-07-20 2023-01-27 국민대학교산학협력단 사용자 검색 의도 분석을 통한 연관 문서 추천 방법 및 장치
CN116451200A (zh) * 2023-06-14 2023-07-18 浙江星汉信息技术股份有限公司 一种基于云端存储的加密式档案资料的检索方法
CN116701306A (zh) * 2023-08-07 2023-09-05 浙江星汉信息技术股份有限公司 一种用于档案的智能分拣与归档管理方法与系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9836538B2 (en) * 2009-03-03 2017-12-05 Microsoft Technology Licensing, Llc Domain-based ranking in document search

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109949885A (zh) * 2019-03-12 2019-06-28 重庆医事通科技发展有限公司 一种远程医疗档案数据聚合优化系统和优化管理方法
CN112487150A (zh) * 2020-12-11 2021-03-12 航天信息股份有限公司 档案管理方法、系统、存储介质及电子设备
CN112836029A (zh) * 2021-01-27 2021-05-25 润联软件系统(深圳)有限公司 一种基于图的文档检索方法、系统及其相关组件
KR20230014035A (ko) * 2021-07-20 2023-01-27 국민대학교산학협력단 사용자 검색 의도 분석을 통한 연관 문서 추천 방법 및 장치
CN114153795A (zh) * 2021-11-25 2022-03-08 北京融安特智能科技股份有限公司 智能调取电子档案的方法、装置、电子设备和存储介质
CN116451200A (zh) * 2023-06-14 2023-07-18 浙江星汉信息技术股份有限公司 一种基于云端存储的加密式档案资料的检索方法
CN116701306A (zh) * 2023-08-07 2023-09-05 浙江星汉信息技术股份有限公司 一种用于档案的智能分拣与归档管理方法与系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Yao, J et al..Employing Personal Word Embeddings for Personalized Search. PROCEEDINGS OF THE 43RD INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL (SIGIR '20).2020,第1359-1368页. *
基于历史点击数据的集合选择方法;刘颖;陈岭;陈根才;赵江奇;王敬昌;;浙江大学学报(工学版)(01);第23-28, 161页 *

Also Published As

Publication number Publication date
CN116975314A (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
CN116975314B (zh) 一种电子档案智能查询方法与系统
US10152479B1 (en) Selecting representative media items based on match information
US10515133B1 (en) Systems and methods for automatically suggesting metadata for media content
US8051073B2 (en) System and method for measuring the quality of document sets
CN109947902B (zh) 一种数据查询方法、装置和可读介质
JP6355840B2 (ja) ストップワード識別方法および装置
TWI571756B (zh) 用以分析瀏覽記錄及其文件之方法及其系統
Bhushan et al. Recommendation of optimized web pages to users using Web Log mining techniques
AU2020269924A1 (en) Methods and systems for determining compact semantic representations of digital audio signals
AU2018313274B2 (en) Diversity evaluation in genealogy search
CN108509449B (zh) 一种信息处理的方法及服务器
CN116881406A (zh) 一种多模态智能文件检索方法及系统
CN110162535B (zh) 用于执行个性化的搜索方法、装置、设备以及存储介质
Azcarraga et al. Evaluating keyword selection methods for WEBSOM text archives
CN116610853A (zh) 搜索推荐方法、搜索推荐系统、计算机设备及存储介质
Abass et al. Information retrieval models, techniques and applications
CN112100330A (zh) 一种基于人工智能技术的主题搜索方法及其系统
CN104951869A (zh) 一种基于工作流的舆情监控方法及装置
Wable Information Retrieval in Business
CN117763109B (zh) 一种用于档案全文检索的数据核查方法
CN117076449A (zh) 一种报表检索方法、装置、终端设备及存储介质
Bermejo et al. Comparison of feature construction methods for video relevance prediction
CN113377997A (zh) 一种歌曲检索方法、电子设备及计算机可读存储介质
CN117349536A (zh) 数据推荐方法、装置、设备以及计算机存储介质
CN117763109A (zh) 一种用于档案全文检索的数据核查方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant