CN114238229B - 一种打印文件的搜索方法、装置、电子设备和存储介质 - Google Patents

一种打印文件的搜索方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114238229B
CN114238229B CN202210169558.7A CN202210169558A CN114238229B CN 114238229 B CN114238229 B CN 114238229B CN 202210169558 A CN202210169558 A CN 202210169558A CN 114238229 B CN114238229 B CN 114238229B
Authority
CN
China
Prior art keywords
target
print file
file
text
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210169558.7A
Other languages
English (en)
Other versions
CN114238229A (zh
Inventor
李�远
杨香玉
刘国超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Chenguang Rongxin Technology Co ltd
Original Assignee
Beijing Chenguang Xin'an Electronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Chenguang Xin'an Electronics Co ltd filed Critical Beijing Chenguang Xin'an Electronics Co ltd
Priority to CN202210169558.7A priority Critical patent/CN114238229B/zh
Publication of CN114238229A publication Critical patent/CN114238229A/zh
Application granted granted Critical
Publication of CN114238229B publication Critical patent/CN114238229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/156Query results presentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种打印文件的搜索方法、装置、电子设备和存储介质,包括:接收针对目标打印主题的搜索信息;响应打印文件库中没有与该目标打印主题匹配的打印文件,获取与该目标打印主题相关的话题的文本资源;其中,各话题的文本资源包括话题文本和多个回复文本,至少一个回复文本中包括打印文件;基于各打印文件对应的回复文本和话题文本,在打印文件中确定至少一个第一目标打印文件;在搜索结果页面展示第一目标打印文件。基于话题的文本资源辅助确定与搜索信息匹配的目标打印文件,提高了打印效率,节约了打印时间,也保证了打印文件的全面性。

Description

一种打印文件的搜索方法、装置、电子设备和存储介质
技术领域
本发明涉及打印技术领域,尤其涉及一种打印文件的搜索方法、装置、电子设备和存储介质。
背景技术
在公司、学校等团体场景下,为了便于相关人员进行文件打印,一般会在打印平台设置文件库存储对应的打印文件。这样,在有打印需求时,相关人员只需要输入相关的搜索词即可找到所需的打印文件进行打印。
发明人在实现本发明的过程中发现,由于相关人员和打印文件创始人在相同内容的描述上会有所差异,而且相关人员在没有明确的打印需求时,可能会输入一些泛查询搜索词,因此存在通过搜索词查询不到需要的目标打印文件,或者查询不全需要的目标打印文件的情况。相关人员需要打开所有文件进行排查,整个过程会花费大量的时间,导致打印效率过低。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明提供了一种打印文件的搜索方法、装置、电子设备和存储介质,能够基于话题的文本资源辅助确定与搜索信息匹配的目标打印文件,提高了打印效率,节约了打印时间,也保证了打印文件的全面性。
本发明提供了一种打印文件的搜索方法,包括:
接收针对目标打印主题的搜索信息;响应打印文件库中没有与该目标打印主题匹配的打印文件,获取与该目标打印主题相关的话题的文本资源;其中,各话题的文本资源包括话题文本和多个回复文本,至少一个回复文本中包括打印文件;基于各打印文件对应的回复文本和话题文本,在打印文件中确定至少一个第一目标打印文件;在搜索结果页面展示所述第一目标打印文件。
本发明还提供了一种打印文件的搜索装置,包括:
获取模块,用于响应打印文件库中没有与上述目标打印主题匹配的打印文件,获取与目标打印主题相关的话题的文本资源;其中,各话题的文本资源包括话题文本和多个回复文本,至少一个回复文本中包括打印文件;确定模块,用于基于各打印文件对应的回复文本和话题文本,在打印文件中确定至少一个第一目标打印文件;展示模块,用于在搜索结果页面展示上述第一目标打印文件。
本发明还提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上所述的打印文件的搜索方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的打印文件的搜索方法。
本发明还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如上所述的打印文件的搜索方法。
本发明提供的技术方案与现有技术相比至少具有如下优点:本发明提供的打印文件的搜索方法、装置、电子设备及存储介质, 在没有与搜索信息精确匹配的打印文件的情况下,能够基于话题的文本资源辅助确定与搜索信息匹配的目标打印文件,提高了打印效率,节约了打印时间,也保证了打印文件的全面性。
附图说明
结合附图并参考以下具体实施方式,本发明各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本发明实施例打印文件的搜索方法的流程图;
图2为本发明实施例打印文件的搜索方法中确定介绍信息的流程图;
图3为本发明实施例打印文件的搜索方法中通过评论索引表确定目标打印文件的流程图;
图4本发明实施例的打印文件的搜索装置的结构示意图;
图5本发明实施例的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细的描述本发明的实施例。虽然附图中显示了本发明的某些实施例,然而应当理解的是,本发明可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是,本发明的附图及实施例仅用于示例性作用,并非用于限制本发明的保护范围。
应当理解,本发明的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本发明的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本发明中提及的“第一”“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本发明中提及的“一个”“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
参考图1所示,本发明实施例提供了一种打印文件的搜索方法的流程图。
步骤S110,接收针对目标打印主题的搜索信息。
在打印平台上,用户可以在搜索框中输入搜索信息来查询需求的打印文件,该搜索信息中携带有目标打印主题的关键词或关键语句,目标打印主题反映了用户的搜索需求,包括但不限于打印文件的题材类型、打印文件的关键对象、打印文件的核心内容、打印文件的主要特征。举例来说,用户可能对打印文件的题材类型有具体要求,如“xx财务报表”;用户可能对打印文件的关键对象有具体要求,如“三年六班的xxx”;用户可能对打印文件的核心内容有具体要求,如“xxx休假管理制度”;用户可能只有泛泛的打印需求,因此对打印文件的主要特征有具体要求,例如“excel学习方法”。
步骤S120,响应打印文件库中没有与目标打印主题匹配的打印文件,获取与该目标打印主题相关的话题的文本资源;其中,各话题的文本资源包括话题文本和多个回复文本,至少一个回复文本中包括打印文件。
在接收到搜索信息之后,首先会对搜索信息进行解析,确定其中的目标打印主题,然后,在打印文件库中查找是否有标题或内容命中所述目标打印主题的打印文件,如果有则直接返回该打印文件。但有些情况下,由于相同内容在描述上的差异,或者目标打印主题属于泛查询需求,明明在打印文件库中有满足搜索信息的打印文件,但是通过传统的搜索匹配方案无法命中该打印文件。
在打印平台上,可以设置“社区互动”版块,在版块中用户可以发起话题,其他用户可以针对该话题进行回复。具体的,话题包括“求某类型/某特征打印文件”、“对某类型/某特征打印文件的讨论”、“对某关键对象的互动”等多个维度,因此针对打印文件的题材类型、打印文件的关键对象、打印文件的核心内容、打印文件的主要特征,均对应有相关维度的话题。也就是说,话题中的话题文本以及回复文本对打印文件的类型、特征、关键对象的描述内容做了充分的解释和扩展,在没有直接命中打印文件的基础上,可以将关键词或关键语句与每个话题中的话题文本或回复文本进行匹配,从而确定与目标打印主题相关的话题。
进一步的,用户在对话题进行回复时,针对“求某类型/某特征打印文件”的话题,可能会直接写出该类型/该特征打印文件的名称;针对“对某类型/某特征打印文件的讨论”、“对某关键对象的互动”的话题,可能会推荐自己认为符合该类型/该特征/该关键对象的打印文件的名称。
为了缩短其他查看该话题的用户查看感兴趣的打印文件的路径,作为本发明的一些可选实施方式,接收针对话题发布的回复文本;检测到该回复文本中存在与打印文件库中的第二目标打印文本的标题匹配的目标文本,将目标文本转化成内链文本或预览封面形式;其中,内链文本或预览封面用于被触发时跳转至第二目标打印文本。
具体的,上述目标文本可以是关键词或关键语句,在接收用户针对话题发布的回复文本的同时,实时监测回复文本中是否存在关键词或关键语句,能够与打印文件库中的打印文件匹配,将匹配的文件作为第二目标打印文件。该匹配可以是模糊匹配,即预先对打印文件库中打印文件的标题和核心内容进行理解,生成反映该打印文件核心内容的若干扩展标题,只要关键词或关键语句能够命中任意扩展标题,即认为与该扩展标题对应的打印文件匹配。
确定了第二目标打印文件之后,可以直接将目标文本转化成内链文本的形式或该第二目标打印文件的预览封面的形式,以上两种形式在被触发后,均可以跳转到第二目标打印文件进行直接阅读,缩短了第二目标文件的触发路径。
在具体实现时,在确定了目标文本之后,也可以将目标文本突出显示,并在其对应的预设位置展开弹窗,询问用户是否加入对应的第二目标打印文件的链接,接收用户同意加入的操作后,再将目标文本进行上述转化。进一步可选的,除了采用上述形式,也可以直接在回复文本下方加入第二目标文件的预览封面,本发明再次不做限定。
进一步的,在确定了与目标打印主题相关的话题后,获取每个话题中的话题文本和多个回复文本。如上所述,有些回复文本中包括打印文件(可以是第二目标打印文件),在该话题与目标打印主题相关的前提下,回复文本的打印文件也是和目标打印主题相关的,因此可以回复文本的打印文件中挑选确定第一目标打印文件。
步骤S130,基于各打印文件对应的回复文本和话题文本,在打印文件中确定至少一个第一目标打印文件。
在本步骤中,可以首先根据话题文本对应的维度,确定若干个与目标打印主题属于相同维度的目标话题,在根据这些目标话题下的打印文件对应的回复文本的互动数据(转发次数、评论次数、点赞次数),确定排名在前预设数量的打印文本,作为第一目标打印文本。
优选的,还可以通过如下方法确定第一目标打印文件:
针对每个打印文件,计算该打印文件对应的话题文本与目标打印主题的第一相似度,以及该打印文件对应的回复文本与目标打印主题的第二相似度;基于上述的第一相似度和第二相似度,确定打印文件与目标打印主题的第三相似度;根据第三相似度,在打印文件中确定至少一个第一目标打印文件。
在本方案中,首先计算打印文件对应的话题文本与目标打印主题(关键词或关键语句)的第一相似度,以及打印文件对应的回复文本与目标打印主题(关键词或关键语句)的第二相似度,第一相似度反映了话题与目标打印主题的相关性,第二相似度反应了回复文本与目标打印主题的相关性;然后对第一相似度和第二相似度进行求和或加权求和,权重可以进行预先设置,得到打印文件与目标打印主题的第三相似度;最后,确定第三相似度满足预设阈值或者排名在前预设数量的打印文本,作为第一目标打印文本。
优选的,相似度的计算方案可以选用向量距离计算方法、TF-IDF(词频-逆文档频率)计算方法、simhash(希姆哈希)算法、深度学习机器模型等,本发明在此不做限定。
步骤S140,在搜索结果页面展示第一目标打印文件。
具体的,可以在搜索结果页面的预设区域展示第一目标文件的预览信息,该预览信息包括但不限于第一目标文件的标题、封面图、关键信息以及打印标识等。触发该第一目标打印文件的打印标识后,可以进行对该第一目标打印文件的打印操作。
作为本发明实施例的一些可选实施方式,第一目标打印文件中链接有第三目标打印文件,具体方法还包括:
在搜索结果页面中展示第一目标打印文件的预览信息;预览信息包括第一目标打印文件的关键信息,以及第三目标打印文件的关键信息。
具体的,第一目标文件中可能链接有其他第三目标打印文件,由于第三目标打印文件与第一目标打印文件的部分内容相关,因此在展示第一目标打印文件的预览信息中,除了包括第一目标打印文件的关键信息,还包括第三目标打印文件的关键信息。关键信息包括但不限于标题信息和核心内容的介绍信息。此外,预览信息还包括文件打印标识,用户在通过关键信息了解第一目标打印文件和第三目标打印文件后,可以选择对应的打印文件触发文件打印标识,进行打印操作。
进一步的,如图2所示,所述介绍信息通过如下方式确定:
步骤S210,根据第一目标打印文件对应的回复文本和话题文本中的关联内容,生成第一介绍信息。
在本步骤中,首先确定回复文本和话题文本中与第一目标打印文件相关的关联内容,该关联内容可以是回复文本中介绍第一目标打印文件核心内容、对象、题材类型的文本,也可以是话题文本中与第一目标打印文件核心内容、对象、题材类型相关的文本,对关联内容进行整合生成第一介绍信息。
步骤S220,对第一目标打印文件的内容进行语义理解,得到第二介绍信息。
具体的,可以使用预先训练好的深度学习模型,将第一目标打印文件输入该模型中进行语义理解,得到该第一目标打印文件的第二介绍信息,该第二介绍信息表征了第一目标文件的关键信息。
步骤S230,将第一介绍信息与第二介绍信息进行比对,确定附加信息。
第二介绍文件是基于第一目标打印文件中的内容得到的,可能会缺少某些维度的介绍,因此可以将第一介绍信息和第二介绍信息进行比对,将第一介绍信息中存在的、未在第二介绍信息中提及的内容作为附加信息。
步骤S240,基于第一介绍信息和附加信息,生成摘要信息。
在本步骤中,对第一介绍信息和附加信息进行整合,生成摘要信息。
作为本发明实施例的再一些优选实施方式,上述方法还包括:
在搜索结果页面展示与目标打印主题相关的话题;响应于对第一目标打印文件的触发操作,切换展示第一目标打印文件对应的话题。
具体的,将搜索结果页面分为第一区域和第二区域,第一区域以卡片形式展示第一目标打印文件,第二区域以卡片形式展示各第一目标文件相关的话题;响应用户在第一区域对第一目标打印文件的选择,第二区域的话题也随之切换成选择的第一目标打印文件对应的话题。即用户触发任意第一目标打印文件后,还可以进一步延展阅读该第一目标打印文件对应的话题,一站式全方位解决用户的需求。
本发明实施例提供的打印文件的搜索方法、装置、电子设备及存储介质,在没有与搜索信息精确匹配的打印文件的情况下,能够基于话题的文本资源辅助确定与搜索信息匹配的目标打印文件,提高了打印效率,节约了打印时间,也保证了打印文件的全面性。
作为本发明实施例的再一些可选实施方式,除了通过话题的文本资源辅助确定与搜索信息匹配的目标打印文件之外,还可以根据打印文件的评论辅助确定与搜索信息匹配的目标打印文件,保证了打印文件的全面性。如图3所示,该方法还包括:
步骤S310,在打印文件库中查找每个打印文件的评论索引表;其中,该评论索引表存储有评论与打印文件中对应内容的映射关系。
打印文件中保留有用户的评论,该评论可以是针对打印评论的对象、核心内容、主要特征以及题材类型做出的,因此可以预先建立评论索引表,表中存储有评论与打印文件中对应内容的映射关系。优选的,可以筛选评论中的若干第一关键词,以及打印文件中对应内容中的若干第二关键词,建立第一关键词与第二关键词的映射关系;亦可以建立评论与第二关键词的第二映射关系。
步骤S320,响应于存在与目标打印主题匹配的目标评论,将目标评论对应的打印文件确定为第四目标打印文件。
由于打印文件库中没有与目标打印主题匹配的打印文件,本步骤中,在评论索引表中查找到与目标打印主题(关键词或关键语句)匹配的目标评论,匹配过程可以参照上文文本相似度的算法,说明该目标评论对应的内容与目标打印主题是相符的,因此将目标评论对应的打印文件确定为第四目标打印文件。
步骤S330,在搜索结果页面展示第四目标打印文件的预览信息,该预览信息中包括第四目标打印文件中的目标内容,该目标内容为评论索引表中与目标评论存在映射关系的内容。
具体的,在搜索结果页面展示第四目标打印文件的预览信息,预览信息中除了包括第四目标打印文件的标题、封面以及关键信息外,还包括评论索引表中与目标评论存在映射关系的目标内容。由于目标评论与目标打印主题相匹配,说明在第四目标打印文件中的目标内容是最符合用户搜索需求的内容,因此可以在预览信息中直接展示该部分内容,用户点击目标内容后可以直接定位跳转到第四目标打印文件中该部分内容进行后续操作。更进一步的,若第二目标内容的页数较多,预览信息中还可以包括打印标识,用户可以直接从目标内容所在页开始进行打印操作,提高了用户的打印效率。
在一个实施例中,参考图4所示,提供了一种打印文件的搜索装置的结构示意图。该装置可用于执行图1-图3所示的打印文件的搜索方法,该装置包括:接收模块410、获取模块420、确定模块430和展示模块440;其中,
接收模块410,用于接收针对目标打印主题的搜索信息;获取模块420,用于响应打印文件库中没有与所述目标打印主题匹配的打印文件,获取与目标打印主题相关的话题的文本资源;其中,各话题的文本资源包括话题文本和多个回复文本,至少一个回复文本中包括打印文件;确定模块430,用于基于各打印文件对应的回复文本和话题文本,在打印文件中确定至少一个第一目标打印文件;展示模块440,用于在搜索结果页面展示第一目标打印文件。
优选的,接收模块410进一步用于,接收针对话题发布的回复文本;检测到回复文本中存在与打印文件库中的第二目标打印文本的标题匹配的目标文本,将目标文本转化成内链文本或预览封面形式;其中,内链文本或预览封面用于被触发时跳转至第二目标打印文本。
优选的,第一目标打印文件中链接有第三目标打印文件,展示模块440进一步用于,在搜索结果页面中展示第一目标打印文件的预览信息;预览信息包括第一目标打印文件的关键信息,以及第三目标打印文件的关键信息。
优选的,第一目标打印文件的关键信息包括标题信息和介绍信息;确定模块430进一步用于,根据第一目标打印文件对应的回复文本和话题文本中的关联内容,生成第一介绍信息;对第一目标打印文件的内容进行语义理解,得到第二介绍信息;将第一介绍信息与第二介绍信息进行比对,确定附加信息;基于上述的第一介绍信息和附加信息,生成介绍信息。
进一步的,获取模块420进一步用于,在打印文件库中查找每个打印文件的评论索引表;其中,评论索引表存储有评论与打印文件中对应内容的映射关系;响应于存在与目标打印主题匹配的目标评论,将目标评论对应的打印文件确定为第四目标打印文件;在搜索结果页面展示第四目标打印文件的预览信息,预览信息中包括第四目标打印文件中的目标内容,目标内容为评论索引表中与目标评论存在映射关系的内容。
优选的,确定模块430进一步用于,针对每个打印文件,计算该打印文件对应的话题文本与目标打印主题的第一相似度,以及该打印文件对应的回复文本与目标打印主题的第二相似度;基于第一相似度和第二相似度,确定打印文件与目标打印主题的第三相似度;根据第三相似度,在打印文件中确定至少一个第一目标打印文件。
优选的,展示模块430进一步用于,在搜索结果页面展示与目标打印主题相关的话题;响应于对第一目标打印文件的触发操作,切换展示第一目标打印文件对应的话题。
需要说明的是,本发明实施例所提供的打印文件的搜索装置对应的可用于执行上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图5为本发明实施例中的一种电子设备的结构示意图。下面具体参考图5,其示出了适于用来实现本发明实施例中的电子设备500的结构示意图。本发明实施例中的电子设备500可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)、可穿戴电子设备等等的移动终端以及诸如数字TV、台式计算机、智能家居设备等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理以实现如本发明所述的实施例的方法。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别的,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行上述各实施例中的流程图所示的方法的程序代码,从而实现如上所述的打印文件的搜索方法。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM502被安装。在该计算机程序被处理装置501执行时,执行本发明实施例的方法中限定的上述功能。
需要说明的是,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,终端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
接收针对目标打印主题的搜索信息;响应打印文件库中没有与目标打印主题匹配的打印文件,获取与目标打印主题相关的话题的文本资源;其中,各话题的文本资源包括话题文本和多个回复文本,至少一个回复文本中包括打印文件;基于各打印文件对应的回复文本和话题文本,在打印文件中确定至少一个第一目标打印文件;在搜索结果页面展示第一目标打印文件。
附图中的流程图和框图,图示了按照本发明各种实施例的方法、装置和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连的表示的方框实际上可以基本并行的执行,它们有时也可以按相反的顺序执行,依照所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样的,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本发明的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反的,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (7)

1.一种打印文件的搜索方法,其特征在于,所述方法包括:
接收针对目标打印主题的搜索信息;
若打印文件库中没有与所述目标打印主题匹配的打印文件,获取与所述目标打印主题相关的话题的文本资源;其中,所述话题的文本资源包括话题文本和多个回复文本,至少一个所述回复文本中包括打印文件;所述话题的文本资源来自于打印平台上的社区互动版块;
针对每个打印文件,计算该打印文件对应的话题文本与所述目标打印主题的第一相似度,以及该打印文件对应的回复文本与所述目标打印主题的第二相似度;对所述第一相似度和所述第二相似度进行求和或加权求和,确定所述打印文件与所述目标打印主题的第三相似度;若所述第三相似度满足预设阈值或排名在前预设数量,则将该打印文件作为第一目标打印文件;
在搜索结果页面的预设区域展示所述第一目标打印文件的预览信息,该预览信息包括第一目标打印文件的关键信息,所述第一目标打印文件的关键信息包括标题信息和介绍信息;
所述介绍信息通过如下方式确定:根据所述第一目标打印文件对应的回复文本和话题文本中的关联内容,生成第一介绍信息;对所述第一目标打印文件的内容进行语义理解,得到第二介绍信息;将所述第一介绍信息与所述第二介绍信息进行比对,确定附加信息,所述附加信息包含所述第一介绍信息中存在的、且未在所述第二介绍信息中提及的内容;基于所述第一介绍信息和所述附加信息,生成所述介绍信息;
在所述打印文件库中查找每个打印文件的评论索引表;其中,所述评论索引表存储有用户评论与打印文件中对应内容的映射关系;响应于存在与所述目标打印主题匹配的目标评论,将所述目标评论对应的打印文件确定为第四目标打印文件;在所述搜索结果页面展示所述第四目标打印文件的预览信息,所述预览信息中包括所述第四目标打印文件中的目标内容,所述目标内容为所述评论索引表中与所述目标评论存在映射关系的内容。
2.根据权利要求1所述的打印文件的搜索方法,其特征在于,所述方法还包括:
接收针对话题发布的回复文本;
检测到所述回复文本中存在与所述打印文件库中的第二目标打印文本的标题匹配的目标文本,将所述目标文本转化成内链文本或预览封面形式;其中,所述内链文本或所述预览封面用于被触发时跳转至所述第二目标打印文本。
3.根据权利要求1所述的打印文件的搜索方法,其特征在于,所述第一目标打印文件中链接有第三目标打印文件,所述在搜索结果页面展示所述第一目标打印文件,包括:
在所述搜索结果页面中展示所述第一目标打印文件的预览信息;所述预览信息包括所述第一目标打印文件的关键信息,以及所述第三目标打印文件的关键信息。
4.根据权利要求1-3任意一项所述的打印文件的搜索方法,其特征在于,所述方法还包括:
在所述搜索结果页面展示与所述目标打印主题相关的话题;
响应于对所述第一目标打印文件的触发操作,切换展示所述第一目标打印文件对应的话题。
5.一种打印文件的搜索装置,其特征在于,包括:
接收模块,用于接收针对目标打印主题的搜索信息;
获取模块,用于若打印文件库中没有与所述目标打印主题匹配的打印文件,获取与所述目标打印主题相关的话题的文本资源;其中,各所述话题的文本资源包括话题文本和多个回复文本,至少一个所述回复文本中包括打印文件;所述话题的文本资源来自于打印平台上的社区互动版块;
第一确定模块,用于针对每个打印文件,计算该打印文件对应的话题文本与所述目标打印主题的第一相似度,以及该打印文件对应的回复文本与所述目标打印主题的第二相似度;对所述第一相似度和所述第二相似度进行求和或加权求和,确定所述打印文件与所述目标打印主题的第三相似度;若所述第三相似度满足预设阈值,则在所述打印文件中确定至少一个第一目标打印文件;
展示模块,用于在搜索结果页面的预设区域展示所述第一目标打印文件的预览信息,该预览信息包括第一目标打印文件的关键信息,所述第一目标打印文件的关键信息包括标题信息和介绍信息;
介绍信息生成模块,用于根据所述第一目标打印文件对应的回复文本和话题文本中的关联内容,生成第一介绍信息;对所述第一目标打印文件的内容进行语义理解,得到第二介绍信息;将所述第一介绍信息与所述第二介绍信息进行比对,确定附加信息,所述附加信息包含所述第一介绍信息中存在的、且未在所述第二介绍信息中提及的内容;基于所述第一介绍信息和所述附加信息,生成所述介绍信息;
第二确定模块,用于在所述打印文件库中查找每个打印文件的评论索引表;其中,所述评论索引表存储有用户评论与打印文件中对应内容的映射关系;响应于存在与所述目标打印主题匹配的目标评论,将所述目标评论对应的打印文件确定为第四目标打印文件;在所述搜索结果页面展示所述第四目标打印文件的预览信息,所述预览信息中包括所述第四目标打印文件中的目标内容,所述目标内容为所述评论索引表中与所述目标评论存在映射关系的内容。
6.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4任意一项所述的方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4任意一项所述的方法。
CN202210169558.7A 2022-02-24 2022-02-24 一种打印文件的搜索方法、装置、电子设备和存储介质 Active CN114238229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210169558.7A CN114238229B (zh) 2022-02-24 2022-02-24 一种打印文件的搜索方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210169558.7A CN114238229B (zh) 2022-02-24 2022-02-24 一种打印文件的搜索方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN114238229A CN114238229A (zh) 2022-03-25
CN114238229B true CN114238229B (zh) 2022-05-24

Family

ID=80747956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210169558.7A Active CN114238229B (zh) 2022-02-24 2022-02-24 一种打印文件的搜索方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114238229B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100410945C (zh) * 2006-01-26 2008-08-13 腾讯科技(深圳)有限公司 一种实现论坛的方法及系统
CN101025740B (zh) * 2006-02-21 2010-08-25 腾讯科技(深圳)有限公司 图片搜索结果自动播放方法
JP4965189B2 (ja) * 2006-08-17 2012-07-04 玉野総合コンサルタント株式会社 施工計画作成システム
US20130024230A1 (en) * 2010-08-02 2013-01-24 King Fahd University Of Petroleum And Minerals Method of extending activity floats in the critical path method
CN103034672A (zh) * 2011-09-29 2013-04-10 云壤(北京)信息技术有限公司 社会化搜索系统及搜索方法
CN114064851A (zh) * 2021-10-19 2022-02-18 中国人民解放军31511部队 一种政府办公文档多机检索方法及系统

Also Published As

Publication number Publication date
CN114238229A (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN107679211B (zh) 用于推送信息的方法和装置
US11669579B2 (en) Method and apparatus for providing search results
CN108804450B (zh) 信息推送的方法和装置
US9720904B2 (en) Generating training data for disambiguation
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN113806588B (zh) 搜索视频的方法和装置
US10901992B2 (en) System and method for efficiently handling queries
EP3961426A2 (en) Method and apparatus for recommending document, electronic device and medium
CN112948540A (zh) 信息查询方法、装置、电子设备以及计算机可读介质
CN112287206A (zh) 信息处理方法、装置和电子设备
CN113609308B (zh) 知识图谱构建方法、装置、存储介质及电子设备
US20190347068A1 (en) Personal history recall
CN111538830B (zh) 法条检索方法、装置、计算机设备及存储介质
CN112182255A (zh) 用于存储媒体文件和用于检索媒体文件的方法和装置
CN111339452B (zh) 搜索结果展现的方法、终端、服务器和系统
CN114065057A (zh) 搜索结果确定方法、展示方法、装置、设备和介质
US20140222865A1 (en) Method, System and Program for Interactive Information Services
CN114357325A (zh) 内容搜索方法、装置、设备及介质
US11314793B2 (en) Query processing
CN114995691B (zh) 一种文档处理方法、装置、设备和介质
CN111737571B (zh) 搜索方法、装置和电子设备
CN110909155B (zh) 书单生成方法、计算设备及计算机存储介质
CN117421389A (zh) 一种基于智能模型的技术趋势确定方法及系统
CN114238229B (zh) 一种打印文件的搜索方法、装置、电子设备和存储介质
CN112348614B (zh) 用于推送信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240402

Address after: 102600 room s1123, 1st floor, building 1, No.9 Keyuan Road, economic development zone, Daxing District, Beijing

Patentee after: Beijing Chenguang Rongxin Technology Co.,Ltd.

Country or region after: China

Address before: 3a, block B, science and technology wealth center, No. 8 Xueqing Road, Haidian District, Beijing 100086

Patentee before: Beijing Chenguang Xin'an Electronics Co.,Ltd.

Country or region before: China