CN102385584A - 剪报方法、装置及系统 - Google Patents

剪报方法、装置及系统 Download PDF

Info

Publication number
CN102385584A
CN102385584A CN2010102687443A CN201010268744A CN102385584A CN 102385584 A CN102385584 A CN 102385584A CN 2010102687443 A CN2010102687443 A CN 2010102687443A CN 201010268744 A CN201010268744 A CN 201010268744A CN 102385584 A CN102385584 A CN 102385584A
Authority
CN
China
Prior art keywords
newpapers
content information
periodicals
information
periodicals content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102687443A
Other languages
English (en)
Inventor
孙赓
吴艳伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN2010102687443A priority Critical patent/CN102385584A/zh
Publication of CN102385584A publication Critical patent/CN102385584A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明实施例公开了一种剪报方法、装置及系统,涉及剪报领域,能够取代人工剪报,实现自动化、信息化的剪报。本发明方法包括:将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息;存储所述数字化格式的报刊内容信息;当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息。本发明实施例主要用于自动化的提取某专业领域相关信息的剪报的过程中。

Description

剪报方法、装置及系统
技术领域
本发明涉及剪报领域,尤其涉及一种剪报方法、装置及系统。
背景技术
剪报是指把从报刊杂志等上面剪下的文字、图片资料,整理分类并集纳成册。传统的剪报方法主要是依靠人工剪切进行剪报,该种剪报方式需要占用大量的人力物力,并且受到人本身因素的干扰较多,剪报结果也因人而异,使得剪切的内容不够全面,剪切下来的剪报片段也不易保存、也不方便对剪报片段进行检索及二次利用。
目前,虽然存在报纸数字化和拼装的技术,但是,该种报纸数字化和拼装的技术,只注重于报纸原版式内容的数字化、留存和原版内容的数字化还原并拼装,不能根据需求实现对报纸的特定报刊内容信息的获取,从而不能实现自动剪报的目的,当用户需要剪报时,还是需要依赖传统的人工剪切的剪报方式实现剪报。
发明内容
本发明的实施例提供一种剪报方法、装置及系统,能够取代人工剪报,实现自动化、信息化的剪报。
为达到上述目的,本发明的实施例采用如下技术方案:
一种剪报方法,包括:
将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息;
存储所述数字化格式的报刊内容信息;
当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息。
一种剪报信息制作装置,包括:
反解单元,用于将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息;
存储单元,用于将所述反解单元反解得到的所述数字化格式的报刊内容信息存储。
一种剪报装置,包括:
查询单元,用于当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询剪报信息制作装置存储的数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息,所述报刊内容信息,包括报刊版面信息和报刊文章信息。
一种剪报系统,包括:剪报信息制作装置和剪报装置;
所述剪报信息制作装置,用于将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息;存储所述数字化格式的报刊内容信息;
所述剪报装置,用于当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询所述剪报信息制作装置存储的数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息。
本发明提供的技术方案,将报刊内容信息反解,形成数字化格式的报刊内容信息,并将该数字化格式的报刊内容信息存储,当需要提取特定的报刊内容信息时,仅需要设定特定的检索条件,并按照该预设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,便可获取与所述预设定的检索条件对应的报刊内容信息,避免了人工手动剪报的费时费力,剪报内容不全面以及剪报内容不方便检索的弊端,能够实现自动化、信息化的剪报。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中剪报方法流程图;
图2为本发明实施例2中剪报方法逻辑图;
图3为本发明实施例2中剪报方法流程图;
图4为本发明实施例3中一种剪报信息制作装置组成框图;
图5为本发明实施例3中另一种剪报信息制作装置组成框图;
图6为本发明实施例3中另一种剪报信息制作装置组成框图;
图7为本发明实施例3中另一种剪报信息制作装置组成框图;
图8为本发明实施例3中一种剪报装置组成框图;
图9为本发明实施例3中另一种剪报装置组成框图;
图10为本发明实施例3中一种剪报系统组成框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本发明实施例提供一种剪报方法,如图1所示,该方法包括:
101、将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息。
其中,将报刊内容信息进行反解,可以采用现有技术中的技术,本发明实施例对此不进行限制;例如,将该报刊版面信息和报刊文章信息进行标引、关联,得到数字化格式的报刊版面信息和报刊文章信息。该报刊文章信息包括图、文、表等信息;该报刊版面信息包括报刊的版面和条目信息。
102、存储所述数字化格式的报刊内容信息。
103、当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息。所述报刊内容信息包括报刊版面信息和报刊文章信息,与现有技术中,用户仅能得到剪报的文章信息相比,该获取报刊内容信息的包含报刊版面信息,使得用户能够得到更全面的剪报内容信息。
其中,所述的特定的报刊内容信息为满足用户要求的报刊内容信息,该特定的即为满足用户要求的报刊内容信息对应的条件,例如,用户要求获取汽车的价格的报刊内容信息,则该特定的指的是汽车的价格。
其中,当提取特定的报刊内容信息时,可以设置多个检索条件,该检索条件之间可以是并列的检索条件,也可以是递进关系的检索条件,本发明实施例对此不进行限制,在具体实施时,可以根据用户的实际需求具体设置。例如,设置多个剪报主题栏目,为每个主体栏目设置相应的检索条件,即过滤信息的条件;该剪报主题可以是不同类型的产品,也可以是不同领域的事件等,本发明实施例对此不进行限制;例如,设置3个不同剪报主题,可以分别设置为:液晶电视机、旅游、北京房价;该检索条件可以按照时间、地点、人物、事件等进行设置,本发明实施例对此也不进行限制,在具体实施例可以根据用户的需求具体设置。
本发明实施例中,将报刊内容信息反解,形成数字化格式的报刊内容信息,并将该数字化格式的报刊内容信息存储,当用户需要提取特定报刊内容信息时,仅需要设定特定的检索条件,并按照该设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,便可获取与所述预设定的检索条件对应的报刊内容信息,避免了人工手动剪报的费时费力,剪报内容不全面以及剪报内容不方便检索的弊端从而实现自动化、信息化的剪报;并且,由于数字化格式的报刊内容信息是将报刊内容信息反解得到,不存在将报纸中的内容遗漏的问题,因此在根据预设定的检索条件,获取与所述检索条件对应的数字化格式的报刊内容信息时,可以将所有的与该检索条件相对应的数字化格式的报刊内容信息全部获取,不存在人工剪报漏剪相关内容的问题;进一步的,由于用户仅需要设定特定的检索条件,便能够实现自动化、信息后的剪报,所以能够实现报刊连续性内容的实时提取,做到尽早实现所需报刊内容的提取,并且无需再预定纸报,完全实现无纸化的剪报流程。
实施例2
本发明实施例提供一种剪报方法,该方法在存储数字化格式的报刊内容信息之前,将该数字化格式的报刊内容信息进行分类,使得在检索需要的报刊内容信息时,能够简单快速的检索到所需的报刊内容信息;本发明实施例结合图2和图3对该方法进行具体介绍,如图3所示,该方法包括:
201、将报刊内容信息反解,得到数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息。
其中,将报刊内容信息进行反解,可以采用现有技术中的技术,本发明实施例对此不进行限制;例如,将该报刊版面信息和报刊文章信息进行标引、关联,得到数字化格式的报刊版面信息和报刊文章信息。该报刊文章信息如图2所示,包括图、文、表等信息;该报刊版面信息包括报刊的版面信息和条目信息。
202、对所述数字化格式的报刊内容信息进行分类。
其中,对所述数字化格式的报刊内容信息进行分类可以采用以下方法中的任一方法,该方法包括:第一种,按照内容聚合的方法对所述数字化格式的报刊内容信息进行分类;第二种,按照预设置的关键字对所述数字化格式的报刊内容信息进行分类。
当采用第一种按照内容聚合的方法对所述数字化格式的报刊内容信息进行分类时,对所述数字化格式的报刊内容信息进行分析,得出报刊的条目信息;根据所述条目信息记载的内容对上述数字化格式的报刊内容信息进行挑选,将相同或类似的数字化格式的报刊内容信息划分为一类,从而实现按照内容聚合的方法,实现对所述数字化格式的报刊内容信息进行分类。
当采用第二种按照预设置的关键字对所述数字化格式的报刊内容信息进行分类时,按照所述预设置的关键字查询所述数字化格式的报刊内容信息,将查询到的与预设置的关键字对应的数字化格式的报刊内容信息划分为一类,从而实现按照预设置的关键字对所述数字化格式的报刊内容信息进行分类;例如,可以采用通过分类训练工具实现对所述数字化格式的报刊内容信息进行分类;当通过分类训练工具实现对所述数字化格式的报刊内容信息进行分类时,剪报信息制作装置提供分类训练工具,根据该分类训练工具中记载的分类关键字,查询所述数字化格式的报刊内容信息,并将与该关键字相应的报刊内容信息归为一类,从而实现按照预设置的关键字对所述数字化格式的报刊内容信息进行分类。其中,需要说明的是,该分类训练工具,允许用户根据自己的分类需求和数据特点设定分类结构、分类关键字,并生成分类特征模板,以进行分类训练。由于该分类训练工具可以根据用户的反馈,对分类模板进行完善,因此,能够通过不断的训练,改善分类模板,增加分类的准确率。
203、将所述分类后的数字化格式的报刊内容信息存储。
204、当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息。所述报刊内容信息,包括报刊版面信息和报刊文章信息;与现有技术中,用户仅能得到剪报的文章信息相比,该获取报刊内容信息的包含报刊版面信息,使得用户能够得到更全面的剪报内容信息;而且在提取特定的报刊内容信息时,可设定与报刊版面信息相关的检索条件,例如可以设定检索位于第一版面的报刊内容信息。
其中,所述的特定的报刊内容信息为满足用户要求的报刊内容信息,该特定的即为满足用户要求的报刊内容信息对应的条件,例如,用户要求获取汽车的价格的报刊内容信息,则该特定的指的是汽车的价格。
其中,当提取特定的报刊内容信息时,可以设置多个检索条件,该检索条件之间可以是并列的检索条件,也可以是递进关系的检索条件,本发明实施例对此不进行限制,在具体实施时,可以根据用户的实际需求具体设置。例如,设置多个剪报主题栏目,为每个主体栏目设置相应的检索条件,即过滤信息的条件;该剪报主题可以是不同类型的产品,也可以是不同领域的事件等,本发明实施例对此不进行限制;例如,设置3个不同剪报主题,可以分别设置为:液晶电视机、旅游、北京房价;该检索条件可以按照时间、地点、人物、事件等进行设置,本发明实施例对此也不进行限制,在具体实施例可以根据用户的需求具体设置。
进一步的,当获取与所述预设定的检索条件对应的报刊内容信息后,为了将该与所述预设定的检索条件对应的报刊内容信息进行后续利用处理,如:生成剪报统计数据、剪报报告、收录到其他专题资讯库中等,因此将该与所述预设定的检索条件对应的报刊内容信息存储,以便进行后续利用处理。所以在执行完步骤204后,本发明实施例可选的还可以执行步骤205,并相继执行步骤206。
205、将所述获取的与所述预设定的检索条件对应的报刊内容信息存储。
206、当需要对与所述预设定的检索条件对应的报刊内容信息进行后续利用处理时,将已储存的与所述预设定的检索条件对应的报刊内容信息取出,并进行相应的后续利用处理。
本发明实施例中,将报刊内容信息反解,形成数字化格式的报刊内容信息,并将该数字化格式的报刊内容信息存储,当用户需要提取特定报刊内容信息时,仅需要设定特定的检索条件,并按照该预设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,便可获取与所述预设定的检索条件对应的报刊内容信息,避免了人工手动剪报的费时费力,剪报内容不全面以及剪报内容不方便检索的弊端,从而实现自动化、信息化的剪报;并且,由于数字化格式的报刊内容信息是将报刊内容信息反解得到,不存在将报纸中的内容遗漏的问题,因此在根据预设定的检索条件,获取与所述检索条件对应的数字化格式的报刊内容信息时,可以将所有的与该检索条件相对应的数字化格式的报刊内容信息全部获取,不存在人工剪报漏剪相关内容的问题;进一步的,由于用户在剪报时,仅需要设定特定的检索条件,便能够实现自动化、信息后的剪报,所以能够实现报刊连续性内容的实时内容提取,做到尽早的实现所需报刊内容信息的提取,并且无需再预定纸报,完全实现无纸化的剪报流程。
并且,本发明实施例中,将该数字化格式的报刊内容信息进行分类,然后再进行存储,使得存储的报刊内容信息层次清楚,当用户需要提取特定的报刊内容信息时,根据预设定的检索条件,可以简单快速的查找到与所述预设定的检索条件相对应的数字化格式的报刊内容信息,与没有分类相比,减少了大量的检索工作量,提高了检索的效率;并且,采用该种分类存储的存储方式,更方便对该数字化格式的报刊内容信息进行管理。
进一步,在根据检索条件获取与该检索条件对应的数字化格式的报刊内容信息后,将该获取的与该检索条件对应的数字化格式的报刊内容信息进行存储,避免了相同内容的再次检索,方便该剪报信息的二次利用。
实施例3
本发明实施例提供一种剪报信息制作装置,如图4所示,包括:反解单元31和存储单元32。
反解单元31,用于将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息;其中,所述反解单元31将报刊内容信息进行反解,可以采用现有技术中的技术,本发明实施例对此不进行限制;例如,将该报刊版面信息和报刊文章信息进行标引、关联,得到数字化格式的报刊版面信息和报刊文章信息。该报刊文章信息包括图、文、表等信息;该报刊版面信息包括报刊的版面和条目信息。
存储单元32,用于将所述反解单元31反解得到的所述数字化格式的报刊内容信息存储,以便当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容。其中,所述存储单元32将所述数字化格式的报刊内容信息存储时,可以将所述数字化格式的报刊内容信息在所述剪报信息制作装置中的存储设备中,也可以将所述数字化格式的报刊内容信息存储在其他的独立于所述剪报信息制作装置的存储设备中,例如存储在光盘或外接硬盘中,本发明实施例对此不进行限制。
进一步的,为了在检索需要的报刊内容信息时,能够简单快速的检索到所需的报刊内容信息,如图5所示,该剪报信息制作装置,还包括:分类单元33。
分类单元33,用于在所述存储单元32将所述数字化格式的报刊内容信息存储之前,对所述数字化格式的报刊内容信息进行分类;所述存储单元32还用于,将所述分类单元33分类后的所述数字化格式的报刊内容信息存储。
其中,所述分类单元33在对所述数字化格式的报刊内容信息进行分类时,可以按照内容聚合的方法对所述数字化格式的报刊内容信息进行分类,也可以按照预设置的关键字对所述数字化格式的报刊内容信息进行分类,本发明实施例对此不进行限制。
当所述分类单元33按照内容聚合的方法对所述数字化格式的报刊内容信息进行时,如图6所示,所述分类单元33包括:包括:分析模块331和第一分类模块332。
分析模块331,用于对所述数字化格式的报刊内容信息进行分析,得到报刊的条目信息;第一分类模块332,根据所述条目信息记载的内容对所述数字化格式的报刊内容信息进行挑选,将相同或类似的数字化格式的报刊内容信息划分为一类,从而实现了按照内容聚合法,实现对所述数字化格式的报刊内容信息进行分类。
进一步,可选的,如图7所示,当所述分类单元33按照预设置的关键字对所述数字化格式的报刊内容信息进行分类时,所述分类单元33包括第二分类模块333。
第二分类模块333,用于按照所述预设置的关键字查询所述数字化格式的报刊内容信息,将查询到的与预设置的关键字对应的数字化格式的报刊内容信息划分为一类。
其中,当第二分类模块333按照预设置的关键字对所述数字化格式的报刊内容信息进行分类时,例如,可以采用通过分类训练工具实现对所述数字化格式的报刊内容信息进行分类;当通过分类训练工具实现对所述数字化格式的报刊内容信息进行分类时,剪报信息制作装置提供分类训练工具,根据该分类训练工具中记载的分类关键字,查询所述数字化格式的报刊内容信息,并将与该关键字相应的报刊内容信息归为一类,从而实现按照预设置的关键字对所述数字化格式的报刊内容信息进行分类。其中,需要说明的是,该分类训练工具,允许用户根据自己的分类需求和数据特点设定分类结构、分类关键字,并生成分类特征模板,以进行分类训练。由于该分类训练工具可以根据用户的反馈,对分类模板进行完善,因此,能够通过不断的训练,改善分类模板,增加分类的准确率。
本发明实施例还提供一种剪报装置,如图8所示,该剪报装置包括:查询单元41。
查询单元41,用于当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询剪报信息制作装置存储的数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息,所述报刊内容信息,包括报刊版面信息和报刊文章信息;与现有技术中,用户仅能得到剪报的文章信息相比,该获取报刊内容信息的包含报刊版面信息,使得用户能够得到更全面的剪报内容信息;在提取特定的报刊内容信息时,而且可设定与报刊版面信息相关的检索条件,例如可以设定检索位于第一版面的报刊内容信息。
其中,所述的特定的报刊内容信息为满足用户要求的报刊内容信息,该特定的即为满足用户要求的报刊内容信息对应的条件,例如,用户要求获取汽车的价格的报刊内容信息,则该特定的指的是汽车的价格。
其中,当所述查询单元41提取特定的报刊内容信息时,可以设置多个检索条件,该检索条件之间可以是并列的检索条件,也可以是递进关系的检索条件,本发明实施例对此不进行限制,在具体实施时,可以根据用户的实际需求具体设置。例如,设置多个剪报主题栏目,为每个主体栏目设置相应的检索条件,即过滤信息的条件;该剪报主题可以是不同类型的产品,也可以是不同领域的事件等,本发明实施例对此不进行限制;例如,设置3个不同剪报主题,可以分别设置为:液晶电视机、旅游、北京房价;该检索条件可以按照时间、地点、人物、事件等进行设置,本发明实施例对此也不进行限制,在具体实施例可以根据用户的需求具体设置。
进一步的,当所述查询单元41获取与所述预设定的检索条件对应的报刊内容信息后,为了将该得到的与所述预设定的检索条件对应的所述报刊内容信息进行后续利用处理,如图9所示,该剪报装置还包括:存储单元42和处理单元43。
存储单元42,用于在所述查询单元41获取与所述预设定的检索条件对应的报刊内容信息后,将所述获取的与所述预设定的检索条件对应的报刊内容信息存储;其中,所述存储单元42将与所述预设定的检索条件对应的报刊内容信息存储时,可以将与所述预设定的检索条件对应的报刊内容信息存储在所述剪报信息获取装置中的存储设备中,也可以将与所述预设定的检索条件对应的报刊内容信息存储在其他的独立于所述剪报信息获取装置的存储设备中,例如存储在光盘或外接硬盘中,本发明实施例对此不进行限制。
处理单元43,用于当需要对与所述预设定的检索条件对应的报刊内容信息进行后续利用处理时,将所述存储单元42已储存的与所述预设定的检索条件对应的报刊内容信息取出,并进行相应的后续利用处理。其中,所述后续利用处可以为但不局限于生成剪报统计数据、剪报报告、收录到其他专题资讯库中等处理。
本发明实施例还提供一种剪报系统,如图10所示,该剪报系统包括:剪报信息制作装置51和剪报装置52。
所述剪报信息制作装置51,用于将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息;将所述数字化格式的报刊内容信息存储。
剪报装置52,用于当用户需要提取特定的报刊内容信息时,按照预设定的检索条件,查询所述剪报信息制作装置51存储的所述数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息。
进一步的,为了能够在检索需要的报刊内容信息时,能够简单快速的检索到所需的报刊内容信息,所述剪报信息制作装置51还用于,在将所述数字化格式的报刊内容信息存储之前,对所述数字化格式的报刊内容信息进行分类,并将所述分类后的数字化格式的报刊内容信息进行存储。其中,所述对所述数字化格式的报刊内容信息进行分类包括:按照内容聚合方法对所述数字化格式的报刊内容信息进行分类;或者按照预设置的关键字对所述数字化格式的报刊内容信息进行分类。其中,上述两种分类方式的具体描述,可以参考其他实施例的相应描述,本发明实施例此处将不再赘述。
进一步的,所述剪报装置52还用于,在获取与所述预设定的检索条件对应的报刊内容信息后,将所述获取的与所述预设定的检索条件对应的报刊内容信息存储;当需要对与所述预设定的检索条件对应的报刊内容信息进行处理时,将已储存的与所述预设定的检索条件对应的报刊内容信息取出,并进行相应的后续利用处理。其中,所述后续利用处理可以为但不局限于生成剪报统计数据、剪报报告、收录到其他专题资讯库中等处理。
本发明实施例中,剪报信息制作装置将报刊内容信息反解,形成数字化格式的报刊内容信息,并将该数字化格式的报刊内容信息存储,当用户需要提取特定报刊内容信息时,仅需要设定特定的检索条件,并按照该预设定的检索条件,查询剪报信息制作装置存储的数字化格式的报刊内容信息,便可获取与所述预设定的检索条件对应的报刊内容信息,避免了人工手动剪报的费时费力,剪报内容不全面以及剪报内容不方便检索的弊端,从而实现自动化、信息化的剪报;并且,由于数字化格式的报刊内容信息是将报刊内容信息反解得到,不存在将报纸中的内容遗漏的问题,因此在根据预设定的检索条件,获取与所述检索条件对应的数字化格式的报刊内容信息时,可以将所有的与该检索条件相对应的数字化格式的报刊内容信息全部获取,不存在人工剪报漏剪相关内容的问题;进一步的,由于用户在剪报时,仅需要设定特定的检索条件,便能够实现自动化、信息后的剪报,所以能够实现报刊连续性内容的实时内容提取,做到尽早的实现所需报刊内容信息的提取,并且无需再预定纸报,完全实现无纸化的剪报流程。
并且,本发明实施例中,剪报信息制作装置将该数字化格式的报刊内容信息进行分类,然后再进行存储,使得存储的报刊内容信息层次清楚,当用户需要提取特定的报刊内容信息时,根据预设定的检索条件,可以简单快速的查找到与所述预设定的检索条件相对应的数字化格式的报刊内容信息,与没有分类相比,减少了大量的检索工作量,提高了检索的效率;并且,采用该种分类存储的存储方式,更方便对该数字化格式的报刊内容信息进行管理。
进一步,在剪报信息获取装置根据检索条件获取与该检索条件对应的数字化格式的报刊内容信息后,将该获取的与该检索条件对应的数字化格式的报刊内容信息进行存储,避免了相同内容的再次检索,方便该剪报信息的二次利用。
本发明实施实施例的应用广泛,可以用用与商业机构、政府监管单位、企事业单位、剪报公司、咨询公司、公关公司、报刊杂志社、网站媒体等以及其他一些商业的应用。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种剪报方法,其特征在于,包括:
将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息;
存储所述数字化格式的报刊内容信息;
当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询已存储的所述数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息。
2.根据权利要求1所述的方法,其特征在于,在存储所述数字化格式的报刊内容信息之前,该方法还包括:
对所述数字化格式的报刊内容信息进行分类。
3.根据权利要求2所述的方法,其特征在于,所述对所述数字化格式的报刊内容信息进行分类包括:
按照内容聚合的方法对所述数字化格式的报刊内容信息进行分类;或者
按照预设置的关键字对所述数字化格式的报刊内容信息进行分类。
4.根据权利要求3所述的方法,其特征在于,
所述按照内容聚合方法对所述数字化格式的报刊内容信息进行分类,包括:
对所述数字化格式的报刊内容信息进行分析,得到报刊的条目信息;
根据所述条目信息记载的内容对所述数字化格式的报刊内容信息进行挑选,将相同或类似的数字化格式的报刊内容信息划分为一类;
或者所述按照预设置的关键字对所述数字化格式的报刊内容信息进行分类,包括:
按照所述预设置的关键字查询所述数字化格式的报刊内容信息,将查询到的与预设置的关键字相应的数字化格式的报刊内容信息划分为一类。
5.根据权利要求1所述方法,其特征在于,在获取与所述预设定的检索条件对应的报刊内容信息后,该方法还包括:
将所述获取的与所述预设定的检索条件对应的报刊内容信息存储;
当需要对与所述预设定的检索条件对应的报刊内容信息进行后续利用处理时,将已储存的所述预设定的检索条件对应的报刊内容信息取出,并进行相应的后续利用处理。
6.一种剪报信息制作装置,其特征在于,包括:
反解单元,用于将报刊内容信息反解,形成数字化格式的报刊内容信息,所述报刊内容信息包括报刊版面信息和报刊文章信息;
存储单元,用于将所述反解单元反解得到的所述数字化格式的报刊内容信息存储。
7.根据权利要求6所述的剪报信息制作装置,其特征在于,还包括:
分类单元,用于在所述存储单元将所述数字化格式的报刊内容信息存储之前,对所述数字化格式的报刊内容信息进行分类;
所述存储单元还用于,将所述分类单元分类后的所述数字化格式的报刊内容信息存储。
8.根据权利要求7所述的剪报信息制作装置,其特征在于,所述分类单元用于:
按照内容聚合的方法对所述数字化格式的报刊内容信息进行分类;或者
按照预设置的关键字对所述数字化格式的报刊内容信息进行分类。
9.根据权利要求8所述的剪报信息制作装置,其特征在于,
当所述分类单元按照内容聚合的方法对所述数字化格式的报刊内容信息进行时,所述分类单元包括:
分析模块,用于对所述数字化格式的报刊内容信息进行分析,得到报刊的条目信息;
第一分类模块,根据所述条目信息记载的内容对所述数字化格式的报刊内容信息进行挑选,将相同或类似的数字化格式的报刊内容信息划分为一类;
或者当所述分类单元按照预设置的关键字对所述数字化格式的报刊内容信息进行分类时,所述分类单元包括:
第二分类模块,用于按照所述预设置的关键字查询所述数字化格式的报刊内容信息,将查询到的与预设置的关键字对应的数字化格式的报刊内容信息划分为一类。
10.一种剪报装置,其特征在于,包括:
查询单元,用于当需要提取特定的报刊内容信息时,按照预设定的检索条件,查询剪报信息制作装置存储的数字化格式的报刊内容信息,获取与所述预设定的检索条件对应的报刊内容信息,所述报刊内容信息,包括报刊版面信息和报刊文章信息。
11.根据权利要求10所述的剪报装置,其特征在于,还包括:
存储单元,用于在所述查找单元获取与所述预设定的检索条件对应的报刊内容信息后,将所述获取的与所述预设定的检索条件对应的报刊内容信息存储;
处理单元,用于当需要对与所述预设定的检索条件对应的报刊内容信息进行后续利用处理时,将所述存储单元已储存的与所述预设定的检索条件对应的报刊内容信息取出,并进行相应的后续利用处理。
12.一种剪报系统,其特征在于,包括:
如权利要求6至9中任一项所述的剪报信息制作装置;和
如权利要求10或11所述的剪报装置。
CN2010102687443A 2010-08-31 2010-08-31 剪报方法、装置及系统 Pending CN102385584A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102687443A CN102385584A (zh) 2010-08-31 2010-08-31 剪报方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102687443A CN102385584A (zh) 2010-08-31 2010-08-31 剪报方法、装置及系统

Publications (1)

Publication Number Publication Date
CN102385584A true CN102385584A (zh) 2012-03-21

Family

ID=45825005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102687443A Pending CN102385584A (zh) 2010-08-31 2010-08-31 剪报方法、装置及系统

Country Status (1)

Country Link
CN (1) CN102385584A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105530276A (zh) * 2014-09-30 2016-04-27 北大方正集团有限公司 见报数据的处理方法和系统
CN105573964A (zh) * 2014-10-10 2016-05-11 北大方正集团有限公司 报纸版面展示方法及装置
CN106569983A (zh) * 2015-10-08 2017-04-19 北大方正集团有限公司 剪报创建方法和剪报创建系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912874A (zh) * 2006-08-30 2007-02-14 北京大学 一种提取见报资料数据信息的方法
CN101122908A (zh) * 2006-08-11 2008-02-13 仇伟军 一种原版报刊网络发布方法
WO2009109627A1 (en) * 2008-03-07 2009-09-11 Jala Aps Method of scanning
CN101739705A (zh) * 2008-11-21 2010-06-16 北大方正集团有限公司 一种报纸数字化版面信息的裁剪与拼装的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101122908A (zh) * 2006-08-11 2008-02-13 仇伟军 一种原版报刊网络发布方法
CN1912874A (zh) * 2006-08-30 2007-02-14 北京大学 一种提取见报资料数据信息的方法
WO2009109627A1 (en) * 2008-03-07 2009-09-11 Jala Aps Method of scanning
CN101739705A (zh) * 2008-11-21 2010-06-16 北大方正集团有限公司 一种报纸数字化版面信息的裁剪与拼装的方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105530276A (zh) * 2014-09-30 2016-04-27 北大方正集团有限公司 见报数据的处理方法和系统
CN105573964A (zh) * 2014-10-10 2016-05-11 北大方正集团有限公司 报纸版面展示方法及装置
CN106569983A (zh) * 2015-10-08 2017-04-19 北大方正集团有限公司 剪报创建方法和剪报创建系统

Similar Documents

Publication Publication Date Title
Quick et al. Data reduction and data mining framework for digital forensic evidence: storage, intelligence, review and archive
MX2009000589A (es) Procesamiento de datos a traves de bases de datos muy grandes.
CN104298736B (zh) 数据集合连接方法、装置及数据库系统
CN101158963A (zh) 一种情报收集处理和检索系统
CN105653592A (zh) 一种基于hdfs的小文件合并工具和方法
CN101751459A (zh) 一种电子设备中数据处理的方法和装置
CN102566945A (zh) 一种实现图书自动组稿按需印刷的方法和系统
CN103970779A (zh) 一种文件的分类方法、装置和设备
CN112262379A (zh) 存储数据项并且标识存储的数据项
CN103177022A (zh) 一种恶意文件搜索方法及装置
CN104462096A (zh) 舆情监测分析方法和装置
CN101408882B (zh) 一种授权文档的检索方法和系统
CN102385584A (zh) 剪报方法、装置及系统
Zapilko et al. Performing statistical methods on linked data
CN102486775A (zh) 业务数据的查询方法及装置
CN107506407B (zh) 一种文件分类、调用的方法及装置
CN101770474A (zh) 一种基于历史检索记录检索的方法和装置
CN102081758A (zh) 一种数字内容资源收集整理加工的方法和系统
CN105302669A (zh) 一种云备份过程中数据去重的方法和系统
CN111045994A (zh) 一种基于kv数据库的文件分类检索方法及系统
CN113778945A (zh) 一种电子档案数据保全系统和方法
Peterson Patron Preferences for Folksonomy Tags: Research Findings When Both Hierarchial Subject Headings and Folksonomy Tags Are Used
JP2008546068A (ja) ユーザが複数のオブジェクト、特に紙文書を管理することを可能にする装置および方法
CN102769730A (zh) 一种广播电视音像资料离线编目方法
CN104657397A (zh) 一种信息处理方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120321