CN106529597A - 扫描图像文件生成装置 - Google Patents

扫描图像文件生成装置 Download PDF

Info

Publication number
CN106529597A
CN106529597A CN201610997371.0A CN201610997371A CN106529597A CN 106529597 A CN106529597 A CN 106529597A CN 201610997371 A CN201610997371 A CN 201610997371A CN 106529597 A CN106529597 A CN 106529597A
Authority
CN
China
Prior art keywords
page
document image
scan document
classification
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610997371.0A
Other languages
English (en)
Inventor
孙翀
欧阳亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Image Technology (shanghai) Co Ltd
Ricoh Imaging Technology Shanghai Co Ltd
Original Assignee
Ricoh Image Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Image Technology (shanghai) Co Ltd filed Critical Ricoh Image Technology (shanghai) Co Ltd
Priority to CN201610997371.0A priority Critical patent/CN106529597A/zh
Publication of CN106529597A publication Critical patent/CN106529597A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供了一种能生成含有分类信息以便于根据该分类信息进行快速和精确检索或归档的扫描图像文件的扫描图像文件生成装置,包括:画面存储部、输入显示部、扫描部、判断部、识别取得部以及扫描图像文件生成部,其中,扫描部用于对原稿中的所有文档页进行扫描依次得到各个页图像;判断部判断页图像中的预定区域是否含有分类识别标识图像;当判断为含有时,识别取得部对分类标识图像中的分类标识进行识别并取得相对应的页分类信息;扫描图像文件生成部根据各个页图像以及所有页分类信息生成扫描图像文件。

Description

扫描图像文件生成装置
技术领域
本发明涉及一种扫描图像文件生成装置,特别是涉及一种能生成含有分类信息以便于根据该分类信息进行快速和精确检索或分类的扫描图像文件的扫描图像文件生成装置。
背景技术
对于一些诸如银行、律师事务所、学校以及图书馆之类的单位或企业,经常有大量的纸质原稿需要扫描,从而生成大量的扫描图像文件,为了便于管理和查找这些扫描图像文件,需要将这些扫描图像文件进行分类归档。
目前通常以扫描图像文件的文件名作为关键词对其进行自动归档或手动归档,日后对扫描图像文件进行搜索时,也是以存储的文件名作为关键词。这样,每次扫描得到一个扫描图像文件时,都要根据将来归档和检索需要人为输入关键词作为文件名,不仅在进行归档时需要大量人力,而且还容易出错,并且一旦文件名不小心被更改,就很难检索到需要的扫描图像文件。
此外,由于扫描图像文件中往往包含多个页图像,不同的页图像又包括不同的关键信息。因此,当要查找的某个关键信息是包含在页图像中而不是存在于文件名中时,若仅仅以文件名作为搜索关键词,就有可能会由于搜索关键词与文件名不匹配而造成不能被搜索到的情况发生。即使检索到了相应的扫描图像文件,也只能对图像文件进行逐页查看,以确定是否是含有上述关键信息的扫描图像文件。这种不能进行精确搜索的情况,势必会造成极大的人力浪费,同时也延长了查找时间。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种能生成含有分类信息以便于根据该分类信息进行快速和精确检索或分类的扫描图像文件的扫描图像文件生成装置。
本发明为了实现上述目的,采用了以下结构:
本发明提供了一种扫描图像文件生成装置,用于对由文档页构成并且含有在预定区域设置有分类标识的文档页的原稿进行扫描生成含有与分类标识相对应的分类信息的扫描图像文件,其特征在于,包括:画面存储部、输入显示部、扫描部、判断部、识别取得部以及扫描图像文件生成部,其中,画面存储部存储有位置数据位置数据输入画面;输入显示部显示位置数据位置数据输入画面让用户输入预定区域的位置数据;扫描部用于对原稿中的所有文档页进行扫描依次得到各个页图像;判断部根据位置数据判断页图像中的预定区域是否含有分类标识图像;当判断为含有时,识别取得部对分类标识图像中的分类标识进行识别并取得相对应的页分类信息;扫描图像文件生成部根据各个页图像以及所有页分类信息生成扫描图像文件。
发明的作用和效果
根据本发明所涉及的扫描图像文件生成装置,因为画面存储部具有能让用户输入要被扫描的页文档的设置有分类标识的预定区域的位置数据的位置数据输入画面,识别取得部又能对该预定区域进行识别取得与页图像相对应的分类信息,进一步地扫描图像文件生成部又能根据各个页图像以及所有分类信息生成扫描图像文件生成的含有与分类标识相对应的分类信息的扫描图像文件,所以一方面使得在对该扫描图像文件进行归档时,能从扫描图像文件中读取相应的分类信息,从而能能实现对扫描图像文件的自动分类,节省了人力,提高了效率,并且减小了分类出错率,另一方面,使得在对该扫描图像文件进行搜索时,能将扫描图像文件中的不同的分类信息作为搜索关键字,从而实现了对扫描图像文件的精确搜索和快速搜索。
附图说明
图1为本发明的实施例一中的设置有分类标识的文档页的示意图;
图2为本发明的实施例一中的扫描图像文件生成装置的结构框图;
图3为本发明的实施例一中的画面存储部存储的位置数据输入画面;
图4为本发明的实施例一中生成的扫描图像文件中的页分类信息与预定标签的对应示意表;
图5为本发明的实施例一中的扫描图像文件生成装置的动作流程图;
图6为本发明的实施例二中的扫描图像文件生成装置的结构框图;
图7为本发明的实施例二中的分类对应表存储的内容示意图;
图8为本发明的实施例二中的扫描图像文件生成装置的动作流程图;
图9为本发明的实施例三中的扫描图像文件生成装置的结构框图;
图10为本发明的实施例三中的扫描图像文件生成装置的动作流程图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下实施例结合附图对本发明的扫描图像文件生成装置作具体阐述。
本实施方式提供了一种扫描图像文件生成装置,用于对由文档页构成并且含有在预定区域设置有分类标识的文档页的原稿进行扫描生成含有与分类标识相对应的分类信息的扫描图像文件,其特征在于,包括:画面存储部、输入显示部、扫描部、判断部、识别取得部以及扫描图像文件生成部,其中,画面存储部存储有位置数据位置数据输入画面;输入显示部显示位置数据位置数据输入画面让用户输入预定区域的位置数据;扫描部用于对原稿中的所有文档页进行扫描依次得到各个页图像;判断部根据位置数据判断页图像中的预定区域是否含有分类标识图像;当判断为含有时,识别取得部对分类标识图像中的分类标识进行识别并取得相对应的页分类信息;扫描图像文件生成部根据各个页图像以及所有页分类信息生成扫描图像文件。
另外,在上述扫描图像文件生成装置中,还可以有这样的特征:其中,扫描图像文件中的页分类信息含有分类关键字以及相对应的页码。
另外,在上述扫描图像文件生成装置中,还可以有这样的特征:其中,扫描图像文件为TIFF图像文件,分类标识为二维码,识别取得部为二维码识别读取部,页分类信息通过二维码识别读取部从二维码中识别取得,该页分类信息含有分类关键字并且与TIFF图像文件中的预定标签相对应。
另外,在上述扫描图像文件生成装置中,还可以有这样的特征:其中,原稿中含有分类标识的文档页作为标识文档页有复数页,标识文档页中的二维码是由用户预先设定并且与不同的分类关键字分别相对应的的多个不同的二维码中的一个。
另外,在上述扫描图像文件生成装置中,还可以有这样的特征:其中,扫描图像文件为TIFF图像文件,分类标识为条形码,识别取得部含有条形码识别读取部和分类对应表,分类对应表设置有与不同的条形编码相对应的不同的分类关键字,页分类信息是通过条形码识别读取部从条形码中读取条形编码,再通过条形编码从分类对应表中取得相对应的分类关键字而生成,该分类关键字与TIFF图像文件中的预定标签相对应。
另外,在上述扫描图像文件生成装置中,还可以有这样的征:其中,原稿中含有分类标识的文档页作为标识文档页有复数页,标识文档页中的条形码是由用户预先设定并且与不同的分类关键字分别相对应的的多个不同的条形码中的一个。
另外,在上述扫描图像文件生成装置中,还可以有这样的特征:其中,扫描图像文件为TIFF图像文件,分类标识为文字标识和图形标识中的一种并且作为文字图像标识,识别取得部含有文字图形标识识别读取部和分类对应表,分类对应表设置有与不同的文字或图形相对应的不同的分类关键字,页分类信息是通过文字图形识别读取部从文字图形标识中读取到文字或所图形,再通过该文字或该图形从分类对应表中取得相对应的分类关键字而生成,该分类关键字与TIFF图像文件中的预定标签相对应。
另外,在上述扫描图像文件生成装置中,还可以有这样的特征,还包括:文件名形成部,根据扫描图像文件中首页的页图像的页分类信息,形成含有该页分类信息中的分类关键字的文件名。
另外,在上述扫描图像文件生成装置中,还可以有这样的特征:其中,分类关键字用于对扫描图像文件进行检索或分类,或者用于对页图像中的内容进行检索或分类。
下面以某学校对2015年一年级5班的试卷为原稿进行扫描生成扫描图像文件为例并结合附图,对本发明涉及的扫描图像文件生成装置进行详细的说明。
<实施例一>
用于让扫描图像文件生成装置扫描生成扫描图像文件的原稿,由文档页构成,并且在构成的文档页中,含有作为标识文档页的文档页,即、在文档页的预定区域设置有分类标识,分类标识是由用户人为设定的,不同的分类标识与不同的分类关键字相对应,分类关键字是根据用户需要而被预先设定的。另外,针对含有多页具有不同类型内容的文档页的原稿,可以根据用户需要,在不同的文档页的预定区域设置相应的分类标识。
在对扫描图像文件生成装置扫描原稿生成后的扫描图像文件进行检索或分类时,或者对扫描图像文件中的页图像的内容进行检索或分类时,上述分类关键字作为用于检索或搜索的关键字。
图1为本发明的实施例一中的设置有分类标识的文档页的示意图。
如图1所示,本实施例中的原稿1为一年级5班的2015年下学期的试卷,由十页文档页110构成。将输入所需要的分类关键字后形成的二维码作为分类标识111b,并将该分类标识设置在作为标识文档页的文档页111的预定区域111a。在10页文档页110中,其中,2-4页文档页的内容为语文试卷,5-7页文档页的内容为数学试卷,8-10页文档页的内容为英语试卷,为了将来便于更精确的分类或查找,用户在第1页的预定区域111a上设置的二维码中,预先输入“2015年一年级5班试卷”作为分类关键字,在第2页的预定区域111a上设置的二维码中,预先输入“语文”作为分类关键字,在第5页的预定区域111a上设置的二维码中,预先输入“数学”作为分类关键字,在第8页的预定区域111a上设置的二维码中,预先输入“英语”作为分类关键字,其中,每个预定区域111a被设置的位置均为右上角,具体位置数据为距离文档页110的上边1cm、右边2cm。
图2为本发明的实施例一中的扫描图像文件生成装置的结构框图。
如图2所示,扫描图像文件生成装置100包括:暂存部10、画面存储部20、输入显示部30、扫描部40、判断部50、识别取得部60、扫描图像文件生成部70以及控制上述各部运行的控制部80。
暂存部10用于对运行中得到的信息和文件进行存储。
画面存储部20存储有位置数据输入画面。
图3为本发明的实施例一中的画面存储部存储的位置数据输入画面。
如图3所示,位置数据输入画面21包括位置数据输入框211、重新输入键212以及输入确认键213。
如图3所示,位置数据输入框211用于输入预定区域111a的位置数据,含有四个输入框211a、211b、211c以及211d,分别对应输入距离文档页110的上边、右边、左边以及下边的距离,距离单位为cm,即、输入框211a为输入上边距(cm),211b为输入右边距(cm),211c为输入左边距(cm),211d为输入下边距(cm),只要输入一个上边距或一个下边距,再输入一个左边距或右边距,就能确定预定区域111a的位置,实施例中输入框211a中显示的输入的位置数据为1、输入框211b中显示的输入的位置数据为2,表示本实施例中的预定区域111a被设置的位置在距离文档页110的上边为1cm,距离文档页110的右边为2cm,此时由于预定区域111a已经可以被确定,所以输入框211c和211d显示为灰色,表示不可输入数据。
用户通过按重新输入键212,就能重新输入或修改位置数据。
用户按下输入确认键213,就确定了输入的位置数据。
用户在进行扫描前,第一次输入位置数据后,不管需要扫描的原稿其中有多少个文档页上设置有分类标识,都默认为每个文档页的预定区域均为第一次输入的数据,不需要再分别输入位置数据。
输入显示部30用于显示位置数据输入画面21和让用户进行输入操作。
扫描部在用户按下输入确认键213后,对原稿1中的所有文档页进行依次扫描,并依次得到相对应的各个页图像。
判断部50根据输入的位置数据,依次判断页图像中的预定区域是否含有与分类标识111b对应的分类标识图像,本实施例中为判断是否存在二维码分类标识图像。
识别取得部60在判断存在分类标识图像时,用于对预定区域进行识别并取得与含有分类标识图像的页图像相对应的页分类信息。本实施例中,识别取得部60为二维码识别取得部,当判断为存在以二维码分类标识图像时,识别取得部60从二维码中识别取得相对应的含有分类关键字的页分类信息。
当不存在未被判断部50判断的页图像时,扫描图像文件生成部70根据各个页图像以及所有页分类信息生成扫描图像文件,页分类信息中含有相应的分类关键字以及页码,也即每个页分类信息对应相应的页图像以及用于标识页图像内容的分类关键字。
图4为本发明的实施例一中生成的扫描图像文件中的页分类信息与预定标签的对应示意表。
如图4所示,本实施例中形成的扫描图像文件为TIFF图像文件,在该TIFF图像文件中,具有很多不同序号的标签tag,将其中的一个预先设定为与页分类信息对应的预定标签,本实施例中设定tag10为预定标签,也即tag序号为10的标签被设定为预定标签,这样形成的TIFF图像文件中,其中的十个页图像,每个页图像都对应有该预定标签项tag10,并且每个页图像的预定标签与相应的页分类信息中的分类关键字相对应,当没有分类关键字时,则对应项显示为空白。
当要对生成的扫描图像文件进行检索时,则通过特定的检索软件,在检索时从扫描图像文件中读取分类关键字,与输入的关键字对比,就能检索到需要的扫描图像文件,当要对生成的扫描图像文件进行分类时,则通过采用特定的自动分类软件,读取扫描图像文件中的分类关键字,就能将扫描图像文件自动归类到文件夹名包括该分类关键字的文件夹中。
图5为本发明的实施例一中的扫描图像文件生成装置的动作流程图。
如图5所示,扫描图像文件生成装置100的动作流程包括以下步骤:
步骤S1-1,输入显示部30显示位置数据输入画面21让用户输入位置数据,然后进入步骤S1-2;
步骤S1-2,当用户输入位置数据并按下输入确认键213后,位置数据被存储到暂存部10中,同时扫描部40对原稿1中的文档页依次进行扫描,得到各个页图像,并存储到暂存部10中,然后进入步骤S1-3;
步骤S1-3,判断部50根据输入的位置数据,从暂存部10中获取一个页图像进行判断,判断获取的页图像中的预定区域是否含有与分类标识111b对应的分类标识图像,当判断为存在时,进入步骤S1-4,当判断为不存在时,进入步骤S1-5;
步骤S1-4,二维码识别取得部60从二维码中识别取得相对应的含有分类关键字的页分类信息并存入暂存部10中,然后进入步骤S1-5;
步骤S1-5,控制部80判断暂存部10中是否还存在未被判断部50判断的页图像,当不存时,进入步骤S1-6,当存在时,返回步骤S1-3;
步骤S1-6,扫描图像文件生成部70根据暂存部10中的各个页图像和页分类信息,生成扫描图像文件,本实施例中为生成TIFFF图像文件。
实施例一的作用与效果
根据本实施例所涉及的扫描图像文件生成装置,因为画面存储部具有能让用户输入要被扫描的页文档的设置有分类标识的预定区域的位置数据的位置数据输入画面,识别取得部又能对该预定区域进行识别取得与页图像相对应的分类信息,进一步地扫描图像文件生成部又能根据各个页图像以及所有分类信息生成扫描图像文件生成的含有与分类标识相对应的分类信息的扫描图像文件,所以一方面使得在对该扫描图像文件进行归档时,能从扫描图像文件中读取相应的分类信息,从而能能实现对扫描图像文件的自动分类,节省了人力,提高了效率,并且减小了分类出错率,另一方面,使得在对该扫描图像文件进行搜索时,能将扫描图像文件中的不同的分类信息作为搜索关键字,从而实现了对扫描图像文件的精确搜索和快速搜索。
进一步地,生成的扫描图像文件中的各个页分类信息含有分类关键字以及相对应的页码,使得生成的扫描图像文件中的各个页分类信息与相应的页图像相对应,便于对该扫描图像文件进行自动分类或搜索时,能将其中的分类关键字与相对应的页码作为搜索关键字,所以能对其进行更加精确的搜索。
进一步,根据本实施例一所涉及的扫描图像文件生成装置,由于生成的扫描图像文件为TIFFF图像文件,并且页分类信息含有分类关键字且与预定标签相对应,所以该TIFF图像文件中的页分类信含有的分类关键字息通过预定标签与相应的页图像相对应,使得通过读取TIFF图像文件中的预定标签对应的分类关键字,就能实现对该TIFF图像文件的自动分类或检索;
另外,根据本实施例一所涉及的扫描图像文件生成装置,由于识别取得部为二维码识别取得部,能从二维码中识别取得页分类信息,所以用户能在扫描前设置含有分类关键字的二维码作为分类标识。
<实施例二>
以下是对实施例二的说明。
在实施例二中,对于和实施例一中相同的结构,给予相同的符号,并省略相同的说明。
图6为本发明的实施例一中的扫描图像文件生成装置的结构框图。
如图6所示,扫描图像文件生成装置200包括:暂存部10、画面存储部20、输入显示部30、扫描部40、判断部250、识别取得部260、扫描图像文件生成部70、图像文件名生成部290以及控制上述各部运行的控制部280。
本实施例的扫描图像文件生成装置200,相比实施例一,识别取得部260含有条形码识别读取部261和分类对应表262。
条形码识别读取部261从页图像的条形码中读取条形编码。
图7为本发明的实施例二中的分类对应表存储的内容示意图。
如图7所示,分类对应表262中,具有条形编码项262-1和分类关键字项262-2,不同的条形编码,对应不同的分类关键字。
本实施例中,用户预先设定一些与不同分类关键字相对应的条形码,在进行扫描前,用户根据需要选取相应的被设定好的条形码,并将该条形码设置在用作标识文档页的预定区域以作为分类标识,当判断部250根据输入的位置数据判断扫描得到的页图像中的预定区域含有与分类标识对应的条形码分类标识图像时,条形编码识别读取部261根据输入的位置数据从条形码中识别读取相对应的条形编码,然从分类对应表262的分类关键字项262-2中取得相对应的分类关键字,由此而生成页分类信息。
另外,与实施例一相比,本实施例还多了个文件名形成部290。在扫描图像文件生成部70生成扫描图像文件后,文件名形成部290根据生成的扫描图像文件中首页的页图像的页分类信息,生成含有该页分类信息的的文件名,这样用户对生成的扫描图像文件进行保存时,可以将该扫描图像文件保存为文件名中含有该分类关键字的扫描图像文件。当采用本实施例中的扫描图像文件生成装置200对实施例一中的原稿1进行扫描生成后扫描图像文件后,自动生成的相应文件名可以为各个页分类信息中含有的分类关键字中的任意一种,这里生成的为“2015年一年级5班试卷”,如果用户直接保存,则保存的文件名就为“2015年一年级5班试卷”。
图8为本发明的实施例二中的扫描图像文件生成装置的动作流程图。
如图8所示,扫描图像文件生成装置200的动作流程包括以下步骤:
步骤S2-1,输入显示部30显示位置数据输入画面21让用户输入位置数据,然后进入步骤S2-2;
步骤S2-2,当用户输入位置数据并按下输入确认键213后,位置数据被存储到暂存部10中,同时扫描部40对原稿1中的文档页依次进行扫描,得到各个页图像,并存储到暂存部10中,然后进入步骤S2-3;
步骤S2-3,判断部250根据输入的位置数据,从暂存部10中获取一个页图像进行判断,判断获取的页图像中的预定区域是否含有与分类标识对应的分类标识图像,当判断为存在时,进入步骤S2-4,当判断为不存在时,然后进入步骤S2-5;
步骤S2-4,条形编码识别部261从条形码中识别读取取得相对应的条形编码,再通过该条形编码从分类对应表262中取得相对应的分类关键字而生成页分类信息,然后进入步骤S2-5;
步骤S2-5,控制部280判断暂存部10中是否还存在未被判断部250判断的页图像,当不存时,进入步骤S2-6,当存在时,返回步骤S2-3;
步骤S2-6,扫描图像文件生成部70根据暂存部10中的各个页图像和页分类信息,生成扫描图像文件,本实施例中为生成TIFFF图像文件,然后进入步骤S2-7;
步骤S2-7,文件名形成部290根据页分类信息,形成文件名,并以该文件名对扫描图像文件进行保存。
实施例二的作用与效果
根据本实施例二所涉及扫描图像文件生成装置,由于同样具有能通过识别分类标识取得页分类信息的识别取得部,并且也具有能根据页分类信息生成扫描图像文件的扫描图像文件生成部,而且能生成和实施例一一样的含有页分类信息的TIFF扫描图像文件,所以同样能实现对该扫描图像文件精确的分类和搜索。
进一步地,由于在本实施例二中,还具有扫描图像文件生成部,在生成扫描图像文件后,能根据该扫描图像文件中的首页的页图像的页分类信息,生成含有该页分类信息中的分类关键字的文件名。
另外,由于在本实施例二中,识别取得部含有条形码识别读取部和分类对应表,而分类对应表设置有与不同的条形编码相对应的不同的分类关键字,所以识别读取部能通过从条形码中读取条形码编码,再通过条形码编码从分类对应表中得到分类关键字而生成页分类信息,所以用户能根据需要,在扫描前设置与分类对应表中的分类关键字相对应的条形码作为分类标识。
<实施例三>
以下是对实施例三的说明。
在实施例三中,对于和实施例一以及实施例二中相同的结构,给予相同的符号,并省略相同的说明。
图9为本发明的实施例三中的扫描图像文件生成装置的结构框图。
如图9所示,扫描图像文件生成装置300包括:暂存部10、画面存储部20、输入显示部30、扫描部40、判断部350、识别取得部360、扫描图像文件生成部70以及控制上述各部运行的控制部380。
本实施例的扫描图像文件生成装置300,相比实施例一,识别取得部360含有文字图形标识识别读取部361和分类对应表362。
文字图形标识识别读取部361从页图像的文字或图形中读取文字或图形。
本实施例中的分类对应表362中存储的内容和实施例二中的类似,只是采用不同的文字或图形替换了条形编码,不同文字或图形,对应不同分类关键字。
本实施例中在进行扫描前,对原稿的预定区域设置文字标识或图形标识作为分类标识,也即设置文字图形标识为分类标识,当判断部350根据输入的位置数据判断扫描得到的页图像中的预定区域含有与分类标识对应的文字或图形时,文字图形标识识别读取部361根据输入的位置数据,从文字图形识别标识中读取文字或图形,然从分类对应表362的分类关键字项中取得相对应的分类关键字,由此而生成页分类信息。
图10为本发明的实施例三中的扫描图像文件生成装置的动作流程图。
如图10所示,扫描图像文件生成装置300的动作流程包括以下步骤:
步骤S3-1,输入显示部30显示位置数据输入画面21让用户输入位置数据,然后进入步骤S3-2;
步骤S3-2,当用户输入位置数据并按下输入确认键213后,位置数据被存储到暂存部10中,同时扫描部40对原稿1中的文档页依次进行扫描,得到各个页图像,并存储到暂存部10中,然后进入步骤S3-3;
步骤S3-3,判断部250根据输入的位置数据,从暂存部10中获取一个页图像进行判断,判断获取的页图像中的预定区域是否含有与分类标识对应的分类标识图像,也即文字图形标识图像,当判断为存在时,进入步骤S3-4,当判断为不存在时,然后进入步骤S3-5;
步骤S3-4,文字图形标识识别读取部361从文字或图形中识别读取取得相对应的文字或图形,再通过该文字或图形从分类对应表362中取得相对应的分类关键字而生成页分类信息,然后进入步骤S2-5;
步骤S3-5,控制部380判断暂存部10中是否还存在未被判断部350判断的页图像,当不存时,进入步骤S3-6,当存在时,返回步骤S3-3;
步骤S3-6,扫描图像文件生成部70根据暂存部10中的各个页图像和页分类信息,生成扫描图像文件,本实施例中为生成TIFFF图像文件。
实施例三的作用与效果
根据本实施例三所涉及的扫描图像文件生成装置,由于同样具有能通过识别分类标识取得页分类信息的识别取得部,并且也具有能根据页分类信息生成扫描图像文件的扫描图像文件生成部,而且能生成和实施例一一样的含有页分类信息且其中的分类关键字与预定标签相对应的TIFF扫描图像文件,所以同样能实现对该扫描图像文件的自动分类和精确检索。
另外,由于在本实施例三中,识别取得部含有文字图形识别读取部和分类对应表,而分类对应表设置有与不同的文字或图形相对应的不同的分类关键字,所以识别读取部能通过从文字图形标识中读取文字或图形,再通过文字或图形从分类对应表中得到分类关键字而生成页分类信息,所以用户能根据需要,在扫描前设置与分类对应表中的分类关键字相对应的文字或图形作为分类标识。
此外,实施例一、实施例二以及实施例三均用于学校对扫描图像文件的管理中,作为本发明的扫描图像文件生成装置,还可用于银行、律师事务所以及图书馆之类的单位或企业对扫描图像文件的管理中。

Claims (9)

1.一种扫描图像文件生成装置,用于对由文档页构成并且含有在预定区域设置有分类标识的文档页的原稿进行扫描生成含有与所述分类标识相对应的分类信息的扫描图像文件,其特征在于,包括:
画面存储部、输入显示部、扫描部、判断部、识别取得部以及扫描图像文件生成部,
其中,所述画面存储部存储有位置数据输入画面;
所述输入显示部显示所述位置数据输入画面让用户输入所述预定区域的位置数据;
所述扫描部用于对所述原稿中的所有文档页进行扫描依次得到各个页图像;
所述判断部根据所述位置数据判断所述页图像中的所述预定区域是否含有分类标识图像;
当判断为含有时,所述识别取得部对所述分类标识图像中的所述分类标识进行识别并取得相对应的页分类信息;
扫描图像文件生成部根据所述各个页图像以及所有所述页分类信息生成所述扫描图像文件。
2.根据权利要求1所述的扫描图像文件生成装置,其特征在于:
其中,所述扫描图像文件中的所述页分类信息含有分类关键字以及相对应的页码。
3.根据权利要求1所述的扫描图像文件生成装置,其特征在于:
其中,所述扫描图像文件为TIFF图像文件,
所述分类标识为二维码,
所述识别取得部为二维码识别读取部,
所述页分类信息通过所述二维码识别读取部从所述二维码中识别取得,该页分类信息含有分类关键字并且与所述TIFF图像文件中的预定标签相对应。
4.根据权利要求3所述的扫描图像文件生成装置,其特征在于:
其中,所述原稿中含有所述分类标识的所述文档页作为标识文档页有复数页,
所述标识文档页中的所述二维码是由所述用户预先设定并且与不同的所述分类关键字分别相对应的多个不同的所述二维码中的一个。
5.根据权利要求1所述的扫描图像文件生成装置,其特征在于:
其中,所述扫描图像文件为TIFF图像文件,
所述分类标识为条形码,
所述识别取得部含有条形码识别读取部和分类对应表,
所述分类对应表设置有与不同的条形编码相对应的不同的分类关键字,
所述页分类信息是通过所述条形码识别读取部从所述条形码中读取所述条形编码,再通过所述条形编码从所述分类对应表中取得相对应的所述分类关键字而生成,该分类关键字与所述TIFF图像文件中的预定标签相对应。
6.根据权利要求5所述的扫描图像文件生成装置,其特征在于:
其中,所述原稿中含有所述分类标识的所述文档页作为标识文档页有复数页,
所述标识文档页中的所述条形码是由所述用户预先设定并且与不同的所述分类关键字分别相对应的多个不同的所述条形码中的一个。
7.根据权利要求1所述的扫描图像文件生成装置,其特征在于:
其中,所述扫描图像文件为TIFF图像文件,
所述分类标识为文字标识和图形标识中的一种并且作为文字图形标识,
所述识别取得部含有文字图形标识识别读取部和分类对应表,
所述分类对应表设置有与不同的所述文字或所述图形相对应的不同的分类关键字,
所述页分类信息是通过所述文字图形识别读取部从所述文字图形标识中读取到所述文字或所图形,再通过该文字或该图形从所述分类对应表中取得相对应的所述分类关键字而生成,该分类关键字与所述TIFF图像文件中的预定标签相对应。
8.根据权利要求2-7任意一项所述的扫描图像文件生成装置,其特征在于,还包括:
文件名形成部,根据所述扫描图像文件中首页的所述页图像的所述页分类信息,形成含有该页分类信息中的所述分类关键字的文件名。
9.根据权利要求2-7任意一项所述的扫描图像文件生成装置,其特征在于:
其中,所述分类关键字用于对所述扫描图像文件进行检索或分类,或者用于对所述页图像中的内容进行检索或分类。
CN201610997371.0A 2016-11-11 2016-11-11 扫描图像文件生成装置 Pending CN106529597A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610997371.0A CN106529597A (zh) 2016-11-11 2016-11-11 扫描图像文件生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610997371.0A CN106529597A (zh) 2016-11-11 2016-11-11 扫描图像文件生成装置

Publications (1)

Publication Number Publication Date
CN106529597A true CN106529597A (zh) 2017-03-22

Family

ID=58351294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610997371.0A Pending CN106529597A (zh) 2016-11-11 2016-11-11 扫描图像文件生成装置

Country Status (1)

Country Link
CN (1) CN106529597A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334797A (zh) * 2017-06-21 2018-07-27 平安科技(深圳)有限公司 文件扫描方法、装置和计算机可读存储介质
CN108460130A (zh) * 2018-03-02 2018-08-28 北京云知学科技有限公司 纸面信息图像化管理方法、装置、电子设备及存储介质
CN110020646A (zh) * 2019-04-16 2019-07-16 恒生电子股份有限公司 文件归档方法、装置、电子设备、及存储介质
CN110188077A (zh) * 2019-05-29 2019-08-30 北京市律典通科技有限公司 一种电子卷宗智能分类方法、装置、电子设备和存储介质
CN110210470A (zh) * 2019-06-05 2019-09-06 复旦大学 商品信息图像识别系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101055614A (zh) * 2007-05-31 2007-10-17 王杰夫 利用条形码识别农产品的方法和系统
CN101587518A (zh) * 2009-07-03 2009-11-25 深圳市宝安区人民医院 一种实现数字化病案分类管理的方法
CN102982160A (zh) * 2012-12-05 2013-03-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其电子化文档的自动分类方法
CN104517045A (zh) * 2013-09-26 2015-04-15 上海中移通信技术工程有限公司 数字文档保护方法及系统
CN104573073A (zh) * 2015-01-27 2015-04-29 江苏汉德天坤数字技术有限公司 一种二维码文档自动分类方法
CN104718741A (zh) * 2012-10-11 2015-06-17 富士施乐株式会社 图像处理设备和程序
CN104750848A (zh) * 2015-04-10 2015-07-01 腾讯科技(北京)有限公司 图像文件的处理方法、服务器及图像显示设备
CN105798914A (zh) * 2014-12-30 2016-07-27 希姆通信息技术(上海)有限公司 用于自动分类图书馆的图书的智能机器人

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101055614A (zh) * 2007-05-31 2007-10-17 王杰夫 利用条形码识别农产品的方法和系统
CN101587518A (zh) * 2009-07-03 2009-11-25 深圳市宝安区人民医院 一种实现数字化病案分类管理的方法
CN104718741A (zh) * 2012-10-11 2015-06-17 富士施乐株式会社 图像处理设备和程序
CN102982160A (zh) * 2012-12-05 2013-03-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其电子化文档的自动分类方法
CN104517045A (zh) * 2013-09-26 2015-04-15 上海中移通信技术工程有限公司 数字文档保护方法及系统
CN105798914A (zh) * 2014-12-30 2016-07-27 希姆通信息技术(上海)有限公司 用于自动分类图书馆的图书的智能机器人
CN104573073A (zh) * 2015-01-27 2015-04-29 江苏汉德天坤数字技术有限公司 一种二维码文档自动分类方法
CN104750848A (zh) * 2015-04-10 2015-07-01 腾讯科技(北京)有限公司 图像文件的处理方法、服务器及图像显示设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334797A (zh) * 2017-06-21 2018-07-27 平安科技(深圳)有限公司 文件扫描方法、装置和计算机可读存储介质
WO2018233356A1 (zh) * 2017-06-21 2018-12-27 平安科技(深圳)有限公司 文件扫描方法、系统、装置和计算机可读存储介质
CN108460130A (zh) * 2018-03-02 2018-08-28 北京云知学科技有限公司 纸面信息图像化管理方法、装置、电子设备及存储介质
CN110020646A (zh) * 2019-04-16 2019-07-16 恒生电子股份有限公司 文件归档方法、装置、电子设备、及存储介质
CN110020646B (zh) * 2019-04-16 2021-07-27 恒生电子股份有限公司 文件归档方法、装置、电子设备、及存储介质
CN110188077A (zh) * 2019-05-29 2019-08-30 北京市律典通科技有限公司 一种电子卷宗智能分类方法、装置、电子设备和存储介质
CN110188077B (zh) * 2019-05-29 2021-03-19 北京市律典通科技有限公司 一种电子卷宗智能分类方法、装置、电子设备和存储介质
CN110210470A (zh) * 2019-06-05 2019-09-06 复旦大学 商品信息图像识别系统

Similar Documents

Publication Publication Date Title
CN106529597A (zh) 扫描图像文件生成装置
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
Shahab et al. An open approach towards the benchmarking of table structure recognition systems
CA2077274C (en) Method and apparatus for summarizing a document without document image decoding
US8520941B2 (en) Method and system for document image classification
JP3289968B2 (ja) 電子的文書処理のための装置および方法
Déjean et al. A system for converting PDF documents into structured XML format
EP0544433A2 (en) Method and apparatus for document image processing
EP2178028A2 (en) Representing documents with runlength histograms
EP1748365A1 (en) Document Template Generation
US8453922B2 (en) Method for one-step document categorization and separation using stamped machine recognizable patterns
Le Bourgeois et al. Document images analysis solutions for digital libraries
Ramel et al. User-driven page layout analysis of historical printed books
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
Konidaris et al. A segmentation-free word spotting method for historical printed documents
US20070116362A1 (en) Method and device for the structural analysis of a document
CN111144445B (zh) 印刷书刊书写格式的检错方法及系统、电子设备
Hamzah et al. Data capturing: Methods, issues and concern
Eskenazi et al. When document security brings new challenges to document analysis
Déjean et al. On tables of contents and how to recognize them
US20030108243A1 (en) Adaptive technology for automatic document analysis
US7920742B2 (en) Image processing apparatus, program and recording medium for document registration
CN100444194C (zh) 文章标题及关联信息的自动抽取装置和抽取方法
Tomaschek Evaluation of off-the-shelf OCR technologies
Lin et al. Multilingual corpus construction based on printed and handwritten character separation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170322

WD01 Invention patent application deemed withdrawn after publication