WO2014086265A1 - 一种方便电子化的专业笔记本及其电子化方法 - Google Patents

一种方便电子化的专业笔记本及其电子化方法 Download PDF

Info

Publication number
WO2014086265A1
WO2014086265A1 PCT/CN2013/088379 CN2013088379W WO2014086265A1 WO 2014086265 A1 WO2014086265 A1 WO 2014086265A1 CN 2013088379 W CN2013088379 W CN 2013088379W WO 2014086265 A1 WO2014086265 A1 WO 2014086265A1
Authority
WO
WIPO (PCT)
Prior art keywords
paper page
line
image
electronic
type
Prior art date
Application number
PCT/CN2013/088379
Other languages
English (en)
French (fr)
Inventor
曹璐
Original Assignee
上海合合信息科技发展有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 上海合合信息科技发展有限公司 filed Critical 上海合合信息科技发展有限公司
Publication of WO2014086265A1 publication Critical patent/WO2014086265A1/zh

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42DBOOKS; BOOK COVERS; LOOSE LEAVES; PRINTED MATTER CHARACTERISED BY IDENTIFICATION OR SECURITY FEATURES; PRINTED MATTER OF SPECIAL FORMAT OR STYLE NOT OTHERWISE PROVIDED FOR; DEVICES FOR USE THEREWITH AND NOT OTHERWISE PROVIDED FOR; MOVABLE-STRIP WRITING OR READING APPARATUS
    • B42D15/00Printed matter of special format or style not otherwise provided for
    • B42D15/0006Paper provided with guiding marks, e.g. ruled, squared or scaled paper
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Definitions

  • the invention belongs to the technical field of electronic computers, and relates to an electronic method for paper text, in particular to a professional notebook which is convenient for electronic use and an electronic method thereof. Background technique
  • Smartphones are one of the commonly used tools for electronically documenting paper documents. Because the camera usually has a camera on the smartphone, the camera on the mobile phone can take a paper document, and the captured electronic document can be processed into a JPEG format or a PDF document. Applications with these features have also become more popular, such as the CamS Canne r application in the Apple App Store and the Google App Store. These applications can automatically monitor the four sides of the captured document from the captured image, use this as a reference to cut off the background outside the document area in the image, and perform correction and image enhancement on the document area to obtain a scanner similar to the one used. The effect of scanning a clean and clean electronic document is saved and managed in a user-specified format.
  • the common paper documents that need to be electronically are paper notebook pages.
  • Ten or even hundreds of pages of paper, and the same type of notebook, all the paper sheets used for recording are generally uniform, such as:
  • the notebook page is usually pre-printed with a branch line to ensure that the record is clean and tidy.
  • the order provides convenience.
  • the line on the notebook is generally printed with the same thickness and length from top to bottom, and a certain distance from the outer edge of the sheet to ensure aesthetics.
  • the application software such as CamScanner determines the position of the cut by detecting the straight edge in the captured image, and then the user can manually adjust the detected straight edge, and the application software will go to the image according to the adjustment result of the user.
  • Straight line detection within a certain range to ensure the accuracy of the outer edge line as the reference for trimming correction, thus ensuring The processed image has a better visual effect.
  • the existing notebook has a straight branch line printed
  • the user can also manually adjust the reference edge provided by the application for segmentation, but since the user's handwriting often overlaps with the branch line on the notebook,
  • the color of the printed branch line may be lighter, and the ambient light printed on the existing notebook may become less obvious when the image is taken, making it difficult for AutoScan and other applications to automatically detect it.
  • the branch line printed on the notebook makes it impossible for the user to use the branch line as the dividing line. This gives the user the inconvenience of determining the position of the trimming correction, which affects the visual effect of the processed image. Summary of the invention
  • an object of the present invention is to provide a professional notebook that is convenient for electronic use and an electronic method thereof for solving the inaccurate trimming correction when the paper document is electronically in the prior art.
  • the present invention provides a professional notebook that is convenient for electronic use and an electronic method thereof.
  • a professional notebook that is convenient for electronic printing, and at least one branch line for scanning and recognizing is printed on the paper page of the electronic notebook which is convenient for electronic printing.
  • the branch line for facilitating scanning recognition is a bold or/and lengthened straight line; the branch line is parallel to the upper and lower edge lines of the paper page, perpendicular to the left and right of the paper page. Edge line.
  • the paper page of the electronic notebook is further printed with at least one line for facilitating scanning and identification; and the line for facilitating scanning and recognition is a bold or/and elongated line;
  • the line of separation is perpendicular to the upper and lower edge lines of the paper page, parallel to the left and right edge lines of the paper page.
  • An electronic method for conveniently digitizing a professional notebook comprising: capturing a paper page image of a professional notebook that is convenient for electronic;
  • a line detection method Determining a line existing in the paper page image by a line detection method in an image, the line including a line where the 4 edge lines of the paper page are located and a line where the line line on the paper page is located ;
  • the line detection method in the passing image Determining a straight line existing in the paper page image for correction, and using the corrected straight line as a reference trim line for selecting content to be retained in the paper page image;
  • At least one branch line for scanning and recognizing is printed on the paper page of the electronic notebook for convenient electronicization;
  • the branch line for facilitating scanning identification is a bold or/and elongated line;
  • the branch line Parallel to the upper and lower edge lines of the paper page, perpendicular to the left and right edge lines of the paper page.
  • the paper page of the electronic notebook is printed with at least one sorting line for scanning identification;
  • the line for facilitating scanning identification is a bold or/and lengthened straight line;
  • the line of separation is perpendicular to the upper and lower edge lines of the paper page, parallel to the left and right edge lines of the paper page.
  • the type of the paper page is determined by the size and format of the paper page.
  • a specific implementation manner of determining the type of the paper page according to the paper page image is: manually specifying the paper quality The type of page.
  • the specific implementation manner of determining the type of the paper page according to the paper page image is: on the paper page Printing a type mark on the upper fixed position; detecting a type mark on the paper page image, comparing the detected type mark with a type mark previously known in the image processing method, and finding out The type to which the paper page belongs.
  • the specific implementation manner of determining the type of the paper page according to the paper page image is: creating a new paper page Type, enter the size and format of the unknown paper page.
  • the invention increases the number of trimming reference lines when the paper document is electronicized by printing the thickening or lengthening branch line or the dividing line on the notebook page, and enhances the selection of the content on the paper page image.
  • the present invention predetermines the type of the paper page, ensures the correction accuracy of the trimming reference line, and solves the problem that the visual image of the finally obtained page image is not good, and Classification and management of electronic paper documents.
  • FIG. 1 is a schematic view showing the structure of a professional notebook which is convenient for electronic use according to the present invention.
  • FIG. 2 is a schematic view showing another structure of a professional notebook which is convenient for electronic use according to the present invention.
  • 3 is a flow chart showing the electronic method of the electronic notebook which is convenient for electronic use according to the present invention.
  • This embodiment provides a professional notebook that is convenient to be electronic, as shown in FIG.
  • the paper page 100 of the professional notebook is printed with at least one branch line 101 for scanning identification.
  • the branch line for facilitating scanning recognition is a thickened or/and lengthened straight line; the branch line is parallel to the upper edge line 103 and the lower edge line 104 of the paper page (referred to as upper and lower edge lines) , perpendicular to the left edge line 105 and the right edge line 106 of the paper page (referred to as the left and right edge lines).
  • the paper page 100 of the electronic notebook is conveniently printed with at least one line 102 for scanning identification.
  • the column line 102 for facilitating scanning identification is a bold or/and elongated line; the column line 102 is perpendicular to the upper edge line 103 and the lower edge line 104 of the paper page (referred to as upper, The lower edge line) is parallel to the left edge line 105 and the right edge line 106 (referred to as the left and right edge lines) of the paper page.
  • the embodiment further provides an electronic method for facilitating electronicization of a professional notebook, wherein the electronic notebook is a convenient and convenient electronic notebook provided by the embodiment (see FIG. 1 and FIG. 2), such as As shown in FIG. 3, the electronic method includes the following steps:
  • branch line that facilitates scanning and identification is printed on the paper page of the electronic notebook that is convenient for electronic printing.
  • the branch line for facilitating scanning recognition is a bold or/and elongated line; the branch line is parallel to an upper edge line and a lower edge line (referred to as an upper and lower edge line) of the paper page, perpendicular to the The left and right edge lines of the paper page (referred to as the left and right edge lines).
  • the line for facilitating scanning recognition is a bold or/and elongated line; the line is perpendicular to an upper edge line and a lower edge line of the paper page (referred to as upper and lower edge lines), parallel to The left edge line and the right edge line of the paper page (referred to as the left and right edge lines).
  • the type of the paper page is determined based on the paper page image, thereby obtaining an accurate position of a branch line printed on the paper page of the professional notebook for easy scanning recognition.
  • the type of the paper page is determined by the size and format of the paper page.
  • the type of paper page also includes the precise location of the bolded or/and lengthened line or/and line of dots in the paper page of the notebook.
  • the type of the paper page is known in advance in a processing method in an image (such as an application software such as a camscanner).
  • Correcting a straight line existing in the paper page image determined by the line detecting method in the image according to the type of the paper page and the position of the branch line or/and the sorting line, and using the corrected straight line as A reference trim line of the content to be retained in the paper page image is selected.
  • the invention increases the number of trimming reference lines when the paper document is electronicized by printing the thickening or lengthening branch line or the dividing line on the notebook page, and enhances the selection of the content on the paper page image.
  • the present invention predetermines the type of the paper page, ensures the correction accuracy of the trimming reference line, solves the problem that the final obtained image of the page is not good, and is also convenient for paper. Classification and management of documents after they are electronic.
  • the invention provides a convenient and quick method for the user to determine an area in the application software such as CamScanner that needs to be segmented and electronicized, that is, the electronic method of the electronic notebook which is convenient for electronicization, and the existing application software such as CamScanner
  • the content on the paper page image can be directly segmented directly, which facilitates the classification and management of the paper document after being electronicized, and is more flexible and more user-friendly.
  • the embodiment provides an electronic method for facilitating electronicization of a professional notebook, which is different from the electronic method of the electronic notebook which is convenient for electronic use according to the first embodiment: the processing method in the image is known in advance.
  • the specific implementation manner of determining the type of the paper page according to the paper page image is:
  • Embodiment 3 the type of paper page to which it belongs, such as one of a series of notebook page types pre-stored in applications such as camScanner.
  • the embodiment provides an electronic method for facilitating electronicization of a professional notebook, which is different from the electronic method of the electronic notebook for convenient electronicization according to the first and second embodiments: the processing method in the image is known in advance In the case of the type of the paper page, the specific implementation manner of determining the type of the paper page according to the paper page image is:
  • the type mark on the paper page image is detected, and the detected type mark is compared with a type mark previously known by the processing method in the image to find out the type to which the paper page belongs.
  • the type tag can be a word, a symbol, a graphic, or a combination of any two or three items.
  • a pre-designed mark ie, type mark
  • the paper of the notebook is detected in the image.
  • the approximate position of the mark is determined in the image of the paper page with reference to the four outer edges, thereby realizing the detection of the mark in the image, and then the detected mark is saved in advance
  • the tags of the paper pages representing a plurality of different types of notebooks are compared one by one to find out the type of paper pages of the notebooks that are taken.
  • the detected mark is compared with the pre-stored mark representing a plurality of different types of notebook paper pages to find out the type of the paper page of the photographed notebook, which involves handwriting recognition, text recognition, Mature techniques in the art such as image matching are not described herein.
  • Embodiment 4
  • the embodiment provides an electronic method for facilitating electronicization of a professional notebook, which is different from the electronic method of the electronic notebook for facilitating electronicization according to the first embodiment: the processing method in the image is not known in advance.
  • the type of the page in this case, the specific implementation manner of determining the type of the paper page according to the paper page image is:
  • the paper page of the notebook being shot does not belong to the application software such as CamScanner, it is known in advance.
  • the type of paper page printed with bold or / and extended branch lines or / and line breaks, in the subsequent steps does not detect the thickened / / and lengthened branches printed on behalf of the paper page
  • the line where the line or / and the line are located, or the type of the unknown paper page is added to the type of the newly created paper page, and then the subsequent line detection is performed.
  • the present invention effectively overcomes various shortcomings in the prior art and has high industrial utilization value.
  • the above-described embodiments are merely illustrative of the principles of the invention and its advantages, and are not intended to limit the invention. Modifications or variations of the above-described embodiments may be made by those skilled in the art without departing from the spirit and scope of the invention. Therefore, all equivalent modifications or changes made by those skilled in the art without departing from the spirit and scope of the invention are still covered by the appended claims.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明提供一种方便电子化的专业笔记本及其电子化方法,该电子化方法包括:拍摄方便电子化的专业笔记本的纸质页面图像;根据纸质页面图像确定纸质页面的类型,获得印刷在专业笔记本的纸质页面上的便于扫描识别的分行线的位置;通过图像中的直线检测方法确定纸质页面图像中存在的直线;根据纸质页面的类型及其分行线的位置,对所述直线进行校正,将校正后的直线作为基准切边线;在基准切边线中选定用于实际切边的直线,通过图像中的切边方法切除纸质页面图像中用于实际切边的直线的外边缘,获得纸质页面图像中需要保留的内容,将需要保留的内容存储为指定格式。本发明增强了对纸质页面图像的内容进行切分的灵活性,保证了切边基准线的准确度。

Description

一种方便电子化的专业笔记本及其电子化方法 技术领域
本发明属于电子计算机技术领域, 涉及一种纸件文本的电子化方法, 特别是 涉及一种方便电子化的专业笔记本及其电子化方法。 背景技术
在日常生活中, 人们经常需要拍摄纸质文档, 保存成 JPEG格式的照片, 或 者生成 PDF格式的文档, 从而实现纸质文档的电子化, 方便管理。 智能手机就是 常用的将纸质文档电子化的工具之一。 因为智能手机上一般都带有摄像头, 利用 手机上的摄像头可以拍摄纸质文档, 并将拍摄得到的电子文档进行一定的图像处 理后再转换成 JPEG格式的照片, 或者生成 PDF格式的文档。 具备上述功能的应 用软件也已经比较普及了, 如苹果应用商店和 google 应用商店中的应用 CamSCanner。 这些应用软件可以从拍摄的图像中自动监测出所拍摄文档的四条 边, 以此为基准切除图像中文档区域外面的背景, 并对文档区域进行校正和图像 增强等处理,获得一个类似于用扫描仪扫描得到的整洁干净的电子化文档的效果, 以用户指定的格式进行保存和管理。
常见的需要进行电子化的纸质文档是纸件笔记本页面, 长期以来人们经常用 纸件笔记本来做各种记录, 如会议记录, 备忘事项记录等等, 一本纸件笔记本中 会有几十甚至上百页纸, 而且同一类型的笔记本, 其所有用来记录的纸页的样式 一般是统一的, 如: 笔记本的页面上一般会预先印上分行线, 来为用户保证记录 的整洁有序提供便利。 笔记本上的分行线一般是印成从上到下所有线的粗细和长 度都一致的, 而且离纸页的外边缘有一定距离以保证美观。 在实际应用中, 人们 经常会在一张笔记本页面上记录多个不同的事项, 而用 CamScanner等应用软件 进行电子化的时候又希望能把记录在一张纸质页面上的不同部分的事项进行分别 电子化, 不原封不动地混淆在一起电子化。 目前 CamScanner等应用软件都是通 过检测所拍摄的图像中的直线边缘来确定切分的位置, 然后用户可以手动对检测 出来的直线边缘进行调整, 应用软件会根据用户的调整结果再去在图像的一定范 围内进行直线检测以保证做为切边校正的基准的外边缘直线的精确性, 从而保证 经过处理以后的图像有比较好的视觉效果。
虽然现有的笔记本中印了笔直的分行线, 用户也可以通过手工调整来改变应 用软件提供的进行切分的参考边缘, 但是由于用户的笔迹经常会跟笔记本上的分 行线重叠, 而且由于所印刷的分行线色泽可能会比较淡, 以及受拍摄的环境光线 等的影响, 现有笔记本上印刷的分行线在拍摄图像时可能会变的很不明显, 使得 CamScanner等应用软件不容易自动检测出笔记本上印刷的分行线,也就使用户无 法将分行线作为切分基准线, 这就给用户确定切边校正的位置带来了不便利, 影 响了处理后图像的视觉效果。 发明内容
鉴于以上所述现有技术的缺点, 本发明的目的在于提供一种方便电子化的专 业笔记本及其电子化方法, 用于解决现有技术中纸质文档电子化时的切边校正不 准确, 导致处理后图像的视觉效果不好的问题。
为实现上述目的及其他相关目的, 本发明提供一种方便电子化的专业笔记本 及其电子化方法。
一种方便电子化的专业笔记本, 所述方便电子化的专业笔记本的纸质页面上 印刷有至少 1条便于扫描识别的分行线。
优选地, 所述便于扫描识别的分行线为加粗或 /和加长的直线; 所述分行线平 行于所述纸质页面的上、 下边缘线, 垂直于所述纸质页面的左、 右边缘线。
优选地, 所述方便电子化的专业笔记本的纸质页面上还印刷有至少 1条便于 扫描识别的分列线; 所述便于扫描识别的分列线为加粗或 /和加长的直线; 所述分 列线垂直于所述纸质页面的上、下边缘线, 平行于所述纸质页面的左、右边缘线。
一种方便电子化的专业笔记本的电子化方法, 所述电子化方法包括: 拍摄方便电子化的专业笔记本的纸质页面图像;
根据所述纸质页面图像确定所述纸质页面的类型, 从而获得印刷在所述专业 笔记本的纸质页面上的便于扫描识别的分行线的位置;
通过图像中的直线检测方法确定所述纸质页面图像中存在的直线, 所述直线 包括所述纸质页面的 4条边缘线所在的直线和位于所述纸质页面上的分行线所在 的直线;
根据所述纸质页面的类型及其分行线的位置, 对通过图像中的直线检测方法 确定的所述纸质页面图像中存在的直线进行校正, 将校正后的直线作为选取所述 纸质页面图像中的需要保留的内容的基准切边线;
在所述基准切边线中选定用于实际切边的直线, 通过图像中的切边方法切除 所述纸质页面图像中用于实际切边的直线的外边缘, 获得所述纸质页面图像中需 要保留的内容, 将所述需要保留的内容存储为指定格式。
优选地, 所述方便电子化的专业笔记本的纸质页面上印刷有至少 1条便于扫 描识别的分行线; 所述便于扫描识别的分行线为加粗或 /和加长的直线; 所述分行 线平行于所述纸质页面的上、 下边缘线, 垂直于所述纸质页面的左、 右边缘线。
优选地, 所述方便电子化的专业笔记本的纸质页面上印刷有至少 1条便于扫 描识别的分列线; 所述便于扫描识别的分列线为加粗或 /和加长的直线; 所述分列 线垂直于所述纸质页面的上、 下边缘线, 平行于所述纸质页面的左、 右边缘线。
优选地, 所述纸质页面的类型由该纸质页面的大小和格式决定。
优选地, 在图像中的处理方法预先已知所述纸质页面的类型的情况下, 根据 所述纸质页面图像确定所述纸质页面的类型的具体实现方式为: 人工指定所述纸 质页面的类型。
优选地, 在图像中的处理方法预先已知所述纸质页面的类型的情况下, 根据 所述纸质页面图像确定所述纸质页面的类型的具体实现方式为: 在所述纸质页面 上的固定位置处印刷有一类型标记; 检测所述纸质页面图像上的类型标记, 将该 检测到的类型标记与所述图像中的处理方法预先已知的类型标记进行一一比较, 找出所述纸质页面所属的类型。
优选地, 在图像中的处理方法预先不知所述纸质页面的类型的情况下, 根据 所述纸质页面图像确定所述纸质页面的类型的具体实现方式为: 创建新的纸质页 面的类型, 输入该未知的纸质页面的大小和格式。 如上所述, 本发明所述的方便电子化的专业笔记本及其电子化方法, 具有以 下有益效果:
本发明通过在笔记本页面上印刷加粗或加长的分行线或分列线的辅助, 增加 了纸质文档电子化时的切边基准线的数量, 增强了对纸质页面图像上的内容进行 选择性切分的灵活性; 此外, 本发明对纸质页面进行预先确定类型, 保证了切边 基准线的校正准确度, 解决了最后获得的页面图像的视觉效果不好的问题, 还便 于纸质文档电子化后的分类和管理。 附图说明
图 1显示为本发明所述的方便电子化的专业笔记本的一种结构示意图。 图 2显示为本发明所述的方便电子化的专业笔记本的另一种结构示意图。 图 3显示为本发明所述的方便电子化的专业笔记本的电子化方法的流程示意
元件标号说明
100 纸质页面;
101 分行线;
102 分列线;
103 上边缘线;
104 下边缘线;
105 左边缘线;
106 右边缘线。 具体实施方式
以下通过特定的具体实例说明本发明的实施方式, 本领域技术人员可由本说 明书所揭露的内容轻易地了解本发明的其他优点与功效。 本发明还可以通过另外 不同的具体实施方式加以实施或应用, 本说明书中的各项细节也可以基于不同观 点与应用, 在没有背离本发明的精神下进行各种修饰或改变。
请参阅附图。 需要说明的是, 本实施例中所提供的图示仅以示意方式说明本 发明的基本构想, 遂图式中仅显示与本发明中有关的组件而非按照实际实施时的 组件数目、 形状及尺寸绘制, 其实际实施时各组件的型态、 数量及比例可为一种 随意的改变, 且其组件布局型态也可能更为复杂。
下面结合实施例和附图对本发明进行详细说明。 实施例一
本实施例提供一种方便电子化的专业笔记本, 如图 1所示, 所述方便电子化 的专业笔记本的纸质页面 100上印刷有至少 1条便于扫描识别的分行线 101。 具 体地, 所述便于扫描识别的分行线为加粗或 /和加长的直线; 所述分行线平行于所 述纸质页面的上边缘线 103和下边缘线 104 (简称上、 下边缘线), 垂直于所述纸 质页面的左边缘线 105和右边缘线 106 (简称左、 右边缘线)。
进一步, 如图 2所示, 所述方便电子化的专业笔记本的纸质页面 100上还印 刷有至少 1条便于扫描识别的分列线 102。 具体地, 所述便于扫描识别的分列线 102为加粗或 /和加长的直线;所述分列线 102垂直于所述纸质页面的上边缘线 103 和下边缘线 104 (简称上、 下边缘线), 平行于所述纸质页面的左边缘线 105和右 边缘线 106 (简称左、 右边缘线)。
本实施例还提供一种方便电子化的专业笔记本的电子化方法, 其中所述方便 电子化的专业笔记本即为本实施例提供的方便电子化的专业笔记本 (参见图 1和 图 2), 如图 3所示, 所述电子化方法包括以下步骤:
拍摄方便电子化的专业笔记本的纸质页面图像。 本实施例中, 所述方便电子 化的专业笔记本的纸质页面上印刷有至少 1条便于扫描识别的分行线。 所述便于 扫描识别的分行线为加粗或 /和加长的直线;所述分行线平行于所述纸质页面的上 边缘线和下边缘线(简称上、下边缘线), 垂直于所述纸质页面的左边缘线和右边 缘线 (简称左、 右边缘线)。 所述便于扫描识别的分列线为加粗或 /和加长的直线; 所述分列线垂直于所述纸质页面的上边缘线和下边缘线(简称上、下边缘线), 平 行于所述纸质页面的左边缘线和右边缘线 (简称左、 右边缘线)。
为实现本发明所述的方法, 需要在笔记本的纸质页面上印刷少量经过加粗和 或加长的分行线或 /和分列线, 例如: 假设一张笔记本的纸质页面上印刷了 20条 均匀分布的分行线, 每隔 4条正常印刷的分行线, 就印刷一条经过加长或 /和加粗 的分行线; 或者在笔记本的纸质页面上印刷至少 1条均匀分布的分列线, 或不印 刷分列线。
根据所述纸质页面图像确定所述纸质页面的类型, 从而获得印刷在所述专业 笔记本的纸质页面上的便于扫描识别的分行线的精确位置。 本实施例中, 所述纸 质页面的类型由该纸质页面的大小和格式决定。 所述纸质页面的类型还包括经过 加粗或 /和加长的分行线或 /和分列线在笔记本的纸质页面中的精确位置。 而且, 所述纸质页面的类型为图像中的处理方法(如 camscanner等应用软件)预先已知 的。 通过图像中的直线检测方法确定所述纸质页面图像中存在的直线, 所述直线 包括所述纸质页面的 4条边缘线所在的直线和位于所述纸质页面上的分行线所在 的直线以及分列线所在的直线。本实施例中, 由于预先已知了经过加粗或 /和加长 的分行线或 /和分列线在所拍摄的笔记本的纸质页面图像中的精确位置,再加上加 粗或 /和加长这些特点使得这些分行线或 /和分列线在所拍摄的纸质页面图像中会 比较突出, 检测这些分行线或分列线的准确性会大幅度提高。
根据所述纸质页面的类型及其分行线或 /和分列线的位置,对通过图像中的直 线检测方法确定的所述纸质页面图像中存在的直线进行校正, 将校正后的直线作 为选取所述纸质页面图像中的需要保留的内容的基准切边线。
在所述基准切边线中选定用于实际切边的直线, 通过图像中的切边方法切除 所述纸质页面图像中用于实际切边的直线的外边缘, 获得所述纸质页面图像中需 要保留的内容, 将所述需要保留的内容进行图像增强等处理, 然后将处理后的需 要保留的内容存储为用户指定格式。
本发明通过在笔记本页面上印刷加粗或加长的分行线或分列线的辅助, 增加 了纸质文档电子化时的切边基准线的数量, 增强了对纸质页面图像上的内容进行 选择性切分的灵活性; 此外, 本发明对纸质页面进行预先确定类型, 保证了切边 基准线的校正准确度, 解决了最后获得的页面图像的视觉效果不好的问题, 还便 于纸质文档电子化后的分类和管理。
本发明为用户在 CamScanner等应用软件中确定需要切分出来进行电子化的 区域提供了一种便利快捷的方法,即所述方便电子化的专业笔记本的电子化方法, 使得现有 CamScanner等应用软件可直接对纸质页面图像上的内容进行选择性切 分, 便于纸质文档电子化后的分类和管理, 灵活性更强, 更人性化。 实施例二
本实施例提供一种方便电子化的专业笔记本的电子化方法, 其与实施例一所 述的方便电子化的专业笔记本的电子化方法的区别在于: 在图像中的处理方法预 先已知所述纸质页面的类型的情况下, 根据所述纸质页面图像确定所述纸质页面 的类型的具体实现方式为:
人工指定所述纸质页面的类型。
即用户在拍摄图像之前, 或者拍摄图像之后处理图像之前, 人工指定笔记本 的纸质页面所属的类型,比如从预先保存在 camScanner等应用软件中的一系列笔 记本页面类型中选择一个。 实施例三
本实施例提供一种方便电子化的专业笔记本的电子化方法, 其与实施例一和 二所述的方便电子化的专业笔记本的电子化方法的区别在于: 在图像中的处理方 法预先已知所述纸质页面的类型的情况下, 根据所述纸质页面图像确定所述纸质 页面的类型的具体实现方式为:
在所述纸质页面上的固定位置处印刷有一类型标记;
检测所述纸质页面图像上的类型标记, 将该检测到的类型标记与所述图像中 的处理方法预先已知的类型标记进行一一比较, 找出所述纸质页面所属的类型。 所述类型标记可以为文字、 符号、 图形或者任意两项或三项的结合。
即预先在笔记本的每一张纸质页面的指定位置印刷上一个预先设计好的标记 (即类型标记),在拍摄获取了笔记本的纸质页面的图像以后,先在图像中检测出 笔记本的纸质页面的四条外边缘, 以该四条外边缘为参照在纸质页面的图像中确 定所述标记的大致位置, 从而实现所述标记在图像中的检测, 然后把检测到的标 记跟预先保存的代表多个不同类型的笔记本的纸质页面的标记进行一一比较, 找 出所拍摄的笔记本的纸质页面所属的类型。 将检测到的标记跟预先保存的代表多 个不同类型的笔记本纸质页面的标记进行一一比较, 找出所拍摄的笔记本的纸质 页面所属的类型, 这一步骤涉及手写识别, 文字识别, 图像匹配等本领域中的成 熟技术, 在此不作赘述。 实施例四
本实施例提供一种方便电子化的专业笔记本的电子化方法, 其与实施例一所 述的方便电子化的专业笔记本的电子化方法的区别在于: 图像中的处理方法预先 不知所述纸质页面的类型, 在此种情况下, 根据所述纸质页面图像确定所述纸质 页面的类型的具体实现方式为:
创建新的纸质页面的类型, 输入该未知的纸质页面的大小和格式, 以及纸质 页面上的分行线和分列线的精确位置。
即如果所拍摄的笔记本的纸质页面不属于 CamScanner等应用软件事先已知 的印刷了加粗或 /和加长的分行线或 /和分列线的纸质页面的类型, 则在后续的步 骤中不去检测代表纸质页面中印刷的经过加粗或 /和加长的分行线或 /和分列线所 在的直线, 或者先将该未知的纸质页面的类型添加到新创建的纸质页面的类型中 后, 再进行后续的直线检测。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。 上述实施例仅例示性说明本发明的原理及其功效, 而非用于限制本发明。 任何熟 悉此技术的人士皆可在不违背本发明的精神及范畴下, 对上述实施例进行修饰或 改变。 因此, 举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神 与技术思想下所完成的一切等效修饰或改变, 仍应由本发明的权利要求所涵盖。

Claims

权利要求书
、 一种方便电子化的专业笔记本, 其特征在于: 所述方便电子化的专业笔记本的纸质页面 上印刷有至少 1条便于扫描识别的分行线。 、 根据权利要求 1 所述的方便电子化的专业笔记本, 其特征在于: 所述便于扫描识别的分 行线为加粗或 /和加长的直线; 所述分行线平行于所述纸质页面的上、 下边缘线, 垂直于 所述纸质页面的左、 右边缘线。 、 根据权利要求 1 所述的方便电子化的专业笔记本, 其特征在于: 所述方便电子化的专业 笔记本的纸质页面上还印刷有至少 1 条便于扫描识别的分列线; 所述便于扫描识别的分 列线为加粗或 /和加长的直线; 所述分列线垂直于所述纸质页面的上、 下边缘线, 平行于 所述纸质页面的左、 右边缘线。 、 一种方便电子化的专业笔记本的电子化方法, 其特征在于, 所述电子化方法包括:
拍摄方便电子化的专业笔记本的纸质页面图像;
根据所述纸质页面图像确定所述纸质页面的类型, 从而获得印刷在所述专业笔记本 的纸质页面上的便于扫描识别的分行线的位置;
通过图像中的直线检测方法确定所述纸质页面图像中存在的直线, 所述直线包括所 述纸质页面的 4条边缘线所在的直线和位于所述纸质页面上的分行线所在的直线;
根据所述纸质页面的类型及其分行线的位置, 对通过图像中的直线检测方法确定的 所述纸质页面图像中存在的直线进行校正, 将校正后的直线作为选取所述纸质页面图像 中的需要保留的内容的基准切边线;
在所述基准切边线中选定用于实际切边的直线, 通过图像中的切边方法切除所述纸 质页面图像中用于实际切边的直线的外边缘, 获得所述纸质页面图像中需要保留的内 容, 将所述需要保留的内容存储为指定格式。 、 根据权利要求 4所述的方便电子化的专业笔记本的电子化方法, 其特征在于: 所述方便 电子化的专业笔记本的纸质页面上印刷有至少 1 条便于扫描识别的分行线; 所述便于扫 描识别的分行线为加粗或 /和加长的直线; 所述分行线平行于所述纸质页面的上、 下边缘 线, 垂直于所述纸质页面的左、 右边缘线。 、 根据权利要求 4所述的方便电子化的专业笔记本的电子化方法, 其特征在于: 所述方便 电子化的专业笔记本的纸质页面上印刷有至少 1 条便于扫描识别的分列线; 所述便于扫 描识别的分列线为加粗或 /和加长的直线; 所述分列线垂直于所述纸质页面的上、 下边缘 线, 平行于所述纸质页面的左、 右边缘线。 、 根据权利要求 4所述的方便电子化的专业笔记本的电子化方法, 其特征在于: 所述纸质 页面的类型由该纸质页面的大小和格式决定。 、 根据权利要求 7 所述的方便电子化的专业笔记本的电子化方法, 其特征在于: 在图像中 的处理方法预先已知所述纸质页面的类型的情况下, 根据所述纸质页面图像确定所述纸 质页面的类型的具体实现方式为: 人工指定所述纸质页面的类型。 、 根据权利要求 7 所述的方便电子化的专业笔记本的电子化方法, 其特征在于: 在图像中 的处理方法预先已知所述纸质页面的类型的情况下, 根据所述纸质页面图像确定所述纸 质页面的类型的具体实现方式为:
在所述纸质页面上的固定位置处印刷有一类型标记;
检测所述纸质页面图像上的类型标记, 将该检测到的类型标记与所述图像中的处理 方法预先已知的类型标记进行一一比较, 找出所述纸质页面所属的类型。 0、 根据权利要求 7 所述的方便电子化的专业笔记本的电子化方法, 其特征在于: 在图 像中的处理方法预先不知所述纸质页面的类型的情况下, 根据所述纸质页面图像确定所 述纸质页面的类型的具体实现方式为:
创建新的纸质页面的类型, 输入该未知的纸质页面的大小和格式。
PCT/CN2013/088379 2012-12-05 2013-12-03 一种方便电子化的专业笔记本及其电子化方法 WO2014086265A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210516674.8A CN102938063B (zh) 2012-12-05 2012-12-05 一种方便电子化的专业笔记本及其电子化方法
CN201210516674.8 2012-12-05

Publications (1)

Publication Number Publication Date
WO2014086265A1 true WO2014086265A1 (zh) 2014-06-12

Family

ID=47696958

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/088379 WO2014086265A1 (zh) 2012-12-05 2013-12-03 一种方便电子化的专业笔记本及其电子化方法

Country Status (2)

Country Link
CN (1) CN102938063B (zh)
WO (1) WO2014086265A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160234A (zh) * 2019-12-27 2020-05-15 掌阅科技股份有限公司 表格识别方法、电子设备及计算机存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034842A (zh) * 2012-12-05 2013-04-10 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子缩略图显示方法
CN102938063B (zh) * 2012-12-05 2016-02-10 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子化方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202079942U (zh) * 2011-05-11 2011-12-21 吴俊文 活页本
CN102402560A (zh) * 2010-09-17 2012-04-04 腾讯数码(天津)有限公司 Sns社区的个人动态消息中的图片评论的方法及系统
CN102938063A (zh) * 2012-12-05 2013-02-20 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子化方法
CN102938061A (zh) * 2012-12-05 2013-02-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其页码自动识别方法
CN102982160A (zh) * 2012-12-05 2013-03-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其电子化文档的自动分类方法
CN103020812A (zh) * 2012-12-05 2013-04-03 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其添加到电子日历中的方法
CN103020619A (zh) * 2012-12-05 2013-04-03 上海合合信息科技发展有限公司 一种自动切分电子化笔记本中手写条目的方法
CN103034842A (zh) * 2012-12-05 2013-04-10 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子缩略图显示方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1628240B1 (en) * 2004-08-10 2008-03-05 Océ-Technologies B.V. Outlier detection during scanning
JP4332858B2 (ja) * 2007-03-02 2009-09-16 ブラザー工業株式会社 画像処理装置および印刷装置、画像処理方法
CN100535930C (zh) * 2007-10-23 2009-09-02 北京大学 一种复杂结构文档图像倾斜快速检测方法
CN101930594B (zh) * 2010-04-14 2012-05-23 山东山大鸥玛软件有限公司 一种扫描文档图像的快速纠偏方法
CN102201053B (zh) * 2010-12-10 2013-07-24 上海合合信息科技发展有限公司 一种文本图像的切边方法
KR20120106291A (ko) * 2011-03-18 2012-09-26 강승인 연습용 노트

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402560A (zh) * 2010-09-17 2012-04-04 腾讯数码(天津)有限公司 Sns社区的个人动态消息中的图片评论的方法及系统
CN202079942U (zh) * 2011-05-11 2011-12-21 吴俊文 活页本
CN102938063A (zh) * 2012-12-05 2013-02-20 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子化方法
CN102938061A (zh) * 2012-12-05 2013-02-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其页码自动识别方法
CN102982160A (zh) * 2012-12-05 2013-03-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其电子化文档的自动分类方法
CN103020812A (zh) * 2012-12-05 2013-04-03 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其添加到电子日历中的方法
CN103020619A (zh) * 2012-12-05 2013-04-03 上海合合信息科技发展有限公司 一种自动切分电子化笔记本中手写条目的方法
CN103034842A (zh) * 2012-12-05 2013-04-10 上海合合信息科技发展有限公司 一种方便电子化的专业笔记本及其电子缩略图显示方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160234A (zh) * 2019-12-27 2020-05-15 掌阅科技股份有限公司 表格识别方法、电子设备及计算机存储介质
CN111160234B (zh) * 2019-12-27 2020-12-08 掌阅科技股份有限公司 表格识别方法、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN102938063A (zh) 2013-02-20
CN102938063B (zh) 2016-02-10

Similar Documents

Publication Publication Date Title
WO2014086277A1 (zh) 方便电子化的专业笔记本及其页码自动识别方法
WO2014086279A1 (zh) 方便电子化的专业笔记本及其电子化文档的自动分类方法
CN103020619B (zh) 一种自动切分电子化笔记本中手写条目的方法
US9311548B2 (en) Recognizing and processing object and action tags from stickers
WO2019169772A1 (zh) 图片处理方法、电子装置及存储介质
CN104143094B (zh) 一种无需答题卡的试卷自动阅卷处理方法及系统
CN102201053B (zh) 一种文本图像的切边方法
WO2014086272A1 (zh) 方便电子化的专业笔记本及其添加到电子日历中的方法
US12056171B2 (en) System and method for automated information extraction from scanned documents
JP2009009527A5 (zh)
US20130177246A1 (en) Identification and Separation of Form and Feature Elements from Handwritten and Other User Supplied Elements
CN103500337A (zh) 用于智能无线通信终端的识别四边形边框的方法及装置
CN102945377B (zh) 获取纸质笔记本中内容的方法及装置
US20150254869A1 (en) Image processing apparatus, image processing method, and storage medium
WO2022127384A1 (zh) 文字识别方法、电子设备和计算机可读存储介质
WO2014086265A1 (zh) 一种方便电子化的专业笔记本及其电子化方法
US20150379339A1 (en) Techniques for detecting user-entered check marks
WO2014086266A1 (zh) 一种方便电子化的专业笔记本及其电子缩略图显示方法
WO2016188104A1 (zh) 信息处理方法及信息处理装置
CN104408427A (zh) 图像四边形识别的方法和装置
TWI682327B (zh) 影像整合列印系統以及影像整合列印方法
US10318563B2 (en) Apparatus, method, and computer-readable medium for recognition of a digital document
Shweka et al. Automatic extraction of catalog data from digital images of historical manuscripts
CN111208955A (zh) 打印方法、装置及服务器
US10032073B1 (en) Detecting aspect ratios of document pages on smartphone photographs by learning camera view angles

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13859970

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13859970

Country of ref document: EP

Kind code of ref document: A1