WO2014082551A1 - 获取纸质笔记本中内容的方法及装置 - Google Patents

获取纸质笔记本中内容的方法及装置 Download PDF

Info

Publication number
WO2014082551A1
WO2014082551A1 PCT/CN2013/087750 CN2013087750W WO2014082551A1 WO 2014082551 A1 WO2014082551 A1 WO 2014082551A1 CN 2013087750 W CN2013087750 W CN 2013087750W WO 2014082551 A1 WO2014082551 A1 WO 2014082551A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
page
notebook
cover
feature
Prior art date
Application number
PCT/CN2013/087750
Other languages
English (en)
French (fr)
Inventor
陈青山
Original Assignee
上海合合信息科技发展有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 上海合合信息科技发展有限公司 filed Critical 上海合合信息科技发展有限公司
Publication of WO2014082551A1 publication Critical patent/WO2014082551A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes

Definitions

  • the present invention relates to the field of document management technologies, and in particular, to a file storage and management, and in particular, a method and apparatus for obtaining content in a paper notebook. Background technique
  • Smartphones are becoming more and more popular, and they have become one of the most commonly used devices in people's daily life, and mobile phones generally have cameras.
  • Application software that uses a camera on a mobile phone to take a document and convert it into a JPEG format after a certain image processing, or to generate a PDF document, has also become popular, such as in the Apple App Store and the Google App Store.
  • Apply CamS Canne r These applications can automatically detect the four sides of the captured document from the captured image, use this as a reference to cut off the background outside the document area in the image, and perform correction and image enhancement on the document area to obtain a scanner similar to the one used. Scan the effects of clean, clean electronic documents and save and manage them in a user-specified format.
  • the common paper documents that need to be electronically are the pages of notebooks. For a long time, people often use notebooks to make various records, such as meeting minutes, memo records, etc. There are dozens or even hundreds of pages in a notebook. Paper, and the same type of notebook, the style of all the paper sheets used for recording is generally uniform.
  • An object of the present invention is to provide a method and apparatus for acquiring content in a paper notebook, which is used to solve the problem in the prior art that it is difficult to quickly and accurately find a desired electronic notebook.
  • the present invention provides, in an aspect, a method for obtaining content in a paper notebook, comprising the steps of: 1) taking a cover image of a notebook to be searched, and capturing a cover feature on the cover image; 2) Extracting the cover feature in the preset database to find whether there is an image matching the feature value of the cover feature; 3) if yes, acquiring The image of the page associated with the image; if not, the current search is ended.
  • step 3) if any, then perform the following steps:
  • step 3 if not, then perform the following steps:
  • the naming of the page image in the pre-stored address includes: an annotation, a note, a document description, a page title, and a to-do item added to the electronic calendar recorded in the notebook page.
  • the feature value of the cover sheet feature is a cover page shape, a color, a pattern, a text or a hand-drawn mark.
  • the present invention provides, in another aspect, an apparatus for acquiring content in a paper notebook, comprising: an image capturing unit, capturing a cover image of the notebook and a plurality of page images of the notebook, and extracting the image on the cover image a cover page feature; an image storage unit, preset a plurality of databases according to the cover feature on the cover image, each database being provided with a plurality of pre-stored addresses for storing a plurality of page images; an image comparison analysis unit, Searching, in the preset database, whether there is an image matching the feature value of the cover page feature according to the captured cover page feature; the page obtaining unit having the feature value of the cover page feature in the database The page image associated with the image is obtained when the image is matched.
  • the page images are sequentially stored in the corresponding pre-stored addresses according to the shooting time.
  • the page acquisition unit selects and is associated with the image.
  • the feature value of the cover sheet feature is a cover page shape, a color, a pattern, a text or a hand-drawn mark.
  • the naming of the page image in the pre-stored address includes: an annotation, a note, a document description, a page title, and a to-do item added to the electronic calendar recorded in the notebook page.
  • the invention not only facilitates the electronic document management of the notebook, but also improves the speed of acquiring the content of the electronic notebook.
  • FIG. 1 is an overall flow chart of a first embodiment of a method for obtaining content in a paper notebook according to the present invention.
  • 2 is a preferred flow chart of the first embodiment of the method for obtaining content in a paper notebook according to the present invention.
  • FIG. 3 is another preferred flow chart of the first embodiment of the method for obtaining content in a paper notebook according to the present invention.
  • 4 is a schematic structural view of an apparatus for acquiring content in a paper notebook according to the present invention.
  • the inventors of the present invention have found that: Users will use multiple notebooks, which may be used at different times, to record different content. However, since these notebook types are identical or the same or close to each other, it is difficult to distinguish after scanning, so that when the user holds a notebook that has been electronically used in the past, it is difficult to find a corresponding electronic notebook. Therefore, the inventors of the present invention have improved the prior art, and proposed a method and apparatus for acquiring content in a paper notebook, which are used to solve the problem that it is difficult to quickly and accurately find the required electronic notebook in the prior art. problem.
  • FIG. 1 is a flow chart showing a method of obtaining contents in a paper notebook according to the present invention.
  • the method for acquiring content in a paper notebook includes: Step S1: capturing a cover image of a notebook to be searched, and capturing a cover feature on the cover image.
  • the user electronically digitizes the pages of the notebook in advance using an application such as CamScanner.
  • the notebook can be photographed using an electronic device with an image pickup function (for example, a camera, a mobile phone with a photographing function, a tablet, etc.). Since the image is captured and the feature values on the image are captured, the prior art is well known to those skilled in the art, and thus will not be described herein.
  • the inventors have creatively conceived to set a cover sheet of a paper notebook so that the cover sheets of each notebook have characteristic values different from those of other cover sheets.
  • the cover sheet feature has a feature value
  • the feature value may be a cover page shape, a color, a pattern, a character or a symbol, etc., which may be printed or hand-painted on the cover page.
  • the feature value may also be a barcode, for example: a two-dimensional code, a one-dimensional barcode, and the like.
  • the position of the feature value may be set at any position of the cover page, for example, the center of the cover page, left Upper corner, upper right corner, lower left corner, lower right corner, etc.
  • the features are not limited to the above-described various types of features, and it is possible to ensure that the cover sheets of each notebook are different types of features.
  • Step S2 Find, in the preset database, whether there is an image matching the feature value of the cover page feature according to the captured cover page feature.
  • the preset database is used to store a cover page and a plurality of pages of the same notebook.
  • the database is a folder.
  • the preset database is pre-configured with a number of pre-stored addresses for storing notebook pages, and a pre-stored address stores one page. Techniques such as handwriting recognition, text recognition, and image matching may be included in this step.
  • step S2 if there is an image in the database that matches the feature value of the cover page feature, then step S3 is performed, otherwise the current search is ended.
  • step S3 If the database has an image that matches the feature value of the cover page feature, the page image associated with the image is acquired.
  • the cover sheet of each notebook since the cover sheet of each notebook has its own unique feature value when the paper notebook is electronically printed, the cover image of the photographed notebook and the sealed of the saved notebook are used.
  • the cover image can be distinguished from other cover images according to the feature values on the cover page to quickly find the cover image.
  • the corresponding cover image should be given regardless of whether the cover image of the notebook that has been saved in the database does not have the same cover image as the cover image of the notebook. Since the cover page of the same notebook and multiple pages have been stored in the same database in advance, only the cover page of the notebook can be found to find multiple pages of the notebook accordingly.
  • step S2 if there is an image in the database that matches the feature value of the cover page feature, the following steps may be performed: Step S4, capturing one of the paper notebooks that is not electronically The image of the page has been processed. Step S5, storing the page image into a pre-stored address allocated in the database, and completing electronic storage of the page.
  • step S2 if there is no image matching the feature value of the cover page feature in the database, the notebook corresponding to the cover page may never be electronically stored. In this case, the pair may be selected. The notebook is electronically stored for later retrieval. Therefore, referring to FIG. 3, if there is no image matching the feature value of the cover page feature in the database, the following steps may be further performed: Step S6, constructing a database according to the cover page image, and A plurality of pre-stored addresses are allocated in the database.
  • the database is used to store a cover page and a plurality of pages of the same notebook.
  • the database is a folder.
  • the pre-stored address is used to correspond to the storage page, and a pre-stored address stores a page.
  • the naming of the page image in the pre-stored address includes: annotations, notes, document descriptions, page titles, and to-do items added to the electronic calendar recorded in the notebook page.
  • the naming of the page image corresponds to the content contained in the page, so that when the page image is acquired through the cover image, the desired page can be quickly and easily found.
  • Step S7 taking a page image in the paper notebook.
  • Step S8 storing the page image into a pre-stored address allocated in the database. After step S7 and step S8, electronic storage of one page of the paper notebook is completed. The above steps S7 to S8 are repeated until the electronic storage of all the pages of the notebook that need to be stored is completed.
  • step S6 to step S8 are newly established in the case where the electronic notebook to be searched does not actually exist.
  • the object of the present invention is to quickly and accurately find the desired electronicized notebook. Therefore, after completing the electronic storage of the above notebook, in the future use, only the cover page of the paper notebook should be taken to automatically obtain the contents of all the electronic notebook pages in the notebook. It should be noted that if the manager neglects, the cover feature value is repeated or in the process of image contrast analysis, the feature value of the similar cover image cannot be well recognized, and the similar feature is recognized as a feature. In this way, the image of the page that does not belong to the same notebook will also be called out.
  • an apparatus for acquiring content in a paper notebook is provided.
  • 4 is a block diagram showing the structure of an apparatus for acquiring contents in a paper notebook provided by the present invention.
  • the apparatus 1 for acquiring content in a paper notebook includes: an image pickup unit 11, an image storage unit 12, an image comparison analysis unit 13, and a page acquisition unit 14. The above various units are described in detail below.
  • the image capturing unit 11 is configured to capture a cover image of the notebook and a plurality of page images of the notebook, and capture a cover feature on the cover image.
  • the user When using an application such as CamScanner to electronically digitize a notebook page, the user needs to capture and save the cover image of the notebook before saving the electronic document of the notebook page.
  • the notebook can be photographed using an electronic device with an image pickup function (for example, a camera, a mobile phone with a photographing function, a tablet, etc.). Since the photographing of images has been known to those skilled in the art, it will not be described herein.
  • the image capturing unit 11 may be a camera of a camera or a smartphone.
  • the inventors in order to solve various kinds of deficiencies in the prior art, the inventors have creatively conceived to set a cover sheet of a paper notebook so that the cover sheets of each notebook have characteristic values different from those of other cover sheets.
  • the feature value may be a cover page shape, a color, a pattern, a text or a symbol, etc., which may be printed or hand-painted on the cover page, for example, on the cover page of the notebook. The date the notebook started to use.
  • the feature value may also be a barcode, for example: a two-dimensional code, a one-dimensional barcode, and the like.
  • the position of the feature may be set at any position of the cover page, for example, the center of the cover page, the upper left corner, the upper right corner, the lower left corner, the lower right corner, and the like. However, it should be ensured that the features should be clearly displayed in the image when the cover image is taken.
  • the feature value is not limited to the above various types of features, and it is possible to ensure that each notebook's cover page is different in various features.
  • the notebook is a popular saying, but the scope of the notebook is not limited to a general notebook, and may include other items such as a courseware, a speech, a printed booklet, and the like.
  • the image storage unit 12 presets a plurality of databases according to the cover features on the cover image, and each database is provided with a plurality of pre-stored addresses for storing a plurality of page images.
  • the naming of the page image in the pre-stored address includes: an annotation, a note, a document description, a page title, and a to-do item added to the electronic calendar recorded in the notebook page. It can also be other user-defined association methods, such as keywords, keywords, etc. of the content in the extracted page.
  • the page images are sequentially stored in the corresponding pre-stored addresses according to the shooting time. In the comparative analysis of the image comparison analysis unit, if it is determined that there are multiple images matching the feature values of the cover page feature in the preset database, the page acquisition unit selects the page image associated with the image. .
  • Electronic storage of a plurality of notebooks can be accomplished by the image capturing unit 11 and the image storage unit 12.
  • the image comparison analysis unit 13 searches, in the preset database, whether there is an image matching the feature value of the cover page feature according to the captured cover feature. That is, it is judged whether or not there is a cover image belonging to the same paper notebook as the cover image of the photographed notebook in the cover image of the notebook that has been saved in the database.
  • the image contrast analysis unit 13 may include techniques such as handwriting recognition, text recognition, and image matching. However, since the handwriting recognition, the character recognition, and the image matching for judging whether the two images are the same are already known in the art, they will not be described herein.
  • the image comparison analysis unit 13 outputs the result of the comparative analysis to prompt whether or not there is a cover image identical to the captured cover sheet image in the cover image of the saved notebook in the database.
  • the cover page of each notebook has been made to be unique. Some features, so when comparing the cover image of the captured notebook with the cover image of the saved notebook, according to the features on the cover, the cover can be distinguished from other covers to quickly Find the cover page.
  • the page obtaining unit 14 acquires a page image associated with the image when the image has an image matching the feature value of the cover page feature.
  • the cover image of the notebook is acquired by the image capturing unit 11 (for example, a mobile phone camera), and the cover feature on the cover image is captured; and then the image comparison analysis unit 13 presets according to the captured cover feature. Whether the image has a matching image with the feature value of the cover page feature; if it is found, the page image associated with the image is acquired, and the image capturing unit 11 and the image storage unit 12 can also be used by the image capturing unit 11 and the image storage unit 12
  • the unprinted page in the notebook continues to be electronically stored in the database where the image is located; if not found, the search is ended; because the reason is not found, the notebook may never be electronically, so In the case where it is not found, the notebook can be further electronically passed through the image pickup unit 11 and the image storage unit 12.
  • the present invention provides a method and apparatus for acquiring content in a paper notebook, and achieves the following beneficial effects:
  • the invention not only facilitates the electronic document management of the notebook, but also improves the speed of acquiring the content of the electronic notebook.
  • the method for automatically acquiring content in a paper notebook of the present invention also has the advantages of being simple and easy to operate.
  • the above-described embodiments are merely illustrative of the principles and effects of the invention and are not intended to limit the invention. Any of the above-described embodiments may be modified by those skilled in the art without departing from the spirit and scope of the invention. Therefore, the scope of the invention should be construed as the scope of the claims.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种获取纸质笔记本中内容的方法及装置,所述装置包括:拍摄笔记本的封页图像以及所述笔记本的多个页面图像并撷取所述封页图像上的封页特征的图像摄取单元;依据所述封页图像上的封页特征预置有多个资料库,每一个资料库设有用于存储多个页面图像的多个预存地址的图像存储单元;根据撷取的封页特征在预置的资料库中查找是否具有与所述封页特征的特征值相匹配的图像的图像对比分析单元;在资料库中具有与所述封页特征的特征值相匹配的图像时获取与该图像相关联的页面图像的页面获取单元。通过本发明,只需要拍摄纸质笔记本的封页,便可自动获取与该封页对应的电子化后的笔记本中的页面图像,从而提高获取电子化笔记本的内容的速度。

Description

获取纸质笔记本中内容的方法及装置
技术领域 本发明涉及文档管理技术领域, 特别涉及对笔记本的备案和管理, 具体为获取纸质笔记 本中内容的方法及装置。 背景技术
在日常生活中人们经常需要拍摄纸质文档, 保存成 JPEG格式的照片, 或者生成 PDF格 式的文档, 从而实现纸质文档的电子化, 方便管理。
智能手机目前已经越来越普及, 成为了人们日常生活中最常用的设备之一, 而手机上一 般都带有摄像头。 利用手机上的摄像头来拍摄文档并把拍摄文档经过一定的图像处理以后转 换成 JPEG格式的照片, 或者生成 PDF格式的文档的应用软件也已经比较普及了, 如苹果应 用商店和 google应用商店中的应用 CamSCanner。 这些应用软件可以从拍摄的图像中自动监 测出所拍摄文档的四条边, 以此为基准切除图像中文档区域外面的背景, 并对文档区域进行 校正和图像增强等处理, 获得一个类似于用扫描仪扫描得到的整洁干净的电子化文档的效 果, 并以用户指定的格式进行保存和管理。
常见的需要进行电子化的纸质文档是笔记本的页面, 长期以来人们经常用笔记本来做各 种记录, 如会议记录, 备忘事项记录等等, 一本笔记本中会有几十甚至上百页纸, 而且同一 类型的笔记本, 其所有用来记录的纸页的样式一般是统一的。
在实际使用中, 随着时间的推移, 用户会使用多个笔记本, 这些笔记本可能是在不同时 期使用的, 记录不同的内容。 但由于这些笔记本类型一致或者样式相同或接近, 扫描之后难 以区分, 这样一来, 当用户拿着一本过去曾经电子化过的笔记本, 却难以找到对应的电子化 后的笔记本。 发明内容 本发明的目的在于提供一种获取纸质笔记本中内容的方法及装置, 用于解决现有技术中 难以快速准确找到所需的电子化后的笔记本的问题。 本发明在一方面提供一种获取纸质笔记本中内容的方法, 包括以下步骤: 1 ) 拍摄待查 找的笔记本的封页图像, 并撷取所述封页图像上的封页特征; 2) 根据撷取的封页特征在预 置的资料库中查找是否具有与所述封页特征的特征值相匹配的图像; 3 ) 若有, 则获取与该 图像相关联的页面图像; 若无, 则结束本次查找。 可选地, 在步骤 3) 中, 若有, 接着执行以下步骤:
4) 拍摄所述纸质笔记本中一未被电子化过的页面图像;
5 ) 将所述页面图像存储至所述资料库中分配的一预存地址中, 重复上述步骤 4) 至步 骤 5), 直至完成该笔记本中未被电子化过的页面的电子化存储。 可选地, 在步骤 3) 中, 若无, 接着执行以下步骤:
6) 依据该封页图像建置一资料库, 并于所述资料库中分配多个预存地址;
7) 拍摄所述纸质笔记本中一页面图像;
8 ) 将所述页面图像存储至所述资料库中分配的一预存地址中, 重复上述步骤 7 ) 至步 骤 8), 直至完成该笔记本的电子化存储。 可选地, 所述页面图像在预存地址中的命名包括: 笔记本页面内包含的批注、 备注、 文 档说明、 页面标题、 以及笔记本页面中记录的添加到电子日历中的待办事项。 可选地, 所述封页特征的特征值为封页形状、 颜色、 图案、 文字或手绘标记。 本发明在另一方面提供一种获取纸质笔记本中内容的装置, 包括: 图像摄取单元, 拍摄 笔记本的封页图像以及所述笔记本的多个页面图像, 并撷取所述封页图像上的封页特征; 图 像存储单元, 依据所述封页图像上的封页特征预置有多个资料库, 每一个资料库设有用于存 储多个页面图像的多个预存地址; 图像对比分析单元, 根据撷取的封页特征在预置的资料库 中查找是否具有与所述封页特征的特征值相匹配的图像; 页面获取单元, 在资料库中具有 与所述封页特征的特征值相匹配的图像时获取与该图像相关联的页面图像。 可选地, 在所述图像存储单元中, 所述页面图像根据拍摄时间的先后依次存入对应的预 存地址中。 可选地, 在所述图像对比分析单元的对比分析中, 若判断在预置的资料库中具有多个与 所述封页特征的特征值相匹配的图像, 页面获取单元选择与该图像相关联的页面图像。 可选地, 所述封页特征的特征值为封页形状、 颜色、 图案、 文字或手绘标记。 可选地, 所述页面图像在预存地址中的命名包括: 笔记本页面内包含的批注、 备注、 文 档说明、 页面标题、 以及笔记本页面中记录的添加到电子日历中的待办事项。 如上所述, 本发明提供一种获取纸质笔记本中内容的方法及装置, 具有以下有益效果:
1、 在把纸质笔记本电子化时, 确认每个笔记本的封页都具有不同于其它笔记本的封页 特征, 在把纸质笔记本电子化的过程中, 将具有自己特征的笔记本的封页与对应的多个笔记 本页面的内容存储在一个资料库中, 在以后想获得该笔记本的页面的内容, 只需要拍摄纸质 笔记本的封页, 便可自动获取与该封页对应的电子化后的笔记本中所有页面的内容。
2、 本发明既方便了笔记本的电子化文档管理, 也提高了获取电子化笔记本的内容的速 度。
3、 本发明自动获取纸质笔记本中内容的方法还具有简单、 容易操作的优势。 附图说明 图 1为本发明获取纸质笔记本中内容的方法的实施例一的整体流程图。 图 2为本发明获取纸质笔记本中内容的方法的实施例一中一种优选的流程图。 图 3为本发明获取纸质笔记本中内容的方法的实施例一中另一种优选的流程图。 图 4为本发明获取纸质笔记本中内容的装置的结构示意图。 元件标号说明
Figure imgf000005_0001
具体实施方式
以下通过特定的具体实例说明本发明的实施方式, 本领域技术人员可由本说明书所揭露 的内容轻易地了解本发明的其他优点与功效。 本发明还可以通过另外不同的具体实施方式加 以实施或应用, 本说明书中的各项细节也可以基于不同观点与应用, 在没有背离本发明的精 神下进行各种修饰或改变。 须知, 本说明书所附图式所绘示的结构、 比例、 大小等, 均仅用以配合说明书所揭示的 内容, 以供熟悉此技术的人士了解与阅读, 并非用以限定本发明可实施的限定条件, 故不具 技术上的实质意义, 任何结构的修饰、 比例关系的改变或大小的调整, 在不影响本发明所能 产生的功效及所能达成的目的下, 均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
本发明的发明人发现: 用户会使用多个笔记本, 这些笔记本可能是在不同时期使用的, 记录不同的内容。 但由于这些笔记本类型一致或者样式相同或接近, 扫描之后难以区分, 这 样一来, 当用户拿着一本过去曾经电子化过的笔记本, 却难以找到对应的电子化后的笔记 本。 因此, 本发明的发明人对现有技术进行了改进, 提出了一种获取纸质笔记本中内容的方 法及装置, 用于解决现有技术中难以快速准确找到所需的电子化后的笔记本的问题。 以下将 详细阐述本发明的一种获取纸质笔记本中内容的方法及装置的原理及实施方式, 使本领域技 术人员不需要创造性劳动即可理解本发明的一种获取纸质笔记本中内容的方法及装置。 第一实施例 图 1显示了本发明一种获取纸质笔记本中内容的方法的流程示意图。 如图 1所示, 所述获取纸质笔记本中内容的方法包括: 步骤 Sl, 拍摄待查找的笔记本的封页图像, 并撷取所述封页图像上的封页特征。 用户在使用 CamScanner等应用软件事先对笔记本的页面进行电子化。 可以利用带有图像摄取功能的电子设备 (例如: 相机, 带有拍照功能的手机、 平板电脑 等) 完成所述笔记本的拍摄。 由于图像的拍摄和撷取图像上特征值的已为本领域技术人员所 熟知的现有技术, 故在此不再赘述。 在本发明中, 为解决现有技术中的种种缺失, 本发明人创造性地设想出设置纸质笔记本 的封页, 使各笔记本的封页都具有区别于其它封页的特征值。 在本发明中, 所述封页特征具有特征值, 特征值可以为封页本身具有的封页形状、 颜 色、 图案、 文字或符号等, 也可以是打印或手绘设置在封页上的各类标记, 比如说在笔记本 的封页上写上笔记本开始使用的日期。 此外, 所述特征值也可以为条码, 例如: 二维码、 一维条码等。 在本实施例中, 所述特征值的位置可以设置在封页的任意位置, 例如, 封页的中心、 左 上角、 右上角、 左下角、 右下角等。 但应保证, 在拍摄封页图像时, 所述特征值应清晰显示 在图像中。 在本发明中, 所述特征并不局限于上述各类特征, 保证每个笔记本的封页都是有所区别 的各类特征都是可以的。 在这里, 所述笔记本为通俗说法, 但其涵盖的范围并不限于普通的笔记本, 还可以包括 其他的例如课件、 演讲文稿、 打印册子等。 步骤 S2, 根据撷取的封页特征在预置的资料库中查找是否具有与所述封页特征的特征 值相匹配的图像。 该预置的资料库用于存储同一个笔记本的封页及多个页面, 在本实施例中, 所述资料库 为一文件夹。 预置的资料库中预设有用于存储笔记本页面的若干预存地址, 一个预存地址存 储一个页面。 在本步骤中可能包括手写识别、 文字识别及图像匹配等技术。 但由于手写识别、 文字识 别、 以及判断两个图像是否相同的图像匹配已为本领域技术人员所熟知的现有技术, 故在此 不再赘述。 在资料库中查找已保存的笔记本的封页图像中是否存在与所拍摄的笔记本的封页图像相 同的封页图像。 也就是判断在已保存的笔记本的封页图像中是否存在与所拍摄的笔记本的封 页图像属于同一个纸质笔记本的封页图像。 在步骤 S2 中, 若资料库中具有与所述封页特征的特征值相匹配的图像, 则接着执行步 骤 S3, 否则结束本次查找。 步骤 S3, 若资料库中具有与所述封页特征的特征值相匹配的图像, 则获取与该图像相 关联的页面图像。 在本发明中, 由于在将纸质笔记本电子化的时候, 已经使每个笔记本的封页具有自己独 有的特征值, 所以在将所拍摄的笔记本的封页图像与已保存的笔记本的封页图像进行对比分 析的时候, 根据封页上的特征值, 可以将该封页图像区分于其它封页图像, 以快速找到该封 页图像。 在本步骤中, 无论在资料库中已保存的笔记本的封页图像中存不存在与所拍摄的笔记本 的封页图像相同的封页图像, 都应给出相应的提示。 由于同一个笔记本的封页与多个页面已经事先存储在同一个资料库中, 仅需找到该笔记 本的封页便可相应地找到该笔记本的多个页面。 这样, 不但可以准备找到所需的电子化的笔 记本, 也可以大大提高获取电子化笔记本的内容的速度。 实际使用中, 还可能存在这样的情况, 笔记本的多个页面已经被电子化存储, 现在使用 者在笔记本中又新记录了内容, 想把新记录的页面继续电子化存储到该笔记本的对应位置。 所以请参阅图 2, 在步骤 S2 中, 若资料库中具有与所述封页特征的特征值相匹配的图像, 还可以执行以下步骤: 步骤 S4, 拍摄所述纸质笔记本中一未被电子化过的页面图像。 步骤 S5, 将所述页面图像存储至所述资料库中分配的一预存地址中, 完成该页面的电 子化存储。 此外, 在步骤 S2 中, 若资料库中不存在与所述封页特征的特征值相匹配的图像, 则可 能该封页对应的笔记本可能从未被电子化存储过, 此时, 可以选择对该笔记本进行电子化存 储, 以便日后获取。 因此, 请参阅图 3, 若资料库中不存在与所述封页特征的特征值相匹配的图像时, 还可 以接着执行以下步骤: 步骤 S6, 依据该封页图像建置一资料库, 并于所述资料库中分配多个预存地址。 该资料库用于存储同一个笔记本的封页及多个页面, 在本实施例中, 所述资料库为一文 件夹。 预存地址用于对应存储页面, 一个预存地址存储一个页面。 所述页面图像在预存地址中的命名包括: 笔记本页面内包含的批注、 备注、 文档说明、 页面标题、 以及笔记本页面中记录的添加到电子日历中的待办事项。 所述页面图像的命名与页面包含的内容相对应, 这样在通过封页图像获取到页面图像 时, 可以方便快速地找到所需的页面。 步骤 S7, 拍摄所述纸质笔记本中一页面图像。 步骤 S8, 将所述页面图像存储至所述资料库中分配的一预存地址中。 经过步骤 S7和步 骤 S8, 完成纸质笔记本的一个页面的电子化存储。 重复上述步骤 S7 至步骤 S8, 直至完成 该笔记本所有需要存储的页面的电子化存储。 有此可知, 步骤 S6至步骤 S8是在待查找的电子化的笔记本实际不存在的情况, 新建立 纸质笔记本的电子化过程。 本发明的目的是快速准确找到所需的电子化后的笔记本。 所以在完成上述笔记本的电子 化存储之后, 在以后的使用中应只需要拍摄纸质笔记本的封页应可以自动获取这本笔记本中 所有已经电子化了的笔记本页面的内容。 需要说明的是, 若管理者疏忽, 导致封页特征值重复或在对图像对比分析的过程中, 不 能很好的识别相近的封页图像的特征值而导致的将相似的特征识别成一个特征, 这样, 就会 导致存在不属于同一个笔记本的页面图像也会被调出来, 所以在本发明中, 在有不属于同一 个笔记本的页面图像时, 应提供给使用者选择, 由使用者确定最终想调用哪些页面。 第二实施例 在本实施例中, 提供一种获取纸质笔记本中内容的装置。 图 4显示了本发明提供的一种 获取纸质笔记本中内容的装置的结构示意图。 如图 4所示, 获取纸质笔记本中内容的装置 1 包括: 图像摄取单元 11、 图像存储单元 12、 图像对比分析单元 13、 以及页面获取单元 14。 以下对上述各个单元进行详细描述。 图像摄取单元 11, 用于拍摄笔记本的封页图像以及所述笔记本的多个页面图像, 并撷 取所述封页图像上的封页特征。 用户在使用 CamScanner等应用软件来对笔记本的页面进行电子化的时候, 需要在保存 笔记本页面的电子化文档之前拍摄并保存笔记本的封页图像。 可以利用带有图像摄取功能的电子设备 (例如: 相机, 带有拍照功能的手机、 平板电脑 等) 完成所述笔记本的拍摄。 由于图像的拍摄已为本领域技术人员所熟知的现有技术, 故在 此不再赘述。 在实际应用中, 图像摄取单元 11可以是相机或智能手机的摄像头。 在本发明中, 为解决现有技术中的种种缺失, 本发明人创造性地设想出设置纸质笔记本 的封页, 使各笔记本的封页都具有区别于其它封页的特征值。 所述特征值可以为封页本身具有的封页形状、 颜色、 图案、 文字或符号等, 也可以是打 印或手绘设置在封页上的各类标记, 比如说在笔记本的封页上写上笔记本开始使用的日期。 此外, 所述特征值也可以为条码, 例如: 二维码、 一维条码等。 在本实施例中, 所述特征的位置可以设置在封页的任意位置, 例如, 封页的中心、 左上 角、 右上角、 左下角、 右下角等。 但应保证, 在拍摄封页图像时, 所述特征应清晰显示在图 像中。 在本发明中, 所述特征值并不局限于上述各类特征, 保证每个笔记本的封页都是有所区 别的各类特征都是可以的。 在这里, 所述笔记本为通俗说法, 但其涵盖的范围并不限于普通的笔记本, 还可以包括 其他的例如课件、 演讲文稿、 打印册子等。 图像存储单元 12, 依据所述封页图像上的封页特征预置有多个资料库, 每一个资料库 设有用于存储多个页面图像的多个预存地址。 在本实施例中, 所述页面图像在预存地址中的命名包括: 笔记本页面内包含的批注、 备 注、 文档说明、 页面标题、 以及笔记本页面中记录的添加到电子日历中的待办事项。 也可以 是使用者自定义的其它关联方式, 例如提取的页面中内容的关键词、 主题词等。 所述页面图像根据拍摄时间的先后依次存入对应的预存地址中。 在所述图像对比分析单元的对比分析中, 若判断在预置的资料库中具有多个与所述封页 特征的特征值相匹配的图像, 页面获取单元选择与该图像相关联的页面图像。 通过图像摄取单元 11和图像存储单元 12可以完成多个笔记本的电子化存储。 图像对比分析单元 13, 根据撷取的封页特征在预置的资料库中查找是否具有与所述封 页特征的特征值相匹配的图像。 也就是判断在资料库中已保存的笔记本的封页图像中是否存 在与所拍摄的笔记本的封页图像属于同一个纸质笔记本的封页图像。 图像对比分析单元 13 可能包括手写识别、 文字识别及图像匹配等技术。 但由于手写识 别、 文字识别、 以及判断两个图像是否相同的图像匹配已为本领域技术人员所熟知的现有技 术, 故在此不再赘述。 所述图像对比分析单元 13 输出对比分析的结果, 以提示在资料库中已保存的笔记本的 封页图像中是否存在与所拍摄的笔记本封页图像相同的封页图像。 在本步骤中, 无论在已保 存的笔记本的封页图像中存不存在与所拍摄的笔记本的封页图像相同的封页图像, 都应给出 相应的提示。 在本发明中, 由于在将纸质笔记本电子化的时候, 已经使每个笔记本的封页具有自己独 有的特征, 所以在将所拍摄的笔记本的封页图像与已保存的笔记本的封页图像进行对比分析 的时候, 根据封页上的特征, 可以将该封页区分于其它封页, 以快速找到该封页。 页面获取单元 14, 在资料库中具有与所述封页特征的特征值相匹配的图像时获取与该 图像相关联的页面图像。 也就是在资料库中的笔记本的封页图像存在与所拍摄的待查找笔记 本的封页图像相同的封页图像时获取该资料库中多个预存地址中存储的多个笔记本页面图 像。 由于同一个笔记本的封页与多个页面已经事先存储在同一个资料库中, 仅需找到该笔记 本的封页便可相应地找到该笔记本的多个页面。 这样, 不但可以准备找到所需的电子化的笔 记本, 也可以大大提高获取电子化笔记本的内容的速度。 需要说明的是, 若管理者疏忽, 导致封页特征重复或在对图像对比分析的过程中, 不能 很好的识别相近的图像而导致的将相似的特征识别成一个特征, 这样, 就会导致存在不属于 同一个笔记本的页面也会被调出来, 所以在本步骤中, 在有不属于同一个笔记本的页面时, 应提供给使用者选择, 由使用者确定最终想调用那些页面。 为使本领域技术人员进一步理解本发明的一种获取纸质笔记本中内容的装置 1, 以下将 说明本发明的装置的使用过程。 首先通过图像摄取单元 11 (例如手机摄像头) 获取笔记本的封页图像, 并撷取所述封 页图像上的封页特征; 然后所述图像对比分析单元 13 根据撷取的封页特征在预置的资料库 中查找是否具有与所述封页特征的特征值相匹配的图像; 若查找到, 获取与该图像相关联的 页面图像, 同时也可通过图像摄取单元 11和图像存储单元 12将该笔记本中未被电子化的页 面继续电子化存储到该图像所在的资料库中; 若未查找到, 则结束本次查找; 由于未查找到 的原因可能是该笔记本从未被电子化过, 所以在未查找到的情况下, 还可以通过图像摄取单 元 11和图像存储单元 12继续将该笔记本电子化。 页面继续电子化存储以及新笔记本的电子 化存储分别在步骤 S4〜步骤 S5以及步骤 S6〜步骤 S8中已经详细说明, 在此不再赘述。 综上所述, 本发明提供一种获取纸质笔记本中内容的方法及装置, 达到了以下有益效 果:
1、 在把纸质笔记本电子化时, 确认每个笔记本的封页都具有不同于其它笔记本的封页 特征, 在把纸质笔记本电子化的过程中, 将具有自己特征的笔记本的封页与对应的多个笔记 本页面的内容存储在一个资料库中, 在以后想获得该笔记本的页面的内容, 只需要拍摄纸质 笔记本的封页, 便可自动获取与该封页对应的电子化后的笔记本中所有页面的内容。
2、 本发明既方便了笔记本的电子化文档管理, 也提高了获取电子化笔记本的内容的速 度。
3、 本发明自动获取纸质笔记本中内容的方法还具有简单、 容易操作的优势。 上述实施例仅列示性说明本发明的原理及功效, 而非用于限制本发明。 任何熟悉此项技 术的人员均可在不违背本发明的精神及范围下, 对上述实施例进行修改。 因此, 本发明的权 利保护范围, 应如权利要求书所列。

Claims

权利要求书
1.一种获取纸质笔记本中内容的方法, 其特征在于, 包括以下步骤:
1 ) 拍摄待查找的笔记本的封页图像, 并撷取所述封页图像上的封页特征;
2) 根据撷取的封页特征在预置的资料库中查找是否具有与所述封页特征的特征值 相匹配的图像;
3) 若有, 则获取与该图像相关联的页面图像; 若无, 则结束本次查找。
2.根据权利要求 1所述的获取纸质笔记本中内容的方法, 其特征在于, 在步骤 3) 中, 若有, 接着执行以下步骤:
4) 拍摄所述纸质笔记本中一未被电子化过的页面图像;
5) 将所述页面图像存储至所述资料库中分配的一预存地址中, 重复上述步骤 4) 至步骤 5), 直至完成该笔记本中未被电子化过的页面的电子化存储。
3.根据权利要求 1所述的获取纸质笔记本中内容的方法, 其特征在于, 在步骤 3) 中, 若无, 接着执行以下步骤:
6) 依据该封页图像建置一资料库, 并于所述资料库中分配多个预存地址;
7) 拍摄所述纸质笔记本中一页面图像;
8) 将所述页面图像存储至所述资料库中分配的一预存地址中, 重复上述步骤 7) 至步骤 8), 直至完成该笔记本的电子化存储。
4.根据权利要求 3所述的获取纸质笔记本中内容的方法, 其特征在于, 所述页面图像在 预存地址中的命名包括: 笔记本页面内包含的批注、 备注、 文档说明、 页面标题、 以及笔记 本页面中记录的添加到电子日历中的待办事项。
5.根据权利要求 1所述的获取纸质笔记本中内容的方法, 其特征在于, 所述封页特征的 特征值为封页形状、 颜色、 图案、 文字或手绘标记。
6.—种获取纸质笔记本中内容的装置, 其特征在于, 包括:
图像摄取单元, 拍摄笔记本的封页图像以及所述笔记本的多个页面图像, 并撷取所述封 页图像上的封页特征;
图像存储单元, 依据所述封页图像上的封页特征预置有多个资料库, 每一个资料库设有 用于存储多个页面图像的多个预存地址;
图像对比分析单元, 根据撷取的封页特征在预置的资料库中查找是否具有与所述封页特 征的特征值相匹配的图像;
页面获取单元, 在资料库中具有与所述封页特征的特征值相匹配的图像时获取与该图像 相关联的页面图像。
7.根据权利要求 6所述的获取纸质笔记本中内容的装置, 其特征在于, 在所述图像存储 单元中, 所述页面图像根据拍摄时间的先后依次存入对应的预存地址中。
8.根据权利要求 6所述的获取纸质笔记本中内容的装置, 其特征在于, 在所述图像对比 分析单元的对比分析中, 若判断在预置的资料库中具有多个与所述封页特征的特征值相匹配 的图像, 页面获取单元选择与该图像相关联的页面图像。
9.根据权利要求 6所述的获取纸质笔记本中内容的装置, 其特征在于, 所述封页特征的 特征值为封页形状、 颜色、 图案、 文字或手绘标记。
10.根据权利要求 6所述的获取纸质笔记本中内容的装置, 其特征在于, 所述页面图像 在预存地址中的命名包括: 笔记本页面内包含的批注、 备注、 文档说明、 页面标题、 以及笔 记本页面中记录的添加到电子日历中的待办事项。
PCT/CN2013/087750 2012-11-28 2013-11-25 获取纸质笔记本中内容的方法及装置 WO2014082551A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210496657.2 2012-11-28
CN201210496657.2A CN102945377B (zh) 2012-11-28 2012-11-28 获取纸质笔记本中内容的方法及装置

Publications (1)

Publication Number Publication Date
WO2014082551A1 true WO2014082551A1 (zh) 2014-06-05

Family

ID=47728316

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/087750 WO2014082551A1 (zh) 2012-11-28 2013-11-25 获取纸质笔记本中内容的方法及装置

Country Status (2)

Country Link
CN (1) CN102945377B (zh)
WO (1) WO2014082551A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102945377B (zh) * 2012-11-28 2016-06-08 上海合合信息科技发展有限公司 获取纸质笔记本中内容的方法及装置
CN103869930B (zh) * 2014-03-07 2017-07-25 联想(北京)有限公司 一种信息处理方法及电子设备
CN104166851B (zh) * 2014-08-25 2018-01-23 盛静浩 一种纸质教材的多媒体互动式学习系统及方法
CN105069293B (zh) * 2015-08-07 2017-11-10 宋声台 一种信息录入终端的方法和智能笔记本
CN105631396A (zh) * 2015-11-13 2016-06-01 东莞酷派软件技术有限公司 一种获取文件电子档的方法及装置
CN107015977A (zh) * 2016-01-27 2017-08-04 肖翩 一种智能辅导系统
CN105956098B (zh) * 2016-05-03 2019-04-12 华中师范大学 一种纸质印刷品与电子资源的关联方法及系统
WO2018010090A1 (zh) * 2016-07-12 2018-01-18 程抒一 针对纸质笔记本的分类存储的方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763384A (zh) * 2008-12-25 2010-06-30 新奥特硅谷视频技术有限责任公司 一种上传扫描文件的方法和装置
CN102324044A (zh) * 2011-09-09 2012-01-18 上海合合信息科技发展有限公司 卡片信息获取方法及系统
CN102945377A (zh) * 2012-11-28 2013-02-27 上海合合信息科技发展有限公司 获取纸质笔记本中内容的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419817A (zh) * 2010-09-27 2012-04-18 贵州黔驰电力信息技术有限公司 一种基于智能图像识别的自动文档扫描分析处理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763384A (zh) * 2008-12-25 2010-06-30 新奥特硅谷视频技术有限责任公司 一种上传扫描文件的方法和装置
CN102324044A (zh) * 2011-09-09 2012-01-18 上海合合信息科技发展有限公司 卡片信息获取方法及系统
CN102945377A (zh) * 2012-11-28 2013-02-27 上海合合信息科技发展有限公司 获取纸质笔记本中内容的方法及装置

Also Published As

Publication number Publication date
CN102945377A (zh) 2013-02-27
CN102945377B (zh) 2016-06-08

Similar Documents

Publication Publication Date Title
WO2014082551A1 (zh) 获取纸质笔记本中内容的方法及装置
WO2017129018A1 (zh) 一种图片处理方法、装置和智能终端
US20180365489A1 (en) Automatically organizing images
US20210209174A1 (en) Intelligently identifying and presenting digital documents
WO2014086279A1 (zh) 方便电子化的专业笔记本及其电子化文档的自动分类方法
WO2016101757A1 (zh) 一种基于移动设备的图片处理方法和装置
WO2014086287A1 (zh) 文本图像自动切分方法及装置,自动切分手写条目的方法
WO2014082528A1 (zh) 自动查找纸质笔记本中页面的方法及装置
JP2007041987A (ja) 画像処理装置および方法、並びにプログラム
WO2014086277A1 (zh) 方便电子化的专业笔记本及其页码自动识别方法
US8467613B2 (en) Automatic retrieval of object interaction relationships
US10136011B2 (en) Automatic scanning of document stack with a camera
WO2014086272A1 (zh) 方便电子化的专业笔记本及其添加到电子日历中的方法
CN106407358B (zh) 一种图像搜索方法、装置及移动终端
JP2006235910A (ja) 写真画像検索装置、写真画像検索方法、記録媒体、およびプログラム
US20110055157A1 (en) System, apparatus, and method with automatic file copying function
US20100125780A1 (en) Electronic device with annotation function and method thereof
US20170046350A1 (en) Media organization
WO2014086266A1 (zh) 一种方便电子化的专业笔记本及其电子缩略图显示方法
JP2009224919A (ja) 携帯通信端末
TW201142622A (en) System and method for sorting pictures
JP2008205963A (ja) 情報処理端末装置、そのデータ保存方法及びプログラム
JP2007183858A (ja) 画像検索システム、画像検索装置、及び、コンピュータプログラム
JP5971003B2 (ja) 情報処理装置及びプログラム
JP6439738B2 (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13858830

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13858830

Country of ref document: EP

Kind code of ref document: A1