CN102833449A - 一种基于多功能机的文档自动处理方法 - Google Patents

一种基于多功能机的文档自动处理方法 Download PDF

Info

Publication number
CN102833449A
CN102833449A CN2012102648490A CN201210264849A CN102833449A CN 102833449 A CN102833449 A CN 102833449A CN 2012102648490 A CN2012102648490 A CN 2012102648490A CN 201210264849 A CN201210264849 A CN 201210264849A CN 102833449 A CN102833449 A CN 102833449A
Authority
CN
China
Prior art keywords
file
role aircraft
multi role
server
phonetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102648490A
Other languages
English (en)
Other versions
CN102833449B (zh
Inventor
安方确
王凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji film industry development (Shanghai) Co.,Ltd.
Original Assignee
Fuji Xerox Industry Development China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Industry Development China Co Ltd filed Critical Fuji Xerox Industry Development China Co Ltd
Priority to CN201210264849.0A priority Critical patent/CN102833449B/zh
Publication of CN102833449A publication Critical patent/CN102833449A/zh
Application granted granted Critical
Publication of CN102833449B publication Critical patent/CN102833449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Facsimiles In General (AREA)

Abstract

本发明公开了一种基于多功能机的文档自动处理方法,所述的多功能机是指具有扫描、复印和打印功能的机器,包括步骤:使用者在所述多功能机上,将纸质文稿扫描输入该多功能机生成图像格式的第一电子文件;所述多功能机将所述的第一电子文件传送至服务器,并对服务器发出处理服务请求;所述服务器对所述第一电子文件内容进行OCR识别处理,识别出该第一电子文件中的文字内容,并记录文字的位置;所述服务器根据接收的处理服务请求类别指示完成对所述第一电子文件相应的处理服务;所述服务器将处理完成生成的图像格式的第二电子文件发送回所述多功能机,该多功能机将该第二电子文件打印到纸上并输出。

Description

一种基于多功能机的文档自动处理方法
技术领域
本发明属于办公自动化技术领域,特别涉及一种基于多功能机的文档自动处理方法。
背景技术
用电脑处理电子文档是很普遍的技术,运用软件在电脑上对电子文档还能实现各种要求和形式的自动处理。但是在很多场合,仍然非常需要能够对纸质文稿的文字进行某种要求的自动处理,而现有技术中,还不存在这样的自动处理系统。
发明内容
本发明的目的是提供一种基于多功能机的文档自动处理方法,以解决纸质文稿的文字自动处理问题。
本发明的技术方案是,一种基于多功能机的文档自动处理方法,所述的多功能机是指具有扫描、复印和打印功能的机器,包括以下步骤:
使用者在所述多功能机上,将纸质文稿扫描输入该多功能机生成图像格式的第一电子文件;
所述多功能机将所述的第一电子文件传送至服务器,并对服务器发出处理服务请求;
所述服务器对所述第一电子文件内容进行OCR识别处理,识别出该第一电子文件中的文字内容,并记录文字的位置;
所述服务器根据接收的处理服务请求类别指示完成对所述第一电子文件相应的处理服务;
所述服务器将处理完成生成的图像格式的第二电子文件发送回所述多功能机,该多功能机将该第二电子文件打印到纸上并输出。
所述方法进一步包括以下步骤:
使用者在所述多功能机的操作面板上选择拼音自动标注服务,启动多功能机的扫描功能,将纸质文稿内容扫描到多功能机中;
所述多功能机将纸质文稿的扫描内容转化为图像格式,并保存为第一电子文件;
所述多功能机将第一电子文件通过互联网或局域网传送到外置服务器,并对服务器发出拼音标注服务请求;
所述外置服务器端的拼音标注程序启动利用第三方OCR引擎实现的文字识别程序,将接收到的第一电子文件输入到文字识别程序进行OCR处理;
所述文字识别程序识别出图像格式的电子文件中的文字内容并获取各个文字在二维平面上的坐标,文字的大小信息,并将其作为一组,存入预先设计好的数据结构容器中并返回,数据结构容器包含文字-大小-位置-拼音为单位的多组数据;
所述的拼音标注程序启动利用第三方技术实现的拼音识别程序,将数据结构容器输入到拼音识别程序进行拼音识别处理;
所述的拼音识别程序将数据结构容器中数据组按存入先后顺序取出,根据数据组中的位置信息计算出识别并获取各个文字所对应的拼音,并将拼音存入数据结构容器中并返回;
所述拼音标注程序打开第一电子文件,将该第一电子文件的原始内容转换成水印格式;
所述拼音标注程序打开第一电子文件,将数据结构容器中的数据组按顺序取出,根据数据组中的文字大小和坐标信息计算出新的坐标,并将拼音插入图像中的相应位置,重复处理直至所有的数据组中的信息全部的得到处理,最后将处理结果保存为图像格式的第二电子文件;
所述拼音标注程序将第二电子文件发送回多功能机;
所述多功能机将第二电子文件打印到纸上并输出。
本发明利用服务器所提供的检索转换功能(例如发音标注功能)服务,结合具有扫描打印复印等功能的多功能复印机,将多功能机的扫描打印服务器通信功能和服务器端提供的数据处理服务相结合,实现对纸质文稿进行包括发音标注功能的文档内容自动加工,帮助学习中文的用户在中文文稿上自动标注拼音。
附图说明
图1是本发明系统组成示意图
图2是本发明一实施例中方法步骤流程图
具体实施方式
图1是本发明的系统组成示意图。结合图2所示,根据图2的模块组成,本发明的基于多功能机的文档自动处理实现步骤为:
1,将纸质的文稿,放到多功能机的扫描板上,在多功能操作面板上选择拼音自动标注服务,启动多功能机的扫描功能,将文稿内容扫描到多功能机中。
2,多功能机将扫描内容转化为特定的图像格式(例如,Docuworks或PDF),并保存为电子文件。
3,多功能机将图像文件通过互联网或局域网传送到外置服务器,并对服务器发出拼音标注服务请求。
4,服务器端拼音标注程序启动利用第三方OCR引擎实现的文字识别程序,将接收到的图像文件输入到文字识别程序进行OCR处理。
5,文字识别程序识别出图像文件中的文字内容并获取各个文字在二维平面上的坐标,文字的大小信息,并将其作为一组,存入实现设计好的数据结构容器中并返回。数据结构容器包含文字-大小-位置-拼音为单位的多组数据。
6,拼音标注程序启动利用第三方技术实现的拼音识别程序,将数据结构容器输入到拼音识别程序进行拼音识别处理。
7,拼音识别程序将数据结构容器中数据组按存入先后顺序(以下简称顺序)取出。根据数据组中的位置信息计算出识别并获取各个文字所对应的拼音,并将拼音存入数据结构容器中并返回。
8,拼音标注程序打开图像文件,将图像文件的原始内容转换成水印格式。
9,拼音标注程序打开图像文件,将数据结构容器中的数据组按顺序取出,根据数据组中的文字大小和坐标信息计算出新的坐标(例如原来坐标的正上方),并将拼音插入图像中的相应位置。重复以上处理,直至所有的数据组中的信息全部的得到处理。最后将图像文件重新保存。
10,拼音标注程序将图像文件发送回多功能机。
11,多功能机将图像文件打印到纸上并输出。

Claims (2)

1.一种基于多功能机的文档自动处理方法,所述的多功能机是指具有扫描、复印和打印功能的机器,其特征在于,包括以下步骤:
使用者在所述多功能机上,将纸质文稿扫描输入该多功能机生成图像格式的第一电子文件;
所述多功能机将所述的第一电子文件传送至服务器,并对服务器发出处理服务请求;
所述服务器对所述第一电子文件内容进行OCR识别处理,识别出该第一电子文件中的文字内容,并记录文字的位置;
所述服务器根据接收的处理服务请求类别指示完成对所述第一电子文件相应的处理服务;
所述服务器将处理完成生成的图像格式的第二电子文件发送回所述多功能机,该多功能机将该第二电子文件打印到纸上并输出。
2.如权利要求1所述的基于多功能机的文档自动处理方法,其特征在于,所述方法进一步包括以下步骤:
使用者在所述多功能机的操作面板上选择拼音自动标注服务,启动多功能机的扫描功能,将纸质文稿内容扫描到多功能机中;
所述多功能机将纸质文稿的扫描内容转化为图像格式,并保存为第一电子文件;
所述多功能机将第一电子文件通过互联网或局域网传送到外置服务器,并对服务器发出拼音标注服务请求;
所述外置服务器端的拼音标注程序启动利用第三方OCR引擎实现的文字识别程序,将接收到的第一电子文件输入到文字识别程序进行OCR处理;
所述文字识别程序识别出图像格式的电子文件中的文字内容并获取各个文字在二维平面上的坐标,文字的大小信息,并将其作为一组,存入预先设计好的数据结构容器中并返回,数据结构容器包含文字-大小位置拼音为单位的多组数据;
所述的拼音标注程序启动利用第三方技术实现的拼音识别程序,将数据结构容器输入到拼音识别程序进行拼音识别处理;
所述的拼音识别程序将数据结构容器中数据组按存入先后顺序取出,根据数据组中的位置信息计算出识别并获取各个文字所对应的拼音,并将拼音存入数据结构容器中并返回;
所述拼音标注程序打开第一电子文件,将该第一电子文件的原始内容转换成水印格式;
所述拼音标注程序打开第一电子文件,将数据结构容器中的数据组按顺序取出,根据数据组中的文字大小和坐标信息计算出新的坐标,并将拼音插入图像中的相应位置,重复处理直至所有的数据组中的信息全部的得到处理,最后将处理结果保存为图像格式的第二电子文件;
所述拼音标注程序将第二电子文件发送回多功能机;
所述多功能机将第二电子文件打印到纸上并输出。
CN201210264849.0A 2012-07-27 2012-07-27 一种基于多功能机的文档自动处理方法 Active CN102833449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210264849.0A CN102833449B (zh) 2012-07-27 2012-07-27 一种基于多功能机的文档自动处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210264849.0A CN102833449B (zh) 2012-07-27 2012-07-27 一种基于多功能机的文档自动处理方法

Publications (2)

Publication Number Publication Date
CN102833449A true CN102833449A (zh) 2012-12-19
CN102833449B CN102833449B (zh) 2015-06-10

Family

ID=47336409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210264849.0A Active CN102833449B (zh) 2012-07-27 2012-07-27 一种基于多功能机的文档自动处理方法

Country Status (1)

Country Link
CN (1) CN102833449B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103973692A (zh) * 2014-05-13 2014-08-06 浙江大学 基于虚拟打印的电子档案自动采集系统及采集方法
CN108182432A (zh) * 2017-12-28 2018-06-19 北京百度网讯科技有限公司 信息处理方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1838112A (zh) * 2005-03-22 2006-09-27 富士施乐株式会社 翻译装置、翻译方法及存储介质
CN101231635A (zh) * 2007-01-26 2008-07-30 黑龙江大学 嵌入式掌上外文辅助解读器及其使用方法和用途
CN101282395A (zh) * 2007-04-06 2008-10-08 夏普株式会社 图像处理系统及图像处理方法
CN101872344A (zh) * 2009-04-27 2010-10-27 上海百测电气有限公司 一种图像扫描的控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1838112A (zh) * 2005-03-22 2006-09-27 富士施乐株式会社 翻译装置、翻译方法及存储介质
CN101231635A (zh) * 2007-01-26 2008-07-30 黑龙江大学 嵌入式掌上外文辅助解读器及其使用方法和用途
CN101282395A (zh) * 2007-04-06 2008-10-08 夏普株式会社 图像处理系统及图像处理方法
CN101872344A (zh) * 2009-04-27 2010-10-27 上海百测电气有限公司 一种图像扫描的控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
代晓东: "中文文本文件的自动拼音标注", 《软件世界》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103973692A (zh) * 2014-05-13 2014-08-06 浙江大学 基于虚拟打印的电子档案自动采集系统及采集方法
CN103973692B (zh) * 2014-05-13 2018-09-14 浙江大学 基于虚拟打印的电子档案自动采集系统及采集方法
CN108182432A (zh) * 2017-12-28 2018-06-19 北京百度网讯科技有限公司 信息处理方法和装置
US10963760B2 (en) 2017-12-28 2021-03-30 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for processing information

Also Published As

Publication number Publication date
CN102833449B (zh) 2015-06-10

Similar Documents

Publication Publication Date Title
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
US8131081B2 (en) Image processing apparatus, and computer program product
US8892995B2 (en) Method and system for specialty imaging effect generation using multiple layers in documents
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
US10528679B2 (en) System and method for real time translation
US8184908B2 (en) Image processing system, image processing method, and program
US20040052433A1 (en) Information research initiated from a scanned image media
CN104869267A (zh) 图像复制方法、以及使用该图像复制方法的多功能一体机
JP2008059157A (ja) 書類確認支援システム、書類確認支援装置およびプログラム
JP2020101843A (ja) 画像処理システム、画像処理方法、画像処理装置
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
JP2020184276A (ja) 画像処理装置、画像処理方法、及びプログラム
JP5315075B2 (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
US7783111B2 (en) Writing image acquisition apparatus, writing information extraction method, and storage medium
CN102833449B (zh) 一种基于多功能机的文档自动处理方法
CN1459073A (zh) 识别并处理数字图像中的命令的方法和装置,其中用户通过例如将其环绕而标记命令
US9542140B2 (en) Systems and methods for editing documents
US10165149B2 (en) Methods and systems for automatically generating a name for an electronic document
JP2020025218A (ja) 画像処理装置及び画像処理プログラム
US20210319273A1 (en) Information processing apparatus, non-transitory computer readable medium, and character recognition system
JP2022144740A (ja) Ocr対象領域位置取得システム、ocr対象領域位置取得プログラム、文書実物、文書実物生成システムおよび文書実物生成プログラム
JP2007299321A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体
JP2024032186A (ja) 画像処理装置、画像処理装置の制御方法、及びプログラム
JP2023087357A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2024034740A (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: 200131 Shanghai City, Pudong New Area Waigaoqiao Free Trade Zone, Beijing Road No. 79

Applicant after: Fuji Xerox Industrial Development (China) Co., Ltd.

Address before: 200131 Shanghai City, Pudong New Area Waigaoqiao Free Trade Zone, Beijing Road No. 79

Applicant before: Fuji Xerox Industrial Development (Shanghai) Co., Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: FUJI XEROX INDUSTRIAL DEVELOPMENT (SHANGHAI) CO., LTD. TO: FUJI XEROX INDUSTRIAL DEVELOPMENT (CHINA) CO., LTD.

C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: 200131 unit D, 8th floor, No. 79, rijing Road, Pudong New Area pilot Free Trade Zone, Shanghai

Patentee after: Fuji film industry development (Shanghai) Co.,Ltd.

Address before: No. 79, rijing Road, Waigaoqiao Free Trade Zone, Pudong New Area, Shanghai 200131

Patentee before: FUJI XEROX INDUSTRIAL DEVELOPMENT (CHINA) Co.,Ltd.

CP03 Change of name, title or address