CN100351839C - 文档检索·阅览方法以及文档检索·阅览装置 - Google Patents

文档检索·阅览方法以及文档检索·阅览装置 Download PDF

Info

Publication number
CN100351839C
CN100351839C CNB2004100048717A CN200410004871A CN100351839C CN 100351839 C CN100351839 C CN 100351839C CN B2004100048717 A CNB2004100048717 A CN B2004100048717A CN 200410004871 A CN200410004871 A CN 200410004871A CN 100351839 C CN100351839 C CN 100351839C
Authority
CN
China
Prior art keywords
mentioned
document
data
ocr
colour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100048717A
Other languages
English (en)
Chinese (zh)
Other versions
CN1612154A (zh
Inventor
永崎健
丸川胜美
竹内沙弥香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN1612154A publication Critical patent/CN1612154A/zh
Application granted granted Critical
Publication of CN100351839C publication Critical patent/CN100351839C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)
CNB2004100048717A 2003-10-29 2004-02-10 文档检索·阅览方法以及文档检索·阅览装置 Expired - Fee Related CN100351839C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP368304/2003 2003-10-29
JP2003368304A JP4461769B2 (ja) 2003-10-29 2003-10-29 文書検索・閲覧手法及び文書検索・閲覧装置

Publications (2)

Publication Number Publication Date
CN1612154A CN1612154A (zh) 2005-05-04
CN100351839C true CN100351839C (zh) 2007-11-28

Family

ID=34646007

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100048717A Expired - Fee Related CN100351839C (zh) 2003-10-29 2004-02-10 文档检索·阅览方法以及文档检索·阅览装置

Country Status (2)

Country Link
JP (1) JP4461769B2 (enExample)
CN (1) CN100351839C (enExample)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058605A (ja) 2005-08-24 2007-03-08 Ricoh Co Ltd 文書管理システム
JP4909576B2 (ja) 2005-11-29 2012-04-04 株式会社リコー 文書編集装置、画像形成装置およびプログラム
WO2007094078A1 (ja) * 2006-02-14 2007-08-23 Hitachi, Ltd. 文字列検索方法およびその装置
JP2008070831A (ja) * 2006-09-15 2008-03-27 Ricoh Co Ltd 文書表示装置及び文書表示プログラム
US8726178B2 (en) 2006-11-10 2014-05-13 Ricoh Company, Ltd. Device, method, and computer program product for information retrieval
CN101226596B (zh) 2007-01-15 2012-02-01 夏普株式会社 文档图像处理装置以及文档图像处理方法
CN101226595B (zh) * 2007-01-15 2012-05-23 夏普株式会社 文档图像处理装置以及文档图像处理方法
US8261200B2 (en) * 2007-04-26 2012-09-04 Fuji Xerox Co., Ltd. Increasing retrieval performance of images by providing relevance feedback on word images contained in the images
JP2008310525A (ja) * 2007-06-13 2008-12-25 Canon Inc 情報処理装置、情報処理方法、及び、情報処理プログラム
JP5134383B2 (ja) * 2008-01-29 2013-01-30 株式会社日立製作所 Ocr装置、証跡管理装置及び証跡管理システム
CN102637159B (zh) * 2011-02-11 2014-12-10 汉王科技股份有限公司 文档显示方法及装置
CN102750541B (zh) * 2011-04-22 2015-07-08 北京文通科技有限公司 一种文档图像分类识别方法及装置
JP2013130997A (ja) * 2011-12-21 2013-07-04 Kyocera Document Solutions Inc 画像形成装置
JP6174466B2 (ja) * 2013-11-22 2017-08-02 日立オムロンターミナルソリューションズ株式会社 帳票認識装置、帳票認識方法、及びプログラム
CN105608131A (zh) * 2015-12-17 2016-05-25 山东尚德软件股份有限公司 一种档案信息检索及利用电子化的实现方法
CN107180039A (zh) * 2016-03-09 2017-09-19 腾讯科技(深圳)有限公司 一种基于图片的文字信息识别方法及装置
CN105956098B (zh) * 2016-05-03 2019-04-12 华中师范大学 一种纸质印刷品与电子资源的关联方法及系统
JP6579331B2 (ja) * 2016-07-28 2019-09-25 京セラドキュメントソリューションズ株式会社 画像形成装置、文書電子化プログラムおよび文書電子化方法
CN107291949B (zh) * 2017-07-17 2020-11-13 绿湾网络科技有限公司 信息搜索方法及装置
CN109389114B (zh) * 2017-08-08 2021-12-03 富士通株式会社 文本行获取装置和方法
JP7003577B2 (ja) * 2017-10-31 2022-01-20 京セラドキュメントソリューションズ株式会社 文書管理システム及び文書管理方法
JP6996234B2 (ja) * 2017-10-31 2022-01-17 京セラドキュメントソリューションズ株式会社 文書管理システム及び文書管理方法
WO2020071252A1 (ja) * 2018-10-04 2020-04-09 昭和電工株式会社 文書検索装置、文書検索プログラム、文書検索方法
CN113474767B (zh) * 2019-02-14 2023-09-01 株式会社力森诺科 文件检索装置、文件检索系统、文件检索程序及文件检索方法
CN111027080B (zh) * 2019-11-26 2021-11-19 中国人民解放军战略支援部队信息工程大学 基于ooxml复合文档源文件数据区位置排列次序的信息隐藏方法及系统
JP7404943B2 (ja) * 2020-03-10 2023-12-26 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
US20230144394A1 (en) * 2020-05-01 2023-05-11 3M Innovative Properties Company Systems and methods for managing digital notes
JP7543788B2 (ja) * 2020-08-31 2024-09-03 株式会社リコー 表示装置、入力方法、プログラム
CN112115892A (zh) * 2020-09-24 2020-12-22 科大讯飞股份有限公司 一种关键要素抽取方法、装置、设备及存储介质
CN113254396B (zh) * 2021-06-23 2021-09-24 昌和云科技有限公司 一种多部门的案件协同管理系统
JP7705573B1 (ja) * 2025-02-04 2025-07-09 株式会社博報堂メディカル 校正支援システム、校正支援方法、校正支援プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1153356A (zh) * 1995-11-10 1997-07-02 富士通株式会社 以格阵作关键字的字典检索装置和方法
JPH09319824A (ja) * 1996-05-30 1997-12-12 Hitachi Ltd 帳票認識方法
JPH1074250A (ja) * 1996-06-26 1998-03-17 Fuji Xerox Co Ltd 文書処理装置、文書処理方法、および記憶媒体
JP2000172779A (ja) * 1998-12-03 2000-06-23 Toshiba Corp Ocrシステム及び同システムに適用する読取制御情報の作成方法
JP2001014311A (ja) * 1999-07-01 2001-01-19 Hitachi Ltd 地名表現方法、地名文字列認識方法及び装置
US20010024520A1 (en) * 2000-03-15 2001-09-27 Ricoh Company, Limited Method and apparatus for table recognition, apparatus for character recognition, and computer product

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1153356A (zh) * 1995-11-10 1997-07-02 富士通株式会社 以格阵作关键字的字典检索装置和方法
JPH09319824A (ja) * 1996-05-30 1997-12-12 Hitachi Ltd 帳票認識方法
JPH1074250A (ja) * 1996-06-26 1998-03-17 Fuji Xerox Co Ltd 文書処理装置、文書処理方法、および記憶媒体
JP2000172779A (ja) * 1998-12-03 2000-06-23 Toshiba Corp Ocrシステム及び同システムに適用する読取制御情報の作成方法
JP2001014311A (ja) * 1999-07-01 2001-01-19 Hitachi Ltd 地名表現方法、地名文字列認識方法及び装置
US20010024520A1 (en) * 2000-03-15 2001-09-27 Ricoh Company, Limited Method and apparatus for table recognition, apparatus for character recognition, and computer product

Also Published As

Publication number Publication date
JP2005135041A (ja) 2005-05-26
JP4461769B2 (ja) 2010-05-12
CN1612154A (zh) 2005-05-04

Similar Documents

Publication Publication Date Title
CN100351839C (zh) 文档检索·阅览方法以及文档检索·阅览装置
CN112633431B (zh) 一种基于crnn和ctc的藏汉双语场景文字识别方法
US5860075A (en) Document data filing apparatus for generating visual attribute values of document data to be filed
US9092423B2 (en) Retrieving electronic documents by converting them to synthetic text
US8285047B2 (en) Automated method and system for naming documents from a scanned source based on manually marked text
JP5181886B2 (ja) 電子書類の検索方法、検索システム及びコンピュータプログラム
US20070035780A1 (en) System and method for defining characteristic data of a scanned document
US20110197121A1 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
US8494280B2 (en) Automated method for extracting highlighted regions in scanned source
US20140245119A1 (en) Automatic Creation of Multiple Rows in a Table
Baek et al. Coo: Comic onomatopoeia dataset for recognizing arbitrary or truncated texts
CN1838113A (zh) 翻译处理方法、文档翻译装置和程序
CN100351849C (zh) 字符识别装置和字符识别方法
Wang et al. An open dataset for oracle bone character recognition and decipherment
Shihab et al. Badlad: A large multi-domain bengali document layout analysis dataset
US10261987B1 (en) Pre-processing E-book in scanned format
CN1147807C (zh) 名片自动识别方法与系统
CN116129446A (zh) 基于深度学习的手写中文字体识别方法
JP4807618B2 (ja) 画像処理装置及び画像処理プログラム
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
Kumar et al. Line based robust script identification for indianlanguages
JP2008108114A (ja) 文書処理装置および文書処理方法
AU2010291063A1 (en) Method and apparatus for segmenting images
Li et al. Thai scene text recognition with character combination
CN112101356A (zh) 一种图片中特定文本的定位方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071128

Termination date: 20150210

EXPY Termination of patent right or utility model