JP2011141677A5 - - Google Patents

Download PDF

Info

Publication number
JP2011141677A5
JP2011141677A5 JP2010001426A JP2010001426A JP2011141677A5 JP 2011141677 A5 JP2011141677 A5 JP 2011141677A5 JP 2010001426 A JP2010001426 A JP 2010001426A JP 2010001426 A JP2010001426 A JP 2010001426A JP 2011141677 A5 JP2011141677 A5 JP 2011141677A5
Authority
JP
Japan
Prior art keywords
sheet
editing
generating
document
area data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010001426A
Other languages
English (en)
Other versions
JP2011141677A (ja
JP5465015B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from JP2010001426A external-priority patent/JP5465015B2/ja
Priority to JP2010001426A priority Critical patent/JP5465015B2/ja
Priority to US12/980,678 priority patent/US8718364B2/en
Priority to EP11150261.3A priority patent/EP2343670B1/en
Priority to KR1020110001492A priority patent/KR101334483B1/ko
Priority to CN201110008963.2A priority patent/CN102117269B/zh
Publication of JP2011141677A publication Critical patent/JP2011141677A/ja
Publication of JP2011141677A5 publication Critical patent/JP2011141677A5/ja
Publication of JP5465015B2 publication Critical patent/JP5465015B2/ja
Application granted granted Critical
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明に係る装置は、表を含む文書の画像データからオブジェクト毎の領域データを抽出する領域抽出手段と、前記抽出された領域データのうち表オブジェクトに関する領域データを解析し、表オブジェクトそれぞれの表構造情報を抽出する表構造解析手段と、前記オブジェクト毎の領域データと前記表構造情報とを用いて、前記文書におけるオブジェクトのレイアウトを再現するための表示用シート及び表の編集をするための表毎の編集用シートを生成するシート生成手段であって、前記編集用シート上の表を参照する描画オブジェクトを生成して、前記描画オブジェクトが記された表示用シートを生成する、シート生成手段と、前記表示用シートと前記編集用シートとを関連付けた電子文書を生成する電子文書生成手段と、を備え、前記表示用シート上の描画オブジェクトは、前記編集用シート上の表が編集されると、当該編集後の内容に更新される、ことを特徴とする。

Claims (7)

  1. 表を含む文書の画像データからオブジェクト毎の領域データを抽出する領域抽出手段と、
    前記抽出された領域データのうち表オブジェクトに関する領域データを解析し、表オブジェクトそれぞれの表構造情報を抽出する表構造解析手段と、
    前記オブジェクト毎の領域データと前記表構造情報とを用いて、前記文書におけるオブジェクトのレイアウトを再現するための表示用シート及び表の編集をするための表毎の編集用シートを生成するシート生成手段であって、前記編集用シート上の表を参照する描画オブジェクトを生成して、前記描画オブジェクトが記された表示用シートを生成する、シート生成手段と、
    前記表示用シートと前記編集用シートとを関連付けた電子文書を生成する電子文書生成手段と、
    を備え、
    前記表示用シート上の描画オブジェクトは、前記編集用シート上の表が編集されると、当該編集後の内容に更新される、
    ことを特徴とする装置。
  2. 前記シート生成手段は、所定の生成条件を満たすかどうかによって前記編集用シートを生成するかどうかを判断する判断手段をさらに有することを特徴とする請求項1に記載の装置。
  3. 前記所定の生成条件は、前記文書に対する表の傾き、セルの背景の色、表と他のオブジェクトとの位置関係及び表同士の位置関係のいずれかに関する条件であることを特徴とする請求項2に記載の装置。
  4. 前記領域データには、前記オブジェクトの、位置、サイズ及び傾きのうち少なくとも1つの情報が含まれ、
    前記表構造情報には、行/列構造、セルの座標、罫線の色、及び罫線の種類のうち少なくとも1つの情報が含まれる
    ことを特徴とする請求項1乃至3のいずれか1項に記載の装置。
  5. 前記電子文書は、XMLフォーマットであることを特徴とする請求項1乃至4のいずれか1項に記載の装置。
  6. 領域抽出手段が、表を含む文書の画像データからオブジェクト毎の領域データを抽出するステップと、
    表構造解析手段が、前記抽出された領域データのうち表オブジェクトに関する領域データを解析し、表オブジェクトそれぞれの表構造情報を抽出するステップと、
    シート生成手段が、前記オブジェクト毎の領域データと前記表構造情報とを用いて、前記文書におけるオブジェクトのレイアウトを再現するための表示用シート及び表の編集をするための表毎の編集用シートを生成するステップであって、前記編集用シート上の表を参照する描画オブジェクトを生成して、前記描画オブジェクトが記された表示用シートを生成する、ステップと、
    電子文書生成手段が、前記表示用シートと前記編集用シートとを関連付けた電子文書を生成するステップと、
    を含み、
    前記表示用シート上の描画オブジェクトは、前記編集用シート上の表が編集されると、当該編集後の内容に更新される、
    ことを特徴とする文書を電子化する方法。
  7. コンピュータを、
    表を含む文書の画像データからオブジェクト毎の領域データを抽出する領域抽出手段、
    前記抽出された領域データのうち表オブジェクトに関する領域データを解析し、表オブジェクトそれぞれの表構造情報を抽出する表構造解析手段、
    前記オブジェクト毎の領域データと前記表構造情報とを用いて、前記文書におけるオブジェクトのレイアウトを再現するための表示用シート及び表の編集をするための表毎の編集用シートを生成するシート生成手段であって、前記編集用シート上の表を参照する描画オブジェクトを生成して、前記描画オブジェクトが記された表示用シートを生成する、シート生成手段、
    前記表示用シートと前記編集用シートとを関連付けた電子文書を生成する電子文書生成手段、
    として機能させるためのコンピュータプログラムであって、
    前記表示用シート上の描画オブジェクトは、前記編集用シート上の表が編集されると、当該編集後の内容に更新される、
    ことを特徴とするコンピュータプログラム。
JP2010001426A 2010-01-06 2010-01-06 文書を電子化する装置及び方法 Expired - Fee Related JP5465015B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2010001426A JP5465015B2 (ja) 2010-01-06 2010-01-06 文書を電子化する装置及び方法
US12/980,678 US8718364B2 (en) 2010-01-06 2010-12-29 Apparatus and method for digitizing documents with extracted region data
EP11150261.3A EP2343670B1 (en) 2010-01-06 2011-01-05 Apparatus and method for digitizing documents
CN201110008963.2A CN102117269B (zh) 2010-01-06 2011-01-06 对文档进行数字化的装置及方法
KR1020110001492A KR101334483B1 (ko) 2010-01-06 2011-01-06 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010001426A JP5465015B2 (ja) 2010-01-06 2010-01-06 文書を電子化する装置及び方法

Publications (3)

Publication Number Publication Date
JP2011141677A JP2011141677A (ja) 2011-07-21
JP2011141677A5 true JP2011141677A5 (ja) 2013-02-14
JP5465015B2 JP5465015B2 (ja) 2014-04-09

Family

ID=43828378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010001426A Expired - Fee Related JP5465015B2 (ja) 2010-01-06 2010-01-06 文書を電子化する装置及び方法

Country Status (5)

Country Link
US (1) US8718364B2 (ja)
EP (1) EP2343670B1 (ja)
JP (1) JP5465015B2 (ja)
KR (1) KR101334483B1 (ja)
CN (1) CN102117269B (ja)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9042653B2 (en) 2011-01-24 2015-05-26 Microsoft Technology Licensing, Llc Associating captured image data with a spreadsheet
JP5541202B2 (ja) * 2011-03-16 2014-07-09 コニカミノルタ株式会社 スプレッドシートデータ生成装置およびプログラム
US8984404B2 (en) * 2011-05-27 2015-03-17 Hewlett-Packard Development Company, L.P. Guiding an image-based task execution
US8657195B2 (en) 2011-09-27 2014-02-25 Symbol Technologies, Inc. Document capture with imaging-based bar code readers
US9069748B2 (en) * 2011-10-04 2015-06-30 Microsoft Technology Licensing, Llc Selective generation and display of data items associated with a spreadsheet
US8990675B2 (en) * 2011-10-04 2015-03-24 Microsoft Technology Licensing, Llc Automatic relationship detection for spreadsheet data items
EP2807604A1 (en) 2012-01-23 2014-12-03 Microsoft Corporation Vector graphics classification engine
EP2807608B1 (en) 2012-01-23 2024-04-10 Microsoft Technology Licensing, LLC Borderless table detection engine
CN102819564A (zh) * 2012-07-05 2012-12-12 无锡中科泛在信息技术研发中心有限公司 一种有限表元组合的报表生成方法
US9626067B2 (en) 2012-12-12 2017-04-18 Apple Inc. Modifying positions of on-canvas objects
CN103020031A (zh) * 2012-12-19 2013-04-03 珠海金山办公软件有限公司 一种智能更新数据透视表的方法及装置
US9953008B2 (en) 2013-01-18 2018-04-24 Microsoft Technology Licensing, Llc Grouping fixed format document elements to preserve graphical data semantics after reflow by manipulating a bounding box vertically and horizontally
CN107066999A (zh) * 2013-05-22 2017-08-18 华为终端有限公司 一种文字识别方法及用户终端
CN104700176B (zh) * 2013-12-09 2018-08-21 中国商用飞机有限责任公司 一种技术出版物内容交付系统及方法
CN104731813A (zh) * 2013-12-23 2015-06-24 珠海金山办公软件有限公司 表格文件显示方法及系统
KR101447555B1 (ko) * 2014-03-06 2014-10-08 주식회사 한글과컴퓨터 표 입력 제어 기반의 전자 문서 편집 장치 및 방법
US9513671B2 (en) 2014-08-01 2016-12-06 Microsoft Technology Licensing, Llc Peripheral retention device
US10191986B2 (en) 2014-08-11 2019-01-29 Microsoft Technology Licensing, Llc Web resource compatibility with web applications
US9705637B2 (en) 2014-08-19 2017-07-11 Microsoft Technology Licensing, Llc Guard band utilization for wireless data communication
US9524429B2 (en) 2014-08-21 2016-12-20 Microsoft Technology Licensing, Llc Enhanced interpretation of character arrangements
US9805483B2 (en) 2014-08-21 2017-10-31 Microsoft Technology Licensing, Llc Enhanced recognition of charted data
US9397723B2 (en) 2014-08-26 2016-07-19 Microsoft Technology Licensing, Llc Spread spectrum wireless over non-contiguous channels
US9424048B2 (en) 2014-09-15 2016-08-23 Microsoft Technology Licensing, Llc Inductive peripheral retention device
CN105069293B (zh) * 2015-08-07 2017-11-10 宋声台 一种信息录入终端的方法和智能笔记本
CN105373791B (zh) * 2015-11-12 2018-12-14 中国建设银行股份有限公司 信息处理方法及信息处理装置
US20170220858A1 (en) * 2016-02-01 2017-08-03 Microsoft Technology Licensing, Llc Optical recognition of tables
CN106650664A (zh) * 2016-12-22 2017-05-10 深圳爱拼信息科技有限公司 一种高招大本数据采集系统及方法
KR101991087B1 (ko) 2017-05-12 2019-06-19 이세희 검증 및 보정 효율성이 개선된 비 전자 기록물의 디지털화 시스템 및 방법
KR102016998B1 (ko) 2017-05-12 2019-09-03 이세희 개인정보를 포함하는 비공개 처리 기록물의 효율적 관리를 위한 비전자 기록물의 디지털화 시스템 및 방법
KR101868468B1 (ko) 2017-05-12 2018-06-19 이세희 무선통신수단을 이용하여 기록물철의 관리 및 검색 효율성을 개선시킨 비 전자 기록물의 디지털화 시스템
US11562143B2 (en) 2017-06-30 2023-01-24 Accenture Global Solutions Limited Artificial intelligence (AI) based document processor
US11003796B2 (en) 2017-06-30 2021-05-11 Accenture Global Solutions Limited Artificial intelligence based document processor
US10489502B2 (en) * 2017-06-30 2019-11-26 Accenture Global Solutions Limited Document processing
KR101991088B1 (ko) 2017-08-02 2019-06-19 이세희 비 전자 기록물의 넘버링을 자동화 한 기록물의 자동 디지털화 장치 및 방법
KR101907029B1 (ko) * 2017-08-24 2018-10-12 (주) 더존비즈온 서식 자동화를 위한 테이블 생성 장치 및 방법
CN109992759B (zh) * 2017-12-29 2023-12-01 珠海金山办公软件有限公司 表格对象编辑方法、装置、电子设备及存储介质
US11650970B2 (en) 2018-03-09 2023-05-16 International Business Machines Corporation Extracting structure and semantics from tabular data
KR102107449B1 (ko) * 2018-07-30 2020-06-02 주식회사 한글과컴퓨터 스프레드시트 문서 내 병합된 셀의 콘텐트를 표시하는 전자 장치 및 그의 동작 방법
US11200413B2 (en) * 2018-07-31 2021-12-14 International Business Machines Corporation Table recognition in portable document format documents
CN109447019B (zh) * 2018-11-08 2021-05-28 公安部沈阳消防研究所 基于图像识别与数据库存储的纸质扫描文档电子化方法
CN109829814B (zh) * 2018-12-29 2024-04-02 平安科技(深圳)有限公司 历史还款信息的生成方法、装置、设备及存储介质
CN110956087B (zh) * 2019-10-25 2024-04-19 北京懿医云科技有限公司 一种图片中表格的识别方法、装置、可读介质和电子设备
KR102300475B1 (ko) * 2019-12-13 2021-09-09 주식회사 한글과컴퓨터 표가 삽입된 이미지를 전자 문서로 변환할 수 있는 전자 장치 및 그 동작 방법
US11501549B2 (en) 2020-05-13 2022-11-15 Accenture Global Solutions Limited Document processing using hybrid rule-based artificial intelligence (AI) mechanisms
CN111898402A (zh) * 2020-06-01 2020-11-06 王昌龙 一种智能排版系统
US11341318B2 (en) 2020-07-07 2022-05-24 Kudzu Software Llc Interactive tool for modifying an automatically generated electronic form
US11403455B2 (en) * 2020-07-07 2022-08-02 Kudzu Software Llc Electronic form generation from electronic documents
KR102211516B1 (ko) * 2020-08-21 2021-02-04 주식회사 애자일소다 가상 셀을 이용한 ocr 기반 문서 분석 시스템 및 방법
CN112149506A (zh) * 2020-08-25 2020-12-29 北京来也网络科技有限公司 结合rpa和ai的图像中的表格生成方法、设备及存储介质
WO2022102823A1 (ko) * 2020-11-16 2022-05-19 주식회사 솔트룩스 표 이미지로부터 구조화된 출력 데이터를 생성하기 위한 표 정보 생성 시스템 및 방법
KR102614760B1 (ko) * 2020-11-16 2023-12-19 주식회사 솔트룩스 표 이미지로부터 구조화된 출력 데이터를 생성하기 위한 표 정보 생성 시스템 및 방법
KR102525024B1 (ko) * 2021-08-19 2023-04-24 (주)복부인 부동산 계약서 자동 분석 및 관리 장치
US11837004B1 (en) * 2023-02-24 2023-12-05 Oracle Financial Services Software Limited Searchable table extraction

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3838729C2 (de) * 1987-11-16 1994-05-05 Canon Kk Dokumentverarbeitungsgerät
JPH05250357A (ja) * 1992-03-05 1993-09-28 Ricoh Co Ltd 画像読取修正装置および修正画像形成装置
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH11167532A (ja) 1997-12-02 1999-06-22 Canon Inc データ加工システムおよび装置、データ加工方法、記録媒体
JPH11312231A (ja) * 1998-04-28 1999-11-09 Omron Corp データ処理プログラムを記録した記録媒体、データ処理装置およびデータ処理方法
US6337924B1 (en) * 1999-02-26 2002-01-08 Hewlett-Packard Company System and method for accurately recognizing text font in a document processing system
US6816630B1 (en) * 2000-05-22 2004-11-09 Electro-Sensors, Inc. System and method for creating and processing data forms
US7155667B1 (en) * 2000-06-21 2006-12-26 Microsoft Corporation User interface for integrated spreadsheets and word processing tables
JP2002007953A (ja) 2000-06-22 2002-01-11 Hitachi Ltd 電子帳票処理装置
JP2002185763A (ja) * 2000-12-11 2002-06-28 Minolta Co Ltd デジタル複写機
JP4208520B2 (ja) * 2002-08-26 2009-01-14 キヤノン株式会社 画像処理装置および画像処理方法、プログラムおよび記憶媒体
US7882427B2 (en) * 2003-07-24 2011-02-01 Balenz Software, Inc. System and method for managing a spreadsheet
JP4041442B2 (ja) 2003-09-08 2008-01-30 シャープ株式会社 無線通信装置及び無線通信システム
JP3796500B2 (ja) * 2003-11-21 2006-07-12 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7873218B2 (en) 2004-04-26 2011-01-18 Canon Kabushiki Kaisha Function approximation processing method and image processing method
JP4371911B2 (ja) 2004-05-31 2009-11-25 キヤノン株式会社 関数化処理方法及び関数化処理装置
DE102005048600B4 (de) * 2005-10-06 2008-09-25 Klaus Rehm Verfahren zum Erfassen von Daten
JP2007249754A (ja) * 2006-03-17 2007-09-27 Internatl Business Mach Corp <Ibm> 情報処理装置、情報処理方法およびプログラム
AU2006252025B2 (en) * 2006-12-13 2012-10-04 Canon Kabushiki Kaisha Recognition of parameterised shapes from document images
AU2006252019B2 (en) * 2006-12-13 2012-06-28 Canon Kabushiki Kaisha Method and Apparatus for Dynamic Connector Analysis
US8595615B2 (en) * 2007-02-07 2013-11-26 International Business Machines Corporation System and method for automatic stylesheet inference
JP4988842B2 (ja) * 2007-06-28 2012-08-01 富士通株式会社 表データ生成プログラム、表データ生成方法および表データ生成装置
US8000529B2 (en) * 2007-07-11 2011-08-16 Hewlett-Packard Development Company, L.P. System and method for creating an editable template from a document image
US8260049B2 (en) * 2007-09-28 2012-09-04 Abbyy Software Ltd. Model-based method of document logical structure recognition in OCR systems

Similar Documents

Publication Publication Date Title
JP2011141677A5 (ja)
EP2343670A3 (en) Apparatus and method for digitizing documents
JP2007079858A5 (ja)
JP2007013550A5 (ja)
JP2006209542A5 (ja)
JP2013027037A5 (ja)
JP2012226744A5 (ja)
EP2320336A3 (en) Information processing apparatus, data acquisition method, and program
JP2014016785A5 (ja)
JP2011013897A5 (ja)
JP2009296439A5 (ja)
CN101430676A (zh) 一种电子校对方法、系统及电子校对终端
EP2009580A3 (en) Information processing apparatus and control method thereof, computer program, and information processing system
JP2010160578A5 (ja)
JP2008311930A5 (ja)
US8780404B2 (en) Information processing apparatus, method for controlling same, and storage medium on which computer program has been recorded
JP2009004990A5 (ja)
JP2012203491A (ja) 文書処理装置及び文書処理プログラム
JP2009194561A5 (ja)
JP2013254321A5 (ja)
JP2015054459A5 (ja)
JP2007316873A5 (ja)
JP2009271779A5 (ja)
JP2011159179A5 (ja) 画像処理装置及びその処理方法、並びに画像処理方法
JP2012088789A5 (ja)