KR100664311B1 - 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 - Google Patents
자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 Download PDFInfo
- Publication number
- KR100664311B1 KR100664311B1 KR1020050110952A KR20050110952A KR100664311B1 KR 100664311 B1 KR100664311 B1 KR 100664311B1 KR 1020050110952 A KR1020050110952 A KR 1020050110952A KR 20050110952 A KR20050110952 A KR 20050110952A KR 100664311 B1 KR100664311 B1 KR 100664311B1
- Authority
- KR
- South Korea
- Prior art keywords
- index
- text
- symbol
- page
- threshold
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03G—ELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
- G03G15/00—Apparatus for electrographic processes using a charge pattern
Abstract
Description
Claims (10)
- 문서를 스캔하는 스캔부;상기 스캔된 문서를 텍스트 영역 및 이미지 영역으로 분리하고, 상기 텍스트 영역의 텍스트를 심볼로 분리하는 텍스트/이미지 분리부;상기 분리된 각 심볼의 특성을 추출하고, 상기 추출한 심볼 특성을 인덱스 문턱값과 비교하여, 상기 심볼이 포함된 텍스트가 인덱스인지 여부를 판단하는 인덱스 판단부; 및상기 인덱스로 판단된 텍스트 및 상기 텍스트가 포함된 페이지 정보를 포함하도록 인덱스 페이지를 생성하는 인덱스페이지 생성부;를 포함하는 것을 특징으로 하는 화상형성장치.
- 제 1항에 있어서,상기 심볼 특성은,심볼 너비, 심볼 높이, 및 획 굵기 중 적어도 어느 하나인 것을 특징으로 하는 화상형성장치.
- 제 1항에 있어서,상기 인덱스 문턱값은,인덱스 대상 심볼을 판단하기 위한 값으로, 심볼 너비 문턱값, 심볼 높이 문턱값, 및 획 굵기 문턱값 중 적어도 어느 하나이며,상기 심볼 특성의 변화에 기초하여 산출된 심볼 특성의 평균값 및 사용자 설정값 중 적어도 어느 하나인 것을 특징으로 하는 화상형성장치.
- 제 1항에 있어서,상기 인덱스 판단부는,상기 추출한 심볼 특성이 상기 인덱스 문턱값보다 크면 인덱스 대상 심볼로 판단하고, 상기 인덱스 대상 심볼을 그룹화하여 생성된 텍스트를 인덱스로 판단하는 것을 특징으로 하는 화상형성장치.
- 제 1항에 있어서,상기 인덱스페이지 생성부는,상기 판단된 인덱스 및 상기 인덱스가 포함된 페이지를 링크시키는 것을 특징으로 하는 화상형성장치.
- 문서를 스캔하는 단계;상기 스캔된 문서를 텍스트 영역 및 이미지 영역으로 분리하고, 상기 텍스트 영역의 텍스트를 심볼로 분리하는 단계;상기 분리된 각 심볼의 특성을 추출하고, 상기 추출한 심볼 특성을 인덱스 문턱값과 비교하여, 상기 심볼이 포함된 텍스트가 인덱스인지 여부를 판단하는 단계; 및상기 인덱스로 판단된 텍스트 및 상기 텍스트가 포함된 페이지 정보를 포함하도록 인덱스 페이지를 생성하는 단계;를 포함하는 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
- 제 6항에 있어서,상기 심볼 특성은,심볼 너비, 심볼 높이, 및 획 굵기 중 적어도 어느 하나인 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
- 제 6항에 있어서,상기 인덱스 문턱값은,인덱스 대상 심볼을 판단하기 위한 값으로, 심볼 너비 문턱값, 심볼 높이 문턱값, 및 획 굵기 문턱값 중 적어도 어느 하나이며,상기 심볼 특성의 변화에 기초하여 산출된 심볼 특성의 평균값 및 사용자 설정값 중 적어도 어느 하나인 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
- 제 6항에 있어서,상기 인덱스를 판단하는 단계는,상기 추출한 심볼 특성이 상기 인덱스 문턱값보다 크면 인덱스 대상 심볼로 판단하고, 상기 인덱스 대상 심볼을 그룹화하여 생성된 텍스트를 인덱스로 판단하는 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
- 제 6항에 있어서,상기 인덱스 페이지를 생성하는 단계는,상기 판단된 인덱스 및 상기 인덱스가 포함된 페이지를 링크시키는 것을 특징으로 하는 화상형성장치의 자동 인덱스 생성방법.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050110952A KR100664311B1 (ko) | 2005-11-18 | 2005-11-18 | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 |
US11/430,123 US7860316B2 (en) | 2005-11-18 | 2006-05-09 | Image forming apparatus that automatically creates an index and a method thereof |
CNB2006101494292A CN100517372C (zh) | 2005-11-18 | 2006-11-20 | 自动创建索引的图像形成装置及其方法 |
US12/947,333 US8369623B2 (en) | 2005-11-18 | 2010-11-16 | Image forming apparatus that automatically creates an index and a method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050110952A KR100664311B1 (ko) | 2005-11-18 | 2005-11-18 | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100664311B1 true KR100664311B1 (ko) | 2007-01-04 |
Family
ID=37866827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050110952A KR100664311B1 (ko) | 2005-11-18 | 2005-11-18 | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 |
Country Status (3)
Country | Link |
---|---|
US (2) | US7860316B2 (ko) |
KR (1) | KR100664311B1 (ko) |
CN (1) | CN100517372C (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101103029B1 (ko) * | 2009-05-22 | 2012-01-06 | 김철회 | 인덱스 인식에 따라 데이터를 추출하는 시스템 및 그 운용방법 |
WO2013151286A1 (ko) * | 2012-04-05 | 2013-10-10 | Kang Shin Tai | 전자노트 기능을 갖는 시스템 및 그 운용방법 |
US8705116B2 (en) | 2007-07-13 | 2014-04-22 | Samsung Electronics Co., Ltd. | Image forming apparatus and color table generating method and color document printing method thereof |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030042319A1 (en) * | 2001-08-31 | 2003-03-06 | Xerox Corporation | Automatic and semi-automatic index generation for raster documents |
KR100664311B1 (ko) * | 2005-11-18 | 2007-01-04 | 삼성전자주식회사 | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 |
US7912829B1 (en) | 2006-10-04 | 2011-03-22 | Google Inc. | Content reference page |
US7979785B1 (en) * | 2006-10-04 | 2011-07-12 | Google Inc. | Recognizing table of contents in an image sequence |
US8782551B1 (en) | 2006-10-04 | 2014-07-15 | Google Inc. | Adjusting margins in book page images |
JP2009033530A (ja) * | 2007-07-27 | 2009-02-12 | Kyocera Mita Corp | 画像形成装置 |
JP5412916B2 (ja) * | 2009-03-27 | 2014-02-12 | コニカミノルタ株式会社 | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
JP5663866B2 (ja) * | 2009-08-20 | 2015-02-04 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP5073773B2 (ja) * | 2010-04-08 | 2012-11-14 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理方法及びプログラム |
US8875007B2 (en) * | 2010-11-08 | 2014-10-28 | Microsoft Corporation | Creating and modifying an image wiki page |
CN103377255A (zh) * | 2012-04-27 | 2013-10-30 | 北大方正集团有限公司 | 索引文章的创建方法和装置 |
KR20140081470A (ko) * | 2012-12-21 | 2014-07-01 | 삼성전자주식회사 | 문자 확대 표시 방법, 상기 방법이 적용되는 장치, 및 상기 방법을 수행하는 프로그램을 저장하는 컴퓨터로 읽을 수 있는 저장 매체 |
JP6020191B2 (ja) * | 2013-01-21 | 2016-11-02 | 富士ゼロックス株式会社 | 表示制御装置及びプログラム |
US9547630B2 (en) * | 2014-04-08 | 2017-01-17 | International Business Machines Corporation | Identification of multimedia content in paginated data using metadata |
US9454696B2 (en) | 2014-04-17 | 2016-09-27 | Xerox Corporation | Dynamically generating table of contents for printable or scanned content |
US10176175B2 (en) | 2015-08-19 | 2019-01-08 | International Business Machines Corporation | System and method for identifying candidates for back-of-book index |
CN106515258B (zh) * | 2016-11-10 | 2017-12-19 | 深圳市科迈爱康科技有限公司 | 笔记本、智能终端及笔记本内容索引创建方法 |
CN107688788B (zh) * | 2017-08-31 | 2021-01-08 | 平安科技(深圳)有限公司 | 文档图表抽取方法、电子设备及计算机可读存储介质 |
US20190384838A1 (en) * | 2018-06-19 | 2019-12-19 | Microsoft Technology Licensing, Llc | Method, apparatus and computer program for processing digital items |
CN114138214B (zh) * | 2022-01-27 | 2022-04-29 | 北京辰光融信技术有限公司 | 一种自动生成打印文件的方法、装置和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5276616A (en) | 1989-10-16 | 1994-01-04 | Sharp Kabushiki Kaisha | Apparatus for automatically generating index |
US5848410A (en) | 1997-10-08 | 1998-12-08 | Hewlett Packard Company | System and method for selective and continuous index generation |
JP2004021381A (ja) | 2002-06-13 | 2004-01-22 | Ricoh Co Ltd | 画像解析装置、プログラム及び記憶媒体 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5048113A (en) * | 1989-02-23 | 1991-09-10 | Ricoh Company, Ltd. | Character recognition post-processing method |
US5280367A (en) * | 1991-05-28 | 1994-01-18 | Hewlett-Packard Company | Automatic separation of text from background in scanned images of complex documents |
US5379130A (en) * | 1992-12-02 | 1995-01-03 | Industrial Technology Research Institute | Text/image separation method |
US6002798A (en) | 1993-01-19 | 1999-12-14 | Canon Kabushiki Kaisha | Method and apparatus for creating, indexing and viewing abstracted documents |
JP3518897B2 (ja) * | 1994-09-05 | 2004-04-12 | オリンパス株式会社 | 情報再生装置及び情報記録媒体 |
JPH08137880A (ja) | 1994-11-14 | 1996-05-31 | Canon Inc | 文書処理装置 |
US5778095A (en) * | 1995-12-20 | 1998-07-07 | Xerox Corporation | Classification of scanned symbols into equivalence classes |
JP3254642B2 (ja) | 1996-01-11 | 2002-02-12 | 株式会社日立製作所 | 索引の表示方法 |
JP2000509173A (ja) * | 1996-04-03 | 2000-07-18 | シーメンス アクチエンゲゼルシヤフト | デジタルデータへの変換後にドキュメントにプロットされるテキストの自動分類方法 |
JPH09282328A (ja) | 1996-04-16 | 1997-10-31 | Canon Inc | 文書画像処理装置及びその方法 |
JPH10240958A (ja) | 1996-12-27 | 1998-09-11 | Fujitsu Ltd | 画像から管理情報を抽出する管理情報抽出装置および方法 |
KR100238030B1 (ko) | 1997-07-23 | 2000-01-15 | 윤종용 | 자동 목차 작성 장치 및 방법 |
US6906812B2 (en) * | 2000-04-14 | 2005-06-14 | Seiko Epson Corporation | Symbol printer, symbol printing method, symbol printer driver, and a data storage medium storing a symbol printing program |
CN1269060C (zh) * | 2000-08-01 | 2006-08-09 | 复旦大学 | 处理和重复使用中文古籍的方法及其所采用的计算机软硬件系统 |
US7133565B2 (en) * | 2000-08-25 | 2006-11-07 | Canon Kabushiki Kaisha | Image processing apparatus and method |
US20030042319A1 (en) * | 2001-08-31 | 2003-03-06 | Xerox Corporation | Automatic and semi-automatic index generation for raster documents |
DE10204751B4 (de) * | 2002-02-06 | 2005-03-03 | Heidelberger Druckmaschinen Ag | Verfahren zur Konvertierung eines Linework Datenformats in das Format einer Seitenbeschreibungssprache |
JP2005071014A (ja) | 2003-08-22 | 2005-03-17 | Canon Inc | 文書画像処理装置、方法、プログラムおよび記憶媒体 |
CN100514357C (zh) * | 2004-09-03 | 2009-07-15 | 深圳市海云天科技有限公司 | 填涂信息卡的信息识别方法 |
KR100664311B1 (ko) * | 2005-11-18 | 2007-01-04 | 삼성전자주식회사 | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 |
-
2005
- 2005-11-18 KR KR1020050110952A patent/KR100664311B1/ko active IP Right Grant
-
2006
- 2006-05-09 US US11/430,123 patent/US7860316B2/en not_active Expired - Fee Related
- 2006-11-20 CN CNB2006101494292A patent/CN100517372C/zh not_active Expired - Fee Related
-
2010
- 2010-11-16 US US12/947,333 patent/US8369623B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5276616A (en) | 1989-10-16 | 1994-01-04 | Sharp Kabushiki Kaisha | Apparatus for automatically generating index |
US5848410A (en) | 1997-10-08 | 1998-12-08 | Hewlett Packard Company | System and method for selective and continuous index generation |
JP2004021381A (ja) | 2002-06-13 | 2004-01-22 | Ricoh Co Ltd | 画像解析装置、プログラム及び記憶媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8705116B2 (en) | 2007-07-13 | 2014-04-22 | Samsung Electronics Co., Ltd. | Image forming apparatus and color table generating method and color document printing method thereof |
KR101103029B1 (ko) * | 2009-05-22 | 2012-01-06 | 김철회 | 인덱스 인식에 따라 데이터를 추출하는 시스템 및 그 운용방법 |
WO2013151286A1 (ko) * | 2012-04-05 | 2013-10-10 | Kang Shin Tai | 전자노트 기능을 갖는 시스템 및 그 운용방법 |
Also Published As
Publication number | Publication date |
---|---|
CN100517372C (zh) | 2009-07-22 |
US8369623B2 (en) | 2013-02-05 |
US20110064310A1 (en) | 2011-03-17 |
US20070116359A1 (en) | 2007-05-24 |
US7860316B2 (en) | 2010-12-28 |
CN1967567A (zh) | 2007-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100664311B1 (ko) | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 | |
US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
US7353987B2 (en) | Printer and control method of printer | |
KR100612495B1 (ko) | 스캐닝된 원고를 소정 순서로 정렬하여 인쇄하는화상형성장치 및 그 방법 | |
GB2401742A (en) | Determining differences between scanned documents | |
US20060285748A1 (en) | Document processing device | |
US8493595B2 (en) | Image processing apparatus, image processing method, program, and storage medium | |
US20080144936A1 (en) | Image processing apparatus and image processing method | |
US20050047659A1 (en) | Image processing apparatus, image processing method and computer program | |
CN106060300B (zh) | 原稿读取装置及原稿读取装置的控制方法 | |
JP5594269B2 (ja) | ファイル名作成装置、画像形成装置、およびファイル名作成プログラム | |
JP2009302944A (ja) | 画像処理装置 | |
US20090324096A1 (en) | Method and apparatus for grouping scanned pages using an image processing apparatus | |
US20040119998A1 (en) | Processing scanned pages | |
US8126193B2 (en) | Image forming apparatus and method of image forming | |
US20220159144A1 (en) | Document processing device, system, document processing method, and computer program | |
US11064094B2 (en) | Image forming apparatus for forming image represented by image data on recording paper sheet | |
JP4396710B2 (ja) | 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム | |
JP6753370B2 (ja) | 原稿読取装置 | |
JP2010072850A (ja) | 画像処理装置 | |
US20210097271A1 (en) | Character recognition using previous recognition result of similar character | |
JP7457903B2 (ja) | 画像処理装置 | |
US11113521B2 (en) | Information processing apparatus | |
JP2012129746A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP4785727B2 (ja) | 地紋印刷装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121129 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20131128 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20141127 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20151127 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20161129 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20171211 Year of fee payment: 12 |