JP4987960B2 - レンダリングのためにトークンベースファイルへの文字列を含むディジタル画像の変換 - Google Patents
レンダリングのためにトークンベースファイルへの文字列を含むディジタル画像の変換 Download PDFInfo
- Publication number
- JP4987960B2 JP4987960B2 JP2009503161A JP2009503161A JP4987960B2 JP 4987960 B2 JP4987960 B2 JP 4987960B2 JP 2009503161 A JP2009503161 A JP 2009503161A JP 2009503161 A JP2009503161 A JP 2009503161A JP 4987960 B2 JP4987960 B2 JP 4987960B2
- Authority
- JP
- Japan
- Prior art keywords
- token
- tokens
- group
- vectorized
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009877 rendering Methods 0.000 title description 5
- 238000006243 chemical reaction Methods 0.000 title description 3
- 238000000034 method Methods 0.000 claims description 67
- 238000012545 processing Methods 0.000 claims description 13
- 230000005484 gravity Effects 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012015 optical character recognition Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/22—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of characters or indicia using display control signals derived from coded signals representing the characters or indicia, e.g. with a character-code memory
- G09G5/24—Generation of individual character patterns
- G09G5/28—Generation of individual character patterns for enhancement of character form, e.g. smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Processing Or Creating Images (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Generation (AREA)
- Image Analysis (AREA)
Description
Claims (17)
- 電子画像を処理するためにコンピュータで実施される方法であって、
書籍の走査された画像に対応する電子画像における1つまたは複数のトークンを、接続構成要素解析を用いて識別することと、
トークンの形状にしたがって、識別されたトークンを複数のトークングループに分類することと、
トークングループのそれぞれに関して、トークングループに含まれるトークンの形状を数学的に表現するベクトル化トークンを作成することと、
出力媒体上でレンダリングするように、画像を表すベクトル化トークンの集合を生成することと、
ベクトル化トークンによって表されるトークンの位置を各ベクトル化トークンに関連付けることとを含む、方法。 - 少なくとも2つのトークンが、同一の英数字に対応する、請求項1に記載の方法。
- 出力媒体が、ハンドヘルド型媒体デバイスである、請求項1に記載の方法。
- 出力媒体が、印刷媒体である、請求項1に記載の方法。
- 類似の形状を有するトークンをグループに分類し、それによって、複数のトークングループを形成することと、
各トークングループにおいてトークンの形状を形態構造学的に表現する代表的なトークンを識別し、それによって複数の代表的なトークンを識別することと、
各代表的なトークンをベクトル化して、代表的なトークンの形状を数学的に表現するベクトル化トークンを作成することとをさらに含み、
各トークングループにおいてトークンの形状を形態構造学的に表現する代表的なトークンを識別することが、各トークングループにおいてトークンの形状を結合して、トークングループにおいてトークンの組み合わせである代表的なトークンを作成することを含む、請求項1に記載の方法。 - 類似の形状を有するトークンをグループに分類することが、類似の形状および類似のサイズの両方を有するトークンをグループに分類することを含む、請求項5に記載の方法。
- 各トークングループにおいてトークンの形状を結合することが、トークンの形状を平均化して、平均化したトークンを作成することを含む、請求項6に記載の方法。
- 電子画像においてトークンを識別することが、接続構成要素解析を用いることを含む、請求項5に記載の方法。
- 電子画像においてトークンを識別することが、接続構成要素が所定の閾値サイズより大きいように求められると、その最短経路に沿って接続構成要素を分離し、それによって2つのトークンに識別することを含む、請求項8に記載の方法。
- 電子画像においてトークンを識別することが、ピクセルがピクセル強度、エッジマグニチュードおよび方向に基づくエッジウェイトを用いてグラフとして表されるエッジグラフ解析を用いることを含む、請求項5に記載の方法。
- 類似の形状を有するトークンをグループに分類することが、
各トークンに関する重心を計算することと、
重心の値に基づいてトークンを整列することとを含む、請求項5に記載の方法。 - 各トークンに関する重心を計算することが、
各トークンを2つ以上の部分に分割することと、
部分のそれぞれに関して重心を計算することとをさらに含む、請求項11に記載の方法。 - 類似の形状を有するトークンをグループに分類することが、トークンを比較するために誤差解析技術を用いることを含む、請求項5に記載の方法。
- 類似の形状を有するトークンをグループに分類することが、トークンを比較するために二乗平均平方根(RMS)誤差解析を用いることを含む、請求項13に記載の方法。
- 各代表的なトークンをベクトル化してベクトル化トークンを作成することが、ベジエ曲線において代表的なトークンの形状を数学的に表現することを含む、請求項5に記載の方法。
- 各ベクトル化トークンをベクトル化トークンによって表されるトークンの位置に関連付けることが、位置に関連付けてベクトル化トークンに対するポインタを格納することを含む、請求項5に記載の方法。
- コンピュータによって実行されたときに、前記コンピュータに、請求項1から16のいずれかに記載の方法のステップを実行させるためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/392,213 US7460710B2 (en) | 2006-03-29 | 2006-03-29 | Converting digital images containing text to token-based files for rendering |
US11/392,213 | 2006-03-29 | ||
PCT/US2007/064616 WO2007121029A2 (en) | 2006-03-29 | 2007-03-22 | Converting digital images containing text to token-based files for rendering |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009531788A JP2009531788A (ja) | 2009-09-03 |
JP4987960B2 true JP4987960B2 (ja) | 2012-08-01 |
Family
ID=38575327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009503161A Active JP4987960B2 (ja) | 2006-03-29 | 2007-03-22 | レンダリングのためにトークンベースファイルへの文字列を含むディジタル画像の変換 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7460710B2 (ja) |
EP (1) | EP1999688B1 (ja) |
JP (1) | JP4987960B2 (ja) |
CN (2) | CN102176230B (ja) |
WO (1) | WO2007121029A2 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060050961A1 (en) * | 2004-08-13 | 2006-03-09 | Mohanaraj Thiyagarajah | Method and system for locating and verifying a finder pattern in a two-dimensional machine-readable symbol |
US7596270B2 (en) * | 2005-09-23 | 2009-09-29 | Dynacomware Taiwan Inc. | Method of shuffling text in an Asian document image |
US7788580B1 (en) | 2006-03-28 | 2010-08-31 | Amazon Technologies, Inc. | Processing digital images including headers and footers into reflow content |
US8023738B1 (en) | 2006-03-28 | 2011-09-20 | Amazon Technologies, Inc. | Generating reflow files from digital images for rendering on various sized displays |
US7433548B2 (en) * | 2006-03-28 | 2008-10-07 | Amazon Technologies, Inc. | Efficient processing of non-reflow content in a digital image |
US7966557B2 (en) * | 2006-03-29 | 2011-06-21 | Amazon Technologies, Inc. | Generating image-based reflowable files for rendering on various sized displays |
US7810026B1 (en) | 2006-09-29 | 2010-10-05 | Amazon Technologies, Inc. | Optimizing typographical content for transmission and display |
US8144978B2 (en) * | 2007-08-01 | 2012-03-27 | Tandent Vision Science, Inc. | System and method for identifying complex tokens in an image |
WO2009049061A1 (en) * | 2007-10-09 | 2009-04-16 | Firstpaper Llc | Methods, apparatus, and systems for providing local and online data services |
US8086040B2 (en) * | 2007-12-05 | 2011-12-27 | Xerox Corporation | Text representation method and apparatus |
US8782516B1 (en) | 2007-12-21 | 2014-07-15 | Amazon Technologies, Inc. | Content style detection |
US8572480B1 (en) | 2008-05-30 | 2013-10-29 | Amazon Technologies, Inc. | Editing the sequential flow of a page |
JP5121599B2 (ja) * | 2008-06-30 | 2013-01-16 | キヤノン株式会社 | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 |
US9229911B1 (en) | 2008-09-30 | 2016-01-05 | Amazon Technologies, Inc. | Detecting continuation of flow of a page |
US8255820B2 (en) | 2009-06-09 | 2012-08-28 | Skiff, Llc | Electronic paper display device event tracking |
US8195626B1 (en) * | 2009-06-18 | 2012-06-05 | Amazon Technologies, Inc. | Compressing token-based files for transfer and reconstruction |
US8396301B2 (en) | 2009-09-24 | 2013-03-12 | Gtech Corporation | System and method for document location and recognition |
FR2950713A1 (fr) * | 2009-09-29 | 2011-04-01 | Movea Sa | Systeme et procede de reconnaissance de gestes |
US20110173532A1 (en) * | 2010-01-13 | 2011-07-14 | George Forman | Generating a layout of text line images in a reflow area |
US8499236B1 (en) | 2010-01-21 | 2013-07-30 | Amazon Technologies, Inc. | Systems and methods for presenting reflowable content on a display |
US8463041B2 (en) * | 2010-01-26 | 2013-06-11 | Hewlett-Packard Development Company, L.P. | Word-based document image compression |
US8675933B2 (en) | 2010-04-30 | 2014-03-18 | Vucomp, Inc. | Breast segmentation in radiographic images |
WO2011137411A1 (en) | 2010-04-30 | 2011-11-03 | Vucomp, Inc. | Probability density function estimator |
CN101853246B (zh) * | 2010-06-14 | 2012-05-23 | 深圳市万兴软件有限公司 | 一种文档格式的转换方法及装置 |
US9256799B2 (en) * | 2010-07-07 | 2016-02-09 | Vucomp, Inc. | Marking system for computer-aided detection of breast abnormalities |
US9349202B1 (en) * | 2012-10-01 | 2016-05-24 | Amazon Technologies, Inc. | Digital conversion of imaged content |
US9501499B2 (en) * | 2013-10-21 | 2016-11-22 | Google Inc. | Methods and systems for creating image-based content based on text-based content |
JP6000992B2 (ja) * | 2014-01-24 | 2016-10-05 | 京セラドキュメントソリューションズ株式会社 | 文書ファイル生成装置及び文書ファイル生成方法 |
US9852337B1 (en) * | 2015-09-30 | 2017-12-26 | Open Text Corporation | Method and system for assessing similarity of documents |
US9684842B2 (en) * | 2015-10-29 | 2017-06-20 | The Nielsen Company (Us), Llc | Methods and apparatus to extract text from imaged documents |
US9990521B2 (en) * | 2016-09-06 | 2018-06-05 | Amazon Technologies, Inc. | Bundled unit identification and tracking |
US10296788B1 (en) * | 2016-12-19 | 2019-05-21 | Matrox Electronic Systems Ltd. | Method and system for processing candidate strings detected in an image to identify a match of a model string in the image |
US10552699B2 (en) | 2016-12-27 | 2020-02-04 | Datalogic Usa, Inc. | Robust string text detection for industrial optical character recognition |
US11295061B2 (en) | 2020-02-05 | 2022-04-05 | Amazon Technologies, Inc. | Dynamic layout adjustment for reflowable content |
CN112053410A (zh) * | 2020-08-24 | 2020-12-08 | 海南太美航空股份有限公司 | 一种基于矢量图形绘制的图像处理方法、系统及电子设备 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0296885A (ja) * | 1988-10-03 | 1990-04-09 | Ricoh Co Ltd | 画像処理装置 |
US5523946A (en) * | 1992-02-11 | 1996-06-04 | Xerox Corporation | Compact encoding of multi-lingual translation dictionaries |
JPH06180771A (ja) * | 1992-12-11 | 1994-06-28 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
US5956419A (en) * | 1995-04-28 | 1999-09-21 | Xerox Corporation | Unsupervised training of character templates using unsegmented samples |
JPH1091724A (ja) * | 1996-09-10 | 1998-04-10 | Riibuson:Kk | パターン認識装置 |
US6562077B2 (en) * | 1997-11-14 | 2003-05-13 | Xerox Corporation | Sorting image segments into clusters based on a distance measurement |
US6064767A (en) * | 1998-01-16 | 2000-05-16 | Regents Of The University Of California | Automatic language identification by stroke geometry analysis |
JP2000113112A (ja) * | 1998-09-30 | 2000-04-21 | Oki Electric Ind Co Ltd | 文字認識回路および英単語認識方法 |
US6621941B1 (en) * | 1998-12-18 | 2003-09-16 | Xerox Corporation | System of indexing a two dimensional pattern in a document drawing |
JP4085183B2 (ja) * | 2002-05-31 | 2008-05-14 | 株式会社 エヌティーアイ | 遺伝的アルゴリズムによるフォント生成システム |
CN1416041A (zh) * | 2002-11-07 | 2003-05-07 | 白世宾 | 图形符号信息处理及输入法 |
US7272258B2 (en) * | 2003-01-29 | 2007-09-18 | Ricoh Co., Ltd. | Reformatting documents using document analysis information |
US7486294B2 (en) * | 2003-03-27 | 2009-02-03 | Microsoft Corporation | Vector graphics element-based model, application programming interface, and markup language |
JP4574235B2 (ja) * | 2004-06-04 | 2010-11-04 | キヤノン株式会社 | 画像処理装置、及びその制御方法、プログラム |
-
2006
- 2006-03-29 US US11/392,213 patent/US7460710B2/en active Active
-
2007
- 2007-03-22 JP JP2009503161A patent/JP4987960B2/ja active Active
- 2007-03-22 WO PCT/US2007/064616 patent/WO2007121029A2/en active Application Filing
- 2007-03-22 CN CN2011100955146A patent/CN102176230B/zh active Active
- 2007-03-22 CN CN2007800155655A patent/CN101432761B/zh active Active
- 2007-03-22 EP EP07780285.8A patent/EP1999688B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
US7460710B2 (en) | 2008-12-02 |
US20070237401A1 (en) | 2007-10-11 |
CN102176230B (zh) | 2013-01-16 |
CN102176230A (zh) | 2011-09-07 |
WO2007121029A3 (en) | 2008-10-16 |
EP1999688A4 (en) | 2011-07-13 |
CN101432761A (zh) | 2009-05-13 |
EP1999688B1 (en) | 2013-10-16 |
EP1999688A2 (en) | 2008-12-10 |
JP2009531788A (ja) | 2009-09-03 |
WO2007121029A2 (en) | 2007-10-25 |
CN101432761B (zh) | 2011-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4987960B2 (ja) | レンダリングのためにトークンベースファイルへの文字列を含むディジタル画像の変換 | |
US8634644B2 (en) | System and method for identifying pictures in documents | |
JP3345350B2 (ja) | 文書画像認識装置、その方法、及び記録媒体 | |
AU2006252025B2 (en) | Recognition of parameterised shapes from document images | |
Seethalakshmi et al. | Optical character recognition for printed Tamil text using Unicode | |
JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
US8965125B2 (en) | Image processing device, method and storage medium for storing and displaying an electronic document | |
US20050193327A1 (en) | Method for determining logical components of a document | |
US6532302B2 (en) | Multiple size reductions for image segmentation | |
US11615244B2 (en) | Data extraction and ordering based on document layout analysis | |
US11436852B2 (en) | Document information extraction for computer manipulation | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
CN115545009B (zh) | 一种获取目标文本的数据处理系统 | |
US8195626B1 (en) | Compressing token-based files for transfer and reconstruction | |
US9323726B1 (en) | Optimizing a glyph-based file | |
US20080131000A1 (en) | Method for generating typographical line | |
CA2790210C (en) | Resolution adjustment of an image that includes text undergoing an ocr process | |
US10310710B2 (en) | Determination of indentation levels of a bulleted list | |
US11080545B2 (en) | Optical character recognition support system | |
CN111126273A (zh) | 图像处理方法、装置、电子设备以及存储介质 | |
JP2007226803A (ja) | 希な複数文字のクラスタに対して品質プロトタイプとしての合成リガチャーを生成するシステムおよび方法 | |
CN112101356A (zh) | 一种图片中特定文本的定位方法、装置及存储介质 | |
Konya et al. | Adaptive methods for robust document image understanding | |
Safonov et al. | Screenshot to metafile conversion for printing | |
CN115830607A (zh) | 基于人工智能的文本识别方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110607 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110905 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120327 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4987960 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |