JP5634972B2 - テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム - Google Patents
テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム Download PDFInfo
- Publication number
- JP5634972B2 JP5634972B2 JP2011246300A JP2011246300A JP5634972B2 JP 5634972 B2 JP5634972 B2 JP 5634972B2 JP 2011246300 A JP2011246300 A JP 2011246300A JP 2011246300 A JP2011246300 A JP 2011246300A JP 5634972 B2 JP5634972 B2 JP 5634972B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- point
- division
- points
- split
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/293—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、概してテキスト画像のセグメンテーションのための方法およびシステムに関する。より具体的には、本発明はテキストの画像を複数のテキストセグメントにセグメント化する方法およびシステムに関する。
スキャンした文書を編集可能で検索可能なテキストに自動的に変換することは、正確で堅牢な光学式文字認識(OCR)システムの使用を要求する。OCRシステムは、テキストの入力画像を文字の単位にセグメント化することによって画像からのテキストを認識することを含む。英語のテキストのためのOCRシステムは、さまざまな理由によって高いレベルの正確性に達した。主な理由の1つは、英語のテキストを分離した文字へと前処理してOCRシステムへの入力として与える能力である。印刷された英語のテキストのくっついていない性質のため、英語のテキストの各々の文字は分離可能である。しかしながら、互いに触れ合う文字を持つテキストのスキャンされた画像は、OCRシステムへの試みをもたらすと共に、そのピッチが可変である場合に正確性を低減させる。そのような互いにくっつく種類の文字は、さまざまな言語に関するテキストにおいて見出し得る。
添付の図面は、同様の参照符号が別々の図面を通して同一または機能的に同様の要素を参照するものであり、以下の詳細な説明と共に、明細書に取り入れられて明細書の一部を形成するものであるが、さらにさまざまな実施の形態を図示するものであり、本発明に従うさまざまな原理および利点を説明するものである。
本発明に従う実施の形態を詳細に説明する前に、実施の形態は、主としてテキストをセグメント化するための方法およびシステムに関する方法のステップと装置の構成要素との組合せに存在することが見てとれるべきである。したがって、装置の構成要素および方法のステップは、図中の従来の記号によって適切に表現され、本明細書の記載の恩恵を有する当業者にとって直ちに明らかになるであろう詳細の開示を隠すことがないように、本発明の実施の形態を理解することに関連して、それらの具体的な詳細を示すのみである。
Claims (15)
- テキストを複数のテキストセグメントにセグメント化する方法であって、前記方法は、
少なくとも1つの分割ヒューリスティックを前記テキストに適用することによって得られた前記テキストの複数の分割点のうちの少なくとも1つの分割点に対応し、テキストの分割点の正しさを示す、前記テキストの妥当な分割点に対応する少なくとも1つの入力ラベルをユーザから受信するステップと、
受信された前記少なくとも1つの入力ラベルに基づいて前記複数の分割点を分析するステップと、
分析するステップに応じて、前記複数の分割点のうちのある分割点が、妥当な分割点を示すかどうかを検証するステップと、
前記検証に基づいて、妥当な分割点の組を前記複数の分割点のうちの少なくとも1つの分割点で更新するステップとを備え、前記妥当な分割点の組は、前記テキストを前記複数のテキストセグメントにセグメント化することを可能にし、
妥当な分割点は、前記テキストの前記複数のテキストセグメントのうちの少なくとも2つのテキストセグメントを分離し、
分析するステップは、入力ラベルに対応する分割点に前記複数の分割点をマッピングするステップと、
前記入力ラベルに対応する前記分割点によるマッピングに基づいて、前記複数の分割点のうちのある分割点に印付けするステップとを含み、
検証するステップは、入力ラベルに対応する分割点に信頼値を割当てるステップを含み、前記信頼値は、妥当な分割点を示す前記分割点の確率を示す、方法。 - 前記テキストはアラビア語のテキストである、請求項1に記載の方法。
- 前記テキストは画像の形式である、請求項1に記載の方法。
- 前記複数のテキストセグメントのうちのあるテキストセグメントは、文字、単語およびラインのうちの少なくとも1つを備える、請求項1に記載の方法。
- 入力ラベルは質問に対する回答であり、前記質問は前記少なくとも1つの分割点のうちのある分割点に対応して生成される、請求項1に記載の方法。
- 入力ラベルはバイナリ値であり、前記バイナリ値は分割点の妥当性を示す、請求項1に記載の方法。
- 検証するステップは、さらに、前記信頼値が予め定められたしきい値限界より上または下のいずれであるかを決定するステップを備える、請求項1に記載の方法。
- 更新するステップは、
前記妥当な分割点の組の中に、前記検証するステップにおける検証に基づく妥当な分割点である少なくとも1つの分割点を追加することで、前記妥当な分割点の組を更新するステップを備え、前記分割点の信頼値は、予め定められたしきい値限界より上である、請求項7に記載の方法。 - テキストを複数のテキストセグメントにセグメント化するためのコンピュータ読取可能なプログラムであって、前記コンピュータ読取可能なプログラムはコンピュータ上で実行されたときに、前記コンピュータに、
少なくとも1つの分割ヒューリスティックを前記テキストによって得られた前記テキストの複数の分割点のうちの少なくとも1つの分割点に対応し、テキストの分割点の正しさを示す、前記テキストの妥当な分割点に対応する少なくとも1つの入力ラベルをユーザから受信させ、
受信された前記少なくとも1つの入力ラベルに基づいて前記複数の分割点を分析させ、
分析に基づいて、前記複数の分割点のうちのある分割点が妥当な分割点を示すかどうかを検証させ、
前記検証に基づいて、妥当な分割点の組を複数の分割点のうちのある分割点で更新させ、
前記妥当な分割点の組は、前記テキストを、前記複数のテキストセグメントにセグメント化することを可能にし、
妥当な分割点は、前記テキストの前記複数のテキストセグメントのうちの少なくとも2つのテキストセグメントを分離し、
分析するステップは、入力ラベルに対応する分割点に前記複数の分割点をマッピングするステップと、
前記入力ラベルに対応する前記分割点によるマッピングに基づいて、前記複数の分割点のうちのある分割点に印付けするステップとを含み、
検証するステップは、入力ラベルに対応する分割点に信頼値を割当てるステップを含み、前記信頼値は、妥当な分割点を示す前記分割点の確率を示す、プログラム。 - 前記テキストはアラビア語のテキストである、請求項9に記載のプログラム。
- 前記プログラムは、さらに、
前記少なくとも1つの入力ラベルのうちのある入力ラベルに対応する分割点に信頼値を割当て、前記信頼値は妥当な分割点を示す前記分割点の確率であり、さらに、
前記信頼値がしきい値限界より上または下のいずれであるかを決定する
ことによって前記コンピュータに検証させる、請求項9に記載のプログラム。 - 前記プログラムは、さらに、
前記妥当な分割点の組の中の前記少なくとも1つの入力ラベルのうちのある入力ラベルに対応するある分割点を追加することによって前記コンピュータに更新させ、前記分割点の信頼値は、予め定められたしきい値限界より上である、請求項11に記載のプログラム。 - テキストを複数のテキストセグメントにセグメント化するためのシステムであって、前記システムは、
プロセッサを備え、前記プロセッサは、
少なくとも1つの分割ヒューリスティックを前記テキストに適用することによって得られた前記テキストの複数の分割点のうちの少なくとも1つの分割点に対応し、テキストの分割点の正しさを示す、前記テキストの妥当な分割点に対応する少なくとも1つの入力ラベルをユーザから受信し、
受信された前記少なくとも1つの入力ラベルに基づいて前記複数の分割点を分析し、
前記入力ラベルのラベル付けに応じて、前記複数の分割点のうちのある分割点が妥当な分割点を示すかどうかを検証し、
前記検証に基づいて、妥当な分割点の組を複数の分割点のうちの少なくとも1つの分割点で更新するように構成され、
前記妥当な分割点の組は、前記テキストを、前記複数のテキストセグメントにセグメント化することを可能にし、
前記システムは、さらに、前記妥当な分割点の組を記憶するためのメモリを備え、
前記プロセッサは、
入力ラベルに対応する分割点を前記複数の分割点でマッピングし、
前記入力ラベルに対応する前記分割点によるマッピングに基づいて前記複数の分割点のうちのある分割点に印付けする
ことによって分析するように構成され、
前記プロセッサは、
ある入力ラベルに対応する分割点に信頼値を割当てることによって検証するように構成され、前記信頼値は妥当な分割点を示す前記分割点の確率を示し、
さらに、前記プロセッサは、
前記信頼値が予め定められたしきい値限界より上または下のいずれであるかを決定するように構成される、システム。 - 前記テキストはアラビア語のテキストである、請求項13に記載のシステム。
- 前記プロセッサは、前記妥当な分割点の組の中の前記少なくとも1つの入力ラベルのうちのある入力ラベルに対応するある分割点を追加することによって、前記妥当な分割点の組を更新するように構成され、
前記分割点の信頼値は、予め定められたしきい値限界より上である、請求項13に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/102,373 US20120281919A1 (en) | 2011-05-06 | 2011-05-06 | Method and system for text segmentation |
US13/102,373 | 2011-05-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012234512A JP2012234512A (ja) | 2012-11-29 |
JP5634972B2 true JP5634972B2 (ja) | 2014-12-03 |
Family
ID=44351378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011246300A Expired - Fee Related JP5634972B2 (ja) | 2011-05-06 | 2011-11-10 | テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120281919A1 (ja) |
EP (1) | EP2521071A3 (ja) |
JP (1) | JP5634972B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160006682A1 (en) * | 2014-07-07 | 2016-01-07 | International Business Machines Corporation | Utilizing social networks for problem solving |
JP5979650B2 (ja) | 2014-07-28 | 2016-08-24 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 用語を適切な粒度で分割する方法、並びに、用語を適切な粒度で分割するためのコンピュータ及びそのコンピュータ・プログラム |
US9665786B2 (en) * | 2015-02-20 | 2017-05-30 | Conduent Business Services, Llc | Confirming automatically recognized handwritten answers |
CN107305630B (zh) * | 2016-04-25 | 2021-03-19 | 腾讯科技(深圳)有限公司 | 文本序列识别方法和装置 |
US20210034907A1 (en) * | 2019-07-29 | 2021-02-04 | Walmart Apollo, Llc | System and method for textual analysis of images |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4562594A (en) * | 1983-09-29 | 1985-12-31 | International Business Machines Corp. (Ibm) | Method and apparatus for segmenting character images |
JPH0610829B2 (ja) * | 1984-06-29 | 1994-02-09 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 手書き文字認識方法 |
EP0498978A1 (en) * | 1991-02-13 | 1992-08-19 | International Business Machines Corporation | Mechanical recognition of characters in cursive script |
US5442715A (en) * | 1992-04-06 | 1995-08-15 | Eastman Kodak Company | Method and apparatus for cursive script recognition |
JP3178686B2 (ja) * | 1992-10-22 | 2001-06-25 | 武藤工業株式会社 | パターン認識方法および装置 |
EP0609474A1 (en) * | 1993-02-03 | 1994-08-10 | International Business Machines Corporation | Method and apparatus for transforming an image for classification or pattern recognition |
US5812697A (en) * | 1994-06-10 | 1998-09-22 | Nippon Steel Corporation | Method and apparatus for recognizing hand-written characters using a weighting dictionary |
US5933525A (en) * | 1996-04-10 | 1999-08-03 | Bbn Corporation | Language-independent and segmentation-free optical character recognition system and method |
CN1173247C (zh) * | 1999-01-13 | 2004-10-27 | 国际商业机器公司 | 具有文字分割用户接口的手写信息处理系统 |
US6298154B1 (en) * | 1999-03-29 | 2001-10-02 | Eastman Kodak Company | Method for rendering improved personal handwriting |
WO2002037933A2 (en) * | 2000-11-08 | 2002-05-16 | New York University | System, process and software arrangement for recognizing handwritten characters |
US6950555B2 (en) * | 2001-02-16 | 2005-09-27 | Parascript Llc | Holistic-analytical recognition of handwritten text |
AUPR824501A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw003) |
US7174043B2 (en) * | 2003-02-25 | 2007-02-06 | Evernote Corp. | On-line handwriting recognizer |
US7424672B2 (en) * | 2003-10-03 | 2008-09-09 | Hewlett-Packard Development Company, L.P. | System and method of specifying image document layout definition |
ATE368895T1 (de) * | 2004-12-10 | 2007-08-15 | Ibm | System und verfahren zur verdeutlichung nicht diakritisierter arabischer wörter in einem text |
KR101145986B1 (ko) * | 2005-02-28 | 2012-05-21 | 지 데쿠마 아베 | 세그먼트화-기반 인식 |
RU2007135945A (ru) * | 2005-02-28 | 2009-04-10 | Зи Декума Аб (Se) | Граф распознавания |
US7657094B2 (en) * | 2005-12-29 | 2010-02-02 | Microsoft Corporation | Handwriting recognition training and synthesis |
US7657091B2 (en) * | 2006-03-06 | 2010-02-02 | Mitek Systems, Inc. | Method for automatic removal of text from a signature area |
US7724957B2 (en) * | 2006-07-31 | 2010-05-25 | Microsoft Corporation | Two tiered text recognition |
US20080136820A1 (en) * | 2006-10-20 | 2008-06-12 | Microsoft Corporation | Progressive cut: interactive object segmentation |
US8005294B2 (en) * | 2006-11-29 | 2011-08-23 | The Mitre Corporation | Cursive character handwriting recognition system and method |
US7974472B2 (en) * | 2007-06-29 | 2011-07-05 | Microsoft Corporation | Feature design for HMM based Eastern Asian character recognition |
CN101458681A (zh) * | 2007-12-10 | 2009-06-17 | 株式会社东芝 | 语音翻译方法和语音翻译装置 |
JP4565015B2 (ja) * | 2008-05-15 | 2010-10-20 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理システム、画像処理プログラムおよびその記録媒体 |
US8150160B2 (en) * | 2009-03-26 | 2012-04-03 | King Fahd University Of Petroleum & Minerals | Automatic Arabic text image optical character recognition method |
KR101468231B1 (ko) * | 2009-09-11 | 2014-12-04 | 삼성전자주식회사 | 라벨 검색 방법 및 장치 |
-
2011
- 2011-05-06 US US13/102,373 patent/US20120281919A1/en not_active Abandoned
- 2011-06-15 EP EP11004865.9A patent/EP2521071A3/en not_active Withdrawn
- 2011-11-10 JP JP2011246300A patent/JP5634972B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2521071A3 (en) | 2015-06-03 |
US20120281919A1 (en) | 2012-11-08 |
JP2012234512A (ja) | 2012-11-29 |
EP2521071A2 (en) | 2012-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10846553B2 (en) | Recognizing typewritten and handwritten characters using end-to-end deep learning | |
US10915788B2 (en) | Optical character recognition using end-to-end deep learning | |
US9286527B2 (en) | Segmentation of an input by cut point classification | |
US10133965B2 (en) | Method for text recognition and computer program product | |
US8340425B2 (en) | Optical character recognition with two-pass zoning | |
US20160371246A1 (en) | System and method of template creation for a data extraction tool | |
CN109766885B (zh) | 一种文字检测方法、装置、电子设备及存储介质 | |
EP3522038A1 (en) | Method for translating characters and apparatus therefor | |
JP5634972B2 (ja) | テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム | |
CN111507330B (zh) | 习题识别方法、装置、电子设备及存储介质 | |
KR101377601B1 (ko) | 모바일 카메라를 이용한 자연 영상 다국어 문자 인식과 번역 시스템 및 방법 | |
CN103606305A (zh) | 一种汉字书写学习系统 | |
WO2007094078A1 (ja) | 文字列検索方法およびその装置 | |
CN114092949A (zh) | 类别预测模型的训练、界面元素类别的识别方法及装置 | |
WO2023038722A1 (en) | Entry detection and recognition for custom forms | |
US9536180B2 (en) | Text recognition based on recognition units | |
US9418281B2 (en) | Segmentation of overwritten online handwriting input | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
JP2020087112A (ja) | 帳票処理装置および帳票処理方法 | |
CN115147846A (zh) | 多语言票据识别方法、装置、设备及存储介质 | |
CN111476090B (zh) | 水印识别方法和装置 | |
Sotoodeh et al. | A music symbols recognition method using pattern matching along with integrated projection and morphological operation techniques | |
CN112070092A (zh) | 一种验证码参数的获取方法及装置 | |
EP3757825A1 (en) | Methods and systems for automatic text segmentation | |
Kaur et al. | Adverse conditions and techniques for cross-lingual text recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130607 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20130607 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20130719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130917 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131209 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140318 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140708 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140716 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141015 |
|
LAPS | Cancellation because of no payment of annual fees |