JP2014106961A - アラビア語テキストを自動的に認識するためのコンピュータによって実行される方法、およびコンピュータプログラム - Google Patents
アラビア語テキストを自動的に認識するためのコンピュータによって実行される方法、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2014106961A JP2014106961A JP2013118680A JP2013118680A JP2014106961A JP 2014106961 A JP2014106961 A JP 2014106961A JP 2013118680 A JP2013118680 A JP 2013118680A JP 2013118680 A JP2013118680 A JP 2013118680A JP 2014106961 A JP2014106961 A JP 2014106961A
- Authority
- JP
- Japan
- Prior art keywords
- pixels
- column
- pixel value
- arabic
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
- G06V30/2276—Character recognition characterised by the type of writing of cursive writing using stroke segmentation with probabilistic networks, e.g. hidden Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/293—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】アラビア語の文字のラインがデジタル化されることにより、各々が2進数で表現された画素値に関連付けられた二次元の画素の配列が形成される。画素値は2進数で表現される。さらに、アラビア語の文字のラインが複数のライン画像へと分割されて、複数のライン画像の中の1つにおいて複数のセルが規定される。複数のセルの各々は、隣接した画素のグループを有する。さらに、複数のライン画像の中の1つにおいて複数のセルの各々の画素の画素値がシリアル化されることにより、2値セル番号が形成される。また、複数のライン画像の中の1つにおける複数のセルから取得された2値セル番号に従ってテキスト特徴ベクトルが形成される。そして、テキスト特徴ベクトルが隠れマルコフモデルに送られることによりアラビア語の文字のラインが認識される。
【選択図】図1
Description
本願は、概して、アラビア語テキストの自動的な認識に関する。
概略的な側面において、本願発明は、アラビア語テキストを自動的に認識するための方法に関する。当該方法は、アラビア語の文字のラインを含むテキスト画像を取得することと、アラビア語の文字のラインをデジタル化することにより、各々が画素値に関連付けられた二次元的の画素の配列を形成することとを含み、画素値は2進数で表現され、上記方法は、さらに、アラビア語の文字のラインを複数のライン画像へと分割することと、複数のライン画像の中の1つにおいて複数のセルを規定することとを含み、複数のセルの各々は、隣接した画素のグループを有し、上記方法は、さらに、複数のライン画像の中の1つにおいて複数のセルの各々の画素の画素値をシリアル化することにより2値セル番号を形成することと、複数のライン画像の中の1つにおける複数のセルから取得された2値セル番号に従ってテキスト特徴ベクトルを形成することと、テキスト特徴ベクトルを隠れマルコフモデル(Hidden Markov Model)に送ることによりアラビア語の文字のラインを認識することとを含む。
以下の図面は、出願書類に組込まれかつその一部を形成し、本願発明の実施例を説明し、かつ、明細書とともに、発明の本質を説明するために供される。
図1は、本発明に従ったアラビア語のテキスト認識の概略的な流れを説明する。図1〜図3Cを参照して、アラビア語のテキスト文書から、テキスト画像200が取得される(図1のステップ110)。テキスト画像200におけるアラビア語テキストは、複数のテキストライン211−214に配置され得、その各々は、筆記体のアラビア語の文字のストリングを含む。テキストライン211−214は、複数のライン画像311−313へと分割される(図1のステップ120)。ライン画像311,312,または313は、それから、各々が画素値を割り当てられた画素321−323へと分割される(図1のステップ130)。ライン画像311,312,または313の幅は、2画素と100画素との間の範囲にあり得、または、3画素と10画素との間の範囲にあり得る。ライン画像311,312,または313は、完全な文字、部分的な文字、または結合した文字を含み得る。
Claims (16)
- アラビア語テキストを自動的に認識するための、コンピュータによって実行される方法であって、
アラビア語の文字のラインを含むテキスト画像を取得することと、
当該アラビア語の文字のラインをデジタル化することにより、各々が2進数で表現された画素値に関連付けられた二次元の画素の配列を形成することとを備え、前記二次元の画素の配列は、第1の方向における複数の行と第2の方向における複数の列とを含み、
前記方法は、さらに、
画素の列における画素のストリング中の同じ画素値の連続する画素の頻度をカウントすることを備え、各々が異なる画素値を有する隣接した画素のストリングは、それらの間での遷移によって規定され、前記カウントすることは、さらに、
列の遷移数が予め定められた足切遷移番号に達したときに、当該列における同じ画素値の連続する画素の頻度のカウントを停止することと、
前記画素の列におけるストリングから取得される頻度カウントを用いてテキスト特徴ベクトルを形成することと、
当該テキスト特徴ベクトルを隠れマルコフモデルに送ることによりアラビア語の文字のラインを認識することとを備える、方法。 - 前記アラビア語の文字のラインは、複数のアラビア語の単語を含む、請求項1に記載のコンピュータによって実行される方法。
- 前記テキスト特徴ベクトルは、前記画素の列における連続する画素のストリングから取得された一連の頻度カウントによって形成される、請求項1に記載のコンピュータによって実行される方法。
- 前記予め定められた足切遷移番号は、前記アラビア語の文字のラインをデジタル化するステップに先立つ、アラビア語テキストについての統計的解析によって取得される、請求項1に記載のコンピュータによって実行される方法。
- 前記予め定められた足切遷移番号は6である、請求項1に記載のコンピュータによって実行される方法。
- 前記二次元の配列における画素値は、単一のビットの2進数で表現される、請求項1に記載のコンピュータによって実行される方法。
- 前記頻度をカウントすることは、
列における最初の1またはそれ以上の画素の画素値が「0」であるときに、第1の頻度カウントの値に「0」を割り当てることを含み、前記第1の頻度カウントの次に、当該列の初めに画素値「0」を有する連続した画素の数が続く、請求項6に記載のコンピュータによって実行される方法。 - 前記頻度をカウントすることは、
列の頂点の1またはそれ以上の画素の画素値が「1」であるときに、第1の頻度カウントの値として「0」を割り当てることを含み、前記第1の頻度カウントの次に、当該列の初めに画素値「1」を有する連続した画素の数が続く、請求項6に記載のコンピュータによって実行される方法。 - コンピュータに以下のことを実行させるためのコンピュータ読取可能なプログラムであって、プログラムコード関数を含み、前記プログラムコード関数は、コンピュータに、
アラビア語の文字のラインを含むテキスト画像を取得させ、
アラビア語の文字のラインをデジタル化させることにより、各々が2進数で表現された画素値に関連付けられた二次元の画素の配列を形成させ、前記二次元の画素の配列は、第1の方向における複数の行と第2の方向における複数の列とを含み、
前記プログラムコード関数は、さらに、前記コンピュータに、画素の列における画素のストリング中の同じ画素値の連続する画素の頻度をカウントさせ、各々が異なる画素値を有する隣接した画素のストリングはそれらの間での遷移によって規定され、前記カウントするステップは、さらに、前記列における遷移の数が予め定められた足切遷移番号に到達したときに、同じ画素値の連続する画素の頻度のカウントを停止することを含み、
前記プログラムコード関数は、前記コンピュータに、
前記画素列におけるストリングから取得される頻度カウントを用いてテキスト特徴ベクトルを形成することと、
前記テキスト特徴ベクトルを隠れマルコフモデルに送ることによりアラビア語の文字のラインを認識することとを実行させる、コンピュータプログラム。 - 前記アラビア語の文字のラインラインは、複数のアラビア語の単語を含む、請求項9に記載のコンピュータプログラム。
- 前記テキスト特徴ベクトルは、前記画素の列における連続する画素のストリングから取得された一連の頻度カウントによって形成される、請求項9に記載のコンピュータプログラム。
- 前記予め定められた足切遷移番号は、前記アラビア語の文字のラインをデジタル化するステップに先立つ、アラビア語テキストについての統計的解析によって取得される、請求項9に記載のコンピュータプログラム。
- 前記予め定められた足切遷移番号は6である、請求項9に記載のコンピュータプログラム。
- 前記二次元の配列における画素値は、単一のビットの2進数で表現される、請求項9に記載のコンピュータプログラム。
- 前記頻度をカウントするステップは、
列における最初の1またはそれ以上の画素の画素値が「0」であるときに、第1の頻度カウントの値に「0」を割り当てることを含み、前記第1の頻度カウントの次に、当該列の初めに画素値「0」を有する連続した画素の数が続く、請求項9に記載のコンピュータプログラム。 - 前記頻度をカウントするステップは、
列の頂点の1またはそれ以上の画素の画素値が「1」であるときに、第1の頻度カウントの値として「0」を割り当てることを含み、前記第1の頻度カウントの次に、当該列の初めに画素値「1」を有する連続した画素の数が続く、請求項9に記載のコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/430,773 US8111911B2 (en) | 2009-04-27 | 2009-04-27 | System and methods for arabic text recognition based on effective arabic text feature extraction |
US13/685,088 US8472707B2 (en) | 2009-04-27 | 2012-11-26 | System and methods for Arabic text recognition based on effective Arabic text feature extraction |
US13/685,088 | 2012-11-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014106961A true JP2014106961A (ja) | 2014-06-09 |
JP2014106961A5 JP2014106961A5 (ja) | 2016-06-23 |
Family
ID=42992189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013118680A Pending JP2014106961A (ja) | 2009-04-27 | 2013-06-05 | アラビア語テキストを自動的に認識するためのコンピュータによって実行される方法、およびコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (5) | US8111911B2 (ja) |
JP (1) | JP2014106961A (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8111922B2 (en) * | 2007-06-08 | 2012-02-07 | Microsoft Corporation | Bi-directional handwriting insertion and correction |
US8111911B2 (en) * | 2009-04-27 | 2012-02-07 | King Abdulaziz City For Science And Technology | System and methods for arabic text recognition based on effective arabic text feature extraction |
US9014477B2 (en) * | 2011-10-27 | 2015-04-21 | King Abdulaziz City for Science and Technology (KACST) | Method and apparatus for automatically identifying character segments for character recognition |
US9064191B2 (en) | 2012-01-26 | 2015-06-23 | Qualcomm Incorporated | Lower modifier detection and extraction from devanagari text images to improve OCR performance |
US20130194448A1 (en) * | 2012-01-26 | 2013-08-01 | Qualcomm Incorporated | Rules for merging blocks of connected components in natural images |
EP2662802A1 (en) * | 2012-05-09 | 2013-11-13 | King Abdulaziz City for Science & Technology (KACST) | Method and system for preprocessing an image for optical character recognition |
US9262699B2 (en) | 2012-07-19 | 2016-02-16 | Qualcomm Incorporated | Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR |
US9076242B2 (en) | 2012-07-19 | 2015-07-07 | Qualcomm Incorporated | Automatic correction of skew in natural images and video |
US9047540B2 (en) | 2012-07-19 | 2015-06-02 | Qualcomm Incorporated | Trellis based word decoder with reverse pass |
US9141874B2 (en) | 2012-07-19 | 2015-09-22 | Qualcomm Incorporated | Feature extraction and use with a probability density function (PDF) divergence metric |
US9014480B2 (en) | 2012-07-19 | 2015-04-21 | Qualcomm Incorporated | Identifying a maximally stable extremal region (MSER) in an image by skipping comparison of pixels in the region |
JP5986051B2 (ja) * | 2013-05-12 | 2016-09-06 | キング・アブドゥルアジズ・シティ・フォー・サイエンス・アンド・テクノロジー(ケイ・エイ・シィ・エス・ティ)King Abdulaziz City For Science And Technology (Kacst) | アラビア語テキストを自動的に認識するための方法 |
US9495620B2 (en) | 2013-06-09 | 2016-11-15 | Apple Inc. | Multi-script handwriting recognition using a universal recognizer |
US9465985B2 (en) | 2013-06-09 | 2016-10-11 | Apple Inc. | Managing real-time handwriting recognition |
CN103294817A (zh) * | 2013-06-13 | 2013-09-11 | 华东师范大学 | 一种基于类别分布概率的文本特征抽取方法 |
WO2014204336A1 (en) * | 2013-06-18 | 2014-12-24 | Abbyy Development Llс | Methods and systems that build a hierarchically organized data structure containing standard feature symbols for conversion of document images to electronic documents |
RU2631168C2 (ru) * | 2013-06-18 | 2017-09-19 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и устройства, которые преобразуют изображения документов в электронные документы с использованием trie-структуры данных, содержащей непараметризованные символы для определения слов и морфем на изображении документа |
DK179329B1 (en) | 2016-06-12 | 2018-05-07 | Apple Inc | Handwriting keyboard for monitors |
US10062001B2 (en) * | 2016-09-29 | 2018-08-28 | Konica Minolta Laboratory U.S.A., Inc. | Method for line and word segmentation for handwritten text images |
CN108073679B (zh) * | 2017-11-10 | 2021-09-28 | 中国科学院信息工程研究所 | 一种串匹配场景下随机模式串集合生成方法、设备和可读存储介质 |
CN107967314B (zh) * | 2017-11-22 | 2022-01-21 | 珠海市君天电子科技有限公司 | 文本特征值的提取方法、装置及电子设备 |
US10565443B2 (en) * | 2018-02-16 | 2020-02-18 | Wipro Limited | Method and system for determining structural blocks of a document |
US10699112B1 (en) * | 2018-09-28 | 2020-06-30 | Automation Anywhere, Inc. | Identification of key segments in document images |
US11194467B2 (en) | 2019-06-01 | 2021-12-07 | Apple Inc. | Keyboard management user interfaces |
CN113254654B (zh) * | 2021-07-05 | 2021-09-21 | 北京世纪好未来教育科技有限公司 | 模型训练、文本识别方法、装置、设备和介质 |
US11914943B1 (en) | 2022-08-22 | 2024-02-27 | Oracle International Corporation | Generating an electronic document with a consistent text ordering |
CN116523544B (zh) * | 2023-06-25 | 2023-11-14 | 江西省机电设备招标有限公司 | 一种软件价格测算方法、系统、存储介质以及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008138356A2 (en) * | 2007-05-15 | 2008-11-20 | The Engineering Company For The Development Of Computer Systems ; (Rdi) | System and method for arabic omni font written optica character recognition |
JP2009545807A (ja) * | 2006-07-31 | 2009-12-24 | マイクロソフト コーポレーション | 2段階テキスト認識 |
US20100246963A1 (en) * | 2009-03-26 | 2010-09-30 | Al-Muhtaseb Husni A | Automatic arabic text image optical character recognition method |
US20100272361A1 (en) * | 2009-04-27 | 2010-10-28 | Khorsheed Mohammad S | System and methods for arabic text recognition based on effective arabic text feature extraction |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0498978A1 (en) * | 1991-02-13 | 1992-08-19 | International Business Machines Corporation | Mechanical recognition of characters in cursive script |
US5933525A (en) * | 1996-04-10 | 1999-08-03 | Bbn Corporation | Language-independent and segmentation-free optical character recognition system and method |
ATE368895T1 (de) * | 2004-12-10 | 2007-08-15 | Ibm | System und verfahren zur verdeutlichung nicht diakritisierter arabischer wörter in einem text |
-
2009
- 2009-04-27 US US12/430,773 patent/US8111911B2/en not_active Expired - Fee Related
-
2011
- 2011-12-14 US US13/325,789 patent/US8369612B2/en not_active Expired - Fee Related
-
2012
- 2012-11-26 US US13/685,088 patent/US8472707B2/en active Active
-
2013
- 2013-05-12 US US13/892,289 patent/US8761500B2/en not_active Expired - Fee Related
- 2013-06-05 JP JP2013118680A patent/JP2014106961A/ja active Pending
-
2014
- 2014-04-23 US US14/259,309 patent/US8908961B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009545807A (ja) * | 2006-07-31 | 2009-12-24 | マイクロソフト コーポレーション | 2段階テキスト認識 |
WO2008138356A2 (en) * | 2007-05-15 | 2008-11-20 | The Engineering Company For The Development Of Computer Systems ; (Rdi) | System and method for arabic omni font written optica character recognition |
US20100246963A1 (en) * | 2009-03-26 | 2010-09-30 | Al-Muhtaseb Husni A | Automatic arabic text image optical character recognition method |
US20100272361A1 (en) * | 2009-04-27 | 2010-10-28 | Khorsheed Mohammad S | System and methods for arabic text recognition based on effective arabic text feature extraction |
US20120087584A1 (en) * | 2009-04-27 | 2012-04-12 | Khorsheed Mohammad S | System and methods for arabic text recognition based on effective arabic text feature extraction |
Also Published As
Publication number | Publication date |
---|---|
US20130251247A1 (en) | 2013-09-26 |
US20130077864A1 (en) | 2013-03-28 |
US20100272361A1 (en) | 2010-10-28 |
US8369612B2 (en) | 2013-02-05 |
US8111911B2 (en) | 2012-02-07 |
US20120087584A1 (en) | 2012-04-12 |
US8761500B2 (en) | 2014-06-24 |
US20140219562A1 (en) | 2014-08-07 |
US8472707B2 (en) | 2013-06-25 |
US8908961B2 (en) | 2014-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014106961A (ja) | アラビア語テキストを自動的に認識するためのコンピュータによって実行される方法、およびコンピュータプログラム | |
US10936862B2 (en) | System and method of character recognition using fully convolutional neural networks | |
JP2667954B2 (ja) | 静的及び動的パラメータを使用する自動手書き文字認識装置及び方法 | |
KR101376863B1 (ko) | 문서 시각 구조의 문법 분석 | |
JP4504702B2 (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
Mathew et al. | Benchmarking scene text recognition in Devanagari, Telugu and Malayalam | |
CN110114776B (zh) | 使用全卷积神经网络的字符识别的系统和方法 | |
Oni et al. | Computational modelling of an optical character recognition system for Yorùbá printed text images | |
Jayanthi et al. | Recognition of HandwrittenWords from DigitalWriting Pad Using MMU-SNet. | |
Ashraf et al. | An analysis of optical character recognition (ocr) methods | |
JP5986051B2 (ja) | アラビア語テキストを自動的に認識するための方法 | |
Ajao et al. | Hidden markov model approach for offline Yoruba handwritten word recognition | |
EP2735999A2 (en) | Systems and methods for arabic text recognition based on effective arabic text feature extraction | |
O’Brien et al. | Optical character recognition | |
Thuon et al. | Syllable Analysis Data Augmentation for Khmer Ancient Palm leaf Recognition | |
RU2792743C1 (ru) | Идентификация используемых в документах систем письма | |
Dutta | Handwritten word recognition for Indic & Latin scripts using deep CNN-RNN hybrid networks | |
JP5853488B2 (ja) | 情報処理装置およびプログラム | |
Nakarmi et al. | Nepal Script Text Recognition Using CRNN CTC Architecture | |
Win et al. | OCRMPD: OCR system for Myanmar printed document image with a novel segmentation method and hierarchical classification scheme | |
CN102142088B (zh) | 基于有效阿拉伯文特征提取的阿拉伯文识别方法及系统 | |
Shah et al. | Word-Level Devanagari Text Recognition | |
CN115862038A (zh) | 一种基于端到端神经网络的木板印刷满文识别方法 | |
Goni et al. | Scientific African | |
Levkov et al. | Transfer Learning for Russian Handwriting Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160510 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20160510 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160726 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161221 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170221 |