JPS5960574A - 文字認識方式 - Google Patents
文字認識方式Info
- Publication number
- JPS5960574A JPS5960574A JP57169510A JP16951082A JPS5960574A JP S5960574 A JPS5960574 A JP S5960574A JP 57169510 A JP57169510 A JP 57169510A JP 16951082 A JP16951082 A JP 16951082A JP S5960574 A JPS5960574 A JP S5960574A
- Authority
- JP
- Japan
- Prior art keywords
- character
- circuit
- stroke
- kana
- strokes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(1)発明の技術分野
本発明は文字認識方式、特に手書きのひらがなや漢字を
光学的に読み取る光学文字読取装置の上記ひらがなと漢
字を判別する方式に関する。
光学的に読み取る光学文字読取装置の上記ひらがなと漢
字を判別する方式に関する。
(2)従来技術と問題点
従来の光学文字読取装置においては、ひらがなと漢字を
一つの手段で認識していたが、ひらがなと漢字とでは一
般的には両級等の収雑さ、曲線部分の多少のように明ら
かな相違点がみられる。
一つの手段で認識していたが、ひらがなと漢字とでは一
般的には両級等の収雑さ、曲線部分の多少のように明ら
かな相違点がみられる。
従って両者を同一手段で認識していだのでは、相違点が
明確に把握できずに、良好々認識結果が得られず、かつ
認識結果に対し、漢字のみから成る単語処理のような文
字の後処理も正確に行なうことはできないという問題点
があった。
明確に把握できずに、良好々認識結果が得られず、かつ
認識結果に対し、漢字のみから成る単語処理のような文
字の後処理も正確に行なうことはできないという問題点
があった。
(3)発明の目的
本発明の目的は、光学文字読取装置に入力されるひらが
なと漢字をそれぞれ別の認識手段で判別することにより
、ひらがなと漢字の認識精度を向上させかつ認識結果に
対する後処理の正確化を図ることにある。
なと漢字をそれぞれ別の認識手段で判別することにより
、ひらがなと漢字の認識精度を向上させかつ認識結果に
対する後処理の正確化を図ることにある。
(4)発明の構成
本発明によれば、光学文字読取装置に入力された文字の
・ンターンをその文字で取り囲まれたループの数と互い
に分離している部分である連結成分の截と水平垂直方向
に走査された文字の連続した部分である黒ランの数とに
よシ多画数の文字と少画数の文字に分類し、更に該多画
数の文字の輪郭を構成する所定の線分の集合である輪郭
線分系列によ多少画数の文字を多画数の漢字とひらがな
に分類することを特徴とする文字認識方式が提供される
。
・ンターンをその文字で取り囲まれたループの数と互い
に分離している部分である連結成分の截と水平垂直方向
に走査された文字の連続した部分である黒ランの数とに
よシ多画数の文字と少画数の文字に分類し、更に該多画
数の文字の輪郭を構成する所定の線分の集合である輪郭
線分系列によ多少画数の文字を多画数の漢字とひらがな
に分類することを特徴とする文字認識方式が提供される
。
(5)発明の実施例
以下、本発明を実施例によシ添付図面を参照して説明す
る。
る。
第1図は、本発明に係る文字認識方式を実施するだめの
回路構成図である。第1図の回路にひらがなと漢字から
成る文字Mが入力されると、先ずループ数連結成分数部
1と平均点ラン数部2によシ多画数漠字TK とそれ以
外の文字が判別され、輪郭線分系列部3によシ更に多画
数漢字SK とひらがなHとが判別されるようになって
いる。
回路構成図である。第1図の回路にひらがなと漢字から
成る文字Mが入力されると、先ずループ数連結成分数部
1と平均点ラン数部2によシ多画数漠字TK とそれ以
外の文字が判別され、輪郭線分系列部3によシ更に多画
数漢字SK とひらがなHとが判別されるようになって
いる。
ループ数連結成分数部1は、ループ数計数回路11と連
結成分数計数回路12と多画数・多画数判定回路13と
から構成されている。このうち、回路11と12はそれ
ぞれ第2図にて定義づけられるループAの数と連結成分
Bの数を計数する機能を有する。
結成分数計数回路12と多画数・多画数判定回路13と
から構成されている。このうち、回路11と12はそれ
ぞれ第2図にて定義づけられるループAの数と連結成分
Bの数を計数する機能を有する。
ループAは入力文字Mの文字部分で取ジ囲まれた部分を
いい、第2図の例ではその数は2つある。
いい、第2図の例ではその数は2つある。
また連結成分Bは入力文字Mの互いに分離している部分
をいい、第2図の例では破綜で示すように5つある。ま
た多画数・多画数判定回路13は入力文字Mの画数の多
少を判別する回路であり、他の平均黒ラン計数部2にも
この回路13は組み込まれており、多画数漢字TKと他
の文字を判別して該多画数漢字TKを抽出する(第1図
)。
をいい、第2図の例では破綜で示すように5つある。ま
た多画数・多画数判定回路13は入力文字Mの画数の多
少を判別する回路であり、他の平均黒ラン計数部2にも
この回路13は組み込まれており、多画数漢字TKと他
の文字を判別して該多画数漢字TKを抽出する(第1図
)。
平均点ラン数部2は平均黒ラン数計数回路21と多画数
・多画数判定回路22から成シ、前段のループ数連結成
分数部1と共に入力文字Mの複雑さの程度を判定する。
・多画数判定回路22から成シ、前段のループ数連結成
分数部1と共に入力文字Mの複雑さの程度を判定する。
黒ランCは第2図のX方向またはX方向に走介した場合
に走置対象たる文字の連続した部分をいい、X方向とX
方向のメツシー截をM、Nとすれで表わされる。
に走置対象たる文字の連続した部分をいい、X方向とX
方向のメツシー截をM、Nとすれで表わされる。
輪郭線分系列部3は輪郭線分系列抽出回路31と多画数
・ひらがな判定回路22から成り少両級漢字SKとひら
がなHを判別する機能を有する。
・ひらがな判定回路22から成り少両級漢字SKとひら
がなHを判別する機能を有する。
輪郭約分系列とは第3図に示すように入力文字MをX方
向(第3図(1))とX方向(第3図(2))に走有し
、文字の縁部において文字が開いているか(○印)閉じ
ているか(・印)の組み合わせでできる4つの線分の系
列(○と○、○と・、・と○、・と・)をいう。これら
線分系列を抽出することにより多画数・ひらがな判定回
路32に入力させ少両級漢字SKとひらがなHとを判別
しようとするものである。
向(第3図(1))とX方向(第3図(2))に走有し
、文字の縁部において文字が開いているか(○印)閉じ
ているか(・印)の組み合わせでできる4つの線分の系
列(○と○、○と・、・と○、・と・)をいう。これら
線分系列を抽出することにより多画数・ひらがな判定回
路32に入力させ少両級漢字SKとひらがなHとを判別
しようとするものである。
上記hi成を有する回路に入力された文字Mのパターン
は先ずループ数連結成分数部1と平均点ラン数部2によ
多画数の多い漢字TKとそれ以外の文字に分類される。
は先ずループ数連結成分数部1と平均点ラン数部2によ
多画数の多い漢字TKとそれ以外の文字に分類される。
そしてそれ以外の文字は比較的特徴が少ないので、更に
詳細な認識機能を有する輪郭線分系列部3によ多画数の
少ない漢字SKとひらがな■(とに分類する。
詳細な認識機能を有する輪郭線分系列部3によ多画数の
少ない漢字SKとひらがな■(とに分類する。
(6)発明の効果
上記の通シ、本発明によれば、光学文字読取装置に入力
されるひらがなと漢字をそれぞれ別の認識手段C判別す
ることができるので、ひらがなと漢字の認識精度を向上
さぜかつそれにもとづく後処理の正確化も図れることが
できる。
されるひらがなと漢字をそれぞれ別の認識手段C判別す
ることができるので、ひらがなと漢字の認識精度を向上
さぜかつそれにもとづく後処理の正確化も図れることが
できる。
第1図は本発明に係る文字認識方式を実施するだめの回
路構成図、第2図と第3図は第1図に示す回路の概念説
明図である。 1・・・ループ数連結成分数部、2・・・平均点ラン数
部、3・・・輪郭線分系列部、11・・・ループ数計数
回路、12・・・連結成分数計数回路、13・・・多画
数・少画裁判定回路、21・・・平均黒ラン数計数回路
、22・・・多画数・多画数判定回路、31・・・輪郭
線分系列抽出回路、32・・・多画数・ひらがな判定回
路。 第3胃1(1) (2)↓ 手続補正書(自発) 昭和57年10月220 特許庁長官 若杉和夫 殿 1、事件の表示 昭和57年 特許願 第169510号2、発明の名称 文字認識方式 3、補正をする者 事件との関係 特許出願人 名称 (522)富士通株式会社 4、代理人 (外 3名) 5、補正の対象 図面全図 6、補正の内容 旧式図面を遺児Ltす。 (内容に変更なし) 7、添付書類の目録 正式図面 1通・
路構成図、第2図と第3図は第1図に示す回路の概念説
明図である。 1・・・ループ数連結成分数部、2・・・平均点ラン数
部、3・・・輪郭線分系列部、11・・・ループ数計数
回路、12・・・連結成分数計数回路、13・・・多画
数・少画裁判定回路、21・・・平均黒ラン数計数回路
、22・・・多画数・多画数判定回路、31・・・輪郭
線分系列抽出回路、32・・・多画数・ひらがな判定回
路。 第3胃1(1) (2)↓ 手続補正書(自発) 昭和57年10月220 特許庁長官 若杉和夫 殿 1、事件の表示 昭和57年 特許願 第169510号2、発明の名称 文字認識方式 3、補正をする者 事件との関係 特許出願人 名称 (522)富士通株式会社 4、代理人 (外 3名) 5、補正の対象 図面全図 6、補正の内容 旧式図面を遺児Ltす。 (内容に変更なし) 7、添付書類の目録 正式図面 1通・
Claims (1)
- 光学文字読取装置に入力された文字のパターンをその文
字で取シ囲まれたループの数と互いに分離している部分
である連結成分の数と水平垂直方向に走査された文字の
連続した部分である黒ランの斂とによシ多画数の文字と
少画数の文字に分類し、更に該少画数の文字の輪郭を構
成する所定の縮分の集合である輪郭線分系列によシ少画
数の文字を少画数の漢字とひらがなに分類することを特
徴とする文字認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57169510A JPS5960574A (ja) | 1982-09-30 | 1982-09-30 | 文字認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57169510A JPS5960574A (ja) | 1982-09-30 | 1982-09-30 | 文字認識方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5960574A true JPS5960574A (ja) | 1984-04-06 |
JPH0425588B2 JPH0425588B2 (ja) | 1992-05-01 |
Family
ID=15887845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57169510A Granted JPS5960574A (ja) | 1982-09-30 | 1982-09-30 | 文字認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5960574A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6146573A (ja) * | 1984-08-10 | 1986-03-06 | Fujitsu Ltd | 文字認識装置 |
JPS6160188A (ja) * | 1984-08-31 | 1986-03-27 | Fujitsu Ltd | 文字認識装置 |
EP0621552A2 (en) * | 1993-04-19 | 1994-10-26 | Xerox Corporation | Method and apparatus for automatic character script determination |
EP0621541A3 (en) * | 1993-04-19 | 1995-05-17 | Xerox Corp | Method and device for automatic speech recognition. |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS502430A (ja) * | 1973-05-08 | 1975-01-11 |
-
1982
- 1982-09-30 JP JP57169510A patent/JPS5960574A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS502430A (ja) * | 1973-05-08 | 1975-01-11 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6146573A (ja) * | 1984-08-10 | 1986-03-06 | Fujitsu Ltd | 文字認識装置 |
JPS6160188A (ja) * | 1984-08-31 | 1986-03-27 | Fujitsu Ltd | 文字認識装置 |
EP0621552A2 (en) * | 1993-04-19 | 1994-10-26 | Xerox Corporation | Method and apparatus for automatic character script determination |
EP0621541A3 (en) * | 1993-04-19 | 1995-05-17 | Xerox Corp | Method and device for automatic speech recognition. |
EP0621552A3 (en) * | 1993-04-19 | 1995-05-17 | Xerox Corp | Method and apparatus for automatic determination of entries. |
Also Published As
Publication number | Publication date |
---|---|
JPH0425588B2 (ja) | 1992-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4454789B2 (ja) | 帳票分類方法及び装置 | |
EP1016033B1 (en) | Automatic language identification system for multilingual optical character recognition | |
US5369714A (en) | Method and apparatus for determining the frequency of phrases in a document without document image decoding | |
EP0854434B1 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
EP1146478A2 (en) | A method for extracting titles from digital images | |
Tan et al. | Text extraction using pyramid | |
CN102915438A (zh) | 一种视频字幕的提取方法及装置 | |
CN103455823A (zh) | 一种基于分类模糊及图像分割的英文字符识别方法 | |
JPS5960574A (ja) | 文字認識方式 | |
Saitoh et al. | Document image segmentation and text area ordering | |
C. Correia et al. | Balloon extraction from complex comic books using edge detection and histogram scoring | |
KR100243350B1 (ko) | 뉴스 비디오 자막 추출 및 인식 방법 | |
JPS62224870A (ja) | 文書画像処理方法 | |
JPS60153574A (ja) | 文字読取方法 | |
Das Bebartta et al. | Algorithm for segmenting script-dependant portion in a bilingual Optical Character Recognition system | |
JPH0660224A (ja) | 光学式文字読取装置 | |
Ohta et al. | Table-structure recognition method using neural networks for implicit ruled line estimation and cell estimation | |
JP2728086B2 (ja) | 文字切り出し方法 | |
Kuo et al. | A new method for the segmentation of mixed handprinted Chinese/English characters | |
JP2728085B2 (ja) | 文字切り出し方法 | |
JP2570415B2 (ja) | 文字切り出し方法 | |
JPS60110089A (ja) | 文字認識装置 | |
Ariki et al. | Extraction and Recognition of Open Captions Superimposed on TV News Articles | |
Wang et al. | Document segmentation and classification with top-down approach | |
JP2578415B2 (ja) | 文字認識方法 |