JPH0766413B2 - Document character direction detection device - Google Patents

Document character direction detection device

Info

Publication number
JPH0766413B2
JPH0766413B2 JP20398390A JP20398390A JPH0766413B2 JP H0766413 B2 JPH0766413 B2 JP H0766413B2 JP 20398390 A JP20398390 A JP 20398390A JP 20398390 A JP20398390 A JP 20398390A JP H0766413 B2 JPH0766413 B2 JP H0766413B2
Authority
JP
Japan
Prior art keywords
document
direction
run
run length
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20398390A
Other languages
Japanese (ja)
Other versions
JPH0490082A (en
Inventor
豊 中村
Original Assignee
富士ゼロックス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士ゼロックス株式会社 filed Critical 富士ゼロックス株式会社
Priority to JP20398390A priority Critical patent/JPH0766413B2/en
Publication of JPH0490082A publication Critical patent/JPH0490082A/en
Publication of JPH0766413B2 publication Critical patent/JPH0766413B2/en
Anticipated expiration legal-status Critical
Application status is Expired - Fee Related legal-status Critical

Links

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION 【産業上の利用分野】 BACKGROUND OF THE INVENTION

文書画像認識装置等のページ単位の文書画像を処理する画像処理装置等に適用可能な入力画像の文書文字方向検出装置に関する。 Regarding the document character direction detection apparatus applicable input image to an image processing apparatus that processes the document image for each page of such document image recognition apparatus.

【従来の技術】 BACKGROUND OF THE INVENTION

文字認識を行なう場合、入力された文書が縦書きであるか、横書きであるかにより、文字の切りだし方向等の処理が異なるため、入力画像の文字の方向を抽出する技術が必要となる。 When performing character recognition, or document input is written vertically, depending on whether it is horizontal, because the processing of such direction cut out characters are different, it is necessary technique for extracting the direction of characters in the input image. 特に、文字認識を一歩進めた文書の構造解析を行なう場合は必須の技術となる。 Particularly, when performing a structural analysis of a document advanced character recognition step is essential techniques. 従来は、入力文書の縦方向、横方向の周辺分布を用いて空白行を検出することにより文字方向を判定していた(例えば、電子通信学会研究報告(信学技報)PRL80−7 Conventionally, the vertical direction of the input document, the peripheral distribution of the transverse direction using a was determined character direction by detecting a blank line (e.g., Institute of Electronics and Communication Engineers Research Report (IEICE) PRL80-7
0、PP9−16参照)。 0, see PP9-16).

【発明が解決しようとする課題】 [Problems that the Invention is to Solve

この従来技術により、第13図(a)に示すように、文字のみの簡単な段組であれば周辺分布により文字方向の判定ができた。 This prior art, as shown in FIG. 13 (a), was able to character direction determination by marginal distribution if a simple multi-column characters only. しかし、第13図(b)に示すような中間調、図表を含んだ原稿、あるいは同図(c)に示すような複雑な段組の原稿では周辺分布により文字方向の判定をすることは困難であった。 However, the 13th halftone as shown in Figure (b), is a complex multi-column document shown in the document containing the chart or drawing, (c) the determination of the character direction by marginal distribution difficult Met. 本発明は、このような従来技術の問題点を解決することを目的とするものである。 The present invention aims to solve the problems of the prior art. すなわち、本発明は文字のみの簡単な原稿のみでなく、中間調や図表の混在した原稿、段組の複雑な原稿も正確に文書の文字方向を検出することのできる文書文字方向検出装置を提供することを目的とするものである。 That is, the present invention is not only simple document character only, provide a document character direction detection device capable mixed original halftone and diagrams, of detecting a character direction of the multi-column complex document also accurately document it is an object of the present invention to be.

【課題を解決するための手段】 In order to solve the problems]

上記目的を達成するために、本発明は、第1図に示すように、2値画像において互いに関連する画素群を単位領域として求める画素領域化手段1と、各隣接する単位領域間の空白領域の縦方向および横方向のランレングスを求めるランレングス検出手段2と、縦方向および横方向のランレングスの出現頻度分布の特徴を抽出するランレングス頻度分布特徴抽出手段3と、抽出された縦および横方向のランレングスの出現頻度分布の特徴を比較して文書の文字の方向を判定する方向判定手段4とを備えたものである。 To achieve the above object, the present invention is, as shown in FIG. 1, a pixel region means 1 for determining the relevant group of pixels as a unit area each other in the binary image, a blank region between the adjacent unit area vertical to the direction and run-length detection means 2 for determining the lateral run-length, the run length frequency distribution feature extracting means 3 for extracting the vertical and horizontal features of the appearance frequency distribution of the run length, the extracted vertical and comparing the lateral aspect of the appearance frequency distribution of the run lengths is obtained and a determining direction determination unit 4 in the direction of characters in the document.

【作用】 [Action]

第9図は文書画像の一例であり、文書は文字、中間調、 Figure 9 is an example of a document image, the document character, halftone,
図形等から構成されている。 It is constructed from graphics, and the like. ここで文字に着目すると、 Now attention is paid to the character,
文字は行を構成し、横書きの場合、縦方向の文字(行) Character constitutes a row, in the case of horizontal writing, vertical character (line)
間隔よりも横方向の文字間隔が狭い。 Character spacing in the lateral direction is narrower than the distance. 逆に縦書きの場合、横方向の文字(行)間隔よりも縦方向の文字間隔が狭い特性を示す。 For vertical in opposite longitudinal character spacing than horizontal character (line) spacing a narrow characteristics. 本発明はこの特性に着目して、文字間隔の計測を基に文書の文字の方向を検出するものである。 The present invention focuses on this property, and detects the direction of the characters of the document on the basis of the measurement of the character spacing. 画素領域化手段1は、入力画像において互いに関連する画素群、例えば1文字を構成する画素群、一つの表や図形、を構成する画素群を単位領域として検出する。 Pixel region means 1 are each associated pixel group in the input image, for example, to detect pixels that constitute one character, the group of pixels constituting one table and figures, as the unit area. 画素群から単位領域を抽出する方法としては、例えば画素群の外接矩形を求めこれを単位領域とする外接矩形化処理がある。 As a method of extracting a unit region from the pixel group, it is circumscribed rectangle process to which the unit area determine the circumscribed rectangle of the example pixel groups. 第10図は画素群を単位領域化(外接矩形化)処理した結果の一例を示すものである。 FIG. 10 shows an example of a result obtained by the unit area of ​​(circumscribed rectangle of) processing the groups of pixels. 次にランレングス検出手段2により各隣接する単位領域間の空白領域の縦方向および横方向のランレングスを求める。 Then determine the longitudinal and lateral run-length of the blank region between the adjacent unit areas by the run-length detection unit 2. ランレングス頻度分布特徴抽出手段3は、ランレングス検出手段2により求めたランレングスから、縦方向および横方向のそれぞれにつきランレングスの出現頻度の分布を求め、その特徴例えば頻度のピーク値を求める。 Run length frequency distribution characteristic extracting unit 3, the run length determined by the run-length detection means 2 obtains a distribution of appearance frequency of the run length per each longitudinal and transverse directions, obtains the peak value of that feature for example frequency. 方向判定手段4は、ランレングス頻度分布特徴抽出手段3により求めた縦横の出現頻度の特徴(ピーク値)を比較し、入力された文書が縦書きであるか、横書きであるかを判定する。 Direction determination means 4 compares the run length frequency distribution characteristic extraction means 3 by the appearance frequency of vertical and horizontal determined characteristic (peak value), whether the input document is written vertically, determines whether the horizontal. 第10図および第11図に横書きおよび縦書きの場合のそれぞれの出現頻度の分布の例を示すが、これらの図から明らかなように横方向および縦方向の白ランのランレングスの頻度のピーク値の大小関係は、横書き文書の場合と縦書き文書の場合で逆になっており、従って、方向判定手段4は上記大小関係を調べることにより判定を行なうことができるのである。 FIGS. 10 and 11 show examples of the distribution of each frequency in the case figure of horizontal and vertical, the peak frequency of the run length of these horizontal and vertical white run as apparent from FIG. magnitude relationship values ​​are reversed in the case of vertical writing document in the case of horizontal writing document, therefore, the direction determining means 4 it is possible to perform the determination by examining the magnitude relation. 本発明によれば、文字だけの簡単な原稿のみでなく、中間調や図表の混在した原稿、段組の複雑な原稿も正確に文書の文字方向を検出することができる。 According to the present invention, not only a simple document only characters, halftone and charts of mixed document, even complex document stage sets can detect a character direction of accurately document.

【実施例】 【Example】

以下、本発明を図面に示す実施例により詳細に説明する。 It will be described in detail below by examples showing the present invention with reference to the drawings. 第2図は本発明の一実施例による文書画像処理装置の全体構成を示すものである。 Figure 2 shows the overall configuration of a document image processing apparatus according to an embodiment of the present invention. この文書画像処理装置は、文書画像をデジタル画像として走査入力するイメージスキャナ21、入力画像を処理のため記憶するイメージメモリ The document image processing apparatus, an image scanner 21 for scanning input document image as a digital image, an image memory for storing for processing an input image
22、本発明の文書の文字方向を検出する文字方向抽出部 22, the character direction extracting unit for detecting a character direction of the document of the present invention
23、装置全体を制御するCPU24、データバス25、画像やメッセージを表示するモニター26、キーボード27、画像等を格納する外部記憶装置28、および画像を出力するプリンタ29等からなっている。 23, CPU 24 controls the entire apparatus, a data bus 25, a monitor 26 for displaying an image and a message consists of a keyboard 27, an external storage device 28 for storing an image or the like, and a printer 29 for outputting an image and the like. 第3図は第2図における本発明の文字方向検出部23の構成を示す図である。 Figure 3 is a diagram showing a structure of a character direction detection unit 23 of the present invention in Figure 2. 文字方向検出部23は外接矩形処理部30と、白ラン検出処理部31と、頻度分布検出処理部32と、ピーク検出処理部 Character direction detection unit 23 and the circumscribed rectangle processing unit 30, and the white run detection processing unit 31, a frequency distribution detection processing unit 32, the peak detection processing section
33と、文字方向判定部34からなっている。 33, is made from the character direction determination unit 34. 外接矩形処理部30は、第1図の黒画素領域化手段1の一例であって、2値画像において互いに関連する黒画素群すなわち互いにつながっている複数の黒画素からなる領域(例えば各文字の領域)を外接して囲む矩形領域(単位領域)を生成するものである。 Enclosing rectangle processing unit 30 is an example of a black pixel area means 1 of FIG. 1, comprising a plurality of black pixels are connected black pixel group i.e. mutually related to each other in the binary image area (for example, each character and it generates a rectangular area (unit area) that surrounds circumscribe the region). この矩形化処理には従来の任意の方式を用いることができるが、例えば従来の矩形化処理方式の一例として、画像の輪郭線を追跡することにより黒画素群を矩形で囲む方式がある。 Although this rectangle process can be used any conventional method, for example, as an example of a conventional rectangular treatment method, there is a method of surrounding the black pixel group in the rectangular by tracking the outline of the image. この方式では、黒領域に対して黒画素の連結成分の追跡を行なうことにより黒画素群を含む要素の最小X,Y座標、最大X,Y In this method, the minimum X elements including black pixel group by carrying out the tracking of connected components of black pixels with respect to the black region, Y-coordinate, maximum X, Y
座標を求めることができ、それぞれの構造を持った黒画素群を矩形で囲むことができるものである。 It is possible to obtain the coordinates, in which a black pixel group having the respective structures can be enclosed in a rectangle. なお、本発明者はこの従来の方式を改良した方式を提案し、本出願人によつて出願されている(特願平1−87039号)。 The present inventor has proposed a method that improves the conventional system, are by connexion filed this applicant (Japanese Patent Application No. 1-87039). この改良された技術を本発明の矩形化処理に利用するのが好ましい。 It preferred to utilize the improved technique in a rectangular processing of the present invention. 上記出願の矩形化処理の例を簡単に説明する。 Briefly describes an example of a rectangular treatment of the above application. ここでは一例として文字である「辺」という画像を例として説明する。 Here it will be described an image that is a character "sides" as an example as an example. 第4図に「辺」という文字を画素単位で示す。 The word "edges" in Figure 4 shows in pixel units. そこでこの画像に対して第5図(a)に示すマスクパターンを用いて左上から右下に黒画素の連結を行う。 Therefore perform connection of black pixels from the upper left to the lower right by using the mask pattern shown in FIG. 5 (a) with respect to the image. 注目画素に対して上の画素、左の画素が共に黒画素であったならば注目画素を黒画素に変換する処理を行う。 Pixels above the pixel of interest, a process of converting the pixel of interest if the left pixel is a black pixel are both black pixels performed. このマスク処理を行った例を第5図(b)に示す。 An example of performing the masking process shown in FIG. 5 (b). 黒画素を右手方向に連結した画素が得られる。 Pixels connected black pixels in the right direction can be obtained. 次に第6図(a)に示すマスクパターンで右上から左下に対して黒画素連結処理を行う。 Then a black pixel connected processing to the lower left from the upper right in the mask pattern shown in FIG. 6 (a). 得られた結果を第6図(b)に示す。 The results obtained are shown in FIG. 6 (b). 先程の処理と逆に左方向に黒画素を連結した画像が得られる。 Image obtained by connecting black pixels in the left direction is obtained previous processing and reverse. 次に第7図(a)に示すマスクパターンで左下から右上に対して黒画素連結処理を行う。 Then a black pixel connected processing to the upper right from the lower left in the mask pattern shown in FIG. 7 (a). 得られた結果を第7図(b)に示す。 The results obtained are shown in FIG. 7 (b). 文字全体がほぼ矩形領域で囲まれてきたことがわかる。 It can be seen that the whole character has been surrounded by a substantially rectangular area. 最後に第8図(a)に示すマスクパターンで右下から左上に対して黒画素の連結処理を行う。 Performing connection processing for a black pixel relative to the upper left from the lower right in the last mask pattern shown in FIG. 8 (a). 得られた結果を第8図(b)に示す。 The results obtained are shown in Figure 8 (b). このように一連の4回の処理を行うことにより文字領域を矩形で囲むことができる。 Thus the character area by performing the processing of the series of four can be enclosed in a rectangle. 処理の説明は文字を例にして行ったが、この結果は図形、表、中間調に対してもあてはまる。 Although description of the processing was performed by a character as an example, the result is shapes, tables, also true for halftone. 第9図は横書きの文書画像の一例を示すものであり、第10図は第9図の画像の外接矩形処理後の画像を示すものである。 Figure 9 is shows an example of a horizontally written document image, FIG. 10 shows the image after the circumscribed rectangle processing of the image of FIG. 9. 白ラン検出処理部31は、第1図におけるランレングス検出手段2に対応するものであり、上記のようにして得られた画像に対して横方向、縦方向にそれぞれ走査して白ランのランレングスを求める処理部である。 White run detection processing unit 31, which corresponds to the run-length detection means 2 in the first diagram, the horizontal direction, the vertical direction to the run of the white run is scanned respectively obtained image as described above it is a processing unit for determining the length. ランレングスを求める処理は従来からある方式から任意に選択して利用することができる。 Process of obtaining the run-length can be utilized arbitrarily selected from methods in the art. 頻度分布検出処理部32は、白ラン検出処理部31により得られた白ランのランレングスを基にその出現頻度の分布を求めるものである。 Frequency distribution detection processing unit 32, and requests distribution of the occurrence frequency based on the run length of the white run obtained by the white run detection processing unit 31. 第11図は横書き文書の場合のランの頻度分布を表したグラフであり、同図(a)は横方向の白ランのランレングスの頻度を示し、同図(b)は縦方向の白ランのランレングスの頻度を示す。 FIG. 11 is a graph showing the frequency distribution of the run when the horizontal document, FIG. (A) shows the frequency of the run length in the lateral direction of the white run, the figure (b) is a longitudinal direction of the white run showing the frequency of the run length. また、第12 In addition, the first 12
図は縦書き文書の場合のランの頻度分布を表したグラフであり、同図(a)は横方向の白ランのランレングスの頻度を示し、同図(b)は縦横方向の白ランのランレングスの頻度を示す。 Figure is a graph showing the frequency distribution of the run of the vertical writing document, the (a) shows the frequency of the run length in the lateral direction of the white run, the figure (b) is in the vertical and horizontal directions of the white run showing the frequency of run length. これらの図からわかるように、縦書き文書も横書き文書も、縦方向と横方向の白ランのランレングスの分布が異なっており、しかも縦書き文書と横書き文書とでは白ランのランレングスの分布が逆になっている。 As seen from these figures, even vertical document also horizontal document, vertical and distribution lateral white run run length is different, yet the distribution of run lengths of white runs in the vertical writing document and horizontal document There has been reversed. この分布の相違により縦書きか横書きかを判定することができる。 It is possible to determine whether vertical or horizontal by this difference in distribution. 本実施例では、各分布の特徴は出現頻度のピーク値を持つ白ランのランレングスによって捉える。 In this embodiment, characteristics of each distribution is captured by the run length of the white run with the peak value of the appearance frequency. ピーク検出処理部33は、頻度の比較により頻度のピーク値を有する白ランのランレングスを求めるものである。 Peak detection processing section 33, and requests the run length of the white run with the peak value of the frequency by comparing the frequency.
上記の頻度分布検出処理部32とピーク検出処理部33からなる処理部は、第1図におけるランレングス頻度分布特徴抽出手段3に対応する。 Processing unit composed of the frequency distribution detection processing unit 32 and the peak detection processing section 33 corresponds to the run length frequency distribution characteristic extraction means 3 in FIG. 1. 文字方向判定部34は、第1図における方向判定部4に対応するものであり、ピーク検出処理部33で求めた横方向および縦方向の最高頻度のランレングスを比較し、(横方向のランレングス<縦方向のランレングス)のとき横書きと判定し、横方向のランレングス>縦方向のランレングス)のとき縦書きと判定するものである。 Character direction determination unit 34, which corresponds to the direction determination unit 4 in FIG. 1, it compares the run length of the highest frequency in the horizontal direction and the vertical direction obtained by the peak detection processing section 33, (lateral direction of the run <determines that horizontal when the vertical run length), lateral run-length> length is to determine the vertical when the vertical run length). 本実施例は、文字間の白ランが基本となっているので、 This embodiment, since white run between characters has become basic,
段組の影響は受けない。 Stage set of impact is not received. 第13図(c)のような複雑な段組で、従来の周辺分布の検出では方向の判定が不可能であったような文書でも、容易に判定をすることができる。 A complex multi-column, such as FIG. 13 (c), in the document as it is impossible to determine the direction of detection of conventional peripheral distribution, can be easily determined. また、中間調、図表は通常の文字間隔よりも広いため出現頻度分布においてピーク値から外れたところに出現頻度が位置するので、縦書き/横書きの判定に影響を及ぼすことがない。 Further, halftone, charts since frequency at which deviates from the peak value in the frequency distribution for wider than normal character spacing is located, does not affect the determination of the vertical / horizontal writing. そのため、高い精度で文書の文字方向を検出することができる。 Therefore, it is possible to detect the character orientation of the document with high accuracy. なお、実施例では、すべての外接矩形に対して矩形間の白ランを求めたが、白ランを求める前処理として、ある程度大きい矩形は処理対象から外すようにしてもよい。 In the embodiment, to determine the white run between rectangular for all of the circumscribed rectangles, as preprocessing for obtaining the white run, may be rectangular large to some extent excluded from the processing target.
この前処理を行なうことにより、中間調、図表が文字方向判定に及ぼす影響を回避することができ、行方向検出に有効なデータのみを集めることができるため、測定精度も向上する。 By performing this pretreatment, the halftone can charts to avoid the influence on the character direction determination, since only can the collect valid data in the row direction detection is also improved measurement accuracy.

【発明の効果】 【Effect of the invention】

本発明によれば、単位領域(外接矩形)を求め、その単位領域間の空白領域(白ラン)の長さ(ランレングス) According to the present invention, it obtains a unit area (circumscribed rectangle), the length of the blank area between the unit area (white run) (run length)
を計測し、出現頻度分布により文字方向の判定をするので、文字だけの簡単な原稿のみでなく、中間調や図表の混在した原稿、段組の複雑な原稿も正確に文書の文字方向を検出することができる。 It was measured, since the character direction determination by appearance frequency distribution, not only simple document text-only, mixed original halftone and diagrams, multi-column complex document also accurately detect the character direction of the document can do.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

第1図は、本発明の基本的構成を示すブロック図である。 Figure 1 is a block diagram showing a basic configuration of the present invention. 第2図は、本発明の一実施例の文書画像処理装置の構成を示す図である。 Figure 2 is a diagram showing a configuration of a document image processing apparatus according to an embodiment of the present invention. 第3図は、第2図における文字方向検出部の構成を示す図である。 Figure 3 is a diagram showing a structure of a character direction detection unit in the second view. 第4図は、文字の画素パターンの一例を示す図である。 4 is a diagram showing an example of a character pixel pattern. 第5図(a)は左上から右下へマスク処理を行なう場合のマスクおよび走査方向を示す図であり、同図(b)はそのマスク処理の結果を示す図である。 Figure 5 (a) is a diagram showing a mask and a scanning direction when performing the mask processing from the upper left to the lower right, Fig. (B) is a diagram showing the result of the masking process. 第6図(a)は右上から左下へマスク処理を行なう場合のマスクおよび走査方向を示す図であり、同図(b)はそのマスク処理の結果を示す図である。 Figure 6 (a) is a diagram showing a mask and a scanning direction when performing the mask processing from the upper right to the lower left, Fig. (B) is a diagram showing the result of the masking process. 第7図(a)は左下から右上へマスク処理を行なう場合のマスクおよび走査方向を示す図であり、同図(b)はそのマスク処理の結果を示す図である。 Figure 7 (a) is a diagram showing a mask and a scanning direction when performing the mask processing from the lower left to the upper right, FIG. (B) is a diagram showing the result of the masking process. 第8図(a)は右下から左上へマスク処理を行なう場合のマスクおよび走査方向を示す図であり、同図(b)はそのマスク処理の結果を示す図である。 Figure 8 (a) is a diagram showing a mask and a scanning direction when performing the mask processing from the lower right to the upper left, FIG. (B) is a diagram showing the result of the masking process. 第9図は文書画像の一例を示す図である。 Figure 9 is a diagram showing an example of a document image. 第10図は外接矩形処理後の画像を示す図である。 FIG. 10 is a diagram showing an image after enclosing rectangle process. 第11図は横書き文書の場合のランの頻度分布を示す図であって、(a)は横方向の白ラン長の頻度分布を表す図、(b)は縦方向の白ラン長の頻度分布を表す図である。 FIG. 11 is a diagram showing a run frequency distribution in the case of horizontal writing document, (a) shows the diagram showing the frequency distribution of the white run length in the horizontal direction, (b) the frequency distribution of the longitudinal direction of the white run length is a diagram illustrating a. 第12図は横書き文書の場合のランの頻度分布を示す図であって、(a)は横方向の白ラン長の頻度分布を表す図、(b)は縦方向の白ラン長の頻度分布を表す図である。 FIG. 12 is a diagram showing a frequency distribution of the run when the horizontal document, (a) shows the diagram showing the frequency distribution of the white run length in the horizontal direction, (b) the frequency distribution of the longitudinal direction of the white run length is a diagram illustrating a. 第13図は、従来の周辺分布検出による文書文字方向検出の方式を説明するための図であって、(a)は文字のみの簡単な段組の場合、(b)は中間調の画像を含んだ原稿の場合、(c)は複雑な、段組の原稿の場合をそれぞれ示している。 FIG. 13 is a diagram for explaining a method of document character direction detection by conventional peripheral distribution detection, the (a) in the case of simple multi-column text only, (b) an image halftone for inclusive document shows (c) is complex, the case of the multi-column document, respectively. 1……画素領域化手段、2……ランレングス検出手段、 1 ...... pixel region means, 2 ...... run length detector means,
3……頻度分布特徴抽出手段、4……方向判定手段。 3 ...... frequency distribution characteristics extraction means, 4 ...... direction determination means.

Claims (1)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】2値画像において互いに関連する黒画素群を単位領域として求める黒画素領域化手段と、 各隣接する単位領域間の空白領域の縦方向および横方向のランレングスを求めるランレングス検出手段と、 縦方向および横方向のランレングスの出現頻度分布の特徴を抽出するランレングス頻度分布特徴抽出手段と、 抽出された縦および横方向のランレングスの出現頻度分布の特徴を比較して文書の文字の方向を判定する方向判定手段と を有することを特徴とする文書文字方向検出装置。 1. A black pixel region means for determining a black pixel group associated with each other in the binary image as a unit area, run length detector to determine the vertical and horizontal run length of the blank region between the adjacent unit areas means and, vertical and horizontal run length frequency distribution and the run length frequency distribution characteristics extraction means for extracting a feature of the extracted vertical and horizontal run length frequency distribution document by comparing the features of the document character direction detection apparatus characterized by comprising a direction determination means for determining a direction of the characters.
JP20398390A 1990-08-02 1990-08-02 Document character direction detection device Expired - Fee Related JPH0766413B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20398390A JPH0766413B2 (en) 1990-08-02 1990-08-02 Document character direction detection device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP20398390A JPH0766413B2 (en) 1990-08-02 1990-08-02 Document character direction detection device
TW80105940A TW206290B (en) 1990-08-02 1991-07-30 Text character orientation detection method
KR91013335A KR940009712B1 (en) 1990-08-02 1991-08-01 Device for detecting character direction in document

Publications (2)

Publication Number Publication Date
JPH0490082A JPH0490082A (en) 1992-03-24
JPH0766413B2 true JPH0766413B2 (en) 1995-07-19

Family

ID=16482852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20398390A Expired - Fee Related JPH0766413B2 (en) 1990-08-02 1990-08-02 Document character direction detection device

Country Status (3)

Country Link
JP (1) JPH0766413B2 (en)
KR (1) KR940009712B1 (en)
TW (1) TW206290B (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3471578B2 (en) 1997-08-29 2003-12-02 シャープ株式会社 Row direction determination apparatus, an image tilt detection device and image inclination correcting device
TWI332635B (en) 2007-01-05 2010-11-01 Compal Electronics Inc Method for determing oriention of chinese words
KR100826577B1 (en) * 2007-02-26 2008-04-30 덕양산업 주식회사 Device for opening and shutting glove box of car
US20110176154A1 (en) * 2010-01-18 2011-07-21 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium

Also Published As

Publication number Publication date
TW206290B (en) 1993-05-21
KR940009712B1 (en) 1994-10-17
JPH0490082A (en) 1992-03-24
KR920005021A (en) 1992-03-28

Similar Documents

Publication Publication Date Title
US7336813B2 (en) System and method of determining image skew using connected components
US5568571A (en) Image enhancement system
US7697723B2 (en) Image recognition device
KR100512831B1 (en) Image processing method, apparatus and program storage medium
JP3338537B2 (en) Image inclination detecting apparatus
US5384864A (en) Method and apparatus for automatic determination of text line, word and character cell spatial features
CA1301308C (en) Thresholding technique for graphics images using histogram analysis
US4903312A (en) Character recognition with variable subdivisions of a character region
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JP2938338B2 (en) Two-dimensional code
JP3302724B2 (en) Image processing apparatus
US4932065A (en) Universal character segmentation scheme for multifont OCR images
US5444793A (en) Method for detecting machine printed monetary amounts in binary images
JP3361124B2 (en) The image processing method and image processing apparatus on a two-dimensional image containing the text
EP0543593A2 (en) Method for determining boundaries of words in text
US20020076111A1 (en) Method and apparatus for formatting OCR text
US5640466A (en) Method of deriving wordshapes for subsequent comparison
KR960015594B1 (en) Method and apparatus for automatic asian language determination
US5179599A (en) Dynamic thresholding system for documents using structural information of the documents
DE19814075B4 (en) Method of scanning and recognizing multiple photographs and eliminating marginal errors
DE60308739T2 (en) Automatic image quality evaluation method and correction technique
US5016118A (en) Image determining method and apparatus
US6347156B1 (en) Device, method and storage medium for recognizing a document image
US4504969A (en) Rectangular pattern recognition apparatus
JP3618796B2 (en) Pattern recognition method and apparatus

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees