JPH01196685A - Method for detecting character - Google Patents
Method for detecting characterInfo
- Publication number
- JPH01196685A JPH01196685A JP63019595A JP1959588A JPH01196685A JP H01196685 A JPH01196685 A JP H01196685A JP 63019595 A JP63019595 A JP 63019595A JP 1959588 A JP1959588 A JP 1959588A JP H01196685 A JPH01196685 A JP H01196685A
- Authority
- JP
- Japan
- Prior art keywords
- character
- line
- pitch
- ruby
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title description 11
- 239000010979 ruby Substances 0.000 claims description 43
- 229910001750 ruby Inorganic materials 0.000 claims description 43
- 238000001514 detection method Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 239000011295 pitch Substances 0.000 abstract description 27
- 235000016496 Panda oleosa Nutrition 0.000 abstract 2
- 240000000220 Panda oleosa Species 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、公知の画像処理技術を利用して縦書または
横書の文書、特に傍点、傍線、ルビまたはアンダーライ
ンを含む文書から、これらが付された文字を検出するた
めの方法に関する。Detailed Description of the Invention [Industrial Application Field] The present invention utilizes known image processing techniques to convert vertically or horizontally written documents, particularly documents containing dots, lines, ruby, or underlines. This invention relates to a method for detecting characters with .
従来、文書中から文字列または文字行を切出す方法とし
ては、傍点、傍線、ルビまたはアンダーラインの存在を
特に意識せずに文字切出しを行ない、切出された文字列
または文字行の幅を対象となる文字領域の標準文字の大
きさと比較し、これが所定幅以下のときはその文字列ま
たは文字行をノイズを含むものとして除去する方法が知
られている。なお、縦書文章と横書文章における傍点。Conventionally, the method of cutting out character strings or character lines from a document is to cut out characters without paying particular attention to the presence of subpoints, parallel lines, rubies, or underlines, and then adjust the width of the extracted character strings or character lines. A method is known in which a character string or line is compared with the standard character size of a target character area, and if the size is less than a predetermined width, the character string or character line is removed as containing noise. In addition, side points in vertical and horizontal writing texts.
傍線、ルビまたはアンダーラインの関係を図示すると第
7図の如くなる。The relationship between side lines, ruby, and underlines is illustrated in FIG. 7.
しかしながら、このような方法ではルビやアンダーライ
ンを含む列または行は、その幅から云って除去の対象と
なってしまい、しかも−度除去されてしまうと、それら
に関する情報は全く失なわれてしまうことになる。′=
また、特にルビの場合、所定幅以上の幅をもつものは除
去の対象とはならないが、その切出し結果の文字列また
は文字行はルビではない他の文字列または文字行と全く
同等、すなわち独立した1つの文字列または文字行とし
て扱われること〜なる。本来、ルビは他の文字列または
文字行に付随するものでsb、それ単独″で意味をなす
ものではないので、従来の方法を使用して文書の読取り
e行なうと、結果として文脈上無意味な行があちこちに
挿入されてしまうことになる。However, with this method, columns or rows containing rubies or underlines are subject to removal due to their width, and once they are removed, all information about them is lost. It turns out. ′=
In addition, especially in the case of ruby, items with a width greater than a specified width are not subject to removal, but the resulting character string or character line is exactly the same as other non-ruby character strings or character lines, that is, it is independent. It will be treated as one character string or line of characters. Originally, ruby is attached to other character strings or character lines and has no meaning on its own, so if you read a document using the conventional method, the result will be meaningless in terms of context. rows will be inserted here and there.
このように、傍点、傍線、ルビ、アンダーライン等は跡
形もなく消滅してしまうか、あるいは他と全く独立した
1個の(しかも無意味な)列または行として存在するか
のいずれかでめった。In this way, dots, lines, rubies, underlines, etc. either disappear without a trace or exist as a single (and meaningless) column or row completely independent of the others. .
したがって、この発明は傍点、傍線、ルビまたはアンダ
ーライン等の情報が失なわれないようにすると〜もに、
これらが付された文字の検出を可能にし、文字読取り性
能を向上させることを目的とする。Therefore, this invention prevents information such as side points, side lines, ruby, or underlines from being lost, and
The purpose is to enable detection of characters with these marks attached and to improve character reading performance.
画像処理装置によυ対象となる文書領域内の文字列(ま
たは文字行)を切出し、隣接する2つの文字列(または
文字行)間の各ピッチから標準ピッチを求め、該標準ピ
ッチから求められるピッチのしきい値と各文字列(iた
は文字行)間のピッチとを比較し、しきい値以下のピッ
チをもつ2つの文字列(または文字行)の幅をそれぞれ
標準文字の大きさと比較して一方の文字列(または文字
行)の幅だけが所定値以下のとき、幅の狭い方の文字列
(または文字行)f、傍点、傍線、ルビまたはアンダー
ラインを含む列(または行)として検出した後、この列
(または行)から個々の要素の切出しを行なう一方、文
字列または文字行からも個々の文字の切出しを行ない、
両者の結果を比較することにより傍点、傍線、ルビまた
はアンダーラインが付されている文字を検出する。An image processing device cuts out a character string (or character line) within the target document area, calculates a standard pitch from each pitch between two adjacent character strings (or character lines), and calculates the standard pitch from the standard pitch. Compare the pitch threshold and the pitch between each character string (i or character line), and calculate the width of the two character strings (or character lines) with a pitch below the threshold with the standard character size. When the width of only one character string (or character line) is less than a predetermined value after comparison, the character string (or character line) with the narrower width f, the column (or line) containing the side dot, side line, ruby, or ), the individual elements are extracted from this column (or row), and the individual characters are also extracted from the character string or character line,
By comparing the two results, characters with side dots, side lines, ruby, or underlines are detected.
各切出し文字列(iたは文字行)間のピッチおよび各文
字列(または文字行)の幅を利用して通常の文字列(ま
たは文字行)と傍点、傍線、ルビまたはアンダーライン
を含む列(または行)とを分離した後、傍点、傍線、ル
ビまたはアンダーライン列に対しその垂直方向にとった
投影結果よシ個々の要素の位置を検出し、この位置と文
字列(または文字行)の各文字位置とを比較することに
より、傍点、傍線、ルビまたはアンダーライン等の付く
文字を検出できるようにし、読取シ性能を向上させる。A column containing normal character strings (or character lines) and side points, side lines, ruby, or underlines by using the pitch between each cut character string (i or character line) and the width of each character string (or character line) (or line), then detect the position of each element based on the projection result taken in the vertical direction with respect to the side point, side line, ruby, or underline column, and detect this position and the character string (or character line). By comparing the position of each character, characters with side dots, lines, ruby, underlines, etc. can be detected, thereby improving reading performance.
第1図はこの発明の実施例を示す概略フローチャート、
第2図はその詳細を示すフローチャートで、以下、第2
図に沿って説明する。なお、具体的な例として第3図の
縦書文章を考える。FIG. 1 is a schematic flowchart showing an embodiment of the present invention;
Figure 2 is a flowchart showing the details.
This will be explained according to the diagram. As a specific example, consider the vertically written text in FIG.
■(第2図の■に対応、以下同様)文字列の切出し結果
の切出し座標(開始座標Ai、終了座標B、)をもとに
、文字列の中心軸間の距離(ピッチ)Piを、
pi−(Ai+1+ni)/2 (A4+J)/2によ
り求める(第3図のP。−P5参照)。■ (Corresponds to ■ in Figure 2, the same applies hereafter) Based on the extraction coordinates (start coordinate Ai, end coordinate B,) of the character string extraction result, calculate the distance (pitch) Pi between the central axes of the character string, It is determined by pi-(Ai+1+ni)/2 (A4+J)/2 (see P.-P5 in FIG. 3).
■得られたピッチPiからその平均値P&(Pa−、召
。Pl/N)″または中央呟もしくは最頻値を求め、そ
れを標準ピッチとする。(2) From the obtained pitch Pi, find its average value P & (Pa-, pitch Pl/N)'' or its median value or mode, and use it as the standard pitch.
■P1の直からPth””αPa(α:定足数によって
ピッチのしきい値Ptht求め、Pthと各ピッチPi
とを比較する。■ Pth””αPa (α: Find the pitch threshold value Ptht from the quorum directly from P1, Pth and each pitch Pi
Compare with.
■2文字列の幅をそれぞれ求める。■Find the width of each of the two character strings.
■しさい[Pth以下のピッチをもつ2文字列に対し、
それぞれの文字列の幅を標準文字の大きさをもとに得ら
れる所定の幅しさい匝と比較する。■Shishai [For two character strings with pitch less than Pth,
The width of each character string is compared with a predetermined width obtained based on the standard character size.
■比較した結果、2つの文字列のうち1方の文字列の幅
のみが所定幅に満たない場合、その2つの文字列を通常
の文字列と傍点、 IJS、ルビあるいはアンダーライ
ン(以下、ルビ、アンダーライン等ともいう。)のA且
であるとみなす。■As a result of the comparison, if the width of only one of the two character strings is less than the specified width, the two character strings are converted into normal character strings, dots, IJS, ruby, or underline (hereinafter referred to as ruby). , underline, etc.).
以上の操作を、例えば第3図のごとく文字列の切出しが
行なわれた場合について考える。ピッチPo%P5によ
シ例えば平均値P、とそのしきい値Pthが求められ、
PthとP。−B5をそれぞれ比較して、こへでは小さ
いピッチP およびB4を検出する。ピッチP。は文字
列C8と文字列C1の間のピッチ、B4は文字列C4と
文字列C5の間のピッチである。こうして幅の狭いピッ
チを検出したら、次はその両端の文字列の@を調べるこ
とになる。例えばピッチP0についてであれば、文字列
C8と文字列C4の@を調べる。この場合、文字列C8
の幅W。−Bo−Aoに比して文字列10幅W1””B
1−△1は小さいのでW。が標準文字の大きさ程度の幅
をもつ通常文字列であれば、適当なしきいl(例えば、
標準文字サイズの0.8倍)によって文字列C6はしき
い値以上、文字列C1はしきい値以下と判定され、これ
ら2つの文字列は通常の文字列と傍点、傍線、ルビ、ア
ンダーラインとの組であるとされる。文字列C4と文字
列C5に対しても、同様の手順で検出が行なわれること
になる。Consider the case where the above operation is performed, for example, when a character string is cut out as shown in FIG. For example, the average value P and its threshold value Pth are determined based on the pitch Po%P5,
Pth and P. -B5 are compared, and the smaller pitches P and B4 are detected here. Pitch P. is the pitch between character string C8 and character string C1, and B4 is the pitch between character string C4 and character string C5. Once a narrow pitch is detected in this way, the next step is to check the @ characters in the string at both ends. For example, in the case of pitch P0, check @ in character string C8 and character string C4. In this case, the string C8
Width W. -Character string 10 width W1""B compared to Bo-Ao
1-△1 is small, so W. If is a regular character string with a width about the size of a standard character, an appropriate threshold l (for example,
(0.8 times the standard character size), character string C6 is determined to be above the threshold value, and character string C1 is determined to be below the threshold value. It is said to be a pair with. The same procedure will be used to detect character strings C4 and C5.
こうして検出された通常文字列とルビ、アンダーライン
等の組に対して、以下の手順によシルビ。For the normal character string, ruby, underline, etc. pair detected in this way, the following procedure is used to create a silvi character string.
アンダーライン等の位置検出が行なわれる。Position detection of underlines, etc. is performed.
■2つの文字列のうち、幅の広い方の文字列(第3図で
いえば、文字列C6や文字列C,)に対しては、文字切
出しアルゴリズムに従って文字切出しを行なう。なお、
文字切出しアルゴリズムについてはよく知られているの
で、ここでは省略する。(2) Characters are extracted from the wider character string (character string C6 and character string C, in FIG. 3) according to the character extraction algorithm. In addition,
Since the character extraction algorithm is well known, it will be omitted here.
0幅の狭い方の文字列(第3図でいう文字列c1や文字
列C5)に対しては、傍点、傍線、ルビ。For character strings with a narrower 0 width (character string c1 and character string C5 in Figure 3), side dots, side lines, and ruby characters are used.
アンダーライン文字列であると考えられるので、傍点、
傍線、ルビ、アンダーラインの切出しを行なう。この切
出しも通常の文字列と同様、文字切出しアルゴリズムに
従う。ただし、この場合、ルビの文字を1文字1文字切
出すことはせず、文字間隔(文字の終了位置と次の文字
の開始位置との距離:第4B図のDr)が所定の大きさ
以下であるものについては、1つの単語にふられている
ルビ1iとtbとみなし、ルビの最初の文字の開始位置
(第4B図のXr)および最後の文字の終了位置(第4
B図のYr)をもってルビの位置とする。ここで、ルビ
、傍点列と傍線、アンダーライン列とは列の投影(線の
本数または黒点の長さの投影)によシ区別する。また、
ルビと傍点とは線の本数で区別する。Since it is considered to be an underlined string,
Extracts side lines, ruby lines, and underlines. This extraction follows the same character extraction algorithm as a normal character string. However, in this case, the ruby characters are not cut out one by one, and the character spacing (distance between the end position of a character and the start position of the next character: Dr in Figure 4B) is less than or equal to the specified size. , the ruby 1i and tb mentioned in one word are considered, and the start position of the first character of the ruby (Xr in Figure 4B) and the end position of the last character (the 4th
Yr) in Figure B is the ruby position. Here, ruby, side dot columns, side lines, and underline columns are distinguished by column projection (projection of the number of lines or length of black dots). Also,
Ruby and side points are distinguished by the number of lines.
■通常文字の切出しによる各文字の位置とルビ。■The position and ruby of each character by cutting out regular characters.
アンダーライン等の切出しによるルビ、アンダーライン
等の位置との比較を行ない、ルビまたはアンダーライン
等の引かれている文字を見つけ出す。A comparison is made with the position of the ruby, underline, etc. by cutting out the underline, etc., and the characters on which the ruby, underline, etc. are drawn are found.
具体的な操作手順を、第4A図のような切出し結果が得
られた場合を例にとって説明する。たyし、と〜ではル
ビだけが付された例を示す。The specific operating procedure will be explained by taking as an example a case where a cutting result as shown in FIG. 4A is obtained. However, and ~ show an example in which only ruby is added.
■−1)各文字の開始座標S、(第4C図のS。〜S5
)を値の小さなものから順にルビ開始座標Xrと比較し
ていき1.最初にXr<8.となるSiを見つける。第
4C図でいえば、これはS、となる。■-1) Start coordinate S of each character, (S in Figure 4C.~S5
) with the ruby start coordinates Xr in descending order of value. 1. First, Xr<8. Find Si. In FIG. 4C, this is S.
■−2)XrとSlおよび3.−、との距離Dl、Di
−。■-2) Xr and Sl and 3. −, distance Dl, Di
−.
を算出する(第4C図のD3.D2)。(D3.D2 in Figure 4C).
■−5)DlとDト、全比較し、
Di−、< Diならば、5i−1を開始座標としても
つ文字を、
Di−、〉Diならば、5iを開始座標としてもつ文字
を、
それぞれルビのふられている単語の最初の文字とする。■-5) Compare all of Dl and D, and if Di-, < Di, then the character with 5i-1 as the starting coordinate, and if Di-, > Di, the character with 5i as the starting coordinate, respectively. It is the first letter of the ruby word.
第4C図の例でいうと、D2〈D、であるので、B2を
開始座標としてもつ「漢」が最初の文字となる。In the example of FIG. 4C, since D2<D, "Kan" having B2 as the starting coordinate becomes the first character.
■−4)同様の比較を文字の終了座標T1とルビ。■-4) Similar comparison is made between the character end coordinate T1 and ruby.
アンダーライン等の終了座標Yrに対しても行ない、最
初にYrくT1となるTIを見つけ、開始座標の場合と
同様にE、、E、、、−1’に比較することによって、
こメではルビのふられている単語の最後の文字を見つけ
る。第4D図の例でいうと、検出−kfべてのルビ、ア
ンダーライン等に対して行なう。Do this also for the end coordinates Yr of the underline, etc., first find the TI that is Yr minus T1, and compare it with E, , E, , -1' as in the case of the start coordinates,
Find the last letter of the ruby word here. In the example of FIG. 4D, detection-kf is performed for all rubies, underlines, etc.
以上の如く操作を行ない、ルビ、アンダーライン等に対
しての位置情報を得る。第5図は文字認職にこの発明に
よる方法を適用し、得られた認識結果においてルビのふ
られている単語の前後にルビマークを挿入するという処
理を加えて結果を出力した例でおる。傍点マーク、fj
I線マークまたはアンダーラインマークについても同様
な処理が行なわれる。なお、第5図と対応する入力文書
を第6図に示す。Perform the operations as described above to obtain position information for ruby, underline, etc. FIG. 5 shows an example in which the method of the present invention is applied to character recognition, and the results are output after adding a process of inserting ruby marks before and after words marked with ruby in the recognition results obtained. Side mark, fj
Similar processing is performed for I-line marks or underline marks. Note that FIG. 6 shows an input document corresponding to FIG. 5.
この発明によれば、傍点、傍線、ルビまたはアンダーラ
インを検出することによ)これらの情報が失なわれるの
を防ぐとへもに各々の位置を検出し、その検出結果とこ
れらが本来付くべき文字列(または文字行)の文字切出
し結果との比較を行なうことにより、どの文字に傍点、
傍線、ルビまたはアンダーラインのいずれが付されてい
るかを検出するようにしたので、読取シ性能が著しく向
上すると云う利点がもたらされる。According to the present invention, by detecting side points, side lines, rubies, or underlines, this information is prevented from being lost. By comparing the character extraction results of the desired character string (or character line), which character has a side point,
Since it is detected whether a side line, ruby, or underline is attached, there is an advantage that reading performance is significantly improved.
第1図はこの発明の実施例を示す概略フ四−チヤード、
第2図はその詳細を示すフローチャート、第3図は各文
字列のピッチの求め方の具体例を説明するための説明図
、第4A図ないし第4D図は傍点、傍線、ルビまたはア
ンダーラインの付く文字を検出する方法の具体例を説明
するための説明図、第5図はルビの付されている文字を
検出してルビマークを付した例を説明するための説明図
、第6図は第5図と対応する文章例全示す説明図、第7
図は縦書文、横書文と傍点、傍線、ルビまたはアンダー
ラインとの関係を説明するための説明図である。
符号説明
Al・・・・・・文字列の切出し開始座標、Bi・・・
・・・文字、Pi・・・・・・文字列の距離(ピッチ)
、Pa・・・・・・標準ピッチ” th・・・・・・ピ
ッチのしきい呟、C,・・・・・・文字列、WOe W
l・・・・・・文字列の幅、Xr・・・・・・ルビの最
初の文字の開始位置、Yr・・・・・・ルビの最後の文
字の終了位置、S、・・・・・・各文字の開始座漂、T
I・・・・・・各文字の終了座標。
代理人 弁理士 並 木 昭 夫
代理人 弁理士 松 崎 清
算 1 図
に21i!+
53 図
第4A図
14B図
1Ω図FIG. 1 is a schematic diagram showing an embodiment of the present invention;
Figure 2 is a flowchart showing the details, Figure 3 is an explanatory diagram to explain a specific example of how to find the pitch of each character string, Figures 4A to 4D are FIG. 5 is an explanatory diagram for explaining a specific example of a method for detecting characters with ruby marks. FIG. 5 is an explanatory diagram for explaining an example of detecting characters with ruby marks and adding ruby marks. Explanatory diagram showing all text examples corresponding to Figure 5, No. 7
The figure is an explanatory diagram for explaining the relationship between a vertical text, a horizontal text, and a side point, a side line, a ruby, or an underline. Code explanation Al...Character string cutting start coordinates, Bi...
...Character, Pi...Distance of character string (pitch)
, Pa...Standard pitch" th...Pitch threshold, C,...Character string, WOe W
l... Width of the character string, Xr... Start position of the first character of ruby, Yr... End position of the last character of ruby, S,...・Start of each letter, T
I... Ending coordinates of each character. Agent Patent Attorney Akio Namiki Agent Patent Attorney Matsuzaki Liquidation 1 21i in Figure! + 53 Figure 4A Figure 14B Figure 1Ω diagram
Claims (1)
列(または文字行)を切出し、隣接する2つの文字列(
または文字行)間の各ピッチから標準ピッチを求め、該
標準ピッチから求められるピッチのしきい値と各文字列
(または文字行)間のピッチとを比較し、しきい値以下
のピッチをもつ2つの文字列(または文字行)の幅をそ
れぞれ標準文字の大きさと比較して一方の文字列(また
は文字行)の幅だけが所定値以下のとき、幅の狭い方の
文字列(または文字行)を傍点、傍線、ルビまたはアン
ダーラインを含む列(または行)として検出した後、該
列(または行)から傍点、傍線、ルビまたはアンダーラ
イン等の切出しを行なう一方、文字列(または文字行)
からも個々の文字の切出しを行ない、両者の結果を比較
することにより傍点、傍線、ルビまたはアンダーライン
等が付されている文字を検出することを特徴とする文字
検出方法。1) An image processing device cuts out a character string (or character line) within the target document area, and extracts two adjacent character strings (
Find the standard pitch from each pitch between each character string (or character line), compare the pitch threshold found from the standard pitch with the pitch between each character string (or character line), and find the pitch between each character string (or character line). Compare the widths of two character strings (or character lines) with the standard character size, and if only the width of one character string (or character line) is less than the specified value, the width of the narrower character string (or character line) is compared with the standard character size. After detecting a row) as a column (or row) containing a side point, side line, ruby, or underline, the side point, side line, ruby, or underline, etc. is extracted from the column (or row), while character strings (or characters line)
A character detection method characterized in that characters with side points, side lines, ruby, underlines, etc. are detected by extracting individual characters from the .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63019595A JP2569103B2 (en) | 1988-02-01 | 1988-02-01 | Character detection method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63019595A JP2569103B2 (en) | 1988-02-01 | 1988-02-01 | Character detection method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01196685A true JPH01196685A (en) | 1989-08-08 |
JP2569103B2 JP2569103B2 (en) | 1997-01-08 |
Family
ID=12003592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63019595A Expired - Lifetime JP2569103B2 (en) | 1988-02-01 | 1988-02-01 | Character detection method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2569103B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5757257A (en) * | 1993-09-20 | 1998-05-26 | Hitachi, Ltd. | Permanent current switch and superconducting magnet system |
JP2015170981A (en) * | 2014-03-06 | 2015-09-28 | ブラザー工業株式会社 | Image processor |
JP2016194801A (en) * | 2015-03-31 | 2016-11-17 | 富士通株式会社 | Sideline problem scoring method, sideline problem scoring program and sideline problem scoring apparatus |
JP2017111720A (en) * | 2015-12-18 | 2017-06-22 | 富士ゼロックス株式会社 | Image processing device and image processing program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5556257A (en) * | 1978-10-19 | 1980-04-24 | Agency Of Ind Science & Technol | Detecting segmentation unit for character with agate |
JPS6048582A (en) * | 1983-08-25 | 1985-03-16 | Fujitsu Ltd | Character cutting-out method of character recognizer |
JPS61269778A (en) * | 1985-05-24 | 1986-11-29 | Agency Of Ind Science & Technol | Character line extracting device |
-
1988
- 1988-02-01 JP JP63019595A patent/JP2569103B2/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5556257A (en) * | 1978-10-19 | 1980-04-24 | Agency Of Ind Science & Technol | Detecting segmentation unit for character with agate |
JPS6048582A (en) * | 1983-08-25 | 1985-03-16 | Fujitsu Ltd | Character cutting-out method of character recognizer |
JPS61269778A (en) * | 1985-05-24 | 1986-11-29 | Agency Of Ind Science & Technol | Character line extracting device |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5757257A (en) * | 1993-09-20 | 1998-05-26 | Hitachi, Ltd. | Permanent current switch and superconducting magnet system |
JP2015170981A (en) * | 2014-03-06 | 2015-09-28 | ブラザー工業株式会社 | Image processor |
JP2016194801A (en) * | 2015-03-31 | 2016-11-17 | 富士通株式会社 | Sideline problem scoring method, sideline problem scoring program and sideline problem scoring apparatus |
JP2017111720A (en) * | 2015-12-18 | 2017-06-22 | 富士ゼロックス株式会社 | Image processing device and image processing program |
Also Published As
Publication number | Publication date |
---|---|
JP2569103B2 (en) | 1997-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20120290288A1 (en) | Parsing of text using linguistic and non-linguistic list properties | |
US7643682B2 (en) | Method of identifying redundant text in an electronic document | |
WO2011072434A1 (en) | System and method for web content extraction | |
Darwish et al. | Using Stem-Templates to Improve Arabic POS and Gender/Number Tagging. | |
JPH04195692A (en) | Document reader | |
JPH01196685A (en) | Method for detecting character | |
US20160283446A1 (en) | Input assistance device, input assistance method and storage medium | |
CN115410207B (en) | Detection method and device for vertical text | |
JPS62247485A (en) | Adding method for information of object character | |
CN104536948A (en) | Layout document processing method and device | |
JPH09274645A (en) | Method and device for recognizing character | |
JP2977247B2 (en) | Inter-character space processing method | |
JP2569156B2 (en) | Character line extraction method | |
JP3888833B2 (en) | Document editing apparatus and method | |
JPH02230484A (en) | Character recognizing device | |
JPH03156589A (en) | Method for detecting and correcting erroneously read character | |
Phissamay et al. | Syllabification of lao script for line breaking | |
JPH09259225A (en) | Character recognizing and converting method and character data processor | |
JP2000187704A (en) | Character recognition device, its method and storage medium | |
JP3063332B2 (en) | Elaboration support system | |
JPH07239915A (en) | On-line hand-written character string segmentation and recognition device | |
JPH01209586A (en) | Character recognizing system for sentence mixed with double size/half size characters | |
JPH02139686A (en) | Character reading method | |
Marosi et al. | Developing A General Purpose Optical Character Recognition System | |
JP2002175294A (en) | Document forming method, storage medium and document forming device |