JPH0437968A - 図書の文字読取方法 - Google Patents
図書の文字読取方法Info
- Publication number
- JPH0437968A JPH0437968A JP2143496A JP14349690A JPH0437968A JP H0437968 A JPH0437968 A JP H0437968A JP 2143496 A JP2143496 A JP 2143496A JP 14349690 A JP14349690 A JP 14349690A JP H0437968 A JPH0437968 A JP H0437968A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- image
- reference line
- characters
- book
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 16
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000012937 correction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
この発明は、図書を開いたときの各ページの境界と直角
に並ぶ各文字列の文字を、イメージスキャナなどの画像
入力装置による、境界近傍で湾曲した文字列画像に基づ
いて正確に読み取るようにした図書の文字読取方法に関
する。 ■従来の技術】 図書を開いたときの各ページの境界と直角に並ぶ各文字
列の文字を、イメージスキャナなどの画像入力装置によ
って映像信号に変換し、それを画像処理して文字を読み
取るときには、次のような方法がとられた。 第4図は図書を開いたときの右ページの横並び文字列を
画像入力したときの画像図である。同図において、方形
枠Fは画像視野を表し、左辺が両ページのほぼ境界に相
当する。各文字列画像Gi(i=1.2.3 ・・・
、n)が、第4図に示すように各ページの境界近傍で湾
曲することに起因して、その分だけ各文字列の文字画像
が部分的に歪むことになる。文字を歪んだままの状態で
読み取ると、誤りが多(なる。 したがって、一つの方法として、この歪んだ文字を読取
り領域から外し、後で人が原図書を見ながら読み取って
編集する。別の方法として、図書の背の接着部分を剥が
し、各ページを平面状態にして画像入力し、歪んでない
文字画像を得て、その画像処理に基づいて文字読取りを
おこなう。
に並ぶ各文字列の文字を、イメージスキャナなどの画像
入力装置による、境界近傍で湾曲した文字列画像に基づ
いて正確に読み取るようにした図書の文字読取方法に関
する。 ■従来の技術】 図書を開いたときの各ページの境界と直角に並ぶ各文字
列の文字を、イメージスキャナなどの画像入力装置によ
って映像信号に変換し、それを画像処理して文字を読み
取るときには、次のような方法がとられた。 第4図は図書を開いたときの右ページの横並び文字列を
画像入力したときの画像図である。同図において、方形
枠Fは画像視野を表し、左辺が両ページのほぼ境界に相
当する。各文字列画像Gi(i=1.2.3 ・・・
、n)が、第4図に示すように各ページの境界近傍で湾
曲することに起因して、その分だけ各文字列の文字画像
が部分的に歪むことになる。文字を歪んだままの状態で
読み取ると、誤りが多(なる。 したがって、一つの方法として、この歪んだ文字を読取
り領域から外し、後で人が原図書を見ながら読み取って
編集する。別の方法として、図書の背の接着部分を剥が
し、各ページを平面状態にして画像入力し、歪んでない
文字画像を得て、その画像処理に基づいて文字読取りを
おこなう。
以上説明したような従来の技術では、次のような問題が
あった。 第1の方法では、歪んだ部分について後で人によってお
こなわれる読取り2編集作業が、非常に面倒で時間がか
かるだけでなく、誤りを起こしやすい。 第2の方法では、図書の背の接着部分を剥がすことが、
はとんどの場合に実現不可能である。 この発明の課題は、従来の技術がもつ以上の問題点を解
消し、図書を開いたときの各ページの境界と直角に並ぶ
各文字列の文字を、画像入力装置による、境界近傍で湾
曲した文字列画像に基づいて正確に読み取るようにした
図書の文字読取方法を提供することにある。
あった。 第1の方法では、歪んだ部分について後で人によってお
こなわれる読取り2編集作業が、非常に面倒で時間がか
かるだけでなく、誤りを起こしやすい。 第2の方法では、図書の背の接着部分を剥がすことが、
はとんどの場合に実現不可能である。 この発明の課題は、従来の技術がもつ以上の問題点を解
消し、図書を開いたときの各ページの境界と直角に並ぶ
各文字列の文字を、画像入力装置による、境界近傍で湾
曲した文字列画像に基づいて正確に読み取るようにした
図書の文字読取方法を提供することにある。
この課題を解決するために、本発明に係る図書の文字読
取方法は、 図書を開いたときの各ページの境界と直角に並ぶ各文字
列の文字を、画像入力装置による画像に基づいて読み取
る方法において、 前記各文字列に外接する長方形文字列領域の画像の長手
方向に設定した基準線上の各点を、その基準線の直線部
の延長線に正投影すること;この正投影したときの隣り
合う前記各点を結ぶ各線分を、その長さが前記正投影前
の前記基準線に沿った長さになるように修正するととも
に、この基準線の直線部から順次隣接してつながるよう
に修正移動させること; の各ステップの処理を前記各文字列の画像に対して施し
、この処理された各文字列画像に基づいて前記文字を読
み取る。
取方法は、 図書を開いたときの各ページの境界と直角に並ぶ各文字
列の文字を、画像入力装置による画像に基づいて読み取
る方法において、 前記各文字列に外接する長方形文字列領域の画像の長手
方向に設定した基準線上の各点を、その基準線の直線部
の延長線に正投影すること;この正投影したときの隣り
合う前記各点を結ぶ各線分を、その長さが前記正投影前
の前記基準線に沿った長さになるように修正するととも
に、この基準線の直線部から順次隣接してつながるよう
に修正移動させること; の各ステップの処理を前記各文字列の画像に対して施し
、この処理された各文字列画像に基づいて前記文字を読
み取る。
画像入力装置による、境界近傍で湾曲した文字列画像を
補正ないし正規化するため、まず予備処理として、各文
字列に外接する長方形文字列領域の画像の長手方向に設
定した基準線上の各点を、その基準線の直線部の延長線
に正投影する;この正投影したときの隣り合う各点を結
ぶ各線分を、その長さが正投影前の基準線に沿った長さ
になるように拡大方向に修正するとともに、この基準線
の直線部から順次隣接してつながるように修正移動させ
る。 ついで本処理として、予備処理を各文字列の画像に対し
て施し、この処理によって補正ないし正規化された各文
字列画像に基づいて文字を読み取る。
補正ないし正規化するため、まず予備処理として、各文
字列に外接する長方形文字列領域の画像の長手方向に設
定した基準線上の各点を、その基準線の直線部の延長線
に正投影する;この正投影したときの隣り合う各点を結
ぶ各線分を、その長さが正投影前の基準線に沿った長さ
になるように拡大方向に修正するとともに、この基準線
の直線部から順次隣接してつながるように修正移動させ
る。 ついで本処理として、予備処理を各文字列の画像に対し
て施し、この処理によって補正ないし正規化された各文
字列画像に基づいて文字を読み取る。
本発明に係る図書の文字読取方法の適用例について、以
下に図面を参照しながら説明する。 既に述べた第4図の図書を開いた右ページに係る文字列
の画像図において、正規の(湾曲しないときの)各文字
列に外接する方形の頷・域を文字列領域と呼ぶことにす
ると、その文字列領域の画像は第5図の斜線ハツチング
のように示される。 この適用例は、まず文字列領域画像を得ることから始ま
る。第5図に示すように、文字列領域画像に上から順番
に、R1,R2,R3,・・・、Rnの符号を付ける。 i番目の文字列領域画像Riについて、以下に述べるよ
うな補正ないし正規化の処理を施す。なお、Fは画像視
野である。 第1図はこの文字列領域画像の補正に係る説明図である
。この文字列領域画像の補正は要するに、文字列領域の
湾曲部を、つながった微小線分に分割し、各微小線分を
直線部の延長線上に順次つないで直線化することである
。 第1図で文字列領域画像Riは、右側の大部分が直線部
であり、左側の一部が湾曲部である。方形文字列領域画
像RiO長手方向の中心線を想定し、これを基準線に1
とする。基準線Kiの直線部に直交し、等間隔な各線L
l、 L2. L3.・・・1 L■を引き、この各線
が基準線Kiの湾曲部と交差する点をそれぞれPL、R
2,R3,R4とする。説明を簡単にするために、点P
4が基準線Kiの湾曲部と直線部との境界点でもあると
する。補正処理は、■各点Pi、P2.P3.P4を基
準線Kiの直線部の延長線上に正投影し、各点QLQ2
.Q3.Q4とする。点Q4と点P4とは一致し、かつ
直線部は線分P4.Paである。 ■各点Ql、Q2.Q3.Q4の隣り合う各点を結ぶ線
分を、その長さが正投影前の基準線Kiに沿った長さに
なるように拡大修正する。 ■前記の各拡大修正線分長を、基準線Kiの直線部から
順次隣接してつながるように修正移動させる。そのとき
、各点Ql、Q2.Q3.Q4は次の各点01.02.
03.04 ニなる。すなわち、線分長01,02 =
弧長Pi、P2 線分長02,03=弧長P2.P3 線分長03,04=弧長P3.R4 なお、点04と点Q4とは一致する。 以上■〜■の補正処理をすることにより、各点PL、P
2.P3.P4で代表された文字列領域Riの湾曲部が
補正ないし正規化されたことになる。ここで、各線Ll
、 L2. L3.・・・、Lmを引いたのは、処理と
説明の便宜上のことで、必ずしもそうすることはない。 重要なことは、文字列領域に設定した基準線の湾曲部に
できるだけ微小間隔で各点をとり、隣り合う各点間の湾
曲部に沿った長さが近似的にその線分長になるようにす
ることである。 つまり、処理■における前記の弧長P1.P2−線分長
Ql、Q2などは、近(収約に線分長PL、P2=線分
長Q1.Q2などになるようにする。 第2図は原文字列領域、補正文字列領域に係る各画像の
模式図で、ここでRiが原の文字列領域画像、Siが補
正文字列領域画像である。 さて、以上の補正処理を予備処理とし、次に本処理とし
て、これと同じ補正処理を各文字列の画像に対して施す
。つまり、各文字列画像を補正ないし正規化する。第3
図は原の文字列、補正文字列に係る各画像の模式図であ
り、ここでGiが原の文字列画像、Hiが補正文字列画
像である。そして、最終的にこの補正文字列画像に基づ
いて文字を読み取る。 ところで、以上述べた適用例では、各文字列画像の補正
は、対応する文字列領域画像の補正に準じておこなわれ
た。これが標準的なやり方であるが、やや処理に時間が
かかる。そこで、条件によっては次のような便法もとり
得る。 各文字列領域画像の補正の程度、言いかえれば湾曲程度
のバラツキが比較的小さければ、各文字列領域画像の補
正処理を平均化したもので、共通に各文字列画像の補正
をおこなうことができる。 また、各文字列領域画像の補正処理の代表的なもので、
統一して各文字列画像の補正をおこなうことも可能であ
る。 【発明の効果1 この発明によれば、画像入力装置による、図書を開いた
ときの各ページの境界近傍で湾曲した文字列画像が、予
備処理によって自動的に直線化されるとともに、各文字
の横幅と間隔とが正規状態になるように補正される。し
たがって、この予備処理によって補正ないし正規化され
た文字の読取りは、正確におこなわれる。
下に図面を参照しながら説明する。 既に述べた第4図の図書を開いた右ページに係る文字列
の画像図において、正規の(湾曲しないときの)各文字
列に外接する方形の頷・域を文字列領域と呼ぶことにす
ると、その文字列領域の画像は第5図の斜線ハツチング
のように示される。 この適用例は、まず文字列領域画像を得ることから始ま
る。第5図に示すように、文字列領域画像に上から順番
に、R1,R2,R3,・・・、Rnの符号を付ける。 i番目の文字列領域画像Riについて、以下に述べるよ
うな補正ないし正規化の処理を施す。なお、Fは画像視
野である。 第1図はこの文字列領域画像の補正に係る説明図である
。この文字列領域画像の補正は要するに、文字列領域の
湾曲部を、つながった微小線分に分割し、各微小線分を
直線部の延長線上に順次つないで直線化することである
。 第1図で文字列領域画像Riは、右側の大部分が直線部
であり、左側の一部が湾曲部である。方形文字列領域画
像RiO長手方向の中心線を想定し、これを基準線に1
とする。基準線Kiの直線部に直交し、等間隔な各線L
l、 L2. L3.・・・1 L■を引き、この各線
が基準線Kiの湾曲部と交差する点をそれぞれPL、R
2,R3,R4とする。説明を簡単にするために、点P
4が基準線Kiの湾曲部と直線部との境界点でもあると
する。補正処理は、■各点Pi、P2.P3.P4を基
準線Kiの直線部の延長線上に正投影し、各点QLQ2
.Q3.Q4とする。点Q4と点P4とは一致し、かつ
直線部は線分P4.Paである。 ■各点Ql、Q2.Q3.Q4の隣り合う各点を結ぶ線
分を、その長さが正投影前の基準線Kiに沿った長さに
なるように拡大修正する。 ■前記の各拡大修正線分長を、基準線Kiの直線部から
順次隣接してつながるように修正移動させる。そのとき
、各点Ql、Q2.Q3.Q4は次の各点01.02.
03.04 ニなる。すなわち、線分長01,02 =
弧長Pi、P2 線分長02,03=弧長P2.P3 線分長03,04=弧長P3.R4 なお、点04と点Q4とは一致する。 以上■〜■の補正処理をすることにより、各点PL、P
2.P3.P4で代表された文字列領域Riの湾曲部が
補正ないし正規化されたことになる。ここで、各線Ll
、 L2. L3.・・・、Lmを引いたのは、処理と
説明の便宜上のことで、必ずしもそうすることはない。 重要なことは、文字列領域に設定した基準線の湾曲部に
できるだけ微小間隔で各点をとり、隣り合う各点間の湾
曲部に沿った長さが近似的にその線分長になるようにす
ることである。 つまり、処理■における前記の弧長P1.P2−線分長
Ql、Q2などは、近(収約に線分長PL、P2=線分
長Q1.Q2などになるようにする。 第2図は原文字列領域、補正文字列領域に係る各画像の
模式図で、ここでRiが原の文字列領域画像、Siが補
正文字列領域画像である。 さて、以上の補正処理を予備処理とし、次に本処理とし
て、これと同じ補正処理を各文字列の画像に対して施す
。つまり、各文字列画像を補正ないし正規化する。第3
図は原の文字列、補正文字列に係る各画像の模式図であ
り、ここでGiが原の文字列画像、Hiが補正文字列画
像である。そして、最終的にこの補正文字列画像に基づ
いて文字を読み取る。 ところで、以上述べた適用例では、各文字列画像の補正
は、対応する文字列領域画像の補正に準じておこなわれ
た。これが標準的なやり方であるが、やや処理に時間が
かかる。そこで、条件によっては次のような便法もとり
得る。 各文字列領域画像の補正の程度、言いかえれば湾曲程度
のバラツキが比較的小さければ、各文字列領域画像の補
正処理を平均化したもので、共通に各文字列画像の補正
をおこなうことができる。 また、各文字列領域画像の補正処理の代表的なもので、
統一して各文字列画像の補正をおこなうことも可能であ
る。 【発明の効果1 この発明によれば、画像入力装置による、図書を開いた
ときの各ページの境界近傍で湾曲した文字列画像が、予
備処理によって自動的に直線化されるとともに、各文字
の横幅と間隔とが正規状態になるように補正される。し
たがって、この予備処理によって補正ないし正規化され
た文字の読取りは、正確におこなわれる。
第1図は文字列領域画像の補正に係る説明図、第2図は
原の文字列領域、補正文字列領域に係る各画像の模式図
、 第3図は原の文字列、補正文字列に係る各画像の模式図
、 第4図は図書を開いて右ページを画像入力したときの文
字列画像図、 第5図は同しくその文字列領域画像図である。 符号説明 R1:文字列領域画像、 Si =補正文字列領域画像、Gi :文字列画像、H
−−補正文字列画像、Ki :基準線、ここで、均11
準佼鄭叛 ′:4F31国 第2図 第4圀 ″″ff′J5目
原の文字列領域、補正文字列領域に係る各画像の模式図
、 第3図は原の文字列、補正文字列に係る各画像の模式図
、 第4図は図書を開いて右ページを画像入力したときの文
字列画像図、 第5図は同しくその文字列領域画像図である。 符号説明 R1:文字列領域画像、 Si =補正文字列領域画像、Gi :文字列画像、H
−−補正文字列画像、Ki :基準線、ここで、均11
準佼鄭叛 ′:4F31国 第2図 第4圀 ″″ff′J5目
Claims (1)
- 【特許請求の範囲】 1)図書を開いたときの各ページの境界と直角に並ぶ各
文字列の文字を、画像入力装置による画像に基づいて読
み取る方法において、 前記各文字列に外接する長方形文字列領域の画像の長手
方向に設定した基準線上の各点を、その基準線の直線部
の延長線に正投影すること; この正投影したときの隣り合う前記各点を結ぶ各線分を
、その長さが前記正投影前の前記基準線に沿った長さに
なるように修正するとともに、この基準線の直線部から
順次隣接してつながるように修正移動させること; の各ステップの処理を前記各文字列の画像に対して施し
、この処理された各文字列画像に基づいて前記文字を読
み取る; ことを特徴とする図書の文字読取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2143496A JPH0437968A (ja) | 1990-06-01 | 1990-06-01 | 図書の文字読取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2143496A JPH0437968A (ja) | 1990-06-01 | 1990-06-01 | 図書の文字読取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0437968A true JPH0437968A (ja) | 1992-02-07 |
Family
ID=15340065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2143496A Pending JPH0437968A (ja) | 1990-06-01 | 1990-06-01 | 図書の文字読取方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0437968A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005041125A1 (ja) * | 2003-10-24 | 2005-05-06 | Fujitsu Limited | 画像歪み補正プログラム, 画像歪み補正装置,画像歪み補正方法並びに画像歪み補正プログラムを格納した記録媒体 |
JP2008171301A (ja) * | 2007-01-15 | 2008-07-24 | Fujitsu Ltd | 文字認識プログラム、文字認識装置および文字認識方法 |
WO2017057679A1 (ja) * | 2015-09-30 | 2017-04-06 | ヤマハ株式会社 | 画像補正装置 |
-
1990
- 1990-06-01 JP JP2143496A patent/JPH0437968A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005041125A1 (ja) * | 2003-10-24 | 2005-05-06 | Fujitsu Limited | 画像歪み補正プログラム, 画像歪み補正装置,画像歪み補正方法並びに画像歪み補正プログラムを格納した記録媒体 |
WO2005041123A1 (ja) * | 2003-10-24 | 2005-05-06 | Fujitsu Limited | 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法 |
US7471848B2 (en) | 2003-10-24 | 2008-12-30 | Fujitsu Limited | Program for correcting image distortion, apparatus for correcting image distortion, method for correcting image distortion, and recording medium storing program for correcting image distortion |
JP2008171301A (ja) * | 2007-01-15 | 2008-07-24 | Fujitsu Ltd | 文字認識プログラム、文字認識装置および文字認識方法 |
WO2017057679A1 (ja) * | 2015-09-30 | 2017-04-06 | ヤマハ株式会社 | 画像補正装置 |
US10600161B2 (en) | 2015-09-30 | 2020-03-24 | Yamaha Corporation | Image correction device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0146873A3 (en) | Method for correcting image distortion due to gradient nonuniformity | |
US20030002751A1 (en) | Method of correcting an image with perspective distortion and producing an artificial image with perspective distortion | |
WO2002023482A1 (fr) | Dispositif et procede de traitement d'image, et support pour le stockage de ladite image | |
JPH0437968A (ja) | 図書の文字読取方法 | |
US7561306B2 (en) | One-dimensional lens shading correction | |
CN110281666A (zh) | 通过图像投影定位打印介质的方法、装置、设备及介质 | |
US8045822B2 (en) | Correction of image distortion | |
JPH0395684A (ja) | 図形処理システム | |
JP3085396B2 (ja) | ベクトルフォントの展開方法および装置 | |
JPS6312073A (ja) | 細線化処理方法 | |
JP2001209818A (ja) | コンピュータによる画像再編集処理システム | |
JP2864577B2 (ja) | パターン処理方法 | |
CN106648515A (zh) | 一种图片显示方法及装置 | |
JP3090712B2 (ja) | 成形品設計装置 | |
JPH02201690A (ja) | 画像認識装置 | |
JPH0640342B2 (ja) | 画像編集装置 | |
JP3024479B2 (ja) | データ変換装置 | |
JP3066667B2 (ja) | アウトライン文字補正処理方式 | |
JP3067198B2 (ja) | グラデーションの作成方法及び装置 | |
JPH02255958A (ja) | 文書編集方法及び装置 | |
JPH0567163A (ja) | 図面分割方式 | |
JP3138571B2 (ja) | 文字列置換装置 | |
JPS63316188A (ja) | Ocr装置 | |
JPH0289191A (ja) | 認識結果修正方式 | |
JPH07160861A (ja) | 画像処理装置 |