JPH02247788A - Reader - Google Patents

Reader

Info

Publication number
JPH02247788A
JPH02247788A JP1069508A JP6950889A JPH02247788A JP H02247788 A JPH02247788 A JP H02247788A JP 1069508 A JP1069508 A JP 1069508A JP 6950889 A JP6950889 A JP 6950889A JP H02247788 A JPH02247788 A JP H02247788A
Authority
JP
Japan
Prior art keywords
book
processor
page
page number
scanner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1069508A
Other languages
Japanese (ja)
Inventor
Sakae Inoue
井上 榮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1069508A priority Critical patent/JPH02247788A/en
Publication of JPH02247788A publication Critical patent/JPH02247788A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To improve operability and to easily use the reader by deciding the upper and lower parts of a book through the recognition of page numbers. CONSTITUTION:When a start button on an operation panel 10 is depressed after opening and setting up a book to be read out, a processor 13 detects the book and a reading starting command is applied to a scanner 11. The binary data of an image of the book read out by the scanner 11 are transferred to an image memory 14 by DMA transfer. The processor 13 calculates the peripheral distribution of the transferred image data and successively extracts the calculated result to recognize the image data. The recognized result is stored in a RAM area of a program memory 15. Then, the processor 13 decides the image data again by using the peripheral distribution, checks the recognized result, and if no value is detected in all positions, calls an attention through a speaker 19.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、印字文字、記号等を読み取り、認識し、認識
結果を表示、発生、または文字コードとして出力する読
書器に関し、とくに印字されている書物、例えば本の上
下の判定を可能とする読書器に関するものである。
[Detailed Description of the Invention] (Industrial Application Field) The present invention relates to a reading device that reads and recognizes printed characters, symbols, etc. and displays, generates, or outputs the recognition results as a character code, and particularly relates to a reading device that reads and recognizes printed characters, symbols, etc., and displays, generates, or outputs the recognition results as a character code. The present invention relates to a reading device that can determine the top and bottom of a book, for example, the top and bottom of the book.

(従来の技術) この種の読書器は盲人の読書を容易とする上で極めて有
益なものである。従来、この種の読書器を使用する場合
には、晴眼者から教示された本の上下情報に基づいて本
を読書器にセットするか、または本の所定個所に手で触
ってわかる印を貼付しておき、この印を手がかりとして
本の上下を知覚し、読書器にセットしていた。。
(Prior Art) This type of reading device is extremely useful for facilitating reading for blind people. Conventionally, when using this type of reading device, a sighted person would either set the book on the reading device based on the book's top/bottom information given to them, or affix a mark on the book at a designated location that could be detected by touch. Then, using this mark as a clue, he could perceive the top and bottom of the book and set it in the reading device. .

(発明が解決しようとする課題) 上述した従来の読書器においては、本の上下を判定する
機能を有していないなめ、盲人が読書器に本をセットす
る場合、あらかじめ、本の上下判別のために貼付した目
印をたよりに上下を判定するか、目印のない本では晴眼
者に本の上下方向を開いてから本をセットするか、また
は、両方向に本をセットして読書器が正常動仲すれば正
しくセットされたと判断するという方法が用いられてい
た。
(Problems to be Solved by the Invention) The conventional reading device described above does not have a function to determine whether the book is up or down. If the book does not have a mark, ask a sighted person to open the book vertically and then set the book, or set the book in both directions to make sure the reading device is working properly. A method was used in which if they matched, it was determined that the settings were correct.

従って、いずれの方法を用いてもオペレータに余分な負
担をかけることになり、使いがたいものであつた。特に
fi後の両方向セットによる試験的動作正常性チエツク
方法を用いた場合には、本が正しい方向にセットされて
いたとしても読書器の機能、性能が不足しているため正
常に読めない場合や、その本は絵本であり、本来読書器
の対象外であるなどの場合には、よい判定条件となって
はいないため、オペレータに誤った指示を与える恐れが
あった。
Therefore, whichever method is used, it places an extra burden on the operator and is difficult to use. In particular, when using the experimental operation normality check method using bidirectional setting after fi, even if the book is set in the correct direction, it may not be possible to read it properly due to insufficient functions or performance of the reading device. If, for example, the book is a picture book and is not originally intended for reading devices, this is not a good judgment condition, and there is a risk of giving incorrect instructions to the operator.

(課題を解決するための手段) 本発明による読書器は、印刷された文字等を認識するこ
とにより書物内容を読み取る読書器において、欄外のペ
ージ番号を検出し、認識するページ番号検出手段と、検
出されたページ番号の位置および認識結果に基づいて本
の上下を判断する上下判断手段とを備える。
(Means for Solving the Problems) A reading device according to the present invention reads the contents of a book by recognizing printed characters, etc., and includes a page number detection means for detecting and recognizing a page number outside the margin. and a top/bottom determination means for determining the top/bottom of the book based on the position of the detected page number and the recognition result.

即ち、本発明による読書器では、本に必ず印刷されてい
るページ番号を認識し、この文字が読めるかどうかで本
の上下を判定する。そのため、オペレータが開いた状態
でセットした本をスキャナで読み取り、得られな2値デ
ータを処理装置で周辺分布を測定し、この周辺分布の状
態を考慮して、本のページ番号の存在すると思われる場
所の2値データを1つずつ切り出し認識する0通常、本
においてページ番号の存在する位置は定まっているので
、その存在する可能性のある位置より順次、切り出しと
認識を行い、各々の位置での文字が数字として認識でき
たかどうかを記録する。更に、認識された数字の値が左
右両ページで正しく連続しているかを判定し、連続して
いると判定されたときに正しくセットされたものと判定
する。正しくセットされていないと判断された場合、「
本が上下正しくセットされていません」と発声し、オペ
レータに注意を促すかあるいは、上下逆にセットされた
場合は、以後本が逆にセットされた場合に対応した処理
を行う。
That is, the reader according to the present invention recognizes the page number always printed on the book, and determines whether the book is up or down based on whether or not these characters can be read. Therefore, an operator reads a book set in an open state with a scanner, uses a processing device to measure the marginal distribution of the resulting binary data, and, taking into account the state of this marginal distribution, it is assumed that there are page numbers in the book. 0 Normally, the positions where page numbers exist in a book are fixed, so we cut out and recognize the binary data one by one from the positions where the page numbers may exist, and then Records whether the characters in can be recognized as numbers. Furthermore, it is determined whether the recognized numerical values are correctly consecutive on both the left and right pages, and when it is determined that they are consecutive, it is determined that they have been set correctly. If it is determined that it is not set correctly, “
"The book is not set upside down correctly" is uttered to alert the operator, or if the book is set upside down, subsequent processing corresponding to the case where the book is set upside down is performed.

(実施例) 次に本発明について図面を参照してより詳細に説明する
(Example) Next, the present invention will be described in more detail with reference to the drawings.

第1図は本発明による読書器の一実施例を示す全体構成
ブロック図である。
FIG. 1 is a block diagram showing an overall configuration of an embodiment of a reader according to the present invention.

本実施例では、スキャナ11により光学的に本を走査し
て読み取られて得られた2値データはバス12を介して
操作パネル10、プロセッサ13、イメージメモリ14
、プログラムメモリ15、パターンメモリ16、辞書メ
モリ17、音声合成回路18に供給される。音声合成部
18からの合成音声はスピーカ19に出力される。
In this embodiment, binary data obtained by optically scanning and reading a book with a scanner 11 is transmitted via a bus 12 to an operation panel 10, a processor 13, and an image memory 14.
, program memory 15, pattern memory 16, dictionary memory 17, and speech synthesis circuit 18. The synthesized speech from the speech synthesis section 18 is output to the speaker 19.

プログラムメモリ15には、各種制御を行うためのプロ
グラムが格納されている読み出し専用メモリ(ROM)
部と、処理を行うために必要なワークエリアとして使わ
れる書き込みと読み出し可能なメモリ(RAM)部から
構成されている。
The program memory 15 is a read-only memory (ROM) that stores programs for performing various controls.
It consists of a writeable and readable memory (RAM) section, which is used as a work area necessary for processing.

ところで、一般に本の紙面上ページ番号が印刷されてい
る場所は時定まっており、縦書、横書にかかわらず第2
図に示す各部位21〜26がある。
By the way, generally the place where the page number is printed on the paper of a book is fixed at a certain time, and whether it is vertical or horizontal writing, the page number is printed on the second page.
There are parts 21 to 26 shown in the figure.

ここで第2図の丸印がページ番号の存在する箇所を示し
、中央の線は本を開いたときの中央の境目を示している
。これを念頭において、以下、本実施例の動作を説明す
る。
Here, the circles in FIG. 2 indicate where the page numbers are located, and the line in the center indicates the center boundary when the book is opened. With this in mind, the operation of this embodiment will be described below.

オペレータは、まず、読ませない本を開いて、読書器に
セットした後、操作パネル10のスタートボタンを押下
する。このスタートボタンの押下を、プロセッサ13が
検出すると、スキャナ11に読み取り開始の指示が与え
られる。スキャナ11により読み取られたセットされた
本の該当ページの2値データは、イメージメモリ14へ
DMA転送で転送される。ここで、プロセッサ13が介
在して1バイトずつスキャナ11よりデータを受は取り
、イメージメモリ14に格納するようにしてもよいこと
は勿論である。
The operator first opens a book that is not to be read, sets it in the reader, and then presses the start button on the operation panel 10. When the processor 13 detects that the start button is pressed, an instruction is given to the scanner 11 to start reading. The binary data of the corresponding page of the set book read by the scanner 11 is transferred to the image memory 14 by DMA transfer. Of course, the processor 13 may intervene to receive data byte by byte from the scanner 11 and store it in the image memory 14.

こうして読み込まれたデータが第3図に30で示すよう
なものであったとする。プロセッサ13は次に周辺分布
を計算する0周辺分布とは、縦方向または、横方向の特
定の一点から見た黒ドツト数をカウントした結果を基準
線に直角な方向に黒ドツトの数に比例した棒グラフとし
て描いたもので、30のパターンについて、周辺分布を
描くと31.32のようになる。
Assume that the data read in this way is as shown at 30 in FIG. The processor 13 then calculates the marginal distribution. The marginal distribution is the result of counting the number of black dots seen from a specific point in the vertical or horizontal direction, which is proportional to the number of black dots in the direction perpendicular to the reference line. This is drawn as a bar graph, and if you draw the marginal distribution for the 30 patterns, it will be 31.32.

第3図の例は、本が水平、垂直方向に正確に一致してセ
ットされた場合の例であるが実際には傾いた状態でセッ
トされる場合の方が多い。したがって、周辺分布を測定
し、山と谷の差を比べ差が小さければ、イメージメモリ
14の他のエリアに時計回りに5度回転した状態で転送
する。
The example shown in FIG. 3 is an example in which the books are set in exact alignment in the horizontal and vertical directions, but in reality, they are more often set in an inclined state. Therefore, the peripheral distribution is measured, and the difference between the peaks and valleys is compared. If the difference is small, the image is transferred to another area of the image memory 14 after being rotated 5 degrees clockwise.

次に転送されたイメージデータに対する周辺分布を計算
する。やはり、差が小さい場合反時計回りに5度回転し
、前と同様の処理を行う、このようにして、回転角度を
増加し、最適な角度が見つかるまで処理を続行する。最
適角度が見出だされたときのイメージパターンと周辺分
布のデータは保存しておく。
Next, a marginal distribution for the transferred image data is calculated. Again, if the difference is small, rotate 5 degrees counterclockwise and perform the same process as before, increasing the rotation angle and continuing the process until the optimal angle is found. The image pattern and peripheral distribution data when the optimal angle was found are saved.

次に第2図に示す位置21〜26の順に当該位置イメー
ジデータを取り出し認識を行う0通常ベージ番号は4桁
以内であると考えてよいのでページ番号が位置21にあ
るとすれば第1行目の先頭から4文字であり、位置22
では第1行目の後から4文字である0位置23では最下
行の先頭から4文字、位置24では後から4文字、位置
25と26では各ページ中央の4文字である。
Next, extract the relevant position image data in the order of positions 21 to 26 shown in Figure 2 and perform recognition. Normally, page numbers can be considered to be within 4 digits, so if the page number is at position 21, the first row 4 characters from the beginning of the eye, position 22
Then, the 0 position 23, which is the last four characters of the first line, is the four characters from the beginning of the bottom line, the position 24 is the last four characters, and the positions 25 and 26 are the four characters in the center of each page.

プロセッサ13は、まず、位置21の文字列を切り出す
The processor 13 first cuts out the character string at position 21.

切り出された文字列は「読書器と」である、プロセッサ
13は、さらに、この切り出された文字列の先頭より一
文字ずつ文字を切り出し、認識を行う。認識は、パター
ンメモリ16を用いる。パターンメモリ16には文字の
パターンが格納されており、このパターンとの比較を行
い、最も類似度の高いものを認識結果とする。認識処理
の結果パターンメモリ16に記憶されているどのパター
ン(標準パターンという)とも類似していなければ認識
できなかったことになる。認識結果はプログラムメモリ
15のRAMエリアへ格納される。
The extracted character string is "reader". The processor 13 further extracts characters one by one from the beginning of this extracted character string and performs recognition. The pattern memory 16 is used for recognition. Character patterns are stored in the pattern memory 16, and comparisons are made with these patterns, and the one with the highest degree of similarity is taken as the recognition result. If the result of the recognition process is not similar to any pattern (referred to as a standard pattern) stored in the pattern memory 16, it means that the pattern could not be recognized. The recognition result is stored in the RAM area of the program memory 15.

RAMへ格納される情報としては、認識できたか否かの
データと認識されたページ番号である。
The information stored in the RAM is data indicating whether or not recognition was possible and the recognized page number.

認識できた場合は数字の“1”が、認識できなかった場
合は0”が格納される。第4図は第3図のページを認識
した場合の例である。
If the page is recognized, the number "1" is stored, and if the page is not recognized, the number "0" is stored. FIG. 4 is an example of the case where the page in FIG. 3 is recognized.

RAMのA番地以降の30バイトが認識結果の格納用で
あり、先頭より5バイトずつに区切られたエリアが夫々
位置21〜26に対応している。
The 30 bytes after address A in the RAM are for storing recognition results, and the areas divided into 5 bytes from the beginning correspond to positions 21 to 26, respectively.

夫々のエリアの先頭の1バイトが認識できたかどうかの
結果を格納するエリアであり、残りの4バイトが、認識
されたページ番号を格納するエリアである。認識できな
かった場合は、このエリアにはスペース(Δ)が格納さ
れる。
The first 1 byte of each area is an area for storing the result of recognition, and the remaining 4 bytes are an area for storing the recognized page number. If it cannot be recognized, a space (Δ) is stored in this area.

第4図には、RAMに格納されている認識結果の例が示
されており、位置21〜24では認識できず、位125
.26で認識でき、その結果が位置25では321、位
置26では322と認識できた場合が示されている。
FIG. 4 shows an example of recognition results stored in the RAM.
.. 26, and the results are 321 at position 25 and 322 at position 26.

次にプロセッサ13は、再び周辺分布を用いてこの本が
縦書か、横書かを判定する。縦書か横書かは、周辺分布
の山と山のスキマが、上下方向と左右方向のいずれで大
きいかによって、判定できる。第3図の場合上下方向で
のスキマの方が大きいので横書きと見なすことができる
。横書きの場合、左ページのページ番号の方が右ページ
のページ番号より小さくなければならない、縦書の場合
はこの逆である。そこで、次に認識結果の数値のチエツ
クを行い、この規則にのっとっているかどうかを判定す
る。この規則にのっとっておれば、本が正しくセットさ
れていると見なすのである。
Next, the processor 13 uses the marginal distribution again to determine whether the book is written vertically or horizontally. Vertical or horizontal writing can be determined depending on whether the gap between the mountains in the peripheral distribution is larger in the vertical direction or in the horizontal direction. In the case of FIG. 3, the gap in the vertical direction is larger, so it can be considered as horizontal writing. For horizontal writing, the page number of the left page must be smaller than the page number of the right page, and vice versa for vertical writing. Therefore, next, the numerical value of the recognition result is checked to determine whether it conforms to this rule. If this rule is followed, the book is considered to be set correctly.

このチエツクを行う理由は、18ページ、19ページを
開いたときのように上下逆であっても数字として何らお
かしくないものがあり、数字として認識できたかどうか
だけを判定する基準とすると、逆さにセットされていて
も正しくセットされたと誤認識されるためである。
The reason for performing this check is that there is nothing wrong with numbers even if they are upside down, like when pages 18 and 19 are opened. This is because even if it is set, it may be mistakenly recognized as having been set correctly.

誤認識した結果、21〜26のすべての位置で数字が検
出できなかった場合は、本が逆さにセットされていると
判定し、プロセッサ13は音声合成回路18へr本が逆
さにセットされています」という文字コードを与えスピ
ーカ19を介して発声させ、オペレータに注意を促す。
If, as a result of erroneous recognition, no numbers are detected in any of the positions 21 to 26, it is determined that the book is set upside down, and the processor 13 informs the speech synthesis circuit 18 that the r book is set upside down. A character code such as "Masu" is given, and the message is uttered through the speaker 19 to call the operator's attention.

オペレータはこの音声を聞いて本を上下逆にセットする
The operator listens to this voice and sets the book upside down.

プロセッサ13は、操作パネル10のスタートボタンの
押下を監視しておき、スタートボタンの押下を検出する
と前に述べた処理を再度開始する。
The processor 13 monitors the depression of the start button on the operation panel 10, and restarts the above-described process when the depression of the start button is detected.

上述の説明では、オペレータに注意を促し、オペレータ
の手により本をセットしなおすという方法で説明したが
、本のセットされた方向を加味して文字の認識、文章の
解析、音声の合成などの次の処理を行っていく方法を用
いてもよい。
In the above explanation, the method was explained by calling the operator's attention and resetting the book by hand. A method may be used in which the following processing is performed.

以上のようにして本が正しくセットされた後、プロセッ
サは周辺分布を再び用いて、ページ内の文字を一文字ず
つ切り出し、認識を行い、RAMエリアに格納する。
After the book is correctly set as described above, the processor uses the marginal distribution again to cut out the characters on the page one by one, recognize them, and store them in the RAM area.

ところで、ページ番号の前後には、カッコ(<、))や
波形(〜)あるいはマイナス記号(−)がある場合もあ
る。さらに、ページ番号の横にその章の名称やその他の
情報が印刷されている場合もある。したがってRAMへ
格納するのは数字として認識されたものだけを格納し、
それ以外の情報は、捨てて格納しない。
Incidentally, there may be parentheses (<, )), a waveform (~), or a minus sign (-) before and after the page number. Additionally, the chapter name or other information may be printed next to the page number. Therefore, only what is recognized as a number is stored in RAM,
Other information is discarded and not stored.

RAMの中にある程度の文字が格納されると、辞書メモ
リ17を用いて、文字列を文節単位に分割し、読みを付
け、これを音声合成回路18およびスピーカ19を用い
て発声させる。そのページの発声が全て完了すると、「
次のページをめくって下さい」と発声し、オペレータに
操作を促す。
When a certain number of characters are stored in the RAM, the dictionary memory 17 is used to divide the character string into phrases, readings are added, and the speech synthesis circuit 18 and speaker 19 are used to vocalize the characters. When all the utterances for that page are completed,
Please turn to the next page.'' to prompt the operator.

オペレータが次のページをめくってスタートボタンを押
すとプロセッサは、スキャナ11よりそのページを読み
取り、以前と同じ処理を実行して、本を読み上げていく
When the operator turns over the next page and presses the start button, the processor reads that page using the scanner 11, performs the same process as before, and reads out the book.

(発明の効果) 以上説明したように本発明は、ページ番号の認識を通し
て本の上下を判定することにより、本の上下を盲人が晴
眼者に尋ねたり、目印を手でさがして判定するなどの必
要性がなくなるので操作性が一段と向上し、読書器が一
層使い易いものとなるという効果がある。
(Effects of the Invention) As explained above, the present invention enables a blind person to ask a sighted person about the top and bottom of a book by determining the top and bottom of the book through recognition of page numbers, or to determine the top and bottom of a book by searching for landmarks by hand. Since this is no longer necessary, the operability is further improved and the reading device becomes even easier to use.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明による読書器の一実施例を示す全体構成
ブロック図、第2図は通常の本でページ番号の存在する
位置を示す図、第3図は読み込まれた文書の一例とその
周辺分布を示す図、第4図はRAMに格納された認識結
果を示す図である。 10・・・操作パネル、11・・・スキャナ、12・・
・バス、13・・・プロセッサ、14・・・イメージメ
モリ、15・・・プログラムメモリ、16・・・パター
ンメモリ、17・・・辞書メモリ、18・・・音声合成
回路、19・・・スピーカ。
Fig. 1 is a block diagram of the overall configuration of an embodiment of a reading device according to the present invention, Fig. 2 is a diagram showing the positions of page numbers in a normal book, and Fig. 3 is an example of a read document and its contents. A diagram showing the peripheral distribution, and FIG. 4 is a diagram showing the recognition results stored in the RAM. 10...Operation panel, 11...Scanner, 12...
・Bus, 13...Processor, 14...Image memory, 15...Program memory, 16...Pattern memory, 17...Dictionary memory, 18...Speech synthesis circuit, 19...Speaker .

Claims (1)

【特許請求の範囲】[Claims] 印刷された文字等を認識することにより書物内容を読み
取る読書器において、欄外のページ番号を検出し、認識
するページ番号検出手段と、検出されたページ番号の位
置および認識結果に基づいて本の上下を判断する上下判
断手段とを備えて成ることを特徴とする読書器。
In a reading device that reads the contents of a book by recognizing printed characters, etc., there is a page number detection means that detects and recognizes the page number outside the margin, and a page number detection means that detects and recognizes the page number outside the margin, and the top and bottom of the book based on the position of the detected page number and the recognition result. A reading device characterized by comprising: upper and lower judgment means for judging.
JP1069508A 1989-03-22 1989-03-22 Reader Pending JPH02247788A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1069508A JPH02247788A (en) 1989-03-22 1989-03-22 Reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1069508A JPH02247788A (en) 1989-03-22 1989-03-22 Reader

Publications (1)

Publication Number Publication Date
JPH02247788A true JPH02247788A (en) 1990-10-03

Family

ID=13404755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1069508A Pending JPH02247788A (en) 1989-03-22 1989-03-22 Reader

Country Status (1)

Country Link
JP (1) JPH02247788A (en)

Similar Documents

Publication Publication Date Title
JPH03201166A (en) Display system at the time of correcting japanese document reading translation system
JPH1139428A (en) Direction correcting method for document video
JPH02247788A (en) Reader
JP2503208B2 (en) Business card image processing method
JP5455364B2 (en) Information processing apparatus and locus data recognition method
JPS61272882A (en) Information recognizing device
JPS6074094A (en) Character recognizing device
JPS61163477A (en) Character recognition device
JP3162575B2 (en) Character recognition device
JPS60238988A (en) Data processor equipped with character recognition device
JPS63220383A (en) Character input device
JPH0452885A (en) Character reader
JPH04192090A (en) Optical character reader
JPS5854431B2 (en) Misreading detection method for character recognition device
JPH01169673A (en) Electronic dictionary
JPH055144B2 (en)
JPH01259470A (en) Character recognizing device
JPS63188284A (en) Character reader
JPH0615149U (en) Media reader
JPH0877297A (en) Portable terminal equipment
JPH03175592A (en) On-line character recognizing device
JPH1166239A (en) System and method for character read
JPH04354085A (en) Character reader
JPS638989A (en) Character reader
JPS59180782A (en) Optical character reader