JPH06325201A - Character recognizing device - Google Patents
Character recognizing deviceInfo
- Publication number
- JPH06325201A JPH06325201A JP5109175A JP10917593A JPH06325201A JP H06325201 A JPH06325201 A JP H06325201A JP 5109175 A JP5109175 A JP 5109175A JP 10917593 A JP10917593 A JP 10917593A JP H06325201 A JPH06325201 A JP H06325201A
- Authority
- JP
- Japan
- Prior art keywords
- knowledge
- dictionary
- character
- knowledge dictionary
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】この発明は、通信回線に接続さ
れ、かつ高精度に認識のできる文字認識装置に関するも
のである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device connected to a communication line and capable of highly accurate recognition.
【0002】[0002]
【従来の技術】従来、通信回線に接続され効率よく運用
出来る文字認識装置としては、例えば特願平03−18
1072に示される情報処理装置に含まれる文字認識装
置があった。この情報処理装置は、通信回線により伝送
された信号より、文書の画像信号、及び発信元を表わす
データを抽出し、受信した画像信号より、文字領域を検
出し、前記検出した文字領域内の文字について文字認識
を行い、前記認識された文字認識結果を翻訳し、前記翻
訳結果を前記受信された発信元に返送する、というもの
であった。2. Description of the Related Art Conventionally, as a character recognition device connected to a communication line and capable of operating efficiently, for example, Japanese Patent Application No. 03-18
There is a character recognition device included in the information processing device 1072. This information processing apparatus extracts an image signal of a document and data representing a sender from a signal transmitted through a communication line, detects a character area from the received image signal, and detects a character in the detected character area. Character recognition is performed, the recognized character recognition result is translated, and the translation result is returned to the received sender.
【0003】また高精度に認識のできる文字認識装置と
しては例えば、特願昭63−029098に示される文
字認識装置があり、1文字ずつの文字を認識し、前記1
文字ずつの認識結果の列より単語を抽出し、前記抽出さ
れた単語をあらかじめ用意した単語辞書と照合し、前記
単語照合の結果を認識結果として出力する、というもの
であった。As a character recognizing device capable of recognizing with high accuracy, there is a character recognizing device shown in Japanese Patent Application No. 63-029098, which recognizes characters one by one and
A word is extracted from a recognition result string for each character, the extracted word is collated with a word dictionary prepared in advance, and the result of the word collation is output as a recognition result.
【0004】[0004]
【発明が解決しようとする課題】しかし、通信回線に接
続され運用されている前記従来の文字認識装置は一般に
会社等において、複数の部門において少数の装置を効率
的に運用することを目的としている場合が多く、従って
様々な部門からの様々な文書を受信し処理する場合が主
であった。従って、前記従来の文字認識装置は、装置が
汎用的な構成に成らざるを得ず、従って特定の文書に対
応できないため一般に高精度な認識が不可能であり、そ
のため効率よく文書を入力することができないという問
題点があった。However, the above-mentioned conventional character recognition device connected to a communication line and operated is generally intended to efficiently operate a small number of devices in a plurality of departments in a company or the like. In many cases, it was therefore the case to receive and process different documents from different departments. Therefore, the conventional character recognition device has to have a general-purpose structure, and therefore cannot generally support high-precision recognition because it cannot correspond to a specific document. Therefore, a document can be efficiently input. There was a problem that I could not do it.
【0005】例えば、図2(A)(B)に示すような、
同一の書式の帳票に記されてはいるが、発信元が異なる
ために文書の種類・内容が全く異なるような帳票文書画
像を認識する場合、前記従来の文字認識装置において
は、同一の書式の帳票に記されているがために文字認識
処理における単語照合において同一の単語辞書を用いて
処理しなければなず満足のいく単語照合が行えないため
高精度な認識ができないという問題が生じた。For example, as shown in FIGS.
When the form document images, which are written on the form of the same format but have different types and contents of documents due to different senders, are recognized, the conventional character recognition device uses the same format. Since it is written on the form, the same word dictionary must be used for the word matching in the character recognition processing, and a satisfactory word matching cannot be performed, resulting in a problem that high-accuracy recognition cannot be performed.
【0006】この発明は各部門から伝送される特定の文
書に対応して高精度の認識が可能な文字認識装置を提供
することを目的とする。An object of the present invention is to provide a character recognition device capable of highly accurate recognition corresponding to a specific document transmitted from each department.
【0007】[0007]
【課題を解決するための手段】この発明は前記課題を解
決するために、通信回線より伝送された文書の認識を行
う文字認識装置において、画像信号と共に発信元をあら
わすデータを受信する受信部と、前記受信した文書画像
の1文字ずつの文字を認識する文字認識部と、前記受信
した発信元データに応じて知識辞書を選択する知識辞書
選択部と、前記1文字ずつの文字の認識結果の列に対し
て前記選択された知識辞書を用いて知識処理を行う知識
処理部と、を具えることを特徴とする。In order to solve the above-mentioned problems, the present invention provides a character recognition device for recognizing a document transmitted from a communication line, and a receiving unit for receiving data representing an origin together with an image signal. A character recognition unit that recognizes each character of the received document image, a knowledge dictionary selection unit that selects a knowledge dictionary according to the received source data, and a recognition result of each character. A knowledge processing unit that performs knowledge processing on the column using the selected knowledge dictionary.
【0008】[0008]
【作用】この発明の文字認識装置によれば、前述のよう
に構成したので、同一の書式の帳票に異なる種類の文書
が記された場合においても発信元に応じて知識辞書を切
り換えることができるため、伝送された文書に応じた知
識辞書を用いて知識処理することが可能となり、高精度
の認識が可能となる。According to the character recognition apparatus of the present invention, since it is configured as described above, the knowledge dictionary can be switched according to the sender even when different types of documents are written on the same form. Therefore, knowledge processing can be performed using the knowledge dictionary corresponding to the transmitted document, and highly accurate recognition can be performed.
【0009】[0009]
【実施例】図1はこの発明の文字認識装置の一実施例を
示す構成図である。文字認識装置10は受信部11、文
字認識部12、知識辞書選択部13、第1の知識辞書1
4、第2の知識辞書15、知識処理部16、および出力
部17からなる。図2は文書画像の例を示す図であり、
20は帳画文書画像、21は文字記入枠である。図3は
知識辞書の説明をする図である。図4は知識辞書対応テ
ーブルの説明をする図であり、40は知識辞書対応テー
ブル、41は発信元電話番号、42は知識辞書番号であ
る。1 is a block diagram showing an embodiment of a character recognition device of the present invention. The character recognition device 10 includes a reception unit 11, a character recognition unit 12, a knowledge dictionary selection unit 13, and a first knowledge dictionary 1.
4, a second knowledge dictionary 15, a knowledge processing unit 16, and an output unit 17. FIG. 2 is a diagram showing an example of a document image,
Reference numeral 20 is a book image document, and 21 is a character entry frame. FIG. 3 is a diagram for explaining the knowledge dictionary. FIG. 4 is a diagram for explaining the knowledge dictionary correspondence table, where 40 is a knowledge dictionary correspondence table, 41 is a source telephone number, and 42 is a knowledge dictionary number.
【0010】以下、図1を用いて本発明の実施例につい
て詳細に説明する。まず通信回線により伝送されたファ
クシミリ信号Sは、文字認識装置10内の受信部11に
入力される。受信部11においては、受信したファクシ
ミリ信号を文書の画像信号に変換し、さらに前記ファク
シミリ信号より発信元データを抽出し、文書の画像信号
を文字認識部12に出力すると共に、 抽出した発信元
データを知識辞書選択部13に出力する。An embodiment of the present invention will be described in detail below with reference to FIG. First, the facsimile signal S transmitted through the communication line is input to the receiving unit 11 in the character recognition device 10. In the receiving unit 11, the received facsimile signal is converted into a document image signal, the source data is extracted from the facsimile signal, the document image signal is output to the character recognition unit 12, and the extracted source data is extracted. Is output to the knowledge dictionary selection unit 13.
【0011】文字認識部12においては、受信部11よ
り入力された文書画像データより1文字ずつの文字を抽
出し、該1文字ずつの文字に対して図示せぬ認識辞書を
用いて認識処理を行い、認識結果の文字コード名を知識
処理部16に出力する。The character recognition unit 12 extracts a character by character from the document image data input from the reception unit 11, and performs a recognition process on the character by character using a recognition dictionary (not shown). Then, the character code name of the recognition result is output to the knowledge processing unit 16.
【0012】知識辞書選択部13においては、受信部1
1より入力された発信元データに従って知識辞書対応テ
ーブルを参照し、第1の知識辞書14または第2の知識
辞書15のいずれか一方を選択し、前記選択した辞書を
知識処理部16より検索が可能な状態にする。In the knowledge dictionary selecting section 13, the receiving section 1
The knowledge dictionary correspondence table is referred to according to the source data input from 1 to select either the first knowledge dictionary 14 or the second knowledge dictionary 15, and the knowledge processing unit 16 searches the selected dictionary. Make it possible.
【0013】知識処理部16においては、文字認識部1
2より入力された認識結果の文字コード名列より単語を
抽出し、該単語を知識処理選択部13より選択された知
識辞書を用いて照合を行い該照合結果の単語文字列を認
識結果として出力部17に出力する。尚、前記単語の抽
出は文字認識部12より入力された認識結果の文字コー
ド名列を「、」、「。」、「 」の区切り文字及び文字
種の変化するカ所において分割することにより行うもの
とする。In the knowledge processing unit 16, the character recognition unit 1
A word is extracted from the character code name string of the recognition result input from 2 and the word is matched using the knowledge dictionary selected by the knowledge processing selection unit 13 and the word character string of the matching result is output as the recognition result. It is output to the unit 17. The word extraction is performed by dividing the character code name sequence of the recognition result input from the character recognition unit 12 at the delimiters of “,”, “.”, “” And the places where the character type changes. To do.
【0014】出力部17は、知識処理部16より入力さ
れた認識結果の単語文字列を外部に出力する端子であ
り、外部の記憶装置、通信回線、その他の情報処理装置
等に接続されるものである。The output unit 17 is a terminal for outputting the word character string of the recognition result input from the knowledge processing unit 16 to the outside, and is connected to an external storage device, communication line, other information processing device, or the like. Is.
【0015】つぎに本実施例の具体例について図2〜図
4を用いて説明する。図2は伝送されたファクシミリ文
書画像の例を示す図であり、図2(A)および図2
(B)は例えば各々別の部門において作成された種類の
異なる文書である。また、図3は知識辞書の説明をする
図であり、図3(A)は住所、氏名、契約関連単語等が
登録された第1の知識辞書15、図3(B)は一般単語
が登録された第2の認識辞書16の登録単語例を示した
ものである。図4は知識辞書選択部13内の知識辞書対
応テーブルの例を示す図であり、41は発信元部門電話
番号を、42は当該部門より発信される文書に対応した
知識辞書の番号が予め登録されているものである。Next, a specific example of this embodiment will be described with reference to FIGS. FIG. 2 is a diagram showing an example of the transmitted facsimile document image, which is shown in FIGS.
(B) are, for example, different types of documents created in different departments. 3 is a diagram for explaining the knowledge dictionary. FIG. 3 (A) is a first knowledge dictionary 15 in which addresses, names, contract-related words, etc. are registered, and FIG. 3 (B) is a general word is registered. It shows an example of registered words of the generated second recognition dictionary 16. FIG. 4 is a diagram showing an example of a knowledge dictionary correspondence table in the knowledge dictionary selection unit 13, where 41 is a source department telephone number and 42 is a knowledge dictionary number corresponding to a document transmitted from the department in advance. It has been done.
【0016】まず、通信回線により接続された一部門よ
り図2(A)に示されるような文書が入力された場合、
受信部11においては図2(A)に示すような文書画像
を文字認識部12に、また受信ファクシミリ信号より抽
出した発信部門データであるところの発信元電話番号
(本実施例では1005とする)を知識辞書選択部13
に出力する。知識辞書選択部13においては、受信部1
1より入力された部門電話番号1005より図4に示す
知識辞書対応テーブルを用いて当該部門が発信した文書
の種類に対応した知識辞書番号を検出し、(本実施例で
は1)、当該辞書番号に対応する図3(A)に示すよう
な知識辞書1を選択し、知識処理部16より検索できる
ようにする。First, when a document as shown in FIG. 2A is input from one department connected by a communication line,
In the receiving section 11, a document image as shown in FIG. 2A is sent to the character recognizing section 12, and a source telephone number (1005 in this embodiment) which is the calling department data extracted from the received facsimile signal. Knowledge dictionary selection unit 13
Output to. In the knowledge dictionary selecting unit 13, the receiving unit 1
From the department telephone number 1005 input from No. 1, the knowledge dictionary number corresponding to the type of the document sent by the department is detected using the knowledge dictionary correspondence table shown in FIG. 4, and (1 in this embodiment), the dictionary number concerned. The knowledge dictionary 1 as shown in FIG. 3A corresponding to is selected so that the knowledge processing unit 16 can retrieve it.
【0017】また、図2(B)に示すようなファクシミ
リ信号が別部門(部門電話番号が1006とする)より
入力された場合には受信部11は図2(B)に示すよう
な文書画像を文字認識部12に出力し、当該文書の発信
元である部門の部門電話番号1006を知識辞書選択部
13に出力する。知識辞書選択部13においては図4に
示す知識辞書対応テーブルを用いて、部門電話番号10
06で示される部門が発信する文書の種類に対応した知
識辞書番号を検出し、対応する図3(B)に示すような
知識辞書2を知識処理部16より検索できるような処理
を行う。When a facsimile signal as shown in FIG. 2 (B) is input from another department (the department telephone number is 1006), the receiving unit 11 displays the document image as shown in FIG. 2 (B). Is output to the character recognition unit 12, and the department telephone number 1006 of the department that is the source of the document is output to the knowledge dictionary selection unit 13. The knowledge dictionary selection unit 13 uses the knowledge dictionary correspondence table shown in FIG.
A knowledge dictionary number corresponding to the type of the document transmitted by the department indicated by 06 is detected, and the knowledge processing unit 16 performs a process for searching the corresponding knowledge dictionary 2 as shown in FIG. 3B.
【0018】従って、知識処理部16においては図2
(A)に示すような契約情報が記された文書画像に対し
ては知識辞書1を用いて認識し、図2(B)に示すよう
な一般文書が記された文書画像が入力された場合には知
識辞書2を用いて知識処理を行う。Therefore, in the knowledge processing section 16, FIG.
When a document image with contract information as shown in (A) is recognized using the knowledge dictionary 1, and a document image with a general document as shown in FIG. 2B is input. Knowledge processing is performed using the knowledge dictionary 2.
【0019】以上、本発明の文字認識装置について詳細
に説明をしたが、本発明は本実施例にのみ適用されるも
のではなく、本発明の範囲内で任意好適に実施できる。
例えば、本実施例においては、知識辞書の種類は2種類
としたが、これに限られるものではなく、3種類以上の
知識辞書を具備する構成としても良い。また、前記知識
辞書は契約関連単語の辞書及び一般単語の辞書としたが
これに限られるものではなく、個々の文書に対応した任
意好適な構成の辞書を用いても何等差し支えない。Although the character recognition device of the present invention has been described in detail above, the present invention is not limited to the present embodiment and can be suitably implemented within the scope of the present invention.
For example, in the present embodiment, there are two types of knowledge dictionaries, but the number of knowledge dictionaries is not limited to this, and the knowledge dictionaries of three or more types may be provided. Further, the knowledge dictionary is a contract-related word dictionary and a general-word dictionary, but the knowledge dictionary is not limited to this, and a dictionary having an arbitrarily suitable structure corresponding to each document may be used.
【0020】[0020]
【発明の効果】以上詳細に説明したように本発明の文字
認識装置は、通信回線で接続され複数の部門より利用さ
れるような文字認識装置において、同一の書式の帳票に
異なる種類の文書が記され伝送された場合においても発
信元に応じて知識辞書を切り換えることができるため、
各々の部門より伝送されている文書に応じた知識辞書を
用いて知識処理することが可能となり、従って個々の部
門においては自部門に文字認識装置があるものと同程度
に特化して該通信回線で結ばれた文字認識装置を利用す
ることができ、従って高精度な認識が可能となり、効率
的な文書入力システムを構築することができる。As described in detail above, the character recognition apparatus of the present invention is a character recognition apparatus connected by a communication line and used by a plurality of departments. Even when written and transmitted, the knowledge dictionary can be switched according to the sender,
It becomes possible to perform knowledge processing using a knowledge dictionary according to the document transmitted from each department. Therefore, in each department, the communication line is specialized as much as a character recognition device in its own department. It is possible to use the character recognition device connected by, so that highly accurate recognition is possible and an efficient document input system can be constructed.
【図1】本発明の一実施例を示す構成図である。FIG. 1 is a configuration diagram showing an embodiment of the present invention.
【図2】本実施例で用いる帳票画像の例を示す図であ
る。FIG. 2 is a diagram showing an example of a form image used in this embodiment.
【図3】知識辞書の説明をする図である。FIG. 3 is a diagram illustrating a knowledge dictionary.
【図4】知識辞書対応テーブルの説明をする図である。FIG. 4 is a diagram illustrating a knowledge dictionary correspondence table.
10 文字認識装置 11 受信部 12 文字認識部 13 知識辞書選択部 14 知識辞書1 15 知識辞書2 16 知識処理部 17 出力部 10 Character Recognition Device 11 Reception Unit 12 Character Recognition Unit 13 Knowledge Dictionary Selection Unit 14 Knowledge Dictionary 1 15 Knowledge Dictionary 2 16 Knowledge Processing Unit 17 Output Unit
Claims (1)
う文字認識装置において、 画像信号と共に発信元をあらわすデータを受信する受信
部と、 前記受信した文書画像の1文字ずつの文字を認識する文
字認識部と、 前記受信した発信元データに応じて知識辞書を選択する
知識辞書選択部と、 前記1文字ずつの文字の認識結果の列に対して前記選択
された知識辞書を用いて知識処理を行う知識処理部と、
を具えることを特徴とする文字認識装置。1. A character recognition device for recognizing a document transmitted from a communication line, and a receiving unit for receiving data representing a sender together with an image signal and a character for each character of the received document image. A character recognition unit, a knowledge dictionary selection unit that selects a knowledge dictionary according to the received source data, and a knowledge processing using the selected knowledge dictionary for the character recognition sequence of each character. A knowledge processing unit that
A character recognition device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5109175A JPH06325201A (en) | 1993-05-11 | 1993-05-11 | Character recognizing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5109175A JPH06325201A (en) | 1993-05-11 | 1993-05-11 | Character recognizing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06325201A true JPH06325201A (en) | 1994-11-25 |
Family
ID=14503563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5109175A Pending JPH06325201A (en) | 1993-05-11 | 1993-05-11 | Character recognizing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06325201A (en) |
-
1993
- 1993-05-11 JP JP5109175A patent/JPH06325201A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3470664B2 (en) | E-mail terminal device with received mail display method and pictogram conversion function | |
EP1603291A2 (en) | Information transmission system and information transmission method | |
JPH01279368A (en) | Transfer system for character data | |
US20050037806A1 (en) | Managing an address book in portable terminal having a camera | |
JPH11167532A (en) | System, device, and method for data processing and recording medium | |
JP2002278977A (en) | Device and method for answering question and question answer program | |
CN112182174A (en) | Business question-answer knowledge query method and device, computer equipment and storage medium | |
JPH06325201A (en) | Character recognizing device | |
KR20000073523A (en) | The method to connect a web site using a classical number system. | |
JPH0388062A (en) | Device for preparing document | |
JPH10334084A (en) | Information processor | |
JP2851469B2 (en) | Business card reader | |
JP2918579B2 (en) | Image processing device | |
EP0553304A1 (en) | Telecommunications device and related method | |
JPS5862762A (en) | Sentence data unifying device | |
JPS60132265A (en) | "kana" "kanji" converting device | |
JPS61187034A (en) | Document output device | |
JPH06333093A (en) | Character recognizing device | |
JPH03232063A (en) | Electronic dictionary retrieving method | |
JPH07107683B2 (en) | Image retrieval device | |
JP2005128076A (en) | Speech recognition system for recognizing speech data from terminal, and method therefor | |
JPH04130973A (en) | Data registering system for electronic filing | |
JPH01314071A (en) | Electronic file system | |
CN1010058B (en) | Chinese article writting device | |
JPH0823346A (en) | Facsimile mail equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20011120 |