JPH06325201A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH06325201A
JPH06325201A JP5109175A JP10917593A JPH06325201A JP H06325201 A JPH06325201 A JP H06325201A JP 5109175 A JP5109175 A JP 5109175A JP 10917593 A JP10917593 A JP 10917593A JP H06325201 A JPH06325201 A JP H06325201A
Authority
JP
Japan
Prior art keywords
knowledge
dictionary
character
knowledge dictionary
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5109175A
Other languages
Japanese (ja)
Inventor
Hiroshi Yoshida
浩史 吉田
Masaharu Nagata
政晴 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5109175A priority Critical patent/JPH06325201A/en
Publication of JPH06325201A publication Critical patent/JPH06325201A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To make it possible to recognize characters with high precision corresponding to a specified document transmitted from each department by switching a knowledge dictionary according to transmission originating sides also when different kinds of documents are entered in a slip of the same format. CONSTITUTION:In a reception part 11, a received facsimile signal is converted into the image signal of a document, further, transmission originating side data are extracted from the facsimile signal, the image signal of the document is outputted to a character recognition part 12 and transmission originating data are outputted to a knowledge dictionary selection part 13. In the character recognition part 12, characters are extracted one by one from document image data, a recognition processing is performed by using a recognition dictionary (not shown in figure) and the character code of the result is outputted to a knowledge processing part 16. In a knowledge dictionary selection part 13, a knowledge dictionary corresponding table is referred to in accordance with transmission originating data, first or second knowledge dictionary 14, 15 is selected and a state retrievable from the knowledge processing part 16 is made. In the knowledge processing part, a word is extracted from the character code name string of a recognition result and a collation is performed by using the selected knowledge dictionary 14 or 15.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、通信回線に接続さ
れ、かつ高精度に認識のできる文字認識装置に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device connected to a communication line and capable of highly accurate recognition.

【0002】[0002]

【従来の技術】従来、通信回線に接続され効率よく運用
出来る文字認識装置としては、例えば特願平03−18
1072に示される情報処理装置に含まれる文字認識装
置があった。この情報処理装置は、通信回線により伝送
された信号より、文書の画像信号、及び発信元を表わす
データを抽出し、受信した画像信号より、文字領域を検
出し、前記検出した文字領域内の文字について文字認識
を行い、前記認識された文字認識結果を翻訳し、前記翻
訳結果を前記受信された発信元に返送する、というもの
であった。
2. Description of the Related Art Conventionally, as a character recognition device connected to a communication line and capable of operating efficiently, for example, Japanese Patent Application No. 03-18
There is a character recognition device included in the information processing device 1072. This information processing apparatus extracts an image signal of a document and data representing a sender from a signal transmitted through a communication line, detects a character area from the received image signal, and detects a character in the detected character area. Character recognition is performed, the recognized character recognition result is translated, and the translation result is returned to the received sender.

【0003】また高精度に認識のできる文字認識装置と
しては例えば、特願昭63−029098に示される文
字認識装置があり、1文字ずつの文字を認識し、前記1
文字ずつの認識結果の列より単語を抽出し、前記抽出さ
れた単語をあらかじめ用意した単語辞書と照合し、前記
単語照合の結果を認識結果として出力する、というもの
であった。
As a character recognizing device capable of recognizing with high accuracy, there is a character recognizing device shown in Japanese Patent Application No. 63-029098, which recognizes characters one by one and
A word is extracted from a recognition result string for each character, the extracted word is collated with a word dictionary prepared in advance, and the result of the word collation is output as a recognition result.

【0004】[0004]

【発明が解決しようとする課題】しかし、通信回線に接
続され運用されている前記従来の文字認識装置は一般に
会社等において、複数の部門において少数の装置を効率
的に運用することを目的としている場合が多く、従って
様々な部門からの様々な文書を受信し処理する場合が主
であった。従って、前記従来の文字認識装置は、装置が
汎用的な構成に成らざるを得ず、従って特定の文書に対
応できないため一般に高精度な認識が不可能であり、そ
のため効率よく文書を入力することができないという問
題点があった。
However, the above-mentioned conventional character recognition device connected to a communication line and operated is generally intended to efficiently operate a small number of devices in a plurality of departments in a company or the like. In many cases, it was therefore the case to receive and process different documents from different departments. Therefore, the conventional character recognition device has to have a general-purpose structure, and therefore cannot generally support high-precision recognition because it cannot correspond to a specific document. Therefore, a document can be efficiently input. There was a problem that I could not do it.

【0005】例えば、図2(A)(B)に示すような、
同一の書式の帳票に記されてはいるが、発信元が異なる
ために文書の種類・内容が全く異なるような帳票文書画
像を認識する場合、前記従来の文字認識装置において
は、同一の書式の帳票に記されているがために文字認識
処理における単語照合において同一の単語辞書を用いて
処理しなければなず満足のいく単語照合が行えないため
高精度な認識ができないという問題が生じた。
For example, as shown in FIGS.
When the form document images, which are written on the form of the same format but have different types and contents of documents due to different senders, are recognized, the conventional character recognition device uses the same format. Since it is written on the form, the same word dictionary must be used for the word matching in the character recognition processing, and a satisfactory word matching cannot be performed, resulting in a problem that high-accuracy recognition cannot be performed.

【0006】この発明は各部門から伝送される特定の文
書に対応して高精度の認識が可能な文字認識装置を提供
することを目的とする。
An object of the present invention is to provide a character recognition device capable of highly accurate recognition corresponding to a specific document transmitted from each department.

【0007】[0007]

【課題を解決するための手段】この発明は前記課題を解
決するために、通信回線より伝送された文書の認識を行
う文字認識装置において、画像信号と共に発信元をあら
わすデータを受信する受信部と、前記受信した文書画像
の1文字ずつの文字を認識する文字認識部と、前記受信
した発信元データに応じて知識辞書を選択する知識辞書
選択部と、前記1文字ずつの文字の認識結果の列に対し
て前記選択された知識辞書を用いて知識処理を行う知識
処理部と、を具えることを特徴とする。
In order to solve the above-mentioned problems, the present invention provides a character recognition device for recognizing a document transmitted from a communication line, and a receiving unit for receiving data representing an origin together with an image signal. A character recognition unit that recognizes each character of the received document image, a knowledge dictionary selection unit that selects a knowledge dictionary according to the received source data, and a recognition result of each character. A knowledge processing unit that performs knowledge processing on the column using the selected knowledge dictionary.

【0008】[0008]

【作用】この発明の文字認識装置によれば、前述のよう
に構成したので、同一の書式の帳票に異なる種類の文書
が記された場合においても発信元に応じて知識辞書を切
り換えることができるため、伝送された文書に応じた知
識辞書を用いて知識処理することが可能となり、高精度
の認識が可能となる。
According to the character recognition apparatus of the present invention, since it is configured as described above, the knowledge dictionary can be switched according to the sender even when different types of documents are written on the same form. Therefore, knowledge processing can be performed using the knowledge dictionary corresponding to the transmitted document, and highly accurate recognition can be performed.

【0009】[0009]

【実施例】図1はこの発明の文字認識装置の一実施例を
示す構成図である。文字認識装置10は受信部11、文
字認識部12、知識辞書選択部13、第1の知識辞書1
4、第2の知識辞書15、知識処理部16、および出力
部17からなる。図2は文書画像の例を示す図であり、
20は帳画文書画像、21は文字記入枠である。図3は
知識辞書の説明をする図である。図4は知識辞書対応テ
ーブルの説明をする図であり、40は知識辞書対応テー
ブル、41は発信元電話番号、42は知識辞書番号であ
る。
1 is a block diagram showing an embodiment of a character recognition device of the present invention. The character recognition device 10 includes a reception unit 11, a character recognition unit 12, a knowledge dictionary selection unit 13, and a first knowledge dictionary 1.
4, a second knowledge dictionary 15, a knowledge processing unit 16, and an output unit 17. FIG. 2 is a diagram showing an example of a document image,
Reference numeral 20 is a book image document, and 21 is a character entry frame. FIG. 3 is a diagram for explaining the knowledge dictionary. FIG. 4 is a diagram for explaining the knowledge dictionary correspondence table, where 40 is a knowledge dictionary correspondence table, 41 is a source telephone number, and 42 is a knowledge dictionary number.

【0010】以下、図1を用いて本発明の実施例につい
て詳細に説明する。まず通信回線により伝送されたファ
クシミリ信号Sは、文字認識装置10内の受信部11に
入力される。受信部11においては、受信したファクシ
ミリ信号を文書の画像信号に変換し、さらに前記ファク
シミリ信号より発信元データを抽出し、文書の画像信号
を文字認識部12に出力すると共に、 抽出した発信元
データを知識辞書選択部13に出力する。
An embodiment of the present invention will be described in detail below with reference to FIG. First, the facsimile signal S transmitted through the communication line is input to the receiving unit 11 in the character recognition device 10. In the receiving unit 11, the received facsimile signal is converted into a document image signal, the source data is extracted from the facsimile signal, the document image signal is output to the character recognition unit 12, and the extracted source data is extracted. Is output to the knowledge dictionary selection unit 13.

【0011】文字認識部12においては、受信部11よ
り入力された文書画像データより1文字ずつの文字を抽
出し、該1文字ずつの文字に対して図示せぬ認識辞書を
用いて認識処理を行い、認識結果の文字コード名を知識
処理部16に出力する。
The character recognition unit 12 extracts a character by character from the document image data input from the reception unit 11, and performs a recognition process on the character by character using a recognition dictionary (not shown). Then, the character code name of the recognition result is output to the knowledge processing unit 16.

【0012】知識辞書選択部13においては、受信部1
1より入力された発信元データに従って知識辞書対応テ
ーブルを参照し、第1の知識辞書14または第2の知識
辞書15のいずれか一方を選択し、前記選択した辞書を
知識処理部16より検索が可能な状態にする。
In the knowledge dictionary selecting section 13, the receiving section 1
The knowledge dictionary correspondence table is referred to according to the source data input from 1 to select either the first knowledge dictionary 14 or the second knowledge dictionary 15, and the knowledge processing unit 16 searches the selected dictionary. Make it possible.

【0013】知識処理部16においては、文字認識部1
2より入力された認識結果の文字コード名列より単語を
抽出し、該単語を知識処理選択部13より選択された知
識辞書を用いて照合を行い該照合結果の単語文字列を認
識結果として出力部17に出力する。尚、前記単語の抽
出は文字認識部12より入力された認識結果の文字コー
ド名列を「、」、「。」、「 」の区切り文字及び文字
種の変化するカ所において分割することにより行うもの
とする。
In the knowledge processing unit 16, the character recognition unit 1
A word is extracted from the character code name string of the recognition result input from 2 and the word is matched using the knowledge dictionary selected by the knowledge processing selection unit 13 and the word character string of the matching result is output as the recognition result. It is output to the unit 17. The word extraction is performed by dividing the character code name sequence of the recognition result input from the character recognition unit 12 at the delimiters of “,”, “.”, “” And the places where the character type changes. To do.

【0014】出力部17は、知識処理部16より入力さ
れた認識結果の単語文字列を外部に出力する端子であ
り、外部の記憶装置、通信回線、その他の情報処理装置
等に接続されるものである。
The output unit 17 is a terminal for outputting the word character string of the recognition result input from the knowledge processing unit 16 to the outside, and is connected to an external storage device, communication line, other information processing device, or the like. Is.

【0015】つぎに本実施例の具体例について図2〜図
4を用いて説明する。図2は伝送されたファクシミリ文
書画像の例を示す図であり、図2(A)および図2
(B)は例えば各々別の部門において作成された種類の
異なる文書である。また、図3は知識辞書の説明をする
図であり、図3(A)は住所、氏名、契約関連単語等が
登録された第1の知識辞書15、図3(B)は一般単語
が登録された第2の認識辞書16の登録単語例を示した
ものである。図4は知識辞書選択部13内の知識辞書対
応テーブルの例を示す図であり、41は発信元部門電話
番号を、42は当該部門より発信される文書に対応した
知識辞書の番号が予め登録されているものである。
Next, a specific example of this embodiment will be described with reference to FIGS. FIG. 2 is a diagram showing an example of the transmitted facsimile document image, which is shown in FIGS.
(B) are, for example, different types of documents created in different departments. 3 is a diagram for explaining the knowledge dictionary. FIG. 3 (A) is a first knowledge dictionary 15 in which addresses, names, contract-related words, etc. are registered, and FIG. 3 (B) is a general word is registered. It shows an example of registered words of the generated second recognition dictionary 16. FIG. 4 is a diagram showing an example of a knowledge dictionary correspondence table in the knowledge dictionary selection unit 13, where 41 is a source department telephone number and 42 is a knowledge dictionary number corresponding to a document transmitted from the department in advance. It has been done.

【0016】まず、通信回線により接続された一部門よ
り図2(A)に示されるような文書が入力された場合、
受信部11においては図2(A)に示すような文書画像
を文字認識部12に、また受信ファクシミリ信号より抽
出した発信部門データであるところの発信元電話番号
(本実施例では1005とする)を知識辞書選択部13
に出力する。知識辞書選択部13においては、受信部1
1より入力された部門電話番号1005より図4に示す
知識辞書対応テーブルを用いて当該部門が発信した文書
の種類に対応した知識辞書番号を検出し、(本実施例で
は1)、当該辞書番号に対応する図3(A)に示すよう
な知識辞書1を選択し、知識処理部16より検索できる
ようにする。
First, when a document as shown in FIG. 2A is input from one department connected by a communication line,
In the receiving section 11, a document image as shown in FIG. 2A is sent to the character recognizing section 12, and a source telephone number (1005 in this embodiment) which is the calling department data extracted from the received facsimile signal. Knowledge dictionary selection unit 13
Output to. In the knowledge dictionary selecting unit 13, the receiving unit 1
From the department telephone number 1005 input from No. 1, the knowledge dictionary number corresponding to the type of the document sent by the department is detected using the knowledge dictionary correspondence table shown in FIG. 4, and (1 in this embodiment), the dictionary number concerned. The knowledge dictionary 1 as shown in FIG. 3A corresponding to is selected so that the knowledge processing unit 16 can retrieve it.

【0017】また、図2(B)に示すようなファクシミ
リ信号が別部門(部門電話番号が1006とする)より
入力された場合には受信部11は図2(B)に示すよう
な文書画像を文字認識部12に出力し、当該文書の発信
元である部門の部門電話番号1006を知識辞書選択部
13に出力する。知識辞書選択部13においては図4に
示す知識辞書対応テーブルを用いて、部門電話番号10
06で示される部門が発信する文書の種類に対応した知
識辞書番号を検出し、対応する図3(B)に示すような
知識辞書2を知識処理部16より検索できるような処理
を行う。
When a facsimile signal as shown in FIG. 2 (B) is input from another department (the department telephone number is 1006), the receiving unit 11 displays the document image as shown in FIG. 2 (B). Is output to the character recognition unit 12, and the department telephone number 1006 of the department that is the source of the document is output to the knowledge dictionary selection unit 13. The knowledge dictionary selection unit 13 uses the knowledge dictionary correspondence table shown in FIG.
A knowledge dictionary number corresponding to the type of the document transmitted by the department indicated by 06 is detected, and the knowledge processing unit 16 performs a process for searching the corresponding knowledge dictionary 2 as shown in FIG. 3B.

【0018】従って、知識処理部16においては図2
(A)に示すような契約情報が記された文書画像に対し
ては知識辞書1を用いて認識し、図2(B)に示すよう
な一般文書が記された文書画像が入力された場合には知
識辞書2を用いて知識処理を行う。
Therefore, in the knowledge processing section 16, FIG.
When a document image with contract information as shown in (A) is recognized using the knowledge dictionary 1, and a document image with a general document as shown in FIG. 2B is input. Knowledge processing is performed using the knowledge dictionary 2.

【0019】以上、本発明の文字認識装置について詳細
に説明をしたが、本発明は本実施例にのみ適用されるも
のではなく、本発明の範囲内で任意好適に実施できる。
例えば、本実施例においては、知識辞書の種類は2種類
としたが、これに限られるものではなく、3種類以上の
知識辞書を具備する構成としても良い。また、前記知識
辞書は契約関連単語の辞書及び一般単語の辞書としたが
これに限られるものではなく、個々の文書に対応した任
意好適な構成の辞書を用いても何等差し支えない。
Although the character recognition device of the present invention has been described in detail above, the present invention is not limited to the present embodiment and can be suitably implemented within the scope of the present invention.
For example, in the present embodiment, there are two types of knowledge dictionaries, but the number of knowledge dictionaries is not limited to this, and the knowledge dictionaries of three or more types may be provided. Further, the knowledge dictionary is a contract-related word dictionary and a general-word dictionary, but the knowledge dictionary is not limited to this, and a dictionary having an arbitrarily suitable structure corresponding to each document may be used.

【0020】[0020]

【発明の効果】以上詳細に説明したように本発明の文字
認識装置は、通信回線で接続され複数の部門より利用さ
れるような文字認識装置において、同一の書式の帳票に
異なる種類の文書が記され伝送された場合においても発
信元に応じて知識辞書を切り換えることができるため、
各々の部門より伝送されている文書に応じた知識辞書を
用いて知識処理することが可能となり、従って個々の部
門においては自部門に文字認識装置があるものと同程度
に特化して該通信回線で結ばれた文字認識装置を利用す
ることができ、従って高精度な認識が可能となり、効率
的な文書入力システムを構築することができる。
As described in detail above, the character recognition apparatus of the present invention is a character recognition apparatus connected by a communication line and used by a plurality of departments. Even when written and transmitted, the knowledge dictionary can be switched according to the sender,
It becomes possible to perform knowledge processing using a knowledge dictionary according to the document transmitted from each department. Therefore, in each department, the communication line is specialized as much as a character recognition device in its own department. It is possible to use the character recognition device connected by, so that highly accurate recognition is possible and an efficient document input system can be constructed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例を示す構成図である。FIG. 1 is a configuration diagram showing an embodiment of the present invention.

【図2】本実施例で用いる帳票画像の例を示す図であ
る。
FIG. 2 is a diagram showing an example of a form image used in this embodiment.

【図3】知識辞書の説明をする図である。FIG. 3 is a diagram illustrating a knowledge dictionary.

【図4】知識辞書対応テーブルの説明をする図である。FIG. 4 is a diagram illustrating a knowledge dictionary correspondence table.

【符号の説明】[Explanation of symbols]

10 文字認識装置 11 受信部 12 文字認識部 13 知識辞書選択部 14 知識辞書1 15 知識辞書2 16 知識処理部 17 出力部 10 Character Recognition Device 11 Reception Unit 12 Character Recognition Unit 13 Knowledge Dictionary Selection Unit 14 Knowledge Dictionary 1 15 Knowledge Dictionary 2 16 Knowledge Processing Unit 17 Output Unit

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 通信回線より伝送された文書の認識を行
う文字認識装置において、 画像信号と共に発信元をあらわすデータを受信する受信
部と、 前記受信した文書画像の1文字ずつの文字を認識する文
字認識部と、 前記受信した発信元データに応じて知識辞書を選択する
知識辞書選択部と、 前記1文字ずつの文字の認識結果の列に対して前記選択
された知識辞書を用いて知識処理を行う知識処理部と、
を具えることを特徴とする文字認識装置。
1. A character recognition device for recognizing a document transmitted from a communication line, and a receiving unit for receiving data representing a sender together with an image signal and a character for each character of the received document image. A character recognition unit, a knowledge dictionary selection unit that selects a knowledge dictionary according to the received source data, and a knowledge processing using the selected knowledge dictionary for the character recognition sequence of each character. A knowledge processing unit that
A character recognition device comprising:
JP5109175A 1993-05-11 1993-05-11 Character recognizing device Pending JPH06325201A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5109175A JPH06325201A (en) 1993-05-11 1993-05-11 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5109175A JPH06325201A (en) 1993-05-11 1993-05-11 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH06325201A true JPH06325201A (en) 1994-11-25

Family

ID=14503563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5109175A Pending JPH06325201A (en) 1993-05-11 1993-05-11 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH06325201A (en)

Similar Documents

Publication Publication Date Title
JP3470664B2 (en) E-mail terminal device with received mail display method and pictogram conversion function
EP1603291A2 (en) Information transmission system and information transmission method
JPH01279368A (en) Transfer system for character data
US20050037806A1 (en) Managing an address book in portable terminal having a camera
JPH11167532A (en) System, device, and method for data processing and recording medium
JP2002278977A (en) Device and method for answering question and question answer program
CN112182174A (en) Business question-answer knowledge query method and device, computer equipment and storage medium
JPH06325201A (en) Character recognizing device
KR20000073523A (en) The method to connect a web site using a classical number system.
JPH0388062A (en) Device for preparing document
JPH10334084A (en) Information processor
JP2851469B2 (en) Business card reader
JP2918579B2 (en) Image processing device
EP0553304A1 (en) Telecommunications device and related method
JPS5862762A (en) Sentence data unifying device
JPS60132265A (en) "kana" "kanji" converting device
JPS61187034A (en) Document output device
JPH06333093A (en) Character recognizing device
JPH03232063A (en) Electronic dictionary retrieving method
JPH07107683B2 (en) Image retrieval device
JP2005128076A (en) Speech recognition system for recognizing speech data from terminal, and method therefor
JPH04130973A (en) Data registering system for electronic filing
JPH01314071A (en) Electronic file system
CN1010058B (en) Chinese article writting device
JPH0823346A (en) Facsimile mail equipment

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20011120