JP3061066B2 - Character data linking device - Google Patents

Character data linking device

Info

Publication number
JP3061066B2
JP3061066B2 JP6994191A JP6994191A JP3061066B2 JP 3061066 B2 JP3061066 B2 JP 3061066B2 JP 6994191 A JP6994191 A JP 6994191A JP 6994191 A JP6994191 A JP 6994191A JP 3061066 B2 JP3061066 B2 JP 3061066B2
Authority
JP
Japan
Prior art keywords
character data
data
character
partial
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP6994191A
Other languages
Japanese (ja)
Other versions
JPH04218887A (en
Inventor
薫 中林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP6994191A priority Critical patent/JP3061066B2/en
Publication of JPH04218887A publication Critical patent/JPH04218887A/en
Priority to US08/395,230 priority patent/US5675672A/en
Application granted granted Critical
Publication of JP3061066B2 publication Critical patent/JP3061066B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文字データ連結装置に
関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character data linking device.

【0002】[0002]

【従来の技術】文字データの連結は単純に第1文字デー
タ群の末尾と第2文字データ群の先頭を連結していた。
2. Description of the Related Art The connection of character data simply connects the end of a first character data group and the head of a second character data group.

【0003】[0003]

【発明が解決しようとする課題】しかし、単純な連結で
は不便な場合がある。例えば、雑誌の記事などの長い文
章をハンディスキャナを用いて複数回に分けて読み取っ
て、この画像データを文字認識手段で文字データとした
場合、1回の読み込みで得られる文字データと次の読み
込みで得られる文字データの一部が重複してしまうこと
がある。このような場合に、文字データを単純に連結す
ると重複部分を後から人手で確認して削除しなければな
らなかった。
However, a simple connection may be inconvenient. For example, when a long sentence such as an article in a magazine is read in a plurality of times using a handy scanner, and this image data is converted into character data by character recognition means, the character data obtained by one reading and the next reading In some cases, some of the character data obtained by the method may be duplicated. In such a case, if the character data is simply connected, the overlapping portion has to be manually checked and deleted later.

【0004】本発明の目的は、第1文字データ群と第2
文字データ群の一部が重複していても、自動的にその部
分を探索して、一方の重複部分を取り除いて2つの文字
データ群を連結する文字データ連結装置を提供しようと
いうものである。
An object of the present invention is to provide a first character data group and a second character data group.
Even if a part of a character data group is overlapped, a character data linking device for automatically searching for that part, removing one of the overlapping parts and linking the two character data groups is provided.

【0005】[0005]

【課題を解決するための手段】本発明の文字データ連結
装置には、任意の部分データ単位ごとにデータアクセス
できる第1および第2文字データ格納部と、第1文字デ
ータ格納部に格納された第1文字データ群の行方向また
は列方向にみた末尾の第1部分データと重複する第2部
分データを第2文字データ格納部に格納された第2文字
データ群から検出する検出手段と、第2文字データ群の
第2部分データ以降のデータ群を第1文字データ群の後
に第1または第2部分データのいずれか一方を取り除い
て連結する連結手段とが備えられている。
According to the character data concatenating device of the present invention, first and second character data storage units which can access data in units of arbitrary partial data, and the first character data storage unit store the first and second character data storage units. Detecting means for detecting, from the second character data group stored in the second character data storage unit, second partial data overlapping the last first partial data in the row direction or the column direction of the first character data group; There is provided linking means for linking a data group subsequent to the second partial data of the two-character data group after removing either the first or second partial data after the first character data group.

【0006】また、第2の発明の文字データ連結装置に
は、任意の部分データ単位ごとにデータアクセスできる
第1および第2文字データ格納部と、第1文字データ格
納部に格納された第1文字データ群の行方向または列方
向にみた末尾の部分データと第2文字データ格納部に格
納された第2文字データ群の任意の部分データとを読み
出し、この任意の部分データが第2文字データ群の末尾
の部分データである場合にこの部分データの読み出し後
に終了信号を発する読出手段と、読出手段で読み出され
た第1文字データ群の末尾の部分データと第2文字デー
タ群の任意の部分データの内容を照合する照合手段と、
照合手段の結果が一致の場合には第2文字データ群の一
致した部分データの次の部分データを伝える信号を発
し、照合手段の結果が不一致の場合で読出手段から終了
信号を受けていない場合には第2文字データ群の次の部
分データを任意の部分データとして読み出すように読出
手段に指令を送り、照合手段の結果が不一致の場合で読
出手段から終了信号を受けとった場合には第2文字デー
タ群の先頭の部分データを伝える信号を発する制御手段
と、第1文字データ群全体を第1文字データ格納装置か
ら読み出し、制御手段からの信号によって伝えられた部
分データから末尾の部分データまでを第2文字データ格
納装置から読み出して、第1文字データ群の後に第2文
字データ群を連結する連結手段とが備えられている。
In the character data linking apparatus according to the second invention, the first and second character data storage units which can access data in arbitrary partial data units and the first character data storage unit stored in the first character data storage unit are provided. The partial data at the end of the character data group as viewed in the row or column direction and any partial data of the second character data group stored in the second character data storage unit are read, and the arbitrary partial data is read as the second character data. Reading means for issuing an end signal after reading the partial data if the partial data at the end of the group; and optional partial data at the end of the first character data group and the second character data group read by the reading means. Collation means for collating the contents of the partial data;
If the result of the matching means is a match, a signal is transmitted to transmit the next partial data of the matched partial data of the second character data group. If the result of the matching means is not matched and no end signal is received from the reading means. Sends a command to the reading means to read out the next partial data of the second character data group as arbitrary partial data. If the result of the collating means does not match and an end signal is received from the reading means, the second Control means for issuing a signal for transmitting the leading partial data of the character data group; and reading the entire first character data group from the first character data storage device, from the partial data transmitted by the signal from the control means to the last partial data. From the second character data storage device, and connecting the second character data group after the first character data group.

【0007】さらに、第3の発明の文字データ連結装置
には、任意の部分データ単位ごとにデータアクセスでき
る第1および第2文字データ格納部と、第1文字データ
格納部に格納された第1文字データ群の行方向または列
方向にみた末尾の1または2以上の部分データを読み出
し、この部分データと同一個数の部分データを第2文字
データ格納部に格納された第2文字データ群の先頭から
読み出し、第2文字データ群の末尾の部分データまで読
み出した場合にこの読み出し後に終了信号を発する読出
手段と、読出手段で読み出された第1文字データ群と第
2文字データ群の1または2以上の部分データの内容を
照合する照合手段と、照合手段の結果が一致の場合には
第2文字データ群から読み出した末尾の部分データの次
の部分データを伝える信号を発し、照合手段の結果が不
一致の場合で読出手段から終了信号を受けていない場合
には読み出す部分データの数を1つ増やすように読出手
段に指令を送り、照合手段の結果が不一致の場合で読出
手段から終了信号を受けとった場合には第2文字データ
群の先頭の部分データを伝える信号を発する制御手段
と、第1文字データ群全体を第1文字データ格納装置か
ら読み出し、制御手段からの信号によって伝えられた部
分データから末尾の部分データまでを第2文字データ格
納装置から読み出して、第1文字データ群の後に第2文
字データ群を連結する連結手段とが備えられている。
Further, the character data concatenating device of the third invention has a first and second character data storage units which can access data in arbitrary partial data units, and a first character data storage unit stored in the first character data storage unit. One or more partial data at the end of the character data group viewed in the row or column direction is read, and the same number of partial data as the partial data is read from the beginning of the second character data group stored in the second character data storage unit. , And when reading up to the last partial data of the second character data group, a reading means for issuing an end signal after the reading, and one of the first character data group and the second character data group read by the reading means. A collating means for collating the contents of the two or more partial data, and transmitting a partial data next to the last partial data read from the second character data group if the result of the collating means is identical. In the case where the result of the matching means is not consistent and the end signal is not received from the reading means, a command is sent to the reading means to increase the number of partial data to be read by one, and the result of the matching means is not matched. In the case of (1), when an end signal is received from the reading means, a control means for issuing a signal for transmitting the leading partial data of the second character data group, and the entire first character data group is read from the first character data storage device. Connecting means for reading from the second character data storage device the partial data transmitted to the end of the partial data transmitted by the signal from the means, and connecting the second character data group after the first character data group. .

【0008】[0008]

【作用】第1の発明の文字データ連結装置によれば、検
出手段によって、第1文字データ格納部に格納された第
1文字データ群と、第2文字データ格納部に格納された
第2文字データ群との重複部分が検出される。そして、
連結手段では、この重複部分の一方が取り除かれ、第1
文字データ群と第2文字データ群とが1つの文字データ
として連結される。
According to the character data linking device of the first invention, the first character data group stored in the first character data storage unit and the second character data group stored in the second character data storage unit are detected by the detection means. An overlap with the data group is detected. And
In the connecting means, one of the overlapping portions is removed, and the first
The character data group and the second character data group are linked as one character data.

【0009】第2の発明の文字データ連結装置によれ
ば、まず、読出手段によって、第1文字データ格納部に
格納された第1文字データ群の行方向または列方向にみ
た末尾の部分データが読み出される。また、第2文字デ
ータ格納部に格納された第2文字データ群の任意の部分
データが読み出される。次に、照合手段によって、第1
文字データ群の末尾の部分データと第2文字データ群の
任意の部分データの内容が照合される。この照合手段の
照合の結果が一致の場合には、第2文字データ群の一致
した部分データの次の部分データを伝える信号が発せら
れる。また、この照合手段の結果が不一致の場合で読出
手段から終了信号を受けていない場合には、第2文字デ
ータ群の次の部分データを任意の部分データとして読み
出すように読出手段に指令が送られる。さらに、照合手
段の結果が不一致の場合で読出手段から終了信号を受け
とった場合には、第2文字データ群の先頭の部分データ
を伝える信号が発せられる。そして、連結手段では、第
1文字データ群の全部が第1文字データ格納装置から読
み出され、制御手段からの信号によって伝えられた部分
データから末尾の部分データまでが第2文字データ格納
装置から読み出され、第1文字データ群の後に第2文字
データ群が連結される。
According to the character data concatenating device of the second invention, first, the reading unit converts the last partial data of the first character data group stored in the first character data storage unit as viewed in the row or column direction. Is read. Also, any partial data of the second character data group stored in the second character data storage is read. Next, the first means
The contents of the partial data at the end of the character data group and any partial data of the second character data group are collated. If the result of the collation by the collating means is a match, a signal is transmitted which transmits the next partial data of the matched partial data of the second character data group. If the result of the matching means does not match and no end signal is received from the reading means, a command is sent to the reading means to read the next partial data of the second character data group as arbitrary partial data. Can be Furthermore, when the end signal is received from the reading means in the case where the result of the collating means does not match, a signal for transmitting the leading partial data of the second character data group is issued. Then, in the connecting means, the entire first character data group is read from the first character data storage device, and from the partial data transmitted by the signal from the control means to the last partial data is read from the second character data storage device. The first character data group is read out and the second character data group is concatenated after the first character data group.

【0010】第3の発明の文字データ連結装置は、1ま
たは2以上の部分データを照合して重複部分を検出する
点が第2の発明の文字データ連結装置と異なる。つま
り、第3の発明の文字データ連結装置の読出手段では、
第1文字データ群の行方向または列方向にみた末尾の1
または2以上の部分データが読み出され、また、この部
分データと同一個数の部分データを第2文字データ群の
先頭から読み出される。そして、これらの部分データが
照合手段で照合されて、重複部分が検出されるのであ
る。
The character data linking apparatus of the third invention is different from the character data linking apparatus of the second invention in that one or two or more pieces of partial data are collated to detect an overlapping portion. That is, in the reading means of the character data linking device of the third invention,
Last 1 in the row or column direction of the first character data group
Alternatively, two or more partial data are read, and the same number of partial data as the partial data are read from the head of the second character data group. Then, these pieces of partial data are collated by the collating means, and an overlapping portion is detected.

【0011】[0011]

【実施例】以下、第1の発明から第3の発明までの一実
施例について、図1から図6を用いて説明する。図1は
本実施例の構成ブロック図である。本実施例の文字デー
タ連結装置1は、第1文字データ群が格納された第1文
字データ格納部10と、第2文字データ群が格納された
第2文字データ格納部20と、第1文字データ格納部1
0と第2文字データ格納部20から行または列または文
字列の部分データを読み出す読出手段30と、読出手段
30で読み出された部分データを照合する照合手段40
と、読出手段30を制御する制御手段50と、第1文字
データ群と第2文字データ群を連結する連結手段60と
から構成されている。第1文字データ格納部10および
第2文字データ格納部20は、任意の部分データ単位ご
とにデータアクセスできるデータ構造を備えている。こ
の任意の部分データには、例えば、行単位の部分データ
や、列単位の部分データや、文節単位の部分データや、
1文字単位の部分データなどがある。また、連結手段で
接続された文字データは文字データ3格納部70に格納
される。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the first to third inventions will be described below with reference to FIGS. FIG. 1 is a configuration block diagram of the present embodiment. The character data linking device 1 according to the present embodiment includes a first character data storage unit 10 storing a first character data group, a second character data storage unit 20 storing a second character data group, and a first character data storage unit 20. Data storage unit 1
0 and a reading means 30 for reading partial data of a row, a column, or a character string from the second character data storage unit 20, and a collating means 40 for collating the partial data read by the reading means 30
And a control means 50 for controlling the reading means 30 and a connecting means 60 for connecting the first character data group and the second character data group. The first character data storage unit 10 and the second character data storage unit 20 have a data structure that allows data access in units of arbitrary partial data. This arbitrary partial data includes, for example, partial data in units of rows, partial data in units of columns, partial data in units of clauses,
There is partial data for each character. The character data connected by the linking means is stored in the character data 3 storage unit 70.

【0012】次に、本実施例の処理の内容について、図
2のフローチャートを用いて説明する。まず、手紙など
の活字データ80の上半分をハンディスキャナで読み込
み、画像データ81を獲得する(ステップ100)。こ
の画像データ81を文字認識部90で画像解析して、第
1文字データ群120を生成する(ステップ101)。
また、活字データ80の下半分をハンディスキャナで読
み込み、画像データ82を獲得する(ステップ10
2)。この画像データ82を文字認識部90で画像解析
して、第2文字データ群121を生成する(ステップ1
03)。そして、第1文字データ120群を第1文字デ
ータ格納部10に、第2文字データ群121を第2文字
データ格納部20にそれぞれ格納する。このように格納
された第1文字データ群120の3、4行目と第2文字
データ群121の1、2行目は重複しているので、以後
の処理でこの内の一方を取り除くのである。
Next, the contents of the processing of this embodiment will be described with reference to the flowchart of FIG. First, the upper half of the type data 80 such as a letter is read by a handy scanner to obtain image data 81 (step 100). The image data 81 is image-analyzed by the character recognition unit 90 to generate a first character data group 120 (step 101).
Further, the lower half of the print data 80 is read by a handy scanner to obtain image data 82 (step 10).
2). The image data 82 is image-analyzed by the character recognition unit 90 to generate a second character data group 121 (step 1).
03). Then, the first character data group 120 is stored in the first character data storage unit 10, and the second character data group 121 is stored in the second character data storage unit 20. Since the third and fourth lines of the first character data group 120 and the first and second lines of the second character data group 121 stored in this way overlap, one of them is removed in the subsequent processing. .

【0013】重複した行を取り除くために、まず、第1
文字データ格納部10と第2文字データ格納部20から
部分データである1行ごとの文字データを読出手段30
を用いて読み出す。具体的には、まず、第2文字データ
群121の行数を示す検索カウンタに「1」(1行目を
示す。)を設定する(ステップ104)。次に、第1文
字データ群120の末尾の行を読み出す(ステップ10
5)。そして、ステップ104で設定された検索カウン
タを用いて、第2文字データ群121の任意の1行を読
み出し(ステップ106)、読み出し後に検索カウンタ
に1を加える(ステップ107)。ステップ106から
ステップ111まではループ構造になっており、検索カ
ウンタによって第2文字データ群121の第1行目から
順番に文字データを読み出していく。そして、この処理
で第2文字データ群121の末尾の行まで読み出したた
めに、ステップ106で正しく文字データを読み出せな
くなった場合(ステップ108)には、検索カウンタ
「1」にした上で(ステップ109)、連結手段の処理
を行う。また、末尾の行まで読み出していない場合に
は、照合手段40に処理を移し、第1文字データ群12
0と第2文字データ群121からそれぞれ読み出された
文字データを照合する(ステップ110)。この照合に
よって、文字データが一致した場合には、連結手段60
に処理を移す(ステップ111)。また、一致しない場
合には、ステップ106に処理を戻して、第2文字デー
タ群121の次の行の文字データを読み出す。連結手段
60では、第1文字データ群の全部の行と第2文字デー
タ群の検索カウンタで示す行以降を連結する(ステップ
112)。
To remove duplicate rows, first
The character data for each line, which is partial data, is read from the character data storage unit 10 and the second character data storage unit 20 for each line.
Read using. Specifically, first, "1" (indicating the first line) is set in a search counter indicating the number of lines of the second character data group 121 (step 104). Next, the last line of the first character data group 120 is read (step 10).
5). Then, an arbitrary line of the second character data group 121 is read using the search counter set in step 104 (step 106), and 1 is added to the search counter after reading (step 107). Steps 106 to 111 have a loop structure, and the search counter reads character data sequentially from the first line of the second character data group 121. If the character data cannot be read correctly in step 106 because the last line of the second character data group 121 has been read in this process (step 108), the search counter is set to "1" (step 108). 109), the processing of the connecting means is performed. If the last line has not been read, the processing is shifted to the collating means 40, and the first character data group 12 is read.
0 and the character data read from the second character data group 121 are collated (step 110). If the character data matches by this collation, the linking means 60
(Step 111). If they do not match, the process returns to step 106 to read the character data of the next line of the second character data group 121. The linking means 60 links all the lines of the first character data group with the lines of the second character data group that follow the line indicated by the search counter (step 112).

【0014】なお、照合手段の処理をより正確に行うた
めには、複数行を用いて比較処理を行えばよい。この場
合には、まず、ステップ105で第1文字データ群の末
尾の行から順番に検索カウンタで示す行数だけ読み出
す。また、ステップ106でも同様に、第2文字データ
群の1行目から検索カウンタが示す行数だけ読み出す。
そして、ステップ110で第1文字データ群と第2文字
データ群の複数行の照合を行うのである。
In order to perform the processing of the matching means more accurately, the comparison processing may be performed using a plurality of rows. In this case, first, in step 105, the number of lines indicated by the search counter is sequentially read from the last line of the first character data group. Similarly, in step 106, the number of lines indicated by the search counter is read from the first line of the second character data group.
Then, in step 110, a plurality of lines of the first character data group and the second character data group are collated.

【0015】次に、本実施例で連結される文字データの
例を、図3〜図5の文字データ連結図を用いて説明す
る。
Next, an example of character data connected in this embodiment will be described with reference to the character data connection diagrams of FIGS.

【0016】図3(a)は第1文字データ群の3、4行
目と第2文字データ群の1、2行目が重複している場合
の連結例である。この例では、第1文字データ群の末尾
に、第2文字データ群の3行目を接続して、第3文字デ
ータを作成している。図3(b)についても同様であ
る。
FIG. 3A shows an example of connection in the case where the third and fourth lines of the first character data group and the first and second lines of the second character data group overlap. In this example, the third character data is created by connecting the third line of the second character data group to the end of the first character data group. The same applies to FIG.

【0017】図4(a)は第1文字データ群の3〜5列
目と第2文字データ群の1〜3列目が重複している場合
の連結例である。この例では、第1文字データ群の末尾
に、第2文字データ群の4列目を接続して、第3文字デ
ータを作成している。図4(b)は第1文字データ群の
17〜19列目と第2文字データ群の1〜3列目が重複
している場合の連結例である。この例では、第1文字デ
ータ群の末尾に、第2文字データ群の4列目を接続し
て、第3文字データを作成している。
FIG. 4A shows an example of connection in the case where the third to fifth columns of the first character data group and the first to third columns of the second character data group overlap. In this example, the third character data is created by connecting the fourth column of the second character data group to the end of the first character data group. FIG. 4B shows a connection example in the case where the 17th to 19th columns of the first character data group and the 1st to 3rd columns of the second character data group overlap. In this example, the third character data is created by connecting the fourth column of the second character data group to the end of the first character data group.

【0018】図5(a)は第1文字データ群の文字列
「初夏の候」が第2文字データ群に存在しない場合の連
結例である。この例では、第1文字データ群の末尾に、
第2文字データ群の先頭を接続して、第3文字データを
作成している。第5図(b)は第1文字データ群の6ワ
ード目の文字列「Epson」が第2文字データ群の4
ワード目と重複している場合の連結例である。この例で
は、第1文字データ群の末尾に、第2文字データ群の4
ワード目を接続して、第3文字データを作成している。
FIG. 5A shows an example of a concatenation in a case where the character string "Early Summer" of the first character data group does not exist in the second character data group. In this example, at the end of the first character data group,
The third character data is created by connecting the head of the second character data group. FIG. 5B shows that the character string “Epson” of the sixth word of the first character data group is the fourth character string of the second character data group.
It is a connection example in the case of overlapping with the word. In this example, at the end of the first character data group, 4
The third character data is created by connecting the words.

【0019】次に、本実施例をパーソナルコンピュータ
で実現した場合のハードウェア構成について、図6を用
いて説明する。パーソナルコンピュータ210は、制御
手段50として動作するCPU211と、読出手段30
や照合手段40などのプログラムが格納されたRAM2
12と、BIOSなどのシステムプログラムが格納され
たRAM213とから構成される。また、このパーソナ
ルコンピュータ210には、第1文字データ群や第2文
字データ群などを表示するCRT220と、ユーザから
の指令が入力されるキーボード221と、雑誌の記事な
どを入力するハンディスキャナ222と、ハンディスキ
ャナ222などで入力された文字データが格納される磁
気ディスク223とが備えられている。
Next, a hardware configuration when the present embodiment is realized by a personal computer will be described with reference to FIG. The personal computer 210 includes a CPU 211 operating as the control unit 50,
2 in which a program such as a memory and a collating means 40 is stored
12 and a RAM 213 storing a system program such as a BIOS. The personal computer 210 includes a CRT 220 for displaying a first character data group, a second character data group, and the like; a keyboard 221 for inputting a command from a user; And a magnetic disk 223 for storing character data input by the handy scanner 222 or the like.

【0020】本実施例は、特にハンディスキャナ222
を用いて入力した複数の文字データを連結する際に効果
を発揮する。つまり、ハンディスキャナ222は入力部
の幅が小さいため、通常は数回に分けて文字データ上を
走査させる必要がある。この走査においては、入力抜け
が生じないように端の部分を重複させながら入力させる
ことが一般に行われている。本実施例を用いれば、この
時に生じる重複部分の削除が自動的に行えるのである。
This embodiment is particularly applicable to the handy scanner 222.
This is effective when concatenating a plurality of character data input using. That is, since the width of the input unit of the handy scanner 222 is small, it is usually necessary to scan the character data several times. In this scanning, input is generally performed while overlapping end portions so that input omission does not occur. By using this embodiment, it is possible to automatically delete the duplicated portion generated at this time.

【0021】なお、本実施例で行または列または文字列
のいずれの部分データを用いるかは、ユーザによる指令
によって決定しても良いし、あるいは2以上の部分デー
タを併用しても良い。併用する例としては、まず行単位
で重複部分の照合を行い、次に列単位で重複部分の照合
を行って、連結する手段などがある。
It should be noted that whether partial data of a row, a column, or a character string is used in this embodiment may be determined by a command from a user, or two or more partial data may be used together. As an example of using them together, there is a means for first collating overlapping portions on a row-by-row basis, then collating overlapping portions on a column-by-column basis, and linking.

【0022】[0022]

【発明の効果】本発明の文字データ連結装置であれば、
複数の文字データの一部が重複する場合に、自動的に重
複部分を探し出して、一方の重複部分を取り除いて文字
データを連結することができる。
According to the character data linking device of the present invention,
When a part of a plurality of character data overlaps, it is possible to automatically search for an overlapping part, remove one of the overlapping parts, and connect the character data.

【0023】したがって、複数の文字データを連結する
作業時に、利用者が重複部分を手作業で削除する必要が
なくなる。このために、修正ミスの発生を防ぐことがで
き、さらに手間と時間が節約できる。
Therefore, when linking a plurality of character data, the user does not need to manually delete the overlapped portion. For this reason, it is possible to prevent occurrence of a correction error, and to save labor and time.

【0024】特に、本発明の文字データ連結装置の応用
として、雑誌の記事などの長い文章をハンディスキャナ
で複数回に分けて読み取り、この画像データを文字認識
手段で文字データとし、そして、このようにして得られ
た複数個の文字データを連結させて元の文章を再現する
場合に効果を発揮する。
In particular, as an application of the character data linking apparatus of the present invention, a long sentence such as a magazine article is read a plurality of times by a handy scanner, and this image data is converted into character data by a character recognition means. This is effective when the original sentence is reproduced by linking a plurality of character data obtained as described above.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施例の構成ブロック図である。FIG. 1 is a configuration block diagram of a present embodiment.

【図2】本実施例の処理の内容を示すフローチャートで
ある。
FIG. 2 is a flowchart illustrating the contents of a process according to the embodiment.

【図3】本実施例の文字データの連結処理を示す概念図
である。
FIG. 3 is a conceptual diagram illustrating a character data linking process according to the embodiment.

【図4】本実施例の文字データの連結処理を示す概念図
である。
FIG. 4 is a conceptual diagram illustrating a process of connecting character data according to the present embodiment.

【図5】本実施例の文字データの連結処理を示す概念図
である。
FIG. 5 is a conceptual diagram illustrating a process of linking character data according to the embodiment.

【図6】本実施例のハードウェア構成図である。FIG. 6 is a hardware configuration diagram of the present embodiment.

【符号の説明】[Explanation of symbols]

1…文字データ連結装置 10…第1文字データ格納部 20…第2文字データ格納部 30…読出手段 40…照合手段 50…制御手段 60…連結手段 DESCRIPTION OF SYMBOLS 1 ... Character data connection apparatus 10 ... 1st character data storage part 20 ... 2nd character data storage part 30 ... Readout means 40 ... Collation means 50 ... Control means 60 ... Connection means

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】任意の部分データ単位ごとにデータアクセ
スできる第1および第2文字データ格納部と、 前記第1文字データ格納部に格納された第1文字データ
の行方向または列方向にみた末尾の第1部分データと
重複する第2部分データを前記第2文字データ格納部に
格納された第2文字データ群から検出する検出手段と、前記第2文字データ群の前記第2部分データ以降のデー
タ群を前記第1文字データ群の後に前記第1または第2
部分データのいずれか一方を取り除いて 連結する連結手
段を備えることを特徴とする文字データ連結装置。
1. A first and second character data storage unit capable of accessing data in an arbitrary partial data unit, and a first character data group stored in the first character data storage unit viewed in a row direction or a column direction. The first partial data at the end
Duplicate second partial data is stored in the second character data storage unit.
Detecting means for detecting from the stored second character data group; and data after the second partial data of the second character data group.
Data group after the first character data group.
A character data linking device comprising linking means for linking after removing one of the partial data .
【請求項2】任意の部分データ単位ごとにデータアクセ
スできる第1および第2文字データ格納部と、 前記第1文字データ格納部に格納された第1文字データ
群の行方向または列方向にみた末尾の部分データと前記
第2文字データ格納部に格納された第2文字データ群の
任意の部分データとを読み出し、この任意の部分データ
が第2文字データ群の末尾の部分データである場合にこ
の部分データの読み出し後に終了信号を発する読出手段
と、 前記読出手段で読み出された第1文字データ群の末尾の
部分データと第2文字データ群の任意の部分データの内
容を照合する照合手段と、 前記照合手段の結果が一致の場合には第2文字データ群
の一致した部分データの次の部分データを伝える信号を
発し、前記照合手段の結果が不一致の場合で読出手段か
ら終了信号を受けていない場合には第2文字データ群の
次の部分データを任意の部分データとして読み出すよう
に前記読出手段に指令を送り、前記照合手段の結果が不
一致の場合で前記読出手段から終了信号を受けとった場
合には第2文字データ群の先頭の部分データを伝える信
号を発する制御手段と、 第1文字データ群全体を前記第1文字データ格納装置か
ら読み出し、前記制御手段からの信号によって伝えられ
た部分データから末尾の部分データまでを前記第2文字
データ格納装置から読み出して、第1文字データ群の後
に第2文字データ群を連結する連結手段とを備えること
を特徴とする文字データ連結装置。
2. A first and a second character data storage unit capable of accessing data in an arbitrary partial data unit, and a first character data group stored in the first character data storage unit viewed in a row direction or a column direction. When the partial data at the end and the optional partial data of the second character data group stored in the second character data storage unit are read out, and the optional partial data is the partial data at the end of the second character data group, Reading means for issuing an end signal after reading the partial data; and collating means for collating the contents of the partial data at the end of the first character data group and any partial data of the second character data group read by the reading means. And if the result of said collating means is a match, a signal is transmitted to transmit the next partial data of the matched partial data of the second character data group. If no end signal has been received from the stage, a command is sent to the reading means so as to read the next partial data of the second character data group as arbitrary partial data. Control means for issuing a signal for transmitting the leading partial data of the second character data group when an end signal is received from the means; and reading the entire first character data group from the first character data storage device; And a linking means for reading from the second character data storage device the partial data transmitted to the last partial data transmitted by the signal of the second character data storage device and connecting the second character data group after the first character data group. Character data concatenation device.
【請求項3】任意の部分データ単位ごとにデータアクセ
スできる第1および第2文字データ格納部と、 前記第1文字データ格納部に格納された第1文字データ
群の行方向または列方向にみた末尾の1または2以上の
部分データを読み出し、この部分データと同一個数の部
分データを前記第2文字データ格納部に格納された第2
文字データ群の先頭から読み出し、第2文字データ群の
末尾の部分データまで読み出した場合にこの読み出し後
に終了信号を発する読出手段と、 前記読出手段で読み出された第1文字データ群と第2文
字データ群の1または2以上の部分データの内容を照合
する照合手段と、 前記照合手段の結果が一致の場合には第2文字データ群
から読み出した末尾の部分データの次の部分データを伝
える信号を発し、前記照合手段の結果が不一致の場合で
前記読出手段から終了信号を受けていない場合には読み
出す部分データの数を1つ増やすように前記読出手段に
指令を送り、前記照合手段の結果が不一致の場合で前記
読出手段から終了信号を受けとった場合には第2文字デ
ータ群の先頭の部分データを伝える信号を発する制御手
段と、 第1文字データ群全体を前記第1文字データ格納装置か
ら読み出し、前記制御手段からの信号によって伝えられ
た部分データから末尾の部分データまでを前記第2文字
データ格納装置から読み出して、第1文字データ群の後
に第2文字データ群を連結する連結手段とを備えること
を特徴とする文字データ連結装置。
3. A first and second character data storage unit which can access data in units of arbitrary partial data, and a first character data group stored in the first character data storage unit viewed in a row direction or a column direction. One or more partial data at the end is read out, and the same number of partial data as the partial data is stored in the second character data storage unit.
Reading means for issuing an end signal after reading from the beginning of the character data group and reading the partial data at the end of the second character data group; and reading the first character data group and the second character data read by the reading means. Collating means for collating the contents of one or more partial data of the character data group; and when the result of the collating means is identical, transmitting the partial data next to the last partial data read from the second character data group. A signal is issued, and when the result of the collation means is inconsistent and an end signal is not received from the reading means, a command is sent to the reading means to increase the number of partial data to be read by one, and Control means for issuing a signal for transmitting a partial data at the head of the second character data group when an end signal is received from the reading means in a case where the results do not match, and The whole group is read from the first character data storage device, and the data from the partial data transmitted by the signal from the control means to the last partial data is read from the second character data storage device, and after the first character data group, A character data linking device comprising: linking means for linking the second character data group.
JP6994191A 1990-06-26 1991-04-02 Character data linking device Expired - Lifetime JP3061066B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6994191A JP3061066B2 (en) 1990-06-26 1991-04-02 Character data linking device
US08/395,230 US5675672A (en) 1990-06-26 1995-02-27 Two dimensional linker for character string data

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP16738490 1990-06-26
JP2-167384 1990-06-26
JP6994191A JP3061066B2 (en) 1990-06-26 1991-04-02 Character data linking device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2000060711A Division JP2000311216A (en) 1990-06-26 2000-03-06 Character data connecting device and method

Publications (2)

Publication Number Publication Date
JPH04218887A JPH04218887A (en) 1992-08-10
JP3061066B2 true JP3061066B2 (en) 2000-07-10

Family

ID=26411109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6994191A Expired - Lifetime JP3061066B2 (en) 1990-06-26 1991-04-02 Character data linking device

Country Status (1)

Country Link
JP (1) JP3061066B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6563948B2 (en) 1999-04-29 2003-05-13 Intel Corporation Using an electronic camera to build a file containing text
JP2002024762A (en) * 2000-06-30 2002-01-25 Toshiba Corp Document recognizing device and its method

Also Published As

Publication number Publication date
JPH04218887A (en) 1992-08-10

Similar Documents

Publication Publication Date Title
JP3078002B2 (en) Image information processing device
JP3061066B2 (en) Character data linking device
JP2000311216A (en) Character data connecting device and method
JP2666931B2 (en) Optical character reader
JP3455643B2 (en) Method of updating learning dictionary in character recognition device and character recognition device
JP2932667B2 (en) Information retrieval method and information storage device
JP2895834B2 (en) Image recording device
JPH04104367A (en) File system
JPH07319890A (en) Document registration/retrieval system
JPH0492973A (en) Image information registration/retrieval device
JPH0863487A (en) Method and device for document retrieval
JPH07271920A (en) Character recognizing device
JPH0721814B2 (en) Character / mark reader
JPS58123159A (en) Registering method of picture information
JPH05298368A (en) Method for inputting retrieving word in electronic filing system
JP2586172B2 (en) Table search device with learning function
JP2865443B2 (en) Kanji conversion device for Kana name or Kana corporation name
JPS6014324A (en) Associative storage device
JPH0470967A (en) Picture retrieving device
JPS6215887B2 (en)
JPH0273467A (en) Electronic filing system
JPH04275625A (en) Automatic generation device for control language
JPH01303566A (en) Data retrieving/registering method for filing system
JPS62256070A (en) Document processor
JPS63212986A (en) Image recorder

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080428

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 11

EXPY Cancellation because of completion of term