JPH06149881A - Dictionary consultant device, document processor, and digital copying machine - Google Patents

Dictionary consultant device, document processor, and digital copying machine

Info

Publication number
JPH06149881A
JPH06149881A JP4323633A JP32363392A JPH06149881A JP H06149881 A JPH06149881 A JP H06149881A JP 4323633 A JP4323633 A JP 4323633A JP 32363392 A JP32363392 A JP 32363392A JP H06149881 A JPH06149881 A JP H06149881A
Authority
JP
Japan
Prior art keywords
search
dictionary
mark
document
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4323633A
Other languages
Japanese (ja)
Inventor
Masayuki Kameda
雅之 亀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP4323633A priority Critical patent/JPH06149881A/en
Publication of JPH06149881A publication Critical patent/JPH06149881A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To acquire the comprehensive output of a retrieval result only for a character string(word) requiring retrieval with an easy operation. CONSTITUTION:A dictionary retrieval means 9 retrieves an electronic dictionary 8, and extracts the content of it. A display/output means 11 displays or outputs the content retrieved by the dictionary retrieval means 9. A document input means 2 inputs electronic document data. An enclosure retrieval mark detecting means 3 detects an enclosure retrieval mark decided in advance in the document data inputted by the document input means 2. A retrieval character string extraction means 6 extracts a character string enclosed with the enclosure retrieval mark detected by the enclosure retrieval mark detecting means 3. Retrieval is performed on the electronic dictionary 8 by the retrieval character string extraction means 6, and a pair of the character string and the content is displayed and outputted.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【技術分野】本発明は、辞書引き装置及び文書処理装置
並びにディジタル複写装置に関し、より詳細には、自然
言語の文書処理技術における辞書引き装置、文書処理装
置、ディジタル複写装置に関する。例えば、外国語文書
購読/作成装置などの支援機能としての辞書引き部に適
用されるものである。
TECHNICAL FIELD The present invention relates to a dictionary lookup device, a document processing device, and a digital copying device, and more particularly to a dictionary lookup device, a document processing device, and a digital copying device in a natural language document processing technique. For example, it is applied to a dictionary lookup unit as a support function of a foreign language document subscription / creation device.

【0002】[0002]

【従来技術】辞書引き機能は、辞書引き装置単体や文書
作成装置に組み込まれている。このような装置では、辞
書引きする文字列を直接指定する。また、このような辞
書引き装置では、通常の本形式の辞書をより効率的に検
索を行ったり、検索された内容を電子化状態で活用する
こともできるようになっている。しかし、対象語を入力
するという手間が残る。これに対して、文書を購読ある
いは翻訳しながら辞書引きを行う装置においては、文書
の表示画面上で範囲指定あるいはポインティング装置で
指定することで対象語を与え、操作を簡単化する方法が
ある。このような方法は、文書が電子化されていない場
合は文書を入力する作業が大変なため、簡単な操作は利
用できない。
2. Description of the Related Art A dictionary lookup function is incorporated in a single dictionary lookup device or a document creation device. In such a device, the character string to be looked up in the dictionary is directly specified. Further, in such a dictionary lookup device, it is possible to more efficiently search a normal book format dictionary and utilize the searched contents in an electronic state. However, the trouble of inputting the target word remains. On the other hand, in a device that performs dictionary lookup while subscribing or translating a document, there is a method of giving a target word by specifying a range or a pointing device on the display screen of the document to simplify the operation. In such a method, a simple operation cannot be used because the work of inputting the document is difficult if the document is not digitized.

【0003】ただし、いわゆる文字読み取り装置(ある
いは文書読み取り装置)を文書入力部の結合すれば、電
子化されていない文書も容易に電子化することができ
る。このような読み取り装置は、自然言語間の翻訳を行
う機械翻訳装置等にも組み込まれ、原言語の文書入力の
効率化にも利用されている。しかし、多数の単語を一括
して検索し、たとえば単語リストのような帳票を作成す
る用途では、このような対話的な使用は適しているとは
いえないが、辞書引き機能を搭載したディジタル複写機
では、文字読み取り装置と組合せ、読み取った文書中の
単語を抽出し、その単語(の一部)を検索対象とする。
この装置によって、単語を指定する手間を不要とするこ
とができるが、利用者にとって、不要な単語の検索結果
まで出力されるという問題が生じる。これは、例えば、
機能的な単語の検索を抑止することで無駄な出力はある
程度は削減できるが、なお、個々の利用者にとって本当
に必要なもの以外の出力が多く含まれている。
However, if a so-called character reading device (or document reading device) is connected to the document input section, a non-electronic document can be easily digitized. Such a reading device is also incorporated in a machine translation device or the like that translates between natural languages, and is also used to improve efficiency in inputting a document in a source language. However, such interactive use is not suitable for the purpose of collectively searching a large number of words and creating a form such as a word list. However, digital copying equipped with a dictionary lookup function is not suitable. In combination with a character reading device, the machine extracts a word in the read document and makes that word (a part of it) the search target.
With this device, it is possible to eliminate the trouble of designating a word, but there is a problem for the user that even a search result of an unnecessary word is output. This is, for example,
Although the useless output can be reduced to some extent by suppressing the search for functional words, there are many outputs that are not really necessary for individual users.

【0004】図9〜図11は、従来の辞書引き装置の構
成図で、図中、31は対象文字列入力手段、32a,3
2bは電子化辞書、33は辞書検索手段、34は対象文
字列メモリ、35は表示/出力手段、36は検索内容メ
モリ、37は文書入力手段、38は対象文字列検出手
段、39は文書メモリ、40は原文書(画像)、41は
画像読み取り手段、42は文書画像メモリ、43は文字
パターン辞書、44aは文字認識手段、44bは文書認
識手段である。
9 to 11 are block diagrams of a conventional dictionary look-up device, in which 31 is an object character string input means, 32a and 3a.
2b is an electronic dictionary, 33 is a dictionary search unit, 34 is a target character string memory, 35 is a display / output unit, 36 is a search content memory, 37 is a document input unit, 38 is a target character string detection unit, and 39 is a document memory. , 40 is an original document (image), 41 is an image reading unit, 42 is a document image memory, 43 is a character pattern dictionary, 44a is a character recognition unit, and 44b is a document recognition unit.

【0005】図9は、単体の辞書引き装置の例であり、
対象文字列入力手段31によって利用者の文字列入力を
受付け、辞書検索手段33によりその文字列を対象に電
子化辞書32aを検索し、その検索結果を表示/出力手
段35により表示あるいは出力を得るものである。たと
えば、一部に表1に示すような内容をもつ電子化辞書が
あるとする。
FIG. 9 shows an example of a single dictionary lookup device.
The target character string input means 31 accepts the user's character string input, the dictionary search means 33 searches the digitized dictionary 32a for the character string, and the display / output means 35 displays or outputs the search result. It is a thing. For example, assume that there is an electronic dictionary partially having the contents shown in Table 1.

【0006】[0006]

【表1】 [Table 1]

【0007】こうした辞書に文字列“prove”を検索対
象として入力すると、次の検索内容を表2のように表示
する。
When the character string "prove" is entered as a search target in such a dictionary, the next search content is displayed as shown in Table 2.

【0008】[0008]

【表2】 [Table 2]

【0009】図10は、電子化文書を扱うことができる
文書作成装置等の例であり、文書表示画面に対するポイ
ンティングデバイス等を備えた対象文字列検出手段38
により、文書から対象文字列を検出する。以下は、図9
の場合と同様である。たとえば、画面に表3のような文
書表示がされていたとする。
FIG. 10 shows an example of a document creating apparatus or the like which can handle an electronic document, and is a target character string detecting means 38 equipped with a pointing device or the like for the document display screen.
, The target character string is detected from the document. The following is Fig. 9
It is similar to the case of. For example, it is assumed that the document shown in Table 3 is displayed on the screen.

【0010】[0010]

【表3】 [Table 3]

【0011】画面上で4行目の“proved”を検索対象と
して、ポインティングデバイス等で指定すると、たとえ
ば、画面上にサブウィンドウ画面が現れ、表4のような
検索内容が表示される。
When "proved" in the fourth line on the screen is designated as a search target with a pointing device or the like, for example, a sub-window screen appears on the screen and the search contents as shown in Table 4 are displayed.

【0012】[0012]

【表4】 [Table 4]

【0013】なお、この際、活用/変化する語の原形を
得るために、たとえば、対象が英語であるならば、語尾
の“ed”あるいは“d”、“es”あるいは“s”を
取り除いたりする簡単な形態素解析手段を必要とする。
At this time, in order to obtain the original form of a word that is utilized / changed, for example, if the object is English, the endings of "ed" or "d", "es" or "s" may be removed. It requires a simple morphological analysis means.

【0014】図11は、いわゆるOCR装置を備えた場
合の例であり、画像読み取り手段、文字認識手段、文書
読み取り手段、文字パターン辞書等を備えたOCR部に
より、紙に印字された文書データを電子化することがで
きる。以下は、図9の場合と同様である。こうした辞書
引き装置を搭載したディジタル複写装置で、表5のよう
に検索内容を印字出力するものがある。
FIG. 11 shows an example in which a so-called OCR device is provided. Document data printed on paper is read by an OCR unit equipped with image reading means, character recognition means, document reading means, character pattern dictionary and the like. It can be computerized. The following is the same as the case of FIG. Some digital copying machines equipped with such a dictionary lookup device print out the search contents as shown in Table 5.

【0015】[0015]

【表5】 [Table 5]

【0016】この英語文の例では、冠詞、助動詞、be動
詞などいわゆる機能語と呼ばれる単語については、検索
対象からはずしてあるが、その他の単語については、そ
の検索内容である日本語訳の最初のひとつをルビ形式で
示している。あるいは、原文の出現順序に合わせて、表
6のような単語帳形式で出力する場合もある。
In the example of this English sentence, words called so-called functional words such as articles, auxiliary verbs and be verbs are excluded from the search target, but other words are excluded from the search target Japanese translation. One of them is shown in ruby format. Alternatively, it may be output in a word book format as shown in Table 6 according to the appearance order of the original text.

【0017】[0017]

【表6】 [Table 6]

【0018】もちろん、このような結果は、OCR装置
をもたない図10の構成でも可能である。これらの辞書
引き装置では、次のような問題点がある。 検索語の指定において、対話的な入力手段しかもたな
い形態(図9,図10)では、一括して、多数の検索結
果を見たい場合に、その方法がない。 一括して多数の検索結果を出力できる機能がある(図
(1))でも、利用者にとって、不要な対象が含まれる。
Of course, such a result is also possible with the arrangement of FIG. 10 without the OCR device. These dictionary lookup devices have the following problems. In the form of having only interactive input means for designating a search word (FIGS. 9 and 10), there is no method for collectively viewing a large number of search results. There is a function that can output many search results at once (Fig.
Even in (1)), the target is unnecessary for the user.

【0019】[0019]

【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、電子化された文書中の単語の辞書引きにおい
て、検索を必要とする文字列(単語)だけの検索結果の
一括出力の取得をより簡単な操作で実現すること、ま
た、検索対象単語を囲む2つのマークを付加することが
必要な辞書引き装置に対し、その先頭部にマークを付加
するだけの指定に簡単化すること、また、元の文書と得
られた検索結果の一括出力との対応を容易にすること、
さらに、文書処理装置あるいはディジタル複写装置を提
供することを目的とする。
[Object] The present invention has been made in view of the above situation, and in the dictionary lookup of words in an electronic document, a batch output of search results of only character strings (words) that need to be searched. To realize the acquisition by a simpler operation, and to simplify the specification of only adding a mark to the head of a dictionary lookup device that needs to add two marks surrounding a search target word. , Also facilitate the correspondence between the original document and the batch output of the obtained search results,
Another object is to provide a document processing device or a digital copying device.

【0020】[0020]

【構成】本発明は、上記目的を達成するために、(1)
検索するべき電子化辞書と、該電子化辞書を検索して内
容を抽出する辞書検索手段と、該辞書検索手段で検索さ
れた内容を表示あるいは出力する表示/出力手段とを備
えた辞書引き装置において、電子化された文書データを
入力する文書入力手段と、前記文書入力手段で入力され
た文書データに対して、あらかじめ定めた囲み検索マー
クを検出する囲み検索マーク検出手段と、前記文書入力
手段で入力された文書データに対して、前記囲み検索マ
ーク検出手段で検出された囲み検索マークで囲まれた文
字列を抽出する検索文字列抽出手段とを備え、該検索文
字列抽出手段で抽出された文字列を対象に、前記辞書検
索手段により前記電子化辞書に対して検索を行い、前記
表示/出力手段により文字列とその内容の組を表示ある
いは出力すること、更には、(2)前記文書入力手段で
入力された文書データに対して、あらかじめ定めた先頭
検索マークを検出する先頭検索マーク検出手段と、前記
文書入力手段で入力された文書データに対して、前記先
頭検索マーク検出手段で検出された先頭検索マーク以降
の文字列を抽出する検索文字列抽出手段とを備え、該検
索文字列抽出手段で抽出された文字列を対象に、前記辞
書検索手段により前記電子化辞書に対して最長一致検索
を行い、前記表示/出力手段により検索単語とその内容
の組を表示あるいは出力すること、更には、(3)前記
(2)において、前記入力文書の単語分割を行い、活用
語はその原形も与える単語分割手段と、前記文書入力手
段で入力された文書データに対して、前記単語分割手段
の結果から、前記先頭検索マーク検出手段で検出された
先頭検索マーク以降の文字から始まる単語を抽出する検
索単語抽出手段とを備え、該検索単語抽出手段で抽出さ
れた文字列を対象に、前記辞書検索手段により前記電子
化辞書に対して検索を行い、前記表示/出力手段により
単語とその内容の組を表示あるいは出力すること、或い
は、(4)電子化された文書データを入力する文書入力
手段と、検索するべき電子化辞書と、前記電子化辞書を
検索して内容を抽出する辞書検索手段と、前記辞書検索
手段で検索された内容を表示あるいは出力する表示/出
力手段と、画像読み取り手段と、該画像読み取り手段に
より得られた画像データを文字パターン辞書により文字
として認識する文字認識手段と、該文字認識手段により
得られた文字データ群を電子化された文書データとして
認識する文書認識手段とを備えた辞書引き装置におい
て、前記画像読み取り手段により得られた画像データか
ら囲みマーク図形の位置を認識する囲みマーク認識手段
と、該囲みマーク認識手段により認識された囲みマーク
図形の位置から前記文字認識手段により得られた文字デ
ータ群中のマーク付けされた文字列を検出する囲みマー
ク付き文字列検出手段とを備え、該囲みマーク付け文字
列検出手段で検出された文字列を対象に、前記辞書検索
手段により前記電子化辞書に対して検索を行い、前記表
示/出力手段により文字列とその内容の組を表示あるい
は出力すること、更には、(5)前記(4)において、
前記画像読み取り手段により得られた画像データから先
頭マーク図形の位置を認識する先頭マーク認識手段と、
該先頭マーク認識手段により認識された先頭マーク図形
の位置から前記文書認識手段により得られた文字データ
群中のマーク付けされた文字を検出する先頭マーク付き
文字認識手段と、該先頭マーク付け文字認識手段で認識
された文字以降の文字を対象に、前記先頭マーク付き文
字認識手段により認識された文字以降の文字列を抽出す
る検索文字列抽出手段とを備え、該検索文字列抽出手段
で抽出された文字列を対象に、前記辞書検索手段により
前記電子化辞書に対して最長一致検索を行い、前記表示
/出力手段により検索単語とその内容の組を表示あるい
は出力すること、更には、(6)前記(5)において、
入力文書の単語分割を行い、活用語はその原形も与える
単語分割手段と、前記画像読み取り手段により得られた
画像データから単語マーク図形の位置を認識する単語マ
ーク認識手段と、該単語マーク認識手段により認識され
た単語マーク図形の位置から前記単語分割手段により得
られた単語列中のマーク付けされた単語を検出するマー
ク付き単語認識手段とを備え、該マーク付き単語認識手
段で認識された単語を対象に、前記辞書検索手段により
前記電子化辞書に対して検索を行い、前記表示/出力手
段により単語とその内容の組を表示あるいは出力するこ
と、更には、(7)前記(1)〜(6)のいずれかにお
いて、表示あるいは出力する対象文字列とその内容の組
に、入力文書における文字列の位置情報を付加して表示
あるいは出力すること、更には、(8)前記(1)〜
(6)のいずれかにおいて、入力文書における対象文字
列に、表示あるいは出力における対象文字列とその内容
の組の位置情報を付加した入力文書を表示あるいは出力
すること、或いは、(9)前記(1)〜(8)のいずれ
かに記載の辞書引き装置を備えた文書処理装置であるこ
と、或いは、(10)前記(4)〜(8)いずれかに記
載の辞書引き装置を備えたディジタル複写装置であるこ
とを特徴としたものである。以下、本発明の実施例に基
づいて説明する。
In order to achieve the above object, the present invention provides (1)
A dictionary lookup device including a computerized dictionary to be searched, dictionary retrieval means for retrieving the computerized dictionary and extracting contents, and display / output means for displaying or outputting the contents retrieved by the dictionary retrieval means In, document input means for inputting digitized document data, surrounding search mark detecting means for detecting a predetermined surrounding search mark for the document data input by the document input means, and the document input means A search character string extracting means for extracting a character string enclosed by the enclosed search mark detected by the enclosed search mark detecting means, from the document data input in Searching for the digitized dictionary by the dictionary searching means for the character string, and displaying or outputting a set of the character string and its contents by the display / output means. Further, (2) a leading search mark detecting means for detecting a leading leading search mark for the document data input by the document inputting means, and document data input by the document inputting means, A search character string extracting means for extracting a character string after the head search mark detected by the head search mark detecting means, wherein the dictionary searching means targets the character string extracted by the search character string extracting means. Performing a longest match search on the electronic dictionary and displaying or outputting a set of the search word and its contents by the display / output means, and (3) the word of the input document in (2) above. The leading search mark detection is performed based on the result of the word division means for the word division means for dividing and giving the original form of the inflection word and the document data input by the document input means. Search word extraction means for extracting a word starting from a character after the first search mark detected by the means, and targeting the character string extracted by the search word extraction means to the electronic dictionary by the dictionary search means. The display / output means displays or outputs a set of words and their contents, or (4) a document input means for inputting digitized document data and an electronic dictionary to be searched. A dictionary search means for searching the electronic dictionary to extract contents, a display / output means for displaying or outputting the contents searched by the dictionary search means, an image reading means, and an image reading means. A character recognition means for recognizing the obtained image data as a character by a character pattern dictionary, and a character data group obtained by the character recognition means as electronic document data. In a dictionary lookup device including document recognizing means for recognizing, a surrounding mark recognizing means for recognizing a position of a surrounding mark figure from the image data obtained by the image reading means, and a surrounding mark recognized by the surrounding mark recognizing means. A character string detecting means with a surrounding mark for detecting a marked character string in the character data group obtained by the character recognizing means from the position of the figure, and the character detected by the surrounding character string detecting means Searching the digitized dictionary by the dictionary searching means for a string, and displaying or outputting a set of a character string and its contents by the display / output means, further, (5) above (4) ),
A head mark recognition means for recognizing the position of the head mark figure from the image data obtained by the image reading means,
Character recognition means with head mark for detecting a marked character in the character data group obtained by the document recognition means from the position of the head mark figure recognized by the head mark recognition means, and the character recognition with head mark A character string after the character recognized by the means and a search character string extracting means for extracting the character string after the character recognized by the character recognition means with the leading mark, and the character string extracted by the search character string extracting means. Performing a longest match search on the digitized dictionary by the dictionary search means for the character string, and displaying or outputting a set of the search word and its contents by the display / output means; and (6) ) In the above (5),
Word division means for dividing the input document into words and giving the original forms of the utilized words, word mark recognition means for recognizing the position of the word mark graphic from the image data obtained by the image reading means, and the word mark recognition means And a word recognized by the marked word recognition means for detecting a marked word in the word string obtained by the word dividing means from the position of the word mark figure recognized by The electronic dictionary is searched by the dictionary searching means, and the set of the word and its contents is displayed or output by the display / output means. Further, (7) (1) to (1) to In any one of (6), the position information of the character string in the input document is added to the set of the target character string to be displayed or output and its contents and displayed or output. If, furthermore, (8) the (1) to
In any one of (6), displaying or outputting an input document in which position information of a target character string to be displayed or output and its contents is added to the target character string in the input document, or (9) above ( A document processing device including the dictionary lookup device according to any one of 1) to (8), or (10) a digital processing device including the dictionary lookup device according to any one of (4) to (8) above. It is characterized by being a copying machine. Hereinafter, description will be given based on examples of the present invention.

【0021】図1は、本発明による辞書引き装置の一実
施例を説明するための構成図で、図中、1は電子化文
書、2は文書入力手段、3は囲み検索マーク検出手段、
4は文書メモリ、5は囲み検索マーク位置、6は検索文
字列抽出手段、7は対象文字列メモリ、8は電子化辞
書、9は辞書検索手段、10は検索内容メモリ、11は
表示/出力手段である。
FIG. 1 is a block diagram for explaining an embodiment of a dictionary lookup apparatus according to the present invention. In the figure, 1 is an electronic document, 2 is a document input means, 3 is an enclosing search mark detecting means,
Reference numeral 4 is a document memory, 5 is an enclosing search mark position, 6 is a search character string extracting means, 7 is a target character string memory, 8 is an electronic dictionary, 9 is a dictionary searching means, 10 is a search content memory, and 11 is display / output. It is a means.

【0022】以下に説明する請求項1〜3は、一括して
多数の検索結果を出力でき、かつ、利用者が必要な対象
だけに限定するために、文書中の検索対象に事前に利用
者がマークを付けることによって、そのマークの付加さ
れた対象についてのみ検索し、その検索結果を一括して
出力する方式である。また、各請求項は、マークの付加
の仕方が異なる。なお、各請求項のマークの付加は、本
方式の辞書引きを組み込んだ装置のもつ文書編集手段、
あるいは別個の装置によりマーク付けされた文書を入力
とする。
According to claims 1 to 3 described below, in order to output a large number of search results at a time, and in order to limit the users to only the necessary ones, the search target in the document is set in advance by the user. Is a method in which only the objects to which the mark is added are searched by adding a mark, and the search results are collectively output. Further, each claim is different in the way of adding a mark. In addition, the addition of the mark of each claim is performed by the document editing means of the device incorporating the dictionary lookup of this system,
Alternatively, the input is a document marked by a separate device.

【0023】請求項1 請求項1は、文書中で、あらかじめ定められた一対の囲
みマークで範囲指定された文字列を検索対象とする。た
とえば、囲みマークを“#<”と“>#”として、表7のよ
うに日本語文書にマークしたとする。
[0023] claims 1 1, in the document, a character string range specified by a pair of enclosing marks predetermined searched. For example, suppose that the surrounding marks are “# <” and “>#” and the Japanese document is marked as shown in Table 7.

【0024】[0024]

【表7】 [Table 7]

【0025】この指定に対し、たとえば辞書を和英辞書
とすれば、検索結果として表8のような単語帳形式の一
覧を出力するものである。
In response to this designation, for example, if the dictionary is a Japanese-English dictionary, a list in a word book format as shown in Table 8 is output as the search result.

【0026】[0026]

【表8】 [Table 8]

【0027】このように、請求項1は、マークで指定さ
れた範囲の文字列を順次に抽出して検索することで実現
できる。
As described above, the first aspect can be realized by sequentially extracting and retrieving the character string in the range designated by the mark.

【0028】請求項2 請求項1では、対象とする文字列の範囲を指定したのに
対し、請求項2では、検索対象の先頭しか指定しない。
すなわち、あらかじめ定めた先頭マーク以降の文字列を
対象にして辞書を最長一致検索する。最長一致検索で
は、簡単には、検索対象文字列を1文字から順次1文字
ずつ延ばしていき、検索が成功する最長の対象を結果と
する。なお、実際には、辞書のエントリがソートされて
いれば、順次1文字ずつ延ばしていった各文字列での検
索で失敗した場合に、 ・その文字列を前方に含む(前方一致)エントリがな
い、あるいは、 ・前方一致したエントリが同じ長さの対象文字列よりソ
ート順で後方である。 ならば、そこまでの最長の対象を結果としてよい。たと
えば、先頭マークを“@>”として、表9のように日本語
文書にマークしたとする。
Claim 2 In claim 1, the range of the target character string is specified, whereas in claim 2, only the beginning of the search target is specified.
That is, the longest match search is performed in the dictionary for the character string after the predetermined start mark. In the longest match search, the search target character string is simply extended one character at a time from one character, and the longest target for which the search is successful is set as the result. Actually, if the entries in the dictionary are sorted, and if the search with each character string that has been sequentially extended by one character fails, the entry that includes the character string at the beginning (prefix match) is No, or-The matching entry is behind the target string of the same length in the sort order. Then, the longest target up to that point may be the result. For example, assume that a Japanese document is marked as shown in Table 9 with the leading mark being "@>".

【0029】[0029]

【表9】 [Table 9]

【0030】この場合、たとえば、2番目の先頭マーク
に関連して、対象とする和英辞書の内容が表10のよう
になっていたとする。
In this case, assume that the contents of the target Japanese-English dictionary are as shown in Table 10 in relation to the second head mark.

【0031】[0031]

【表10】 [Table 10]

【0032】先頭マーク以降の検索対象文字列は、
“文”,“文書”,“文書中”,“文書中に”,…が順
次割り当てられるが、“文”及び“文書”では検索に成
功するが、“文書中”では失敗し、かつその文字列を前
方に含む検索も失敗するので、“文書”が最長一致とな
る。“請求項”及び“検索対”を前方にもつエントリが
なければ、検索結果は、請求項1の例と同様になる。す
なわち、請求項2によれば、範囲指定によらず先頭の指
定だけでよい。また、英語のように、単語が空白で分割
されている場合は、あえて最長一致検索を用いなくても
よいが、“at last”のような複数単語の連続した熟語
を含める場合には、最長一致検索が必要になる。なお、
たとえば、文中に“文書検索”があるが、“文書”を検
索したいという場合には、先頭マークでは不可で、囲み
マークでの指定が必要となる。
The search target character string after the head mark is
"Sentence", "Document", "In the document", "In the document", ... Are sequentially assigned, but the search is successful in "Sentence" and "Document", but fails in "In the document" and A search that includes a character string at the beginning also fails, so the "document" is the longest match. If there is no entry having “Claim” and “Search pair” in the front, the search result is similar to the example of Claim 1. That is, according to the second aspect, it is only necessary to specify the head, not the range. In addition, if the words are separated by white space like English, it is not necessary to use the longest match search, but if you include consecutive idioms of multiple words such as "at last", the longest match search is not necessary. A match search is required. In addition,
For example, if there is a "document search" in the sentence, but you want to search for "document", it is not possible to use the leading mark, and it is necessary to specify with the enclosing mark.

【0033】請求項3 図2は、本発明による辞書引き装置の他の実施例(請求
項3)を示す図で、図中、12は単語分割手段、13は
先頭検索マーク検出手段、14は単語分割別メモリ、1
5は先頭検索マーク位置、16は対象単語メモリで、そ
の他図1と同じ作用をする部分は同一の符号を付してあ
る。請求項3では、指定の方法は請求項2と同様である
が、検索対象文字列の特定に単語分割結果を用い、マー
クの付いた単語を検索対象とする。このために、請求項
3では単語分割手段を必要とする。すなわち、事前に文
書を単語分割手段により単語に分割し、活用/変化する
語についてはその原形も得ておく。この単語分割は、す
でに形態素解析として確立された技術である。また、英
語については、空白によって単語に分割されているが、
語形変化や複数形の原形を得ることが必要である。単語
分割手段によれば、たとえば英語文及び日本語文につい
て、表11のような単語分割結果が得られる。
Claim 3 FIG. 2 is a diagram showing another embodiment (claim 3) of the dictionary lookup apparatus according to the present invention, in which 12 is a word dividing means, 13 is a head search mark detecting means, and 14 is Memory by word division, 1
Reference numeral 5 is the position of the head search mark, 16 is the target word memory, and other parts having the same operations as in FIG. In claim 3, the designation method is the same as in claim 2, but the word division result is used to specify the search target character string, and the marked word is set as the search target. For this reason, the word dividing means is required in claim 3. That is, the document is divided into words by the word dividing means in advance, and the original forms of the words that are utilized / changed are also obtained. This word division is a technique already established as morphological analysis. Also, for English, although it is divided into words by white space,
It is necessary to obtain word forms and plural forms. According to the word dividing means, the word dividing result as shown in Table 11 is obtained for, for example, an English sentence and a Japanese sentence.

【0034】[0034]

【表11】 [Table 11]

【0035】たとえば、日本語文において、請求項3の
先頭マークを“$>”とし、表12のような指定が行わ
れたとする。
For example, it is assumed that in the Japanese sentence, the head mark of claim 3 is set to "$>" and the specification shown in Table 12 is made.

【0036】[0036]

【表12】 [Table 12]

【0037】第2番目の指定では、“文書”が単語とし
て分割されているので、“文書”が検索対象となる。ま
た、第3番目の指定では、“検索”が対象となるが、第
4番目の指定では、“検索する”が対象となる。従っ
て、上記の例では、表13のような検索結果を得ること
ができる。
In the second designation, since "document" is divided as a word, "document" is to be searched. In the third designation, "search" is the target, whereas in the fourth designation, "search" is the target. Therefore, in the above example, the search result as shown in Table 13 can be obtained.

【0038】[0038]

【表13】 [Table 13]

【0039】ここの「検索する」というように、活用す
る単語については、文中では、原形を指定できないが、
単語分割結果を参照することにより、これを可能とす
る。以上、3種類のマークを示したが、各請求項の組合
せにより、これらのマークの混在により、より柔軟な指
定が可能となる。
As for the word to be used, such as "search", the original form cannot be specified in the sentence.
This is possible by referring to the word division result. Although three types of marks are shown above, the combination of the claims makes it possible to specify more flexibly by mixing these marks.

【0040】次に説明する請求項4〜6は、前述した図
11のようなOCR装置をもつ場合において、請求項1
〜3と同様に、一括して多数の検索結果を出力でき、か
つ、利用者が必要な対象だけに限定するために、文書中
の検索対象に事前に利用者がマークを付けることによっ
て、そのマークの付加された対象についてのみ検索し、
その検索結果を一括して出力する方式である。マーク
は、OCR装置の入力となる印字されたオリジナルの文
書に記入する。記入は、文字認識に影響を与えないよう
に、行間に記入するのを原則とする。請求項4〜6で
は、各々囲みマーク、先頭マーク、単語マークを与え、
検索対象の指示とする。
Claims 4 to 6, which will be described below, claim 1 when the OCR device as shown in FIG. 11 is provided.
In the same manner as ~ 3, a large number of search results can be output in a batch, and in order to limit the users to only the necessary ones, the user marks the search objects in the document in advance. Search only for objects with marks,
This is a method of outputting the search results all at once. The mark is placed on the original printed document that is input to the OCR device. In principle, fill in between lines so that it does not affect character recognition. In claims 4 to 6, a surrounding mark, a leading mark, and a word mark are given,
This is an instruction to search.

【0041】請求項4 図3は、本発明による辞書引き装置の更に他の実施例
(請求項4)を示す図で、図中、17は原文書(画
像)、18は画像読み取り手段、19は文書画像メモ
リ、20は文字パターン辞書、21aは文字認識手段、
21bは文書認識手段で、その他、図2と同じ作用をす
る部分は、同一の符号を付してある。請求項4では、対
象とする文字列全体を指定するための囲みマークを与え
る。囲みマークの実際は、さまざまな形式が可能である
が、たとえば、図5に示すように、文字列の下部に線や
波線を引くのが簡単である。また、複写装置では、部分
抽出のために、蛍光マーカーによる囲み線分を認識でき
る機能があることから、図6に示すように、文字列をマ
ーカで囲むような指定も可能である(図6では、螢光マ
ーカーによる囲み線分を点線で示す)。文字認識結果と
囲みマークの認識結果の位置を照合し、囲みマークの与
えられた文字列を特定する。図5,図6では、各々、1
行目「請求」,2行目「文書」と「検索」が特定され
る。以下は、請求項1と同様である。
Claim 4 FIG. 3 shows a further embodiment (claim 4) of the dictionary lookup apparatus according to the present invention, in which 17 is an original document (image), 18 is an image reading means, and 19 is an image reading means. Is a document image memory, 20 is a character pattern dictionary, 21a is a character recognition means,
Reference numeral 21b is a document recognition means, and other parts having the same functions as those in FIG. 2 are denoted by the same reference numerals. In claim 4, an enclosing mark for designating the entire target character string is provided. Although various forms of the enclosing mark are possible, it is easy to draw a line or a wavy line at the bottom of the character string, as shown in FIG. 5, for example. Further, since the copying apparatus has a function of recognizing a line segment surrounded by a fluorescent marker for partial extraction, it is possible to specify that a character string is surrounded by a marker as shown in FIG. 6 (FIG. 6). Then, the dotted line encircling the fluorescent marker is shown). The character recognition result and the position of the recognition result of the enclosing mark are collated, and the character string given the enclosing mark is specified. In FIG. 5 and FIG. 6, 1 respectively
The line “request”, the second line “document” and “search” are specified. The following is the same as in claim 1.

【0042】請求項5 請求項5では、対象とする文字列の先頭を指定するため
の先頭マークを与える。先頭マークの実際は、さまざま
な形式が可能であるが、たとえば、図7に示すように、
先頭文字の下部や上部にチェックマークや線等を記入す
るのが簡単である。文字認識結果と先頭マークの認識結
果の位置を照合し、先頭マークの与えられた文字を特定
する。図7では、1行目「請求項は…」の「請」,2行
目「文書中の検索対象に…」の「文」と「検」が特定さ
れる。以下は、請求項2と同様である。
Claim 5 In claim 5, a head mark for designating the head of the target character string is given. Actually, the head mark can have various formats. For example, as shown in FIG.
It is easy to put a check mark or a line at the bottom or top of the first letter. The position of the result of character recognition and the position of the result of recognition of the head mark are collated, and the character with the head mark is specified. In FIG. 7, “Contract” in the first line “Claim is ...” and “Sentence” and “Check” in the second line “Search target in document ...” are specified. The following is the same as in claim 2.

【0043】請求項6 図4は、本発明による辞書引き装置の更に他の実施例
(請求項6)を示す図で、図中、22は単語マーク認識
手段、23は単語マーク位置、24は付単語認識手段
で、その他、図3と同じ作用をする部分は同一の符号を
付してある。請求項6では、対象とする単語を指定する
ための単語マークを与える。また、請求項6では、請求
項3と同様に、文書認識(文字認識)された文書データ
を単語分割する手段も備える。単語マークの実際は、さ
まざまな形式が可能であるが、たとえば、図8に示すよ
うに、単語文字列の下部や上部の一部あるいは全体に線
分やチェックマーク等を記入するのが簡単である。文字
認識結果と単語マークの認識結果の位置を照合し、単語
マークの与えられた文字あるいは文字列を特定し、さら
に、文書認識された文書データの単語分割結果とマーク
で特定された文字あるいは文字列から、それを含む単語
を特定することができる。文字認識結果の文書データを
する。図8では、単語分割の結果にもよるが、1行目
「請求」,2行目「文書」と「検索」、4行目の「検索
する」が特定される。以下は、請求項3と同様である。
なお、図では、日本語文でのマークの例を示したが、英
語文では、空白で単語が分割されているので、請求項4
の囲みマークでは、空白で分割された文字列全体を特定
するということにすれば、文字列全体を指定しなくてす
む。また、請求項5は、特に用いなくても前者の方法で
代用することができ、不都合は余り生じない。
Claim 6 FIG. 4 is a diagram showing another embodiment (claim 6) of the dictionary lookup apparatus according to the present invention, in which 22 is a word mark recognition means, 23 is a word mark position, and 24 is a word mark position. In the attached word recognition means, other parts that have the same operation as in FIG. 3 are given the same reference numerals. In claim 6, a word mark for designating a target word is given. Further, in the sixth aspect, similarly to the third aspect, a means for dividing the document data subjected to the document recognition (character recognition) into words is provided. Although various forms of word marks can be used in practice, for example, as shown in FIG. 8, it is easy to write a line segment or a check mark on a part or the whole of a lower part or an upper part of a word character string. . The character recognition result and the position of the recognition result of the word mark are collated, the character or character string with the word mark is specified, and the word division result of the document data recognized by the document and the character or character specified by the mark are specified. From the column, the word that contains it can be identified. Document data of character recognition result. In FIG. 8, although depending on the result of word division, “request” on the first line, “document” and “search” on the second line, and “search” on the fourth line are specified. The following is the same as that of claim 3.
Although the example of the mark in the Japanese sentence is shown in the figure, in the English sentence, the word is divided by a space, so the claim 4
With the enclosing mark, if you specify the entire character string separated by white space, you do not have to specify the entire character string. Further, claim 5 can be substituted by the former method even if it is not particularly used, and there is not much inconvenience.

【0044】以下に説明する請求項7,8は、検索結果
出力と入力文書の一方あるいは双方に他方への参照情報
を付加して、相互の参照を効率化する。請求項7 請求項7では、検索結果出力中の各検索結果に入力文書
中の検索対象の位置情報を含ませる。たとえば、位置情
報として入力文書におけるページと行を与えた場合の対
応の例を表14に示す。
According to claims 7 and 8 described below, reference information to the other is added to one or both of the search result output and the input document to improve mutual reference efficiency. Claim 7 In claim 7, the position information of the search target in the input document is included in each search result output in the search result output. For example, Table 14 shows an example of correspondence when a page and a line in an input document are given as position information.

【0045】[0045]

【表14】 [Table 14]

【0046】請求項8 請求項8では、入力文書中の検索対象にも、検索結果出
力中の検索結果の位置情報を含ませた出力を行う。たと
えば、位置情報として検索結果出力におけるページと番
号を与えた場合の対応の例を表15に示す。
Claim 8 According to claim 8, the search target in the input document is also output including the position information of the search result in the output of the search result. For example, Table 15 shows an example of correspondence when a page and a number in a search result output are given as position information.

【0047】[0047]

【表15】 [Table 15]

【0048】なお、請求項8では、請求項7での検索結
果出力中に入力文書中の検索対象の位置情報と組み合わ
せた場合も含むものである。
It should be noted that the eighth aspect includes the case where the retrieval result output in the seventh aspect is combined with the position information of the retrieval target in the input document.

【0049】以下に説明する請求項9,10は、上記の
辞書引き装置を組み込んだ応用装置の発明である。請求項9 請求項9は、上記の辞書引き装置を組み込んだ文書処理
装置である。すでに、辞書引き機能を備えた文書処理装
置は多く存在するが、本発明の辞書引き装置を取ること
によりその有用性が一層高まる。たとえば、外国語文作
成支援システムが考えられる。たとえば、英語作成支援
システムにおいて、辞書として和英辞書をもつ本発明の
辞書引き装置を搭載する。システムのもつ文書編集機能
としては、英語文だけでなく日本語文も扱えることが必
要である。あらかじめ、元になる日本語文があれば、そ
れに各種マークを付与することで、知りたい単語の対訳
の一覧が単語帳形式で出力できる。さらに、日本語OC
R装置も備えることで、元になる日本語が紙に印字され
た形態であっても、紙上でマークを記入することで、同
様の一覧表が得ることができる。また、逆に、外国語文
購読支援システムも考えられる。英語文購読支援システ
ムでは英日辞書を搭載する。OCR装置を備える場合
は、英語OCR装置を備える。この外国語購読支援は、
外国との電子メールのやりとりや電子ニュースシステム
において、大量に生じる電子化された外国語文の購読に
有用である。この他、編集機能あるいはOCR機能のあ
る単語帳作成システムも可能である。
Claims 9 and 10 described below are inventions of an application device incorporating the above dictionary lookup device. Claim 9 Claim 9 is a document processing apparatus incorporating the above dictionary lookup apparatus. Although there are already many document processing devices having a dictionary lookup function, the utility of the document lookup device of the present invention is further enhanced. For example, a foreign language sentence creation support system can be considered. For example, an English creation support system is equipped with the dictionary lookup device of the present invention having a Japanese-English dictionary as a dictionary. The document editing function of the system must be able to handle Japanese as well as English sentences. If you have the original Japanese sentence in advance, you can add various marks to it to output a list of parallel translations of the words you want to know in the wordbook format. Furthermore, Japanese OC
By including the R device, even if the original Japanese is printed on paper, a similar list can be obtained by writing a mark on the paper. Conversely, a foreign language text subscription support system is also conceivable. The English text subscription support system is equipped with an English-Japanese dictionary. When equipped with an OCR device, it is equipped with an English OCR device. This foreign language subscription support is
It is useful for subscribing a large amount of digitized foreign language texts in e-mail exchanges with foreign countries and electronic news systems. In addition, a word book creating system having an editing function or an OCR function is also possible.

【0050】請求項10 請求項9は、上記の辞書引き装置を組み込んだディジタ
ル複写装置である。すでに、辞書引き機能を備えたディ
ジタル複写装置は存在するが、本発明の辞書引き装置を
取ることによりその有用性が一層高まる。
Claim 10 Claim 9 is a digital copying apparatus incorporating the above dictionary lookup apparatus. Although a digital copying apparatus having a dictionary lookup function already exists, the dictionary lookup apparatus of the present invention makes the utility even more useful.

【0051】[0051]

【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)請求項1に対応する効果:電子化された文書中の
単語の辞書引きにおいて、検索を必要とする単語だけの
検索結果の一括出力の取得を、より簡単な操作で実現す
る。 (2)請求項2に対応する効果:検索対象単語を囲む2
つのマークを付加することが必要な請求項1に対し、さ
らに、その先頭部にマークを付加するだけの指定に簡単
化する。 (3)請求項3に対応する効果:活用語では検索失敗が
ある可能性のある請求項2に対し、さらに、その問題を
解決する。 (4)請求項4に対応する効果:電子化されていない文
書中の単語の辞書引きにおいて、検索を必要とする単語
だけの検索結果の一括出力の取得を、より簡単な操作で
実現する。 (5)請求項5に対応する効果:検索対象単語を囲む2
つのマークを付加することが必要な請求項4に対し、さ
らに、その先頭部にマークを付加するだけの指定に簡単
化する。 (6)請求項6に対応する効果:活用語では検索失敗が
ある可能性のある請求項4に対し、さらに、その問題を
解決する。 (7)請求項7,8に対応する効果:元の文書と得られ
た検索結果の一括出力との対応を容易にとることを実現
する。 (8)請求項9,10に対応する効果:前記各作用効果
を有する文書処理装置あるいはディジタル複写装置を提
供する。すなわち、より有用性の高い辞書引き機能を備
えた文書処理装置あるいはディジタル複写装置を提供す
る。
As is apparent from the above description, the present invention has the following effects. (1) Effect corresponding to claim 1: In dictionary lookup of words in a digitized document, acquisition of batch output of search results of only words that need to be searched is realized by a simpler operation. (2) Effect corresponding to claim 2: Surrounding search target word 2
In addition to claim 1 in which it is necessary to add one mark, the specification is simply simplified by adding the mark to the head of the claim. (3) Effect corresponding to claim 3: The problem is further solved for claim 2 in which there is a possibility that there is a search failure in the conjugation word. (4) Effect corresponding to claim 4: In the dictionary lookup of words in a document that is not digitized, batch output of search results of only words that need to be searched can be obtained by a simpler operation. (5) Effect corresponding to claim 5: 2 surrounding a search target word
In addition to the claim 4 in which it is necessary to add one mark, the specification is simply simplified by adding the mark to the head part. (6) Effect corresponding to claim 6: The problem is further solved with respect to claim 4 in which there is a possibility that a search failure may occur in the conjugation word. (7) Effects corresponding to claims 7 and 8: It is realized that the original document and the batch output of the obtained search results are easily corresponded. (8) Effects corresponding to claims 9 and 10: To provide a document processing device or a digital copying device having the above-mentioned effects. That is, a document processing device or a digital copying device having a more useful dictionary lookup function is provided.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明による辞書引き装置の一実施例(請求
項1)を説明するための構成図である。
FIG. 1 is a configuration diagram for explaining an embodiment (claim 1) of a dictionary lookup device according to the present invention.

【図2】 本発明による辞書引き装置の他の実施例(請
求項3)を示す図である。
FIG. 2 is a diagram showing another embodiment (claim 3) of the dictionary lookup apparatus according to the present invention.

【図3】 本発明による辞書引き装置の更に他の実施例
(請求項4)を示す図である。
FIG. 3 is a diagram showing still another embodiment (claim 4) of the dictionary lookup apparatus according to the present invention.

【図4】 本発明による辞書引き装置の更に他の実施例
(請求項6)を示す図である。
FIG. 4 is a diagram showing still another embodiment (claim 6) of the dictionary lookup apparatus according to the present invention.

【図5】 本発明の請求項4におけるマーク(文字列の
指定)の例を示す図である。
FIG. 5 is a diagram showing an example of a mark (designation of a character string) in claim 4 of the present invention.

【図6】 本発明の請求項4におけるマーク(文字列の
指定)の他の例を示す図である。
FIG. 6 is a diagram showing another example of a mark (designation of a character string) according to claim 4 of the present invention.

【図7】 本発明の請求項4におけるマーク(先頭文字
の指定)の例を示す図である。
FIG. 7 is a diagram showing an example of a mark (designation of a leading character) in claim 4 of the present invention.

【図8】 本発明の請求項4におけるマーク(単語の指
定)の例を示す図である。
FIG. 8 is a diagram showing an example of a mark (designation of a word) according to claim 4 of the present invention.

【図9】 従来の辞書引き装置を示す図である。FIG. 9 is a diagram showing a conventional dictionary lookup device.

【図10】 従来の辞書引き装置の他の例を示す図であ
る。
FIG. 10 is a diagram showing another example of a conventional dictionary lookup device.

【図11】 従来の辞書引き装置の更に他の例を示す図
である。
FIG. 11 is a diagram showing still another example of a conventional dictionary lookup device.

【符号の説明】[Explanation of symbols]

1…電子化文書、2…文書入力手段、3…囲み検索マー
ク検出手段、4…文書メモリ、5…囲み検索マーク位
置、6…検索文字列抽出手段、7…対象文字列メモリ、
8…電子化辞書、9…辞書検索手段、10…検索内容メ
モリ、11…表示/出力手段。
1 ... Digitized document, 2 ... Document input means, 3 ... Enclosed search mark detection means, 4 ... Document memory, 5 ... Enclosed search mark position, 6 ... Search character string extraction means, 7 ... Target character string memory,
8 ... Electronic dictionary, 9 ... Dictionary search means, 10 ... Search content memory, 11 ... Display / output means.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 H04N 1/387 4226−5C ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 5 Identification code Internal reference number FI Technical indication H04N 1/387 4226-5C

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 検索するべき電子化辞書と、該電子化辞
書を検索して内容を抽出する辞書検索手段と、該辞書検
索手段で検索された内容を表示あるいは出力する表示・
出力手段とを備えた辞書引き装置において、電子化され
た文書データを入力する文書入力手段と、前記文書入力
手段で入力された文書データに対して、あらかじめ定め
た囲み検索マークを検出する囲み検索マーク検出手段
と、前記文書入力手段で入力された文書データに対し
て、前記囲み検索マーク検出手段で検出された囲み検索
マークで囲まれた文字列を抽出する検索文字列抽出手段
とを備え、該検索文字列抽出手段で抽出された文字列を
対象に、前記辞書検索手段により前記電子化辞書に対し
て検索を行い、前記表示/出力手段により文字列とその
内容の組を表示あるいは出力することを特徴とする辞書
引き装置。
1. An electronic dictionary to be searched, a dictionary search means for searching the electronic dictionary to extract contents, and a display for displaying or outputting the contents searched by the dictionary search means.
In a dictionary lookup device including output means, a document input means for inputting digitized document data, and a surrounding search for detecting a predetermined surrounding search mark for the document data input by the document input means A mark detecting means; and a search character string extracting means for extracting a character string enclosed by the enclosing search mark detected by the enclosing search mark detecting means from the document data input by the document inputting means, The dictionary search unit searches the electronic dictionary for the character string extracted by the search character string extraction unit, and the display / output unit displays or outputs a set of the character string and its contents. A dictionary lookup device characterized in that
【請求項2】 前記文書入力手段で入力された文書デー
タに対して、あらかじめ定めた先頭検索マークを検出す
る先頭検索マーク検出手段と、前記文書入力手段で入力
された文書データに対して、前記先頭検索マーク検出手
段で検出された先頭検索マーク以降の文字列を抽出する
検索文字列抽出手段とを備え、該検索文字列抽出手段で
抽出された文字列を対象に、前記辞書検索手段により前
記電子化辞書に対して最長一致検索を行い、前記表示/
出力手段により検索単語とその内容の組を表示あるいは
出力することを特徴とする請求項1記載の辞書引き装
置。
2. A head search mark detecting unit for detecting a predetermined head search mark for the document data input by the document input unit, and the document data input by the document input unit for the document data input by the document input unit. A search character string extracting means for extracting a character string after the first search mark detected by the first search mark detecting means, wherein the dictionary searching means is provided for the character string extracted by the search character string extracting means. The longest match search is performed on the electronic dictionary and the above display /
2. The dictionary lookup apparatus according to claim 1, wherein the output means displays or outputs a set of search words and their contents.
【請求項3】 前記入力文書の単語分割を行い、活用語
はその原形も与える単語分割手段と、前記文書入力手段
で入力された文書データに対して、前記単語分割手段の
結果から、前記先頭検索マーク検出手段で検出された先
頭検索マーク以降の文字から始まる単語を抽出する検索
単語抽出手段とを備え、該検索単語抽出手段で抽出され
た文字列を対象に、前記辞書検索手段により前記電子化
辞書に対して検索を行い、前記表示/出力手段により単
語とその内容の組を表示あるいは出力することを特徴と
する請求項2記載の辞書引き装置。
3. The word division of the input document is performed, and the inflection word also gives the original form of the utilization word, and with respect to the document data input by the document input means, from the result of the word division means, the leading part is obtained. A search word extracting means for extracting a word starting from a character after the first search mark detected by the search mark detecting means, wherein the electronic dictionary is searched by the dictionary searching means for the character string extracted by the search word extracting means. 3. The dictionary lookup apparatus according to claim 2, wherein the dictionary is searched, and the display / output means displays or outputs a set of words and their contents.
【請求項4】 電子化された文書データを入力する文書
入力手段と、検索するべき電子化辞書と、前記電子化辞
書を検索して内容を抽出する辞書検索手段と、前記辞書
検索手段で検索された内容を表示あるいは出力する表示
/出力手段と、画像読み取り手段と、該画像読み取り手
段により得られた画像データを文字パターン辞書により
文字として認識する文字認識手段と、該文字認識手段に
より得られた文字データ群を電子化された文書データと
して認識する文書認識手段とを備えた辞書引き装置にお
いて、前記画像読み取り手段により得られた画像データ
から囲みマーク図形の位置を認識する囲みマーク認識手
段と、該囲みマーク認識手段により認識された囲みマー
ク図形の位置から前記文字認識手段により得られた文字
データ群中のマーク付けされた文字列を検出する囲みマ
ーク付き文字列検出手段とを備え、該囲みマーク付け文
字列検出手段で検出された文字列を対象に、前記辞書検
索手段により前記電子化辞書に対して検索を行い、前記
表示/出力手段により文字列とその内容の組を表示ある
いは出力することを特徴とする辞書引き装置。
4. A document input means for inputting electronic document data, an electronic dictionary to be searched, a dictionary search means for searching the electronic dictionary and extracting contents, and a search by the dictionary search means. Display / output means for displaying or outputting the displayed contents, image reading means, character recognition means for recognizing the image data obtained by the image reading means as a character by a character pattern dictionary, and the character recognition means. A dictionary recognizing device having a document recognizing means for recognizing the character data group as electronic document data, and a surrounding mark recognizing means for recognizing the position of the surrounding mark figure from the image data obtained by the image reading means. , A mark in the character data group obtained by the character recognizing means from the position of the surrounding mark figure recognized by the surrounding mark recognizing means A character string detecting means with an enclosing mark for detecting the attached character string, and searching the electronic dictionary by the dictionary searching means for the character string detected by the enclosing character string detecting means And displaying or outputting a set of a character string and its contents by the display / output means.
【請求項5】 前記画像読み取り手段により得られた画
像データから先頭マーク図形の位置を認識する先頭マー
ク認識手段と、該先頭マーク認識手段により認識された
先頭マーク図形の位置から前記文書認識手段により得ら
れた文字データ群中のマーク付けされた文字を検出する
先頭マーク付き文字認識手段と、該先頭マーク付け文字
認識手段で認識された文字以降の文字を対象に、前記先
頭マーク付き文字認識手段により認識された文字以降の
文字列を抽出する検索文字列抽出手段とを備え、該検索
文字列抽出手段で抽出された文字列を対象に、前記辞書
検索手段により前記電子化辞書に対して最長一致検索を
行い、前記表示/出力手段により検索単語とその内容の
組を表示あるいは出力することを特徴とする請求項4記
載の辞書引き装置。
5. A head mark recognition means for recognizing the position of the head mark figure from the image data obtained by the image reading means, and a document recognition means for recognizing the position of the head mark figure recognized by the head mark recognition means. A character recognition means with a head mark for detecting a marked character in the obtained character data group, and a character recognition means with a head mark for a character after the character recognized by the character recognition means with a head mark A character string extracted by the search character string extraction means, and a character string extracted by the search character string extraction means. 5. The dictionary lookup apparatus according to claim 4, wherein a match search is performed, and the display / output means displays or outputs a set of search words and their contents.
【請求項6】 入力文書の単語分割を行い、活用語はそ
の原形も与える単語分割手段と、前記画像読み取り手段
により得られた画像データから単語マーク図形の位置を
認識する単語マーク認識手段と、該単語マーク認識手段
により認識された単語マーク図形の位置から前記単語分
割手段により得られた単語列中のマーク付けされた単語
を検出するマーク付き単語認識手段とを備え、該マーク
付き単語認識手段で認識された単語を対象に、前記辞書
検索手段により前記電子化辞書に対して検索を行い、前
記表示/出力手段により単語とその内容の組を表示ある
いは出力することを特徴とする請求項5記載の辞書引き
装置。
6. A word dividing means for dividing a word of an input document and giving an original form of a utilized word, and a word mark recognizing means for recognizing a position of a word mark figure from image data obtained by said image reading means, A marked word recognition means for detecting a marked word in the word string obtained by the word dividing means from the position of the word mark figure recognized by the word mark recognition means, and the marked word recognition means 6. The word recognized by the above is searched for in the electronic dictionary by the dictionary searching means, and the set of the word and its contents is displayed or output by the display / output means. The dictionary lookup device described.
【請求項7】 表示あるいは出力する対象文字列とその
内容の組に、入力文書における文字列の位置情報を付加
して表示あるいは出力することを特徴とする請求項1〜
6いずれか1項に記載の辞書引き装置。
7. The character string position information in the input document is added to the set of the target character string to be displayed or output and its contents, and the character string position information is displayed or output.
6. The dictionary lookup device according to any one of 6 above.
【請求項8】 入力文書における対象文字列に、表示あ
るいは出力における対象文字列とその内容の組の位置情
報を付加した入力文書を表示あるいは出力することを特
徴とする請求項1〜6いずれか1項に記載の辞書引き装
置。
8. The input document in which position information of a target character string in display or output and its content is added to the target character string in the input document is displayed or output. The dictionary lookup device according to item 1.
【請求項9】 前記請求項1〜8いずれか1項に記載の
辞書引き装置を備えたことを特徴とする文書処理装置。
9. A document processing device comprising the dictionary lookup device according to claim 1.
【請求項10】 前記請求項4〜8のいずれか1項に記
載の辞書引き装置を備えたことを特徴とするディジタル
複写装置。
10. A digital copying apparatus comprising the dictionary look-up device according to any one of claims 4 to 8.
JP4323633A 1992-11-09 1992-11-09 Dictionary consultant device, document processor, and digital copying machine Pending JPH06149881A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4323633A JPH06149881A (en) 1992-11-09 1992-11-09 Dictionary consultant device, document processor, and digital copying machine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4323633A JPH06149881A (en) 1992-11-09 1992-11-09 Dictionary consultant device, document processor, and digital copying machine

Publications (1)

Publication Number Publication Date
JPH06149881A true JPH06149881A (en) 1994-05-31

Family

ID=18156907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4323633A Pending JPH06149881A (en) 1992-11-09 1992-11-09 Dictionary consultant device, document processor, and digital copying machine

Country Status (1)

Country Link
JP (1) JPH06149881A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006190060A (en) * 2005-01-06 2006-07-20 Kyocera Mita Corp Database retieval method, database retieval program, and original processor
JP2006202068A (en) * 2005-01-21 2006-08-03 Hitachi Ltd Word recognition device and method
JP2012221367A (en) * 2011-04-12 2012-11-12 Konica Minolta Business Technologies Inc Display unit and display control program
KR101626500B1 (en) * 2015-02-09 2016-06-01 동의대학교 산학협력단 System and method for ordering word based on o c r character recognition

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6188365A (en) * 1984-10-05 1986-05-06 Matsushita Electric Ind Co Ltd Interpreter
JPH04123263A (en) * 1990-09-14 1992-04-23 Nippon Telegr & Teleph Corp <Ntt> Device for supporting reading/understanding of japanese sentence
JPH04267475A (en) * 1991-02-21 1992-09-24 Canon Inc Electronic dictionary device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6188365A (en) * 1984-10-05 1986-05-06 Matsushita Electric Ind Co Ltd Interpreter
JPH04123263A (en) * 1990-09-14 1992-04-23 Nippon Telegr & Teleph Corp <Ntt> Device for supporting reading/understanding of japanese sentence
JPH04267475A (en) * 1991-02-21 1992-09-24 Canon Inc Electronic dictionary device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006190060A (en) * 2005-01-06 2006-07-20 Kyocera Mita Corp Database retieval method, database retieval program, and original processor
JP2006202068A (en) * 2005-01-21 2006-08-03 Hitachi Ltd Word recognition device and method
JP2012221367A (en) * 2011-04-12 2012-11-12 Konica Minolta Business Technologies Inc Display unit and display control program
KR101626500B1 (en) * 2015-02-09 2016-06-01 동의대학교 산학협력단 System and method for ordering word based on o c r character recognition

Similar Documents

Publication Publication Date Title
JP4118349B2 (en) Document selection method and document server
JP3289968B2 (en) Apparatus and method for electronic document processing
JP3356536B2 (en) Machine translation equipment
US7712028B2 (en) Using annotations for summarizing a document image and itemizing the summary based on similar annotations
US7668814B2 (en) Document management system
JPH10320525A (en) Filing/retrieval device and filing/retrieval method
US5890182A (en) Sentence processing method and apparatus
US5890183A (en) Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JPH05158401A (en) Document fast reading support/display system and document processor and document retrieving device
EP1304625B1 (en) Method and apparatus for forward annotating documents and for generating a summary from a document image
JPH06149881A (en) Dictionary consultant device, document processor, and digital copying machine
JP3727995B2 (en) Document processing method and apparatus
JP3841318B2 (en) Icon generation method, document search method, and document server
JPH0883280A (en) Document processor
JPH08153110A (en) Device and method for filing document
JP2928515B2 (en) Translated word output device
JPH07160724A (en) Document retrieval device
JPH0944521A (en) Index generating device and document retrieval device
JP2737662B2 (en) Foreign language keyword document search processing device
JPH06266753A (en) Word processor
JP3206600B2 (en) Document generation device
JP4992210B2 (en) Translation device
JPH04174069A (en) Language understanding assisting device
JPH07182344A (en) Machine translation system
JPH06266765A (en) Sentence retrieving device