JPH03273361A - 電子辞書 - Google Patents

電子辞書

Info

Publication number
JPH03273361A
JPH03273361A JP2075248A JP7524890A JPH03273361A JP H03273361 A JPH03273361 A JP H03273361A JP 2075248 A JP2075248 A JP 2075248A JP 7524890 A JP7524890 A JP 7524890A JP H03273361 A JPH03273361 A JP H03273361A
Authority
JP
Japan
Prior art keywords
word
symbol
dictionary
character
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2075248A
Other languages
English (en)
Inventor
Yoshimi Yamada
義美 山田
Hideo Tanimoto
谷本 英雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2075248A priority Critical patent/JPH03273361A/ja
Publication of JPH03273361A publication Critical patent/JPH03273361A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、光学式読取装置で読取った文字で構成される
単語に基づき、この単語に対応する他の情報(例えば、
訳語)を検索して出力する電子辞書に関し、特に検索対
象となる単語が記号を含む場合の記号処理機能に関する
〔従来の技術〕
第2図は従来の電子辞書を示すブロック図である。
同図において、原稿P上には読取り対象である単語を構
成する文字の他に記号(例えば、「、」、[;J、「?
コ、 r ’J 、 [−J等)が含まれているのが一
般的である。従来の電子辞書は、まずこうした原稿P上
の単語を構成する文字や記号を光学式読取部11で読取
る。この読取部11から出力されたアナログ信号は、A
/D変換部12においてデジタル信号に変換され出力さ
れる。このデジタル信号は、前処理部12Aで文字、記
号切出しなどの前処理が行なわれ、文字や記号のパター
ンとして文字記号認識部13に送られる。この文字や記
号のパターンは、文字記号認識部13で予め認識辞書1
4に記憶されている標準パターンと照合されて認識され
る。
そして、この認識動作を繰返すことによって認識された
文字および記号の列は単語切出部15においてスペース
ごとに区切られ、被検索用の原単語として切出される。
この切出された原単語は、単語検索部16へ送出される
。単語検索部16は単語辞書17を検索することにより
、送られてきた原単語に対応する翻訳情報を得る。そし
て、原単語と翻訳情報が表示部18に表示される。
〔発明が解決しようとする課題〕
しかしながら、従来例には次の様な問題があった。
上記したように、単語切出部15においては認識された
文字及び記号の列をスペースごとに区切り、被検索用の
原単語として切出している。即ち、文字の列によって構
成されるべき単語に記号が含まれることがある。(例え
ば、文字列の最初に「゛」、「(」等が付加されたり、
文字列の最後にピリオド「、」、セミコロン「;J1ク
エスチョンマークV?J等が付加されたり、又、ハイフ
ン「−」によって本来二つの単語となるべき文字列が一
つに切出される等) このような記号を含む原単語は、単語検索部6において
検索不可能であるため、単語検索率、例えば翻訳率が低
下するという問題があった。
そこで本発明は、上記したような従来技術の課題を解決
するためになされたもので、その目的とするところは、
必要に応じて記号を含む単語の記号部分のみ削除または
再付加する等の処理を施して、単語検索可能な被検索用
の原単語に修正し、単語検索率例えば翻訳率(対応する
情報の出力率)の高い電子辞書を提供することである。
〔課題を解決するための手段〕
本発明の電子辞書は、原稿上の文字及び記号を光学的に
読取り、認識する読取認識手段と、上記読取認識手段に
よって認識した文字及び記号の列を単語に切出し、かつ
切出された単語の一部である記号の有無を判定する単語
切出し手段と、単語に対応する情報を予め記憶した単語
辞書と、上記単語切出手段からの単語を受けて単語に含
まれる記号を処理する記号処理手段と、上記記号処理手
段で記号処理を受けた単語もしくは上記単語切出手段か
らの単語を受けて、上記単語辞書を参照して対応する情
報を出力する単語検索手段と、上記単語検索手段から受
けた情報を表示する表示手段とを有することを特徴とす
る。
〔作用〕
本発明においては、単語切出手段において記号を含む単
語が切出された場合には、この切出された単語は記号処
理手段に送られる。記号処理手段では、送られてきた単
語中の記号を適当に削除、付加する等の処理を施すこと
によって検索可能な被検索用の原単語として単語検索部
に送出する機能を有する。よって検索不可能となること
が少なくなり、単語検索率、即ち翻訳等の情報表示率か
向上する。
〔実施例〕
以下、本考案の一実施例を図面を参照して説明する。
第1図は本実施例の電子辞書の一例を示すブロック図で
ある。
本実施例の電子辞書は、原稿P上の英単語を光学的に読
取って、対応する訳語情報を原語の英単語とともに表示
するものである。
第1図において、1は光学式読取部で、文字及び記号の
列を読取り、アナログ電気信号を発生させる。
2はA/D変換部で、読取部1からのアナログ信号をデ
ィジタル信号に変換する。
2Aは前処理部で、A/D変換部2からの信号を受けて
前処理をし、文字や記号のパターンを発生する。
3は認識辞書で、文字や記号の標準パターンを記憶して
いる。
4は文字記号認識部で、前処理部2Aから出力された文
字や記号のパターンを受け、認識辞書3を参照して、公
知のパターンマツチング法等によって文字および記号の
認識を行なう。このように文字記号認識部4は文字及び
記号の認識を次々に行なって、文字及び記号を表すコー
ドの列を出力する。
5は単語切出部で、文字記号認識部4から出力された文
字および記号の列をスペースごとに区切り、単語として
切出して順次出力する。この際、単語切出部5では切出
した単語に記号を含まない場合にはその単語をデータ線
Aに出力し、記号を含む場合にはその単語をデータ線B
に出力する。
6は記号処理部で、単語切出部5からデータ線Bに出力
された単語中の記号の削除、再添加等の処理を行ない、
検索可能な単語になるように処理し出力する。
7は単語辞書で、検索可能に配列された多数の被検索用
の原単語に対応して、その訳語情報を記憶したものであ
る。従って、原単語が入力されると、これに対応する訳
語情報を出力する。
8は単語検索部で、単語切出部5から出力された記号を
含まない原単語、または記号処理部6から出力された記
号処理済の原単語を受け、単語辞書7を検索してその訳
語情報を出力する。
9は表示部で、単語検索部8から出力された訳語情報を
受けて表示する。
上記の電子辞書の操作及び動作は次のとおりである。
第1図において、まず光学式読取部1で原稿P上の英単
語を構成する文字および記号の列が読取られ、読取られ
た文字および記号の列に対応するアナログ信号が発生さ
れる。この信号はA/D変換部2、前処理部2Aを経て
、文字パターン、記号パターンを表わすデータとなり、
文字記号認識部4で認識辞書3の標準パターンと比較さ
れて、それぞれ文字、記号として認識される。文字、記
号の認識は読取り対象部分の全てについて次々に行なわ
れ、文字および記号の列は、文字記号認識部4から単語
切出部5に送られる。単語切出部5に入力された文字と
記号の列はスペースことに区切られ、単語に変換される
。この際に、変換された単語が記号を含まない場合は、
その単語かデータ線Aを介して単語検索部8に送られる
。単語検索部8では単語辞書7か検索され、対応する訳
語情報が見つけ出されて出力され、表示部9に原単語と
ともに表示される。
次に単語切出部5において切出された原単語が記号を含
む場合には、その単語がデータ線Bを介して記号処理部
6に送られる。以下、この場合の動作について説明する
ここで、第3図は第1図の単語切出部5で記号を含む単
語が切出されてデータ線Bに出力された際の記号処理部
6、単語辞書7、単語検索部8、及び表示部9の動作を
示すフローチャートである。
同図に示されるように、記号処理部6に送られてきた記
号を含む原単語は、まず原車語中の記号のうち、原単語
の初めや後にくる記号としてピリオド[、J、カンマ「
1J、「゛」、アポストロフィ「′」、コロン「:」、
セミコロン「;」、カッコ「(J、FB、クエスチョン
マークr?J、エクスラメーンヨンマーク「!」があれ
ば、これらが原単語より削除された状態のものが単語検
索部8に送られる。そして単語検索部8において単語辞
書7が検索される(S102)。このとき対応する訳語
情報の有無か調へられ(5103)、訳語情報があれば
この訳語情報は出力され(S120)、表示部9に原単
語とともに表示される(S 121) S103において訳語情報がなければ、記号処理部6に
おいて原単語のスラッシュ「/」の有無が調べられ(S
 104)、[′/Jがあれば(例えば、rday/l
imeJ等)、「/」の前までの文字列か原単語と見な
されて単語検索される(S105)。そして原単語に対
応する訳語情報の有無が調べられる(S 106)。
5106において訳語情報がない場合、及び5104に
おいて「/」がない場合は、ふたたび原単語の「−」の
有無が調へられる(S107)。
そしてr−Jがある場合(例えば、rself−ser
viceJ)は、「−」付加のまま単語辞書7が検索さ
れ(8108)、訳語情報の有無が調べられる(S10
9)。ここでrself−serviceJは単語辞書
7に記録されているため、訳語情報が出力され(S12
0)、表示部9においで表示される(S 121)。
しかし、5109において「−」付加の原単語の訳語情
報がない場合は(例えば、「one−timeJ )、
r−Jの前までの文字列が原単語とみなされて単語辞書
7の検索によって(S 110)、訳語情報の有無か調
べられる(S 111)。
そして、5illにおいて対応する訳語情報がない場合
、及び5107において「−」がなかった場合は、原単
語中の「′」の有無が調べられる(S112)。原単語
に「′」があれば(例えば、ro’  clockJ)
、「゛」付加のまま原単語を単語辞書7によって検索し
く5113)、訳語情報があるか調べられる(S 11
4)。
そして、5114において対応する訳語情報がない場合
(例えば「user′ s」)は、「′」の前まで(r
userJ)が原単語と見なされて単語辞書7か検索さ
れ(S115)、検索により訳語情報の有無が調べられ
(S116)、訳語情報があれば出力する(S120)
また、8116において訳語情報かない場合、及び51
12において「°」が原単語になかった場合は、記号処
理部6において再び「、」が原単語にあるか調べられる
(S 117)。5117において原単語に「、」があ
れば(例えば、rMr。
」)、「、Jを添加したまま単語辞書7が検索され(5
118)、訳語情報の有無が調べられ(S119L訳語
情報があれば出力され(S120)、訳語情報が表示さ
れる(S121)。又、5117において置」が原単語
になければ、「訳語情報無し」が表示部9に表示される
(S 122)。
以上の様に記号処理部9において処理された原単語は、
単語検索部6において単語辞書7を検索することによっ
て、対応する訳語情報の有無が調べられ、対応する訳語
情報がなければ、記号処理部9においてふたたび記号が
処理されて、単語検索部6へ送出される。そして、対応
する訳語情報があれば、原単語とともに表示部8に表示
される。
〔発明の効果〕
以上説明し、たように本発明によれば、原稿より読取ら
れ、単語切出手段でスペース毎に切出された単語の文字
列に記号か含まれていた場合、単語辞書を参照して単語
検索がなされる前に、この記号の処理を行ない、検索可
能な原中語に変換する。
従って、従来のように記号か含まれてるために単語辞書
で検索されないということが少なくなる。
よって検索率か向上するという効果がある。
【図面の簡単な説明】
第1図は本実施例による電子辞書のブロック図、第2図
は従来の電子辞書のブロック図、第3図は第1図の単語
切出部において、原単語がB方向に出力された場合の記
号処理部、単語検索部、単語辞書、表示部の動作を示す
フローチャートである。 1・・・・・・光学式読取部、 2・・・・・・A/D変換部、 2A・・・・・・前処理部、 3・・・・・・認識辞書、 4・・・・・・文字記号認識部、 5・・・・・・単語切出部、 6・・・・・・記号処理部、 7・・・・・・単語辞書、 8・・・・・・単語検索部、 9・・・・・・表示部。

Claims (1)

  1. 【特許請求の範囲】 原稿上の文字及び記号を光学的に読取り、認識する読取
    認識手段と、 上記読取認識手段によって認識した文字及び記号の列を
    単語に切出し、かつ切出された単語中の記号の有無を判
    定する単語切出し手段と、 単語に対応する情報を予め記憶した単語辞書と、上記単
    語切出手段からの単語を受けて単語中の記号を処理する
    記号処理手段と、 上記記号処理手段で記号処理を受けた単語もしくは上記
    単語切出手段からの単語を受けて、上記単語辞書を参照
    して対応する情報を出力する単語検索手段と、 上記単語検索手段から受けた情報を表示する表示手段と
    を有することを特徴とする電子辞書。
JP2075248A 1990-03-22 1990-03-22 電子辞書 Pending JPH03273361A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2075248A JPH03273361A (ja) 1990-03-22 1990-03-22 電子辞書

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2075248A JPH03273361A (ja) 1990-03-22 1990-03-22 電子辞書

Publications (1)

Publication Number Publication Date
JPH03273361A true JPH03273361A (ja) 1991-12-04

Family

ID=13570733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2075248A Pending JPH03273361A (ja) 1990-03-22 1990-03-22 電子辞書

Country Status (1)

Country Link
JP (1) JPH03273361A (ja)

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
JP3427692B2 (ja) 文字認識方法および文字認識装置
JP3292388B2 (ja) 文書画像の復号なしに文書を要約するための方法と装置
JP2726568B2 (ja) 文字認識方法及び装置
JP2005135041A (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
JPH03273361A (ja) 電子辞書
JPH06215184A (ja) 抽出領域のラベリング装置
JP2000029983A (ja) 文書読取装置
JP2559356B2 (ja) 文書画像処理方法
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JPH0528324A (ja) 英文字認識装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JP2746345B2 (ja) 文字認識の後処理方法
JP2939945B2 (ja) ローマ字住所認識装置
JPH087046A (ja) 文書認識装置
JPH05108703A (ja) 機械翻訳機
JP2995783B2 (ja) カタカナ語の訳語推定装置
JP3310063B2 (ja) 文書処理装置
JPH05210635A (ja) 入力装置
JP2995825B2 (ja) 日本語文字認識装置
JPH0528323A (ja) 文字認識装置
JPH07120396B2 (ja) 文書読み取り装置
JPS63188284A (ja) 文字読取装置
JPS6318483A (ja) 光学的情報入力装置用文字認識方法
JPS61229177A (ja) 濁点・半濁点付き文字の認識方式