JPS6282466A - 辞書検索装置 - Google Patents
辞書検索装置Info
- Publication number
- JPS6282466A JPS6282466A JP60223114A JP22311485A JPS6282466A JP S6282466 A JPS6282466 A JP S6282466A JP 60223114 A JP60223114 A JP 60223114A JP 22311485 A JP22311485 A JP 22311485A JP S6282466 A JPS6282466 A JP S6282466A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- word
- dictionary
- letters
- input character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は機械翻訳システム等に用いられる辞書検索装置
に関する。
に関する。
英日機械翻訳システム等では、入力された英文1 を構
成するIIwIに対応する日本in l uを単語辞書
を検索して求める処理が行われる。具体的には、アルフ
ァベット文字列で示される英単開に対応する日本鮪の1
1冊を」二足アルファベット文字列を見出し開として辞
書検索し、これを見出すことが行われる。
成するIIwIに対応する日本in l uを単語辞書
を検索して求める処理が行われる。具体的には、アルフ
ァベット文字列で示される英単開に対応する日本鮪の1
1冊を」二足アルファベット文字列を見出し開として辞
書検索し、これを見出すことが行われる。
ところが英文は、そのタイトル等は全て大文字で表記さ
れることが多く、また本文中の単語は小文字で示される
ことが多い。更にはその本文であっても、文頭中♂Hの
先頭文字は大文字で表記されることが多く、その他にも
多くの例4がある。
れることが多く、また本文中の単語は小文字で示される
ことが多い。更にはその本文であっても、文頭中♂Hの
先頭文字は大文字で表記されることが多く、その他にも
多くの例4がある。
このような種々の表記形態をとる英甲浦の全てに対する
辞書検索を常に1しく行わせる為には、これらの表記形
態の全てを見出し8nとして申開辞自記憶手段にa録し
てJ3 <必要がある。この為(4二は膨大な辞綱配憶
容醋を必要どし、実用性に乏【)い。
辞書検索を常に1しく行わせる為には、これらの表記形
態の全てを見出し8nとして申開辞自記憶手段にa録し
てJ3 <必要がある。この為(4二は膨大な辞綱配憶
容醋を必要どし、実用性に乏【)い。
またその辞書検索に多大な時間を必要どすることになる
。
。
本発明はこのような事情を考慮してなさねたもので、そ
の目的とするところは、必要な静態容―の削減を図るこ
とができ、しかも大文字と小文字とが混在した文字列で
示される申開についても効果的に辞書検索し、その該当
単語を見出4ことのできる静間検索装置を提供Jること
にある。
の目的とするところは、必要な静態容―の削減を図るこ
とができ、しかも大文字と小文字とが混在した文字列で
示される申開についても効果的に辞書検索し、その該当
単語を見出4ことのできる静間検索装置を提供Jること
にある。
〔発明の概要〕
本発明は、入力文字列についてll:Fi辞真南記憶手
段検索しても該当中油が見出されなかったとき、上記入
力文字列に大文字が含まれるか否かを判定し、大文字が
含まれるときには、イの大文字の全て、或いはその先頭
の1文字を除く残りの文字を小文字!J変換した文字列
に、にて前記単飴辞書記憶手段を検索°するようにした
ものである。
段検索しても該当中油が見出されなかったとき、上記入
力文字列に大文字が含まれるか否かを判定し、大文字が
含まれるときには、イの大文字の全て、或いはその先頭
の1文字を除く残りの文字を小文字!J変換した文字列
に、にて前記単飴辞書記憶手段を検索°するようにした
ものである。
(発明の効宋)
かくして本発明によれば、入力文字列に大文字が含まれ
、この結果辞書検索が失敗したときには、その大文字を
小文字に変換した文字列にて辞書検索が行われるので、
中38辞古記憶手段を不本意に人容醋化づることなしに
入力単語に該当するψ開を見出づことが可能となる。
、この結果辞書検索が失敗したときには、その大文字を
小文字に変換した文字列にて辞書検索が行われるので、
中38辞古記憶手段を不本意に人容醋化づることなしに
入力単語に該当するψ開を見出づことが可能となる。
しかも、タイミールや文頭等の大文字を含む単語につい
ても、これを正しく、bつ効果的に辞書検索することが
可能とイTる等の実用ト多大なる効梁が奏せられる。
ても、これを正しく、bつ効果的に辞書検索することが
可能とイTる等の実用ト多大なる効梁が奏せられる。
以下、図面を参照して本発明の一実施例につき説明−す
る。
る。
第1図は実施例装置の概略構成図である。
入力部1は辞書検索に供せられる単語の文字列、例えば
アルノアベット文字列を入クツするものである。この入
力部1から与えられた文字列は、単語辞書検索部2に転
送され、入力文字列バッファに格納される等して甲88
辞書配憶部3を用いた単語辞書検索に供せられる。
アルノアベット文字列を入クツするものである。この入
力部1から与えられた文字列は、単語辞書検索部2に転
送され、入力文字列バッファに格納される等して甲88
辞書配憶部3を用いた単語辞書検索に供せられる。
申開故山記憶部3は、アルファベット文字列を見出しt
llどして、その文字列が示す単語に該当する日本δR
* 1iFiの情報を格納して構成される。
llどして、その文字列が示す単語に該当する日本δR
* 1iFiの情報を格納して構成される。
単語辞書検索部2は、このような単語辞書記憶部3を順
に検索し、入力文字列に該当する単語が見出されたとき
、その単語情報を−V記単語辞書記憶部3から読出して
、これを出力部4を介して出力する。
に検索し、入力文字列に該当する単語が見出されたとき
、その単語情報を−V記単語辞書記憶部3から読出して
、これを出力部4を介して出力する。
しかして#41語辞書検索部2は、入力文字列に該当す
る単語を前記申開辞書から見出されなかったとき、つま
り辞書検索に失敗したとき、前記文字列バッファに格納
した入力文字列を大文字小文字判定部5に供給している
。この大文字小文字判定部5では、入力文字列中に大文
字が含まれているか否かを判定するもので、その入力文
字列が全て小文字で構成され−Cいる場合、その判定結
果を前記単語辞書検索部2に返送している。
る単語を前記申開辞書から見出されなかったとき、つま
り辞書検索に失敗したとき、前記文字列バッファに格納
した入力文字列を大文字小文字判定部5に供給している
。この大文字小文字判定部5では、入力文字列中に大文
字が含まれているか否かを判定するもので、その入力文
字列が全て小文字で構成され−Cいる場合、その判定結
果を前記単語辞書検索部2に返送している。
この結果、甲3R辞書検索部2は、入力文字列に対する
辞書検索が出来ない旨を前記出力部4を介してメツセー
ジ出力することになる。
辞書検索が出来ない旨を前記出力部4を介してメツセー
ジ出力することになる。
一方、大文字小文字判定部5にて入力文字列に大文字が
含まれていると判定された場合、その判定情報は入力文
字列中の大文字検出された文字位置の情報、および入力
文字列の情報と共に、大文字小文字変換部6に与えてい
る。
含まれていると判定された場合、その判定情報は入力文
字列中の大文字検出された文字位置の情報、および入力
文字列の情報と共に、大文字小文字変換部6に与えてい
る。
この大文字小文字変換部6では、入力文字列の全てが大
文字で構成される場合、先ずその先頭の1文字を除く残
りの文字をそれぞれ小文字に変換し、その文字列を単語
辞書検索部2に与えている。
文字で構成される場合、先ずその先頭の1文字を除く残
りの文字をそれぞれ小文字に変換し、その文字列を単語
辞書検索部2に与えている。
またその入力文字列の全てを小文字に変換して前記単語
辞書検索部2に与えている。
辞書検索部2に与えている。
141開辞書検索部2では、このようにして小文字変換
された文字列に対し、前記半開辞書記憶部3を用いて同
様に辞書検索し、該当する単語を見出したとき、その*
a情報を読出して出力部4から出力している。またこの
辞書検索においても該当する単8Rが見出されなかった
場合には、辞書検索ができなかった旨をメツセージ出力
することになる。
された文字列に対し、前記半開辞書記憶部3を用いて同
様に辞書検索し、該当する単語を見出したとき、その*
a情報を読出して出力部4から出力している。またこの
辞書検索においても該当する単8Rが見出されなかった
場合には、辞書検索ができなかった旨をメツセージ出力
することになる。
第2図はこのように構成された辞書検索装置における辞
書検索処理の流れの一例を示すものである。
書検索処理の流れの一例を示すものである。
即ち、辞書検索すべき入力文字列が与えられると、先ず
その入力文字列についての辞書検索が行われる(ステッ
プa)。そして該当単語が存在lノだか否か(辞書検索
に成功したか否か)を判定し、辞書検索に成功した場合
にはその辞書検索結果を出力する(ステップ1)。この
辞書検索結果の出力は、該5単8Hの情報を単語辞書記
憶部3から続出し、これを出力することによって達せら
れる。
その入力文字列についての辞書検索が行われる(ステッ
プa)。そして該当単語が存在lノだか否か(辞書検索
に成功したか否か)を判定し、辞書検索に成功した場合
にはその辞書検索結果を出力する(ステップ1)。この
辞書検索結果の出力は、該5単8Hの情報を単語辞書記
憶部3から続出し、これを出力することによって達せら
れる。
一方、入力文字列に対する辞書検索に失敗【ノた場合、
次にその入力文字列中に大文字が含まれるか否かが判定
される(ステップC)。そして人文l 字が
含まれていないと判定された場合には、141 語辞書
記憶部3に該当する単語情報が登録されていない旨を辞
書検索結果として出力する(ステップ1)。また入力文
字列中に大文字が含まれている場合には、次に入力文字
列の全てが大文字であるか否かが判定される(ステップ
d)。
次にその入力文字列中に大文字が含まれるか否かが判定
される(ステップC)。そして人文l 字が
含まれていないと判定された場合には、141 語辞書
記憶部3に該当する単語情報が登録されていない旨を辞
書検索結果として出力する(ステップ1)。また入力文
字列中に大文字が含まれている場合には、次に入力文字
列の全てが大文字であるか否かが判定される(ステップ
d)。
そして入力文字列の全てが大文字である場合、先ずその
先頭文字以外を小文字に変換する(ステップe)。この
小文字変換された文字列に対して辞書検索を行い、その
辞書検索結果をメモリにスタックする(ステップf)。
先頭文字以外を小文字に変換する(ステップe)。この
小文字変換された文字列に対して辞書検索を行い、その
辞書検索結果をメモリにスタックする(ステップf)。
その後、前記入力文字列の全てを小文字に変換しくステ
ップCJ)、その文字列について同様に辞書検索する(
ステップh)、。
ップCJ)、その文字列について同様に辞書検索する(
ステップh)、。
尚、前記入力文字列の全てが大文字であるか否かの判定
において、その全てが大文字でないと判定された場合に
は、上記ステップ0で示される処理から行う。
において、その全てが大文字でないと判定された場合に
は、上記ステップ0で示される処理から行う。
このようにして入力文字列中の大文字を小文字に変換し
た文字列についても辞書検索した後、その辞書検索結果
を出力する(ステップi)。
た文字列についても辞書検索した後、その辞書検索結果
を出力する(ステップi)。
具体的には、例えばrMAYJなる入力文字列が与えら
れ、単語辞書記憶部3にはrMayJrmayJなる単
BFi情報しか格納されでいないとする。
れ、単語辞書記憶部3にはrMayJrmayJなる単
BFi情報しか格納されでいないとする。
この場合には、入力文字列r M A Y 、1に対づ
る辞書検索が失敗し、その文字列が大文字を含むか否か
が判定されることになる。そしてその全てが大文字であ
ることから、先ず先頭文字を除く文字に対する小文字変
換が行われ、rMayJなる文字列が得られる。
る辞書検索が失敗し、その文字列が大文字を含むか否か
が判定されることになる。そしてその全てが大文字であ
ることから、先ず先頭文字を除く文字に対する小文字変
換が行われ、rMayJなる文字列が得られる。
この文字列r M a y Jについて辞書検索するこ
とにより、単語辞書記憶部3から rvay;Rn1 なる単語情報が得られることになる。
とにより、単語辞書記憶部3から rvay;Rn1 なる単語情報が得られることになる。
その後、入力文字列の全てを小文字変換した文字列rm
ayjが生成され、この文字列について同様に辞書検索
が行われる。この結果、甲1iFi辞書配憶部3から jmay:〜てもよいj なる単語情報が辞書検索結束として求められることにな
る。
ayjが生成され、この文字列について同様に辞書検索
が行われる。この結果、甲1iFi辞書配憶部3から jmay:〜てもよいj なる単語情報が辞書検索結束として求められることにな
る。
このように本装置によれば、入力文字列に対する単語辞
書検索が、■入力文字列そのまま、■先頭文字を除く残
りの文字を小文字変換した文字列、■全ての文字列を小
文字変換した文字列、と云う優先順位で順に単語辞書検
索が行われる。
書検索が、■入力文字列そのまま、■先頭文字を除く残
りの文字を小文字変換した文字列、■全ての文字列を小
文字変換した文字列、と云う優先順位で順に単語辞書検
索が行われる。
これ故、小文字だけの文字列、大文字と小文字とが混在
する文字列、大文字だけからなる文字列と云うように、
同じ単語情報に対して重複して単語辞書を登録しておく
必要がなくなり、その無駄を抑えて単語辞書記憶部の必
要容−を最小限に少なくすることが可能となる。
する文字列、大文字だけからなる文字列と云うように、
同じ単語情報に対して重複して単語辞書を登録しておく
必要がなくなり、その無駄を抑えて単語辞書記憶部の必
要容−を最小限に少なくすることが可能となる。
またこのように辞書内容が整理されているので、その辞
書検索の所要時間の大幅な短縮化を図ることが可能とな
る。また上述した如き優先順位で辞書検索が行われるの
で、その辞書検索効率の向上を図り、大文字小文字が混
在する種々の表現形態の申開を正しく辞書検索すること
ができる等の効果も奏せられる。
書検索の所要時間の大幅な短縮化を図ることが可能とな
る。また上述した如き優先順位で辞書検索が行われるの
で、その辞書検索効率の向上を図り、大文字小文字が混
在する種々の表現形態の申開を正しく辞書検索すること
ができる等の効果も奏せられる。
尚、本発明は上述した実施例に限定されるものではない
。例えば先頭文字を除く残りの文字を小文字変換した文
字列にて辞書検索が成功した場合、全ての大文字を小文
字変換した文字IIにJ、る辞書検索を行わないように
することもできる。この場合には、前記第2図における
ステップfの静画検索処理の後、その辞書検索の成功を
判定する処理を設け、その判定結束に従って次のステッ
プ0に進むか、或いは結果出力のステップ1に進むかを
制鄭するようにすれば良い。
。例えば先頭文字を除く残りの文字を小文字変換した文
字列にて辞書検索が成功した場合、全ての大文字を小文
字変換した文字IIにJ、る辞書検索を行わないように
することもできる。この場合には、前記第2図における
ステップfの静画検索処理の後、その辞書検索の成功を
判定する処理を設け、その判定結束に従って次のステッ
プ0に進むか、或いは結果出力のステップ1に進むかを
制鄭するようにすれば良い。
またここでは英11問に対づる日本賄申開の辞内検索を
例に説明したが、アルファベットで入力文字列が与えら
れる他の古曲における11語辞内検索についても同様に
適用することができる。その他、本発明はその要旨を逸
脱しない範囲で種々変形()て実施することができる。
例に説明したが、アルファベットで入力文字列が与えら
れる他の古曲における11語辞内検索についても同様に
適用することができる。その他、本発明はその要旨を逸
脱しない範囲で種々変形()て実施することができる。
第1図は本発明の一実施例装置の概略構成図、第2図は
実施例装置における静画検索処理の流れを示す図である
。 1・・・入力部、2・・・辞書検索部、3・・・中58
辞肉記憶部、4・・・出力部、5・・・大文字小文字判
定部、6・・・大文字小文字変換部。 出願人代理人 弁理士 鈴汗武彦 第1図 第2 図
実施例装置における静画検索処理の流れを示す図である
。 1・・・入力部、2・・・辞書検索部、3・・・中58
辞肉記憶部、4・・・出力部、5・・・大文字小文字判
定部、6・・・大文字小文字変換部。 出願人代理人 弁理士 鈴汗武彦 第1図 第2 図
Claims (3)
- (1)単語辞書記憶手段に記憶された単語情報を入力文
字列に従って検索し、入力文字列に該当する単語情報を
上記単語辞書記憶手段から読出す辞書検索装置において
、 上記辞書検索において該当単語情報が見出されず、且つ
入力文字列に大文字が含まれるとき、入力文字列中の大
文字を小文字に変換した文字列にて前記単語辞書記憶手
段を検索してなることを特徴とする辞書検索装置。 - (2)入力文字列中の大文字を小文字に変換して単語辞
書記憶手段を検索する手段は、入力文字列の全てが大文
字で構成されるとき、先頭の1文字だけを残し、他の残
りの文字をそれぞれ小文字に変換した文字列にて単語辞
書記憶手段を検索し、その後、全ての大文字を小文字に
変換した文字列にて前記単語辞書記憶手段を検索するも
のである特許請求の範囲第1項記載の辞書検索装置。 - (3)大文字の小文字への変換は、外部制御信号により
制御されるものである特許請求の範囲第1項記載の辞書
検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60223114A JPS6282466A (ja) | 1985-10-07 | 1985-10-07 | 辞書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60223114A JPS6282466A (ja) | 1985-10-07 | 1985-10-07 | 辞書検索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6282466A true JPS6282466A (ja) | 1987-04-15 |
Family
ID=16793040
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60223114A Pending JPS6282466A (ja) | 1985-10-07 | 1985-10-07 | 辞書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6282466A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01166258A (ja) * | 1987-12-23 | 1989-06-30 | Sharp Corp | 機械翻訳装置 |
JPH0528142A (ja) * | 1991-07-18 | 1993-02-05 | Nec Corp | 文章検査装置 |
EP0805404A1 (en) * | 1996-05-02 | 1997-11-05 | Microsoft Corporation | Method and system for lexical processing of uppercase and unaccented text |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS562063A (en) * | 1979-06-19 | 1981-01-10 | Sharp Corp | Information retrieval system |
JPS5769364A (en) * | 1980-10-13 | 1982-04-28 | Canon Inc | Electronic device |
-
1985
- 1985-10-07 JP JP60223114A patent/JPS6282466A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS562063A (en) * | 1979-06-19 | 1981-01-10 | Sharp Corp | Information retrieval system |
JPS5769364A (en) * | 1980-10-13 | 1982-04-28 | Canon Inc | Electronic device |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01166258A (ja) * | 1987-12-23 | 1989-06-30 | Sharp Corp | 機械翻訳装置 |
JPH0528142A (ja) * | 1991-07-18 | 1993-02-05 | Nec Corp | 文章検査装置 |
EP0805404A1 (en) * | 1996-05-02 | 1997-11-05 | Microsoft Corporation | Method and system for lexical processing of uppercase and unaccented text |
US5995922A (en) * | 1996-05-02 | 1999-11-30 | Microsoft Corporation | Identifying information related to an input word in an electronic dictionary |
US6651220B1 (en) | 1996-05-02 | 2003-11-18 | Microsoft Corporation | Creating an electronic dictionary using source dictionary entry keys |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Veronis | Morphosyntactic correction in natural language interfaces | |
JPS5918729B2 (ja) | カネ漢字変換装置 | |
JPS589968B2 (ja) | カナ漢字変換装置 | |
JPS6282466A (ja) | 辞書検索装置 | |
JP2771976B2 (ja) | 言語解析装置 | |
JPS58123129A (ja) | 仮名漢字変換装置 | |
JPH0130173B2 (ja) | ||
JPS58123126A (ja) | 辞書検索装置 | |
JP3285149B2 (ja) | 外国語電子辞書検索方法及び装置 | |
Galli et al. | Experimental studies in computer-assisted correction of unorthographic text | |
JPS62144269A (ja) | 情報検索装置 | |
JPS60136865A (ja) | 辞書検索装置 | |
JP3048793B2 (ja) | 文字変換装置 | |
JP2570784B2 (ja) | 文書リーダ後処理装置 | |
JP2641768B2 (ja) | 文章処理装置 | |
JPS59103136A (ja) | カナ漢字変換処理装置 | |
JPH05120325A (ja) | 電子化辞書 | |
JPS61177575A (ja) | 日本語文章作成装置 | |
JPH0695330B2 (ja) | 文書作成装置 | |
JPH01304574A (ja) | 目次索引作成装置 | |
JPH11161296A (ja) | 文書読み上げ装置および方法 | |
JPH0346864B2 (ja) | ||
JPS6217266B2 (ja) | ||
JPS63157266A (ja) | 単語辞書構成方式 | |
JPS60189573A (ja) | 文字変換装置 |