JPS61223979A - 辞書検索装置 - Google Patents
辞書検索装置Info
- Publication number
- JPS61223979A JPS61223979A JP60063457A JP6345785A JPS61223979A JP S61223979 A JPS61223979 A JP S61223979A JP 60063457 A JP60063457 A JP 60063457A JP 6345785 A JP6345785 A JP 6345785A JP S61223979 A JPS61223979 A JP S61223979A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- delimiter
- section
- word
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、例えば自動翻訳処理における複合語に対する
辞書検索を効果的に可能ならしめる辞書検索方式に関す
る。
辞書検索を効果的に可能ならしめる辞書検索方式に関す
る。
近時、文章の自動翻訳(IN械翻訳)処理が注目されて
いる。例えば英語で示される文書を日本語に翻訳処理す
る装置が、提唱されるに至っている。
いる。例えば英語で示される文書を日本語に翻訳処理す
る装置が、提唱されるに至っている。
この場合、一般に英単語を見出し語とし、これに対応す
る日本語の単語を上記英単語に関する情報とした辞書を
用いて入力文字列を検索し、これによって入力文字列を
順次翻訳処理することが行ねれる。
る日本語の単語を上記英単語に関する情報とした辞書を
用いて入力文字列を検索し、これによって入力文字列を
順次翻訳処理することが行ねれる。
ところが辞書検索対象とする文字列の中には多くの複合
語が含まれる。しかもその複合語は、例えば rread only memoryJrread
−only memoryJrread−only−
memory」に代表されるように、個々の単語をハイ
フン「−」によって結合する場合と、結合しない場合と
がある。これ故、これらの複数の表記形態を取る複合語
を確実に辞書検索する為には、その辞書にこれらの全て
を予め登録しておく必要があり、辞書容量の膨大化が否
めなかった。また複合語を形成する個々の単語を辞書登
録していても、複合語であるが故に辞書検索ができない
場合も生じた。
語が含まれる。しかもその複合語は、例えば rread only memoryJrread
−only memoryJrread−only−
memory」に代表されるように、個々の単語をハイ
フン「−」によって結合する場合と、結合しない場合と
がある。これ故、これらの複数の表記形態を取る複合語
を確実に辞書検索する為には、その辞書にこれらの全て
を予め登録しておく必要があり、辞書容量の膨大化が否
めなかった。また複合語を形成する個々の単語を辞書登
録していても、複合語であるが故に辞書検索ができない
場合も生じた。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、辞書容量の膨大化を招来するこ
となく、複合語に対する辞書検索を容易ならしめる辞書
検索装置を提供することにある。
の目的とするところは、辞書容量の膨大化を招来するこ
となく、複合語に対する辞書検索を容易ならしめる辞書
検索装置を提供することにある。
(発明の概要〕
本発明は、熟語の情報を記憶した熟語辞書、または単語
の情報を記憶した単語辞書と、複合語に現われる、例え
ば単語を相互に結合して1つの複合語を形成するハイフ
ンr−J等の特殊文字からなる区切り文字を記憶した区
切り文字辞書とを具備し、入力文字列中に現われる区切
り文字を上記区切り文字辞書を用いて検索し、上記入力
文字列中に前記区切り文字が検出されたとき、検出され
た区切り文字を前記熟語辞書中に現われる区切り文字に
変換した後、該入力文字列を前記熟語辞書を用いて辞書
検索したり、或いは検出された区切り文字の前後で前記
入力文字列を区分した後、区分された文字列毎に前記単
語辞書を用いて辞書検索することを特徴とするものであ
る。
の情報を記憶した単語辞書と、複合語に現われる、例え
ば単語を相互に結合して1つの複合語を形成するハイフ
ンr−J等の特殊文字からなる区切り文字を記憶した区
切り文字辞書とを具備し、入力文字列中に現われる区切
り文字を上記区切り文字辞書を用いて検索し、上記入力
文字列中に前記区切り文字が検出されたとき、検出され
た区切り文字を前記熟語辞書中に現われる区切り文字に
変換した後、該入力文字列を前記熟語辞書を用いて辞書
検索したり、或いは検出された区切り文字の前後で前記
入力文字列を区分した後、区分された文字列毎に前記単
語辞書を用いて辞書検索することを特徴とするものであ
る。
かくして本発明によれば、種々の表記形式の文字列とし
て与えられる複合語を、熟語辞書に登録された複合語の
表記形式に変換して辞書検索し、或いは単語辞書に登録
された単語レベルの文字列に区分して辞書検索するので
、複合語が取り得る種々の表記形式の全てを辞書登録し
ておく必要がなくなる。従って膨大な容量の辞書を準備
する必要がなく、装置構成の簡略化を図ることが可能と
なる。しかも種々の表記形式の複合語を簡易に、且つ効
果的に辞書検索することが可能となる等、実用上多大な
る効果が奏せられる。
て与えられる複合語を、熟語辞書に登録された複合語の
表記形式に変換して辞書検索し、或いは単語辞書に登録
された単語レベルの文字列に区分して辞書検索するので
、複合語が取り得る種々の表記形式の全てを辞書登録し
ておく必要がなくなる。従って膨大な容量の辞書を準備
する必要がなく、装置構成の簡略化を図ることが可能と
なる。しかも種々の表記形式の複合語を簡易に、且つ効
果的に辞書検索することが可能となる等、実用上多大な
る効果が奏せられる。
以下、図面を参照して本発明の一実施例につき説明する
。
。
第1図は実施例装置の概略構成図であり、第2図はその
処理シーケンスを示す図である。この実施例装置は、例
えばアルファベットからなる文字列として入力される英
単語(複合語を含む)を辞書検索して、その訳語、例え
ば日本語を求める自動翻訳装置に組込まれるものである
。
処理シーケンスを示す図である。この実施例装置は、例
えばアルファベットからなる文字列として入力される英
単語(複合語を含む)を辞書検索して、その訳語、例え
ば日本語を求める自動翻訳装置に組込まれるものである
。
入力部1は、翻訳処理に供される英単語(複合gりをア
ルファベットからなる文字列として入力するもので、そ
の入力文字列は一部入カバッファに格納される等して辞
書検索に供される。第1の辞書検索部2aは、単語熟語
辞書3を用いて上記入力文字列が辞書登録されているか
否かを検索しくステップa)、該単語熟語辞書3中に上
記入力文字列に該当する単語および熟語が検出されたと
き、その単語または熟語の情報を辞I3から読出して出
力部4に与えている(ステップb)。
ルファベットからなる文字列として入力するもので、そ
の入力文字列は一部入カバッファに格納される等して辞
書検索に供される。第1の辞書検索部2aは、単語熟語
辞書3を用いて上記入力文字列が辞書登録されているか
否かを検索しくステップa)、該単語熟語辞書3中に上
記入力文字列に該当する単語および熟語が検出されたと
き、その単語または熟語の情報を辞I3から読出して出
力部4に与えている(ステップb)。
この単語熟語辞書3は、アルファベットからなる文字列
を単語または熟語の見出し語として、その訳語を該単語
または熟語の情報として予め登録したものである。ちな
みに従来より種々提唱されでいる翻訳処理装置では、こ
のような単語熟語辞書3のみを備え、該辞書3中に入力
文字列に該当する単語または熟語が見出だされない場合
には、これを辞書検索不能として処理していた。
を単語または熟語の見出し語として、その訳語を該単語
または熟語の情報として予め登録したものである。ちな
みに従来より種々提唱されでいる翻訳処理装置では、こ
のような単語熟語辞書3のみを備え、該辞書3中に入力
文字列に該当する単語または熟語が見出だされない場合
には、これを辞書検索不能として処理していた。
これに対して本装置では、複合語を為す入力文字列中に
出現する可能性の成る特殊な文字、例えばr−J r/
J r・・・」「;」等の複数の単語を相互に結合して
1つの複合語を形成する区切り文字を区切り文字辞書記
憶部5に予め登録している。
出現する可能性の成る特殊な文字、例えばr−J r/
J r・・・」「;」等の複数の単語を相互に結合して
1つの複合語を形成する区切り文字を区切り文字辞書記
憶部5に予め登録している。
また熟語辞書記憶部6は、複合語を形成する複数のml
を、例えば「スペース」で結ぶ等してその表記形式を統
一化した熟語として予め登録している。尚、この熟語辞
書6については、前記単語熟語辞書記憶部3の一部とし
て実現されるものであっても良い。
を、例えば「スペース」で結ぶ等してその表記形式を統
一化した熟語として予め登録している。尚、この熟語辞
書6については、前記単語熟語辞書記憶部3の一部とし
て実現されるものであっても良い。
しかして区切り文字変換部7は、前記辞書検索部2aが
検索不能(ステップb)とした入力文字列について、前
記区切り文字辞書記憶部5に登録された区切り文字の情
報を用いて、該入力文字列中に該当する区切り文字が存
在するか否かを検索判定している(ステップC)。ここ
で入力文字1列中に該当する区切り文字が検出された場
合、該入力文字列は複合語を為すものであると認定して
いる(ステップd)。そしてその検出された区切り文字
を前記熟語辞I6に登録された熟語を表記している区切
り文字、例えば「スペース」に変換している(ステップ
e)。この区切り文字変換部7にて該当する区切り文字
が検出されなかった入力文字列は複合語ではないと判定
され(ステップd)、ここで始めて検索不能であるとし
て処理される。
検索不能(ステップb)とした入力文字列について、前
記区切り文字辞書記憶部5に登録された区切り文字の情
報を用いて、該入力文字列中に該当する区切り文字が存
在するか否かを検索判定している(ステップC)。ここ
で入力文字1列中に該当する区切り文字が検出された場
合、該入力文字列は複合語を為すものであると認定して
いる(ステップd)。そしてその検出された区切り文字
を前記熟語辞I6に登録された熟語を表記している区切
り文字、例えば「スペース」に変換している(ステップ
e)。この区切り文字変換部7にて該当する区切り文字
が検出されなかった入力文字列は複合語ではないと判定
され(ステップd)、ここで始めて検索不能であるとし
て処理される。
第2の辞書検索部2bは、上記区切り文字変換部7にて
区切り文字変換された文字列を入力し、この文字列が前
記熟語辞書記憶部6に登録されているか否かを辞書検索
している(ステップf)。そして該区切り文字変換され
た文字列が熟語辞書記憶部6から検索されたとき、その
熟語の情報を熟語辞書記憶部6から読出して前記出力部
4に与えている(ステップQ)。
区切り文字変換された文字列を入力し、この文字列が前
記熟語辞書記憶部6に登録されているか否かを辞書検索
している(ステップf)。そして該区切り文字変換され
た文字列が熟語辞書記憶部6から検索されたとき、その
熟語の情報を熟語辞書記憶部6から読出して前記出力部
4に与えている(ステップQ)。
一方、複合語分割部8は、上記辞書検索部2bによる熟
語辞書記憶部6の検索によっても該当する熟R(複合I
I)が見出だされなかったとき(ステップQ)、その入
力文字列中の前記「スペース」部分で該入力文字列を分
割している(ステップh)。つまりその複合語をなす文
字列を、その複合語を形成する複数の単語をそれぞれ為
す個々の文字列に分離している。
語辞書記憶部6の検索によっても該当する熟R(複合I
I)が見出だされなかったとき(ステップQ)、その入
力文字列中の前記「スペース」部分で該入力文字列を分
割している(ステップh)。つまりその複合語をなす文
字列を、その複合語を形成する複数の単語をそれぞれ為
す個々の文字列に分離している。
第3の辞書検索部2Cは、このようにして分割された文
字列について単語辞書記憶部9に予め登録された*iの
情報を用いて検索するものである(ステップi)、そし
てこの分割された個々の文字列について該当する単語の
情報を前記単語辞書記憶部9から見出だし、これらを出
力部4に与えている。尚、この単語辞書記1i8119
についても、前述した単語熟語辞書記憶部3の一部とし
て構成されるものであっても良い。また前記第1乃至第
3の辞書検索部2a、 2b、 2cは、同一の辞書検
索装置として実現されるものであっても良い。
字列について単語辞書記憶部9に予め登録された*iの
情報を用いて検索するものである(ステップi)、そし
てこの分割された個々の文字列について該当する単語の
情報を前記単語辞書記憶部9から見出だし、これらを出
力部4に与えている。尚、この単語辞書記1i8119
についても、前述した単語熟語辞書記憶部3の一部とし
て構成されるものであっても良い。また前記第1乃至第
3の辞書検索部2a、 2b、 2cは、同一の辞書検
索装置として実現されるものであっても良い。
具体的には、例えば
rread−on I y−memoryJなる入力文
字列が与えられたとき、辞書検索部2aではこれを単語
熟語辞書を用いて検索する。しかし単語熟語辞書および
熟語辞書には rread only memoryJなる複合語
しか登録されていないとすると、その辞書検索は失敗す
る。このようなとき、区切り文字変換部7では、前記入
力文字列中の区切り文字r−Jを検出し、これを辞書中
で出現する区切り文字「−」(スペース)に変換し、 [read only memoryJる文字列に
変換している。辞書検索部2bではこのような文字列に
ついて前記熟語辞書を用いて辞書検索を行うことになる
。そしてこの場合にあっては、この辞書検索によって該
当する熟語(複合語)が見出だされることになる。
字列が与えられたとき、辞書検索部2aではこれを単語
熟語辞書を用いて検索する。しかし単語熟語辞書および
熟語辞書には rread only memoryJなる複合語
しか登録されていないとすると、その辞書検索は失敗す
る。このようなとき、区切り文字変換部7では、前記入
力文字列中の区切り文字r−Jを検出し、これを辞書中
で出現する区切り文字「−」(スペース)に変換し、 [read only memoryJる文字列に
変換している。辞書検索部2bではこのような文字列に
ついて前記熟語辞書を用いて辞書検索を行うことになる
。そしてこの場合にあっては、この辞書検索によって該
当する熟語(複合語)が見出だされることになる。
ところが熟語辞書に
「read only memoryJなる複合語
が登録されていない場合には、複合語分割部8では、前
記区切り文字変換したスペース(区切り文字)を手掛り
として、該入力文字列を分割し、 rreadJ ronlyJ rmemoryJな
る3つの単語の文字列にそれぞれ分割している。
が登録されていない場合には、複合語分割部8では、前
記区切り文字変換したスペース(区切り文字)を手掛り
として、該入力文字列を分割し、 rreadJ ronlyJ rmemoryJな
る3つの単語の文字列にそれぞれ分割している。
辞書検索部2Cでは゛このようにして分割された個々の
文字列についてそれぞれ辞書検索を行い、その単語情報
を求めることになる。
文字列についてそれぞれ辞書検索を行い、その単語情報
を求めることになる。
かくして本装置によれば、複数の表記形式を取り得る複
合語を、予め特定された1つの表記形式の見出し語とし
て辞書登録しておくだけで、その複合語が種々の表記形
式の文字列として入力された場合であっても、これを効
果的に辞書検索することができる。しかも、辞書として
は同じ意味を持つ複合語を、その表記形式が異なるから
と云って、その表記形式毎に登録することが必要ない。
合語を、予め特定された1つの表記形式の見出し語とし
て辞書登録しておくだけで、その複合語が種々の表記形
式の文字列として入力された場合であっても、これを効
果的に辞書検索することができる。しかも、辞書として
は同じ意味を持つ複合語を、その表記形式が異なるから
と云って、その表記形式毎に登録することが必要ない。
故に辞書の構成を大幅に簡略化することができ、その容
量を最大限に生かして多くの単語、および複合語を登録
することが可能となり、簡易に、且つ効果的な辞書検索
を可能ならしめる等の実用上多大なる効果が奏せられる
。
量を最大限に生かして多くの単語、および複合語を登録
することが可能となり、簡易に、且つ効果的な辞書検索
を可能ならしめる等の実用上多大なる効果が奏せられる
。
尚、本発明は上述した実施例に限定されるものではない
。例えば区切り文字を変換した文字列から熟語辞書を用
いて辞書検索結果が得られ、更に入力文字列を区切り文
字部分で分割した文字列毎に単語辞書からその検索結果
がそれぞれ得られた場合には、これらの辞書検索結果の
全てを出力するようにしても良い。またここでは、単語
および複合語の情報として、アルファベット文字列から
なる英単R(複合語)の訳語を例に説明したが、その英
単1!(複合語)の意味を示す情報等であっても良い。
。例えば区切り文字を変換した文字列から熟語辞書を用
いて辞書検索結果が得られ、更に入力文字列を区切り文
字部分で分割した文字列毎に単語辞書からその検索結果
がそれぞれ得られた場合には、これらの辞書検索結果の
全てを出力するようにしても良い。またここでは、単語
および複合語の情報として、アルファベット文字列から
なる英単R(複合語)の訳語を例に説明したが、その英
単1!(複合語)の意味を示す情報等であっても良い。
つまり技術用語に対する技術的意味(II能)を示す情
報であっても良い。また辞書に登録される複合語の区切
り文字がハイフン「−」であっても良いことは云うまで
もない。
報であっても良い。また辞書に登録される複合語の区切
り文字がハイフン「−」であっても良いことは云うまで
もない。
またここでは、複合g!(熟語)の区切り文字を辞書に
出現する区切り文字に変換する例について示したが、特
殊な形態として「無」なる情報に変換するようにしても
良い。即ち、区切り文字自体を入力文字列中から除くよ
うにしても良い。具体的には、例えば rbi−directionalJ なる入力文字列中のハイフン「−」を除去し、rbid
irectionalJ なる単語に変換し、この単語について辞書検索するよう
にしても良い。その他、本発明はその要旨を逸脱しない
範囲で種々変形して実施することができる。
出現する区切り文字に変換する例について示したが、特
殊な形態として「無」なる情報に変換するようにしても
良い。即ち、区切り文字自体を入力文字列中から除くよ
うにしても良い。具体的には、例えば rbi−directionalJ なる入力文字列中のハイフン「−」を除去し、rbid
irectionalJ なる単語に変換し、この単語について辞書検索するよう
にしても良い。その他、本発明はその要旨を逸脱しない
範囲で種々変形して実施することができる。
第1図は本発明の一実施例装置の概略構成図、第2図は
実施例装置の処理シーケンスを示す図である。 1・・・入力部、2a、 2b、 2c・・・辞書検索
部、3・・・単語熟語辞書記憶部、4・・・出力部、5
・・・区切り文字辞書記憶部、6・・・熟語辞書記憶部
、1・・・区切り文字変換部、8・・・複合語分割部、
9・・・単語辞書記憶部。 出願人代理人 弁理士 鈴江武彦 褒1 図
実施例装置の処理シーケンスを示す図である。 1・・・入力部、2a、 2b、 2c・・・辞書検索
部、3・・・単語熟語辞書記憶部、4・・・出力部、5
・・・区切り文字辞書記憶部、6・・・熟語辞書記憶部
、1・・・区切り文字変換部、8・・・複合語分割部、
9・・・単語辞書記憶部。 出願人代理人 弁理士 鈴江武彦 褒1 図
Claims (4)
- (1)熟語の情報を記憶した熟語辞書と、複合語に現わ
れる区切り文字を記憶した区切り文字辞書とを具備し、
入力文字列中に現われる区切り文字を上記区切り文字辞
書を用いて検索し、上記入力文字列中に前記区切り文字
が検出されたとき、検出された区切り文字を前記熟語辞
書中に現われる区切り文字に変換した後、該入力文字列
を前記熟語辞書を用いて辞書検索することを特徴とする
辞書検索装置。 - (2)区切り文字は、単語を相互に結合して1つの複合
語を形成する特殊文字からなるものである特許請求の範
囲第1項記載の辞書検索装置。 - (3)単語の情報を記憶した単語辞書と、複合語に現わ
れる区切り文字を記憶した区切り文字辞書とを具備し、
入力文字列中に現われる区切り文字を上記区切り文字辞
書を用いて検索し、上記入力文字列中に前記区切り文字
が検出されたとき、検出された区切り文字の前後で前記
入力文字列を区分した後、区分された文字列毎に前記単
語辞書を用いて辞書検索することを特徴とする辞書検索
装置。 - (4)区切り文字は、単語を相互に結合して1つの複合
語を形成する特殊文字からなるものである特許請求の範
囲第3項記載の辞書検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60063457A JPS61223979A (ja) | 1985-03-29 | 1985-03-29 | 辞書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60063457A JPS61223979A (ja) | 1985-03-29 | 1985-03-29 | 辞書検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61223979A true JPS61223979A (ja) | 1986-10-04 |
JPH0346864B2 JPH0346864B2 (ja) | 1991-07-17 |
Family
ID=13229780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60063457A Granted JPS61223979A (ja) | 1985-03-29 | 1985-03-29 | 辞書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61223979A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63106040A (ja) * | 1986-10-23 | 1988-05-11 | Fujitsu Ltd | 文章読み上げ校正装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57113187A (en) * | 1980-12-19 | 1982-07-14 | Ibm | Method of processing text |
-
1985
- 1985-03-29 JP JP60063457A patent/JPS61223979A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57113187A (en) * | 1980-12-19 | 1982-07-14 | Ibm | Method of processing text |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63106040A (ja) * | 1986-10-23 | 1988-05-11 | Fujitsu Ltd | 文章読み上げ校正装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH0346864B2 (ja) | 1991-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3300866B2 (ja) | テキスト処理システムにより使用されるテキストを準備する方法及び装置 | |
JP2000200291A (ja) | 選択された文字列をテキスト内で自動検出する方法 | |
JPS61223979A (ja) | 辞書検索装置 | |
JPH056398A (ja) | 文書登録装置及び文書検索装置 | |
JPH03116375A (ja) | 情報検索装置 | |
JPS62144269A (ja) | 情報検索装置 | |
JPS63221475A (ja) | 構文解析方法 | |
JP2995783B2 (ja) | カタカナ語の訳語推定装置 | |
JPS6324359A (ja) | 翻訳支援装置 | |
JPS6282466A (ja) | 辞書検索装置 | |
JP3644765B2 (ja) | 文書管理方式および文書管理方法 | |
JP2001318595A (ja) | 点字変換システム | |
JPH0447365A (ja) | 辞書装置 | |
JPS6126172A (ja) | カナ漢字変換方式 | |
JPS6324458A (ja) | 自然言語処理装置 | |
JPS62263569A (ja) | 仮名漢字変換処理方式 | |
JPS63223963A (ja) | 意味・文脈処理システム | |
Neuhaus | The Structure of Morphological Families | |
JPH0447864B2 (ja) | ||
JPH0816910B2 (ja) | 言語解析装置 | |
JPH02202673A (ja) | 文解析装置 | |
JPS6395570A (ja) | 言語解析方式 | |
JPH0512753B2 (ja) | ||
JPS6170661A (ja) | 訳語生成装置 | |
JPH0229858A (ja) | 機械翻訳処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |