JP2856736B2 - 辞書参照装置及び辞書参照方法 - Google Patents

辞書参照装置及び辞書参照方法

Info

Publication number
JP2856736B2
JP2856736B2 JP62216642A JP21664287A JP2856736B2 JP 2856736 B2 JP2856736 B2 JP 2856736B2 JP 62216642 A JP62216642 A JP 62216642A JP 21664287 A JP21664287 A JP 21664287A JP 2856736 B2 JP2856736 B2 JP 2856736B2
Authority
JP
Japan
Prior art keywords
character string
dictionary
unit
phrase
dictionary search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62216642A
Other languages
English (en)
Other versions
JPS6459457A (en
Inventor
紀子 小山
公人 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62216642A priority Critical patent/JP2856736B2/ja
Publication of JPS6459457A publication Critical patent/JPS6459457A/ja
Application granted granted Critical
Publication of JP2856736B2 publication Critical patent/JP2856736B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は入力文字列に従って辞書から情報を検索し、
その検索結果を参照出力する為の辞書参照装置及び辞書
参照方法に関する。 (従来の技術) 近時、コンピュータを利用して入力原文を自動的に他
国語に翻訳する機械翻訳システムや、既に作成された文
書を文字列を利用して、その文字列に対応する他国語や
類似語等の様々な情報を得る為の情報処理システムが開
発されている。この種のシステムでは、指定された文字
列に従って辞書を検索し、その辞書検索結果を参照出力
する機能が重要な役割を果たす。例えば日英機械翻訳シ
ステムにあっては、入力日本語文字列に従って辞書を検
索し、その文字列に対応させて辞書登録されている訳語
の情報を抽出し、これを参照出力することが行われる。 しかしてこの種の辞書検索は、一般的には指定された
文字列を見出しとして行われるが、指定された文字列を
複数の文節をなす文字列の組合せとして捕え、これらの
各文節(区切られた文字列)毎に辞書検索することも行
われる。 ところがこのような辞書検索に供される文字列をどの
ような単位で指定すれば、その目的とする辞書参照結果
を求めることができるかと云う点で大きな問題がある。
具体的には単語単位で文字列を指定すると、辞書参照結
果としてはその単語についての情報しか得られない。ま
た複数の文節を構成する文字列を指定すると、その文字
列中の文節の区切りが不明確なので、不本意な位置で区
切られた文字列についての辞書参照結果が求められるこ
とがある。また指定された文字列によっては、その一部
の文字列について辞書検索に成功した辞書情報が個々に
参照出力され、全体として異和感が生じる等の不具合を
招来することがあった。この為、どのようにして文字列
を指定すれば目的とする辞書情報を参照できるのかが非
常にわかり難かった。 (発明が解決しようとする問題点) このように従来装置にあっては、辞書検索に供される
文字列をどのようにして与えれば目的とする辞書参照情
報を得ることができるのかが曖昧であり、辞書検索機能
の利用正,使い易さ,わかり易さの点で種々の問題があ
った。 本発明はこのような事情を考慮してなされたもので、
その目的とするところは、辞書検索に供する文字列を簡
易に与えることができ、しかも所望とする辞書参照結果
を異和感を招くことなく効果的に求めることのできる辞
書参照装置及び辞書参照方法を提供することにある。 [発明の構成] (問題点を解決するための手段) 本発明の辞書参照装置は、辞書参照対象として指定さ
れた文字列を所定の文法法則に従って解析する解析手段
と、この解析手段の解析結果に基づいて前記文字列の各
部分について前記辞書を検索し、その辞書検索情報を抽
出する辞書検索手段と、前記解析手段の解析結果に基づ
いて前記文字列が文節として成立する文字列単位あるい
は付属語分割を正しく行なうことの可能な文字列単位で
あるか否かを判定する判定手段と、この判定手段の結
果、前記文字列が文節として成立する文字列単位あるい
は付属語分割を正しく行なうことの可能な文字列単位で
ある場合に、前記辞書検索手段によって抽出された前記
文字列に対応する辞書検索情報のみを出力する出力制御
手段とを具備したことを特徴とする。 また、本発明の辞書参照方法は、辞書参照対象として
指定された文字列に基づいて辞書を検索し、その辞書検
索結果を参照出力する辞書参照装置に用いられる辞書参
照方法であって、前記文字列を所定の文法法則に従って
解析するステップと、この解析結果に基づいて前記文字
列の各部分について前記辞書を検索し、その辞書検索情
報を抽出するステップと、前記解析結果に基づいて前記
文字列が文節して成立する文字列単位あるいは付属語分
割を正しく行なうことの可能な文字列単位であるか否か
を判定するステップと、この判定手段の結果、前記文字
列が文節として成立する文字列単位あるいは付属語分割
を正しく行なうことの可能な文字列単位である場合に、
前記文字列に対応する辞書検索情報のみを出力するステ
ップとを具備したことを特徴とする。 (作用) 本発明によれば辞書検索の為に指定された文字列に対
して形態的な解析が行われ、この形態的な解析による活
用処理や付属語解析の結果に従って、例えば文節として
の終了条件を満す文字列が与えられた場合にのみ、辞書
記憶部から検索された情報の参照出力が行われる。従っ
て意図する内容と異なる情報内容が参照出力されること
がなくなり、上記意図に即した形で辞書検索とその辞書
情報の参照出力が行われることになる。これ故、例えば
文字列をわざわざ終止形等の形で指示しなくても、その
指定された文字列に対する形態解析結果に従って、例え
ば文節として容認し得る単位、或いは付属語分割が正し
く行い得る単位毎に辞書検索が行われることになるの
で、その辞書検索結果として異和感のない情報を効果的
に得ることが可能となる。 (実施例) 以下、図面を参照して本発明の一実施例につき説明す
る。 第1図は本発明の一実施例に係る辞書参照装置を組込
んで構成される機械翻訳システムの概略構成図であり、
1は文字データや各種の制御コマンドを入力する為の入
力部である。この入力部1を介して翻訳処理に供される
原文データが入力され、編集制御部2を介して原文記憶
部3に格納される。尚、入力された原文データは表示制
御部4を介して、CRTディスプレイ等からなる表示部5
の所定の原文表示領域に表示される。 また翻訳部6は前記編集制御部2の制御を受け、辞書
部7を参照して前記原文記憶部3に格納された原文に対
する機械翻訳処理を実行するものである。この機械翻訳
処理は本発明とは直接関係のないものであるが、例えば
第4図に示すようにして行われる。 即ち、辞書記憶部7には機械翻訳処理に必要な活用・
接続規則7a,単語・熟語辞書7b,解析文法7c,変換文法7d,
生成文法7e,形態素生成文法7f等が格納されており、翻
訳部6はこのような辞書記憶情報を参照して第4図に示
すようにしてその機械翻訳処理を実行するものとなって
いる。 具体的には前記活用・接続規則7aと単語・熟語辞書7b
とを参照して入力原文に対して活用処理や付属語解析,
接続条件判定等を行いながら上記入力原文を文節解析す
る(ステップA)。そしてその解析制御の下で(ステッ
プB)、前記解析文法7cを用いて訳文候補に対する構文
解析を実行し(ステップC)、この構文解析に成功した
時点で前述した変換文法7dを参照して入力原文の構造を
翻訳文の構造に変換する(ステップD)。しかる後、前
記生成文法7eに従って原文の構造から訳文の語順に決定
処理を行い、訳文構造を生成する(ステップE)。その
後、形態素生成文法7fを適用して訳語の語尾変化等の処
理(形態素生成)を行い、前記入力原文に対する翻訳文
を完成させる(ステップF)。 尚、翻訳処理のアルゴリズムはこの例に限定されない
ことは勿論のことである。 以上のようにして翻訳部6にて求められた訳文データ
は訳文記憶部8に格納されると共に、前記表示部5の所
定の訳文表示領域に表示されるものとなっている。 尚、印刷部9は前記編集制御部2の制御を受けて前述
した訳文等をハード・コピー出力するものである。 このように構成された機械翻訳システムにおいて、前
記辞書部7の情報を参照する為の辞書参照装置は、辞書
参照部11として組込まれている。この辞書参照部11は前
記入力部1から辞書参照の指示がなされ、辞書参照すべ
き文字列が前記入力原文中から指定されたときに前記編
集制御部2の指示を受けて起動される。 即ち、この辞書参照部11は第2図に示すように制御部
12によって動作管理される文節解析部13,活用処理部14,
辞書検索部15,および正当性判定部16を具備して構成さ
れる。そして第3図に例示する処理手続に従い、前記活
用・接続規則7aを参照して指定された文字列を解析し、
その文字列の正当性が判定されたとき前記単語・熟語辞
書7bから上記文字列に従って検索された情報を辞書参照
結果として出力するものとなっている。 制御部12は辞書参照すべき文字列が与えられたとき、
その文字列を文節解析部13に与えている。文節解析部13
は入力文字列を活用・接続辞書7aを参照して文節解析す
ると共に、辞書検索部15に与えている。辞書検索部15は
与えられた文字列について単語・熟語辞書7bを検索し、
辞書検索に成功した文字列部分の情報を活用処理部14に
与えている。活用処理部14はこの文字列部分について前
記活用・接続規則7aを参照してその活用が正しいか否か
をチェックし、その活用が正しい場合にはその活用に応
じた接続情報を付加している。 更に前記文節解析部13は残りの文字列についても同様
にして辞書検索し、またその残りの文字列に対する活用
や付属語の解析を行う。そして付属語である場合には、
付属語接続条件等から先に辞書検索された文字列部分の
付属語として成立するか否か等を前記正当性判定部16に
て判定するものとなっている。このような処理を入力文
字列の最後の文字についてまで繰返し実行し、最終的に
は上記入力文字列が文節として成立するか否かを判定し
ている。そして入力文字列が文節等として所定の条件を
満していることが確認されたとき、その入力文字列に従
って前記単語・熟語辞書7bから検索抽出された情報を前
記入力文字列によって指定された辞書参照結果として出
力するものとなっている。尚、上記文字列が所定の正当
性条件を満さない場合には、単語・熟語辞書7bから検索
された情報の参照出力が禁止されるものとなっている。 即ち、この辞書参照処理は、第3図に示すように先ず
指定された文字列の先頭にポインタをセットし(ステッ
プa)、このポインタがセットされた文字が上記指定さ
れた文字列の最後であるか否かを調べながら(ステップ
b)、以下に示す処理を進めることによって行われる。 しかしてポインタによって示される文字を手掛りとし
て前記単語・熟語辞書7bを検索し、その文字を先頭語と
する見出しの情報が辞書から検索されたか否かを判定す
る(ステップd)。辞書からの情報検索が失敗した場合
には、その時点で指定された文字列では辞書検索ができ
ないと判定し、その指定文字列の変更を促す等の処理を
起動する。 しかして前記ポインタによって指定される文字を先頭
とする文字列につてい辞書検索に成功した場合には、次
のその文字列についての活用を調べる(ステップe)。
そして上記辞書検索に成功した文字列に対する活用が正
しくない場合には、辞書検索結果を得た文字列が不当な
ものであるとして前述したステップcからの処理を繰返
し実行し、他の辞書検索結果を得るべく、その検索処理
を先に進める。これに対してその活用が正しいと判断さ
れた場合には、その活用を得た文字列に対して前述した
接続情報を付加し(ステップf)、この接続情報に従っ
てその前の語(辞書検索に成功した文字列)と接続可能
であるか否かを判定する(ステップg)。この判定が不
成功に終わった場合には、前述したステップcからの処
理手順を再度実行し、辞書検索処理を先に進める。 以上のチェック手続を経てその指定された文字列の前
記ポインタを起点として抽出された文字列部分による辞
書検索に成功したことが確認されたとき、前記ポインタ
を進め(ステップh)、残された文字列部分について同
様な処理を繰返し実行する。そして上述した如く指定さ
れた文字列の最後の文字に対してまで辞書検索が実行さ
れたとき(ステップb)、前述した活用や付属語の接続
関係等に従って前述した如く指定された文字列が文節と
して成立するか否かを判定し(ステップi)、文節とし
て認められた場合、前記各文字列部分についてそれぞれ
求められた辞書検索結果(辞書から抽出された情報)を
辞書参照結果として出力する(ステップj)。 具体的には、例えば『行かなかった』なる文字列が指
定された場合、先ず『行』なる文字にポインタをセット
し、この『行』なる文字を手掛りとして辞書検索する。
この検索の結果、カ行五段活用動詞「行く」が求められ
ることから、次にその後の『かなかった』に対して活用
チェックが行われる。この場合、『か』の未然形として
正しいとの判断結果を得ることから、その文字列『かな
かった』に対してカ行五段活用動詞・未然形の接続情報
が与えられ、この接続情報に従って上記文字列が語頭と
して正しいか否かが判断される。この例では語頭として
正しいので、次の文字『な』にポインタが進められる。 しかる後、『なかった』なる文字列に対して同様にし
て辞書検索が行われる。そしてこの場合には自動詞「な
い」が求められ、『かっ』が連用形の音便形であるか
ら、その文字列が正しいと判定される。この場合にも接
続情報が与えられ、前述した「ない」がカ行五段動詞・
未然形であり、これに接続可能であることが判定される
ので、前述したポインタが次の後『た』に進められる。 この『た』については過去助動詞として解析され、こ
れによって文字列が終るので以上の文字列が文節として
成立するか否かが判断される。この場合には、文節とし
て成立することから、前述した文字列に従って辞書から
検索された情報が参照辞書情報として出力されることに
なる。 以上のようにして本装置によれば、入力文字列(指示
文字列)が文節として正しいと判断された場合にのみ、
その文字列に従って辞書検索さた結果が出力される。従
って入力文字列に対する正しい解釈の下での辞書検索結
果だけが出力されることになる、参照目的と異なる辞書
情報や異和感のある辞書情報等が不本意に出力されるこ
とがなくなる。 またオペレータにとっても、その文字列を通常正しい
と考え得る文節の単位で指定すれば良いので、その処理
操作手続が非常に簡単である等の効果が奏せられる。 尚、本発明は上述した実施例に限定されるものてはな
い。ここでは日本語により文字列を指示入力し、これに
従って辞書検索を行うものとして説明したが、他国語に
ついても同様に適用可能なことは勿論のことである。ま
た辞書検索結果を出力する為の文字列の入力条件として
は、前述したように文節として成立しないまでも、付属
語分割を正しく行い得る時点で、辞書検索結果を出力す
るようにしても良い。 更には文字列の範囲を指定することなく、例えば文字
列データ中の先頭文字だけを指定して辞書検索を行わせ
るようにしても良い。この場合には、文字種の変化のあ
る箇所や、句読点の箇所、また予め単語単位に分割され
た箇所等をシステムにて自動検出し、その範囲内の文字
列について辞書検索を実行するようにしても良い。その
他、本発明はその要旨を逸脱しない範囲で種々変形して
実施することができる。 [発明の効果] 以上説明したように本発明によれば、要求された辞書
参照の情報だけを指定された文字列に従って効果的に出
力することができ、不本意な辞書情報の参照出力を効果
的に防ぐことができ、また辞書情報参照の為の文字列指
定をも簡易に行うことでき、辞書参照機能の効果的な利
用を図り得る等の実用上多大なる効果が奏せられる。
【図面の簡単な説明】 図は本発明の一実施例を示すもので、第1図は実施例装
置を組込んで構成される機械翻訳システムの概略構成
図、第2図は本発明の一実施例に係る辞書参照装置の要
部概略構成図、第3図は辞書検索処理の流れを示す図、
第4図は機械翻訳処理の全体的な流れを示す図である。 7……辞書部、7a……活用・接続辞書、7b……単語・熟
語辞書、11……辞書参照部、12……制御部、13……文節
解析部、14……活用処理部、15……辞書検索部、16……
正当性判定部。

Claims (1)

  1. (57)【特許請求の範囲】 1.辞書参照対象として指定された文字列を所定の文法
    法則に従って解析する解析手段と、 この解析手段の解析結果に基づいて前記文字列の各部分
    について前記辞書を検索し、その辞書検索情報を抽出す
    る辞書検索手段と、 前記解析手段の解析結果に基づいて前記文字列が文節と
    して成立する文字列単位あるいは付属語分割を正しく行
    なうことの可能な文字列単位であるか否かを判断する判
    定手段と、 この判定手段の結果、前記文字列が文節として成立する
    文字列単位あるいは付属語分割を正しく行なうことの可
    能な文字列単位である場合に、前記辞書検索手段によっ
    て抽出された前記文字列に対応する辞書検索情報のみを
    出力する出力制御手段と、 を具備したことを特徴とする辞書参照装置。 2.辞書参照対象として指定された文字列に基づいて辞
    書を検索し、その辞書検索結果を参照出力する辞書参照
    装置に用いられる辞書参照方法であって、 前記文字列を所定の文法法則に従って解析するステップ
    と、 この解析結果に基づいて前記文字列の各部分について前
    記辞書を検索し、その辞書検索情報を抽出するステップ
    と、 前記解析結果に基づいて前記文字列が文節として成立す
    る文字列単位あるいは付属語分割を正しく行なうことの
    可能な文字列単位であるか否かを判定するステップと、 この判定手段の結果、前記文字列が文節として成立する
    文字列単位あるいは付属語分割を正しく行なうことの可
    能な文字列単位である場合に、前記文字列に対応する辞
    書検索情報のみを出力するステップと を具備したことを特徴とする辞書参照方法。
JP62216642A 1987-08-31 1987-08-31 辞書参照装置及び辞書参照方法 Expired - Lifetime JP2856736B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62216642A JP2856736B2 (ja) 1987-08-31 1987-08-31 辞書参照装置及び辞書参照方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62216642A JP2856736B2 (ja) 1987-08-31 1987-08-31 辞書参照装置及び辞書参照方法

Publications (2)

Publication Number Publication Date
JPS6459457A JPS6459457A (en) 1989-03-07
JP2856736B2 true JP2856736B2 (ja) 1999-02-10

Family

ID=16691635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62216642A Expired - Lifetime JP2856736B2 (ja) 1987-08-31 1987-08-31 辞書参照装置及び辞書参照方法

Country Status (1)

Country Link
JP (1) JP2856736B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61190657A (ja) * 1985-02-20 1986-08-25 Hitachi Ltd 日本語文字列認定方式

Also Published As

Publication number Publication date
JPS6459457A (en) 1989-03-07

Similar Documents

Publication Publication Date Title
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
US5099425A (en) Method and apparatus for analyzing the semantics and syntax of a sentence or a phrase
JPS62163173A (ja) 機械翻訳方法
JPH0644296A (ja) 機械翻訳装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
KR900008402B1 (ko) 기계번역장치
JPH0332106B2 (ja)
JP3131432B2 (ja) 機械翻訳方法及び機械翻訳装置
JPH0715691B2 (ja) 自動翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH0816910B2 (ja) 言語解析装置
JP3353873B2 (ja) 機械翻訳装置
JPH07122876B2 (ja) 機械翻訳装置
JPS6244872A (ja) 機械翻訳装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH0612449A (ja) 機械翻訳装置及びその方法
JPH0332105B2 (ja)
JPS62271054A (ja) 翻訳装置における形態素解析結果修正方式
JPH1063664A (ja) 自然言語の翻訳方法及び装置
JPS62163170A (ja) 機械翻訳システム
JPH0785057A (ja) 構文解析方法及び装置
JPS6244876A (ja) 機械翻訳装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPS62271053A (ja) 翻訳装置における形態素解析結果修正方式
JPS63268068A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071127

Year of fee payment: 9