JPH07282055A - 文解析方法および装置 - Google Patents

文解析方法および装置

Info

Publication number
JPH07282055A
JPH07282055A JP6068737A JP6873794A JPH07282055A JP H07282055 A JPH07282055 A JP H07282055A JP 6068737 A JP6068737 A JP 6068737A JP 6873794 A JP6873794 A JP 6873794A JP H07282055 A JPH07282055 A JP H07282055A
Authority
JP
Japan
Prior art keywords
pattern matching
sentence
pattern
rule
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6068737A
Other languages
English (en)
Inventor
Naoto Nakamura
直人 中村
Ikuko Nagasawa
郁子 長澤
Tomoko Segawa
智子 瀬川
Kunio Matsui
くにお 松井
Kenji Sugiyama
健司 杉山
Manabu Sasano
学 颯々野
Makoto Shiozu
誠 塩津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6068737A priority Critical patent/JPH07282055A/ja
Priority to US08/412,136 priority patent/US5842159A/en
Priority to GB9506952A priority patent/GB2288258B/en
Publication of JPH07282055A publication Critical patent/JPH07282055A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】弱連結の熟語について、文章中の弱連結の熟語
を簡単な処理で的確な認識し、単語または通常の強連結
の熟語を扱うのと同様の処理で正しい解析を行うことを
可能とする。 【構成】パターンマッチング部11には、予め弱連結の
熟語を認識するためのパターンマッチング規則11Aが
保持されている。パターンマッチング部11は、与えら
れた入力文中にパターンマッチング規則11Aに登録さ
れた弱連結の熟語が分離した状態で存在すると、それが
パターンマッチング部11で認識される。パターンマッ
チング部11で弱連結の熟語が認識されると、その熟語
が、置換部12で記号化された一連のパターンに置き換
えられる。置換部12で置換の施された文が解析部13
に与えられる。解析部13は、記号化された一連のパタ
ーンを1つの熟語として取り扱って、文の解析を行う。
この結果、解析部13の出力として弱連結の熟語が適切
に処理された解析結果が得られる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、言語処理システムに係
り、特に文中の熟語を効果的に処理するための文解析方
法および装置に関する。
【0002】
【従来の技術】文章中には、複数の部分例えば単語が常
に連続して存在する熟語ばかりでなく、複数の部分から
なりこれらが連続して存在する場合も分離して存在する
場合もあり、いずれの場合にも同一の意味を持つような
熟語がある。このように、複数の部分に分離して存在し
得る熟語を「弱連結の熟語」と称することにする。
【0003】例えば、「彼はとても腹の大きい人だ。」
という文における「腹の大きい(英語の"generous"に相
当する)」という熟語は、「彼は腹のとても大きい人
だ。」というように、何ら意味が変化することなく分離
して存在することがある。この「腹の大きい」のような
語が上述した弱連結の熟語である。
【0004】従来の言語処理装置では、文章中に弱連結
の熟語が含まれている場合に、熟語としての認識ができ
ないため、分離した各部を個別の単語としてしか取り扱
うことができず、解析および翻訳等の処理結果に悪影響
を及ぼしていた。
【0005】すなわち、次のような文における「腹の大
きい」という熟語は、一箇所に連続して存在するため、
従来の技術で処理可能である。 彼は、とても{腹の大きい}人だ。
【0006】(He is a {generous} man.) また、次のような文では、「腹の大きい」という熟語
が、「腹の」と「大きい」に分離して存在するため、従
来の技術では熟語として処理することが不可能である。
【0007】彼は、{腹の}とても{大きい}人だ。
(He is a {generous} man.)
【0008】
【発明が解決しようとする課題】また、上述のように、
「腹の大きい」という熟語が、「腹の」と「大きい」に
分離して存在する文は、従来の技術では熟語として処理
することが不可能であため、次のような不都合を生ず
る。
【0009】例えば、翻訳システムにおいて、「彼は、
腹のとても大きい人だ。」を英文に翻訳する場合、「腹
の」と「大きい」とに分離した語を「腹の大きい」とい
う熟語と認識することができないため、「腹の」および
「大きい」をそれぞれ単独の語として認識してしまう。
このような場合、「彼は、腹のとても大きい人だ。」と
いう文を、例えば「彼は大きな腹を持つ人だ。」という
のと同様の意味に認識し"He is a man having a large
stomach."などと翻訳してしまう。
【0010】従来のシステムでこのような不都合を回避
するためには、文法処理によって分離した熟語を関連付
けて処理する方法が考えられるが、種々の場合に対応し
得るようにするためには、文法処理が著しく複雑になっ
てしまう。
【0011】本発明は、上述のような問題を解決するた
めになされたもので、弱連結の熟語について、文章中の
弱連結の熟語を簡単な処理で的確な認識し、単語または
通常の強連結の熟語を扱うのと同様の処理で正しい解析
を行うことを可能とする文解析方法および装置を提供す
ることを目的としている。
【0012】
【課題を解決するための手段】本発明は、上述した課題
を解決するため、次のように構成する。 〔第1の発明方法〕本発明に係る第1の方法である文解
析方法は、パターンマッチングステップ、置換ステップ
および解析ステップを有する。
【0013】パターンマッチングステップは、分離して
存在し得る複数の部分からなる熟語についてのパターン
マッチング規則を用意し、このパターンマッチング規則
を基に、文のパターンマッチングを行って分離して存在
する前記熟語を認識する。
【0014】置換ステップは、前記パターンマッチング
で認識された前記熟語を構成する複数の部分を記号化さ
れた一連のパターンに置き換える。解析ステップは、前
記置換ステップで置換された文を解析する。
【0015】前記パターンマッチングステップは、文字
列パターンによるパターンマッチングを行うステップを
含んでいてもよく、形態素解析結果のパターンによるパ
ターンマッチングを行うステップを含んでいてもよく、
あるいは、構文解析結果のパターンによるパターンマッ
チングを行うステップを含んでいてもよい。
【0016】〔第2の発明方法〕本発明に係る第2の方
法である文解析方法は、入力ステップ、規則生成ステッ
プ、パターンマッチングステップ、置換ステップおよび
解析ステップを有する。
【0017】入力ステップは、分離して存在する複数の
部分からなる熟語部分にマークを付した文を取り込む。
規則生成ステップは、入力された文を解析して、前記マ
ークが付された分離して存在する複数の部分からなる熟
語部分を認識するためのパターンマッチング規則を生成
する。
【0018】パターンマッチングステップは、前記規則
生成ステップで生成されたパターンマッチング規則を基
に、文のパターンマッチングを行って分離して存在する
前記熟語を認識する。
【0019】置換ステップは、前記パターンマッチング
ステップで認識された前記熟語を構成する複数の部分を
記号化された一連のパターンに置き換える。解析ステッ
プは、前記置換ステップで置換された文を解析する。
【0020】前記規則生成ステップは、文字列パターン
によるパターンマッチング規則を生成するステップを含
んでいてもよく、形態素解析結果のパターンによるパタ
ーンマッチング規則を生成するステップを含んでいても
よく、構文解析結果のパターンによるパターンマッチン
グ規則を生成するステップを含んでいてもよい。
【0021】また、前記パターンマッチングステップ
は、それぞれ前記規則生成ステップに対応して、文字列
パターンによるパターンマッチングを行うステップを含
んでいてもよく、形態素解析結果のパターンによるパタ
ーンマッチングを行うステップを含んでいてもよく、あ
るいは、構文解析結果のパターンによるパターンマッチ
ングを行うステップを含んでいてもよい。
【0022】〔第3の発明方法〕本発明に係る第3の方
法である規則生成方法は、入力ステップおよび規則生成
ステップを有する。
【0023】入力ステップは、分離して存在する複数の
部分からなる熟語部分にマークを付した文を取り込む。
規則生成ステップは、入力された文を解析して、前記マ
ークが付された分離して存在する複数の部分からなる熟
語部分を認識するためのパターンマッチング規則を生成
する。
【0024】前記規則生成ステップは、文字列パターン
によるパターンマッチング規則を生成するステップを含
んでいてもよく、形態素解析結果のパターンによるパタ
ーンマッチング規則を生成するステップを含んでいても
よく、構文解析結果のパターンによるパターンマッチン
グ規則を生成するステップを含んでいてもよい。
【0025】〔第1の発明装置〕本発明に係る第1の装
置である文解析装置は、パターンマッチング部、置換部
および解析部を具備する。
【0026】パターンマッチング部は、分離して存在し
得る複数の部分からなる熟語についてのパターンマッチ
ング規則を保持し、このパターンマッチング規則を基
に、文のパターンマッチングを行って分離して存在する
前記熟語を認識する。
【0027】置換部は、前記パターンマッチング部で認
識された前記熟語を構成する複数の部分を記号化された
一連のパターンに置き換える。解析部は、前記置換部で
置換された文を解析する。
【0028】前記パターンマッチング部は、文字列パタ
ーンによりパターンマッチングを行ってもよく、形態素
解析結果のパターンによりパターンマッチングを行って
もよく、あるいは、構文解析結果のパターンによりパタ
ーンマッチングを行ってもよい。
【0029】〔第2の発明装置〕本発明に係る第2の装
置である文解析装置は、入力部、規則生成部、パターン
マッチング部、置換部および解析部を具備する。
【0030】入力部は、分離して存在する複数の部分か
らなる熟語部分にマークを付した文を取り込む。規則生
成部は、入力された文を解析して、前記マークが付され
た分離して存在する複数の部分からなる熟語部分を認識
するパターンマッチング規則を生成する。
【0031】パターンマッチング部は、前記規則生成部
で生成されたパターンマッチング規則を基に、文のパタ
ーンマッチングを行って分離して存在する前記熟語を認
識する。
【0032】置換部は、前記パターンマッチング部で認
識された前記熟語を構成する複数の部分を記号化された
一連のパターンに置き換える。解析部は、前記置換部で
置換された文を解析する。
【0033】前記規則生成部は、文字列パターンによる
パターンマッチング規則を生成してもよく、形態素解析
結果のパターンによるパターンマッチング規則を生成し
てもよく、構文解析結果のパターンによるパターンマッ
チング規則を生成してもよい。
【0034】また、前記パターンマッチング部は、それ
ぞれ前記規則生成部に対応して、文字列パターンにより
パターンマッチングを行ってもよく、形態素解析結果の
パターンによりパターンマッチングを行ってもよく、あ
るいは、構文解析結果のパターンによりパターンマッチ
ングを行ってもよい。
【0035】〔第3の発明装置〕本発明に係る第3の装
置である規則生成装置は、入力部および規則生成部を具
備する。
【0036】入力部は、分離して存在する複数の部分か
らなる熟語部分にマークを付した文を取り込む。規則生
成部は、入力された文を解析して、前記マークが付され
た分離して存在する複数の部分からなる熟語部分を認識
するパターンマッチング規則を生成する。
【0037】前記規則生成部は、文字列パターンによる
パターンマッチング規則を生成してもよく、形態素解析
結果のパターンによるパターンマッチング規則を生成し
てもよく、構文解析結果のパターンによるパターンマッ
チング規則を生成してもよい。
【0038】
【作用】
〔第1の方法の作用〕本発明に係る第1の方法である文
解析方法では、パターンマッチングステップで、分離し
て存在し得る複数の部分からなる熟語についてのパター
ンマッチング規則を用意し、このパターンマッチング規
則を基に、文のパターンマッチングを行って分離して存
在する前記熟語を認識して、置換ステップで、前記パタ
ーンマッチングで認識された前記熟語を構成する複数の
部分を記号化された一連のパターンに置き換え、さら
に、解析ステップでは、前記置換ステップで置換された
文を解析する。
【0039】このことにより、弱連結の熟語は、予めパ
ターン認識により記号化された一連のパターンに置き換
えられてから解析に供されるので、弱連結の熟語が、分
離して存在していても常に熟語として取り扱われ、簡単
な操作であるにもかかわらず適切な文解析が行われる。
【0040】前記パターンマッチングには、文字列パタ
ーン、形態素解析結果のパターンおよび構文解析結果の
パターンのいずれを用いてもよく、その他の文解析上の
パターンをもちいてもよい。
【0041】〔第2の方法の作用〕本発明に係る第2の
方法である文解析方法では、分離して存在する複数の部
分からなる熟語部分にマークを付した文を入力ステップ
で取り込み、規則生成ステップで、入力文を解析して、
前記マークが付された分離して存在する複数の部分から
なる熟語部分を認識するためのパターンマッチング規則
を生成し、パターンマッチングステップで、前記パター
ンマッチング規則を基に、文のパターンマッチングを行
って分離して存在する前記熟語を認識して、前記パター
ンマッチングステップで認識された前記熟語を構成する
複数の部分を、置換ステップで、記号化された一連のパ
ターンに置き換え、前記置換ステップで置換された文を
解析ステップの解析に供する。
【0042】このことにより、弱連結の熟語をパターン
認識するためのパターンマッチング規則を、該当個所に
マークを付した入力文から生成し、弱連結の熟語は、予
めパターン認識により記号化された一連のパターンに置
き換えられてから解析に供されるので、弱連結の熟語を
認識するためのパターンマッチング規則を予め用意して
おかなくとも、容易に生成することができ、弱連結の熟
語が分離して存在していても常に熟語として取り扱わ
れ、適切な文解析が行われる。
【0043】前記規則生成にあたっては、文字列パター
ン、形態素解析結果のパターンおよび構文解析結果のパ
ターンのいずれの規則を生成してもよい。また、パター
ンマッチングに際しても、それぞれ生成されたマッチン
グ規則に対応して、文字列パターン、形態素解析結果の
パターンおよび構文解析結果のパターンのいずれのパタ
ーンについてパターンマッチングを行ってもよい。
【0044】〔第3の方法の作用〕本発明に係る第3の
方法である規則生成方法では、入力ステップで、分離し
て存在する複数の部分からなる熟語部分にマークを付し
た文を取り込み、入力された文を解析して、前記マーク
が付された分離して存在する複数の部分からなる熟語部
分を認識するためのパターンマッチング規則を規則生成
ステップで生成する。
【0045】このことにより、弱連結の熟語をパターン
マッチングにより置換処理するためのマッチング規則を
容易に且つ自動的に生成させることができる。前記規則
生成にあたっては、文字列パターン、形態素解析結果の
パターンおよび構文解析結果のパターンのいずれの規則
を生成してもよい。
【0046】〔第1の装置の作用〕本発明に係る第1の
装置である文解析装置では、パターンマッチング部が、
分離して存在し得る複数の部分からなる熟語についての
パターンマッチング規則を保持し、このパターンマッチ
ング規則を基に、文のパターンマッチングを行って分離
して存在する前記熟語を認識し、置換部が、前記パター
ンマッチング部で認識された前記熟語を構成する複数の
部分を記号化された一連のパターンに置き換えるととも
に、解析部が、前記置換部で置換された文を解析する。
【0047】このことにより、弱連結の熟語が、予めパ
ターン認識により記号化された一連のパターンに置き換
えられてから解析に供されるので、弱連結の熟語が、分
離して存在していても常に熟語として取り扱われ、簡単
な構成であるにもかかわらず適切な文解析を行うことが
できる。
【0048】前記パターンマッチング部は、文字列パタ
ーン、形態素解析結果のパターン、あるいは、構文解析
結果のパターンのいずれによりパターンマッチングを行
ってもよい。
【0049】〔第2の装置の作用〕本発明に係る第2の
装置である文解析装置では、入力部が、分離して存在す
る複数の部分からなる熟語部分にマークを付した文を取
り込み、規則生成部が、入力された文を解析して、前記
マークが付された分離して存在する複数の部分からなる
熟語部分を認識するパターンマッチング規則を生成し、
パターンマッチング部が、前記パターンマッチング規則
を基に、文のパターンマッチングを行って分離して存在
する前記熟語を認識するとともに、置換部が、前記熟語
を構成する複数の部分を記号化された一連のパターンに
置き換えて、解析部が、前記置換部で置換された文を解
析する。
【0050】このことにより、弱連結の熟語をパターン
認識するためのパターンマッチング規則を、該当個所に
マークを付した入力文から生成し、弱連結の熟語は、予
めパターン認識により記号化された一連のパターンに置
き換えられてから解析に供されるので、弱連結の熟語を
認識するためのパターンマッチング規則を予め用意して
おかなくとも、容易に生成することができ、弱連結の熟
語が分離して存在していても常に熟語として取り扱わ
れ、適切な文解析が行われる。
【0051】前記規則生成部は、文字列パターン、形態
素解析結果のパターンおよび構文解析結果のパターンの
いずれに対応するパターンマッチング規則を生成しても
よい。
【0052】また、前記パターンマッチング部は、それ
ぞれ前記規則生成部に対応して、文字列パターン、形態
素解析結果のパターンおよび構文解析結果のパターンの
いずれによりパターンマッチングを行ってもよい。
【0053】〔第3の装置の作用〕本発明に係る第3の
装置である規則生成装置では、入力部が、分離して存在
する複数の部分からなる熟語部分にマークを付した文を
取り込み、規則生成部が、入力された文を解析して、前
記マークが付された分離して存在する複数の部分からな
る熟語部分を認識するパターンマッチング規則を生成す
る。
【0054】このことにより、弱連結の熟語をパターン
マッチングにより置換処理するためのマッチング規則を
容易に且つ自動的に生成させることができる。前記規則
生成部は、文字列パターン、形態素解析結果のパターン
および構文解析結果のパターンによるパターンマッチン
グ規則を生成してもよい。
【0055】
【実施例】以下、図面を参照して本発明の実施例を説明
する。 〔実施例1〕本発明の第1の実施例による原理的な文解
析装置を図1を参照して説明する。
【0056】図1に示す文解析装置は、パターンマッチ
ング部11、置換部12および解析部13を具備する。
パターンマッチング部11は、分離して存在し得る複数
の部分からなる熟語についてのパターンマッチング規則
11Aを保持し、このパターンマッチング規則11Aを
基に、入力文のパターンマッチングを行って分離して存
在する前記熟語を認識する。
【0057】置換部12は、前記パターンマッチング部
11で認識された前記熟語を構成する複数の部分を記号
化された一連のパターンに置き換える。解析部13は、
前記置換部で置換された文を解析し解析結果を出力す
る。
【0058】前記パターンマッチング部11は、文字列
パターンによりパターンマッチングを行ってもよく、形
態素解析結果のパターンによりパターンマッチングを行
ってもよく、あるいは、構文解析結果のパターンにより
パターンマッチングを行ってもよい。
【0059】このような構成において、パターンマッチ
ング部11には、予め本発明に係る弱連結の熟語を認識
するためのパターンマッチング規則11Aが保持されて
いる。パターンマッチング部11は、与えられた入力文
中にパターンマッチング規則11Aに登録された弱連結
の熟語が分離した状態で存在すると、それがパターンマ
ッチング部11で認識される。パターンマッチング部1
1で弱連結の熟語が認識されると、その熟語が、置換部
12で記号化された一連のパターンに置き換えられる。
置換部12で置換の施された文が解析部13に与えられ
る。解析部13は、記号化された一連のパターンを1つ
の熟語として取り扱って、文の解析を行う。この結果、
解析部13の出力として弱連結の熟語が適切に処理され
た解析結果が得られる。
【0060】このようにして、比較的簡単な構成による
簡単な処理を用いているにもかかわらず、分離して存在
する弱連結の熟語について、一つの熟語として処理する
ことができ、適切な文解析結果を得ることができる。
【0061】〔実施例2〕本発明の第2の実施例による
原理的な規則生成装置を図2を参照して説明する。
【0062】図2に示す規則生成装置は、成句を登録し
て、図1に示した文解析装置のパターンマッチング部1
1で使用するためのパターンマッチング規則11Aを生
成するために用いられ、入力部21および規則生成部2
2を具備する。
【0063】入力部21は、分離して存在する複数の部
分からなる熟語部分に予めマークを付した文を取り込
む。この入力文は、例えば弱連結の熟語部分を括
弧「{」および「}」でくくるなど、予め設定した弱連
結の熟語を示すマークが付された入力文である。これ
は、ユーザが例えばエディタを用いて生成した文であ
る。
【0064】規則生成部22は、入力された文を解析し
て、前記マークが付された分離して存在する複数の部分
からなる熟語部分を処理し、この熟語を認識するための
パターンマッチング規則を生成する。このパターンマッ
チング規則は、図1のパターンマッチング規則11Aと
して使用される。
【0065】前記規則生成部22は、文字列パターンに
よるパターンマッチング規則を生成してもよく、形態素
解析結果のパターンによるパターンマッチング規則を生
成してもよく、構文解析結果のパターンによるパターン
マッチング規則を生成してもよい。
【0066】このようにして、弱連結の熟語を認識する
ためのパターンマッチング規則を生成することができ、
生成されたパターンマッチング規則を用いれば、図1に
示すような文解析装置で、適切な文解析を行うことがで
きる。
【0067】この図2に示した規則生成装置を図1の文
解析装置に組み合わせて言語処理システムを構成しても
よい。 〔実施例3〕本発明の第3の実施例による具体的な規則
生成装置を組み込んだ成句登録システムの構成を図3に
示す。
【0068】図3に示す成句登録システムは、翻訳シス
テム上の成句登録システムであり、成句を登録し、本発
明に係る弱連結の熟語の処理に用いるパターンマッチン
グ規則を生成するシステムである。
【0069】この成句登録システムでは、ユーザが例え
ば対訳エディタ上で登録したい成句を括弧「{」および
「}」で囲んで指定するだけで、自動的に成句の辞書登
録を行い、同時にパターンマッチング規則の自動生成も
行う。すなわち、成句登録システムは、ユーザが登録し
たい成句を指定して入力すると、その成句を含む文章の
形態素解析を行い、その成句の辞書エントリを形態素解
析を行い、その成句の辞書エントリを形態素結果から自
動的に生成し、翻訳用辞書に登録する。また、辞書登録
の処理と共に、弱連結熟語の場合は、翻訳の際に使用す
るパターンマッチング規則を自動生成する。
【0070】図3の成句登録システムは、成句入力部3
1、形態素解析部32、未登録語チェック部33、マッ
チング規則生成部34、未登録語登録部35、辞書エン
トリ生成部36および成句辞書登録部37を具備する。
【0071】〈成句入力部31〉成句入力部31は、対
訳エディタ上でユーザが正しい訳語に修正し、登録した
い部分すなわち成句を括弧「{」および「}」で囲んだ
データをファイル入力すると、システムが指定括弧のチ
ェック、つまり入れ子や非対応のチェックを行い、括弧
で囲まれた部分のみを抽出して成句データとして格納す
る。
【0072】例えば、翻訳の結果として次のような原文
および訳文例えば英訳文が得られたとする。 原文:彼は学位を簡単に取得するつもりだ。
【0073】訳文:He will easily acquire the degre
e. これを、ユーザが対訳エディタ上で修正し、登録したい
成句部分を括弧で囲んで次のような原文および訳文を得
る。
【0074】原文:彼は{学位を}簡単に{取得}する
つもりだ。 訳文:He will {take a degree} easily. この修正された原文と訳文とをシステムに入力する。成
句入力部31は、成句データを抽出し、次のような成句
データとして格納する。
【0075】〔成句データ〕 日本語:学位を取得 英語:take a degree 〈形態素解析部32〉形態素解析部32は、入力文章の
形態素解析を行い、形態素毎に解析用辞書D1から品詞
活用情報等を抽出する。
【0076】この場合、先に述べたような文章が入力さ
れている。まず、次のように形態素に分割する。 日本語:彼/は/学位/を/簡単/に/取得/する/つ
もり/だ。
【0077】次に、それぞれの形態素毎に辞書を引き品
詞および形態情報を得る。 品詞 形態 彼 人称代名詞 自立語 人間 は 係助詞 付属語 … 学位 普通名詞 自立語 … を 格助詞 付属語 … 簡単 形容詞 語幹 に 形容詞 語尾 取得 サ変名詞 自立語 … する サ変名詞接続 終止、連体同形 付属語(語尾) … つもり 終止形接続型助詞 付属語 だ 副助詞 終止形 … 。 句点 付属語 … 英語についても同様に形態素に分割する。
【0078】英語:He/will/takes/a/degree/easily. それぞれの形態素毎に辞書を引き品詞および形態情報を
得る。 品詞 単・複 He 人称代名詞 不規則(原形:it;複数:they) … will 助動詞 − … take 動詞 規則的 … a 冠詞 − … degree 名詞 規則的 … easily 副詞 − … . 終止符 − 〈未登録語チェック部33〉未登録語チェック部33
は、日本語および英語のそれぞれについて未登録語のチ
ェックを行い、成句部分に未登録語が含まれている場合
は、未登録語登録部35に与えて未登録語の処理に供す
る。
【0079】〈マッチング規則生成部34〉マッチング
規則生成部34は、形態素解析後の入力文章に基づいて
成句のパターンマッチングのためのマッチング規則を生
成する。この場合、使用するパターンマッチングの形態
に応じて、それぞれ弱連結熟語である成句を次のような
置き換え記号に置き換えるマッチング規則を生成する。
【0080】(a) 文字列マッチング 文字列マッチングの場合、ユーザの指定した成句の文字
列パターンとそれに対応する置き換え記号とを規則ファ
イルR1に登録する。
【0081】マッチング規則ファイルR1には、例えば
次のような情報が登録される。 <学位を*取得> … 置き換え記号 学位を … 成句パターン 取得 (b) 形態素解析結果を用いたマッチング 形態素解析結果を用いたマッチングの場合、ユーザの指
定した成句のパターンとそれを構成する形態素の辞書情
報と置き換え記号とをマッチング規則ファイルR1に登
録する。
【0082】マッチング規則ファイルR1には、例えば
次のような情報が登録される。 <学位を*取得> … 置き換え記号 学位 普通名詞 自立語 … 形態素解析結果 を 格助詞 付属語 … 取得 サ変名詞 自立語 … (c) 構文解析結果を用いたマッチング 構文解析結果を用いたマッチングの場合、ユーザの指定
した成句のパターンとそれを構成する形態素の辞書情報
と置き換え記号とをマッチング規則ファイルR1に登録
する。
【0083】マッチング規則ファイルR1には、例えば
次のような情報が登録される。 <学位を*取得> … 置き換え記号 学位 … 形態素 を 取得 取得 →<obj>→ 学位 … 構文解析結果 〈未登録語登録部35〉未登録語登録部35は、与えら
れた未登録語について、簡易辞書エディタまたは未登録
語処理によって解析用辞書D1に登録する。
【0084】〈辞書エントリ生成部36〉辞書エントリ
生成部36は、形態素解析部2で解析用辞書D1を用い
た解析結果A1の形態素の辞書エントリに基づいて成句
の辞書エントリを生成する。
【0085】例えば次のような辞書エントリが生成され
る。 <学位を*取得> 動詞 自立語 take a degree 動詞 規則的 … 〈成句辞書登録部37〉成句辞書登録部37は、辞書エ
ントリ生成部36で生成されたデータを翻訳用辞書D2
に登録する。
【0086】次に、このような構成の成句登録システム
の動作について、図4に示すフローチャートを参照して
説明する。システムがスタートすると、成句入力部31
により入力された登録対象の表現(例えば、登録しよう
とする成句部分に括弧「{}」を付した文)の文字列パ
ターンを読み込む(ステップS11)。登録の前処理と
して、読み込まれた表現中の記号(例えば、登録しよう
とする成句部分の括弧「{}」)の構文をチェックし
(ステップS12)、構文が正しくない場合には、エラ
ーメッセージの表示等により構文エラーを報告して(ス
テップS13)処理を終了する。
【0087】ステップS12で構文が正しいと判定され
た場合は、登録のために必要なレベルで文字列パターン
の解析、例えば形態素解析を形態素解析部32で行う
(ステップS14)。
【0088】ステップS14の解析結果に基づき、マッ
チング規則生成部34で、入力された表現の文字列パタ
ーンの内容が登録可能であるか否か(例えば動詞表現を
対象としたシステムに名詞表現が入力されていないかの
確認等)を判定し(ステップS15)、登録可能でない
場合には、エラーメッセージの表示等により登録不能を
報告して(ステップS16)処理を終了する。
【0089】ステップS15で、パターンの内容が登録
可能であると判定された場合は、マッチング規則生成部
34および辞書エントリ生成部36で、原文置き換え規
則または専用単語等の登録情報が作成され(ステップS
17)、マッチング規則ファイルR1および翻訳用辞書
D2に登録されて(ステップS18)、処理を終了す
る。
【0090】次に、このようなシステムにおける具体的
な処理の例について説明する。例えば、「彼は{腹の}
たいへん{大きい}人だ。」(括弧「{}」で囲まれた
区間の解釈は「寛大な」)という表現がステップS11
で読み込まれた場合、ステップS12では、括弧「{」
と「}」との対応関係に矛盾がないか、括弧「{」
と「}」との重なりがないかが確認される。
【0091】この場合、例えば、「彼は{腹のたいへん
{大きい}人だ。」となっているようなときに不正デー
タとなる。ステップS14では、入力表現が次のように
例えば形態素に区切られるとともに、括弧の位置が認識
される。
【0092】「彼/は/{腹/の}/たいへん/{大き
/い}/人/だ。」あらかじめシステムに登録しておい
た登録可能な形態素のパターンを (名詞)(助詞)〜(形容詞語幹)(形容詞連体語尾) とすると、入力された括弧「{}」区間の内容がこのパ
ターンに適合するか否かがステップS15で判定され
る。
【0093】ステップS17では、与えられた熟語をそ
の解釈(寛大な)と置き換えるための例えば次のような
書き換え規則を生成する。 [*A]腹 の [*B]大き い [*C] (名)(助) (形・語幹)(形・連体) →[*A][*B]寛大 な [*C] (形・語幹)(形・連体) (ここで、[*A]、[*B]、[*C]は、それぞ
れ、任意の形態素並びとマッチし、「→」の右辺にそれ
ぞれの内容が複写されるものとする。(名)、(助)、
(形・語幹)および(形・連体)は、それぞれ(名
詞)、(助詞)、(形容詞語幹)および(形容詞連体語
尾)を意味する。) ステップS18で上述のような書き換え規則がシステム
に登録される。このようにして、成句登録システムは、
ユーザが登録したい成句を指定して入力すると、その成
句を含む文章の形態素解析を行い、その成句の辞書エン
トリを形態素解析を行い、その成句の辞書エントリを形
態素結果から自動的に生成し、翻訳用辞書に登録する。
また、辞書登録の処理と共に、弱連結熟語の場合は、翻
訳の際に使用するパターンマッチング規則を自動生成す
る。
【0094】〔実施例4〕本発明の第4の実施例による
具体的な文解析装置を組み込んだ機械翻訳システムの構
成を図5に示す。
【0095】翻訳システムは、ユーザが翻訳したい文章
を入力し、その文章の形態素解析を行い、その結果に対
してパターンマッチングを行い、弱連結熟語が含まれて
いる場合は、弱連結熟語用の辞書見出しに置き換えを行
い、翻訳用辞書を用いて翻訳する。この翻訳システム
は、パターンマッチング規則に従ってパターンマッチン
グを行うことにより文章中に成句が弱連結の形であらわ
れた場合にも正しい解析を行い、正しい翻訳結果を出力
することができる。
【0096】図5の翻訳システムは、形態素解析部4
1、パターンマッチング部42および翻訳部43を具備
しており、図3の実施例の成句登録システムにより得ら
れる翻訳用辞書D2とマッチング規則ファイルR1を用
いる。
【0097】〈形態素解析部41〉形態素解析部41
は、ユーザが入力した原言語(例えば日本語)の文章の
形態素解析をする。例えば「彼は学位を簡単に取得する
つもりだ。」という文を形態素解析により形態素に分割
すると次のようになる。
【0098】彼は/学位/を/簡単に/取得/する/つ
もり/だ。 〈パターンマッチング部42〉パターンマッチング部4
2は、例えば図3の成句登録システムにおけるマッチン
グ規則生成部34で生成されたマッチング規則ファイル
R1の規則に従って、登録パターンが文章中に存在する
かどうかをチェックする。もしも登録パターンが存在す
れば、翻訳用辞書D2に登録されているパターンの見出
しに置き換える。
【0099】例えば、次のような文が入力されたとす
る。 彼は学位を簡単に取得するつもりだ。 この文から、マッチング規則により、次のように登録パ
ターン(「」でくくられている)を認識する。
【0100】彼は「学位を」簡単に「取得」するつもり
だ。 このようなパターンが認識されると、パターンマッチン
グ部42は、認識されたパターンを文章から除き、パタ
ーンの存在していた右端部分に置き換え記号を挿入し
て、次のような文を得る。
【0101】彼は簡単に〈学位を*取得〉するつもり
だ。 〈翻訳部43〉翻訳部43は、翻訳用辞書D2を用いて
原言語(例えば日本語)から目標言語(例えば英語)へ
の翻訳を行う。
【0102】すなわち、翻訳処理は次のように行われ
る。 入力文を:「彼は学位を簡単に取得するつもりだ。」 とすると、 パターンマッチング/置換により:「彼は簡単に〈学位
を*取得〉するつもりだ。」 となる。これを翻訳した翻訳結果として:"He will tak
e a degree easily." が得られる。
【0103】次に、このような構成の機械翻訳システム
の詳細な動作について、図6に示すフローチャートを参
照して説明する。システムがスタートすると、翻訳用の
熟語処理規則すなわちパターンマッチング規則がシステ
ムに読み込まれる(ステップS21)。次に入力文が終
わりであるか否かが判定され(ステップS22)、入力
文が終わりでなければ(未入力も含む)、入力文の読み
込みが行われる(ステップS23)。
【0104】ステップS23で読み込まれた入力文に対
し、熟語処理レベルでの解析が行われ(ステップS2
4)、規則適用の可否が判定される(ステップS2
5)。ステップS25で、規則適用が可能であると判定
された場合は、熟語処理規則が適用され(ステップS2
6)、さらに熟語データに適合しているか否かが判定さ
れる(ステップS27)。ステップS27で、熟語デー
タに適合していると判定された場合は、熟語データを利
用して翻訳処理が行われ、翻訳出力が作成される(ステ
ップS28)。
【0105】ステップS27で熟語データに適合してい
ないと判定された場合、およびステップS25で規則適
用が不可能と判定された場合は、通常の方法で翻訳処理
が行われ、翻訳出力が作成される(ステップS29)。
【0106】ステップS28およびステップS29で出
力が作成されると、作成された翻訳結果が出力され(ス
テップS30)、ステップS22へ戻る。ステップS2
2では、入力文が終わりであれば処理を終了する。
【0107】次に、具体的な例について説明する例えば
規則として次のような規則が読み込まれる。 *A「腹の」*B「大きい」*C →*A*B<GENEROUS>*C ここでは、文字列レベルの書き換えを行うものとし、*
A、*B、*Cは、それぞれ、任意の文字列に照合す
る。「→」の右辺では、*A、*B、*Cは、それぞれ
の照合内容が展開されるものとする。つづり、「<GENE
ROUS>」は、通常の入力に現れないつづりであるとし、
この単語は英語に訳すと"generous"という形容詞である
として、機械翻訳用の日英辞書D2に対応づけられてい
るものとする(これは書き換え規則とともに設定され
る)。
【0108】ステップS23では、例えば「彼は腹の大
きい人だ。」という文が入力される。ステップS24で
は、文字列レベルの場合は文字コード列の文を日本語文
字の単位に区切る。なお、形態素レベルの処理の場合
は、形態素解析を行う。
【0109】ステップS25では、用意された規則の左
辺と照合される。例えば、*A=「彼は」、*B
=「」、*C=「人だ」に該当するか否かが調べられ
る。ステップS26では、規則の右辺に従って文が合成
される。例えば「彼は<GENEROUS>人だ」となる。
【0110】ステップS27およびステップS28で、
つづり<GENEROUS>が、熟語用データとして翻訳され
る。ステップS30で、例えば "He is a generous man." という文が出力される。
【0111】このようにして翻訳が行われる。もちろ
ん、図3の成句登録システムと図5の機械翻訳システム
とを組み合わせて構成してもよい。なお、このような、
弱連結の表現としては、日英翻訳の例として次のような
ものがある。
【0112】 鼻が〜高い → proud 上手に〜を利用する → make good use of … 戸口まで〜を送って出る → see … to the door 不意に〜と出会う → drop in with … また、英文の例としては、次のようなものがある。
【0113】 I {agree} very well {with} him. (意見が一致する) He {appeared to} me {in a dream}. (夢枕に立つ) このようにして、弱連結の熟語について効果的な文解析
を行うことができる。
【0114】なお、本発明による文解析は、機械翻訳シ
ステムに限らず、キーワード検索および自然言語で簡単
な文を解析するシステム等に適用することもできる。
【0115】
【発明の効果】本発明により次のような効果を得ること
ができる。本発明の第1の方法および装置によれば、在
来のシステムにパターンマッチングと置き換え機能を付
け加えるだけで、従来不可能であった弱連結熟語を含む
文章の解析を正しく行うことができる。
【0116】本発明の第2の方法および装置によれば、
第1の方法および装置で使用するパターンマッチング規
則を自動生成することにより、ユーザの手間をはぶくこ
とができる。
【0117】本発明の第3の方法および装置によれば、
パターンマッチング規則を自動生成し、それを用いて置
き換えを行うことにより、従来不可能であった弱連結熟
語を含む文章の解析を容易に正しく行うことができる。
【0118】なお、文字列マッチングを用いてパターン
マッチングを行うことにより、他の方法より高速に熟語
認識を行うことができる。また、形態素解析結果を用い
てパターンマッチを行うことで、同音異義が多数存在す
る単語を含む文章について、正確な熟語認識を行うこと
ができる。
【0119】さらに、構文解析結果を用いてパターンマ
ッチを行うことで、掛かり受け関係が複雑な文章につい
ても正確な熟語認識を行うことができる。
【図面の簡単な説明】
【図1】本発明に係る第1の実施例による文解析装置の
構成を示すブロック図である
【図2】本発明に係る第2の実施例による文解析の規則
生成装置の構成を示すブロック図である
【図3】本発明に係る第3の実施例による文解析装置を
含む成句登録システムの構成を示すブロック図である
【図4】図3の成句登録システムの動作を説明するため
のフローチャートである
【図5】本発明に係る第4の実施例による文解析装置を
含む機械翻訳システムの構成を示すブロック図である
【図6】図5の機械翻訳システムの動作を説明するため
のフローチャートである
【符号の説明】
11、42…パターンマッチング部 11A…パターンマッチング規則 12…置換部 13…解析部 21…文入力部 22…規則生成部 31…成句入力部 32、41…形態素解析部 33…未登録語チェック部 34…マッチング規則生成部 35…未登録語登録部 36…辞書エントリ部 37…成句辞書登録部 43…翻訳部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松井 くにお 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 杉山 健司 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 颯々野 学 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 塩津 誠 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内

Claims (31)

    【特許請求の範囲】
  1. 【請求項1】 分離して存在し得る複数の部分からなる
    熟語についてのパターンマッチング規則を用意し、この
    パターンマッチング規則を基に、文のパターンマッチン
    グを行って分離して存在する前記熟語を認識するパター
    ンマッチングステップと、 このパターンマッチングで認識された前記熟語を構成す
    る複数の部分を記号化された一連のパターンに置き換え
    る置換ステップと、 この置換ステップで置換された文を解析する解析ステッ
    プとを有することを特徴とする文解析方法。
  2. 【請求項2】 パターンマッチングステップは、文字列
    パターンによるパターンマッチングを行うステップを含
    むことを特徴とする請求項1の文解析方法。
  3. 【請求項3】 パターンマッチングステップは、形態素
    解析結果のパターンによるパターンマッチングを行うス
    テップを含むことを特徴とする請求項1の文解析方法。
  4. 【請求項4】 パターンマッチングステップは、構文解
    析結果のパターンによるパターンマッチングを行うステ
    ップを含むことを特徴とする請求項1の文解析方法。
  5. 【請求項5】 分離して存在する複数の部分からなる熟
    語部分にマークを付した文を取り込む入力ステップと、 入力された文を解析して、前記マークが付された分離し
    て存在する複数の部分からなる熟語部分を認識するため
    のパターンマッチング規則を生成する規則生成ステップ
    と、 前記規則生成ステップで生成されたパターンマッチング
    規則を基に、文のパターンマッチングを行って分離して
    存在する前記熟語を認識するパターンマッチングステッ
    プと、 このパターンマッチングステップで認識された前記熟語
    を構成する複数の部分を記号化された一連のパターンに
    置き換える置換ステップと、 この置換ステップで置換された文を解析する解析ステッ
    プとを有することを特徴とする文解析方法。
  6. 【請求項6】 規則生成ステップは、文字列パターンに
    よるパターンマッチング規則を生成するステップを含む
    ことを特徴とする請求項5の文解析方法。
  7. 【請求項7】 パターンマッチングステップは、文字列
    パターンによるパターンマッチングを行うステップを含
    むことを特徴とする請求項6の文解析方法。
  8. 【請求項8】 規則生成ステップは、形態素解析結果の
    パターンによるパターンマッチング規則を生成するステ
    ップを含むことを特徴とする請求項5の文解析方法。
  9. 【請求項9】 パターンマッチングステップは、形態素
    解析結果のパターンによるパターンマッチングを行うス
    テップを含むことを特徴とする請求項8の文解析方法。
  10. 【請求項10】 規則生成ステップは、構文解析結果の
    パターンによるパターンマッチング規則を生成するステ
    ップを含むことを特徴とする請求項5の文解析方法。
  11. 【請求項11】 パターンマッチングステップは、構文
    解析結果のパターンによるパターンマッチングを行うス
    テップを含むことを特徴とする請求項10の文解析方
    法。
  12. 【請求項12】 分離して存在する複数の部分からなる
    熟語部分にマークを付した文を取り込む入力ステップ
    と、 入力された文を解析して、前記マークが付された分離し
    て存在する複数の部分からなる熟語部分を認識するため
    のパターンマッチング規則を生成する規則生成ステップ
    とを有することを特徴とする規則生成方法。
  13. 【請求項13】 規則生成ステップは、文字列パターン
    によるパターンマッチング規則を生成するステップを含
    むことを特徴とする請求項12の文解析方法。
  14. 【請求項14】 規則生成ステップは、形態素解析結果
    のパターンによるパターンマッチング規則を生成するス
    テップを含むことを特徴とする請求項12の文解析方
    法。
  15. 【請求項15】 規則生成ステップは、構文解析結果の
    パターンによるパターンマッチング規則を生成するステ
    ップを含むことを特徴とする請求項12の文解析方法。
  16. 【請求項16】 分離して存在し得る複数の部分からな
    る熟語についてのパターンマッチング規則を保持し、こ
    のパターンマッチング規則を基に、文のパターンマッチ
    ングを行って分離して存在する前記熟語を認識するため
    のパターンマッチング手段(11)と、 このパターンマッチング手段(11)で認識された前記
    熟語を構成する複数の部分を記号化された一連のパター
    ンに置き換えるための置換手段(12)と、 この置換手段(12)で置換された文を解析するための
    解析手段(13)とを具備することを特徴とする文解析
    装置。
  17. 【請求項17】 パターンマッチング手段(11)は、
    文字列パターンによるパターンマッチングを行うための
    手段を含むことを特徴とする請求項16の文解析装置。
  18. 【請求項18】 パターンマッチング手段(11)は、
    形態素解析結果のパターンによるパターンマッチングを
    行うための手段を含むことを特徴とする請求項16の文
    解析装置。
  19. 【請求項19】 パターンマッチング手段(11)は、
    構文解析結果のパターンによるパターンマッチングを行
    うための手段を含むことを特徴とする請求項16の文解
    析装置。
  20. 【請求項20】 分離して存在する複数の部分からなる
    熟語部分にマークを付した文を取り込むための入力手段
    (21)と、 入力された文を解析して、前記マークが付された分離し
    て存在する複数の部分からなる熟語部分を認識するため
    のパターンマッチング規則を生成するための規則生成手
    段(22)と、 前記規則生成手段(22)で生成されたパターンマッチ
    ング規則を基に、文のパターンマッチングを行って分離
    して存在する前記熟語を認識するためのパターンマッチ
    ング手段(11)と、 このパターンマッチング手段(11)で認識された前記
    熟語を構成する複数の部分を記号化された一連のパター
    ンに置き換えるための置換手段(12)と、 この置換手段(12)で置換された文を解析するための
    解析手段(13)とを具備することを特徴とする文解析
    装置。
  21. 【請求項21】 規則生成手段(22)は、文字列パタ
    ーンによるパターンマッチング規則を生成するための手
    段を含むことを特徴とする請求項20の文解析装置。
  22. 【請求項22】 パターンマッチング手段(11)は、
    文字列パターンによるパターンマッチングを行うための
    手段を含むことを特徴とする請求項21の文解析装置。
  23. 【請求項23】 規則生成手段(22)は、形態素解析
    結果のパターンによるパターンマッチング規則を生成す
    るための手段を含むことを特徴とする請求項20の文解
    析装置。
  24. 【請求項24】 パターンマッチング手段(11)は、
    形態素解析結果のパターンによるパターンマッチングを
    行うための手段を含むことを特徴とする請求項23の文
    解析装置。
  25. 【請求項25】 規則生成手段(22)は、構文解析結
    果のパターンによるパターンマッチング規則を生成する
    ための手段を含むことを特徴とする請求項20の文解析
    装置。
  26. 【請求項26】 パターンマッチング手段(11)は、
    構文解析結果のパターンによるパターンマッチングを行
    うための手段を含むことを特徴とする請求項25の文解
    析装置。
  27. 【請求項27】 分離して存在する複数の部分からなる
    熟語部分にマークを付した文を取り込むための入力手段
    (21)と、 入力された文を解析して、前記マークが付された分離し
    て存在する複数の部分からなる熟語部分を認識するため
    のパターンマッチング規則を生成するための規則生成手
    段(22)とを具備することを特徴とする規則生成装
    置。
  28. 【請求項28】 規則生成手段(22)は、文字列パタ
    ーンによるパターンマッチング規則を生成するための手
    段を含むことを特徴とする請求項27の文解析装置。
  29. 【請求項29】 規則生成手段(22)は、形態素解析
    結果のパターンによるパターンマッチング規則を生成す
    るための手段を含むことを特徴とする請求項27の文解
    析装置。
  30. 【請求項30】 規則生成手段(22)は、構文解析結
    果のパターンによるパターンマッチング規則を生成する
    ための手段を含むことを特徴とする請求項27の文解析
    装置。
  31. 【請求項31】 分離して存在し得る複数の部分からな
    る熟語についてのパターンマッチング規則を保持し、こ
    のパターンマッチング規則を基に、文のパターンマッチ
    ングを行って分離して存在する前記熟語を認識するため
    のパターンマッチング手段(11)と、 このパターンマッチング手段(11)で認識された前記
    熟語を構成する複数の部分を記号化された一連のパター
    ンに置き換えるための置換手段(12)と、 この置換手段(12)で置換された文を解析して、翻訳
    処理を行うための翻訳処理手段(43)とを具備するこ
    とを特徴とする機械翻訳装置。
JP6068737A 1994-04-06 1994-04-06 文解析方法および装置 Pending JPH07282055A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP6068737A JPH07282055A (ja) 1994-04-06 1994-04-06 文解析方法および装置
US08/412,136 US5842159A (en) 1994-04-06 1995-03-28 Method of and apparatus for analyzing sentence
GB9506952A GB2288258B (en) 1994-04-06 1995-04-04 Method of and apparatus for language processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6068737A JPH07282055A (ja) 1994-04-06 1994-04-06 文解析方法および装置

Publications (1)

Publication Number Publication Date
JPH07282055A true JPH07282055A (ja) 1995-10-27

Family

ID=13382409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6068737A Pending JPH07282055A (ja) 1994-04-06 1994-04-06 文解析方法および装置

Country Status (3)

Country Link
US (1) US5842159A (ja)
JP (1) JPH07282055A (ja)
GB (1) GB2288258B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010515178A (ja) * 2007-01-04 2010-05-06 シンキング ソリューションズ ピーティーワイ リミテッド 言語分析

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6181909B1 (en) * 1997-07-22 2001-01-30 Educational Testing Service System and method for computer-based automatic essay scoring
JP3272288B2 (ja) * 1997-12-24 2002-04-08 日本アイ・ビー・エム株式会社 機械翻訳装置および機械翻訳方法
CN1102271C (zh) * 1998-10-07 2003-02-26 国际商业机器公司 具有习惯用语处理功能的电子词典
US6964011B1 (en) * 1998-11-26 2005-11-08 Canon Kabushiki Kaisha Document type definition generating method and apparatus, and storage medium for storing program
US6535842B1 (en) * 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system
JP4253152B2 (ja) * 2000-01-05 2009-04-08 三菱電機株式会社 キーワード抽出装置
US7346488B2 (en) * 2000-07-10 2008-03-18 Fujitsu Limited Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
JP3662519B2 (ja) * 2000-07-13 2005-06-22 シャープ株式会社 光ピックアップ
GB0030330D0 (en) * 2000-12-13 2001-01-24 Hewlett Packard Co Idiom handling in voice service systems
US20030154069A1 (en) * 2002-02-14 2003-08-14 International Business Machines Corporation Computerized system and method for converting selected text between languages
WO2005033909A2 (en) * 2003-10-08 2005-04-14 Any Language Communications Inc. Relationship analysis system and method for semantic disambiguation of natural language
US7349924B2 (en) * 2004-11-29 2008-03-25 International Business Machines Corporation Colloquium prose interpreter for collaborative electronic communication
CN1992613B (zh) * 2005-12-29 2010-09-08 腾讯科技(深圳)有限公司 一种即时通信号码索回的方法及其系统
US20090210404A1 (en) * 2008-02-14 2009-08-20 Wilson Kelce S Database search control
KR102013230B1 (ko) * 2012-10-31 2019-08-23 십일번가 주식회사 구문 전처리 기반의 구문 분석 장치 및 그 방법
KR102407630B1 (ko) * 2015-09-08 2022-06-10 삼성전자주식회사 서버, 사용자 단말 및 이들의 제어 방법.
US10061770B2 (en) 2016-11-11 2018-08-28 International Business Machines Corporation Multilingual idiomatic phrase translation
US10055400B2 (en) 2016-11-11 2018-08-21 International Business Machines Corporation Multilingual analogy detection and resolution

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) * 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
JPS57152070A (en) * 1981-03-13 1982-09-20 Sharp Corp Electronic interpreter
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS6089275A (ja) * 1983-10-21 1985-05-20 Hitachi Ltd 翻訳方式
JP2815714B2 (ja) * 1991-01-11 1998-10-27 シャープ株式会社 翻訳装置
JPH05314166A (ja) * 1992-05-08 1993-11-26 Sharp Corp 電子化辞書および辞書検索装置
US5541838A (en) * 1992-10-26 1996-07-30 Sharp Kabushiki Kaisha Translation machine having capability of registering idioms

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010515178A (ja) * 2007-01-04 2010-05-06 シンキング ソリューションズ ピーティーワイ リミテッド 言語分析

Also Published As

Publication number Publication date
GB2288258A (en) 1995-10-11
US5842159A (en) 1998-11-24
GB2288258B (en) 1998-07-01
GB9506952D0 (en) 1995-05-24

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
JPH07282055A (ja) 文解析方法および装置
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
KR101099177B1 (ko) 기계 번역기를 훈련하기 위한 방법 및 시스템
JPH0782498B2 (ja) 機械翻訳システム
JPH077419B2 (ja) 機械翻訳装置における略称付き固有名詞処理方法
Khan et al. Translation divergence patterns handling in English to Urdu machine translation
US5299124A (en) Translation machine capable of analyzing syntactic of sentence
Gakis et al. Design and construction of the Greek grammar checker
JP2007518164A (ja) 自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体
JPH0855123A (ja) イディオム登録機能を有する機械翻訳装置
JPS59140582A (ja) 自然言語翻訳援助方式
Gasser A dependency grammar for Amharic
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Kitamura et al. Practical machine translation system allowing complex patterns
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2002297585A (ja) 英文名詞句の区分方法,英文構文情報生成方法および装置
JP3701050B2 (ja) 文書形態素解析装置
JPH05282289A (ja) 文書作成装置
JP2001337945A (ja) 自動編集装置及び方法並びにこれに利用される記憶媒体
Skadiņa et al. Comprehension Assistant for Languages of Baltic States
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP2839419B2 (ja) イディオム登録機能を持つ機械翻訳装置
JPH0658672B2 (ja) 機械翻訳システム
JPH07141382A (ja) 外国語文書作成支援装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021210