JPH06274192A - 自然言語解析方式 - Google Patents

自然言語解析方式

Info

Publication number
JPH06274192A
JPH06274192A JP5063605A JP6360593A JPH06274192A JP H06274192 A JPH06274192 A JP H06274192A JP 5063605 A JP5063605 A JP 5063605A JP 6360593 A JP6360593 A JP 6360593A JP H06274192 A JPH06274192 A JP H06274192A
Authority
JP
Japan
Prior art keywords
input sentence
natural language
surface layer
sentence
layer pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5063605A
Other languages
English (en)
Other versions
JPH0769710B2 (ja
Inventor
Kura Furuse
蔵 古瀬
Eiichiro Sumida
英一郎 隅田
Hitoshi Iida
仁 飯田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
A T R JIDO HONYAKU DENWA KENKYUSHO KK
ATR JIDO HONYAKU DENWA
Original Assignee
A T R JIDO HONYAKU DENWA KENKYUSHO KK
ATR JIDO HONYAKU DENWA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by A T R JIDO HONYAKU DENWA KENKYUSHO KK, ATR JIDO HONYAKU DENWA filed Critical A T R JIDO HONYAKU DENWA KENKYUSHO KK
Priority to JP5063605A priority Critical patent/JPH0769710B2/ja
Publication of JPH06274192A publication Critical patent/JPH06274192A/ja
Publication of JPH0769710B2 publication Critical patent/JPH0769710B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 非文法的な文にも対処できる頑強な処理が可
能な自然言語解析方式を提供する。 【構成】 形態素解析モジュール1は、入力文の単語分
割の処理を行ない、各単語からのインデックスにより照
合可能な表層パターンを検索する。表層パターン照合モ
ジュール2は検索された表層パターンを入力文と照合し
て構造の候補を作る。解析補助モジュール3は、必要に
応じて助詞の補完など入力文の修正を行ない、表層パタ
ーン照合モジュール21が入力文に表層パターンを照合
できるよう助ける。最尤構造決定モジュール4は、入力
単語と表層パターンの用例単語間の意味的距離を計算
し、最尤の構造を決定して出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は自然言語解析方式に関
し、特に、表層語句を活用して処理を行なうような自然
言語解析方式に関する。
【0002】
【従来の技術】自然言語処理システムに対する社会的ニ
ーズはますます増大し、研究もさかんに行なわれてい
る。たとえば、機械翻訳技術においては、書き言葉翻訳
だけでなく、自動翻訳電話などの話し言葉翻訳の技術開
発が最近行なわれるようになっている。書き言葉翻訳と
違って、話し言葉翻訳を実現するには、荒い内容でも答
えを常に出力する頑強な処理が必要とされる。
【0003】
【発明が解決しようとする課題】しかしながら、複雑な
文法を基に精密な分析を行なう従来の方法は、文法か
らしばしば逸脱する話し言葉の解析には向いていない、
複雑な文法規則を書くには熟練を要し、規則が膨大に
なったとき規則間の矛盾検出などの管理作業が困難にな
る、膨大な数の曖昧な構造を生成する、文法規則を
照合するアルゴリズムが複雑になる、処理時間がかか
る、など多くの問題が生じている。
【0004】それゆえに、この発明の主たる目的は、非
文法的な文にも対処できる頑強な処理ができる自然言語
解析方式を提供することである。
【0005】
【課題を解決するための手段】請求項1に係る発明は、
入力された自然言語文の構造を把握する自然言語解析方
式であって、表層パターンの組合わせと入力文を照合す
るようにしたものである。
【0006】より好ましくは、請求項1の表層パターン
は、表層の語句と変数とによって記述される。
【0007】さらに、より好ましくは、請求項2の表層
パターンは、入力文の各語を持つインデックスにより検
索される。
【0008】さらに、請求項3で検索された表層パター
ンを組合わせて入力文と照合させ、入力文と照合に成功
した表層パターンの組合わせを構造の候補とする。
【0009】請求項4の表層パターンは、複文のような
大きい言語的単位のものから、単語のような小さな言語
的単位のものへと入力文を照合させていく。
【0010】より好ましくは、請求項4の表層パターン
を入力文に照合できるように必要時に入力文の修正を行
なう。
【0011】請求項4の表層パターンは、変数を具体化
する語を用例として持つ。請求項7の用例と入力文の語
の間の意味的距離により、構造の候補から最尤の構造を
決定し出力する。
【0012】
【作用】この発明に係る自然言語解析方式は、表層パタ
ーンの組合わせと入力部を照合して自然言語を解析する
ことにより、非文法的な文にも対処できる頑強な処理技
術を実現できる。
【0013】
【実施例】図1はこの発明の一実施例の概略ブロック図
である。図1において、この発明に係る自然言語解析処
理方式は、形態素解析モジュール1と表層パターン照合
モジュール2と解析補助モジュール3と最尤構造決定モ
ジュール4とによって実現される。形態素解析モジュー
ル1は内蔵されている辞書を参照して、単語分割や品詞
・活用などの情報の付与を行なう。単語からは表層パタ
ーンのインデックスが用意される。たとえば、「たい」
は表層パターン「Xたいのですが」へのインデックスを
持っている。表層パターンは、「Xたいのですが」や
「XのY」のように、単文や名詞句などの言語的単位
を、表層語句および変数により記述したものである。な
お、X,Yは変数を示す。入力文の各単語が持つインデ
ックスにより入力文に照合可能な表層パターンを絞り込
む。
【0014】表層パターン照合モジュール2は、絞り込
まれた表層パターンを組合わせて入力文の構造を作り上
げる。表層パターンは、複文レベルの大きな単位のもの
から、単語レベルの小さな単位のものまでいくつかの言
語的単位により分類され、表層パターンを効率的に入力
文に照合させる。
【0015】図2はこの発明が適用される代表的な表層
パターンを、言語的単位の大きなものから小さなものへ
と並べて示した図である。
【0016】ここで、入力文と表層パターンの照合のア
ルゴリズムについて説明する。(0) 形態素解析モジ
ュール1によって得られた表層パターンの中から最も大
きい言語的単位のものについて(1)を実行する。
【0017】(1) 表層パターンを、入力文に照合さ
せる。照合が成功すれば(2)を行なう。失敗すれば
(3)を実行する。
【0018】(2) (1)において照合に成功したの
が、変数を持たない表層パターンならば、その部分の照
合は成功して終了する。そうでなければ表層パターンの
各変数部について(1)を実行する。
【0019】(3) 表層パターンの言語的単位を下げ
(1)を実行する。これ以上言語的単位を下げられない
なら照合は失敗として終了する。
【0020】このアルゴリズムは、最も大きな言語的単
位のものから小さな言語的単位のものへと表層パターン
を入力文に照合していく。入力文のすべての部分につい
て照合が成功すれば、照合した表層パターンの組合わせ
結果を構造とする。たとえば、「会議に申し込みたいの
ですが」という文に対しては、照合可能な表層パターン
の中で最も言語的単位が大きな、単文単位の表層パター
ン「Xたいのですが」をまず文全体に照合する。
【0021】次に、「Xたいのですが」の変数部を具体
化する「会議に申込み」に格関係単位の表層パターン
「XにY」を照合する。さらに、「XにY」の変数X,
Yにそれぞれ「会議」「申込み」という単語単位の表層
パターンを照合し、入力文が表層パターンの組合わせと
完全に照合したことになる。その結果、構造として (((会議)に(申込み))たいのですが) が得られる。
【0022】解析補助モジュール3は、そのままの入力
文の状態では入力文に表層パターンが照合できないとき
に起動され、表層パターンを入力文に照合できるように
補助規則により入力文を修正する。補助規則は表層パタ
ーンを照合できるように入力文について正規化などの操
作を行なう。たとえば、「それ出席する」という入力文
において直接、表層パターンは照合できない。そこで、
次の補助規則により入力文を修正する。
【0023】代名詞 動詞→代名詞 に 動詞 ((そ
れ、参加する),…) 代名詞 を 動詞 ((これ、送る),…) 補助規則は品詞などの文法カテゴリを使って記述され、
各文法カテゴリを具体化する単語用例を照合条件として
記述する。上の補助規則は、代名詞と動詞が連続したと
きに助詞を補完する。たとえば、「それ 参加する」と
いう代名詞と動詞の語系列は「に」という助詞が補完さ
れ、「それに参加する」と修正される。「これ 送る」
については「を」という助詞が補完され、「これを送
る」と修正される。この補助規則により、入力文「それ
出席する」には、(それ、出席する)と(それ、参加す
る)の意味的距離の近さから、助詞「に」が補完され
「それに出席する」と修正される。また、補完された助
詞「に」より、「XにY」が、照合可能な表層パターン
として新たに検索される。その後、表層パターン照合モ
ジュール2において、表層パターン「XにY」が入力文
に照合され、 ((それ)に(出席する)) という構造が得られる。
【0024】最尤構造決定モジュール4は、表層パター
ン照合モジュール2で得られた構造の中から、入力単語
と表層パターンの用例単語間の意味的距離を求め、最も
距離の総和が小さいものを最適の構造と決定する。
【0025】図3はこの発明のパターン照合による自然
言語解析方式の基本的な処理の流れを示す図である。次
に、図3を参照して、次に示す文(1)を解析する具体
例について説明する。
【0026】(1) 「京都ホテルの1万円の部屋お願
いします。」 まず、形態素解析モジュール1で入力文の単語分割の処
理を行なう。そして、文(1)の各単語からのインデッ
クスにより照合可能な表層パターンを検索する。たとえ
ば、入力文の語「の」からは「XのY」という表層パタ
ーンが検索される。
【0027】表層パターン照合モジュール2は、形態素
解析モジュール1で検索された表層パターンを入力文に
照合しようとするが、助詞が脱落しているため、照合に
失敗する。
【0028】普通名詞 動詞→普通名詞 を 動詞
((部屋、お願いする),…) そこで、解析補助モジュール3は、上の補助規則より、
入力文に助詞「を」を補完し、入力文を (1′)「京都ホテルの1万円の部屋をお願いしま
す。」 と修正する。
【0029】表層パターン照合モジュール2は解析補助
モジュール3の結果を受け、(1′)に表層パターンを
照合しようとする。まず、絞り込まれた表層パターンの
中で最も言語的単位の大きな、単文単位の表層パターン
「Xをお願いします」を照合する。次に「Xをお願いし
ます」の変数Xを満たす「京都ホテルの1万円の部屋」
に表層パターンを照合しようとする。この表現には格関
係単位の「XのY」という表層パターンを照合できる
が、2つの「の」を持つため、入力文に対して次ように
2つの構造が作られる。 (2) (((京都ホテル)の((1万円)の(部
屋)))をお願いします) (3) ((((京都ホテル)の(1万円))の(部
屋))をお願いします) 「XのY」の変数には「京都ホテル」、「1万円」,
「部屋」が照合でき、入力文全体が表層パターンですべ
て構成されたことになる。
【0030】最尤構造決定モジュール4は、入力単語と
表層パターンの用例単語間の意味的距離を計算し、
(2)の構造の距離の総和0.0,(3)の構造の距離
の総和0.5を得る。距離の総和の小さい(2)を
(1)に対する構造として出力する。
【0031】
【発明の効果】以上のように、この発明によれば、入力
文の各語が持つインデックスにより表層パターンを検索
し、検索した表層パターンを複文のような大きい言語的
単位のものから、単語のような小さな言語的単位のもの
へと入力文に照合させて入力文の構造の候補を作り、そ
の候補から入力と用例間の意味的距離の計算により最尤
の構造を決定して出力をするようにしたので、話し言葉
のように文法的に構造を説明するのが難しい文に対して
も構造が求められる頑強な自然言語解析機構を実現でき
る。
【図面の簡単な説明】
【図1】この発明の一実施例の内容を示すブロック図で
ある。
【図2】代表的な表層パターンを言語的単位の大きなも
のから小さなものへと並べて示した図である。
【図3】入力文「京都ホテルの1万円の部屋お願いしま
す」に対する自然言語解析処理の流れを示すブロック図
である。
【符号の説明】
1 形態素解析モジュール 2 表層パターン照合モジュール 3 解析補助モジュール 4 最尤構造決定モジュール
───────────────────────────────────────────────────── フロントページの続き (72)発明者 隅田 英一郎 京都府相楽郡精華町大字乾谷小字三平谷5 番地 株式会社エイ・ティ・アール自動翻 訳電話研究所内 (72)発明者 飯田 仁 京都府相楽郡精華町大字乾谷小字三平谷5 番地 株式会社エイ・ティ・アール自動翻 訳電話研究所内

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力された自然言語文の構造を把握する
    自然言語解析方式であって、 表層パターンの組合わせと入力文を照合することを特徴
    とする、自然言語解析方式。
  2. 【請求項2】 前記表層パターンは、表層の語句と変数
    とによって記述することを特徴とする、請求項1の自然
    言語解析方式。
  3. 【請求項3】 前記表層パターンは、入力文の各語が持
    つインデックスにより検索されることを特徴とする、請
    求項2の自然言語解析方式。
  4. 【請求項4】 前記検索された表層パターンを組合わせ
    て入力文と照合させ、前記入力文と照合に成功した表層
    パターンの組合わせを構造の候補とすることを特徴とす
    る、請求項3の自然言語解析方式。
  5. 【請求項5】 前記表層パターンは、複文のような大き
    い言語的単位のものから、単語のような小さな言語的単
    位のものへと入力文に照合させていくことを特徴とす
    る、請求項4の自然言語解析方式。
  6. 【請求項6】 前記表層パターンを、前記入力文に照合
    できるように、必要時に入力文の修正を行なうことを特
    徴とする、請求項4の自然言語解析方式。
  7. 【請求項7】 前記表層パターンは、変数を具体化する
    語を用例として持つことを特徴とする、請求項4の自然
    言語解析方式。
  8. 【請求項8】 前記用例と前記入力文の語の間の意味的
    距離により、前記構造の候補から、最尤の構造を決定
    し、出力することを特徴とする、請求項7の自然言語解
    析方式。
JP5063605A 1993-03-23 1993-03-23 自然言語解析方法 Expired - Fee Related JPH0769710B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5063605A JPH0769710B2 (ja) 1993-03-23 1993-03-23 自然言語解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5063605A JPH0769710B2 (ja) 1993-03-23 1993-03-23 自然言語解析方法

Publications (2)

Publication Number Publication Date
JPH06274192A true JPH06274192A (ja) 1994-09-30
JPH0769710B2 JPH0769710B2 (ja) 1995-07-31

Family

ID=13234091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5063605A Expired - Fee Related JPH0769710B2 (ja) 1993-03-23 1993-03-23 自然言語解析方法

Country Status (1)

Country Link
JP (1) JPH0769710B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005539249A (ja) * 2002-06-28 2005-12-22 テー−モービレ ドイチェランド ゲーエムベーハー 生成変形句構造文法に基づいて自然言語認識をする方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60200369A (ja) * 1984-03-24 1985-10-09 Mitsubishi Electric Corp 機械翻訳装置
JPS63213068A (ja) * 1987-03-02 1988-09-05 Canon Inc 言語処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60200369A (ja) * 1984-03-24 1985-10-09 Mitsubishi Electric Corp 機械翻訳装置
JPS63213068A (ja) * 1987-03-02 1988-09-05 Canon Inc 言語処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005539249A (ja) * 2002-06-28 2005-12-22 テー−モービレ ドイチェランド ゲーエムベーハー 生成変形句構造文法に基づいて自然言語認識をする方法
JP4649207B2 (ja) * 2002-06-28 2011-03-09 テー−モービレ ドイチェランド ゲーエムベーハー 生成変形句構造文法に基づいて自然言語認識をする方法

Also Published As

Publication number Publication date
JPH0769710B2 (ja) 1995-07-31

Similar Documents

Publication Publication Date Title
Palmer et al. Adaptive multilingual sentence boundary disambiguation
Zettlemoyer et al. Learning to map sentences to logical form: Structured classification with probabilistic categorial grammars
Thede et al. A second-order hidden Markov model for part-of-speech tagging
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US8392188B1 (en) Method and system for building a phonotactic model for domain independent speech recognition
KR101279707B1 (ko) 문서에서 정의를 식별하는 방법 및 정의 추출 시스템
US20020198713A1 (en) Method and apparatus for perfoming spoken language translation
WO2000045290A1 (en) A method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
Singh et al. The transformers’ ability to implement for solving intricacies of language processing
Su et al. An overview of corpus-based statistics-oriented (CBSO) techniques for natural language processing
Irmawati et al. Exploiting Syntactic Similarities for Preposition Error Corrections on Indonesian Sentences Written by Second Language Learner
Li et al. Combining trigram and automatic weight distribution in Chinese spelling error correction
Mahafdah et al. Arabic Part of speech Tagging using k-Nearest Neighbour and Naive Bayes Classifiers Combination.
JPH06274192A (ja) 自然言語解析方式
Demilie et al. Automated all in one misspelling detection and correction system for Ethiopian languages
Amrani et al. A semi-automatic system for tagging specialized corpora
JPH0844741A (ja) 日本語文時制解析装置及び日本語文時制解析方法
Eutamene et al. Ontologies and Bigram-based Approach for Isolated Non-word Errors Correction in OCR System.
Sampath et al. Hybrid Tamil spell checker with combined character splitting
Marin et al. Learning phrase patterns for ASR name error detection using semantic similarity.
Veronis Correction of phonographic errors in natural language interfaces
Farokhshad et al. ViraPart: A Text Refinement Framework for Automatic Speech Recognition and Natural Language Processing Tasks in Persian

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19960123

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees