JPS6217872A - 日本語理解装置 - Google Patents

日本語理解装置

Info

Publication number
JPS6217872A
JPS6217872A JP60155996A JP15599685A JPS6217872A JP S6217872 A JPS6217872 A JP S6217872A JP 60155996 A JP60155996 A JP 60155996A JP 15599685 A JP15599685 A JP 15599685A JP S6217872 A JPS6217872 A JP S6217872A
Authority
JP
Japan
Prior art keywords
sentence
words
normalization
input
normalized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60155996A
Other languages
English (en)
Inventor
Toshiyuki Funabe
舟部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60155996A priority Critical patent/JPS6217872A/ja
Publication of JPS6217872A publication Critical patent/JPS6217872A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、日本語の意味を理解する日本語理解装置に関
し、より詳細には、質問応答システムや機械翻訳装置な
どに適用しつる日本語理解装置に関する。
従来技術 従来の日本語理解装置にあっては、構文解析や意味抽出
のだめの処理が複雑で、そのために、単語の詳細な意味
情報をすべての単語について備えなければならず、辞書
が大容量化し、処理速度を向上させることが困難である
という問題があった。また、処理速度を向上させようと
すると、ある特定されたパターンの文しか理解すること
ができないという問題があった。
目的 本発明は、上記従来の問題を解決すること、言い換えれ
ば、日本語理解の処理を簡単化して、処理速度を向上さ
せることができる日本語理解装置を提供することを目的
とする。
構成 本発明は、上記目的を達成するため、形態素解析された
入力文の単語を適合する正規化条件に対応した正規化表
現に書き換える文正規化装置を含んでなることを特徴と
したものである。
以下、本発明を一実施例に基づいて具体的に説明する。
第1図に本発明が適用された日本語理解装置を含む一実
施例の質問応答システムの全体ブロック図を、第2図に
その要部である一実施例の文正規化装置のブロック図を
示す。
第1図に示すように、質問応答システムは入力装置10
、形態素解析装置20、文正規化装置30、文理群装置
40、知識ベース検索装置50、出力文生成装置60、
出力装置70から成っている。入力装置10はたとえば
キーボードなどから形成され、形態素解析装置20は入
力装置10を介して入力される日本詔文を、形態素辞書
を用いて単語単位に分割するとともに、キー単語である
ことを表わすキー単語フラグや品詞情報などの形態素情
報を付加して、文正規化装置30に送出する。文正規化
装置3oは後述する手順に従い、キー単語と品詞をキー
として、入力文の意味するところを予め定められた正規
化表現に書き換えることによって、入力文を正規化して
文理群装置4oに送出する。文理群装置40は正規化さ
れた入力文の意味するところを抽出し、知識ベースから
何を検索するかを決定し、検索指令情報を知識ベース検
索装置50に送出する。知識ベース検索装置5oは検索
指令情報に従って、知識ベースから知識を検索して出力
文生成装置60に出力する。出力文生成装置60は検索
された知識に基づいて応答出力文を作成し、たとえばC
RTなどからなる出力装置70に出力する。このように
、入力装置10から入力される質問を理解し、これに対
する応答を出力装置70に出力するようになっている。
文正規化装置30は本発明の主要部であり、第2図に示
すように、キー単語判定部31、単語正規化辞書検索部
32、品詞正規化辞書検索部33、書き換え部34、単
語正規化辞書35、品詞正規化辞書36を含んで形成さ
れている。
単語正規化辞書35と品詞正規化辞書36には、それぞ
れ第3図と第4図に示すように、キー単語単位と品詞単
位に正規化条件a、b、c、d。
・・・とそれに対応する正規化表現A 、 B 、 C
、D。
・・・とが格納されている。なお、正規化条件は前後関
係(・クターン)や品詞などの各種形態素情報を含んだ
ものとなっており、その正規化条件に一致する単語の正
規化表現は、同意語を統一した1つの表現に正規化する
ように定められている。
次に、第2図に示した文正規化装置30の機能を、第5
図に示した処理フローチャートを参照して、動作ととも
に説明する。なお、入力文の例として、次の2つの入力
文1,2を仮定し、これに沿って説明する。
入力文17日本についておしえてください。
入力文2:日本に関して調べて下さい。
まず、入力文1は形態素解析装置20において次のよう
に解析されたとする。
(S(日本(品詞2名詞)(キーni7 )・・・))
(について(品詞、助詞)(キーT)・・・))(おし
えてください(品詞、動詞)・・・(キーT)・・・)
))・・・(1) ここで、「S」は文を示すノードであり、「キー」はキ
ー単語フラグであり、「キーnJはキー単語ではないこ
とを、「キーT」はキー単語であることを示す。
第5図ステッf102にて、形態素解析された(1)に
示す入力文1の単語が、文頭から順次キー単語判定部3
1に入力され、ステップ106にてキー単語か否かが判
定される。捷ず先頭の単語1日本」はキー単語フラグが
「n1t」となっているのでステップ108で品詞正規
化辞書検索部33へ処理が移され、ステップ120にお
いて品詞正規化辞書36が検索される。しかし、本実施
例の場合、品詞正規化辞書36のキー品詞には単語「日
本」の品詞である「名詞」の項がないので、検索失敗と
なりステップ122を介してステップ102に移され、
キー単語判定部31に処理が戻される。
そして、キー単語判定部31は次の単語「について」を
取り込み、キー単語か否かを判定する。単語「について
」のキー単語フラグはITJとなっていることから、処
理はステップ108を介して単語正規化辞書検索部32
に移され、ステップ110にて「について」をキー単語
として、単語正規化辞書35が検索される。い1、単語
正規化辞書35の内容が第6図に示すようになっている
とすると、単語「について」の前方には「日本」という
単語がひとつしかないので、正規化条件gに一致するこ
とから判定はOKとなり、ステップ112を介してステ
ップ114に進み、その条件に対応する正規化表現Gと
品詞情報等が書き換え部34に出力される。
書き換え部34は正規化表現Gに従って入力文1を次の
(2)のように書き換え、ステップ102に戻る。
(S(日本・ ・ ・ ・ ・ ) (をキーとして・・・・) (おしえてください・・・・))  ・・・(2)そし
て、キー単語判定部31は次の句「おしえてください」
を取り込み、上述と同様にステツf106〜114の処
理が実行され、書き換え部34は入力文1を次に示す(
3)のように書き換えてステ、flo 2に戻る。
(S(日本・ ・ ・・・) (をキーとして・・・・) (検索する     ))    ・・・(3)ステ、
ノ102で次の単語を取り込むが、「。」なので処理を
終了し、ステップ104を介して次の処理、即ち文理解
装型40へ正規化した次に示す(4)の入力文1を送出
する。
「日本をキーとして検索する。」  ・・・(4)文理
解装型40は単語「日本」をキーとして知識ベースを検
索し、「日本」に関する知識を抽出して出力文生成装置
60に出力し、ここで応答文を生成して出力装置70に
出力表示する。
一方、入力文2の場合についても、入力文1と同様に正
規化処理がなされ、次に示す(5)のように書き換えら
れる。
「日本をキーとして検索する。」  ・・・(5)上述
したように、入力文1と2は異なる表現であるが、その
意味するところは「日本についての知識を知シたい」と
いうことであシ、正規化装置30によって同一の表現に
正規化される。
すなわち、本実施例によれば、入力文の表現(単語など
)が異なっていても、意味的に同一であれば、同一の単
語を用いた表現に統一(正規化)した後、文理解装型4
0に送出するようにしていることから、文理解装型40
では正規化された文を解析処理すればよいことになる。
したがって、処理が単純で簡単なものとなるから、処理
速度が向上されるとともに、正規化によって単語の数が
大幅に低減されるので、意味抽出用の意味情報辞書の容
量が小さくてすむ。
なお、正規化表現を用いた他の文例を、入力文に対応さ
せて次に示す。
入力文→正規化文(適用した正規化条件等)「・・・調
査し/なければならない。」す変動側 →[・・・調査する必要がある。」 (第3図のa −+ A ) 「・・・調査/±/なければならない。」助詞 →「・・・調査がある必要がある。」 (第3図のb−)B) 「まったく/おかしい。」 →[・・・非常におかしい。」 (第3図のC→C) 「・・・について/調査。」 す変名詞 →「・・・について調査する。」 (第4図のd −+ I) ) 「・・・について/調査/、/研究する。」→[・・・
について調査し、研究する。](第4図のe 1 r 
e 2 →E )効果 以上説明したように、本発明によれば、入力文の単語の
うち正規化条件に適合する単語を対応する正規化表現に
書き換え、異なる表現で人力された同一の意味を有する
入力文を、同一の表現にすることができることから、文
理屑処理が単純で簡単なものとなり、処理速度が向上さ
れるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例が適用σれてなる質問応答シ
ステムの全体ブロック図、 第2図は第1図の実施例の要部を示すブロック図、 第3図は単語正規化辞書の一部内容を例示する図、 第4図は品詞正規化辞書の一部内容を例示する図、 第5図は第2図に示す要部の処理手順を示すフローチャ
ート、 第6図は単語正規化辞書の他の一部内容を例示する図で
ある。 主要部符号の説明 20・・形態素解析装置 30・・文正規化装置 40・・・文理解装面 31・・・キー単語判定部 32・・・単語正規化辞書検索部 33・・品詞正規化辞書検索部 34・・・書き換え部 35・単語正規化辞書 36・・・品詞iTE規化辞書

Claims (1)

  1. 【特許請求の範囲】 1、形態素解析された入力文の単語を適合する正規化条
    件に対応した正規化表現に書き換える文正規化装置を含
    んでなることを特徴とする日本語理解装置。 2、特許請求の範囲第1項記載の日本語理解装置におい
    て、前記文正規化装置は、 単語と品詞単位にそれぞれ正規化条件とこの正規化条件
    に対応する正規化表現が格納された正規化辞書と、 該正規化辞書を検索して前記入力文の単語を、その単語
    が一致する正規化条件の正規化表現に書き換える正規化
    処理手段とを含んでなることを特徴とする日本語理解装
    置。 3、特許請求の範囲第1項または第2項に記載の日本語
    理解装置において、前記文正規化装置により正規化処理
    される単語は、予めなされる形態素解析にて指定される
    ことを特徴とする日本語理解装置。
JP60155996A 1985-07-17 1985-07-17 日本語理解装置 Pending JPS6217872A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60155996A JPS6217872A (ja) 1985-07-17 1985-07-17 日本語理解装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60155996A JPS6217872A (ja) 1985-07-17 1985-07-17 日本語理解装置

Publications (1)

Publication Number Publication Date
JPS6217872A true JPS6217872A (ja) 1987-01-26

Family

ID=15618063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60155996A Pending JPS6217872A (ja) 1985-07-17 1985-07-17 日本語理解装置

Country Status (1)

Country Link
JP (1) JPS6217872A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63204462A (ja) * 1987-02-20 1988-08-24 Sanyo Electric Co Ltd 日本語解析処理方式
JPH01138161U (ja) * 1988-03-15 1989-09-21
JPH0221335A (ja) * 1988-07-08 1990-01-24 Mitsubishi Heavy Ind Ltd 知識ベース構築支援装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63204462A (ja) * 1987-02-20 1988-08-24 Sanyo Electric Co Ltd 日本語解析処理方式
JPH01138161U (ja) * 1988-03-15 1989-09-21
JPH0221335A (ja) * 1988-07-08 1990-01-24 Mitsubishi Heavy Ind Ltd 知識ベース構築支援装置

Similar Documents

Publication Publication Date Title
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US5541838A (en) Translation machine having capability of registering idioms
JPH0644296A (ja) 機械翻訳装置
JPH0782498B2 (ja) 機械翻訳システム
JP2000507008A (ja) テキスト・ベース型情報ソースのコレクションの中の情報を捜し出すためのシステム、ソフトウエア及び方法
JP2000112941A (ja) イディオム処理機能を有する電子辞書
JP3123836B2 (ja) テキスト型データベース装置
JPS6217872A (ja) 日本語理解装置
JP2771976B2 (ja) 言語解析装置
JP4024137B2 (ja) 数量表現検索装置
JP4007630B2 (ja) 対訳例文登録装置
JP2966473B2 (ja) 文書作成装置
JPH0520354A (ja) 日本語文章解析装置
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置
JP2719453B2 (ja) 機械翻訳装置
JPS61187077A (ja) 日本語解析装置
JPH0320866A (ja) テキストベース検索方式
JP2807586B2 (ja) 機械翻訳装置
JPH0229858A (ja) 機械翻訳処理方法
JPH05189492A (ja) 検索式自動生成装置
JP2901977B2 (ja) 翻訳装置
JPH03229367A (ja) テキストベース検索方式
JP3255294B2 (ja) 機械翻訳装置
JPH05250413A (ja) テキストデータ検索装置
JPH09146959A (ja) 機械翻訳システム