JPH08185406A - 自然言語処理システム及びその方法 - Google Patents

自然言語処理システム及びその方法

Info

Publication number
JPH08185406A
JPH08185406A JP6327448A JP32744894A JPH08185406A JP H08185406 A JPH08185406 A JP H08185406A JP 6327448 A JP6327448 A JP 6327448A JP 32744894 A JP32744894 A JP 32744894A JP H08185406 A JPH08185406 A JP H08185406A
Authority
JP
Japan
Prior art keywords
natural language
determining
language processing
concept
selecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6327448A
Other languages
English (en)
Inventor
Aruna Roora Suda
須田アルナ・ローラ
Suretsushiyu Jieachiyandoran
ジェアチャンドラン・スレッシュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6327448A priority Critical patent/JPH08185406A/ja
Priority to EP95309436A priority patent/EP0720106A3/en
Priority to US08/580,311 priority patent/US6023669A/en
Publication of JPH08185406A publication Critical patent/JPH08185406A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 同一の概念から、状況に適した自然言語の情
報を生成する。 【構成】 自然言語処理システムに、概念で表現された
情報を入力する入力手段と、言語の知識、一般知識、特
定領域の知識を有する知識ベースと、該知識ベースを参
照して、前記入力手段よりの入力情報を個々の概念に分
割する分割手段と、前記知識ベースを参照して、該分割
手段により分割された個々の概念に対して、1つ以上の
自然言語表現から1つの自然言語表現を選択する選択手
段と、該選択手段により選択された自然言語表現を出力
する出力手段とを具える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、概念で表された情報か
ら、自然言語情報を生成する自然言語処理システム及び
その方法に関するものである。
【0002】
【従来の技術】従来、定型の文字列やテンプレート等に
基づいて、自然言語の文章を生成するシステムが存在す
る。
【0003】また、概念表現やシンタックス・ツリーな
どのシステムの内部表現から、文を生成するシステムも
存在する。
【0004】また、Kathleen R Mckeownにより、関連性
を基準とし、話題の焦点の制約と、談話法を用いてテキ
ストを生成するシステムが考案されている。
【0005】
【発明が解決しようとしている課題】しかしながら、固
定のテンプレートから文章を生成するシステムでは、個
人の文体に合った文章を生成することができない。した
がって、同じ入力に対して、常に同一の文章が出力さ
れ、ユーザの好みの文体を得ることはできなかった。
【0006】
【課題を解決するための手段】本発明によれば、自然言
語処理システムに、概念で表現された情報を入力する入
力手段と、言語の知識、一般知識、特定領域の知識を有
する知識ベースと、該知識ベースを参照して、前記入力
手段よりの入力情報を個々の概念に分割する分割手段
と、前記知識ベースを参照して、該分割手段により分割
された個々の概念に対して、1つ以上の自然言語表現か
ら1つの自然言語表現を選択する選択手段と、該選択手
段により選択された自然言語表現を出力する出力手段と
を具える。
【0007】また、本発明の他の態様によれば、自然言
語処理方法に、概念で表現された情報を入力する入力工
程と、言語の知識、一般知識、特定領域の知識を有する
知識ベースを参照して、前記入力工程よりの入力情報を
個々の概念に分割する分割工程と、前記知識ベースを参
照して、該分割工程により分割された個々の概念に対し
て、1つ以上の自然言語表現から1つの自然言語表現を
選択する選択工程と、該選択工程により選択された自然
言語表現を出力する出力工程とを具える。
【0008】
【作用】本発明によれば、概念で表現された情報を入力
し、言語の知識、一般知識、特定領域の知識を有する知
識ベースを参照して、入力情報を個々の概念に分割し、
前記知識ベースを参照して、分割された個々の概念に対
して、1つ以上の自然言語表現から1つの自然言語表現
を選択し、選択された自然言語表現を出力する。
【0009】
【実施例】以下、添付図面を参照しながら、本発明に係
る好適な一実施例を詳細に説明する。
【0010】図1は本発明に係る自然言語処理システム
の1実施例のハードウェア構成を示すブロック図であ
る。
【0011】同図において、1は、自然言語などにより
情報を入力するための入力部である。以下では、この入
力情報を文章と称するが、本装置では、一定の規則的な
構造を有していれば、文法的に完全な文章でなくとも、
処理対象とすることができる。
【0012】入力部1は、例えば、音声を入力・認識す
る音声認識装置や、文字をキー入力するためのキーボー
ド、書類から光学的に文字を読み取って認識する文字認
識装置、オンライン/オフラインの手書き文字認識装
置、他のシステムより情報を受信する受信装置、例え
ば、文字認識システムより認識結果を受信する装置など
であってもよいし、同一装置内の他の処理により生成さ
れた情報をここでの入力としてもよい。更に、これらの
うちの2以上を併設して、選択的に利用してもよい。
【0013】2は、CPUであり、各種処理のための演
算、論理判断等を行ない、バス6に接続された各構成要
素を制御する。
【0014】3は、情報を出力する出力部である。出力
部3は、分析部21より得られたデータを出力する出力
部であり、例えば、文字情報を音声合成して出力する音
声合成装置、CRTや液晶表示器などの表示装置、書類
上に文字を印刷出力するためのプリンタ、さらには、デ
ータベースのような他の装置へ情報を送信する送信装置
であってもよく、ここでの出力を同一装置内の他の処理
部、例えば、概念解析部などのへの入力としてもよい。
更に、これらのうちの2以上を具え、選択的に利用する
ようにしてもよい。
【0015】4は、プログラムメモリであり、フローチ
ャートにつき後述する処理手順を含むCPU2による制
御のためのプログラムを格納するメモリである。プログ
ラムメモリ4は、ROMであってもよいし、外部記憶装
置などからプログラムがロードされるRAMであっても
よい。
【0016】5は、データメモリであり、各種処理で生
じたデータを格納するほか、後述する知識ベースの知識
を格納する。データメモリ5は、例えばRAMとする
が、知識ベースの知識は、不揮発な外部記憶媒体から、
処理に先立ってロードしておく、あるいは、必要がある
ごとに参照するものとする。
【0017】6は、CPU1の制御の対象とする構成要
素を指示するアドレス信号、各構成要素を制御するため
のコントロール信号、各構成機器相互間でやりとりされ
るデータの転送を行なうためのバスである。
【0018】図32に、生成部を中心とした自然言語処
理システムの機能構成図を示す。同図において、11は
生成部、12は知識ベースである。
【0019】ここで、生成とは、概念表現等のコンピュ
ータの内部表現を、英語等の自然言語の表現に変換する
ことである。しかしながら、本実施例のシステムでは、
これに限らず、かかる内部表現とテンプレートとの組み
合わせも処理可能とする。
【0020】生成部11は、個人のスタイルや、語り手
と聞き手とのレベルの相違等の要因が組み込まれた文章
を変換して、整然とした質の高い文章を生成するもので
ある。
【0021】図2は、生成部の詳細構成を示すブロック
図である。
【0022】同図に示すように、生成部11は3つの部
分からなり、21は前処理部、22は文生成部、23
は、後処理部である。前処理部21は、内部表現のリス
ト(例えば、Action(s), Action(s)+Templates, Concep
ts...)が他のシステム(プレ・ジェネレータ、文書作成
部、対話処理部など)から入力される。前処理部21の
出力は、内部表現を英語などの自然言語に変換する文生
成部22により処理される。後処理部は、後編集、内的
なフィードバックなどを行う。
【0023】図3は、前処理部の処理手順を示すフロー
チャートである。前処理部21の主たる機能は、入力さ
れた概念に言語に依存した特徴を付加する言語的な概念
を生成する(ステップS303)ことである。言語に依
存する特徴には、例えば、性、数、格(主格、目的格
…)、人称(1人称、2人称…)を含む。また、前処理
部21は、記述すべき概念全体を見通して、文体や表現
形式を決定し、これをガイドラインとして文生成部22
に渡す。例として、代名詞の形や大まかな中心を含む。
【0024】図4は、言語に依存するパラメータを満た
す処理(ステップS304)の詳細な手順を示すフロー
チャートである。
【0025】図5は、文生成部の処理手順を示すフロー
チャートである。
【0026】まず、ステップS501で、入力された概
念をGLISTに付加し、SENTENCEに空をセッ
トする。
【0027】ステップS502では、GLISTは空で
あるかを調べ、空であればSENTENCEを出力し
て、処理を終了する。空でなければ、ステップS503
にて、GLISTの先頭は単語であるかを調べ、単語で
あれば、ステップS504で、その単語をSENTEN
CEに追加し、ステップS502へ戻る。
【0028】ステップS503で、先頭が単語でなけれ
ば、ステップS505へ進み、特別な条件を満足してい
るかを調べ、そうであればステップS502へ戻る。そ
うでなければ、ステップS506へ進む。ステップS5
06では、説明すべき最初の概念であるかを判定し、そ
うでなければ、ステップS502へ戻る。そうであれ
ば、ステップS507にて、GLISTで最初の概念に
対応する単語を捜し、ステップS508で、位置情報を
用いて、GLIST上にサブコンセプトを設定し、ステ
ップS502へ戻る。
【0029】図6は、特別な条件の1つである不定詞の
条件に関する処理手順を示すフローチャートである。
【0030】同図において、不定詞の条件は、ある概念
を不定詞形で書くのか、あるいは動詞の表層語句が識別
されたら不定詞形を使用すべきであることを示すため
に、タグをつけておくのかを決定する。例えば、現在の
概念及びその目的が行動であれば、不定詞形表現すべき
であり、行動のアクタまたはIobject と埋め込まれてい
る行動のアクタが同一であれば、埋め込まれている行動
のアクタは略すべきである。
【0031】図7は、質問の条件に関する処理手順を示
すフローチャートである。
【0032】行動の概念が質問調で記述されていたな
ら、問題のスロットに基づき、適切なWh-phrase (Who,
When, など)が識別される。質問形式であった場合、て
いねいな文体が生成される。タグは、主語と助動詞との
倒置に対してもセットされる。これは、通常、英語で
は、主語が助動詞の前であるのに対し、質問形では、こ
の順が逆になるからである。
【0033】図8は、英語に対するWh-phrase を決定す
る処理手順を示すフローチャートである。
【0034】図9は、概念に基づいてWh-phrase を決定
する処理手順を示すフローチャートである。
【0035】これ以外の特別な条件としては、概念が特
別な言語構造を有する場合、例えば、coord(AND),REASO
N,CONDN などであった場合に、組み合わさっていた概念
を分離し、GLISTに載せる場合、アクタのスロット
の繰り返しを略す。
【0036】概念が名詞または形容詞の場合、必要なら
適当な冠詞を付与してもよい。
【0037】概念が関係である場合、関係のタイプに従
い、適当な行動が行われる。例えば、関係が「一緒」で
ある場合、and, or, with などが決定される。また、関
係が「所有」である場合、John's book の形式、あるい
はbook of Johnの形式化が決定される。
【0038】図10は概念の表層語を見つける処理手順
を示すフローチャートである。
【0039】まず、その概念がすでに述べられている
か、または代名詞により述べるようにマークされている
かをチェックし、その場合は、概念を述べるために可能
な代名詞を利用し、そうでなければ、言語の知識ベース
を検索し、概念に一致する全単語を抽出する。生成部
は、また、ユーザの好む単語を得るために、個人データ
ベース及びユーザ登録辞書を検索する。このサーチは、
以下のように行われる。
【0040】まず、各概念につき、概念の辞書が検索さ
れ、関連するすべてのワード・タグが、それぞれの使用
条件・制約と共に取り出され、この条件・制約を解釈し
て、最も良くマッチするワード・タグを捜し出す。これ
が見つかった場合に、その同意語も取り出され、概念の
文法情報とともに格納される。
【0041】図11は、代名詞決定の処理手順を示すフ
ローチャートである。
【0042】まず、代名詞で記述できるかをチェックす
る。例えば、代名詞を使用することによって、あいまい
さが増加する場合は、代名詞は用いられない。実際に用
いる代名詞は、概念のタイプや、性、人称などのパラメ
ータに従って定められる。
【0043】図12は、表層語決定の処理手順を示すフ
ローチャートである。
【0044】もし、概念が行動でなければ、フォームの
辞書を検索することで、ワードタグから基本形を決定す
る。関連する位置情報やシンタックスもまた、概念のサ
ブコンセプトやスロットの表現形式を決定する。文法ル
ールを適用して、前置詞を必要とするスロットに対し
て、前置詞が決定される。最終的な表層語は、言語パラ
メータに基づき、基本形から決定される。例えば、名詞
の場合、単数形か複数形かは、数や性などによって定め
られる。
【0045】図13は、動詞の場合の表層語決定の処理
手順を示すフローチャートである。
【0046】まず、フォームの辞書を検索することで、
ワードタグから基本形を決定する。関連する位置情報や
シンタックスもまた、概念のサブコンセプトやスロット
の表現形式を決定する。文法ルールを適用して、前置詞
を必要とするスロットに対して、前置詞が決定される。
動詞がある行動の理由(目的)である場合、英語では、
表現形式として、不定詞形、動名詞形の2つがある。こ
の場合、いずれの形式とするかは、叙法、助動詞、時制
によって定まる。また、不定詞形、動名詞形のいずれで
表現されているかにも影響される。
【0047】図14は、後処理部23の処理手順を表わ
すフローチャートである。
【0048】後処理部23は、文生成部が、自然言語の
出力文を生成した後で、ステップS1401で文頭の文
字の大文字化、句読点の付与等の後編集を行なう。後処
理部23は、これ以外の機能として、ステップS140
2で、システム内部のフィードバックにより、与えられ
た入力とシステムの理解において、生成された文章の整
合性のチェックも行なう。
【0049】以下に、具体例に従って、説明する。
【0050】図15は、入力例を示す図であり、WOR
Kのタイプの行動を表わしている。まず、前処理部21
が、この入力を、図16に示す言語的な行動の構造に変
換する。
【0051】性、人称、格などの言語的なパラメータが
決定されて、付加される。また、概念の表現された回数
が求められ、付加される。
【0052】処理手順は、図5のフローチャートに従
う。まず、LingCon1がGLISTに付加され、その結
果、 101) GLIST:(LingCon1) SENTENCE:() が得られる。
【0053】ここで、GLISTは空でなく、特別な条
件も満足されていないので、ステップS507が実行さ
れる。概念に対応する単語のサーチの詳細は、図10の
ようになる。出力は、SENTENCEに格納される。
この概念は、それ以前に言及がないので、行動に対する
適当な動詞が言語知識ベース(LKB)から得られる。
このサーチは、以下のように実行される。
【0054】先ず、入力された概念WORKにつき、図
30に示す概念の辞書内がサーチされ、この概念に一致
する全ての動詞(ワードタグ)が、関連する条件および
ルールとともに得られる。生成部11は、このルールを
評価して、各動詞が適用可能かをチェックする。この場
合の得られるワードタグはwork1である。次に、図
29に示すフォームの辞書を参照して、叙法及び時制に
基づいて、表層語の形式を決定する。ここでは、am wor
kingとなる。
【0055】位置情報、すなわちシンタックス情報とし
て、Actor,Verb,Object,Support,IobjReason,Time が得
られる。文法ルールを用いて、各スロットに前置詞が決
定され、変形された位置情報Actor,Verb,on Object,Sup
port,IobjReason,Timeが得られる。
【0056】上述の位置情報が、GLIST上にサブコ
ンセプトあるいは行動のスロットを設定するために用い
られる。この結果次のGLISTが得られる。 102) GLIST:(Actor,'am working','on'Object,Suppor
t,IobjReason,Time) SENTENCE:() アクタを代名詞で記述するようにセットされており、人
称が第1人称であるので、Iが選択され、GLISTは
次のように変形される。 103) GLIST:('I','am working','on'Object,Support,I
objReason,Time) SENTENCE:() GLISTの最初の項目が、表層語であるので、SEN
TENCEに与えられる。 104) GLIST:('am working','on'Object,Support,IobjR
eason,Time) SENTENCE:('I') GLISTの最初の項目が、表層語であるので、SEN
TENCEに与えられる。 105) GLIST:('on'Object,Support,IobjReason,Time) SENTENCE:(I am working) Work領域の単語を見つけるのは、動詞の検索と同様
に、Work領域を表現する表層形式はnameであり、L
KBから得られる関連する位置情報は、Name,Methodolo
gy,Since である。前置詞を決定すると、Name,using,Me
thodology,Since となる。
【0057】内容の中心に基づいて、Since は余り重要
でないので、表現しないものとマークする。このように
して、Work領域のサブコンセプトがGLISTに載
せられ、処理が続行される。 106) GLIST:('on'Name,'using' Methodology,Since,Su
pport,IobjReason,Time) SENTENCE:(I am working) 107) GLIST:('on Cognitive Science','using' Method
ology,Support,IobjReason,Time) SENTENCE:(I am working) 108) GLIST:('using' Methodology,Support,IobjReaso
n,Time) SENTENCE:(I am working on Cognitive Science) 109) GLIST:('using' Methodology,Support,IobjReaso
n,Time) SENTENCE:(I am working on Cognitive Science) Methodology のスロットは、John Smith's theoryに代
名詞を用いた your theory of learningにより満たされ
る。 110) GLIST:('using your theory of learning',Suppo
rt,IobjReason,Time) SENTENCE:(I am working on Cognitive Science) 111) GLIST:(Support,IobjReason,Time) SENTENCE:(I am working on Cognitive Science using
your theory oflearning) Support,IobjReason,Time のスロットは、内容の中心に
基づいて、重要でないものとされ、表現しないものとマ
ークされる。この結果、最終的な出力は、 I am working on Cognitive Science using your theor
y of learning となる。
【0058】次の例として、図17に示すWANT wit
h Object MTRANSのタイプの入力例について説明
する。
【0059】まず、前処理部21が、この入力を、図1
8に示す言語的な行動の構造に変換する。
【0060】性、人称、格などの言語的なパラメータが
決定されて、付加される。また、概念の表現された回数
が求められ、付加される。
【0061】処理手順は、図5のフローチャートに従
う。まず、LingCon1がGLISTに付加され、その結
果、 201) GLIST:(LingCon2) SENTENCE:() が得られる。
【0062】GLISTは空でなく、概念であり、特別
な条件がチェックされる。この結果、図6の不定詞の条
件が満足され、表層語の動詞が見つかったときに、表現
形式として、不定詞形であるというタグをつけて記述す
ると決定される。WANTとMTRANSのアクタが同
一であるので、埋め込まれたMTRANSのアクタは表
現しないものとされる。
【0063】WANTに対応する動詞の決定は、前述の
例と同様に実行され、その結果、表層語は、would like
となり、位置情報は、Actor,Verb,to Object,Time とな
る。 202) GLIST:(Actor,'would like','to'Object,Time) SENTENCE:() アクタは代名詞で記述するようにセットされているの
で、人称に従って、Iが選択され、GLISTが更新さ
れる。以下、前述の例と同様に処理される。 203) GLIST:('I','would like','to'Object,Time) SENTENCE:() 204) GLIST:('would like','to'Object,Time) SENTENCE:('I') 205) GLIST:('to'Object,Time) SENTENCE:(I would like) MTRANSに対応する単語の検索は、他の動詞の場合
と同様に実行され、表層語は、discuss と決定され、位
置情報は、Actor,Verb,Object,with IobjectBenf,IobjR
eason,Instrument,Time となる。 206) GLIST:(Actor,'to diccuss',Object,with Iobjec
tBenf,IobjReason,Instrument,Time) SENTENCE:(I would like) 不定詞の条件は、アクタを省略するようにされているの
で、これは、表現しない。 207) GLIST:('to diccuss',Object,with IobjectBenf,
IobjReason,Instrument,Time) SENTENCE:(I would like) 208) GLIST:(Object,with IobjectBenf,IobjReason,In
strument,Time) SENTENCE:(I would like to discuss) Work領域は、前述の実施例と同様に表現され、入力
の継続を仮定して代名詞を用いるようにし、適当な代名
詞としてitが選択される。 209) GLIST:(with IobjectBenf,IobjReason,Instrumen
t,Time) SENTENCE:(I would like to discuss it) 210) GLIST:(with IobjectBenf,IobjReason,Instrumen
t,Time) SENTENCE:(I would like to discuss it) 211) GLIST:(with you,IobjReason,Instrument,Time) SENTENCE:(I would like to discuss it) 212) GLIST:(IobjReason,Instrument,Time) SENTENCE:(I would like to discuss it with you) 最終的な出力は、 I would like to discuss it with you となる。
【0064】次の例として、図19に示すWANT wit
h Object MEETのタイプの入力例について説明す
る。
【0065】まず、前処理部21が、この入力を、図2
0に示す言語的な行動の構造に変換する。以下、各段階
での処理結果を示す。処理の過程は、前述の実施例と同
様である。 301) GLIST:(LingCon8) SENTENCE:() REASONに対する接続詞として、since が選択される。 302) GLIST:(since,LingCon6,LingCon8) SENTENCE:() 303) GLIST:(LingCon6,LingCon4) SENTENCE:(since) 304) GLIST:(LingCon6,LingCon4) SENTENCE:(since) Comeに対する位置情報は、Actor,Verb,Iobj-direction,
Iobj-reason であり、 305) GLIST:(Actor,'am coming',Iobj-direction,Iobj
-reason,LingCon4) SENTENCE:(since) 306) GLIST:('I','am coming',Iobj-direction,Iobj-r
eason,LingCon4) SENTENCE:(since) 307) GLIST:('am coming',Iobj-direction,Iobj-reaso
n,LingCon4) SENTENCE:(since I) 308) GLIST:(Iobj-direction,Iobj-reason,LingCon4) SENTENCE:(since I am coming) 309) GLIST:(Iobj-reason,LingCon4) SENTENCE:(since I am coming to USA) toの重複を避けるためにIobj-reason は動名詞形で表現
される。 310) GLIST:('for attending',Conf1,LingCon4) SENTENCE:(since I am coming to USA) 311) GLIST:('IJCAI conference',LingCon4) SENTENCE:(since I am coming to USA for attending) 312) GLIST:(LingCon4) SENTENCE:(since I am coming to USA for attending I
JCAI conference) 最終的な出力として、 Since I am coming to USA for attending IJCAI confe
rence, I would like totake this opportunity to vis
it you. が得られる。
【0066】次の例として、図21に示すCo-ordタイプ
の入力例について説明する。
【0067】まず、前処理部21が、この入力を、図2
2に示す言語的な行動の構造に変換する。以下、各段階
での処理結果を示す。処理の過程は、前述の実施例と同
様である。 401) GLIST:(Coord1) SENTENCE:() Coord1に対応する表層語として、LKBよりand が得ら
れる。位置情報は、con1,and,con2 である。 402) GLIST:(LingCon9,and,LingCon10) SENTENCE:() LingCon9に対する表層語は、LKBからam comingとさ
れ、位置情報は、 Actor,Verb,Iobj-direction,Iobj-re
ason,Time となる。
【0068】GLISTにサブコンセプトを付加するの
に先立ち、LingCon9のcanned phrase スロットがit so
happens を文の前に付加するように指定されているの
で、GLISTは、次のように変形される。 403) GLIST:('it so happens',Actor,Verb,Iobj-direc
tion,Iobj-reason,Time,and,LingCon10) SENTENCE:() 404) GLIST:(Actor,Verb,Iobj-direction,Iobj-reaso
n,Time,and,LingCon10) SENTENCE:(it so happens) 最終的な出力は、 It so happens that I am coming to USA on business
in May and I shall beextremely grateful if I could
meet you on 10th May 93. となる。
【0069】図23は、行動の構造を示す図である。
【0070】図24は、行動の例を示す図である。
【0071】図25は、MEETの構造を示す図であ
る。
【0072】図26は、MTRANSの構造を示す図で
ある。
【0073】図27は、PTRANSの構造を示す図で
ある。
【0074】図28は、LKBの構造を示す図である。
【0075】図29は、フォームの辞書の例を示す図で
ある。
【0076】図30は、概念の辞書の例を示す図であ
る。
【0077】図31は、文法の辞書の例を示す図であ
る。
【0078】なお、本発明の機能が実行されるのであれ
ば、単体の装置であっても、複数の装置からなるシステ
ムであっても、装置またはシステムにプログラムを供給
することにより処理が行なわれる場合であっても、本発
明が適用されることは言うまでもない。
【0079】
【発明の効果】以上説明したように、本発明によれば、
入力された同一の概念から、個々の状況に適した表層
語、または表現形式の語句が生成でき、質の高い文章を
作成することができるいう効果がある。
【図面の簡単な説明】
【図1】実施例の自然言語処理装置のハードウェア構成
を示すブロック図である。
【図2】生成部の詳細構成を示すブロック図である。
【図3】前処理部の処理手順を示すフローチャートであ
る。
【図4】言語に依存するパラメータを満たす処理の手順
を示すフローチャートである。
【図5】文生成部の処理手順を示すフローチャートであ
る。
【図6】不定詞の条件に関する処理手順を示すフローチ
ャートである。
【図7】質問の条件に関する処理手順を示すフローチャ
ートである。
【図8】英語に対するWh-phrase を決定する処理手順を
示すフローチャートである。
【図9】概念に基づいてWh-phrase を決定する処理手順
を示すフローチャートである。
【図10】概念の表層語を見つける処理手順を示すフロ
ーチャートである。
【図11】代名詞決定の処理手順を示すフローチャート
である。
【図12】表層語決定の処理手順を示すフローチャート
である。
【図13】動詞の場合の表層語決定の処理手順を示すフ
ローチャートである。
【図14】後処理部23の処理手順を表わすフローチャ
ートである。
【図15】入力例を示す図である。
【図16】行動の構造を示す図である。
【図17】入力例を示す図である。
【図18】行動の構造を示す図である。
【図19】入力例を示す図である。
【図20】言語的構造を示す図である。
【図21】入力例を示す図である。
【図22】言語的構造を示す図である。
【図23】行動の構造を示す図である。
【図24】行動の例を示す図である。
【図25】MEETの構造を示す図である。
【図26】MTRANSの構造を示す図である。
【図27】PTRANSの構造を示す図である。
【図28】LKBの構造を示す図である。
【図29】フォームの辞書の例を示す図である。
【図30】概念の辞書の例を示す図である。
【図31】文法の辞書の例を示す図である。
【図32】実施例の自然言語処理装置の機能構成を示す
ブロック図である。
【符号の説明】
1 入力部 2 CPU 3 出力部 4 プログラムメモリ 5 データメモリ 6 バス 11 生成部 12 知識ベース 21 前処理部 22 文生成部 23 後処理部

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 概念で表現された情報を入力する入力手
    段と、 言語の知識、一般知識、特定領域の知識を有する知識ベ
    ースと、 該知識ベースを参照して、前記入力手段よりの入力情報
    を個々の概念に分割する分割手段と、 前記知識ベースを参照して、該分割手段により分割され
    た個々の概念に対して、1つ以上の自然言語表現から1
    つの自然言語表現を選択する選択手段と、 該選択手段により選択された自然言語表現を出力する出
    力手段とを具えることを特徴とする自然言語処理システ
    ム。
  2. 【請求項2】 前記選択手段は、言語に依存するパラメ
    ータを決定するパラメータ決定手段を有することを特徴
    とする請求項1に記載の自然言語処理システム。
  3. 【請求項3】 前記パラメータ決定手段は、名詞の数を
    決定する数決定手段を有することを特徴とする請求項1
    に記載の自然言語処理システム。
  4. 【請求項4】 前記数決定手段は、同一名詞の使用回数
    を計数する計数手段を有することを特徴とする請求項3
    に記載の自然言語処理システム。
  5. 【請求項5】 前記パラメータ決定手段は、名詞の性を
    決定する性決定手段を有することを特徴とする請求項1
    に記載の自然言語処理システム。
  6. 【請求項6】 前記パラメータ決定選択手段は、人間の
    人称を決定する人称決定手段を有することを特徴とする
    請求項1に記載の自然言語処理システム。
  7. 【請求項7】 前記選択手段は、重複する名詞に対し
    て、該名詞に対応する代名詞を選択することを特徴とす
    る請求項1に記載の自然言語処理システム。
  8. 【請求項8】 前記選択手段は、複数の動作の行為者が
    重複する場合に、一方の行為者の記述を省略した表現を
    選択することを特徴とする請求項1に記載の自然言語処
    理システム。
  9. 【請求項9】 前記選択手段は、質問文として、疑問詞
    を用いた質問文を選択することを特徴とする請求項1に
    記載の自然言語処理システム。
  10. 【請求項10】 前記選択手段は、動詞の表現形式を決
    定する動詞表現決定手段を有することを特徴とする請求
    項1に記載の自然言語処理システム。
  11. 【請求項11】 概念で表現された情報を入力する入力
    工程と、 言語の知識、一般知識、特定領域の知識を有する知識ベ
    ースを参照して、前記入力工程よりの入力情報を個々の
    概念に分割する分割工程と、 前記知識ベースを参照して、該分割工程により分割され
    た個々の概念に対して、1つ以上の自然言語表現から1
    つの自然言語表現を選択する選択工程と、 該選択工程により選択された自然言語表現を出力する出
    力工程とを具えることを特徴とする自然言語処理方法。
  12. 【請求項12】 前記選択工程は、言語に依存するパラ
    メータを決定するパラメータ決定工程を有することを特
    徴とする請求項11に記載の自然言語処理方法。
  13. 【請求項13】 前記パラメータ決定工程は、名詞の数
    を決定する数決定工程を有することを特徴とする請求項
    11に記載の自然言語処理方法。
  14. 【請求項14】 前記数決定工程は、同一名詞の使用回
    数を計数する計数工程を有することを特徴とする請求項
    13に記載の自然言語処理方法。
  15. 【請求項15】 前記パラメータ決定工程は、名詞の性
    を決定する性決定工程を有することを特徴とする請求項
    11に記載の自然言語処理方法。
  16. 【請求項16】 前記パラメータ決定選択工程は、人間
    の人称を決定する人称決定工程を有することを特徴とす
    る請求項11に記載の自然言語処理方法。
  17. 【請求項17】 前記選択工程は、重複する名詞に対し
    て、該名詞に対応する代名詞を選択することを特徴とす
    る請求項11に記載の自然言語処理方法。
  18. 【請求項18】 前記選択工程は、複数の動作の行為者
    が重複する場合に、一方の行為者の記述を省略した表現
    を選択することを特徴とする請求項11に記載の自然言
    語処理方法。
  19. 【請求項19】 前記選択工程は、質問文として、疑問
    詞を用いた質問文を選択することを特徴とする請求項1
    1に記載の自然言語処理方法。
  20. 【請求項20】 前記選択工程は、動詞の表現形式を決
    定する動詞表現決定工程を有することを特徴とする請求
    項11に記載の自然言語処理方法。
JP6327448A 1994-12-28 1994-12-28 自然言語処理システム及びその方法 Pending JPH08185406A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP6327448A JPH08185406A (ja) 1994-12-28 1994-12-28 自然言語処理システム及びその方法
EP95309436A EP0720106A3 (en) 1994-12-28 1995-12-27 Device and method for generating natural language information from information defined by concepts
US08/580,311 US6023669A (en) 1994-12-28 1995-12-28 System for generating natural language information from information expressed by concept and method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6327448A JPH08185406A (ja) 1994-12-28 1994-12-28 自然言語処理システム及びその方法

Publications (1)

Publication Number Publication Date
JPH08185406A true JPH08185406A (ja) 1996-07-16

Family

ID=18199281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6327448A Pending JPH08185406A (ja) 1994-12-28 1994-12-28 自然言語処理システム及びその方法

Country Status (1)

Country Link
JP (1) JPH08185406A (ja)

Similar Documents

Publication Publication Date Title
US7860705B2 (en) Methods and apparatus for context adaptation of speech-to-speech translation systems
Habash et al. MADA+ TOKAN: A toolkit for Arabic tokenization, diacritization, morphological disambiguation, POS tagging, stemming and lemmatization
EP0720106A2 (en) System for generating natural language information from information expressed by concept and method therefor
JPH1011447A (ja) パターンに基づく翻訳方法及び翻訳システム
US7136803B2 (en) Japanese virtual dictionary
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
Sproat et al. The taxonomy of writing systems: How to measure how logographic a system is
Bugert et al. Generalizing cross-document event coreference resolution across multiple corpora
KR101929509B1 (ko) 형태소 합성 장치 및 방법
KR102284903B1 (ko) 입력 시퀀스 생성 방법 및 장치
JPH0855123A (ja) イディオム登録機能を有する機械翻訳装置
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
US20200387806A1 (en) Idea generation support device, idea generation support system, and recording medium
Zayyan et al. Automatic diacritics restoration for modern standard Arabic text
Toleush et al. Development of morphological segmentation for the Kyrgyz language on complete set of endings
JPH08185406A (ja) 自然言語処理システム及びその方法
JPH08185393A (ja) 再実行システム及びその方法
Gothe et al. An efficient system for grammatical error correction on mobile devices
Barros et al. Improving the naturalness and expressivity of language generation for Spanish
KR20080028655A (ko) 품사 태깅 장치 및 태깅 방법
Babhulgaonkar et al. Experimenting with factored language model and generalized back-off for Hindi
ASAHIAH et al. A survey of diacritic restoration in abjad and alphabet writing systems
Gibbon et al. Spoken Language Characterization
KR100292376B1 (ko) 문장변환장치 및 그 방법
Barros et al. Inflection generation for spanish verbs using supervised learning

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020723