JP3419483B2 - 自然言語処理装置及びその方法 - Google Patents

自然言語処理装置及びその方法

Info

Publication number
JP3419483B2
JP3419483B2 JP01007193A JP1007193A JP3419483B2 JP 3419483 B2 JP3419483 B2 JP 3419483B2 JP 01007193 A JP01007193 A JP 01007193A JP 1007193 A JP1007193 A JP 1007193A JP 3419483 B2 JP3419483 B2 JP 3419483B2
Authority
JP
Japan
Prior art keywords
information
language
knowledge
storage means
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01007193A
Other languages
English (en)
Other versions
JPH06223102A (ja
Inventor
哲朗 知野
朋男 池田
克己 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP01007193A priority Critical patent/JP3419483B2/ja
Publication of JPH06223102A publication Critical patent/JPH06223102A/ja
Application granted granted Critical
Publication of JP3419483B2 publication Critical patent/JP3419483B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書編集装置に用い
られる自然言語処理装置及びその方法に関するものであ
る。
【0002】
【従来の技術】近年、日本語ワードプロセッサや機械翻
訳システム等のいわゆる自然言語処理技術を応用した計
算機が出てきている。また、データベースへの自然言語
インタフェース、自然言語によるプログラミング等も実
用化の期待が高くなってきている。
【0003】そこで本発明は、自然言語処理装置におい
て、自然言語によるプログラム仕様記述支援装置、文書
推敲支援装置、自然翻訳装置等の各種言語処理装置に用
いられる文書編集装置に関し提案する。
【0004】近年、自然言語によるプログラム仕様記述
支援装置、文書推敲支援装置、自動翻訳装置などの各種
言語処理装置においては、文書に対して自然言語解析用
の知識と文書の対象とする分野の知識を用いて解析を行
ないその文書の内容を理解するものが注目されている。
【0005】このような自然言語処理装置では、入力さ
れる文書に対して解析を行なう場合、言語辞書、対象知
識などの複数の知識ベースを用いて解析を行なう解析装
置が用いられている。
【0006】そして、従来上記装置では、文書の入力手
段、および言語辞書、対象知識に対する知識の入力手段
がそれぞれ独立に扱われていた。
【0007】例えば、プログラム仕様記述支援装置の場
合、文書を入力するための文書編集手段、言語辞書を入
力するための言語辞書編集手段、対象知識を入力するた
めの対象知識入力手段を設け、装置の使用者が文書、あ
るいは知識を入力する場合、各部を独立に操作し、入力
を行なうように装置が構成されている。
【0008】しかし、入力文書、言語辞書、対象知識は
全く独立なわけではなく、互いに依存関係を持つ。
【0009】例えば、プログラム仕様記述支援装置にお
いて、空調機の制御プログラムに関する入力文章中の
『運転切替えスイッチが暖房状態ならば、暖房温度制御
を行なう。』という文について考えてみる。まず入力文
を解析するためには、『運転切替えスイッチ』、『暖房
状態』、『暖房温度制御』などの単語を言語辞書に記憶
させる必要がある。また、『運転切替えスイッチ』と
『暖房状態』の関係を知るためには、『運転切替えスイ
ッチ』がどのような動作をするか、どのような状態をと
るかを対象知識に記憶させる必要がある。また、『暖房
温度制御』がどのような動作を行なうかは、入力文書の
別の部分に定義されているはずであり、その情報も対象
知識が記憶している必要がある。このように、入力文
書、言語辞書、対象知識は互いに密接な関係を持つ。
【0010】よって、上記のように文書、言語辞書、対
象知識に対する知識の入力手段をそれぞれ独立に扱う
と、新たな分野に関する知識を登録する際に、関係のあ
る知識を別々に入力しなければならないので入力の作業
量が増大するという問題があった。
【0011】
【発明が解決しようとする課題】文書編集装置の問題点
は、文書、言語辞書、対象知識に対する知識の入力手段
をそれぞれ独立に扱うと、新たな分野に関する知識を登
録する際に、関係のある知識を別々に入力しなければな
らないので入力の作業量が増大するということにある。
【0012】本発明はこのような事情を考慮してなされ
たもので、関連する知識を言語辞書、対象知識に同時に
登録することにより、知識入力の労力を軽減することが
可能な文書編集装置を提供することにある。
【0013】
【課題を解決するための手段】請求項1の発明は、入力
文書の解析のための言語情報を記憶する言語辞書記憶手
段と、入力文書の解析のための意味情報を記憶する対象
知識記憶手段と、入力文書の構造的仕様を記憶する言語
仕様記憶手段と、この言語仕様記憶手段に記憶された構
造的仕様に基づき入力文書の構造情報を解析する入力文
書解析手段と、文書の構造情報と意味情報との対応関係
を記憶した仕様知識対応表と、意味情報と言語情報との
対応関係を記憶した知識辞書対応表と、この入力文書解
析手段の解析結果から得られる言語情報及び意味情報
を、前記言語辞書記憶手段および対象知識記憶手段にそ
れぞれ登録させる登録手段とを有し、前記登録手段は、
前記入力文書解析手段の解析結果から得られる構造情報
と、前記仕様知識対応表の対応関係とから意味情報を求
め、この求めた意味情報を前記対象知識記憶手段に登録
させ、また、この求めた意味情報と前記知識辞書対応表
の対応関係から言語情報を求め、さらに、この求めた言
語情報を前記言語辞書記憶手段に登録させることを特徴
とする自然言語処理装置である。
【0014】請求項2の発明は、自然言語処理装置が行
う自然言語処理方法であって、入力文書の構造的仕様を
記憶する言語仕様記憶手段に記憶された構造的仕様に基
づき入力文書を前記自然言語処理装置が解析する入力文
書解析ステップと、この入力文書解析ステップの解析結
果から得られる言語情報及び意味情報を、入力文書の解
析のための言語情報を記憶する言語辞書記憶手段および
入力文書の解析のための言語情報を記憶する対象知識記
憶手段に前記自然言語処理装置がそれぞれ登録させる登
録ステップとを有し、前記自然言語処理装置が行う登録
ステップでは、前記入力文書解析ステップの解析結果か
ら得られる構造情報と、文書の構造情報と意味情報との
対応関係を記憶した仕様知識対応表の対応関係とから意
味情報を求め、この求めた意味情報を前記対象知識記憶
手段に登録させ、また、この求めた意味情報と、意味情
報と言語情報との対応関係を記憶した知識辞書対応表の
対応関係から言語情報を求め、さらに、この求めた言語
情報を前記言語辞書記憶手段に登録させることを特徴と
する自然言語処理方法である。
【0015】
【0016】
【作 用】請求項1と2の発明の自然言語処理装置につ
いて説明する。
【0017】入力文書解析手段が、文書編集手段を経て
入力された文書を、言語仕様記憶手段に記憶された構造
的仕様に基づき入力文書を解析する。この解析結果から
得られる言語情報及び意味情報を、前記言語辞書記憶手
段および対象知識記憶手段にそれぞれ登録させる。
【0018】これにより、関連した知識を言語辞書、対
象知識に同時に登録することにより、知識入力の労力を
軽減することが可能となる。
【0019】また、請求項2の発明は、対象知識編集手
段を用いて入力された意味情報から得られる言語情報
を、言語辞書記憶手段に登録させる手段も有している。
【0020】
【実施例】以下、図1から図14に基づいて発明の一
実施例である文書編集装置について説明する。
【0021】図1は、文書編集装置の全体ブロック図で
ある。
【0022】このシステムは、文書を入力または編集す
る文書編集手段101、入力文書の構造的仕様に基づき
入力文書を解析し、入力文書の構造情報を出力する入力
文書解析手段102、入力文書の構造的仕様を記憶する
言語仕様記憶手段103、入力文書の構造的情報と対象
知識の対応関係を記憶する仕様・知識対応表105、対
象知識と言語辞書の対応関係を記憶する知識・辞書対応
表106、入力文書の解析のための意味情報を記憶する
対象知識記憶手段107、対象知識記憶手段中に格納さ
れた意味情報の内容を入力または編集する対象知識編集
手段108、入力文書の解析のための言語情報を記憶す
る言語辞書記憶手段109、対象知識記憶手段に知識を
自動的に登録する辞書・知識登録手段104より構成さ
れている。以下、各手段の構造を順次説明する。
【0023】文書編集手段101は文書を入力または編
集する部分である。画面表示の外観を図2に示す。20
1は文書表示部、202は終了ボタン、203は解析ボ
タンである。使用者がキーボードより文書を入力する
と、順次文書表示部201に表示される。解析ボタン2
03をマウスでクリックすると、入力された文書が入力
文書解析手段102に出力される。終了ボタン202を
マウスでクリックすると文書編集が終了する。
【0024】入力文書解析手段102は、文書編集手段
101から出力された入力文書を解析する部分である。
解析には、言語仕様記憶手段103が記憶している入力
文書の構造的仕様を文法として用い、下記のような一般
的な構文解析技術を用いて入力文書を解析する。なお、
以下では言語仕様記憶手段103中に格納されているS
GML形式の構造情報をDTDと呼ぶ。
【0025】DTDは、文書中で許される要素の名前、
出現順序、要素の内容、タグの属性等を定義している。
以下、図3(a)の構造情報を例にして説明する。
【0026】“ELEMENT”で始まる行は、各要素
の名前と構造を定義している。例えば、4行目は、「S
ample要素は、一つのHeader要素を持つ。」
という内容を定義している。
【0027】図3(a)のDTDにより定義される文書
形式を木構造表現で表すと、図3(b)のようになる。
文書全体を表すSample構造は、文書の標題である
Header構造を一つ、文書の各章であるProce
ss構造を複数持つ。各Process構造は、そのプ
ロセス名であるProcname構造、プロセスの構成
を記述した節であるStructure構造、定義文を
記述した節であるDefinition構造、動作文を
記述した節であるAction構造を一つづつ持つ。S
tructure構造、Definition構造、A
ction構造は、それぞれ文であるSentence
構造を0個以上持つ。
【0028】“ATTLIST”で始まっている行は、
各タグの属性を定義している。例えば、15行目(最終
行)は、「Action構造は、keywordという
属性を持ち、その型はCDATAで、属性のデフォルメ
値は、“num.3 動作”である」という内容を定義
している。
【0029】このkeyword属性は、文書の境界を
判断するために使用される。
【0030】また、CDATAは、文字列を表し、構造
はそれ以上細かく分解することができない。
【0031】さらに、下記のような規則が存在する。
【0032】1.空行、行頭の空白文字は無視する。
【0033】2.DTD中の“CDATA”は、文書の
1行の文字列に対応する。
【0034】3.DTD中で、“keyword”が指
定されている構造は、文書中ではkeywordからそ
の構造が開始され、他のkeywordが出現するか、
文書が終了した時点でその構造が終了する。
【0035】4.keyword自体は解析結果には出
力されない。
【0036】そして、文書中の構造を持つ部分をSGM
Lの開始タグと終了タグで囲み、それを入力文書の構造
的情報として出力する。タグとは文書の各部分の構造を
示す情報で、“<”と“>”で囲まれた文字列である。
この実施例では開始タグと終了タグの2種類を扱う。文
字列が“/”ではじまる場合は、ある構造の終了を示す
終了タグである。開始タグとは例えば“<Sample
>”のような文字列で、それに対する終了タグは“</
Sample>”となる。
【0037】言語仕様記憶手段103は、入力文書解析
手段102において入力文書の解析に用いるための、入
力文書の構造的仕様をSGML形式で記憶する。言語仕
様記憶手段103に記憶される構造情報の例を図3
(a)に示す。
【0038】仕様・知識対応表105は、入力文書の構
造情報から得られた情報を対象知識記憶手段107に登
録する際の対応表を記憶する。対応表は構造情報名によ
って分類され、それぞれの構造情報名に対応して、1つ
のクラス名、複数のノード名、各ノード名に対し1つの
リンク名が記憶されている。仕様・知識対応表105に
記憶される内容の例を図4に示す。
【0039】知識・辞書対応表106は、対象知識記憶
手段107に登録された知識情報を言語辞書編集手段1
09に登録する際の対応表を記憶する。対応表はクラス
名によって分類され、それぞれのクラス名に対応して、
複数のノード名、各ノード名に対し1つのリンク名が記
憶されている。それぞれのノード名、リンク名の組合わ
せに対して、対応する単語の自然言語表現および品詞が
記憶されている。知識・辞書対応表106に記憶される
内容の例を図5に示す。
【0040】対象知識記憶手段107は、入力文書の解
析のための意味情報を記憶する。内容は、ネットワーク
構造を持った複数の情報を記憶しており、それぞれのデ
ータの構造は、ネットワーク構造の頂点であるルート、
その情報の種類を表すクラス、情報の詳細な動作、状態
等を表すノード、ルートに対するノードの状態を表すリ
ンクの4種類の情報からなる。1つの情報に対し、ルー
ト、クラスはそれぞれ1つ、ノードは複数存在し、各ノ
ードに対してリンクが1つ存在する。対象知識記憶手段
107に記憶される内容の例を図6(a)に示す。な
お、図6(b)は、図6(a)の例を用いてネットワー
ク構造を図式化したものである。
【0041】対象知識編集手段108は、対象知識記憶
手段107中に格納された情報の内容を入力または編集
する部分である。画面表示の外観を図7に示す。この中
で符号701はデータ表示部、符号702はデータ入力
部、符号703はデータ選択部、符号704はデータ追
加ボタン、符号705はデータ削除ボタン、符号706
はノード追加ボタン、符号707はノード削除ボタン、
符号708は保存ボタン、符号709は終了ボタンを示
す。データ表示部701は、入力および編集する情報の
表示、ノード等の選択を行なう部分である。データ入力
部702は、ルート名などの文字列を入力する部分であ
る。データ選択部703は、対象知識記憶手段107中
に格納されているそれぞれの情報に対応するルート名の
表示、情報の選択を行なう部分である。新たな情報を入
力する場合は、データ追加ボタン704をマウスでクリ
ックし、データ入力部702からルート名、クラス名を
順次入力すると、情報がデータ表示部701に表示され
る。次にノード追加ボタン706をマウスでクリック
し、ノード名とリンク名を入力するとその情報が画面に
追加される。ノード追加を繰り返し、最後に保存ボタン
708をマウスでクリックするとその情報の入力が終了
し、データを対象知識記憶手段107に登録するととも
に、辞書・知識登録手段104に情報を出力する。ま
た、ノード名をマウスでクリックし、ノード削除ボタン
707をマウスでクリックすると、そのノードがリンク
とともに削除される。また、あらかじめ対象知識記憶手
段107中に格納された情報を編集する場合は、データ
選択部703に表示されているルート名のうち、編集す
る情報のルート名をクリックすると、データ表示部70
1にその情報のデータが表示されるので、それに対しノ
ード追加、削除を行なう。また、情報を削除する場合
は、データ選択部703で削除する情報のルート名をマ
ウスで選択し、データ削除ボタン705をマウスでクリ
ックすると、その情報がルート、クラス、ノード、リン
クとも全て削除される。また、終了ボタン709をマウ
スでクリックすると、対象知識編集手段108が終了す
る。
【0042】言語辞書記憶手段109は、入力文書の解
析のための言語情報を記憶する。内容は、複数の単語に
関する情報を記憶しており、それぞれの単語の情報は、
その単語の自然言語表現および品詞からなる。言語辞書
記憶手段109に記憶される内容の例を図8に示す。
【0043】辞書・知識登録手段104は、入力文書解
析手段102から出力された入力文書の構造情報から得
られた情報を、仕様・知識対応表105、知識・辞書対
応表106を参照して、対象知識記憶手段107、言語
辞書記憶手段109に登録する。はじめに、辞書・知識
登録手段104は仕様・知識対応表105を参照し、入
力された構造情報から対象知識記憶手段107に登録す
る情報を決定し、実際に登録を行なう。その処理の流れ
を示すフローチャートを図9に示す。このフローチャー
トに基づき、実際の処理について説明する。ステップ9
01では入力である構造情報を1行読み込む。ステップ
902は終了処理で、入力が終了でなければステップ9
03に進む。ステップ903では入力行がSGML形式
のタグであるかを検査する。入力行がタグでない場合は
ステップ901に戻る。ステップ904では入力行中の
タグが仕様・知識対応表105中の構造情報の欄に存在
するかを検査する。存在しない場合はステップ901に
戻る。存在する場合はステップ905で入力行中のタグ
をタグ記憶手段に記憶する。次にステップ906で文字
列記憶手段の内容をクリアする。ステップ907で次の
1行を読み込み、ステップ908でそれが終了タグであ
るか検査する。終了タグでない場合はステップ909で
入力行を文字列記憶手段に追加し、ステップ907に戻
り、次の1行を読み込む。終了タグが読み込まれるまで
以上の動作を繰り返す。次にステップ910で仕様・知
識対応表105からタグ記憶手段の内容を構造情報とし
て持つ部分を抽出する。ステップ911で、文字列記憶
手段の内容をルート名として、抽出されたデータととも
に対象知識記憶手段107に登録する。次に辞書・知識
登録手段104は上記の処理により決定された対象知識
記憶手段107に登録する情報から、まずルート名の文
字列を品詞を『名詞』として言語辞書記憶手段109に
登録する。その後知識・辞書対応表106を参照し、各
ノード名を言語辞書記憶手段109に登録する。
【0044】また辞書・知識登録手段104は、対象知
識編集手段108を用いて入力された対象知識情報から
得られた情報を、知識・辞書対応表106を参照して上
記と同様の処理を行ない、言語辞書記憶手段109に登
録する。
【0045】具体例として、図10の文書を入力した場
合の動作について説明する。
【0046】ここで、言語仕様記憶手段103には図3
(a)のSGML形式の構造情報、仕様・知識対応表1
05には図4の対応表、知識・辞書対応表106には図
5の対応表が記憶されているとする。
【0047】使用者が図10の文書を文書編集手段10
1に入力すると、その入力文書は入力文書解析手段10
2によって解析される。解析の処理を具体的に説明す
る。まず、図3(a)の言語仕様により、文書全体が
“Sample”構造であることがわかるので、まず
“<Sample>”を出力する。次に“Sampl
e”は1つの“Header”と複数の“Proces
s”からなるので、“<Header>”を出力する。
“Header”はCDATAなので、第1行目の“温
度制御プログラム仕様書”が“Header”であるこ
とがわかり、“温度制御プログラム仕様書”を出力し、
“<Header>”を出力し、次に“<Proces
s>”を出力する。“Process”は、各1つの
“Procname”、“Structure”、“D
efinition”、“Action”からなる。空
行を無視した次の行に“Procname”のkeyw
ordが出現するので、まず“Procname”を出
力し、keywordを除いた“温度制御”を出力す
る。次の行に“Structure”のkeyword
が出現するので、“</Procname>”を出力
し、“<Structure>”を出力する。“Str
ucture”は複数の“Sentence”からな
る。次の行にはkeywordは出現しないので、“<
Sentence>”を出力する。“Sentenc
e”はCDATAからなるので、“温度制御の下位制御
には、暖房温度制御がある。”の1行を出力し、“</
Sentence>”を出力する。次の行に“Defi
nition”のkeywordが出現するので、</
Structure>”を出力し、“<Definit
ion>”を出力する。同様の処理を文書終了まで行な
うと、図11の構造情報が出力される。
【0048】構造情報は辞書・知識登録手段104に入
力される。はじめに、辞書・知識登録手段104は対象
知識記憶手段107に情報の登録を行なう。辞書・知識
登録手段104に図11の構造情報が入力された場合の
処理の流れについて以下に説明する。
【0049】まずステップ901では、構造情報から
“<Sample>”の行が読み込まれる。入力終了で
はないので、ステップ902からステップ903に進
む。“<Sample>”はタグなので、ステップ90
4に進む。図4の対応表中には“<Sample>”は
存在しないので、ステップ901に戻る。ステップ90
1で2行目の“<Header>”を読み込み、上記と
同様の処理を行なって再びステップ901に戻る。3行
目を読み込みステップ902、ステップ903と処理が
進むが、“温度制御プログラム仕様書”はタグではない
のでステップ901に戻る。以後同様に処理が進み、
“<Header>”、“<Process>”が読み
込まれ、ステップ901に戻る。次に“<Procna
me>”の行が読み込まれる。ステップ902、ステッ
プ903を経てステップ904に進む。図4の対応表中
に“<Procname>”が存在するので、ステップ
905でタグ記憶手段に“<Procname>”を記
憶する。ステップ906で文字列記憶部をクリアして、
ステップ907で“温度制御”を読み込み、ステップ9
08に進む。“温度制御”は終了タグではないので、ス
テップ909に進み、文字列記憶手段に“温度制御”を
追加する。文字列記憶手段は内容がクリアされているの
で、文字列記憶手段の内容は“温度制御”となる。ステ
ップ907に戻り、“</Procname>”を読み
込み、ステップ908へ進む。“</Procname
>”は終了タグなので、ステップ910に進む。ここ
で、図4の対応表からタグ記憶手段の内容“<Proc
name>”を構造情報として持つ、図12の部分を抽
出し、ステップ911に進む。ステップ911で、抽出
した部分のデータより、文字列記憶手段から得られた
『温度制御』をルート名、クラスを『制御動作』、表中
の抽出した部分の各ノード、それに対応するリンクを対
象知識記憶手段107に登録する。次にステップ901
に戻り同様の動作を入力終了まで行なう。その結果、対
象知識記憶手段107の内容は図6のようになる。
【0050】次に辞書・知識登録手段104は言語辞書
記憶手段109に情報の登録を行なう。まず文字列『温
度制御』を品詞『名詞』として言語辞書記憶手段109
に登録する。次に知識・辞書対応表106中でクラスが
『制御動作』である部分を抽出する。その中で『温度制
御』に含まれるノードとリンクの組合せについて対応す
る部分(この例では全てが対応する)を抽出し、そのノ
ードを対応する自然言語、品詞で言語辞書記憶手段10
9に登録する。例えば『開始/動作』のノードとリンク
の組合せから、文字列『開始する』が品詞『動詞』で登
録される。その結果、言語辞書記憶手段109の内容は
図8のようになる。
【0051】次に、第2の具体例として、使用者が対象
知識編集手段108を用いて図13の情報を対象知識に
登録した場合の動作について説明する。
【0052】使用者が図13の情報を対象知識編集手段
108に入力すると、表示画面は図7のようになる。入
力した情報は対象知識記憶手段107に登録されるとと
もに、辞書・知識登録手段104に出力される。
【0053】辞書・知識登録手段104は対象知識編集
手段108からの入力をもとに、第1の具体例と同様の
処理を行ない、情報を言語辞書記憶手段109に登録す
る。具体的には、まず文字列『運転切替えスイッチ』を
品詞『名詞』として言語辞書記憶手段109に登録す
る。次に知識・辞書対応表106中でクラスが『機器』
である部分を抽出する。その中で『運転切替えスイッ
チ』に含まれるノードとリンクの組合せについて対応す
る部分(この例では全てが対応する)を抽出し、そのノ
ードを対応する自然言語、品詞で言語辞書記憶手段10
9に登録する。例えば『ON/状態』のノードとリンク
の組合せから、文字列『ON』が品詞『名詞』で登録さ
れる。
【0054】このように構成された本装置によれば、関
連する知識を言語辞書、対象知識に同時に登録すること
により、知識入力の労力を軽減することが可能となる。
【0055】なお本実施例では、入力部101を図2の
ようなユーザーインターフェースを持つ文書入力装置と
しているが、ユーザーインターフェースはこの例のみに
限定されるわけではなく、例えばキーボードのみの入力
装置でも良い。また磁気ディスク、磁気テープ、OCR
などから文書が入力されても良い。
【0056】また本実施例では、文書編集手段101に
自然言語の文書を入力し、入力文書解析手段102によ
って入力文書を解析することによって構造情報を出力し
ているが、予め構造情報の含まれた文書を文書編集手段
101に入力することとしても良い。この場合入力文書
解析手段102を、入力文書の構造情報が正しいかどう
かを検査し、その構造情報を出力するための解析装置と
する。または、入力文書解析手段102および言語仕様
記憶手段103を取り外し、文書編集手段101と辞書
・知識編集手段104を直接接続しても良い。この場合
は入力文書の構造情報を辞書・知識編集手段104で直
接処理する。
【0057】また本実施例では、入力文書解析手段10
2より出力される構造情報としてSGML形式を用いて
いるが、これはODA形式、LATEX形式など他の種
類の構造情報の形式でも良い。この場合、言語仕様記憶
手段103は、ODA形式、LATEX形式など対応す
る構造情報を記憶する。
【0058】また本実施例では、対象知識編集手段10
8を図7のようなユーザーインターフェースを持つ入力
装置としているが、ユーザーインターフェースはこの例
のみに限定されるわけではない。例えば図14のような
ファイルを入力として、その内容を自動的に対象知識記
憶手段107に登録しても良い。
【0059】このように、本発明は上記実施例にのみ限
定されず要旨を変更しない範囲で実施できる。
【0060】
【発明の効果】以上説明したように、発明によれば、
言語辞書記憶手段、対象知識記憶手段を有する文書編集
装置において、知識を登録する際に、関連する知識を言
語辞書記憶手段、対象知識記憶手段に同時に登録するこ
とが可能であり、これにより、知識入力の労力を軽減す
ることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例である文書編集装置の概略構
成を示すブロック図。
【図2】同じく文書編集手段の画面表示の一例。
【図3】(a) 同じく言語仕様記憶手段の内容の一
例。(b) (a)のDTDにより定義される文書形式
の木構造表現。
【図4】同じく仕様・知識対応表の内容の一例。
【図5】同じく知識・辞書対応表の内容の一例。
【図6】(a) 同じく対象知識記憶手段の内容の一
例。(b) ネットワーク構造。
【図7】同じく対象知識編集手段の画面表示の一例。
【図8】同じく言語辞書記憶手段の内容の一例。
【図9】同じく辞書・知識登録手段の処理の流れを示す
フローチャート。
【図10】同じく入力文書の一例。
【図11】同じく入力文書解析手段から出力される構造
情報の一例。
【図12】同じく辞書・知識登録手段の処理過程で仕様
・知識対応表から抽出される情報の一例。
【図13】同じく対象知識編集手段に入力される情報の
一例。
【図14】同じく対象知識編集手段に入力される情報の
一例。
【符号の説明】
101……文書編集手段 102……入力文書解析手段 103……言語仕様記憶手段 104……辞書知識登録手段 105……仕様知識対応表 106……知識辞書対応表 107……対象知識記憶手段 108……対象知識編集手段 109……言語辞書記憶手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−46370(JP,A) 特開 平5−46656(JP,A) 田中克己,自然言語による仕様記述の ための知識の取り扱いについて,情報処 理学会研究報告92−AI−84−9,日 本,1992年 9月10日,Vol.92,N o.70,p.81−p.89 (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文書の解析のための言語情報を記憶す
    る言語辞書記憶手段と、 入力文書の解析のための意味情報を記憶する対象知識記
    憶手段と、 入力文書の構造的仕様を記憶する言語仕様記憶手段と、 この言語仕様記憶手段に記憶された構造的仕様に基づき
    入力文書の構造情報を解析する入力文書解析手段と、 文書の構造情報と意味情報との対応関係を記憶した仕様
    知識対応表と、 意味情報と言語情報との対応関係を記憶した知識辞書対
    応表と、 この入力文書解析手段の解析結果から得られる言語情報
    及び意味情報を、前記言語辞書記憶手段および対象知識
    記憶手段にそれぞれ登録させる登録手段とを有し、 前記登録手段は、 前記入力文書解析手段の解析結果から得られる構造情報
    と、前記仕様知識対応表の対応関係とから意味情報を求
    め、 この求めた意味情報を前記対象知識記憶手段に登録さ
    せ、 また、この求めた意味情報と前記知識辞書対応表の対応
    関係から言語情報を求め、 さらに、この求めた言語情報を前記言語辞書記憶手段に
    登録させることを特徴とする自然言語処理装置。
  2. 【請求項2】自然言語処理装置が行う自然言語処理方法
    であって、 入力文書の構造的仕様を記憶する言語仕様記憶手段に記
    憶された構造的仕様に基づき入力文書を前記自然言語処
    理装置が解析する入力文書解析ステップと、 この入力文書解析ステップの解析結果から得られる言語
    情報及び意味情報を、入力文書の解析のための言語情報
    を記憶する言語辞書記憶手段および入力文書の解析のた
    めの言語情報を記憶する対象知識記憶手段に前記自然言
    語処理装置がそれぞれ登録させる登録ステップとを有
    し、 前記自然言語処理装置が行う登録ステップでは、 前記入力文書解析ステップの解析結果から得られる構造
    情報と、文書の構造情報と意味情報との対応関係を記憶
    した仕様知識対応表の対応関係とから意味情報を求め、
    この求めた意味情報を前記対象知識記憶手段に登録さ
    せ、 また、この求めた意味情報と、意味情報と言語情報との
    対応関係を記憶した知識辞書対応表の対応関係から言語
    情報を求め、 さらに、この求めた言語情報を前記言語辞書記憶手段に
    登録させることを特徴とする自然言語処理方法。
JP01007193A 1993-01-25 1993-01-25 自然言語処理装置及びその方法 Expired - Fee Related JP3419483B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01007193A JP3419483B2 (ja) 1993-01-25 1993-01-25 自然言語処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01007193A JP3419483B2 (ja) 1993-01-25 1993-01-25 自然言語処理装置及びその方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002324456A Division JP3999103B2 (ja) 2002-11-07 2002-11-07 自然言語処理装置

Publications (2)

Publication Number Publication Date
JPH06223102A JPH06223102A (ja) 1994-08-12
JP3419483B2 true JP3419483B2 (ja) 2003-06-23

Family

ID=11740146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01007193A Expired - Fee Related JP3419483B2 (ja) 1993-01-25 1993-01-25 自然言語処理装置及びその方法

Country Status (1)

Country Link
JP (1) JP3419483B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7135399B2 (ja) * 2018-04-12 2022-09-13 富士通株式会社 特定プログラム、特定方法および情報処理装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田中克己,自然言語による仕様記述のための知識の取り扱いについて,情報処理学会研究報告92−AI−84−9,日本,1992年 9月10日,Vol.92,No.70,p.81−p.89

Also Published As

Publication number Publication date
JPH06223102A (ja) 1994-08-12

Similar Documents

Publication Publication Date Title
JPH0830620A (ja) 構造検索装置
JPH01180062A (ja) 文書整形装置
JPH0567144A (ja) 前編集支援方法およびその装置
US20090083300A1 (en) Document processing device and document processing method
US5289376A (en) Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus
EP1830274A1 (en) Server device and name space issuing method
JPH09146931A (ja) 文書型定義生成装置
JP2000020537A (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004094487A (ja) 文書作成支援システム
US20080005085A1 (en) Server Device and Search Method
JP3419483B2 (ja) 自然言語処理装置及びその方法
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JPH08221417A (ja) 構造化文書の新旧対照編集装置
JP3851712B2 (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20090083620A1 (en) Document processing device and document processing method
JPH0877196A (ja) 文書情報抽出装置
JP2002297662A (ja) 構造化文書編集方法および構造化文書編集装置および端末装置およびプログラム
JPH09265431A (ja) ドキュメント編集方法及び装置と、ドキュメント編集装置を含むクライアント装置
JP3050811B2 (ja) 構文解析木データベース構築支援装置
JPH08263490A (ja) 法規文書更新システム
JP3537260B2 (ja) リンク付文書検索表示システム
JP3239845B2 (ja) 全文検索装置および方法
JP2967317B2 (ja) ハイパーテキスト文書編集方法及びその装置
JP2811747B2 (ja) 言語処理装置
JP3135221B2 (ja) 用例主導型言語構造解析装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees