JPH02176868A - データベース検索装置 - Google Patents

データベース検索装置

Info

Publication number
JPH02176868A
JPH02176868A JP63330070A JP33007088A JPH02176868A JP H02176868 A JPH02176868 A JP H02176868A JP 63330070 A JP63330070 A JP 63330070A JP 33007088 A JP33007088 A JP 33007088A JP H02176868 A JPH02176868 A JP H02176868A
Authority
JP
Japan
Prior art keywords
word
data
words
memory
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63330070A
Other languages
English (en)
Inventor
Masumi Nomura
真澄 野村
Ryoichi Murata
良一 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP63330070A priority Critical patent/JPH02176868A/ja
Publication of JPH02176868A publication Critical patent/JPH02176868A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、自然言語表現記述のデータを格納したデータ
ベースの検索に適用される知的データベース検索装置に
関する。
〔従来の技術〕
単語、あるいは数値的な検索キーを与えて情報を抽出す
る従来のデータベース検索装置は、検索キーによる単な
るコード比較と、数値的な大小演算処理を行なっている
〔発明が解決しようとする課題〕
単語、あるいは数値的な検索キーを与えて情報を抽出す
る従来のデータベース検索装置は、以下の問題点を有し
ている。
自然言語における表現上の柔軟性を何等考慮せず1(検
索キーを規定し、検索キーを陽にユ−ザに指定させるこ
とによりデータベースを検索するので、 (1)検索キーが登録されていないために検索できない
(2)入力しようとしているキーワードが検索キーとし
、て登録されているかを確認する必要があり、検索キー
自身の検索に時間がかかる。
また、複数の検索キーを指定し、これのANDをとって
検索することにより、抽出情報量を制限することができ
るものの。
(3)検索キーの間の自然言語的意味付けがなされてい
ないため、ユーザの要求していない情報まで取り出して
しまう。
〔課題を解決するための手段〕
ユーザの入力する検索キーとして、自然言語表現のキー
センテンスと称すデータ表現を許し。
対象領域における単語、熟語、あるいは単語の一部(例
えば語幹)等を、単語の種類、他の単語等との関係とと
もに辞書に登録し、さらに単語の種類の順序に関する制
約を柔軟に規定し。
これらを用いてユーザが入力した自然言語表現のデータ
の解析、理解を行ない、この結果を踏まえてデータベー
スを検索する。
〔作用〕
前記手段は、ユーザの入力したキーセンテンスなる自然
言語表現データの意味理解を行う。
なお1本件発明の具体的作用は、〔実施例〕の第5項、
処理手順に述べる。
〔実施例〕
第1図に本発明の実施例を示す。知的データベース検索
装置は、単語抽出装置1、構文解析装置2、データ検索
装置3.第1のメモリ4゜第2のメモリ5、第3のメモ
リ6、ワーキングメモリ7、データベース8、入力装置
9.及び出力装置10から構成されている。
第2、第3、第4図には、第1のメモリ4゜第2のメモ
リ5、第3のメモリ6の構成図を示す。
また、第5、第6図には、ワーキングメモリ7 データ
ベース8の構成図を示す。
第1のメモリ4に格納されている辞書には。
単語データ40を第2図に示した形式で記述されている
。以下に具体的な記述内容を説明する。
単語名部41は、単語を記述する。同義語基部42は、
当該単語の同義語を記述する。反意語基部43は、当該
単語の反意語を記述する。
上位単語名部44は、当該単語の意味するものが物理的
な物であればこれを物理的に包含する物理的な物に対応
する単語を、当該単語の意味するものが抽象的概念であ
れば、これを意味的に包含する抽象的概念に対応する単
語を記述する。
下位単語名部45は、当該単語の意味するものが物理的
な物であればこれが物理的に包含する物理的な物に対応
する単語を、当該単語の意味するものが抽象的概念であ
れば、これが意味的に包含する抽象的概念に対応する単
語を、その単語区分名とともに記述する。
ルール基部46は、当該単語が出現したときに評価され
るルール名を記述する。
単語区分基部47は、当該単語の単語区分名を記述する
テンプレートノードの記述例について説明すると、第2
のメモリ5に格納されているテンプレートノード50は
、第3図に示した形式で記述されている。以下に具体的
な記述内容を説明する。
ノード名部51は、当該テンプレートノードのノード名
を記述する。通常、これには単語区分名を用いる。
上流ノード名部52は、当該テンプレートノードのノー
ド名に対応する単語区分名を属性として翁1−単語より
前に出現する単語の単語区分名に対応するテンプレート
ノードのノード名を記述する。下流ノード名部53は、
当該テンプレートノードのノード名に対応する単語区分
名を属性として有す単語より後に出現する単語の単語区
分基に対応スルテンプレートノードのノード名を記述す
る。
第3のメモリ6に格納されているルールは、第4図に示
したルールセットと称する4つのグループに分割して格
納されている。以下、各ルールセットに格納されている
ルールの一例を示す。第1のルールセット61のうち、 ルールAでは、接続詞的な単語を有する文は、その接続
詞的な単語の前後でテンプレートノードにより制約され
る語順規定を犯すが、これを黙認する。
ルールBでは、数量に関する単語は、文の最初か、ある
いは主語より後で副詞、動詞、形容動詞より前に位置せ
ねばならない。
第2のルールセット62のうち。
ルールCでは、6及び“や6または”等の接続詞的に使
用する単語は、その前後の単語区分基を参考にして、自
然言語表現データから省略されていると見なされる単語
を補完する。
ルールDでは2本来2つの単語が接続詞的な単語により
結合され、さらにそれを簡略化したと見なせる単語(例
えば“出入口”は“出口及び入口″と見なしてよい)は
、その元の簡略化していない表現に戻す。
ルールEでは、1単語1+否定語1は単語1の反意語に
置換する。
第3のルールセット63のうち、ルールFでは、単語区
分基1の単語は、テンプレートノード名1に位置する単
語として単語1あるいは単語2を持たねばならない。ル
ールGでは、単語区分基1の単語は、テンプレートノー
ド名1に位置する単語として単語区分基2の単語を持っ
てはならない。
第4のルールセット64のうち、ルールHでは、単語1
(例えば“あるいは#)を含むデータは、その前後に位
置し、かつ語順テンプレートを満たす最も長い単語列デ
ータを交換しても自然言語上の意味は何等変わらない。
ルールIでは、数量に関する単語は、文の最初にあって
も、あるいは主語より後で副詞、動詞、形容動詞より前
にあっても、自然言語上の意味は何ら変わらない。
本発明の実施例は以下の手順で処理がなされる。
5.0  知的データベース検索装置を起動すると、 51 出力装置10は、検索のための自然言語表現形式
のデータを入力装置9より入力するよう、ユーザにメツ
セージを出力する。
5.2  人力装置9より検索のだめの自然言語表現形
式のデータが入力されたら、入力装置9はこれをワーキ
ングメモリ7の初期データ部71に格納する。
5.3  単語抽出装置1は、第1のメモリ4に格納さ
れている単語名部41より単語を順次取り出し、これが
ワーキングメモリ7の初期データ部71に格納されてい
るデータ内に含・まれるかを評価する。含まれていれば
この単語をワーキングメモリ7のキーワード部72の最
初に格納する。含まれていなりれば当該単語データ40
の同義語基部42に格納されている同義語を抽出し、こ
れがワーキングメモリ7の初期データ部71に格納され
ているデータ内に含まれるかを評価する。この同義語が
含まれていれば、当該単語(この同義語が同義語基部4
2に登録してあった単語データ40の単語名部41に格
納されている単語)をワーキングメモリ7のキーワード
部72の最初に格納する。
5.4  単語抽出装置1は、5.3項の処理により単
語を1つも抽出できなければ、ユーザの入力した自然言
語表現形式のデータが不正であるとして、その旨を出力
装置10より出力し、5゜8に飛ぶ。1つでも抽出でき
れば5.5の処理を行う。
5.5  構文解析装置2は、まず、ワーキングメモリ
7の初期データ部71に格納されているデータにおいて
、53項の処理で抽出した単語の出現する順序に対応し
て、ワーキングメモリ7のキーワード部72に格納され
ている単語の順序を変更する。次に、ワーキングメモリ
7のキーワード部72に格納されている単語に対し順次
、第1のメモリ4に格納されている対応する単語データ
40の有しているルール基部46を調べ、第3のメモリ
6の第2のルールセット62に格納されているルールの
ルール名が記述されていれば、当該ルールを抽出、発火
させる。
さらに、ワーキングメモリ7のキーワード部72に格納
されている単語に対し、順次、第1のメモリ4に格納さ
れている対応する単語データ40の有している単語区分
基部47を調べて、この順序が、第2のメモリ5に格納
されているテンプレートノード50に記述されているリ
ンク情報により実現可能かを評価する。この評価の際、
第3のメモリ6の第1のルールセット61に格納されて
いるルールの適用される単語があれば当該ルールを考慮
する。実現可能であれば、構文解析装置2は、解析結果
を出力装置10より出力し、5.6の処理を行なう。実
現可能でなければその旨を出力装置10fC出力し、5
8に飛ぶ。
56 構文解析装置2は、ワーキングメモリ7のキーワ
ード部72に格納されている単語に対し、第3のメモリ
6の第3のルールセット63に格納されているルールの
適用される単語があれば当該ルールを評価する。ルール
を満足しない単語が1つもなければ、5.7の処理を行
なう。ルールを満足しない単語が1つでも存在すれば、
その旨を出力装置10より出力し、58に飛ぶ。
5.7  データ検索装置3は、ワーキングメモリ7の
キーワード部72に格納されている単語列データを、あ
るいはワーキングメモリ7のキーワード部72に格納さ
れている単語列データ内の一部の単語を第3のメモリ6
の第3のルールセット63に格納されているルールを考
慮して当該単語データ40の有している上位単語名部4
4に格納されている単語、あるいは下位単語名部45に
格納されている単語に置換した単語列データを、この順
に含んでいる自然言語表現記述のデータを、第3のメモ
リ6の第4のルールセット64に格納されているルール
を考慮してデータベース8のキーセンテンス部81(デ
ータ部82であっても構わない)より検索し、これに関
連する範囲内のデータ80を出力装置10より出力する
5.8  出力装置10は、検索を終了するかを問うメ
ツセージを表示し、ユーザが1処理を終了する1と入力
装置9より入力すれば処理を終了し、′処理を継続する
“と入力すればワーキングメモリ7をクリアし5.1に
戻る。
〔発明の効果〕
ユーザの入力する検索キーとして、自然言語表現のキー
センテンスと称すデータ、表、現を許し。
対象領域における単語、熟語、あるいは単語の一部(例
えば語幹)等を、単語の種類、他の単語等との関係とと
もに辞書に登録し、さらに単語の種類の順序に関する制
約を柔軟に規定し、これらを用いてユーザが入力した自
然言語表現のデータの解析、理解を行ない この結果を
踏まえてデータベースを検索することにより、(1) 
 ユーザは検索キーの登録の有無を一切考慮する必要が
なく、 (2)不必要な情報を抽出する恐れが減少する。
【図面の簡単な説明】
第1図は本発明の一実施例としての知的データベース検
索装置、第2.第3.第4図は、前記実施例に含まれる
第1、第2.第3のメモリ4.5.6の構成図、第5図
は、ワーキングメモリ7の構成図、第6図は、データベ
ース8の構成図である。 1・・・単語抽出装置、2・・・構文解析装置、3・・
・データ検索装置、4・・・第1のメモリ、5・・・第
2のメモリ、6・・・第3のメモリ、7・・・ワーキン
グメモリ、8・・・データベース 9・・入力装置、1
0・・・出力装置、40・・・単語データ、45・・下
位単語名部、50・・・テンプレートノード、80・・
・データベース内データの抽出可能な最小単位のデータ

Claims (1)

    【特許請求の範囲】
  1. 自然言語表現で記述したデータを格納するためのメモリ
    を有したデータベース検索装置において、前記データベ
    ース検索装置が、単熟語を登録した辞書を格納するため
    の第1のメモリと、単語の順序を柔軟に規定するテンプ
    レートノードを格納するための第2のメモリと、単語の
    補完・置換・順序変更検索するためのルールを格納する
    ための第3のメモリと、ユーザにより入力されたデータ
    から単語を抽出、あるいは同義の別の単語に置換する単
    語抽出装置と、前記単語抽出装置により抽出された単語
    の順序を確認・修正、同義の別の単語に置換、補完する
    構文解析装置と、データベースに格納されている自然言
    語表現のデータを検索するデータ検索装置と、外部より
    自然言語等を用いて入力するための入力装置と、検索し
    たデータを表示する等ユーザに情報を提示するための出
    力装置を含むことを特徴とするデータベース検索装置。
JP63330070A 1988-12-27 1988-12-27 データベース検索装置 Pending JPH02176868A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63330070A JPH02176868A (ja) 1988-12-27 1988-12-27 データベース検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63330070A JPH02176868A (ja) 1988-12-27 1988-12-27 データベース検索装置

Publications (1)

Publication Number Publication Date
JPH02176868A true JPH02176868A (ja) 1990-07-10

Family

ID=18228445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63330070A Pending JPH02176868A (ja) 1988-12-27 1988-12-27 データベース検索装置

Country Status (1)

Country Link
JP (1) JPH02176868A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0703435A1 (en) 1994-09-21 1996-03-27 Nec Corporation Moving object navigation apparatus
JP2001117939A (ja) * 1999-10-20 2001-04-27 Just Syst Corp クエリ出力装置、文献検索システム、クエリ出力方法、文献検索方法、並びに、記録媒体
KR100802115B1 (ko) * 2006-12-07 2008-02-11 삼성광주전자 주식회사 팬 모터 케이스

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0703435A1 (en) 1994-09-21 1996-03-27 Nec Corporation Moving object navigation apparatus
JPH0894369A (ja) * 1994-09-21 1996-04-12 Nec Corp 移動体誘導装置
US5797112A (en) * 1994-09-21 1998-08-18 Nec Corporation Navigation apparatus using a position index and information representative of roads and institutions
JP2001117939A (ja) * 1999-10-20 2001-04-27 Just Syst Corp クエリ出力装置、文献検索システム、クエリ出力方法、文献検索方法、並びに、記録媒体
KR100802115B1 (ko) * 2006-12-07 2008-02-11 삼성광주전자 주식회사 팬 모터 케이스

Similar Documents

Publication Publication Date Title
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US6658377B1 (en) Method and system for text analysis based on the tagging, processing, and/or reformatting of the input text
US6965857B1 (en) Method and apparatus for deriving information from written text
KR100515641B1 (ko) 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법
US10296584B2 (en) Semantic textual analysis
US5475587A (en) Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms
JP2005535007A (ja) 文書検索システム用の知識抽出のための自己学習システムの合成方法
Passarotti et al. Interlinking through lemmas. the lexical collection of the lila knowledge base of linguistic resources for latin
Reese et al. Natural Language Processing with Java: Techniques for building machine learning and neural network models for NLP
Zouaoui et al. A novel quranic search engine using an ontology-based semantic indexing
JPH02176868A (ja) データベース検索装置
Shamsfard et al. An introduction to HASTI: an ontology learning system
Dorobăţ et al. onIQ: an ontology-independent natural language interface for building SPARQL queries
Chiarcos et al. Towards LLOD-based language contact studies: a case study in interoperability
Autayeu et al. Lightweight parsing of classifications into lightweight ontologies
Ramos et al. A QA System for learning Python
Enea et al. Idiolectic Language-Analysis for Understanding Doctor-Patient Dialogues.
JPH0322140A (ja) 知識洗練装置
Vysotska Generative regular grammars application to modeling the semantics of sentences in natural language
Moruz et al. Interlinking and Extending Large Lexical Resources for Romanian
Dhanya et al. Vriksh: A tree based malayalam lemmatizer using suffix replacement dictionary
Emani et al. Improving open information extraction for semantic web tasks
Yarushkina et al. The Method for Improving the Quality of Information Retrieval Based on Linguistic Analysis of Search Query
Bednár Vocabulary matching for information extraction language
Kasbe et al. Ontology Based Information Retrieval System Using Multiple Queries For Academic Library