JPH07129601A - Information retrieval device - Google Patents

Information retrieval device

Info

Publication number
JPH07129601A
JPH07129601A JP5276478A JP27647893A JPH07129601A JP H07129601 A JPH07129601 A JP H07129601A JP 5276478 A JP5276478 A JP 5276478A JP 27647893 A JP27647893 A JP 27647893A JP H07129601 A JPH07129601 A JP H07129601A
Authority
JP
Japan
Prior art keywords
data
search
input
natural language
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5276478A
Other languages
Japanese (ja)
Inventor
Toshihide Ichimori
俊秀 市森
Akira Maeda
章 前田
Hitoshi Ashida
仁史 芦田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5276478A priority Critical patent/JPH07129601A/en
Publication of JPH07129601A publication Critical patent/JPH07129601A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To easily understand a retrieved result at the time of information retrieval by utilizing a natural language, to improve the efficiency of the information retrieval and to easily construct an information retrieval device utilizing the natural language by learning. CONSTITUTION:Based on retrieval conditions inputted in a user input part 107, the retrieval of data is executed in a fuzzy retrieval execution part 103. The result of retrieval is converted into the natural language by referring to a natural language definition part 104 in a retrieved result conversion part 106. Thus, the legibility of the information retrieved result is improved, a tendency provided in the data is easily grasped and the efficiency of an operation for leading information from a data base is improved. Thus, the information retrieval device with improved retrieval efficiency is easily constructed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、情報処理分野、制御分
野等、大量のデータを扱う分野一般に関連するものであ
り、特にデータベースの利用が盛んな分野で適用可能な
情報検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a general field of handling a large amount of data such as an information processing field and a control field, and more particularly to an information retrieval apparatus applicable in a field where a database is actively used.

【0002】[0002]

【従来の技術】本発明においてデータとは、ビジネス分
野における顧客情報、営業情報、また制御分野における
プラントの運転履歴、運転状態のデータなどを指す。こ
れらのデータは、数値データの場合もあれば、記号デー
タの場合もあり、通常データベースと呼ばれるデータ記
憶システムに蓄えらることが多いが、これ以外にもプラ
ント装置等で、プラントからオンラインで転送されてく
る場合もある。
2. Description of the Related Art In the present invention, data refers to customer information and business information in the business field, and plant operation history and operation state data in the control field. These data may be numerical data or symbolic data, and are often stored in a data storage system usually called a database. In some cases, it will be sent.

【0003】データベースは、通常、磁気記憶装置等よ
り構成され、データの一括管理、すなわちデータの整理
・保管を最大の利用目的としている。データベースに記
憶されている内容は、要求に応じて自由に読み出した
り、書き換えたりすることが可能であり、データベース
を利用することで、大量のデータを効率的に管理するこ
とが可能になる。このような利用法は、データベースの
1次的な利用であり、現在の中心的な利用法となってい
る。
The database is usually composed of a magnetic storage device or the like, and its maximum purpose is to collectively manage the data, that is, organize and store the data. The contents stored in the database can be freely read or rewritten in response to a request, and a large amount of data can be efficiently managed by using the database. Such usage is a primary usage of the database, and is currently the main usage.

【0004】1次的な利用法に加えて、データの解析を
行ない、様々な有益な情報を導き出す高度な利用法、す
なわちデータベースの2次的な利用の開発が進められて
いる。例えばビジネス分野であれば顧客の個々のデータ
の管理を行なう1次的な利用方法に加え、顧客の情報を
解析して営業戦略に役立てる2次的な利用方法の開発が
進められている。
In addition to the primary usage, the advanced usage that analyzes data and derives various useful information, that is, the secondary usage of the database is being developed. For example, in the field of business, in addition to the primary usage method of managing individual customer data, the development of secondary usage methods of analyzing customer information for use in a sales strategy is under way.

【0005】データベースの1次的な利用の技術として
は、データベースから目的の情報を取り出すための情報
検索技術がある。情報検索技術とは、データベース等に
アクセスして目的の情報を得る技術であり、このなか
で、人間の用いる自然言語による検索を扱うものとし
て、あいまい検索技術(以下、従来技術1と呼ぶ)が提
案されている。従来技術1の例としては、寺野寿郎、浅
居喜代治、菅野道夫共編「ファジィシステム入門」(オ
ーム社刊)205ページから207ページ記載のものが
ある。
As a technique for primary use of the database, there is an information retrieval technique for retrieving target information from the database. The information retrieval technique is a technique for accessing a database or the like to obtain target information, and among them, a fuzzy retrieval technique (hereinafter referred to as conventional technique 1) is used as a technique for dealing with retrieval in natural language used by humans. Proposed. As an example of the conventional technique 1, there is one described in pages 205 to 207 of "Introduction to Fuzzy Systems" (published by Ohmsha) edited by Toshiro Terano, Kiyoji Asai and Michio Kanno.

【0006】データベースの2次的な利用の技術として
は、データの統計的な性質を調べる統計解析技術などが
ある。
As a technique for secondary use of the database, there is a statistical analysis technique for examining statistical properties of data.

【0007】以下、熱ボイラーの稼働状況のデータを対
象に、従来技術の説明を行なう。今、ボイラー装置の稼
働状況を管理するデータベースがあるとする。ボイラー
装置は、内部状態が、「ボイラー内温度」および「ボイ
ラー内圧力」の値で表現される。ボイラー装置は、圧力
弁を介して内部状態の制御が行なわれる。「圧力弁制御
量」は圧力弁の開度であり、簡単には、圧力弁を開くと
ボイラーの温度および圧力が下がり、逆に閉じると温度
および圧力が上昇する。ボイラーのデータベースには複
数のボイラー装置のデータが記録されている。ボイラー
のデータは、「ボイラー名」、「時刻」、「ボイラー内
温度」、「ボイラー内圧力」、「圧力弁制御量」、の5
項目からなる。データベースに記憶されている内容の一
部を表1に示す。データの項目の内、ボイラー名は記号
データで、それ以外は数値データである。
The prior art will be described below with reference to the data on the operating condition of the thermal boiler. Suppose now that there is a database that manages the operating status of boiler equipment. The internal state of the boiler device is represented by the values of “temperature inside boiler” and “pressure inside boiler”. In the boiler device, the internal state is controlled via the pressure valve. The “pressure valve control amount” is the opening degree of the pressure valve. Briefly, when the pressure valve is opened, the temperature and pressure of the boiler decrease, and conversely, the temperature and pressure increase. The data of multiple boiler devices are recorded in the boiler database. Boiler data is 5 for "boiler name", "time", "boiler temperature", "boiler pressure", and "pressure valve control amount".
It consists of items. Table 1 shows a part of the contents stored in the database. Among the data items, the boiler name is symbolic data and the others are numerical data.

【0008】従来技術1のあいまい検索技術について説
明する。
The fuzzy search technique of the prior art 1 will be described.

【0009】今、上記のボイラーの稼働状況データベー
スを、任意の項目、例えばボイラー名により検索する。
通常の検索では、記号データの項目については検索条件
を記号で入力し、数値データの項目については検索条件
を数値または、数式等で入力する。具体的な検索条件と
しては、例えば、 検索条件:(ボイラー名 = ”ボイラー1”)、 検索条件:(200度 < ボイラー内温度 < 300
度)、 などと設定する。
Now, the operation status database of the boiler is searched by an arbitrary item, for example, the boiler name.
In a normal search, a search condition is entered as a symbol for a symbol data item, and a search condition is entered as a numeric value or a mathematical expression for a numeric data item. As specific search conditions, for example, search condition: (boiler name = “boiler 1”), search condition: (200 degrees <boiler internal temperature <300
Degree), etc.

【0010】数値データを検索する場合、人間の用いる
自然言語で検索条件を設定できると直観的で分かりやす
い。すなわち次のような設定である。
When searching numerical data, it is intuitive and easy to understand if search conditions can be set in the natural language used by humans. That is, the following settings are made.

【0011】検索条件:(ボイラー内温度 = 高い)。Search conditions: (temperature in boiler = high).

【0012】しかしながらこの場合、自然言語の「高
い」が具体的にどのような数値の範囲を指すかあいまい
であるため、データにアクセスする際の直接の検索条件
として扱えない。そこでファジィ論理を用いたあいまい
検索技術によりこの点を解決する。なお、ファジィ論理
の詳細は向殿政男著「ファジィのはなし」(日刊工業新
聞社刊,13頁〜65頁)等に詳しい。
In this case, however, it is unclear what numerical range "high" in the natural language specifically refers to, and therefore it cannot be treated as a direct search condition when accessing data. Therefore, we solve this point by fuzzy search technology using fuzzy logic. The details of fuzzy logic are described in "Fuzzy's Story" by Masao Mukaiden (published by Nikkan Kogyo Shimbun, pages 13-65) and the like.

【0013】あいまい検索の実行手順を図16に示す。
図16中、ステップ1601でユーザは検索条件を入力
する。ここでは、次の検索条件を考える。
FIG. 16 shows the procedure for executing the fuzzy search.
In FIG. 16, in step 1601, the user inputs search conditions. Here, consider the following search conditions.

【0014】検索条件:((ボイラー名=”ボイラー
1”)かつ(ボイラー内温度=高い))。
Search conditions: ((boiler name = “boiler 1”) and (boiler internal temperature = high)).

【0015】検索条件には数値データであるボイラー内
温度の項目に、「高い」という自然言語が入力されてい
る。ステップ1602では、検索条件のうち数値データ
の項目に自然言語で入力があった、「ボイラー内温度=
高い」をファジィメンバシップ関数に対応づけ、数値デ
ータを扱える形に変換する。「ボイラー内温度が高い」
には、図17に示すようなファジィメンバシップ関数を
対応させる。ファジィメンバシップ関数は予め定義され
ているものとする。
In the retrieval condition, the natural language "high" is entered in the item of boiler temperature which is numerical data. In step 1602, the numerical data item in the search conditions was input in natural language, "temperature in boiler =
"High" is associated with a fuzzy membership function and converted into a form that can handle numerical data. "High temperature inside the boiler"
Is associated with a fuzzy membership function as shown in FIG. The fuzzy membership function is defined in advance.

【0016】次にステップ1603でデータ検索が実行
される。検索条件は、記号データであるボイラー名とフ
ァジィメンバシップ関数に変換されているボイラー内温
度である。
Next, in step 1603, a data search is executed. The search conditions are the boiler name, which is symbolic data, and the temperature inside the boiler that has been converted into a fuzzy membership function.

【0017】ステップ1603のデータ検索の詳細な手
順を図18に示す。
FIG. 18 shows the detailed procedure of the data search in step 1603.

【0018】まずステップ1801〜1804で、デー
タベース内の全てのデータについて、検索条件に対する
適合度を算定する。ここで適合度とは、データが検索条
件にどれだけ適合しているかを示す[0,1]の連続値
であり、検索条件が完全に適合していれば1になる。条
件が記号データの場合は、項目が一致した場合に適合度
が1、そうでない場合に0の2値をとる。
First, in steps 1801 to 1804, the degree of conformity to the search condition is calculated for all data in the database. Here, the goodness of fit is a continuous value of [0, 1] indicating how well the data matches the search condition, and becomes 1 if the search condition is perfectly matched. If the condition is symbolic data, the degree of relevance is 1 when the items match, and 0 otherwise.

【0019】ステップ1802およびステップ1803
では、データの個々の検索条件に対する適合度を求め
る。個々の検索条件とは検索条件の各要素、すなわち
「ボイラー名=ボイラー1」および「ボイラー内温度=
高い」を指す。
Steps 1802 and 1803
Then, the degree of conformity of the data to each search condition is obtained. The individual search conditions are the elements of the search conditions, namely, "boiler name = boiler 1" and "boiler temperature =
“High”.

【0020】検索条件の要素は、 要素1:(ボイラー名=”ボイラー1”)、 要素2:(ボイラー内温度 = 高い)、 であるから、例えば表1の番号4のデータに対する適合
度はそれぞれ、 要素1に対する適合度=1、 要素2に対する適合度=0.5、 となる。
The elements of the search condition are element 1: (boiler name = “boiler 1”) and element 2: (boiler internal temperature = high), so that, for example, the goodness of fit for the data of No. 4 in Table 1 is , Conformity to element 1 = 1, conformity to element 2 = 0.5.

【0021】個々の検索条件全てについて適合度が算定
されたら、ステップ1804において検索条件の各要素
の適合度から、検索条件全体に対する適合度を求める。
適合度同士の演算には、様々なファジィ演算が適用可能
である。ファジィ演算については、前述の向殿政男著
「ファジィのはなし」(日刊工業新聞社刊,13頁〜6
5頁)等に詳しい。ここでは、ファジィ演算のなかのM
IN-MAX演算を例に説明する。このMIN-MAX演
算は、要素が「かつ」で結合されている時は、その要素
の内のミニマム、すなわち小さい方を全体の値とし、要
素が「または」で結合されている時はその要素の内のマ
キシマム、すなわち大きい方を全体の値とする演算であ
る。
When the goodness of fit is calculated for all the individual search conditions, the goodness of fit for the entire search condition is obtained from the goodness of fit of each element of the search condition in step 1804.
Various fuzzy calculations can be applied to the calculation of the matching degrees. Regarding fuzzy arithmetic, "Fuzzy no Hanashi" by Masao Mukaiden mentioned above (published by Nikkan Kogyo Shimbun, page 13-6
Details on page 5). Here, M in fuzzy operation
The IN-MAX operation will be described as an example. This MIN-MAX operation takes the minimum value of the elements, that is, the smaller one as the whole value when the elements are connected with "and", and the element when the elements are connected with "or". The maximum of the two, that is, the larger one is the total value.

【0022】このMIN-MAX演算にしたがえば、検
索条件の要素は、「かつ」で結合されているため、先の
要素1と要素2の適合度の小さい方になり、 番号4のデータの適合度 = 0.5。
According to this MIN-MAX operation, since the elements of the search condition are combined with "Katsu", the matching degree of the element 1 and the element 2 is smaller, and the data of the number 4 Goodness of fit = 0.5.

【0023】以上の操作をデータベース中の全てのデー
タについて行ない、各データの適合度を算定して、処理
はステップ1805に進む。ステップ1805では、検
索条件を満たしているデータを選択して出力する。デー
タの適合度は、そのデータがどれだけ検索条件に適合し
ているかを示す指標であるから、適合度の大きなデータ
を選択すれば良い。適合度がどれくらいの値であれば検
索条件を満たすかは、さまざまな判断がある。例えば、
「適合度>0.5」であれば検索条件を満たしているな
どであるが、ここでは、簡単のため適合度の値が最も大
きいものを選ぶことにする。
The above operation is performed for all the data in the database, the suitability of each data is calculated, and the process proceeds to step 1805. In step 1805, data satisfying the search condition is selected and output. The goodness of fit of the data is an index showing how well the data fits the search condition, and therefore, the data having a high goodness of fit may be selected. There are various judgments as to what value of the goodness of fit satisfies the search condition. For example,
If "goodness of fit>0.5", the search condition is satisfied, but here, for simplicity, the one with the highest goodness of fit value is selected.

【0024】この操作により選ばれるデータは、表1に
示す番号3のデータの組になる。番号3のデータが選択
されて、あいまい検索が終了する。
The data selected by this operation is the data set of No. 3 shown in Table 1. The data of number 3 is selected, and the fuzzy search ends.

【0025】[0025]

【表1】 [Table 1]

【0026】従来技術2について説明する。従来技術2
は、データに統計的な処理を施してデータの持つ情報を
明らかにするものである。統計処理として最も簡単に
は、データベースに含まれている各データについて平均
・分散等を調べる方法がある。さらに各項目間の関係を
調べたければ、共分散を調べる、相関係数を調べるなど
の方法がある。
Prior art 2 will be described. Prior art 2
Is to clarify the information contained in data by performing statistical processing on the data. The simplest method of statistical processing is to check the average, variance, etc. for each data contained in the database. Further, if it is desired to examine the relationship between each item, there are methods such as examining the covariance and the correlation coefficient.

【0027】例えばデータベースに表2のデータが含ま
れているとする。「ボイラー内温度」、「ボイラー内圧
力」の平均値はそれぞれ、「300度」、「7気圧」と
なるのでこれがほぼ通常の稼働状態であると見当をつけ
ることができる。ボイラー稼働時に、これより大きく外
れた値が発生すれば、ボイラーの異常を検知することが
可能になる。
For example, it is assumed that the database contains the data of Table 2. Since the average values of the “boiler temperature” and the “boiler pressure” are “300 degrees” and “7 atm”, respectively, it can be estimated that these are almost normal operating conditions. If a value that deviates significantly from this occurs when the boiler is operating, it is possible to detect an abnormality in the boiler.

【0028】このようにして、データベースに蓄積され
たデータに統計処理を施すことで有用な情報を導き出す
ことができる。
In this way, useful information can be derived by statistically processing the data accumulated in the database.

【0029】[0029]

【発明が解決しようとする課題】従来技術1の問題点に
ついて述べる。
Problems of the prior art 1 will be described.

【0030】従来技術1は、検索条件については自然言
語で指定可能であったが、検索結果については、何の処
理も施されない。このために検索者は検索結果を理解し
づらい。例えばボイラー内温度が高い場合のボイラー内
圧力の傾向を知ることが目的で、表1のデータに対して
検索を行なう。検索条件は、検索条件:(ボイラー内温
度=高い)、とする。ただし、ファジィメンバシップ関
数および適合度算定のためのファジィ演算等は適当に定
義されているものとする。
In the prior art 1, the search condition can be specified in natural language, but no processing is performed on the search result. This makes it difficult for searchers to understand the search results. For example, the data in Table 1 is searched for the purpose of knowing the tendency of the boiler internal pressure when the boiler internal temperature is high. The search condition is the search condition: (temperature inside boiler = high). However, it is assumed that the fuzzy membership function and the fuzzy calculation for calculating the fitness are appropriately defined.

【0031】検索を実行すると、検索結果として次のよ
うに複数のデータが得られることがある。
When the search is executed, a plurality of data may be obtained as the search result as follows.

【0032】ボイラー内温度=380度、ボイラー内圧
力=7気圧。
Boiler internal temperature = 380 ° C., boiler internal pressure = 7 atm.

【0033】ボイラー内温度=350度、ボイラー内圧
力=8気圧。
Boiler internal temperature = 350 ° C., boiler internal pressure = 8 atm.

【0034】ボイラー内温度=320度、ボイラー内圧
力=6気圧。
Boiler temperature = 320 ° C., boiler pressure = 6 atm.

【0035】この検索結果を見ると、ボイラー内温度が
高い場合のボイラー内圧力は、6〜8気圧であることが
わかる。しかしながら、6〜8気圧と言う数字が持つ意
味、例えばこの圧力の値が相対的に高いのか低いのか
は、直接にはわからない。これは、ボイラー内圧力が数
値データであり、それをそのまま表示するために生じる
問題である。これは、通常の情報検索でも同様に生じて
いた問題であり、あいまい検索によっても解決されなか
った問題である。
From this search result, it can be seen that the boiler internal pressure is 6 to 8 atm when the boiler internal temperature is high. However, it is not directly known what the numerical value of 6 to 8 atm has, for example, whether the value of this pressure is relatively high or low. This is a problem because the pressure inside the boiler is numerical data and is displayed as it is. This is a problem that has occurred in the normal information search as well, and is a problem that cannot be solved by the fuzzy search.

【0036】また、従来技術1では、自然言語をファジ
ィメンバシップ関数を介して数値に変換し、検索を行な
う。検索者の意図通りに検索が行なわれるためには、フ
ァジィメンバシップ関数の形状がデータベースの内容を
十分に反映している必要がある。しかしながら、ファジ
ィメンバシップ関数の形状をデータベースに適合するよ
うに調整する作業は、多大な試行錯誤が必要であり、あ
いまい検索装置の構築効率低下の問題を招いている。
Further, in the prior art 1, natural language is converted into a numerical value through a fuzzy membership function and a search is performed. In order for the search to be performed as the searcher intended, the shape of the fuzzy membership function must sufficiently reflect the contents of the database. However, the work of adjusting the shape of the fuzzy membership function so that it fits the database requires a great deal of trial and error, which causes a problem of lowering the construction efficiency of the fuzzy search device.

【0037】このように、従来技術1では、第1に検索
結果が数値データを含む場合に検索結果の持つ意味が直
観的には理解が難しい点、第2にファジィメンバシップ
関数の調整に多大な労力が必要な点、の2点が問題とな
る。
As described above, in the prior art 1, first, it is difficult to intuitively understand the meaning of the search result when the search result includes numerical data. Secondly, it is very difficult to adjust the fuzzy membership function. There are two problems, that is, a lot of labor is required.

【0038】従来技術2の問題点について述べる。The problems of the prior art 2 will be described.

【0039】従来技術2の統計的な手法は、あくまでも
データの統計的な性質について調べるものであり、統計
上で発生頻度の少ない事柄を調べるには不適当である。
上記のボイラーの例でいえば、異常稼働時のデータであ
る。異常稼働時のデータは正常稼働時のデータに較べ、
出現頻度が低い。そのため得られたデータに直接統計解
析を行なうと、異常稼働時のデータが圧倒的多数の正常
稼働時のデータに埋もれる事態が発生し、解析が不可能
になる。例えば正常稼働時と異常稼働時の出現頻度が1
00対1の場合、異常稼働時のデータがデータ全体の平
均値に与える影響は100対1であり、平均値を調べて
も異常稼働時の状況は解析できない。
The statistical method of the prior art 2 is to check the statistical properties of the data, and is not suitable for checking the statistically infrequent occurrences.
In the case of the above-mentioned boiler, it is data at the time of abnormal operation. Compared with the data at the time of normal operation, the data at the time of abnormal operation,
The appearance frequency is low. Therefore, if the obtained data is directly subjected to statistical analysis, the data during abnormal operation may be overwhelmed by the data during normal operation, which makes analysis impossible. For example, the appearance frequency during normal operation and abnormal operation is 1
In the case of 00: 1, the influence of the data at the time of abnormal operation on the average value of the entire data is 100: 1, and the situation at the time of abnormal operation cannot be analyzed even by examining the average value.

【0040】これを防ぐためには、元のデータから異常
時のデータを選り分けた上で、解析を行なえば良い。し
かしながら、この選り分けを行なうためにはボイラーの
異常稼働状態に関する事前の知識が必要である。データ
の解析を行なう前に、そのデータの持つ傾向や性質を知
ることは一般にあまり期待できない。また事前の知識が
あったとしても、これによりデータを選り分ける作業
は、情報検索の効率の低下を招く。
In order to prevent this, it is sufficient to select the abnormal data from the original data and then analyze it. However, in order to make this selection, prior knowledge of the abnormal operating condition of the boiler is required. It is generally not possible to expect much to know the tendency and the nature of the data before analyzing the data. Further, even if there is prior knowledge, the work of selecting data by this causes a decrease in the efficiency of information retrieval.

【0041】このように従来技術2では、統計的手法の
成否がデータの性質に左右される問題があり、また、目
的の情報を正確に取り出すためには、非常な労力が必要
になる点が問題になる。
As described above, in the prior art 2, there is a problem that the success or failure of the statistical method depends on the property of the data, and it takes a great deal of effort to accurately extract the target information. It becomes a problem.

【0042】本発明の第1の目的は、上記従来例1の第
1の問題点を克服し、データベース等の検索結果に数値
データの項目が含まれる際には、これを自然言語に変換
して可読性を高め、情報検索の効率向上を図ることにあ
る。
A first object of the present invention is to overcome the first problem of the conventional example 1 described above, and when numerical data items are included in a search result of a database or the like, convert them into a natural language. Readability and information retrieval efficiency.

【0043】本発明の第2の目的は、上記従来例1の第
2の問題点を克服し、ファジィメンバシップ関数の調整
を自動化することで、情報検索装置の構築の効率向上を
図ることにある。
A second object of the present invention is to overcome the second problem of the conventional example 1 described above and to automate the adjustment of the fuzzy membership function to improve the efficiency of the construction of the information retrieval apparatus. is there.

【0044】本発明の第3の目的は、上記従来例2の問
題点を克服し、データの持つ傾向を掴むことを容易とす
ることで、情報検索により情報を導き出す作業の効率化
を図ることにある。
A third object of the present invention is to overcome the problems of the above-mentioned conventional example 2 and to easily grasp the tendency of data, thereby improving the efficiency of work for deriving information by information retrieval. It is in.

【0045】[0045]

【課題を解決するための手段】本発明は、データベース
検索結果に数値データの項目が含まれる場合、これを自
然言語に変換する手段を具備する。
The present invention comprises means for converting numerical data items, if they are included in a database search result, into a natural language.

【0046】本発明は、データベース検索結果に数値デ
ータの項目が含まれる場合、これを自然言語に変換する
手段、さらに検索条件および検索結果の項目のうち数値
データの項目にはファジィメンバシップ関数を対応させ
る手段を具備する。
In the present invention, when the database search result includes a numerical data item, a means for converting the numerical data item into a natural language, and a numerical condition data item among the search condition and the search result item is provided with a fuzzy membership function. It is equipped with a means for responding.

【0047】本発明は、データベース検索において、数
値データの項目を自然言語を用いて検索する場合、自然
言語の対応する具体的な検索条件の数値を、ユーザの明
示的な指定なしに決定する手段を具備する。
According to the present invention, in a database search, when an item of numerical data is searched using natural language, a means for determining the numerical value of a specific search condition corresponding to natural language without the user's explicit designation. It is equipped with.

【0048】本発明は、データベース等において、数値
データの項目に自然言語を対応させ、次に自然言語と数
値データを結びつけるファジィメンバシップ関数を対応
させ、さらにファジィメンバシップ関数の形状を、ユー
ザの指定した学習データを基に、自動的に決定する手段
を具備する。
According to the present invention, in a database or the like, a natural language is made to correspond to an item of numerical data, and then a fuzzy membership function for connecting the natural language and the numerical data is made to correspond. Furthermore, the shape of the fuzzy membership function is defined by the user. A means for automatically determining based on designated learning data is provided.

【0049】本発明は、データベースのデータをディス
プレイ画面上でユーザに提示し、さらにマウス等の指示
手段により、ユーザが学習データを指定する手段を具備
し、この学習データを基に自然言語の対応する具体的な
検索条件の数値を決定する手段を具備する。
The present invention is provided with means for presenting the data of the database to the user on the display screen and for the user to specify the learning data by means of an instruction means such as a mouse. And a means for determining the numerical value of a specific search condition.

【0050】本発明は、検索結果の項目および値の組合
せに対して、検索結果のデータがどの程度合致している
か示す手段を具備する。
The present invention comprises means for indicating how much the data of the search result matches the combination of the item and the value of the search result.

【0051】[0051]

【作用】本発明は、ファジィメンバシップ関数等を利用
して、データベース等の数値データの項目に自然言語を
対応させる。これにより検索結果に数値データが含まれ
る場合でも、ユーザは、検索結果を自然言語により得る
ことが可能になる。
The present invention uses a fuzzy membership function or the like to associate a natural language with an item of numerical data in a database or the like. This allows the user to obtain the search result in natural language even when the search result includes numerical data.

【0052】本発明は、データベース等の中の数値デー
タの項目と、ユーザが定義した自然言語の対応関係を、
ユーザの指定した学習データを基に自動的に決定する。
これにより、ユーザは学習データを指定するだけで、数
値データの項目と自然言語を対応づけることが可能にな
る。
According to the present invention, the correspondence between the numerical data items in the database etc. and the natural language defined by the user,
It is automatically determined based on the learning data specified by the user.
As a result, the user can associate the items of the numerical data with the natural language only by designating the learning data.

【0053】本発明は、データベース等の中の数値デー
タの項目と、ユーザが定義した自然言語の対応関係を決
定しているファジィメンバシップ関数を、ユーザの指定
した学習データを基に自動的に決定する。これにより、
ユーザは学習データを指定するだけで、ファジィメンバ
シップ関数の定義が可能になる。
According to the present invention, a fuzzy membership function that determines the correspondence between a numerical data item in a database or the like and a natural language defined by the user is automatically calculated based on the learning data specified by the user. decide. This allows
The user can define the fuzzy membership function by simply specifying the learning data.

【0054】本発明は、検索結果の持つ傾向を、データ
の項目と自然言語の組合せで示す。これにより、ユーザ
は検索結果の持つ傾向を簡単に知ることが可能になる。
In the present invention, the tendency of the search result is shown by the combination of the data item and the natural language. This allows the user to easily know the tendency of the search result.

【0055】[0055]

【実施例】本発明の実施例について図面を用いて詳細に
説明する。例としてボイラーの稼働状況のデータを対象
に説明を行なう。今、ボイラー装置の稼働状況を管理す
るデータベースがあるとする。ボイラー装置の内部状態
は、「ボイラー内温度」および「ボイラー内圧力」の値
で表現される。ボイラー装置は、内部状態の制御が圧力
弁を介して行なわれ、「圧力弁制御量」の値は、オペレ
ータの行なった操作を示す。「圧力弁制御量」は圧力弁
の開度であり、簡単には、圧力弁を開くとボイラーの温
度、圧力が下がり、逆に閉じると温度圧力が上昇する傾
向にある。ボイラーのデータベースには、複数のボイラ
ー装置のデータが記録されている。前記表1で示される
ように、ボイラーのデータの項目は、「ボイラー名」、
「時刻」、「ボイラー内温度」、「ボイラー内圧力」、
「圧力弁制御量」、の5項目からなる。データベースに
記憶されている内容の一部が表2であるとする。各項目
の内、ボイラー名は記号データで、それ以外は数値デー
タである。
Embodiments of the present invention will be described in detail with reference to the drawings. As an example, we will explain the data on the operating status of the boiler. Suppose now that there is a database that manages the operating status of boiler equipment. The internal state of the boiler device is represented by the values of "temperature inside boiler" and "pressure inside boiler". In the boiler device, the internal state is controlled via the pressure valve, and the value of the "pressure valve control amount" indicates the operation performed by the operator. The "pressure valve control amount" is the opening of the pressure valve, and in brief, when the pressure valve is opened, the temperature and pressure of the boiler decrease, and conversely, the temperature and pressure tend to increase. The data of a plurality of boiler devices is recorded in the boiler database. As shown in Table 1, the boiler data item is “boiler name”,
"Time", "Boiler temperature", "Boiler pressure",
It consists of five items, "pressure valve control amount". It is assumed that a part of the contents stored in the database is Table 2. Among the items, the boiler name is symbol data, and the others are numerical data.

【0056】[0056]

【表2】 [Table 2]

【0057】本発明の第1の実施例を図面を用いて詳細
に説明する。第1の実施例は、検索結果の自然言語によ
る出力である。すなわち、データベース等の検索結果に
数値データの項目が含まれている際に、これを自然言語
に変換して可読性を高めることで検索システムの操作性
を向上させ、情報検索の効率向上を図る。
A first embodiment of the present invention will be described in detail with reference to the drawings. The first embodiment is an output of search results in natural language. That is, when a numerical result item is included in the search result of a database or the like, the operability of the search system is improved by converting the numerical data item into a natural language to improve readability, and the efficiency of information search is improved.

【0058】図1は本発明の第1の実施例の情報検索装
置の概要である。図1中、データ記憶部101とデータ
アクセス部105により、通常のデータベースが構成さ
れている。データベースには、本発明が対象とするデー
タが蓄積され、このデータは、データアクセス部に検索
条件を入力することで検索可能である。ただし、データ
ベースアクセス部105が受け付けるデータベース検索
の入力は、通常の情報検索の入力、すなわち検索するデ
ータの様式と同じものである。検索するデータが数値デ
ータであれば、数値または数式で入力し、記号データで
あれば記号で入力する必要がある。
FIG. 1 is an outline of the information retrieval apparatus of the first embodiment of the present invention. In FIG. 1, the data storage unit 101 and the data access unit 105 constitute a normal database. Data targeted by the present invention is accumulated in the database, and this data can be searched by inputting search conditions into the data access unit. However, the input of the database search accepted by the database access unit 105 is the same as the input of the normal information search, that is, the format of the data to be searched. If the data to be searched is numeric data, it must be entered as a numeric value or mathematical formula, and if it is symbol data, it must be entered as a symbol.

【0059】以下では、変換方式にファジィメンバシッ
プ関数およびファジィ演算を用いた方式を例に説明を行
なう。
In the following, a method using a fuzzy membership function and fuzzy operation as a conversion method will be described as an example.

【0060】ユーザ入力部107は、ディスプレイ、キ
ーボード、マウス等により構成され、ユーザからの入力
を受けつける。ユーザの検索条件入力はこのユーザ入力
部107を介して行なわれる。検索条件は、データベー
スのデータの様式と同じである必要はなく、例えば数値
データを検索する際に、自然言語で検索条件を指定して
も良い。数値データの検索条件に自然言語が指定された
際には、検索条件変換部102は自然言語定義部104
を参照して、自然言語をファジィメンバシップ関数に変
換する。
The user input section 107 is composed of a display, a keyboard, a mouse, etc., and receives an input from the user. The search condition input by the user is performed via the user input unit 107. The search condition does not have to be the same as the data format of the database, and for example, when searching numerical data, the search condition may be specified in natural language. When natural language is specified as the search condition of the numerical data, the search condition conversion unit 102 causes the natural language definition unit 104 to
To convert a natural language into a fuzzy membership function.

【0061】あいまい検索実行部103は、変換された
検索条件入力を基に、データベースに対して従来例の
「あいまい検索」等を行ない、検索結果を得る。
The fuzzy search execution unit 103 performs the "fuzzy search" of the conventional example on the database based on the converted search condition input, and obtains the search result.

【0062】検索結果変換部106は、検索結果に数値
データの項目が含まれている場合に、自然言語定義部1
04を参照し、数値データの項目を自然言語に変換す
る。検索結果出力部はディスプレイ等により構成され、
自然言語に変換された検索結果を表示出力する。
The search result conversion unit 106, when the search result includes an item of numerical data, determines the natural language definition unit 1.
04, the item of numerical data is converted into natural language. The search result output unit consists of a display, etc.
The search results converted into natural language are displayed and output.

【0063】自然言語定義部104は、数値データと自
然言語の変換を行なう方式を記憶する。ファジィメンバ
シップ関数の形状およびファジィ演算の方法が記憶され
ている。
The natural language definition unit 104 stores a method for converting numerical data and natural language. The shape of the fuzzy membership function and the method of fuzzy operation are stored.

【0064】本発明の情報検索装置の実行の手順を図2
に示す。図中、ステップ201の検索条件入力、ステッ
プ202の検索条件変換およびステップ203のあいま
い検索実行は、前記従来例1などと同様の手順において
行なわれる。すなわち、ステップ201で入力された検
索条件は、数値データの項目に自然言語で指定があった
場合、ステップ202において、ファジィメンバシップ
関数に変換される。ステップ203では変換された検索
条件で、従来例のあいまい検索が実行される。
FIG. 2 shows the procedure of execution of the information retrieval apparatus of the present invention.
Shown in. In the figure, the search condition input in step 201, the search condition conversion in step 202, and the ambiguous search execution in step 203 are performed in the same procedure as in the prior art example 1 and the like. That is, the search condition input in step 201 is converted into a fuzzy membership function in step 202 when an item of numerical data is designated in natural language. In step 203, the fuzzy search of the conventional example is executed using the converted search conditions.

【0065】ただし、上記ステップ201からステップ
203の検索は、あいまい検索ではなく、前記従来例で
述べた通常の検索方法、すなわち数値データの項目は数
値データの範囲を指定すること等で検索を行なっても良
い。
However, the search from step 201 to step 203 is not an ambiguous search, and is performed by the usual search method described in the above-mentioned conventional example, that is, by specifying the range of numerical data for the numerical data item. May be.

【0066】ステップ204では、あいまい検索の検索
結果に数値データの項目が含まれている場合、これを自
然言語に変換する。変換された検索結果はステップ20
5でユーザに出力される。
In step 204, if the search result of the fuzzy search includes an item of numerical data, it is converted into a natural language. The converted search result is step 20.
It is output to the user at 5.

【0067】ボイラー稼働状況のデータを例に、本実施
例の情報検索の具体的な手順について説明する。今、検
索条件が、 検索条件:((ボイラー名=”ボイラー1”)かつ(ボイラ
ー内温度=高い))、 であったとする。「ボイラー内温度が高い」のファジィ
メンバシップ関数が図3に示す定義であり、適合度のフ
ァジィ演算がMIN−MAX、検索条件に適合するデー
タは適合度が最大のものを選ぶとする。あいまい検索を
実行すると表1中の番号3のデータの組が選ばれる。従
来例では、データが選択されると、これをそのまま出力
して処理は終りであるが、本発明ではこれをさらに検索
結果のデータの項目の内、数値データのものを自然言語
に変換して出力する。これは、本発明の情報検索装置で
は、図1中の検索結果変換部106であり、本発明の処
理の手順ではステップ204に対応する。
A specific procedure for information retrieval of this embodiment will be described by taking the data of the boiler operating condition as an example. Now, it is assumed that the search condition is the search condition: ((boiler name = "boiler 1") and (boiler temperature = high)). It is assumed that the fuzzy membership function "high boiler temperature" is the definition shown in FIG. 3, the fuzzy calculation of the goodness of fit is MIN-MAX, and the data having the highest goodness of fit is selected as the data meeting the search condition. When the fuzzy search is executed, the data set numbered 3 in Table 1 is selected. In the conventional example, when the data is selected, it is output as it is and the processing ends. However, in the present invention, this is further converted into the natural language from the numerical data among the items of the data of the search result. Output. This is the search result conversion unit 106 in FIG. 1 in the information search device of the present invention, and corresponds to step 204 in the processing procedure of the present invention.

【0068】ボイラー稼働状況のデータの項目は、ボイ
ラー名以外は数値データである。これら数値データは、
ステップ204で自然言語に変換される。変換は、図1
中の自然言語定義部104中に記憶されている内容に従
い、検索結果変換部106において行なわれる。図5は
変換の詳細な手順を示す。
The items of the boiler operation status data are numerical data except for the boiler name. These numerical data are
In step 204, it is converted into a natural language. The conversion is shown in Figure 1.
In accordance with the contents stored in the natural language definition unit 104 therein, the search result conversion unit 106 performs. FIG. 5 shows the detailed procedure of conversion.

【0069】ステップ501では、変換対象の項目に対
応する自然言語の候補を選ぶ。「ボイラー内圧力」の項
目の数値を自然言語に変換するのであれば、対応する自
然言語として定義されている、「高い」および「低い」
がファジィメンバシップ関数と共に自然言語定義部10
4から読み出される。それぞれの自然言語には、図4の
ファジィメンバシップ関数が割り当てられているものと
する。
In step 501, a natural language candidate corresponding to the item to be converted is selected. If the value of the item "pressure in boiler" is converted into natural language, "high" and "low" are defined as the corresponding natural language.
Is a natural language definition part 10 together with a fuzzy membership function.
4 is read. It is assumed that the fuzzy membership function of FIG. 4 is assigned to each natural language.

【0070】ステップ502では、データの項目の数値
およびファジィメンバシップ関数から各候補の適合度を
算定する。「ボイラー内圧力」の数値、「9気圧」に対
する適合度は次のようになる。
In step 502, the suitability of each candidate is calculated from the numerical values of the data items and the fuzzy membership function. The conformity to the numerical value of "pressure in boiler" and "9 atm" is as follows.

【0071】「高い」の適合度=1.0 「低い」の適合度=0.0 ステップ503では、最も適合度の高い自然言語を選択
する。すなわち、「ボイラー内圧力」の項目に対応する
自然言語として「高い」が選択される。
Goodness of Fit = 1.0 Goodness of Low = 0.0 In step 503, the natural language with the highest fit is selected. That is, “high” is selected as the natural language corresponding to the item “pressure in boiler”.

【0072】他の数値データの項目も同様に処理され、
図2中のステップ204の検索出力の変換が終了する。
Other numerical data items are processed in the same manner,
The conversion of the search output in step 204 in FIG. 2 is completed.

【0073】変換されたデータは、最終的にステップ2
05でユーザに対して出力される。出力は、図1中の検
索結果出力部108において、次のような内容がディス
プレイ等にされる。
The converted data is finally processed in step 2
It is output to the user at 05. Regarding the output, the search result output unit 108 in FIG. 1 displays the following contents on a display or the like.

【0074】「番号」=3 「時刻」= 正午。 「ボイラー内温度」=「高い」。 「ボイラー内圧力」=「高い」。 「圧力弁制御量」=「大」。"Number" = 3 "Time" = noon. "Boiler temperature" = "high". "Boiler pressure" = "high". "Pressure valve control amount" = "large".

【0075】以上のようにして、検索結果に含まれてい
る数値データの項目を自然言語に変換することが可能に
なる。
As described above, the items of numerical data included in the search result can be converted into natural language.

【0076】ちなみに、検索結果を自然言語に変換しな
い場合の出力は次のようになる。
Incidentally, the output when the search result is not converted into natural language is as follows.

【0077】「番号」=3 「時刻」= 12:00。 「ボイラー内温度」=「400°C」。 「ボイラー内圧力」=「9気圧」。 「圧力弁制御量」=「+30」。"Number" = 3 "Time" = 12: 00. "Boiler temperature" = "400 ° C". "Boiler pressure" = "9 atm". “Pressure valve control amount” = “+ 30”.

【0078】この2つを比較すると、数値データの項目
を自然言語に変換することでデータの可読性が向上し、
検索結果の持つ意味や内容が理解しやすくなることは明
らかである。
Comparing the two, the readability of the data is improved by converting the items of numerical data into natural language,
It is clear that the meaning and content of the search results will be easier to understand.

【0079】検索結果出力部108において画面等に表
示する内容としては、図6に示すように数値および自然
言語に変換したもの両方を表示するか、またはどちらか
一方を表示する。両方表示する場合、自然言語の方は、
数値データの全データ中での傾向を示すガイド的な役割
となる。さらに自然言語表示の補助として、自然言語の
対応するメンバシップ関数の適合度、重心値等を表示し
てもよい。
As the contents displayed on the screen or the like in the search result output unit 108, both numerical values and those converted into natural language are displayed as shown in FIG. 6, or either one is displayed. When displaying both, the natural language
It serves as a guide for showing trends in all numerical data. Furthermore, as an aid to the natural language display, the fitness, the center of gravity value, etc. of the membership function corresponding to the natural language may be displayed.

【0080】また、検索結果を表示する際に、自然言語
に変換したものと数値のままのものが混ざっても構わな
い。
Further, when displaying the retrieval result, the one converted into the natural language and the one having the numerical value may be mixed.

【0081】上記第1の実施例では、各項目の自然言語
毎にファジィメンバシップ関数を対応させたが、項目の
組合せに対してファジィメンバシップ関数を対応させて
も良い。例えば上記では、「温度が高い」にファジィメ
ンバシップ関数が対応したが、「ボイラー1の温度が高
い」、「ボイラー2の温度が高い」、等として、それぞ
れ異なるファジィメンバシップ関数を対応させても良
い。
In the first embodiment described above, the fuzzy membership function is made to correspond to each natural language of each item, but the fuzzy membership function may be made to correspond to a combination of items. For example, in the above, the fuzzy membership function is associated with "high temperature", but different fuzzy membership functions are associated with "high temperature of boiler 1", "high temperature of boiler 2", etc. Is also good.

【0082】上記第1の実施例では、数値データと自然
言語の変換にはファジィメンバシップ関数およびファジ
ィ演算を用いた。変換方式としては、ファジィメンバシ
ップ関数以外にも、定義域のみ定める、数式で与える、
等の方法を用いてもよい。また、他に条件を指定しても
よい。例えば、 {ボイラー内圧力が「高い」|ボイラー内圧力>5気圧}、 {ボイラー内圧力が「高い」|ボイラー内圧力>ボイラー内温度/50}、 {ボイラー内圧力が「高い」|(ボイラー名=”ボイラー1”かつ 時刻>12:00 かつ ボイラー内圧力>5気圧)}、 などとする方法である。この場合はそれぞれ、 ボイラー内圧力の値が5気圧より高い、 ボイラー内圧力の値がボイラー内温度の50分の1より
大きい、 ボイラー1で、時刻が12:00以降でボイラー内圧力
が5気圧より高い、 場合に、ボイラー内圧力の値を「高い」に変換する。
In the first embodiment described above, the fuzzy membership function and the fuzzy operation are used to convert the numerical data and the natural language. As a conversion method, besides the fuzzy membership function, only the domain is defined, given by a mathematical expression,
Etc. may be used. Also, other conditions may be specified. For example, {Boiler internal pressure is "high" | Boiler internal pressure> 5 atm}, {Boiler internal pressure is "high" | Boiler internal pressure> Boiler internal temperature / 50}, {Boiler internal pressure is "high" | (Boiler internal pressure Name = “boiler 1” and time> 12:00 and boiler internal pressure> 5 atm)}, and so on. In this case, the value of the boiler internal pressure is higher than 5 atm, the value of the boiler internal pressure is greater than 1/50 of the boiler internal temperature, the boiler 1 has a boiler internal pressure of 5 atm after 12:00. In case of higher, convert value of boiler pressure to "high".

【0083】上記第1の実施例の検索結果の変換では、
ファジィメンバシップ関数の適合度を基準に自然言語の
選択を行なったが、これ以外にも、「数値データとファ
ジィメンバシップ関数の重心値の距離により比較を行な
う」、「適合度が0以上のものはすべて選択する」、等
の方法を用いてもよい。
In the conversion of the search result of the first embodiment,
Natural language was selected based on the goodness of fit of the fuzzy membership function. In addition to this, "Compare by the distance between the numerical data and the center of gravity of the fuzzy membership function", You can use a method such as “select all things”.

【0084】上記第1の実施例ではデータベース等のデ
ータが数値データで、これを自然言語で検索する場合に
ついて述べたが、これとは逆に自然言語、記号等のデー
タを数値で検索することも当然可能である。この場合自
然言語設定部で上記手順のステップ204とは逆の変
換、すなわち数値データから自然言語、記号への変換を
行なうことになる。
In the first embodiment described above, the data in the database or the like is numerical data, and the case of retrieving this in natural language has been described. On the contrary, the data in natural language, symbols, etc. is retrieved in numerical value. Of course it is possible. In this case, the natural language setting unit performs the reverse conversion of step 204 of the above procedure, that is, the conversion of numerical data into natural language and symbols.

【0085】上記第1の実施例では、データベースから
目的のデータを取り出す手段として、あいまい検索を用
いたが、あいまい検索以外の検索方法、例えば、検索条
件をデータベースのデータと同じ様式で指定して、デー
タベースアクセス部に検索条件を直接入力するなどの通
常のデータベース検索を行なっても良い。
In the first embodiment, the fuzzy search is used as a means for retrieving the target data from the database. However, a search method other than the fuzzy search, for example, a search condition is specified in the same format as the data in the database. Ordinary database search may be performed by directly inputting search conditions into the database access unit.

【0086】本発明の第2の実施例を図面を用いて詳細
に説明する。第2の実施例は、自然言語定義の自動学習
機能である。すなわち、ユーザの指定する学習データを
基に、データベース等の中の数値データの項目と自然言
語を対応づける自然言語定義を自動学習し、自然言語定
義の設定作業の効率化をはかる。
The second embodiment of the present invention will be described in detail with reference to the drawings. The second embodiment is an automatic learning function of natural language definition. That is, based on the learning data specified by the user, the natural language definition for associating the items of the numerical data in the database etc. with the natural language is automatically learned, and the setting work of the natural language definition is made efficient.

【0087】図7は本発明の第2の実施例の対象である
情報検索装置の概要である。データ記憶部101、検索
条件変換部102、あいまい検索実行部103、自然言
語定義部104、データアクセス部105、検索結果変
換部106、ユーザ入力部107、および検索結果出力
部108は上記第1の実施例と同じ構成である。ユーザ
の学習データ指定は、ユーザ入力部107を介して行な
われる。
FIG. 7 is an outline of the information retrieval apparatus which is the object of the second embodiment of the present invention. The data storage unit 101, the search condition conversion unit 102, the fuzzy search execution unit 103, the natural language definition unit 104, the data access unit 105, the search result conversion unit 106, the user input unit 107, and the search result output unit 108 are the above-mentioned first It has the same configuration as the embodiment. The user's learning data designation is performed via the user input unit 107.

【0088】学習実行部701は、指定された学習デー
タに適合するように、自然言語定義部104に記憶され
ている、数値と自然言語の変換方式を調整する。
The learning execution unit 701 adjusts the conversion method between the numerical value and the natural language stored in the natural language definition unit 104 so as to match the designated learning data.

【0089】第2の実施例の具体的な例として、第1の
実施例の説明に用いたボイラー稼働状況のデータベース
を用いる。数値と自然言語の変換方式は、第1の実施例
の説明で用いたものと同様にファジィメンバシップ関数
とファジィ演算を用いる方式とする。この場合、ファジ
ィメンバシップ関数の形状が自動学習の対象となる。
As a concrete example of the second embodiment, the boiler operation status database used in the description of the first embodiment is used. The conversion method between the numerical value and the natural language is the method using the fuzzy membership function and the fuzzy operation as in the case of the description of the first embodiment. In this case, the shape of the fuzzy membership function is the target of automatic learning.

【0090】ボイラー稼働状況のデータベース中の項目
の「ボイラー内温度」に対応する自然言語の定義を学習
する方法について説明する。自然言語定義の学習は例え
ば図8の手順で行なわれる。図8中ステップ801から
803は順序が変わってもよい。
A method of learning the definition of the natural language corresponding to the item “temperature in boiler” in the database of boiler operating status will be described. Learning of the natural language definition is performed, for example, by the procedure shown in FIG. The order of steps 801 to 803 in FIG. 8 may be changed.

【0091】まずステップ801でデータの項目に対応
する自然言語を与える。これは、ユーザが与えても良い
し、予め、「大」、「中」、「小」の3つの言葉が自動
的に割り当てられる等の設定にしておいてもよい。ここ
では、データの項目が「ボイラー内温度」であるから
「高」、「中」、「低」の3つを割り当てることにす
る。
First, in step 801, a natural language corresponding to an item of data is given. This may be given by the user, or may be set in advance such that three words “large”, “medium”, and “small” are automatically assigned. Here, since the data item is “temperature in boiler”, three “high”, “medium”, and “low” will be assigned.

【0092】ステップ802では、それぞれの言葉に学
習実行前の初期値としてのファジィメンバシップ関数、
ファジィメンバシップ関数の鋳型を割り当てる。
「高」、「中」、「低」それぞれに、図9のようなファ
ジィメンバシップ関数が割り当てられたとする。この操
作も、ステップ802と同じようにユーザが与えても良
いし、例えば3角形のファジィメンバシップ関数が自動
的に割り当てられるよう設定していてもよい。
In step 802, a fuzzy membership function as an initial value before learning is executed for each word,
Assign a template for the fuzzy membership function.
It is assumed that a fuzzy membership function as shown in FIG. 9 is assigned to each of “high”, “medium”, and “low”. This operation may be given by the user similarly to step 802, or may be set so that, for example, a triangular fuzzy membership function is automatically assigned.

【0093】ステップ803で、自然言語の学習データ
の候補となるデータをデータベースから読み出し、ユー
ザに表示する。
In step 803, data that is a candidate for learning data of natural language is read from the database and displayed to the user.

【0094】ステップ804では、ユーザが学習データ
候補の中から自然言語に対応すべき学習データを選択す
る。これは、「高」、「中」、「低」の自然言語のそれ
ぞれに対し、該当するデータをユーザが選ぶ作業であ
る。表1のデータでは、「高」に対応するデータとして
は、「番号」が2、3、8、9等、「中」に対応するデ
ータとしては、データ番号4、5、13等、「低」に対
応するデータとしてはデータ番号1、7等が選ばれると
する。
At step 804, the user selects the learning data corresponding to the natural language from the learning data candidates. This is an operation in which the user selects the corresponding data for each of the "high", "medium", and "low" natural languages. In the data of Table 1, as the data corresponding to “high”, the “number” is 2, 3, 8, 9 and the like, and as the data corresponding to “medium”, the data numbers 4, 5, 13 and the like are “low”. It is assumed that data numbers 1, 7 and the like are selected as data corresponding to ".

【0095】ステップ803およびステップ804の学
習データ候補の表示、ユーザの選択の方法としては、例
えば図10に示すように学習候補データを一覧表示し、
そこから学習データを選択する。表示する学習データの
候補は、データベースのデータ全てでもよいし、一部だ
けでもよい。また、数値の欠落など、学習データとして
不適当なデータは除去して表示してもよい。図中、10
01はデータベースの中のデータ一覧であり、ユーザ
は、データ一覧の表示欄をマウス等の指示手段を用いて
指定することで、学習データに加えることができる。1
002は、指示手段が現在指示している学習データ、1
003は、選択中の学習データの対応すべき自然言語の
表示であり、1004は、学習データに選択されたデー
タ番号等の表示である。このよう方法により選択された
学習データの一部を表3に示す。
As a method of displaying the learning data candidates in step 803 and step 804 and selecting the user, for example, a list of learning candidate data is displayed as shown in FIG.
Select learning data from there. The learning data candidates to be displayed may be all the data in the database or only a part thereof. Also, data unsuitable as learning data, such as missing numerical values, may be removed and displayed. 10 in the figure
Reference numeral 01 is a data list in the database, which can be added to the learning data by the user by designating a display field of the data list using an instruction means such as a mouse. 1
002 is the learning data currently instructed by the instructing means, 1
Reference numeral 003 is a display of the natural language to which the selected learning data should correspond, and 1004 is a display of the data number or the like selected for the learning data. Table 3 shows a part of the learning data selected by this method.

【0096】表3において、教師値の項にはデータに対
応する自然言語が表示される。
In Table 3, the natural language corresponding to the data is displayed in the term of the teacher value.

【0097】[0097]

【表3】 [Table 3]

【0098】実際のファジィメンバシップ関数の学習は
ステップ805で実行される。学習には、各自然言語毎
に個別に学習を行なう方式(個別学習方式)と、全て同
時に行なう方式(同時学習方式)等がある。いずれも、
基本的にはメンバシップ関数の誤差を求めた後、勾配法
によりメンバシップ関数のパラメータを修正する方法で
ある。
Learning of the actual fuzzy membership function is performed in step 805. The learning includes a method of individually learning for each natural language (individual learning method) and a method of simultaneously performing all learning (simultaneous learning method). Both
Basically, it is a method of correcting the membership function error and then correcting the parameters of the membership function by the gradient method.

【0099】個別学習方式について述べる。個別学習方
式の手順は例えば図11で示される。
The individual learning method will be described. The procedure of the individual learning method is shown in FIG. 11, for example.

【0100】ステップ1101では、各学習データ毎に
自然言語の適合度を求め、予め与えておいた基準値との
比較を行なう。全ての学習データの適合度が基準適合度
を上回れば学習は終了する。基準適合度とは、適合度の
値がいくら以上の場合にその自然言語が成立するかを示
す値であり、例えば0.8などに設定しておく。データ
の適合度が基準適合度を上回れば、その自然言語はデー
タの数値に対応しているわけであり、自然言語のファジ
ィメンバシップ関数の形状を修正する必要がない。
At step 1101, the fitness of the natural language is calculated for each learning data and compared with a reference value given in advance. If the fitness of all the learning data exceeds the standard fitness, the learning ends. The reference goodness of fit is a value indicating how much the goodness of fit value satisfies the natural language, and is set to, for example, 0.8. If the goodness of fit of the data exceeds the standard goodness of fit, the natural language corresponds to the numerical value of the data, and it is not necessary to modify the shape of the fuzzy membership function of the natural language.

【0101】適合度が基準適合度を下回るデータがある
場合は、ステップ1102において、該当する各データ
毎に誤差を算定する。各データに対する誤差は例えば次
式で算定される。
If there is data whose conformity falls below the reference conformity, in step 1102, an error is calculated for each corresponding data. The error for each data is calculated by the following formula, for example.

【0102】[0102]

【数1】 ej = {(基準値) − (適合度)}2。 …(1) ステップ1103では、ステップ1102で求めた誤差
の収束の有無を判定し、収束していたら処理を終了す
る。これは、学習データに誤りがある等の理由で、ステ
ップ1701の終了条件が満たされない場合に、学習を
終了する条件である。収束の判定は、例えば次式によ
る。
[Equation 1] ej = {(reference value) − (goodness of fit)} 2 . (1) In step 1103, it is determined whether or not the error obtained in step 1102 has converged, and if it has converged, the process ends. This is a condition for ending the learning when the ending condition of step 1701 is not satisfied due to an error in the learning data. The determination of convergence is based on the following equation, for example.

【0103】[0103]

【数2】 |(前回の誤差の総和)−(今回の誤差の総和)| < 0.1 …(2) ただし、誤差の総和は次で表される。## EQU00002 ## | (Previous error sum)-(Current error sum) | <0.1 (2) However, the error sum is represented by the following.

【0104】[0104]

【数3】 Σej 。 …(3) j(jは適合度が基準値未満のデータ) 誤差が収束していなかったら、ステップ1104でファ
ジィメンバシップ関数の形状を定めている形状パラメー
タに修正を加え、適合度が基準値を上回るようにファジ
ィメンバシップ関数の形状を調整する。ファジィメンバ
シップ関数の形状パラメータpiは次式等により変更す
る。
## EQU3 ## Σ ej. (3) j (where j is the data whose fitness is less than the reference value) If the error has not converged, the shape parameter that defines the shape of the fuzzy membership function is modified in step 1104, and the fitness is adjusted to the reference value. Adjust the shape of the fuzzy membership function to exceed. The shape parameter p i of the fuzzy membership function is changed by the following equation.

【0105】[0105]

【数4】 pi ← pi + α・Σ(∂ej /∂pi)。 …(4) j(jは適合度が基準値未満のデータ) ただし、αは学習係数であり微小な値を与える。[Equation 4] pi ← pi + α · Σ (∂ej / ∂pi). (4) j (j is data whose fitness is less than the reference value) where α is a learning coefficient and gives a minute value.

【0106】全てのパラメータの変更が終了したらステ
ップ1101に戻る。ステップ1101〜1104の手
順を繰り返すことで、学習データに対して適合度が基準
値を越えるようにファジィメンバシップ関数の形状が修
正される。
When all the parameters have been changed, the process returns to step 1101. By repeating the procedure of steps 1101 to 1104, the shape of the fuzzy membership function is modified so that the goodness of fit exceeds the reference value for the learning data.

【0107】以上の手順を各データの項目の各自然言語
について行なえば、目的とする図8中ステップ805の
ファジィメンバシップ関数の学習が完了する。
By performing the above procedure for each natural language of each data item, the learning of the target fuzzy membership function in step 805 in FIG. 8 is completed.

【0108】次に、同時学習方式について説明する。同
時学習方式は、1つのデータの項目に対応する自然言語
全てを同時に学習する方式である。以下では、学習デー
タに対応すべき自然言語を教師値と呼ぶ。同時学習方式
の手順は例えば図12で示される。
Next, the simultaneous learning method will be described. The simultaneous learning method is a method for simultaneously learning all natural languages corresponding to one data item. Below, the natural language that should correspond to the learning data is called the teacher value. The procedure of the simultaneous learning method is shown in FIG. 12, for example.

【0109】表3の学習データを用いて、「ボイラー内
温度が高い」に同時学習方式を適用した場合について、
図12の手順に従って説明する。
Using the learning data in Table 3, the case where the simultaneous learning method is applied to "the temperature inside the boiler is high" is as follows.
It will be described according to the procedure of FIG.

【0110】まずステップ1201およびステップ12
02で各学習データについて、データ項目に対応する自
然言語を求め、教師値と比較する。全ての学習データで
教師値と自然言語が一致すれば処理は終了する。
First, step 1201 and step 12
In 02, for each learning data, the natural language corresponding to the data item is obtained and compared with the teacher value. The process ends if the teacher value and the natural language match in all learning data.

【0111】一致しない学習データがある場合、処理は
ステップ1203に進む。一致しなかった学習データに
ついて、これが一致するように各自然言語のファジィメ
ンバシップ関数の形状を調整する。
If there is learning data that does not match, the process proceeds to step 1203. The shape of the fuzzy membership function of each natural language is adjusted so that the learning data that do not match will match.

【0112】例えば表3のデータ番号1の学習データに
対して、「ボイラー内温度」の各自然言語の適合度は、 「高」の適合度=0.7。 「中」の適合度=0.3。 「低」の適合度=0.0。
For example, with respect to the learning data of data number 1 in Table 3, the fitness of each natural language of “temperature in boiler” is “high” fitness = 0.7. Goodness of fit for "medium" = 0.3. "Low" goodness of fit = 0.0.

【0113】である。最も適合度の高いものは「高」と
なり。これが「ボイラー内温度」の自然言語として得ら
れる。しかしながら、これは教師値「中」と異なるた
め、この学習データについて、「ボイラー内温度」の
「高」、「中」、「低」のファジィメンバシップ関数の
修正が必要である。
It is The one with the highest degree of conformity is "high". This is obtained as the natural language of "temperature in the boiler". However, since this is different from the teacher value "medium", it is necessary to correct the fuzzy membership functions of "high", "medium", and "low" of "temperature in boiler" for this learning data.

【0114】ステップ1203およびステップ1204
で一致しなかった学習データを順に1つずつ取り出し、
1205〜1208でデータ項目に対応する自然言語の
ファジィメンバシップ関数の学習を行なう。
Steps 1203 and 1204
The training data that did not match in
In 1205 to 1208, a fuzzy membership function of natural language corresponding to the data item is learned.

【0115】まず、ステップ1205および1206で
は、データ項目に対する自然言語を順に選択する。
First, in steps 1205 and 1206, the natural language for the data item is sequentially selected.

【0116】ステップ1207では、選択された自然言
語の学習データに対する誤差を算定する。選択された自
然言語が教師値と一致している場合、すなわち「中」の
ファジィメンバシップ関数の誤差は、 e = {1 − (適合度)}2、 とし、それ以外で適合度が教師値の自然言語より大きい
場合、すなわち「高」のファジィメンバシップ関数の誤
差は、 e = {(教師値自然言語の適合度) − (適合度)}2、 とする。ステップ1208では算定した誤差よりファジ
ィメンバシップ関数の調整を行なう。ファジィメンバシ
ップ関数の各パラメータpiは次式等により変更する。
In step 1207, the error with respect to the learning data of the selected natural language is calculated. If the selected natural language matches the teacher value, that is, the error of the “medium” fuzzy membership function is e = {1− (fitness)} 2 , and otherwise the fitness is the teacher value. Is larger than the natural language of, that is, the error of the “high” fuzzy membership function is e = {(fitness of teacher value natural language) − (fitness)} 2 . In step 1208, the fuzzy membership function is adjusted based on the calculated error. Each parameter pi of the fuzzy membership function is changed by the following equation.

【0117】[0117]

【数5】 pi ← pi + α・(∂e/∂pi)。 …
(5) ただし、αは学習係数であり微小な値を与える。
[Equation 5] pi ← pi + α · (∂e / ∂pi). …
(5) where α is a learning coefficient and gives a minute value.

【0118】以上の手順を繰り返すことにより、教師値
と一致する自然言語は適合度が大きくなる方向に、一致
しない自然言語は適合度が小さくなる方向にファジィメ
ンバシップ関数の形状が調整されていく。上記の例で
は、「高」に対応するファジィメンバシップ関数は適合
度が小さくなり、また教師値と同じ「高」に対応するフ
ァジィメンバシップ関数は適合度が大きくなる。最終的
に、学習データに対して、教師値と同じ自然言語の適合
度が最大になり、学習データに対応する自然言語は教師
値と同じものになる。
By repeating the above procedure, the shape of the fuzzy membership function is adjusted such that the natural language that matches the teacher value has a higher fitness and the non-matching natural language has a lower fitness. . In the above example, the fuzzy membership function corresponding to "high" has a low degree of conformity, and the fuzzy membership function corresponding to "high" which is the same as the teacher value has a high degree of fitness. Finally, the fitness of the same natural language as the teacher value becomes maximum with respect to the learning data, and the natural language corresponding to the learning data becomes the same as the teacher value.

【0119】以上の手順を各データ項目について行なえ
ば、目的とする図8中ステップ805のファジィメンバ
シップ関数の学習が完了する。
When the above procedure is performed for each data item, the learning of the target fuzzy membership function at step 805 in FIG. 8 is completed.

【0120】学習後のファジィメンバシップ関数の形状
を図13に示す。
The shape of the fuzzy membership function after learning is shown in FIG.

【0121】上記の同時学習の手順では簡単のため省略
したが、学習データに誤りがある等の場合に学習が終了
しないのを防ぐため、ステップ1203等において誤差
の収束状況を監視して、誤差が収束した場合は処理を終
了するようにしてもよい。
Although the procedure of the simultaneous learning is omitted for simplification, the error convergence state is monitored in step 1203 or the like to prevent the learning from ending if the learning data has an error. The process may be terminated when the values have converged.

【0122】上記の同時学習の手順では、ステップ12
04から1208において学習データ1つに対してファ
ジィメンバシップ関数の形状パラメータの修正を1回行
なったが、これ以外に、学習データ1つ毎の、形状パラ
メータの修正量を加算しておき、学習データ全体での修
正量の和を用いてファジィメンバシップ関数の形状を修
正してもよい。
In the above simultaneous learning procedure, step 12
In 04 to 1208, the shape parameter of the fuzzy membership function was corrected once for one learning data, but in addition to this, the correction amount of the shape parameter for each learning data is added and learning is performed. The shape of the fuzzy membership function may be corrected using the sum of the correction amounts of the entire data.

【0123】上記第2の実施例では、数値データと自然
言語の変換にはファジィメンバシップ関数およびファジ
ィ演算を用いた。変換方式としては、ファジィメンバシ
ップ関数以外にも、定義域のみ定める、数式で与える、
等の方法を用いてもよい。また、他に条件を指定しても
よい。例えば、 {ボイラー内圧力が「高い」|ボイラー内圧力>5気圧}、 {ボイラー内圧力が「高い」|ボイラー内圧力>ボイラー内温度/50}、 {ボイラー内圧力が「高い」|(ボイラー名=”ボイラー1”かつ 時刻>12:00 かつ ボイラー内圧力>5気圧)}、 などとする方法である。
In the second embodiment, the fuzzy membership function and the fuzzy operation are used to convert the numerical data and the natural language. As a conversion method, besides the fuzzy membership function, only the domain is defined, given by a mathematical expression,
Etc. may be used. Also, other conditions may be specified. For example, {Boiler internal pressure is "high" | Boiler internal pressure> 5 atm}, {Boiler internal pressure is "high" | Boiler internal pressure> Boiler internal temperature / 50}, {Boiler internal pressure is "high" | (Boiler internal pressure Name = “boiler 1” and time> 12:00 and boiler internal pressure> 5 atm)}, and so on.

【0124】このような変換方式でも、上記第2の実施
例の手順中のファジィメンバシップ関数の形状パラメー
タを調整している部分、図12中ではステップ1208
に対応する部分を、数式のパラメータを調整する、条件
が成立している時だけパラメータを調整する、等に変更
すれば容易に本発明を実現することができる。
Even in such a conversion method, the part of adjusting the shape parameter of the fuzzy membership function in the procedure of the second embodiment, step 1208 in FIG.
The present invention can be easily realized by changing the part corresponding to (1) to adjusting the parameter of the mathematical expression, adjusting the parameter only when the condition is satisfied, and the like.

【0125】上記第2の実施例では、データベースから
目的のデータを取り出す手段として、あいまい検索を用
いたが、あいまい検索以外の検索方法、例えば、検索条
件をデータベースのデータと同じ様式で指定して、デー
タベースアクセス部に検索条件を直接入力するなどの通
常のデータベース検索を行なっても良い。
In the second embodiment, the fuzzy search is used as the means for extracting the target data from the database. However, a search method other than the fuzzy search, for example, a search condition is specified in the same format as the data in the database. Ordinary database search may be performed by directly inputting search conditions into the database access unit.

【0126】上記第2の実施例では、メンバシップ関数
のパラメータの修正に勾配法を用いたが、ニュトン法、
共役勾配法等の計算方法を用いても構わない。
In the second embodiment described above, the gradient method is used to correct the parameters of the membership function, but the Newton method,
A calculation method such as the conjugate gradient method may be used.

【0127】また、最初にメンバシップ関数の鋳形を与
えて、これを修正するのではなく、クラスタリング、最
小2乗法等、公知の手法を利用して、直接に、ファジィ
メンバシップ関数の同定を行なってもよい。
Further, instead of first giving the casting of the membership function and correcting it, the well-known methods such as clustering and least squares method are used to directly identify the fuzzy membership function. You may do it.

【0128】本発明の第3の実施例を図面を用いて詳細
に説明する。第3の実施例は検索結果の説明機能であ
る。すなわち、検索結果が自然言語で得られた後、さら
にデータの項目と自然言語の組合せが、検索結果にどの
ように現れたかを調べて表示し、ユーザが容易に検索結
果の傾向を把握できるようにする。
A third embodiment of the present invention will be described in detail with reference to the drawings. The third embodiment is a function of explaining search results. That is, after the search result is obtained in natural language, how the combination of the data item and natural language appears in the search result is further displayed and displayed so that the user can easily grasp the tendency of the search result. To

【0129】図14は本発明の第3の実施例の対象であ
る情報検索装置の概要である。データ記憶部101、検
索条件変換部102、あいまい検索実行部103、自然
言語定義部104、データアクセス部105、検索結果
変換部106、およびユーザ入力部107は上記第1の
実施例と同じ構成である。
FIG. 14 is an outline of the information retrieval apparatus which is the object of the third embodiment of the present invention. The data storage unit 101, the search condition conversion unit 102, the fuzzy search execution unit 103, the natural language definition unit 104, the data access unit 105, the search result conversion unit 106, and the user input unit 107 have the same configuration as in the first embodiment. is there.

【0130】類似検索結果出力部1401は、検索結果
のデータから、同じ傾向を示すデータをまとめ、検索結
果全体の中での出現頻度をデータの合致度として出力す
る。
The similar search result output unit 1401 collects data showing the same tendency from the search result data, and outputs the appearance frequency in the entire search result as the matching degree of the data.

【0131】本発明の第3の実施例の具体的な手順を次
に示す。
The concrete procedure of the third embodiment of the present invention will be described below.

【0132】ステップ14.1 検索条件を入力し、検
索を行なう。
Step 14.1 Enter search conditions and search.

【0133】ステップ14.2 得られた検索結果のう
ちで、各項目と自然言語を組合せたものが、検索結果の
データにどれだけの頻度で現れたかを求める。
Step 14.2 Among the obtained search results, how often the combination of each item and natural language appears in the data of the search results.

【0134】ステップ14.3 ステップ1401.2
の結果を表示する。
Step 14.3 Step 1401.2
Display the result of.

【0135】ステップ14.1では、第1の実施例で説
明した情報検索が実行される。検索結果のデータのうち
数値項目のデータは自然言語に変換されている。
In step 14.1, the information search described in the first embodiment is executed. Numerical data of the search result data is converted into natural language.

【0136】次にステップ14.1で得られた検索結果
をもとに、ステップ14.2が実行される。ステップ1
4.2では、検索結果の各項目と対応する自然言語の組
合せを作り、検索結果得られたデータに対して、それぞ
れの組合せに合致するデータおよび合致しないデータを
調べ、その組合せで検索結果のデータの傾向をどれだけ
説明できるかをデータの合致度として数値で出力する。
Next, step 14.2 is executed based on the search result obtained in step 14.1. Step 1
In 4.2, a combination of natural language corresponding to each item of the search result is created, and the data obtained as the search result is examined for the data matching the respective combinations and the data not matching, and the combination of the search result is obtained. A numerical value is output as the degree of agreement of the data indicating how much the tendency of the data can be explained.

【0137】第3の実施例を具体的な例により説明す
る。例えばボイラー稼働状況のデータベースに対して、
適当な検索条件によりステップ14.1を実行する。検
索の結果、「ボイラー内温度」の項目について次のよう
なデータが得られたとする。
The third embodiment will be described with reference to a concrete example. For example, for the database of boiler operation status,
Execute step 14.1 with appropriate search conditions. As a result of the search, assume that the following data is obtained for the item "temperature in boiler".

【0138】データ1: (ボイラー内温度が高)、 データ2: (ボイラー内温度が高)、 データ3: (ボイラー内温度が低)、 データ4: (ボイラー内温度が中)、 データ5: (ボイラー内温度が高)、 データ6: (ボイラー内温度が高)、 データ7: (ボイラー内温度が中)、 データ8: (ボイラー内温度が高)、 データ9: (ボイラー内温度が高)、 データ10:(ボイラー内温度が中)。Data 1: (Boiler temperature is high), Data 2: (Boiler temperature is high), Data 3: (Boiler temperature is low), Data 4: (Boiler temperature is medium), Data 5: (Boiler temperature is high), Data 6: (Boiler temperature is high), Data 7: (Boiler temperature is medium), Data 8: (Boiler temperature is high), Data 9: (Boiler temperature is high) ), Data 10: (temperature inside the boiler is medium).

【0139】次にステップ14.2を実行すると、項目
と対応する自然言語の組合せに対する合致度は、それぞ
れ (ボイラー内温度が高): 0.6(10件中6件合
致)、 (ボイラー内温度が中): 0.3(10件中3件合
致)、 (ボイラー内温度が低): 0.1(10件中1件合
致)、 となる。
Next, when step 14.2 is executed, the degree of agreement with respect to the combination of the item and the corresponding natural language is (the temperature inside the boiler is high): 0.6 (6 cases out of 10 cases), (the inside of the boiler) Temperature is medium: 0.3 (3 matches out of 10), (Boiler temperature is low): 0.1 (1 match out of 10), and so on.

【0140】ステップ14.3では、ステップ14.2
での結果を表示する。表示の具体的な例を図15に示
す。1501は検索条件の表示、1502はデータ項目
と自然言語の組合せの表示、1503は各組合せに対す
るデータの合致度の表示である。
In step 14.3, step 14.2
Display the results in. A specific example of the display is shown in FIG. Reference numeral 1501 is a display of search conditions, 1502 is a display of a combination of data items and natural language, and 1503 is a display of the matching degree of data for each combination.

【0141】表示すべき内容が大量の場合は、データの
項目名と自然言語をユーザが選択して表示するなど、階
層的な表示方法をとってもよい。また、ここでは項目と
自然言語の組合せの中で、合致率の高いものについて表
示を行なったが、任意の項目と任意の自然語について、
検索結果に対する合致率を表示しても良い。また、必要
に応じて、合致度の大きさで並べかえを行なったりグラ
フ表示する等の加工を加えて表示してもよい。
When there is a large amount of content to be displayed, a hierarchical display method may be used, such as the user selecting and displaying the item name and natural language of the data. Also, here, among the combinations of items and natural language, the ones with a high matching rate are displayed, but for any item and any natural language,
You may display the matching rate with respect to a search result. Further, if necessary, the display may be performed by rearranging according to the degree of coincidence or by performing processing such as displaying a graph.

【0142】本発明の第3の実施例の情報検索システム
を利用することで、データベースに含まれている情報を
分かりやすい形で取り出すことができ、データベースか
ら情報を導き出す作業の効率化が図れる。例えば、上記
の例では、検索結果が10個のデータで得られている
が、似た傾向のものをまとめると全部で3つに整理され
ている。また、検索結果の中、「ボイラー内温度が低」
の場合、発生頻度は少なくとも、ボイラー内状況の1つ
として取り出すことが可能になっている。また、同じ傾
向のデータをまとめ、検索結果を整理して表示するた
め、ユーザが調べなければならないデータ数を減らすこ
とができ、効率的な情報検索が可能になる。
By using the information retrieval system of the third embodiment of the present invention, the information contained in the database can be retrieved in an easy-to-understand form, and the work of deriving the information from the database can be made more efficient. For example, in the above example, the search result is obtained with 10 data, but if the similar results are summarized, they are sorted into three in total. Also, in the search results, "the temperature inside the boiler is low"
In this case, at least the occurrence frequency can be taken out as one of the situations in the boiler. In addition, since the data of the same tendency are collected and the search results are organized and displayed, the number of data that the user has to check can be reduced and an efficient information search can be performed.

【0143】上記の手順のステップ14.2、ステップ
14.3では、データの項目およびデータの数が多い場
合に多大な計算時間が必要になる。また、実際に重要な
のは合致度の高い項目と自然言語の組合せを求めること
であるので、ステップ14.2では、分枝限定法など公
知の組合せ最適化手法を使って、計算時間の削減を図っ
ても良い。
In steps 14.2 and 14.3 of the above procedure, a large amount of calculation time is required when the number of data items and data items is large. In addition, what is actually important is to find a combination of an item with a high degree of matching and a natural language. Therefore, in step 14.2, a known combination optimization method such as a branch and bound method is used to reduce the calculation time. May be.

【0144】上記第1、第2および第3の実施例ではデ
ータは全て磁気ディスク装置等により構成されるデータ
記憶システムを想定していたが、これは例えば、データ
バス等を介して、データの送受信が行なわれる構成であ
っても差し支えない。例えばプラント装置からのデータ
がリアルタイムで送られてくるような場合、送られてく
るデータを、自然言語を含む検索条件によって選別し
て、さらに検索結果を自然言語により表示してもよい。
In the first, second and third embodiments described above, all the data is assumed to be a data storage system constituted by a magnetic disk device or the like. It does not matter even if the configuration is such that transmission and reception are performed. For example, when the data from the plant device is sent in real time, the sent data may be selected according to the search condition including the natural language, and the search result may be displayed in the natural language.

【0145】また、上記第1、第2および第3の実施例
では、検索条件および検索結果の表示と実際の検索の変
換は、自然言語と数値データのみについて説明したが、
予め定義できるものでさえあれば、記号等のデータと数
値データの変換等でもよい。例えば記号xが、 x={1,2,3}、 と自然言語定義部104に定義されているとする。検索
変換部106は、検索結果のデータ中に{1,2,
3}、となるデータがあれば、これをxに変換して出力
する。
In the first, second and third embodiments, the display of the search condition and the search result and the actual conversion of the search are explained only for natural language and numerical data.
As long as it can be defined in advance, data such as symbols and numerical data may be converted. For example, it is assumed that the symbol x is defined in the natural language definition unit 104 as x = {1,2,3}. The search conversion unit 106 adds {1, 2 ,,
3}, the data is converted to x and output.

【0146】[0146]

【発明の効果】本発明により、データベース等の検索結
果に数値データの項目が含まれる際には、これが自然言
語に変換され、検索結果の可読性が高まり、情報検索の
効率が向上する。
According to the present invention, when an item of numerical data is included in a search result of a database or the like, it is converted into a natural language, the readability of the search result is improved, and the efficiency of information search is improved.

【0147】本発明により、数値と自然言語の変換を行
なうファジィメンバシップ関数の調整が自動化され、ユ
ーザはメンバシップ関数の形状を明示的に指定すること
なく、効率的に検索システムを構築可能になる。
According to the present invention, the adjustment of the fuzzy membership function for converting the numerical value and the natural language is automated, and the user can efficiently construct the search system without explicitly designating the shape of the membership function. Become.

【0148】本発明により、データの持つ傾向を掴むこ
とが容易になり、データベースから情報を導き出す作業
の効率化が図れる。
According to the present invention, the tendency of data can be easily grasped, and the work of deriving information from the database can be made more efficient.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例の情報検索装置。FIG. 1 is an information search device according to a first embodiment of the present invention.

【図2】本発明の第1の実施例の情報検索装置の情報検
索の手順。
FIG. 2 is an information search procedure of the information search device according to the first embodiment of this invention.

【図3】本発明の第1の実施例の「ボイラー内温度が
高」のファジィメンバシップ関数。
FIG. 3 is a fuzzy membership function of “high boiler temperature” according to the first embodiment of this invention.

【図4】本発明の第1の実施例の「ボイラー内圧力が
高」および「ボイラー内圧力が低」のファジィメンバシ
ップ関数。
FIG. 4 is a fuzzy membership function of “high boiler pressure” and “low boiler pressure” according to the first embodiment of the present invention.

【図5】本発明の第1の実施例の情報検索装置の情報検
索の手順中の検索結果変換手順。
FIG. 5 is a search result conversion procedure in the information search procedure of the information search device according to the first embodiment of this invention.

【図6】本発明の第1の実施例の情報検索装置の検索結
果の表示例。
FIG. 6 is a display example of search results of the information search device according to the first embodiment of the present invention.

【図7】本発明の第2の実施例の情報検索装置。FIG. 7 is an information search device according to a second embodiment of the present invention.

【図8】本発明の第2の実施例の情報検索装置の学習実
行の手順。
FIG. 8 shows a learning execution procedure of the information search device according to the second embodiment of the present invention.

【図9】本発明の第2の実施例の、学習前の「ボイラー
内温度が高」、「ボイラー内温度が中」、および「ボイ
ラー内温度が低」のファジィメンバシップ関数。
FIG. 9 is a fuzzy membership function of “high boiler internal temperature”, “boiler internal temperature”, and “boiler internal temperature” before learning according to the second embodiment of the present invention.

【図10】本発明の第2の実施例の学習データの指定画
面および指定方式の表示例。
FIG. 10 is a display example of a learning data designation screen and a designation method according to the second embodiment of the present invention.

【図11】本発明の第2の実施例の個別学習方式の手
順。
FIG. 11 is a procedure of the individual learning system according to the second embodiment of this invention.

【図12】本発明の第2の実施例の同時学習方式の手
順。
FIG. 12 is a procedure of the simultaneous learning method according to the second embodiment of this invention.

【図13】本発明の第2の実施例の、学習後の「ボイラ
ー内温度が高」、「ボイラー内温度が中」、および「ボ
イラー内温度が低」のファジィメンバシップ関数。
FIG. 13 is a fuzzy membership function of “high boiler internal temperature”, “boiler internal temperature”, and “low boiler internal temperature” after learning according to the second embodiment of the present invention.

【図14】本発明の第3の実施例の情報検索装置。FIG. 14 is an information search device according to the third embodiment of the present invention.

【図15】本発明の第3の実施例の情報検索装置の検索
結果の説明の表示例。
FIG. 15 is a display example of a description of search results of the information search device according to the third embodiment of the present invention.

【図16】従来技術1のあいまい検索の手順。FIG. 16 is a fuzzy search procedure according to the related art 1.

【図17】従来技術1のあいまい検索で用いた、「ボイ
ラー内温度が高」のファジィメンバシップ関数。
FIG. 17 is a fuzzy membership function of “high temperature in the boiler” used in the fuzzy search of Prior Art 1.

【図18】従来技術1のあいまい検索の詳細な手順。FIG. 18 is a detailed procedure of fuzzy search according to the related art 1.

【符合の説明】[Explanation of sign]

101…データ記憶部、102…検索条件変換部、10
3…あいまい検索実行部、104…自然言語定義部、1
05…データアクセス部、106…検索結果変換部、1
07…ユーザ入力部、108…検索結果出力部、601
…検索条件表示部、602…検索結果表示部、701…
学習実行部、1001…学習データ候補一覧表示部、1
002…現在選択中の学習データ候補の表示例、100
3…教師値のデータ項目および自然言語の表示部、10
04…選択された学習データの表示部、1401…類似
検索結果出力部、1501…検索条件の表示部、150
2…データの項目と自然言語の組合せの表示部、150
3…検索結果のデータの合致度表示部。
101 ... Data storage unit, 102 ... Search condition conversion unit, 10
3 ... Fuzzy search execution unit, 104 ... Natural language definition unit, 1
05 ... data access unit, 106 ... search result conversion unit, 1
07 ... User input unit, 108 ... Search result output unit, 601
... Search condition display area 602 ... Search result display area 701 ...
Learning execution unit, 1001 ... Learning data candidate list display unit, 1
002 ... Display example of learning data candidate currently selected, 100
3 ... teacher value data item and natural language display unit, 10
04 ... Selected learning data display unit, 1401 ... Similarity search result output unit, 1501 ... Search condition display unit, 150
2 ... Display of combination of data item and natural language, 150
3 ... A matching degree display section for data of search results.

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】データを記憶するデータ記憶手段と、該デ
ータ記憶手段にアクセスして、データの検索を行なうデ
ータ検索手段と、ユーザの入力を受け付けるユーザ入力
手段と、ユーザの入力が検索条件であった場合に、該検
索条件を上記データ検索手段の入力として適合する様式
に変換する入力変換方式を定義して記憶する入力データ
様式変換定義手段と、該定義された入力変換方式を用い
て、ユーザにより入力された検索条件を上記データ検索
手段の入力として適合する様式に変換する入力データ様
式変換手段と、上記データ検索手段を用いて該変換され
た検索条件に合致するデータの検索を行なうデータ検索
実行手段と、検索されたデータを数値と自然言語の様式
に変換する出力変換方式を定義して記憶する出力データ
様式変換定義手段と、検索されたデータに対し、該定義
された出力変換方式を用いて、数値と自然言語の変換を
行なう出力データ様式変換手段と、該変換されたデータ
をユーザに示す検索結果表示手段とからなることを特徴
とする情報検索装置。
1. A data storage unit for storing data, a data search unit for accessing the data storage unit to search for data, a user input unit for receiving a user input, and a user input as search conditions. If there is, input data format conversion defining means for defining and storing an input conversion method for converting the search condition into a format suitable as an input of the data search means, and using the defined input conversion method, Input data format conversion means for converting the search condition input by the user into a format suitable for input of the data search means, and data for searching data matching the converted search condition using the data search means Retrieval executing means and output data format conversion defining means for defining and storing an output conversion method for converting retrieved data into numerical values and natural language formats , Output data format conversion means for converting numerical values and natural language into the retrieved data using the defined output conversion method, and search result display means for showing the converted data to the user. An information retrieval device characterized by the above.
【請求項2】上記出力データ様式変換手段は、数値と自
然言語の変換をおこなうための、ファジィメンバシップ
関数およびファジィ演算を用いた変換方式を記憶する手
段を含む請求項1記載の情報検索装置。
2. The information retrieval apparatus according to claim 1, wherein said output data format conversion means includes means for storing a conversion method using a fuzzy membership function and fuzzy operation for converting a numerical value and a natural language. .
【請求項3】上記検索結果表示手段は、データの項目お
よび自然言語の組合せについて、その組合せが検索結果
として得られたデータ全体に占める割合等を算定して表
示する手段からなる請求項1または2記載の情報検索装
置。
3. The search result display means comprises means for calculating and displaying, for a combination of data items and natural language, a ratio of the combination to the entire data obtained as a search result. 2. The information retrieval device described in 2.
【請求項4】データを記憶するデータ記憶手段と、該デ
ータ記憶手段にアクセスして、データの検索を行なうデ
ータ検索手段と、ユーザの入力を受け付けるユーザ入力
手段と、ユーザの入力が検索条件であった場合に、該検
索条件を上記データ検索手段の入力として適合する様式
に変換する入力変換方式を定義して記憶する入力データ
様式変換定義手段と、該定義された入力変換方式を用い
て、ユーザにより入力された検索条件を上記データ検索
手段の入力として適合する様式に変換する入力データ様
式変換手段と、上記データ検索手段を用いて該変換され
た検索条件に合致するデータの検索を行なうデータ検索
実行手段と、検索されたデータを数値と自然言語の様式
に変換する出力変換方式を定義して記憶する出力データ
様式変換定義手段と、検索されたデータに対し、該定義
された出力変換方式を用いて、数値と自然言語の変換を
行なう出力データ様式変換手段と、該変換されたデータ
をユーザに示す検索結果表示手段と、ユーザの入力が自
然言語の学習データの指定であった場合、上記入力変換
方式と出力変換方式から、指定された自然言語に対応す
る変換方式を選択し、さらに上記データ検索手段を用い
て学習データを選択し、選択した変換方式が選択した学
習データに適合するように、該変換方式を調整するデー
タ様式変換定義学習手段とからなることを特徴とする情
報検索装置。
4. A data storage means for storing data, a data search means for accessing the data storage means to search for data, a user input means for receiving a user's input, and a user's input as search conditions. If there is, input data format conversion defining means for defining and storing an input conversion method for converting the search condition into a format suitable as an input of the data search means, and using the defined input conversion method, Input data format conversion means for converting the search condition input by the user into a format suitable for input of the data search means, and data for searching data matching the converted search condition using the data search means Retrieval executing means and output data format conversion defining means for defining and storing an output conversion method for converting retrieved data into numerical values and natural language formats , Output data format conversion means for converting the retrieved data into a numerical value and a natural language by using the defined output conversion method, a search result display means for showing the converted data to the user, and a user When the input of is a designation of learning data of a natural language, the conversion method corresponding to the designated natural language is selected from the input conversion method and the output conversion method, and the learning data is further acquired using the data search means. An information retrieval apparatus comprising: a data format conversion definition learning unit that adjusts the selected conversion method so that the selected conversion method is suitable for the selected learning data.
【請求項5】データを記憶するデータ記憶手段と、該デ
ータ記憶手段にアクセスして、データの検索を行なうデ
ータ検索手段と、ユーザの入力を受け付けるユーザ入力
手段と、ユーザの入力が検索条件であった場合に、該検
索条件を上記データ検索手段の入力として適合する様式
に変換する入力変換方式を定義して記憶する入力データ
様式変換定義手段と、該定義された入力変換方式を用い
て、ユーザにより入力された検索条件を上記データ検索
手段の入力として適合する様式に変換する入力データ様
式変換手段と、上記データ検索手段を用いて該変換され
た検索条件に合致するデータの検索を行なうデータ検索
実行手段と、検索されたデータを数値と自然言語の様式
に変換する出力変換方式を定義して記憶する出力データ
様式変換定義手段と、検索されたデータに対し、定義さ
れた出力変換方式を用いて、数値と自然言語の変換を行
なう出力データ様式変換手段と、該変換された検索結果
のデータをユーザに示す検索結果表示手段と、入力デー
タ様式変換定義手段および出力データ様式変換定義手段
のすくなくとも一方において、ファジィメンバシップ関
数およびファジィ演算を用いた数値と自然言語の変換方
式を記憶し、ユーザの入力が自然言語の学習データの指
定であった場合、該入力データ様式変換定義手段中の変
換方式または該出力データ様式変換定義手段中の変換方
式から、指定された自然言語に対応するファジィメンバ
シップ関数およびファジィ演算からなる変換方式を選択
し、さらに上記データ検索手段を用いて学習データを選
択し、選択した変換方式が学習データに適合するよう
に、該変換方式中のファジィ演算を参照して該変換方式
中のファジィメンバシップ関数の形状を調整するデータ
様式変換定義学習手段とからなることを特徴とする情報
検索装置。
5. A data storage means for storing data, a data search means for accessing the data storage means to search for data, a user input means for receiving a user input, and a user input as search conditions. If there is, input data format conversion defining means for defining and storing an input conversion method for converting the search condition into a format suitable as an input of the data search means, and using the defined input conversion method, Input data format conversion means for converting the search condition input by the user into a format suitable for input of the data search means, and data for searching data matching the converted search condition using the data search means Retrieval executing means and output data format conversion defining means for defining and storing an output conversion method for converting retrieved data into numerical values and natural language formats An output data format conversion means for converting the retrieved data into a numerical value and a natural language by using a defined output conversion method, and a retrieval result display means for showing the converted retrieval result data to the user. , At least one of the input data format conversion definition means and the output data format conversion definition means stores a conversion method between a numerical value and a natural language using a fuzzy membership function and a fuzzy operation, and a user input is a learning data of a natural language. If specified, a conversion method consisting of a fuzzy membership function and a fuzzy operation corresponding to the specified natural language from the conversion method in the input data format conversion defining means or the conversion method in the output data format conversion defining means. Then, select the learning data using the data search means, and select the learning method as the learning data. To conform to the information retrieval apparatus with reference to the fuzzy operation in the conversion method characterized by comprising the data style conversion definition learning means for adjusting the shape of the fuzzy membership functions in said conversion system.
【請求項6】上記データ様式変換定義学習手段は、数値
と自然言語の変換について、ファジィメンバシップ関数
およびファジィ演算を用いた変換方式を記憶する入力デ
ータ様式変換定義手段および出力データ様式変換定義手
段と、ユーザの入力が自然言語の学習データの指定であ
った場合、該入力データ様式変換定義手段中の変換方式
と該出力データ様式変換定義手段中の変換方式から、指
定された自然言語に対応する変換方式を選択し、さらに
データ検索手段を用いて学習データを選択し、選択した
変換方式が学習データに適合するように、該変換方式中
のファジィ演算を参照して該変換方式中のファジィメン
バシップ関数の形状を調整するデータ様式変換定義学習
手段とからなることを特徴とする請求項5記載の情報検
索装置。
6. The data format conversion definition learning means stores input data format conversion definition means and output data format conversion definition means for storing a conversion method using a fuzzy membership function and a fuzzy operation for conversion between a numerical value and a natural language. If the user's input is to specify learning data in natural language, the conversion method in the input data format conversion definition means and the conversion method in the output data format conversion definition means correspond to the specified natural language. The learning method is selected by using the data search means, and the fuzzy operation in the conversion method is referred to by referring to the fuzzy operation in the conversion method so that the selected conversion method matches the learning data. The information retrieval apparatus according to claim 5, further comprising a data format conversion definition learning means for adjusting the shape of the membership function.
【請求項7】上記ユーザ入力手段は、上記入力データ様
式変換定義手段中または出力データ様式変換定義手段中
の自然言語および学習データの候補の一覧を表示するデ
ィスプレイ画面と、マウス等の指示手段によりユーザに
指定された自然言語または学習データを、ハイライト表
示、ディスプレイ画面上の他の領域に別個に表示する手
段からなることを特徴する請求項6記載の情報検索装
置。
7. The user input means comprises a display screen for displaying a list of natural language and learning data candidates in the input data format conversion defining means or the output data format conversion defining means, and an instruction means such as a mouse. 7. The information retrieval apparatus according to claim 6, further comprising means for displaying the natural language or learning data designated by the user separately in highlight display and in another area on the display screen.
JP5276478A 1993-11-05 1993-11-05 Information retrieval device Pending JPH07129601A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5276478A JPH07129601A (en) 1993-11-05 1993-11-05 Information retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5276478A JPH07129601A (en) 1993-11-05 1993-11-05 Information retrieval device

Publications (1)

Publication Number Publication Date
JPH07129601A true JPH07129601A (en) 1995-05-19

Family

ID=17570017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5276478A Pending JPH07129601A (en) 1993-11-05 1993-11-05 Information retrieval device

Country Status (1)

Country Link
JP (1) JPH07129601A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297534A (en) * 1995-04-27 1996-11-12 Brother Ind Ltd Coordinate input device
JP2001014321A (en) * 1999-06-28 2001-01-19 Toshiba Corp Method and device for retrieving information
JP2017165407A (en) * 2010-10-22 2017-09-21 トヨタ モーター エンジニアリング アンド マニュファクチャリング ノース アメリカ,インコーポレイティド System and method for parking vehicle near obstacles

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297534A (en) * 1995-04-27 1996-11-12 Brother Ind Ltd Coordinate input device
JP2001014321A (en) * 1999-06-28 2001-01-19 Toshiba Corp Method and device for retrieving information
JP2017165407A (en) * 2010-10-22 2017-09-21 トヨタ モーター エンジニアリング アンド マニュファクチャリング ノース アメリカ,インコーポレイティド System and method for parking vehicle near obstacles

Similar Documents

Publication Publication Date Title
US20210173817A1 (en) Method and system for large scale data curation
EP1209582B1 (en) Document retrieval method and system and computer readable storage medium
US6654744B2 (en) Method and apparatus for categorizing information, and a computer product
CA2371688C (en) Document-classification system, method and software
US20030115192A1 (en) One-step data mining with natural language specification and results
US20040158569A1 (en) Method and apparatus for document filtering using ensemble filters
JPH0877010A (en) Method and device for data analysis
WO2002073531A1 (en) One-step data mining with natural language specification and results
EP1623344B1 (en) Presentation of data using meta-morphing
US7836059B2 (en) System and method for minimally predictive feature identification
JP2005501321A (en) How to automatically index documents
US9594755B2 (en) Electronic document repository system
US7779018B2 (en) Presentation of data using meta-morphing
Srinivasan The importance of rough approximations for information retrieval
KR970001907B1 (en) Data retrieving method and apparatus provlding satisfaction or agreement degree
CN117290404A (en) Method and system for rapidly searching and practical main distribution network fault processing method
JPH07129601A (en) Information retrieval device
JPH0394375A (en) Device for retrieving document
Irshad et al. SwCS: Section-Wise Content Similarity Approach to Exploit Scientific Big Data.
CN109213830A (en) The document retrieval system of professional technical documentation
JP3452308B2 (en) Data analyzer
JP3311778B2 (en) Similar information search device
JP4146393B2 (en) Label display type document search apparatus, label display type document search method, computer program for executing label display type document search method, and computer readable recording medium storing the computer program
JPH1027125A (en) Document classifying device
CN117725229A (en) Knowledge organization system auxiliary updating method