JP6924461B2 - How to process logical programs that allow strings containing variables as literals, computer programs and devices - Google Patents

How to process logical programs that allow strings containing variables as literals, computer programs and devices Download PDF

Info

Publication number
JP6924461B2
JP6924461B2 JP2016165180A JP2016165180A JP6924461B2 JP 6924461 B2 JP6924461 B2 JP 6924461B2 JP 2016165180 A JP2016165180 A JP 2016165180A JP 2016165180 A JP2016165180 A JP 2016165180A JP 6924461 B2 JP6924461 B2 JP 6924461B2
Authority
JP
Japan
Prior art keywords
literal
variable
variables
true
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016165180A
Other languages
Japanese (ja)
Other versions
JP2018032275A (en
Inventor
中村圭介
Original Assignee
ナレルシステム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナレルシステム株式会社 filed Critical ナレルシステム株式会社
Priority to JP2016165180A priority Critical patent/JP6924461B2/en
Publication of JP2018032275A publication Critical patent/JP2018032275A/en
Application granted granted Critical
Publication of JP6924461B2 publication Critical patent/JP6924461B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法、コンピュータプログラム及び装置に関する。 The present invention relates to a method, a computer program and a device for processing a logical program that allows a character string including variables as a literal.

変数を含んだ文字列をリテラルとして許容する論理プログラムとその処理系が当該発明者によって研究開発されている(特許文献1)。しかし、リテラルが変数によって可変であるということは単一化できる可能性が従来のPROLOG等よりも極めて広くなるため、計算量の増加と計算の遅延を招いていた。 A logical program that allows a character string containing a variable as a literal and a processing system thereof have been researched and developed by the inventor (Patent Document 1). However, the fact that literals are variable depending on variables means that the possibility of unification is extremely wider than that of conventional PROLOG and the like, resulting in an increase in the amount of calculation and a delay in calculation.

特願2013−087008Japanese Patent Application No. 2013-087008 特願2015−219007Japanese Patent Application 2015-219007 特願2016−009327Japanese Patent Application No. 2016-09327 特願2016−103010Japanese Patent Application No. 2016-103010 特願2015−234356Japanese Patent Application 2015-234356

本発明は、かかる問題に鑑み、
変数を含んだ文字列をリテラルとして許容する論理プログラムを「高速に」処理する方法、コンピュータプログラム及び装置を提供することを主な課題とする。
また、論理プログラムの動的な読み込み(特許文献2に記載した技術)にも対応した高速化をさらなる課題とする。
また、高速化した場合にも根拠や証明経路の表示や手続き的解釈(特許文献3のコンピュータからの質問等も含む)が損なわれないようにすることをさらなる課題とする。
In view of such a problem, the present invention has a problem.
The main task is to provide a method, a computer program and a device for processing a logical program that allows a character string containing a variable as a literal "at high speed".
Further, it is a further task to increase the speed corresponding to the dynamic reading of the logic program (the technique described in Patent Document 2).
Further, it is a further task to prevent the display of the grounds and the certification route and the procedural interpretation (including the question from the computer of Patent Document 3) from being impaired even when the speed is increased.

かかる課題を解決するため、
本発明(請求項1)は、
変数を含んだ文字列をリテラルとして許容する論理プログラムをコンピュータが処理する方法であって、
論理プログラムにおいて変数を含んだリテラルを真にする変数の値をコンピュータが求めた際に
該リテラルと該変数の値を関連づけて記憶しておく第一のステップと、
同一の論理プログラムにおいて該リテラルを真にする変数の値を求める際に
前記第一のステップで該リテラルと関連づけて記憶しておいた該変数の値を用いる第二のステップと
を含むことを特徴とする方法を提供する。

リテラル(例えば、「$Xは$Yが好き」)を真にする変数の値は、複数(左の例に応じた例「($X,$Y)={(太郎,花子),(次郎、小百合)}」の場合であれば、2個)でもよい。
「関連づけて記憶」は、従来からの一般的なオープン/クローズドハッシュのアルゴリズムや、バイナリサーチが可能な(整列された)map型ないし組み込みハッシュ型を用いることにより高速に実現することができる。
特許文献4ではユーザーからの問いの表記ゆれが少なくなるため、ますます再計算の省略が有利になり、単一ユーザーによる一回の質問文を処理する中での再利用だけでなく複数ユーザーによる複数回の同一(質問文が同一/実質同一等)・同様(質問文に答えるためのサブクエリ集合に共通部分が多い等)の質問文を処理するためにも用いることができる。
特許文献5における程度を比較する計算や価値観を考慮した複雑な計算の結果も再計算を省略して動的に参照し計算量を節約することができる。
これにより、実質同じ推論/解探索を大幅に省略して、前記した主な課題を解決することができる。
To solve this problem
The present invention (claim 1)
A way for a computer to process a logical program that allows a string containing variables as a literal.
When a computer finds the value of a variable that makes a literal containing a variable true in a logical program, the first step is to associate the literal with the value of the variable and store it.
It is characterized by including a second step of using the value of the variable stored in association with the literal in the first step when obtaining the value of the variable that makes the literal true in the same logical program. Provide a method of

The value of the variable that makes the literal (for example, "$ X likes $ Y") true is multiple (example "($ X, $ Y) = {(Taro, Hanako), (Jiro) according to the example on the left". , Sayuri)} ”, two) may be used.
"Associative storage" can be realized at high speed by using a conventional general open / closed hash algorithm or a (arranged) map type or built-in hash type capable of binary search.
In Patent Document 4, since there is less variation in the notation of questions from users, it becomes more and more advantageous to omit recalculation, and it is not only reused in processing one question by a single user, but also by multiple users. It can also be used to process multiple times of the same (same question / substantially the same, etc.) and similar (many common parts in the subquery set for answering the question, etc.).
It is possible to save the amount of calculation by dynamically referring to the result of the calculation comparing the degree in Patent Document 5 and the complicated calculation considering the sense of values by omitting the recalculation.
As a result, the same inference / solution search can be largely omitted, and the above-mentioned main problem can be solved.

本発明(請求項2)はまた、
前記リテラルと変数の値を関連づけて記憶する際、又は、関連づけて記憶しておいたリテラルと別のリテラルを照合する際に、
対象となるリテラルに含まれる変数の表記を標準化することを特徴とする
請求項1に記載の
方法を提供する。

標準化の方法としては、例えば「$Xは、$Yが$Xを好きなので好き」であれば、変数の出現順に「¥1は、¥2が¥1を好きなので好き」という形(同じ変数が後で出現したときは、前に出現したときの順番を割り当てる)等に機械的に標準化することができる。
これにより、変数の名前が異なるだけのリテラル(論理プログラム上の静的なリテラル、又は、処理の途中で動的に生成(同名変数の混同を避ける等のために)されたリテラル)を真とする値が同一論理プログラムにおいて同じとなる性質を(変数名だけが異なるリテラル間にも)より網羅的に利用して、さらなる高速化を可能にすることができる。
The present invention (claim 2) also
When storing the literal and the value of the variable in association with each other, or when collating the literal stored in association with another literal.
The method according to claim 1, wherein the notation of variables included in the target literal is standardized.

As a standardization method, for example, if "$ X likes $ X because $ Y likes $ X", then in the order of appearance of variables, "\ 1 likes \ 2 because \ 1 likes \ 1" (same variable). When appears later, it can be mechanically standardized to (assign the order when it appeared earlier).
This makes literals with different variable names (static literals on a logical program, or literals dynamically generated in the middle of processing (to avoid confusion of variables with the same name, etc.)) as true. It is possible to make further speedup possible by more comprehensively utilizing the property that the values to be used are the same in the same logical program (even between literals in which only the variable names are different).

本発明(請求項3)はまた、
コンピュータが変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法であって、
論理プログラムにおいて変数を含まないリテラルの真偽を求めた際に
該リテラルと該値(真偽)を関連づけて記憶しておく第一のステップと、
同一の論理プログラムにおいて該リテラルの真偽を求める際に
前記第一のステップで該リテラルと関連づけて記憶しておいた該値を用いる第二のステップと
を含む方法を提供する。

「関連づけて記憶する」より具体的な方法は、変数を含むリテラルの場合と同様でもよいが、値のほうは、リテラルを真にする変数の値ではなくリテラルの真か偽となる。
変数を含まない定数リテラルの真偽の計算も計算量が大きくなる場合があり、このキャッシュは大きな計算量の節約となる。
The present invention (claim 3) also
A way for a computer to process a logical program that allows a string containing variables as a literal.
When the truth of a literal that does not include variables is obtained in a logical program, the first step of associating the literal with the value (true or false) and memorizing it, and
Provided is a method including a second step of using the value stored in association with the literal in the first step when determining the authenticity of the literal in the same logic program.

A more specific method of "associating and storing" may be the same as for a literal containing a variable, but the value is the true or false of the literal rather than the value of the variable that makes the literal true.
Calculation of the truth of a constant literal that does not include variables can also be computationally expensive, and this cache saves a great deal of computational complexity.

本発明(請求項4)はまた、
前記リテラルと変数の値を関連づけて記憶する際、又は、関連づけて記憶しておいたリテラルと別のリテラルを照合する際に、
リテラルの意味を解析して意味が同一のリテラルの表記が同一となる方向に表記を標準化することを特徴とする
請求項1から3のいずれか一項に記載の方法
を提供する。
「リテラルの意味を解析して意味が同一のリテラルの表記が同一となる方向に表記を標準化」は、従来からの形態素解析、構文解析、意味解析、指示語解析、所定言語への翻訳等を用いることができ、結果は、所定の自然言語形式の他、JSON形式(ただし、格の種類(主格、目的格・・・)によってソートされている)や従来のPROLOG形式として記憶することもできる。
意味の解析は、変数を含まない(すなわち固定文字列の)リテラルのほうが正確性を期待できるが、変数を含むリテラルについても、最尤度(構文)仮説を採用した意味解析結果(ただし変数部分が残る)を用いて標準化すること等も一定の精度では可能である。
これにより、同一の意味をもつ自然言語の表記ゆれ(標準化方針によっては外国語からの翻訳等による標準化を含んでもよい)にも実質的に対応することが可能となる。
The present invention (Claim 4) also
When storing the literal and the value of the variable in association with each other, or when collating the literal stored in association with another literal.
The method according to any one of claims 1 to 3, wherein the meaning of the literal is analyzed and the notation of the literal having the same meaning is standardized in the direction in which the notation is the same.
"Analyze the meaning of literals and standardize the notation in the direction that the notation of literals with the same meaning is the same" is the conventional morphological analysis, parsing, semantic analysis, directive analysis, translation into a predetermined language, etc. The results can be used and stored as JSON format (however, sorted by case type (nominative case, literal case ...)) or conventional PROLOG format, in addition to the predetermined natural language format. ..
Semantic analysis can be expected to be more accurate for literals that do not include variables (that is, fixed strings), but for literals that include variables, the results of semantic analysis that adopt the most likely (syntax) hypothesis (however, the variable part) It is also possible to standardize using (remaining) with a certain accuracy.
As a result, it becomes possible to substantially deal with notational fluctuations of natural languages having the same meaning (standardization by translation from a foreign language may be included depending on the standardization policy).

本発明(請求項5)はまた、
変数を含むリテラルを真にする変数の値又は変数を含まないリテラルの真偽を、
該リテラルだけでなく処理の対象とする論理プログラムの範囲を指定する情報と関連づけて
前記記憶又は照合することを特徴とする
請求項1から4のいずれか一項に記載の方法
を提供する。
「該リテラルだけでなく処理の対象とする論理プログラムの範囲を指定する情報と関連づけて」とは、
例えば、
「変数を含むリテラルを真にする変数の値又は変数を含まないリテラルの真偽」への
オーダードmap型のキーとして
「リテラルの表記」と「参照した(単数又は複数の)論理プログラムのURIパス列をソートしたもの」との連接を
用いることができる(ここで、あえてソートするのは、記載順のゆれにより実質同じ論理プログラム(のURIパス)集合が泣き別れとなることを避けるため)。
これは、例えば、ccashがオーダードmap型の変数であるとすると、「ccash["\1は¥2が¥1を好きなので好き___\\社内共有\見込み客リスト.txt___https://hoge1.jp/love.txt___https://hoge2.jp/love.txt"]="{(太郎,花子),(次郎,小百合)}"」とすること等である(この場合の「___」は区切りを示す)。
これにより、変数を含むリテラルを真にする変数の値又は変数を含まないリテラルの真偽をもとめる根拠となる論理プログラムが動的に(=探索/推論処理中に(例えば、特許文献2の動的読込の場合))又は経時的更新により変わるような場合(このようなときは論理プログラムのリビジョン番号を明示したURIパスを採用してもよい)にも、根拠となる論理プログラムの変化による答えの変化の可能性を正しく反映した健全な高速化を行うことができる。
The present invention (Claim 5) also
Make a literal that contains a variable true The value of a variable or the truth of a literal that does not contain a variable,
The method according to any one of claims 1 to 4, wherein the method is stored or collated in association with information specifying a range of a logical program to be processed as well as the literal.
"In association with information that specifies the range of the logical program to be processed as well as the literal"
for example,
URI of "literal notation" and "referenced (s) logical program" as the key of the ordered map type to "the value of the variable that makes the literal including the variable true or the truth of the literal without the variable" You can use the concatenation with "a sorted path sequence" (here, the purpose of sorting is to avoid the literally the same literal program (URI path) set from crying out due to fluctuations in the description order).
For example, if ccash is an ordered map type variable, "ccash [" \ 1 likes \ 2 because \ 1 likes it ___ \\ internal sharing \ prospect list.txt___ https: // hoge1 .jp / love.txt ___ https://hoge2.jp/love.txt "] =" {(Taro, Hanako), (Jiro, Sayuri)} "" (In this case, "___" is a delimiter. Shows).
As a result, the logical program that is the basis for finding the value of the variable that makes the literal including the variable true or the truth of the literal that does not contain the variable is dynamically (= during the search / inference process (for example, the operation of Patent Document 2). Answers based on changes in the underlying logical program, even if it changes due to changes over time (in such cases, the URI path that specifies the revision number of the logical program may be adopted). It is possible to perform a sound speedup that correctly reflects the possibility of change in.

本発明(請求項6)はまた、
変数を含んだ文字列をリテラルとして許容する論理プログラムをコンピュータが処理する方法であって、
サブクエリ(質問文そのものであってもよい)の結果をキャッシュしておき、
実質同じサブクエリが発生したときに再計算せずに該当するキャッシュを用いることを特徴とする方法
を提供する。
「サブクエリ」とは、例えば、PROLOGのホーン節のヘッド(クエリにマッチしたもの)をそのホーン節のボディ部の各条件(構成要件)へと一つ一つ展開するときにできる新たなクエリ(サブゴールとも呼ばれるもの)をいう。PROLOGに限らず、SLD導出を行うものや、構成要件を用いた論理プログラミング言語では、サブクエリに該当するものが存在し、本発明を適用可能である。
「実質同じ」とは、リテラル中に出現する同じ変数を同じ数字のエスケープ文字等(「数字」は最初に出現する順番(1、2、・・・など)に置き換えたものが同じ文字列になること、等をいう。
これにより、前記した主な課題を達成することになるが、
変数を含んだ文字列をリテラルとして許容する論理プログラムにおいては、
通常の関数型プログラミング言語における引数に応じた関数値のキャッシュ等に比べて、
さらにはPROLOGのように格構造を想定したプログラミング言語における計算結果のキャッシュ等(ただし、手続き的解釈が明確に定義されている言語では不適切であり、当該発明者はそのような先行技術を知らない)に比べて、
狭い定義域(「実質同じ」クエリ)の呼び出し(真偽又は解の計算)が何度も繰り返される(=再計算される)ことが多くなりがちである。
したがって、
変数を含んだ文字列をリテラルとして許容する論理プログラムにおいては、
他のプログラミング言語に比べてこのようなキャッシュ(クエリ→真/偽又は変数を真とする値(解)集合)が極めて有効となる。
一方で、このようなキャッシュ機構は、
従来のディスクキャッシュ(定義域が物理アドレスであり値域が固定長)等と比して、
定義域の形式が、「変数を含んだ文字列を許容するリテラル(同一変数の複数回出現も許容)」という、極めて複雑で目新しい(したがって離散数学的/集合論的な性質が不確かで、同定法(実質同じであることを計算する方法)もこれまで不明であった)クエリ形式であり、基礎となっているPROLOGが閉世界仮説を採用して偽となるリテラルを積極的に定義しない方針であったりカットオペレータ(!)やfailにより再計算をある程度制御できたりしていたため、そもそもキャッシュする(計算して偽だったことも含めて大域的に文脈を問わずに記憶している)という発想が極めて生まれにくいものであった(実現困難かつ想到困難)。なお、従来のPROLOG等はメモリが少ない時代に発達したものであり、リテラルを真にする変数の値(解)集合(極めて大きくなる可能性のあるオブジェクト)をキャッシュするという発想が生まれにくい、ということもあった。
そんななか、本発明は、上記した標準化による同定方法を初めて与えることによって、実現困難かつ想到困難であった変数埋め込みリテラル型クエリのキャッシュ機構を実現可能にし、その必要性、有用性、有効性(再帰処理が多く含まれるある論理プログラムに問う実験では処理時間が60分の1になった等)も示したものである。
The present invention (claim 6) also
A way for a computer to process a logical program that allows a string containing variables as a literal.
Cache the results of subqueries (which may be the question text itself) and
Provided is a method characterized by using the corresponding cache without recalculation when substantially the same subquery occurs.
A "subquery" is, for example, a new query (a new query that can be made when the head of the horn clause of PROLOG (matching the query) is expanded one by one to each condition (constituent requirement) of the body part of the horn clause). It is also called a subgoal). Not limited to PROLOG, there are those that perform SLD derivation and logic programming languages that use configuration requirements that correspond to subqueries, and the present invention can be applied.
"Substantially the same" means that the same variable that appears in a literal is replaced with an escape character of the same number ("number" is the order in which it first appears (1, 2, ..., etc.)) to the same character string. To become, etc.
This will achieve the main tasks mentioned above,
In a logical program that allows a character string containing variables as a literal,
Compared to the cache of function values according to the arguments in a normal functional programming language,
Furthermore, cache of calculation results in a programming language that assumes a case structure such as PROLOG (however, it is inappropriate in a language in which procedural interpretation is clearly defined, and the inventor is aware of such prior art. Compared to (not)
Calls (calculation of truth or solution) of a narrow domain (“substantially the same” query) tend to be repeated (= recalculated) many times.
therefore,
In a logical program that allows a character string containing variables as a literal,
Compared to other programming languages, such a cache (query-> true / false or value (solution) set whose true value is a variable) is extremely effective.
On the other hand, such a cache mechanism is
Compared to the conventional disk cache (the domain is the physical address and the range is the fixed length), etc.
The domain format is extremely complex and novel (thus the discrete mathematical / collective nature is uncertain and identified as "literals that allow strings containing variables (allowing the same variable to appear multiple times)". The method (the method of calculating that they are substantially the same) is also a query format (the method of calculating that they are substantially the same), and the policy that the underlying PROLOG adopts the closed-world hypothesis and does not actively define false literals. Or because the recalculation could be controlled to some extent by the cut operator (!) Or fail, it is cached in the first place (it is memorized globally regardless of the context, including the fact that it was calculated and false). It was extremely difficult to come up with ideas (difficult to realize and difficult to come up with). In addition, conventional PROLOG etc. were developed in the era when memory was small, and it is difficult to create the idea of caching the value (solution) set (object that may become extremely large) of variables that make literals true. Sometimes.
Under such circumstances, the present invention makes it possible to realize a cache mechanism for variable-embedded literal queries, which was difficult to realize and conceive, by providing the above-mentioned standardization identification method for the first time, and its necessity, usefulness, and effectiveness ( In an experiment in which a logical program containing a lot of recursive processing was asked, the processing time was reduced to 1/60, etc.).

本発明(請求項7)はまた、
リテラルの計算に手続き的解釈を行う必要のあるルールが介在していたかどうかを示すフラグを有し、
フラグが真のときに再計算することを特徴とする
請求項1から6のいずれか一項に記載の方法を
提供する。
手続き的解釈の例としては、グローバル変数の定義(更新を含む)、論理プログラムの追加(ユーザーごとの文脈(例えば、「今日は体調がよい」)の追加や外部プログラムの追加ロード等)・削除・更新(ユーザーや状況や問題や日時ごとのカスタマイズ等)、print文やグラフィック文や発生文やメール文等の表示その他の出力に影響を与えるもの、等が考えられる。複合的なものとしては、コンピュータが推論の経過に応じて動的に質問してそれにユーザーが答えた内容によって論理プログラムに行が一時的に追加されたり、既存の行の内容が更新されたり削除されたりするいわゆる「逆質問文(「?今日は体調がよい」「?$Bは友達」等)」(特許文献3参照)も手続き的解釈に含めることができる。
これにより、必要な手続き的解釈(場合によっては論理プログラム自体が変わり値も変わる(なお、論理プログラム自体がかわるときは、そのテキスト全体のハッシュ値等をmap型変数やキャッシュのキーとしてリテラルの後かつURIパス列の前等に追加する仕様としてもよい))を行いながら高速化することができる。
The present invention (Claim 7) also
It has a flag that indicates whether the literal calculation was mediated by a rule that required a procedural interpretation.
The method according to any one of claims 1 to 6, wherein the recalculation is performed when the flag is true.
Examples of procedural interpretations include the definition of global variables (including updates), the addition of logical programs (addition of context for each user (for example, "I am in good shape today"), the additional loading of external programs, etc.) / deletion. -Updates (users, situations, problems, customization for each date and time, etc.), display of print texts, graphic texts, generated texts, mail texts, etc., and other things that affect the output can be considered. As a complex, the computer dynamically asks questions as the inference progresses, and the user's answers temporarily add lines to the logical program, or update or delete the contents of existing lines. The so-called "reverse question sentence ("? I'm feeling well today ","? $ B is a friend ", etc.)" (see Patent Document 3) that is often asked can also be included in the procedural interpretation.
As a result, the necessary procedural interpretation (in some cases, the logical program itself changes and the value also changes (when the logical program itself changes, the hash value of the entire text is used as a map type variable or cache key after the literal. In addition, the speed can be increased while performing ())), which may be added before the URI path sequence.

本発明(請求項8)はまた、
前回計算した時から対象とする論理プログラムに変更があったかどうか計算するデータ構造を有し、
変更があった場合に記憶された値を用いずに再計算を行う
請求項1から7のいずれか一項に記載の方法を
提供する。
「データ構造」の例としては、キャッシュ(関連づけて記憶)した日時分秒ミリセカンド/マイクロセカンドを「真偽又は変数を真にする解集合」と一緒に記憶しておき、かつ、対象とする論理プログラムの変更日時分秒ミリセカンド/マイクロセカンドを記憶しておき、前者が後者より後の場合には、キャッシュ(関連づけて記憶した値)を用い、そうでない場合は再計算するようにすればよい。この場合、日時分秒ミリセカンド/マイクロセカンドは値側に格納する。ミリセカンド等はキーとしての特定が難しいからである。
また、日時分秒ミリセカンド/マイクロセカンド等でなく単純にユーザーごとのリビジョン番号等をデータ構造として用いることもできる(図6)。この場合、ユーザーIDとリビジョン番号は、キー側に格納する。ユーザーIDとリビジョン番号はフォークした論理プログラムと関連づけて記憶したユーザーIDとリビジョン番号から自明なためである。
いずれにしても、対象とする論理プログラムごとに変更があったりなかったりする場合に、キャッシュの全体をクリアすることなく高速化が可能となる。
The present invention (claim 8) also
It has a data structure that calculates whether the target logical program has changed since the last calculation.
The method according to any one of claims 1 to 7, wherein the recalculation is performed without using the stored value when there is a change.
As an example of "data structure", the cached (associately stored) date, time, minute, second, and millisecond / microsecond are stored together with the "solution set that makes the truth or variable true" and is targeted. If the change date / time / minute / second millisecond / microsecond of the logical program is stored, if the former is later than the latter, the cache (value stored in association) is used, and if not, it is recalculated. good. In this case, the date, time, minute, second, millisecond / microsecond are stored on the value side. This is because it is difficult to identify the millisecond as a key.
It is also possible to simply use the revision number for each user as the data structure instead of the date / time / minute / second millisecond / microsecond or the like (Fig. 6). In this case, the user ID and revision number are stored on the key side. This is because the user ID and revision number are obvious from the user ID and revision number stored in association with the forked logical program.
In any case, when there is a change or no change for each target logical program, it is possible to increase the speed without clearing the entire cache.

本発明(請求項9)はまた、
真偽や解集合の導出に用いたルール、事実又は文脈を明示する必要がある場合に、
真偽の証明経路ごと又は解集合に含まれる解ごとに
あえて再計算させるようにした
請求項1から8のいずれか一項に記載の方法を
提供する。
「文脈」とは、リテラルに含まれる変数の一部又は全部が、それ以前の単一化や(ヘッドの変数からボディー部の変数への部分的/全体的)束縛によって埋められた状態で(真偽又は解集合が改めて)計算されるその動的な状態をいう。
これにより、いわゆる「別解」となる証明や、各解ごとの根拠となるルールや事実や文脈のツリー表示を、高速化が要求される中でも丁寧に行うことができる。
The present invention (Claim 9) also
When it is necessary to specify the rules, facts or contexts used to derive the truth or solution set
The method according to any one of claims 1 to 8 is provided, in which the calculation is intentionally performed for each authenticity proof path or for each solution included in the solution set.
A "context" is one in which some or all of the variables contained in a literal are filled by previous unification or binding (partial / total from the head variable to the body variable). The dynamic state in which the truth or solution set is calculated (again).
As a result, the so-called "different solution" proof and the tree display of the rules, facts, and contexts on which each solution is based can be carefully performed even when high speed is required.

本発明(請求項10)はまた、
かかる方法を実施する
コンピュータプログラムを提供する。
The present invention (Claim 10) also
Provided is a computer program that implements such a method.

本発明(請求項11)はまた、
かかるコンピュータプログラムを用いた
装置を提供する。
The present invention (claim 11) also
An apparatus using such a computer program is provided.

変数を含んだ文字列をリテラルとして許容する論理プログラムの冗長な計算量を示す図である。It is a figure which shows the redundant calculation amount of the logical program which allows a character string containing a variable as a literal. 変数を含んだ文字列をリテラルとして許容する論理プログラムの効率的な計算(キャッシュ使用)を示す図である。It is a figure which shows the efficient calculation (use of a cache) of a logical program which accepts a character string containing a variable as a literal. 変数名を正規化する前のリテラル及び変数のないリテラルと各値のキャッシュの例を示す図である。It is a figure which shows the example of the literal before normalizing the variable name, the literal without a variable, and the cache of each value. 変数名を正規化した後のリテラル及び変数のないリテラルと各値のキャッシュの例を示す図である。It is a figure which shows the example of the literal after normalizing the variable name, the literal without a variable, and the cache of each value. 論理プログラムを動的に複数(P1,P2)追加する場合のキャッシュの例を示す図である。It is a figure which shows the example of the cache at the time of dynamically adding a plurality of logical programs (P1, P2). 論理プログラムが動的に変更されたり追加されたりする場合のキャッシュの例を示す図である。It is a figure which shows the example of the cache when a logical program is dynamically changed or added. 意味解析を用いて変数名以外も意味的に標準化する場合のキャッシュの例を示す図である。It is a figure which shows the example of the cache at the time of standardizing meaning other than a variable name by using semantic analysis. 手続き的解釈(例:経由者をWRITE)が必要なためキャッシュを抑制する例を示す図である。It is a figure which shows the example which suppresses a cache because a procedural interpretation (eg, WRITE for a transitor) is required. 解ごとにツリー状に根拠を求めるためにキャッシュを抑制する例を示す図である。It is a figure which shows the example which suppresses a cache in order to obtain the basis in a tree shape for each solution.

下記に説明するいくつかの実施例は、同一発明者による以下の特許明細書(上記、特許文献1からの抜粋)の実施の形態に、本発明に特有の上記機能を追加で実装することにより実施できる。また以下の、特許文献1の引用は、本明細者の実施可能性面、進歩性面の補足目的も含んだものである。

===
<特許文献1の課題> 自然言語に変数を埋め込む形式で表現した知識をコンピュータでPROLOG同様に自動処理することを実現可能にし、述語論理レベルの網羅的な演繹や解探索(自動単一化処理、自動導出処理、そのための後ろ向き推論、バックトラック)を実現すること。
変数が格構造に縛られない利点を十分に生かし、処理を高速化し、証明や学習等のため結果を見やすく表示すること。
<特許文献1の解決手段(概要)>
人間が、PROLOGにおける「事実」、「ルール」又は「ゴール」の入力にあたり、PROLOGにおける「リテラル」にあたる内容の定数部分と変数部分とを文字種、デリミタ又はエスケープ文字により区別してコンピュータに入力し、
コンピュータが、文の主部、述部等の境界をまたがりうるものとして変数を取扱いながら、その入力に含まれる文の自動単一化処理、自動導出処理又はその両方を行う。
変数を含みうる文であるパターンと、変数を含まない文である定数文字列との単一化を、パターンに最初に出現する変数の最長一致解を求めて、該最長一致解の文字列を後ろから空文字になるまで削る過程を該パターンに代入してできる
各新たなパターンについて、該新たなパターンができる前提となった削る過程の解の各状態をそれぞれ記憶しながら、再帰的に同様に変数がなくなるまで繰り返し、変数がなくなったときに単一化した各途中の解の状態を結合して各単一化の答えを得る。
パターン中の固定文字列が最長一致解を削る過程の文字列に含まれるか等を検出して高速化する。
パターン対パターンの単一化は語頭や語尾の一致に着目して高速化する。全探索の具体的手法も提供する。
<特許文献1の解決手段(全文、ただし一部本発明と混同しないように加筆・修正)>
(0009)
本発明は、かかる課題に鑑みてなされたものであり、特許文献1の請求項1は、
コンピュータが、論理型プログラミング言語PROLOGの機能の一部又は全部を自動的に行う方法であって、
人間が、PROLOGにおける「事実」、「ルール」又は「ゴール」の入力にあたり、PROLOGにおける「リテラル」にあたる内容(以降、「文」と呼ぶ)の定数部分と変数部分とを文字種、デリミタ又はエスケープ文字により区別してコンピュータに入力すること、
コンピュータが、文の主部、述部、主語、述語、目的語、補語、連用修飾語、連体修飾語又は文の境界をまたがりうるものとして変数を取扱いながら、上記「事実」、「ルール」又は「ゴール」の入力に含まれる文の自動単一化処理、自動導出処理又はその両方を行うこと、
を特徴とする処理方法を提供する。
ここで、「人間が、・・・定数部分と変数部分とを文字種、デリミタ又はエスケープ文字により区別してコンピュータに入力する」とは、人間が本発明によるアプリケーションソフト(処理系)の入力欄内やコマンドプロンプト後等に(フロントエンドプロセッサ等を介して又は介さずに)直接入力すること、インターネットブラウザや文章編集ソフト等からコピーペーストやカットペーストすること、別途入力して保存してあったテキストファイル等を読み込んだり、引用したり、参照したりすること等を含む。
また、「コンピュータが、文の主部、述部、主語、述語、目的語、補語、連用修飾語、連体修飾語又は文の境界をまたがりうるものとして変数を取扱い」とは、日本語等の助詞等や英語等の前置詞等を介した明示的な区切りのある格構造(構文解析結果や意味解析結果の階層構造に該当するものを含みうる)の境界(明示的な区切り)をまたがりうるだけでなく、英語等の例えばSV形式・SVO形式・SVOO形式・SVOC形式のSとVの境界、VとOの境界、VとCの境界等をまたがり得、重文や複文の文の境界等をもまたがり得るものとして取り扱うモードを含む(逆に、取り扱わないモードがあってもよい)。これらの場合、変数に入り得る解候補として、文全体や、文全体を構成する文字列から文としての文法構造による区切りの単位を無視して任意の部分文字列を抽出したもの、さらには階層的な参照構造をもつ複文・重文やもっと長い論文等の全体や、さらにそれらの任意の部分文字列が対象となる(なお、「文の境界」をもまたがりうるものとして取り扱う場合であって、知識源の集合を扱う(例えば、ファイルにまとめた知識源の集合を一括して読み込む、書き込む、参照する、等する)場合には、文の境界「以外」に知識源どうしの区切りが必要となるため、このような区切りとして、例えば、改行コードやタブコード等を用いることができる)。
これにより、自然言語に変数を埋め込む形式で表現した知識や情報も、普通の文章形式の知識や情報も、それらの間での現実的な相互活用の可能性が十分に開けた一元的な知識源として、両者を特に区別せずにコンピュータで自動処理することが可能になる(上記「困難性A」の克服)。
「現実的」な相互作用の可能性が「十分」に開けるためには、コンピュータによる自動処理が検索処理系として備えるべき1)検索式(パターンを指定する表現)の簡便性、2)十分な適合率(解の正確性)、3)十分な再現率(解候補を抽出する上での網羅性)を備えていなければならないが、本発明では、文中の自由な(すなわち、文法や意味の区切りに制限されない)場所に変数(複数種類でもよく複数回でもよい)の埋め込みを許容し(簡便性を確保し)つつも、PROLOGの知識処理手順(と内在する知識解釈方針)に基本的に沿うことにより、他の処理系におけるようなハイブリッドな知識処理手順(と、そのハイブリッドな処理手順に対応する複雑な知識解釈方針)によって起こりうる適合率(解の正確性)低下のリスクを回避しつつ、「文の主部、述部、主語、述語、目的語、補語、連用修飾語、連体修飾語又は文の境界をまたがりうるものとして変数を取扱」うことにより、自然言語の区切り表現(読点、句読点、カッコ、コンマ、ピリオド、等)や修飾的なフレーズ(形容詞句、副詞句、必須でない格の表現、等)による指定パターンの泣き別れ出現が原因となる不当な不一致(正規表現的なアンマッチ)を防ぎ、格構造の明示されない表層的な文字列表現間(検索式と知識源の間)での一定の再現性(解候補を抽出する上での網羅性)を確保可能としている。また、知識源となった自然言語の正確な文脈(前後の文字列)を損ないにくい一体的・連続的な引用・抽出(変数への解候補としての)も可能となり、結局、その透明性・単純性により推論の実質的な健全性(根拠や推論経緯の正当性)の確認・検証が手軽かつ容易となり、根拠がいつも明確であるという現実的な安心感を利用者にもたらし、全体として、変数が格構造に縛られない(さらに、格構造のルール(出現順序等)について知らなくてもよく、引数の順番が間違っているかもしれないという不安もない)という仕様の利点を十分に生かしきることを可能にする。
なお、本発明は日本語(一文字の情報量が多く、単語の間にスペースがない)を第一の対象にしているため、文字を処理単位、区切りの単位としている内容が多いが、英語等(一文字の情報量が少なく、一文の文字数は多いが、単語の間にスペースのあるもの)は、スペースで区切った単語を単位として同様の処理をすることも可能である。
(0010)
また、特許文献1の請求項2は、
前記自動単一化処理において、
変数を含みうる文であるパターン(定数部分と変数部分とを文字種、デリミタ又はエスケープ文字により区別したもの)と、変数を含まない文である定数文字列との単一化を、
パターン(例:$Xと$Yは$Zが好き)に最初(又は最後)に出現する変数(例:$X)の最長一致解(例:太郎と次郎)を求めて、該最長一致解の文字列を後ろ(又は前)から空文字になるまで削る過程(例:太郎と次郎>太郎と次>太郎と>太郎>太>空)を該パターンに代入してできる各新たなパターン(例:「太郎と次郎と$Yは$Zが好き」>「太郎と次と$Yは$Zが好き」>「太郎とと$Yは$Zが好き」>「太郎と$Yは$Zが好き」>「太と$Yは$Zが好き」>「と$Yは$Zが好き」)について、該新たなパターンができる前提となった削る過程の解の各状態($X=太郎と次郎>太郎と次>太郎と>太郎>太>空)をそれぞれ記憶しながら、
再帰的に同様に変数がなくなるまで繰り返し、
変数がなくなったときに単一化した各途中の解の状態(例:真($X=太郎と次郎,$Y=三郎),真($X=太郎,$Y=次郎と三郎))を結合して各単一化の答え(例:答え1=($X=太郎と次郎,$Y=三郎),答え2=($X=太郎,$Y=次郎と三郎)を得ることを特徴とする
特許文献1の請求項1に記載の処理方法を提供する。
ここで、「(又は最後)」は「(又は前)」に対応しており、最後に出現する変数から代入するときは、削り始めが前からとなる必要があることを意味する。
これにより、最長一致解から最短一致解に至るすべての可能性について確実に網羅した各解候補の状態を検証し、網羅的な答え(さらに絞りこまれた解候補の集合)を提供することが可能になる。
(0011)
また、特許文献1の請求項3は、
空文字になるまで徐々に削るかわりに、別途求めた最短一致解までしか徐々に削らないことを特徴とする
特許文献1の請求項2に記載の処理方法を提供する。
これにより、最短一致解未満の長さから「空」文字までの解探索の計算を節約することができ、自動処理の高速化が可能となる場合がある。
(0012)
また、特許文献1の請求項4は、
空文字になるまで徐々に削る際、
パターン中で該変数が最初(又は最後)に出現した直後(又は直前)の固定文字である1文字C(直後(又は直前)が別の変数でその解が空文字でないときは該別の変数に解候補として代入されている解候補の最初(又は最後)の1文字C)が該最長一致解に含まれる場合に、
該最長一致解の文字列の最後(又は最初)からそのCに最初にあたるまでの部分文字列をそのCを含め削ることを特徴とする
特許文献1の請求項2又は3に記載の処理方法を提供する。
ここで、「(又は最後)」は「(又は直前)」に対応しており、最後に出現する変数から代入するときは、削り始めが前からとなる必要があることを意味する。
これにより、変数の直後(又は直前)の固定文字にマッチしない解候補の列挙とその解候補を前提とした探索を節約することができ、自動処理の高速化が可能となる場合がある。
(0013)
また、特許文献1の請求項5は、
前記自動単一化処理又は自動導出処理において、
前記「ゴール」(「サブゴール」を含む。以下同じ)となる束縛情報を求める際、
該「ゴール」を構成する各文について独立して束縛情報を求め
各束縛情報の積集合が空でない場合に戻り値真とその積集合を返す
特許文献1の請求項1から4のいずれか一項に記載の処理方法を提供する。
ここで、束縛情報とは、各変数に同時にそのような解候補を代入してみたか/すべきかということを示す情報である。各変数への一つの束縛の仕方を示す束縛情報は、「,」をAND結合と解釈することにより、「変数名1=値1,変数名2=値2,・・・,変数名N=値N」といったリスト形式で表現することができる一方、複数の束縛の仕方は、そのようなリストの集合として、あるいは、「,」ではなくAND/OR結合を明示して複数束縛間の共通部分をくくりだした形や、複数束縛の全体を標準化した連言標準形や選言標準形で表現することができる。
これにより、同時に満たすべきパターン(文)が複数あり、パターン(文)間で同名の変数には同じ解が入るべきとする問題形式の場合(例えば、ユーザからのそのようなAND結合問合せや、ルールのボディ部に複数の文がある場合)に、ルールのより右側のパターンについて、より左側のパターンの各単一化結果ごとに多大な全文探索処理を無駄に繰り返す可能性がすくなくなり、ボディ部をバックトラックしながら深さ優先探索する非効率(変数を自然言語に埋め込む形式においてより顕著な非効率)を回避し、同時に満たすべき各パターンごとの処理を単純化することができる。また、推論過程の表示や検証(完全性や健全性)をわかりやすく、容易にする。また、ルールの意味として必要な直観にとって余計であり定義されるべきでなかった順序性(ボディ部の文間の)が推論過程に副作用を与えることを防ぐことができる。
(0014)
また、特許文献1の請求項6は、
前記自動単一化処理又は自動導出処理において、
前記「ゴール」となる束縛情報を求める際、
既存の束縛情報を最初に空とし、
「ゴール」が含む文集合を、既存の束縛情報の適用下で該一文が真となりうるかと該なりうるための追加の束縛情報について自動計算して該追加の束縛情報を該既存の束縛情報に加えながら該一文を除いて再帰的に小さくしていき、
真となりうるまま該文集合が空集合になったときの既存の束縛情報を「ゴール」となる束縛情報とする
特許文献1の請求項1から4のいずれか一項に記載の処理方法を提供する。
ここで、「再帰的に小さくしていき」とは、再帰が深くなるほど文集合が小さくかつ束縛情報が複雑になる(より多くの変数が束縛され、束縛する値の範囲がより絞られる)よう、例えば、C言語で再帰呼び出しをする処理や、独自に宣言し定義した深さ優先探索用のスタック構造(構造体の配列とスタックポインタ等)によって同等の再帰的処理を実現することをいう。
これにより、変数を自然言語に埋め込む形式で表現された、同時に満たすべき複数パターンのAND結合からなるオープンクエスチョンを自動処理する問題を、より単純かつ再帰的な同一構造を持つ部分問題へとシンプルに変換し、推論過程の表示や検証(完全性や健全性の)を容易にする。
(0015)
また、特許文献1の請求項7は、
前記自動単一化処理又は自動導出処理において、
変数を含まないパターンと変数を含まない事実との単一化を行う場合、
パターンと事実が文字列として一致する場合に真を返す、又は
パターンと事実が文字列として一致しない場合に偽を返す
特許文献1の請求項1から6のいずれか一項に記載の処理方法を提供する。
これにより、シンプルかつ迅速に探索を行うことができる。
なお、「変数を含まない事実」が句点等で区切られた複数の文を含む場合。「文字列としての一致」は、パターンの文字列が事実の文字列の部分に一致することであってもよいとするモードを設けることもできる。
これにより、同型の複数の情報を一つの事実にまとめて表現して探索の対象とすることができる。また、複数要素間のなんらかの順序性(例えば、大きさ、貴重さ、古さ・・・等)も表現しやすくなる。
(0016)
また、特許文献1の請求項8は、
前記自動単一化処理又は自動導出処理において、
変数を含まないパターンとホーン節の変数を含まないヘッド部との単一化を行う場合、
パターンとヘッド部が文字列として一致する場合に、該ホーン節のボディ部をサブゴールとして特許文献1の請求項5又は6に記載の処理方法を適用した結果を返し、
一致しない場合に偽を返す
特許文献1の請求項1から7のいずれか一項に記載の処理方法を提供する。
これにより、変数を自然言語に埋め込む形式で表現するルールのヘッドが変数を含まない場合の健全な機械的解釈と、シームレスでわかりやすくかつシンプルで統一的な処理メカニズムと、対応する推論過程の説明を与えることができる。
(0017)
また、特許文献1の請求項9は、
前記自動単一化処理又は自動導出処理において、
変数を含まないパターンと変数を含むヘッド部をもつホーン節との単一化を行う場合、
特許文献1の請求項2から4のいずれか一項に記載の処理方法における「定数文字列」として当該パ
ターンを用いかつ同処理方法における「パターン」として当該ヘッド部を用いて処理して求めた各束縛情報について、
当該ホーン節のボディ部に適用したものを特許文献1の請求項5又は6に記載の処理方法の「サブゴ
ール」として処理した結果が真となるものが存在すれば真を返す、又は
存在しなければ偽を返す
特許文献1の請求項1から8のいずれか一項に記載の処理方法を提供する。
これにより、変数を自然言語に埋め込む形式で表現するルールのヘッドが変数を含み、このルールを起動したパターンが変数を含まない場合に、ボディ部の変数の束縛範囲を事前に制限して、真偽判断の処理を高速化することができる。
また、健全な機械的解釈と、シームレスでわかりやすくかつシンプルで統一的な処理メカニズムと、対応する推論過程の説明を与えることができる。
(0018)
また、特許文献1の請求項10は、
前記自動単一化処理又は自動導出処理において、
変数を含むパターンと変数を含まない事実との単一化を行う場合、
特許文献1の請求項2から4のいずれか一項に記載の処理方法における「パターン」として当該パタ
ーンを用いかつ同処理方法における「定数文字列」として当該事実を用いて処理した結果を返す、
特許文献1の請求項1から9のいずれか一項に記載の処理方法を提供する。
これにより、パターンと(静的な)事実との間のすべての解候補(格変数への)が洗い出されて「結果」として返されるため、上記「困難性A」克服のための基礎的な機構をシンプルに与えることができ、推論過程の可視化や検証だけでなくさらにはルールの修正等といったユーザーの手を介した学習をも容易にする。
(0019)
また、特許文献1の請求項11は、
前記自動単一化処理又は自動導出処理において、
変数を含むパターンと変数を含まないヘッド部をもつホーン節との単一化を行う場合、
特許文献1の請求項2から4のいずれか一項に記載の処理方法における「パターン」として当該パタ
ーンを用いかつ同処理方法における「定数文字列」として当該ヘッド部を用いて処理した結果を真とする束縛情報(C)が存在する場合で、かつ、当該ホーン節のボディ部を請求項5又は6に記載の処理方法の「サブゴール」として処理した結果が真の場合に当該束縛情報(C)とともに真を返す、
特許文献1の請求項1から10のいずれか一項に記載の処理方法を提供する。
これにより、変数を含むパターンと(変数を含まない静的な)ヘッドとの間のすべての解候補(各変数への)が洗い出されて「結果」として返されるため、上記「困難性A」克服のための基礎的な機構をシンプルに与えることができ、推論過程の可視化や検証だけでなくさらにはルールの修正等といったユーザーの手を介した学習をも容易にする。
また、より単純かつ再帰的な(または相互再帰的な)同一構造を持つ部分問題へとシンプルに変換し、推論過程の表示や検証(完全性や健全性の)を容易にする。
また、変数を自然言語に埋め込む形式で表現するルールのヘッドが変数を含まない場合の健全な機械的解釈と、シームレスでわかりやすくかつシンプルで統一的な処理メカニズムと、これらに該当する推論過程の説明を与えることができる。
(0020)
また、特許文献1の請求項12は、
前記自動単一化処理又は自動導出処理において、
変数を含むパターンと変数を含むヘッド部をもつホーン節との単一化を行う場合、
パターンとヘッド部の頭、尾又は両方に存在する文字数分の固定文字が一致していない場合に偽を返す、
特許文献1の請求項1から11のいずれか一項に記載の処理方法を提供する。
これにより、一律の探索に比して、明らかに大幅な計算量節約と処理速度向上が図れる。
(0021)
また、特許文献1の請求項13は、
前記自動単一化処理又は自動導出処理において、
変数を含む第一のパターンと変数を含むヘッド部をもつホーン節との単一化を行う場合、
パターンとヘッド部の頭及び尾に存在する文字数分の固定文字が一致している場合、
特許文献1の請求項5又は6に記載の処理方法における「サブゴール」として当該ホーン節のボディ
部を適用した結果が真となる各束縛情報により当該ホーン節のヘッド部を束縛して得られる各第二のパターンについて、
第二のパターンが変数を含まない場合に、
特許文献1の請求項2から4のいずれか一項に記載の処理方法における「パターン」として第一の
パターンを用いかつ同処理方法における「定数文字列」として第二のパターンを用いて処理した結果を返す、
請求項1から12のいずれか一項に記載の処理方法を提供する。
ここで、「第二のパターンが変数を含まない場合」とは、ホーン節(ルール)において、ヘッド部に含まれるすべての変数がボディ部「にも」含まれており、ボディ部のすべての変数が定数(固定文字列)で束縛された結果としてヘッド部のすべての変数も定数(固定文字列)で束縛(代入)されたことによりヘッド部の変数が消えてヘッド部が定数文字列と見なせるようになったことをいう。
これにより、変数を含むパターンと変数を含むヘッド部をもつホーン節(ルール)との単一化をシンプルな計算モデルにより、ユーザーがトレースしやすい流れで機械的・自動的に行うことができる。
すなわち、変数を含むパターンと変数を(各束縛情報により)含まなくなった(=定数文字列化した)ヘッド部との間のすべての解候補(パターンの各変数へ代入すべきもの)を洗い出して「結果」として返す形に、元々のより複雑な問題(変数対変数の単一化)を帰着(問題を変換)させることにより、上記「困難性A」克服のための基礎的な機構をシンプルに与え、思考プロセスとしても表現しやすいものにできている。また、この「帰着(問題の変換)」に当たって、より単純かつ再帰的な(または相互再帰的な)同一構造を持つ部分問題へとシンプルに変換しているため、推論過程の可視化や検証(完全性や健全性の)だけでなくルールの修正等といったユーザーの手を介した学習をも容易にする。 結局、変数を自然言語に埋め込む形式で表現するルールのヘッドが変数を含む場合の健全な機械的解釈と、シームレスでわかりやすくかつシンプルで統一的な処理メカニズムと、これらに該当する推論過程の説明を容易に与えることができる。
(0022)
また、特許文献1の請求項14は、
変数を含む事実が入力されることをコンピュータが制限することを特徴とする
特許文献1の請求項1から13のいずれか一項に記載の処理方法を提供する。
ここで、変数を含む事実(ルールでない知識源)とは、例えば、「$Xは$Xである。」(トートロジー的に恒真となる事実)や「$Xは$Yである。」(表層的な文型だけが合致していれば真となってしまう根拠のない事実)等がある。
これらがコンピュータに入力されることを制限することにより、パターン(変数を含みうる文)と事実(変数を含まない文(=固定文字列))との自動単一化処理の計算が単純になり、自動処理による高速な回答が可能となる。また、根拠のない事実を知識源に混入しにくくする。
(0023)
また、特許文献1の請求項15は、
前記ルールがいわゆるホーン節と同様の形式であり、ヘッド部がボディ部に出現しない変数を含むことをコンピュータが制限することを特徴とする
特許文献1の請求項1から14のいずれか一項に記載の処理方法を提供する。
ここで、「ヘッド部がボディ部に出現しない変数を含むことをコンピュータが制限する」とは、ヘッド部が「$Xは素敵」であり、ボディ部が「$Yは強い,$Yは$Zに優しい,$Zは子供,$Yは賢い」といったように、ボディ部のすべての文中の変数(この例では、$Yと$Z)が束縛(代入)されても、ヘッド部の変数(この例では、$X)が束縛されないまま残るようなルールが知識源として入力されたり、記憶されたり、起動されたりすることをコンピュータが制限することをいう。このようなルールは、事実の場合と同様に、ヘッド部に束縛されない変数を残すことにつながるため、健全でない推論結果を生み出しやすく、推論のスピードをも低下させる原因となる。
こうしたルールがコンピュータに入力されることを制限することにより、パターン(変数を含みうる文)とヘッド部(特許文献1の請求項13により変数を含まない文(=固定文字列)の集
合に帰着可能)との自動単一化処理の計算が単純になり、自動処理による高速な回答が可能となる。また、根拠のない推論結果を生み出しにくくする。
(0024)
また、特許文献1の請求項16は、
前記自動単一化処理又は自動導出処理において、
束縛されない変数が互いに残っているパターンとヘッド部又は事実との自動単一化処理を、
固定文字列として極小となる解の集合を求めて返すことにより行うことを特徴する、 特許文献1の請求項1から13のいずれか一項に記載の処理方法を提供する。
ここで、「固定文字列として極小となる解の集合」の例としては、「$Aは$B」と「$Cも$D」との間の自動単一化の結果として、{($A=”も”、$B=<空>、$C=<空>、$D=”は”),($A=空、$B=”も”、$C=”は”、$D=空)}という2つの解を提供することがある。
これにより、無限個の解が存在する場合にも解の例(特に最小のシンプルな例)を提供することが可能になる。
(0025)
また、特許文献1の請求項17は、
前記自動単一化処理又は自動導出処理において、
束縛されない変数が互いに残っているパターンとヘッド部又は事実との自動単一化処理を、
変数を含む文字列として極小となる解の集合を求めて返すことにより行うことを特徴する、
特許文献1の請求項1から13のいずれか一項に記載の処理方法を提供する。
ここで、「固定文字列として極小となる解の集合」の例としては、「$Aは$B」と「$Cも$D」との間の自動単一化の結果として、{($A=”$Cも”、$B=<自由>、$C=<自由>、$D=”は$B”),($A=<自由>、$B=”も$D”、$C=”$Aは”、$D=<自由>)}という2つの解を提供すること等がある。変数を束縛する値(変数に代入される値)の文字列長(ただし、変数が含まれる場合は変数の出現あたり1文字と見なす)の合計(解組みを通じた)が極小となるものと考えることができる。
これにより、無限個の解が存在する場合にも解の一般形を提供することが可能になる。
(0026)
また、特許文献1の請求項18は、
束縛されない変数が互いに残っているパターンとヘッド部又は事実との各文字列の頭及び尾に共通して存在する文字数分の固定文字が一致していない場合、
偽を返すことを特徴とする、
特許文献1の請求項16又は17に記載の処理方法を提供する。
これにより、単一化の可能性のない自動探索を節約し、自動処理を高速化することができる。
(0027)
また、特許文献1の請求項19は、
前記固定文字列又は変数を含む文字列として極小となる解の集合を求める際、
束縛されない変数が互いに残っているパターンとヘッド部又は事実とからなる両文字列(第一の文字列と第二の文字列とする)に含まれる各変数が、各文字列内では共通に束縛され、文字列間では独立に束縛されるものとしながら(あるいは、同名変数を共通に束縛するスコープを各文字列内のみ(あるいは、文字列間は変数のスコープ外)としながら)、
各変数に相手の文字列(第一の文字列中の変数には第二の文字列、第二の文字列中の変数には第一の文字列)のあらゆる部分文字列(<空>及び文字列全体も含む)又は自分自身を代入してみて両文字列が一致する場合を探す全探索により極小となる解の集合を求めることを特徴する、
特許文献1の請求項16又は17に記載の処理方法を提供する。
「又は自分自身を・・・代入」とは、文字列中の「$X」には「$X」そのものを代入することをいい、たまたま第一の文字列にも第二の文字列にも$X(互いのスコープは異なっている)が含まれるときは、第一の文字列の$Xと第二の文字列の$Xをあえて区別できるように(例えば、「$X1」と「$X2」、等として)代入することによっても明らかに健全な計算を行うことができる。
これにより、健全性と停止性(計算の有限性)を確保しながら解集合の一定の網羅性(問題(パターン対)の性質によっては完全性)を確保することができる。
(0028)
また、特許文献1の請求項20は、
束縛されない変数が互いに残っているパターンとヘッド部又は事実とからなる両文字列そのものではなく、
束縛されない変数が互いに残っているパターンとヘッド部又は事実との各文字列の頭及び尾に共通して存在する文字数分の固定文字を両者から除いて残る二つの文字列に相当する両文字列について、
特許文献1の請求項19に記載の処理をする処理方法を提供する。
これにより、解集合の一定の網羅性(場合によっては完全性)を保ちながら全探索の空間を小さくでき、処理が高速化される。
例えば、「石川の$Aは$Bが好き。」と「石川の$Cも$Dアイスが好き。」との間の自動単一化の過程として、そのまま解を探すのではなく、頭尾の共通部分を削除して ”$Aは$B”

”$Cも$Dアイス”
とした上で、全探索により「$A」と「$B」それぞれに、”$Cも$Dアイス”の全ての部分文字列(これは、$Cや$Dといった変数(${・・・}形式の変数も同じ)は1文字とすると、6文字であるため、6×(6+1)/2+1(<空>分)+1(自分自身を代入分)=23通りある)を代入しつつ、同様に、「$C」と「$D」それぞれに”$Aは$B”の全ての部分文字列(これは、同様に3文字であるため、3×(3+1)/2+1+1=8通りある)を代入してみてできる全ての両文字列(23×23×8×8通り)について、両文字列が一致した場合(例えば、(
”もはアイス”,
”はもアイス”,
”$Aはもアイス”,
”$Cもはアイス”,
”$Aはも$Dアイス”
※ちなみに”$Cもは$Bアイス”は一致しない
)となった場合の代入組の集合{
($A=”も”、$B=”アイス”、$C=<空>、$D=”は”),
($A=<空>,$B=”もアイス”,$C=”は”,$D=<空>),
($A=”$A”,$B=”もアイス”,$C=”$Aは”,$D=<空>),
($A=”$Cも”,$B=”アイス”,$C=”$C”,$D=”は”),
($A=”$A”,$B=”も$Dアイス”,$C=”$Aは”,$D=”$D”) }又は、各代入組の部分的代入の集合(例えば{
($A=”も”、$B=”アイス”),
($A=<空>,$B=”もアイス”),
($A=”$A”,$B=”もアイス”),
($A=”$Cも”,$B=”アイス”),
($A=”$A”,$B=”も$Dアイス”)
})
を解として答えることができる。
なお、$A=”$A”や$B=”も$Dアイス”は、$Aや$Dが自由であり、そこにどのような文字列を代入しても単一化できる(すなわち、無限の解があるということと、その無限個の解(文字列)の制約(正規表現的な形)のあり方)を示すことができる。 (0029)
また、特許文献1の請求項21は、
各変数に相手の文字列のあらゆる部分文字列(<空>及び文字列全体も含む)又は自分自身を代入してみて両文字列が一致する場合を探す全探索により極小となる解の集合を求める際、
変数に代入する部分文字列に変数が含まれる場合に、当該部分文字列に含まれる変数を両文字列にそれまで存在しなかった新しい変数で置き換えながら、該新しい変数に対しての同様の代入も以後再帰的に行いながら両文字列が一致する場合を探す全探索を行うことを特徴とする
特許文献1の請求項19又は20に記載の処理方法を提供する。
これにより、自文字列内の固定文字を相手文字列内の変数を介して反射的に自文字列内の変数に代入した解をも探す必要のある性格の問題(例えば、両文字列={”$Xは$X”,”い$Yう”}の場合では、解候補として($X=”いう”,$Y=”うはい”)を列挙できなければならない)について、解探索の健全性を維持したまま、解候補列挙の網羅性をより高めることができる。上の例では、両文字列(「パターン対」とも呼ぶ)={”$Xは$X”,”い$Yう”}から($X=”いう”,$Y=”うはい”)という解候補を列挙できることを、本発明により再帰的に($X=”い${Y1}う”)⇒(${Y1}=<空>)⇒($Y=”うはい”)という探索枝(探索木の一部であり、本発明に沿った幅優先探索の場合は有限回で生成可能である)を生成しうることによって、示すことができる。
「再帰的に・・・全探索」とは、例えば、各変数への各ありうる代入(前の特許文献1の請求項と同
じ)を再帰的に繰り返す幅優先探索をしながら一致する代入系列(例えば、上記の($X=”い${Y1}う”)⇒(${Y1}=<空>)⇒($Y=”うはい”)、等)を列挙することである。最初の代入のバリエーションは、両文字列中の変数の種類がそれぞれ2個と3個であり文字列の長さがそれぞれ6字と7字(変数はまとめて1字と数える)であれば、2個×(7×(7+1)/2+1+1)+3個×(6×(6+1)/2+1+1)=60+69=129通りとなる。これらの枝から派生するさらなる枝の最長深さが均等になるように幅優先探索を行う場合、代入回数等によるリミッター(上限値と比較するプログラムステップ等)を設けることにより、一回一回の探索を適当な計算量に制限することができる(再帰性によって保証されなくなった停止性や応答速度の確保)。なお、深さ優先探索とした場合にも、深さの制限や代入回数等によって計算量を制限することができる。いずれも自己再帰や相互再帰による無限ループを、再帰的な関数の呼び出しを管理するスタック構造(構造体の配列)等を設けて、先祖(より根方向)となる枝の呼出しパラメータ(その代入系列(代入文脈)に応じた両文字列の状態表現を含んでいてもよい)を現在の呼出しパラメータと比較したりすることにより回避することができる。また、両文字列の頭尾に存在する固定文字列が共通して存在する文字数分一致しているかどうかなどにより、単一化しえない枝の枝刈りを行うこともできる。なお、制限した計算量(例えば代入百万回や探索深さ20以内)の探索により解が見つからなかった場合に「解なし(精度:代入百万回かつ探索深さ20以内)」として、見つかった場合に、「($X=”いう”,$Y=”うはい”),(・・・),・・・(但し、精度:代入百万回かつ探索深さ20以内)」等として探索精度を明示しながらユーザに答えることもできる。また、代入の制限回数以内かつ制限探索深さ以内で明らかに全探索できた場合(完全性のある場合)には、その旨を「解なし(全探索済)」あるいは「($X=”いう”,$Y=”うはい”),(・・・),・・・(全探索済)」等と明示して、ユーザに答えることもできる。
(0030)
また、特許文献1の請求項22は、
変数に代入した結果についても、各文字列の頭及び尾に共通して存在する文字数分の固定文字を両者から除いて残る二つの文字列を、
「相手の文字列のあらゆる部分文字列(<空>及び文字列全体も含む)」の対象となるの「相手の文字列」として、探索が進むごとに、文字列の頭又は尾に存在する固定文字数が少なくすることを特徴とする、
特許文献1の請求項19〜21のいずれか一項に記載の処理方法を提供する。
これにより、探索を進めるごとに(先の枝にいくほど)枝の個数が少なくなり計算量を節約することができる。
(0031)
また、特許文献1の請求項23は、
前記固定文字列又は変数を含む文字列として極小となる解の集合を求める際、
束縛されない変数が互いに残っているパターンとヘッド部又は事実とからなる両文字列(第一の文字列と第二の文字列とする)に含まれる各変数が、各文字列内では共通に束縛され、文字列間では独立に束縛されるものとしながら(あるいは、同名変数を共通に束縛するスコープを各文字列内のみ(あるいは、文字列間は変数のスコープ外)としながら)、
各変数に、固定文字列(空文字を含む)又は変数を含む文字列を再帰的に代入してみて解の集合を求める処理方法であって、
代入してみる変数を相手文字列の頭又は尾が固定文字である自文字列の対応する頭又は尾の変数に限定し、
代入値を、該頭である場合には該頭の固定文字もしくは固定文字列に続く新しい変数又は<空>とし、該尾である場合には新しい変数に続く該尾の固定文字もしくは固定文字列又は<空>とし、
変数に代入した結果について、各文字列の頭及び尾に共通して存在する文字数分の固定文字を両者から除くことを繰り返す、
ことを特徴とする特許文献1の請求項16又は17に記載の処理方法を提供する。
これにより、頭及び尾の固定文字の存在に着目して解の列挙範囲を(探索の網羅性を損なわずに)大幅に制限すること可能になり、大幅な計算量節約と高速化が可能になる。 (0032)
また、特許文献1の請求項24は、
前記固定文字列又は変数を含む文字列として極小となる解の集合を求める際、
束縛されない変数が互いに残っているパターンとヘッド部又は事実とからなる両文字列(第一の文字列と第二の文字列とする)に含まれる各変数が、各文字列内では共通に束縛され、文字列間では独立に束縛されるものとしながら(あるいは、同名変数を共通に束縛するスコープを各文字列内のみ(あるいは、文字列間は変数のスコープ外)としながら)、
各変数に、固定文字列(空文字を含む)を再帰的に代入してみて解の集合を求める処理方法であって、
各文字列の頭及び尾に存在する文字数分の共通する固定文字を除いてできる両文字列中の固定文字種(変数の識別子やデリミタを除いた文字種)だけを用いてできる束縛情報を、束縛する値の文字列長の合計が小さいものから順に列挙していくことにより求める、 特許文献1の請求項16又は17に記載の処理方法を提供する。
これにより、一定の性質をもった問題については、効率よく解に到達し、列挙することもできる。
(0033)
また、特許文献1の請求項25は、
求めた「変数を含む文字列として極小となる解の集合」をもとに、
当該ホーン節の変数を当該変数を含む文字列で一時的に書き換えてできるホーン節により探索を継続する特許文献1の請求項19〜24に記載の処理方法を提供する。
これにより、パターンとホーン節(ルール)のヘッド部とが単一化するために必要であることが計算された制約(上記の例では、変数「$C」が”$Aは”という形の文字列で束縛(代入)されることでしか単一化しえないという制約の働くような単一化方針(例えば、上記最後の代入組の場合)もある)を、そのホーン節のボディ部の探索プロセスに伝播することができ、探索を効率化することができる。
(0034)
また、特許文献1の請求項26は、
求めた「変数を含む文字列として極小となる解の集合」をもとに、
「変数を含む文字列」の変数部分に、当該「変数を含む事実」の解組の集合としてあらかじめ定義された固定文字列組の集合の各要素を代入してできる固定文字列組の集合を返す、
特許文献1の請求項19〜25のいずれか一項に記載の処理方法を提供する。
これにより、変数(一個又は複数)を含む事実とその変数に埋めうる適切な答え(又は仮説)の集合とをひもづけたデータベース(例えば、「言葉方程式(登録商標)」「VLANK(登録商標)」中の知識源)と効率的に連携した解探索を行うことができる。また、似た文型をもつ大量の事実を、本発明の枠組みと連携させて効率的に管理することができる。
(0035)
また、特許文献1の請求項27は、
前記自動単一化処理又は自動導出処理において、
変数を含む第一のパターンと変数を含む第二のパターンとの自動単一化を行う場合、
両パターンの頭及び尾に存在する文字数分の固定文字が一致しており、かつ、同じ変数が各パターン内で一度しか出現しない場合、
無限個の解の存在を意味する情報を返す、
特許文献1の請求項1から26のいずれか一項に記載の処理方法を提供する。
(0036)
また、特許文献1の請求項28は、
特許文献1の請求項1から27のいずれか一項の方法を実行するための装置を提供する。
(0037)
また、特許文献1の請求項29は、
特許文献1の請求項1から27のいずれか一項の方法をコンピュータに実行させるためのコンピュー
タプログラムを提供する。
(特許文献1の発明の効果)
(0038)
本発明の効果は、各特許文献1の請求項について上述したとおりである。
(特許文献1の図面の簡単な説明)
(0039)
(図1)図1は本発明を最も効果的に実施するネットワークシステムの全体図である
。(実施例1)
(図2)図2は本発明を実施するコンピュータのハードウエア構成を示した説明図で
ある。(実施例1)
(図3)図3は本発明を実施する端末における画面表示の例を示した説明図である。
(実施例1)
(特許文献1の発明を実施するための形態)
(0040)
本発明は、ネットワークに接続された/接続されてないあらゆる種類のコンピュータ(クラウドサーバー、大型汎用機、デスクトップPC、ノートPC、携帯端末、本発明専用機)において実施することができるが、一般的なマルチタスク機能とウィンドウ機能をもちインターネットに接続されたPCにより実現した形態により説明する。
図1は本発明を最も効果的に実施するそのネットワークシステムの全体図であり、コンテンツ管理装置1は、利用者PC2又は利用者兼管理者PC2により、本発明で取り扱うコンテンツ(ルールや事実)の投稿を受け付け、所定のポリシーによって共有アクセス権やコンテンツ提供優先順位を制御しながらコンテンツを配信する公知のファイル共有サーバーでよい。利用者PC2は、その利用者ごとに、その信じる内容(や検討したい内容)を自然言語で表現したコンテンツ(ルールや事実)を本発明の方法に沿って入力して記憶し本発明の方法によって処理するコンピュータ、携帯端末等である。
図2は本発明で用いるコンピュータのハードウエア構成を示した説明図である。これは計算機の構成としては一般的なものであり、本発明の特徴は、不揮発性メモリ2hに記憶されたプログラム3及びコンテンツデータ4の指示や記載に従い自然法則を用いてCPU2eで処理される処理の内容、及び、利用者との対話プロトコル(書式)の在り方にある。
図3は本発明を実施する端末における画面表示の例を示した説明図である。図では「?$Aしない」という問い(オープンクエスチョン形式)に対して、図示しない記憶したリストLの1行目の「されていやなことはなるべくしない」という事実を用いて「$A =
されて嫌なことをなるべく/1/」という答えを列挙し、同様にリストLの9行目の「いじめをしない」という事実を用いて「$A = いじめ/9/」と答えている。
(0041)
このような実施形態においては、C++言語等を介して製造されたコンピュータプログラムにより、コンピュータ(PC等)に可能なあらゆる動作を実施させることができる。したがって、自然法則を用いたコンピュータの公知の基本的な動作(レジスタやメモリやストレージへの記憶・取り出し、四則演算、比較、等)や既に開発環境等の標準ライブラリとなっている一般的な機能(変数やN次元配列への代入・比較・コピー、文字列や数値の操作/比較/表示、リスト構造・キュー構造・ハッシュ構造・ベクトル型等の操作、バイナリ―サーチやソート操作、正規表現によるパターンマッチ操作、ネットワーク通信操作、等)の実現方法については、本発明の本質(新規性や進歩性につながる独自の構成)とも異なり、当業者にもよく知られているので、詳述はしない。一方、このような一般的な機能を組み合わせて、本発明に固有の処理をどのような操作順序や記憶の仕方(アルゴリズムやデータ構造)で実現するかについては、以下に詳述する。このアルゴリズム等の説明、上記した課題解決手段の説明及び本発明の図面の説明を提供して開発の参考とさせることにより、標準レベルの職業的プログラマであれば、標準的なアプリケーションプログラム開発技法(C++によるGUIアプリケーション統合開発環境、等)を用いて、本発明の方法をコンピュータに実施させることが明らかに可能となり、また、この方法のための装置やプログラムを作成することも可能となる。
(0042)
以下に示すアルゴリズムは、C言語/C++言語等を用いて所望の「関数」を新たに定義した上で関数呼出しを行うという標準的な構造化プログラミングをベースにしたアルゴリズムであり、当業者は、下記各関数の機能分担に応じた入出力や機能切り分けを行いながら(或いは、下記に示した仕様に沿って関数群をそのままコーディングすることにより)、本発明の解決手段に相当する処理手段(プログラムや計算機)を実現することが可能となる。
(0043)
■問い合わせPに対する知識リストLの処理アルゴリズム仕様
=====================================================================================================================
関数Q1(P:変数を含みうるパターン,L:知識リスト):★特許文献1の請求項に共通するメイン関数の特許文献1の実施例1★

1.Lの最初の行の内容B(事実又はホーン節)を取り出す。
ただし、Lが空の場合(最初の行が取り出せなかった場合)、偽を出力して終了。
2.変数の束縛情報Cの初期値を空とし、下記関数H(P,B,C)を呼出し、真となる(=マッチする)束縛情報(=解集合)Cを出力。
真(=マッチした)の場合
真(はい)を出力する(マッチした内容Bの行番号も添えて出力する)。
偽の場合
何もしない。
3.Lの次の行の内容B’が
ある場合
・B←B’とし、2に移動する。
ない場合
・2で真を一度も出力していない場合は偽(いいえ)を出力。
・終了。

(0044)
■問い合わせPに対する知識リストLの処理アルゴリズム仕様(事前固定文字列化版) =====================================================================================================================
関数Q2(P:変数を含みうるパターン,L:知識リスト):★特許文献1の請求項に共通するメイン関数の実施例2(事前固定文字列化版)★

(事前の固定文字列化)
1.{Lのみから演繹できるすべての文字列/その各文字列を演繹する根拠として用いたLの行番集合}を各行とする固定文字列テキストTを求める。
具体的には、上記関数Q1(”$A”,L)の出力系列(A=解1/根拠1,A=解2/根拠2,・・・)の要素を各行としてマージしたテキストTを求める。
求める途中で無限ループになる場合について、明示的な呼出管理スタック等を用いた無限ループ検出機能により演繹を部分的に省略する。
・例えば、ホーン節の真偽の確認をある変数束縛条件下でコンピュータが行う途中で
同じホーン節の真偽を同じ変数束縛条件下で確認しようとしていないかを、
構造体(確認中のホーン節識別子,現在の変数束縛条件)をメンバーとする呼出管理スタックを管理し、
呼出し時にスタックの根に向かって同じ組み合わせがないかリニアサーチすることにより
無限ループを検出する。
(固定文字列のみである故にQ1よりシンプルな方法(関数F)で解集合を求める) 2.テキストTの各行tにつき、下記関数F(P,t,C)が真となるCをすべて出力する。
(最終結果の出力)
3.Cが一つでもあれば真を出力し、なければ偽を出力する。

(0045)
■問い合わせPに対する、一の事実(固定文字列)又はホーン節B(但し、ヘッドに含まれるすべての変数がボディにも存在)の処理アルゴリズム仕様
=====================================================================================================================
関数H(P:変数を含みうるパターン,B:一の事実(固定文字列)又はホーン節,C:変数の束縛情報):★特許文献1の請求項1〜15の発明で使用する関数の特許文献1の実施例1−1★

Pが変数を含まない場合{
Bが事実である場合{
P=Bの場合は、真を返す。
そうでない場合は偽を返す。

Bがホーン節である場合{
Bのヘッド部が変数を含まない場合{
P=Bのヘッド部の場合は、関数D(Bのボディ部,E)の真偽を返す。
そうでない場合は偽を返す。

Bのヘッド部が変数を含む場合{
F(Bのヘッド部,P,C1)を真とする各C1について、
関数D(Bのボディ部にC1を適用したもの,E)の結果が真となるC1があれば、 真を返す。
そうでない場合は偽を返す。



Pが変数を含む場合{
Bが事実である場合{
F(P,B,C1)が真となるC1が存在すれば、そのようなすべてのC1をCに加えて真を返す。
そのようなC1が存在しなければ、偽を返す。

Bがホーン節である場合{
Bのヘッド部が変数を含まない場合{
F(P,Bのヘッド部,C1)を真とするC1が存在する場合で、かつ
関数D(Bのボディ部,E)が真であれば、そのようなすべてのC1をCに加えて真を返す。
そうでない場合は偽を返す。


Bのヘッド部が変数を含む場合{
★特許文献1の請求項12の発明を実施する場合★
//高速化の工夫(オプション)開始
PとBのヘッド部の頭及び尾に存在する文字数分の固定文字が一致していない場合{
偽を返す。

//高速化の工夫(オプション)終了

★特許文献1の請求項13の発明の実施★
PとBのヘッド部の頭及び尾に存在する文字数分の固定文字が一致している場合{
関数D(Bのボディ部,E)の結果が真となるE中のいずれかの束縛情報Gについて、 関数F(P,Bのヘッド部をGで束縛したもの(固定文字列になるはず),C1)を真とするC1があれば
そのようなすべてのC1をCに加えて真を返す。
そのようなC1が存在しない場合は偽を返す。





(0046)
■ホーン節のボディ部(又は変数を共有する重文の問い合わせ)の解集合の列挙アルゴリズム仕様
=====================================================================================================================
呼出例
→関数D("$Aと$Bは友達だ,$Aは人間,$Bは人間", E);
戻り例
←真(E=((A=花子,B=太郎),(A=太郎,B=次郎),(A=次郎,B=三郎)))
=====================================================================================================================
関数D(J:ボディ部(又は変数を共有する重文の問い合わせ),E:解集合):★特許文献1の請求項6の発明で使用する関数の特許文献1の実施例1−2A★
※ただし、知識源全体Lはグローバル変数に格納して参照可能とする

1.J中の最初の文Mを取り出す。最初の文が存在しない場合真を返す。
2.知識源全体Lに対して、前記関数Q1(M,L)又はQ2(M,L)を呼び出す。
結果が偽のときは
偽を返す。
真のとき
Mが変数を含まない場合
何もしない。
Mが変数を含む場合
Mを真とするためにとりうる束縛情報の集合Cを記憶する。
※真とするために束縛不要の変数は、その旨を明示的に示すこともできる。
※束縛値が無限集合でありながら真とするために一定の条件を要求する場合は、その条件を付記することもできる。
3.J中の次の文M’を取り出す。存在しない場合、真(E=束縛情報の集合C)を返す。
4.知識源全体Lに対して、前記関数Q1(M’,L)又はQ2(M’,L)を呼び出す。
結果が偽のときは
偽を返す。
真のとき
M’が変数を含まない場合
何もしない。
M’が変数を含む場合
M’を真とするためにとりうる束縛情報の集合C’と記憶してあった集合Cとの積集合を新たなCとする。
但し、元々の集合Cが空集合でなく積集合をとって空集合となったときは偽を返す。
※真とするために束縛不要の変数は、その旨を明示的に示すこともできる。
※束縛値が無限集合でありながら真とするために一定の条件を要求する場合は、その条件を付記することもできる。
5.3に戻る。


関数D2(J:ボディ部(又は変数を共有する重文の問い合わせ),E:解集合):★特許文献1の請求項6の発明で使用する関数の特許文献1の別の実施例1−2B(関数の再帰呼び出しを用い束縛情報を他の文に波及させることにより高速化を図ったもの)★

1.J中の最初の文Mを取り出す。Mが存在しない場合真を返す。
2.知識源全体Lに対して、Q1(M,L)又はQ2(M,L)を呼び出す。
結果が偽のときは
偽を返す。
真のとき
Mが変数を含まない場合
Jの次の文がなければ真を返し
あれば次の文を新たなMとし2に戻る。
Mが変数を含む場合
Jの次の文がなければ、とりうる束縛情報をEに格納して真を返し
あればとりうる束縛情報を集合Cとして記憶する。
3.Eを空にし、集合C中の各束縛情報Kについて
再帰呼び出しD2(KによりJの次の文以降を束縛してできるボディ部J’,E’)を実行する
結果が真のときは
Eに、真となったそのKかつE’を加える
4.各Kについて一度も真となっていないときは偽を返し、一度でも真となっているときは真(E)を返す


関数D3(J:ボディ部(又は変数を共有する重文の問い合わせ),E:解集合):★特許文献1の請求項5の発明で使用する関数の特許文献1の実施例1−3★

1.J中の最初の文M1を取り出す。最初の文が存在しない場合真を返す。
2.知識源全体Lに対して、Q1(M1,L)又はQ2(M1,L)を呼び出す。
結果が偽のときは
偽を返す。
真のとき
M1が変数を含まない場合
何もしない。
M1が変数を含む場合
とりうる束縛情報の集合C1を記憶する。
3.同様に、偽とならないうちはM2,M3・・・についてC2,C3・・・を求めていく。
偽となった場合は偽を返す。
4.残ったC1,C2,C3・・・Cnについて積集合Cを求めて、真(C)を返す。


(0047)
■問い合わせPに対する事実Sの多長一致解(複数も可)の列挙アルゴリズム仕様
=====================================================================================================================
呼出例
→関数F("$Aと$Bは友達だ","太郎と次郎と三郎は友達だ", "");
関数F(P:変数を含みうるパターン,S:定数文字列,C:変数の束縛情報):★特許文献1の請求項2の発明(ただし、「(又は最後)」と「又は前」を省いた実現例)で使用する関数の特許文献1の実施例1−4A★

(準備)
1.P中の変数の種類数Vと、出現する変数の名前N1,N2,・・・を出現順に求める

(Pがもともと変数を含まない場合への対応)
2.Vが0のときは、
⇒ P=Sのとき、真を返して終了。
⇒ P≠Sのとき、偽を返して終了。

(出力)
3.Vが1のときは、N1がP中に何回出現しようとも、PとSの単一化の解R1は1つしかないので、
⇒ マッチする場合、その唯一の解を「CかつN1=R1」として出力して、真を返して終了。
⇒ マッチしない場合、偽を返して終了。
※単一化そのものは、正規表現とのマッチ(同じ変数が二度以上出現する場合は後置参照あり)として実施可能

4.Vが2以上のとき
変数N1についての最長一致解R1で、P中の全てのN1を埋めてできるP’について 再帰呼び出しF(P’,S,CかつN1=R1)を実行
⇒ N1について最長一致解とした解集合が出力される

5.R1’←R1の最後の1文字を除いた文字列とし
P中の全てのN1をR1’で埋めてできるP’’について
再帰呼び出しF(P’’,S,CかつN1=R1’)を実行
⇒ N1について、最長一致解より1文字除いた解候補R1’とした解集合が出力される

6.R1’が
1文字以上の場合、(★特許文献1の請求項3では最短一致解の文字数より大きい場合)
⇒R1←R1’として5に戻る。
0文字の場合、(★特許文献1の請求項3では最短一致解の文字数である場合)
終了。


(0048)
関数F(P:変数を含みうるパターン,S:定数文字列,C:変数の束縛情報):★請求項4の発明で使用する関数の実施例1−4B★
//P中で変数が最初に出現した直後の固定文字列の最初の文字Cに着目して高速化の工夫その1をした関数F

(準備)
1.P中の変数の種類数Vと、出現する変数の名前N1,N2,・・・を出現順に求める

(Pがもともと変数を含まない場合への対応)
2.Vが0のときは、
⇒ P=Sのとき、真を返して終了。
⇒ P≠Sのとき、偽を返して終了。

(出力)
3.Vが1のときは、N1がP中に何回出現しようとも、PとSの単一化の解R1は1つしかないので、
⇒ マッチする場合、その唯一の解を「CかつN1=R1」として出力して、TRUEを返して終了。
⇒ マッチしない場合、偽を返して終了。

4.(高速化の工夫その2。この処理は5以降でカバーされるため省いてもよい。★この工夫2は、特許文献1の請求項にはしていない★)
Vが2以上のときで、
すべての変数(N1(=N),N2,・・・)について最長一致モードでマッチしてみた解と
すべての変数(N1(=N),N2,・・・)について最短一致モードでマッチしてみた解と
が同一(N1=R1,N2=R2,・・・)のとき
⇒ その唯一の解を「CかつN1=R1かつN2=R2かつ・・・」として出力して終了する
そもそもマッチしなかった場合、
⇒ 偽を返して終了。
同一でないとき
⇒ 5に続く

5.Vが2以上のとき
変数N1についての最長一致解R1で、P中の全てのN1を埋めてできるP’について 再帰呼び出しF(P’,S,CかつN1=R1)を実行
⇒ N1について最長一致解とした解集合が出力される

6.P中で変数N1の後すぐに変数N1(自分自身)が続くとき
⇒ 7以降で処理する
別の変数N2が続くとき
⇒ 7以降で処理する(ただし、7で1文字CはN2の解R2の最初の1文字とする)
固定文字が続くとき
⇒ 7以降で処理する

7.P中で変数N1が最初に出現した直後の固定文字である1文字C(直後が別の変数N2であるときはR2の最初の1文字C)が、
最長一致解R1に含まれる場合
⇒ 1)R1’←R1の文字列の最後からそのCにあたるまでの部分文字列を削除した文字列
⇒ 2)P’’←R1’でP中のすべてのNを埋めてできるパターン
⇒ 3)再帰呼び出しF(P’’,S,CかつN1=R1’)を実行
⇒N1について一段階だけ短めの解が存在すれば出力できるはず
最長一致解R1に含まれない場合
⇒ N1についてはより短い解の列挙が終わったので、終了。

8.R1←R1’として7に戻る。

=====================================================================================================================
In some examples described below, the above-mentioned functions peculiar to the present invention are additionally implemented in the embodiment of the following patent specification (above, excerpt from Patent Document 1) by the same inventor. Can be implemented. In addition, the following citation of Patent Document 1 also includes a supplementary purpose in terms of feasibility and inventive step of the present person.

===
<Problems of Patent Document 1> It is possible to automatically process knowledge expressed in the form of embedding variables in natural language on a computer in the same way as PROLOG, and comprehensive deduction and solution search (automatic unification processing) at the predicate logic level. , Automatic derivation processing, backward inference for that, backtrack).
Make full use of the advantage that variables are not tied to the case structure, speed up processing, and display the results in an easy-to-read manner for proof and learning.
<Solutions for Patent Document 1 (Overview)>
When a human inputs a "fact", "rule" or "goal" in PROLOG, the constant part and the variable part of the content corresponding to "literal" in PROLOG are input to the computer separately by the character type, delimiter or escape character.
The computer treats variables as being able to straddle boundaries such as the main part and predicate of a sentence, and performs automatic unification processing, automatic derivation processing, or both of the sentences included in the input.
The pattern, which is a statement that can contain variables, and the constant character string, which is a statement that does not contain variables, are unified. For each new pattern that can be created by substituting the process of scraping from the back until it becomes an empty character, each state of the solution of the scraping process that was the premise that the new pattern can be created is stored in the same way recursively. Repeat until there are no variables, and combine the states of each intermediate solution that was unified when there are no variables to obtain the answer for each unification.
Detects whether the fixed character string in the pattern is included in the character string in the process of removing the longest matching solution, and speeds up.
Pattern-to-pattern unification is accelerated by focusing on the matching of the beginning and end of words. A concrete method of full search is also provided.
<Solutions for Patent Document 1 (full text, but some additions / corrections so as not to be confused with the present invention)>
(0009)
The present invention has been made in view of such a problem, and claim 1 of Patent Document 1 is set forth in claim 1.
A method in which a computer automatically performs some or all of the functions of the logical programming language PROLOG.
When a human inputs a "fact", "rule" or "goal" in PROLOG, the constant part and variable part of the content corresponding to "literal" in PROLOG (hereinafter referred to as "sentence") are character types, delimiters or escape characters. Input to the computer separately by
The above "facts", "rules" or Performing automatic unification processing, automatic derivation processing, or both of the sentences included in the input of "goal",
Provide a processing method characterized by.
Here, "human beings input the constant part and the variable part into the computer by distinguishing them by the character type, the delimita or the escape character" means that the human beings input in the input field of the application software (processing system) according to the present invention. Input directly after the command prompt (with or without a front-end processor, etc.), copy-paste or cut-paste from an Internet browser, text editing software, etc., or a text file that has been input and saved separately. Etc. are included in reading, quoting, referencing, etc.
In addition, "the computer treats variables as those that can cross the main part, predicate, subject, predicate, object, particle, conjunctive modifier, conjunctive modifier, or sentence boundary of a sentence" means Japanese, etc. It can only straddle the boundaries (explicit delimiters) of case structures (including those that correspond to the hierarchical structure of parsing results and semantic analysis results) with explicit delimiters via particles, etc. and predicates such as English. Instead, it can straddle the boundaries between S and V, the boundaries between V and O, the boundaries between V and C, etc. Includes modes that are treated as possible (conversely, some modes are not treated). In these cases, as solution candidates that can be included in variables, an arbitrary sub-character string is extracted from the entire sentence or the character string that composes the entire sentence, ignoring the unit of delimiter by the grammatical structure as the sentence, and further, the hierarchy. The whole of compound sentences / double sentences with a typical reference structure, longer papers, etc., and any substrings of them are targeted (note that it is a case where "sentence boundaries" are treated as possible. When dealing with a set of knowledge sources (for example, reading, writing, referencing, etc., a set of knowledge sources in a file), it is necessary to separate the knowledge sources at "other than" the sentence boundary. Therefore, for example, a line feed code, a tab code, or the like can be used as such a delimiter).
As a result, knowledge and information expressed in the form of embedding variables in natural language and knowledge and information in the ordinary sentence format are unified knowledge that opens up the possibility of realistic mutual utilization between them. As a source, it becomes possible to automatically process the two by a computer without distinguishing between them (overcoming the above-mentioned "difficulty A").
In order to open up the possibility of "realistic" interaction "sufficiently", automatic processing by a computer should be provided as a search processing system. 1) Convenience of search formulas (expressions that specify patterns), 2) Sufficient The precision rate (accuracy of the solution), 3) the sufficient recall rate (comprehensiveness in extracting solution candidates) must be provided, but in the present invention, the sentence is free (that is, the grammar and meaning). While allowing the embedding of variables (multiple types or multiple times) in places (not limited to delimiters) (ensuring convenience), it is basically based on PROLOG's knowledge processing procedure (and underlying knowledge interpretation policy). By following this, the risk of reduced precision (solution accuracy) that can occur due to hybrid knowledge processing procedures (and complex knowledge interpretation policies corresponding to the hybrid processing procedures) as in other processing systems is avoided. At the same time, by "treating variables as those that can straddle the main part, predicate, subject, predicate, object, complement, conjunctive modifier, conjunctive modifier, or sentence boundary of a sentence", the delimiter expression of natural language ( Unjustified disagreement (regular expression) caused by the appearance of crying of specified patterns by reading points, punctuation points, parentheses, commas, periods, etc.) and modifier phrases (advocacy phrases, complement phrases, non-essential case expressions, etc.) Unmatching) is prevented, and a certain degree of reproducibility (comprehensiveness in extracting solution candidates) can be ensured between superficial character string expressions (between search expressions and knowledge sources) where the case structure is not specified. In addition, it is possible to perform integrated and continuous quoting / extraction (as a solution candidate to a variable) that does not easily impair the exact context (character strings before and after) of the natural language that became the source of knowledge, and in the end, its transparency. The simplicity makes it easy and easy to confirm and verify the substantial soundness of the reasoning (the validity of the grounds and the reasoning process), and gives the user a realistic sense of security that the grounds are always clear. Take full advantage of the specification that variables are not tied to the case structure (and you don't have to know about the rules of the case structure (such as the order of appearance) and you don't have to worry that the order of the arguments may be wrong). Allows you to cut.
Since the first object of the present invention is Japanese (the amount of information in one character is large and there is no space between words), there are many contents in which characters are used as processing units and delimiter units, but English and the like. (The amount of information in one character is small, the number of characters in one sentence is large, but there is a space between words), it is possible to perform the same processing in units of words separated by spaces.
(0010)
Further, claim 2 of Patent Document 1 is
In the automatic unification process
Unification of a pattern that is a sentence that can contain variables (a constant part and a variable part are distinguished by a character type, a delimiter, or an escape character) and a constant character string that is a sentence that does not contain variables.
Find the longest matching solution (eg Taro and Jiro) of the variable (eg $ X) that appears first (or last) in the pattern (eg $ X and $ Y like $ Z) and find the longest matching solution. Each new pattern (example: Taro and Jiro> Taro and Jiro> Taro and Jiro> Taro and>Taro>Ta> Sky) that can be created by substituting the process of cutting the character string from the back (or front) to the empty string : "Taro and Jiro and $ Y like $ Z">"Taro and Jiro and $ Y like $ Z">"Taro and Jiro and $ Y like $ Z">"Taro and $ Y like $ Z""Ilike">"Thick and $ Y like $ Z">"And $ Y like $ Z"), each state of the solution of the shaving process that was the premise that the new pattern can be created ($ X = While memorizing Taro and Jiro> Taro and Jiro> Taro and>Taro>Ta> Sky)
Recursively repeat until there are no more variables,
The state of each solution that was unified when the variables disappeared (example: true ($ X = Taro and Jiro, $ Y = Saburo), true ($ X = Taro, $ Y = Jiro and Saburo)) Characterized by combining and obtaining answers for each unification (example: answer 1 = ($ X = Taro and Jiro, $ Y = Saburo), answer 2 = ($ X = Taro, $ Y = Jiro and Saburo)) The processing method according to claim 1 of Patent Document 1 is provided.
Here, "(or last)" corresponds to "(or before)", and when substituting from the variable that appears last, it means that the start of scraping must be from the front.
This makes it possible to verify the state of each solution candidate that reliably covers all possibilities from the longest matching solution to the shortest matching solution, and to provide a comprehensive answer (a set of further narrowed solution candidates). It will be possible.
(0011)
Further, claim 3 of Patent Document 1 is
The processing method according to claim 2 of Patent Document 1, which is characterized in that instead of gradually cutting until it becomes an empty string, it gradually cuts only to the shortest matching solution obtained separately.
As a result, it is possible to save the calculation of the solution search from the length less than the shortest matching solution to the "empty" character, and it may be possible to speed up the automatic processing.
(0012)
Further, claim 4 of Patent Document 1 is
When gradually scraping until it becomes an empty string
If one character C (immediately after (or immediately before)), which is a fixed character immediately after (or immediately before) the variable first appears (or last) in the pattern, is another variable and the solution is not an empty string, the variable is changed to the other variable. When the first (or last) character C) of the solution candidate assigned as the solution candidate is included in the longest matching solution,
The processing method according to claim 2 or 3 of Patent Document 1, wherein the substring from the end (or the beginning) of the character string of the longest matching solution to the first character string corresponding to the C is deleted including the C. offer.
Here, "(or last)" corresponds to "(or just before)", and when substituting from the variable that appears last, it means that the start of scraping must be from the front.
As a result, it is possible to save the enumeration of solution candidates that do not match the fixed characters immediately after (or immediately before) the variable and the search based on the solution candidates, and it may be possible to speed up the automatic processing.
(0013)
Further, claim 5 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When requesting binding information that becomes the "goal" (including "sub-goal"; the same applies hereinafter)
Any one of claims 1 to 4 of Patent Document 1 that independently obtains binding information for each sentence constituting the "goal" and returns the return value true and the intersection of the bound information when the product set of each bound information is not empty. The processing method described in the section is provided.
Here, the binding information is information indicating whether or not such a solution candidate has been assigned to each variable at the same time. The binding information that indicates one binding method for each variable is "variable name 1 = value 1, variable name 2 = value 2, ..., variable name N =" by interpreting "," as an AND combination. While it can be expressed in a list format such as "value N", multiple bindings can be expressed as a set of such lists, or as a common part between multiple bindings by explicitly specifying an AND / OR combination instead of ",". It can be expressed in the form of a combination, or in the standard form of conjunctive words or the standard form of selection, which standardizes the whole of multiple bindings.
As a result, in the case of a problem form in which there are multiple patterns (sentences) to be satisfied at the same time, and variables with the same name should have the same solution among the patterns (sentences) (for example, such an AND join query from the user, (When there are multiple sentences in the body part of the rule), there is less possibility that a large amount of full-text search processing will be unnecessarily repeated for each unification result of the pattern on the left side of the pattern on the right side of the rule. It is possible to avoid the inefficiency of depth-first search while backtracking the part (more remarkable inefficiency in the form of embedding variables in natural language), and to simplify the processing for each pattern to be satisfied at the same time. It also makes the display and verification (completeness and soundness) of the inference process easy to understand. In addition, it is possible to prevent the ordering (between sentences in the body part), which is unnecessary for the intuition required as the meaning of the rule and should not be defined, to have a side effect on the inference process.
(0014)
Further, claim 6 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When requesting the binding information that is the "goal"
Empty the existing binding information first,
The sentence set contained in the "goal" is automatically calculated for whether the sentence can be true under the application of the existing binding information and the additional binding information for the possible binding information, and the additional binding information is used as the existing binding information. While adding, the sentence is recursively reduced except for the sentence.
The processing method according to any one of claims 1 to 4 of Patent Document 1 is provided in which the existing binding information when the sentence set becomes an empty set as it can be true is used as the binding information that becomes the "goal". do.
Here, "recursively reduce" means that the deeper the recursion, the smaller the statement set and the more complicated the binding information (more variables are bound, and the range of bound values is narrowed). For example, it means to realize equivalent recursive processing by a process of making a recursive call in C language or a stack structure (structure array and stack pointer, etc.) for depth priority search originally declared and defined.
This simplifies the problem of automatically processing an open question consisting of multiple patterns of AND combinations to be satisfied at the same time, expressed in the form of embedding variables in natural language, into a simpler and recursive partial problem with the same structure. Transform to facilitate the display and verification (completeness and soundness) of the inference process.
(0015)
Further, claim 7 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When unifying the non-variable pattern with the non-variable fact
The processing method according to any one of claims 1 to 6 of Patent Document 1, which returns true when the pattern and the fact match as a character string, or returns false when the pattern and the fact do not match as a character string. offer.
As a result, the search can be performed simply and quickly.
When "facts that do not include variables" include multiple sentences separated by punctuation marks. The "match as a character string" may be provided with a mode in which the character string of the pattern may match a part of the actual character string.
As a result, a plurality of pieces of information of the same type can be collectively expressed as one fact and used as a search target. It also makes it easier to express some order between multiple elements (eg, size, preciousness, antiquity, etc.).
(0016)
Further, claim 8 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When unifying the pattern that does not include variables and the head part that does not include variables in the horn clause,
When the pattern and the head portion match as a character string, the result of applying the processing method according to claim 5 or 6 of Patent Document 1 with the body portion of the horn clause as a subgoal is returned.
The processing method according to any one of claims 1 to 7 of Patent Document 1, which returns false if they do not match, is provided.
This explains the sound mechanical interpretation when the head of the rule that expresses the variable in the form of embedding it in natural language does not include the variable, the seamless, easy-to-understand, simple and unified processing mechanism, and the corresponding inference process. Can be given.
(0017)
Further, claim 9 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When unifying a pattern that does not contain variables and a horn clause that has a head that contains variables,
Obtained by processing using the pattern as the "constant character string" in the processing method according to any one of claims 2 to 4 of Patent Document 1 and using the head portion as the "pattern" in the same processing method. About each binding information
If there is a true result of processing the one applied to the body portion of the horn clause as a "subgoal" of the processing method according to claim 5 or 6 of Patent Document 1, the true value is returned or exists. Provided is the processing method according to any one of claims 1 to 8 of Patent Document 1, which returns false if not.
As a result, when the head of the rule that expresses the variable in the form of embedding it in natural language contains the variable and the pattern that invokes this rule does not contain the variable, the bound range of the variable in the body part is limited in advance, and it is true. The processing of false judgment can be speeded up.
It can also provide a sound mechanical interpretation, a seamless, easy-to-understand, simple and unified processing mechanism, and an explanation of the corresponding inference process.
(0018)
Further, claim 10 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When unifying patterns with variables and facts without variables
The result of processing using the pattern as the "pattern" in the processing method according to any one of claims 2 to 4 of Patent Document 1 and using the fact as the "constant character string" in the same processing method. return,
The processing method according to any one of claims 1 to 9 of Patent Document 1 is provided.
As a result, all solution candidates (to case variables) between the pattern and the (static) facts are identified and returned as "results", which is the basis for overcoming the above "difficulty A". A simple mechanism can be given, facilitating not only visualization and verification of the inference process, but also learning through the user's hands such as rule modification.
(0019)
In addition, claim 11 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When unifying the pattern containing variables and the horn clause having a head part not containing variables,
The result of processing using the pattern as the "pattern" in the processing method according to any one of claims 2 to 4 of Patent Document 1 and using the head portion as the "constant character string" in the same processing method. The binding information (C) is true, and the binding information is true when the result of processing the body portion of the horn clause as a "subgoal" of the processing method according to claim 5 or 6 is true. Return true with (C),
The processing method according to any one of claims 1 to 10 of Patent Document 1 is provided.
As a result, all solution candidates (for each variable) between the pattern containing variables and the head (static without variables) are identified and returned as "results". Therefore, the above "difficulty A" The basic mechanism for overcoming it can be simply given, facilitating not only visualization and verification of the inference process, but also learning through the user's hands such as modifying rules.
It also simply transforms into a simpler and recursive (or mutual recursion) subproblem with the same structure, facilitating the display and verification (completeness and soundness) of the inference process.
In addition, a sound mechanical interpretation when the head of the rule that expresses the variable in the form of embedding it in natural language does not include the variable, a seamless, easy-to-understand, simple and unified processing mechanism, and the inference process corresponding to these. An explanation can be given.
(0020)
Further, claim 12 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When unifying the pattern containing variables and the horn clause having a head part containing variables,
Returns false if the number of fixed characters existing in the pattern and the head, tail, or both of the head does not match.
The processing method according to any one of claims 1 to 11 of Patent Document 1 is provided.
As a result, compared to a uniform search, it is possible to clearly save a large amount of calculation and improve the processing speed.
(0021)
In addition, claim 13 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When unifying the first pattern containing variables and the horn clause having a head part containing variables,
When the pattern matches the fixed characters for the number of characters existing at the head and tail of the head part,
Each binding information obtained by binding the head portion of the horn clause with each binding information for which the result of applying the body portion of the horn clause as a "subgoal" in the processing method according to claim 5 or 6 of Patent Document 1 is true. About the second pattern
If the second pattern does not contain variables
Processing was performed using the first pattern as the "pattern" in the processing method according to any one of claims 2 to 4 of Patent Document 1 and using the second pattern as the "constant character string" in the same processing method. Returns the result,
The processing method according to any one of claims 1 to 12 is provided.
Here, "when the second pattern does not contain variables" means that in the horn clause (rule), all the variables included in the head part are also included in the body part "also", and all the variables in the body part are included. As a result of the variables being bound by constants (fixed character strings), all the variables in the head part are also bound (assigned) by constants (fixed character strings), so the variables in the head part disappear and the head part becomes a constant character string. It means that it can be regarded.
As a result, the unification of the pattern including variables and the horn clause (rule) having a head portion including variables can be mechanically and automatically performed in a flow that is easy for the user to trace by using a simple calculation model.
That is, all solution candidates (those that should be assigned to each variable of the pattern) between the pattern containing the variable and the head part that does not include the variable (by each binding information) (= constant character string) are identified and " By reducing the original more complicated problem (variable-to-variable unification) (transforming the problem) into the form returned as a "result", the basic mechanism for overcoming the above "difficulty A" is simplified. It is made easy to express as a giving and thinking process. In addition, in this "reduction (conversion of the problem)", it is simply converted into a partial problem with the same structure that is simpler and recursive (or mutual recursion), so that the inference process is visualized and verified (completely). It facilitates learning through the user's hands, such as modifying rules as well as (of sexuality and soundness). After all, a sound mechanical interpretation when the head of the rule that expresses the variable in the form of embedding it in natural language contains the variable, a seamless, easy-to-understand, simple and unified processing mechanism, and an explanation of the inference process corresponding to these. Can be easily given.
(0022)
In addition, claim 14 of Patent Document 1 is
The processing method according to any one of claims 1 to 13 of Patent Document 1, wherein the computer restricts the input of facts including variables.
Here, the facts including variables (knowledge sources that are not rules) include, for example, "$ X is $ X" (tautologically tautological fact) and "$ X is $ Y" (. There is no basis for truth if only the superficial sentence patterns match).
By limiting the input of these to the computer, the calculation of the automatic unification process of patterns (sentences that can contain variables) and facts (sentences that do not contain variables (= fixed character strings)) becomes simple. , High-speed answer is possible by automatic processing. It also makes it difficult to mix unfounded facts into knowledge sources.
(0023)
In addition, claim 15 of Patent Document 1 is
The rule has a form similar to the so-called horn clause, and any one of claims 1 to 14 of Patent Document 1 is characterized in that the computer restricts the head portion from including a variable that does not appear in the body portion. The processing method described is provided.
Here, "the computer restricts the head part from including variables that do not appear in the body part" means that the head part is "$ X is nice" and the body part is "$ Y is strong, $ Y is $". Even if the variables in all the sentences in the body part ($ Y and $ Z in this example) are bound (assigned), such as "Z-friendly, $ Z is a child, $ Y is smart", the variables in the head part In this example, it means that the computer restricts the input, storage, and activation of rules that leave ($ X) unbound as a source of knowledge. Such a rule leads to leaving unbound variables in the head, as in the case of facts, which tends to produce unhealthy inference results and slows down inference.
By restricting the input of such rules to the computer, the pattern (sentence that can contain variables) and the head part (sentence that does not contain variables (= fixed character string) according to claim 13 of Patent Document 1) can be combined. The calculation of the automatic unification process with (reducible) is simplified, and high-speed answering by the automatic process becomes possible. It also makes it difficult to produce unfounded inference results.
(0024)
In addition, claim 16 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
Automatic unification of patterns and heads or facts with unbound variables remaining in each other,
The processing method according to any one of claims 1 to 13 of Patent Document 1, which is performed by obtaining and returning a set of solutions which is a minimum as a fixed character string, is provided.
Here, as an example of "a set of solutions that are minimal as a fixed character string", as a result of automatic unification between "$ A is $ B" and "$ C is also $ D", {($) A = "mo", $ B = <empty>, $ C = <empty>, $ D = "is"), ($ A = empty, $ B = "also", $ C = "is", $ D = Empty)} may be provided.
This makes it possible to provide an example of a solution (especially the smallest simple example) even when there are an infinite number of solutions.
(0025)
In addition, claim 17 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
Automatic unification of patterns and heads or facts with unbound variables remaining in each other,
It is characterized by finding and returning a set of solutions that is the minimum as a character string containing variables.
The processing method according to any one of claims 1 to 13 of Patent Document 1 is provided.
Here, as an example of "a set of solutions that are minimal as a fixed character string", as a result of automatic unification between "$ A is $ B" and "$ C is also $ D", {($) A = "$ C also", $ B = <free>, $ C = <free>, $ D = "is $ B"), ($ A = <free>, $ B = "also $ D", $ It may provide two solutions such as C = "$ A is" and $ D = <free>)}. It is considered that the total (through the solution) of the character string length of the value that binds the variable (the value assigned to the variable) (however, if the variable is included, it is regarded as one character per occurrence of the variable) is minimized. be able to.
This makes it possible to provide a general form of a solution even when there are an infinite number of solutions.
(0026)
In addition, claim 18 of Patent Document 1 is
When the fixed characters for the number of characters that are common to the beginning and tail of each character string of the head part or fact and the pattern in which unbound variables remain are not the same.
Characterized by returning false,
The processing method according to claim 16 or 17 of Patent Document 1 is provided.
As a result, automatic search that cannot be unified can be saved, and automatic processing can be speeded up.
(0027)
In addition, claim 19 of Patent Document 1 is
When finding a set of solutions that is minimal as a character string containing the fixed character string or variables,
Each variable contained in both character strings (the first character string and the second character string) consisting of a pattern and a head part or a fact in which unbound variables remain in each other is bound in common within each character string. And while being bound independently between strings (or, the scope for binding variables with the same name in common is only within each string (or between strings is outside the scope of the variable)).
For each variable, any substring (<empty>) of the other string (the second string for the variable in the first string, the first string for the variable in the second string) and It is characterized by finding a set of solutions that is the minimum by a full search to find a case where both character strings match by substituting itself (including the entire character string).
The processing method according to claim 16 or 17 of Patent Document 1 is provided.
"Or substitute yourself ..." means to substitute "$ X" itself for "$ X" in the character string, and it happens to be in the first character string or the second character string. When $ X (the scopes of each are different) is included, the first character string $ X and the second character string $ X can be distinguished (for example, "$ X1" and "$". Clearly sound calculations can also be made by substituting (as X2 ”, etc.).
As a result, it is possible to secure a certain degree of completeness of the solution set (completeness depending on the nature of the problem (pattern pair)) while ensuring soundness and stoppage (finiteness of calculation).
(0028)
Further, claim 20 of Patent Document 1 is
Not the two strings themselves, which consist of patterns and heads or facts with unbound variables remaining in each other
Both character strings corresponding to the two character strings that remain after excluding the fixed characters for the number of characters that are common to the beginning and tail of each character string of the pattern and the head part or fact where unbound variables remain in each other. about,
A processing method for performing the processing according to claim 19 of Patent Document 1 is provided.
As a result, the space for the entire search can be reduced while maintaining a certain degree of completeness (in some cases, completeness) of the solution set, and the processing speed is increased.
For example, as a process of automatic unification between "Ishikawa's $ A likes $ B." And "Ishikawa's $ C also likes $ D ice cream." Delete the common part of "$ A is $ B"
And "$ C is also $ D ice cream"
Then, by full search, all substrings of "$ C is also $ D ice" for "$ A" and "$ B" (this is a variable such as $ C and $ D ($ {... (The same applies to variables in the form of}) is 6 characters if it is 1 character, so while substituting 6 x (6 + 1) / 2 + 1 (<empty> minutes) + 1 (substringing itself) = 23 ways) , Similarly, all substrings of "$ A is $ B" for "$ C" and "$ D" respectively (since this is also 3 characters, 3 x (3 + 1) / 2 + 1 + 1 = 8 ways When both character strings match (for example, (for example)
"Moha ice cream",
"Hamo ice cream",
"$ A is ice cream",
"$ C is also ice cream",
"$ A is also $ D ice cream"
* By the way, the set of substitution sets when "$ C and $ B ice" do not match) {
($ A = "also", $ B = "ice", $ C = <empty>, $ D = "is"),
($ A = <empty>, $ B = "also ice", $ C = "is", $ D = <empty>),
($ A = "$ A", $ B = "also ice", $ C = "$ A is", $ D = <empty>),
($ A = "$ C also", $ B = "ice", $ C = "$ C", $ D = "is"),
($ A = "$ A", $ B = "also $ D ice", $ C = "$ A is", $ D = "$ D")} or a set of partial substitutions for each assignment set (eg, $ D = "$ D")} {
($ A = "also", $ B = "ice"),
($ A = <empty>, $ B = "also ice"),
($ A = "$ A", $ B = "also ice cream"),
($ A = "$ C also", $ B = "ice"),
($ A = "$ A", $ B = "also $ D ice cream")
})
Can be answered as a solution.
Note that $ A = "$ A" and $ B = "also $ D ice" can be freely $ A and $ D, and can be unified by substituting any character string there (that is,). It is possible to show that there are infinite solutions and how the constraints (regular expression form) of the infinite number of solutions (character strings) should be. (0029)
In addition, claim 21 of Patent Document 1 is
Substitute any substring (including <empty> and the entire string) of the other string for each variable, or try to find a case where both strings match. When asking
When a variable is included in the substring to be assigned to a variable, the variable contained in the substring is replaced with a new variable that did not previously exist in both strings, and the same assignment to the new variable is made. The processing method according to claim 19 or 20 of Patent Document 1, further comprising performing a full search for a case where both character strings match while performing recursively.
As a result, it is necessary to search for a solution in which a fixed character in the own character string is reflexively assigned to a variable in the own character string via a variable in the other character string (for example, both character strings = { In the case of "$ X is $ X", "i $ Yu"}, it is necessary to be able to enumerate ($ X = "say", $ Y = "uye") as solution candidates). It is possible to improve the completeness of the solution candidate enumeration while maintaining the soundness. In the above example, both character strings (also called "pattern pair") = {"$ X is $ X", "i $ Y u"} to ($ X = "say", $ Y = "u yes") According to the present invention, it is possible to recursively search for the solution candidates ($ X = "i $ {Y1} u") ⇒ ($ {Y1} = <empty>) ⇒ ($ Y = "uye"). It can be shown by being able to generate branches (which are part of a search tree and can be generated in a finite number of times in the case of breadth-first search according to the present invention).
“Recursively ... full search” means, for example, a matching substitution sequence while performing a breadth-first search that recursively repeats each possible assignment to each variable (same as the claim of the previous patent document 1). (For example, the above ($ X = "i $ {Y1} u") ⇒ ($ {Y1} = <empty>) ⇒ ($ Y = "uye"), etc.) are listed. The first variation of the assignment is if the types of variables in both strings are 2 and 3 respectively and the length of the string is 6 and 7 characters respectively (variables are collectively counted as 1 character). 2 pieces x (7 x (7 + 1) / 2 + 1 + 1) + 3 pieces x (6 x (6 + 1) / 2 + 1 + 1) = 60 + 69 = 129 ways. When performing a breadth-first search so that the maximum depths of further branches derived from these branches are even, a limiter (program step to compare with the upper limit value, etc.) is provided according to the number of substitutions, etc., so that each search is performed once. Can be limited to an appropriate amount of calculation (ensuring stoppage and response speed that are no longer guaranteed by reflexivity). Even in the case of a depth-first search, the amount of calculation can be limited by limiting the depth, the number of substitutions, and the like. In each case, an infinite loop by self-recursive or mutual recursion is provided, and a stack structure (array of structures) that manages recursive function calls is provided, and call parameters (its substitution series) of branches that are ancestors (more root direction). (It may include the state representation of both character strings according to (assignment context)) can be avoided by comparing it with the current calling parameter. In addition, it is possible to prun the branches that cannot be unified depending on whether or not the fixed character strings existing at the beginning and the end of both character strings match the number of characters existing in common. If a solution is not found by searching with a limited amount of calculation (for example, 1 million substitutions or search depth within 20), it is found as "no solution (accuracy: 1 million substitutions and search depth within 20)". In that case, as "($ X =" say ", $ Y =" yes "), (...), ... (However, accuracy: 1 million substitutions and search depth within 20)", etc. It is also possible to answer the user while clearly indicating the search accuracy. In addition, if the entire search can be clearly performed within the limit number of substitutions and within the limit search depth (when there is completeness), "no solution (completely searched)" or "($ X =") to that effect. It is also possible to answer the user by clearly stating ", $ Y =" yes "), (...), ... (all searched)".
(0030)
In addition, claim 22 of Patent Document 1 is
As for the result of assigning to the variable, the two character strings that remain after removing the fixed characters for the number of characters that are common to the beginning and end of each character string from both are
As the "other party's character string" that is the target of "any substring of the other party's character string (including <empty> and the entire character string)", it exists at the beginning or end of the character string as the search progresses. Characterized by reducing the number of fixed characters,
The processing method according to any one of claims 19 to 21 of Patent Document 1 is provided.
As a result, the number of branches decreases as the search progresses (the further the branch goes), and the amount of calculation can be saved.
(0031)
In addition, claim 23 of Patent Document 1 is
When finding a set of solutions that is minimal as a character string containing the fixed character string or variables,
Each variable contained in both character strings (the first character string and the second character string) consisting of a pattern and a head part or a fact in which unbound variables remain in each other is bound in common within each character string. And while being bound independently between strings (or, the scope for binding variables with the same name in common is only within each string (or between strings is outside the scope of the variable)).
It is a processing method to find a set of solutions by recursively substituting a fixed character string (including an empty string) or a character string containing a variable into each variable.
Limit the variables to be assigned to the variables at the beginning or end of the own character string whose head or tail is a fixed character.
The substitution value is a new variable or <empty> following the fixed character or fixed character string of the head if it is the head, and a fixed character or fixed character string of the tail following the new variable if it is the tail. Or <empty>
For the result of assigning to the variable, the fixed characters for the number of characters that are common to the beginning and the end of each character string are repeatedly removed from both.
The processing method according to claim 16 or 17 of Patent Document 1 is provided.
This makes it possible to significantly limit the enumeration range of solutions (without impairing the completeness of the search) by focusing on the existence of fixed characters at the beginning and tail, which enables significant computational complexity savings and speedup. Become. (0032)
In addition, claim 24 of Patent Document 1 is
When finding a set of solutions that is minimal as a character string containing the fixed character string or variables,
Each variable contained in both character strings (the first character string and the second character string) consisting of a pattern and a head part or a fact in which unbound variables remain in each other is bound in common within each character string. And while being bound independently between strings (or, the scope for binding variables with the same name in common is only within each string (or between strings is outside the scope of the variable)).
It is a processing method to find a set of solutions by recursively substituting a fixed character string (including an empty string) into each variable.
Binds the binding information that can be created using only the fixed character types (character types excluding variable identifiers and delimiters) in both character strings that can be created by excluding the common fixed characters for the number of characters that exist at the beginning and end of each character string. The processing method according to claim 16 or 17 of Patent Document 1, which is obtained by enumerating the values in ascending order from the one having the smallest total character string length.
As a result, problems with certain properties can be efficiently reached and listed.
(0033)
Further, claim 25 of Patent Document 1 is
Based on the obtained "set of solutions that is the minimum as a character string containing variables"
The processing method according to claims 19 to 24 of Patent Document 1 is provided, in which the search is continued by the horn clause that can temporarily rewrite the variable of the horn clause with a character string including the variable.
As a result, it is calculated that the pattern and the head part of the horn clause (rule) are required to be unified (in the above example, the variable "$ C" is in the form of "$ A is". There is also a unification policy (for example, in the case of the last assignment set above) in which the constraint that it can be unified only by being bound (assigned) by a character string works), in the body part of the horn clause. It can be propagated to the search process and the search can be streamlined.
(0034)
In addition, claim 26 of Patent Document 1 is
Based on the obtained "set of solutions that is the minimum as a character string containing variables"
A set of fixed character strings that can be created by substituting each element of the set of fixed character strings defined in advance as the set of solutions of the "facts containing variables" into the variable part of the "character string containing variables". return,
The processing method according to any one of claims 19 to 25 of Patent Document 1 is provided.
As a result, a database (for example, "word equation (registered trademark)" and "VLANK (registered trademark)" that links facts containing variables (one or more) and a set of appropriate answers (or hypotheses) that can be filled in the variables (for example) It is possible to search for a solution in an efficient manner with the knowledge source in "". In addition, a large number of facts having similar sentence patterns can be efficiently managed in cooperation with the framework of the present invention.
(0035)
In addition, claim 27 of Patent Document 1 is
In the automatic unification process or the automatic derivation process
When performing automatic unification between the first pattern containing variables and the second pattern containing variables,
When the fixed characters for the number of characters existing at the beginning and tail of both patterns match, and the same variable appears only once in each pattern
Returns information that means the existence of an infinite number of solutions,
The processing method according to any one of claims 1 to 26 of Patent Document 1 is provided.
(0036)
In addition, claim 28 of Patent Document 1 is
Provided is an apparatus for carrying out the method according to any one of claims 1 to 27 of Patent Document 1.
(0037)
In addition, claim 29 of Patent Document 1
Provided is a computer program for causing a computer to execute the method according to any one of claims 1 to 27 of Patent Document 1.
(Effect of Invention of Patent Document 1)
(0038)
The effects of the present invention are as described above with respect to the claims of each Patent Document 1.
(Brief description of drawings of Patent Document 1)
(0039)
(Fig. 1) Fig. 1 is an overall view of a network system in which the present invention is most effectively implemented. (Example 1)
FIG. 2 is an explanatory diagram showing a hardware configuration of a computer for carrying out the present invention. (Example 1)
FIG. 3 is an explanatory diagram showing an example of screen display in a terminal for carrying out the present invention.
(Example 1)
(Form for carrying out the invention of Patent Document 1)
(0040)
The present invention can be carried out on all kinds of computers connected / not connected to a network (cloud server, large general-purpose machine, desktop PC, notebook PC, mobile terminal, dedicated machine of the present invention), but it is general. The description will be given in a form realized by a PC connected to the Internet, which has a multitasking function and a window function.
FIG. 1 is an overall view of the network system that most effectively implements the present invention, and the content management device 1 is a content (rule or fact) handled by the user PC2 or the user / administrator PC2 in the present invention. A well-known file sharing server that accepts posts and distributes content while controlling sharing access rights and content provision priorities according to a predetermined policy may be used. The user PC2 inputs and stores content (rules and facts) expressing the content (or content to be examined) in natural language for each user according to the method of the present invention, and stores the content (rules and facts) according to the method of the present invention. Computers, mobile terminals, etc. that process.
FIG. 2 is an explanatory diagram showing a hardware configuration of a computer used in the present invention. This is a general configuration of a computer, and a feature of the present invention is a process processed by the CPU 2e using a natural law according to the instructions and descriptions of the program 3 and the content data 4 stored in the non-volatile memory 2h. It is in the content of and the way of the dialogue protocol (format) with the user.
FIG. 3 is an explanatory diagram showing an example of screen display in a terminal for carrying out the present invention. In the figure, in response to the question "? $ A not done" (open question format), "$ A =" is used by using the fact that "do not do anything unpleasant" in the first line of the memorized list L (not shown).
I enumerate the answers "as much as possible / 1 /" and answer "$ A = bullying / 9 /" using the fact that "do not bully" on the 9th line of the list L.
(0041)
In such an embodiment, a computer program manufactured via C ++ language or the like can cause a computer (PC or the like) to perform all possible operations. Therefore, known basic operations of computers using the laws of nature (storage / retrieval to registers, memory, and storage, four-rule operations, comparison, etc.) and general functions that have already become standard libraries for development environments, etc. (Assignment / comparison / copy to variables and N-dimensional arrays, operation / comparison / display of character strings and numerical values, operations such as list structure / queue structure / hash structure / vector type, binary search and sort operations, by regular expression The method of realizing the pattern matching operation, network communication operation, etc.) is different from the essence of the present invention (unique configuration leading to novelty and progress) and is well known to those skilled in the art, and will not be described in detail. .. On the other hand, what kind of operation order and storage method (algorithm and data structure) is used to realize the processing peculiar to the present invention by combining such general functions will be described in detail below. By providing an explanation of this algorithm, etc., an explanation of the above-mentioned problem-solving means, and an explanation of the drawings of the present invention for reference in development, a standard-level professional programmer can use standard application program development techniques ( It is possible to make a computer carry out the method of the present invention by using a GUI application integrated development environment by C ++, etc., and it is also possible to create a device or a program for this method.
(0042)
The algorithm shown below is an algorithm based on standard structured programming in which a desired "function" is newly defined using C language / C ++ language or the like and then a function call is made. A processing means (program) corresponding to the solution means of the present invention while performing input / output and function separation according to the function division of each of the following functions (or by coding the function group as it is according to the specifications shown below). And a computer) can be realized.
(0043)
■ Processing algorithm specifications of knowledge list L for inquiry P
================================================== ================================================== =================
Function Q1 (P: pattern that can include variables, L: knowledge list): ★ Example 1 of Patent Document 1 of the main function common to the claims of Patent Document 1 ★
{
1. 1. Extract the content B (fact or Horn clause) of the first line of L.
However, if L is empty (if the first line could not be retrieved), a false output is output and the process ends.
2. The initial value of the variable binding information C is emptied, the following function H (P, B, C) is called, and the true (= matching) binding information (= solution set) C is output.
When true (= matched) True (yes) is output (the line number of the matched content B is also output).
If false, do nothing.
3. 3. If there is a content B'on the next line of L-Set B ← B'and move to 2.
If not ・ If true is never output in 2, false (no) is output.
·end.
}
(0044)
■ Processing algorithm specification of knowledge list L for inquiry P (pre-fixed character string version) =============================== ================================================== ====================================
Function Q2 (P: pattern that can include variables, L: knowledge list): ★ Example 2 of the main function common to the claims of Patent Document 1 (pre-fixed character string version) ★
{
(Pre-fixed character string)
1. 1. Find the fixed character string text T with {all character strings that can be deduced only from L / the line number set of L used as the basis for deducing each character string} as each line.
Specifically, the text T obtained by merging the elements of the output series (A = solution 1 / rationale 1, A = solution 2 / rationale 2, ...) Of the above function Q1 ("$ A", L) as each line is used. Ask.
In the case of an infinite loop in the middle of the calculation, the deduction is partially omitted by the infinite loop detection function using an explicit call management stack or the like.
-For example, whether the computer is trying to confirm the authenticity of the same horn clause under the same variable binding condition while the computer is performing the confirmation of the authenticity of the horn clause under the same variable binding condition.
Manages the call management stack that has a structure (the horn clause identifier being confirmed, the current variable binding condition) as a member,
Detect an infinite loop by linearly searching for the same combination towards the root of the stack at the time of the call.
(Since it is only a fixed character string, the solution set is obtained by a simpler method (function F) than Q1) 2. For each line t of the text T, all Cs for which the following function F (P, t, C) is true are output.
(Output of final result)
3. 3. If there is at least one C, it outputs true, otherwise it outputs false.
}
(0045)
■ Processing algorithm specification of one fact (fixed character string) or horn clause B (however, all variables included in the head also exist in the body) for inquiry P
================================================== ================================================== =================
Function H (P: pattern that can include variables, B: one fact (fixed character string) or horn clause, C: variable binding information): ★ Of the functions used in the inventions of claims 1 to 15 of Patent Document 1. Example 1-1 of Patent Document 1 ★
{
If P does not contain a variable {
If B is a fact {
If P = B, it returns true.
Otherwise, it returns false.
}
If B is the horn clause {
When the head part of B does not contain a variable {
In the case of the head portion of P = B, the truth of the function D (body portion of B, E) is returned.
Otherwise, it returns false.
}
When the head part of B contains a variable {
For each C1 whose true F (B head, P, C1)
If there is C1 for which the result of the function D (C1 applied to the body part of B, E) is true, the true is returned.
Otherwise, it returns false.
}
}
}
If P contains a variable {
If B is a fact {
If there is a C1 for which F (P, B, C1) is true, then all such C1s are added to C and the truth is returned.
If such C1 does not exist, it returns false.
}
If B is the horn clause {
When the head part of B does not contain a variable {
If there is a C1 whose true F (head of P, B, C1) and the function D (body of B, E) is true, then all such C1s are added to C. Returns true.
Otherwise, it returns false.
}

When the head part of B contains a variable {
★ When implementing the invention of claim 12 of Patent Document 1 ★
// Start of speed-up device (option) When the fixed characters for the number of characters existing at the head and tail of the heads of P and B do not match {
Returns false.
}
// End of speed-up device (option)

★ Implementation of the invention of claim 13 of Patent Document 1 ★
When the fixed characters for the number of characters existing at the head and tail of the head of P and B match {
For any binding information G in E for which the result of the function D (body part of B, E) is true, the function F (the head part of P and B is bound by G (should be a fixed character string)). , C1) If there is a C1 that is true
Add all such C1s to C and return true.
If such C1 does not exist, false is returned.
}
}
}
}
}
(0046)
■ Enumeration algorithm specification of solution set of body part of horn clause (or inquiry of compound sentence sharing variable)
================================================== ================================================== =================
Call example → Function D ("$ A and $ B are friends, $ A is human, $ B is human", E);
Return example ← True (E = ((A = Hanako, B = Taro), (A = Taro, B = Jiro), (A = Jiro, B = Saburo)))
================================================== ================================================== =================
Function D (J: body part (or inquiry of compound sentences sharing variables), E: solution set): ★ Example 1-2A of Patent Document 1 of the function used in the invention of claim 6 of Patent Document 1 ★
* However, the entire knowledge source L is stored in a global variable so that it can be referenced {
1. 1. Take out the first sentence M in J. Returns true if the first sentence does not exist.
2. The function Q1 (M, L) or Q2 (M, L) is called for the entire knowledge source L.
If the result is false, false is returned.
When true When M does not contain a variable
do nothing.
When M contains a variable
Stores a set C of binding information that can be taken to make M true.
* Variables that do not need to be bound to be true can be explicitly indicated.
* If a certain condition is required to make it true even though the binding value is an infinite set, that condition can be added.
3. 3. Take out the next sentence M'in J. If it does not exist, it returns true (E = set of binding information C).
4. The function Q1 (M', L) or Q2 (M', L) is called for the entire knowledge source L.
If the result is false, false is returned.
When true When M'does not contain a variable
do nothing.
When M'contains a variable
Let the new C be the intersection of the set C'of the binding information that can be taken to make M'true and the memorized set C.
However, if the original set C is not an empty set but an intersection and becomes an empty set, false is returned.
* Variables that do not need to be bound to be true can be explicitly indicated.
* If a certain condition is required to make it true even though the binding value is an infinite set, that condition can be added.
Return to 5.3.
}

Function D2 (J: body part (or inquiry of compound sentences sharing variables), E: solution set): ★ Another Example 1-2B of Patent Document 1 of the function used in the invention of claim 6 of Patent Document 1. (The speed is increased by spreading the binding information to other statements using the recursive call of the function) ★
{
1. 1. Take out the first sentence M in J. Returns true if M does not exist.
2. Call Q1 (M, L) or Q2 (M, L) for the entire knowledge source L.
If the result is false, false is returned.
When true If M does not contain a variable If there is no sentence next to J, it returns true. If it is true, the next sentence is set as a new M and returns to 2.
When M contains a variable If there is no sentence following J, the possible binding information is stored in E, and if true is returned, the possible binding information is stored as a set C.
3. 3. Empty E and execute recursive call D2 (body part J', E'that can be bound after the next sentence of J by K) for each binding information K in the set C. If the result is true, set to E. , Add that K and E'that became true 4. Returns false if it has never been true for each K, and returns true (E) if it has never been true}

Function D3 (J: body part (or inquiry of compound sentences sharing variables), E: solution set): ★ Example 1-3 of Patent Document 1 of the function used in the invention of claim 5 of Patent Document 1.
{
1. 1. Take out the first sentence M1 in J. Returns true if the first sentence does not exist.
2. Call Q1 (M1, L) or Q2 (M1, L) for the entire knowledge source L.
If the result is false, false is returned.
When true When M1 does not contain a variable
do nothing.
When M1 contains a variable
Stores a set C1 of possible binding information.
3. 3. Similarly, C2, C3 ... Are obtained for M2, M3 ... As long as they are not false.
If it becomes false, false is returned.
4. The intersection C is obtained for the remaining C1, C2, C3 ... Cn, and true (C) is returned.
}

(0047)
■ Enumeration algorithm specification of multiple-length matching solution (s) of fact S for inquiry P
================================================== ================================================== =================
Call example → Function F ("$ A and $ B are friends", "Taro, Jiro and Saburo are friends", "");
Function F (P: pattern that can include variables, S: constant character string, C: variable binding information): ★ Invention of claim 2 of Patent Document 1 (however, "(or last)" and "or before" Example 1-4A of Patent Document 1 of the function used in the omitted implementation example)
{
(Preparation)
1. 1. Find the number of types V of variables in P and the names N1, N2, ... Of the variables that appear in the order of appearance.

(Correspondence when P originally does not contain variables)
2. When V is 0,
⇒ When P = S, return true and finish.
⇒ When P ≠ S, return false and finish.

(output)
3. 3. When V is 1, no matter how many times N1 appears in P, there is only one solution R1 for unification of P and S.
⇒ If there is a match, the only solution is output as "C and N1 = R1", and the truth is returned and the process ends.
⇒ If there is no match, return false and finish.
* The unification itself can be performed as a match with the regular expression (if the same variable appears more than once, there is a postscript reference).

4. When V is 2 or more, the longest matching solution R1 for the variable N1 executes the recursive call F (P', S, C and N1 = R1) for P'that can fill all N1 in P ⇒ longest for N1 The solution set as a matching solution is output

5. R1'← Recursive call F (P'', S, C and N1 = R1') for P'' which can be a character string excluding the last character of R1 and all N1 in P can be filled with R1'. Execution ⇒ For N1, a solution set with solution candidate R1'excluding one character from the longest matching solution is output.

6. When R1'is one or more characters (★ When it is larger than the number of characters of the shortest matching solution in claim 3 of Patent Document 1)
⇒ Return to 5 as R1 ← R1'.
In the case of 0 characters (★ When the number of characters of the shortest matching solution in claim 3 of Patent Document 1)
end.
}

(0048)
Function F (P: pattern that can include variables, S: constant character string, C: variable binding information): ★ Examples 1-4B of the function used in the invention of claim 4 ★
// Function F that focused on the first character C of the fixed character string immediately after the variable first appeared in P and made a device for speeding up part 1
{
(Preparation)
1. 1. Find the number of types V of variables in P and the names N1, N2, ... Of the variables that appear in the order of appearance.

(Correspondence when P originally does not contain variables)
2. When V is 0,
⇒ When P = S, return true and finish.
⇒ When P ≠ S, return false and finish.

(output)
3. 3. When V is 1, no matter how many times N1 appears in P, there is only one solution R1 for unification of P and S.
⇒ If there is a match, the only solution is output as "C and N1 = R1", TRUE is returned, and the process ends.
⇒ If there is no match, return false and finish.

4. (Ingenuity for speeding up # 2. This process is covered in 5 or later and may be omitted. ★ This ingenuity 2 is not claimed in Patent Document 1 ★)
When V is 2 or more
The solution tried to match all variables (N1 (= N), N2, ...) In the longest match mode and all variables (N1 (= N), N2, ...) Match in the shortest match mode. When the solution is the same (N1 = R1, N2 = R2, ...) ⇒ The only solution is output as "C and N1 = R1 and N2 = R2 and ..." and ends. If you didn't
⇒ Return false and finish.
When they are not the same ⇒ Continue to 5

5. When V is 2 or more, the longest matching solution R1 for the variable N1 executes the recursive call F (P', S, C and N1 = R1) for P'that can fill all N1 in P ⇒ longest for N1 The solution set as a matching solution is output

6. When variable N1 (self) follows immediately after variable N1 in P ⇒ When another variable N2 continues to process after 7 ⇒ Process after 7 (However, 1 character C at 7 is the solution R2 of N2 The first character of)
When fixed characters continue ⇒ Process after 7

7. One character C, which is a fixed character immediately after the variable N1 first appears in P (when immediately after another variable N2, the first character C of R2) is
When it is included in the longest matching solution R1 ⇒ 1) R1'← A character string in which the substring from the end of the character string of R1 to its C is deleted ⇒ 2) All N in P with P''← R1' ⇒ 3) Execute recursive call F (P'', S, C and N1 = R1')
⇒ It should be possible to output if there is a solution that is one step shorter for N1. If it is not included in the longest matching solution R1 ⇒ For N1, the list of shorter solutions is complete, so the process ends.

8. Return to 7 as R1 ← R1'.
}
================================================== ================================================== =================

本発明のいくつかの実施例を図を用いて説明する。 Some examples of the present invention will be described with reference to the drawings.

図1は、変数を含んだ文字列をリテラルとして許容する論理プログラムの冗長な計算量を示す図である。
PROLOGのカットオペレータやASSERT文を用いずに計算する場合(小学校向けプログラミング等は、簡単さが重要なので用いたくない)、図1に示すとおり何回(多いものは5回)も同じ計算(リテラルの真偽又は真とする変数値(解)を求めるための計算(単純な文字列マッチングも含む))を行うことになってしまう。わずか4行のプログラムですら最大5回の同じ計算がおこなわれるため、より大きいプログラムでのより大きな組み合わせ爆発を防ぐため、次の図3、図4のようなキャッシュを導入して、図2のような計算量に抑えることにする。
FIG. 1 is a diagram showing a redundant calculation amount of a logical program that allows a character string including variables as a literal.
When calculating without using the PROLOG cut operator or ASSERT statement (I do not want to use programming for elementary schools because simplicity is important), the same calculation (literal) is performed many times (5 times for many) as shown in Fig. 1. Calculation (including simple character string matching) for finding the true / false or true variable value (solution) of is performed. Since the same calculation is performed up to 5 times even in a program with only 4 lines, in order to prevent a larger combinatorial explosion in a larger program, a cache as shown in Fig. 3 and Fig. 4 is introduced as shown in Fig. 2. I will limit the amount of calculation to such.

図2は、変数を含んだ文字列をリテラルとして許容する論理プログラムの効率的な計算(キャッシュ使用)を示す図である。
これは、同じリテラルの計算をキャッシュを用いて省略する(キャッシュしていた値を用いる)場合であり、明らかに計算量が節約できているのがわかる。
なお、別の実施例では「$A」という証明できるすべてのリテラル(固定文字列)について列挙する質問文が問われることがある。図1、図2の論理プログラムでは、3つの事実と1つのルールで証明できる内容がいずれも、実質的に「$Aは$Bの兄」という形式をしているため、答える形式は異なるものの、「$A」の結果と図2の「$Aは$Bの兄」の結果は、実質同じとなり、いずれも「太郎は次郎の兄」「次郎は三郎の兄」「三郎は四郎の兄」「太郎は三郎の兄」「太郎は四郎の兄」「次郎は四郎の兄」という6つの内容を答えることになる(また、「太郎は$Xの兄」と質問した場合は、太郎が兄である3つの「$X」のみを答えることになる)。
しかし、別の実施例として、「太郎は花子の夫」などといった事実が論理プログラムに含まれている場合は、「$A」という質問文ではこれが解答に含まれるが、「$Aは$Bの兄」という質問文の解答には含まれないことになる。
このようにキャッシュされる内容は、質問文によって大きく異なるが、論理プログラムによって証明できる全体が有限個の固定文字列集合の場合、「$A」の答えとなる固定文字列集合をあらかじめ計算して記憶して置き、各質問文を正規表現とみて(変数を(.+)や(.*)や後置参照(\1)(\2)...等とみて)マッチングをとって求めてもよい(高速化)。
また、任意の事実を論理プログラムに足すと論理プログラムで証明できる全体がどのように変化するかの差分をとるためにも、処理系が質問文を処理していない開いた時間に自動的に「$A」をもとめるようにしておいてもよい。また、このとき記憶したキャッシュ(「$A]のみがキーとなるのではなく、より具体的な様々なリテラルがキーとなってキャッシュされサブゴールの計算が行われて、初めて$Aの値(証明できる固定文字列の全体)が求められる)を、以降の質問文処理時に流用することにしてもよい。PROLOGや上記した実施形態の知能システムの基本的な意味論では、論理プログラムと質問文(ないしサブクエリ)が変化しない場合は、値(真偽又はリテラルを真にする変数値(解)集合)も変化しないからである。
FIG. 2 is a diagram showing efficient calculation (using cache) of a logical program that allows a character string including variables as a literal.
This is a case where the calculation of the same literal is omitted by using the cache (using the cached value), and it can be clearly seen that the amount of calculation is saved.
In another embodiment, a question sentence listing all literals (fixed character strings) that can be proved as "$ A" may be asked. In the logical programs of FIGS. 1 and 2, the three facts and the contents that can be proved by one rule are all in the form of "$ A is the brother of $ B", so the answer format is different. , The result of "$ A" and the result of "$ A is $ B's brother" in Fig. 2 are substantially the same, and both are "Taro is Jiro's brother", "Jiro is Saburo's brother", and "Saburo is Shiro's brother". "Taro is Saburo's older brother,""Taro is Shiro's older brother," and "Jiro is Shiro's older brother." Only my brother's three "$ X" will be answered).
However, as another example, if the logic program contains facts such as "Taro is Hanako's husband", the question "$ A" will include this in the answer, but "$ A is $ B". It will not be included in the answer to the question "My brother".
The contents cached in this way differ greatly depending on the question sentence, but if the total number of fixed character strings that can be proved by the logical program is a finite number, the fixed character string set that is the answer to "$ A" is calculated in advance. Remember and store each question as a regular expression (see variables as (. +), (. *), Postfix references (\ 1) (\ 2) ..., etc.) and find them by matching. Good (high speed).
Also, in order to take the difference of how the whole that can be proved by the logical program changes when an arbitrary fact is added to the logical program, the processing system automatically "is open during the open time when the question sentence is not processed. You may ask for "$ A". In addition, the cache ("$ A") memorized at this time is not the only key, but various more specific literals are used as the key to cache and the subgoal is calculated, and the value of $ A (proof). (The whole fixed character string that can be created) is required) may be diverted in the subsequent question sentence processing. In the basic semantics of PROLOG and the intelligent system of the above-described embodiment, the logical program and the question sentence () If the subquery) does not change, the value (the set of variable values (solutions) that make the truth or literal true) does not change either.

図3は、変数名を正規化する前のリテラル及び変数のないリテラルと各値のキャッシュの例を示す図である。
基本的なPROLOGの構文と同様のスコープルールをもつ上記した実施形態のプログラミング言語では、同一の論理プログラムについては、変数の並び方が同じであれば、変数名が異なっても本質的に同じ答えとなり、共通のキャッシュでよいはずであるが、そうなっていない場合(すなわち、図3の「太郎は$Zの兄」と「太郎は$Yの兄」の場合等、変数名が正規化(統一)されていない場合)、このように多くのメモリ(及び計算量)を使用することになってしまう。そこで、図4のように変数名の正規化による高速化を実施するオプションを用意する。
FIG. 3 is a diagram showing an example of a literal before normalizing a variable name, a literal without a variable, and a cache of each value.
In the programming language of the above-described embodiment, which has the same scope rules as the basic PROLOG syntax, if the variables are arranged in the same order, the answer is essentially the same even if the variable names are different. , A common cache should be fine, but if that is not the case (that is, in the case of "Taro is the brother of $ Z" and "Taro is the brother of $ Y" in Fig. 3, the variable names are normalized (unified). ), This would use a lot of memory (and amount of computation). Therefore, as shown in FIG. 4, an option for speeding up by normalizing the variable name is prepared.

図4は、変数名を正規化した後のリテラル及び変数のないリテラルと各値のキャッシュの例を示す図である。
このように変数の出現順に対応する名前をつける、などして正規化することにより、キャッシュに必要なメモリー量も対応する計算量も図3に比して大幅に節約できることがわかる。
FIG. 4 is a diagram showing an example of a literal after normalizing a variable name, a literal without a variable, and a cache of each value.
It can be seen that the amount of memory required for the cache and the corresponding amount of calculation can be significantly saved as compared with FIG. 3 by normalizing by giving names corresponding to the order of appearance of the variables in this way.

図5は、論理プログラムを動的に複数(P1,P2)追加する場合のキャッシュの例を示す図である。
Rは動的引用を示す矢印であり、この例では再帰的に2つの論理プログラム(P1,P2)が動的に追加ロード(一時的に追加ロードされて質問終了後に削除)されている。技術詳細は、特許文献2を参照されたいが、「Req <URIパス>」はボディ部の任意の位置に記載することができ、クエリ(又はサブクエリ)とヘッドがマッチしかつボディ部内のそれ以前の条件等がすべて真の場合にのみ<URIパス>で指定した論理プログラム(通常の自然言語テキストも可)を既存の論理プログラムの末尾に追加するように読み込み、以降のボディ部の処理についてのみ、その読み込んだ追加プログラムの影響を及ぼす(たとえば変数の解の数が増える)ものである。
図のP1...は省略のためのものであり、実際には、「\\社内共有\P1.jpl」であり、同様にP2は「http://hoge.jp/P2.jpl」である。前者は社内仮想VPN内ファイルサーバーの共有フォルダ内の社内限りで参照される論理プログラムであり、後者はインターネット全体に(=人類全体に)httpで公開された論理プログラムである。前者は社内の担当者が社内限りノウハウの共有のために更新し、後者はボランティア団体が特定の知識や情報の普及のために更新している。
論理プログラムP1の内容は参照関係がわかるように図式で示しているが、例として示している内容は上記実施形態では「$Aに$Xを供給可能 :- Req "\\社内共有\P1.jpl"; $Xは食べれる; $Aは$Xが好き;」であり、同様にP2は「$Yは食べれる :- Req "http://hoge.j/P2.jpl"; $Yは食べれる;」である。
キャッシュC1は、P1とP2を読み込んだ結果として、元の論理プログラムP0における「¥1は食べ物」というリテラル(正規化されている)を真にする変数「¥1」の値が「カレー」か「ラーメン」であることを示している。これは、P1が読み込まれていなかったり、P2が読み込まれていなかったり、また別のP3が読み込まれて「いる」場合には、別の表現になり、ひもづく値が変化する可能性に対応している。ここでは、あくまでP1(\\社内共有\P1.jpl)とP2(http://hoge.jp/P2.jpl)のみを読み込んだ結果であることがキー「¥1は食物_\\社内共有\P1.jpl_http://hoge.jp/P2.jpl」として表現されている。なお、読み込んだURIパスは所定のソート規則にしたがってソートするため、P2の後にP1を読み込んだとしても上記のように整列して泣き別れないようにしている。
キャッシュC2は、論理プログラムP1に出現しP2には出現しない「¥1は食べれる」というリテラルについてであるが、このリテラルをヘッドとするボディが「Req "http://hoge.jp/JP.jpl"」(Req P2...)を含んでいるため、P1だけでなくP2をキーに含めている。実際に、P2にしか存在しないカレーとラーメンが値として記憶されている。
キャッシュC3は、上記「Req P2...」の範囲がそのルールのみをスコープとし「$Yは食物」までとなるため、P2を考慮する必要があるのは、P1の中では「$Yは食べれる」と「$Yは食物」のみとなり、「中国人は爆竹が好き」「インド人はカレーが好き」に対応する「¥1は¥2が好き」というリテラルのキャッシュのキーとしてはP2は含まれないことになる。
キャッシュC4は、P0にしかないリテラルであるが、再帰的にP1,P2を読み込んだ結果としての値をキャッシュしているため、キーは「¥1に¥2を補給可能_P1..._P2...」となる。同じヘッドを有してP1を動的読み込みしない節が仮に存在したば場合には、「¥1に¥2を補給可能」というキーとその値(真偽又はリテラルを真にする変数値(解)集合)を関連付けて記憶する(図示しない)キャッシュがその節のために設けられることもある。
FIG. 5 is a diagram showing an example of a cache when a plurality of logical programs (P1, P2) are dynamically added.
R is an arrow indicating a dynamic citation. In this example, two logical programs (P1 and P2) are recursively additionally loaded (temporarily additionally loaded and deleted after the question is completed). For technical details, refer to Patent Document 2, but "Req <URI path>" can be described at any position in the body part, and the query (or subquery) and the head match and before that in the body part. Only when all the conditions of , The effect of the additional program loaded (for example, the number of solutions of variables increases).
P1 ... in the figure is for omission, and is actually "\\ internal sharing \ P1.jpl", and similarly P2 is "http://hoge.jp/P2.jpl". be. The former is a logical program that is referenced only within the company in the shared folder of the file server in the company virtual VPN, and the latter is a logic program that is published via http on the entire Internet (= for the entire human race). The former is updated by the person in charge within the company to share know-how only within the company, and the latter is updated by volunteer groups to disseminate specific knowledge and information.
The contents of the logical program P1 are shown graphically so that the reference relationship can be understood, but the contents shown as an example are "$ X can be supplied to $ A:-Req" \\ internal sharing \ P1. jpl "; $ X can be eaten; $ A likes $ X;", and P2 is "$ Y can be eaten:-Req" http://hoge.j/P2.jpl "; $ Y Can be eaten; ".
As a result of reading P1 and P2 in the cache C1, is the value of the variable "¥ 1" that makes the literal (normalized) "¥ 1 is food" in the original logical program P0 true "curry"? It shows that it is "ramen". This is a different expression if P1 is not loaded, P2 is not loaded, or another P3 is loaded and "is", and corresponds to the possibility that the associated value will change. doing. Here, the key is that the result is that only P1 (\\ internal sharing \ P1.jpl) and P2 (http://hoge.jp/P2.jpl) are read. It is expressed as "\ P1.jpl_http://hoge.jp/P2.jpl". Since the read URI path is sorted according to a predetermined sorting rule, even if P1 is read after P2, it is aligned as described above so as not to cry.
The cache C2 is about a literal that appears in the logic program P1 and does not appear in P2, "¥ 1 can be eaten", but the body headed by this literal is "Req" http://hoge.jp/JP. Since it contains jpl "" (Req P2 ...), not only P1 but also P2 is included in the key. Actually, curry and ramen that exist only in P2 are stored as values.
In cache C3, the range of the above "Req P2 ..." is limited to that rule and extends to "$ Y is food", so it is necessary to consider P2 because "$ Y is" in P1. Only "Eatable" and "$ Y is food", and "Chinese people like firecrackers" and "Indians like curry" correspond to "¥ 1 likes ¥ 2" as a literal cash key P2 Will not be included.
The cache C4 is a literal that can only be found in P0, but since it caches the value as a result of recursively reading P1 and P2, the key is "¥ 2 can be replenished to ¥ 1_P1 ..._P2 .. . ". If there is a clause that has the same head and does not dynamically read P1, the key "¥ 2 can be replenished for ¥ 1" and its value (variable value that makes the truth or literal true (solution) A cache (not shown) that associates and stores (sets)) may be provided for that clause.

図6は、論理プログラムが動的に変更されたり追加されたりする場合のキャッシュの例を示す図である。
これは特許文献3の逆質問機能による動的変更を例にとったものである。詳しくは同文献を参照されたいが、推論の途中でコンピュータがそのリテラルを真にする変数の値をユーザーに尋ねた回答をもとに知識を動的に追加することによって、コンピュータが当初からもっている知識や情報の不足を補うシステムであり、簡単な追加法の場合は、論理プログラムの最後に事実の形で追加されることになる(同文献)。
これにより、他のリテラルの真偽や変数を真にする値(解)集合が変化する場合があるため、動的追加に応じたキャッシュキーの変更が必要になってくる。この例ではユーザーごとに動的に追加する事実が異なりうるシステムとして構成しており、キーにはユーザーID(ここではU01)とそのリビジョン番号(REV001)をキーに追加し、どのキャッシュがどのリビジョンの論理プログラムに対応しているのかを管理している。
FIG. 6 is a diagram showing an example of a cache when a logical program is dynamically changed or added.
This is an example of dynamic change by the reverse question function of Patent Document 3. For details, refer to the same document, but the computer has the knowledge from the beginning by dynamically adding knowledge based on the answer that the computer asked the user about the value of the variable that makes the literal true in the middle of the inference. It is a system that makes up for the lack of knowledge and information that exists, and in the case of a simple addition method, it will be added in the form of a fact at the end of a logical program (ibid.).
As a result, the truth of other literals and the set of values (solutions) that make variables true may change, so it is necessary to change the cache key according to the dynamic addition. In this example, the system is configured so that the fact that it is added dynamically for each user can be different. The user ID (U01 in this case) and its revision number (REV001) are added to the key, and which cache is which revision. It manages whether it corresponds to the logical program of.

図7は、意味解析を用いて変数名以外も意味的に標準化する場合のキャッシュの例を示す図である。
図5では、「¥1は食物」と「¥1は食べれる」は同義であるにも関わらず別のキャッシュとなっていた。これを意味解析を用いた公知の正規化・標準化技術によって「同じ意味のものは同じ表記」として表記ゆれが発生しないようにする(名詞については名寄せもする)ことによって明らかにキーの数を減らしキャッシュを節約することができる。
図右上には、簡単な意味解析&標準化ルールを記載しているが、実際には1990年代を中心に発達してすでに公知公用となっている数多くの形態素解析技術、構文解析技術、意味解析技術、指示語解析技術等を用いることができる。
また図5では、P1において表記ゆれの吸収のために用いられていたルール「$Yは食べれる:−$Yは食物;」がなくても同様の結果を得られるようになっている。
FIG. 7 is a diagram showing an example of a cache when semantically standardizing other than variable names by using semantic analysis.
In FIG. 5, although "¥ 1 is food" and "¥ 1 can be eaten" are synonymous, they are different cash. By using a known normalization / standardization technique that uses semantic analysis, the number of keys is clearly reduced by preventing notation fluctuations from occurring as "things with the same meaning have the same notation" (nouns are also named). You can save cache.
In the upper right of the figure, simple semantic analysis & standardization rules are described, but in reality, many morphological analysis techniques, parsing techniques, and semantic analysis techniques that have been developed mainly in the 1990s and are already publicly known. , Indicator analysis technology, etc. can be used.
Further, in FIG. 5, the same result can be obtained without the rule “$ Y is edible: − $ Y is food;” used for absorption of the notational fluctuation in P1.

図8は、手続き的解釈(例:経由者をWRITE)が必要なためキャッシュを抑制する例を示す図である。
図1の論理プログラムに手続き的解釈であるWRITE($Y)が加わったものである。これは$Yを束縛している値を表示する組み込み関数である。これを確実に機能させるためには、ボディ部を副作用(表示等)も必要とする手続きとみなして省略せずに実行する必要がある。図8では、図2に比べて、手続きを含む4行目のルールを確実に実行している(キャッシュで代替しない)。このため、図2に比べて計算量は増えるが、図1に比べて計算量を節約し、必要な手続き(ここではWRITE)を省略せずに処理することが可能となっている。これは、手続き的解釈を含むルール(特定の予約語を含むもの)をそうでないルールと区別することで可能にしている。
FIG. 8 is a diagram showing an example of suppressing the cache because procedural interpretation (eg, WRITE for the intermediary) is required.
WRITE ($ Y), which is a procedural interpretation, is added to the logical program of FIG. This is a built-in function that displays the value binding $ Y. In order for this to function reliably, it is necessary to regard the body part as a procedure that also requires side effects (display, etc.) and execute it without omitting it. In FIG. 8, as compared with FIG. 2, the rule on the fourth line including the procedure is surely executed (not replaced by the cache). Therefore, although the amount of calculation is increased as compared with FIG. 2, the amount of calculation is saved as compared with FIG. 1, and it is possible to process without omitting the necessary procedure (here, WRITE). This is made possible by distinguishing rules that include procedural interpretations (those that contain certain reserved words) from rules that do not.

図9は、解ごとにツリー状に根拠を求めるためにキャッシュを抑制する例を示す図である。右のツリー状のグラフは証明の経路を示しており、数字は論理プログラムの行番を示す。
この場合も、解(たとえば最も論証経路の大きい丸5番、すなわち($A,$B)=(太郎,四郎))の根拠(別解を含め2つのツリーとなる)を省略せずに示す場合には、すでに求めたキャッシュに頼らずに、「太郎は四郎の兄」という固定文字列リテラルの真を証明する導出過程を再計算して論証の経路をたどってみている。
このような場合には、キャッシュを抑制することが必要であり、キャッシュを全部または特定の解に関連する部分のみをクリアすることによっても対処している。特定の解に関連する部分のキャッシュのみクリアすることにより、他のキャッシュを他のキャッシュを生かすことができる(論理プログラムが変更されない限り)。
なお、元の質問文を処理する過程で各解(候補)を支持するために必要な事実やルールを解候補に紐づけてメモしていくアルゴリズムよりも、解が求まった後に質問文に各解を代入して各固定文字列リテラルを作成した上で、各導出過程(一つとは限らない)を再計算することにより各根拠ツリーを求めるアルゴリズムのほうが各根拠のツリーを計算しやすいという事実を発明者が発見している。
それは、深さ優先のバックトラックではなく一つひとつの条件文について幅優先でまず解候補を列挙して後の条件文で解候補を絞り込んでいくほうが文字列マッチのさまざまな可能性の網羅をひとつひとつのリテラル(ルールの条件文の)で完結することができるため、マッチ途中(正規表現がマッチする可能性が複数あってそれを一つ一つ別の候補として計算する途中)の状態からの再帰的な探索関数呼び出し(文脈切り替えを伴う)やバックトラックを減らして、(関数再入可能化のために自動変数としなければならなくなるはずの正規表現データ構造の積み上げによって生じがちな)スタック膨張を抑え、高速化も図れるためであり、変数を含んだ文字列をリテラルとして許容する処理系では、伝統的なPROLOG等に比べて、正規表現マッチングを多用するために、そうするメリットが大きいからでもある。
また、このように、ルールのボディ部の一つひとつの条件となるリテラルを真とする変数の値(解)集合をリテラルごとに一気に全部列挙する方針(幅優先)の場合は、キャッシュとしてその全部を求めておくことが極めて有利となり、本発明の目的をもっとも効果的に達成する計算方針の組み合わせ(幅優先×キャッシュ)となる。
FIG. 9 is a diagram showing an example of suppressing the cache in order to obtain the basis in a tree shape for each solution. The tree-shaped graph on the right shows the proof path, and the numbers show the line numbers of the logical program.
In this case as well, the rationale for the solution (for example, circle 5 with the largest argument path, that is, ($ A, $ B) = (Taro, Shiro)) (two trees including another solution) is shown without omission. In this case, instead of relying on the cache already obtained, I recalculate the derivation process that proves the truth of the fixed string literal "Taro is Shiro's older brother" and follow the path of the argument.
In such a case, it is necessary to suppress the cache, and it is also dealt with by clearing the cache entirely or only the part related to a specific solution. By clearing only the cache related to a specific solution, other caches can be used for other caches (unless the logical program is changed).
In addition, in the process of processing the original question text, each question text is written after the solution is obtained, rather than the algorithm that associates the facts and rules necessary to support each solution (candidate) with the solution candidate and makes a note of it. The fact that it is easier to calculate each rationale tree with an algorithm that finds each rationale tree by substituting the solution to create each fixed string literal and then recalculating each derivation process (not necessarily one). Has been discovered by the inventor.
It is better to first list the solution candidates for each conditional statement with width priority instead of the depth-priority backtrack, and narrow down the solution candidates with the subsequent conditional statements to cover the various possibilities of string matching. Since it can be completed in (in the conditional statement of the rule), it is recursive from the state in the middle of the match (there are multiple possibilities that the regular expression matches and each one is calculated as another candidate). Reduces search function calls (with context switching) and backtracking to reduce stack swelling (which is often caused by stacking regular expression data structures that would have to be automatic variables to enable function reentrants). This is because the speed can be increased, and in a processing system that allows a character string including variables as a literal, there is a great merit in doing so because regular expression matching is used more frequently than in traditional PROLOG and the like.
Also, in this way, in the case of a policy (breadth-first) that enumerates all the value (solution) sets of variables whose true is a literal, which is a condition of each body part of the rule, at once for each literal, all of them are obtained as a cache. It is extremely advantageous to keep it, and it becomes a combination of calculation policies (breadth-first x cache) that most effectively achieves the object of the present invention.

本発明(高速化とその抑制)の対象となる知能システムは、知見そのものの分類・整理・管理、その管理している知見の新しい事実等への自動適用(自動推論)、アイディア自体の広範な検索・探索、アイディアの結合・詳細化・具体化、人類やコミュニティや会社やグループにおける知見や研究結果の自動的な共有・普及・更新・精密化に活用することができる。また、自分だけの知能システムを、外部の知識を引用する形式で低コストで簡単に開発することを容易にする。 The intelligent system targeted by the present invention (acceleration and suppression thereof) includes classification, organization, and management of knowledge itself, automatic application of the managed knowledge to new facts (automatic reasoning), and a wide range of ideas themselves. It can be used for searching / searching, combining / detailing / embodying ideas, and automatically sharing / disseminating / updating / refining knowledge and research results in humankind, communities, companies and groups. It also makes it easy to develop your own intelligence system at low cost and easily in the form of quoting external knowledge.

C1、C2、C3、C4 キャッシュの中身の例
Qr 逆質問文の例(コンピュータがユーザーに真偽や真にする変数値(解)を尋ねて結果が論理プログラムの末尾等に追加される文)
Qr1 逆質問文の結果として追加された文の例
R 動的引用(矢印の元のプログラムから先のプログラムを引用する)の例
C1, C2, C3, C4 Example of cache contents Qr Example of reverse question sentence (statement in which the computer asks the user for the true / false or true variable value (solution) and the result is added to the end of the logical program)
Qr1 Example of sentence added as a result of reverse question sentence R Example of dynamic quoting (quoting the program before the original program of the arrow)

Claims (10)

変数を含んだ文字列をリテラルとして許容する論理プログラムを
コンピュータが処理する方法であって、
論理プログラムにおいて変数を含んだリテラルを真にする変数の値をコンピュータが求め
(以降、「計算する」と呼ぶ)た際に
該リテラルと該変数の値を関連づけて記憶しておく第一のステップと、
同一の論理プログラムにおいて該リテラルを真にする変数の値を求める際に
前記第一のステップで該リテラルと関連づけて記憶しておいた該変数の値を用いる第二の
ステップと
を含む方法であって、
変数を含むリテラルを真にする変数の値を、
該リテラルだけでなく処理の対象とする論理プログラムの範囲を指定する情報と関連づけ

前記記憶することを特徴とする方法。
A way for a computer to process a logical program that allows a string containing variables as a literal.
The first step in associating and storing the literal and the value of the variable when the computer finds (hereinafter referred to as "calculate") the value of the variable that makes the literal including the variable true in the logical program. When,
It is a method including a second step of using the value of the variable stored in association with the literal in the first step when obtaining the value of the variable that makes the literal true in the same logical program. hand,
The value of a variable that makes a literal containing the variable true,
A method characterized in that it is stored in association with information that specifies a range of a logical program to be processed as well as the literal.
前記リテラルと変数の値を関連づけて記憶する際、又は、
関連づけて記憶しておいたリテラルと別のリテラルを照合する際に、
対象となるリテラルに含まれる変数の表記を標準化することを特徴とする
請求項1に記載の方法。
When storing the literal and the value of the variable in association with each other, or
When collating a literal that you have associated and remembered with another literal
The method according to claim 1, wherein the notation of variables included in the target literal is standardized.
コンピュータが変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する
方法であって、
論理プログラムにおいて変数を含まないリテラルの真偽を求め(以降、これも「計算する
」と呼ぶ)た際に
該リテラルと該値(真偽)を関連づけて記憶しておく第一のステップと、
同一の論理プログラムにおいて該リテラルの真偽を求める際に
前記第一のステップで該リテラルと関連づけて記憶しておいた該値を用いる第二のステッ
プと
を含む方法であって、
変数を含まないリテラルの真偽を
該リテラルだけでなく処理の対象とする論理プログラムの範囲を指定する情報と関連づけ

前記記憶することを特徴とする方法。
A way for a computer to process a logical program that allows a string containing variables as a literal.
When the truth of a literal that does not include variables is obtained in a logical program (hereinafter, this is also called "calculation"), the first step of associating the literal with the value (true or false) and memorizing it, and
A method including a second step of using the value stored in association with the literal in the first step when determining the authenticity of the literal in the same logic program.
A method characterized in that the truth of a literal that does not include a variable is stored in association with information that specifies the range of a logical program to be processed as well as the literal.
前記リテラルと変数の値を関連づけて記憶する際、又は、
関連づけて記憶しておいたリテラルと別のリテラルを照合する際に、
リテラルの意味を解析して意味が同一のリテラルの表記が同一となる方向に表記を標準化
することを特徴とする
請求項1から3のいずれか一項に記載の方法。
When storing the literal and the value of the variable in association with each other, or
When collating a literal that you have associated and remembered with another literal
The method according to any one of claims 1 to 3, wherein the literal meaning is analyzed and the notation of literals having the same meaning is standardized in the direction in which the notation is the same.
変数を含んだ文字列をリテラルとして許容する論理プログラムをコンピュータが処理する
方法であって、
サブクエリ(質問文そのものであってもよい)の計算結果をキャッシュしておき、
実質同じサブクエリが発生したときに計算せずに該当するキャッシュを用いることを特
徴とする請求項1または3に記載の方法。
A way for a computer to process a logical program that allows a string containing variables as a literal.
Cache the calculation result of the subquery (which may be the question text itself) and
The method according to claim 1 or 3, wherein when substantially the same subquery occurs, the corresponding cache is used without calculation.
リテラルの計算に手続き的解釈を行う必要のあるルールが介在していたかどうかを示すフ
ラグを有し、
フラグが真のときに計算することを特徴とする
請求項1から5のいずれか一項に記載の方法。
It has a flag that indicates whether the literal calculation was mediated by a rule that required a procedural interpretation.
The method according to any one of claims 1 to 5, wherein the calculation is performed when the flag is true.
計算した時から対象とする論理プログラムに変更があったかどうか計算するデータ構造を
有し、
変更があった場合に記憶された値を用いずに計算を行う
請求項1から6のいずれか一項に記載の方法。
It has a data structure that calculates whether the target logical program has changed from the time of calculation.
The method according to any one of claims 1 to 6, wherein the calculation is performed without using the stored value when there is a change.
真偽や解集合の導出に用いたルール、事実又は文脈を明示する必要がある場合に、
真偽の証明経路ごと又は解集合に含まれる解ごとに
計算するようにした
請求項1から7のいずれか一項に記載の方法。
When it is necessary to specify the rules, facts or contexts used to derive the truth or solution set
The method according to any one of claims 1 to 7, wherein the calculation is performed for each authenticity proof path or for each solution included in the solution set.
請求項1から8のいずれか一項に記載の方法をコンピュータに実施させるコンピュータプ
ログラム。
A computer program that causes a computer to perform the method according to any one of claims 1 to 8.
請求項9に記載のコンピュータプログラムを用いた装置。 A device using the computer program according to claim 9.
JP2016165180A 2016-08-25 2016-08-25 How to process logical programs that allow strings containing variables as literals, computer programs and devices Active JP6924461B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016165180A JP6924461B2 (en) 2016-08-25 2016-08-25 How to process logical programs that allow strings containing variables as literals, computer programs and devices

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016165180A JP6924461B2 (en) 2016-08-25 2016-08-25 How to process logical programs that allow strings containing variables as literals, computer programs and devices

Publications (2)

Publication Number Publication Date
JP2018032275A JP2018032275A (en) 2018-03-01
JP6924461B2 true JP6924461B2 (en) 2021-08-25

Family

ID=61304408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016165180A Active JP6924461B2 (en) 2016-08-25 2016-08-25 How to process logical programs that allow strings containing variables as literals, computer programs and devices

Country Status (1)

Country Link
JP (1) JP6924461B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114415622B (en) * 2021-12-13 2023-12-22 浙江中控技术股份有限公司 Control system user program logic online verification method and system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161498A (en) * 1997-11-26 1999-06-18 Hitachi Ltd Knowledge information analysis method, knowledge information processing system, and storage medium
JP2005301859A (en) * 2004-04-15 2005-10-27 Fujitsu Ltd Code search program and code search device
JP6263858B2 (en) * 2013-04-17 2018-01-24 ナレルシステム株式会社 Method, apparatus and computer program for processing knowledge and information

Also Published As

Publication number Publication date
JP2018032275A (en) 2018-03-01

Similar Documents

Publication Publication Date Title
Vasiliev Natural language processing with Python and spaCy: A practical introduction
Altinok Mastering spaCy: An end-to-end practical guide to implementing NLP applications using the Python ecosystem
Abonizio et al. Toward text data augmentation for sentiment analysis
US10496749B2 (en) Unified semantics-focused language processing and zero base knowledge building system
Ferguson Faulty Belnap Computers and Subsystems of E fde
WO2014078747A1 (en) Natural language command string for controlling target applications
JP6263858B2 (en) Method, apparatus and computer program for processing knowledge and information
Graliński et al. PSI-toolkit: A natural language processing pipeline
Feuto et al. Domain specific language based on the SBVR standard for expressing business rules
JP6924461B2 (en) How to process logical programs that allow strings containing variables as literals, computer programs and devices
Atzeni et al. What is the cube root of 27? Question answering over CodeOntology
Tammet et al. An experimental pipeline for automated reasoning in natural language (short paper)
Okhotin Underlying principles and recurring ideas of formal grammars
JP7239959B2 (en) Method, computer program and apparatus for automatically synthesizing ideas from natural language text
Krivochen Mixed computation: Grammar up and down the Chomsky hierarchy
JP6905729B2 (en) Search pruning methods, computer programs and equipment
Adabala et al. A fragment of linear temporal logic for universal very weak automata
WO2016071942A1 (en) Method for processing knowledge or information, device, and computer program
JP2017102628A (en) Method for processing knowledge and information, computer program for the same, and processing device
Razorenov et al. A new formal approach to semantic parsing of instructions and to file manager design
US20240143928A1 (en) Generation of interactive utterances of code tasks
Sevilla et al. Enriched semantic graphs for extractive text summarization
Colton Text classification using Python
JP6799731B2 (en) Methods, computer programs and devices for computers to infer interactively
Marjalaakso Implementing Semantic Search to a Case Management System

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200804

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210622

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210722

R150 Certificate of patent or registration of utility model

Ref document number: 6924461

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150