JP2018032275A - 変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法、コンピュータプログラム及び装置 - Google Patents
変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法、コンピュータプログラム及び装置 Download PDFInfo
- Publication number
- JP2018032275A JP2018032275A JP2016165180A JP2016165180A JP2018032275A JP 2018032275 A JP2018032275 A JP 2018032275A JP 2016165180 A JP2016165180 A JP 2016165180A JP 2016165180 A JP2016165180 A JP 2016165180A JP 2018032275 A JP2018032275 A JP 2018032275A
- Authority
- JP
- Japan
- Prior art keywords
- variable
- literal
- true
- character string
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】変数を含んだ文字列をリテラルとして許容する論理プログラムをコンピュータが処理する方法であって、論理プログラムにおいて変数を含んだリテラルを真にする変数の値をコンピュータが求めた際に該リテラルと該変数の値を関連づけて記憶しておく第一のステップと、同一の論理プログラムにおいて該リテラルを真にする変数の値を求める際に前記第一のステップで該リテラルと関連づけて記憶しておいた該変数の値を用いる第二のステップとを含むことを特徴とする方法を提供する。
【選択図】図4
Description
変数を含んだ文字列をリテラルとして許容する論理プログラムを「高速に」処理する方法、コンピュータプログラム及び装置を提供することを主な課題とする。
また、論理プログラムの動的な読み込み(特許文献2に記載した技術)にも対応した高速化をさらなる課題とする。
また、高速化した場合にも根拠や証明経路の表示や手続き的解釈(特許文献3のコンピュータからの質問等も含む)が損なわれないようにすることをさらなる課題とする。
本発明(請求項1)は、
変数を含んだ文字列をリテラルとして許容する論理プログラムをコンピュータが処理する方法であって、
論理プログラムにおいて変数を含んだリテラルを真にする変数の値をコンピュータが求めた際に
該リテラルと該変数の値を関連づけて記憶しておく第一のステップと、
同一の論理プログラムにおいて該リテラルを真にする変数の値を求める際に
前記第一のステップで該リテラルと関連づけて記憶しておいた該変数の値を用いる第二のステップと
を含むことを特徴とする方法を提供する。
リテラル(例えば、「$Xは$Yが好き」)を真にする変数の値は、複数(左の例に応じた例「($X,$Y)={(太郎,花子),(次郎、小百合)}」の場合であれば、2個)でもよい。
「関連づけて記憶」は、従来からの一般的なオープン/クローズドハッシュのアルゴリズムや、バイナリサーチが可能な(整列された)map型ないし組み込みハッシュ型を用いることにより高速に実現することができる。
特許文献4ではユーザーからの問いの表記ゆれが少なくなるため、ますます再計算の省略が有利になり、単一ユーザーによる一回の質問文を処理する中での再利用だけでなく複数ユーザーによる複数回の同一(質問文が同一/実質同一等)・同様(質問文に答えるためのサブクエリ集合に共通部分が多い等)の質問文を処理するためにも用いることができる。
特許文献5における程度を比較する計算や価値観を考慮した複雑な計算の結果も再計算を省略して動的に参照し計算量を節約することができる。
これにより、実質同じ推論/解探索を大幅に省略して、前記した主な課題を解決することができる。
前記リテラルと変数の値を関連づけて記憶する際、又は、関連づけて記憶しておいたリテラルと別のリテラルを照合する際に、
対象となるリテラルに含まれる変数の表記を標準化することを特徴とする
請求項1に記載の
方法を提供する。
標準化の方法としては、例えば「$Xは、$Yが$Xを好きなので好き」であれば、変数の出現順に「¥1は、¥2が¥1を好きなので好き」という形(同じ変数が後で出現したときは、前に出現したときの順番を割り当てる)等に機械的に標準化することができる。
これにより、変数の名前が異なるだけのリテラル(論理プログラム上の静的なリテラル、又は、処理の途中で動的に生成(同名変数の混同を避ける等のために)されたリテラル)を真とする値が同一論理プログラムにおいて同じとなる性質を(変数名だけが異なるリテラル間にも)より網羅的に利用して、さらなる高速化を可能にすることができる。
コンピュータが変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法であって、
論理プログラムにおいて変数を含まないリテラルの真偽を求めた際に
該リテラルと該値(真偽)を関連づけて記憶しておく第一のステップと、
同一の論理プログラムにおいて該リテラルの真偽を求める際に
前記第一のステップで該リテラルと関連づけて記憶しておいた該値を用いる第二のステップと
を含む方法を提供する。
「関連づけて記憶する」より具体的な方法は、変数を含むリテラルの場合と同様でもよいが、値のほうは、リテラルを真にする変数の値ではなくリテラルの真か偽となる。
変数を含まない定数リテラルの真偽の計算も計算量が大きくなる場合があり、このキャッシュは大きな計算量の節約となる。
前記リテラルと変数の値を関連づけて記憶する際、又は、関連づけて記憶しておいたリテラルと別のリテラルを照合する際に、
リテラルの意味を解析して意味が同一のリテラルの表記が同一となる方向に表記を標準化することを特徴とする
請求項1から3のいずれか一項に記載の方法
を提供する。
「リテラルの意味を解析して意味が同一のリテラルの表記が同一となる方向に表記を標準化」は、従来からの形態素解析、構文解析、意味解析、指示語解析、所定言語への翻訳等を用いることができ、結果は、所定の自然言語形式の他、JSON形式(ただし、格の種類(主格、目的格・・・)によってソートされている)や従来のPROLOG形式として記憶することもできる。
意味の解析は、変数を含まない(すなわち固定文字列の)リテラルのほうが正確性を期待できるが、変数を含むリテラルについても、最尤度(構文)仮説を採用した意味解析結果(ただし変数部分が残る)を用いて標準化すること等も一定の精度では可能である。
これにより、同一の意味をもつ自然言語の表記ゆれ(標準化方針によっては外国語からの翻訳等による標準化を含んでもよい)にも実質的に対応することが可能となる。
変数を含むリテラルを真にする変数の値又は変数を含まないリテラルの真偽を、
該リテラルだけでなく処理の対象とする論理プログラムの範囲を指定する情報と関連づけて
前記記憶又は照合することを特徴とする
請求項1から4のいずれか一項に記載の方法
を提供する。
「該リテラルだけでなく処理の対象とする論理プログラムの範囲を指定する情報と関連づけて」とは、
例えば、
「変数を含むリテラルを真にする変数の値又は変数を含まないリテラルの真偽」への
オーダードmap型のキーとして
「リテラルの表記」と「参照した(単数又は複数の)論理プログラムのURIパス列をソートしたもの」との連接を
用いることができる(ここで、あえてソートするのは、記載順のゆれにより実質同じ論理プログラム(のURIパス)集合が泣き別れとなることを避けるため)。
これは、例えば、ccashがオーダードmap型の変数であるとすると、「ccash["\1は¥2が¥1を好きなので好き___\\社内共有\見込み客リスト.txt___https://hoge1.jp/love.txt___https://hoge2.jp/love.txt"]="{(太郎,花子),(次郎,小百合)}"」とすること等である(この場合の「___」は区切りを示す)。
これにより、変数を含むリテラルを真にする変数の値又は変数を含まないリテラルの真偽をもとめる根拠となる論理プログラムが動的に(=探索/推論処理中に(例えば、特許文献2の動的読込の場合))又は経時的更新により変わるような場合(このようなときは論理プログラムのリビジョン番号を明示したURIパスを採用してもよい)にも、根拠となる論理プログラムの変化による答えの変化の可能性を正しく反映した健全な高速化を行うことができる。
変数を含んだ文字列をリテラルとして許容する論理プログラムをコンピュータが処理する方法であって、
サブクエリ(質問文そのものであってもよい)の結果をキャッシュしておき、
実質同じサブクエリが発生したときに再計算せずに該当するキャッシュを用いることを特徴とする方法
を提供する。
「サブクエリ」とは、例えば、PROLOGのホーン節のヘッド(クエリにマッチしたもの)をそのホーン節のボディ部の各条件(構成要件)へと一つ一つ展開するときにできる新たなクエリ(サブゴールとも呼ばれるもの)をいう。PROLOGに限らず、SLD導出を行うものや、構成要件を用いた論理プログラミング言語では、サブクエリに該当するものが存在し、本発明を適用可能である。
「実質同じ」とは、リテラル中に出現する同じ変数を同じ数字のエスケープ文字等(「数字」は最初に出現する順番(1、2、・・・など)に置き換えたものが同じ文字列になること、等をいう。
これにより、前記した主な課題を達成することになるが、
変数を含んだ文字列をリテラルとして許容する論理プログラムにおいては、
通常の関数型プログラミング言語における引数に応じた関数値のキャッシュ等に比べて、
さらにはPROLOGのように格構造を想定したプログラミング言語における計算結果のキャッシュ等(ただし、手続き的解釈が明確に定義されている言語では不適切であり、当該発明者はそのような先行技術を知らない)に比べて、
狭い定義域(「実質同じ」クエリ)の呼び出し(真偽又は解の計算)が何度も繰り返される(=再計算される)ことが多くなりがちである。
したがって、
変数を含んだ文字列をリテラルとして許容する論理プログラムにおいては、
他のプログラミング言語に比べてこのようなキャッシュ(クエリ→真/偽又は変数を真とする値(解)集合)が極めて有効となる。
一方で、このようなキャッシュ機構は、
従来のディスクキャッシュ(定義域が物理アドレスであり値域が固定長)等と比して、
定義域の形式が、「変数を含んだ文字列を許容するリテラル(同一変数の複数回出現も許容)」という、極めて複雑で目新しい(したがって離散数学的/集合論的な性質が不確かで、同定法(実質同じであることを計算する方法)もこれまで不明であった)クエリ形式であり、基礎となっているPROLOGが閉世界仮説を採用して偽となるリテラルを積極的に定義しない方針であったりカットオペレータ(!)やfailにより再計算をある程度制御できたりしていたため、そもそもキャッシュする(計算して偽だったことも含めて大域的に文脈を問わずに記憶している)という発想が極めて生まれにくいものであった(実現困難かつ想到困難)。なお、従来のPROLOG等はメモリが少ない時代に発達したものであり、リテラルを真にする変数の値(解)集合(極めて大きくなる可能性のあるオブジェクト)をキャッシュするという発想が生まれにくい、ということもあった。
そんななか、本発明は、上記した標準化による同定方法を初めて与えることによって、実現困難かつ想到困難であった変数埋め込みリテラル型クエリのキャッシュ機構を実現可能にし、その必要性、有用性、有効性(再帰処理が多く含まれるある論理プログラムに問う実験では処理時間が60分の1になった等)も示したものである。
リテラルの計算に手続き的解釈を行う必要のあるルールが介在していたかどうかを示すフラグを有し、
フラグが真のときに再計算することを特徴とする
請求項1から6のいずれか一項に記載の方法を
提供する。
手続き的解釈の例としては、グローバル変数の定義(更新を含む)、論理プログラムの追加(ユーザーごとの文脈(例えば、「今日は体調がよい」)の追加や外部プログラムの追加ロード等)・削除・更新(ユーザーや状況や問題や日時ごとのカスタマイズ等)、print文やグラフィック文や発生文やメール文等の表示その他の出力に影響を与えるもの、等が考えられる。複合的なものとしては、コンピュータが推論の経過に応じて動的に質問してそれにユーザーが答えた内容によって論理プログラムに行が一時的に追加されたり、既存の行の内容が更新されたり削除されたりするいわゆる「逆質問文(「?今日は体調がよい」「?$Bは友達」等)」(特許文献3参照)も手続き的解釈に含めることができる。
これにより、必要な手続き的解釈(場合によっては論理プログラム自体が変わり値も変わる(なお、論理プログラム自体がかわるときは、そのテキスト全体のハッシュ値等をmap型変数やキャッシュのキーとしてリテラルの後かつURIパス列の前等に追加する仕様としてもよい))を行いながら高速化することができる。
前回計算した時から対象とする論理プログラムに変更があったかどうか計算するデータ構造を有し、
変更があった場合に記憶された値を用いずに再計算を行う
請求項1から7のいずれか一項に記載の方法を
提供する。
「データ構造」の例としては、キャッシュ(関連づけて記憶)した日時分秒ミリセカンド/マイクロセカンドを「真偽又は変数を真にする解集合」と一緒に記憶しておき、かつ、対象とする論理プログラムの変更日時分秒ミリセカンド/マイクロセカンドを記憶しておき、前者が後者より後の場合には、キャッシュ(関連づけて記憶した値)を用い、そうでない場合は再計算するようにすればよい。この場合、日時分秒ミリセカンド/マイクロセカンドは値側に格納する。ミリセカンド等はキーとしての特定が難しいからである。
また、日時分秒ミリセカンド/マイクロセカンド等でなく単純にユーザーごとのリビジョン番号等をデータ構造として用いることもできる(図6)。この場合、ユーザーIDとリビジョン番号は、キー側に格納する。ユーザーIDとリビジョン番号はフォークした論理プログラムと関連づけて記憶したユーザーIDとリビジョン番号から自明なためである。
いずれにしても、対象とする論理プログラムごとに変更があったりなかったりする場合に、キャッシュの全体をクリアすることなく高速化が可能となる。
真偽や解集合の導出に用いたルール、事実又は文脈を明示する必要がある場合に、
真偽の証明経路ごと又は解集合に含まれる解ごとに
あえて再計算させるようにした
請求項1から8のいずれか一項に記載の方法を
提供する。
「文脈」とは、リテラルに含まれる変数の一部又は全部が、それ以前の単一化や(ヘッドの変数からボディー部の変数への部分的/全体的)束縛によって埋められた状態で(真偽又は解集合が改めて)計算されるその動的な状態をいう。
これにより、いわゆる「別解」となる証明や、各解ごとの根拠となるルールや事実や文脈のツリー表示を、高速化が要求される中でも丁寧に行うことができる。
かかる方法を実施する
コンピュータプログラムを提供する。
かかるコンピュータプログラムを用いた
装置を提供する。
===
<特許文献1の課題> 自然言語に変数を埋め込む形式で表現した知識をコンピュータでPROLOG同様に自動処理することを実現可能にし、述語論理レベルの網羅的な演繹や解探索(自動単一化処理、自動導出処理、そのための後ろ向き推論、バックトラック)を実現すること。
変数が格構造に縛られない利点を十分に生かし、処理を高速化し、証明や学習等のため結果を見やすく表示すること。
<特許文献1の解決手段(概要)>
人間が、PROLOGにおける「事実」、「ルール」又は「ゴール」の入力にあたり、PROLOGにおける「リテラル」にあたる内容の定数部分と変数部分とを文字種、デリミタ又はエスケープ文字により区別してコンピュータに入力し、
コンピュータが、文の主部、述部等の境界をまたがりうるものとして変数を取扱いながら、その入力に含まれる文の自動単一化処理、自動導出処理又はその両方を行う。
変数を含みうる文であるパターンと、変数を含まない文である定数文字列との単一化を、パターンに最初に出現する変数の最長一致解を求めて、該最長一致解の文字列を後ろから空文字になるまで削る過程を該パターンに代入してできる
各新たなパターンについて、該新たなパターンができる前提となった削る過程の解の各状態をそれぞれ記憶しながら、再帰的に同様に変数がなくなるまで繰り返し、変数がなくなったときに単一化した各途中の解の状態を結合して各単一化の答えを得る。
パターン中の固定文字列が最長一致解を削る過程の文字列に含まれるか等を検出して高速化する。
パターン対パターンの単一化は語頭や語尾の一致に着目して高速化する。全探索の具体的手法も提供する。
<特許文献1の解決手段(全文、ただし一部本発明と混同しないように加筆・修正)>
(0009)
本発明は、かかる課題に鑑みてなされたものであり、特許文献1の請求項1は、
コンピュータが、論理型プログラミング言語PROLOGの機能の一部又は全部を自動的に行う方法であって、
人間が、PROLOGにおける「事実」、「ルール」又は「ゴール」の入力にあたり、PROLOGにおける「リテラル」にあたる内容(以降、「文」と呼ぶ)の定数部分と変数部分とを文字種、デリミタ又はエスケープ文字により区別してコンピュータに入力すること、
コンピュータが、文の主部、述部、主語、述語、目的語、補語、連用修飾語、連体修飾語又は文の境界をまたがりうるものとして変数を取扱いながら、上記「事実」、「ルール」又は「ゴール」の入力に含まれる文の自動単一化処理、自動導出処理又はその両方を行うこと、
を特徴とする処理方法を提供する。
ここで、「人間が、・・・定数部分と変数部分とを文字種、デリミタ又はエスケープ文字により区別してコンピュータに入力する」とは、人間が本発明によるアプリケーションソフト(処理系)の入力欄内やコマンドプロンプト後等に(フロントエンドプロセッサ等を介して又は介さずに)直接入力すること、インターネットブラウザや文章編集ソフト等からコピーペーストやカットペーストすること、別途入力して保存してあったテキストファイル等を読み込んだり、引用したり、参照したりすること等を含む。
また、「コンピュータが、文の主部、述部、主語、述語、目的語、補語、連用修飾語、連体修飾語又は文の境界をまたがりうるものとして変数を取扱い」とは、日本語等の助詞等や英語等の前置詞等を介した明示的な区切りのある格構造(構文解析結果や意味解析結果の階層構造に該当するものを含みうる)の境界(明示的な区切り)をまたがりうるだけでなく、英語等の例えばSV形式・SVO形式・SVOO形式・SVOC形式のSとVの境界、VとOの境界、VとCの境界等をまたがり得、重文や複文の文の境界等をもまたがり得るものとして取り扱うモードを含む(逆に、取り扱わないモードがあってもよい)。これらの場合、変数に入り得る解候補として、文全体や、文全体を構成する文字列から文としての文法構造による区切りの単位を無視して任意の部分文字列を抽出したもの、さらには階層的な参照構造をもつ複文・重文やもっと長い論文等の全体や、さらにそれらの任意の部分文字列が対象となる(なお、「文の境界」をもまたがりうるものとして取り扱う場合であって、知識源の集合を扱う(例えば、ファイルにまとめた知識源の集合を一括して読み込む、書き込む、参照する、等する)場合には、文の境界「以外」に知識源どうしの区切りが必要となるため、このような区切りとして、例えば、改行コードやタブコード等を用いることができる)。
これにより、自然言語に変数を埋め込む形式で表現した知識や情報も、普通の文章形式の知識や情報も、それらの間での現実的な相互活用の可能性が十分に開けた一元的な知識源として、両者を特に区別せずにコンピュータで自動処理することが可能になる(上記「困難性A」の克服)。
「現実的」な相互作用の可能性が「十分」に開けるためには、コンピュータによる自動処理が検索処理系として備えるべき1)検索式(パターンを指定する表現)の簡便性、2)十分な適合率(解の正確性)、3)十分な再現率(解候補を抽出する上での網羅性)を備えていなければならないが、本発明では、文中の自由な(すなわち、文法や意味の区切りに制限されない)場所に変数(複数種類でもよく複数回でもよい)の埋め込みを許容し(簡便性を確保し)つつも、PROLOGの知識処理手順(と内在する知識解釈方針)に基本的に沿うことにより、他の処理系におけるようなハイブリッドな知識処理手順(と、そのハイブリッドな処理手順に対応する複雑な知識解釈方針)によって起こりうる適合率(解の正確性)低下のリスクを回避しつつ、「文の主部、述部、主語、述語、目的語、補語、連用修飾語、連体修飾語又は文の境界をまたがりうるものとして変数を取扱」うことにより、自然言語の区切り表現(読点、句読点、カッコ、コンマ、ピリオド、等)や修飾的なフレーズ(形容詞句、副詞句、必須でない格の表現、等)による指定パターンの泣き別れ出現が原因となる不当な不一致(正規表現的なアンマッチ)を防ぎ、格構造の明示されない表層的な文字列表現間(検索式と知識源の間)での一定の再現性(解候補を抽出する上での網羅性)を確保可能としている。また、知識源となった自然言語の正確な文脈(前後の文字列)を損ないにくい一体的・連続的な引用・抽出(変数への解候補としての)も可能となり、結局、その透明性・単純性により推論の実質的な健全性(根拠や推論経緯の正当性)の確認・検証が手軽かつ容易となり、根拠がいつも明確であるという現実的な安心感を利用者にもたらし、全体として、変数が格構造に縛られない(さらに、格構造のルール(出現順序等)について知らなくてもよく、引数の順番が間違っているかもしれないという不安もない)という仕様の利点を十分に生かしきることを可能にする。
なお、本発明は日本語(一文字の情報量が多く、単語の間にスペースがない)を第一の対象にしているため、文字を処理単位、区切りの単位としている内容が多いが、英語等(一文字の情報量が少なく、一文の文字数は多いが、単語の間にスペースのあるもの)は、スペースで区切った単語を単位として同様の処理をすることも可能である。
(0010)
また、特許文献1の請求項2は、
前記自動単一化処理において、
変数を含みうる文であるパターン(定数部分と変数部分とを文字種、デリミタ又はエスケープ文字により区別したもの)と、変数を含まない文である定数文字列との単一化を、
パターン(例:$Xと$Yは$Zが好き)に最初(又は最後)に出現する変数(例:$X)の最長一致解(例:太郎と次郎)を求めて、該最長一致解の文字列を後ろ(又は前)から空文字になるまで削る過程(例:太郎と次郎>太郎と次>太郎と>太郎>太>空)を該パターンに代入してできる各新たなパターン(例:「太郎と次郎と$Yは$Zが好き」>「太郎と次と$Yは$Zが好き」>「太郎とと$Yは$Zが好き」>「太郎と$Yは$Zが好き」>「太と$Yは$Zが好き」>「と$Yは$Zが好き」)について、該新たなパターンができる前提となった削る過程の解の各状態($X=太郎と次郎>太郎と次>太郎と>太郎>太>空)をそれぞれ記憶しながら、
再帰的に同様に変数がなくなるまで繰り返し、
変数がなくなったときに単一化した各途中の解の状態(例:真($X=太郎と次郎,$Y=三郎),真($X=太郎,$Y=次郎と三郎))を結合して各単一化の答え(例:答え1=($X=太郎と次郎,$Y=三郎),答え2=($X=太郎,$Y=次郎と三郎)を得ることを特徴とする
特許文献1の請求項1に記載の処理方法を提供する。
ここで、「(又は最後)」は「(又は前)」に対応しており、最後に出現する変数から代入するときは、削り始めが前からとなる必要があることを意味する。
これにより、最長一致解から最短一致解に至るすべての可能性について確実に網羅した各解候補の状態を検証し、網羅的な答え(さらに絞りこまれた解候補の集合)を提供することが可能になる。
(0011)
また、特許文献1の請求項3は、
空文字になるまで徐々に削るかわりに、別途求めた最短一致解までしか徐々に削らないことを特徴とする
特許文献1の請求項2に記載の処理方法を提供する。
これにより、最短一致解未満の長さから「空」文字までの解探索の計算を節約することができ、自動処理の高速化が可能となる場合がある。
(0012)
また、特許文献1の請求項4は、
空文字になるまで徐々に削る際、
パターン中で該変数が最初(又は最後)に出現した直後(又は直前)の固定文字である1文字C(直後(又は直前)が別の変数でその解が空文字でないときは該別の変数に解候補として代入されている解候補の最初(又は最後)の1文字C)が該最長一致解に含まれる場合に、
該最長一致解の文字列の最後(又は最初)からそのCに最初にあたるまでの部分文字列をそのCを含め削ることを特徴とする
特許文献1の請求項2又は3に記載の処理方法を提供する。
ここで、「(又は最後)」は「(又は直前)」に対応しており、最後に出現する変数から代入するときは、削り始めが前からとなる必要があることを意味する。
これにより、変数の直後(又は直前)の固定文字にマッチしない解候補の列挙とその解候補を前提とした探索を節約することができ、自動処理の高速化が可能となる場合がある。
(0013)
また、特許文献1の請求項5は、
前記自動単一化処理又は自動導出処理において、
前記「ゴール」(「サブゴール」を含む。以下同じ)となる束縛情報を求める際、
該「ゴール」を構成する各文について独立して束縛情報を求め
各束縛情報の積集合が空でない場合に戻り値真とその積集合を返す
特許文献1の請求項1から4のいずれか一項に記載の処理方法を提供する。
ここで、束縛情報とは、各変数に同時にそのような解候補を代入してみたか/すべきかということを示す情報である。各変数への一つの束縛の仕方を示す束縛情報は、「,」をAND結合と解釈することにより、「変数名1=値1,変数名2=値2,・・・,変数名N=値N」といったリスト形式で表現することができる一方、複数の束縛の仕方は、そのようなリストの集合として、あるいは、「,」ではなくAND/OR結合を明示して複数束縛間の共通部分をくくりだした形や、複数束縛の全体を標準化した連言標準形や選言標準形で表現することができる。
これにより、同時に満たすべきパターン(文)が複数あり、パターン(文)間で同名の変数には同じ解が入るべきとする問題形式の場合(例えば、ユーザからのそのようなAND結合問合せや、ルールのボディ部に複数の文がある場合)に、ルールのより右側のパターンについて、より左側のパターンの各単一化結果ごとに多大な全文探索処理を無駄に繰り返す可能性がすくなくなり、ボディ部をバックトラックしながら深さ優先探索する非効率(変数を自然言語に埋め込む形式においてより顕著な非効率)を回避し、同時に満たすべき各パターンごとの処理を単純化することができる。また、推論過程の表示や検証(完全性や健全性)をわかりやすく、容易にする。また、ルールの意味として必要な直観にとって余計であり定義されるべきでなかった順序性(ボディ部の文間の)が推論過程に副作用を与えることを防ぐことができる。
(0014)
また、特許文献1の請求項6は、
前記自動単一化処理又は自動導出処理において、
前記「ゴール」となる束縛情報を求める際、
既存の束縛情報を最初に空とし、
「ゴール」が含む文集合を、既存の束縛情報の適用下で該一文が真となりうるかと該なりうるための追加の束縛情報について自動計算して該追加の束縛情報を該既存の束縛情報に加えながら該一文を除いて再帰的に小さくしていき、
真となりうるまま該文集合が空集合になったときの既存の束縛情報を「ゴール」となる束縛情報とする
特許文献1の請求項1から4のいずれか一項に記載の処理方法を提供する。
ここで、「再帰的に小さくしていき」とは、再帰が深くなるほど文集合が小さくかつ束縛情報が複雑になる(より多くの変数が束縛され、束縛する値の範囲がより絞られる)よう、例えば、C言語で再帰呼び出しをする処理や、独自に宣言し定義した深さ優先探索用のスタック構造(構造体の配列とスタックポインタ等)によって同等の再帰的処理を実現することをいう。
これにより、変数を自然言語に埋め込む形式で表現された、同時に満たすべき複数パターンのAND結合からなるオープンクエスチョンを自動処理する問題を、より単純かつ再帰的な同一構造を持つ部分問題へとシンプルに変換し、推論過程の表示や検証(完全性や健全性の)を容易にする。
(0015)
また、特許文献1の請求項7は、
前記自動単一化処理又は自動導出処理において、
変数を含まないパターンと変数を含まない事実との単一化を行う場合、
パターンと事実が文字列として一致する場合に真を返す、又は
パターンと事実が文字列として一致しない場合に偽を返す
特許文献1の請求項1から6のいずれか一項に記載の処理方法を提供する。
これにより、シンプルかつ迅速に探索を行うことができる。
なお、「変数を含まない事実」が句点等で区切られた複数の文を含む場合。「文字列としての一致」は、パターンの文字列が事実の文字列の部分に一致することであってもよいとするモードを設けることもできる。
これにより、同型の複数の情報を一つの事実にまとめて表現して探索の対象とすることができる。また、複数要素間のなんらかの順序性(例えば、大きさ、貴重さ、古さ・・・等)も表現しやすくなる。
(0016)
また、特許文献1の請求項8は、
前記自動単一化処理又は自動導出処理において、
変数を含まないパターンとホーン節の変数を含まないヘッド部との単一化を行う場合、
パターンとヘッド部が文字列として一致する場合に、該ホーン節のボディ部をサブゴールとして特許文献1の請求項5又は6に記載の処理方法を適用した結果を返し、
一致しない場合に偽を返す
特許文献1の請求項1から7のいずれか一項に記載の処理方法を提供する。
これにより、変数を自然言語に埋め込む形式で表現するルールのヘッドが変数を含まない場合の健全な機械的解釈と、シームレスでわかりやすくかつシンプルで統一的な処理メカニズムと、対応する推論過程の説明を与えることができる。
(0017)
また、特許文献1の請求項9は、
前記自動単一化処理又は自動導出処理において、
変数を含まないパターンと変数を含むヘッド部をもつホーン節との単一化を行う場合、
特許文献1の請求項2から4のいずれか一項に記載の処理方法における「定数文字列」として当該パ
ターンを用いかつ同処理方法における「パターン」として当該ヘッド部を用いて処理して求めた各束縛情報について、
当該ホーン節のボディ部に適用したものを特許文献1の請求項5又は6に記載の処理方法の「サブゴ
ール」として処理した結果が真となるものが存在すれば真を返す、又は
存在しなければ偽を返す
特許文献1の請求項1から8のいずれか一項に記載の処理方法を提供する。
これにより、変数を自然言語に埋め込む形式で表現するルールのヘッドが変数を含み、このルールを起動したパターンが変数を含まない場合に、ボディ部の変数の束縛範囲を事前に制限して、真偽判断の処理を高速化することができる。
また、健全な機械的解釈と、シームレスでわかりやすくかつシンプルで統一的な処理メカニズムと、対応する推論過程の説明を与えることができる。
(0018)
また、特許文献1の請求項10は、
前記自動単一化処理又は自動導出処理において、
変数を含むパターンと変数を含まない事実との単一化を行う場合、
特許文献1の請求項2から4のいずれか一項に記載の処理方法における「パターン」として当該パタ
ーンを用いかつ同処理方法における「定数文字列」として当該事実を用いて処理した結果を返す、
特許文献1の請求項1から9のいずれか一項に記載の処理方法を提供する。
これにより、パターンと(静的な)事実との間のすべての解候補(格変数への)が洗い出されて「結果」として返されるため、上記「困難性A」克服のための基礎的な機構をシンプルに与えることができ、推論過程の可視化や検証だけでなくさらにはルールの修正等といったユーザーの手を介した学習をも容易にする。
(0019)
また、特許文献1の請求項11は、
前記自動単一化処理又は自動導出処理において、
変数を含むパターンと変数を含まないヘッド部をもつホーン節との単一化を行う場合、
特許文献1の請求項2から4のいずれか一項に記載の処理方法における「パターン」として当該パタ
ーンを用いかつ同処理方法における「定数文字列」として当該ヘッド部を用いて処理した結果を真とする束縛情報(C)が存在する場合で、かつ、当該ホーン節のボディ部を請求項5又は6に記載の処理方法の「サブゴール」として処理した結果が真の場合に当該束縛情報(C)とともに真を返す、
特許文献1の請求項1から10のいずれか一項に記載の処理方法を提供する。
これにより、変数を含むパターンと(変数を含まない静的な)ヘッドとの間のすべての解候補(各変数への)が洗い出されて「結果」として返されるため、上記「困難性A」克服のための基礎的な機構をシンプルに与えることができ、推論過程の可視化や検証だけでなくさらにはルールの修正等といったユーザーの手を介した学習をも容易にする。
また、より単純かつ再帰的な(または相互再帰的な)同一構造を持つ部分問題へとシンプルに変換し、推論過程の表示や検証(完全性や健全性の)を容易にする。
また、変数を自然言語に埋め込む形式で表現するルールのヘッドが変数を含まない場合の健全な機械的解釈と、シームレスでわかりやすくかつシンプルで統一的な処理メカニズムと、これらに該当する推論過程の説明を与えることができる。
(0020)
また、特許文献1の請求項12は、
前記自動単一化処理又は自動導出処理において、
変数を含むパターンと変数を含むヘッド部をもつホーン節との単一化を行う場合、
パターンとヘッド部の頭、尾又は両方に存在する文字数分の固定文字が一致していない場合に偽を返す、
特許文献1の請求項1から11のいずれか一項に記載の処理方法を提供する。
これにより、一律の探索に比して、明らかに大幅な計算量節約と処理速度向上が図れる。
(0021)
また、特許文献1の請求項13は、
前記自動単一化処理又は自動導出処理において、
変数を含む第一のパターンと変数を含むヘッド部をもつホーン節との単一化を行う場合、
パターンとヘッド部の頭及び尾に存在する文字数分の固定文字が一致している場合、
特許文献1の請求項5又は6に記載の処理方法における「サブゴール」として当該ホーン節のボディ
部を適用した結果が真となる各束縛情報により当該ホーン節のヘッド部を束縛して得られる各第二のパターンについて、
第二のパターンが変数を含まない場合に、
特許文献1の請求項2から4のいずれか一項に記載の処理方法における「パターン」として第一の
パターンを用いかつ同処理方法における「定数文字列」として第二のパターンを用いて処理した結果を返す、
請求項1から12のいずれか一項に記載の処理方法を提供する。
ここで、「第二のパターンが変数を含まない場合」とは、ホーン節(ルール)において、ヘッド部に含まれるすべての変数がボディ部「にも」含まれており、ボディ部のすべての変数が定数(固定文字列)で束縛された結果としてヘッド部のすべての変数も定数(固定文字列)で束縛(代入)されたことによりヘッド部の変数が消えてヘッド部が定数文字列と見なせるようになったことをいう。
これにより、変数を含むパターンと変数を含むヘッド部をもつホーン節(ルール)との単一化をシンプルな計算モデルにより、ユーザーがトレースしやすい流れで機械的・自動的に行うことができる。
すなわち、変数を含むパターンと変数を(各束縛情報により)含まなくなった(=定数文字列化した)ヘッド部との間のすべての解候補(パターンの各変数へ代入すべきもの)を洗い出して「結果」として返す形に、元々のより複雑な問題(変数対変数の単一化)を帰着(問題を変換)させることにより、上記「困難性A」克服のための基礎的な機構をシンプルに与え、思考プロセスとしても表現しやすいものにできている。また、この「帰着(問題の変換)」に当たって、より単純かつ再帰的な(または相互再帰的な)同一構造を持つ部分問題へとシンプルに変換しているため、推論過程の可視化や検証(完全性や健全性の)だけでなくルールの修正等といったユーザーの手を介した学習をも容易にする。 結局、変数を自然言語に埋め込む形式で表現するルールのヘッドが変数を含む場合の健全な機械的解釈と、シームレスでわかりやすくかつシンプルで統一的な処理メカニズムと、これらに該当する推論過程の説明を容易に与えることができる。
(0022)
また、特許文献1の請求項14は、
変数を含む事実が入力されることをコンピュータが制限することを特徴とする
特許文献1の請求項1から13のいずれか一項に記載の処理方法を提供する。
ここで、変数を含む事実(ルールでない知識源)とは、例えば、「$Xは$Xである。」(トートロジー的に恒真となる事実)や「$Xは$Yである。」(表層的な文型だけが合致していれば真となってしまう根拠のない事実)等がある。
これらがコンピュータに入力されることを制限することにより、パターン(変数を含みうる文)と事実(変数を含まない文(=固定文字列))との自動単一化処理の計算が単純になり、自動処理による高速な回答が可能となる。また、根拠のない事実を知識源に混入しにくくする。
(0023)
また、特許文献1の請求項15は、
前記ルールがいわゆるホーン節と同様の形式であり、ヘッド部がボディ部に出現しない変数を含むことをコンピュータが制限することを特徴とする
特許文献1の請求項1から14のいずれか一項に記載の処理方法を提供する。
ここで、「ヘッド部がボディ部に出現しない変数を含むことをコンピュータが制限する」とは、ヘッド部が「$Xは素敵」であり、ボディ部が「$Yは強い,$Yは$Zに優しい,$Zは子供,$Yは賢い」といったように、ボディ部のすべての文中の変数(この例では、$Yと$Z)が束縛(代入)されても、ヘッド部の変数(この例では、$X)が束縛されないまま残るようなルールが知識源として入力されたり、記憶されたり、起動されたりすることをコンピュータが制限することをいう。このようなルールは、事実の場合と同様に、ヘッド部に束縛されない変数を残すことにつながるため、健全でない推論結果を生み出しやすく、推論のスピードをも低下させる原因となる。
こうしたルールがコンピュータに入力されることを制限することにより、パターン(変数を含みうる文)とヘッド部(特許文献1の請求項13により変数を含まない文(=固定文字列)の集
合に帰着可能)との自動単一化処理の計算が単純になり、自動処理による高速な回答が可能となる。また、根拠のない推論結果を生み出しにくくする。
(0024)
また、特許文献1の請求項16は、
前記自動単一化処理又は自動導出処理において、
束縛されない変数が互いに残っているパターンとヘッド部又は事実との自動単一化処理を、
固定文字列として極小となる解の集合を求めて返すことにより行うことを特徴する、 特許文献1の請求項1から13のいずれか一項に記載の処理方法を提供する。
ここで、「固定文字列として極小となる解の集合」の例としては、「$Aは$B」と「$Cも$D」との間の自動単一化の結果として、{($A=”も”、$B=<空>、$C=<空>、$D=”は”),($A=空、$B=”も”、$C=”は”、$D=空)}という2つの解を提供することがある。
これにより、無限個の解が存在する場合にも解の例(特に最小のシンプルな例)を提供することが可能になる。
(0025)
また、特許文献1の請求項17は、
前記自動単一化処理又は自動導出処理において、
束縛されない変数が互いに残っているパターンとヘッド部又は事実との自動単一化処理を、
変数を含む文字列として極小となる解の集合を求めて返すことにより行うことを特徴する、
特許文献1の請求項1から13のいずれか一項に記載の処理方法を提供する。
ここで、「固定文字列として極小となる解の集合」の例としては、「$Aは$B」と「$Cも$D」との間の自動単一化の結果として、{($A=”$Cも”、$B=<自由>、$C=<自由>、$D=”は$B”),($A=<自由>、$B=”も$D”、$C=”$Aは”、$D=<自由>)}という2つの解を提供すること等がある。変数を束縛する値(変数に代入される値)の文字列長(ただし、変数が含まれる場合は変数の出現あたり1文字と見なす)の合計(解組みを通じた)が極小となるものと考えることができる。
これにより、無限個の解が存在する場合にも解の一般形を提供することが可能になる。
(0026)
また、特許文献1の請求項18は、
束縛されない変数が互いに残っているパターンとヘッド部又は事実との各文字列の頭及び尾に共通して存在する文字数分の固定文字が一致していない場合、
偽を返すことを特徴とする、
特許文献1の請求項16又は17に記載の処理方法を提供する。
これにより、単一化の可能性のない自動探索を節約し、自動処理を高速化することができる。
(0027)
また、特許文献1の請求項19は、
前記固定文字列又は変数を含む文字列として極小となる解の集合を求める際、
束縛されない変数が互いに残っているパターンとヘッド部又は事実とからなる両文字列(第一の文字列と第二の文字列とする)に含まれる各変数が、各文字列内では共通に束縛され、文字列間では独立に束縛されるものとしながら(あるいは、同名変数を共通に束縛するスコープを各文字列内のみ(あるいは、文字列間は変数のスコープ外)としながら)、
各変数に相手の文字列(第一の文字列中の変数には第二の文字列、第二の文字列中の変数には第一の文字列)のあらゆる部分文字列(<空>及び文字列全体も含む)又は自分自身を代入してみて両文字列が一致する場合を探す全探索により極小となる解の集合を求めることを特徴する、
特許文献1の請求項16又は17に記載の処理方法を提供する。
「又は自分自身を・・・代入」とは、文字列中の「$X」には「$X」そのものを代入することをいい、たまたま第一の文字列にも第二の文字列にも$X(互いのスコープは異なっている)が含まれるときは、第一の文字列の$Xと第二の文字列の$Xをあえて区別できるように(例えば、「$X1」と「$X2」、等として)代入することによっても明らかに健全な計算を行うことができる。
これにより、健全性と停止性(計算の有限性)を確保しながら解集合の一定の網羅性(問題(パターン対)の性質によっては完全性)を確保することができる。
(0028)
また、特許文献1の請求項20は、
束縛されない変数が互いに残っているパターンとヘッド部又は事実とからなる両文字列そのものではなく、
束縛されない変数が互いに残っているパターンとヘッド部又は事実との各文字列の頭及び尾に共通して存在する文字数分の固定文字を両者から除いて残る二つの文字列に相当する両文字列について、
特許文献1の請求項19に記載の処理をする処理方法を提供する。
これにより、解集合の一定の網羅性(場合によっては完全性)を保ちながら全探索の空間を小さくでき、処理が高速化される。
例えば、「石川の$Aは$Bが好き。」と「石川の$Cも$Dアイスが好き。」との間の自動単一化の過程として、そのまま解を探すのではなく、頭尾の共通部分を削除して ”$Aは$B”
と
”$Cも$Dアイス”
とした上で、全探索により「$A」と「$B」それぞれに、”$Cも$Dアイス”の全ての部分文字列(これは、$Cや$Dといった変数(${・・・}形式の変数も同じ)は1文字とすると、6文字であるため、6×(6+1)/2+1(<空>分)+1(自分自身を代入分)=23通りある)を代入しつつ、同様に、「$C」と「$D」それぞれに”$Aは$B”の全ての部分文字列(これは、同様に3文字であるため、3×(3+1)/2+1+1=8通りある)を代入してみてできる全ての両文字列(23×23×8×8通り)について、両文字列が一致した場合(例えば、(
”もはアイス”,
”はもアイス”,
”$Aはもアイス”,
”$Cもはアイス”,
”$Aはも$Dアイス”
※ちなみに”$Cもは$Bアイス”は一致しない
)となった場合の代入組の集合{
($A=”も”、$B=”アイス”、$C=<空>、$D=”は”),
($A=<空>,$B=”もアイス”,$C=”は”,$D=<空>),
($A=”$A”,$B=”もアイス”,$C=”$Aは”,$D=<空>),
($A=”$Cも”,$B=”アイス”,$C=”$C”,$D=”は”),
($A=”$A”,$B=”も$Dアイス”,$C=”$Aは”,$D=”$D”) }又は、各代入組の部分的代入の集合(例えば{
($A=”も”、$B=”アイス”),
($A=<空>,$B=”もアイス”),
($A=”$A”,$B=”もアイス”),
($A=”$Cも”,$B=”アイス”),
($A=”$A”,$B=”も$Dアイス”)
})
を解として答えることができる。
なお、$A=”$A”や$B=”も$Dアイス”は、$Aや$Dが自由であり、そこにどのような文字列を代入しても単一化できる(すなわち、無限の解があるということと、その無限個の解(文字列)の制約(正規表現的な形)のあり方)を示すことができる。 (0029)
また、特許文献1の請求項21は、
各変数に相手の文字列のあらゆる部分文字列(<空>及び文字列全体も含む)又は自分自身を代入してみて両文字列が一致する場合を探す全探索により極小となる解の集合を求める際、
変数に代入する部分文字列に変数が含まれる場合に、当該部分文字列に含まれる変数を両文字列にそれまで存在しなかった新しい変数で置き換えながら、該新しい変数に対しての同様の代入も以後再帰的に行いながら両文字列が一致する場合を探す全探索を行うことを特徴とする
特許文献1の請求項19又は20に記載の処理方法を提供する。
これにより、自文字列内の固定文字を相手文字列内の変数を介して反射的に自文字列内の変数に代入した解をも探す必要のある性格の問題(例えば、両文字列={”$Xは$X”,”い$Yう”}の場合では、解候補として($X=”いう”,$Y=”うはい”)を列挙できなければならない)について、解探索の健全性を維持したまま、解候補列挙の網羅性をより高めることができる。上の例では、両文字列(「パターン対」とも呼ぶ)={”$Xは$X”,”い$Yう”}から($X=”いう”,$Y=”うはい”)という解候補を列挙できることを、本発明により再帰的に($X=”い${Y1}う”)⇒(${Y1}=<空>)⇒($Y=”うはい”)という探索枝(探索木の一部であり、本発明に沿った幅優先探索の場合は有限回で生成可能である)を生成しうることによって、示すことができる。
「再帰的に・・・全探索」とは、例えば、各変数への各ありうる代入(前の特許文献1の請求項と同
じ)を再帰的に繰り返す幅優先探索をしながら一致する代入系列(例えば、上記の($X=”い${Y1}う”)⇒(${Y1}=<空>)⇒($Y=”うはい”)、等)を列挙することである。最初の代入のバリエーションは、両文字列中の変数の種類がそれぞれ2個と3個であり文字列の長さがそれぞれ6字と7字(変数はまとめて1字と数える)であれば、2個×(7×(7+1)/2+1+1)+3個×(6×(6+1)/2+1+1)=60+69=129通りとなる。これらの枝から派生するさらなる枝の最長深さが均等になるように幅優先探索を行う場合、代入回数等によるリミッター(上限値と比較するプログラムステップ等)を設けることにより、一回一回の探索を適当な計算量に制限することができる(再帰性によって保証されなくなった停止性や応答速度の確保)。なお、深さ優先探索とした場合にも、深さの制限や代入回数等によって計算量を制限することができる。いずれも自己再帰や相互再帰による無限ループを、再帰的な関数の呼び出しを管理するスタック構造(構造体の配列)等を設けて、先祖(より根方向)となる枝の呼出しパラメータ(その代入系列(代入文脈)に応じた両文字列の状態表現を含んでいてもよい)を現在の呼出しパラメータと比較したりすることにより回避することができる。また、両文字列の頭尾に存在する固定文字列が共通して存在する文字数分一致しているかどうかなどにより、単一化しえない枝の枝刈りを行うこともできる。なお、制限した計算量(例えば代入百万回や探索深さ20以内)の探索により解が見つからなかった場合に「解なし(精度:代入百万回かつ探索深さ20以内)」として、見つかった場合に、「($X=”いう”,$Y=”うはい”),(・・・),・・・(但し、精度:代入百万回かつ探索深さ20以内)」等として探索精度を明示しながらユーザに答えることもできる。また、代入の制限回数以内かつ制限探索深さ以内で明らかに全探索できた場合(完全性のある場合)には、その旨を「解なし(全探索済)」あるいは「($X=”いう”,$Y=”うはい”),(・・・),・・・(全探索済)」等と明示して、ユーザに答えることもできる。
(0030)
また、特許文献1の請求項22は、
変数に代入した結果についても、各文字列の頭及び尾に共通して存在する文字数分の固定文字を両者から除いて残る二つの文字列を、
「相手の文字列のあらゆる部分文字列(<空>及び文字列全体も含む)」の対象となるの「相手の文字列」として、探索が進むごとに、文字列の頭又は尾に存在する固定文字数が少なくすることを特徴とする、
特許文献1の請求項19〜21のいずれか一項に記載の処理方法を提供する。
これにより、探索を進めるごとに(先の枝にいくほど)枝の個数が少なくなり計算量を節約することができる。
(0031)
また、特許文献1の請求項23は、
前記固定文字列又は変数を含む文字列として極小となる解の集合を求める際、
束縛されない変数が互いに残っているパターンとヘッド部又は事実とからなる両文字列(第一の文字列と第二の文字列とする)に含まれる各変数が、各文字列内では共通に束縛され、文字列間では独立に束縛されるものとしながら(あるいは、同名変数を共通に束縛するスコープを各文字列内のみ(あるいは、文字列間は変数のスコープ外)としながら)、
各変数に、固定文字列(空文字を含む)又は変数を含む文字列を再帰的に代入してみて解の集合を求める処理方法であって、
代入してみる変数を相手文字列の頭又は尾が固定文字である自文字列の対応する頭又は尾の変数に限定し、
代入値を、該頭である場合には該頭の固定文字もしくは固定文字列に続く新しい変数又は<空>とし、該尾である場合には新しい変数に続く該尾の固定文字もしくは固定文字列又は<空>とし、
変数に代入した結果について、各文字列の頭及び尾に共通して存在する文字数分の固定文字を両者から除くことを繰り返す、
ことを特徴とする特許文献1の請求項16又は17に記載の処理方法を提供する。
これにより、頭及び尾の固定文字の存在に着目して解の列挙範囲を(探索の網羅性を損なわずに)大幅に制限すること可能になり、大幅な計算量節約と高速化が可能になる。 (0032)
また、特許文献1の請求項24は、
前記固定文字列又は変数を含む文字列として極小となる解の集合を求める際、
束縛されない変数が互いに残っているパターンとヘッド部又は事実とからなる両文字列(第一の文字列と第二の文字列とする)に含まれる各変数が、各文字列内では共通に束縛され、文字列間では独立に束縛されるものとしながら(あるいは、同名変数を共通に束縛するスコープを各文字列内のみ(あるいは、文字列間は変数のスコープ外)としながら)、
各変数に、固定文字列(空文字を含む)を再帰的に代入してみて解の集合を求める処理方法であって、
各文字列の頭及び尾に存在する文字数分の共通する固定文字を除いてできる両文字列中の固定文字種(変数の識別子やデリミタを除いた文字種)だけを用いてできる束縛情報を、束縛する値の文字列長の合計が小さいものから順に列挙していくことにより求める、 特許文献1の請求項16又は17に記載の処理方法を提供する。
これにより、一定の性質をもった問題については、効率よく解に到達し、列挙することもできる。
(0033)
また、特許文献1の請求項25は、
求めた「変数を含む文字列として極小となる解の集合」をもとに、
当該ホーン節の変数を当該変数を含む文字列で一時的に書き換えてできるホーン節により探索を継続する特許文献1の請求項19〜24に記載の処理方法を提供する。
これにより、パターンとホーン節(ルール)のヘッド部とが単一化するために必要であることが計算された制約(上記の例では、変数「$C」が”$Aは”という形の文字列で束縛(代入)されることでしか単一化しえないという制約の働くような単一化方針(例えば、上記最後の代入組の場合)もある)を、そのホーン節のボディ部の探索プロセスに伝播することができ、探索を効率化することができる。
(0034)
また、特許文献1の請求項26は、
求めた「変数を含む文字列として極小となる解の集合」をもとに、
「変数を含む文字列」の変数部分に、当該「変数を含む事実」の解組の集合としてあらかじめ定義された固定文字列組の集合の各要素を代入してできる固定文字列組の集合を返す、
特許文献1の請求項19〜25のいずれか一項に記載の処理方法を提供する。
これにより、変数(一個又は複数)を含む事実とその変数に埋めうる適切な答え(又は仮説)の集合とをひもづけたデータベース(例えば、「言葉方程式(登録商標)」「VLANK(登録商標)」中の知識源)と効率的に連携した解探索を行うことができる。また、似た文型をもつ大量の事実を、本発明の枠組みと連携させて効率的に管理することができる。
(0035)
また、特許文献1の請求項27は、
前記自動単一化処理又は自動導出処理において、
変数を含む第一のパターンと変数を含む第二のパターンとの自動単一化を行う場合、
両パターンの頭及び尾に存在する文字数分の固定文字が一致しており、かつ、同じ変数が各パターン内で一度しか出現しない場合、
無限個の解の存在を意味する情報を返す、
特許文献1の請求項1から26のいずれか一項に記載の処理方法を提供する。
(0036)
また、特許文献1の請求項28は、
特許文献1の請求項1から27のいずれか一項の方法を実行するための装置を提供する。
(0037)
また、特許文献1の請求項29は、
特許文献1の請求項1から27のいずれか一項の方法をコンピュータに実行させるためのコンピュー
タプログラムを提供する。
(特許文献1の発明の効果)
(0038)
本発明の効果は、各特許文献1の請求項について上述したとおりである。
(特許文献1の図面の簡単な説明)
(0039)
(図1)図1は本発明を最も効果的に実施するネットワークシステムの全体図である
。(実施例1)
(図2)図2は本発明を実施するコンピュータのハードウエア構成を示した説明図で
ある。(実施例1)
(図3)図3は本発明を実施する端末における画面表示の例を示した説明図である。
(実施例1)
(特許文献1の発明を実施するための形態)
(0040)
本発明は、ネットワークに接続された/接続されてないあらゆる種類のコンピュータ(クラウドサーバー、大型汎用機、デスクトップPC、ノートPC、携帯端末、本発明専用機)において実施することができるが、一般的なマルチタスク機能とウィンドウ機能をもちインターネットに接続されたPCにより実現した形態により説明する。
図1は本発明を最も効果的に実施するそのネットワークシステムの全体図であり、コンテンツ管理装置1は、利用者PC2又は利用者兼管理者PC2により、本発明で取り扱うコンテンツ(ルールや事実)の投稿を受け付け、所定のポリシーによって共有アクセス権やコンテンツ提供優先順位を制御しながらコンテンツを配信する公知のファイル共有サーバーでよい。利用者PC2は、その利用者ごとに、その信じる内容(や検討したい内容)を自然言語で表現したコンテンツ(ルールや事実)を本発明の方法に沿って入力して記憶し本発明の方法によって処理するコンピュータ、携帯端末等である。
図2は本発明で用いるコンピュータのハードウエア構成を示した説明図である。これは計算機の構成としては一般的なものであり、本発明の特徴は、不揮発性メモリ2hに記憶されたプログラム3及びコンテンツデータ4の指示や記載に従い自然法則を用いてCPU2eで処理される処理の内容、及び、利用者との対話プロトコル(書式)の在り方にある。
図3は本発明を実施する端末における画面表示の例を示した説明図である。図では「?$Aしない」という問い(オープンクエスチョン形式)に対して、図示しない記憶したリストLの1行目の「されていやなことはなるべくしない」という事実を用いて「$A =
されて嫌なことをなるべく/1/」という答えを列挙し、同様にリストLの9行目の「いじめをしない」という事実を用いて「$A = いじめ/9/」と答えている。
(0041)
このような実施形態においては、C++言語等を介して製造されたコンピュータプログラムにより、コンピュータ(PC等)に可能なあらゆる動作を実施させることができる。したがって、自然法則を用いたコンピュータの公知の基本的な動作(レジスタやメモリやストレージへの記憶・取り出し、四則演算、比較、等)や既に開発環境等の標準ライブラリとなっている一般的な機能(変数やN次元配列への代入・比較・コピー、文字列や数値の操作/比較/表示、リスト構造・キュー構造・ハッシュ構造・ベクトル型等の操作、バイナリ―サーチやソート操作、正規表現によるパターンマッチ操作、ネットワーク通信操作、等)の実現方法については、本発明の本質(新規性や進歩性につながる独自の構成)とも異なり、当業者にもよく知られているので、詳述はしない。一方、このような一般的な機能を組み合わせて、本発明に固有の処理をどのような操作順序や記憶の仕方(アルゴリズムやデータ構造)で実現するかについては、以下に詳述する。このアルゴリズム等の説明、上記した課題解決手段の説明及び本発明の図面の説明を提供して開発の参考とさせることにより、標準レベルの職業的プログラマであれば、標準的なアプリケーションプログラム開発技法(C++によるGUIアプリケーション統合開発環境、等)を用いて、本発明の方法をコンピュータに実施させることが明らかに可能となり、また、この方法のための装置やプログラムを作成することも可能となる。
(0042)
以下に示すアルゴリズムは、C言語/C++言語等を用いて所望の「関数」を新たに定義した上で関数呼出しを行うという標準的な構造化プログラミングをベースにしたアルゴリズムであり、当業者は、下記各関数の機能分担に応じた入出力や機能切り分けを行いながら(或いは、下記に示した仕様に沿って関数群をそのままコーディングすることにより)、本発明の解決手段に相当する処理手段(プログラムや計算機)を実現することが可能となる。
(0043)
■問い合わせPに対する知識リストLの処理アルゴリズム仕様
=====================================================================================================================
関数Q1(P:変数を含みうるパターン,L:知識リスト):★特許文献1の請求項に共通するメイン関数の特許文献1の実施例1★
{
1.Lの最初の行の内容B(事実又はホーン節)を取り出す。
ただし、Lが空の場合(最初の行が取り出せなかった場合)、偽を出力して終了。
2.変数の束縛情報Cの初期値を空とし、下記関数H(P,B,C)を呼出し、真となる(=マッチする)束縛情報(=解集合)Cを出力。
真(=マッチした)の場合
真(はい)を出力する(マッチした内容Bの行番号も添えて出力する)。
偽の場合
何もしない。
3.Lの次の行の内容B’が
ある場合
・B←B’とし、2に移動する。
ない場合
・2で真を一度も出力していない場合は偽(いいえ)を出力。
・終了。
}
(0044)
■問い合わせPに対する知識リストLの処理アルゴリズム仕様(事前固定文字列化版) =====================================================================================================================
関数Q2(P:変数を含みうるパターン,L:知識リスト):★特許文献1の請求項に共通するメイン関数の実施例2(事前固定文字列化版)★
{
(事前の固定文字列化)
1.{Lのみから演繹できるすべての文字列/その各文字列を演繹する根拠として用いたLの行番集合}を各行とする固定文字列テキストTを求める。
具体的には、上記関数Q1(”$A”,L)の出力系列(A=解1/根拠1,A=解2/根拠2,・・・)の要素を各行としてマージしたテキストTを求める。
求める途中で無限ループになる場合について、明示的な呼出管理スタック等を用いた無限ループ検出機能により演繹を部分的に省略する。
・例えば、ホーン節の真偽の確認をある変数束縛条件下でコンピュータが行う途中で
同じホーン節の真偽を同じ変数束縛条件下で確認しようとしていないかを、
構造体(確認中のホーン節識別子,現在の変数束縛条件)をメンバーとする呼出管理スタックを管理し、
呼出し時にスタックの根に向かって同じ組み合わせがないかリニアサーチすることにより
無限ループを検出する。
(固定文字列のみである故にQ1よりシンプルな方法(関数F)で解集合を求める) 2.テキストTの各行tにつき、下記関数F(P,t,C)が真となるCをすべて出力する。
(最終結果の出力)
3.Cが一つでもあれば真を出力し、なければ偽を出力する。
}
(0045)
■問い合わせPに対する、一の事実(固定文字列)又はホーン節B(但し、ヘッドに含まれるすべての変数がボディにも存在)の処理アルゴリズム仕様
=====================================================================================================================
関数H(P:変数を含みうるパターン,B:一の事実(固定文字列)又はホーン節,C:変数の束縛情報):★特許文献1の請求項1〜15の発明で使用する関数の特許文献1の実施例1−1★
{
Pが変数を含まない場合{
Bが事実である場合{
P=Bの場合は、真を返す。
そうでない場合は偽を返す。
}
Bがホーン節である場合{
Bのヘッド部が変数を含まない場合{
P=Bのヘッド部の場合は、関数D(Bのボディ部,E)の真偽を返す。
そうでない場合は偽を返す。
}
Bのヘッド部が変数を含む場合{
F(Bのヘッド部,P,C1)を真とする各C1について、
関数D(Bのボディ部にC1を適用したもの,E)の結果が真となるC1があれば、 真を返す。
そうでない場合は偽を返す。
}
}
}
Pが変数を含む場合{
Bが事実である場合{
F(P,B,C1)が真となるC1が存在すれば、そのようなすべてのC1をCに加えて真を返す。
そのようなC1が存在しなければ、偽を返す。
}
Bがホーン節である場合{
Bのヘッド部が変数を含まない場合{
F(P,Bのヘッド部,C1)を真とするC1が存在する場合で、かつ
関数D(Bのボディ部,E)が真であれば、そのようなすべてのC1をCに加えて真を返す。
そうでない場合は偽を返す。
}
Bのヘッド部が変数を含む場合{
★特許文献1の請求項12の発明を実施する場合★
//高速化の工夫(オプション)開始
PとBのヘッド部の頭及び尾に存在する文字数分の固定文字が一致していない場合{
偽を返す。
}
//高速化の工夫(オプション)終了
★特許文献1の請求項13の発明の実施★
PとBのヘッド部の頭及び尾に存在する文字数分の固定文字が一致している場合{
関数D(Bのボディ部,E)の結果が真となるE中のいずれかの束縛情報Gについて、 関数F(P,Bのヘッド部をGで束縛したもの(固定文字列になるはず),C1)を真とするC1があれば
そのようなすべてのC1をCに加えて真を返す。
そのようなC1が存在しない場合は偽を返す。
}
}
}
}
}
(0046)
■ホーン節のボディ部(又は変数を共有する重文の問い合わせ)の解集合の列挙アルゴリズム仕様
=====================================================================================================================
呼出例
→関数D("$Aと$Bは友達だ,$Aは人間,$Bは人間", E);
戻り例
←真(E=((A=花子,B=太郎),(A=太郎,B=次郎),(A=次郎,B=三郎)))
=====================================================================================================================
関数D(J:ボディ部(又は変数を共有する重文の問い合わせ),E:解集合):★特許文献1の請求項6の発明で使用する関数の特許文献1の実施例1−2A★
※ただし、知識源全体Lはグローバル変数に格納して参照可能とする
{
1.J中の最初の文Mを取り出す。最初の文が存在しない場合真を返す。
2.知識源全体Lに対して、前記関数Q1(M,L)又はQ2(M,L)を呼び出す。
結果が偽のときは
偽を返す。
真のとき
Mが変数を含まない場合
何もしない。
Mが変数を含む場合
Mを真とするためにとりうる束縛情報の集合Cを記憶する。
※真とするために束縛不要の変数は、その旨を明示的に示すこともできる。
※束縛値が無限集合でありながら真とするために一定の条件を要求する場合は、その条件を付記することもできる。
3.J中の次の文M’を取り出す。存在しない場合、真(E=束縛情報の集合C)を返す。
4.知識源全体Lに対して、前記関数Q1(M’,L)又はQ2(M’,L)を呼び出す。
結果が偽のときは
偽を返す。
真のとき
M’が変数を含まない場合
何もしない。
M’が変数を含む場合
M’を真とするためにとりうる束縛情報の集合C’と記憶してあった集合Cとの積集合を新たなCとする。
但し、元々の集合Cが空集合でなく積集合をとって空集合となったときは偽を返す。
※真とするために束縛不要の変数は、その旨を明示的に示すこともできる。
※束縛値が無限集合でありながら真とするために一定の条件を要求する場合は、その条件を付記することもできる。
5.3に戻る。
}
関数D2(J:ボディ部(又は変数を共有する重文の問い合わせ),E:解集合):★特許文献1の請求項6の発明で使用する関数の特許文献1の別の実施例1−2B(関数の再帰呼び出しを用い束縛情報を他の文に波及させることにより高速化を図ったもの)★
{
1.J中の最初の文Mを取り出す。Mが存在しない場合真を返す。
2.知識源全体Lに対して、Q1(M,L)又はQ2(M,L)を呼び出す。
結果が偽のときは
偽を返す。
真のとき
Mが変数を含まない場合
Jの次の文がなければ真を返し
あれば次の文を新たなMとし2に戻る。
Mが変数を含む場合
Jの次の文がなければ、とりうる束縛情報をEに格納して真を返し
あればとりうる束縛情報を集合Cとして記憶する。
3.Eを空にし、集合C中の各束縛情報Kについて
再帰呼び出しD2(KによりJの次の文以降を束縛してできるボディ部J’,E’)を実行する
結果が真のときは
Eに、真となったそのKかつE’を加える
4.各Kについて一度も真となっていないときは偽を返し、一度でも真となっているときは真(E)を返す
}
関数D3(J:ボディ部(又は変数を共有する重文の問い合わせ),E:解集合):★特許文献1の請求項5の発明で使用する関数の特許文献1の実施例1−3★
{
1.J中の最初の文M1を取り出す。最初の文が存在しない場合真を返す。
2.知識源全体Lに対して、Q1(M1,L)又はQ2(M1,L)を呼び出す。
結果が偽のときは
偽を返す。
真のとき
M1が変数を含まない場合
何もしない。
M1が変数を含む場合
とりうる束縛情報の集合C1を記憶する。
3.同様に、偽とならないうちはM2,M3・・・についてC2,C3・・・を求めていく。
偽となった場合は偽を返す。
4.残ったC1,C2,C3・・・Cnについて積集合Cを求めて、真(C)を返す。
}
(0047)
■問い合わせPに対する事実Sの多長一致解(複数も可)の列挙アルゴリズム仕様
=====================================================================================================================
呼出例
→関数F("$Aと$Bは友達だ","太郎と次郎と三郎は友達だ", "");
関数F(P:変数を含みうるパターン,S:定数文字列,C:変数の束縛情報):★特許文献1の請求項2の発明(ただし、「(又は最後)」と「又は前」を省いた実現例)で使用する関数の特許文献1の実施例1−4A★
{
(準備)
1.P中の変数の種類数Vと、出現する変数の名前N1,N2,・・・を出現順に求める
(Pがもともと変数を含まない場合への対応)
2.Vが0のときは、
⇒ P=Sのとき、真を返して終了。
⇒ P≠Sのとき、偽を返して終了。
(出力)
3.Vが1のときは、N1がP中に何回出現しようとも、PとSの単一化の解R1は1つしかないので、
⇒ マッチする場合、その唯一の解を「CかつN1=R1」として出力して、真を返して終了。
⇒ マッチしない場合、偽を返して終了。
※単一化そのものは、正規表現とのマッチ(同じ変数が二度以上出現する場合は後置参照あり)として実施可能
4.Vが2以上のとき
変数N1についての最長一致解R1で、P中の全てのN1を埋めてできるP’について 再帰呼び出しF(P’,S,CかつN1=R1)を実行
⇒ N1について最長一致解とした解集合が出力される
5.R1’←R1の最後の1文字を除いた文字列とし
P中の全てのN1をR1’で埋めてできるP’’について
再帰呼び出しF(P’’,S,CかつN1=R1’)を実行
⇒ N1について、最長一致解より1文字除いた解候補R1’とした解集合が出力される
6.R1’が
1文字以上の場合、(★特許文献1の請求項3では最短一致解の文字数より大きい場合)
⇒R1←R1’として5に戻る。
0文字の場合、(★特許文献1の請求項3では最短一致解の文字数である場合)
終了。
}
(0048)
関数F(P:変数を含みうるパターン,S:定数文字列,C:変数の束縛情報):★請求項4の発明で使用する関数の実施例1−4B★
//P中で変数が最初に出現した直後の固定文字列の最初の文字Cに着目して高速化の工夫その1をした関数F
{
(準備)
1.P中の変数の種類数Vと、出現する変数の名前N1,N2,・・・を出現順に求める
(Pがもともと変数を含まない場合への対応)
2.Vが0のときは、
⇒ P=Sのとき、真を返して終了。
⇒ P≠Sのとき、偽を返して終了。
(出力)
3.Vが1のときは、N1がP中に何回出現しようとも、PとSの単一化の解R1は1つしかないので、
⇒ マッチする場合、その唯一の解を「CかつN1=R1」として出力して、TRUEを返して終了。
⇒ マッチしない場合、偽を返して終了。
4.(高速化の工夫その2。この処理は5以降でカバーされるため省いてもよい。★この工夫2は、特許文献1の請求項にはしていない★)
Vが2以上のときで、
すべての変数(N1(=N),N2,・・・)について最長一致モードでマッチしてみた解と
すべての変数(N1(=N),N2,・・・)について最短一致モードでマッチしてみた解と
が同一(N1=R1,N2=R2,・・・)のとき
⇒ その唯一の解を「CかつN1=R1かつN2=R2かつ・・・」として出力して終了する
そもそもマッチしなかった場合、
⇒ 偽を返して終了。
同一でないとき
⇒ 5に続く
5.Vが2以上のとき
変数N1についての最長一致解R1で、P中の全てのN1を埋めてできるP’について 再帰呼び出しF(P’,S,CかつN1=R1)を実行
⇒ N1について最長一致解とした解集合が出力される
6.P中で変数N1の後すぐに変数N1(自分自身)が続くとき
⇒ 7以降で処理する
別の変数N2が続くとき
⇒ 7以降で処理する(ただし、7で1文字CはN2の解R2の最初の1文字とする)
固定文字が続くとき
⇒ 7以降で処理する
7.P中で変数N1が最初に出現した直後の固定文字である1文字C(直後が別の変数N2であるときはR2の最初の1文字C)が、
最長一致解R1に含まれる場合
⇒ 1)R1’←R1の文字列の最後からそのCにあたるまでの部分文字列を削除した文字列
⇒ 2)P’’←R1’でP中のすべてのNを埋めてできるパターン
⇒ 3)再帰呼び出しF(P’’,S,CかつN1=R1’)を実行
⇒N1について一段階だけ短めの解が存在すれば出力できるはず
最長一致解R1に含まれない場合
⇒ N1についてはより短い解の列挙が終わったので、終了。
8.R1←R1’として7に戻る。
}
=====================================================================================================================
PROLOGのカットオペレータやASSERT文を用いずに計算する場合(小学校向けプログラミング等は、簡単さが重要なので用いたくない)、図1に示すとおり何回(多いものは5回)も同じ計算(リテラルの真偽又は真とする変数値(解)を求めるための計算(単純な文字列マッチングも含む))を行うことになってしまう。わずか4行のプログラムですら最大5回の同じ計算がおこなわれるため、より大きいプログラムでのより大きな組み合わせ爆発を防ぐため、次の図3、図4のようなキャッシュを導入して、図2のような計算量に抑えることにする。
これは、同じリテラルの計算をキャッシュを用いて省略する(キャッシュしていた値を用いる)場合であり、明らかに計算量が節約できているのがわかる。
なお、別の実施例では「$A」という証明できるすべてのリテラル(固定文字列)について列挙する質問文が問われることがある。図1、図2の論理プログラムでは、3つの事実と1つのルールで証明できる内容がいずれも、実質的に「$Aは$Bの兄」という形式をしているため、答える形式は異なるものの、「$A」の結果と図2の「$Aは$Bの兄」の結果は、実質同じとなり、いずれも「太郎は次郎の兄」「次郎は三郎の兄」「三郎は四郎の兄」「太郎は三郎の兄」「太郎は四郎の兄」「次郎は四郎の兄」という6つの内容を答えることになる(また、「太郎は$Xの兄」と質問した場合は、太郎が兄である3つの「$X」のみを答えることになる)。
しかし、別の実施例として、「太郎は花子の夫」などといった事実が論理プログラムに含まれている場合は、「$A」という質問文ではこれが解答に含まれるが、「$Aは$Bの兄」という質問文の解答には含まれないことになる。
このようにキャッシュされる内容は、質問文によって大きく異なるが、論理プログラムによって証明できる全体が有限個の固定文字列集合の場合、「$A」の答えとなる固定文字列集合をあらかじめ計算して記憶して置き、各質問文を正規表現とみて(変数を(.+)や(.*)や後置参照(\1)(\2)...等とみて)マッチングをとって求めてもよい(高速化)。
また、任意の事実を論理プログラムに足すと論理プログラムで証明できる全体がどのように変化するかの差分をとるためにも、処理系が質問文を処理していない開いた時間に自動的に「$A」をもとめるようにしておいてもよい。また、このとき記憶したキャッシュ(「$A]のみがキーとなるのではなく、より具体的な様々なリテラルがキーとなってキャッシュされサブゴールの計算が行われて、初めて$Aの値(証明できる固定文字列の全体)が求められる)を、以降の質問文処理時に流用することにしてもよい。PROLOGや上記した実施形態の知能システムの基本的な意味論では、論理プログラムと質問文(ないしサブクエリ)が変化しない場合は、値(真偽又はリテラルを真にする変数値(解)集合)も変化しないからである。
基本的なPROLOGの構文と同様のスコープルールをもつ上記した実施形態のプログラミング言語では、同一の論理プログラムについては、変数の並び方が同じであれば、変数名が異なっても本質的に同じ答えとなり、共通のキャッシュでよいはずであるが、そうなっていない場合(すなわち、図3の「太郎は$Zの兄」と「太郎は$Yの兄」の場合等、変数名が正規化(統一)されていない場合)、このように多くのメモリ(及び計算量)を使用することになってしまう。そこで、図4のように変数名の正規化による高速化を実施するオプションを用意する。
このように変数の出現順に対応する名前をつける、などして正規化することにより、キャッシュに必要なメモリー量も対応する計算量も図3に比して大幅に節約できることがわかる。
Rは動的引用を示す矢印であり、この例では再帰的に2つの論理プログラム(P1,P2)が動的に追加ロード(一時的に追加ロードされて質問終了後に削除)されている。技術詳細は、特許文献2を参照されたいが、「Req <URIパス>」はボディ部の任意の位置に記載することができ、クエリ(又はサブクエリ)とヘッドがマッチしかつボディ部内のそれ以前の条件等がすべて真の場合にのみ<URIパス>で指定した論理プログラム(通常の自然言語テキストも可)を既存の論理プログラムの末尾に追加するように読み込み、以降のボディ部の処理についてのみ、その読み込んだ追加プログラムの影響を及ぼす(たとえば変数の解の数が増える)ものである。
図のP1...は省略のためのものであり、実際には、「\\社内共有\P1.jpl」であり、同様にP2は「http://hoge.jp/P2.jpl」である。前者は社内仮想VPN内ファイルサーバーの共有フォルダ内の社内限りで参照される論理プログラムであり、後者はインターネット全体に(=人類全体に)httpで公開された論理プログラムである。前者は社内の担当者が社内限りノウハウの共有のために更新し、後者はボランティア団体が特定の知識や情報の普及のために更新している。
論理プログラムP1の内容は参照関係がわかるように図式で示しているが、例として示している内容は上記実施形態では「$Aに$Xを供給可能 :- Req "\\社内共有\P1.jpl"; $Xは食べれる; $Aは$Xが好き;」であり、同様にP2は「$Yは食べれる :- Req "http://hoge.j/P2.jpl"; $Yは食べれる;」である。
キャッシュC1は、P1とP2を読み込んだ結果として、元の論理プログラムP0における「¥1は食べ物」というリテラル(正規化されている)を真にする変数「¥1」の値が「カレー」か「ラーメン」であることを示している。これは、P1が読み込まれていなかったり、P2が読み込まれていなかったり、また別のP3が読み込まれて「いる」場合には、別の表現になり、ひもづく値が変化する可能性に対応している。ここでは、あくまでP1(\\社内共有\P1.jpl)とP2(http://hoge.jp/P2.jpl)のみを読み込んだ結果であることがキー「¥1は食物_\\社内共有\P1.jpl_http://hoge.jp/P2.jpl」として表現されている。なお、読み込んだURIパスは所定のソート規則にしたがってソートするため、P2の後にP1を読み込んだとしても上記のように整列して泣き別れないようにしている。
キャッシュC2は、論理プログラムP1に出現しP2には出現しない「¥1は食べれる」というリテラルについてであるが、このリテラルをヘッドとするボディが「Req "http://hoge.jp/JP.jpl"」(Req P2...)を含んでいるため、P1だけでなくP2をキーに含めている。実際に、P2にしか存在しないカレーとラーメンが値として記憶されている。
キャッシュC3は、上記「Req P2...」の範囲がそのルールのみをスコープとし「$Yは食物」までとなるため、P2を考慮する必要があるのは、P1の中では「$Yは食べれる」と「$Yは食物」のみとなり、「中国人は爆竹が好き」「インド人はカレーが好き」に対応する「¥1は¥2が好き」というリテラルのキャッシュのキーとしてはP2は含まれないことになる。
キャッシュC4は、P0にしかないリテラルであるが、再帰的にP1,P2を読み込んだ結果としての値をキャッシュしているため、キーは「¥1に¥2を補給可能_P1..._P2...」となる。同じヘッドを有してP1を動的読み込みしない節が仮に存在したば場合には、「¥1に¥2を補給可能」というキーとその値(真偽又はリテラルを真にする変数値(解)集合)を関連付けて記憶する(図示しない)キャッシュがその節のために設けられることもある。
これは特許文献3の逆質問機能による動的変更を例にとったものである。詳しくは同文献を参照されたいが、推論の途中でコンピュータがそのリテラルを真にする変数の値をユーザーに尋ねた回答をもとに知識を動的に追加することによって、コンピュータが当初からもっている知識や情報の不足を補うシステムであり、簡単な追加法の場合は、論理プログラムの最後に事実の形で追加されることになる(同文献)。
これにより、他のリテラルの真偽や変数を真にする値(解)集合が変化する場合があるため、動的追加に応じたキャッシュキーの変更が必要になってくる。この例ではユーザーごとに動的に追加する事実が異なりうるシステムとして構成しており、キーにはユーザーID(ここではU01)とそのリビジョン番号(REV001)をキーに追加し、どのキャッシュがどのリビジョンの論理プログラムに対応しているのかを管理している。
図5では、「¥1は食物」と「¥1は食べれる」は同義であるにも関わらず別のキャッシュとなっていた。これを意味解析を用いた公知の正規化・標準化技術によって「同じ意味のものは同じ表記」として表記ゆれが発生しないようにする(名詞については名寄せもする)ことによって明らかにキーの数を減らしキャッシュを節約することができる。
図右上には、簡単な意味解析&標準化ルールを記載しているが、実際には1990年代を中心に発達してすでに公知公用となっている数多くの形態素解析技術、構文解析技術、意味解析技術、指示語解析技術等を用いることができる。
また図5では、P1において表記ゆれの吸収のために用いられていたルール「$Yは食べれる:−$Yは食物;」がなくても同様の結果を得られるようになっている。
図1の論理プログラムに手続き的解釈であるWRITE($Y)が加わったものである。これは$Yを束縛している値を表示する組み込み関数である。これを確実に機能させるためには、ボディ部を副作用(表示等)も必要とする手続きとみなして省略せずに実行する必要がある。図8では、図2に比べて、手続きを含む4行目のルールを確実に実行している(キャッシュで代替しない)。このため、図2に比べて計算量は増えるが、図1に比べて計算量を節約し、必要な手続き(ここではWRITE)を省略せずに処理することが可能となっている。これは、手続き的解釈を含むルール(特定の予約語を含むもの)をそうでないルールと区別することで可能にしている。
この場合も、解(たとえば最も論証経路の大きい丸5番、すなわち($A,$B)=(太郎,四郎))の根拠(別解を含め2つのツリーとなる)を省略せずに示す場合には、すでに求めたキャッシュに頼らずに、「太郎は四郎の兄」という固定文字列リテラルの真を証明する導出過程を再計算して論証の経路をたどってみている。
このような場合には、キャッシュを抑制することが必要であり、キャッシュを全部または特定の解に関連する部分のみをクリアすることによっても対処している。特定の解に関連する部分のキャッシュのみクリアすることにより、他のキャッシュを他のキャッシュを生かすことができる(論理プログラムが変更されない限り)。
なお、元の質問文を処理する過程で各解(候補)を支持するために必要な事実やルールを解候補に紐づけてメモしていくアルゴリズムよりも、解が求まった後に質問文に各解を代入して各固定文字列リテラルを作成した上で、各導出過程(一つとは限らない)を再計算することにより各根拠ツリーを求めるアルゴリズムのほうが各根拠のツリーを計算しやすいという事実を発明者が発見している。
それは、深さ優先のバックトラックではなく一つひとつの条件文について幅優先でまず解候補を列挙して後の条件文で解候補を絞り込んでいくほうが文字列マッチのさまざまな可能性の網羅をひとつひとつのリテラル(ルールの条件文の)で完結することができるため、マッチ途中(正規表現がマッチする可能性が複数あってそれを一つ一つ別の候補として計算する途中)の状態からの再帰的な探索関数呼び出し(文脈切り替えを伴う)やバックトラックを減らして、(関数再入可能化のために自動変数としなければならなくなるはずの正規表現データ構造の積み上げによって生じがちな)スタック膨張を抑え、高速化も図れるためであり、変数を含んだ文字列をリテラルとして許容する処理系では、伝統的なPROLOG等に比べて、正規表現マッチングを多用するために、そうするメリットが大きいからでもある。
また、このように、ルールのボディ部の一つひとつの条件となるリテラルを真とする変数の値(解)集合をリテラルごとに一気に全部列挙する方針(幅優先)の場合は、キャッシュとしてその全部を求めておくことが極めて有利となり、本発明の目的をもっとも効果的に達成する計算方針の組み合わせ(幅優先×キャッシュ)となる。
Qr 逆質問文の例(コンピュータがユーザーに真偽や真にする変数値(解)を尋ねて結果が論理プログラムの末尾等に追加される文)
Qr1 逆質問文の結果として追加された文の例
R 動的引用(矢印の元のプログラムから先のプログラムを引用する)の例
Claims (11)
- 変数を含んだ文字列をリテラルとして許容する論理プログラムをコンピュータが処理する方法であって、
論理プログラムにおいて変数を含んだリテラルを真にする変数の値をコンピュータが求めた際に
該リテラルと該変数の値を関連づけて記憶しておく第一のステップと、
同一の論理プログラムにおいて該リテラルを真にする変数の値を求める際に
前記第一のステップで該リテラルと関連づけて記憶しておいた該変数の値を用いる第二のステップと
を含むことを特徴とする方法。 - 前記リテラルと変数の値を関連づけて記憶する際、又は、関連づけて記憶しておいたリテラルと別のリテラルを照合する際に、
対象となるリテラルに含まれる変数の表記を標準化することを特徴とする
請求項1に記載の方法。 - コンピュータが変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法であって、
論理プログラムにおいて変数を含まないリテラルの真偽を求めた際に
該リテラルと該値(真偽)を関連づけて記憶しておく第一のステップと、
同一の論理プログラムにおいて該リテラルの真偽を求める際に
前記第一のステップで該リテラルと関連づけて記憶しておいた該値を用いる第二のステップと
を含む方法。 - 前記リテラルと変数の値を関連づけて記憶する際、又は、関連づけて記憶しておいたリテラルと別のリテラルを照合する際に、
リテラルの意味を解析して意味が同一のリテラルの表記が同一となる方向に表記を標準化することを特徴とする
請求項1から3のいずれか一項に記載の方法。 - 変数を含むリテラルを真にする変数の値又は変数を含まないリテラルの真偽を、
該リテラルだけでなく処理の対象とする論理プログラムの範囲を指定する情報と関連づけて
前記記憶又は照合することを特徴とする
請求項1から4のいずれか一項に記載の方法。 - 変数を含んだ文字列をリテラルとして許容する論理プログラムをコンピュータが処理する方法であって、
サブクエリ(質問文そのものであってもよい)の結果をキャッシュしておき、
実質同じサブクエリが発生したときに再計算せずに該当するキャッシュを用いることを特徴とする方法。 - リテラルの計算に手続き的解釈を行う必要のあるルールが介在していたかどうかを示すフラグを有し、
フラグが真のときに再計算することを特徴とする
請求項1から6のいずれか一項に記載の方法。 - 前回計算した時から対象とする論理プログラムに変更があったかどうか計算するデータ構造を有し、
変更があった場合に記憶された値を用いずに再計算を行う
請求項1から7のいずれか一項に記載の方法。 - 真偽や解集合の導出に用いたルール、事実又は文脈を明示する必要がある場合に、
真偽の証明経路ごと又は解集合に含まれる解ごとに
あえて再計算させるようにした
請求項1から8のいずれか一項に記載の方法。 - 請求項1から9のいずれか一項に記載の方法を実施するコンピュータプログラム。
- 請求項10に記載のコンピュータプログラムを用いた装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016165180A JP6924461B2 (ja) | 2016-08-25 | 2016-08-25 | 変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法、コンピュータプログラム及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016165180A JP6924461B2 (ja) | 2016-08-25 | 2016-08-25 | 変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法、コンピュータプログラム及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018032275A true JP2018032275A (ja) | 2018-03-01 |
JP6924461B2 JP6924461B2 (ja) | 2021-08-25 |
Family
ID=61304408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016165180A Active JP6924461B2 (ja) | 2016-08-25 | 2016-08-25 | 変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法、コンピュータプログラム及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6924461B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114415622A (zh) * | 2021-12-13 | 2022-04-29 | 浙江中控技术股份有限公司 | 一种控制系统用户程序逻辑在线验证方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11161498A (ja) * | 1997-11-26 | 1999-06-18 | Hitachi Ltd | 知識情報の分析方法及び知識情報処理システム及び記憶媒体 |
JP2005301859A (ja) * | 2004-04-15 | 2005-10-27 | Fujitsu Ltd | コード検索プログラム及びコード検索装置 |
JP2014211725A (ja) * | 2013-04-17 | 2014-11-13 | ナレルシステム有限会社 | 知識や情報を処理する方法、装置及びコンピュータプログラム |
-
2016
- 2016-08-25 JP JP2016165180A patent/JP6924461B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11161498A (ja) * | 1997-11-26 | 1999-06-18 | Hitachi Ltd | 知識情報の分析方法及び知識情報処理システム及び記憶媒体 |
JP2005301859A (ja) * | 2004-04-15 | 2005-10-27 | Fujitsu Ltd | コード検索プログラム及びコード検索装置 |
JP2014211725A (ja) * | 2013-04-17 | 2014-11-13 | ナレルシステム有限会社 | 知識や情報を処理する方法、装置及びコンピュータプログラム |
Non-Patent Citations (1)
Title |
---|
山下睦弘、外1名: "トップダウン定理証明における前処理の効果", 電子情報通信学会技術研究報告, vol. 96, no. 346, JPN6020024015, 2 November 1996 (1996-11-02), JP, pages 47 - 53, ISSN: 0004445918 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114415622A (zh) * | 2021-12-13 | 2022-04-29 | 浙江中控技术股份有限公司 | 一种控制系统用户程序逻辑在线验证方法及系统 |
CN114415622B (zh) * | 2021-12-13 | 2023-12-22 | 浙江中控技术股份有限公司 | 一种控制系统用户程序逻辑在线验证方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP6924461B2 (ja) | 2021-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8229878B2 (en) | Methods and systems for interpreting text using intelligent glossaries | |
US20160364377A1 (en) | Language Processing And Knowledge Building System | |
US20190392035A1 (en) | Information object extraction using combination of classifiers analyzing local and non-local features | |
Altinok | Mastering spaCy: An end-to-end practical guide to implementing NLP applications using the Python ecosystem | |
US20140156282A1 (en) | Method and system for controlling target applications based upon a natural language command string | |
Ferguson | Faulty Belnap Computers and Subsystems of E fde | |
JP6263858B2 (ja) | 知識や情報を処理する方法、装置及びコンピュータプログラム | |
AU2014315619A1 (en) | Methods and systems of four-valued simulation | |
Otten | Non-clausal connection calculi for non-classical logics | |
Gao et al. | Semantic mapping from natural language questions to OWL queries | |
Alur et al. | Colored nested words | |
JP6924461B2 (ja) | 変数を含んだ文字列をリテラルとして許容する論理プログラムを処理する方法、コンピュータプログラム及び装置 | |
JP7239959B2 (ja) | 自然言語テキストからアイディアを自動合成する方法、コンピュータプログラム及び装置 | |
Ayats et al. | Extracting relations in texts with concepts of neighbours | |
Arrieta et al. | CoSMo: A constructor specification language for Abstract Wikipedia's content selection process | |
WO2016071942A1 (ja) | 知識や情報を処理する方法、装置及びコンピュータプログラム | |
JP2017102628A (ja) | 知識や情報を処理する方法、このためのコンピュータプログラム及び処理装置 | |
JP6905729B2 (ja) | 探索枝刈り方法、コンピュータプログラム及び装置 | |
Sevilla et al. | Enriched semantic graphs for extractive text summarization | |
Wahde et al. | An interpretable method for automated classification of spoken transcripts and written text | |
Razorenov et al. | A new formal approach to semantic parsing of instructions and to file manager design | |
US20240143928A1 (en) | Generation of interactive utterances of code tasks | |
JP2013206130A (ja) | 検索装置、検索方法およびプログラム | |
Colton | Text classification using Python | |
Yarushkina et al. | The Method for Improving the Quality of Information Retrieval Based on Linguistic Analysis of Search Query |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210622 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210722 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6924461 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |