JP2021510429A

JP2021510429A - 知識および自然言語処理を統合するための機械学習

Info

Publication number: JP2021510429A
Application number: JP2020532977A
Authority: JP
Inventors: バカレッラ、デイヴィット; バーンビー、ジェームス; ローレンス、ニコラス; パテル、シュミット
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2018-01-10
Filing date: 2018-12-31
Publication date: 2021-04-22
Anticipated expiration: 2038-12-31
Also published as: WO2019138289A1; GB2583313A; GB202011417D0; DE112018005894T5; US10423726B2; JP7210587B2; US20190213258A1; US20190303441A1; US10599780B2; CN111566654B; CN111566654A

Abstract

【課題】データの知識グラフベースの持続のためのフレームワークを自動化し、知識グラフの経時的変化および不確実性を解決するためのシステム等を提供する。【解決手段】自然言語理解が、１つまたは複数の機械学習モデル（ＭＬＭ）とともに、エンティティおよびエンティティ関係を含め、非構造化情報からデータを抽出するために使用される。抽出されたデータは、知識グラフにデータ投入される。ＫＧが変化を受けると、ＫＧは、新たな機械学習モデル（ＭＬＭ）を作成し、既存のＭＬＭを再訓練するために使用される。投入されたデータに、信憑値の形態の重み付けが適用される。データの信頼度を保証し、データに対する変更を評定するための監査可能性を提供するために、投入されたデータにブロックチェーン技術が適用される。【選択図】図１

Description

本発明は、自然言語処理に関し、より詳細には、知識および自然言語処理を統合するための機械学習に関する。

人工知能コンピュータ・システムの分野において、自然言語システム（ＩＢＭＷａｔｓｏｎ（商標）人工知能コンピュータ・システムおよび他の自然言語質問応答システムなど）は、システムによって獲得される知識に基づいて自然言語を処理する。自然言語を処理するために、システムは、知識のデータベースまたはコーパスから導出されるデータを用いて訓練することができるが、もたらされる結果は、言語構造の特異さおよび正しくない人間の論理的思考または新たな訓練データに関係する様々な理由から正しくないまたは不正確である可能性がある。

人工知能（ＡＩ）の一部である機械学習は、アルゴリズムを利用して、データから学習し、このデータに基づいて展望を作成する。ＡＩとは、機械が情報に基づいて判断を行うことが可能であるとき、所与のトピックにおいて成功する機会を最大化する知能を指す。より具体的には、ＡＩは、データ・セットから、問題を解決し、関連する推奨を提供する方法を学習することが可能である。ＡＩは、認知コンピューティングの一部であり、これは、大きい規模で学習し、目的をもって論理的に思考し、人間と自然に対話するシステムを指す。認知コンピューティングは、コンピュータ科学と認知科学との混合である。認知コンピューティングは、データ最小値、視覚認識、および自然言語処理を使用して問題を解決し、人間が関係するプロセスを最適化する独習アルゴリズムを利用する。

認知システムは、本質的に非決定論的である。具体的には、認知システムから出力されるデータは、入力として提供および使用される情報の影響を受けやすい。例えば、新たな機械学習モデルが展開されると、システムが以前と同じエンティティを抽出する保証はない。新たなモデルは、先行するモデルの結果に悪影響を与える場合がある。同様に、ある文書を通じて導入されるエラーの結果として、正しくないデータが抽出され、正しくないデータが出力として提供される場合がある。したがって、認知システムにおいて決定論的挙動を作成することが必要とされている。

本発明は、認知システムのための決定論的データを対象とする自然言語処理のためのシステム等を提供することを目的とする。

実施形態は、認知システムのための決定論的データを対象とする自然言語処理のためのシステム、コンピュータ・プログラム製品、および方法を含む。

１つの態様において、システムには、メモリに動作可能に結合されている処理ユニットが設けられ、人工知能プラットフォームが、処理ユニットおよびメモリと通信する。処理ユニットと通信する知識エンジンが、データを管理するために提供される。より具体的には、知識エンジンは、構造化データまたは非構造化データあるいはその両方からデータおよびデータ関係を抽出する。知識エンジンは、抽出されたデータおよびデータ関係のエントリを知識グラフ内に作成し、記憶されているデータへの信憑値の割り当てを含め、データおよびデータ関係を選択的に知識グラフ内に記憶する。加えて、アセット値エントリが、知識グラフに対応するかまたは他の様態で関連付けられる、対応するブロックチェーン（ＢＣ）台帳内に作成される。アセット値エントリは、割り当てられた信憑値を含む。ＢＣ台帳エントリに対応するＢＣ識別子が作成され、ＢＣ識別子は、知識グラフ・エントリとともに記憶される。知識グラフ・エントリおよび対応するＢＣ台帳エントリに基づいて、ＫＧ内の選択データが、評価をサポートするために知識エンジンによって利用され得る。より具体的には、評価は、選択データの来歴の判定をサポートし、加えて、データの定量化をサポートする。知識エンジンは、割り当てられた信憑値に基づくリスト内のデータのソートを含む、評価されたデータのリストを生成する。１つの実施形態ではリスト内のデータ要素エントリの間で最も強い信憑性スコアを有するデータ要素であるデータ要素が、ソートされたリストから返される。

別の態様において、自然言語を処理するためのコンピュータ・プログラム製品が提供される。コンピュータ・プログラム製品は、処理ユニットによって実行可能であるプログラム・コードを具現化したコンピュータ可読記憶デバイスを含む。プログラム・コードは、知識グラフ内にデータを記憶するために提供される。これは、構造化データまたは非構造化データあるいはその両方からデータおよびデータ関係を抽出するためのプログラム・コード、知識グラフ内にエントリを作成するためのプログラム・コードであって、エントリは、抽出されたデータおよびデータ関係ならびに記憶されているデータへの信憑値の割り当ての選択的記憶を含む、プログラム・コード、知識グラフに対応するＢＣ台帳内にアセット値エントリを作成するためのプログラム・コードであって、エントリは、割り当てられた信憑値を含む、プログラム・コード、ＢＣ台帳エントリに対応するＢＣ識別子を作成するためのプログラム・コード、ならびに、作成されたＢＣ識別子を知識グラフ・エントリとともに記憶するためのプログラム・コードを含む。加えて、記憶されているデータの評価をサポートするためのプログラム・コードが提供される。具体的には、プログラム・コードは、知識グラフに記憶されている選択データを評価し、これは、ＢＣ識別子を利用して選択データの来歴を判定し、データを定量化するプログラム・コードを含む。評価されたデータのリストを生成し、対応する信憑値に基づいてリスト内のデータをソートするためのプログラム・コードも提供される。結果は、ソートされたリスト内の最も強く表現される信憑性スコアを有するデータ要素の形態でリストから生成される。

また別の態様において、自然言語を処理するためのコンピュータ実施方法が提供される。方法は、知識グラフ内にデータを記憶すること、記憶されているデータを評価すること、評価されたデータ内のデータ要素を識別することを含む。データを記憶することは、構造化データまたは非構造化データあるいはその両方からデータおよびデータ関係を抽出することと、知識グラフ内にエントリを作成し、抽出されたデータおよびデータ関係をグラフ内に選択的に記憶することと、記憶されているデータに信憑値を割り当てることと、対応するＢＣ台帳内にアセット値エントリを作成することと、ＢＣ識別子を作成することと、ＢＣ識別子を知識グラフ・エントリとともに記憶することとを含む。記憶されているデータの評価は、ＢＣ識別子を利用して選択データの来歴を判定し、また、データを定量化することを含む。評価に基づいて、リストが生成され、割り当てられた信憑値に基づいてソートされる。識別された最も強い信憑値を有するデータ要素が、リストから返される。

添付の図面とともに取り上げられる、現在好ましい実施形態の以下の詳細な説明から、本発明のこれらのおよび他の特徴および利点が明らかになる。

図面に示す特徴は、別途明示的に指定しない限り、すべての実施形態ではなく、ほんの一部の実施形態の例示として意図されている。

自然言語処理システムの概略図を示すシステム図である。図１に示すＮＬ処理ツールおよびそれらの関連付けられるＡＰＩを示すブロック図である。自然言語処理（ＮＬＰ）システムの自然言語（ＮＬ）出力から知識グラフ（ＫＧ）にデータ投入するためのプロセスを示すフローチャートである。抽出されたデータから新たなトリプレットを作成するためのプロセスを示すフローチャートである。ＮＬＰ出力からトリプレットを抽出するためのプロセスを示すフローチャートである。ＮＬＰ出力からトリプレットを抽出するためのプロセスを示すフローチャートである。ＫＧを区分化するためのプロセスを示すフローチャートである。２つのＫＧを連結するためのプロセスを示すフローチャートである。機械学習モデル（ＭＬＭ）を活用してクエリ入力を増強するためのプロセスを示すフローチャートである。機械学習モデル（ＭＬＭ）を活用してクエリ入力を増強するためのプロセスを示すフローチャートである。既存のＭＬＭを訓練するためのプロセスを示すフローチャートである。漸進的かつ適応的なＭＬＭ構成のためのプロセスを示すフローチャートである。

本明細書において全般的に説明されており、図面において例示されているような本発明の実施形態の構成要素は、広範な種々の構成において構成および設計することができることは容易に理解されよう。したがって、図面において提示されているような本発明の実施形態の装置、システム、方法、およびコンピュータ・プログラム製品の実施形態の以下の詳細な説明は、特許請求されているものとしての実施形態の範囲を限定するようには意図されておらず、選択されている実施形態を代表しているに過ぎない。

本明細書全体を通じて「選択実施形態」、「１つの実施形態」、または「一実施形態」が参照されている場合、これは、その実施形態と関連して説明されている特定の特徴、構造、または特性が、少なくとも１つの実施形態に含まれることを意味する。したがって、「選択実施形態」、「１つの実施形態において」、または「一実施形態において」という語句が、本明細書全体を通じた様々な箇所に見られるとき、これらは必ずしも同じ実施形態を参照しているとは限らない。

図示されている実施形態は、図面を参照することによって最良に理解され、図面全体を通じて、同様の部分は同様の参照符号によって指定される。以下の説明は、例としてのみ意図されており、単純に、本明細書において特許請求されているものとしての実施形態と一貫するデバイス、システム、およびプロセスの特定の選択されている実施形態を例示する。

オントロジーは、情報および概念を組織化するための構造的枠組みとして機能する。自然言語理解（ＮＬＵ）は、自然言語処理（ＮＬＰ）の一部である。ＮＬＵは、アルゴリズムを使用して、音声を構造化オントロジーに変換する。１つの実施形態において、オントロジーは、ＮＬＵ出力の分類から構築される。ＮＬＵは、クラス、サブクラス、ドメイン、範囲、データ特性、およびオブジェクト特性に関してオントロジーを構築するのに必要とされる定義を提供する。個別のオントロジーが、オブジェクトにマッピングされる。同じまたは類似の文書を処理することによって、初期オントロジーとしても参照される、オントロジーを構築するのに必要とされるデータが与えられる。オントロジーは、機械学習モデル（ＭＬＭ）が、知識グラフ（ＫＧ）マネージャによってデータ・ストアに適用されることによって定義され、オントロジーは、関連付けられるＮＬＰサービスの出力を使用して構築される。より具体的には、オントロジーは、ＭＬＭが生成されたという事実または言及によって生成される。これらの事実または言及が、個別のオントロジーを構成する。１つの実施形態において、オントロジーは、ＫＧの形態であり、事実または言及は、グラフ内のノードとして表される。ＫＧの構造は、情報が追加または削除されることを可能にしながら、一定のままに維持することができる。同様に、オントロジーを使用して、新たなＭＬＭを作成し、既存のＭＬＭを再訓練することができる。１つの実施形態において、ＫＧが修正されると、新たなエンティティおよび関係が認識され、ＭＬＭの訓練を自動化するために利用され、ＭＬＭは動的かつ漸進的になる。したがって、オントロジーはＫＧによって表され、ＭＬＭは相互に関係付けられる。

図１を参照すると、自然言語処理システム（１００）の概略図が示されている。図示されているように、ネットワーク接続（１０５）にわたって複数のコンピューティング・デバイス（１８０）、（１８２）、（１８４）、（１８６）、および（１８８）と通信するサーバ（１１０）が提供される。サーバ（１１０）は、バス（１１６）にわたってメモリ（１１４）に動作可能に結合されている処理ユニット（１１２）を有して構成されている。知識エンジン（１７０）の形態のツールが、サーバ（１１０）に対してローカルに示されており、処理ユニット（１１２）またはメモリ（１１４）あるいはその両方に動作可能に結合されている。図示されているように、知識エンジン（１７０）は、１つまたは複数のツール（１７２）〜（１７８）を含む。ツール（１７２）〜（１７８）は、１つまたは複数のコンピューティング・デバイス（１８０）、（１８２）、（１８４）、（１８６）および（１８８）からのネットワーク（１０５）を介して自然言語処理を可能にする。より具体的には、コンピューティング・デバイス（１８０）、（１８２）、（１８４）、（１８６）、および（１８８）は、１つまたは複数のワイヤまたはワイヤレスデータ通信リンクあるいはその両方を介して、互いに、および、他のデバイスまたは構成要素と通信し、各通信リンクは、ワイヤ、ルータ、スイッチ、送信機、受信機などのうちの１つまたは複数を含んでもよい。このネットワーク接続構成においてサーバ（１１０）およびネットワーク接続（１０５）は、自然言語処理、および、１人または複数のコンテンツ・ユーザの分解能を可能にすることができる。サーバ（１１０）の他の実施形態が、本明細書において示されているもの以外の構成要素、システム、サブシステム、またはデバイスあるいはその組合せとともに使用されてもよい。

知識エンジン（１７０）を含むツール、または、１つの実施形態において、ＫＧマネージャ（１７２）、精度マネージャ（１７４）、ＢＣマネージャ（１７６）、およびＭＬＭマネージャ（１７８）を含む、知識エンジン中に組み込まれているツールは、限定ではないが、ネットワーク（１０５）からの入力、インターフェース（１６６）を介して構造化データ（１６８）のコーパスに動作可能に結合されているノード−グラフ・データ・ストア（１６０）からの１つまたは複数の知識グラフ、ＢＣネットワーク（１５０）、および１つまたは複数の機械学習モデル（ＭＬＭ）のライブラリ（１４０）を含む、様々なソースからの入力を受信するように構成することができる。図示されているように、ノード−グラフ・データ・ストア（１６０）は、ＫＧ_０（１６４Ａ）、ＫＧ_１（１６４Ｂ）、およびＫＧ_Ｎ（１６４Ｎ）を含む、複数のＫＧを有する、知識グラフのライブラリ（１６２）として機能する。本明細書において示されているＫＧの量は、限定であると考えられるべきではない。各ＫＧは、概念のオントロジーの表現である。より具体的には、各ＫＧ（１６４Ａ）、（１６４Ｂ）、および（１６４Ｎ）は、複数の関係付けられる主語および目的語を含む。１つの実施形態において、関係付けられるＫＧは、関連付けられるＫＧコンテナ内に記憶され、コーパス（１６０）が１つまたは複数のＫＧコンテナを記憶する。１つの実施形態において、ＫＧはまた、他のソースから獲得することもでき、そのため、図示されているデータ・ストアは、限定であると考えられるべきではない。

ネットワーク（１０５）と通信する様々なコンピューティング・デバイス（１８０）、（１８２）、（１８４）、（１８６）、および（１８８）は、コンテンツ作成者およびコンテンツ・ユーザのアクセス・ポイントを示す。コンピューティング・デバイスの一部は、知識エンジン（１７０）、および、１つの実施形態においてはツール（１７２）〜（１７８）によって使用される情報の本体としてデータのコーパスを記憶するデータベースが、決定論的挙動をシステムに組み込むためのデバイスを含むことができる。ネットワーク（１０５）は、様々な実施形態においてローカル・ネットワーク接続およびリモート接続を含んでもよく、結果、知識エンジン（１７０）および組み込みツール（１７２）〜（１７８）は、ローカル、および、例えばインターネットなどのグローバルを含む、任意のサイズの環境において動作することができる。加えて、サーバ（１１０）および知識エンジン（１７０）は、文書、ネットワークアクセス可能ソースまたは構造化データ・ソースあるいはその組合せから抽出されるか、または、その中で表現される様々な知識を利用可能にすることができるフロントエンド・システムとしての役割を果たす。このように、いくつかのプロセスは、サーバ（１１０）にデータ投入し、サーバ（１１０）はまた、要求を受信し、それに従って応答するための入力インターフェースをも含む。コンテンツ作成者およびコンテンツ・ユーザはまた、限定ではないが、（１４０）および（１６０）のようなデータ・リポジトリにおいても利用可能であり得、ここで、示されているアクセス・ポイントのリストは限定であると考えられるべきではない。

図示されているように、ノード−グラフ・データ・ストア（１６０）は、サーバ（１１０）に動作可能に結合されている。ノード−グラフ・データ・ストア（１６０）は、サーバ（１１０）によって使用するための１つまたは複数のＫＧ（１６４Ａ）〜（１６４Ｎ）を有するＫＧライブラリ（１６２）を含む。コンテンツ・ユーザは、図２に示し、記載されているような、ＡＰＩ管理またはオーケストレーション・プラットフォーム、および、ＮＬＵ入力経路を介して受信される自然言語入力を介して、システムにアクセスすることができる。

下記に詳細に説明するように、サーバ（１１０）および知識エンジン（１７０）は、ノード−グラフ・データ・ストア（１６０）内に記憶されている１つまたは複数のＫＧ内で内容を抽出または記憶するために、１つまたは複数の機械学習モデル、以下ＭＬＭを使用することによって、自然言語クエリを処理する。記憶または受信されるデータの信頼性、例えば来歴を効率的に提供するために、ブロックチェーン技術、以下「ＢＣ」が内容に対して活用される。ＭＬＭマネージャ（１７８）が、関連付けられるＭＬＭの作成、連結、または修正あるいはその組合せのためのツールとして機能し、または、１つの実施形態において、知識エンジン（１７０）内のＡＰＩが、そのために使用される。下記にさらに説明するように、ＭＬＭは、特定の知識ドメインに対して特異的に生成、作成、または修正される。ＭＬＭは、非構造化データからエンティティおよび関係を抽出するために作成される。これらのモデルは、具体的には、知識の特定のドメイン（例えば、経歴情報、株式市場、天文学）を理解するために作成される。

ＢＣは、本明細書においては、取引の履歴を記録するための非集中的かつ分散型のデジタル台帳の形態のＢＣネットワーク（１５０）として表される。より具体的には、ＢＣは、取引をデジタル的に識別および追跡し、この情報を分散型コンピュータ・ネットワークにわたって共有することを可能にするタイプのデータ構造を参照する。ＢＣは、所有権のトランスペアレントで安全な追跡を介して、実効的に、分散型信頼性ネットワークを作成する。本明細書において図示および説明されているように、ＢＣは、知識を自然言語処理と統合するために、ＭＬＭマネージャ（１７８）、精度マネージャ（１７４）、およびＫＧマネージャ（１７２）とともに活用される。

サーバ（１１０）は、以降説明する例示的な実施形態のメカニズムによって増強される、ニューヨーク州アーモンク所在のインターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能なＩＢＭＷａｔｓｏｎ（商標）システムであってもよい。ＩＢＭＷａｔｓｏｎ（商標）知識マネージャ・システムは、知識を自然言語処理（ＮＬＰ）にインポートする。具体的には、下記に詳細に説明するように、データの受信、組織化、または記憶あるいはその組合せが行われるとき、データは真または偽であり得る。サーバ（１１０）は単独では、データの信憑性を区別、またはより具体的には証明することができない。本明細書において示されているように、サーバ（１１０）は、入力内容（１０２）を受信し、その後、サーバは、内容（１０２）の特徴を抽出するために入力内容を評価し、これはその後、ノード−グラフ・データ・ストア（１６０）に適用される。特に、受信される内容（１０２）は、１つまたは複数の推論アルゴリズムを使用して入力内容（１０２）を評価し、これに信頼性を付与するために分析を実施するＩＢＭＷａｔｓｏｎ（商標）サーバ（１１０）によって処理することができる。

自然言語を処理するために、サーバ（１１０）は、知識エンジン（１７０）およびＮＬＰをサポートするための関連付けられるツール（１７２）〜（１７８）の形態の情報処理システムを利用する。サーバ（１１０）において具現化される、または、サーバ（１１０）と統合されるものとして示されているが、情報処理システムは、ネットワーク（１０５）にわたってサーバ（１１０）に接続される別個のコンピュータ・システム（例えば、１９０）内で実施されてもよい。どこに組み込まれようとも、データを管理および処理し、より具体的には、自然言語を検出および識別し、決定論的出力を作成または利用するために、１つまたは複数のＭＬＭが利用される。図示されているように、ツールは、ＫＧマネージャ（１７２）、精度マネージャ（１７４）、ＢＣマネージャ（１７６）およびＭＬＭマネージャ（１７８）を含む。ＭＬＭマネージャ（１７８）は、本明細書においてはＭＬＭ_０（１４２）、ＭＬＭ_１（１４４）、およびＭＬＭ_Ｎ（１４６）を含む複数のＭＬＭを有して示されているＭＬＭライブラリ（１４０）に動作可能に結合されて示されているが、図示および説明されているＭＬＭの量は、限定であると考えられるべきではない。１つの実施形態において、ＭＬＭは、ＮＬＰをサポートするように利用または適合されているアルゴリズムであることが理解される。サーバ（１１０）に対してローカルに図示されているが、ツール（１７０）〜（１７８）は集合的にまたは個別に、メモリ（１１４）内に組み込まれてもよい。

１つまたは複数のＭＬＭ（１４２）〜（１４６）は、ＫＧ内にデータを記憶することを含め、データを管理するように機能する。理解されるように、ＫＧは、構造化オントロジーであり、単にデータを記憶するだけのものではない。具体的には、知識エンジン（１７０）が、非構造化データからデータおよび１つまたは複数のデータ関係を抽出し、ＫＧ内に抽出されたデータおよびデータ関係のエントリを作成し、データおよびデータ関係をＫＧエントリ内に記憶する。１つの実施形態において、ＫＧ内のデータはノードにおいて記憶または表現され、２つのデータ要素の間の関係は、２つのノードを接続するエッジとして表される。同様に、１つの実施形態において、各ノードは、ノード・レベル信憑値を有し、各関係は、関係信憑値を有し、関係信憑値は、２つの相互接続されたノードの信憑値に基づいて計算される。データ抽出および記憶に加えて、ＭＬＭ、すなわちＭＬＭ_０（１４２）は、ＫＧ内に記憶されているデータに信憑値を割り当てるか、または、他の様態で指定する。１つの実施形態において、信憑値は、下記に詳細に説明するように、忠実度、ソース信頼度、および人間フィードバックから構成される複合スコアである。１つの実施形態において、信憑値は、追加の因子または因子のサブセットを含んでもよく、そのため、限定であると考えられるべきではない。割り当てられた信憑値は、ＫＧ内に記憶される。割り当てられた信憑値はまた、識別されているＢＣ台帳内のエントリ内にも記憶される。ＢＣ台帳内の各エントリは、台帳および台帳エントリのアドレスを識別する、本明細書においてはＢＣ識別子として参照される、対応する識別子を有する。ＢＣ識別子は、識別されるデータとともにＫＧ内に記憶され、対応するＢＣ台帳および記憶されている信憑値の位置を識別する。１つの実施形態において、ＫＧマネージャ（１７２）は、ＫＧにおけるＢＣ識別子の記憶を管理する。したがって、割り当てられたまたは作成された信憑値はＢＣ内に記憶され、ノード−グラフ・データ・ストア（１６０）内のＫＧ内の信憑値の複製コピーである。

各ＫＧは、大量のデータを組織化し、これに構造を与えることが理解される。ＫＧは、単一のオントロジーであってもよく、または、１つの実施形態において、ＫＧもしくはＫＧコンテナが、それらの関係または関連を示すためにともに連結される複数のＫＧから構成されてもよい。ＫＧマネージャ（１７２）は、ＫＧの構造および組織化を管理するように機能する。例えば、大規模なＫＧは、管理するのが煩雑に過ぎるかまたは費用がかかり過ぎる場合がある。このシナリオにおいて、ＫＧマネージャ（１７２）は、ＫＧを区分化することができ、実効的に、例えば、第１のＫＧパーティションおよび第２のＫＧパーティションなど、少なくとも２つのパーティションを作成する。ＫＧは、１つまたは複数の因子に基づいて区分化することができる。例えば、１つの実施形態において、ＫＧは、トピックまたはサブトピックによって区分化することができる。同様に、ＫＧ内で表現されている各事実は、限定ではないが、忠実度指標、ソース信頼度測度、および人間フィードバック因子を含む、複数の因子の複合である、関連付けられる信憑値を有する。ＫＧマネージャ（１７２）は、信憑値に基づいて、または、１つの実施形態において、信憑値を含む因子のうちの１つもしくは複数に基づいて、ＫＧを区分化することができる。１つの実施形態において、ＫＧが少なくとも第１のパーティションおよび第２のパーティションに区分化された後、ＫＧマネージャ（１７２）は、信憑値の構成要素の１つまたは複数を、パーティション内で表現される各ノードまたはエッジに対して指定することができる。例えば、ＫＧ区分化の後、ＫＧマネージャ（１７２）は、第１の信頼度値を第１のパーティンション内のデータにデータ投入および割り当てすることができ、１つの実施形態において、ＫＧマネージャ（１７２）は、第１の信頼度値とは異なる第２の信頼度値を、第２のパーティション内のデータにさらにデータ投入および割り当てすることができる。信憑値の構成要素のうちの１つまたは複数の修正は、実効的に、信憑値を変化させる。しかしながら、信憑値の構成要素のうちの１つまたは複数の値は、経時的に変化し得、そのため、この変化は関連付けられるデータによって反映または具現化されることが理解される。したがって、ＫＧマネージャ（１７２）は、データを管理し、データに構造および値を与えるように機能する。

ＫＧマネージャ（１７２）の機能のうちの１つは、２つ以上のＫＧを連結または接合することである。ＫＧを接合または連結することは、ＫＧを区分化することの逆である。ＫＧを接合または連結する機能は、ＫＧマネージャ（１７２）が、１つのＫＧ内の１つまたは複数のデータ要素と、第２のＫＧ内の１つまたは複数のデータ要素とを比較し、重複するデータの出現を排除または少なくとも低減することを必要とする。上述したように、ＫＧ内で表現される各データ要素は、関連付けられる複合スコアを有する。ＫＧマネージャ（１７２）は、１つの構成要素、複数の構成要素、または信憑値自体を、データ比較および評価のための因子として使用することができる。接合または連結されると、重複するデータ項目を除去することが実現可能であり得るかまたは保証され得る。重複するデータであると判定された、連結されたＫＧ内のデータは、ＫＧマネージャ（１７２）によって選択的に除去される。重複するデータの除去の１つの特性は、ＫＧの一定の構造を維持することができることである。したがって、ＫＧマネージャ（１７２）は、ＫＧ内で表現されるデータを管理することによって、ＫＧの構造を管理するように機能する。

ＢＣマネージャ（１７６）は、機械学習環境に関する複数の機能を有する。上述したように、ＢＣマネージャ（１７６）は、ＭＬＭとともに、関連付けられるデータの信頼性を維持するように機能することができる。ＢＣマネージャ（１７６）は、ＢＣネットワーク対話のための契約を生成し、来歴を提供し、ＢＣ情報を取り出し、システムのすべてのＢＣ対話を管理する。

ＮＬ入力の評価は、ＭＬＭ、すなわち、ＭＬＭ_０（１４２）によって管理される。ＮＬ入力と関連付けられる矛盾またはエラーが、ＮＬ入力から生成されるＫＧからのクエリ結果、より具体的には、クエリ結果のソートによって識別される。強い信憑値を有するクエリ結果とＮＬとの間に矛盾があるとき、これは、ＮＬ入力が正しくない可能性があることを示す。精度マネージャ（１７４）は、ＮＬ入力の言語を、生成されているリストからの識別または選択されているトリプレットと置換されることによって、ＮＬ入力を補正する。本明細書においてはメモリとしても参照されるトリプレットは、ＫＧ内の２つ以上のノードおよび２つ以上のノードの間の関係に基づく。１つの実施形態において、トリプレットは、ＫＧから捕捉されるものとしての主語−動詞−目的語関係である。１つの実施形態において、識別または選択は、１つの実施形態においてユーザによって選択される、最も高い信憑値に基づき得る。同様に、別の実施形態において、識別または選択は、複合信憑値を含む因子のうちの１つまたは複数に基づき得る。知識エンジン（１５０）がリスト内の１つまたは複数のエントリと関連付けられる不変の因子を識別し、不変の因子とＮＬ入力との間の矛盾をさらに識別するとき、別の形態の矛盾が生じ得る。この矛盾は、精度マネージャ（１７４）が、ＮＬ入力の言語を不変の因子を有するエントリと関連付けられるトリプレットと置換されることによってＮＬ入力を補正することによって解決される。矛盾に加えて、別の解決策は、精度マネージャ（１７４）が、ＮＬ入力とソートされたリストのエントリとの間の部分一致を識別することにあり得る。部分一致は、ＫＧマネージャ（１７２）およびＢＣマネージャ（１７６）が、ＮＬ入力についてそれぞれ、ＫＧおよび対応するＢＣ台帳内に新たなエントリを作成することを可能にするか、または、そのように誘導する。加えて、ＫＧマネージャ（１７２）は、新たなエントリと、部分一致に対応する既存のＫＧエントリとを接続する。ＮＬ入力は、例えば、空集合など、一致を一切生成しない場合があることがさらに理解される。一致がない場合、ＫＧマネージャ（１７２）およびＢＣマネージャ（１７６）が、それぞれＮＬ入力に対応する新たなＫＧエントリおよびＢＣ台帳エントリを作成する。したがって、ＮＬ入力は、ＫＧ内で組織化されるデータに照らして、ＭＬＭ、すなわちＭＬＭ_０（１４２）、および、１つの実施形態において精度マネージャ（１７４）によって処理される。

本明細書において示し、説明されているように、ＭＬＭライブラリ（１４０）が、サーバ（１１０）に動作可能に結合され、ＡＩプラットフォームにおける自然言語処理をサポートするための複数のＭＬＭを含む。ＭＬＭのうちの１つまたは複数は、動的であり得、新たなエンティティおよび関係に適合するように訓練することができる。異なるＫＧが、異なる知識ドメインと関連付けられ得る。例えば、第１のＭＬＭ、すなわちＭＬＭ_０（１４２）が、ＫＧ_０（１６４Ａ）とのその整合に基づいて、ライブラリ（１４０）から識別または選択され得る。ＮＬ入力の処理に応答して、ＭＬＭ_０（１４２）がＫＧ_０（１６４Ａ）に対して適用され得、第２のＫＧ、すなわちＫＧ_１（１６４Ｂ）に対して別個に適用され得る。ＭＬＭマネージャ（１７８）は、両方のＫＧからの結果を、それらの対応する信憑値とともに処理し、処理に基づいて、ＫＧのうちの１つの修正が識別される。１つの実施形態において、信憑値は、修正の信頼性を識別するために評価される。認証を受けて、ＭＬＭマネージャ（１７８）は、関連付けられるＭＬＭ、すなわちＭＬＭ_０（１４２）を動的に修正する。１つの実施形態において、識別される修正は、追加のフィールドを含むための、関連付けられるデータ・セットの拡張であり得る。同様に、１つの実施形態において、ＭＬＭマネージャ（１７８）は、修正が共時的または通時的であることを確認し、この分類を、修正を監督するための要素として使用することができる。１つの実施形態において、ＭＬＭ_０（１４２）の修正の結果として、新たなＭＬＭ、例えばＭＬＭ_Ｎ（１４６）が作成され、１つの実施形態において、元のＭＬＭ、すなわちＭＬＭ_０（１４２）が保持される。したがって、ＭＬＭライブラリ（１４０）は、ＭＬＭの動的修正を受けて拡張することができる。

システム（１１０）を利用することができる情報処理システムのタイプは、手持ち式コンピュータ／携帯電話（１８０）のような小型手持ち式デバイスから、メインフレーム・コンピュータ（１８２）のような大型メインフレーム・システムに及ぶ。手持ち式コンピュータ（１８０）の例は、携帯情報端末（ＰＤＡ）、ＭＰ４プレーヤ、携帯テレビ、およびコンパクト・ディスク・プレーヤのようなパーソナル・エンターテインメント・デバイスを含む。情報処理システムの他の例は、ペンまたはタブレット・コンピュータ（１８４）、ラップトップまたはノートブック・コンピュータ（１８６）、パーソナル・コンピュータ・システム（１８８）およびサーバ（１９０）を含む。図示されているように、様々な情報処理システムは、コンピュータ・ネットワーク（１０５）を使用してともにネットワーク接続することができる。様々な情報処理システムを相互接続するために使用することができるコンピュータ・ネットワーク（１０５）のタイプは、ローカル・エリア・ネットワーク（ＬＡＮ）、ワイヤレス・ローカル・エリア・ネットワーク（ＷＬＡＮ）、インターネット、公衆交換電話網（ＰＳＴＮ）、他のワイヤレス・ネットワーク、および、情報処理システムを相互接続するために使用することができる任意の他のネットワーク・トポロジを含む。情報処理システムの多くは、ハード・ドライブまたは不揮発性メモリあるいはその両方のような、不揮発性データ・ストアを含む。情報処理システムのいくつかは、別個の不揮発性データ・ストアを使用することができる（例えば、サーバ（１９０）は、不揮発性データ・ストア（１９０ａ）を利用し、メインフレーム・コンピュータ（１８２）は、不揮発性データ・ストア（１８２ａ）を利用する）。不揮発性データ・ストア（１８２ａ）は、様々な情報処理システムの外部にある構成要素とすることができ、または、情報処理システムのうちの１つの内部にあることができる。

情報処理システムは、多くの形態をとることができ、その一部が図１に示されている。例えば、情報処理システムは、デスクトップ、サーバ、ポータブル、ラップトップ、ノートブック、または他の形状因子のコンピュータまたはデータ処理システムの形態をとることができる。加えて、情報処理システムは、携帯情報端末（ＰＤＡ）、ゲーミング・デバイス、ＡＴＭ機械、携帯電話デバイス、通信デバイスまたはプロセッサおよびメモリを含む他のデバイスのような、他の形状因子をとることができる。

アプリケーション・プログラム・インターフェース（ＡＰＩ）は、当該技術分野において、２つ以上のアプリケーションの間を媒介するソフトウェアとして理解されている。図１に示し、記載されているＮＬ処理システムに関して、ツール（１７２）〜（１７８）のうちの１つまたは複数およびそれらの関連付けられる機能をサポートするために、１つまたは複数のＡＰＩを利用することができる。図２を参照すると、ＮＬ処理ツールおよびそれらの関連付けられるＡＰＩを示すブロック図（２００）が提供される。図示されているように、複数のツールが知識エンジン（２０５）内に組み込まれており、ツールは、ＡＰＩ_０（２１２）と関連付けられる精度マネージャ（２１０）、ＡＰＩ_１（２２２）と関連付けられるＫＧマネージャ（２２０）、ＡＰＩ_２（２３２）と関連付けられるＢＣマネージャ（２３０）、およびＡＰＩ_３（２４２）と関連付けられるＭＬＭマネージャ（２４０）を含む。ＡＰＩの各々は、１つまたは複数の言語およびインターフェース仕様において実施することができる。ＡＰＩ_０（２１２）は、アセット比較、信憑性判定、信憑性判断、および信憑性割り当てを可能にし、ＡＰＩ_１（２２２）は、ＫＧ作成、更新、および削除を可能にし、ＡＰＩ_２（２３２）は、ＭＬＭ作成、更新、および削除を可能にし、ＡＰＩ_３（２４２）は、ＢＣ契約作成、ブロック作成、ネットワーク通信、およびブロック追加を可能にする。図示されているように、ＡＰＩ（２１２）、（２２２）、（２３２）、および（２４２）の各々は、他にオーケストレーション層として知られているＡＰＩオーケストレータ（２５０）に動作可能に結合され、ＡＰＩオーケストレータは、当該技術分野において、別個のＡＰＩをともにトランスペアレントにスレッド化するための抽象化レイヤとして機能するものとして理解されている。１つの実施形態において、別個のＡＰＩの機能は、接合または組み合わせすることができる。そのため、本明細書において示されているＡＰＩの構成は、限定であると考えられるべきではない。したがって、本明細書において示されているように、ツールの機能は、それらのそれぞれのＡＰＩによって具現化またはサポートすることができる。

本開示の選択されている実施形態の理解を向上するための追加の詳細を提供するために、ここで、ＫＧを初期化するための形態のプロセスを示す図３を参照する。システムが初期化されるとき、ＫＧは空である。ＭＬＭが、非構造化データからエンティティおよび関係を抽出するために作成または利用される。ＭＬＭは、知識の特定のドメイン、すなわち、経歴情報、金融市場、科学の諸分野などを理解するために作成される。代表的なデータが、システムに、モデル内で定義されるエンティティおよび関係のテキストを識別することを教示するために使用される。図３を参照すると、ＮＬＰシステムの自然言語出力からＫＧにデータ投入するためのプロセスを示すフローチャート（３００）が与えられる。ＫＧ初期化およびデータ投入プロセスの一部として、抽出されるトリプレットの信憑値が指定される。信憑値は、忠実度指標、ソース信頼度指標、および人間フィードバック指標から構成される。１つの実施形態において、信憑値を含む指標の各々は、０と１との間のスケール上の数値である。忠実度指標は、基礎となる事実の確実性を反映する。１つの実施形態において、１の忠実度値は、事実が間違いなく真であることを反映し、０の値は、事実が間違いなく偽であることを反映し、０と１との間の値は、事実に関する確実性または不確実性のレベルを示す。ソース信頼度因子は、限定ではないが、事実が確認されたデータおよび時間を含む、事実のソース、例えば起源と関連付けられる。人間フィードバック指標は、事実の肯定および反論の量を追跡する。１つの実施形態において、この因子は、応答の量を追跡する。したがって、ＫＧが初期化され、データを投入されると、信憑値の構成要素が、ＮＬＰシステムを介して抽出されるトリプレットに割り当てられるように選択または設定される。

共時的または通時的情報のような分類が、それぞれ一定のままであるかまたは経時的に変化し得るかのいずれかであるデータを記述するために利用される。教師あり訓練の例の場合、忠実度値は１に設定され、ソース信頼度値は１に設定され、人間フィードバックは０に設定される。これらの値は一例に過ぎず、１つの実施形態においては変化してもよい。１つの実施形態において、ＫＧアプリケーション・プログラム・インターフェース（ＡＰＩ）は、信憑値を指定するためのプラットフォームを提供する。図示されているように、エンティティおよび関係を定義することによって、ＭＬＭが作成される（３０２）。ＭＬＭは、代表的なデータを使用して訓練される（３０４）。ステップ（３０４）の後、ＮＬＰを用いるＭＬＭが使用されて、訓練データからトリプレットが抽出される（３０６）。抽出されたトリプレットは、ファイルに保存されるか、または、ストリーミングされ得る。１つの実施形態において、抽出されたトリプレットは、主語−動詞−目的語関係である。ステップ（３０６）の後、抽出されたトリプレットが利用されて、ＫＧがデータ投入される（３０８）。１つの実施形態において、ＫＧＡＰＩが使用されて、ＮＬＵ出力からトリプレットが読み出され、解析される。１つの実施形態において、ＫＧにデータ投入されるトリプレットは、メモリとして参照される。ＭＬＭは訓練を通じて作成され、その後、ＭＬＭは、ＫＧにデータ投入するためのデータに対して適用される。したがって、ＮＬＰを用いるＭＬＭは、データからトリプレットを抽出し、以前は空であったＫＧにデータ投入する。

ＮＬＰ出力から抽出される各主語エンティティについて（３１０）、主語エンティティが関連付けられるＫＧ内に存在するか否かが判定される（３１２）。ステップ（３１２）における判定に対して肯定的応答が得られる場合、その後、抽出された主語エンティティと関連付けられる既知の関係が存在するか否かが判定される（３１４）。ステップ（３１４）における判定に対する応答が肯定である場合、関連付けられる関係および割り当てられた信憑値を伴う主語エンティティがＫＧ内に存在するか否かが判定される（３１６）。ステップ（３１６）における判定に対する肯定的応答は、主語エンティティ関係がＫＧ内に存在することを示し、プロセスは完了する。しかしながら、ステップ（３１２）、（３１４）、および（３１６）に示す判定のうちのいずれか１つに対する応答が否定的である場合、その後、ＫＧ内に新たなトリプレットおよび新たなトリプレットのエントリが作成される（３１８）。したがって、図示されているように、ＮＬＰ文書からデータを抽出し、抽出されたデータによってＫＧに選択的にデータ投入するためにＫＧマネージャにアクセスするために、ＭＬＭが利用される。

図４を参照すると、抽出されたデータから新たなトリプレットを作成するためのプロセスを示すフローチャート（４００）が与えられる。図３に記載されているように、抽出されたデータの信憑値成分が確立されまたは割り当てられる。１つの実施形態において、信憑値成分は、ＫＧ初期化と関連付けられる監督に基づいて確立される。例えば、主語−動詞−目的語関係などの新たな各トリプレットについて、信憑値がトリプレットに割り当てられる（４０２）。１つの実施形態において、信憑値は、ＫＧＡＰＩを介して割り当てられる。ステップ（４０２）の後、対応するまたは指定のＢＣ台帳内にエントリが作成される（４０４）。より具体的には、ステップ（４０４）において、ＢＣエントリが、トリプレット信憑値を記憶し、本明細書においてはＢＣ識別子として参照される識別子が作成され、その後、取り出される。１つの実施形態において、取り出されるＢＣ識別子は、統一資源識別子（ＵＲＩ）または他の一意のアセット識別子である。ステップ（４０４）の後、新たなトリプレットが、関連付けられるＢＣ識別子とともにＫＧに挿入される（４０６）。１つの実施形態において、ＫＧＡＰＩが、ステップ（４０６）において、トリプレットおよび関連付けられるＢＣ識別子の挿入を実施する。したがって、示されているように、新たな各トリプレットの信憑値が対応するＢＣ台帳内に記憶され、関連付けられるＢＣ識別子が、ＫＧエントリ内のトリプレットとともに記憶されるか、または、他の様態で関連付けられる。

図３および図４に示し、記載されているプロセスはまた、例えば、データが信頼できない場合があるときに教師なし訓練を使用して、または、教師あり訓練を使用して、ＮＬＰシステムの自然言語出力からＫＧにデータ投入するためにも利用され得る。図３および図４に示し、記載されているように、ＫＧＡＰＩは、ＮＬＰ出力から抽出されているデータの信憑値を設定するために利用される。ソースに応じて、信憑値は、不確実性を示すために設定することができる。例えば、１つの実施形態において、忠実度指標は０．５に設定されてもよく、ソース信頼度は０．５に設定されてもよく、人間フィードバック値は０に設定されてもよい。したがって、教師なし訓練は、信憑値の種々のセットにおいて反映され得る。

非訓練データの処理の過程において、正確なトリプレット一致が見つからない場合、新たなメモリが作成され、対応するまたは識別されるＫＧ内に記憶される。これは、同じ主語に関する複数の文書の処理を考慮するときに実現され得る。例えば、１つの文書が第１の日付を有する事実を識別し得、第２の文書が第２の日付を有する同じ事実を識別し得る。しかしながら、これらの日付の内の一方のみが、事実上正しい。図３および図４に示すように、ＫＧに入力されている各トリプレットは、対応する信憑値を有し、信憑値は、記憶されているメモリの正しさの指標として機能する。これらの信憑性スコアは、ＫＧにデータ投入される矛盾する事実の正確度または正しさあるいはその両方を確立するために使用することができる。

図５および図６を参照すると、ＮＬＰ出力からトリプレットを抽出するためのプロセスを示すフローチャート（５００）が与えられる。図示されているように、精度マネージャを通じてクエリまたは文がＫＧに提示される（５０２）。提示は、限定ではないが、事実確認を含む、様々な理由による場合がある。ＮＬＰを用いるＭＬＭが使用されて、ＫＧからトリプレットが抽出され（５０４）、ＫＧＡＰＩが使用されて、ＮＬＰ出力からトリプレットが読み出しおよび解析される（５０６）。以下の表は、例示的なトリプレットを示す。

ステップ（５０６）の後、変数Ｘ_{Ｔｏｔａｌ}が解析されたトリプレットの量に割り当てられる（５０８）。その後、Ｘ_{Ｔｏｔａｌ}がゼロよりも大きいか否かが判定される（５１０）。ステップ（５１０）における判定に対する応答が否定的である場合、これはクエリが空集合を生成したことを示すため、抽出プロセスが完了する（５１２）。しかしながら、ステップ（５１０）における判定に対する応答が肯定的である場合、その後、解析されたトリプレットが処理される（５１４）。トリプレット・カウント変数が１に設定され（５１６）、各トリプレット_Ｘについて、同じ主語エンティティおよび関係を有するすべてのトリプレットをフェッチするために、ＫＧが問い合わせされる（５１８）。図３および図４に示し、記載されているように、各トリプレットは、関連付けられるＢＣ識別子を有する。ＢＣ識別子は、対応するＢＣ台帳にアクセスし、記憶されているトリプレット信憑値をフェッチするために利用される（５２０）。ステップ（５２０）の後、トリプレット・カウント変数が増分される（５２２）。その後、識別されたトリプレットの各々が処理されているか否かが判定される（５２７）。ステップ（５２２）における判定に対する応答が否定的である場合、その後、ステップ（５１８）に戻る。同様に、判定に対する応答が肯定的である場合、ＫＧおよび対応するＢＣ台帳エントリに問い合わせるプロセスが完了し（５２６）、抽出および処理されたトリプレットはソートを受ける（５２８）。（５２８）におけるソートは、トリプレットをある順序に配置するように機能する。例えば、１つの実施形態において、トリプレットは、忠実度指標、ソース信頼度、および人間フィードバックの昇順にソートされてもよい。同様に、ソート順序は、特定の使用事例に適合するようにカスタマイズ可能であってもよい。例えば、１つの実施形態において、人間フィードバック指標が優先されてもよい。したがって、トリプレット抽出は、ＫＧを利用して、トリプレットおよび関連付けられるＢＣ識別子を取得または識別し、ＢＣ識別子は関連付けられる信憑値を獲得するために利用され、信憑値はその後、トリプレットをソートするための特性として利用される。

以下の表２は、２つのトリプレットの例示的なソートを示す、表１の拡張である。

表２の例においては、各々が異なる主語エンティティ値と関連付けられる２つのトリプレット・エントリが存在する。示されているように、エントリは、忠実度指標またはソース信頼度指標のいずれかの昇順にソートされる。ソート因子は、限定であると考えられるべきではない。１つの実施形態において、ソートは、逆の降順になってもよく、または、信憑値の異なる成分に基づいてもよい。この例における第１のトリプレット・エントリは、主語エンティティによって定義され、関係は、最も高い信憑値、例えば、信憑性スコアを有すると考えられる。

事業使用事例が、クエリ結果の解釈を後押しする。例えば、より高い確度スコアを有するトリプレットが実現される場合、システムは、主語エンティティ値の元の値をより高い信憑性スコアを有する値と自動的に置換されるように構成することができる。忠実度指標は、返される情報の正確度の反映である。図示されているように、ステップ（５２８）の後、事業使用事例が検索結果に適用される（５３０）。ステップ（５３０）における適用の後、ＫＧと、ＫＧ内の対応するＢＣ識別子と関連付けられる適切なまたは識別されているＢＣ台帳の両方が問い合わせされる（５３２）。ステップ（５３２）における問い合わせは、すべての関連付けられる関係および主語エンティティ値を得る。より詳細には、これによって、主語エンティティについてすべてのデータを分析的に検討することが可能である。ステップ（５３２）の後、ＮＬＰ入力または出力データが増強される（５３４）。増強の例は、限定ではなく、補正、分析、増強、およびマスキングを含む。補正は、主語エンティティ値をメモリからのデータと置換されることを含む。１つの実施形態において、置換は、例えばクエリに対してローカルであり、ＫＧまたはＢＣ内では反映されない。分析は、主語−関係値のリストに信憑性を加えることを含む。増強は、例えば、主語−関係の対あたり１つの値など、最高レベルの確度を有するすべての既知の主語−関係値によって結果を補完することを含む。マスキングは、ＮＬＰ出力から１つまたは複数のトリプレットを削除することを含む。ステップ（５３２）の後、増強されたデータが返される。したがって、ＮＬＰ入力から１つまたは複数の適切なデータ要素を返すために、同じく増強され得る検索結果の解釈を後押しするのに、異なる使用事例が任意選択的に利用可能である。

図５および図６に示し、記載されているように、１つまたは複数のクエリが、作成されているＫＧに対して処理され得る。ＫＧは、データを組織化するためのツールとして機能し、各トリプレットが、例えば、忠実度、信頼度、およびフィードバックなどの信憑性スコア成分によって表現されるかまたは他の様態でそれと関連付けられるグラフ内に反映されることが理解される。信憑性スコア成分のうちの１つまたは複数は、動的であり得、例えば、値は経時的変化を受けることが理解される。この変化は、選択ＫＧ全体を通じて均一であり得、結果、ＫＧ内で表現される各トリプレットに影響を与え、または、変化は、不均一であり得、ＫＧ内の１つまたは複数のトリプレットに選択的に影響を与える。

図７を参照すると、１つまたは複数のＫＧを区分化するためのプロセスを示すフローチャート（６００）が与えられる。本明細書において示されている区分化の例は、信頼度因子の変化に基づく。これは一例に過ぎず、１つの実施形態において、区分化は、忠実度またはフィードバック因子の変化に基づいてもよい。信頼度因子は、データのソースの信頼度の測度を反映する。信頼度因子値が受信される（６０２）。１つの実施形態において、信頼度因子値は、ＫＧＡＰＩを通じたＮＬ入力およびフィードバックの一部である。ＫＧは、受信された信頼度値と関連付けられるエントリを識別するように求められる（６０４）。その後、何らかのＫＧエントリが識別されているか否かが判定される（６０６）。ステップ（６０６）における判定に対する応答が否定的である場合、受信された信頼度因子に基づいてＫＧに区分化を受けさせる根拠がないため、区分化プロセスは完了する（６１６）。しかしながら、ステップ（６０６）における判定に対する応答が肯定的である場合、その後、ＫＧ内にパーティションが作成され（６０８）、作成されたパーティションが、識別された信頼度値を有するＫＧ内のエントリによってデータ投入される（６１０）。ステップ（６０８）におけるパーティション作成によって、実効的に、元のＫＧ内の残りのエントリによってデータ投入される第２のパーティション（６１２）が作成される。

ＫＧの第１のパーティションおよび第２のパーティション内のエントリは、異なる信頼度因子値を有することが理解される。上述したように、信憑値は、忠実度、信頼度、およびフィードバック値の複合値として機能する。個々の成分値のいずれかの変化は、複合値に対して影響を及ぼし、これは、任意のクエリ結果に影響を及ぼし得る。ステップ（６１２）の後、第１のパーティションおよび第２のパーティションを含む、ＫＧ内の信憑性評価が行われる（６１４）。ステップ（６１４）における評価は、例えば第１のデータなど、第１のＫＧパーティション内に投入されたデータと、例えば第２のデータなど、第２のパーティション内に投入されたデータとの比較を含む。１つの実施形態において、信憑性評価は、区分化後に自動的に実施される。第１のパーティション内に投入されたデータは、第２のパーティション内のデータとは異なる信憑値を有することが理解される。本明細書において示されている区分化は、信憑値内で表現される１つの成分の変化に基づく。１つの実施形態において、区分化は、２つ以上の信憑値成分または成分の変化に対して行われてもよい。したがって、信憑値を含む成分のうちのいずれか１つの変化は、関連付けられるＫＧの１つまたは複数のパーティションの作成を含み得る。

図７に示すように、ＫＧは、区分化を受け得る。２つ以上のＫＧおよび関連付けられるＢＣ台帳を連結または他の様態で接合することによって、逆の概念が行われ得る。図８を参照すると、２つのＫＧおよび関連付けられるＢＣ台帳を連結するためのプロセスを示すフローチャート（７００）が与えられる。１つの実施形態において、少なくとも接線方向に関係付けられるＫＧが連結され得る。関係は、ＫＧ内で表現される内容または関係に基づき得る。図示されているように、クエリが知識ベースにて提示され（７０２）、２つ以上のＫＧが識別される（７０４）。１つの実施形態において、ＫＧＡＰＩは、２つのＫＧが、クエリに関連するデータを含むことを識別する。同様に、１つの実施形態において、ＫＧＡＰＩは、３つ以上のＫＧを識別することができ、そのため、識別されるＫＧの量は、限定であると考えられるべきではない。識別されたＫＧの間にリンクが確立される（７０６）。２つ以上のＫＧの連結は、別個のＫＧの構造を維持する、すなわち、構造は一定のままである。

ＫＧ、および、具体的にはその中で表現されるデータの間の関係は、矛盾するトリプレット、例えばメモリを有するクエリ結果を与える場合があることが理解される。潜在的な矛盾を解決するために、連結されているＫＧの評価が、データ要素を比較するために行われる（７０８）。より具体的には、比較は、それらの対応する信憑値成分を含む、連結されているＫＧの各々の中で表現されるデータの評価（７１０）を含む。識別された矛盾するデータ要素は、例えば、忠実度、信頼度、およびフィードバックなど、信憑値成分のうちの少なくとも１つに基づいて、選択的に置換される（７１２）。置換は、別個のＫＧの構造に従う。言い換えれば、ＫＧ内のノードは連結によって除去または追加されない。むしろ、識別されているノード内で表現されるデータは、置換することができる。したがって、連結されているＫＧ内の矛盾するエントリの置換は、矛盾するクエリ結果を軽減する。

図９および図１０を参照すると、ＭＬＭを活用してクエリ入力を増強することを示すフローチャート（８００）が与えられる。より具体的には、クエリ提出の結果は、クエリ入力において誘導されるエラーを示すことができる。図示されているように、自然言語入力が受信および処理される（８０２）。受信入力は、１つまたは複数の指定のＫＧ、および、１つの実施形態において、対応するＢＣ台帳を含め、文脈に対して問い合わせされる（８０４）。クエリ処理は、指定のＫＧから抽出または識別される、例えばメモリなどの、１つまたは複数のトリプレットの形態の結果を生成する（８０６）。上述したように、各トリプレットは、主語、目的語、および関連付けられる関係を含む。変数Ｘ_{Ｔｏｔａｌ}が、ＫＧから抽出または識別されているトリプレットの量に割り当てられる（８０８）。その後、ステップ（８０８）において抽出される量が、少なくとも１つのトリプレットを含むか否かが判定される（８１０）。ステップ（８１０）における判定に対する応答が肯定的である場合、その後、関連付けられるトリプレット・カウント変数が初期化される（８１２）。各トリプレットは、トリプレットと関連付けられるかまたはトリプレットに割り当てられる信憑値を含む、ＢＣ台帳エントリに対応するＢＣ識別子を有する。抽出または識別される各トリプレット、例えば、トリプレット_Ｘについて、ＢＣ識別子が取得され（８１４）、ＢＣ識別子から、ＢＣ台帳が求められ、対応する信憑値が識別される（８１６）。ステップ（８１６）の後、トリプレット・カウント変数が増分され（８１８）、抽出または識別されているＫＧの各々が評価されているか否かを判定するための評定が行われる（８２０）。ステップ（８２０）における判定に対する応答が否定的である場合、その後、ステップ（８１４）に戻り、応答が肯定的である場合、トリプレット抽出および識別プロセスが完了する。したがって、クエリ入力と関連付けられると判定される各トリプレットについて、関連付けられる信憑値が識別される。

ステップ（８１０）における判定に対する応答が否定的である場合、その後、関連付けられるＫＧ内のエントリについて新たなトリプレットが作成される（８２２）。新たなトリプレットは、受信される自然言語入力、例えば、クエリ提出に対応し、信憑性スコアが新たなトリプレットに割り当てられる（８２４）。加えて、ＫＧに対応するＢＣ台帳内のエントリが作成される（８２６）。ＢＣ台帳エントリと関連付けられるＢＣ識別子が作成され、新たなトリプレットとともにＫＧ内に記憶され（８２８）、割り当てられた信憑性スコアが対応する台帳エントリ内に記憶される（８３０）。したがって、クエリ入力から返されるトリプレットの空集合が、ＫＧおよび対応するＢＣ台帳に加えられることになる。

クエリ提出は、ステップ（８２０）における判定に対する肯定的応答によって識別されるものとしての、関連付けられるＫＧからの１つまたは複数のトリプレットの形態の応答を返すことができることが理解される。識別されているトリプレットが処理およびソートされた後（８３２）、ＭＬＭは、識別されているトリプレットのソートに対応するように、自然言語入力を増強する（８３４）。増強は１つまたは複数の形態をとることができる。例えば、１つの実施形態において、増強は、自然言語入力とソートされたトリプレットとの間の矛盾から生じる（８３６）。矛盾が識別されるとき、ＭＬＭによる増強は、ソートからの正しいトリプレットの識別（８３８）、および、識別されているトリプレットに対応するためのＮＬ入力の修正（８４０）の形態である。ステップ（８３８）における識別は、種々の形態をとることができる。例えば、１つの実施形態において、識別は、上述したように複合スコアである、関連付けられる信憑値に基づき得る。同様に、１つの実施形態において、信憑値を含む成分のうちの１つまたは複数は、トリプレットのリストをソートするためのソート因子として利用することができる。別の実施形態において、ソートは、トリプレット・エントリと関連付けられる不変の因子に基づいてもよく、不変の因子に基づいてトリプレットがソートされる。したがって、増強は、識別されている矛盾に基づいてもよい。

増強は、一致、または、１つの実施形態において、部分一致に応答する他の形態をとってもよいことが理解される。増強が、ソートにおいて自然言語入力と、トリプレットのうちの少なくとも１つとの間の一致から生じるとき（８４２）、自然言語入力のエントリが、ＢＣ台帳エントリとともに、対応するＫＧ内で作成される（８４４）。同様に、増強が、自然言語入力と、識別されているトリプレットのうちの少なくとも１つとの間の部分一致から生じるとき（８４６）、関連付けられるＫＧ内のエントリの新たなトリプレットが作成される（８４８）。新たなトリプレットは、受信されるＮＬ入力、例えば、クエリ提出に対応し、信憑性スコアが新たなトリプレットに割り当てられる（８４８）。加えて、ＫＧに対応するＢＣ台帳内のエントリが作成される（８５０）。ＢＣ台帳エントリと関連付けられるＢＣ識別子が作成され、新たなトリプレットとともにＫＧ内に記憶され（８５２）、割り当てられた信憑性スコアが対応する台帳エントリ内に記憶される（８５４）。加えて、ＫＧ内の新たなトリプレット・エントリが、部分一致によって識別されるトリプレットと接続される（８５６）。したがって、示されているように、一致または部分一致の増強は、対応するＫＧおよび関連付けられるＢＣ台帳内のエントリの作成を含む。

図３〜図１０に示し、記載されているように、ＫＧ内に記憶されているデータを識別し、１つの実施形態において、クエリ提出を増強するために、クエリ提出の形態の自然言語処理をサポートするために、ＭＬＭが利用される。ＭＬＭは動的であり、変化を受けることも理解される。ＫＧは、１つまたは複数の新たなＭＬＭを作成すること、または、既存のＭＬＭを再訓練すること、あるいはその両方のために利用され得る。オントロジーが修正されるとき、新たなエンティティおよび関係が認識される。この新たな情報は、その後、ＭＬＭの訓練を自動化し、結果、動的かつ漸進的なＭＬＭをサポートし、新たなＭＬＭを作成し、または、既存のＭＬＭを増強するために利用することができる。

図１１を参照すると、フローチャート（９００）は、既存のＭＬＭを訓練するためのプロセスを与える。ここで示されているプロセスにおいて、ＭＬＭのＮＬＰライブラリが存在する。ライブラリ内の、ここでは第１のＭＬＭとして参照されるＭＬＭが、ここでは第１のＫＧとして参照されるＫＧ内で表現される知識ドメインに対するその整合に基づいて識別または選択される（９０２）。第１のＫＧに対して問い合わせされる自然言語入力の受信に応答して、識別または選択されている第１のＭＬＭは、クエリ入力を処理し、第１のＫＧから１つまたは複数のトリプレットを抽出する（９０４）。加えて、第２のＫＧが識別され（９０６）、１つの実施形態において、第１のＫＧに関係付けられる。ＭＬＭは、第２のＫＧを用いて同じクエリを処理し、１つまたは複数のトリプレットが第２のＫＧから抽出される（９０８）。ステップ（９０４）および（９０８）において抽出される各トリプレットは、本明細書においてはメモリとしても参照され、主語、目的語、および関係を含む。上述したように、各トリプレットは、対応する信憑値を記憶しているＢＣ台帳を示す、関連付けられるＢＣ識別子を有する。ステップ（９０８）の後、抽出されている各トリプレットは、それらの対応するＢＣ台帳エントリ内に記憶されている、それらの関連付けられる信憑値を識別するために処理される（９１０）。第１のＫＧのトリプレットおよび第２のＫＧのトリプレットが評価および比較される（９１２）。より具体的には、ステップ（９１２）における評価は、第２のＫＧにおいて反映されるものとして、第１のＫＧの内容または構造あるいはその両方が修正を受けたか否かを評定する（９１４）。動的に修正されるべきＭＬＭについて、判定は、２つの主語ＫＧが関係付けられる構造および内容を有するか否かである。修正は、第１のＫＧおよび第２のＫＧから返されるトリプレットの比較を介して証明することができる。ステップ（９１４）における評価に対する応答が否定的である場合、ＭＬＭ修正が完了する（９２２）。しかしながら、ステップ（９１４）における評価に対する応答が肯定的である場合、その後、内容的変化または構造的変化あるいはその両方が識別される（９１６）。加えて、対応する信憑値が、変化の信頼性を検証するために評定される（９１８）。ステップ（９１８）における検証に基づいて、ＭＬＭの構造は、動的修正を受ける（９２０）。

ステップ（９２０）における修正は、種々の形態をとることができる。例えば、１つの実施形態において、ＭＬＭの修正は、第１のＫＧエントリと比較したときに、第２のＫＧエントリ内で反映される、検証される変化に一致し得る。別の実施形態において、修正は、抽出されたデータの対応する信憑値の評定に基づいてもよい。したがって、ＭＬＭが、ＫＧ内の変化に基づく変化を受けることが実証される。

さらに、ＫＧ内で表現されるデータおよび関連付けられる関係は、共時的または通時的情報であり得ることが理解される。分類は、ステップ（９１２）における評価にインポートされ得る。変化すべきでなく、修正されていることが実証されているデータは、ＭＬＭ修正において反映されるべきではない。したがって、データ分類は、データ評価および関連付けられるＭＬＭ評価にインポートされ得る。

図１２を参照すると、漸進的かつ適応的なＭＬＭ構成のためのプロセスを示すフローチャート（１０００）が与えられる。ＫＧＡＰＩは、新たなエンティティ、関係、およびデータについて、関連付けられるまたは識別されているＫＧを定期的に検索する（１００２）。ステップ（１００２）における識別は、ＫＧ内のエントリのデータまたは時間あるいはその両方のチェック、または、既存のＭＬＭからのエンティティおよび関係と、ＫＧ内に含まれるデータとの比較によって達成することができる。ＫＧ内に存在する、および、対象のＭＬＭ内に存在しないエンティティおよび関係のリストが生成される（１００４）。リストは、ＭＬＭを生成するために使用される訓練ツールによって消費可能であるフォーマットにおいて生成される。消費可能データは、既存のＭＬＭの構造を更新するためにストリーミングされる（１００６）。１つの実施形態において、ＫＧＡＰＩは、訓練のためにその後ＭＬＭに供給することができる各トリプレットを表現する言語文をＫＧから生成する。ステップ（１００６）の後、更新されたＭＬＭが新たなＭＬＭとしてＭＬＭライブラリ内に記憶される（１００８）。１つの実施形態において、漸進的ＭＬＭ構成は、既存のＭＬＭの増分的変化を表現するため、増分的である。増分的機械学習は、ＭＬＭを、ＫＧの構造と同期させるように機能する。連続的または増分的変化が標的ＭＬＭに対して実施され、結果、各増分的変化によって、ＭＬＭがＫＧからデータを抽出する能力が増大し、ＭＬＭが実効的に適合する。

本明細書において示されているシステムおよびフローチャートはまた、ＮＬ処理を容易にするためにインテリジェント・コンピュータ・プラットフォームとともに使用するためのコンピュータ・プログラム・デバイスの形態であってもよい。このデバイスには、プログラム・コードが具現化されている。プログラム・コードは、処理ユニットによって、記載されている機能をサポートするために実行可能である。

図示および説明されているように、１つの実施形態において、処理ユニットは、対応するＢＣ台帳および関連付けられるエントリとともに、既存のＫＧおよび対応するＭＬＭの証拠を求めてコーパスを検索する機能をサポートする。複合信憑性スコアが、関連付けられるデータの定性化または定量化あるいはその両方を行い、１つまたは複数の評定を行うための重みを与える。対応するＢＣ台帳内の関連付けられる構成要素とともに信憑性スコアを記録することによって、データに信頼性が与えられる。結果セット内の各エントリは、対応する信憑性スコアに基づいて評価される。本明細書において説明されているように、ＫＧは、区分化および連結、ならびに、１つまたは複数の選択ＫＧに対して表現または割り当てされているデータに信憑性スコア成分を割り当てることを含む、修正を受ける。同様に、本明細書において説明されているように、ＭＬＭは、ＫＧのうちの１つまたは複数への構造的変更を反映するように、動的に調製することができる。より具体的には、ＭＬＭは、新たなエンティティおよびエンティティ関係に適応する。

本明細書において、メモリおよび外部学習の使用を通じて動的ＭＬＭ生成および増強のためのシステム、方法、装置、およびコンピュータ・プログラム製品が開示されていることが諒解されよう。開示されているように、システム、方法、装置、およびコンピュータ・プログラム製品は、ＭＬＭをサポートし、ＭＬＭがＫＧの持続をサポートするために、ＮＬ処理を適用する。

本発明の特定の実施形態が図示および説明されているが、本明細書における教示に基づいて、本発明およびそのより広い態様から逸脱することなく、変更および修正を行うことができることが、当業者には明らかになる。それゆえ、添付の特許請求の範囲は、すべてのそのような変更および修正を、本発明の真の思想および範囲内にあるように、それらの範囲内に包含するものとする。さらに、本発明が、添付の特許請求の範囲によってのみ規定されることは理解されたい。具体的な数の特許請求項の要素の導入が意図されている場合、そのような意図は特許請求項において明示的に列挙されており、そのような列挙がない場合、そのような限定は存在しないことが当業者には理解されよう。非限定的な例として、理解を助けるものとして、以下の添付の特許請求の範囲は、特許請求項の要素を導入するために前置きの語句「少なくとも１つ」および「１つまたは複数」の使用を含む。しかしながら、このような語句を使用することは、不定冠詞「ａ」または「ａｎ」による特許請求項の列挙の導入が、たとえ同じ特許請求項が前置きの語句「１つまたは複数」または「少なくとも１つ」および「ａ」または「ａｎ」のような不定冠詞を含む場合であっても、このように導入される特許請求項の要素を含む任意の特定の特許請求項をただ１つのこのような要素を含む発明に限定することを暗示するものとして解釈されるべきではなく、同じことが、特許請求項の範囲における定冠詞の使用にも当てはまる。

本発明は、システム、方法、またはコンピュータ・プログラム製品あるいはその組合せであってもよい。加えて、本発明の選択される態様は、本明細書においてはすべて包括的に「回路」、「モジュール」または「システム」と称する場合がある、全体がハードウェアの実施形態、全体がソフトウェアの実施形態（ファームウェア、常駐ソフトウェア、マイクロコードなどを含む）、または、ソフトウェアの態様またはハードウェアの態様あるいはその両方を組み合わせた実施形態の形態をとり得る。さらに本発明の諸態様は、プロセッサに、本発明の諸態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体において具現化されるコンピュータ・プログラム製品の形態をとり得る。このように具現化されると、本開示のシステム、方法、またはコンピュータ・プログラム製品あるいはその組合せは、信憑値に基づいて機械学習モデルの機能および動作を改善し、ＢＣ技術を活用するように動作可能である。

コンピュータ可読記憶媒体は、命令実行デバイスによって使用するための命令を保持および記憶することができる有形デバイスとすることができる。コンピュータ可読記憶媒体は例えば、限定ではないが、電子記憶デバイス、磁気記憶デバイス、光記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、または上記の任意の適切な組合せであってもよい。コンピュータ可読記憶媒体のより特定的な例の包括的でないリストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ダイナミックまたはスタティック・ランダム・アクセス・メモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能プログラマブル読み出し専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、磁気記憶デバイス、ポータブル・コンパクト・ディスク読み出し専用メモリ（ＣＤ−ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリ・スティック、フロッピー（Ｒ）ディスク、パンチ・カード、または、命令を記録されている溝の中の隆起構造のような機械的に符号化されているデバイス、および、上記の任意の適切な組合せを含む。コンピュータ可読記憶媒体は、本明細書において使用されるものとしては、無線波、または、他の自由に伝播する電磁波、導波路もしくは他の伝送媒体（例えば、光ファイバ・ケーブルを通過する光パルス）を通じて伝播する電磁波、または、ワイヤを通じて伝送される電気信号のような、過渡的信号自体として解釈されるべきではない。

本明細書において記載されているコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理デバイスへ、または、ネットワーク、例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワークもしくはワイヤレス・ネットワークまたはその両方を介して外部コンピュータもしくは外部記憶デバイスへダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、ワイヤレス送信、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータまたはエッジサーバあるいはその組合せを含んでもよい。各コンピューティング／処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースが、ネットワークからコンピュータ可読プログラム命令を受信し、それぞれのコンピューティング／処理デバイス内のコンピュータ可読記憶媒体内に記憶するために、コンピュータ可読プログラム命令を転送する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、または、Ｊａｖａ（Ｒ）、Ｓｍａｌｌｔａｌｋ、Ｃ＋＋などのようなオブジェクト指向プログラミング言語、および、「Ｃ」プログラミング言語もしくは同様のプログラミング言語のような従来の手続き型プログラミング言語を含む、１つまたは複数のプログラミング言語の任意の組合せで書かれているソースコードもしくはオブジェクトコードのいずれかであってもよい。コンピュータ可読プログラム命令は、その全体をユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、独立型ソフトウェア・パッケージとして、部分的にユーザのコンピュータ上でかつ部分的にリモート・コンピュータ上で、またはその全体をリモート・コンピュータもしくはサーバもしくはサーバのクラスタ上で実行することができる。後者のシナリオにおいて、リモート・コンピュータが、ローカル・エリア・ネットワーク（ＬＡＮ）もしくは広域ネットワーク（ＷＡＮ）を含む任意のタイプのネットワークを通じてユーザのコンピュータに接続されてもよく、または、接続は、外部コンピュータに対して（例えば、インターネット・サービス・プロバイダを使用してインターネットを通じて）行われてもよい。いくつかの実施形態において、例えば、プログラム可能論理回路、フィールドプログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラム可能論理アレイ（ＰＬＡ）を含む電子回路が、本発明の態様を実施するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路をカスタマイズすることによって、コンピュータ可読プログラム命令を実行することができる。

本発明の態様は、本明細書において、本発明の実施形態による、方法、装置（システム）およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明されている。フローチャート図またはブロック図あるいはその両方の各ブロック、および、フローチャート図またはブロック図あるいはその両方の中の複数のブロックの組合せはそれぞれ、コンピュータ可読プログラム命令によって実装されることができることは理解されよう。

これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ、または他のプログラム可能データ処理装置のプロセッサに提供されてマシンを生成することができ、それによって、コンピュータまたは他のプラグラマム可能データ処理装置のプロセッサを介して実行する命令は、フローチャート図またはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作を実施するための手段を作り出す。これらのコンピュータ可読プログラム命令はまた、コンピュータ、プログラム可能データ処理装置、または他のデバイスあるいはその組合せに特定の様式で機能するように指示することができるコンピュータ可読記憶媒体内に記憶することもでき、それによって、命令を記憶されているコンピュータ可読記憶媒体は、フローチャート図またはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作の態様を実施する命令を含む製造品を含む。

コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能データ処理装置、または他のデバイス上にロードされて、一連の動作ステップが、コンピュータ、他のプログラム可能装置、または他のデバイス上で実行されるようにして、コンピュータで実施されるプロセスを生成することができ、それによって、コンピュータ、他のプログラム可能装置、または他のデバイス上で実行する命令が、フローチャート図またはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作を実施する。

図面内のフローチャート図およびブロック図は本発明の様々な実施形態によるシステム、方法およびコンピュータ・プログラム製品の可能な実施態様のアーキテクチャ、機能、および動作を例示する。これに関連して、フローチャート図またはブロック図内の各ブロックは、指定の論理機能を実施するための１つまたは複数の実行可能命令を含む、モジュール、セグメント、または命令の一部分を表すことができる。いくつかの代替的な実施態様において、ブロックに記載されている機能は、図面に記載されている順序と一致せずに行われてもよい。例えば、連続して示されている２つのブロックは実際には、関与する機能に応じて、実質的に同時に実行されてもよく、または、これらのブロックは、時として逆順に実行されてもよい。また、ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方のブロックの組合せは、指定の機能もしくは動作を実施するか、または、専用ハードウェアとコンピュータ命令との組合せを実行する専用ハードウェアベース・システムによって実施することができることも留意されよう。

本発明の特定の実施形態が例示を目的として本明細書において説明されているが、本発明の思想および範囲から逸脱することなく、様々な修正を行うことができることが諒解されよう。特に、自然言語処理は、複数の異なるコンピューティング・プラットフォームによって、または、複数のデバイスにわたって実行されてもよい。さらに、データ記憶装置またはコーパスあるいはその両方は、局在化されてもよく、リモートであってもよく、または複数のシステムにわたって分散されてもよい。したがって、本発明の保護範囲は添付の特許請求の範囲およびそれらの均等物によってのみ限定される。

Claims

コンピュータ・システムであって、
メモリに動作可能に結合されている処理ユニットと、
前記処理ユニットと通信する知識エンジンであって、
構造化データ、非構造化データ、およびこれらの組合せから成る群から選択されるデータから、データおよびデータ関係を抽出することと、
抽出された前記データおよび前記データ関係のエントリを知識グラフ（ＫＧ）内に作成し、記憶されている前記データへの信憑値の割り当てを含め、抽出された前記データおよび前記データ関係を選択的に前記ＫＧ内に記憶することと、
前記ＫＧに対応するブロックチェーン（ＢＣ）台帳内にアセット値エントリを作成することであって、前記アセット値エントリは、割り当てられた前記信憑値を含む、前記アセット値エントリを作成することと、
前記ＢＣ台帳エントリに対応するＢＣ識別子を作成することと、
作成された前記ＢＣ識別子を、前記ＫＧエントリとともに記憶することと
を含む、データを管理することと、
前記ＢＣ識別子を利用して選択データの来歴を判定し、前記データを定量化することを含め、前記ＫＧ内に記憶されている前記選択データを評価することと、
評価された前記データのリストを生成し、割り当てられた前記信憑値に基づいて、生成された前記リスト内の前記データをソートすることと
を行うための、前記知識エンジンと
を備え、
ソートされた前記リストから、最も強い信憑性スコアを有するデータ要素が返される、コンピュータ・システム。
前記知識エンジンが、
前記ＫＧ内に第１のパーティションを作成し、前記第１のパーティション内の第１のデータに第１の信頼度値をデータ投入し、割り当てることと、
前記ＫＧ内に第２のパーティションを作成し、前記第２のパーティション内の第２のデータに、前記第１の信頼度値とは異なる第２の信頼度値をデータ投入し、割り当てることとを行うことをさらに行う、請求項１に記載のシステム。
前記知識エンジンが、前記第１のデータと前記第２のデータとの比較を含め、前記ＫＧ内での信憑性評価を自動的に実施することをさらに行う、請求項２に記載のシステム。
前記知識エンジンが、第２のＫＧ内のデータ要素と第１のＫＧ内のデータ要素とを比較および評価し、信頼度、フィードバック、およびこれらの組合せから成る群から選択される値に基づいて、データ要素を選択的に置換することを含め、２つの知識グラフ間にリンクを確立することをさらに行う、請求項１に記載のシステム。
前記知識エンジンが、前記第１のＫＧと前記第２のＫＧとの間の前記リンクの確立後に、前記ＫＧの構造を一定に維持することをさらに行う、請求項４に記載のシステム。
前記データは、前記ＫＧ内のノード内に記憶され、前記関係は、２つのノードを接続するエッジとして表現され、各ノードは、ノード・レベル信憑値を有し、各関係は、関係信憑値を有し、前記関係値は、前記関係内の前記ノードの前記信憑値に基づいて計算される、請求項１に記載のシステム。
自然言語を処理するためのコンピュータ・プログラム製品であって、プログラム・コードが具現化されているコンピュータ可読記憶デバイスを備え、前記プログラム・コードは、処理ユニットによって、
知識グラフ（ＫＧ）内にデータを記憶することであって、
構造化データ、非構造化データ、およびこれらの組合せから成る群から選択されるデータから、データおよびデータ関係を抽出することと、
前記ＫＧ内にエントリを作成し、記憶されている前記データへの信憑値の割り当てを含め、抽出された前記データおよび前記データ関係を選択的に前記ＫＧ内に記憶することと、
前記ＫＧに対応するブロックチェーン（ＢＣ）台帳内にアセット値エントリを作成することであって、前記アセット値エントリは、割り当てられた前記信憑値を含む、前記アセット値エントリを作成することと、
前記ＢＣ台帳エントリに対応するＢＣ識別子を作成することと、
作成された前記ＢＣ識別子を、前記ＫＧエントリとともに記憶することと
を含む、ＫＧ内にデータを記憶することと、
前記ＢＣ識別子を利用して選択データの来歴を判定し、前記データを定量化することを含め、前記ＫＧ内に記憶されている前記選択データを評価することと、
評価された前記データのリストを生成し、割り当てられた前記信憑値に基づいて、生成された前記リスト内の前記データをソートすることと、
結果を生成することであって、前記結果は、ソートされた前記リストから返される、最も強い信憑性スコアを有するデータ要素であるデータ要素である、前記結果を生成することと
を行うように実行可能である、コンピュータ・プログラム製品。
前記ＫＧ内に第１のパーティションを作成し、前記第１のパーティション内の第１のデータに第１の信頼度値をデータ投入し、割り当てることと、
前記ＫＧ内に第２のパーティションを作成し、前記第２のパーティション内の第２のデータに、前記第１の信頼度値とは異なる第２の信頼度値をデータ投入し、割り当てることと
を行うためのプログラム・コードをさらに備える、請求項７に記載のコンピュータ・プログラム製品。
前記第１のデータと前記第２のデータとの比較を含め、前記ＫＧ内での信憑性評価を自動的に実施するためのプログラム・コードをさらに備える、請求項８に記載のコンピュータ・プログラム製品。
第２のＫＧ内のデータ要素と第１のＫＧ内のデータ要素とを比較および評価し、信頼度、フィードバック、およびこれらの組合せから成る群から選択される値に基づいて、データ要素を選択的に置換することを含め、２つの知識グラフ間にリンクを確立するためのプログラム・コードをさらに備える、請求項７に記載のコンピュータ・プログラム製品。
前記第１のＫＧと前記第２のＫＧとの間の前記リンクの確立後に、前記ＫＧの構造を一定に維持するためのプログラム・コードをさらに備える、請求項１０に記載のコンピュータ・プログラム製品。
前記データは、前記ＫＧ内のノード内に記憶され、前記関係は、２つのノードを接続するエッジとして表現され、各ノードは、ノード・レベル信憑値を有し、各関係は、関係信憑値を有し、前記関係値は、前記関係内の前記ノードの前記信憑値に基づいて計算される、請求項７に記載のコンピュータ・プログラム製品。
自然言語を処理するコンピュータ実施方法であって、
知識グラフ（ＫＧ）内にデータを記憶することであって、
構造化データ、非構造化データ、およびこれらの組合せから成る群から選択されるデータから、データおよびデータ関係を抽出することと、
前記ＫＧ内にエントリを作成し、記憶されている前記データへの信憑値の割り当てを含め、抽出された前記データおよび前記データ関係を選択的に前記ＫＧ内に記憶することと、
前記ＫＧに対応するブロックチェーン（ＢＣ）台帳内にアセット値エントリを作成することであって、前記アセット値エントリは、割り当てられた前記信憑値を含む、前記アセット値エントリを作成することと、
前記ＢＣ台帳エントリに対応するＢＣ識別子を作成することと、
作成された前記ＢＣ識別子を、前記ＫＧエントリとともに記憶することと
を含む、ＫＧ内にデータを記憶することと、
前記ＢＣ識別子を利用して選択データの来歴を判定し、前記データを定量化することを含め、前記ＫＧ内に記憶されている前記選択データを評価することと、
評価された前記データのリストを生成し、割り当てられた前記信憑値に基づいて、生成された前記リスト内の前記データをソートすることと
を含み、
ソートされた前記リストから、最も強い信憑性スコアを有するデータ要素が返される、コンピュータ実施方法。
前記ＫＧ内に第１のパーティションを作成し、前記第１のパーティション内の第１のデータに第１の信頼度値をデータ投入し、割り当てることと、
前記ＫＧ内に第２のパーティションを作成し、前記第２のパーティション内の第２のデータに、前記第１の信頼度値とは異なる第２の信頼度値をデータ投入し、割り当てることと
をさらに含む、請求項１３に記載の方法。
前記第１のデータと前記第２のデータとの比較を含め、前記ＫＧ内での信憑性評価を自動的に実施することをさらに含む、請求項１４に記載の方法。
第２のＫＧ内のデータ要素と第１のＫＧ内のデータ要素とを比較および評価し、信頼度、フィードバック、およびこれらの組合せから成る群から選択される値に基づいて、データ要素を選択的に置換することを含め、２つの知識グラフ間にリンクを確立することをさらに含む、請求項１３に記載の方法。
前記第１のＫＧと前記第２のＫＧとの間の前記リンクの確立後に、前記ＫＧの構造を一定に維持することをさらに含む、請求項１６に記載の方法。
前記データは、前記ＫＧ内のノード内に記憶され、前記関係は、２つのノードを接続するエッジとして表現され、各ノードは、ノード・レベル信憑値を有し、各関係は、関係信憑値を有し、前記関係値は、前記関係内の前記ノードの前記信憑値に基づいて計算される、請求項１３に記載の方法。