JP2022519963A

JP2022519963A - ナレッジグラフに基づく事件検索方法、装置、機器及び記憶媒体

Info

Publication number: JP2022519963A
Application number: JP2021512261A
Authority: JP
Inventors: シュエチェンチャン; ジアウェイリュウ; シューミンユイ; チェンチェン; クアリー; ウェイワン
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-01-08
Filing date: 2020-05-29
Publication date: 2022-03-28
Anticipated expiration: 2040-05-29
Also published as: JP7141180B2; US20220121695A1; US12001466B2; CN111241241A; CN111241241B; WO2021139074A1; SG11202100444SA

Abstract

本願は、ビッグデータの分野に関するものであり、事件検索システムのユーザビリティを向上させるナレッジグラフに基づく事件検索方法、装置、機器及び記憶媒体が開示されている。本願の方法は、テキスト情報に基づいて法律事件ナレッジグラフを構築するステップと、前記法律事件ナレッジグラフに基づいて構築されたノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップと、複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得するステップと、ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築するステップと、前記検索すべきナレッジグラフに基づいて前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報を取得するステップと、前記事件情報の第１の類似度と第２の類似度に基づいて、出力される事件情報を取得するステップと、を含む。

Description

本願は、２０２０年１月８日に中国専利局に提出された、出願番号が２０２０１００１７５９０．４で、発明の名称が「ナレッジグラフに基づく事件検索方法、装置、機器及び記憶媒体」である中国特許出願の優先権を主張するものであり、その全ての内容は、参照により本願に組み込まれるものとする。

本願は、ビッグデータの分野におけるナレッジグラフの分野に関し、特に、ナレッジグラフに基づく事件検索方法、装置、機器及び記憶媒体に関する。

類似事件の検索方式は、事件の関連情報に基づいて過去事件を検索し、最も類似する事件を見つける事件情報の取得方式であり、得られた事件情報は、法官の判決や訴訟事件の関係者に参考を提供することができる。現在採用されている類似事件の検索方式は、裁判文書中の関連フィールドを検索することのみに基づいて裁判文書を全文検索し、裁判文書における司法裁判の関連知識との明確な対応関係がなく、司法裁判の「キー事実」の複雑な論理がキーワードで記述しにくく、異なる文書での争点、訴因及び訴訟上の請求等の関連情報の表記方式が一致しない影響因子を処理しないため、検索の正確性及び専門性について高い効果を達成することができない。

現在の類似事件の検索は、ユーザが入力した照会内容を受信することにより、前記照会内容を分析して前記照会内容の第１のキー情報を取得し、前記第１のキー情報に基づいて、作成された裁判ナレッジグラフから第２のキー情報を取得し、前記第２のキー情報によりデータベースで検索して、前記第２のキー情報に関連する判例テキストを取得し、前記判例テキストを順序付けし、順序付けされた判例テキストを予め設定された推薦条件に従って推薦出力する。発明者らは、裁判ナレッジグラフが、裁判文書の内容のみに基づいて構築されたナレッジグラフであるため、検索される参照対象が比較的単一であり、取得された判例テキストはあまり参考にならず、検索回数と検索方式を増加させてしまうので、事件検索システムのユーザビリティが低くなってしまうことを見出した。

本願は、法律事件ナレッジグラフの構築、法律事件ナレッジグラフの検索、ランダムウォークサンプリング及びコサイン類似度算出などのステップにより、法律事件ナレッジグラフと検索すべきナレッジグラフの事件情報が記述上、関連性、専門性、及び全面性がより高くなるようにするとともにシステムが高い拡張可能性と高い操作性を備えるようにして、検索の速度と正確性を向上させ、ユーザによるシステムの操作回数を減少させて事件検索システムのユーザビリティを向上させるためのナレッジグラフに基づく事件検索方法、装置、機器及び記憶媒体を提供する。

本願の実施例の第１の態様によれば、
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフを分析してノード集合データを構築するステップと、
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップと、
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得するステップと、
ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築するステップと、
前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、前記検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得するステップと、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の内容記述上の類似度を示す第１の類似度及び前記事件情報の論理的関係上の類似度を示す第２の類似度を算出し、前記事件情報の前記第１の類似度及び前記第２の類似度を加算して、ターゲット類似度を取得するステップと、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力するステップと、を含むナレッジグラフに基づく事件検索方法を提供する。

本願の実施例の第２の態様によれば、上記第１の態様に係るナレッジグラフに基づく事件検索方法を実現する機能を有するナレッジグラフに基づく事件検索装置を提供する。前記機能は、ハードウェアによって実現されてもよく、ハードウェアによって対応するソフトウェアを実行して実現されてもよい。ハードウェア又はソフトウェアは、上記機能に対応する１つ以上のモジュールを含み，前記ユニットは、ソフトウェア及び／又はハードウェアであってよい。

前記装置は、
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフを分析してノード集合データを構築する第１の構築ユニットと、
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するサンプリングユニットと、
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得する第１の取得ユニットと、
ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築する第２の構築ユニットと、
前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、前記検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得する第２の取得ユニットと、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の内容記述上の類似度を示す第１の類似度及び前記事件情報の論理的関係上の類似度を示す第２の類似度を算出し、前記事件情報の前記第１の類似度及び前記第２の類似度を加算して、ターゲット類似度を取得する算出ユニットと、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力する順序付けユニットと、を含む。

本願の実施例の第３の態様によれば、メモリと、プロセッサと、前記メモリに記憶されて前記プロセッサ上で実行可能で、前記プロセッサによって実行されると、ナレッジグラフに基づく事件検索方法を実現するコンピュータプログラムと、を含むナレッジグラフに基づく事件検索機器であって、前記方法は、
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフを分析してノード集合データを構築するステップと、
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップと、
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得するステップと、
ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築するステップと、
前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、前記検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得するステップと、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の内容記述上の類似度を示す第１の類似度及び前記事件情報の論理的関係上の類似度を示す第２の類似度を算出し、前記事件情報の前記第１の類似度及び前記第２の類似度を加算して、ターゲット類似度を取得するステップと、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力するステップと、を含むナレッジグラフに基づく事件検索機器を提供する。

本願の実施例の第４の態様によれば、コンピュータ上で実行されると、
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフを分析してノード集合データを構築するステップと、
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップと、
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得するステップと、
ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築するステップと、
前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、前記検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得するステップと、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の内容記述上の類似度を示す第１の類似度及び前記事件情報の論理的関係上の類似度を示す第２の類似度を算出し、前記事件情報の前記第１の類似度及び前記第２の類似度を加算して、ターゲット類似度を取得するステップと、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力するステップと、を含むナレッジグラフに基づく事件検索方法をコンピュータに実行させる命令を含むコンピュータ読み取り可能な記憶媒体を提供する。

本願の実施例に係る発明は、従来技術と比較して、テキスト情報に基づいて法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフに基づいて構築されたノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得し、複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得し、ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築し、前記検索すべきナレッジグラフに基づいて前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報を取得し、前記事件情報の第１の類似度と第２の類似度に基づいて、出力される事件情報を取得する。本願の実施例によれば、法律事件ナレッジグラフと検索すべきナレッジグラフの事件情報が記述上、関連性、専門性、及び全面性がよりより高くなるとともに、システムが高い拡張可能性と高い操作性を備えているので、検索の速度と正確性が向上し、ユーザによるシステムの操作回数が減少して事件検索システムのユーザビリティが向上する。

本願の実施例におけるナレッジグラフに基づく事件検索方法の一実施例の概略図である。本願の実施例における構築された法律事件ナレッジグラフの概略図である。本願の実施例におけるターゲット類似度を取得するために比較された検索すべきナレッジグラフの概略図である。本願の実施例におけるターゲット類似度を取得するために比較された法律事件ナレッジグラフの概略図である。本願の実施例におけるナレッジグラフに基づく事件検索方法の別の実施例の概略図である。本願の実施例におけるナレッジグラフに基づく事件検索装置の一実施例の概略図である。本願の実施例におけるナレッジグラフに基づく事件検索装置の別の実施例の概略図である。本願の実施例におけるナレッジグラフに基づく事件検索機器の一実施例の概略図である。

本願の実施例に係るナレッジグラフに基づく事件検索方法のフローチャートである図１を参照しながら、以下、本願に係る、コンピュータ機器により実行されるナレッジグラフに基づく事件検索方法を例示して説明する。コンピュータ機器は、サーバ又は端末であってもよく、図８に示す装置８０がアプリケーション又はエクセキュティブプログラムである場合、端末は図８に示す装置８０が実装された端末であり、本願は、実行主体のタイプを限定するものではない。該方法は、具体的には、ステップ１０１～１０７を含む。

ステップ１０１では、予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、法律事件ナレッジグラフを分析してノード集合データを構築する。

サーバは、予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、法律事件ナレッジグラフを分析してノード集合データを構築する。

具体的には、サーバは、テキスト情報を分析してテキスト情報中のノイズをクリアし、不一致を訂正し、テキスト情報をデータ統合し、テキスト情報を複数のデータソースから１つの一致したデータに統合して記憶し、テキスト情報に対して集約、冗長特徴の削除とクラスタリングの処理を行い、テキスト情報に対してデータ変換処理を行って、テキスト情報を小さい区間と機械が認識可能な表現式とに圧縮し、テキスト情報に対して単語分割処理を行い、分割された単語を特徴抽出して特徴情報を取得し、予め設定された畳み込みニューラルネットワーク言語モデルを呼び出して、自然言語処理（ＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ、ＮＬＰ）アルゴリズムにより、特徴情報を属性、属性に対応する内容及び属性間の関係を含むナレッジグラフの構造化データとして解釈し、属性、属性に対応する内容及び属性間の関係に基づいて、図２に示すように、法律事件ナレッジグラフを作成する。法律事件ナレッジグラフを分析し、原告情報と、原告の訴訟上の請求情報と、争点と、事実要素と、小要素と、法条と、原告が提供した証拠情報と、前の関連関係とに基づいて、法律事件ナレッジグラフを分割して再組み合わせて、法律事件ナレッジグラフのノードデータをツリー構造のノード集合データに構築する。図２の内容は、参考例に過ぎず、その内容の正確性と実際の操作の有無は考慮しない。

ステップ１０２では、ノード集合データの各ノードを出発点として、ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得する。

サーバは、ノード集合データの各ノードを出発点として、ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得する。

具体的には、法律事件ナレッジグラフをディープウォーク（Ｄｅｅｐｗａｌｋ）アルゴリズムモデルに深度入力して監視なしの予備訓練を行う。反復回数ｎ、ステップ幅ｍ、変数データｐ、及び毎回ランダムに生成されるベクトルの数ｑを設定し、ランダムウォーク回数ｋを初期化し、ノード集合データの各ノードを出発点とし、出発点の下流ノード集合の重み値でノード集合データをｍステップランダムウォークし、ｋ回ランダムウォークし、ｍステップランダムウォークした場合に、現在のノードには下流結合点がないと、該ノードでランダムウォークを停止し、そして、変数データｐと、毎回ランダムに生成されるベクトルの数ｑとに基づいて１本ずつのシーケンスデータを生成し、ｎ回反復操作し、一連のランダムウォーク操作が完了すると、シーケンスデータの最適値を算出し、最適値を取得できなければ、改めてステップ幅を設定し、最適値が取得されるまでノード集合データをランダムウォークサンプリングする。目的関数の反数の最小値を算出することにより最適値を算出することができ、試験関数は、

であり、ここで、ｘとｙはランダムウォーク停止時に所在するノードの座標を示し、はグローバル最大値の値範囲を示し、ｅは制御精度を示す。

ステップ１０３では、複数のシーケンスデータに基づいて単語変換ベクトルアルゴリズムによりモデルを訓練して、更新されたターゲットモデルを取得する。

サーバは、複数のシーケンスデータに基づいて単語変換ベクトルアルゴリズムによりモデルを訓練して、更新されたターゲットモデルを取得する。

具体的には、単語変換ベクトルｗｏｒｄ２ｖｅｃアルゴリズムにより複数のシーケンスデータを分析して、モデルを訓練し、モデルを更新する。入力層により複数のシーケンスデータ中の単語をベクトルの表現形式に変換して単語ベクトルを取得し、隠れ層により入力層から出力された単語ベクトルの累積和を算出して総ベクトルを取得し、総ベクトルが出力層のハフマンツリーの各非リーフノードに結合され、意味的関係と文脈関係に基づいて総ベクトルに対してハフマンツリーを構築し、エネルギー関数によりハフマンツリーに対して確率算出を行うことができる。

ステップ１０４では、ターゲットテキスト情報を取得し、ターゲットモデルによりターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築する。

サーバは、ターゲットテキスト情報を取得し、ターゲットモデルによりターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築する。

具体的には、サーバは、ターゲットテキスト情報を分析してテキスト情報中のノイズをクリアし、不一致を訂正し、ターゲットテキスト情報をデータ統合し、ターゲットテキスト情報を複数のデータソースから１つの一致したデータに統合して記憶し、ターゲットテキスト情報に対して集約、冗長特徴の削除とクラスタリングの処理を行い、ターゲットテキスト情報に対してデータ変換処理を行い、ターゲットテキスト情報を小さい区間と機械が認識可能な表現式とに圧縮し、ターゲットテキスト情報に対して単語分割処理を行い、分割された単語を特徴抽出して特徴情報を取得し、予め設定された畳み込みニューラルネットワーク言語モデルを呼び出して、ＮＬＰアルゴリズムにより、特徴情報を属性、属性に対応する内容及び属性間の関係を含むナレッジグラフの構造化データとして解釈し、属性、属性に対応する内容及び属性間の関係に基づいて、検索すべきナレッジグラフを作成する。

ステップ１０５では、法律事件ナレッジグラフで検索して、検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得する。

サーバは、法律事件ナレッジグラフで検索して、検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得する。

具体的には、検索すべきナレッジグラフに対して特徴抽出を行い、特徴情報間のつながりを分析して、訴因情報と事件タイプ情報を含む関連特徴情報を取得し、関連特徴情報に基づいて法律事件ナレッジグラフをトラバースし、同じ及び／又は類似する事件情報と事件情報に対応する第１の単語埋め込みベクトルデータと、検索すべきナレッジグラフの第２の単語埋め込みベクトルデータとを取得する。第１の単語埋め込みベクトルデータ及び第２の単語埋め込みベクトルデータにより、検索すべきナレッジグラフのノードと法律事件ナレッジグラフのノードの間の関係の類似度及び内容の類似度を算出することに役立つ。

ステップ１０６では、第１の単語埋め込みベクトルデータ及び第２の単語埋め込みベクトルデータに基づいて、事件情報の内容記述上の類似度を示す第１の類似度及び第２の類似度を算出し、事件情報の第１の類似度及び第２の類似度を加算して、ターゲット類似度を取得する。

サーバは、第１の単語埋め込みベクトルデータ及び第２の単語埋め込みベクトルデータに基づいて、事件情報の内容記述上の第１の類似度及び論理的関係上の第２の類似度を算出し、第１の類似度及び第２の類似度を加算してターゲット類似度を取得する。

具体的には、第１の単語埋め込みベクトルデータと第２の単語埋め込みベクトルデータとの間の内容記述上の類似度を算出して、事件情報の第１の類似度を取得し、第１の単語埋め込みベクトルデータと第２のワード埋め込みベクトルデータとの間の論理的関係上の類似度を算出して、事件情報の第２の類似度を取得し、第１の類似度と第２の類似度の和の値をターゲット類似度とする。

法律事件ナレッジグラフにおける複数のノードに対応する類似度を加算した値を、法律事件ナレッジグラフに対応する法律事件とユーザにより入力された検索すべき事件との類似度とすることにより、検索の正確性を向上させる。例えば、図３及び図４に示すように、図３は、検索すべきナレッジグラフであり、図４は、法律事件ナレッジグラフであり、図４におけるノード６、ノード８、ノード９及びノード１０のそれぞれに対応する第２の類似度の和の値が図３におけるノード６、ノード８、ノード９及びノード１０のそれぞれに対応する類似度の和の値に最も近ければ、図４におけるノード７は、図３におけるノード７に最も類似する。

上記の例示的な内容、図３の内容、及び図４の内容は、説明及び参考のみに用いられ、その内容の正確性と実際の操作の有無は考慮しない。

ステップ１０７では、ターゲット類似度の値が高い順に事件情報を順序付けし、順序付けされた事件情報を出力する。

サーバは、ターゲット類似度の値が高い順に事件情報を順序付けし、順序付けされた事件情報を出力する。

具体的には、ターゲット類似度の値が高い順に事件情報を順序付けし、順序付けされた事件情報を取得し、順序付けされた事件を解釈説明する。解釈説明される内容は、事件情報と入力されたテキスト情報との類似度、事件情報の判決意見と事件情報の証拠抽出方向などを含む。事件情報と解釈説明をテキスト情報として生成し、事件情報における各部分の類似度を統計分析して可視化グラフを生成する。ユーザが入力した事件情報出力条件を受信すると、事件情報出力条件を満たす事件情報のテキストと可視化グラフを出力する。事件出力条件は、事件情報の順序付け範囲又は事件の類似度範囲を含むが、これらに限定されない。

図５を参照すると、本願の実施例におけるナレッジグラフに基づく事件検索方法の別の実施例は、ステップ５０１～５１１を含む。

ステップ５０１では、予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、法律事件ナレッジグラフを分析してノード集合データを構築する。

具体的には、サーバは、テキスト情報を分析してテキスト情報中のノイズをクリアし、不一致を訂正し、テキスト情報をデータ統合し、テキスト情報を複数のデータソースから１つの一致したデータに統合して記憶し、テキスト情報に対して集約、冗長特徴の削除とクラスタリングの処理を行い、テキスト情報に対してデータ変換処理を行い、テキスト情報を小さい区間と機械が認識可能な表現式とに圧縮し、テキスト情報に対して単語分割処理を行い、分割された単語を特徴抽出して特徴情報を取得し、予め設定された畳み込みニューラルネットワーク言語モデルを呼び出して、自然言語処理（ＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ、ＮＬＰ）アルゴリズムにより、特徴情報を属性、属性に対応する内容及び属性間の関係を含むナレッジグラフの構造化データとして解釈し、属性、属性に対応する内容及び属性間の関係に基づいて、図２に示すように、法律事件ナレッジグラフを作成する。法律事件ナレッジグラフを分析し、原告情報と、原告の訴訟上の請求情報と、争点と、事実要素と、小要素と、法条と、原告が提供した証拠情報と、前の関連関係とに基づいて、法律事件ナレッジグラフを分割して再組み合わせて、法律事件ナレッジグラフのノードデータをツリー構造のノード集合データに構築する。図２の内容は、参考例に過ぎず、その内容の正確性と実際の操作の有無は考慮しない。

選択的に、予め設定されたモデルによりテキスト情報を分析して法律事件ナレッジグラフを構築するステップは、具体的には、各法律事件照会及び／又は管理プラットフォームのデータをリンクするブロックチェーン構成ネットワークを作成し、ブロックチェーン構成ネットワークに記憶されたテキスト情報を取得するステップと、テキスト情報に対して字句解析、構文解析及び意味解析を行って、構造化データを取得し、構造化データをマークアップ言語データに変換するステップと、マークアップ言語データを実体的に抽出して、法律事件に係る人名、組織／機構名、地理的位置、イベント／日付、文字値、及び金額値を含む実体情報を取得し、マークアップ言語データに対して関係抽出を行って、事実要素、人物、証拠、争点、及び法条のうちの少なくとも両者の関係を含む関係情報を取得し、マークアップ言語データに対して属性抽出を行って属性情報を取得するステップと、実体情報、関係情報及び属性情報に対して情報融合処理を行って、融合処理情報を取得し、融合処理情報に基づいてデータモデルを構築して法律事件ナレッジグラフを取得し、法律事件ナレッジグラフをブロックチェーン構成ネットワークの関連データベース管理システムＭｙＳＱＬデータベースに記憶するステップと、を含む。ブロックチェーン構成ネットワークにより複数のプラットフォームの履歴データとリアルタイムデータを取得し、法律事件ナレッジグラフにロバストな構築基礎を提供し、ブロックチェーン構成ネットワークの低コスト、高効率及びデータ記憶安全などの特性に合わせて、その法律事件ナレッジグラフの構築を迅速かつ正確にする。

ステップ５０２では、ノード集合データの各ノードを出発点として、ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得する。

具体的には、法律事件ナレッジグラフをディープウォークアルゴリズムモデルに深度入力して監視なしの予備訓練を行う。反復回数ｎ、ステップ幅ｍ、変数データｐ、及び毎回ランダムに生成されたベクトルの数ｑを設定し、ランダムウォーク回数ｋを初期化し、ノード集合データの各ノードを出発点とし、出発点の下流ノード集合の重み値でノード集合データをｍステップランダムウォークし、ｋ回ランダムウォークし、ｍステップランダムウォークした場合に、現在のノードに下流結合点がないと、該ノードでランダムウォークを停止し、そして、変数データｐと、毎回ランダムに生成されたベクトルの数ｑとに基づいて１つずつのシーケンスデータを生成し、ｎ回反復操作し、一連のランダムウォーク操作が完了すると、１つずつのシーケンスデータの最適値を算出し、最適値を取得できなければ、改めてステップ幅を設定し、最適値が取得されるまでノード集合データをランダムウォークサンプリングする。目的関数の反数の最小値を算出することにより最適値を算出することができ、試験関数は、

であり、ここで、ｘとｙはランダムウォーク停止時に所在するノードの座標を示し、τはグローバル最大値の値範囲を示し、ｅは制御精度を示す。

選択的に、ノード集合データの各ノードを出発点として、ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップは、具体的には、ノード集合データの各ノードを出発点として、出発点の次のノードの重み値を取得するステップと、重み値を分析してランダムウォークステップ数を設定し、出発点が所在する分岐のノード数を分析してウォーク閾値ステップ数を設定するステップと、ランダムウォークステップ数がウォーク閾値ステップ数より小さいと判断された場合、ランダムウォークステップ数に従って、出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成し、複数のシーケンスデータを取得するステップと、ランダムウォークステップ数がウォーク閾値ステップ数以上であると判断された場合、ウォーク閾値ステップ数に従って、出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成し、複数のシーケンスデータを取得するステップと、を含む。

選択的に、ノード集合データの各ノードを出発点として、ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップは、具体的には、ノード集合データの各ノードを出発点として、出発点以外の下流ノードの重み値を取得し、重み値に基づいて現在の反復回数を決定するステップと、現在の反復回数に基づいて、予め設定された経路長に応じてノード集合データをランダムウォークするステップと、現在の反復回数が予め設定された反復制御回数より小さいことが検出されると、区間［－１、１］の間の多次元ベクトルと多次元ベクトルの多変数関数をランダムに生成するステップと、多変数関数の関数値を算出し、関数値が第１の予め設定された閾値に達したこと、及び、予め設定された経路長がノード集合データへのランダムウォークを停止するための制御精度より小さいことを検出すれば、ノード集合データをランダムウォークすることを停止し、かつノード集合データにおいてランダムウォークする際に生成されるシーケンスデータを取得するステップと、関数値が第１の予め設定された閾値に達していないこと、及び、予め設定された経路長が制御精度以上であることを検出すれば、ランダムウォークの走行ステップ幅を予め設定された経路長の半分に設定し、設定されたランダムウォークの走行ステップ幅に従って、関数値が第１の予め設定された閾値に達し、かつ予め設定された経路長が制御精度より小さくなるまで、ノード集合データを改めてランダムウォークし、かつノード集合データにおいてランダムウォークする際に生成されるシーケンスデータを取得するステップと、を含む。

ステップ５０３では、複数のシーケンスデータに基づいて単語変換ベクトルアルゴリズムによりモデルを訓練して、更新されたターゲットモデルを取得する。

選択的に、複数のシーケンスデータに基づいて単語変換ベクトルアルゴリズムによりモデルを訓練するステップは、具体的には、全結合層、複数の結合層、及び正規化Ｓｏｆｔｍａｘ分類器を含むモデルにより、複数のシーケンスデータに基づいてハフマンツリーを作成するステップと、全結合層によりハフマンツリー中の各単語を分析して、複数の予め設定された長さのワンホット（ｏｎｅ－ｈｏｔ）ベクトルを取得するステップと、複数の結合層により、複数の予め設定された長さのｏｎｅ－ｈｏｔベクトルに対して勾配反復処理を行って、列ベクトルデータを取得するステップと、Ｓｏｆｔｍａｘ分類器により列ベクトルデータを処理して、単語埋め込みベクトルデータを取得するステップと、を含む。

選択的に、単語埋め込みベクトルデータを取得した後に、上記方法は、ＨａｓｈＴａｂｌｅ［ＭａｘＳｉｚｅ］関数によりタイプを設定するステップと、単語埋め込みベクトルデータのキーワード及びキーワードシーケンスを取得し、アドレス取得関数によりハッシュテーブルにおいてキーワードを索引や、削除、挿入した記録情報を抽出するステップであって、アドレス取得関数が、

であり、ここでｋｅｙはキーワードであり、ｍはハッシュテーブル長さであり、ｉは単語埋め込みベクトルデータの増分シーケンスであり、ｐは予め設定された素数であるステップと、タイプと記録情報に基づいてハッシュテーブルを作成し、ハッシュテーブルを初期化し、ハッシュテーブルにキーワードシーケンスを挿入し、ハッシュテーブルの平均索引長を設定するステップとをさらに含む。単語埋め込みベクトルデータ中のキーコード値をハッシュテーブルの１つの位置にマッピングすることによりレコードにアクセスして、履歴事件の情報を記憶し事件検索の効率を向上させることに役立つ。

選択的に、Ｓｏｆｔｍａｘ分類器により列ベクトルデータを処理する前に、方法は、列ベクトルデータを規則的なフレームシーケンス情報に符号化し、規則的なフレームシーケンス情報に対して、タイミング時間長が規則的なフレームシーケンス情報の送信往復時間より長いタイマーを含むタイマーを設定するステップと、自動再送要求ＡＲＱプロトコルと、列ベクトルデータの送信ルールを含むスライディングウィンドウプロトコルとを設定し、ウィンドウサイズが最大送信フレーム数であるスライドウィンドウを含む、Ｓｏｆｔｍａｘ分類器の結合層に結合された送信スライディングウィンドウを設定し、Ｓｏｆｔｍａｘ分類器の受信スライディングウィンドウを設定するステップと、ＡＲＱプロトコル、スライディングウィンドウプロトコル、送信スライディングウィンドウ及び受信スライディングウィンドウにより、規則的なフレームシーケンス情報をＳｏｆｔｍａｘ分類器に伝送し、かつＳｏｆｔｍａｘ分類器により、結合された結合層に情報フィードバックを行うステップと、をさらに含む。スライディングウィンドウにより上記列ベクトルデータの伝送を制御して、データの渋滞と欠損を回避するとともに、履歴列ベクトルデータと現在の列ベクトルデータとを分離するため、現在の列ベクトルデータへの処理速度が履歴列ベクトルデータの増加により緩やかになることなく、事件検索システムによるデータの処理効率を向上させる。データ伝送量を制御することにより、システムのキャッシュの負担を軽減して伝送効率を向上させる。

ステップ５０４では、ターゲットテキスト情報を取得し、ターゲットモデルによりターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築する。

ステップ５０５では、法律事件ナレッジグラフで検索して、検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得する。

ステップ５０６では、第１の単語埋め込みベクトルデータ及び第２の単語埋め込みベクトルデータに基づいて、事件情報とターゲットテキスト情報との間の事実要素類似度、争点類似度、証拠類似度、争点関連類似度、証拠関連類似度及び事実要素関連類似度を算出する。

サーバは、第１の単語埋め込みベクトルデータ及び第２の単語埋め込みベクトルデータに基づいて、事件情報とターゲットテキスト情報との間の事実要素類似度、争点類似度、証拠類似度、争点関連類似度、証拠関連類似度及び事実要素関連類似度を算出する。

具体的には、争点、証拠及び事実要素の第１の単語埋め込みベクトルデータをそれぞれ取得し、また、争点、証拠及び事実要素の第２の単語埋め込みベクトルデータをそれぞれ取得し、争点の第１の単語埋め込みベクトルデータと争点の第２の単語埋め込みベクトルデータとの類似度を算出して、争点類似度を取得し、証拠の第１の単語埋め込みベクトルデータと証拠の第２の単語埋め込みベクトルデータとの類似度を算出して、証拠類似度を取得し、事実要素の第１の単語埋め込みベクトルデータと事実要素の第２の単語埋め込みベクトルデータとの類似度を算出して、事実要素類似度を取得する。第１の単語埋め込みベクトルデータと第２の単語埋め込みベクトルデータとの争点関連類似度、証拠関連類似度及び事実要素関連類似度をそれぞれ算出し、それぞれ事件情報とターゲットテキスト情報との間の争点関連類似度、証拠関連類似度及び事実要素関連類似度を取得する。

ステップ５０７では、第１の予め設定された重み比率に基づいて、事実要素類似度、争点類似度及び証拠類似度の重み付け平均値を算出して、事件情報の第１の類似度を取得し、かつ第２の予め設定された重み比率に基づいて、争点関連類似度、証拠関連類似度及び事実要素関連類似度の重み付け平均値を算出して、事件情報の第２の類似度を取得する。

サーバは、第１の予め設定された重み比率に基づいて、事実要素類似度、争点類似度及び証拠類似度の重み付け平均値を算出して、事件情報の第１の類似度を取得し、かつ第２の予め設定された重み比率に基づいて、争点関連類似度、証拠関連類似度及び事実要素関連類似度の重み付け平均値を算出して、事件情報の第２の類似度を取得する。

具体的には、予め設定された重みに基づいて第１の単語埋め込みベクトルデータと第２の単語埋め込みベクトルデータとの類似度重み付け平均値を算出して第１の類似度を取得し、予め設定された重みの設定方式は、争点、証拠、及び事実要素の重みを順次減らして設定する。例えば、争点、証拠及び事実要素の重みがそれぞれ４０％、３５％、２５％であり、争点に関し、算出された類似度が０．５であり、証拠に関し、算出された類似度が０．２であり、事実要素に関し、算出された類似度が０．３である場合、第１の類似度＝０．４＊０．５＋０．３５＊０．２＋０．２５＊０．３＝１．５５である。予め設定された重みに基づいて第１の単語埋め込みベクトルデータと第２の単語埋め込みベクトルデータとの類似度重み付け平均値を算出して、第１の類似度を取得し、ここで、予め設定された重みの設定方式は、争点、証拠、及び事実要素の重みを順次減らして設定する。

ステップ５０８では、類似度が第１の予め設定された閾値より大きい第１の類似度を認識し取得し、かつ類似度が第２の予め設定された閾値より大きい第２の類似度を認識し取得する。

サーバは、類似度が第１の予め設定された閾値より大きい第１の類似度を認識し取得し、かつ類似度が第２の予め設定された閾値より大きい第２の類似度を認識し取得する。

具体的には、第１の類似度の類似度が第１の予め設定された閾値より大きいか否かを判断し、類似度が第１の予め設定された閾値より大きい第１の類似度を選別し、第２の類似度の類似度が第２の予め設定された閾値より大きいか否かを判断し、類似度が第２の予め設定された閾値より大きい第２の類似度を選別する。第１の類似度と第２の類似度を選別して後続の算出動作を減らすことにより、データ分析の品質及び正確性を確保するだけでなく、動作効率を向上させることができる。

ステップ５０９では、第３の予め設定された重み比率に応じて、取得された第１の類似度の重み付け平均値を算出して、ターゲットの第１の類似度を取得し、かつ第４の予め設定された重み比率に応じて、取得された第２の類似度の重み付け平均値を算出して、ターゲットの第２の類似度を取得する。

サーバは、第３の予め設定された重み比率に応じて、取得された第１の類似度の重み付け平均値を算出して、ターゲットの第１の類似度を取得し、かつ第４の予め設定された重み比率に応じて、取得された第２の類似度の重み付け平均値を算出して、ターゲットの第２の類似度を取得する。

具体的には、類似度が第１の予め設定された閾値より大きい第１の類似度について、第３の予め設定された重み比率に応じて、重み付け平均値を算出して、総類似度、すなわちターゲットの第１の類似度を取得する。類似度が第２の予め設定された閾値より大きい第２の類似度について、第４の予め設定された重み比率に応じて、重み付け平均値を算出して、総類似度、すなわちターゲットの第２の類似度を取得する。第３の予め設定された重みは、類似度が第１の予め設定された閾値より大きい第１の類似度の類似度範囲値に基づいて、重みを設定することができ、例えば、類似度が第１の予め設定された閾値より大きい第１の類似度が０．２、０．３５、０．１５、０．５５、０．５、０．２７、０．８７、０．９であれば、第１の類似度０．１５、０．２、０．２７の重みを０．３２と設定し、第１の類似度０．３５、０．５、０．５５の重みを０．３と設定し、第１の類似度０．８７、０．９の重みを０．３８と設定することができ、同様に第４の予め設定された重みを取得することができる。上記例示的な内容は、説明及び参考のみに用いられ、その内容の正確性と実際の操作の有無は考慮しない。

ステップ５１０では、ターゲットの第１の類似度とターゲットの第２の類似度とを加算して、ターゲット類似度を取得する。

サーバは、ターゲットの第１の類似度とターゲットの第２の類似度とを加算して、ターゲット類似度を取得する。法律事件ナレッジグラフにおける複数のノードに対応する類似度を加算した値を、法律事件ナレッジグラフに対応する法律事件とユーザにより入力された検索すべき事件との類似度とすることにより、検索の正確性を向上させる。

ステップ５１１では、ターゲット類似度の値が高い順に事件情報を順序付けし、順序付けされた事件情報を出力する。

ターゲット類似度の値が高い順に事件情報を順序付けし、順序付けされた事件情報を出力することは、具体的には、ターゲット類似度の値が高い順に事件情報を順序付けするステップと、順序付け範囲と類似度範囲のいずれか一つを少なくとも含む、ユーザが入力した事件出力条件を受信し、事件出力条件に基づいて対象事件情報を決定するステップと、対象事件情報を統計分析し、可視化グラフとテキスト情報を生成して出力するステップと、を含む。ターゲット類似度の値が高い順に事件情報を順序付けし、順序付けされた事件情報を取得し、順序付けされた事件を解釈説明する、解釈説明される内容は、事件情報と入力されたテキスト情報との類似度、事件情報の判決意見と事件情報の証拠抽出方向などを含む。事件情報と解釈説明をテキスト情報として生成し、事件情報における各部分の類似度を統計分析して可視化グラフを生成する。ユーザが入力した事件情報出力条件を受信すると、事件情報出力条件を満たす事件情報のテキストと可視化グラフを出力する。事件出力条件は、事件情報の順序付け範囲又は事件の類似度範囲を含むが、これらに限定されない。

以上、本願の実施例におけるナレッジグラフに基づく事件検索方法について説明した。以下、本願の実施例におけるナレッジグラフに基づく事件検索装置について説明する。図６を参照すると、本願の実施例におけるナレッジグラフに基づく事件検索装置の一実施例は、
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、法律事件ナレッジグラフを分析してノード集合データを構築する第１の構築ユニット６０１と、
ノード集合データの各ノードを出発点として、ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するサンプリングユニット６０２と、
複数のシーケンスデータに基づいて単語変換ベクトルアルゴリズムによりモデルを訓練して、更新されたターゲットモデルを取得する第１の取得ユニット６０３と、
ターゲットテキスト情報を取得し、ターゲットモデルによりターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築する第２の構築ユニット６０４と、
法律事件ナレッジグラフで検索して、検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得する第２の取得ユニット６０５と、
第１の単語埋め込みベクトルデータ及び第２の単語埋め込みベクトルデータに基づいて、事件情報の内容記述上の類似度を示す第１の類似度及び事件情報の論理的関係上の類似度を示す第２の類似度を算出し、事件情報の第１の類似度及び第２の類似度を加算して、ターゲット類似度を取得する算出ユニット６０６と、
ターゲット類似度の値が高い順に事件情報を順序付けし、順序付けされた事件情報を出力する順序付けユニット６０７と、を含む。

図７を参照すると、本願の実施例におけるナレッジグラフに基づく事件検索装置の別の実施例は、
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、法律事件ナレッジグラフを分析してノード集合データを構築する第１の構築ユニット６０１と、
ノード集合データの各ノードを出発点として、ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するサンプリングユニット６０２と、
複数のシーケンスデータに基づいて単語変換ベクトルアルゴリズムによりモデルを訓練して、更新されたターゲットモデルを取得する第１の取得ユニット６０３と、
ターゲットテキスト情報を取得し、ターゲットモデルによりターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築する第２の構築ユニット６０４と、
法律事件ナレッジグラフで検索して、検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得する第２の取得ユニット６０５と、
第１の単語埋め込みベクトルデータ及び第２の単語埋め込みベクトルデータに基づいて、事件情報とターゲットテキスト情報との間の事実要素類似度、争点類似度、証拠類似度、争点関連類似度、証拠関連類似度及び事実要素関連類似度を算出する第１の算出ユニット６０６と、
第１の予め設定された重み比率に基づいて、事実要素類似度、争点類似度及び証拠類似度の重み付け平均値を算出して、事件情報の第１の類似度を取得し、かつ第２の予め設定された重み比率に基づいて、争点関連類似度、証拠関連類似度及び事実要素関連類似度の重み付け平均値を算出して、事件情報の第２の類似度を取得する第２の算出ユニット６０７と、
類似度が第１の予め設定された閾値より大きい第１の類似度を認識し取得し、かつ類似度が第２の予め設定された閾値より大きい第２の類似度を認識し取得する第３の取得ユニット６０８と、
第３の予め設定された重み比率に応じて、取得された第１の類似度の重み付け平均値を算出して、ターゲットの第１の類似度を取得し、かつ第４の予め設定された重み比率に応じて、取得された第２の類似度の重み付け平均値を算出して、ターゲットの第２の類似度を取得する第３の算出ユニット６０９と、
ターゲットの第１の類似度とターゲットの第２の類似度とを加算して、ターゲット類似度を取得する第４の算出ユニット６１０と、
ターゲット類似度の値が高い順に事件情報を順序付けし、順序付けされた事件情報を出力する順序付けユニット６１１と、を含む。

選択的に、第１の構築ユニット６０１は、具体的には、各法律事件照会及び／又は管理プラットフォームのデータをリンクするブロックチェーン構成ネットワークを作成し、ブロックチェーン構成ネットワークに記憶されたテキスト情報を取得し、テキスト情報に対して字句解析、構文解析及び意味解析を行って、構造化データを取得し、構造化データをマークアップ言語データに変換し、マークアップ言語データを実体的に抽出して、法律事件に係る人名、組織／機構名、地理的位置、イベント／日付、文字値、及び金額値を含む実体情報を取得し、マークアップ言語データに対して関係抽出を行って、事実要素、人物、証拠、争点、及び法条のうちの少なくとも両者の関係を含む関係情報を取得し、マークアップ言語データに対して属性抽出を行って属性情報を取得し、実体情報、関係情報及び属性情報に対して情報融合処理を行って、融合処理情報を取得し、融合処理情報に基づいてデータモデルを構築して法律事件ナレッジグラフを取得し、法律事件ナレッジグラフをブロックチェーン構成ネットワークの関連データベース管理システムＭｙＳＱＬデータベースに記憶する。

選択的に、サンプリングユニット６０２は、具体的には、ノード集合データの各ノードを出発点として、出発点の次のノードの重み値を取得し、重み値を分析してランダムウォークステップ数を設定し、出発点が所在する分岐のノード数を分析してウォーク閾値ステップ数を設定し、ランダムウォークステップ数がウォーク閾値ステップ数より小さいと判断された場合、ランダムウォークステップ数に従って、出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成し、複数のシーケンスデータを取得し、ランダムウォークステップ数がウォーク閾値ステップ数以上であると判断された場合、ウォーク閾値ステップ数に従って、出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成し、複数のシーケンスデータを取得する。

選択的に、サンプリングユニット６０２はさらに、具体的には、ノード集合データの各ノードを出発点として、出発点以外の下流ノードの重み値を取得し、重み値に基づいて現在の反復回数を決定し、現在の反復回数に基づいて、予め設定された経路長に応じてノード集合データをランダムウォークし、現在の反復回数が予め設定された反復制御回数より小さいことが検出されると、区間［－１、１］の間の多次元ベクトルと多次元ベクトルの多変数関数をランダムに生成し、多変数関数の関数値を算出し、関数値が第１の予め設定された閾値に達したこと、及び、予め設定された経路長がノード集合データへのランダムウォークを停止するための制御精度より小さいことを検出すれば、ノード集合データをランダムウォークすることを停止し、かつノード集合データにおいてランダムウォークする際に生成されるシーケンスデータを取得し、関数値が第１の予め設定された閾値に達していないこと、及び、予め設定された経路長が制御精度以上であることを検出すれば、ランダムウォークの走行ステップ幅を予め設定された経路長の半分に設定し、設定されたランダムウォークの走行ステップ幅に従って、関数値が第１の予め設定された閾値に達し、かつ予め設定された経路長が制御精度より小さくなるまで、ノード集合データを改めてランダムウォークし、かつノード集合データにおいてランダムウォークする際に生成されるシーケンスデータを取得する。

選択的に、第１の取得ユニット６０３は、具体的には、全結合層、複数の結合層、及び正規化Ｓｏｆｔｍａｘ分類器を含むモデルにより、複数のシーケンスデータに基づいてハフマンツリーを作成し、全結合層によりハフマンツリー中の各単語を分析して、複数の予め設定された長さのｏｎｅ－ｈｏｔベクトルを取得し、複数の結合層により、複数の予め設定された長さのｏｎｅ－ｈｏｔベクトルに対して勾配反復処理を行って、列ベクトルデータを取得し、Ｓｏｆｔｍａｘ分類器により列ベクトルデータを処理し、単語埋め込みベクトルデータを取得する。

選択的に、第１の取得ユニット６０３はさらに、具体的には、ＨａｓｈＴａｂｌｅ［ＭａｘＳｉｚｅ］関数によりタイプを設定し、単語埋め込みベクトルデータのキーワード及びキーワードシーケンスを取得し、アドレス取得関数によりハッシュテーブルにおいてキーワードを索引や、削除、挿入した記録情報を抽出し、ここで、アドレス取得関数は、

であり、ｋｅｙはキーワードであり、ｍはハッシュテーブル長さであり、ｉは単語埋め込みベクトルデータの増分シーケンスであり、ｐは予め設定された素数であり、タイプと記録情報に基づいてハッシュテーブルを作成し、ハッシュテーブルを初期化し、ハッシュテーブルにキーワードシーケンスを挿入し、ハッシュテーブルの平均索引長を設定する。

選択的に、第１の取得ユニット６０３はさらに、具体的には、列ベクトルデータを規則的なフレームシーケンス情報に符号化し、規則的なフレームシーケンス情報に対して、タイミング時間長が規則的なフレームシーケンス情報の送信往復時間より長いタイマーを含むタイマーを設定し、自動再送要求ＡＲＱプロトコルと、列ベクトルデータの送信ルールを含むスライディングウィンドウプロトコルとを設定し、ウィンドウサイズが最大送信フレーム数であるスライドウィンドウを含む、Ｓｏｆｔｍａｘ分類器の結合層に結合された送信スライディングウィンドウを設定し、Ｓｏｆｔｍａｘ分類器の受信スライディングウィンドウを設定し、ＡＲＱプロトコル、スライディングウィンドウプロトコル、送信スライディングウィンドウ及び受信スライディングウィンドウにより、規則的なフレームシーケンス情報をＳｏｆｔｍａｘ分類器に伝送し、かつＳｏｆｔｍａｘ分類器により、結合された結合層に情報フィードバックを行う。

選択的に、順序付けユニット６１１は、具体的には、ターゲット類似度の値が高い順に事件情報を順序付けし、順序付け範囲と類似度範囲のいずれかを少なくとも含む、ユーザが入力した事件出力条件を受信し、事件出力条件に基づいて対象事件情報を決定し、対象事件情報を統計分析し、可視化グラフとテキスト情報を生成して出力する。

以上の図６～図７は、モジュール化機能エンティティの角度から本願の実施例におけるナレッジグラフに基づく事件検索装置を詳細に説明した。以下、ハードウェア処理の角度から本願の実施例におけるナレッジグラフに基づく事件検索機器を詳細に説明する。

図８は、本願の実施例に係るナレッジグラフに基づく事件検索機器の概略構成図であり、該ナレッジグラフに基づく事件検索機器８００は、コンフィグレーション又は性能によって大きく異なってもよく、１つ以上のプロセッサ（ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔｓ、ＣＰＵ）８０１（例えば、１つ以上のプロセッサ）と、メモリ８０９と、アプリケーションプログラム８０７又はデータ８０６を記憶する１つ以上の記憶媒体８０８（例えば、１つ以上の大容量記憶装置）と、を含んでよい。メモリ８０９及び記憶媒体８０８は、一時的記憶装置でもよく永続的記憶装置でもよい。記憶媒体８０８に記憶されたプログラムは、それぞれがチェックイン管理装置に対する一連の命令操作を含む１つ以上のモジュール（図示せず）を含んでよい。さらに、プロセッサ８０１は、記憶媒体８０８と通信して、記憶媒体８０８における一連の命令操作をナレッジグラフに基づく事件検索機器８００で実行するように構成されてよい。

ナレッジグラフに基づく事件検索機器８００は、１つ以上の電源８０２、１つ以上の有線又は無線ネットワークインタフェース８０３、１つ以上の入出力インタフェース８０４、及び／又は１つ以上のオペレーティングシステム８０５、例えば、ＷｉｎｄｏｗｓＳｅｒｖｅｒ、ＭａｃＯＳＸ、Ｕｎｉｘ、Ｌｉｎｕｘ（登録商標）、ＦｒｅｅＢＳＤなどをさらに含んでよい。当業者が理解できるように、図８に示すナレッジグラフに基づく事件検索機器の構成は、ナレッジグラフに基づく事件検索機器を限定するものではない。プロセッサ８０１は、上記実施例における第１の構築ユニット６０１、サンプリングユニット６０２、第１の取得ユニット６０３、第２の構築ユニット６０４、第２の取得ユニット６０５、第１の算出ユニット６０６、第２の算出ユニット６０７、第３の取得ユニット６０８、第３の算出ユニット６０９、第４の算出ユニット６１０、及び順序付けユニット６１１の機能を実行することができる。

以下、図８を参照しながらナレッジグラフに基づく事件検索機器の各構成部材を具体的に説明する。

プロセッサ８０１は、ナレッジグラフに基づく事件検索機器の制御センターであり、ナレッジグラフに基づく事件検索方法に従って処理することができる。プロセッサ８０１は、様々なインタフェースと回線によりナレッジグラフに基づく事件検索機器全体の各部分に結合され、メモリ８０９に記憶されているソフトウェアプログラム及び／又はモジュールを動作させるか又は実行し、メモリ８０９に記憶されたデータを呼び出すことにより、ナレッジグラフに基づく事件検索機器の様々な機能とデータ処理を実行して、事件検索システムのユーザビリティを向上させる機能を実現する。記憶媒体８０８とメモリ８０９は、いずれもデータを記憶するキャリアであり、本願の実施例では、記憶媒体８０８は、記憶容量が小さいが、速度が速い内部メモリであってよく、メモリ８０９は、記憶容量が大きいが、記憶速度が遅い外部メモリであってよい。

メモリ８０９は、ソフトウェアプログラム及びモジュールを記憶してよく、プロセッサ８０１は、メモリ８０９に記憶されているソフトウェアプログラム及びモジュールを実行することにより、ナレッジグラフに基づく事件検索機器８００の様々な機能アプリケーション及びデータ処理を実行する。メモリ８０９は、主に、オペレーティングシステム、少なくとも１つの機能（予め設定されたモデルにより、テキスト情報を分析して法律事件ナレッジグラフを構築し、法律事件ナレッジグラフを分析してノード集合データを構築するなど）に必要なアプリケーションプログラムなどを記憶することができるプログラム記憶領域と、チェックイン管理装置の使用（ノード集合データの各ノードを出発点として、ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するなど）に応じて作成されたデータなどを記憶することができるデータ記憶領域と、を含んでよい。また、メモリ８０９は、高速ランダムアクセスメモリを含んでもよく、例えば少なくとも１つの磁気ディスク記憶デバイス、フラッシュメモリデバイス又は、他の不揮発性固体メモリ素子などの不揮発性メモリを含んでもよい。本願の実施例に係るナレッジグラフに基づく事件検索方法のプログラムと受信したデータフローがメモリに記憶され、使用する必要がある場合には、プロセッサ８０１は、メモリ８０９から呼び出す。

コンピュータに上記コンピュータプログラム命令をロードし実行するときに、本願の実施例に記載のフロー又は機能を全て又は部分的に生成する。上記コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、又は他のプログラマブル装置であってよい。上記コンピュータ命令は、不揮発性であっても揮発性であってもよいコンピュータ読み取り可能な記憶媒体に記憶されてもよく、一方のコンピュータ読み取り可能な記憶媒体から他のコンピュータ読み取り可能な記憶媒体に伝送されてもよい。

Claims

予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフを分析してノード集合データを構築するステップと、
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップと、
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得するステップと、
ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築するステップと、
前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、前記検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得するステップと、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の内容記述上の類似度を示す第１の類似度及び前記事件情報の論理的関係上の類似度を示す第２の類似度を算出し、前記事件情報の前記第１の類似度及び前記第２の類似度を加算して、ターゲット類似度を取得するステップと、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力するステップと、を含む、ナレッジグラフに基づく事件検索方法。
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップは、
前記ノード集合データの各ノードを出発点として、前記出発点の次のノードの重み値を取得するステップと、
前記重み値を分析してランダムウォークステップ数を設定し、前記出発点が所在する分岐のノード数を分析してウォーク閾値ステップ数を設定するステップと、
前記ランダムウォークステップ数が前記ウォーク閾値ステップ数より小さいと判断された場合、前記ランダムウォークステップ数に従って、前記出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成して、複数のシーケンスデータを取得するステップと、
前記ランダムウォークステップ数が前記ウォーク閾値ステップ数以上であると判断された場合、前記ウォーク閾値ステップ数に従って、前記出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成して、複数のシーケンスデータを取得するステップと、を含む、請求項１に記載のナレッジグラフに基づく事件検索方法。
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練するステップは、
全結合層、複数の結合層、及び正規化Ｓｏｆｔｍａｘ分類器を含む前記モデルにより、複数の前記シーケンスデータに基づいてハフマンツリーを作成するステップと、
全結合層により前記ハフマンツリー中の各単語を分析して、複数の予め設定された長さのワンホットｏｎｅ－ｈｏｔベクトルを取得するステップと、
複数の前記結合層により、複数の前記予め設定された長さのｏｎｅ－ｈｏｔベクトルに対して勾配反復処理を行って、列ベクトルデータを取得するステップと、
前記Ｓｏｆｔｍａｘ分類器により前記列ベクトルデータを処理して、単語埋め込みベクトルデータを取得するステップと、を含む、請求項２に記載のナレッジグラフに基づく事件検索方法。
複数の前記結合層により、複数の前記予め設定された長さのｏｎｅ－ｈｏｔベクトルに対して勾配反復処理を行って、列ベクトルデータを取得した後、前記Ｓｏｆｔｍａｘ分類器により前記列ベクトルデータを処理する前に、前記方法は、
前記列ベクトルデータを規則的なフレームシーケンス情報に符号化し、前記規則的なフレームシーケンス情報に対して、タイミング時間長が前記規則的なフレームシーケンス情報の送信往復時間より長いタイマーを含むタイマーを設定するステップと、
自動再送要求ＡＲＱプロトコルと、前記列ベクトルデータの送信ルールを含むスライディングウィンドウプロトコルとを設定し、ウィンドウサイズが最大送信フレーム数であるスライドウィンドウを含む、前記Ｓｏｆｔｍａｘ分類器の結合層に結合された送信スライディングウィンドウを設定し、前記Ｓｏｆｔｍａｘ分類器の受信スライディングウィンドウを設定するステップと、
前記ＡＲＱプロトコル、前記スライディングウィンドウプロトコル、前記送信スライディングウィンドウ及び前記受信スライディングウィンドウにより、前記規則的なフレームシーケンス情報を前記Ｓｏｆｔｍａｘ分類器に伝送し、かつ前記Ｓｏｆｔｍａｘ分類器により、結合された結合層に情報フィードバックを行うステップと、をさらに含む、請求項３に記載のナレッジグラフに基づく事件検索方法。
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の第１の類似度及び第２の類似度を算出するステップは、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報と前記ターゲットテキスト情報との間の事実要素類似度、争点類似度、証拠類似度、争点関連類似度、証拠関連類似度及び事実要素関連類似度を算出するステップと、
第１の予め設定された重み比率に基づいて、前記事実要素類似度、前記争点類似度及び前記証拠類似度の重み付け平均値を算出して、前記事件情報の第１の類似度を取得し、かつ第２の予め設定された重み比率に基づいて、前記争点関連類似度、前記証拠関連類似度及び前記事実要素関連類似度の重み付け平均値を算出して、前記事件情報の第２の類似度を取得するステップと、を含む、請求項１に記載のナレッジグラフに基づく事件検索方法。
前記第１の類似度と前記第２の類似度とを加算して、ターゲット類似度を取得するステップは、
類似度が第１の予め設定された閾値より大きい第１の類似度を認識し取得し、かつ類似度が第２の予め設定された閾値より大きい第２の類似度を認識し取得するステップと、
第３の予め設定された重み比率に応じて、取得された第１の類似度の重み付け平均値を算出して、ターゲットの第１の類似度を取得し、かつ第４の予め設定された重み比率に応じて、取得された第２の類似度の重み付け平均値を算出して、ターゲットの第２の類似度を取得するステップと、
前記ターゲットの第１の類似度と前記ターゲットの第２の類似度とを加算して、ターゲット類似度を取得するステップと、を含む、請求項５に記載のナレッジグラフに基づく事件検索方法。
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力するステップは、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けするステップと、
順序付け範囲と類似度範囲のいずれか一つを少なくとも含む、ユーザが入力した事件出力条件を受信し、前記事件出力条件に基づいて対象事件情報を決定するステップと、
前記対象事件情報を統計分析し、可視化グラフとテキスト情報を生成して出力するステップと、を含む、請求項１～６のいずれか一項に記載のナレッジグラフに基づく事件検索方法。
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフを分析してノード集合データを構築する第１の構築ユニットと、
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するサンプリングユニットと、
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得する第１の取得ユニットと、
ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築する第２の構築ユニットと、
前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、前記検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得する第２の取得ユニットと、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の内容記述上の類似度を示す第１の類似度及び前記事件情報の論理的関係上の類似度を示す第２の類似度を算出し、前記事件情報の前記第１の類似度及び前記第２の類似度を加算して、ターゲット類似度を取得する算出ユニットと、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力する順序付けユニットと、を含む、ナレッジグラフに基づく事件検索装置。
メモリと、プロセッサと、前記メモリに記憶されて前記プロセッサ上で実行可能で、前記プロセッサによって実行されると、ナレッジグラフに基づく事件検索方法を実現するコンピュータプログラムと、を含むナレッジグラフに基づく事件検索機器であって、
前記方法は、
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフを分析してノード集合データを構築するステップと、
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップと、
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得するステップと、
ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築するステップと、
前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、前記検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得するステップと、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の内容記述上の類似度を示す第１の類似度及び前記事件情報の論理的関係上の類似度を示す第２の類似度を算出し、前記事件情報の前記第１の類似度及び前記第２の類似度を加算して、ターゲット類似度を取得するステップと、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力するステップと、を含む、ナレッジグラフに基づく事件検索機器。
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップは、
前記ノード集合データの各ノードを出発点として、前記出発点の次のノードの重み値を取得するステップと、
前記重み値を分析してランダムウォークステップ数を設定し、前記出発点が所在する分岐のノード数を分析してウォーク閾値ステップ数を設定するステップと、
前記ランダムウォークステップ数が前記ウォーク閾値ステップ数より小さいと判断された場合、前記ランダムウォークステップ数に従って、前記出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成して、複数のシーケンスデータを取得するステップと、
前記ランダムウォークステップ数が前記ウォーク閾値ステップ数以上であると判断された場合、前記ウォーク閾値ステップ数に従って、前記出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成して、複数のシーケンスデータを取得するステップと、を含む、請求項９に記載のナレッジグラフに基づく事件検索機器。
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練するステップは、
全結合層、複数の結合層、及び正規化Ｓｏｆｔｍａｘ分類器を含む前記モデルにより、複数の前記シーケンスデータに基づいてハフマンツリーを作成するステップと、
全結合層により前記ハフマンツリー中の各単語を分析して、複数の予め設定された長さのワンホットｏｎｅ－ｈｏｔベクトルを取得するステップと、
複数の前記結合層により、複数の前記予め設定された長さのｏｎｅ－ｈｏｔベクトルに対して勾配反復処理を行って、列ベクトルデータを取得するステップと、
前記Ｓｏｆｔｍａｘ分類器により前記列ベクトルデータを処理して、単語埋め込みベクトルデータを取得するステップと、を含む、請求項１０に記載のナレッジグラフに基づく事件検索機器。
複数の前記結合層により、複数の前記予め設定された長さのｏｎｅ－ｈｏｔベクトルに対して勾配反復処理を行って、列ベクトルデータを取得した後、前記Ｓｏｆｔｍａｘ分類器により前記列ベクトルデータを処理する前に、前記方法は、
前記列ベクトルデータを規則的なフレームシーケンス情報に符号化し、前記規則的なフレームシーケンス情報に対して、タイミング時間長が前記規則的なフレームシーケンス情報の送信往復時間より長いタイマーを含むタイマーを設定するステップと、
自動再送要求ＡＲＱプロトコルと、前記列ベクトルデータの送信ルールを含むスライディングウィンドウプロトコルとを設定し、ウィンドウサイズが最大送信フレーム数であるスライドウィンドウを含む、前記Ｓｏｆｔｍａｘ分類器の結合層に結合された送信スライディングウィンドウを設定し、前記Ｓｏｆｔｍａｘ分類器の受信スライディングウィンドウを設定するステップと、
前記ＡＲＱプロトコル、前記スライディングウィンドウプロトコル、前記送信スライディングウィンドウ及び前記受信スライディングウィンドウにより、前記規則的なフレームシーケンス情報を前記Ｓｏｆｔｍａｘ分類器に伝送し、かつ前記Ｓｏｆｔｍａｘ分類器により、結合された結合層に情報フィードバックを行うステップと、をさらに含む、請求項１１に記載のナレッジグラフに基づく事件検索機器。
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の第１の類似度及び第２の類似度を算出するステップは、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報と前記ターゲットテキスト情報との間の事実要素類似度、争点類似度、証拠類似度、争点関連類似度、証拠関連類似度及び事実要素関連類似度を算出するステップと、
第１の予め設定された重み比率に基づいて、前記事実要素類似度、前記争点類似度及び前記証拠類似度の重み付け平均値を算出して、前記事件情報の第１の類似度を取得し、かつ第２の予め設定された重み比率に基づいて、前記争点関連類似度、前記証拠関連類似度及び前記事実要素関連類似度の重み付け平均値を算出して、前記事件情報の第２の類似度を取得するステップと、を含む、請求項９に記載のナレッジグラフに基づく事件検索機器。
前記第１の類似度と前記第２の類似度とを加算して、ターゲット類似度を取得するステップは、
類似度が第１の予め設定された閾値より大きい第１の類似度を認識し取得し、かつ類似度が第２の予め設定された閾値より大きい第２の類似度を認識し取得するステップと、
第３の予め設定された重み比率に応じて、取得された第１の類似度の重み付け平均値を算出して、ターゲットの第１の類似度を取得し、かつ第４の予め設定された重み比率に応じて、取得された第２の類似度の重み付け平均値を算出して、ターゲットの第２の類似度を取得するステップと、
前記ターゲットの第１の類似度と前記ターゲットの第２の類似度とを加算して、ターゲット類似度を取得するステップと、を含む、請求項１３に記載のナレッジグラフに基づく事件検索機器。
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力するステップは、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けするステップと、
順序付け範囲と類似度範囲のいずれかを少なくとも含む、ユーザが入力した事件出力条件を受信し、前記事件出力条件に基づいて対象事件情報を決定するステップと、
前記対象事件情報を統計分析し、可視化グラフとテキスト情報を生成して出力するステップと、を含む、請求項９～１４のいずれか一項に記載のナレッジグラフに基づく事件検索機器。
コンピュータ上で実行されると、ナレッジグラフに基づく事件検索方法をコンピュータに実行させる命令を含むコンピュータ読み取り可能な記憶媒体であって、
前記方法は、
予め設定されたモデルにより、履歴及び／又はリアルタイムな原告の訴訟上の請求情報、被告の主張情報、原告が提供した証拠情報、被告が提供した証拠情報及び履歴法律事件情報を含むテキスト情報を分析して法律事件ナレッジグラフを構築し、前記法律事件ナレッジグラフを分析してノード集合データを構築するステップと、
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップと、
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練して、更新されたターゲットモデルを取得するステップと、
ターゲットテキスト情報を取得し、前記ターゲットモデルにより前記ターゲットテキスト情報を分析し、検索すべきナレッジグラフを構築するステップと、
前記法律事件ナレッジグラフで検索して、前記検索すべきナレッジグラフに関連した事件情報及び第１の単語埋め込みベクトルデータを取得し、前記検索すべきナレッジグラフの第２の単語埋め込みベクトルデータを取得するステップと、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の内容記述上の類似度を示す第１の類似度及び前記事件情報の論理的関係上の類似度を示す第２の類似度を算出し、前記事件情報の前記第１の類似度及び前記第２の類似度を加算して、ターゲット類似度を取得するステップと、
前記ターゲット類似度の値が高い順に前記事件情報を順序付けし、順序付けされた事件情報を出力するステップと、を含む、コンピュータ読み取り可能な記憶媒体。
前記ノード集合データの各ノードを出発点として、前記ノード集合データをランダムウォークサンプリングして、複数のシーケンスデータを取得するステップは、
前記ノード集合データの各ノードを出発点として、前記出発点の次のノードの重み値を取得するステップと、
前記重み値を分析してランダムウォークステップ数を設定し、前記出発点が所在する分岐のノード数を分析してウォーク閾値ステップ数を設定するステップと、
前記ランダムウォークステップ数が前記ウォーク閾値ステップ数より小さいと判断された場合、前記ランダムウォークステップ数に従って、前記出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成して、複数のシーケンスデータを取得するステップと、
前記ランダムウォークステップ数が前記ウォーク閾値ステップ数以上であると判断された場合、前記ウォーク閾値ステップ数に従って、前記出発点の次のノードに結合されたノードに沿ってウォークし、ランダムウォークシーケンスデータを生成して、複数のシーケンスデータを取得するステップと、を含む、請求項１６に記載のコンピュータ読み取り可能な記憶媒体。
複数の前記シーケンスデータに基づいて単語変換ベクトルアルゴリズムにより前記モデルを訓練するステップは、
全結合層、複数の結合層、及び正規化Ｓｏｆｔｍａｘ分類器を含む前記モデルにより、複数の前記シーケンスデータに基づいてハフマンツリーを作成するステップと、
全結合層により前記ハフマンツリー中の各単語を分析して、複数の予め設定された長さのワンホットｏｎｅ－ｈｏｔベクトルを取得するステップと、
複数の前記結合層により、複数の前記予め設定された長さのｏｎｅ－ｈｏｔベクトルに対して勾配反復処理を行って、列ベクトルデータを取得するステップと、
前記Ｓｏｆｔｍａｘ分類器により前記列ベクトルデータを処理して、単語埋め込みベクトルデータを取得するステップと、を含む、請求項１７に記載のコンピュータ読み取り可能な記憶媒体。
複数の前記結合層により、複数の前記予め設定された長さのｏｎｅ－ｈｏｔベクトルに対して勾配反復処理を行って、列ベクトルデータを取得した後、前記Ｓｏｆｔｍａｘ分類器により前記列ベクトルデータを処理する前に、前記方法は、
前記列ベクトルデータを規則的なフレームシーケンス情報に符号化し、前記規則的なフレームシーケンス情報に対して、タイミング時間長が前記規則的なフレームシーケンス情報の送信往復時間より長いタイマーを含むタイマーを設定するステップと、
自動再送要求ＡＲＱプロトコルと、前記列ベクトルデータの送信ルールを含むスライディングウィンドウプロトコルとを設定し、ウィンドウサイズが最大送信フレーム数であるスライドウィンドウを含む、前記Ｓｏｆｔｍａｘ分類器の結合層に結合された送信スライディングウィンドウを設定し、前記Ｓｏｆｔｍａｘ分類器の受信スライディングウィンドウを設定するステップと、
前記ＡＲＱプロトコル、前記スライディングウィンドウプロトコル、前記送信スライディングウィンドウ及び前記受信スライディングウィンドウにより、前記規則的なフレームシーケンス情報を前記Ｓｏｆｔｍａｘ分類器に伝送し、かつ前記Ｓｏｆｔｍａｘ分類器により、結合された結合層に情報フィードバックを行うステップと、をさらに含む、請求項１８に記載のコンピュータ読み取り可能な記憶媒体。
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報の第１の類似度及び第２の類似度を算出するステップは、
前記第１の単語埋め込みベクトルデータ及び前記第２の単語埋め込みベクトルデータに基づいて、前記事件情報と前記ターゲットテキスト情報との間の事実要素類似度、争点類似度、証拠類似度、争点関連類似度、証拠関連類似度及び事実要素関連類似度を算出するステップと、
第１の予め設定された重み比率に基づいて、前記事実要素類似度、前記争点類似度及び前記証拠類似度の重み付け平均値を算出して、前記事件情報の第１の類似度を取得し、かつ第２の予め設定された重み比率に基づいて、前記争点関連類似度、前記証拠関連類似度及び前記事実要素関連類似度の重み付け平均値を算出して、前記事件情報の第２の類似度を取得するステップと、を含む、請求項１６に記載のコンピュータ読み取り可能な記憶媒体。