JP2020529777A - 大規模、高密度、高ノイズネットワークから構造を抽出するためのシステム及び方法 - Google Patents

大規模、高密度、高ノイズネットワークから構造を抽出するためのシステム及び方法 Download PDF

Info

Publication number
JP2020529777A
JP2020529777A JP2020505787A JP2020505787A JP2020529777A JP 2020529777 A JP2020529777 A JP 2020529777A JP 2020505787 A JP2020505787 A JP 2020505787A JP 2020505787 A JP2020505787 A JP 2020505787A JP 2020529777 A JP2020529777 A JP 2020529777A
Authority
JP
Japan
Prior art keywords
nodes
network
filtered
components
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020505787A
Other languages
English (en)
Other versions
JP6970275B2 (ja
JP2020529777A5 (ja
Inventor
マット ホビー
マット ホビー
バリー ノートン
バリー ノートン
ヤツェク スジェイダ
ヤツェク スジェイダ
ピーター ウールドリッジ
ピーター ウールドリッジ
Original Assignee
エルゼビア インコーポレイテッド
エルゼビア インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エルゼビア インコーポレイテッド, エルゼビア インコーポレイテッド filed Critical エルゼビア インコーポレイテッド
Publication of JP2020529777A publication Critical patent/JP2020529777A/ja
Publication of JP2020529777A5 publication Critical patent/JP2020529777A5/ja
Application granted granted Critical
Publication of JP6970275B2 publication Critical patent/JP6970275B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

ネットワークから構造を抽出する方法が、ノードと、ノードを互いに連結して、連結されたノード間の関係の強さを定めるエッジとを含むネットワークを規定するエッジリストを受け取るステップと、所定のフィルタパラメータに基づいてエッジリストからノードをフィルタ処理することによって、フィルタ処理済みネットワークを形成するステップとを含む。方法は、フィルタ処理済みネットワーク内の異なる連結成分を識別するステップと、フィルタ処理済みネットワークの異なる連結成分の各々を、異なる連結成分内の追加構造の存在について分析して、追加構造はさらなる異なる連結成分に分解するステップとをさらに含む。方法は、異なる連結成分の各々のツリー走査を実行し、ツリー走査からの結果として得られた階層構造を融合して局所的モジュラリティ最適条件を決定するステップと、局所的モジュラリティ最適条件に応答して、ネットワーク内の構造成分を生成するステップとをさらに含む。【選択図】図6

Description

〔関連出願との相互参照〕
本出願は、2017年8月1日に出願された「大規模、高密度、高ノイズネットワークにおける構造を抽出するためのシステム及び方法(Systems and Methods for Extracting Structure in Large, Dense and Noisy Networks)」という名称の米国仮特許出願第62/539,758号に対する優先権を主張する、2018年7月31日に出願された「大規模、高密度、高ノイズネットワークから構造を抽出するためのシステム及び方法(Systems and Methods for Extracting Structure from Large, Dense, and Noisy Networks)」という名称の米国特許出願第16/050,138号の利益を主張するものであり、この文献の内容はその全体が引用により本明細書に組み入れられる。
本明細書は、一般にネットワークから構造を抽出するためのシステム及び方法に関し、具体的には、反復プロセスにおいて使用されるフィルタ処理法と分析法との組み合わせを利用して、大規模、高密度(dense)、高ノイズ(noisy)ネットワークモデルから構造を抽出するためのシステム及び方法に関する。
科学的に興味深い多くのシステムは、一連のノードがエッジによって結合されたネットワークとして表すことができる。一例としては、インターネット及びワールドワイドウェブ、メタボリックネットワーク、フードウェブ、ニューラルネットワーク、通信及び分散ネットワーク、ソーシャルネットワーク、及びデータ解析のための大規模データセットが挙げられる。すなわち、ネットワークモデルは、エンティティ及びその連結方法を記述することができる。しかしながら、これらの大型で通常は高ノイズのネットワークモデル内のコミュニティ構造(community structures)の検出及び特徴付けには問題がある。一般に、この問題は、基底ネットワーク構造を規定する(define)関係が、構造を規定しない関係(例えば、ネットワークモデル内のいわゆる「ノイズ(noise)」)によってかき消されてしまう恐れがあるというものである。既存の方法は、高ノイズ関係(noisy relationships)を解決せず、従ってネットワークモデル全体を通じて基底構造を解決しないことが多い。
Newman著、「ネットワークにおけるモジュラリティ及びコミュニティ構造(Modularity and community structure in networks)」、インターネット<http://www.pnas.org/content/pnas/103/23/8577.full.pdf> De Meo、Pasquale他著、「大規模ネットワークにおけるコミュニティ検出のための一般的Louvain法(Generalized Louvain Method for Community Detection in Large Network)」、Intelligent Systems Design and Applications(ISDA)、2011、11th International Conference on Intelligent Systems Design And Applications、IEEE、88〜93ページ、2011年
1つの実施形態では、ネットワークから構造を抽出する方法が、複数のノードと、複数のノードのうちの1つ又は2つ以上を互いに連結して(connecting)、連結されたノード間の関係の強さを定める1又は2以上のエッジとを含むネットワークを規定するエッジリストをプロセッサが受け取るステップと、所定のフィルタパラメータに基づいてエッジリストから1又は2以上のノードをプロセッサがフィルタ処理(filtering)することによって、フィルタ処理済みネットワークを形成するステップと、を含む。この方法は、ダイクストラ法(Dijkstra’s algorithm)を利用して、フィルタ処理済みネットワーク内の1又は2以上の異なる連結成分(distinct connected components)を識別するステップと、フィルタ処理済みネットワークの1又は2以上の異なる連結成分の各々を、1又は2以上の異なる連結成分内における追加構造の存在について分析して、追加構造をさらなる異なる連結成分に分解するステップと、異なる連結成分の各々のツリー走査(tree traversal)を実行し、ツリー走査からの結果として得られた階層構造を融合して、局所的モジュラリティ最適条件(local modularity optimum)を決定するステップと、局所的モジュラリティ最適条件に応答して、ネットワーク内の1又は2以上の構造成分を生成するステップと、をさらに含む。
別の実施形態では、ネットワークから構造を抽出するシステムが、プロセッサと、プロセッサに結合されて機械可読命令セットを記憶した非一時的プロセッサ可読メモリとを含む。機械可読命令セットは、プロセッサによって実行された時に、プロセッサに、複数のノードと、複数のノードのうちの1つ又は2つ以上を互いに連結して、連結されたノード間の関係の強さを定める1又は2以上のエッジとを含むネットワークを規定するエッジリストを受け取り、所定のフィルタパラメータに基づいてエッジリストから1又は2以上のノードをフィルタ除去(filter out)することによって、フィルタ処理済みネットワークを形成することを行わせる。機械可読命令セットは、ダイクストラ法を利用して、フィルタ処理済みネットワーク内の1又は2以上の異なる連結成分を識別し、フィルタ処理済みネットワークの1又は2以上の異なる連結成分の各々を、1又は2以上の異なる連結成分内における追加構造の存在について分析して、追加構造をさらなる異なる連結成分に分解し、異なる連結成分の各々のツリー走査を実行し、ツリー走査からの結果として得られた階層構造を融合して、局所的モジュラリティ最適条件を決定し、局所的モジュラリティ最適条件に応答して、ネットワーク内の1又は2以上の構造成分を生成することをさらにプロセッサに行わせる。
さらに別の実施形態では、ネットワークから構造を抽出するためのコンピュータプログラム製品が、コンピュータによって実行された時に、コンピュータに、複数のノードと、複数のノードのうちの1つ又は2つ以上を互いに連結して、連結されたノード間の関係の強さを定める1又は2以上のエッジとを含むネットワークを規定するエッジリストを受け取るステップと、所定のフィルタパラメータに基づいてエッジリストから1又は2以上のノードをフィルタ除去することによって、フィルタ処理済みネットワークを形成するステップと、を実行させる。このコンピュータプログラム製品は、ダイクストラ法を利用して、フィルタ処理済みネットワーク内の1又は2以上の異なる連結成分を識別するステップと、フィルタ処理済みネットワークの1又は2以上の異なる連結成分の各々を、1又は2以上の異なる連結成分内における追加構造の存在について分析して、追加構造をさらなる異なる連結成分に分解するステップと、異なる連結成分の各々のツリー走査を実行し、ツリー走査からの結果として得られた階層構造を融合して、局所的モジュラリティ最適条件を決定するステップと、局所的モジュラリティ最適条件に応答して、ネットワーク内の1又は2以上の構造成分を生成するステップと、をコンピュータにさらに実行させる。
以下の詳細な説明を図面と共に考慮すれば、本明細書で説明する実施形態によって提供されるこれらの及びさらなる特徴が十分に理解されるであろう。
図面に示す実施形態は、説明的かつ例示的なものであり、特許請求の範囲に定める主題を限定するものではない。以下の例示的な実施形態についての詳細な説明は、同じ構造を同じ参照数字によって示す以下の図面と共に読むことによって理解することができる。
本明細書において図示し説明する1又は2以上の実施形態による、大規模、高密度、高ノイズネットワークモデルから構造を抽出するコンピュータネットワーク例を概略的に示す図である。 本明細書において図示し説明する1又は2以上の実施形態による、大規模、高密度、高ノイズネットワークモデルから構造を抽出するコンピュータ装置例を概略的に示す図である。 本明細書において図示し説明する1又は2以上の実施形態による、複数の基底構造を有する大規模、高密度ネットワークを図形的に示す図である。 本明細書において図示し説明する1又は2以上の実施形態による、基底構造を決定するネットワークモデルの一部の例示的な階層構造表現を示す図である。 本明細書において図示し説明する1又は2以上の実施形態による、基底構造を決定するネットワークモデルに適用される関数当てはめ法の結果の例示的なグラフ表現を示す図である。 本明細書において図示し説明する1又は2以上の実施形態による、例示的な大規模、高密度、高ノイズネットワークを示す図である。 本明細書において図示し説明する1又は2以上の実施形態による、大規模、高密度、高ノイズネットワークから構造を反復的に抽出する方法例のフローチャートを図形的に示す図である。 本明細書において図示し説明する1又は2以上の実施形態による、本明細書で説明する方法を使用して構造を決定できる例示的なネットワークを例示的に示す図である。
ネットワークモデルは、エンティティ及びその連結方法を記述する。非限定的な例として、ネットワークモデルを使用して、書かれた記事間の関係及びこれらの間の引用、或いは出版物間における著者及び共同執筆者のリンクを記述することができる。例えば、記事及び著者は何千万も存在して何十億もの関係を有し、従って著しく大規模なネットワークを形成することができる。非限定的な例として、出版物は、執筆者、内部引用、出版物の媒体、主題、出版日及び改訂日などの、出版物を規定する1又は2以上の属性を有することができる。1つの出版物のこれらの各属性及びその他の属性を他の多くの出版物とリンクさせることによって、出版物のネットワークモデルを形成することができる。本明細書では構造成分とも呼ぶコミュニティは、ネットワークモデルに対して出版物が追加又は除去された時に形成されて存在することができる。このようなコミュニティの決定は、(カタログ又は探索システムなどの)システム又はユーザに、本明細書で説明するシステム及び方法によって決定された基底構造から決定できる固有の一連のコミュニティ(すなわち、一群のネットワーク化された出版物)を提供することができる。
このようなネットワークモデル内では、ネットワークモデルの基底構造を表す高密度な一群の関係を観察することができる。上述した記事の例では、これらの関係が、記事の共通の話題分野(common topic area)、又は著者のコミュニティを表すことができる。このような大規模ネットワークにわたってこの構造を抽出することは困難な場合があり、従ってこれらの群を識別するための複数のアルゴリズムが存在する。多くの場合、基底ネットワーク構造を規定する関係は、構造を規定しない関係、いわゆる「高ノイズ」エッジによってかき消されてしまう恐れがある。限定するわけではないが、ネットワークモデル内の出版物を表すことができる大量のノード(例えば、出版物)を含むことができる多くの理由で、どの関係が構造的であるか、及びどれがノイズであるかを事前に知ることは不可能となり得る。例えば、ネットワークモデル内の第1の出版物及び第2の出版物を、共同執筆者を共有するという理由で互いにリンクさせることはできるが、第1及び第2の出版物をリンクさせる共同執筆者が、第1の出版物で論じられている主題よりもむしろ第2の出版物で論じられている主題を有する出版物に主に執筆を行い、又はこちらの方に実質的に貢献している可能性もあるので、このリンクは「高ノイズ」リンクになり得る。従って、いくつかの例では、主題に基づくコミュニティが、第1の出版物と第2の出版物との間の関係に関するものではあるがそれほど重要ではないリンク(又は本明細書では「エッジ」とも呼ぶ)に起因して「高ノイズ」メンバを含む場合がある。
ネットワーク内の構造を抽出するいくつかの方法は、高ノイズ関係を解決せず、従ってネットワークモデル全体を通じて基底構造を解決しないことが多い。本開示の実施形態は、大規模、高密度、高ノイズネットワークモデル内の構造を抽出するために、高ノイズ関係を解決する反復法を使用して基底構造を解決するシステム及び方法に関する。
本明細書で説明するように、これらのシステム及び方法は、大規模、高密度、高ノイズネットワークモデルから、ネットワークモデル内の、本明細書では構造成分とも呼ぶコミュニティの定義をもたらす構造を抽出する。これらの構造成分は、データストレージ要素内に再アタッチ(再接続)ネットワーク(reattached networks)として記憶することができる。さらに、これらのコミュニティは、ビッグデータセットなどのデータを分析してデータから関係又は傾向などを決定する他のアプリケーション及び方法が利用することもできる。さらなるコンピュータ装置及びシステムがこれらのコミュニティを使用して知識ベースを構築し、又はデータ間の関係を識別することにより、本明細書で説明するシステム及び方法によって明らかになった関係のコミュニティに基づく予測アルゴリズムを通じて、検索アルゴリズムから戻される結果を改善し、及び/又はさらなる関連コンテンツの提案をユーザに行うこともできる。
以下、大規模、高密度、高ノイズネットワークモデルから構造を抽出する様々な実施形態について説明する。
ここで図面を参照すると、図1に、本明細書において図示し説明する1又は2以上の実施形態による、大規模、高密度、高ノイズネットワークモデルから構造を抽出するシステムの構成要素を示すコンピュータネットワーク例100を示す。図1に示すように、ネットワーク100は、インターネットなどのワイドエリアネットワーク、ローカルエリアネットワーク(LAN)、モバイル通信ネットワーク、公衆交換電話網(PSTN)、及び/又はその他のネットワークを含むことができ、ユーザコンピュータ装置102、大規模、高密度、高ノイズネットワークモデルから構造を抽出する抽出コンピュータ103及び管理者コンピュータ装置104を電気的に及び/又は通信可能に接続するように構成することができる。
ユーザコンピュータ装置102は、ディスプレイ102aと、処理装置102bと、入力装置102cとを含むことができ、これらの各々は、互いに及び/又はネットワーク100に通信可能に結合することができる。ユーザコンピュータ装置102を使用して、大規模、高密度、高ノイズネットワークモデルから構造を抽出するシステム及び方法を利用できるフロントエンドアプリケーションと相互連結することができる。いくつかの実施形態では、1又は2以上のユーザコンピュータ装置を、本明細書で説明する1又は2以上の特定のステップを実行することによって大規模、高密度及び/又は高ノイズネットワークモデルから構造を抽出するように実装することができる。
また、図1には管理者コンピュータ装置104も含まれる。大規模、高密度、高ノイズネットワークモデルから構造を抽出する抽出コンピュータ103が監視、更新又は訂正を必要とする場合には、管理者コンピュータ装置104を、所望の監視、更新及び/又は訂正を行うように構成することができる。
ユーザコンピュータ装置102及び管理者コンピュータ装置104をパーソナルコンピュータとして示し、コンテンツ概要を生成する抽出コンピュータ103をサーバとして示しているが、これらは一例にすぎないと理解されたい。具体的に言えば、いくつかの実施形態では、これらの構成要素には、いずれもあらゆるタイプのコンピュータ装置(例えば、モバイルコンピュータ装置、パーソナルコンピュータ及びサーバなど)を使用することができる。また、図1にはこれらの各コンピュータ装置を単体のハードウェアとして示しているが、これも一例である。具体的に言えば、ユーザコンピュータ装置102、大規模、高密度、高ノイズネットワークモデルから構造を抽出する抽出コンピュータ103及び管理者コンピュータ装置104の各々は、複数のコンピュータ、サーバ、データベースなどを表すこともできる。例えば、ユーザコンピュータ装置102、大規模、高密度、高ノイズネットワークモデルから構造を抽出する抽出コンピュータ103、及び管理者コンピュータ装置104の各々は、本明細書で説明する方法を実行するための分散又はグリッドコンピューティングフレームワークを形成することができる。
図2に、大規模、高密度、高ノイズネットワークモデルから構造を抽出する抽出コンピュータ103の内部構成要素を示す。一般に、抽出コンピュータ103は、本明細書で説明するネットワークモデル内からの1又は2以上の構造成分のフィルタ処理、識別、分析及び生成を行う。大規模、高密度、高ノイズネットワークモデルから構造を抽出する抽出コンピュータ103は、このようなタスクを完了するために、本明細書において図示し説明する実施形態によるハードウェア、ソフトウェア及び/又はファームウェアを利用することができる。抽出コンピュータ103は、いくつかの実施形態では、必須ハードウェア、ソフトウェア及び/又はファームウェアを含む汎用コンピュータとして構成することができ、いくつかの実施形態では、本明細書で説明する機能を実行するように特異的に設計された専用コンピュータとして構成することもできる。抽出コンピュータ103が汎用コンピュータである実施形態では、本明細書で説明する抽出コンピュータ103によって完了したプロセスが、大規模、高密度、高ノイズネットワークモデルへのアクセスを効率化することによってコンピュータ機能を改善すると理解されたい。
やはり図2に示すように、抽出コンピュータ103は、プロセッサ230と、入力/出力ハードウェア232と、ネットワークインターフェイスハードウェア234と、エッジリスト238a、連結成分データ238b、分解連結成分データ238c、及び結果として得られる再アタッチネットワーク238dなどの形の構造成分を記憶するデータストレージ要素236と、メモリ240とを含むことができる。メモリ240は、機械可読メモリとすることができる(非一時的プロセッサ可読メモリと呼ぶこともできる)。メモリ240は、揮発性及び/又は不揮発性メモリとして構成することができ、従って(SRAM、DRAM及び/又はその他のタイプのランダムアクセスメモリを含む)ランダムアクセスメモリ、フラッシュメモリ、レジスタ、コンパクトディスク(CD)、デジタル多機能ディスク(DVD)、及び/又はその他のタイプのストレージ要素を含むことができる。また、メモリ240は、オペレーティングロジック242、フィルタロジック244、連結成分ロジック246、分解ロジック248、ツリー走査ロジック250及び再アタッチロジック252を記憶するように構成することができ、これらの各々は、コンピュータプログラム、ファームウェア又はハードウェアとして具体化することができ、これについては以下で詳細に説明する。図2には、抽出コンピュータ103の構成要素間の通信を容易にするバス又はその他のインターフェイスとして実装できるローカルインターフェイス246も含まれる。
プロセッサ230は、(データストレージ要素236及び/又はメモリ240などから)プログラム命令を受け取って実行するように構成されたいずれかの処理要素を含むことができる。この命令は、データストレージ要素236及び/又はメモリ240に記憶された機械可読命令セット(例えば、1又は2以上のプログラム命令)の形をとることができる。入力/出力ハードウェア232は、モニタ、キーボード、マウス、プリンタ、カメラ、マイク、スピーカ、及び/又はデータの受信、送信及び/又は提示を行うその他の装置を含むことができる。ネットワークインターフェイスハードウェア234は、モデム、LANポート、Wi-Fiカード、WiMaxカード、モバイル通信ハードウェア、及び/又は他のネットワーク及び/又は装置と通信するその他のハードウェアなどの、いずれかの有線又は無線ネットワーキングハードウェアを含むことができる。
データストレージ要素236は、抽出コンピュータ103の局所及び/又は遠隔地に存在して、抽出コンピュータ103及び/又はその他の構成要素がアクセスするための1又は2以上のデータを記憶するように構成することができると理解されたい。図2に示すように、データストレージ要素236は、例えばエッジリスト238aを記憶する。エッジリスト238aは、ネットワークモデルの数字表現とすることができる。例えば、エッジリスト238aは、大規模、高密度、そして通常は高ノイズのネットワークモデルとすることができる。エッジリスト238aは、ネットワークグラフ内のノードの一連の近隣を記述する。換言すれば、エッジリストは、複数のノードと、これらの複数のノードのうちの1又は2以上のノードを互いに連結するエッジとを含むネットワークを規定する。1又は2以上のエッジは、例えば、グラフ空間内のノード間の距離を定めるエッジ又はエッジの長さに関連する加重値によって連結ノード間の関係の強さをさらに定めることができる。例えば、長さが長いエッジは弱い関係を示すことができるのに対し、長さが短いエッジは、長さが長いエッジよりも強い関係を示すことができる。いくつかの実施形態では、隣接行列、隣接リスト、又はその他の数値/行列構造によってネットワークを規定することができる。
データストレージ要素236は、連結成分データ238bを記憶することもできる。連結成分データ238bは、本明細書でさらに詳細に説明する初期フィルタ処理動作によって生成された部分連結ノードとしてのネットワーク表現に関する情報を含むことができる。また、分解連結成分データ238cは、例えばモジュラリティスペクトル分解法(modularity spectral decomposition method)及び/又はルヴァン法(Louvain method)を使用して分析された後に連結成分データ238bから規定されるネットワークモデルの一部を含むことができる。すなわち、分解連結成分データ238cは、1又は2以上の連結成分238b内の追加構造を規定する。ネットワークモデルの一部は、例えばワールドワイドウェブのネットワークモデルからの関連する話題に関する一連のウェブページ、ソーシャルネットワークのネットワークモデルからのソーシャルユニット又はコミュニティ、管轄、時間又は相互引用などに基づく関係を有するネットワークモデル判例法からの特定の問題又は話題に関する判例法に制限なく対応することができる。本明細書でさらに詳細に説明するように、これらの部分は、さらなる方法の反復を通じて精緻化することができるさらなる構造を含むことができる。
データストレージ要素236は、ネットワークから抽出された1又は2以上の構造成分を規定する再アタッチネットワーク238dに関するデータを含むこともできる。再アタッチネットワーク238dは、エッジリスト、隣接メトリクス、又はネットワークモデルの他の数値表現によって表すことができる。再アタッチネットワーク238dは、ネットワーク内に存在する1又は2以上の個々のコミュニティ構造を定める、大規模、高密度、高ノイズネットワークモデルから決定された1又は2以上の構造成分を含むことができる。例えば、コミュニティは、1又は2以上の著者を共有する一群の記事などの関連ノードのクラスタ(cluster)、又は大規模データ群から決定されることが望ましい他のいずれかの属性とすることができる。
メモリ240には、オペレーティングロジック242、フィルタロジック244、連結成分ロジック246、分解ロジック248、ツリー走査ロジック250、及び/又は再アタッチロジック252が含まれる。オペレーティングロジック242は、抽出コンピュータ103の構成要素を管理するためのオペレーティングシステム及び/又はその他のソフトウェアを含むことができる。フィルタロジック244は、メモリ240に記憶することもでき、所定のフィルタパラメータに基づいてエッジリストから1又は2以上のノードをフィルタ処理することによってフィルタ処理済みネットワークを形成するための命令を含むことができる。例えば、この所定のフィルタパラメータは、ノード次数(node degree)と呼ぶこともできるノードの連結数(例えば、ノードに連結されたエッジの数)を定める所定の値とすることができる。ネットワーク内の各ノードは、別のノードとの少なくとも1つの連結を有することができる。ネットワークは、ノード及び/又はエッジを除去するように所定のフィルタパラメータによってフィルタ処理される。1つの非限定的な例では、所定のフィルタパラメータがノード次数、すなわちそのノードからネットワーク内の他の全てのノードへの総エッジ数である。この非限定的な例では、連結が良好でなく所定の連結数未満の(例えば、非限定的な例として1、2、3、4、5、6、7、8、9、10又は11以上の連結未満の)連結しか有していないノードがネットワークからフィルタ除去される。所定のフィルタパラメータは、最初の反復において最小限に抑え、その後の反復において調整する(例えば、増加又は減少させる)ことができる。このようにしてノードを除去すると、構造及びノイズを示すノード及びエッジがいずれも減少する。すなわち、所定のフィルタパラメータ未満のノードを除去することによってネットワークモデル内の全体的なノード数が減少し、これによってネットワークモデル内の初期の一連の構造が露出し、或いは初期の一連のノイズ及びいくつかの少量の構造要素が少なくとも減少して、その後の処理がネットワークモデルの基底構造を良好に定義できるようになる。
メモリ240は、連結成分ロジック246を含むこともできる。連結成分ロジック246は、フィルタ処理済みネットワーク内の1又は2以上の異なる連結成分を識別するために使用される、例えばダイクストラ法などの1又は2以上のアルゴリズムとすることができる。例えば、ダイクストラ法は、ネットワーク内の第1のノードと第2のノードとの間の最短経路を定める複数の異なる連結成分を生成することができる。ダイクストラ法は、所与のノードについて、この所与のノードの連結先である他の数多くのノードまでの最短経路を決定することができる。これらの各々を組み合わせて連結成分を定めることができる。連結成分は、さらに規定すべき一群のコミュニティを含むことができる。
一般に、ダイクストラ法の実施形態は、ネットワークモデルを解析してネットワーク内の第1のノードと第2のノードとの間の最短経路を定めることにより、ネットワークモデル内の初期ノードから開始して1又は2以上の他のノードまでの経路及び/又はツリーを生成することができる。例えば、ダイクストラ法は、以下の一般的ステップを含むことができる。第1に、ネットワークモデル内の全てのノードに未訪問としてマーク付けし、例えば未訪問セットと呼ばれる全ての未訪問ノードのリストを形成する。第2に、全てのノードに暫定的な初期距離を割り当てることができる。初期ノードにゼロの値を割り当て、他の全てのノードを無限大に設定することができる。第3に、このアルゴリズムは、初期ノード(すなわち、最初の反復における現在のノード)から開始して、現在のノードからその各近隣ノードまでの暫定距離を計算する。この暫定距離を現在のノードの値に加算し、各近隣ノードについて決定された現在割り当てられている値と比較する。2つの値(すなわち、暫定距離、又はそれまでにノードの比較が行われていない場合には無限大の可能性がある近隣ノードの現在値)のうちの小さい方を近隣ノードに割り当てる。例えば、現在のノードAに6の距離がマーク付けされており、このノードを近隣Bに連結するエッジが長さ2を有する場合、AからBまでの距離は6+2=8になる。それまでに8よりも大きな距離がBにマーク付けされていた場合、この値を8に変更する。そうでなければ、現在の値を維持する。第4に、現在のノードに訪問済みとしてマーク付けし、未訪問セットから削除する。訪問済みノードは、決して再びチェックされることはない。第5に、宛先ノードに訪問済みとのマーク付けが行われている場合(すなわち、2つの特定のノード間のルートを計画する場合)、或いは未訪問セット内のノード間の最小暫定距離が無限大である場合(初期ノードと残りの未訪問ノードとの間に連結が存在しない時に発生する、完全な走査を計画する場合)、このアルゴリズムは停止する。そうでなければ、現在のノードの一連の近隣ノードから最小暫定距離とのマーク付けが行われた未訪問ノードを選択し、新たな「現在のノード」として設定する。アルゴリズムは、第3のステップに戻って継続する。
引き続きメモリ240を参照すると、メモリ240には分解ロジック248を記憶することができる。分解ロジック248は、一般に連結成分内の追加構造の存在を判別するための1又は2以上の方法を含む。例えば、分解ロジック248は、http://www.pnas.org/content/pnas/103/23/8577.full.pdfにおいて閲覧できるNewmanの論文「ネットワークにおけるモジュラリティ及びコミュニティ構造(Modularity and community structure in networks)」に記載されているモジュラリティスペクトル分解法を完全に又は部分的に含み、又は別様に実装することができ、このサイトはその全体が引用により本明細書に組み入れられる。さらに、モジュラリティスペクトル分解法の代わりに、例えばDe Meo、Pasquale他著、「大規模ネットワークにおけるコミュニティ検出のための一般的Louvain法(Generalized Louvain Method for Community Detection in Large Network)」、Intelligent Systems Design and Applications(ISDA)、2011、11th International Conference on Intelligent Systems Design And Applications、IEEE、88〜93ページ、2011年、に記載されているLouvain法などの他の方法を制限なく利用することもできると理解されたい。さらに、フィルタ処理済みネットワークの1又は2以上の異なる連結成分の各々を1又は2以上の異なる連結成分内の追加構造の存在について分析することができ、追加構造の存在が決定された時に追加構造を異なる追加連結成分に分解できる他の方法を使用することもできる。
メモリ240は、ツリー走査ロジック250を含むこともできる。ツリー走査ロジック250は、各分解連結成分のツリー走査を実行するための命令を含むことができる。ツリー走査は、ネットワークの階層構造又は他のツリー表現などのツリーデータ構造内の各ノードを正確に一回訪問(すなわち、チェック及び/又は更新)するプロセスを意味するグラフ走査の一形態である。このような走査は、ノードが訪問を受ける順番によって分類される。一般に、ネットワークのノードを走査する方法には、中間順、先行順及び後行順という3つの深さ優先順が存在する。しかしながら、探索木の拡張を探索空間の無作為抽出に準拠させて最も期待できる動きを分析することに集中する他の3つの走査アルゴリズムも存在する。ツリー走査ロジック250は、例えば階層構造などの、結果として得られた構造を融合するためのロジックを含むこともできる。階層構造は、異なる連結成分毎にツリー走査を実行することから決定することができる。本明細書で詳細に説明するように、結果として得られた階層構造を融合して局所的モジュラリティ最適条件を発見することができる。これにより、ネットワーク内から検索できる複数の構造成分が提供される。例えば、モジュラリティスペクトル分解法を使用して1又は2以上の異なる連結成分を分析すると、結果として得られたツリーの最上位からツリー走査プロセス開始することができ、プロセスがツリーを下向きに走査する際に必要に応じて成分を下位成分に分解することができる。このプロセスは、分割すべき成分又は下位成分が無くなると停止する。次に、プロセスは、結果として得られたツリーを上向きに戻り、(例えば、ネットワークモデルの特性行列の固有ベクトルを通じて表現できる)モジュラリティパラメータによって最適な分割がどこであるかを決定する。例えばLouvainモジュラリティ法を利用する実施形態などの他の実施形態では、ツリー走査法がノードから開始してノードを互いに結合し、モジュラリティパラメータの最適条件が観察されるまでツリーを上向きに遡る。モジュラリティパラメータの最適条件は、最初に全てのノードに作用することによって小さなコミュニティ(すなわち、小さな構造成分)を決定し、次に各小さなコミュニティを1つのノードにグループ化して、モジュラリティの増加が発生しなくなるまでツリー走査プロセスを繰り返すことができる。
図3に、大規模、高密度ネットワーク300の図形表現を示す。ネットワーク300のエンティティをノード302によって示し、ノード間の関係をエッジによって表す。なお、説明を容易にするために、図3にはネットワーク300のエッジを示していない。ネットワーク300内には基底構造が存在することもできるが、ネットワーク300のサイズ、密度及びノイズの量に起因して見えない場合もあると理解されたい。例示及び説明を目的として、ネットワーク300全体の基底構造を示すエンティティの構造(例えば、構造成分304A〜304E)については異なるグレイスケール値で示す。基底構造を明らかにする方法は、ネットワークの表現(例えば、図3に示す表現)を作成した後に、本明細書で説明する方法を使用して構造を識別することを含む。
上述したように、図4に、例示的なネットワーク表現と、基底構造を決定する方法の図形表現とを示す。ネットワークの表現は、制限を伴わずにエッジリスト、隣接行列又は隣接リストなどとすることができる。本明細書でさらに詳細に説明するように、ネットワークモデルのエッジリストは、2つのノード間の個々の連結のリストを通じて規定を行う。隣接行列は、ノードによってインデックス付けされた行及び列と、セルの行及び列に対応するノード間にエッジが存在するかどうかを示すブール値を含むセルとを有する行列である。ネットワークモデルの隣接リストは、ネットワークモデルの各ノードをその一群の近隣ノード又はエッジに関連付ける。この基本理念には多くの変種が存在し、これらは、ノード及び群間の関連付けの実施方法についての詳細、群の実装方法、ノードとエッジを両方とも含むか、それとも第1種オブジェクト(first class objects)としてのノードのみを含むか、並びにどのような種類のオブジェクトを使用してノード及びエッジを表すかが異なる。
ネットワークにおける基底構造を決定するために利用される方法に関しては、反復プロセスを通じたフィルタ処理と共に、例えばダイクストラ法、スペクトルモジュラリティ分解法、(例えば、図4Aに示すツリー構造によって示す)階層構造化法、(例えば、図4Bに示すネットワークモデルに適用される関数当てはめ法の結果のグラフによって示す)関数当てはめなどの方法を制限なく利用することができる。すなわち、これらの方法は、基底構造の決定をネットワーク内で正確に明らかにする(例えば、信号とノイズエッジとを区別する)のに単独では不十分であるが、本明細書で説明するように併用した時には、これらを使用して、同様のタイプの関係を共有するノードのコミュニティを定義する基底構造を決定することができる。
本明細書で言及する「ノイズ」は、基底構造に大きく寄与しないエッジとして定義される。図5に、大規模、高密度、高ノイズネットワークモデルの図を示す。このネットワークは、連結ノード間の関係を定めるエッジ504によって相互連結された複数のノード502を含む。ノイズは、一般にランダムなエッジによって生じる。実際には、ランダムなエッジは、長期的な活動のクラスタを生成し始めずにグラフの密な成分を形成するノード間の偶然の相互作用(例えば、一方の出版物が応用数学に関連し他方の出版物が電気工学に関連する場合の出版物に共通する共同執筆者、例えば異なる教授の下で働く大学院生)に起因して発生する。従って、これらのエッジは構造を示さず、これらのエッジの存在がこの構造をかき消してしまう恐れがある。なお、ネットワークは時間的に変化し、構造は発展することができる。従って、ある時点における高ノイズエッジが、さらなるエッジ504の形成を通じて時間と共に次第に中心的になり、将来的な何らかの時点で構造を示すようになることもある。図5の例では、ネットワークのノードがコミュニティiをコミュニティjに連結する確率Pijによって一様にランダムな連結モデルが規定さられる。コミュニティは、関連ノードのクラスタ又は構造成分と呼ぶことができる。一様にランダムな連結モデルでは、モジュラリティスペクトル分解法を用いた検出能の限界が
Figure 2020529777
によって与えられることを数学的に証明することができる。経験的証拠では、全ての方法に検出限界があることが実証されている。ネットワーク内の構造を検出するには、異なるコミュニティのノード間の連結確率であるPijを最小化し、同じコミュニティのノード間の連結確率であるPiiを最大化する必要がある。しかしながら、ノイズと信号の違いを判別することはできないので、コミュニティ内エッジとコミュニティ間エッジとを区別することは困難であり、従って基底構造を明らかにするにはPijの最小化とPiiの最大化とを同時に行うことが課題である。なお、本開示の実施形態は、一様にランダムな連結グラフ内の構造を決定することに限定されるものではなく、このようなグラフは一例として示すものにすぎないと理解されたい。本明細書で説明する反復法は、あらゆるタイプのグラフに適用することができる。
以下、図6及び図7を参照しながら、反復プロセスにおいて使用されるフィルタ処理法と分析法との組み合わせを利用して大規模、高密度、高ノイズネットワークモデル700から構造を抽出する方法について説明する。図6には、大規模、高密度、高ノイズネットワークモデル700から構造を反復的に抽出する方法例のフローチャートを示す。図7には、図6に関して説明する方法を使用して構造を特定できるネットワーク700を示す。図7にはかなり単純なネットワーク例700を示しているが、これは説明目的にすぎず、本明細書で説明するシステム及び方法は、何百個、何千個、何百万個、何十億個、又はそれよりも多くのノード及びエッジを有するネットワーク上に実装することができると理解されたい。図7に示すネットワーク700は、エッジ720〜744によって相互連結されたノード701〜716を含む。エッジ720〜744は、それぞれが長さを含むことができる。この長さは、連結ノード720〜744間の関係の強さを定めることができる。いくつかの実施形態では、エッジの長さが、連結ノード720〜744の間の関係の強さに反比例する。例えば、長いエッジの長さは弱い関係を示すことができ、一方で短いエッジの長さは連結ノード間の強い関係を示すことができる。また、上述したように、各ノードは、特定のノードに連結されたエッジの数を示すノード次数によって定めることができる。例えば、ノード701は1のノード次数を有し、ノード702は5のノード次数を有する。ノード間の関係の強さ又は弱さ(例えば、関係の度合い又は強度)は、ノードが共有する属性数の結果とすることができ、例えば2つの出版物は、共通の共同執筆者を共有しているという理由で互いにリンクすることができる。これらの2つの出版物が同様の又は関連する主題なども共有している場合には、さらに強いリンクを定めることができる。しかしながら、これは1つの限定的な例にすぎない。ネットワークのノードは、個々の消費者及び商取引方法(例えば、物理的店舗、オンライン小売店又はテレコマースなど)を表すこともでき、この場合、消費者は、購入頻度、返品頻度(return frequency)及びリピート購入頻度などの一連の習慣を通じて取引方法及び他の消費者にリンクされる。属性又は習慣の程度は、消費者の初期ネットワークモデル及び購入方法ネットワークモデルの生成時にモデル内の他のもので正規化することができる。
さて、大規模、高密度、高ノイズネットワークモデル700から構造を抽出する方法の考察に関する図6及び図7を参照すると、ブロック602において、本発明のシステムはエッジリストを受け取ることができる。エッジリストは、ネットワークモデル全体を表す。エッジリストは、複数のノードと、複数のノードのうちの1つ又は2つ以上を互いに連結する1又は2以上のエッジとを含むネットワークモデル700を規定し、1又は2以上のエッジは、連結ノード間の関係の強さを定める。例えば、以下の表1に、ネットワークモデル700のエッジリストを示す。
表1
Figure 2020529777
いくつかの実施形態では、エッジリストがノードの行列のみを含むことができ、他の実施形態では、エッジ識別子及び/又はエッジ重みを示すことができる。さらに、エッジリストは、ネットワークモデルの規定及び入力のための表現の一例にすぎない。抽出コンピュータ又は他のコンピュータシステムが受け取って利用できる他の表現例としては、隣接行列又は隣接リストなどを挙げることができる。
ブロック604において、フィルタ処理法を使用して、所定のフィルタパラメータに基づいてエッジリストから1又は2以上のノードをフィルタ処理することによって、フィルタ処理済みネットワークを形成する。所定のフィルタパラメータは、フィルタ処理プロセスの適用時に所定のフィルタパラメータ以下のノード次数を有するあらゆるノード及び関連するエッジをフィルタ処理するノード次数値とすることができる。例えば、所定のフィルタパラメータが2の値に設定されている場合、ノード702、707及び709は、他のノードとの連結エッジが2以下であるためフィルタ除去される。このフィルタ処理プロセスの結果、少なくとも2つの異なる構造が明らかになる。ノード709が除去された結果、ノード713〜716を含むノードのクラスタは、残りのノードから分離して、クラスタが基底構造を示すことができる旨の初期指示を与える。この非限定的な例では、十分に連結されていないノードがネットワークモデル700からフィルタ除去される。例えば、連結数が所定の数未満の(例えば、非限定的な例として連結数が2以下の)ノードがネットワークからフィルタ除去される。最初の反復では、この次数フィルタの程度を最小限に保つことができる。このようにノードを除去すると、構造及びノイズを示すノード及びエッジがいずれも減少する。しかしながら、構造の存在下ではノードがコミュニティ間連結よりもコミュニティ内連結を有している可能性が高いことを考えれば、ノードを一様に除去することで、コミュニティ内エッジ(Pii)よりもコミュニティ間エッジ(Pij) の方が多く減少するようになる。この結果、ネットワーク内の構造を規定する能力を強化することができる。
上述したように、ブロック604におけるフィルタ処理ステップ後には、ネットワーク内に異なる連結成分が残る。ブロック606において、異なる連結成分を発見する。1つの非限定的な例として、ダイクストラ法を使用して連結成分を識別することができる。ダイクストラ法は、ネットワーク内の第1のノードと第2のノードとの間の最短経路を定める複数の異なる連結成分を生成することができる。ダイクストラ法は、所与のノードについて、この所与のノードが連結された他の数多くのノードまでの最短経理を決定し、これらの経路を定める連結成分を出力することができる。例えば、ノード702の連結成分は、以下の表2のノードリストによって定めることができる。
表2
Figure 2020529777
これらのリストは、本明細書で説明したフィルタ処理プロセスの結果としてノード701、707及び709が除去された後の、フィルタ処理済みネットワーク内の複数の終点ノードまでの最短経路を表す。このプロセスを、異なる連結成分が識別されるようにネットワーク内の他の各ノードについても繰り返すことができる。
ブロック606で特定された各連結成分について、ブロック608及び610のプロセスを適用する。ブロック608において、ブロック606で発見された連結成分を分析してさらなる構造を発見する。すなわち、フィルタ処理済みネットワークの1又は2以上の異なる連結成分の各々を、1又は2以上の異なる連結成分内における追加構造の存在について分析し、追加構造の存在が判明した時点で、これらの追加構造をさらなる異なる連結成分に分解する。いくつかの実施形態では、ブロック608に示すステップの目的が、ノードを2又は3以上のグループに分離しながらグループ間に延びるエッジ数が最小化されるようにノード内の分割を決定することである。1つの方法は、「最小カット(minimum cut)」法と呼ばれる。しかしながら、この方法は、1つのグループが0個又は1個のノードを含んで他のグループが残りの全てのノードを含むような最適分割を規定することがある。従って、どの分割がコミュニティ間の最も少ないエッジ数を有するかについてコミュニティへのネットワーク分割を単独で決定できず、予想されるコミュニティ間のエッジよりも少なくなることがある。いくつかの実施形態では、モジュラリティと呼ばれる尺度を使用してこの方法を定量化することができる。
モジュラリティは、乗法定数(multiplicative constant)を上限として、グループ内に入るエッジの数から、エッジがランダムに配置された同等のネットワーク内の期待数を差し引いたものである。モジュラリティは、正又は負のいずれかとすることができ、正の値はコミュニティ構造が存在する可能性を示す。従って、システムは、正及び大きな値のモジュラリティを有するネットワークの分割を探すことによってコミュニティ構造を探索することができる。いくつかの実施形態では、モジュラリティプロセスが大規模ネットワーク問題に役立つようにするために、ヒューリスティック法又は外部最適化を使用することができる。しかしながら、本明細書で説明するように、モジュラリティプロセスは、対象ネットワークのスペクトル特性に関して再公式化することができる。この構造を識別するために使用される非限定的な方法例としては、モジュラリティスペクトル分解法が挙げられる。換言すれば、あるパラメータ(例えば、モジュラリティパラメータ)について連結成分を最適化する方法を使用する。いくつかの実施形態では、ブロック608において、スペクトル分解法、階層法又は関数当てはめ法を使用することができる。非限定的な例として、ネットワークモデルがn個のノードを含むと仮定する。ネットワークモデルの2つのグループへの特定の分割について、ノードiがグループ1に属する場合にはsi=1とし、ノードiがグループ2に属する場合にはsi=−1とする。ノードi及びj間のエッジ数をAijとし、この値は通常は0又は1であるが、複数のエッジが許容されるネットワークでは大きな値も可能である。(量Aijは、いわゆる隣接行列の要素である(すなわち、ネットワークモデルのエッジリスト又は他の行列表現から生成することができる))。同時に、エッジがランダムに配置された場合のノードi及びj間の予想エッジ数をkij/2mとし、ここでのki及びkjはノード次数であり、
Figure 2020529777
はネットワークモデル内の総エッジ数である。従って、モジュラリティQは、同じグループに入る全てのノードペアi、jにわたる
Figure 2020529777
の合計によって与えられる。
i及びjが同じグループに含まれる場合には量
Figure 2020529777
が1であり、そうでなければ0であることを見てとると、モジュラリティは、以下の方程式1として表すことができ、
Figure 2020529777
方程式1
ここでの第2の等式は、
Figure 2020529777
との観察から得られる。1/4mという先頭の因数(leading factor)は便宜的なもの(conventional)にすぎない。従って、方程式1は、以下の方程式2のように行列形式で書くことができ、
Figure 2020529777
方程式2
ここでの
Figure 2020529777

Figure 2020529777
Figure 2020529777
方程式3
この方程式は、モジュラリティ行列(modularity matrix)と呼ばれる。なお、行列の行及び列の各々の要素を合計すると、常に固有値0の固有ベクトル(1,1,1,...)を
Figure 2020529777
Figure 2020529777

Figure 2020529777

Figure 2020529777
この結果、以下のように表せる方程式4を見出すことができ、
Figure 2020529777
方程式4
Figure 2020529777
固有値がβ1≧β2≧…βnという減少順でラベル付けされると仮定する。
Figure 2020529777
適切な分割を選択することにより、モジュラリティを最大化することである。このことは、最大の(すなわち最も大きな正の)固有値を伴う方程式4の合計に関してできるだけ
Figure 2020529777

Figure 2020529777
比例するように選択することもできる。これにより、固有ベクトルが直交するので、最大固有値β1を伴う項に全ての重みが加えられ、他の項は自動的にゼロになる。
Figure 2020529777

Figure 2020529777

Figure 2020529777

Figure 2020529777
i=+1に設定し、そうでなければsi=−1に設定することによって実現される。換言すれば、対応する要素が正である全てのノードが1つのグループに入り、残りは全て他のグループに入る。これにより、ネットワークを分割するアルゴリズムが得られる。すなわち、このアルゴリズムは、モジュラリティ行列の主要固有ベクトル(leading eigenvector)を計算し、このベクトルの要素の符号に従ってノードを2つのグループに分割する。説明するアルゴリズムは、主要固有ベクトルの要素の符号のみを利用するが、その大きさも情報を伝える。大きさが大きな要素に対応するノードは、(例えば、方程式4によって示すように)モジュラリティに大きく寄与し、小さな要素については逆である。或いは、ネットワークを2つのグループに最適に分割することができ、ノードを1つのグループから他のグループに移動させる場合、このノードのベクトル要素は、モジュラリティがどれほど減少するかについて示唆し、大きさが大きな要素に対応するノードは、大きなモジュラリティペナルティを伴わないと移動できないのに対し、小さな要素に対応するノードは、比較的低コストで移動することができる。従って、主要固有ベクトルの要素は、各ノードが割り当て先のコミュニティにいかにしっかりと属しているかについての測定単位となり、大きなベクトル要素を有するノードは、そのコミュニティの強力な中心メンバであるのに対し、小さな要素を有するノードは両面性が高い。
いくつかの実施形態では、ブロック608において、追加構造をさらなる異なる連結成分に分解することができる。例えば、上述したスペクトルモジュラリティ分解法は、固有ベクトルに基づく分割をエッジ732にわたって行うことができると判断し、これによって別のクラスタ(すなわち、異なる連結成分)を形成することができる。例えば、ブロック608において、スペクトルモジュラリティ分解法は、ノード702、703、704、705、706を有するグループ1、ノード708、710、711、712を有するグループ2、及び713、714、715、716を有するグループ3という少なくとも3つの異なる連結成分を制限なく形成する。
引き続き図6及び図7を参照すると、システムは、各異なる連結成分のツリー走査を実行することができ、ブロック610において、ツリー走査から結果として得られる階層構造を融合して局所的モジュラリティ最適条件を決定する。すなわち、局所的モジュラリティ最適条件は、グローバルネットワークモデル全体よりも小さな識別構造内のローカルクラスタ連結を定めることができる。例えば、出版物のネットワークモデルは、それぞれが特定の主題を含む1又は2以上の連結成分(例えば、構造)を有することができる一方で、1又は2以上の連結成分の各々には、執筆者又は副題などの間の関係にさらに具体的に基づく追加構造が存在することができる。局所的モジュラリティ最適条件は、これらの追加構造のローカルクラスタ(例えば、サブコミュニティ)間の分割を定めることができる。上述したように、ツリー走査の実行は、各分解連結成分を走査することを含むことができる。すなわち、ツリー走査は、ネットワークの階層構造又はその他のツリー表現などのツリーデータ構造内の各ノードを正確に1回訪問(すなわち、チェック及び/又は更新)するプロセスを示すグラフ走査の一形態である。結果として得られる階層構造を融合して、局所的モジュラリティ最適条件を発見する。これにより、ネットワーク内から取り出された複数の構造成分が得られる。モジュラリティスペクトル分解法を使用する上述の例では、プロセスがツリーの最上位から開始し、プロセスがツリーを下向きに走査する際に必要に応じて成分が下位成分に分解される。このプロセスは、分割すべき成分又は下位成分が無くなると停止する。次に、プロセスは、結果として得られたツリーを上向きに戻り、モジュラリティパラメータによって最適な分割がどこであるかを調べる。局所的モジュラリティ最適条件の決定に応答して、ネットワークから1又は2以上の構造成分を生成することができる。
ブロック610において1又は2以上の構造成分を生成した後に、ブロック612において、ブロック604のフィルタ処理によって除去されたノードを再接続させる(reattached)ことができる。具体的には、所定のフィルタパラメータに基づいてフィルタ処理された1又は2以上のノードのうちのフィルタ処理済みノードを、投票プロセス(voting process)に基づいて再接続させることができる。投票プロセスは、どのコミュニティ(例えば、構造成分)にノードを再接続させるべきであるかを決定することを含むことができる。例えば、フィルタ除去されたノードが、元々はコミュニティAへの3つの連結と、コミュニティBへの2つの連結とを有していた場合、コミュニティAへの連結の方が多いという理由でコミュニティAに特定のノードを接続させることができる。いくつかの実施形態では、ノードをコミュニティに連結するエッジの長さを考慮することができる。例えば、フィルタ除去されたノードが、元々はコミュニティCとの1つの連結と、コミュニティDとの1つの連結とを有していたが、コミュニティDへの連結が、フィルタ処理済みノードをコミュニティCに連結するエッジよりも長いライン長を有するエッジによって定められていた場合には、フィルタ処理済みノードをコミュニティCに再連結することができる。従って、フィルタ処理済みノードは、必ずしも除去された同じ位置に再接続させなくてもよい。
反復(ブロック604〜612)の完了後、ブロック614において、再びフィルタ処理を行って別の反復を完了させるか、それともプロセスを停止するかを決定することができる。この決定は、方法の1又は2以上の反復によって生成された1又は2以上の構造成分によって定められるコミュニティの伝導性に基づくことができる。コミュニティの伝導性を決定するには、例えば以下のプロセスを利用することができる。G=(V,E)がネットワークのグラフを示すものと仮定すると、一連のノードS⊂V(ここでは、Sが全てのノードの半分を超えるノードを含んでいないと仮定する)の伝導性φは、以下のように定義される。S内のノード次数の合計をvとし、S内に1つのエンドポイントを有して、
Figure 2020529777
すると、Sの伝導性はφ=s/v、又は同等にφ=s/(s+2e)であり、ここでのeは、両エンドポイントSを有するエッジの数である。より形式的には、AがグラフGの隣接行列である場合、以下のようになり、
Figure 2020529777
方程式6
ここでは
Figure 2020529777
であり、この例では、グラフGの伝導性が以下のようになる。
Figure 2020529777
方程式7
Figure 2020529777
又はコミュニティSの同系性を与える。実際に、コミュニティは、連結間よりも連結内の方が多い及び/又は良好な一連のノードと見なすべきであることがしばしば示される。コミュニティの検出及びその品質の評価に関心がある時には、小さな伝導性(すなわち、コミュニティの内部では密にリンクされ、コミュニティの外部では疎にリンクされる組)が好ましくなり得る。
再びフィルタ処理を行って別の反復を実行すると決定した場合には、ブロック616において、その後の反復中にネットワーク内のノイズに寄与する要素を除去するように所定のパラメータを増加させた後に、ブロック604に戻ってその後のフィルタ処理プロセスを実行する。いくつかの実施形態では、例えば最初の反復中に排除されたノードが多すぎる場合には、より多くのノードを許容するように所定のフィルタパラメータを減少させることができる。
方法の反復をさらに実行して大規模、高密度、高ノイズネットワークモデルから構造を抽出するかどうかにかかわらず、本明細書ではネットワーク内の構造成分とも呼ぶ、結果として得られたコミュニティを、データストレージ要素内に再アタッチネットワークとして記憶することができる。これらのコミュニティは、とりわけビッグデータセットなどのデータを分析してデータから関係又は傾向などを決定する他のアプリケーション及び方法が利用することもできる。いくつかの実施形態では、ネットワークを形成するデータセットが、ネットワーク全体の解析を通じて実行可能に分析されない多くの変数及び多くの関係に基づく。しかしながら、大規模かつ高密度な情報ネットワークから構造を抽出することにより、データが計算リソースにとって管理しやすくなるとともに、より効率的な分析結果を提供することができる。
本明細書で図示し説明したシステム及び方法は、反復プロセスを通じて大規模、高密度、高ノイズネットワークモデルから構造を抽出するものであると理解されたい。このプロセスは、一般に複数のノードと、複数のノードのうちの1又は2以上のノードを互いに接続する1又は2以上のエッジとを含むネットワークを規定するエッジリストを受け取るステップを含む。方法は、所定のフィルタパラメータに基づいてエッジリストから1又は2以上のノードをフィルタ除去することによって、フィルタ処理済みネットワークを形成するステップと、ダイクストラ法を利用して、フィルタ処理済みネットワーク内の1又は2以上の異なる連結成分を識別するステップと、フィルタ処理済みネットワークの1又は2以上の異なる連結成分の各々を1又は2以上の異なる連結成分内の追加構造の存在について分析し、追加構造の存在が判明した時に、追加構造をさらなる異なる連結成分に分解するステップとを含む。また、異なる連結成分の各々に対してツリー走査を実行し、ツリー走査から結果として得られた階層構造を融合して、局所的モジュラリティ最適条件を決定することもできる。ツリー走査プロセスから局所的モジュラリティ最適条件が決定されたことに応答して、ネットワーク内の1又は2以上の構造成分を生成することができる。
本明細書で使用する専門用語は、特定の態様を説明するためのものにすぎず、限定を意図するものではない。本明細書で使用する単数形の「1つの(英文不定冠詞)」及び「その(英文定冠詞)」は、その文脈で別途明確に示していない限り、複数形も含むように意図される。「又は」は、「及び/又は」を意味する。本明細書で使用する「及び/又は」という用語は、関連する1又は2以上の列挙項目のありとあらゆる組み合わせを含む。さらに、「備える、含む(comprises及び/又はcomprising、或いはincludes及び/又はincluding)」という用語は、本明細書で使用する場合、上述した特徴、領域、整数、ステップ、動作、要素及び/又はコンポーネントの存在を示すが、1又は2以上の他の特徴、領域、整数、ステップ、動作、要素、コンポーネント、及び/又はこれらの群の存在又は追加を除外するものではないと理解されたい。「又はこれらの組み合わせ(or a combination thereof)」という用語は、先行する要素のうちの少なくとも1つを含む組み合わせを意味する。
本明細書では、「実質的に(substantially)」及び「約(about)」という用語を利用して、いずれかの定量比較、値、測定値又はその他の表現に起因し得る固有の不確実性度合いを表していることがある。本明細書では、これらの用語を利用して、対象となる主題の基本機能を変化させることなく、記載する内容から定量的表現が変化し得る度合いを表すことができる。
本明細書では特定の実施形態を図示し説明したが、特許請求する主題の趣旨及び範囲から逸脱することなく、他の様々な変更及び修正を行うことができると理解されたい。さらに、本明細書では、特許請求する主題の様々な態様を説明したが、このような態様を組み合わせて利用する必要はない。従って、添付の特許請求の範囲は、特許請求する主題の範囲内に収まる全てのこのような変更及び修正を対象とするように意図される。

Claims (20)

  1. ネットワークから構造を抽出する方法であって、
    複数のノードと、該複数のノードのうちの1又は複数のノードを互いに連結して、連結されたノード間の関係の強さを定める1又は複数のエッジとを含むネットワークを規定するエッジリストをプロセッサにより受け取るステップと、
    所定のフィルタパラメータに基づいて前記エッジリストから1又は複数のノードをプロセッサによりフィルタ処理することによって、フィルタ処理済みネットワークを形成するステップと、
    ダイクストラ法を利用して、前記フィルタ処理済みネットワーク内の1又は複数の異なる連結成分を識別するステップと、
    前記フィルタ処理済みネットワークの前記1又は複数の異なる連結成分の各々を、前記1又は複数の異なる連結成分内における追加構造の存在について分析するステップであって、前記追加構造は更なる異なる連結成分に分解される、ステップと、
    前記異なる連結成分の各々のツリー走査を実行するステップであって、前記ツリー走査からの結果として得られた階層構造は局所的モジュラリティ最適条件を決定するために融合される、ステップと、
    前記局所的モジュラリティ最適条件に応答して、前記ネットワーク内の1又は複数の構造成分を生成するステップと、
    を含む方法。
  2. 第2の所定のフィルタパラメータに基づいて前記ネットワークをフィルタ処理するか否かを決定するステップと、
    前記ネットワーク内の前記1又は複数の構造成分のノード間の伝導性に基づいて、前記方法の別の反復を完了するステップと、
    を更に含む、請求項1に記載の方法。
  3. 第1の反復における前記所定のフィルタパラメータは、第2の反復における第2の所定の連結数よりも少ない第1の所定の連結数を含む、請求項2に記載の方法。
  4. 前記ツリー走査を実行した後に、前記所定のフィルタパラメータに基づいてフィルタ処理された前記1又は複数のノードのうちのフィルタ処理済みノードを再接続させるステップを更に含み、前記フィルタ処理済みノードを再接続させるステップは投票プロセスに基づき、前記フィルタ処理済みノードは、前記フィルタ処理済みノードと、前記1又は複数の構造成分の前記1又は複数のノードとの間の関係の強さに基づいて、前記1又は複数の構造成分のうちの1つの構造成分に再接続される、請求項1に記載の方法。
  5. 前記1又は複数のエッジの各々の長さは、連結されたノードの間の関係の強さに反比例する、請求項1に記載の方法。
  6. 前記1又は複数の異なる連結成分の各成分を分析するステップは、モジュラリティスペクトル分解法を利用する、請求項1に記載の方法。
  7. 前記所定のフィルタパラメータは、ノードに連結されたエッジの数を定める所定の値である、請求項1に記載の方法。
  8. ネットワークから構造を抽出するためのシステムであって、
    プロセッサと、
    前記プロセッサに結合されて機械可読命令セットを記憶した非一時的プロセッサ可読メモリと、
    を含み、前記機械可読命令セットは、前記プロセッサによって実行されたときに、該プロセッサに、
    複数のノードと、該複数のノードのうちの1又は複数のノードを互いに連結して、連結されたノード間の関係の強さを定める1又は複数のエッジとを含むネットワークを規定するエッジリストを受け取ることと、
    所定のフィルタパラメータに基づいて前記エッジリストから1又は複数のノードをフィルタ除去することによって、フィルタ処理済みネットワークを形成することと、
    ダイクストラ法を利用して、前記フィルタ処理済みネットワーク内の1又は複数の異なる連結成分を識別することと、
    前記フィルタ処理済みネットワークの前記1又は複数の異なる連結成分の各々を、前記1又は複数の異なる連結成分内における追加構造の存在について分析することであって、前記追加構造は更なる異なる連結成分に分解される、分析することと、
    前記異なる連結成分の各々のツリー走査を実行することであって、前記ツリー走査からの結果として得られた階層構造は局所的モジュラリティ最適条件を決定するために融合される、実行することと、
    前記局所的モジュラリティ最適条件に応答して、前記ネットワーク内の1又は複数の構造成分を生成することと、
    を行わせる、システム。
  9. 前記機械可読命令セットは、実行時に、前記プロセッサに、
    第2の所定のフィルタパラメータに基づいて前記ネットワークをフィルタ処理するか否かを決定することと、
    前記ネットワーク内の前記1又は複数の構造成分のノード間の伝導性に基づいて、前記方法の別の反復を完了することと、
    を更に行わせる、請求項8に記載のシステム。
  10. 第1の反復における前記所定のフィルタパラメータは、第2の反復における第2の所定の連結数よりも少ない第1の所定の連結数を含む、請求項9に記載のシステム。
  11. 前記機械可読命令セットは、実行時に、前記プロセッサに、前記ツリー走査を実行した後に、前記所定のフィルタパラメータに基づいてフィルタ処理された前記1又は複数のノードのうちのフィルタ処理済みノードを再接続させることを更に行わせ、前記フィルタ処理済みノードを再接続させることは投票プロセスに基づき、前記フィルタ処理済みノードは、前記フィルタ処理済みノードと、前記1又は複数の構造成分の前記1又は複数のノードとの間の関係の強さに基づいて、前記1又は複数の構造成分のうちの1つの構造成分に再接続される、請求項8に記載のシステム。
  12. 前記1又は複数のエッジの各々は、連結されたノード間の関係の強さを定める値を含む、請求項8に記載のシステム。
  13. 前記1又は複数の異なる連結成分の各成分の分析は、モジュラリティスペクトル分解法を利用する、請求項8に記載のシステム。
  14. 前記所定のフィルタパラメータは、ノードに連結されたエッジの数を定める所定の値である、請求項8に記載のシステム。
  15. 前記1又は複数のエッジのうちの第1のエッジは、第1の長さを含み、前記1又は複数のエッジのうちの第2のエッジは、前記第1のエッジの前記第1の長さよりも長い第2の長さを含み、前記第2のエッジよりも短い長さを有する前記第1の長さよりも弱い関係を定める、請求項8に記載のシステム。
  16. ネットワークから構造を抽出するための、命令を含むコンピュータプログラム製品であって、該命令は、コンピュータによって実行されたときに、該コンピュータに、
    複数のノードと、該複数のノードのうちの1又は複数のノードを互いに連結して、連結されたノード間の関係の強さを定める1又は複数のエッジとを含むネットワークを規定するエッジリストを受け取るステップと、
    所定のフィルタパラメータに基づいて前記エッジリストから1又は複数のノードをフィルタ除去することによって、フィルタ処理済みネットワークを形成するステップと、
    ダイクストラ法を利用して、前記フィルタ処理済みネットワーク内の1又は複数の異なる連結成分を識別するステップと、
    前記フィルタ処理済みネットワークの前記1又は複数の異なる連結成分の各々を、前記1又は複数の異なる連結成分内における追加構造の存在について分析するステップであって、前記追加構造は更なる異なる連結成分に分解される、ステップと、
    前記異なる連結成分の各々のツリー走査を実行するステップであって、前記ツリー走査からの結果として得られた階層構造は局所的モジュラリティ最適条件を決定するために融合される、ステップと、
    前記局所的モジュラリティ最適条件に応答して、前記ネットワーク内の1又は複数の構造成分を生成するステップと、
    を実行させる、コンピュータプログラム製品。
  17. 第2の所定のフィルタパラメータに基づいて前記ネットワークをフィルタ処理するか否かを決定するステップと、
    前記ネットワーク内の前記1又は複数の構造成分のノード間の伝導性に基づいて、前記方法の別の反復を完了するステップと、
    を更に含む、請求項16に記載のコンピュータプログラム。
  18. 第1の反復における前記所定のフィルタパラメータは、第2の反復における第2の所定の連結数よりも少ない第1の所定の連結数を含む、請求項17に記載のコンピュータプログラム。
  19. 前記ツリー走査を実行した後に、前記所定のフィルタパラメータに基づいてフィルタ処理された前記1又は複数のノードのうちのフィルタ処理済みノードを再接続させるステップを更に含み、前記フィルタ処理済みノードを再接続させるステップは投票プロセスに基づき、前記フィルタ処理済みノードは、前記フィルタ処理済みノードと、前記1又は複数の構造成分の前記1又は複数のノードとの間の関係の強さに基づいて、前記1又は複数の構造成分のうちの1つの構造成分に再接続される、請求項16に記載のコンピュータプログラム。
  20. 前記分析するステップは、モジュラリティスペクトル分解法を利用する、請求項16に記載のコンピュータプログラム。
JP2020505787A 2017-08-01 2018-08-01 大規模、高密度、高ノイズネットワークから構造を抽出するためのシステム及び方法 Active JP6970275B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762539758P 2017-08-01 2017-08-01
US62/539,758 2017-08-01
US16/050,138 US10826781B2 (en) 2017-08-01 2018-07-31 Systems and methods for extracting structure from large, dense, and noisy networks
US16/050,138 2018-07-31
PCT/US2018/044824 WO2019028149A1 (en) 2017-08-01 2018-08-01 SYSTEMS AND METHODS FOR STRUCTURE EXTRACTION FROM DENSED, LOUD, AND LARGE DIMENSIONS

Publications (3)

Publication Number Publication Date
JP2020529777A true JP2020529777A (ja) 2020-10-08
JP2020529777A5 JP2020529777A5 (ja) 2021-09-09
JP6970275B2 JP6970275B2 (ja) 2021-11-24

Family

ID=65230097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020505787A Active JP6970275B2 (ja) 2017-08-01 2018-08-01 大規模、高密度、高ノイズネットワークから構造を抽出するためのシステム及び方法

Country Status (5)

Country Link
US (1) US10826781B2 (ja)
JP (1) JP6970275B2 (ja)
CN (1) CN112005525B (ja)
AU (1) AU2018312543B2 (ja)
WO (1) WO2019028149A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110825935A (zh) * 2019-09-26 2020-02-21 福建新大陆软件工程有限公司 社区核心人物挖掘方法、系统、电子设备及可读存储介质
CN111932386B (zh) * 2020-09-09 2021-01-15 腾讯科技(深圳)有限公司 用户账号确定方法及装置、信息推送方法及装置、电子设备
CN114928545B (zh) * 2022-03-31 2024-02-06 中国电子科技集团公司第十五研究所 一种基于Spark的大规模流量数据关键节点计算方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7269587B1 (en) * 1997-01-10 2007-09-11 The Board Of Trustees Of The Leland Stanford Junior University Scoring documents in a linked database
WO2011016281A2 (ja) * 2009-08-06 2011-02-10 株式会社シーエーシー ベイジアンネットワーク構造学習のための情報処理装置及びプログラム
JP2011150539A (ja) * 2010-01-21 2011-08-04 Nippon Telegr & Teleph Corp <Ntt> グラフの中心性のモニタリング装置及び方法及びプログラム
US20120284384A1 (en) * 2011-03-29 2012-11-08 International Business Machines Corporation Computer processing method and system for network data

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5832182A (en) 1996-04-24 1998-11-03 Wisconsin Alumni Research Foundation Method and system for data clustering for very large databases
US6003029A (en) 1997-08-22 1999-12-14 International Business Machines Corporation Automatic subspace clustering of high dimensional data for data mining applications
US6092072A (en) 1998-04-07 2000-07-18 Lucent Technologies, Inc. Programmed medium for clustering large databases
US9110985B2 (en) 2005-05-10 2015-08-18 Neetseer, Inc. Generating a conceptual association graph from large-scale loosely-grouped content
CN102177683B (zh) * 2008-08-08 2014-04-09 惠普开发有限公司 端到端网络访问分析
EP2254286B1 (en) * 2009-05-20 2013-03-20 Accenture Global Services Limited Network real time monitoring and control method, system and computer program product
CN102208989A (zh) * 2010-03-30 2011-10-05 国际商业机器公司 网络可视化处理方法及设备
US8396855B2 (en) * 2010-05-28 2013-03-12 International Business Machines Corporation Identifying communities in an information network
US9210071B2 (en) * 2010-08-16 2015-12-08 Telefonaktiebolaget L M Ericsson (Publ) Automated traffic engineering for fat tree networks
CN102662974B (zh) * 2012-03-12 2014-02-26 浙江大学 一种基于邻接节点树的网络图索引方法
CN103853726B (zh) * 2012-11-29 2018-03-02 腾讯科技(深圳)有限公司 一种挖掘社区用户的方法及装置
WO2015058307A1 (en) * 2013-10-25 2015-04-30 Sysomos L.P. Systems and methods for dynamically determining influencers in a social data network using weighted analysis
GB2520051A (en) * 2013-11-08 2015-05-13 Ibm Entitlement system and method for resources in a multi-computer system controlled by a single instance
US9928624B2 (en) 2014-10-14 2018-03-27 International Business Machines Corporation Visualization of relationships and strengths between data nodes
CN104346481B (zh) 2014-11-28 2018-01-16 西安电子科技大学 一种基于动态同步模型的社区检测方法
US9929909B2 (en) * 2015-08-31 2018-03-27 International Business Machines Corporation Identifying marginal-influence maximizing nodes in networks
TWI587661B (zh) * 2015-11-26 2017-06-11 財團法人工業技術研究院 混合式軟體定義網路的虛擬區域網路復原方法、系統及其裝置
CN105930856A (zh) 2016-03-23 2016-09-07 深圳市颐通科技有限公司 基于改进dbscan-smote算法的分类方法
CN106411572B (zh) * 2016-09-06 2019-05-07 山东大学 一种结合节点信息和网络结构的社区发现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7269587B1 (en) * 1997-01-10 2007-09-11 The Board Of Trustees Of The Leland Stanford Junior University Scoring documents in a linked database
WO2011016281A2 (ja) * 2009-08-06 2011-02-10 株式会社シーエーシー ベイジアンネットワーク構造学習のための情報処理装置及びプログラム
JP2011150539A (ja) * 2010-01-21 2011-08-04 Nippon Telegr & Teleph Corp <Ntt> グラフの中心性のモニタリング装置及び方法及びプログラム
US20120284384A1 (en) * 2011-03-29 2012-11-08 International Business Machines Corporation Computer processing method and system for network data

Also Published As

Publication number Publication date
CN112005525B (zh) 2024-03-15
WO2019028149A1 (en) 2019-02-07
US10826781B2 (en) 2020-11-03
JP6970275B2 (ja) 2021-11-24
US20190044821A1 (en) 2019-02-07
CN112005525A (zh) 2020-11-27
AU2018312543A1 (en) 2020-02-27
AU2018312543B2 (en) 2022-09-29

Similar Documents

Publication Publication Date Title
Bell et al. Network growth models: A behavioural basis for attachment proportional to fitness
Mooney et al. Analysis of Interaction and Co‐editing Patterns amongst O pen S treet M ap Contributors
CN109299090B (zh) 基金中心度计算方法、系统、计算机设备和存储介质
Al-Taie et al. Python for graph and network analysis
CN109492111A (zh) 最短路径查询方法、系统、计算机设备和存储介质
del Río-Chanona et al. Trends of the world input and output network of global trade
CN106844407B (zh) 基于数据集相关性的标签网络产生方法和系统
JP6970275B2 (ja) 大規模、高密度、高ノイズネットワークから構造を抽出するためのシステム及び方法
Das et al. A key review on graph data science: The power of graphs in scientific studies
JP5159451B2 (ja) ネットワーク行動を分析する情報処理装置、分析システム、ネットワーク行動の分析方法およびプログラム
US20150379112A1 (en) Creating an on-line job function ontology
Ebden et al. Network analysis on provenance graphs from a crowdsourcing application
US8700756B2 (en) Systems, methods and devices for extracting and visualizing user-centric communities from emails
Bhat et al. Browser simulation-based crawler for online social network profile extraction
Benatti et al. Complex networks accessibility and symmetry
US12061650B2 (en) Systems, methods, computing platforms, and storage media for comparing non-adjacent data subsets
CN106575418A (zh) 建议的关键词
Wang et al. The subnetwork investigation of scale-free networks based on the self-similarity
US20160239474A1 (en) Information management device and information management method
US10853820B2 (en) Method and apparatus for recommending topic-cohesive and interactive implicit communities in social customer relationship management
Wang et al. Resilience of hybrid herbivore–plant–pollinator networks
Budiman et al. Evaluation of the bioinformatics resource portal
CN111191882B (zh) 一种识别异质信息网络中有影响力的开发者的方法及装置
Enache et al. A conceptual framework for using marketing models for sustainable development
Shehu ACohesion BASED FRIEND RECOMMENDATION SYSTEM

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210802

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210802

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211028

R150 Certificate of patent or registration of utility model

Ref document number: 6970275

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150