JP2022025013A

JP2022025013A - 研究論文に関連付けられたマルチモーダルオンラインリソースの抽出

Info

Publication number: JP2022025013A
Application number: JP2021106728A
Authority: JP
Inventors: ワン・ジュヌ; Ju-Nu Wang; 寛治内野; Kanji Uchino
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-07-28
Filing date: 2021-06-28
Publication date: 2022-02-09
Also published as: US11270107B2; US20220036064A1

Abstract

【課題】研究論文に関連付けられたマルチモーダルオンラインリソースの抽出を提供する。【解決手段】方法は、研究論文と、メディアコンテンツを含む候補リソースセットと、を格納するステップを含む。前記方法は、前記研究論文の中の１つ以上の第１コンテンツフィールドの各々を、前記１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、第１ベクトルに符号化するステップを更に含む。前記方法は、パースした前記候補リソースセットの各々の中の１つ以上の第２コンテンツフィールドの各々を、前記１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するステップを更に含む。前記方法は、前記第１ベクトルを前記第２ベクトルと比較して、前記比較に基づき最終リソースセットを決定するステップを更に含む。前記方法は、決定した前記最終リソースセットと前記研究論文とを出力するようディスプレイスクリーンを制御するステップを更に含む。【選択図】図９

Description

本開示で議論される実施形態は、研究論文に関連付けられたマルチモーダルオンラインリソースの抽出に関連する。

標準的に、研究者は、関心分野における最新の進捗を理解するために、膨大な数の研究論文を研究することがある。例えば、研究者は、特定の研究論文を読み、更に、該研究論文の中で引用された１つ以上の関連研究論文を識別し研究することがある。通常、研究者は、検索エンジンで１つ以上の引用研究論文を検索する。研究及び検索は時間がかかり、研究者の関心分野及び事前知識に基づき退屈な作業になり得る。特定のソリューションでは、研究者は、手動で検索して、ウェブページに散乱しているオンラインリソース（例えば、ビデオ、スライド）を見付け、識別した研究論文および関心分野の概要を得ることができる。明らかに、研究論文に関連付けられたオンラインリソースの手動検索処理は、時間がかかり、膨大な数の研究論文が存在する場合には煩わしい。従って、研究者の関心分野の効率的理解のために、研究論文に関連付けられたオンラインリソースのメディアコンテンツを検索し抽出するための改良された方法が必要である。

本開示で請求される主題は、任意の欠点を解決する実施形態なたが］上述のような環境でのみ動作する実施形態に限定されない。むしろ、この背景技術は、本開示に記載の幾つかの実施形態が実施され得る一例である技術領域を説明するためにのみ提供される。

本発明の態様によると、方法が提供され得る。前記方法は、１つ以上の第１ウェブサイトから、研究論文に関連付けられた題名に基づき、１つ以上の第１リソースを抽出するステップを含んでよい。前記方法は、前記抽出した１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するステップを更に含んでよい。前記方法は、前記識別したリソースタイプセットに基づき、所定の複数のリソースタイプから、１つ以上の第１リソースタイプを決定するステップを更に含んでよい。前記リソースタイプセットは、前記決定した１つ以上の第１リソースタイプを除外してよい。前記方法は、前記研究論文に関連付けられた前記題名に基づき、前記１つ以上の第２ウェブサイトから、前記決定した１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを抽出するステップを更に含んでよい。前記１つ以上の第１リソース及び前記１つ以上の第２リソースの各々は、メディアコンテンツを含んでよい。前記方法は、前記研究論文の１つ以上の第１コンテンツフィールドと前記抽出した１つ以上の第１リソース及び前記抽出した１つ以上の第２リソースの１つ以上の第２コンテンツフィールドとの間の比較に基づき、最終リソースセットを決定するステップを更に含んでよい。前記方法は、前記決定した最終リソースセットと前記研究論文とを出力するようディスプレイスクリーンを制御するステップを更に含んでよい。

別の実施形態の別の態様によると、方法が提供され得る。前記方法は、候補リソースセット及び研究論文を格納するステップであって、候補リソースセット及び研究論文の各々は１つ以上のコンテンツフィールドを含んでよい、ステップを含んでよい。前記候補リソースセットは、メディアコンテンツを含んでよく、前記研究論文に関連付けられてよい。前記方法は、前記研究論文の中の１つ以上の第１コンテンツフィールドの各々を、前記１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、第１ベクトルに符号化するステップを更に含んでよい。前記方法は、前記格納した候補リソースセットの各々を１つ以上の第２コンテンツフィールドへとパースするステップを更に含んでよい。前記方法は、パースした前記候補リソースセットの各々の中の１つ以上の第２コンテンツフィールドの各々を、前記１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するステップを更に含んでよい。前記方法は、前記符号化された１つ以上の第１コンテンツフィールドの各々の前記第１ベクトルを、前記符号化された１つ以上の第２コンテンツフィールドの各々の前記第２ベクトルと比較するステップを更に含んでよい。前記方法は、前記比較に基づき、最終リソースセットを決定するステップを更に含んでよい。前記方法は、前記決定した最終リソースセットと前記研究論文とを出力するようディスプレイスクリーンを制御するステップを更に含んでよい。

実施形態の目的及び利点は、請求項において特に指摘される要素、特徴、及び組み合わせにより少なくとも実現され達成される。

前述の一般的説明及び以下の詳細な説明は両方とも例として与えられ、説明のためであり、請求される本発明の限定ではない。

例示的な実施形態は、以下の添付の図面の使用を通じて更なる特殊性及び詳細事項により記載され説明される。

１つ以上のウェブサイトからの研究論文に関連付けられたリソースの抽出に関連する例示的な環境を表す図である。

１つ以上のウェブサイトからの研究論文に関連付けられたリソースの抽出のための例示的な電子装置を示すブロック図である。

研究論文に関連付けられたリソースの抽出のための例示的なウェブサイトを共同で示す。研究論文に関連付けられたリソースの抽出のための例示的なウェブサイトを共同で示す。研究論文に関連付けられたリソースの抽出のための例示的なウェブサイトを共同で示す。

研究論文に関連付けられたオンラインリソースの抽出のための例示的な方法のフローチャートを示す。

研究論文の１つ以上の第１コンテンツフィールド及び研究論文に関連付けられた１つ以上のリソースの各々の１つ以上の第２コンテンツフィールドの抽出のための例示的な方法のフローチャートを示す。

同じリソースタイプに関連付けられた複数のリソースのマージのための例示的な方法のフローチャートを示す。

研究論文に関連付けられた最終リソースセットの決定のための例示的な方法のフローチャートを示す。

研究論文と共に最終リソースセットを表示し得る例示的なユーザインタフェース（ＵＩ）を示す。

全図は、本開示に記載される少なくとも１つの実施形態に従う。

本開示で説明される幾つかの実施形態は、研究論文に関連付けられたメディアコンテンツ（例えば、ビデオ、ポスター、プレゼンテーションスライド、又はプログラムコード）を含むマルチモーダルオンラインリソースの自動抽出のための方法及びシステムに関する。本開示では、１つ以上の第１リソースは、研究論文に関連付けられた題名に基づき、１つ以上の第１ウェブサイトから抽出されてよい。１つ以上の抽出した第１リソースに関連付けられたリソースタイプセットが識別されてよい。更に、１つ以上の第１リソースタイプは、識別されたリソースタイプセット（つまり、抽出されるべき所定のターゲットリソースタイプ）に基づき、所定の複数のリソースタイプから決定されてよい。１つ以上の抽出した第１リソースのリソースタイプセットは、決定した１つ以上の第１リソースタイプを除外してよい。ここで、１つ以上の第１リソースタイプは、所定の複数のリソースタイプの中で、抽出した１つ以上の第１リソースに関連付けられたリソースタイプセットから失われている（又は除外されている）可能性のあるリソースタイプに対応してよい。決定した１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースは、研究論文に関連付けられた題名に基づき、１つ以上の第２ウェブサイト（例えば、検索エンジン）から抽出されてよい。ここで、１つ以上の第１リソース及び１つ以上の第２リソースの各々は、研究論文に関連付けられ得るメディアコンテンツを含んでよい。最終リソースセットは、研究論文の１つ以上の第１コンテンツフィールドと抽出した１つ以上の第１リソース及び抽出した１つ以上の第２リソースの各々の１つ以上の第２コンテンツフィールドとの間の比較に基づき決定されてよい。ディスプレイスクリーンは、決定した最終リソースセットと研究論文とを出力するよう更に制御されてよい。

本開示で説明される別の実施形態は、抽出されたマルチモーダルオンラインリソース（メディアコンテンツを含む）の関連付けられた研究論文との自動比較のための方法及びシステムに関連する。本開示では、候補リソースセット及び研究論文が格納されてよい。候補リソースセット及び研究論文の各々は、１つ以上のコンテンツフィールドを含んでよい。候補リソースセットは、メディアコンテンツを含んでよく、研究論文に関連付けられてよい。研究論文は、１つ以上第１コンテンツフィールドにパースされて（parsed）よく、一方で、格納された候補リソースセットの各々は、１つ以上の第２コンテンツフィールドにパースされてよい。パースした研究論文の中の１つ以上の第１コンテンツフィールドの各々は、１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、第１ベクトルに符号化されてよい。更に、パースした候補リソースセットの中の１つ以上の第２コンテンツフィールドの各々は、１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化されてよい。符号化された１つ以上の第１コンテンツフィールドの各々の第１ベクトルは、符号化された１つ以上の第２コンテンツフィールドの各々の第２ベクトルと比較されてよい。最終リソースセットは、比較に基づき決定されてよい。ディスプレイスクリーンは、決定した最終リソースセット及び研究論文を出力するよう制御されてよい。

本開示の１つ以上の実施形態によると、メディアコンテンツリソース抽出の技術分野は、コンピューティングシステムが、研究論文に関連付けられたオンラインリソースを自動的に抽出し、及び抽出したリソースを関連付けられた研究論文と比較して、最終オンラインリソースセットを出力できるように、コンピューティングシステムを構成することにより改良され得る。種々のウェブサイトから研究論文に関連付けられたオンラインリソースを検索及びフィルタリングするための相当量の手動入力及び努力を必要とし得る他の従来のソリューションと比べて、コンピューティングシステムは、１つ以上のウェブサイトから、研究論文に関連付けられたオンラインリソースを、候補リソースとして自動的に抽出し、候補リソースを研究論文と比較して、研究論文に関連付けられた最終リソースセットを決定してよい。

システムは、１つ以上の第１ウェブサイトから、研究論文に関連付けられた題名に基づき、１つ以上の第１リソースを抽出するよう構成されてよい。例えば、１つ以上の第１ウェブサイトは、会議、会誌、又は前刷り研究論文出版社ウェブサイト、個人または学術機関ウェブサイト、又はリソース専用ウェブサイトであってよい。ここで、リソースは、メディアコンテンツを含んでよい。１つ以上の第１リソースの例は、限定ではなく、プレゼンテーションスライド、ポスター、ビデオ、又はプログラムコードを含んでよい。システムは、抽出した１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するよう更に構成されてよい。システムは、識別したリソースタイプセットに基づき、所定の複数のリソースタイプから、１つ以上の第１リソースタイプを決定するよう更に構成されてよい。ここで、リソースタイプセットは、決定した１つ以上の第１リソースタイプを除外してよい。例えば、所定の複数のリソースタイプは、限定ではないが、研究タイプ、ポスタータイプ、プレゼンテーションスライドタイプ、ビデオタイプ、又はプログラムコードタイプ、を含んでよい。リソースタイプセットが研究タイプ（つまり研究論文自体）、ポスタータイプ、及びプレゼンテーションスライドタイプを含む場合、決定される１つ以上の第１リソースタイプは、限定ではないが、ビデオタイプ又はプログラムコードタイプを含んでよい。言い換えると、１つ以上の第１リソースタイプは、リソースタイプセットの中で欠損しているが、複数の所定のリソースタイプの中に存在してよい。

システムは、決定した１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを、研究論文に関連付けられた題名に基づき、１つ以上の第２ウェブサイトから抽出するよう更に構成されてよい。例えば、決定した１つ以上の第１リソースタイプがビデオタイプ及びプログラムコードタイプリソースを含む場合、１つ以上の第２ウェブサイト（例えば、検索エンジン）は、ビデオタイプ及びプログラムコードタイプのリソースを抽出するために検索されてよい。抽出した１つ以上の第２リソースは、抽出した１つ以上の第１リソースと異なってよい。

システムは、研究論文の１つ以上の第１コンテンツフィールドと、抽出した１つ以上の第１リソース及び抽出した１つ以上の第２リソースの１つ以上の第２コンテンツフィールドと、の間の比較に基づき、最終リソースセットを決定するよう更に構成されてよい。例えば、研究論文の題名は、抽出されたポスター、プレゼンテーションスライド、又はビデオの各々に関連付けられた題名と比較されてよい（つまり、抽出された１つ以上の第１リソース及び抽出された１つ以上の第２リソース）。例では、研究論文の著者は、抽出されたポスター、プレゼンテーションスライド、及びビデオの各々に関連付けられた著者と比較されてよい。更に、研究論文の中のテキスト、図、又は表は抽出されたポスター、プレゼンテーションスライド、又はビデオの中の対応するテキスト、図、及び表と比較されてよい。自動比較、及び研究論文と抽出したリソース（例えば、ポスター、プレゼンテーションスライド、ビデオ、又はプログラムコード）との間の一致に成功すること、の両方に基づき、一致したリソースは、最終リソースセットとして決定されてよい。システムは、決定した最終リソースセットと研究論文とを、集約マルチモーダルデータとして、出力するようディスプレイスクリーンを制御するよう更に構成されてよい。例えば、ポスター、プレゼンテーションスライド、ビデオ、又はプログラムコード（つまり最終リソースセット）は、研究者のために統合ユーザインタフェース（ＵＩ）上で研究論文と一緒に表示されてよい。

本開示の１つ以上の他の実施形態によると、システムは、候補リソースセット及び研究論文を格納するよう構成されてよい。候補リソースセット及び研究論文の各々は１つ以上のコンテンツフィールドを含んでよい。候補リソースセットは、メディアコンテンツを含んでよく、候補リソースセットは研究論文に関連付けられてよい。例えば、ポスター、プレゼンテーションスライド、ビデオ、又はプログラムコードに関連するコンテンツは、候補リソースセットとして格納されてよい。システムは、研究論文をパースして（parse）１つ以上第１コンテンツフィールドにするよう、及び候補リソースセットの各々を、１つ以上の第２コンテンツフィールドにするよう、更に構成されてよい。例えば、１つ以上の第１コンテンツフィールドは、限定ではないが、題名、著者、発行日、要約、全文、図、表、又は研究論文に関連付けられたメタ情報を含んでよい。例では、１つ以上の第２コンテンツフィールドは、限定ではないが、題名、著者、リソースのオンラインアップロードの日、テキスト、図、表、又は候補リソースセットに関連付けられたメタ情報を含んでよい。

システムは、研究論文の中の１つ以上の第１コンテンツフィールドの各々を、１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、第１ベクトルに符号化するよう構成されてよい。同様に、システムは、候補リソースセットの各々の中の１つ以上の第２コンテンツフィールドの各々を、１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するよう構成されてよい。第１フィールドタイプ及び第２フィールドタイプの各々は、テキストフィールドタイプ、カテゴリフィールドタイプ、日時フィールドタイプ、図フィールドタイプ、又は表フィールドタイプ、のうちの１つを含んでよい。

システムは、符号化された１つ以上の第１コンテンツフィールドの各々の第１ベクトルを、符号化された１つ以上の第２コンテンツフィールドの各々の第２ベクトルと比較するよう構成されてよい。比較に基づき、システムは、候補リソースセットから、最終リソースセットを決定するよう構成されてよい。例えば、システムは、研究論文の第１ベクトルが第１候補リソースの第２ベクトルと一致する場合、候補リソースセットからの第１候補リソースを、最終リソースセットに追加してよい。比較に基づき、システムは、第１候補リソースが研究論文に対応することを検証してよい。システムは、決定した最終リソースセットと研究論文とを、集約マルチモーダルデータとして、出力するようディスプレイスクリーンを制御するよう更に構成されてよい。例えば、最終リソースセットは、研究者のために統合ＵＩ上で研究論文と一緒に表示されてよい。

標準的に、研究者は、分野の最先端を理解するために、関心分野の複数の研究論文の概要を取得したいと望み得る。しかしながら、自動ツール（例えば、開示されるコンピューティングシステム）が無いので、研究論文は、各研究論文に関連するオンラインリソースを手動で検索し抽出する必要がある。このような手動のアプローチは、研究者がインターネット上に散乱した複数のウェブサイトに手動でアクセスしアクセスしたリソースを抽出又はダウンロードしなければならないので、煩わしく時間がかかる。研究者は、更に、各々のアクセスしたオンラインリソースの中のコンテンツが実際に研究論文に対応するかどうかを手動で検証する必要がある。明らかに、研究論文に関連付けられたオンラインリソースの手動検索処理、及びこのようなオンラインリソースの集約は、時間がかかる作業であり、膨大な数の研究論文には良好に調整されない場合がある。これに対して、開示のシステムは、研究論文に関連付けられた（メディアコンテンツを含む）マルチモーダルオンラインリソースの自動及び拡張された抽出を提供し、抽出したオンラインリソースが研究論文に対応することの自動検証を提供し得る。このような自動的なアプローチは、研究者が研究論文に関連するオンラインリソース（つまりマルチモーダルコンテンツ）を検索し、抽出し、及び／又は検証するための有意な時間を節約し得る。

本開示の実施形態は、添付の図面を参照して説明される。

図１は、本開示で説明される少なくとも１つの実施形態に従い構成される、１つ以上のウェブサイトからの研究論文に関連付けられたリソースの抽出に関連する例示的な環境を示す図である図１を参照すると、環境１００が示される。環境１００は、電子装置１０２、サーバ１０４、データベース１０６、ユーザエンド装置１０８、及び通信ネットワーク１１０を含んでよい。電子装置１０２、サーバ１０４、データベース１０６、及びユーザエンド装置１０８は、通信ネットワーク１１０を介して互いに通信可能に接続されてよい。図１には、１つ以上の第１ウェブサイト１１２、及び１つ以上の第２ウェブサイト１１４が更に示される。サーバ１０４は、１つ以上の第１ウェブサイト１１２、及び１つ以上の第２ウェブサイト１１４をホスティングしてよい。１つ以上の第１ウェブサイト１１２は、ウェブサイト１１２Ａ、ウェブサイト１１２Ｂ、．．．、ウェブサイト１１２Ｎを含んでよい。１つ以上の第２ウェブサイト１１４は、ウェブサイト１１４Ａ、ウェブサイト１１４Ｂ、．．．、ウェブサイト１１４Ｎを含んでよい。電子装置１０２又はユーザエンド装置１０８に関連付けられ又はそれを操作し得るユーザ１１６が更に示される。

電子装置１０２は、研究論文に関連付けられた題名に基づき、サーバ１０４によりホスティングされる１つ以上の第１ウェブサイトから１つ以上の第１リソースを抽出するよう構成されてよい適切なロジック、回路、インタフェース、及び／又はコードを含んでよい。例えば、１つ以上の第１ウェブサイト１１２は、限定ではないが、会議、会誌、又は前刷り研究論文出版社ウェブサイト、個人又は学術機関ウェブサイト、又はリソース専用ウェブサイトを含んでよい。ここで、リソースは、メディアコンテンツを含んでよい。１つ以上の第１リソースの例は、限定ではなく、プレゼンテーションスライド、ポスター、ビデオ、又はプログラムコードを含んでよい。電子装置１０２は、抽出した１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するよう更に構成されてよい。電子装置１０２は、識別したリソースタイプセットに基づき、所定の複数のリソースタイプから、１つ以上の第１リソースタイプを決定するよう更に構成されてよい。ここで、例えば図４において説明されるように、リソースタイプセットは、決定した１つ以上の第１リソースタイプを除外してよい。

電子装置１０２は、決定した１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを、研究論文に関連付けられた題名に基づき、サーバ１０４によりホスティングされる１つ以上の第２ウェブサイト１１４から抽出するよう更に構成されてよい。例では、１つ以上の第２ウェブサイト１１４は、１つ以上の第１ウェブサイト１１２と異なってよい１つ以上の検索エンジンウェブサイトであってよい。電子装置１０２は、研究論文の１つ以上の第１コンテンツフィールドと、抽出した１つ以上の第１リソース及び抽出した１つ以上の第２リソースの１つ以上の第２コンテンツフィールドと、の間の比較に基づき、最終リソースセットを決定するよう更に構成されてよい。例えば、図５及び７に、１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールド、並びに比較が、説明される。

比較、及び研究論文と抽出したリソース（例えば、ポスター、プレゼンテーションスライド、ビデオ、又はプログラムコード）との間の一致に成功すること、の両方に基づき、電子装置１０２は、更に、抽出したリソースを、最終リソースセットのうちの１つであってよいリソースとして決定してよい。電子装置１０２は、決定した最終リソースセット及び研究論文を出力するよう、ディスプレイスクリーン（例えば、図２に示すディスプレイスクリーン２１２）を制御するよう更に構成されてよい。研究論文に関連付けられたオンラインリソースの抽出及び表示は、例えば、図４、５、６、及び９において更に説明される。

別の実施形態では、電子装置１０２は、候補リソースセット及び研究論文を格納するよう構成されてよい。候補リソースセット及び研究論文の各々は１つ以上のコンテンツフィールドを含んでよい。候補リソースセットは、メディアコンテンツを含んでよく、候補リソースセットは研究論文に関連付けられてよい。電子装置１０２は、研究論文をパースして（parse）１つ以上第１コンテンツフィールドにするよう、及び候補リソースセットの各々を、１つ以上の第２コンテンツフィールドにするよう、更に構成されてよい。これは、例えば図５及び７で更に説明される。

電子装置１０２は、研究論文の中の１つ以上の第１コンテンツフィールドの各々を、１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、第１ベクトルに符号化するよう更に構成されてよい。同様に、電子装置１０２は、候補リソースセットの各々の中の１つ以上の第２コンテンツフィールドの各々を、１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するよう更に構成されてよい。第１フィールドタイプ及び第２フィールドタイプの各々は、テキストフィールドタイプ、カテゴリフィールドタイプ、日時フィールドタイプ、図フィールドタイプ、又は表フィールドタイプ、のうちの１つを含んでよい。例えば、図７で、１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールドの符号化が、説明される。

電子装置１０２は、符号化された１つ以上の第１コンテンツフィールドの各々の第１ベクトルを、符号化された１つ以上の第２コンテンツフィールドの各々の第２ベクトルと比較するよう更に構成されてよい。比較に基づき、電子装置１０２は、候補リソースセットから、最終リソースセットを決定するよう構成されてよい。例えば、電子装置１０２は、研究論文の第１ベクトルが第１候補リソースの第２ベクトルと一致する場合、候補リソースセットからの第１候補リソースを、最終リソースセットに追加してよい。比較に基づき、電子装置１０２は、第１候補リソースが研究論文に対応するか否かを検証してよい。電子装置１０２は、決定した最終リソースセットと研究論文とを出力するようディスプレイスクリーンを制御するよう更に構成されてよい。例えば、最終リソースセットは、統合ユーザインタフェース（ＵＩ）上で研究論文と一緒に（マルチモーダルコンテンツとして）表示されてよい。研究論文による抽出したリソースの自動検証は、例えば、図７及び８において更に説明される。最終リソースセット及び研究論文を表示し得る例示的な統合ＵＩは、例えば図９において更に説明される。

電子装置１０２の例は、限定ではないが、ウェブラッパー（web wrapper）装置、ウェブ検索装置、検索エンジン、モバイル装置、デスクトップコンピュータ、ラップトップ、コンピュータワークステーション、コンピューティング装置、メインフレームマシン、クラウドサーバのようなサーバ、及びサーバ群を含んでよい。１つ以上の実施形態では、電子装置１０２は、ユーザエンド端末装置、及びユーザエンド端末装置に通信可能に結合されたサーバを含んでよい。電子装置１０２は、プロセッサ、（例えば、１つ以上の動作を実行する又は実行を制御する）マイクロプロセッサ、ＦＰＧＡ（field－programmable gate array）、又はＡＳＩＣ（application－specific integrated circuit）を含むハードウェアを用いて実装されてよい。幾つかの他の例では、電子装置１０２は、ハードウェア及びソフトウェアの組み合わせを用いて実装されてよい。

サーバ１０４は、カテゴリの１つ以上のウェブサイトをホスティングするよう構成されてよい適切なロジック、回路、インタフェース及び／又はコードを含んでよい。例えば、サーバ１０４は、１つ以上の第１ウェブサイト１１２をホスティングしてよい。該１つ以上の第１ウェブサイト１１２から、１つ以上の第１リソースが、電子装置１０２により抽出されてよい。更に、サーバ１０４は、１つ以上の第２ウェブサイト１１４をホスティングしてよい。該１つ以上の第２ウェブサイト１１４から、１つ以上の第２リソースが、電子装置１０２により抽出されてよい。サーバ１０４の例は、限定ではないが、ウェブサーバ、データベースサーバ、ファイルサーバ、メディアサーバ、アプリケーションサーバ、メインフレームサーバ、又はクラウドコンピューティングサーバを含んでよい。１つ以上の実施形態では、電子装置１０２は、サーバ１０４を含んでよい。サーバ１０４は、プロセッサ、（例えば、１つ以上の動作を実行する又は実行を制御する）マイクロプロセッサ、ＦＰＧＡ（field－programmable gate array）、又はＡＳＩＣ（application－specific integrated circuit）を含むハードウェアを用いて実装されてよい。幾つかの他の例では、サーバ１０４は、ハードウェア及びソフトウェアの組み合わせを用いて実装されてよい。

データベース１０６は、電子装置１０２によりサーバ１０４上にホスティングされた１つ以上の第１ウェブサイト１１２及び１つ以上の第２ウェブサイト１１４から抽出されてよい１つ以上の第１リソース及び１つ以上の第２リソースを格納するよう構成されてよい適切なロジック、インタフェース、及び／又はコードを含んでよい。実施形態では、データベース１０６は、候補リソースセット及び研究論文を格納してよい。データベース１０６は、研究論文の１つ以上の第１コンテンツフィールド、及び１つ以上の第１リソース及び１つ以上の第２リソースの各々の１つ以上の第２コンテンツフィールド（又は候補リソースセットの１つ以上の第２コンテンツフィールド）を更に格納してよい。更に、データベース１０６は、研究論文に一致し得る最終リソースセットも格納してよい。

データベース１０６は、関係型又は非関係型データベースであってよい。また、幾つかの例では、データベース１０６は、クラウドサーバのようなサーバ上に格納されてよく、又は電子装置１０２上にキャッシュされ格納されてよい。実施形態では、データベース１０６のサーバは、研究論文、リソース、又は研究論文若しくはリソースのコンテンツフィールドに対する要求を、電子装置１０２から、通信ネットワーク１１０を介して受信するよう構成されてよい。それに応答して、データベース１０６のサーバは、受信した要求に基づき、要求された研究論文、リソース、又はコンテンツフィールドを読み出し、電子装置１０２へ通信ネットワーク１１０を介して提供するよう構成されてよい。追加又は代替として、データベース１０６は、プロセッサ、（例えば、１つ以上の動作を実行する又は実行を制御する）マイクロプロセッサ、ＦＰＧＡ（field－programmable gate array）、又はＡＳＩＣ（application－specific integrated circuit）を含むハードウェアを用いて実装されてよい。幾つかの他の例では、データベース１０６は、ハードウェア及びソフトウェアの組み合わせを用いて実装されてよい。

ユーザエンド端末装置１０８は、研究論文及び最終リソースセットを含む統合ＵＩが表示され得る適切なロジック、回路、インタフェース、及び／又はコードを有してよい。ユーザエンド装置１０８は、統合ＵＩを表示するためのウェブブラウザソフトウェア又は独立型ソフトウェアを含んでよい。実施形態では、ユーザエンド装置１０８は、ユーザ１１６から、研究論文の題名及びＵＲＬ（Uniform Resource Locator）を含むユーザ入力を受信してよい。ユーザエンド装置１０８は、ユーザ入力を受信するためのＧＵＩ（graphical user interface）を含んでよい。ユーザエンド装置１０８は、ユーザ入力の中で示された研究論文に関連する最終リソースセットを自動的に検索し抽出するために、ユーザ入力を通信ネットワーク１１０を介して電子装置１０２に更に提供してよい。ユーザエンド装置１０８は、提供したユーザ入力に基づき、電子装置１０２から最終リソースセットを更に受信してよい。ウェブブラウザ又は独立型ソフトウェアは、ユーザ１１６からの研究論文の題名又はＵＲＬの受信したユーザ入力に基づき、研究論文及び最終リソースセットを含む統合ＵＩを表示してよい。ユーザエンド装置１０８の例は、限定ではないが、ウェブソルトウェア開発若しくはテスト装置、検索エンジン装置、モバイル装置、デスクトップコンピュータ、ラップトップ、コンピュータワークステーション、コンピューティング装置、メインフレームマシン、クラウドサーバのようなサーバ、及びサーバ群を含んでよい。図１では、ユーザエンド装置１０８は電子装置１０２と別個であるが、しかしながら、幾つかの実施形態では、ユーザエンド装置１０８は、本開示の範囲から逸脱することなく、電子装置１０２に統合されてよい。

通信ネットワーク１１０は、通信媒体であって、該通信媒体を通じて電子装置１０２がサーバ１０４と通信し得る通信媒体と、データベース１０６を格納し得るサーバと、ユーザエンド装置１０８と、を含んでよい。通信ネットワーク１１０の例は、限定ではないが、インターネット、クラウドネットワーク、Ｗｉ－Ｆｉ（Wireless Fidelity）ネットワーク、ＰＡＮ（Personal Area Network）、ＬＡＮ（Local Area Network）、及び／又はＭＡＮ（Metropolitan Area Network）を含んでよい。環境１００内の種々の装置は、種々の有線及び無線通信プロトコルに従い、通信ネットワーク１１０に接続するよう構成されてよい。このような有線及び無線通信プロトコルの例は、限定ではないが、ＴＣＰ／ＩＰ（Transmission Control Protocol and Internet Protocol）、ＵＤＰ（User Datagram Protocol）、ＨＴＴＰ（Hypertext Transfer Protocol）、ＦＴＰ（File Transfer Protocol）、ZigBee、EDGE、ＩＥＥＥ８０２．１１、Ｌｉ－Ｆｉ（light fidelity）、８０２．１６、ＩＥＥＥ８０２．１１ｓ、ＩＥＥＥ８０２．１１ｇ、マルチホップ通信、無線アクセスポイント（ＡＰ）、装置間通信、セルラ通信プロトコル、及び／又はＢＴ（Bluetooth）通信プロトコル、又はそれらの組み合わせを含んでよい。

変更、追加、又は省略が、本開示の範囲から逸脱することなく図１に対して行われてよい。例えば、環境１００は、図示され本開示で説明されるよりも多数又は少数の要素を含んでよい。例えば、幾つかの実施形態では、環境１００は、電子装置１０２を含むが、データベース１０６及びユーザエンド装置１０８を含まなくてよい。さらに、幾つかの実施形態では、データベース１０６及びユーザエンド装置１０８の各々の機能は、本開示の範囲から逸脱することなく、電子装置１０２に組み込まれてよい。

図２は、本開示で説明される少なくとも１つの実施形態に従い構成される、１つ以上のウェブサイトからの研究論文に関連付けられたリソースの抽出のための例示的な電子装置を示すブロック図である。図２は、図１の要素と関連して説明される。図２を参照すると、電子装置１０２を含むシステム２０２のブロック図２００が示される。電子装置１０２は、プロセッサ２０４、メモリ２０６、永久データ記憶装置２０８７、入力／出力（Ｉ／Ｏ）装置２１０、ディスプレイスクリーン２１２、及びネットワークインタフェース２１４を含んでよい。

プロセッサ２０４は、電子装置１０２により実行されるべき異なる動作に関連付けられたプログラム命令を実行するよう構成され得る、適切なロジック、回路、及び／又はインタフェースを含んでよい。例えば、動作のうちの幾つかは、１つ以上の第１リソースを抽出するステップと、リソースタイプセットを識別するステップと、１つ以上の第１リソースタイプを決定するステップと、１つ以上の第２リソースを抽出するステップと、を含んでよい。動作は、候補リソースセット及び研究論文を格納するステップと、研究論文及び格納した候補リソースセットの各々をパースするステップと、１つ以上の第１コンテンツフィールドの各々を符号化するステップと、１つ以上の第２コンテンツフィールドの各々を符号化するステップと、第１ベクトルを第２ベクトルと比較するステップと、を更に含んでよい。動作は、最終リソースセットを決定するステップと、最終リソースセットを表示するようディスプレイスクリーン（例えば、ディスプレイスクリーン２１２）を制御するステップと、を更に含んでよい。プロセッサ２０４は、種々のコンピュータハードウェア又はソフトウェアモジュールを含む、任意の適切な専用又は汎用コンピュータ、コンピューティングエンティティ、又は処理装置を含んでよく、任意の適切なコンピュータ可読記憶媒体に格納された命令を実行するよう構成されてよい。例えば、プロセッサ２０４は、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、又はプログラム命令を解釈し及び／又は実行し及び／又はデータを処理するよう構成される任意の他のデジタル若しくはアナログ回路を含んでよい。

図２には単一のプロセッサとして示されるが、プロセッサ２０４は、個々に又は集合的に本開示に記載のような電子装置１０２の任意の数の動作を実行する又は実行を指示するよう構成される任意の数のプロセッサを含んでよいさらに、プロセッサのうちの１つ以上は、異なるサーバのような１つ以上の異なる電子装置上に存在してよい。幾つかの実施形態では、プロセッサ２０４は、プログラム命令を解釈し及び／又は実行し、及び／又はメモリ２０６及び／又は永久データ記憶装置２０８に格納されたデータを処理するよう構成されてよい。幾つかの実施形態では、プロセッサ２０４は、プログラム命令を永久データ記憶装置２０８からフェッチし、プログラム命令をメモリ２０６にロードしてよい。プログラム命令がメモリ２０６にロードされた後に、プロセッサ２０４は、プログラム命令を実行してよい。プロセッサ２０４の例のうちの幾つかは、ＧＰＵ、ＣＰＵ、ＲＩＳＣプロセッサ、ＡＳＩＣプロセッサ、ＣＩＳＣプロセッサ、コプロセッサ、及び／又はそれらの組み合わせであってよい。

プロセッサ２０６は、プロセッサ２０４により実行可能なプログラム命令を格納するよう構成され得る、適切なロジック、回路、インタフェース及び／又はコードを含んでよい。特定の実施形態では、メモリ２０６は、オペレーティングシステム及び関連する特定用途情報を格納するよう構成されてよい。メモリ２０６は、格納されたコンピュータ実行可能命令またはデータ構造を運ぶ又は有するコンピュータ可読記憶媒体を含んでよい。このようなコンピュータ可読記憶媒体は、プロセッサ２０４のような汎用又は専用コンピュータによりアクセスされ得る任意の市販の媒体を含んでよい。例として、限定ではなく、このようなコンピュータ可読記憶媒体は、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、電気的消去可能なプログラマブル読み出し専用メモリ（ＥＥＰＲＯＭ）、コンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、又は他の光ディスク記憶装置、磁気ディスク記憶装置、又は他の磁気記憶装置、フラッシュメモリ素子（例えば、個体メモリ装置）、又はコンピュータ実行可能命令若しくはデータ構造の形式で特定のプログラムコードを運ぶ又は格納するために使用され得る且つ汎用又は専用コンピュータによりアクセスされ得る任意の他の記憶媒体、を含む有形又は非一時的コンピュータ可読媒体を含んでよい。上記の組み合わせも、コンピュータ可読記憶媒体の範囲に含まれてよい。コンピュータ実行可能命令は、例えば、プロセッサ２０４に、電子装置１０２に関連付けられた特定動作又は一群の動作を実行させるよう構成される命令及びデータを含んでよい。

永久データ記憶装置２０８は、プロセッサ２０４により実行可能なプログラム命令、オペレーティングシステム、及び／又はログ及び特定用途データベースのような特定用途情報を格納するよう構成され得る、適切なロジック、回路、インタフェース、及び／又はコードを含んでよい。永久データ記憶装置２０８は、格納されたコンピュータ実行可能命令またはデータ構造を運ぶ又は有するコンピュータ可読記憶媒体を含んでよい。このようなコンピュータ可読記憶媒体は、プロセッサ２０４のような汎用又は専用コンピュータによりアクセスされ得る任意の市販の媒体を含んでよい。

例として、限定ではなく、このようなコンピュータ可読記憶媒体は、ＣＤ－ＲＯＭ（Compact Disc Read－Only Memory）又は他の光ディスク記憶装置、磁気ディスク記憶装置、又は他の磁気記憶装置（例えばＨＤＤ（Hard－Disk Drive））、フラッシュメモリ装置（例えば、ＳＤＤ（Solid State Drive）、ＳＤ（Secure Digital）カード、他の個体メモリ装置）、又は特定のプログラムコードをコンピュータ実行可能命令又はデータ構造の形式で運び又は格納するために使用されてよい且つ汎用又は専用コンピュータによりアクセスされ得る任意の他の記憶媒体を含む有形又は非一時的コンピュータ可読記憶媒体を含んでよい。上記の組み合わせも、コンピュータ可読記憶媒体の範囲に含まれてよい。コンピュータ実行可能命令は、例えば、プロセッサ２０４に、電子装置１０２に関連付けられた特定動作又は一群の動作を実行させるよう構成される命令及びデータを含んでよい。

幾つかの実施形態では、メモリ２０６、永久データ記憶装置２０８、又は組合せは、１つ以上の第１リソース、１つ以上の第２リソース、候補リソースセット、最終リソースセット、及び研究論文を格納してよい。メモリ２０６、永久データ記憶装置２０８、又は組合せのいずれかは、研究論文の１つ以上の第１コンテンツフィールド、及び１つ以上の第１リソース及び１つ以上の第２リソースの各々の１つ以上の第２コンテンツフィールド（及び／又は候補リソースセットの１つ以上の第２コンテンツフィールド）を更に格納してよい。

Ｉ／Ｏ装置２１０は、ユーザ入力を受信するよう構成され得る、適切なロジック、回路、インタフェース、及び／又はコードを含んでよい。例えば、Ｉ／Ｏ装置２１０は、研究論文の題名又は研究論文のＵＲＬを含むユーザ入力を受信してよい。Ｉ／Ｏ装置２１０は、ユーザ入力に応答して、出力を提供するよう更に構成されてよい。例えば、出力は、最終リソースセット及び研究論文を表示し得る統合ＵＩを含んでよい。Ｉ／Ｏ装置２１０は、プロセッサ２０４及びネットワークインタフェース２１４のような他のコンポーネントと通信するよう構成され得る種々の入力及び出力装置を含んでよい。入力装置の例は、限定ではないが、タッチスクリーン、キーボード、マウス、ジョイスティック、及び／又はマイクロフォンを含んでよい。出力装置の例は、限定ではないが、ディスプレイ及び／又はスピーカを含んでよい。

ディスプレイスクリーン２１２は、最終リソースセット及び研究論文を表示し得る統合ＵＩをレンダリングするよう構成され得る、適切なロジック、回路、インタフェース、及び／又はコードを含んでよい。ディスプレイスクリーン２１２は、ユーザ１１６からユーザ入力を受信するよう構成されてよい。ユーザ入力は、研究論文の題名又はＵＲＬを含んでよい。このような場合にはｍ、ディスプレイスクリーン２１２は、ユーザ入力を受信するタッチスクリーンであってよい。ディスプレイスクリーン２１２は、限定ではないが、液晶ディスプレイ（ＬＣＤ）ディスプレイ、発光ダイオード（ＬＥＤ）ディスプレイ、プラズマディスプレイ、及び／又は有機ＬＥＤ（ＯＬＥＤ）ディスプレイ技術、及び／又は他のディスプレイ技術のような、幾つかの知られている技術を通じて実現されてよい。

ネットワークインタフェース２１４は、電子装置１０２、サーバ１０４、データベース１０６、及びユーザエンド装置１０８の間の通信を通信ネットワーク１１０を介して確立するよう構成され得る、適切なロジック、回路、インタフェース、及び／又はコードを有してよい。ネットワークインタフェース２１４は、通信ネットワーク１１０を介して電子装置１０２の有線又は無線通信をサポートする種々の知られている技術の使用により実装されてよい。ネットワークインタフェース２１４は、限定ではないが、アンテナ、無線周波数（ＲＦ）通信機、１つ以上の増幅器、チューナ、１つ以上の発信器、デジタル信号プロセッサ、コードデコーダ（ＣＯＤＥＣ）チップセット、加入者識別モジュール（ＳＩＭ）カード、及び／又はローカルバッファを含んでよい。

変更、追加、又は省略が、本開示の範囲から逸脱することなく例示的な電子装置１０２に対して行われてよい。例えば、幾つかの実施形態では、例示的な電子装置１０２は、簡単のために明示され又は記載されないことのある任意の数の他のコンポーネントを含んでよい。

図３Ａ、３Ｂ及び３Ｃは、本開示で説明される少なくとも１つの実施形態に従い構成される、研究論文に関連付けられたリソースの抽出のための例示的なウェブサイトを共同で示すブロック図である。図３Ａ、３Ｂ及び３Ｃは、図１及び図２の要素と関連して説明される。

図３Ａを参照すると、第１ウェブサイト３００Ａが示される。第１ウェブサイト３００Ａは、研究論文及び各研究論文に関連付けられた１つ以上のリソースに関連付けられ又はそれらを格納し得る、会議、会誌、又は前刷り研究論文出版社に関連付けられたウェブサイトであってよい。図３Ａには、第１ウェブサイト３００Ａの名称（例えば、３０２により示される「Conference website」（会議ウェブサイト））が示される。第１ウェブサイト３００Ａは、研究論文に関連付けられたメタデータ及び／又はコンテンツフィールドにより研究論文を検索するための検索ボックス（例えば、検索ボックス３０４Ａ）を含んでよい。例えば、電子装置１０２は、ユーザ１１６から、検索ボックス３０４Ａを通じてユーザ入力を受信してよい。ユーザ入力は、研究論文に関連付けられた題名を含んでよい。第１ウェブサイト３００Ａは、題名に基づき研究論文を検索し、検索した研究論文に関連する情報を提示してよい。

図３Ａに示すように、第１ウェブサイト３００Ａは、検索した研究論文に関連付けられた題名（例えば、３０４Ｂにより示される「Research Paper Title: Title－１」（研究論文の題名：題名１））を表示してよい。第１ウェブサイト３００Ａは、検索した研究論文に関連付けられた関連リソースのリンクも表示してよい。例えば、第１ウェブサイト３００Ａは、検索した研究論文に関連付けられたポスターのリンク（例えば、３０４Ｃにより示される「Related Resources Links: Poster－１」（関連リソースのリンク：ポスター１））を表示してよい。第１ウェブサイト３００Ａは、検索した研究論文の著者の名前（例えば、「Authors:FirstNameA LastNameA, FirstNameB LastNameB, FirstNameC LastNameC, and FirstNameD LastNameD」（著者：名前Ａ名字Ａ、名前Ｂ名字Ｂ、名前Ｃ名字Ｃ、名前Ｄ名字Ｄ））を更に表示してよい。第１ウェブサイト３００Ａは、検索した研究論文の要約（例えば、３０４Ｅにより示される「Abstract Text－１」（要約テキスト１））を更に表示してよい。更に、第１ウェブサイト３００Ａは、検索した研究論文の全文、又は全文を含むファイルへのリンク（例えば、３０４Ｆにより示される「Full Text Links: HTML－１ | PDF－１」（全文のリンク：HTML－１ | PDF－１））を表示してよい。例えば、第１ウェブサイト３００Ａは、全文のＨＴＭＬ（Hypertext Markup Language）ファイルへのリンク（例えば、「HTML－１」）又は全文のＰＤＦ（Portable Document Format）ファイルへのリンク（例えば、「PDF－１」）を表示してよい。第１ウェブサイト３００Ａは、検索した研究論文の書誌データ（例えば、３０６により示される）を更に表示してよい。書誌データの例は、図３Ａに示すように、会議議事録の巻（例えば、「Conference C－１, Volume １」（会議Ｃ－１、第１巻））、発行日（例えば、「April２０２０」（２０２０年４月））、頁番号（例えば、「２５－２８」）、及び著者情報（例えば、「FirstNameA LastNameA and FirstNameB LastNameB from ABC University, US; and FirstNameC LastNameC and FirstNameD LastNameD from XYZ Inc., US」（名前Ａ名字Ａ、及び名前Ｂ名字Ｂ、ＡＢＣ大学、米国：名前Ｃ名字Ｃ、及び名前Ｄ名字Ｄ、ＸＹＺ社、米国））を含んでよい。

図３Ｂを参照すると、第２ウェブサイト３００Ｂが示される。第２ウェブサイト３００Ｂは、学術機関に関連付けられたウェブサイト、又は研究論文の著者の及び／又は研究論文に関連付けられた１つ以上のリソースの著者の個人ウェブページであってよい。図３Ｂには、第２１ウェブサイト３００Ｂの名称（例えば、３０８により示される「Personal website」（個人ウェブサイト））が示される。第２ウェブサイト３００Ｂは、著者名（例えば、３１０により示される「Author name: FirstNameA LastNameA」（著者名：名前Ａ名字Ａ））を含んでよい。第２ウェブサイト３００Ｂは、著者の写真又は顔写真（例えば、写真３１２）を更に含んでよい。図３Ｂに示すように、第２ウェブサイト３００Ｂは、著者の職業、称号、組織、所属、又は学術機関若しくは個人の関心を更に含んでよい。例えば、図３Ｂの３１４により示されるように、著者の紹介は、「I am a Professor of ．．．ImageProcessing」（私は米国ＡＢＣ大学のコンピュータ科学の教授です。私の研究対象は、人工知能、クラウドコンピューティング、ＩｏＴ、及び画像処理です。）であってよい。

図３Ｂに示すように、第２ウェブサイト３００Ｂは、著者（例えば、「FirstNameA LastNameA」（名前Ａ名字Ａ））の出版物リスト（例えば、３１６により示される）を更に含んでよい。例えば、出版物リスト（例えば３１６により示される）は、第１研究論文（例えば、３１６Ａにより示される「Research Paper Title: Title－１」（研究論文の題名：題名１））、及び第２研究論文（例えば、３１６Ｂにより示される「Research Paper Title: Title－２」（研究論文の題名：題名２）を含んでよい。第１研究論文は「Title－１」のような題名、「FirstNameA LastNameA, FirstNameB LastNameB, FirstNameC LastNameC, and FirstNameD LastNameD」のような著者、及び「Abstract Text－１」のような要約を有してよい。第２ウェブサイト３００Ｂは、ＨＴＭＬファイルへのリンク（例えば、「HTML－１」）、及びＰＤＦファイルへのリンク（例えば、「PDF－２」）を表示してよい。第２ウェブサイト３００Ｂは、第１研究論文に関連する１つ以上のリソースを更に表示してよい。例えば、第２ウェブサイト３００Ｂは、第１研究論文に関連付けられた１つ以上のリソースとして、ポスターへのリンク（例えば「Poster－１」）及びプレゼンテーションスライドへのリンク（例えば「Presentation Slides－１」）を表示してよい。

第２研究論文（例えば、３１６Ｂにより示される）は「Title－２」のような題名、「FirstNameE LastNameE, FirstNameA LastNameA, FirstNameB LastNameB, and FirstNameC LastNameC」のような著者、及び「Abstract Text－２」のような要約を有してよい。第２ウェブサイト３００Ｂは、ＨＴＭＬファイルへのリンク（例えば、「HTML－２」）、及びＰＤＦファイルへのリンク（例えば、「PDF－３」）を表示してよい。第２ウェブサイト３００Ｂは、第２研究論文に関連する１つ以上のリソースを更に含み表示してよい。例えば、第２ウェブサイト３００Ｂは、第２研究論文に関連付けられた１つ以上のリソースとしてプログラムコードへのリンク（例えば「Source Code－２」）及びプレゼンテーションスライドへのリンク（例えば「Presentation Slides－２」）を表示してよい。

図３Ｃを参照すると、第３ウェブサイト３００Ｃが示される。第３ウェブサイト３００Ｃは、研究論文に関連付けられた特定のリソース（例えば、ポスター、プレゼンテーションスライド、ビデオ、プログラムコード、又は他のメディアコンテンツ）に関連付けられたウェブサイトであってよい。第３ウェブサイト３００Ｃは、ユーザ１１６（例えば、研究者）により検索され得る研究論文に関連し得る特定のリソースを格納するために、データベースを含んでよい。実施形態では、第３ウェブサイト３００Ｃは、１種類のリソース（例えばビデオ）を格納してよい。別の実施形態では、第３ウェブサイト３００Ｃは、複数種類のリソース（例えば、ポスター、プレゼンテーションスライド、ビデオ、又はプログラムコードの組合せ）を格納してよい。

例えば、図３Ｃには、第３ウェブサイト３００Ｃの名称（例えば、３１８により示される「Media content website」（メディアコンテンツウェブサイト））が示される。第３ウェブサイト３００Ｃは、研究論文に関連付けられたメディアコンテンツを含むリソースを検索するための検索ボックス（例えば、検索ボックス３２０Ａ）を含んでよい。例えば、電子装置１０２は、ユーザ１１６から、検索ボックス３２０Ａを通じてユーザ入力を受信してよい。ユーザ入力は、研究論文に関連付けられた題名を含んでよい。第３ウェブサイト３００Ｃは、題名に基づき研究論文を検索し、検索した研究論文に関連する情報を提示し、更に、検索した研究論文について第３ウェブサイト３００Ｃで入手可能なリソースを検索してよい。

図３Ｃに示すように、検索結果として、第３ウェブサイト３００Ｃは、検索した研究論文に関連付けられた題名（例えば、３２０Ｂにより示される「Title－１」を表示してよい。第３ウェブサイト３００Ｃは、検索した研究論文の著者の名前（例えば、「Authors: FirstNameA LastNameA, FirstNameB LastNameB, FirstNameC LastNameC, and FirstNameD LastNameD」（著者：名前Ａ名字Ａ、名前Ｂ名字Ｂ、名前Ｃ名字Ｃ、名前Ｄ名字Ｄ））を更に表示してよい。第３ウェブサイト３００Ｃは、検索した研究論文の書誌データ（例えば、３２０Ｄにより示される）を更に表示してよい。書誌データの例は、図３Ｃに示すように、会議議事録の巻（例えば、「Conference C－１, Volume １」（会議Ｃ－１、第１巻））、発行日（例えば、「April２０２０」（２０２０年４月））、頁番号（例えば、「２５－２８」）、及び著者情報（例えば、「FirstNameA LastNameA and FirstNameB LastNameB from ABC University, US; and FirstNameC LastNameC and FirstNameD LastNameD from XYZ Inc., US」（名前Ａ名字Ａ、及び名前Ｂ名字Ｂ、ＡＢＣ大学、米国：名前Ｃ名字Ｃ、及び名前Ｄ名字Ｄ、ＸＹＺ社、米国））を含んでよい。

第３ウェブサイト３００Ｃは、検索した研究論文に関連付けられた関連リソースのリンクを更に表示してよい。例えば、第３ウェブサイト３００Ｃは、メディアコンテンツ（例えば「Media Content－１”」）を閲覧し及び／又はダウンロードするために、リンク（例えば、３２２により示される）を表示してよい。メディアコンテンツは、検索した研究論文に関連付けられたリソースを含んでよい。メディアコンテンツの例は、限定ではなく、ポスター、プレゼンテーションスライド、ビデオ、及び／又はプログラムコードを含んでよい。ポスター及びプレゼンテーションスライドは、リソースとして、研究論文の迅速で有益な要約を提供してよい。ビデオは、リソースとして、検索した研究論文に含まれる分野又は概念のより良好な理解のための鮮明な情報を提供してよい。プログラムコードは、リソースとして、検索した研究論文の中で言及される概念に関連する詳細な実装に関する情報を提供してよい。

留意すべきことに、図３Ａ～３Ｃに示される、第１ウェブサイト３００Ａ、第２ウェブサイト３００Ｂ、及び第３ウェブサイト３００Ｃは、単に例として提示され、本開示の範囲を限定すると考えられるべきではない。

図４は、本開示で説明される少なくとも１つの実施形態に従い構成される、研究論文に関連付けられたオンラインリソースの抽出のための例示的な方法のフローチャートを示す。図４は、図１、図２、図３Ａ，図３Ｂ及び図３Ｃの要素と関連して説明される。図４を参照すると、フローチャート４００が示される。フローチャート４００に示される方法は、４０２で開始してよく、任意の適切なシステム、機器、又は装置により、例えば図１又は図２の例示的な電子装置１０２により、実行されてよい。別個のブロックにより示したが、フローチャート４００のブロックのうちの１つ以上に関連するステップ及び動作は、特定の実装に依存して、追加ブロックに分けられ、少ないブロックに結合され、又は削除されてよい。

ブロック４０２で、１つ以上の第１リソースが、１つ以上の第１ウェブサイト１１２から抽出されてよい。実施形態では、プロセッサ２０４は、１つ以上の第１ウェブサイト１１２から、研究論文に関連付けられた題名に基づき、１つ以上の第１リソースを抽出するよう構成されてよい。１つ以上の第１ウェブサイト１１２の例は、限定ではないが、会議、会誌、又は前刷り研究論文出版社ウェブサイト（例えば、第１ウェブサイト３００Ａ）、個人又は学術機関ウェブサイト（例えば、第２ウェブサイト３００Ｂ）、又はリソース専用ウェブサイト（例えば、第３ウェブサイト３００Ｃ）を含んでよい。実施形態では、プロセッサ２０４は、第１ウェブサイト３００Ａから第１リソースセットを、第２ウェブサイト３００Ｂから第２リソースセットを、第３ウェブサイト３００Ｃから第３リソースセットを、抽出してよい。１つ以上の第１リソースは、１つ以上の第１ウェブサイト１１２から抽出された、第１リソースセット、第２リソースセット、及び第３リソースセットを含んでよい。１つ以上の第１リソースの中のリソースの例は、限定ではなく、プレゼンテーションスライド、ポスター、ビデオ、又はプログラムコードを含んでよい。実施形態では、プロセッサ２０４は、１つ以上の第１ウェブサイト１１２から、研究論文も抽出してよい。例えば、第１リソースセットと一緒に、プロセッサ２０４は、第１ウェブサイト３００Ａから研究論文を抽出してよい。実施形態では、プロセッサ２０４は、１つ以上の第１ウェブサイト１１２から、研究論文の題名に基づき、１つ以上の第１リソースを抽出してよい。例えば、プロセッサ２０４は、（ユーザ１１６又は任意の他の研究者又は知識労働者にとって関心のある可能性のある）研究論文の題名を、同じ（つまり研究論文の題名と類似する）題名を含む又はそれによりインデックス付けされ得る１つ以上の第１リソース（例えば、ポスター、プレゼンテーションスライド、ビデオ、又はプログラムコード）を抽出するために、第１ウェブサイト３００Ａ、第２ウェブサイト３００Ｂ、又は第３ウェブサイト３００Ｃへ提供してよい。幾つかの実施形態では、プロセッサ２０４は、１つ以上の第１ウェブサイト１１２から、研究論文の題名（又はＵＲＬ）に基づき、研究論文を抽出してよい。他の実施形態では、プロセッサ２０４は、１つ以上の第１ウェブサイト１１２から、研究論文の他のメタ情報、例えば限定ではないが著者名、要約若しくは研究論文の説明の１つ以上のキーワード、に基づき、１つ以上の第１リソースを抽出するよう構成されてよい。

幾つかの実施形態では、プロセッサ２０４は、第１ウェブページセットから情報（例えば、第１リソースセット）を抽出するために、第１ウェブサイト３００Ａに関連付けられた第１ウェブページセット（例えば、会議、会誌、又は前刷り研究論文出版社に関連付けられたウェブサイト）をクロールするよう構成されてよい。更に、プロセッサ２０４は、ユーザ（例えば、ユーザ１１６）からのユーザ入力に基づき、クロールした第１ウェブページセットのうちのサンプルウェブページの中の１つ以上のアイテムをラベル付けし又は選択してよい。プロセッサ２０４は、ツリーデータ構造及び第１アイテムに関連付けられた視覚情報に基づき、サンプルウェブページのラベル付けされた１つ以上のアイテムから第１アイテムを抽出するための初期抽出ルールを生成してよい。プロセッサ２０４は、クロールした第１ウェブページセットの中のターゲットウェブページから第２アイテム（つまり第１アイテムに対応する）を抽出するための新たな抽出ルールを生成するために、初期抽出ルールを精緻化してよい。プロセッサ２０４は、抽出されるべきアイテムに関連付けられた視覚情報に基づき、他のターゲットウェブページの各々からのアイテムの抽出のために、このような他のターゲットウェブページについて、新たな抽出ルールを自動的に且つ増分的に精緻化してよい。プロセッサ２０４は、第１ウェブサイト３００Ａの中の各々のこのようなターゲットウェブページからアイテムを更に抽出してよい。抽出したアイテムは、研究論文、及び１つ以上の第１リソースの中の第１リソースセットに対応してよい。

幾つかの実施形態では、第１ウェブサイト３００Ａに関連付けられた第１ウェブページセットからの情報（例えば、第１リソースセット）の抽出と同様に、プロセッサ２０４は、第３ウェブサイト３００Ｃに関連付けられた第２ウェブページセット（例えば、リソース専用ウェブサイト）から情報を抽出してよい。第３ウェブサイト３００Ｃから抽出した情報は、１つ以上の第１リソースの中の第３リソースセットに対応してよい。例では、第３ウェブサイト３００Ｃが研究論文に関連付けられたビデオリソースをホスティングする場合、第３リソースセットは、研究論文に関連付けられたビデオを含んでよい。

幾つかの実施形態では、プロセッサ２０４は、第２ウェブサイト３００Ｂから、分散したオンラインリソース（例えば、第２リソースセット）を自動的に識別し抽出するよう構成されてよい。プロセッサ２０４は、第２ウェブサイト３００Ｂの中の候補エントリリストページを特定するよう構成されてよい。例えば、候補エントリリストページは、第２ウェブサイト３００Ｂのホームページ内のリンクの中でターゲットキーワードについてのキーワード検索に基づき、第２ウェブサイト３００Ｂの中で特定されてよい。ここで、各リンクはアンカー（anchor）テキスト及び／又はＵＲＬを含んでよい。ターゲットキーワードを含むリンクのリンクリストが生成されてよく、リンクリストからのリンクは、候補エントリリストページを指すとして選択されてよい。プロセッサ２０４は、候補エントリリストページの文書オブジェクトモデル（Document Object Model (DOM)）ツリー通じて、反復パターンを用いて、エントリリストページとして候補エントリリストページを検証するよう構成されてよい。プロセッサ２０４は、エントリリストページを複数のエントリアイテムにセグメント化してよい。複数のエントリアイテムから、プロセッサ２０４は、各エントリアイテムの中の１つ以上のリンクの識別により、複数の候補ターゲットページを抽出してよい。１つ以上のリンクの各々は、複数の候補ターゲットページのうちの対応する１つを指してよい。プロセッサ２０４は、候補ターゲットページのうちの少なくとも１つの視覚構造及び提示の分析に基づき、候補ターゲットページのうちの少なくとも１つを、ターゲットページとして検証して、候補ターゲットページのうちの少なくとも１つの中の１つ以上の情報ブロックを識別するよう構成されてよい。プロセッサ２０４は、１つ以上の情報ブロックから１つ以上のキーワード特徴を抽出してよい。プロセッサ２０４は、更に、１つ以上のキーワード特徴のうちの少なくとも１つに基づき、少なくとも１つの候補ターゲットページを特定ジャンルのページに対応するとして、それによりターゲットページとして、分類してよい。最終的に、プロセッサ２０４は、従って、ターゲットページから、第２ウェブサイト３００Ｂ（つまり、学術機関又は個人ウェブページに関連付けられたウェブサイト）から抽出された第２リソースセットとして、メタデータ及び情報を抽出してよい。

例えば、ＦＬＡ１１－０２５、米国特許第９,３９０,１６６Ｂ２号、２０１２年１２月３１日出願、参照によりその全体がここに組み込まれる、は、オンラインリソース識別及び抽出を詳細に議論している。参照された出願によるウェブページから情報を抽出する方法は、単なる例であることに留意する。しかしながら、本開示の範囲から逸脱することなく、ウェブページから情報を抽出する異なる他の方法が存在し得る。

実施形態では、プロセッサ２０４は、研究論文及び１つ以上の第１リソースに対応する抽出したアイテムをインデックス付けし、インデックス付けした抽出したアイテムをデータベース１０６、メモリ２０６、永久データ記憶装置２０８、又はそれらの組合せに格納するよう更に構成されてよい。別の実施形態では、プロセッサ２０４は、研究論文及び／又は第１リソースセットに対応するアイテム、第２リソースセットに対応するアイテム、及び第３リソースセットに対応するアイテムを個別にインデックス付けするよう構成されてよい。このようなシナリオでは、プロセッサ２０４は、このように個別にインデックス付けしたアイテムを、（研究論文及び／又は第１リソースセットのための）第１データベース、（第２リソースセットのための）第２データベース、及び（第３リソースセットのための）第３データベースのような個別のデータベースに格納してよい。実施形態では、第１データベース、第２データベース、及び第３データベースは、データベース１０６、メモリ２０６、永久データ記憶装置２０８、又はそれらの組合せに関連付けられてよい。

実施形態では、第１データベースは、第１ウェブサイト３００Ａ（例えば、会議、会誌、又は前刷り研究論文出版社のウェブサイト）から抽出された研究論文及び第１リソースセットを含み得る中央ドメイン固有のデータのためのデータベースに対応してよい。第２データベースは、第２ウェブサイト３００Ｂ（例えば、学術機関又は個人のウェブサイト）から抽出した第２リソースセットを含み得る分散ドメイン固有のデータのためのデータベースに対応してよい。第３データベースは、第３ウェブサイト３００Ｃ（例えば、リソース専用ウェブサイト）から抽出した第３リソースセットを含み得る特別なリソースのためのデータベースに対応してよい。

ブロック４０４で、抽出した１つ以上の第１リソースに関連付けられたリソースタイプセットが識別されてよい。実施形態では、プロセッサ２０４は、１つ以上の第１ウェブサイト１１２から抽出した抽出した１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するよう構成されてよい。幾つかの実施形態では、プロセッサ２０４は、リソースに関連付けられたＵＲＬに基づき、リソース（つまり抽出された１つ以上の第１リソース）のリソースタイプを、ビデオタイプ又はプログラムコードタイプとして識別してよい。例えば、プロセッサ２０４は、リソースのＵＲＬを、ビデオ又はプログラムコードタイプのリソースの既知のＵＲＬのリストと比較して、リソースがビデオタイプか又はプログラムコードタイプかをそれぞれ決定してよい。

幾つかの実施形態では、プロセッサ２０４は、ページレイアウト分析に基づき、研究論文、プレゼンテーションスライド、又はポスターのようなリソースのリソースタイプを更に識別してよい。プロセッサ２０４は、このようなリソースのリソースタイプ（つまり、リソースタイプセットの中の）を、研究論文タイプ、プレゼンテーションスライドタイプ、又はポスタータイプとして、識別してよい。プロセッサ２０４は、このようなリソースの中の各頁を画像に変換してよい。例えば、プロセッサ２０４は、スクリーンキャプチャ又は文書－画像変換技術に基づき、ページを対応する画像に変換してよい。プロセッサ２０４は、予めトレーニングされた画像分類器を画像に適用することにより、リソースのリソースタイプを識別してよい。画像分類器は、抽出したリソース（又は変換した画像）を、対応する画像に関連付けられたページのレイアウトに基づき、研究論文タイプ、プレゼンテーションスライドタイプ、又はポスタータイプのような対応するリソースタイプに分類するよう、深層学習技術を用いて予めトレーニングされてよい。

ブロック４０６で、１つ以上の第１リソースタイプは、識別されたリソースタイプセットに基づき、複数の所定のリソースタイプから決定されてよい。実施形態では、プロセッサ２０４は、抽出した１つ以上の第１リソースから識別されたリソースタイプセットに基づき、複数の所定のリソースタイプから、１つ以上の第１リソースタイプを決定するよう構成されてよい。実施形態では、リソースタイプセットは、１つ以上の第１リソースタイプを除外してよい。例えば、所定の複数のリソースタイプは、限定ではないが、研究論文タイプ、ポスタータイプ、プレゼンテーションスライドタイプ、ビデオタイプ、又はプログラムコードタイプ、を含んでよい。リソースタイプセットが研究論文タイプ（つまり研究論文自体）、ポスタータイプ、及びプレゼンテーションスライドタイプを含む場合、決定される１つ以上の第１リソースタイプは、ビデオタイプ又はプログラムコードタイプを含んでよい。言い換えると、１つ以上の第１リソースタイプは、リソースタイプセットの中で欠損しているが、複数の所定のリソースタイプの中に存在してよい。言い換えると、プロセッサ２０４は、欠損しているリソースタイプ（つまり、１つ以上の第１リソースタイプ）を決定して、ステップ４０２で１つ以上の第１ウェブサイト１１２から抽出されなくてよい又は１つ以上の第１ウェブサイト１１２の中で入手可能ではないリソースタイプ（例えば、ビデオタイプ又はプログラムコードタイプ）を決定してよい。

ブロック４０８で、１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースは、研究論文に関連付けられた題名に基づき、１つ以上の第２ウェブサイト１１４から抽出されてよい。実施形態では、プロセッサ２０４は、（ステップ４０６で決定された）１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを、研究論文に関連付けられた題名に基づき、１つ以上の第２ウェブサイト１１４から抽出するよう更に構成されてよい。サーバ１０４は、１つ以上の第２ウェブサイト１１４をホスティングしてよい。１つ以上の第２ウェブサイトの例は、限定ではないが、１対所の検索エンジンウェブサイトを含んでよい。実施形態では、（ステップ４０２で抽出された）１つ以上の第１リソース及び（ステップ４０６で抽出された）１つ以上の第２リソースの各々は、例えばメディアコンテンツ、限定ではないが、プレゼンテーションスライド、ポスター、ビデオ、又はプログラムコードを含んでよい。例では、（ステップ４０６で決定された）１つ以上の第１リソースタイプがビデオタイプおよびプログラムコードタイプを含む場合、１つ以上の第２リソースは、ビデオ及びプログラムコード（つまり、ステップ４０２で１つ以上の第１ウェブサイト１１２から抽出された１つ以上の第１リソースの中で欠損しているリソース）を含んでよい。

例では、プロセッサ２０４は、研究論文の題名に基づき、ビデオコンテンツに関連付けられた検索エンジンで、ビデオリソースタイプのリソースを抽出し又は検索してよい。プログラムコードタイプのリソースの検索又は抽出のために、プロセッサ２０４は、検索エンジンで又は公開若しくはプライベートソースコードレポジトリを含むデータベースを検索してよい。例では、プレゼンテーションスライドタイプ又はポスタータイプとして決定された１つ以上の第１リソースタイプの場合、プロセッサ２０４は、一般的な検索エンジンで、研究論文の題名及び１つ以上の検索演算子（例えば、ＰＤＦ（Portable Document Format）ファイルについて「filetype:pdf」、又はプレゼンテーションスライドについて「filetype:ppt」のようなファイルタイプ制限）に基づき、プレゼンテーションスライド及びポスターを検索してよい。

ブロック４１０で、最終リソースセットは、研究論文の１つ以上の第１コンテンツフィールドと抽出した１つ以上の第１リソース及び１つ以上の第２リソースの１つ以上の第２コンテンツフィールドとの間の比較に基づき決定されてよい。実施形態では、プロセッサ２０４は、研究論文の１つ以上の第１コンテンツフィールドと、抽出した１つ以上の第１リソース及び抽出した（つまりステップ４０２及び４０８で抽出された）１つ以上の第２リソースの１つ以上の第２コンテンツフィールドと、の間の比較に基づき、最終リソースセットを決定するよう構成されてよい。例えば図５で、１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールドの抽出が、更に説明される。幾つかの実施形態では、最終リソースセットは、例えば図６に更に説明されるように、同じタイプの抽出された１つ以上の第１リソース及び抽出された１つ以上の第２リソースに基づき決定されてよい。最終リソースセットの決定は、例えば図７及び図８で更に説明される。

ブロック４１２で、ディスプレイスクリーンは、最終リソースセットと研究論文とを出力するよう制御されてよい。実施形態では、プロセッサ２０４は、決定した最終リソースセット及び研究論文を出力するよう、ディスプレイスクリーン（例えば、電子装置１０２のディスプレイスクリーン２１２）を制御するよう構成されてよい。幾つかの実施形態では、プロセッサ２０４は、ディスプレイスクリーン２１２に最終リソースセット及び研究論文を一緒に表示し得る統合ＵＩを出力してよい。最終リソースセット及び研究論文を表示し得る例示的な統合ＵＩは、例えば図９で説明される。制御は最後まで進んでよい。

フローチャート４００は、４０２、４０４、４０６、４０８、４１０、及び４１２のような個別の動作として図示された。しかしながら、特定の実施形態では、開示の実施形態の本質を損なうことなく、特定の実装に依存して、このような個別の動作は、追加動作に更に分けられ、より少数の動作に結合され、又は削除されてよい。

図５は、本開示で説明される少なくとも１つの実施形態により構成される、研究論文の１つ以上の第１コンテンツフィールド及び研究論文に関連付けられた１つ以上のリソースの各々の１つ以上の第２コンテンツフィールドの抽出のための例示的な方法のフローチャートを示す。図５は、図１、図２、図３Ａ、図３Ｂ、図３Ｃ及び図４の要素と関連して説明される。図５を参照すると、フローチャート５００が示される。フローチャート５００に示される方法は、５０２で開始してよく、任意の適切なシステム、機器、又は装置により、例えば図１又は図２の例示的な電子装置１０２により、実行されてよい。別個のブロックにより示したが、フローチャート５００のブロックのうちの１つ以上に関連するステップ及び動作は、特定の実装に依存して、追加ブロックに分けられ、少ないブロックに結合され、又は削除されてよい。

ブロック５０２で、１つ以上の第１メタフィールドが、研究論文から抽出されてよく、１つ以上の第２メタフィールドが、１つ以上の第１リソース及び１つ以上の第２リソースの各々から抽出されてよい。実施形態では、プロセッサ２０４は、研究論文から１つ以上の第１メタフィールドを、（図４のステップ４０２及び４０８で抽出された）１つ以上の第１リソース及び１つ以上の第２リソースのうちの少なくとも１つのリソースから１つ以上の第２メタフィールドを、抽出するよう構成されてよい。特定の実施形態では、少なくとも１つのリソースは、１つ以上の第１リソース及び１つ以上の第２リソースの各々を含んでよい。別の実施形態では、少なくとも１つのリソースは、１つ以上の第１リソース（又は単に第１ウェブサイト３００Ａから抽出された第１リソースセット）を含んでよい。

幾つかの実施形態では、プロセッサ２０４は、研究論文の題名に基づきデータベース１０６を検索して、研究論文に関連付けられたメタフィールドセットを決定するよう構成されてよい。例では、プロセッサ２０４は、研究論文の題名に基づきデータベース１０６の第１データベース（つまり、中央ドメイン固有のデータのためのデータベース）を検索して、研究論文に関連付けられたメタフィールドセットを決定してよい。第１データベースは、研究論文、及び第１ウェブサイト３００Ａから抽出されてよい第１リソースセットを含んでよい。第１ウェブサイト３００Ａは研究論文のより包括的なメタフィールドを含み得るので、プロセッサ２０４は、メタフィールドセットの中の全部の包括的なメタフィールドが、研究論文、１つ以上の第１リソース、及び／又は１つ以上の第２リソースから既に抽出さているかどうかをチェックしてよい。実施形態では、メタフィールドセットの中の全部のメタフィールドが、研究論文、１つ以上の第１リソース、及び／又は１つ以上の第２リソースについて抽出されていない場合、プロセッサ２０４は、ステップ５０２を実行して、１対所の第１メタフィールド及び１つ以上の第２メタフィールドを抽出してよい。

研究論文の１つ以上の第１メタフィールドの例は、限定ではないが、題名、著者、研究所、会議会場若しくは会誌、論文発表日、提出、又は会議、を含んでよい。実施形態では、プロセッサ２０４は、研究論文に関連付けられたコンテンツファイルのレイアウト分析に基づき、１つ以上の第１メタフィールドを決定してよい。例えば、プロセッサ２０４は、研究論文のＰＤＦファイルからの１つ以上の第１メタフィールドの抽出のために、ＰＤＦ抽出技術を用いてよい。別の例では、プロセッサ２０４は、研究論文のスキャンした文書からの１つ以上の第１メタフィールドの抽出のために、光学文字認識（Optical Character Recognition (OCR)）技術を用いてよい。

実施形態では、１つ以上の第１メタフィールドの抽出と同様に、プロセッサ２０４は、研究論文に関連付けられた抽出されたリソース（例えば、ビデオ、ポスター、プレゼンテーションスライド、又はプログラムコード）から、１つ以上の第２メタフィールドを抽出してよい。プロセッサ２０４は、ビデオの題名、説明、著者、及び投稿日時の抽出により、ビデオの１つ以上の第２メタフィールドを抽出するよう構成されてよい。プロセッサ２０４は、プログラムコードの著者名、説明、Ｒｅａｄｍｅテキスト、及びアップロードの日時の抽出により、プログラムコードの１つ以上の第２メタフィールドを抽出するよう構成されてよい。

ブロック５０４で、１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールドは、テキスト抽出に基づき抽出されてよい。実施形態では、プロセッサ２０４は、研究論文の１つ以上の第１コンテンツフィールド、並びに１つ以上の第１リソース及び１つ以上の第２リソースの各々の１つ以上の第２メタフィールドを、テキスト抽出に基づき抽出するよう構成されてよい。ここで、１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールドは、テキストコンテンツ（例えば、題名、著者名、又は全部の記述）を含み又はそれに対応してよい。例えば、プロセッサ２０４は、ＰＤＦテキスト抽出を使用して、１つ以上の第１コンテンツフィールドを研究論文のＰＤＦファイルから抽出し、１つ以上の第２コンテンツフィールドを少なくとも１つのリソース（つまり、１つ以上の第１リソース及び／又は１つ以上の第２リソース、又は単に第１ウェブサイト３００Ａから抽出された第１リソースセット）のＰＤＦファイルから抽出してよい。別の例では、プロセッサ２０４は、研究論文のスキャンされた文書から１つ以上の第１コンテンツフィールドを、及び少なくとも１つのリソースのスキャンされた文書から１つ以上の第２コンテンツフィールドを抽出するために、ＯＣＲ技術を使用してよい。

ブロック５０６で、１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールドは、オブジェクト検出に基づき抽出されてよい。実施形態では、プロセッサ２０４は、研究論文の１つ以上の第１コンテンツフィールド、及び少なくとも１つのリソース（つまり、１つ以上の第１リソース及び／又は１つ以上の第２リソース、又は単に第１ウェブサイト３００Ａから抽出された第１リソースセット）の１つ以上の第２コンテンツフィールドを、オブジェクト検出に基づき抽出するよう構成されてよい。ここで、１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールドは、研究論文及び抽出されたリソースに含まれる図又は表コンテンツを（１つ以上のオブジェクトとして）含んでよい（又はそれに対応してよい）。

例えば、プロセッサ２０４は、研究論文またはリソースの中の（図又は表を含む）各ページを画像に変換してよい。例では、プロセッサ２０４は、スクリーンキャプチャ又は文書－画像変換技術を使用して、ページを対応する画像に変換してよい。プロセッサ２０４は、ニューラルネットワーク（例えば、深層学習）を用いて、変換された画像にオブジェクト検出を実行して、研究論文及び抽出されたリソースから図又は表コンテンツを検出し抽出してよい。ニューラルネットワークの例は、限定ではないが、深層ニューラルネットワーク（deep neural network：ＤＮＮ）、畳み込みニューラルネットワーク（convolutional neural network (CNN)）、リカレントニューラルネットワーク（recurrent neural network：ＲＮＮ）、ＣＮＮリカレントニューラルネットワーク（CNN－recurrent neural network (CNN－RNN)）、Ｒ－ＣＮＮ、高速Ｒ－ＣＮＮ、人工ニューラルネットワーク（artificial neural network (ANN)）、ＹＯＬＯ（You Only Look Once）ネットワーク、ＬＳＴＭ（Long Short Term Memory (LSTM)）ネットワークに基づくＲＮＮ、ＣＮＮ＋ＡＮＮ、ＬＳＴＭ＋ＡＮＮ、制御されたリカレントユニット（gated recurrent unit (GRU)）に基づくＲＮＮ、完全結合（fully connected）ニューラルネットワーク、ＣＴＣ（Connectionist Temporal Classification (CTC)）に基づくＲＮＮ、深層ベイジアンニューラルネットワーク、敵対的生成ネットワーク（Generative Adversarial Network：ＧＡＮ）、及び／又はこのようなネットワークの組み合わせを含んでよい。幾つかの実施形態では、ニューラルネットワークに関連付けられた学習エンジンは、データフローグラフを用いる数値計算技術を含んでよい。特定の実施形態では、ニューラルネットワークは、複数の深層ニューラルネットワーク（Deep Neural Network (DNN)）のハイブリッドアーキテクチャに基づいてよい。例では、プロセッサ２０４は、Ｄｅｔｅｃｔｒｏｎに基づくニューラルネットワークを用いて図を検出し抽出してよい。更に、プロセッサ２０４は、限定ではないが、ＴａｂｌｅＢａｎｋのようなテーブルデータセットに対する転移学習（transfer learning）を使用して、研究論文及び抽出されたリソース（つまり、１つ以上の第１リソース及び１つ以上の第２リソース）から表を検出し抽出してよい。

ブロック５０８で、抽出された１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールドが格納されてよい。実施形態では、プロセッサ２０４は、研究論文の１つ以上の第１コンテンツフィールド、及び少なくとも１つのリソース（つまり、１つ以上の第１リソース及び／又は１つ以上の第２リソース、又は単に第１ウェブサイト３００Ａから抽出された第１リソースセット）の１つ以上の第２コンテンツフィールドを、データベース１０６に構造化フォーマットで格納するよう構成されてよい。例では、プロセッサ２０４は、研究論文の１つ以上の第１コンテンツフィールド、並びに１つ以上の第１リソースセットの１つ以上の第２コンテンツフィールドを、データベース１０６の第１データベースに格納してよい。更に、プロセッサ２０４は、第２リソースセットの１つ以上の第２コンテンツフィールドをデータベース１０６の第２データベースに、並びに第３リソースセットの１つ以上の第２コンテンツフィールドをデータベース１０６の第３データベースに格納してよい。（コンテンツフィールドの鍵－値ペア及び対応する値に対応し得る）構造化フォーマットの例は、限定ではないが、ＪＳＯＮ（Java Script Object Notation）フォーマット、ＳＭＬ（eXtensible Markup Language）フォーマット、又はＣＳＶ（Comma Separated Values）フォーマットを含んでよい。制御は最後まで進んでよい。

フローチャート５００は、５０２、５０４、５０６、及び５０８のような個別の動作として図示された。しかしながら、特定の実施形態では、開示の実施形態の本質を損なうことなく、特定の実装に依存して、このような個別の動作は、追加動作に更に分けられ、より少数の動作に結合され、又は削除されてよい。

図６は、本開示で説明される少なくとも１つの実施形態により構成される、１つ以上の第１リソース及び１つ以上の第２リソースからの同じリソースタイプに関連付けられた複数のリソースをマージする例示的な方法のフローチャートを示す。図６は、図１、図２、図３Ａ、図３Ｂ、図３Ｃ、図４及び図５の要素と関連して説明される。図６を参照すると、フローチャート６００が示される。フローチャート６００に示される方法は、６０２で開始してよく、任意の適切なシステム、機器、又は装置により、例えば図１又は図２の例示的な電子装置１０２により、実行されてよい。別個のブロックにより示したが、フローチャート６００のブロックのうちの１つ以上に関連するステップ及び動作は、特定の実装に依存して、追加ブロックに分けられ、少ないブロックに結合され、又は削除されてよい。

ブロック６０２で、同じリソースタイプに関連付けられた複数のリソースは、抽出された１対所の第１リソース及び１つ以上の第２リソースから決定されてよい。実施形態では、プロセッサ２０４は、１つ以上の第１リソース及び１つ以上の第２リソース（つまり、図４のステップ４０２及び４０８で抽出された）から、複数のリソース（つまり、同じリソースタイプに関連付けられたもの）を決定するよう構成されてよい。プロセッサ２０４は、図４のステップ４０４で説明されたリソースタイプセットの識別と同様に、１つ以上の第１リソース及び１つ以上の第２リソースの各々に関連付けられたリソースタイプを決定してよい。例えば、図３Ａの第１ウェブサイト３００Ａ、及び図３Ｂの第２ウェブサイト３００Ｂを参照すると、プロセッサ２０４は、題名「Poster－１」（例えば、３０４Ｃにより示されるリンクとして示される）を有する第１ポスター、及び題名「Poster－１」（例えば、３１６Ａにより示される、第１刊行物の関連リソースフィールド内のリンクとして示される）を有する第２ポスターが、同じリソースタイプ、つまりポスターリソースタイプであり得ることを決定してよい。抽出された１つ以上の第１リソース及び１つ以上の第２リソースの中の全部のリソースは、決定された複数のリソースの中で同じリソースタイプを有すると考えられてよい。

ブロック６０４で、決定された複数のリソースは、決定された複数のリソースの中のコンテンツの類似性に基づきマージされてよい。実施形態では、プロセッサ２０４は、決定された複数のリソースの中のコンテンツの類似性に基づき、決定された複数のリソースをマージするよう構成されてよい。実施形態では、複数のリソースは、同じＵＲＬを有してよい。別の実施形態では、複数のリソースは、異なるＵＲＬを有してよい。幾つかの実施形態では、高い類似性のコンテンツを有するリソースは、同じ題名又はコンテンツを有してよいが、異なるウェブサイト又はＵＲＬから抽出されてよい。プロセッサ２０４は、ファイル比較に基づき、決定された複数のリソースの中のコンテンツの類似性をチェックしてよい。ファイル比較技術の例は、限定ではないが、ビット毎の比較、ファイル又は画像圧縮に基づく比較、ＭＰ５に基づく比較を含んでよい。リソースの２つ以上のファイルの間のコンテンツの類似性のチェックに基づき、プロセッサ２０４は、２つ以上のファイルをマージし、ファイルのうちの１つを、リソースに関連付けられたファイルとして選択してよい。例では、プロセッサ２０４は、リソースのファイルをマージするために、正確に一致する場合に２つ以上のファイルのいずれかを選択してよい。別のシナリオでは、プロセッサ２０４は、リソースのファイルをマージするために、より大きなサイズ又は最新の作成日又は変更日のファイルを選択してよい。プロセッサ２０４は、同じタイプの及び／又は同様のコンテンツの（１つ以上の第１ウェブサイト１１２及び１つ以上の第２ウェブサイト１１４から抽出された）リソースをマージして、（図４のステップ４１０及び４１２で説明した）同じリソースが冗長して又は繰り返し最終リソースセットに含まれることを回避してよい。

ブロック６０６で、第１リソースセットは、マージされた複数のリソースに基づき決定されてよい。実施形態では、プロセッサ２０４は、マージされた複数のリソースに基づき、第１リソースセットを決定するよう構成されてよい。例えば、図３Ａ及び３Ｂを参照して、プロセッサ２０４は、第１ウェブサイト３００Ａの第１ポスター「Poster－１」及び第２ウェブサイト３００Ｂの第２ポスター「Poster－１」を、第１ポスター「Poster－１」のような単一のポスターとしてマージしてよい。このような場合には、プロセッサ２０４は、「Poster－１」及び「Presentation Slides－１」が図３Ａ及び３Ｂに示すように検索した研究論文の「Title－１」に対応するので、最終リソースセットを、第１ポスター「Poster－１」（図３Ａで３０４により示される）及び「Presentation Slides－１」（例えば、３１６Ａにより示されるように、第１刊行物の関連リソースフィールド内のリンクとして示される）として決定してよい。制御は最後まで進んでよい。

フローチャート６００は、６０２、６０４、及び６０６のような個別の動作として図示された。しかしながら、特定の実施形態では、開示の実施形態の本質を損なうことなく、特定の実装に依存して、このような個別の動作は、追加動作に更に分けられ、より少数の動作に結合され、又は削除されてよい。

図７は、本開示で説明される少なくとも１つの実施形態に従い構成される、研究論文に関連付けられた最終リソースセットの決定のための例示的な方法のフローチャートを示す。図７は、図１、図２、図３Ａ、図３Ｂ、図３Ｃ、図４、図５及び図６の要素と関連して説明される。図７を参照すると、フローチャート７００が示される。フローチャート７００に示される方法は、７０２で開始してよく、任意の適切なシステム、機器、又は装置により、例えば図１又は図２の例示的な電子装置１０２により、実行されてよい。別個のブロックにより示したが、フローチャート７００のブロックのうちの１つ以上に関連するステップ及び動作は、特定の実装に依存して、追加ブロックに分けられ、少ないブロックに結合され、又は削除されてよい。

ブロック７０２で、候補リソースセット及び研究論文が格納されてよい。実施形態では、プロセッサ２０４は、データベース１０６、メモリ２０６、又は永久データ記憶装置２０８に、候補リソースセット及び研究論文の各々を格納するよう構成されてよい。候補リソースセット及び研究論文の各々は、１つ以上のコンテンツフィールド（例えば、図５で説明された１つ以上の第１コンテンツフィールド及び１つ以上の第２コンテンツフィールド）を含んでよい。ここで、候補リソースセットは、メディアコンテンツ、例えば、限定ではないが、研究論文に関連付けられた又は関連する（つまり、ユーザ１１６のような研究者にとって関心のある可能性がある）ビデオ、ポスター、プレゼンテーションスライド、又はプログラムコードを含んでよい。実施形態では、候補リソースセット及び研究論文は、図４で説明された１つ以上の第１ウェブサイト１１２又は１つ以上の第２ウェブサイト１１４のうちの少なくとも１つから抽出されてよい。

ブロック７０４で、研究論文は、１つ以上の第１コンテンツフィールドへとパース（parsed）されてよい。実施形態では、プロセッサ２０４は、研究論文の１つ以上の第１コンテンツフィールドへと研究論文をパースするよう構成されてよい。実施形態では、プロセッサ２０４は、例えば図４及び５で説明したように、ページの文書レイアウト分析、文書またはコンテンツファイル、テキスト抽出、文書から画像への変換、又はオブジェクト検出、のうちの少なくとも１つに基づき、研究論文を１つ以上の第１コンテンツフィールドへとパースしてよい。

ブロック７０６で、研究論文の中の１つ以上の第１コンテンツフィールドの各々は、第１ベクトルへと符号化されてよい。実施形態では、プロセッサ２０４は、研究論文の中のパースされた（又は抽出された）１つ以上の第１コンテンツフィールドの各々を、研究論文の１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、第１ベクトルに符号化するよう構成されてよい。第１フィールドタイプは、限定ではないが、テキストフィールドタイプ、カテゴリフィールドタイプ、日時フィールドタイプ、図フィールドタイプ、又は表フィールドタイプ、のうちの１つを含んでよい。実施形態では、プロセッサ２０４は、予めトレーニングされたコンテキスト埋め込み又はテキストフィールドタイプの予めトレーニングされた埋め込みのバッグ（bag）、カテゴリフィールドタイプのカテゴリ符号化、又は日時フィールドタイプの数値符号化、又は図フィールドタイプの若しくは表フィールドタイプの予めトレーニングされた符号化、のうちの少なくとも１つに基づき、１つ以上の第１コンテンツフィールドを符号化してよい。実施形態では、プロセッサ２０４は、コンテンツフィールドをベクトルに符号化して、コンテンツフィールドの長さを圧縮された長さに短縮してよい。その結果、同じ長さ及びタイプの２つの対応するコンテンツフィールドのベクトルが、対応するコンテンツフィールドを比較するために比較され得る。

例えば、プロセッサ２０４は、限定ではないがＢＥＲＴ（Bidirectional Encoder Representations from Transformer）のような短いテキストの予めトレーニングされたコンテキスト埋め込みに基づき、研究論文の題名及び要約の両方（つまり、テキストフィールドタイプの第１コンテンツフィールド）を、ベクトル（例えば、第１ベクトル）に符号化してよい。更に、プロセッサ２０４は、限定ではないがｗｏｒｄ２ｖｅｃ又はｆａｓｔｔｅｘｔのような長いテキストの予めトレーニングされた埋め込みのバッグに基づき、研究論文の全文をベクトル（例えば第１ベクトル）に符号化してよい。例では、プロセッサ２０４は、カテゴリ符号化に基づき、研究論文の著者名（つまり、カテゴリフィールドタイプの第１コンテンツフィールド）をベクトル（例えば、第１ベクトル）に符号化してよい。その結果、各々の著者名及び／又は著者に関連付けられた各々の研究機関又は組織は、別個のカテゴリとして表現されてよい。更に、プロセッサ２０４は、数値符号化に基づき、研究論文の発行日（つまり、日時フィールドタイプの第１コンテンツフィールド）をベクトル（例えば、第１ベクトル）に符号化してよい。例えば、プロセッサ２０４は、所定の日時（例えば、１９７０年１月１日１２：００ＡＭ）と発行日の１２：００ＡＭ（又は実際の発行した時間）との間のミリ秒数の数値差を表してよい数値として、発行日を表現してよい。更に、プロセッサ２０４は、限定ではないがＲｅｓＮｅｔ（Residual Networks）の予めトレーニングされたモデルまたはＧｏｏｇＬｅＮｅｔの予めトレーニングされたモデルのような予めトレーニングされた符号化に基づき、研究論文の中の図又は表（つまり、図フィールドタイプ又は表フィールドタイプの第１コンテンツフィールド）を、ベクトル（例えば、第１ベクトル）に符号化してよい。

ブロック７０８で、格納された候補リソースセットの各々は、１つ以上の第２コンテンツフィールドへとパースされてよい。実施形態では、プロセッサ２０４は、格納された候補リソースセットの各々を１つ以上の第２コンテンツフィールドへとパースするよう構成されてよい。幾つかの実施形態では、（ステップ７０４で説明した）研究論文のパースと同様に、プロセッサ２０４は、（候補リソースセットとして）ポスター及びプレゼンテーションスライドのパースを実行して、１つ以上の第２コンテンツフィールド（例えば、題名、著者名、全文、発行日、図又は表）を抽出してよい。特定の実施形態では、プロセッサ２０４は、題名、説明、著者、及びビデオ投稿の日時の抽出により、ビデオの１つ以上の第２コンテンツフィールドを抽出してよい。プロセッサ２０４は、ビデオから特徴的な画像フレームを抽出し、深層学習又は他のニューラルネットワークモデルに基づき、オブジェクト検出により、各画像フレームの中の図及び表を検出するよう更に構成されてよい。プロセッサ２０４は、著者名、説明、Ｒｅａｄｍｅテキスト、及びプログラムコードアップロードの日時の抽出により、プログラムコードの１つ以上の第２コンテンツフィールドを抽出するよう構成されてよい。１つ以上の第２コンテンツフィールドのパースも、例えば図４及び５で説明された。

ブロック７１０で、パースされた候補リソースセットの各々の中の１つ以上の第２コンテンツフィールドの各々は、第２ベクトルへと符号化されてよい。実施形態では、プロセッサ２０４は、（パースされた候補リソースセットの各々の中の）抽出された１つ以上の第２コンテンツフィールドの各々を、１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するよう構成されてよい。第１フィールドタイプと同様に、第２フィールドタイプは、テキストフィールドタイプ、カテゴリフィールドタイプ、日時フィールドタイプ、図フィールドタイプ、又は表フィールドタイプ、のうちの少なくとも１つを含んでよい。実施形態では、１つ以上の第１コンテンツフィールドの符号化と同様に、プロセッサ２０４は、第２コンテンツフィールドの予めトレーニングされたコンテキスト埋め込み又はテキストフィールドタイプの予めトレーニングされた埋め込みのバッグ（bag）、第２コンテンツフィールドのカテゴリフィールドタイプのカテゴリ符号化、第２コンテンツフィールドの日時フィールドタイプの数値符号化、又は第２コンテンツフィールドの図フィールドタイプの若しくは表フィールドタイプの予めトレーニングされた符号化、のうちの少なくとも１つに基づき、１つ以上の第２コンテンツフィールドを符号化してよい。１つ以上の第２コンテンツフィールドの符号化は、ステップ７０６で説明したような、候補リソースセットの中の各コンテンツフィールドの対応するフィールドタイプに基づく１つ以上の第１コンテンツフィールドの符号化と同様であってよい。

ブロック７１２で、符号化された１つ以上の第１コンテンツフィールドは、第１ベクトルと第２ベクトルとの間の比較に基づき、符号化された１つ以上の第２コンテンツフィールドと比較されてよい。実施形態では、プロセッサ２０４は、研究論文の対応する第１コンテンツフィールドの第１ベクトルと候補リソースセットの対応する第２コンテンツフィールドの第２ベクトルとの間の比較に基づき、符号化された１つ以上の第１コンテンツフィールドを１つ以上の第２コンテンツフィールドと比較するよう構成されてよい。実施形態では、第１ベクトル（研究論文の第１コンテンツフィールドに関連する）は、テキストフィールドタイプ（例えば、題名、要約、及び全文）のコンテンツフィールドに関連付けられた第１テキスト特徴セット、及びカテゴリフィールドタイプ（例えば、著者）のコンテンツフィールドに関連付けられた第１カテゴリ特徴セットを含んでよい。第１ベクトルは、日時フィールドタイプ（例えば、発行日）のコンテンツフィールドに関連付けられた第１数値特徴セット、及び図フィールドタイプ（例えば、図）又は表フィールドタイプ（例えば、表）のコンテンツフィールドに関連付けられた第１シャムニューラルネットワーク特徴セットを更に含んでよい。同様に、第２ベクトル（候補リソースセットの第２コンテンツフィールドに関連する）は、テキストフィールドタイプのコンテンツフィールドに関連付けられた第２テキスト特徴セット、及びカテゴリフィールドタイプのコンテンツフィールドに関連付けられた第２カテゴリ特徴セットを含んでよい。第２ベクトルは、日時フィールドタイプのコンテンツフィールドに関連付けられた第２数値特徴セット、及び図又は表フィールドタイプのコンテンツフィールドに関連付けられた第２シャムニューラルネットワーク特徴セットを更に含んでよい。

プロセッサ２０４は、対応する特徴セットの比較に基づき、（符号化された１つ以上の第１コンテンツフィールドの各々の）第１ベクトルを、（符号化された１つ以上の第２コンテンツフィールドの各々の）第２ベクトルと比較するよう構成されてよい。例えば、プロセッサ２０４は、第１テキスト特徴セットを第２テキスト特徴セットと、及び第１カテゴリ特徴セットを第２カテゴリ特徴セットと、比較してよい。更に、プロセッサ２０４は、第１数値特徴セットを第２数値特徴セットと、及び第１シャムニューラルネットワーク特徴セットを第２シャムニューラルネットワーク特徴セットと、比較してよい。第１ベクトルの第２ベクトルとの比較は、例えば図８において更に説明される。

ブロック７１４で、最終リソースセットは、研究論文の符号化された１つ以上の第１コンテンツフィールドの各々の第１ベクトルと、候補リソースセットの符号化された１つ以上の第２コンテンツフィールドの各々の対応する第２ベクトルと、の間の比較に基づき、決定されてよい。実施形態では、プロセッサ２０４は、第１ベクトルと第２ベクトルとの間の比較に基づき、最終リソースセットを決定するよう構成されてよい。最終リソースセットの決定は、例えば図８で更に説明される。

ブロック７１６で、ディスプレイスクリーンは、決定された最終リソースセットと研究論文とを出力するよう制御されてよい。実施形態では、プロセッサ２０４は、決定した最終リソースセット及び研究論文を出力するよう、ディスプレイスクリーン（例えば、電子装置１０２のディスプレイスクリーン２１２）を制御するよう構成されてよい。幾つかの実施形態では、プロセッサ２０４は、ディスプレイスクリーン２１２に最終リソースセット及び研究論文を一緒に表示し得る統合ＵＩを（例えば、マルチモーダル出力として）出力してよい。最終リソースセット及び研究論文を表示し得る例示的な統合ＵＩは、例えば図９において更に説明される。制御は最後まで進んでよい。

フローチャート７００は、７０２、７０４、７０６、７０８、７１０、７１２、７１４、及び７１６のような個別の動作として図示された。しかしながら、特定の実施形態では、開示の実施形態の本質を損なうことなく、特定の実装に依存して、このような個別の動作は、追加動作に更に分けられ、より少数の動作に結合され、又は削除されてよい。

図８は、本開示で説明される少なくとも１つの実施形態に従い構成される、研究論文に関連付けられた最終リソースセットの決定のための例示的な方法のフローチャートを示す。図８は、図１、図２、図３Ａ、図３Ｂ、図３Ｃ、図４、図５、図６及び図７の要素と関連して説明される。図８を参照すると、フローチャート８００が示される。フローチャート８００に示される方法は、８０２で開始してよく、任意の適切なシステム、機器、又は装置により、例えば図１又は図２の例示的な電子装置１０２により、実行されてよい。別個のブロックにより示したが、フローチャート８００のブロックのうちの１つ以上に関連するステップ及び動作は、特定の実装に依存して、追加ブロックに分けられ、少ないブロックに結合され、又は削除されてよい。

ブロック８０２で、第１ベクトルに関連付けられた第１テキスト特徴セットと第２ベクトルに関連付けられた第２テキスト特徴セットとの間のコサイン距離が計算されてよい。実施形態では、プロセッサ２０４は、例えば図７のステップ７１２で説明した比較のために、第１ベクトルに関連付けられた第１テキスト特徴セットと第２ベクトルに関連付けられた第２テキスト特徴セットとの間のコサイン距離を計算するよう構成されてよい。コサイン距離は、次式（１）により表現されてよい。

例えば、第１ベクトルに関連付けられた第１テキスト特徴セット（例えば、特徴セットベクトル「Ａ」）と第２ベクトルに関連付けられた第２テキスト特徴セット（例えば、特徴セットベクトル「Ｂ」）との間コサイン距離の値は、「０」と「１」との間にあってよい。実施形態では、コサイン距離の値が「１」に近いほど、又は特徴セットベクトル「Ａ」と特徴セットベクトル「Ｂ」との間のコサイン差角が小さいほど（つまり、０°に近い角度差）、第１テキスト特徴セットと第２テキスト特徴セットとの間の類似性が大きいことを示してよい。例では、プロセッサ２０４は、ステップ８０２で説明したコサイン距離の計算に基づき、研究論文の題名と候補リソースセットの各々の題名との間の類似性を決定してよい。

ブロック８０４で、第１ベクトルに関連付けられた第１カテゴリ特徴セットと第２ベクトルに関連付けられた第２カテゴリ特徴セットとの間の重なり合いが計算されてよい。実施形態では、プロセッサ２０４は、例えば図７のステップ７１２で説明した比較のために、第１ベクトルに関連付けられた第１カテゴリ特徴セットと第２ベクトルに関連付けられた第２カテゴリ特徴セットとの間の重なり合いを計算するよう構成されてよい。例えば、著（カテゴリフィールドタイプを有する）者のコンテンツフィールドについて、プロセッサ２０４は、研究論文の各々の個々の著者名を、候補リソースセットの著者名と比較して、共通の著者の人数を決定してよい。プロセッサ２０４は、研究論文に共通する少なくとも１人の著者と候補リソースセットとの一致に基づき、重なり合いを計算してよい。２人の著者が研究論文と候補リソースセットとの間で共通である場合、プロセッサ２０４は、重なり合いを２として計算してよい、等である。

ブロック８０６で、第１ベクトルに関連付けられた第１数値特徴セットと第２ベクトルに関連付けられた第２数値特徴セットとの間の正規化日時差が計算されてよい。実施形態では、プロセッサ２０４は、例えば図７のステップ７１２で説明した比較のために、第１ベクトルに関連付けられた第１数値特徴セットと第２ベクトルに関連付けられた第２数値特徴セットとの間の正規化日時差を計算するよう構成されてよい。実施形態では、プロセッサ２０４は、第１数値特徴セットおよび第２テキスト特徴セットの各々に関連付けられた日時の数値を正規化するよう構成されてよい。例えば、第１数値特徴セット及び第２数値特徴セットは、それぞれ、第１日時（つまり、研究論文の中の第１コンテンツフィールド）及び第２日時（つまり、候補リソースセットの第２コンテンツフィールド）の数値表現であってよい。第１日時及び第２日時の数値表現は、所定の日時（例えば、１９７０年１月１日１２：００ＡＭ）と対応する日時との間のミリ秒数の数値差であってよい。プロセッサ２０４は、第１日時及び第２日時の各々の数値表現の所定の数値による除算に基づき、第１日時及び第２日時の数値表現を正規化してよい。プロセッサ２０４は、正規化された第１日時と第２日時との間の差分を実行して、第１ベクトルに関連付けられた第１数値特徴セットと第２ベクトルに関連付けられた第２数値特徴セットとの間の正規化日時差を計算してよい。

ブロック８０８で、第１ベクトルに関連付けられた第１シャムニューラルネットワーク特徴セットと第２ベクトルに関連付けられた第２シャムニューラルネットワーク特徴セットとの間の図又は表の類似性スコアが計算されてよい。実施形態では、プロセッサ２０４は、例えば図７のステップ７１２で説明した比較のために、第１ベクトルに関連付けられた第１シャムニューラルネットワーク特徴セットと第２ベクトルに関連付けられた第２シャムニューラルネットワーク特徴セットとの間の図又は表の類似性スコアを計算するよう構成されてよい。実施形態では、プロセッサ２０４は、第１シャムニューラルネットワーク特徴セット及び第２シャムニューラルネットワーク特徴セットに対する複数のニューラルネットワークモデル（例えば、深層学習）の適用に基づき、パターンマッチングを実行してよい。パターンマッチングに基づき、プロセッサ２０４は、研究論文の中の図又は表と候補リソースセットの中の対応するリソースとの間の類似性の指標として、類似性スコア（例えば、０と１の間の実数）を決定してよい。

ブロック８１０で、第１ベクトルに関連付けられた第１の複数の特徴、及び第２ベクトルに関連付けられた第２の複数の特徴は、連結特徴セットを生成するために、連結されてよい。実施形態では、プロセッサ２０４は、第１ベクトルに関連付けられた第１の複数の特徴、及び第２ベクトルに関連付けられた第２の複数の特徴を連結して、連結特徴セットを生成するよう構成されてよい。ここで、第１の複数の特徴及び第２の複数の特徴の各々は、テキスト特徴セット、カテゴリ特徴セット、数値特徴セット、又はシャムニューラルネットワーク特徴セットのうちの少なくとも１つを含んでよい。例えば、連結特徴セットは、第１テキスト特徴セット、第２テキスト特徴セット、第１カテゴリ特徴セット、第２カテゴリ特徴セット、第１数値特徴セット、第２数値特徴セット、第１シャムニューラルネットワーク特徴セット、第２シャムニューラルネットワーク特徴セットを含んでよい。実施形態では、連結特徴セットは、（ステップ８０２で）計算されたコサイン距離の値、（ステップ８０４で）計算された重なり合い、（ステップ８０６で）計算された正規化日時差、及び（ステップ８０８で）計算された類似性スコアも含んでよい。

ブロック８１２で、連結特徴セットが機械学習のために十分かどうかが決定されてよい。実施形態では、プロセッサ２０４は、連結特徴セットが機械学習モデルをトレーニングするのに十分かどうかを決定するよう構成されてよい。例では、プロセッサ２０４は、連結特徴セットが生成されるデータベース１０６の中の研究論文の数を決定してよい。決定された研究論文の数が所定の閾値より大きい場合、プロセッサ２０４は、連結特徴セットが機械学習のために十分であり得ると決定してよい。このような場合には、制御はステップ８１４へ進んでよい。その他の場合には、制御はステップ８１６へ進んでよい。

ブロック８１４で、複数の研究論文に関連付けられた複数のリソースを含むトレーニングデータに基づき、機械学習モデルが生成されてよい。実施形態では、プロセッサ２０４は、複数の研究論文に関連付けられた複数のリソースを含むトレーニングデータに基づき、機械学習モデルを生成するよう構成されてよい。複数の研究論文は研究論文を含んでよく、複数のリソースは最終リソースセットを含んでよい。例えば、トレーニングデータは、研究論文のデータセットの中の対応する研究論文との所定の関連を有するリソースのデータセットを含んでよい。プロセッサ２０４は、１対所の第１ウェブサイト１１２又は１つ以上の第２ウェブサイト１１４のうちの少なくとも１つから、トレーニングデータを抽出するよう構成されてよい。

機械学習モデルの例は、（研究論文及びリソースを含む）入力と（研究論文とリソースとの間の一致または不一致のような）出力ラベルとの間の関係を識別するためのトレーニングに基づき生成されてよい回帰モデル又は分類器であってよい。機械学習モデルは、そのハイパーパラメータ、例えば、重みの数値、コスト関数、入力サイズ、層の数、等により定義されてよい。機械学習モデルのコスト関数のグローバル最小値に向かって行くように、機械学習モデルのハイパーパラメータは調整されてよく、重みは更新されてよい。トレーニングデータの中の特徴情報に関するトレーニングの幾つかのエポック（epoch）の後に、機械学習モデルは、入力セット（例えば、研究論文及びリソース）について、予測／分類結果（例えば、一致又は不一致出力）を出力するようトレーニングされてよい。機械学習モデルの予測結果は、入力セットの各入力（例えば、研究論文及びリソースの新しい／未知のインスタンスから抽出される入力特徴）について、クラスラベル（例えば、一致又は不一致出力）を示してよい。

８１６で、連結特徴セットに基づき、ルールに基づくモデルが生成されてよい。実施形態では、プロセッサ２０４は、連結特徴セットに基づき、ルールに基づくモデルを生成するよう構成されてよい。例では、プロセッサ２０４は、テキスト特徴の計算されたコサイン距離が「０．５」より大きい、カテゴリ特徴の計算された重なり合いが「２．０」より大きい、計算された正規化日時差が「０．１」より小さい、及び計算された類似性スコアが「０．３」より大きいとき、リソースが研究論文に一致することを示してよいルールに基づくモデルを生成してよい。

８１８で、予めトレーニングされたモデル（例えば、機械学習モデル）又はルールに基づくモデルのうちの少なくともは、第１候補リソースが研究論文に一致するかどうかを決定するために、候補リソースセットからの１候補リソースに適用されてよい。プロセッサ２０４は、予めトレーニングされたモデル（例えば、機械学習モデル）又はルールに基づくモデルのうちの少なくとも１つを、候補リソースセットからの第１候補リソースに適用するよう構成されてよい。予めトレーニングされたモデル又はルールに基づくモデルのうちの１つの、第１候補リソースへの適用に基づき、プロセッサ２０４は、第１候補リソースが研究論文に一致するか否かを決定してよい。

ブロック８２０で、第１候補リソースが研究論文に一致するという決定に基づき、第１候補リソースを含む最終リソースセットが、決定されてよい。実施形態では、プロセッサ２０４は、第１候補リソースが研究論文に一致するという決定に基づき、最終リソースセットが第１候補リソースを含み得ることを決定してよい。第１候補リソースが研究論文に一致する場合、プロセッサ２０４は、第１候補リソースを最終リソースセットに追加してよい。プロセッサ２０４は、それにより、研究論文に一致し得る最終リソースセットを決定してよい。従って、開示の電子装置１０２のプロセッサ２０４は、ユーザ１１６（例えば、研究者）にとって関心のある研究論文について、マルチモーダルオンラインリソース（つまり、異なるリソースタイプのプレゼンテーションスライド、ビデオ、ポスター、又はプログラムコード）を自動的に抽出し照合してよい。プロセッサ２０４は、このような抽出し一致したマルチモーダルオンラインリソースを集約し、例えば図９で更に説明されるように、統合ＵＩの中で研究論文と共にオンラインリソースを表示してよい。

フローチャート８００は、８０２、８０４、８０６、８０８、８１０、８１２、８１４、８１６、８１８、及び８２０のような個別の動作として図示された。しかしながら、特定の実施形態では、開示の実施形態の本質を損なうことなく、特定の実装に依存して、このような個別の動作は、追加動作に更に分けられ、より少数の動作に結合され、又は削除されてよい。

図９は、本開示で説明される少なくとも１つの実施形態に従い構成される、研究論文と共に最終リソースセットを表示し得る例示的なユーザインタフェース（ＵＩ）を示す。図９は、図１、図２、図３Ａ、図３Ｂ、図３Ｃ、図４、図５、図６、図７及び図８の要素と関連して説明される。図９を参照すると、統合ＵＩ９００が示される。統合ＵＩ９００は、第１研究論文９０２、第１ポスター９０４、第１プログラムコード９０６、第１ビデオ９０８、及び第１プレゼンテーションスライド９１０を含んでよい。

例えば、図９に示すように、第１研究論文９０２は、題名（例えば「Title－１」）、著者名（例えば「FirstNameA LastNameA, FirstNameB LastNameB, FirstNameC LastNameC, and FirstNameD LastNameD」）、所属情報（例えば、「FirstNameA LastNameA and FirstNameB LastNameB」に関連付けられた「ABC University US」、及び「FirstNameC LastNameC and FirstNameD LastNameD」に関連付けられた「XYZ Inc. US」）、会議ボリューム情報（例えば、「Conference C－１, Vol. １」）、及び発行日（例えば「April ２０２０」）を含んでよい。第１研究論文９０２は、要約（例えば「Abstract Text－１」）及び全文（例えば「Full Text－１」）を更に含んでよい。実施形態では、統合ＵＩ９００は、第１研究論文９０２をダウンロードするための又は第１研究論文９０２を別のユーザインタフェースで開くためのハイパーリンクを提供してよい。

図９は、第１研究論文９０２に関連するインフォグラフィックを含み得る第１ポスター９０４（例えば、「Poster－１」）を更に示す。例では、図９に示すように、インフォグラフィックは、研究の目的（objective）を含む第１セクション、研究に関連する先行研究（prior work）を含む第２セクション、研究に関連するアルゴリズム（algorithm）の概要（例えば、処理－出力のグラフ）を含む第３セクション、及び研究の成果（results）を含む第４セクションを含んでよい。統合ＵＩ９００は、第１ポスター９０４をダウンロードするためのリンクを提供してよい。

図９には、特定のプログラミング言語（例えば、Ｃ、Ｃ＋＋、Ｊａｖａ、Ｃ＃．ＮＥＴ、Ｐｙｔｈｏｎ、又はアセンブリ言語）で記述された、代表的アルゴリズムを示し得る第１プログラムコード９０６（例えば、「Code－１」）、又は第１研究論文９０２に関連するソースコードが更に示される。実施形態では、統合ＵＩ９００は、第１プログラムコード９０６をリアルタイムにデバッグして及び／又は実行してユーザ１１６に出力を提供するための、統合された又は埋め込まれたデバッガ又は実行環境（例えば、Java Virtual Machine）を含んでよい。統合ＵＩ９００は、第１プログラムコード９０６をリアルタイム編集し第１プログラムコード９０６を別の統合開発環境（Integrated Development Environment (IDE)）にエクスポートするためのインタフェースを、ユーザ１１６に更に提供してよい。実施形態では、統合ＵＩ９００は、第１プログラムコード９０６をホスティングし得るソースコードレポジトリへのリンクを含んでよい。別の実施形態では、統合ＵＩ９００は、第１プログラムコード９０６に関連付けられたソースコードレポジトリのウェブページを埋め込んでよい。

図９には、第１研究論文９０２に関連付けられたマルチメディア（例えば、オーディオ／ビデオ）コンテンツを示してよい第１ビデオ９０８（例えば、「Video－１」）が更に示される。統合ＵＩ９００は、ユーザ１１６からのユーザ入力に基づき第１ビデオ９０８を再生するためのビデオプレイヤを含んでよい。第１ビデオ９０８は、第１研究論文９０２のコンテンツを提示してよく、及び／又は研究論文に関する概念を説明する解説（クローズドキャプションの文字を含む）を含んでよい。統合ＵＩ９００は、第１ビデオ９０８をダウンロードするためのリンクを提供してよい。

図９には、第１研究論文９０２に関連付けられたマルチメディアコンテンツ（例えば、グラフィック、アニメーション、ナレータの声、解説、及び／又はテキスト）を示し得る第１プレゼンテーションスライド９１０（例えば「Presentation Slides－１」）が更に示される。統合ＵＩ９００は、ユーザ１１６に第１プレゼンテーションスライド９１０を提示するためのスライドプレイヤを含んでよい。統合ＵＩ９００は、第１プレゼンテーションスライド９１０をダウンロードするためのリンクを提供してよい。

留意すべきことに、図９に示される統合ＵＩ９００、第１研究論文９０２、第１ポスター９０４、第１プログラムコード９０６、第１ビデオ９０８、及び第１プレゼンテーションスライド９１０は、単なる例として提示されるのであり、本開示の範囲を限定すると考えられるべきではない。

標準的に、研究者は、関心分野の複数の研究論文の研究により、関心分野の従来技術を理解し得る。しかしながら、全てのこのような研究論文を分析するのは退屈な場合がある。従って、研究者は、各研究論文に関連付けられたオンラインリソースを検索して、研究論文又は関連分野の概要を得ることがある。研究者は、インターネットに渡り散乱している可能性のある複数のウェブサイト又は検索エンジンから研究論文に関連する各オンラインリソースを手動で検索し抽出する必要がある。更に、研究者は、各オンラインリソースから利用可能なコンテンツを研究論文と手動で比較して、オンラインリソースと研究論文との間の相関を確立し、更に抽出したオンラインリソースが対象の特定の研究論文に実際に対応するか否かを決定する必要がある。明らかに、研究論文に関連付けられたオンラインリソースを抽出する手動処理は、時間がかかり、膨大な数の研究論文には良好に調整されない場合がある。従って、オンラインリソースの手動抽出及び検証の従来のソリューションと比べて、開示の電子装置１０２は、研究論文に関連し得るメディアコンテンツ（ポスター、ビデオ、スライド、又はコード）を含むマルチモーダルオンラインリソースの自動抽出を提供でき、抽出したオンラインリソースが研究論文に対応する（又は一致する）ことの自動検証を更に提供できる。更に、開示の電子装置１０２は、マルチモーダルオンラインリソースに関連付けられた研究論文と一緒に、マルチモーダルオンラインリソース（例えば、ポスター、ビデオ、プレゼンテーションスライド、及びプログラムコード）の統合された又はユーザフレンドリな表示のために、統合ＵＩ９００（例えば、図９の統合ＵＩ９００）を提供してよい。このような統合ＵＩ９００は、例えば図９に示され、（ターゲット研究論文に一致する）オンラインリソースを研究論文と一緒に研究し統合ＵＩ上に表示されたオンラインリソースを効率的に体系づけるために、ダッシュボードに基づくインタフェースを研究者（つまり、ユーザ１１６）に提供してよい。開示の電子装置１０２により提供される自動抽出、検証、及び統合ＵＩは、ユーザ１１６（つまり、研究者又は任意の知識労働者）がこのようなリソースを検索し照合するための相当な時間を節約しながら、研究論文及び研究論文に関連付けられた関心分野のより良好な向上された理解を更に提供できる。

本開示の種々の実施形態は、実行されることに応答してシステム（例えば、例示的な電子装置１０２）に動作を実行させる命令を格納するよう構成される１つ以上の非一時的コンピュータ可読記憶媒体を提供してよい。動作は、１つ以上の第１ウェブサイトから、研究論文に関連付けられた題名に基づき、１つ以上の第１リソースを抽出するステップを含んでよい。動作は、抽出した１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するステップを更に含んでよい。動作は、識別したリソースタイプセットに基づき、所定の複数のリソースタイプから、１つ以上の第１リソースタイプを決定するステップを更に含んでよい。リソースタイプセットは、決定した１つ以上の第１リソースタイプを除外してよい。動作は、研究論文に関連付けられた題名に基づき、１つ以上の第２ウェブサイトから、決定した１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを抽出するステップを更に含んでよい。１つ以上の第１リソース及び１つ以上の第２リソースの各々は、メディアコンテンツを含む。動作は、研究論文の１つ以上の第１コンテンツフィールドと抽出した１つ以上の第１リソース及び抽出した１つ以上の第２リソースの１つ以上の第２コンテンツフィールドとの間の比較に基づき、最終リソースセットを決定するステップを更に含んでよい。動作は、決定した最終リソースセットと研究論文とを出力するようディスプレイスクリーンを制御するステップを更に含んでよい。

本開示の種々の他の実施形態は、実行されることに応答してシステム（例えば、例示的な電子装置１０２）に動作を実行させる命令を格納するよう構成される１つ以上の非一時的コンピュータ可読記憶媒体を提供してよい。動作は、候補リソースセット及び研究論文を格納するステップであって、候補リソースセット及び研究論文の各々は１つ以上のコンテンツフィールドを含む、ステップを含んでよい。候補リソースセットは、メディアコンテンツを含んでよく、候補リソースセットは研究論文に関連付けられてよい。動作は、研究論文の中の１つ以上の第１コンテンツフィールドの各々を、１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、第１ベクトルに符号化するステップを更に含んでよい。動作は、格納した候補リソースセットの各々を１つ以上の第２コンテンツフィールドへとパースするステップを更に含んでよい。動作は、パースした候補リソースセットの各々の中の１つ以上の第２コンテンツフィールドの各々を、１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するステップを更に含んでよい。動作は、符号化された１つ以上の第１コンテンツフィールドの各々の第１ベクトルを、符号化された１つ以上の第２コンテンツフィールドの各々の第２ベクトルと比較するステップを更に含んでよい。動作は、比較に基づき、最終リソースセットを決定するステップを更に含んでよい。動作は、決定した最終リソースセットと研究論文とを出力するようディスプレイスクリーンを制御するステップを更に含んでよい。

本開示で使用されるとき、用語「モジュール」又は「コンポーネント」は、モジュール又はコンポーネントの動作を実行するよう構成される特定ハードウェア実装、及び／又は、コンピューティングシステムの汎用ハードウェア（例えば、コンピュータ可読媒体、処理装置、等）により格納され及び／又は実行され得るソフトウェアオブジェクト又はソフトウェアルーチンを表してよい。幾つかの実施形態では、本開示に記載されたものと異なるコンポーネント、モジュール、エンジン、及びサービスが、コンピューティングシステム上で実行するオブジェクト又はプロセス（例えば、別個のスレッド）として実装されてよい。本開示に記載されたシステム及び方法のうちの一部は、概して（汎用ハードウェアに格納される及び／又はそれにより実行される）ソフトウェアで実装されるとして記載されたが、専用ハードウェア実装又はソフトウェア及び専用ハードウェア実装の組み合わせも、可能であり想定される。この記載において、「コンピューティングエンティティ」は、本開示において前述した任意のコンピューティングシステム、又はコンピューティングシステム上で実行する任意のモジュール若しくはモジュールの組み合わせであってよい。

本開示で及び特に添付の特許請求の範囲（例えば、添付の請求項本体）で使用される用語は、通常、「広義」の用語として意図される（例えば、用語「含む」は「含むが、これに限定されない」と解釈されるべきであり、用語「有する」は「有するが、これに限定されない」と解釈されるべきである、等）。

さらに、特定数の導入された請求項の列挙が意図される場合、このような意図は、請求項中に明示的に示され、このような列挙のない場合、このような意図は存在しない。例えば、理解の支援として、以下の添付の請求項は、請求項の列挙を導入するために、導入フレーズ「少なくとも１つ」及び「１つ以上」の使用を含み得る。しかしながら、このようなフレーズの使用は、同じ請求項が導入フレーズ「１つ以上」又は「少なくとも１つ」及び不定冠詞「ａ」又は「ａｎ」を含むときでも（例えば、「ａ」及び／又は「ａｎ」は「少なくとも１つ」又は「１つ以上」を意味すると解釈されるべきである）、不定冠詞「ａ」又は「ａｎ」による請求項の列挙の導入が、このような導入された請求項の列挙を含む任意の特定の請求項を、１つのこのような列挙のみを含む実施形態に限定することを意味すると考えられるべきではない。つまり、同じことが、請求項の列挙を導入するために使用される定冠詞の使用にも当てはまる。

さらに、特定数の導入された請求項の列挙が明示的に記載される場合、当業者は、このような列挙が、少なくとも列挙された数を意味すると解釈されるべきであることを理解する（例えば、他の修飾のない「２つの列挙」の記載は、少なくとも２つの列挙、又は２以上の列挙を意味する）。さらに、「Ａ、Ｂ、及びＣ等のうちの少なくとも１つ」又は「Ａ、Ｂ、及びＣ等のうちの１つ以上」と同様の記載が使用される例では、通常、このような構成は、Ａ単独で、Ｂ単独で、Ｃ単独で、Ａ及びＢを一緒に、Ａ及びＣを一緒に、Ｂ及びＣを一緒に、又はＡ、Ｂ、及びＣを一緒に、等を含むことを意図する。

さらに、２以上の選択的な用語を表す任意の離接的な語又はフレーズは、説明、請求項、又は図面にあるかにかかわらず、用語のうちの１つ、用語のうちのいずれか、又は両方の用語を含む可能性を想定すると理解されるべきである。例えば、フレーズ「Ａ又はＢ」は、「Ａ」又は「Ｂ」又は「Ａ及びＢ」の可能性を含むと理解されるべきである。

本開示に記載された全ての例及び条件付き言語は、読者が本開示及び本開示が技術を更に発展させることに貢献する概念を理解するのを支援する教示目的を意図しており、そのような具体的に列挙された例及び条件に限定されないと解釈されるべきである。本開示の実施形態は詳細に記載されたが、本開示の精神及び範囲から逸脱することなく、これらに種々の変更、代替、及び選択が行われ得る。

以上の実施形態に加えて、更に以下の付記を開示する。
（付記１）方法であって、
１つ以上の第１ウェブサイトから、研究論文に関連付けられた題名に基づき、１つ以上の第１リソースを抽出するステップと、
抽出した前記１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するステップと、
識別した前記リソースタイプセットに基づき、所定の複数のリソースタイプから、１つ以上の第１リソースタイプを決定するステップであって、前記リソースタイプセットは、決定した前記１つ以上の第１リソースタイプを除く、ステップと、
１つ以上のウェブサイトから、前記研究論文に関連付けられた前記題名に基づき、決定した前記１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを抽出するステップであって、前記１つ以上の第１リソースタイプ及び前記１つ以上の第２リソースの各々はメディアコンテンツを含む、ステップと、
前記研究論文の１つ以上の第１コンテンツフィールドと抽出した前記１つ以上の第１リソース及び抽出した前記１つ以上の第２リソースの１つ以上の第２コンテンツフィールドとの間の比較に基づき、最終リソースセットを決定するステップと、
決定した前記最終リソースセット及び前記研究論文を出力するよう、ディスプレイスクリーンを制御するステップと、
を含む方法。
（付記２）前記所定の複数のリソースタイプは、研究論文タイプ、ポスタータイプ、プレゼンテーションスライドタイプ、ビデオタイプ、又はプログラムコードタイプ、のうちの少なくとも１つを含む、付記１に記載の方法。
（付記３）前記１つ以上の第１ウェブサイトは、会議又は研究論文誌に関連付けられた第１ウェブサイト、研究論文の著者又は発行者に関連付けられた第２ウェブサイト、又はリソースタイプに関連付けられた第３ウェブサイト、のうちの少なくとも１つを含む、付記１に記載の方法。
（付記４）前記研究論文からの１つ以上の第１メタフィールド、並びに前記１つ以上の第１リソース及び前記１つ以上の第２リソースの各々からの１つ以上の第２メタフィールドを抽出するステップを更に含む付記１に記載の方法。
（付記５）テキスト抽出に基づき、前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドを抽出するステップであって、前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドの各々はテキストコンテンツを含む、ステップを更に含む付記１に記載の方法。
（付記６）オブジェクト検出に基づき、前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドを抽出するステップであって、前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドの各々はオブジェクトとしての図コンテンツ又は表コンテンツのうちの少なくとも１つに対応する、ステップを更に含む付記１に記載の方法。
（付記７）抽出した前記１つ以上の第１リソース及び抽出した前記１つ以上の第２リソースから、同じリソースタイプに関連付けられた複数のリソースを決定するステップと、
決定した前記複数のリソースの中のコンテンツの類似度に基づき、決定した前記複数のリソースをマージするステップと、
マージした前記複数のリソースに基づき、前記最終リソースセットを決定するステップと、
を更に含む付記１に記載の方法。
（付記８）方法であって、
それぞれ１つ以上のコンテンツフィールドを含む候補リソースセット及び研究論文を格納するステップであって、前記候補リソースセットは、メディアコンテンツを含み、前記研究論文に関連付けられる、ステップと、
前記１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、前記研究論文の中の１つ以上の第１コンテンツフィールドの各々を、第１ベクトルに符号化するステップと、
格納した前記候補リソースセットの各々を、１つ以上の第２コンテンツフィールドへとパースするステップと、
パースした前記候補リソースセットの各々の中の前記１つ以上の第２コンテンツフィールドの各々を、前記１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するステップと、
符号化した前記１つ以上の第１コンテンツフィールドの各々の前記第１ベクトルを、符号化した前記１つ以上の第２コンテンツフィールドの各々の前記第２ベクトルと比較するステップと、
前記比較に基づき、最終リソースセットを決定するステップと、
決定した最終リソースセット及び前記研究論文を出力するよう、ディスプレイスクリーンを制御するステップと、
を含む方法。
（付記９）文書レイアウト分析、テキスト抽出、文書から画像への変換、又はオブジェクト検出、のうちの少なくとも１つに基づき、前記研究論文を前記１つ以上の第１コンテンツフィールドへとパースするステップを更に含む付記８に記載の方法。
（付記１０）前記第１フィールドタイプ及び前記第２フィールドタイプの各々は、テキストフィールドタイプ、カテゴリフィールドタイプ、日時フィールドタイプ、図フィールドタイプ、又は表フィールドタイプ、のうちの１つを含む、付記８に記載の方法。
（付記１１）前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドの各々は、前記テキストフィールドタイプの予めトレーニングされたコンテキスト埋め込み又は予めトレーニングされた埋め込みのバッグ（bag）、前記カテゴリフィールドタイプのカテゴリ符号化、前記日時フィールドタイプの数値符号化、又は前記図フィールドタイプの又は前記表フィールドタイプの予めトレーニングされた符号化、のうちの少なくとも１つに基づき符号化される、付記１０に記載の方法。
（付記１２）前記第１フィールドタイプ及び前記第２フィールドタイプの各々がテキストフィールドタイプであるとき、前記比較は、前記第１ベクトルに関連付けられた第１テキスト特徴セットと前記第２ベクトルに関連付けられた第２テキスト特徴セットとの間のコサイン距離を計算するステップを更に含む、付記８に記載の方法。
（付記１３）前記第１フィールドタイプ及び前記第２フィールドタイプの各々がカテゴリフィールドタイプであるとき、前記比較は、前記第１ベクトルに関連付けられた第１カテゴリ特徴セットと前記第２ベクトルに関連付けられた第２カテゴリ特徴セットとの間の重なり合いを計算するステップを更に含む、付記８に記載の方法。
（付記１４）前記第１フィールドタイプ及び前記第２フィールドタイプの各々が日時フィールドタイプであるとき、前記比較は、前記第１ベクトルに関連付けられた第１数値特徴セットと前記第２ベクトルに関連付けられた第２数値特徴セットとの間の正規化日時差を計算するステップを更に含む、付記８に記載の方法。
（付記１５）前記第１フィールドタイプ及び前記第２フィールドタイプの各々が図フィールドタイプ又は表フィールドタイプであるとき、前記比較は、前記第１ベクトルに関連付けられた第１シャムニューラルネットワーク特徴セットと前記第２ベクトルに関連付けられた第２シャムニューラルネットワーク特徴セットとの間の図又は表の類似性スコアを計算するステップを更に含む、付記８に記載の方法。
（付記１６）前記第１ベクトルに関連付けられた第１の複数の特徴と、前記第２ベクトルに関連付けられた第２の複数の特徴とを連結して、連結特徴セットを生成するステップ、を更に含み、
前記第１の複数の特徴及び前記第２の複数の特徴の各々は、テキスト特徴セット、カテゴリ特徴セット、数値特徴セット、又はシャムニューラルネットワーク特徴セット、のうちの少なくとも１つを含む、付記８に記載の方法。
（付記１７）複数の研究論文に関連付けられた複数のリソースを含むトレーニングデータに基づき、機械学習モデルを生成するステップであって、前記複数の研究論文は前記研究論文を含み、前記複数のリソースは前記最終リソースセットを含む、ステップを更に含む付記１６に記載の方法。
（付記１８）前記連結特徴セットに基づき、ルールに基づくモデルを生成するステップと、
生成した前記ルールに基づくモデルに基づき、前記最終リソースセットを決定するステップと、
を更に含む付記１６に記載の方法。
（付記１９）機械学習モデル又はルールに基づくモデルのうちの少なくとも１つを、前記候補リソースセットからの第１候補リソースに適用して、前記第１候補リソースが前記研究論文と一致するかどうかを決定するステップと、
前記第１候補リソースが前記研究論文と一致するという決定に基づき、前記第１候補リソースを含む前記最終リソースセットを決定するステップと、
を更に含む付記１６に記載の方法。
（付記２０）命令を格納するよう構成される１つ以上の非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されることに応答してシステムに動作を実行させ、前記動作は、
１つ以上の第１ウェブサイトから、研究論文に関連付けられた題名に基づき、１つ以上の第１リソースを抽出するステップと、
抽出した前記１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するステップと、
識別した前記リソースタイプセットに基づき、所定の複数のリソースタイプから、１つ以上の第１リソースタイプを決定するステップであって、前記リソースタイプセットは、決定した前記１つ以上の第１リソースタイプを除く、ステップと、
１つ以上のウェブサイトから、前記研究論文に関連付けられた前記題名に基づき、決定した前記１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを抽出するステップであって、前記１つ以上の第１リソースタイプ及び前記１つ以上の第２リソースの各々はメディアコンテンツを含む、ステップと、
前記研究論文の１つ以上の第１コンテンツフィールドと抽出した前記１つ以上の第１リソース及び抽出した前記１つ以上の第２リソースの１つ以上の第２コンテンツフィールドとの間の比較に基づき、最終リソースセットを決定するステップと、
決定した前記最終リソースセット及び前記研究論文を出力するよう、ディスプレイスクリーンを制御するステップと、
を含む、コンピュータ可読記憶媒体。
（付記２１）命令を格納するよう構成される１つ以上の非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されることに応答してシステムに動作を実行させ、前記動作は、
それぞれ１つ以上のコンテンツフィールドを含む候補リソースセット及び研究論文を格納するステップであって、前記候補リソースセットは、メディアコンテンツを含み、前記研究論文に関連付けられる、ステップと、
前記１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、前記研究論文の中の１つ以上の第１コンテンツフィールドの各々を、第１ベクトルに符号化するステップと、
格納した前記候補リソースセットの各々を、１つ以上の第２コンテンツフィールドへとパースするステップと、
パースした前記候補リソースセットの各々の中の前記１つ以上の第２コンテンツフィールドの各々を、前記１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するステップと、
符号化した前記１つ以上の第１コンテンツフィールドの各々の前記第１ベクトルを、符号化した前記１つ以上の第２コンテンツフィールドの各々の前記第２ベクトルと比較するステップと、
前記比較に基づき、最終リソースセットを決定するステップと、
決定した最終リソースセット及び前記研究論文を出力するよう、ディスプレイスクリーンを制御するステップと、
を含む、コンピュータ可読記憶媒体。

１０２電子装置
１０４サーバ
１０６データベース
１０８ユーザエンド装置
１１０通信ネットワーク

Claims

方法であって、
１つ以上の第１ウェブサイトから、研究論文に関連付けられた題名に基づき、１つ以上の第１リソースを抽出するステップと、
抽出した前記１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するステップと、
識別した前記リソースタイプセットに基づき、所定の複数のリソースタイプから、１つ以上の第１リソースタイプを決定するステップであって、前記リソースタイプセットは、決定した前記１つ以上の第１リソースタイプを除く、ステップと、
１つ以上のウェブサイトから、前記研究論文に関連付けられた前記題名に基づき、決定した前記１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを抽出するステップであって、前記１つ以上の第１リソースタイプ及び前記１つ以上の第２リソースの各々はメディアコンテンツを含む、ステップと、
前記研究論文の１つ以上の第１コンテンツフィールドと抽出した前記１つ以上の第１リソース及び抽出した前記１つ以上の第２リソースの１つ以上の第２コンテンツフィールドとの間の比較に基づき、最終リソースセットを決定するステップと、
決定した前記最終リソースセット及び前記研究論文を出力するよう、ディスプレイスクリーンを制御するステップと、
を含む方法。
前記所定の複数のリソースタイプは、研究論文タイプ、ポスタータイプ、プレゼンテーションスライドタイプ、ビデオタイプ、又はプログラムコードタイプ、のうちの少なくとも１つを含む、請求項１に記載の方法。
前記１つ以上の第１ウェブサイトは、会議又は研究論文誌に関連付けられた第１ウェブサイト、研究論文の著者又は発行者に関連付けられた第２ウェブサイト、又はリソースタイプに関連付けられた第３ウェブサイト、のうちの少なくとも１つを含む、請求項１に記載の方法。
前記研究論文からの１つ以上の第１メタフィールド、並びに前記１つ以上の第１リソース及び前記１つ以上の第２リソースの各々からの１つ以上の第２メタフィールドを抽出するステップを更に含む請求項１に記載の方法。
テキスト抽出に基づき、前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドを抽出するステップであって、前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドの各々はテキストコンテンツを含む、ステップを更に含む請求項１に記載の方法。
オブジェクト検出に基づき、前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドを抽出するステップであって、前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドの各々はオブジェクトとしての図コンテンツ又は表コンテンツのうちの少なくとも１つに対応する、ステップを更に含む請求項１に記載の方法。
抽出した前記１つ以上の第１リソース及び抽出した前記１つ以上の第２リソースから、同じリソースタイプに関連付けられた複数のリソースを決定するステップと、
決定した前記複数のリソースの中のコンテンツの類似度に基づき、決定した前記複数のリソースをマージするステップと、
マージした前記複数のリソースに基づき、前記最終リソースセットを決定するステップと、
を更に含む請求項１に記載の方法。
方法であって、
それぞれ１つ以上のコンテンツフィールドを含む候補リソースセット及び研究論文を格納するステップであって、前記候補リソースセットは、メディアコンテンツを含み、前記研究論文に関連付けられる、ステップと、
前記１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、前記研究論文の中の１つ以上の第１コンテンツフィールドの各々を、第１ベクトルに符号化するステップと、
格納した前記候補リソースセットの各々を、１つ以上の第２コンテンツフィールドへとパースするステップと、
パースした前記候補リソースセットの各々の中の前記１つ以上の第２コンテンツフィールドの各々を、前記１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するステップと、
符号化した前記１つ以上の第１コンテンツフィールドの各々の前記第１ベクトルを、符号化した前記１つ以上の第２コンテンツフィールドの各々の前記第２ベクトルと比較するステップと、
前記比較に基づき、最終リソースセットを決定するステップと、
決定した最終リソースセット及び前記研究論文を出力するよう、ディスプレイスクリーンを制御するステップと、
を含む方法。
文書レイアウト分析、テキスト抽出、文書から画像への変換、又はオブジェクト検出、のうちの少なくとも１つに基づき、前記研究論文を前記１つ以上の第１コンテンツフィールドへとパースするステップを更に含む請求項８に記載の方法。
前記第１フィールドタイプ及び前記第２フィールドタイプの各々は、テキストフィールドタイプ、カテゴリフィールドタイプ、日時フィールドタイプ、図フィールドタイプ、又は表フィールドタイプ、のうちの１つを含む、請求項８に記載の方法。
前記１つ以上の第１コンテンツフィールド及び前記１つ以上の第２コンテンツフィールドの各々は、前記テキストフィールドタイプの予めトレーニングされたコンテキスト埋め込み又は予めトレーニングされた埋め込みのバッグ（bag）、前記カテゴリフィールドタイプのカテゴリ符号化、前記日時フィールドタイプの数値符号化、又は前記図フィールドタイプの又は前記表フィールドタイプの予めトレーニングされた符号化、のうちの少なくとも１つに基づき符号化される、請求項１０に記載の方法。
前記第１フィールドタイプ及び前記第２フィールドタイプの各々がテキストフィールドタイプであるとき、前記比較は、前記第１ベクトルに関連付けられた第１テキスト特徴セットと前記第２ベクトルに関連付けられた第２テキスト特徴セットとの間のコサイン距離を計算するステップを更に含む、請求項８に記載の方法。
前記第１フィールドタイプ及び前記第２フィールドタイプの各々がカテゴリフィールドタイプであるとき、前記比較は、前記第１ベクトルに関連付けられた第１カテゴリ特徴セットと前記第２ベクトルに関連付けられた第２カテゴリ特徴セットとの間の重なり合いを計算するステップを更に含む、請求項８に記載の方法。
前記第１フィールドタイプ及び前記第２フィールドタイプの各々が日時フィールドタイプであるとき、前記比較は、前記第１ベクトルに関連付けられた第１数値特徴セットと前記第２ベクトルに関連付けられた第２数値特徴セットとの間の正規化日時差を計算するステップを更に含む、請求項８に記載の方法。
前記第１フィールドタイプ及び前記第２フィールドタイプの各々が図フィールドタイプ又は表フィールドタイプであるとき、前記比較は、前記第１ベクトルに関連付けられた第１シャムニューラルネットワーク特徴セットと前記第２ベクトルに関連付けられた第２シャムニューラルネットワーク特徴セットとの間の図又は表の類似性スコアを計算するステップを更に含む、請求項８に記載の方法。
前記第１ベクトルに関連付けられた第１の複数の特徴と、前記第２ベクトルに関連付けられた第２の複数の特徴とを連結して、連結特徴セットを生成するステップ、を更に含み、
前記第１の複数の特徴及び前記第２の複数の特徴の各々は、テキスト特徴セット、カテゴリ特徴セット、数値特徴セット、又はシャムニューラルネットワーク特徴セット、のうちの少なくとも１つを含む、請求項８に記載の方法。
複数の研究論文に関連付けられた複数のリソースを含むトレーニングデータに基づき、機械学習モデルを生成するステップであって、前記複数の研究論文は前記研究論文を含み、前記複数のリソースは前記最終リソースセットを含む、ステップを更に含む請求項１６に記載の方法。
前記連結特徴セットに基づき、ルールに基づくモデルを生成するステップと、
生成した前記ルールに基づくモデルに基づき、前記最終リソースセットを決定するステップと、
を更に含む請求項１６に記載の方法。
機械学習モデル又はルールに基づくモデルのうちの少なくとも１つを、前記候補リソースセットからの第１候補リソースに適用して、前記第１候補リソースが前記研究論文と一致するかどうかを決定するステップと、
前記第１候補リソースが前記研究論文と一致するという決定に基づき、前記第１候補リソースを含む前記最終リソースセットを決定するステップと、
を更に含む請求項１６に記載の方法。
命令を格納するよう構成される１つ以上の非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されることに応答してシステムに動作を実行させ、前記動作は、
１つ以上の第１ウェブサイトから、研究論文に関連付けられた題名に基づき、１つ以上の第１リソースを抽出するステップと、
抽出した前記１つ以上の第１リソースに関連付けられたリソースタイプセットを識別するステップと、
識別した前記リソースタイプセットに基づき、所定の複数のリソースタイプから、１つ以上の第１リソースタイプを決定するステップであって、前記リソースタイプセットは、決定した前記１つ以上の第１リソースタイプを除く、ステップと、
１つ以上のウェブサイトから、前記研究論文に関連付けられた前記題名に基づき、決定した前記１つ以上の第１リソースタイプに関連付けられた１つ以上の第２リソースを抽出するステップであって、前記１つ以上の第１リソースタイプ及び前記１つ以上の第２リソースの各々はメディアコンテンツを含む、ステップと、
前記研究論文の１つ以上の第１コンテンツフィールドと抽出した前記１つ以上の第１リソース及び抽出した前記１つ以上の第２リソースの１つ以上の第２コンテンツフィールドとの間の比較に基づき、最終リソースセットを決定するステップと、
決定した前記最終リソースセット及び前記研究論文を出力するよう、ディスプレイスクリーンを制御するステップと、
を含む、コンピュータ可読記憶媒体。
命令を格納するよう構成される１つ以上の非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されることに応答してシステムに動作を実行させ、前記動作は、
それぞれ１つ以上のコンテンツフィールドを含む候補リソースセット及び研究論文を格納するステップであって、前記候補リソースセットは、メディアコンテンツを含み、前記研究論文に関連付けられる、ステップと、
前記１つ以上の第１コンテンツフィールドの各々に関連付けられた第１フィールドタイプに基づき、前記研究論文の中の１つ以上の第１コンテンツフィールドの各々を、第１ベクトルに符号化するステップと、
格納した前記候補リソースセットの各々を、１つ以上の第２コンテンツフィールドへとパースするステップと、
パースした前記候補リソースセットの各々の中の前記１つ以上の第２コンテンツフィールドの各々を、前記１つ以上の第２コンテンツフィールドの各々に関連付けられた第２フィールドタイプに基づき、第２ベクトルに符号化するステップと、
符号化した前記１つ以上の第１コンテンツフィールドの各々の前記第１ベクトルを、符号化した前記１つ以上の第２コンテンツフィールドの各々の前記第２ベクトルと比較するステップと、
前記比較に基づき、最終リソースセットを決定するステップと、
決定した最終リソースセット及び前記研究論文を出力するよう、ディスプレイスクリーンを制御するステップと、
を含む、コンピュータ可読記憶媒体。