JP7003481B2 - Reinforcing rankings for social media accounts and content - Google Patents

Reinforcing rankings for social media accounts and content Download PDF

Info

Publication number
JP7003481B2
JP7003481B2 JP2017155651A JP2017155651A JP7003481B2 JP 7003481 B2 JP7003481 B2 JP 7003481B2 JP 2017155651 A JP2017155651 A JP 2017155651A JP 2017155651 A JP2017155651 A JP 2017155651A JP 7003481 B2 JP7003481 B2 JP 7003481B2
Authority
JP
Japan
Prior art keywords
social media
account
media account
accounts
author
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017155651A
Other languages
Japanese (ja)
Other versions
JP2018124966A (en
Inventor
ワン・ジュヌ
寛治 内野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US15/422,383 external-priority patent/US20170235835A1/en
Priority claimed from US15/424,730 external-priority patent/US20170235836A1/en
Priority claimed from US15/653,356 external-priority patent/US10776885B2/en
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2018124966A publication Critical patent/JP2018124966A/en
Application granted granted Critical
Publication of JP7003481B2 publication Critical patent/JP7003481B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

関連出願への相互参照
本願は2016年2月12日に出願された米国特許出願第15/043,406号の部分継続である2017年2月1日に出願された米国特許出願第15/422,383号の部分継続である2017年2月3日に出願された米国特許出願第15/424,730号の部分継続である。上記出願の内容はここに参照によってその全体において組み込まれる。
Mutual reference to related applications This application is a partial continuation of US Patent Application No. 15 / 043,406 filed February 12, 2016, of US Patent Application No. 15 / 422,383 filed February 1, 2017. Partial continuation This is a partial continuation of US Patent Application No. 15 / 424,730 filed on February 3, 2017. The content of the above application is incorporated herein by reference in its entirety.

分野
本稿で論じられる実施形態は情報の識別および抽出に関する。
Fields The embodiments discussed in this paper relate to the identification and extraction of information.

インターネットのようなコンピュータ・ネットワークの到来および技術の成長により、ますます多くの情報がますます多くの人々に利用可能になっている。たとえば、多くの主導的な研究者はソーシャル・メディアを使ってタイムリーに情報を共有し、アイデアを交換している。 With the advent of computer networks such as the Internet and the growth of technology, more and more information is becoming available to more and more people. For example, many leading researchers use social media to share information and exchange ideas in a timely manner.

本願で特許請求される主題は、何らかの欠点を解決するまたは上記のような環境でのみ動作する実施形態に限定されない。むしろ、この背景は、本稿に記載されるいくつかの実施形態が実施されうる一つの例示的な技術領域を示すために与えられているだけである。 The subject matter claimed in the present application is not limited to embodiments that solve any shortcomings or operate only in an environment as described above. Rather, this background is provided only to illustrate one exemplary technical area in which some of the embodiments described herein may be implemented.

本開示の一つまたは複数の実施形態は、ソーシャル・メディア・アカウントとコンテンツとの間の相互に補強し合う関係に基づいてソーシャル・メディア・アカウントおよびコンテンツをランク付けするコンピュータ実装される方法を含んでいてもよい。本方法は、複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについて一般型重みを決定することを含んでいてもよい。一般型重みは、そのソーシャル・メディア・アカウントに対応するソーシャル・メディア・アカウント型に基づいていてもよい。本方法はさらに、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての個別重みを決定することを含んでいてもよい。本方法はまた、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされているコンテンツとの間の相互に補強する関係をエンコードすることをも含んでいてもよい。相互に補強する関係は、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツのコンテンツ項目との間のプロモーション・リンクとしてエンコードされてもよい。本方法はさらに、基本リンク強さを計算することを含んでいてもよい。基本リンク強さは各プロモーション・リンクについて計算されてもよく、基本リンク強さは前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記一般型重みと、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記個別重みとに基づいていてもよい。本方法はまた、前記複数のソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキングを、前記基本リンク強さに基づいて計算することを含んでいてもよい。 One or more embodiments of the present disclosure include computer-implemented methods of ranking social media accounts and content based on mutually reinforcing relationships between social media accounts and content. You may be. The method may include determining a general type weight for each social media account of multiple social media accounts. The general type weight may be based on the social media account type corresponding to the social media account. The method may further include determining the individual weight for each social media account of the plurality of social media accounts. The method also mutually reinforces between each social media account of the plurality of social media accounts and the content promoted by each social media account of the plurality of social media accounts. It may also include encoding relationships. The mutually reinforcing relationship is between each social media account of the plurality of social media accounts and the content item of the content promoted by each social media account of the plurality of social media accounts. It may be encoded as a promotional link. The method may further include calculating the basic link strength. The base link strength may be calculated for each promotional link, and the base link strength is the general type weight for each social media account of the plurality of social media accounts and the plurality of social media. • It may be based on the individual weights for each social media account in the account. The method may also include calculating the mutually reinforcing rankings of the plurality of social media accounts and content based on the basic link strength.

実施形態の目的および利点は、少なくとも、請求項において具体的に指摘される要素、特徴および組み合わせによって実現され、達成されるであろう。 The objectives and advantages of the embodiments will be realized and achieved at least by the elements, features and combinations specifically pointed out in the claims.

以上の概括的な記述および以下の詳細な記述はいずれも単に例であり説明的なものであり、特許請求される発明を制約するものではないことは理解しておくべきである。 It should be understood that the above general description and the following detailed description are merely examples and descriptive, and do not limit the claimed invention.

例示的実施形態について、付属の図面を使って、さらに具体的かつ詳細に記述し、説明する。
情報を識別し、抽出するよう構成された例示的システムを表わす図である。 情報の識別および抽出に関して使われてもよい例示的なフローの図である。 情報の識別および抽出の例示的な方法のフローチャートの前半である。 情報の識別および抽出の例示的な方法のフローチャートの後半である。 情報の識別および抽出のもう一つの例示的な方法のフローチャートである。 情報の識別および抽出のもう一つの例示的な方法のフローチャートである。 情報の識別および抽出に関して使われてもよいもう一つの例示的なフローの図である。 情報の識別および抽出の例示的な方法のフローチャートである。 個人学術ウェブページを識別する例示的方法のフローチャートである。 情報の識別および抽出において使われてもよいもう一つの例示的な方法のフローチャートの前半である。 情報の識別および抽出において使われてもよいもう一つの例示的な方法のフローチャートの後半である。 ソーシャル・メディア・アカウントおよび個人学術ウェブページの候補を相互検証することにおいて使われてもよい例示的な方法のフローチャートである。 ソーシャル・メディア・アカウントおよび個人学術ウェブページの候補を相互検証することにおいて使われてもよいもう一つの例示的な方法のフローチャートである。 ソーシャル・メディア・アカウントおよび個人学術ウェブページの候補を相互検証することにおいて使われてもよいもう一つの例示的な方法のフローチャートである。 ソーシャル・メディア・アカウントおよび個人学術ウェブページの候補を相互検証することにおいて使われてもよいもう一つの例示的な方法のフローチャートである。 ソーシャル・メディア・アカウントおよび個人学術ウェブページの候補を相互検証することにおいて使われてもよいもう一つの例示的な方法のフローチャートである。 ソーシャル・メディア・アカウントの候補集合を生成する処理の例示的な概略的表現を示す図である。 ソーシャル・メディア・アカウントをセンサーとして使いながらの情報の識別および抽出の例示的方法のフローチャートの前半である。 ソーシャル・メディア・アカウントをセンサーとして使いながらの情報の識別および抽出の例示的方法のフローチャートの後半である。 ソーシャル・メディア・アカウントをセンサーとして使いながらの情報の識別および抽出において使用されうる例示的方法のフローチャートである。 ソーシャル・メディア・アカウントをセンサーとして使いながらの情報の識別および抽出において使用されうるもう一つの例示的方法のフローチャートである。 ソーシャル・メディア・アカウント型に基づくソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキングに関して使用されうる例示的フローの図である。 ソーシャル・メディア・アカウント型の決定に関して使用されうる例示的フローの図の前半である。 ソーシャル・メディア・アカウント型の決定に関して使用されうる例示的フローの図の後半である。 ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキングを計算する例示的方法のフローチャートである。 アカウントとコンテンツの間の相互に補強する関係をエンコードする例示的な二部グラフを表わす図である。 情報を識別および抽出しうる例示的システムを示す図である。
An exemplary embodiment will be described and described in more detail and in detail with reference to the accompanying drawings.
FIG. 6 illustrates an exemplary system configured to identify and extract information. It is a diagram of an exemplary flow that may be used for the identification and extraction of information. The first half of the flowchart of an exemplary method of identifying and extracting information. The second half of the flow chart is an exemplary method of identifying and extracting information. It is a flowchart of another exemplary method of information identification and extraction. It is a flowchart of another exemplary method of information identification and extraction. It is another exemplary flow diagram that may be used for the identification and extraction of information. It is a flowchart of an exemplary method of information identification and extraction. It is a flowchart of an exemplary method of identifying a personal academic web page. The first half of the flow chart of another exemplary method that may be used in the identification and extraction of information. It is the second half of the flow chart of another exemplary method that may be used in the identification and extraction of information. A flowchart of an exemplary method that may be used in cross-validating candidates for social media accounts and personal academic web pages. A flowchart of another exemplary method that may be used in cross-validating candidates for social media accounts and personal academic web pages. A flowchart of another exemplary method that may be used in cross-validating candidates for social media accounts and personal academic web pages. A flowchart of another exemplary method that may be used in cross-validating candidates for social media accounts and personal academic web pages. A flowchart of another exemplary method that may be used in cross-validating candidates for social media accounts and personal academic web pages. FIG. 3 illustrates an exemplary schematic representation of the process of generating a candidate set for a social media account. The first half of the flowchart of an exemplary method of identifying and extracting information while using a social media account as a sensor. The second half of the flow chart is an exemplary method of identifying and extracting information while using a social media account as a sensor. It is a flowchart of an exemplary method that can be used in identifying and extracting information while using a social media account as a sensor. It is a flowchart of another exemplary method that can be used in identifying and extracting information while using a social media account as a sensor. It is a diagram of an exemplary flow that can be used for mutually reinforcing rankings of social media accounts and content based on the social media account type. The first half of the diagram of an exemplary flow that can be used for social media account type decisions. The second half of the diagram of the exemplary flow that can be used for social media account type decisions. It is a flowchart of an exemplary method of calculating a mutually reinforcing ranking of social media accounts and content. It is a diagram showing an exemplary bipartite graph that encodes a mutually reinforcing relationship between an account and content. It is a figure which shows the exemplary system which can identify and extract information.

本稿に記載されるいくつかの実施形態は、情報の識別および抽出の方法およびシステムに関する。技術、研究および一般的な知識の生成の現在の速さの結果、知識頒布の従前および現在の方法では、最近の発展について最新の知識および情報を十分に提供しない。さらに、知識はもはや選ばれた地域における少数の選ばれた個人によって生成されるのではない。むしろ、本開示において知識ある人々と称される所与のトピックの知識をもつ研究者、教授、専門家その他は世界中に位置しており、たえず新たなアイデアを生成し、共有している。 Some embodiments described in this article relate to methods and systems for identifying and extracting information. As a result of the current speed of technology, research and general knowledge generation, previous and current methods of knowledge distribution do not provide sufficient up-to-date knowledge and information about recent developments. Moreover, knowledge is no longer generated by a small number of selected individuals in a selected area. Rather, researchers, professors, experts and others with knowledge of a given topic, referred to as knowledgeable people in this disclosure, are located around the world and constantly generate and share new ideas.

しかしながら、インターネットの結果、この世界中からの膨大な新たに生成される知識は、たえず世界規模で共有されている。いくつかの状況では、この膨大な知識はソーシャル・メディアを通じて共有されている。たとえば、知識ある人々は、最近得た知識をブログ、マイクロブログおよび他のソーシャル・メディアを通じて共有してもよい。 However, as a result of the Internet, this vast amount of newly generated knowledge from around the world is constantly being shared worldwide. In some situations, this vast amount of knowledge is shared through social media. For example, knowledgeable people may share their recent knowledge through blogs, microblogs and other social media.

現行情報がソーシャル・メディアで共有されていることを知っても、現行情報が簡単にアクセスできることや個人が現実的に該情報にアクセスできることにはならない。いくつかの分野では、何千、何万または何十万もの知識ある人々がいることがある。特定の分野からの知識ある人々の名前を含むデータベースはない。しかしながら、たとえデータベースが名前を含んでいたとしても、該知識ある人々がソーシャル・メディア・アカウントをもっているかどうかを人が特定するために費やされる時間は、誰も考えられないほど不相応なものであろう。さらに、たとえある知識ある人がソーシャル・メディア・アカウントを有していたかどうかをある人が特定できたとしても、常時それらのソーシャル・メディア・アカウントにアクセスし、パースして、そこで共有されている新たな知識を得るための時間は現実的ではないであろう。 Knowing that current information is shared on social media does not mean that it is easily accessible or that individuals can actually access it. In some areas, there may be thousands, tens of thousands, or hundreds of thousands of knowledgeable people. There is no database containing the names of knowledgeable people from a particular field. However, even if the database contains a name, the time a person spends identifying whether the knowledgeable person has a social media account would be unthinkably disproportionate. .. Moreover, even if a person can identify whether a knowledgeable person had a social media account, they are always accessing, parsing, and sharing those social media accounts. The time to gain new knowledge will not be realistic.

つまるところ、コンピュータおよびインターネットの台頭のため、大量の情報が利用可能になっているが、人が合理的に該情報にアクセスするための現実的なすべがない。本稿に記載されるいくつかの実施形態は、従前には利用可能でなかった、あるいは技術の支援なくしては人間によって、さらには人間のグループによってでも合理的に取得可能ではなかった情報に人々がアクセスするのを助けうる、情報の識別および抽出の方法およびシステムに関する。 After all, the rise of computers and the Internet has made large amounts of information available, but there is no practical way for humans to reasonably access it. Some embodiments described in this article have been previously unavailable to people, or to information that was not reasonably available by humans, or even by groups of humans, without technical assistance. Regarding methods and systems for identifying and extracting information that can help access.

本開示において記載される情報の識別および抽出の方法およびシステムは、刊行物およびレクチャーの著作者を判別することによって知識ある人々を判別することを含む。それら複数の著作者についてのメタデータが刊行物およびレクチャーから抽出される。著作者メタデータは、それらの著作者のソーシャル・メディア・アカウントを判別するために、ソーシャル・メディア・アカウントを検索するために使われる。たとえば、いくつかの実施形態では、著作者メタデータは、著作者の名前、著作者のプロフィールおよび共著者についての情報を含んでいてもよい。ソーシャル・メディア・アカウントからの情報は、著作者をソーシャル・メディア・アカウントとマッチさせるために、著作者メタデータと比較されてもよい。いくつかの実施形態では、本開示におけるシステムおよび方法はさらに、ソーシャル・メディア・アカウント上で提供される情報のトピックを考慮してもよい。こうして、ある著作者がソーシャル・メディア・アカウントをもっているがその著作者が公表した前記トピックに関係した知識を共有しない場合には、ソーシャル・メディア・アカウントは考慮されなくてもよい。 The methods and systems for identifying and extracting information described in this disclosure include identifying knowledgeable people by identifying the authors of publications and lectures. Metadata for those multiple authors is extracted from publications and lectures. Author metadata is used to search for social media accounts to determine the social media accounts of those authors. For example, in some embodiments, author metadata may include information about the author's name, author's profile, and co-authors. Information from social media accounts may be compared to author metadata to match authors with social media accounts. In some embodiments, the systems and methods in this disclosure may further consider the topic of information provided on social media accounts. Thus, if an author has a social media account but does not share any knowledge related to the topic published by that author, the social media account may not be considered.

ソーシャル・メディア・アカウントを同定した後、同定されたソーシャル・メディア・アカウント上の情報が収集され、組織化され、呈示されてもよい。たとえば、該情報は、トピックに基づいて組織化されてもよく、それにより選択されたトピックに関心のある人が、複数の異なる知識ある人々からの現行知識を、現行の更新をもって、呈示されることができる。このようにして、人が合理的に識別または管理できない数の源からの新情報がアクセスされ、共有されることができる。こうして、本開示におけるシステムおよび方法は、人によって合理的には実行できない、技術から生じる問題に対する技術的解決策を提供する。 After identifying a social media account, the information on the identified social media account may be collected, organized and presented. For example, the information may be organized on the basis of a topic, thereby presenting current knowledge from people with different knowledge, with current updates, to those who are interested in the selected topic. be able to. In this way, new information from a number of sources that one cannot reasonably identify or manage can be accessed and shared. Thus, the systems and methods in this disclosure provide technical solutions to problems arising from technology that cannot be reasonably implemented by humans.

さらに、たとえソーシャル・メディア・アカウントが同定できたとしても、知識ある人に関連したソーシャル・メディア・アカウントを同定する自動化されたシステムまたはプロセスは正しくないことがあり、あるいはソーシャル・メディア・アカウントの複数の潜在的な候補の間で見きわめをすることができないことがある。たとえば、70%を超える名前が、その名前に関連付けられた複数のツイッター(登録商標)・アカウントをもつ。コンピューティング・システムがどのソーシャル・メディア・アカウントが特定の知識ある人に関連しているかを自動的に見きわめることは非常に難しいことがありうる。また、多くの知識ある人々は個人学術ウェブページをもつ。あるウェブサイトがある知識ある人の学術ウェブページであるかどうかを識別することも難しいことがある。 In addition, even if a social media account can be identified, the automated system or process for identifying a social media account related to a knowledgeable person may be incorrect, or multiple social media accounts. It may not be possible to make a distinction among the potential candidates for. For example, more than 70% of names have multiple Twitter accounts associated with that name. It can be very difficult for a computing system to automatically determine which social media account is associated with a particular knowledgeable person. Also, many knowledgeable people have personal academic web pages. It can also be difficult to identify whether a website is an academic web page of a knowledgeable person.

本開示は、知識ある人のソーシャル・メディア・アカウントと個人学術ウェブページとの相互検証に関しうる。たとえば、ソーシャル・メディア・アカウントおよび個人学術ウェブページのさまざまな側面を使うことによって、両者の間のさまざまな一貫した特徴または側面が、両者が同じ知識ある人に関連していることを確認しうる。本開示と整合して、候補ソーシャル・メディア・アカウントおよび候補個人学術ウェブページの集合が同定されてもよい。各候補は、ソーシャル・メディア・アカウント候補および/または個人学術ウェブページ候補のさまざまな特徴または側面を同定するためにパースされ、あるいは他の仕方で解析されてもよい。それらのさまざまな特徴および/または側面は、その個人学術ウェブページおよびそのソーシャル・メディア・アカウントの両方がある特定の著作者に正しく関連付けられていることを確証するために、両者の間で相互検証されてもよい。本開示によれば、ソーシャル・メディア・アカウントが個人学術ウェブページと相互検証された後、それらのソーシャル・メディア・アカウントの投稿がトピックに基づいて組織化されてもよく、それにより、選択されたトピックに関心のある人が、複数の異なる知識ある人々からの現行知識を、現行の更新をもって、呈示されることができる。このようにして、人が合理的に識別または管理できない数の源からの新情報がアクセスされ、共有されることができる。こうして、本開示におけるシステムおよび方法は、人によって合理的には実行できない、技術から生じる問題に対する技術的解決策を提供する。さらに、以前にはコンピュータによって実行されなかったタスクの自動化された処理を許容する。 This disclosure may relate to mutual validation between a knowledgeable person's social media account and a personal academic web page. For example, by using different aspects of social media accounts and personal academic web pages, it is possible to ensure that different consistent features or aspects between the two are related to the same knowledgeable person. .. Consistent with this disclosure, a collection of candidate social media accounts and candidate personal academic web pages may be identified. Each candidate may be parsed or otherwise analyzed to identify various features or aspects of a candidate social media account and / or a candidate personal academic web page. Their various features and / or aspects are cross-validated between the two to ensure that both their personal academic web page and their social media account are correctly associated with a particular author. May be done. According to this disclosure, after social media accounts have been cross-validated with personal academic web pages, the posts of those social media accounts may be organized on a topic basis and thereby selected. A person interested in a topic can present current knowledge from multiple different knowledgeable people with current updates. In this way, new information from a number of sources that one cannot reasonably identify or manage can be accessed and shared. Thus, the systems and methods in this disclosure provide technical solutions to problems arising from technology that cannot be reasonably implemented by humans. In addition, it allows automated processing of tasks that were not previously performed by the computer.

この空間におけるさらなる困難は、所与のトピックについての知識のあるソーシャル・メディア・アカウントを識別することである。個々人が何千またはさらには何百万ものソーシャル・メディア・アカウントをかきわけてあるトピックについて知識があるさまざまなアカウントを識別しようとすることは現実的ではなく、事実上実施不可能である。さらに、どんな所与のトピックでも、知識のあるソーシャル・メディア投稿を認識することだけでもできる知識のある人々の集合は完全に異なることがある。同様に、コンピュータによって実行される単純なキーワード検索は、単にあるトピックに言及しているだけであったり、あるいは論じているトピックについて実際に知識があるのではないかもしれないアカウントの膨大な数の偽陽性を引き出すことがありうる。さらに、より高度なコンピュータ・ベースの解析も、所与のトピックについて別の人が知識があると考えられうるかどうかに関して知識のある人の人間判断に頼ることほど効果的ではないことがありうる。 A further difficulty in this space is identifying social media accounts that are knowledgeable about a given topic. It is impractical and virtually impractical to try to identify different accounts where an individual is knowledgeable about a topic that is squeezing thousands or even millions of social media accounts. Moreover, the set of knowledgeable people who can only recognize knowledgeable social media posts on any given topic can be completely different. Similarly, a simple keyword search performed by a computer is a huge number of accounts that may simply refer to a topic or may not actually know the topic being discussed. It can lead to false positives. Moreover, more sophisticated computer-based analysis may not be as effective as relying on the human judgment of a knowledgeable person as to whether another person may be considered knowledgeable on a given topic.

本開示は、ソーシャル・メディア・アカウントをセンサーとして使うことに関しうる。それにより、所与のソーシャル・メディア・アカウントが知識のあるアカウントでありうるか否かを判定するための基礎として、人間判断が間接的に使用されうる。具体的には、所与のトピックについて知識がある人々は、他のどの人々が同じトピックについて知識があるかを知っており、認識する可能性が高い。さらに、所与のトピックについて知識がある人々は、やはりそのトピックについて知識がある他者からの情報を、たとえばその刊行物を読んだりそのソーシャル・メディア投稿をフォローしたりすることにより、求める可能性が高い。たとえば、あるトピックについて知識があるとわかっているアカウントである一つまたは複数のシード・ソーシャル・メディア・アカウントから出発して、フォローしているおよびフォローされているアカウントのリストが集積されてもよい。任意的に、一般的なおよび/または個人でないソーシャル・メディア・アカウントは該リストから除去されてもよい。すでにシード・アカウントになっているのでない、シード・アカウントによってフォローされているアカウントについて、それが知識のあるアカウントであるかどうかを判定するために、そのアカウントに対して解析が実行されてもよい。それが知識のあるアカウントであれば(たとえば、そのアカウントが問題のトピックについての学術刊行物の著者に関連付けられている場合)、そのアカウントはシード・アカウントとして追加されてもよい。このようにして、あるトピックについて実際に知識のある人々が、やはり知識がある他のアカウントを識別するために、(その人々がフォローしているソーシャル・メディア・アカウントを介して)間接的に使用される。さらに、これは、人間ではできない仕方でコンピュータを使う様式で行なわれる。こうして、本開示におけるシステムおよび方法は、人によって合理的には実行できない、技術から生じる問題に対する技術的解決策を提供する。さらに、人の判断および知識を活用するハイブリッド・システムの実装を通じて、コンピュータによって以前には実行されなかったタスクの自動化された処理を許容する。 This disclosure may relate to using a social media account as a sensor. Thereby, human judgment can be indirectly used as a basis for determining whether a given social media account can be a knowledgeable account. Specifically, those who are knowledgeable about a given topic are likely to know and recognize which other people are knowledgeable about the same topic. In addition, people who are knowledgeable about a given topic may seek information from others who are also knowledgeable about the topic, for example by reading the publication or following the social media post. Is high. For example, a list of followers and followers may be aggregated starting from one or more seeded social media accounts that are known to be knowledgeable about a topic. .. Optionally, general and / or non-personal social media accounts may be removed from the list. For accounts that are being followed by a seed account that are not already seed accounts, analysis may be performed on that account to determine if it is a knowledgeable account. .. If it is a knowledgeable account (for example, if the account is associated with the author of an academic publication on the topic in question), the account may be added as a seed account. In this way, people who are actually knowledgeable about a topic use it indirectly (through the social media accounts they follow) to identify other accounts that are also knowledgeable. Will be done. Moreover, this is done in a way that computers are used in ways that humans cannot. Thus, the systems and methods in this disclosure provide technical solutions to problems arising from technology that cannot be reasonably implemented by humans. In addition, through the implementation of hybrid systems that leverage human judgment and knowledge, it allows automated processing of tasks that were not previously performed by computers.

上記で論じたように、所与のトピックの知識をもつ研究者、教授、専門家その他は世界中に位置しており、たえず新たなアイデアを生成し、共有している。これらの知識のある人の多くはツイッターのようなソーシャル・メディアを、最新の分野固有知識を学ぶために利用可能な情報資源と見なす。ソーシャル・メディアを通じて共有される情報および知識の豊富さのため、特定分野の学習者のような人にとって、あるトピックについて知識があるさまざまなアカウントを識別することは難しいことがある。 As discussed above, researchers, professors, experts and others with knowledge of a given topic are located all over the world and are constantly generating and sharing new ideas. Many of these knowledgeable people view social media such as Twitter as an available resource for learning the latest discipline-specific knowledge. Due to the abundance of information and knowledge shared through social media, it can be difficult for someone like a learner in a particular discipline to identify different accounts that are knowledgeable about a topic.

本開示は、ソーシャル・メディア・アカウント型に基づくソーシャル・メディア・アカウントおよびソーシャル・メディア・コンテンツの相互に補強するランキングに関しうる。前提は、分野固有の専門知識をもつ(すなわち所与のトピックにおいて知識のある)ソーシャル・メディア・ユーザーはその分野における高品質のコンテンツをプロモーションする可能性が高く、ある分野における高品質のコンテンツは分野固有の専門知識をもつソーシャル・メディア・ユーザーによってプロモーションされるということである。具体的には、コンテンツ(たとえば記事)が分野固有の専門知識をもつより多くの良質のソーシャル・メディア・アカウントによって公開または共有される場合、そのコンテンツはその分野における良質のまたは高品質のコンテンツであると結論しうる。さらに、あるソーシャル・メディア・アカウントがある分野における良質なコンテンツ(たとえば良質の記事)を一貫して公開しているまたは共有している場合には、そのソーシャル・メディア・アカウントは、分野固有の専門知識をもつ良質のソーシャル・メディア・アカウントであると結論しうる。本開示のいくつかの実施形態は、ソーシャル・メディア・アカウント型に基づいて、ある分野における良質または高品質のコンテンツと、分野固有の専門知識をもつ良質のソーシャル・メディア・アカウントとの相互に補強するランキングを提供する。 The present disclosure may relate to mutually reinforcing rankings of social media accounts and social media content based on the social media account type. The premise is that social media users with discipline-specific expertise (ie, knowledgeable on a given topic) are likely to promote high-quality content in that discipline, and high-quality content in a discipline It is promoted by social media users with discipline-specific expertise. Specifically, if content (eg, an article) is published or shared by more quality social media accounts with discipline-specific expertise, that content is of good or high quality content in that discipline. We can conclude that there is. In addition, if a social media account consistently publishes or shares good content (eg, good articles) in a discipline, that social media account is a discipline-specific specialty. You can conclude that it is a good quality social media account with knowledge. Some embodiments of the present disclosure are based on the social media account type and are mutually reinforcing between good quality or high quality content in a discipline and good quality social media accounts with discipline-specific expertise. Provide rankings to do.

本開示の実施形態は、付属の図面を参照して説明される。 Embodiments of the present disclosure will be described with reference to the accompanying drawings.

図1は、本開示に記載される少なくとも一つの実施形態に従って構成された、情報を識別し、抽出するよう構成された例示的システム100を表わす図である。システム100は、ネットワーク102、情報収集システム110、刊行物システム120、ソーシャル・メディア・システム130、装置140およびウェブ・ホスティング・システム150を含んでいてもよい。 FIG. 1 is a diagram illustrating an exemplary system 100 configured to identify and extract information, configured according to at least one embodiment described in the present disclosure. The system 100 may include a network 102, an information gathering system 110, a publication system 120, a social media system 130, a device 140 and a web hosting system 150.

ネットワーク102は、情報収集システム110、刊行物システム120、ソーシャル・メディア・システム130、装置140およびウェブ・ホスティング・システム150を通信上結合するよう構成されていてもよい。いくつかの実施形態では、ネットワーク102は、装置間で通信を送受信するよう構成された任意のネットワークまたは諸ネットワークの構成を含んでいてもよい。いくつかの実施形態では、ネットワーク102は通常型ネットワーク、有線もしくは無線ネットワークを含んでいてもよく、数多くの異なる構成を有しうる。さらに、ネットワーク102は、ローカル・エリア・ネットワーク(LAN)、広域ネットワーク(WAN)(たとえばインターネット)または他の相互接続されたデータ経路であってそれを通じて複数の装置および/またはエンティティが通信しうるものを含んでいてもよい。いくつかの実施形態では、ネットワーク102は、ピアツーピア・ネットワークを含んでいてもよい。ネットワーク102は、多様な異なる通信プロトコルでデータを送るために遠隔通信ネットワークの諸部分に結合されていてもよく、あるいは該諸部分を含んでいてもよい。いくつかの実施形態では、ネットワーク102は、通信および/またはデータを送受信するためにブルートゥース(登録商標)通信ネットワークまたはセルラー通信ネットワークを含んでいてもよい。そのような送受信は、ショート・メッセージ・サービス(SMS)、マルチメディア・メッセージング・サービス(MMS)、ハイパーテキスト転送プロトコル(HTTP)、直接データ接続、無線アプリケーション・プロトコル(WAP)、電子メールおよび/またはその他を介してのものを含む。ネットワーク102は、第三世代(3G)、第四世代(4G)、ロングタームエボリューション(LTE)、ロングタームエボリューションアドバンスト(LTE-A)、LTEを通じた音声(「VoLTE」)または他の任意のモバイル・データ・ネットワークもしくは諸モバイル・データ・ネットワークの組み合わせを含んでいてもよい。さらに、ネットワーク102は、一つまたは複数のIEEE802.11無線ネットワークを含んでいてもよい。 The network 102 may be configured to communically combine an information gathering system 110, a publication system 120, a social media system 130, a device 140 and a web hosting system 150. In some embodiments, the network 102 may include any network or network configuration configured to send and receive communications between devices. In some embodiments, the network 102 may include a conventional network, a wired or wireless network, and may have many different configurations. In addition, network 102 is a local area network (LAN), wide area network (WAN) (eg, the Internet) or other interconnected data path through which multiple devices and / or entities can communicate. May include. In some embodiments, the network 102 may include a peer-to-peer network. The network 102 may or may be coupled to parts of the remote communication network to send data in a variety of different communication protocols. In some embodiments, the network 102 may include a Bluetooth® communication network or a cellular communication network for communicating and / or transmitting and receiving data. Such transmissions and receptions include Short Message Service (SMS), Multimedia Messaging Service (MMS), Hypertext Transfer Protocol (HTTP), Direct Data Connection, Wireless Application Protocol (WAP), Email and / or Including those via others. Network 102 includes 3rd Generation (3G), 4th Generation (4G), Long Term Evolution (LTE), Long Term Evolution Advanced (LTE-A), Voice over LTE (“VoLTE”) or any other mobile. It may include a combination of data networks or mobile data networks. Further, the network 102 may include one or more IEEE 802.11 wireless networks.

いくつかの実施形態では、情報収集システム110、刊行物システム120、ソーシャル・メディア・システム130およびウェブ・ホスティング・システム150の任意のものは、ハードウェアの任意の構成、たとえば一緒にネットワーク接続されタスクを実行するよう構成されている諸サーバーおよび諸データベースを含んでいてもよい。たとえば、情報収集システム110、刊行物システム120、ソーシャル・メディア・システム130およびウェブ・ホスティング・システム150はそれぞれ複数のコンピューティング・システム、たとえば複数のサーバーであって、一緒にネットワーク接続されて本開示において記載される動作を実行するおよび/または該動作の実行を制御するよう構成されたものを含んでいてもよい。いくつかの実施形態では、情報収集システム110、刊行物システム120、ソーシャル・メディア・システム130およびウェブ・ホスティング・システム150の任意のものは、本開示において記載される動作を実行するおよび/または該動作の実行を制御するよう一つまたは複数の装置によって実行されるよう構成されているコンピュータ可読命令を含んでいてもよい。 In some embodiments, any of the information gathering system 110, publication system 120, social media system 130 and web hosting system 150 can be configured with any hardware configuration, eg, networked together and tasked. May include servers and databases that are configured to run. For example, the information gathering system 110, the publication system 120, the social media system 130, and the web hosting system 150 are each a plurality of computing systems, for example, a plurality of servers, which are networked together and disclosed in the present disclosure. It may include those configured to perform and / or control the execution of the operations described in. In some embodiments, any of the information gathering system 110, publication system 120, social media system 130 and web hosting system 150 perform the actions described in this disclosure and / or said. It may include computer-readable instructions that are configured to be executed by one or more devices to control the execution of operations.

情報収集システム110は、データ記憶部112を含んでいてもよい。データ記憶部112は、データ・オブジェクトに基づく構造をもつ、情報収集システム110内のデータベースを含んでいてもよい。たとえば、データ記憶部112は、種々のフィールドをもつ複数のデータ・オブジェクトを含んでいてもよい。いくつかの実施形態では、データ記憶部112は、著作者オブジェクト114、ソーシャル・メディア・アカウント・オブジェクト116および個人ウェブページ・オブジェクト118を含んでいてもよい。 The information collection system 110 may include a data storage unit 112. The data storage unit 112 may include a database in the information collection system 110 having a structure based on a data object. For example, the data storage unit 112 may include a plurality of data objects having various fields. In some embodiments, the data storage unit 112 may include an author object 114, a social media account object 116, and a personal web page object 118.

一般に、情報収集システム110は、刊行物、たとえば刊行物システム120からの論文、レクチャーおよび他の刊行物の著作者情報を取得するよう構成されていてもよい。その著作者情報を使って、情報収集システム110は、該著作者に関連したソーシャル・メディア・アカウントを判別し、ソーシャル・メディア・システム130から該ソーシャル・メディア・アカウントからの情報をプルすることができるとともに、該著作者に関連した個人学術ウェブページを判別し、ウェブ・ホスティング・システム150から該個人学術ウェブページからの情報をプルすることができる。情報収集システム110は、ソーシャル・メディア・アカウントおよび/または個人学術ウェブページからの情報を組織化し、装置140に提供してもよい。それにより該情報は装置140のディスプレイ142に呈示されうる。 In general, the information gathering system 110 may be configured to acquire author information for publications, such as articles, lectures and other publications from the publication system 120. Using the author information, the information gathering system 110 may determine the social media account associated with the author and pull information from the social media account from the social media system 130. At the same time, the personal academic web page associated with the author can be identified and information from the personal academic web page can be pulled from the web hosting system 150. The information gathering system 110 may organize information from social media accounts and / or personal academic web pages and provide it to device 140. Thereby, the information can be presented on the display 142 of the device 140.

刊行物システム120は、論文、刊行物、ジャーナル、レクチャーおよび他のデジタル文書をホストする複数のシステムを含んでいてもよい。刊行物システム120の複数のシステムは、みな情報を提供するメディアをホストするというほかは関係していなくてもよい。たとえば、刊行物システム120のあるシステムは、大学の教授のレクチャーおよび論文をホストする大学ウェブサイトを含んでいてもよい。刊行物システム120の別のシステムは、ジャーナルで発表された論文をホストするウェブサイトを含んでいてもよい。これらおよび他の実施形態において、諸刊行物システム120は、ウェブサイト、サーバー、ホスティング・ドメインまたは所有者を共有していてもいなくてもよい。 The publication system 120 may include a plurality of systems for hosting articles, publications, journals, lectures and other digital documents. The plurality of systems in the publication system 120 may not all be involved except that they host media that provide information. For example, one system of publication system 120 may include a university website hosting lectures and dissertations by university professors. Another system of publication system 120 may include a website hosting articles published in the journal. In these and other embodiments, the publication system 120 may or may not share a website, server, hosting domain or owner.

いくつかの実施形態では、情報収集システム110は、諸刊行物システム120の一つまたは複数にアクセスして、刊行物システム120からデジタル文書を取得してもよい。それらのデジタル文書を使って、情報収集システム110はデジタル文書の著作者およびデジタル文書のトピックについての情報を取得してもよい。いくつかの実施形態では、デジタル文書の各著作者について、情報収集システム110はデータ記憶部112において著作者オブジェクト114を生成してもよい。生成された著作者オブジェクト114において、情報収集システム110はデジタル文書から得られた著作者についての情報を格納してもよい。該情報は、名前、プロフィール、画像、デジタル文書の共著者、著作者の所属(たとえば著作者が所属する大学または著作者が雇用されている企業)を含んでいてもよい。情報収集システム110は、デジタル文書のトピックを判別してもよい。デジタル文書のトピックは著作者オブジェクト114に格納されてもよい。 In some embodiments, the information gathering system 110 may access one or more of the publication systems 120 to obtain digital documents from the publication system 120. Using those digital documents, the information gathering system 110 may obtain information about the author of the digital document and the topic of the digital document. In some embodiments, for each author of a digital document, the information gathering system 110 may generate an author object 114 in the data storage unit 112. In the generated author object 114, the information gathering system 110 may store information about the author obtained from the digital document. The information may include names, profiles, images, co-authors of digital documents, and affiliations of authors (eg, the university to which the author belongs or the company in which the author is employed). The information gathering system 110 may determine the topic of the digital document. The topic of the digital document may be stored in the author object 114.

いくつかの実施形態では、刊行物システム120からの複数のデジタル文書が同じ著作者を含むことがある。これらおよび他の実施形態において、その著作者についての著作者オブジェクト114が、他のデジタル文書からの情報をもって更新および/または補足されてもよい。たとえば、他のデジタル文書からのトピックが著作者オブジェクト114に格納されてもよい。いくつかの実施形態では、情報収集システム110によって得られたある著作者のデジタル文書全部のトピックが著作者オブジェクト114に格納されてもよい。 In some embodiments, multiple digital documents from publication system 120 may include the same author. In these and other embodiments, the author object 114 for the author may be updated and / or supplemented with information from other digital documents. For example, topics from other digital documents may be stored in the author object 114. In some embodiments, the topic of the entire digital document of an author obtained by the information gathering system 110 may be stored in the author object 114.

著作者オブジェクト114を生成した後、情報収集システム110は著作者オブジェクト114における各著作者についてのソーシャル・メディア・アカウントを判別するよう構成されていてもよい。情報収集システム110は、ソーシャル・メディア・システム130にアクセスすることによってソーシャル・メディア・アカウントを判別してもよい。追加的または代替的に、情報収集システム110は、著作者オブジェクト114における各著作者について個人学術ウェブページを判別するよう構成されていてもよい。情報収集システム110は、ウェブ・ホスティング・システム150にアクセスすることによってソーシャル・メディア・アカウントを判別してもよい。これらおよび他の実施形態において、情報システム110は、ある著作者のソーシャル・メディア・アカウントと個人学術ウェブページを相互検証してもよい。 After generating the author object 114, the information gathering system 110 may be configured to determine a social media account for each author in the author object 114. The information gathering system 110 may determine the social media account by accessing the social media system 130. Additional or alternative, the information gathering system 110 may be configured to identify a personal scholarly web page for each author in the author object 114. The information gathering system 110 may determine the social media account by accessing the web hosting system 150. In these and other embodiments, the information system 110 may cross-validate a social media account of an author with a personal scholarly web page.

いくつかの実施形態では、各ソーシャル・メディア・システム130は、異なるソーシャル・メディアをホストするよう構成されたシステムを含んでいてもよい。たとえば、ソーシャル・メディア・システム130の一つは、マイクロブログ・ソーシャル・メディア・システムを含んでいてもよい。ソーシャル・メディア・システム130の別のものは、ブログ・ソーシャル・メディア・システムを含んでいてもよい。ソーシャル・メディア・システム130の別のものは、ソーシャル・ネットワークまたは他の型のソーシャル・メディア・システムを含んでいてもよい。ソーシャル・メディア・システム130の別のものは、刊行物収集ソーシャル・メディア・システムを含んでいてもよい。 In some embodiments, each social media system 130 may include a system configured to host different social media. For example, one of the social media systems 130 may include a microblogging social media system. Another of the social media systems 130 may include a blog social media system. Another of the social media systems 130 may include social networks or other types of social media systems. Another of the social media systems 130 may include a publication collection social media system.

情報収集システム110は、各ソーシャル・メディア・システム130に、それぞれのソーシャル・メディア・アカウントで著作者オブジェクト114における各著作者の名前を検索するよう要求してもよい。たとえば、情報収集システム110は何千、何万または何十万の著作者オブジェクト114を含んでいてもよく、各著作者オブジェクト114は一人の著作者の名前を含む。この例では、著作者らが情報を共有しうるソーシャル・メディア・システム130が四つあってもよい。ソーシャル・メディア・システム130の数は四つより多かったり、あるいは少なかったりしてもよい。これらおよび他の実施形態において、情報収集システム110は、四つのソーシャル・メディア・システム130のそれぞれにおいて、各著作者オブジェクト114に関連付けられた著作者の名前を使って検索が実行されることを要求してもよい。こうして、四つのソーシャル・メディア・システム130および10万人の著作者があったとすると、ソーシャル・メディア・システム110は40万の検索を要求しうる。ソーシャル・メディア・システム130は検索の結果を情報収集システム110に提供してもよい。これらおよび他の実施形態において、検索の結果は、著作者オブジェクト114の著作者の名前に少なくとも部分的に一致する名前をもつ所有者のソーシャル・メディア・アカウントのリンクおよび/またはネットワーク・アドレスを含んでいてもよい。 The information gathering system 110 may require each social media system 130 to search for the name of each author in the author object 114 in their respective social media account. For example, the information gathering system 110 may include thousands, tens of thousands, or hundreds of thousands of author objects 114, where each author object 114 contains the name of one author. In this example, there may be four social media systems 130 with which the authors can share information. The number of social media systems 130 may be more or less than four. In these and other embodiments, the information gathering system 110 requires that each of the four social media systems 130 perform a search using the name of the author associated with each author object 114. You may. Thus, given that there are four social media systems 130 and 100,000 authors, the social media system 110 can request 400,000 searches. The social media system 130 may provide the search results to the information gathering system 110. In these and other embodiments, the search results include the link and / or network address of the owner's social media account with a name that at least partially matches the name of the author of author object 114. You may be.

検索からのソーシャル・メディア・アカウントのリンクおよび/またはネットワーク・アドレスを使って、情報収集システム110はソーシャル・メディア・アカウントを要求してもよい。情報収集システム110はまた、各ソーシャル・メディア・アカウントについてソーシャル・メディア・アカウント・オブジェクト116を生成してもよい。ソーシャル・メディア・アカウント・オブジェクト116を生成するために、情報収集システム110はソーシャル・メディア・アカウントから情報をプルし、ソーシャル・メディア・アカウント・オブジェクト116に該情報を格納してもよい。ソーシャル・メディア・アカウント・オブジェクト116は、ソーシャル・メディア・アカウントに関連付けられている人についての情報、たとえば名前、プロフィール・データ、画像および/またはソーシャル・メディア連絡先を含んでいてもよい。情報収集システム110は、ソーシャル・メディア・アカウントにおける投稿のトピックをも取得してもよく、それもソーシャル・メディア・アカウント・オブジェクト116に格納されてもよい。 The information gathering system 110 may request a social media account using the social media account link and / or network address from the search. The information gathering system 110 may also generate a social media account object 116 for each social media account. To generate the social media account object 116, the information gathering system 110 may pull information from the social media account and store the information in the social media account object 116. The social media account object 116 may include information about the person associated with the social media account, such as name, profile data, images and / or social media contacts. The information gathering system 110 may also acquire the topic of the post in the social media account, which may also be stored in the social media account object 116.

いくつかの実施形態では、各ウェブ・ホスティング・システム150は種々のウェブページをホストするよう構成されたシステムを含んでいてもよい。たとえば、ウェブ・ホスティング・システム150の一つは、大学またはカレッジに関連する教員または他の人に割かれた一つまたは複数のウェブページを含む大学またはカレッジのウェブ・ホスティング・システムを含んでいてもよい。ウェブ・ホスティング・システム150の別のものは、企業または私的エンティティに雇用されているまたは他の仕方で関連している人に割かれた一つまたは複数のウェブページを含む企業または他の私的なエンティティのウェブ・ホスティング・システムを含んでいてもよい。ウェブ・ホスティング・システム150の別のものは、個人のウェブ・ホスティング・システムを含んでいてもよい。 In some embodiments, each web hosting system 150 may include a system configured to host various web pages. For example, one of the web hosting systems 150 includes a college or college web hosting system that includes one or more web pages devoted to faculty or others associated with the college or college. May be good. Another of the web hosting system 150 is a company or other me that contains one or more web pages that are devoted to someone who is employed or otherwise associated with a company or private entity. Entity web hosting system may be included. Another of the web hosting system 150 may include a personal web hosting system.

情報収集システム110は、著作者オブジェクト114における各著作者の名前に基づいて、ウェブページの検索を実行するよう、一般的な検索エンジンに要求してもよい。追加的または代替的に、情報収集システム110は、著作者オブジェクト114における各著作者の名前およびその著作者の所属に基づいて、ウェブページの検索を実行するよう、一般的な検索エンジンに要求してもよい。たとえば、情報収集システム110は、何千、何万または何十万の著作者オブジェクト114を含んでいてもよく、各著作者オブジェクト114は、一人の著作者の名前および任意的にはその著作者の所属を含む。よって、10万人の著作者がいたとすると、情報収集システム110は20万の検索を要求してもよい(著作者の名前についての検索10万と著作者の名前および所属についての検索10万)。ウェブ・ホスティング・システム150は検索の結果を情報収集システム110に提供してもよい。これらおよび他の実施形態において、検索の結果は、個人学術ウェブページ候補のリンクおよび/または一様リソース位置指定子(URL)を含んでいてもよい。 The information gathering system 110 may request a general search engine to perform a search for a web page based on the name of each author in the author object 114. Additional or alternative, the information gathering system 110 requires a common search engine to perform a search for a web page based on the name of each author in the author object 114 and the affiliation of that author. You may. For example, the information gathering system 110 may include thousands, tens of thousands, or hundreds of thousands of author objects 114, where each author object 114 is the name of one author and optionally its author. Including the affiliation of. Therefore, if there are 100,000 authors, the information gathering system 110 may request 200,000 searches (100,000 searches for author names and 100,000 searches for author names and affiliations). ). The web hosting system 150 may provide the search results to the information gathering system 110. In these and other embodiments, the search results may include links for personal academic web page candidates and / or uniform resource location specifiers (URLs).

個人学術ウェブページ候補のリンクおよび/またはURLを使って、情報収集システム110は、個人学術ウェブページ候補を要求してもよい。情報収集システム110は、個人学術ウェブページ候補のそれぞれについて個人学術ウェブページ・オブジェクト118を生成してもよい。個人学術ウェブページ・オブジェクト118を生成するために、情報収集システム110は、個人学術ウェブページ候補から情報をプルして、該情報を個人学術ウェブページ・オブジェクト118に格納してもよい。個人学術ウェブページ・オブジェクト118は、個人学術ウェブページ候補に関連付けられた人についての情報、たとえば名前、刊行物、キーワード、トピック、所属、ソーシャル、画像および/またはその他を含んでいてもよい。いくつかの実施形態では、個人学術ウェブページ候補は、たとえば図9aおよび図9bの方法900において記述されるようなさまざまな属性についてパースされ、あるいは他の仕方で解析されてもよい。 The information gathering system 110 may request a personal academic web page candidate using the link and / or URL of the personal academic web page candidate. The information gathering system 110 may generate a personal academic web page object 118 for each of the personal academic web page candidates. In order to generate the personal academic web page object 118, the information gathering system 110 may pull information from the personal academic web page candidates and store the information in the personal academic web page object 118. The personal academic web page object 118 may include information about a person associated with a personal academic web page candidate, such as a name, publication, keyword, topic, affiliation, social, image and / or others. In some embodiments, personal academic web page candidates may be parsed or otherwise analyzed for various attributes as described, for example, in Method 900 of FIGS. 9a and 9b.

情報収集システム110は、著作者オブジェクト114からの情報を、ソーシャル・メディア・アカウント・オブジェクト116および/または個人学術ウェブページ・オブジェクト118からの情報と比較して、著作者オブジェクト114における著作者に関連するソーシャル・メディア・アカウントおよび/または個人学術ウェブページを判別してもよい。たとえば、所与の著作者オブジェクト114について、ソーシャル・メディア・システム130の検索は25個のアカウントを返してもよい。25個のアカウントのソーシャル・メディア・アカウント・オブジェクト116が所与の著作者オブジェクト114および個人ウェブページ・オブジェクト118と比較されて、25個のソーシャル・メディア・アカウントのうちのどれと個人学術ウェブページ候補のどれが所与の著作者オブジェクト114の著作者に関連しているかを判別してもよい。いくつかの実施形態では、著作者がソーシャル・メディア・アカウントに関連していることがありうるのは、その著作者がそのソーシャル・メディア・アカウントの所有者であるときである。いくつかの実施形態では、著作者オブジェクト114の著作者に関連したソーシャル・メディア・アカウントおよび個人ウェブページは、そのソーシャル・メディア・アカウントおよびその個人ウェブページの両方がその著作者に関連していることがありうることを、より高い信頼レベルで確認するために、相互検証されてもよい。そのような相互検証のさまざまな例は図7および図10~図14に関してより詳細に述べる。 The information gathering system 110 compares the information from the author object 114 with the information from the social media account object 116 and / or the personal academic web page object 118 and is relevant to the author in the author object 114. You may determine which social media account and / or personal academic web page you are. For example, for a given author object 114, a search on social media system 130 may return 25 accounts. 25 social media account objects 116 are compared to a given author object 114 and personal web page object 118, which of the 25 social media accounts and personal academic web pages It may be determined which of the candidates is associated with the author of a given author object 114. In some embodiments, an author may be associated with a social media account when the author is the owner of the social media account. In some embodiments, the social media account and personal web page associated with the author of author object 114 is such that both the social media account and the personal web page are associated with the author. Mutual verification may be done to confirm at a higher level of confidence that this is possible. Various examples of such mutual verification are described in more detail with respect to FIGS. 7 and 10-14.

ソーシャル・メディア・アカウントを刊行物システム120からのデジタル文書からの著作者と、個人ウェブページとの相互検証によることも含めてマッチングさせた後、情報収集システム110は、マッチするソーシャル・メディア・アカウントから情報を得てもよい。これらおよび他の実施形態において、情報収集システム110は、ソーシャル・メディア・アカウントを要求し、該ソーシャル・メディア・アカウントをパースして、ソーシャル・メディア・アカウントからの情報を得てもよい。情報収集システム110は、ソーシャル・メディア・アカウントからの情報を照合し、該情報をトピックに基づいて組織化して、該情報を情報収集システム110のユーザーに提供してもよい。たとえば、情報収集システム110は該情報を装置140に提供してもよい。 After matching the social media account, including by mutual verification between the author from the digital document from the publication system 120 and the personal web page, the information gathering system 110 will match the social media account. You may get information from. In these and other embodiments, the information gathering system 110 may request a social media account and parse the social media account to obtain information from the social media account. The information gathering system 110 may collate information from social media accounts, organize the information on a topic basis, and provide the information to users of the information gathering system 110. For example, the information gathering system 110 may provide the information to the device 140.

装置140は、情報収集システム110のユーザーに関連付けられていてもよい。これらおよび他の実施形態において、装置140はいかなる型のコンピューティング・システムを含んでいてもよい。たとえば、装置140はデスクトップ・コンピュータ、タブレット・コンピュータ、携帯電話、スマートフォンまたは他の何らかのコンピュータ・システムを含んでいてもよい。装置140は、ウェブ・ブラウザーをサポートしうるオペレーティング・システムを含んでいてもよい。ウェブ・ブラウザーを通じて、装置140は、情報収集システム110がソーシャル・メディア・システム130のソーシャル・メディア・アカウントから収集した情報を含むウェブページを情報収集システム110に要求してもよい。要求されたウェブページは、装置140のユーザーへの呈示のために装置140のディスプレイ142に表示されてもよい。 The device 140 may be associated with a user of the information gathering system 110. In these and other embodiments, the device 140 may include any type of computing system. For example, device 140 may include a desktop computer, tablet computer, mobile phone, smartphone or any other computer system. The device 140 may include an operating system capable of supporting a web browser. Through a web browser, the device 140 may request the information gathering system 110 for a web page containing information collected by the information gathering system 110 from the social media account of the social media system 130. The requested web page may be displayed on the display 142 of the device 140 for presentation to the user of the device 140.

いくつかの実施形態では、情報収集システム110は、所与のトピックについての著作者の部分集合のソーシャル・メディア・アカウントから情報を取得し、著作者の前記部分集合に基づいてその情報を呈示してもよい。これらおよび他の実施形態において、ソーシャル・メディア・アカウントは、どのソーシャル・メディア・アカウントがその部分集合に含められてもよいかを識別するためのセンサーとして使われてもよい。たとえば、所与のトピックについて知識がある人物であるとわかっている人々に関連付けられた一つまたは複数のシード・ソーシャル・メディア・アカウントから始めて、それらの知識のある人物によってフォローされているソーシャル・メディア・アカウントのリストが得られてもよい。そのリストから、すでにシード・アカウントであるソーシャル・メディア・アカウントが除去されてもよい。任意的にはまた、全般的なソーシャル・メディア・アカウントを除去する。これらおよび他の実施形態において、リストにおける残りのソーシャル・メディア・アカウントが、知識のあるソーシャル・メディア・アカウントであるかどうかを判定するために解析され、もしそうであれば、シード・ソーシャル・メディア・アカウントとして追加されてもよい。本開示と整合するそのようなプロセスは図16aから図18においてさらに詳細に述べる。 In some embodiments, the information gathering system 110 obtains information from a social media account of a subset of authors on a given topic and presents that information based on said subset of authors. You may. In these and other embodiments, the social media account may be used as a sensor to identify which social media account may be included in its subset. For example, starting with one or more seed social media accounts associated with people who are known to be knowledgeable about a given topic, and being followed by those knowledgeable people. A list of media accounts may be obtained. Social media accounts that are already seed accounts may be removed from the list. Optionally, also remove general social media accounts. In these and other embodiments, the remaining social media accounts in the list are analyzed to determine if they are knowledgeable social media accounts, and if so, seed social media. -May be added as an account. Such processes consistent with the present disclosure are described in more detail in FIGS. 16a-18.

これらおよび他の実施形態において、学習者アカウントであるソーシャル・メディア・アカウントの別の集合が生成されてもよい。たとえば、所与のトピックについて知識のある人物であるとわかっている人々に関連する一つまたは複数のシード・ソーシャル・メディア・アカウントから始めて、それらの知識のある人物をフォローしているソーシャル・メディア・アカウントのリストが得られてもよい。そのリストから、すでにシード・アカウントであるソーシャル・メディア・アカウントが除去されてもよい。任意的にはまた、全般的なソーシャル・メディア・アカウントを除去する。これらおよび他の実施形態において、リストにおける残りのソーシャル・メディア・アカウントが、当該トピックに関心をもっているかどうかを判定するために解析され、もしそうであれば、そのトピックについて学習しようとしている者に関連するソーシャル・メディア・アカウントの第二のリストに追加されてもよい。 In these and other embodiments, another set of social media accounts, which are learner accounts, may be generated. For example, starting with one or more seed social media accounts related to people who are known to be knowledgeable about a given topic, social media following those knowledgeable people. -A list of accounts may be obtained. Social media accounts that are already seed accounts may be removed from the list. Optionally, also remove general social media accounts. In these and other embodiments, the remaining social media accounts in the list are analyzed to determine if they are interested in the topic, and if so, relevant to those who are trying to learn about that topic. May be added to the second list of social media accounts.

いくつかの実施形態では、アカウントが一部をなしているそれぞれのグループに基づいて、第一のコンテンツがシード・ソーシャル・メディア・アカウントに送達されてもよく、第二のコンテンツが前記第二のリストのソーシャル・メディア・アカウントに送達されてもよい。たとえば、シード・ソーシャル・メディア・アカウントは知識ある人物に関連していることがあり、当該トピックについての学術刊行物や書籍の章がシード・ソーシャル・メディア・アカウントには最も好適でありうる。一方、前記第二の集合の学習ソーシャル・メディア・アカウントについては、レクチャー・ノートまたはデモ・ビデオのような、それほど厳格でない素材がより好適であることがある。 In some embodiments, the first content may be delivered to the seed social media account based on each group of which the account is part, and the second content is said to be the second. It may be served to the social media account on the list. For example, a seed social media account may be associated with a knowledgeable person, and academic publications and book chapters on the topic may be most suitable for a seed social media account. On the other hand, less rigorous material, such as lecture notes or demo videos, may be more suitable for the second set of learning social media accounts.

いくつかの実施形態では、情報収集システム110は、ソーシャル・メディア・アカウント型に基づいてソーシャル・メディア・アカウントおよびソーシャル・メディア・コンテンツの相互に補強するランキングを決定してもよい。情報収集システム110は、分野固有の知識(たとえば所与のトピックにおける知識)をもつ拡張されたシード・ソーシャル・メディア・アカウントを入力として受けてもよい。拡張されたシード・ソーシャル・メディア・アカウントは、所与のトピックについて知識のある人であることがわかっている人々に関連付けられたシード・ソーシャル・メディア・アカウントと、該知識のある人によってフォローされていてすでにシード・ソーシャル・メディア・アカウントになっているのではないソーシャル・メディア・アカウントとを含む。該知識のある人によってフォローされていてすでにシード・ソーシャル・メディア・アカウントになっているのではないソーシャル・メディア・アカウントは、組織、刊行物、ソフトウェア・ベンダーを含むベンダー、会議などに関連付けられていてもよい。情報収集システム110は、分野固有の知識をもつ前記入力の拡張されたシード・ソーシャル・メディア・アカウントから、ソーシャル・メディア・アカウントのさまざまな型を判別してもよい。たとえば、情報収集システム110は、分野固有の知識をもつソーシャル・メディア・アカウントのさまざまな型を判別するために、判断木のような機械学習ツールを利用してもよい。 In some embodiments, the information gathering system 110 may determine a mutually reinforcing ranking of social media accounts and social media content based on the social media account type. The information gathering system 110 may receive an extended seed social media account as input with field-specific knowledge (eg, knowledge on a given topic). Extended seed social media accounts are followed by seed social media accounts associated with people who are known to be knowledgeable about a given topic, as well as those who are knowledgeable. Includes social media accounts that are not already seed social media accounts. Social media accounts that are followed by the knowledgeable person and are no longer seed social media accounts are associated with organizations, publications, vendors including software vendors, conferences, etc. You may. The information gathering system 110 may discriminate between different types of social media accounts from the extended seeded social media accounts of the input with field-specific knowledge. For example, the information gathering system 110 may utilize machine learning tools such as judgment trees to discriminate between different types of social media accounts with discipline-specific knowledge.

いくつかの実施形態では、情報収集システム110は、ランキングを、ソーシャル・メディア・アカウントと、ソーシャル・メディア・アカウントによってプロモーションされるソーシャル・メディア・コンテンツとの間の相互に補強する関係に基づかせてもよい。たとえば、有用情報に富む(informative)ソーシャル・メディア・アカウントは新鮮で良質なコンテンツをプロモーションすることがあり、良質なコンテンツは有用情報に富むソーシャル・メディア・アカウントによってプロモーションされることがある。情報収集システム110は、ソーシャル・メディア・アカウントと該ソーシャル・メディア・アカウントによってプロモーションされるソーシャル・メディア・コンテンツとの間のリンク強さを、相互に補強する関係の基礎として、決定または計算してもよい。たとえば、それぞれのソーシャル・メディア・アカウントおよびそのソーシャル・メディア・アカウントによってプロモーションされるソーシャル・メディア・コンテンツについて、情報収集システム110はリンク強さ(たとえば該プロモーションの強さ)を計算してもよく、ランキングをそのリンク強さに基づかせてもよい。いくつかの実施形態では、情報収集システム110は、前記リンク強さを使ってソーシャル・メディア・アカウントおよびソーシャル・メディア・コンテンツのランキングを決定するために、判断木のような機械学習ツールを利用してもよい。いくつかの実施形態では、情報収集システム110は、リンクを含むプロモーションを考慮するが、リンクを含まないプロモーションは考慮しないのでもよい。 In some embodiments, the information gathering system 110 bases the ranking on a mutually reinforcing relationship between the social media account and the social media content promoted by the social media account. May be good. For example, an informative social media account may promote fresh, quality content, and good content may be promoted by a useful information-rich social media account. The information gathering system 110 determines or calculates the strength of the link between the social media account and the social media content promoted by the social media account as the basis for a mutually reinforcing relationship. May be good. For example, for each social media account and the social media content promoted by that social media account, the information gathering system 110 may calculate the link strength (eg, the strength of the promotion). The ranking may be based on the link strength. In some embodiments, the information gathering system 110 utilizes a machine learning tool, such as a judgment tree, to determine the ranking of social media accounts and social media content using said link strength. You may. In some embodiments, the information gathering system 110 considers promotions that include links, but may not consider promotions that do not include links.

いくつかの実施形態では、情報収集システム110は、リンク強さを決定する際に前記プロモーションのタイムラインを考慮してもよい。たとえば、時間的により早いプロモーションが、時間的により遅いプロモーションよりも高い重みを与えられてもよい。すなわち、より早いプロモーションに関連するリンク強さは、より遅いプロモーションに関連するリンク強さに比べて、より高い重みを与えられてもよい。もう一つの例として、時間的により近時のプロモーションが、時間的により古いプロモーションよりも、より高い重みを与えられてもよい。さらにもう一つの例として、より新しいまたはより近時のコンテンツのプロモーションが、より古いコンテンツのプロモーションよりも、より高い重みを与えられてもよい。 In some embodiments, the information gathering system 110 may consider the promotion timeline in determining link strength. For example, a promotion that is earlier in time may be given a higher weight than a promotion that is later in time. That is, the link strength associated with the earlier promotion may be given a higher weight than the link strength associated with the later promotion. As another example, a promotion that is more recent in time may be given a higher weight than a promotion that is older in time. As yet another example, promotion of newer or more recent content may be given higher weight than promotion of older content.

いくつかの実施形態では、情報収集システム110は、リンク強さを決定する際にプロモーションの型を考慮してもよい。たとえば、初期のまたはもとのプロモーションは、初期のプロモーションをプロモーションするプロモーションよりも高い重みを与えられてもよい。いくつかの実施形態では、初期のプロモーションをプロモーションするプロモーションからの重みの一部が、初期のプロモーションに与えられ、あるいは移転されてもよい。 In some embodiments, the information gathering system 110 may consider the type of promotion in determining the link strength. For example, an initial or original promotion may be given a higher weight than a promotion that promotes an initial promotion. In some embodiments, some of the weight from the promotion promoting the initial promotion may be given or transferred to the initial promotion.

本開示の範囲から外れることなく、システム100に修正、追加または省略がなされてもよい。たとえば、システム100は、情報収集システム110から情報を取得する複数の他の装置を含んでいてもよい。代替的または追加的に、システム100は一つのソーシャル・メディア・システムを含んでいてもよい。 Modifications, additions or omissions may be made to system 100 without departing from the scope of the present disclosure. For example, the system 100 may include a plurality of other devices that acquire information from the information gathering system 110. Alternatively or additionally, the system 100 may include one social media system.

図2は、本稿に記載される少なくとも一つの実施形態に基づく、情報を識別し、抽出するために使用されうる例示的なフロー200の図である。いくつかの実施形態では、フロー200は、ソーシャル・メディア・アカウントから情報を識別および抽出するよう構成されていてもよい。特に、フロー200は、あるソーシャル・メディア・アカウントがあるデジタル文書の著作者に関連しているかどうかを判定するよう構成されていてもよい。これらおよび他の実施形態において、フロー200の一部または全部は、図1のシステム100の動作の例でありうる。 FIG. 2 is a diagram of an exemplary flow 200 that can be used to identify and extract information based on at least one embodiment described herein. In some embodiments, the flow 200 may be configured to identify and extract information from a social media account. In particular, the flow 200 may be configured to determine if a social media account is associated with the author of a digital document. In these and other embodiments, some or all of the flow 200 may be an example of the operation of system 100 in FIG.

フロー200はブロック210で始まってもよい。ここで、デジタル文書212が取得されてもよい。デジタル文書212は一つまたは複数の源、たとえばウェブサイトまたは他の源から取得されてもよい。デジタル文書212は刊行物、レクチャー、論文または他の文書を含んでいてもよい。いくつかの実施形態では、デジタル文書212は最近の文書、たとえばここ一週間、一か月または数か月など特定の期間内に公表された文書を含んでいてもよい。 The flow 200 may start at block 210. Here, the digital document 212 may be acquired. Digital document 212 may be obtained from one or more sources, such as a website or other sources. Digital document 212 may include publications, lectures, dissertations or other documents. In some embodiments, the digital document 212 may include a recent document, eg, a document published within a specific time period, such as the last week, month or months.

ブロック220では、デジタル文書212の全部または一部の著作者プロフィール・データおよびトピックが、トピック・モデル解析のような方法を使って抽出されてもよい。デジタル文書212の一つまたは複数における著作者についての著作者プロフィール・データは、抽出され、著作者オブジェクト222に格納されてもよい。いくつかの実施形態では、著作者プロフィール・データは、著作者のフルネーム、著作者の所属、著作者の肩書き、共著者、著作者の文書画像および著作者の専門分野もしくは関心領域の記述を含んでいてもよい。著作者の所属は、著作者が関係している企業、大学または他のエンティティに関係していてもよい。著作者の肩書きは、著作者の等級または地位を含んでいてもよい。たとえば、著作者は博士、研究マネージャー、上級研究員、教授、講師および/または他の肩書きを有することがありうる。著作者プロフィール・データを抽出するために、デジタル文書212は、著作者プロフィール・データに関連するキーワードについて、パースされ、検索されてもよい。 At block 220, author profile data and topics of all or part of the digital document 212 may be extracted using methods such as topic model analysis. Author profile data about the author in one or more of the digital documents 212 may be extracted and stored in the author object 222. In some embodiments, the author profile data includes the author's full name, author's affiliation, author's title, co-author, author's documentary image, and description of the author's area of expertise or interest. You may be. The affiliation of the author may be related to the company, university or other entity with which the author is associated. The title of the author may include the grade or status of the author. For example, an author may have a PhD, Research Manager, Senior Researcher, Professor, Lecturer and / or other title. To extract author profile data, digital document 212 may be parsed and searched for keywords related to author profile data.

いくつかの実施形態では、デジタル文書212に対してトピック・モデル解析が実行されてもよい。いくつかの実施形態では、トピック・モデル解析は、判別されうるいくつかのトピックを含んでいてもよく、デジタル文書212はそれらのトピックのうちのどれがデジタル文書212にあるかを判別するために解析されてもよい。これらおよび他の実施形態において、トピック・モデル解析は、各トピックについて、デジタル文書212からの単語分布を出力してもよい。代替的または追加的に、各デジタル文書についての単語分布が決定されてもよい。こうして、各デジタル文書212について一つまたは複数のトピックが決定されてもよい。いくつかの実施形態ではデジタル文書212の一つまたは複数が複数のトピックを含んでいてもよい。いくつかの実施形態では、各デジタル文書212についてのトピックは著作者オブジェクト222に格納されてもよい。 In some embodiments, topic model analysis may be performed on digital document 212. In some embodiments, the topic model analysis may include several topics that can be discerned, the digital document 212 to determine which of those topics is in the digital document 212. It may be analyzed. In these and other embodiments, the topic model analysis may output the word distribution from digital document 212 for each topic. Alternatively or additionally, the word distribution for each digital document may be determined. Thus, one or more topics may be determined for each digital document 212. In some embodiments, one or more of the digital documents 212 may include a plurality of topics. In some embodiments, the topic for each digital document 212 may be stored in the author object 222.

ブロック230において、著作者オブジェクト222からの著作者について、ソーシャル・メディアが検索されてもよい。いくつかの実施形態では、ソーシャル・メディアは、著作者のフルネームを使って検索されてもよい。著作者の検索は、デジタル文書212の著作者によって所有されている、運営されているまたは該著作者に関連していることがありうるソーシャル・メディア・アカウント232を同定しうる。 At block 230, social media may be searched for authors from author object 222. In some embodiments, social media may be searched using the author's full name. The author search may identify a social media account 232 that is owned, operated, or may be related to the author of Digital Document 212.

ブロック240では、ソーシャル・メディア・アカウント232からソーシャル・メディア・プロフィール・データが抽出されてもよい。ソーシャル・メディア・プロフィール・データは著作者データと同様であってもよい。たとえば、ソーシャル・メディア・プロフィール・データは、そのソーシャル・メディア・アカウントを所有している、運営しているまたはそのアカウントに関連付けられている人についての情報を含んでいてもよい。ソーシャル・メディア・アカウントを所有している、運営しているまたはそのアカウントに関連付けられている人は、ソーシャル・メディア・アカウント所有者と称されてもよい。ソーシャル・メディア・プロフィール・データは、ソーシャル・メディア・アカウント所有者についての名前、所属、位置、肩書き、専門分野、ソーシャル・メディア画像、関心領域の記述および/または他の情報を含んでいてもよい。いくつかの実施形態では、ソーシャル・メディア・プロフィール・データは、ソーシャル・メディア・アカウントを所有する人についてのバイオグラフィー、プロフィールまたは他の情報などといった、ソーシャル・メディア・アカウントへの投稿ではないソーシャル・メディア・アカウントからの単語をパースおよび解析することによって収集されてもよい。 At block 240, social media profile data may be extracted from the social media account 232. Social media profile data may be similar to author data. For example, social media profile data may contain information about who owns, operates, or is associated with that social media account. Anyone who owns, operates, or is associated with a social media account may be referred to as a social media account owner. Social media profile data may include name, affiliation, location, title, specialty, social media image, description of areas of interest and / or other information about the social media account holder. .. In some embodiments, social media profile data is social media that is not a post to a social media account, such as a biography, profile or other information about the person who owns the social media account. • May be collected by parsing and parsing words from the account.

いくつかの実施形態では、ソーシャル・メディア・アカウント232につながっているいくつかのソーシャル・メディア・アカウントが判別されてもよい。代替的または追加的に、ソーシャル・メディア・アカウント232につながっているそれらのソーシャル・メディア・アカウントのソーシャル・メディア・アカウント所有者が同定されてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント232によって言及されているいくつかのソーシャル・メディア・アカウントが判別されてもよい。代替的または追加的に、ソーシャル・メディア・アカウント232によって言及されているそれらのソーシャル・メディア・アカウントのソーシャル・メディア・アカウント所有者が同定されてもよい。ソーシャル・メディア・アカウント232につながっているおよび/または言及されているそれらの所有者についての情報は、ソーシャル・メディア相互作用データの一部であってもよい。 In some embodiments, some social media accounts connected to the social media account 232 may be identified. Alternatively or additionally, the social media account owners of those social media accounts linked to the social media accounts 232 may be identified. In some embodiments, some social media accounts referred to by social media account 232 may be identified. Alternatively or additionally, the social media account owners of those social media accounts referred to by social media accounts 232 may be identified. Information about those owners connected to and / or mentioned in social media accounts 232 may be part of social media interaction data.

いくつかの実施形態では、ソーシャル・メディア・アカウント232に言及されているまたはつながっているソーシャル・メディア・アカウントのうちの一つまたは複数についてのソーシャル・メディア・アカウント所有者の専門分野が判別されてもよい。これらまたは他の実施形態において、言及されているまたはつながっているソーシャル・メディア・アカウントがアクセスされてもよい。言及されているまたはつながっているソーシャル・メディア・アカウントの所有者の専門分野が判別されてもよい。いくつかの実施形態では、専門分野は、ソーシャル・メディア・アカウント所有者のプロフィールにおける記述に基づいて判別されてもよい。代替的または追加的に、専門分野は、言及されているまたはつながっているソーシャル・メディア・アカウントの投稿のトピックに基づいて判別されてもよい。 In some embodiments, the area of expertise of the social media account holder for one or more of the social media accounts referred to or connected to the social media account 232 is determined. May be good. In these or other embodiments, the mentioned or connected social media accounts may be accessed. The specialty of the owner of the social media account mentioned or connected may be determined. In some embodiments, the discipline may be determined based on the description in the profile of the social media account holder. Alternatively or additionally, the discipline may be determined based on the topic of postings on social media accounts mentioned or connected.

いくつかの実施形態では、ソーシャル・メディア・アカウント232での投稿のトピックも判別されてもよい。投稿のトピックを判別するためには、閾値単語数より短い投稿は除去されてもよい。閾値単語数はソーシャル・メディアの形に依存してもよい。たとえば、ソーシャル・メディアがマイクロブログであれば、閾値数は、ブログについての閾値数より小さくてもよい。 In some embodiments, the topic of posting on social media account 232 may also be determined. Posts shorter than the threshold number of words may be removed to determine the topic of the post. The threshold number of words may depend on the form of social media. For example, if the social media is a microblog, the threshold may be less than the threshold for the blog.

ソーシャル・メディア・アカウント232での投稿に加えて、ソーシャル・メディア・アカウント232での投稿によってリンクされたコンテンツが、ソーシャル・メディア・アカウント232のトピック(複数または単数)を判別するために使われてもよい。これらおよび他の実施形態において、ソーシャル・メディア・アカウント232の投稿内のリンクがアクセスされて、コンテンツが収集されてもよい。具体的には、マイクロブログであるソーシャル・メディア・アカウント232の投稿内のリンクがアクセスされて、コンテンツが収集されてもよい。収集されたコンテンツおよび投稿はまとめられてもよい。まとめられたコンテンツのトピック分布を決定するためにトピック・モデル解析が適用されてもよい。トピック・モデルを使って、ソーシャル・メディア・アカウント232のトピック分布が決定されてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント232の投稿におけるリンクから収集されたコンテンツの著作者も収集されてもよい。ソーシャル・メディア・プロフィール・データ、ソーシャル・メディア相互作用データおよびトピックは、ソーシャル・メディア・アカウント・オブジェクト242として記憶されてもよい。 In addition to postings on social media account 232, content linked by postings on social media account 232 is used to determine the topic (s) of social media account 232. May be good. In these and other embodiments, links within posts of social media account 232 may be accessed to collect content. Specifically, the link in the post of the social media account 232, which is a microblog, may be accessed to collect the content. The collected content and posts may be combined. Topic model analysis may be applied to determine the topic distribution of the aggregated content. The topic model may be used to determine the topic distribution for social media accounts 232. In some embodiments, the authors of the content collected from the links in the posts of social media account 232 may also be collected. Social media profile data, social media interaction data and topics may be stored as social media account objects 242.

ブロック250では、著作者オブジェクト222からの著作者の名前を使う検索から帰結する、ソーシャル・メディア・アカウント232に関連付けられたソーシャル・メディア・アカウント・オブジェクト242は、著作者オブジェクト222と比較されて、さまざまなスコアを生成する。スコアは、名前スコア252、プロフィール・スコア254、コンテンツ・スコア256および相互作用スコア258を含む。 In block 250, the social media account object 242 associated with the social media account 232, resulting from a search using the author's name from the author object 222, is compared to the author object 222. Generate different scores. Scores include a name score 252, a profile score 254, a content score 256 and an interaction score 258.

名前スコア252は、著作者オブジェクト222からの名前とソーシャル・メディア・アカウント・オブジェクト242からの名前の比較に基づいて決定されてもよい。それらの名前が完全に一致する場合、名前スコア252は第一の値であってもよい。それらの名前が部分的に一致する場合、名前スコア252は第二の値であってもよく、それらの名前の短縮が一致する場合には、名前スコア252は第三のスコアであってもよい。名前の間に一致がない場合には、名前スコア252は0であってもよい。第一、第二および第三のスコアについての値は、アドホックなヒューリスティック規則または統計的機械学習に基づいて決定されてもよい。 The name score 252 may be determined based on a comparison of the name from the author object 222 with the name from the social media account object 242. The name score 252 may be the first value if their names match exactly. If their names match partially, the name score 252 may be the second value, and if the abbreviations of their names match, the name score 252 may be the third score. .. If there is no match between the names, the name score 252 may be 0. Values for the first, second and third scores may be determined based on ad hoc heuristic rules or statistical machine learning.

プロフィール・スコア254は、著作者オブジェクト222およびソーシャル・メディア・アカウント・オブジェクト242からの以下のもののうち一つまたは複数の比較に基づいて決定されてもよい:肩書き、所属、専門分野の記述、画像および位置。これらおよび他の実施形態において、著作者オブジェクト222からの著作者の位置およびソーシャル・メディア・アカウント・オブジェクト242からのソーシャル・メディア・アカウント所有者の位置はそれぞれの所属から推定されてもよい。これらおよび他の実施形態において、著作者およびソーシャル・メディア・アカウント所有者の肩書き、所属、画像、専門分野の記述および位置が比較されてもよい。 The profile score 254 may be determined based on one or more comparisons of the following from the author object 222 and the social media account object 242: title, affiliation, specialty description, image. And position. In these and other embodiments, the position of the author from the author object 222 and the position of the social media account owner from the social media account object 242 may be estimated from their respective affiliations. In these and other embodiments, the titles, affiliations, images, descriptions and locations of the authors and social media account holders may be compared.

いくつかの実施形態では、著作者オブジェクト222からの文書画像が顔認識アルゴリズムを使って解析されてもよい。たとえば、著作者オブジェクト222からの文書画像は著作者の画像であることがある。ソーシャル・メディア・アカウント・オブジェクト242からのソーシャル・メディア画像も顔認識アルゴリズムを使って解析されてもよい。たとえば、ソーシャル・メディア・アカウント・オブジェクト242からのソーシャル・メディア画像は、ソーシャル・メディア・アカウント232の所有者の画像であることがある。いくつかの実施形態では、著作者オブジェクト222からの文書画像の解析からの結果が、ソーシャル・メディア・アカウント・オブジェクト242からのソーシャル・メディア画像の解析からの結果と比較されてもよい。比較は、それらの画像が同じ人物を含んでいる確からしさの指標を与えてもよい。それらの画像が同じ人物を含んでいる確からしさの該指標が、プロフィール・スコア254を生成するために使われてもよい。 In some embodiments, the document image from the author object 222 may be analyzed using a face recognition algorithm. For example, the document image from the author object 222 may be the image of the author. Social media images from the social media account object 242 may also be analyzed using a facial recognition algorithm. For example, the social media image from the social media account object 242 may be the image of the owner of the social media account 232. In some embodiments, the results from the analysis of the document image from the author object 222 may be compared to the results from the analysis of the social media image from the social media account object 242. The comparison may give an indicator of the certainty that those images contain the same person. The measure of certainty that those images contain the same person may be used to generate a profile score 254.

いくつかの実施形態では、著作者オブジェクト222からの肩書き、所属、専門分野の記述、文書画像の解析および位置は、著作者プロフィール・ベクトルに入れられてもよい。同様に、ソーシャル・メディア・アカウント・オブジェクト242からの肩書き、所属、専門分野の記述、ソーシャル・メディア画像の解析および位置は、ソーシャル・メディア・アカウント・プロフィール・ベクトルに入れられてもよい。著作者プロフィール・ベクトルとソーシャル・メディア・プロフィール・ベクトルはベクトル空間モデリングを使って比較されてもよい。ベクトル空間モデリングの結果が前記プロフィール・スコア254であってもよい。いくつかの実施形態では、プロフィール・スコア254は肩書き、所属、専門分野および位置の間の比較の別の集積に基づいていてもよい。たとえば、各比較は同じまたは異なる重みを与えられてもよく、比較のスコアは線形結合において一緒に加算されてもよい。 In some embodiments, titles, affiliations, discipline descriptions, analysis and location of document images from the author object 222 may be included in the author profile vector. Similarly, titles, affiliations, specialty descriptions, analysis and location of social media images from the social media account object 242 may be included in the social media account profile vector. Author profile vectors and social media profile vectors may be compared using vector space modeling. The result of vector space modeling may be the profile score 254. In some embodiments, the profile score 254 may be based on another collection of comparisons between titles, affiliations, disciplines and locations. For example, each comparison may be given the same or different weights, and the scores of the comparisons may be added together in a linear combination.

コンテンツ・スコア256は、著作者オブジェクト222からの著作者に関連付けられた前記デジタル文書212のトピックと、ソーシャル・メディア・アカウント・オブジェクト242からのソーシャル・メディア・アカウントの主要トピックとの比較に基づいて決定されてもよい。いくつかの実施形態では、投稿においてリンクされたコンテンツの著作者が著作者オブジェクト222からの著作者および/または共著者に一致するときに、コンテンツ・スコア256が増大させられてもよい。 The content score 256 is based on a comparison of the topic of the digital document 212 associated with the author from the author object 222 with the main topic of the social media account from the social media account object 242. It may be decided. In some embodiments, the content score 256 may be increased when the author of the linked content in the post matches the author and / or co-author from the author object 222.

いくつかの実施形態では、著作者に関連付けられた前記デジタル文書212のトピックと、ソーシャル・メディア・アカウント・オブジェクトからのソーシャル・メディア・アカウントの主要トピックとを比較するために、著作者に関連付けられた各デジタル文書212が単語の集合(bag-of-words)ベクトルにおいて呈示されてもよい。著作者に関連付けられた諸デジタル文書212の重心ベクトルは、諸デジタル文書212についての諸単語の集合ベクトルの平均を使って決定されてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント232からの各投稿も単語の集合ベクトルとして呈示されてもよい。ソーシャル・メディア・アカウント232の投稿全部の重心ベクトルが、それらの投稿についての単語の集合ベクトル全部の平均を使って決定されてもよい。ソーシャル・メディア・アカウント232の投稿の重心ベクトルと著作者オブジェクト222のデジタル文書212の重心ベクトルとの間の類似性スコアS_bowを計算するために、ベクトル空間モデルが使われてもよい。 In some embodiments, the topic of the digital document 212 associated with the author is associated with the author to compare the main topic of the social media account from the social media account object. Each digital document 212 may be presented in a bag-of-words vector. The centroid vector of the digital documents 212 associated with the author may be determined using the average of the set vectors of the words for the digital documents 212. In some embodiments, each post from the social media account 232 may also be presented as a set vector of words. The centroid vector of all posts in social media account 232 may be determined using the average of all set vectors of words for those posts. A vector space model may be used to calculate the similarity score S_bow between the center of gravity vector of a post in social media account 232 and the center of gravity vector of digital document 212 in author object 222.

いくつかの実施形態では、著作者のデジタル文書232全部のトピック分布が、著作者トピック・ベクトルを形成するために使われてもよい。ソーシャル・メディア・アカウント232の投稿全部のトピック分布が投稿トピック・ベクトルを形成するために使われてもよい。ベクトル空間モデルは、著作者トピック・ベクトルと投稿トピック・ベクトルとの間の類似性スコアS_topicを計算するために使われてもよい。著作者オブジェクト212からの著作者がソーシャル・メディア・アカウントの投稿に埋め込まれたリンクから抽出された文書の著作者でもある回数が数N_authorであってもよい。いくつかの実施形態では、コンテンツ・スコアは次の式によって表わされてもよい:a*S_bow+b*S_topic+c*log(N_author+1)。ここで、a,b,cは数であり、a+b+c=1である。 In some embodiments, the topic distribution of the entire author's digital document 232 may be used to form the author's topic vector. The topic distribution of all posts in social media account 232 may be used to form the post topic vector. The vector space model may be used to calculate the similarity score S_topic between the author topic vector and the posted topic vector. The number of times the author from the author object 212 is also the author of the document extracted from the link embedded in the post of the social media account may be N_author. In some embodiments, the content score may be expressed by the following equation: a * S_bow + b * S_topic + c * log (N_author + 1). Here, a, b, and c are numbers, and a + b + c = 1.

相互作用スコア258は、デジタル文書212の共著者と、ソーシャル・メディア・アカウント232においてつながっているおよび言及されているソーシャル・メディア・アカウントのソーシャル・メディア・アカウント所有者との間の相関に基づいて決定されてもよい。これらおよび他の実施形態では、ソーシャル・メディア・アカウント232において言及されているソーシャル・メディア・アカウント所有者であって共著者である人の数が決定され、言及アカウント数と称されてもよい。ソーシャル・メディア・アカウント232につながっているソーシャル・メディア・アカウント所有者であって共著者である人の数が決定され、つながりアカウント数と称されてもよい。いくつかの実施形態では、相互作用スコア258は、言及アカウント数とつながりアカウント数の線形結合であってもよい。いくつかの実施形態では、言及アカウント数およびつながりアカウント数のそれぞれは異なる重みをかけられてもよい。言及アカウント数およびつながりアカウント数についての重みは、アドホックなヒューリスティック規則および統計的機械学習に基づいて決定されてもよい。 The interaction score 258 is based on the correlation between the co-author of Digital Document 212 and the social media account owner of the social media account connected and mentioned in social media account 232. It may be decided. In these and other embodiments, the number of social media account owners and co-authors referred to in social media account 232 is determined and may be referred to as the number of mentioned accounts. The number of social media account owners and co-authors connected to the social media account 232 is determined and may be referred to as the number of connected accounts. In some embodiments, the interaction score 258 may be a linear combination of the number of mentioned accounts and the number of connected accounts. In some embodiments, the number of mentioned accounts and the number of connected accounts may each be weighted differently. Weights for the number of mentioned accounts and the number of connected accounts may be determined based on ad hoc heuristic rules and statistical machine learning.

いくつかの実施形態では、相互作用スコア258は、言及アカウント数と、つながりアカウント数と、その著作者の専門分野に比べたつながっているおよび言及されているソーシャル・アカウントのソーシャル・メディア・アカウント所有者の平均専門分野スコアおよび/またはコンテンツ・スコアとに基づいて決定されてもよい。 In some embodiments, the interaction score 258 is the number of mentioned accounts, the number of connected accounts, and the social media account ownership of the connected and mentioned social accounts relative to the specialty of the author. It may be determined based on a person's average specialty score and / or content score.

たとえば、いくつかの実施形態では、共著者として識別されたつながっているソーシャル・メディア・アカウントの数はN_connectedと表わされてもよい。共著者として識別された言及されたソーシャル・メディア・アカウントの数はN_mentionedと表わされてもよい。他のつながっているソーシャル・アカウントと当該著作者との間の平均専門分野スコアおよび/またはコンテンツ・スコアはS_average_connectedと表わされてもよい。他の言及されているソーシャル・アカウントと当該著作者との間の平均専門分野スコアおよび/またはコンテンツ・スコアはS_average_mentionedによって表わされてもよい。 For example, in some embodiments, the number of connected social media accounts identified as co-authors may be expressed as N_connected. The number of mentioned social media accounts identified as co-authors may be expressed as N_listed. The average discipline score and / or content score between the author and other connected social accounts may be expressed as S_average_connected. The average discipline score and / or content score between the author and other mentioned social accounts may be represented by S_average_mentioned.

これらおよび他の実施形態において、相互作用スコア258は次の式に基づいていてもよい:P1*log(N_connected+1)+P2*log(N_mentioned+1)+P3*S_average_connected+P4*S_average_mentioned。ここで、P1,P2,P3,P4は数であり、P1+P2+P3+P4=1である。 In these and other embodiments, the interaction score 258 may be based on the following equation: P1 * log (N_connected + 1) + P2 * log (N_list + 1) + P3 * S_average_connected + P4 * S_average_mentioned. Here, P1, P2, P3, and P4 are numbers, and P1 + P2 + P3 + P4 = 1.

ブロック260では、ソーシャル・メディア・アカウント232のソーシャル・メディア・アカウント所有者が著作者オブジェクト222からの著作者と同じであるかどうかが、名前スコア252、プロフィール・スコア254、コンテンツ・スコア256および相互作用スコア258を使って判定されてもよい。いくつかの実施形態では、判定は、名前スコア252、プロフィール・スコア254、コンテンツ・スコア256および相互作用スコア258の線形結合に基づいて行なわれてもよい。たとえば、名前スコア252、プロフィール・スコア254、コンテンツ・スコア256および相互作用スコア258の線形結合が閾値より上であるとき、ソーシャル・メディア・アカウント232のソーシャル・メディア・アカウント所有者が著作者オブジェクト222からの著作者と同じであると判定されてもよい。いくつかの実施形態では、閾値は、諸一致の以前の認証(authentication)に基づいて決定されてもよい。たとえば、フロー200の複数の逐次反復が異なる著作者について決定されてもよく、フロー200の外部で一致が判定されてもよい。特定の信頼度での閾値スコアが、それら複数の逐次反復に基づいて選択されてもよい。 In block 260, whether the social media account owner of social media account 232 is the same as the author from author object 222 has a name score of 252, a profile score of 254, a content score of 256, and mutual. It may be determined using the action score 258. In some embodiments, the determination may be based on a linear combination of a name score 252, a profile score 254, a content score 256 and an interaction score 258. For example, when the linear combination of name score 252, profile score 254, content score 256, and interaction score 258 is above the threshold, the social media account owner of social media account 232 is the author object 222. It may be determined that it is the same as the author from. In some embodiments, the threshold may be determined based on the previous authentication of the matches. For example, a plurality of successive iterations of the flow 200 may be determined for different authors, or a match may be determined outside the flow 200. A threshold score at a particular confidence level may be selected based on those multiple sequential iterations.

いくつかの実施形態では、名前スコア252、プロフィール・スコア254、コンテンツ・スコア256および相互作用スコア258のそれぞれは異なる重みをかけられてもよい。これらおよび他の実施形態において、異なるスコアについての重みは、統計的機械学習または他の何らかのアルゴリズムを使って決定されてもよい。たとえば、機械学習アルゴリズムが、あらかじめ判定された一致および非一致に基づいてトレーニングされてもよい。トレーニングされた後、機械学習アルゴリズムは個別のスコアのそれぞれを入力として受け取ってもよく、それらのスコアに重み付けして線形結合にしてもよく、ソーシャル・メディア・アカウント232のソーシャル・メディア・アカウント所有者が著作者オブジェクト222からの著作者と同じである確からしさを決定してもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント232のソーシャル・メディア・アカウント所有者が著作者オブジェクト222からの著作者と同じである確からしさが閾値より上であるとき、機械学習アルゴリズムは一致があることを示してもよい。いくつかの実施形態では、閾値は、フロー200の以前の経験または逐次反復に基づいてユーザー選択され、あるいは他の仕方で決定されてもよい。 In some embodiments, the name score 252, profile score 254, content score 256 and interaction score 258 may each be weighted differently. In these and other embodiments, the weights for different scores may be determined using statistical machine learning or some other algorithm. For example, machine learning algorithms may be trained on the basis of pre-determined matches and mismatches. After training, the machine learning algorithm may receive each of the individual scores as input, weighted to those scores and linearly combined, and the social media account owner of social media account 232. May determine the certainty that is the same as the author from the author object 222. In some embodiments, the machine learning algorithm matches when the certainty that the social media account owner of the social media account 232 is the same as the author from the author object 222 is above the threshold. It may be shown that there is. In some embodiments, the threshold may be user-selected or otherwise determined based on the previous experience or sequential iteration of the flow 200.

本開示の範囲から外れることなくフロー200に修正、追加または省略がなされてもよい。たとえば、いくつかの実施形態では、フロー200は複数のソーシャル・メディア・アカウント232を含んでいてもよい。これらおよび他の実施形態において、それぞれのソーシャル・メディア・アカウント232についてソーシャル・メディア・アカウント・オブジェクト242が生成されてもよく、著作者オブジェクト222は、一致を判別するためにそれぞれのソーシャル・メディア・アカウント・オブジェクト242に個々に比較されてもよい。いくつかの実施形態では、著作者が単一のソーシャル・メディア・アカウント232のソーシャル・メディア・アカウント所有者であると判別される場合、その著作者についての検索から帰結する諸ソーシャル・メディア・アカウント232については他のソーシャル・メディア・アカウント・オブジェクト242は生成されなくてもよい。 The flow 200 may be modified, added or omitted without departing from the scope of the present disclosure. For example, in some embodiments, the flow 200 may include multiple social media accounts 232. In these and other embodiments, a social media account object 242 may be generated for each social media account 232, and the author object 222 may generate a respective social media object 222 to determine a match. It may be compared individually to the account object 242. In some embodiments, if the author is determined to be the owner of a single social media account 232 social media account, the social media accounts resulting from a search for that author. For 232, no other social media account object 242 may be generated.

いくつかの実施形態では、異なるソーシャル・メディア・アカウント232のそれぞれについてのソーシャル・メディア・アカウント・オブジェクト242は、著作者オブジェクト222との比較より前に決定されてもよい。代替的または追加的に、単一のソーシャル・メディア・アカウント232のソーシャル・メディア・アカウント・オブジェクト242が生成され、次いで該単一のソーシャル・メディア・アカウント232に帰結した著作者に関連付けられた著作者オブジェクト222と比較され、諸スコアが生成され、一致が判定されることが、他のソーシャル・メディア・アカウント・オブジェクト242が生成される前に行なわれてもよい。 In some embodiments, the social media account object 242 for each of the different social media accounts 232 may be determined prior to comparison with the author object 222. Alternatively or additionally, a work associated with the author who generated the social media account object 242 of a single social media account 232 and then resulted in the single social media account 232. Comparisons with the author object 222, scores generated, and a match determination may be made before the other social media account object 242 is generated.

いくつかの実施形態では、デジタル文書212は複数の著作者を含んでいてもよい。これらおよび他の実施形態において、各著作者についての著作者プロフィール・データが収集され、異なる著作者オブジェクト222を生成するために使われてもよい。異なる著作者オブジェクト222のそれぞれについてソーシャル・メディアの検索が行なわれてもよい。要するに、フロー200は、情報の識別および抽出のためのデータ・フローの単に一例であり、本開示はそれに限定されない。 In some embodiments, the digital document 212 may include multiple authors. In these and other embodiments, author profile data for each author may be collected and used to generate different author objects 222. A social media search may be performed for each of the different author objects 222. In short, the flow 200 is merely an example of a data flow for identifying and extracting information, and the present disclosure is not limited thereto.

図3aおよび図3bは、本稿に記載される少なくとも一つの実施形態に基づく情報の識別および抽出の例示的方法300のフローチャートを示している。いくつかの実施形態では、方法300に関連する動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法300はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法300に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法300のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 3a and 3b show a flow chart of an exemplary method 300 for identifying and extracting information based on at least one embodiment described herein. In some embodiments, one or more of the actions associated with method 300 may be performed by the information gathering system 110. Alternatively or additionally, the method 300 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 300. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks in Method 300 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

方法300はブロック302で始まってもよい。ここで、処理システムを使って、複数のデジタル文書が一つまたは複数の源から得られてもよい。デジタル文書は、最近の文書、たとえばここ一週間、一か月または数か月など特定の最近の時間期間内に公表された文書を含んでいてもよい。ブロック304では、各デジタル文書のトピックが、トピック・モデル解析を使って判別されてもよい。 Method 300 may start at block 302. Here, the processing system may be used to obtain multiple digital documents from one or more sources. Digital documents may include recent documents, such as those published within a particular recent time period, such as the last week, month or months. At block 304, the topic of each digital document may be determined using topic model analysis.

ブロック306では、デジタル文書の著作者が判別されてもよい。いくつかの実施形態では、著作者の判別は、デジタル文書において著作者として示されている人々の名前を抽出することを含んでいてもよい。これらおよび他の実施形態において、デジタル文書は、ある名前がそのデジタル文書の著作者であることを示す単語を求めてパースおよび検索されてもよい。いくつかの実施形態では、各著作者についてデータベースから著作者オブジェクトが得られてもよい。いくつかの実施形態では、著作者オブジェクトを得ることは、著作者オブジェクトを生成すること、あるいは同じ名前をもつデータベース内の既存の著作者オブジェクトを検索し位置特定することを含んでいてもよい。 At block 306, the author of the digital document may be determined. In some embodiments, author determination may include extracting the names of people indicated as authors in a digital document. In these and other embodiments, a digital document may be parsed and searched for a word indicating that a name is the author of the digital document. In some embodiments, author objects may be obtained from the database for each author. In some embodiments, obtaining an author object may include creating an author object, or searching for and locating an existing author object in a database having the same name.

ブロック308では、著作者が選択されてもよい。ブロック310では、選択された著作者についてのメタデータが得られてもよい。いくつかの実施形態では、メタデータはその著作者を含む諸デジタル文書から得られてもよい。いくつかの実施形態では、メタデータは、著作者プロフィール・データおよびその著作者を含む諸デジタル文書のトピックであってもよい。メタデータは、その著作者に関連付けられた著作者オブジェクトにおいて保存されてもよい。 In block 308, the author may be selected. Block 310 may provide metadata about the selected author. In some embodiments, the metadata may be obtained from digital documents including its author. In some embodiments, the metadata may be the topic of author profile data and various digital documents including the author. Metadata may be stored in the author object associated with that author.

ブロック312では、ソーシャル・メディアが選択されてもよい。ブロック314では、選択されたソーシャル・メディアが選択された著作者の名前を使って検索されてもよい。検索はその著作者に関連していることがありうる複数のソーシャル・メディア・アカウントを返してもよい。ブロック316では、それらのソーシャル・メディア・アカウントの一つが選択されてもよい。 At block 312, social media may be selected. In block 314, the selected social media may be searched using the name of the selected author. The search may return multiple social media accounts that may be related to the author. At block 316, one of those social media accounts may be selected.

ブロック318では、選択されたソーシャル・メディア・アカウントのソーシャル・メディア・アカウント・メタデータが得られてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント・メタデータは、選択されたソーシャル・メディア・アカウントから得られてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント・メタデータは、選択されたソーシャル・メディア・アカウントのソーシャル・メディア・アカウント・プロフィール・データおよび投稿のトピック(単数または複数)、リンクされた文書および他の側面であってもよい。ソーシャル・メディア・アカウント・メタデータは、選択されたソーシャル・メディア・アカウントに関連付けられた著作者オブジェクトにおいて保存されてもよい。 At block 318, social media account metadata for the selected social media account may be obtained. In some embodiments, social media account metadata may be obtained from selected social media accounts. In some embodiments, the social media account metadata is the social media account profile data and posting topics (s), linked documents, and links for the selected social media account. It may be another aspect. Social media account metadata may be stored in the author object associated with the selected social media account.

ブロック320では、選択されたソーシャル・メディア・アカウントと選択された著作者との間の比較に基づいてスコアが生成されてもよい。いくつかの実施形態では、それらのスコアはソーシャル・メディア・アカウント・オブジェクトと著作者オブジェクトの比較に基づいて生成されてもよい。いくつかの実施形態では、スコアは、名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコアのうちの一つまたは複数を含んでいてもよい。 At block 320, scores may be generated based on a comparison between the selected social media account and the selected author. In some embodiments, those scores may be generated based on a comparison of the social media account object and the author object. In some embodiments, the score may include one or more of a name score, a profile score, a content score and an interaction score.

ブロック322では、ブロック314でのソーシャル・メディアの検索から帰結した他のソーシャル・メディア・アカウントでまだ選択されていないものがあるかどうかが判定されてもよい。他の選択されていないソーシャル・メディア・アカウントがあるとき、方法300はブロック316に進んでもよく、選択されていないソーシャル・メディア・アカウントのうちのもう一つのものが選択されうる。他の選択されていないソーシャル・メディア・アカウントがないときは、方法300はブロック324に進んでもよい。 At block 322, it may be determined if there are other social media accounts that have not yet been selected as a result of the social media search in block 314. When there are other unselected social media accounts, method 300 may proceed to block 316, where another of the unselected social media accounts may be selected. If there are no other unselected social media accounts, Method 300 may proceed to block 324.

ブロック324では、選択された著作者が選択されたソーシャル・メディア・アカウントのソーシャル・メディア・アカウント所有者であるかどうかが、ブロック320において各ソーシャル・メディア・アカウントについて生成されたスコアを使って判定されてもよい。いくつかの実施形態では、選択されたソーシャル・メディア・アカウントのソーシャル・メディア・アカウント所有者のうちの誰が前記選択された著作者であるかが、各ソーシャル・メディア・アカウントについて生成されたスコアを比較することによって判定されてもよい。これらおよび他の実施形態において、最も高いスコアをもつソーシャル・メディア・アカウントが、選択された著作者のソーシャル・メディア・アカウントであると判定されてもよい。代替的または追加的に、ある選択閾値より高いスコアをもつソーシャル・メディア・アカウントが、選択された著作者のソーシャル・メディア・アカウントであると判定されてもよい。選択閾値は、他の型の解析もあるが、機械学習、以前の経験に基づいていてもよい。選択された著作者が選択されたソーシャル・メディア・アカウントのうちの一つのソーシャル・メディア・アカウントのソーシャル・メディア・アカウント所有者である場合、選択された著作者および選択されたソーシャル・メディア・アカウントのうちの該一つのソーシャル・メディア・アカウントは、著作者オブジェクトおよびソーシャル・メディア・アカウント・オブジェクトを含むデータベースにおいて関連付けられてもよい。 In block 324, whether the selected author is the social media account owner of the selected social media account is determined using the score generated for each social media account in block 320. May be done. In some embodiments, which of the social media account owners of the selected social media account is the selected author is the score generated for each social media account. It may be determined by comparison. In these and other embodiments, the social media account with the highest score may be determined to be the social media account of the selected author. Alternatively or additionally, a social media account with a score higher than a certain selection threshold may be determined to be the social media account of the selected author. The selection threshold may be based on machine learning, previous experience, although there are other types of analysis. If the selected author is the social media account owner of one of the selected social media accounts, the selected author and the selected social media account. The one of the social media accounts may be associated in a database containing an author object and a social media account object.

ブロック326では、ブロック312でまだ選択されていない他のソーシャル・メディアがあるかどうかが判定されてもよい。たとえば、方法300は、著作者を、複数の異なるソーシャル・メディアにおけるソーシャル・メディア・アカウントと照合するよう構成されていてもよい。他の選択されていないソーシャル・メディアがあるときは、方法300はブロック312に進んでもよく、選択されていないソーシャル・メディアのうちの別のものが選択されてもよい。他の選択されていないソーシャル・メディアがないときは、方法300はブロック328に進んでもよい。 At block 326, it may be determined if there are other social media that have not yet been selected in block 312. For example, method 300 may be configured to match the author with a social media account in a plurality of different social media. If there are other unselected social media, method 300 may proceed to block 312 and another of the unselected social media may be selected. If there are no other unselected social media, method 300 may proceed to block 328.

ブロック328では、ブロック306において判別されたデジタル文書からの他の著作者であってまだ選択されていない人があるかどうかが判定されてもよい。他の選択されていない著作者があるときは、方法300はブロック308に進んでもよく、選択されていない著作者のうち別の人が選択されてもよい。他の選択されていない著作者がないときは、方法300はブロック330に進んでもよい。 At block 328, it may be determined whether there are other authors from the digital document identified in block 306 that have not yet been selected. If there are other unselected authors, method 300 may proceed to block 308 and another of the unselected authors may be selected. If there are no other unselected authors, method 300 may proceed to block 330.

ブロック330では、データベースにおいて著作者に関連付けられているソーシャル・メディア・アカウントでの新たな投稿が抽出されてもよい。新たな投稿を抽出するために、データベースはソーシャル・メディア・アカウントについてのネットワーク・アドレスを含んでいてもよい。システムは、そのネットワーク・アドレスを使ってソーシャル・メディア・アカウントまでナビゲートして、最近の時間期間からの投稿を、あるいはソーシャル・メディア・アカウントから以前に抽出された投稿がある場合には最後の投稿抽出以降の投稿を、抽出してもよい。 At block 330, new posts in the social media account associated with the author in the database may be extracted. To extract new posts, the database may contain network addresses for social media accounts. The system will use that network address to navigate to your social media account, postings from a recent time period, or last if there are posts previously extracted from your social media account. Posts may be extracted after the post is extracted.

ブロック332では、新たな投稿から抽出された情報が組織化されてもよい。いくつかの実施形態では、該情報は、該情報が抽出されたソーシャル・メディア・アカウントに関連付けられた著作者の専門分野に基づいて組織化されてもよい。 In block 332, the information extracted from the new post may be organized. In some embodiments, the information may be organized based on the discipline of the author associated with the social media account from which the information was extracted.

ブロック334では、組織化されたデータが、それらのソーシャル・メディア・アカウントに関連付けられた著作者の専門分野に基づいて提供されてもよい。いくつかの実施形態では、該情報は、ウェブページを通じて提供されてもよい。 At block 334, organized data may be provided based on the discipline of the author associated with those social media accounts. In some embodiments, the information may be provided through a web page.

当業者は、このプロセスおよび方法ならびに本稿に開示される他のプロセスおよび方法のために、それらのプロセスおよび方法において実行される機能が異なる順序で実装されてもよいことを理解するであろう。さらに、概説された段階および動作は単に例として与えられているのであって、開示される実施形態の本質を損なうことなく、段階および動作のいくつかが任意的であったり、より少数の段階および動作に組み合わされたり、あるいは追加的な段階および動作に展開されたりしてもよい。 Those skilled in the art will appreciate that for this process and method and other processes and methods disclosed herein, the functions performed in those processes and methods may be implemented in different order. Moreover, the steps and actions outlined are given merely as examples, and some of the steps and actions are optional or a smaller number of steps and actions without compromising the essence of the disclosed embodiments. It may be combined with an action or expanded into additional stages and actions.

図4は、本稿に記載される少なくとも一つの実施形態に基づく、情報の識別および抽出の例示的方法400のフローチャートである。いくつかの実施形態では、方法400に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法400はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法400に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法400のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 4 is a flow chart of an exemplary method 400 for identifying and extracting information, based on at least one embodiment described herein. In some embodiments, one or more of the actions associated with method 400 may be performed by the information gathering system 110. Alternatively or additionally, method 400 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 400. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks in Method 400 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

方法400はブロック402で始まってもよい。ここで、複数のデジタル文書の各著作者について、データベースにおいて著作者オブジェクトが生成されてもよい。複数のデジタル文書は一つまたは複数の源から得られてもよい。いくつかの実施形態では、著作者プロフィール・データは、著作者の肩書き、著作者の所属、著作者の専門分野および著作者の位置を含んでいてもよい。いくつかの実施形態では、著作者オブジェクトの生成は、名前、著作者プロフィール・データおよび共著者をデジタル文書から抽出することを含んでいてもよい。 Method 400 may start with block 402. Here, for each author of a plurality of digital documents, an author object may be generated in the database. Multiple digital documents may be obtained from one or more sources. In some embodiments, the author profile data may include the title of the author, the affiliation of the author, the area of expertise of the author, and the location of the author. In some embodiments, the generation of the author object may include extracting the name, author profile data and co-authors from the digital document.

ブロック404では、あるソーシャル・メディアにおける諸ソーシャル・メディア・アカウントの指示(an indication)が得られてもよい。該指示は、前記ソーシャル・メディアにおける著作者オブジェクト内の著作者の名前の検索に基づいていてもよい。 At block 404, an indication of various social media accounts in a social media may be obtained. The instructions may be based on a search for the name of the author in the author object on the social media.

ブロック406では、著作者オブジェクトからの名前と、ソーシャル・メディア・アカウントに基づいて生成されたソーシャル・メディア・アカウント・オブジェクトからのソーシャル・メディア名前との比較に基づいて、名前スコアが生成されてもよい。 In block 406, even if a name score is generated based on a comparison of the name from the author object with the social media name from the social media account object generated based on the social media account. good.

ブロック408では、著作者オブジェクトからの著作者プロフィール・データと、ソーシャル・メディア・アカウント・オブジェクトからのソーシャル・メディア・プロフィール・データとの比較に基づいて、プロフィール・スコアが生成されてもよい。いくつかの実施形態では、著作者プロフィール・データとソーシャル・メディア・プロフィール・データとの比較は、著作者プロフィール・データを使って著作者ベクトルを構築し、ソーシャル・メディア・プロフィール・データを使ってソーシャル・メディア・ベクトルを構築し、著作者ベクトルとソーシャル・メディア・ベクトルとの間の類似性を計算することを含んでいてもよい。ここで、計算された類似性がプロフィール・スコアである。 At block 408, a profile score may be generated based on a comparison of author profile data from the author object with social media profile data from the social media account object. In some embodiments, the comparison of author profile data with social media profile data uses author profile data to build an author vector and uses social media profile data. It may include constructing a social media vector and calculating the similarity between the author vector and the social media vector. Here, the calculated similarity is the profile score.

ブロック410では、ソーシャル・メディア・アカウントでの投稿からのトピックと、著作者オブジェクトからの著作者に関連付けられたデジタル文書のそれぞれについてのトピックとの比較に基づいて、コンテンツ・スコアが生成されてもよい。 In block 410, even if a content score is generated based on a comparison of topics from posts in social media accounts and topics about each of the digital documents associated with the author from the author object. good.

ブロック412では、ソーシャル・メディア・アカウントにおけるソーシャルつながりと、著作者オブジェクトからの著作者に関連付けられたデジタル文書のそれぞれについての共著者との評価に基づいて、相互作用スコアが生成されてもよい。 At block 412, interaction scores may be generated based on the social connection in the social media account and the evaluation of the co-authors for each of the digital documents associated with the author from the author object.

ブロック414では、そのソーシャル・メディア・アカウントがその著作者オブジェクトの著作者に関連しているかどうかが、名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコアに基づいて判定されてもよい。いくつかの実施形態では、そのソーシャル・メディア・アカウントがその著作者オブジェクトの著作者に関連しているかどうかを名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコアに基づいて判定することは、名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコアのそれぞれに重みを割り当てることを含んでいてもよい。判定はさらに、重み付けされた名前スコア、重み付けされたプロフィール・スコア、重み付けされたコンテンツ・スコアおよび重み付けされた相互作用スコアを線形結合して、該線形結合を機械学習アルゴリズムに適用して、そのソーシャル・メディア・アカウントがその著作者オブジェクトの著作者に関連付けられているかどうかを判定することを含んでいてもよい。 At block 414, whether the social media account is associated with the author of the author object may be determined based on the name score, profile score, content score and interaction score. In some embodiments, determining whether the social media account is related to the author of the author object is based on the name score, profile score, content score, and interaction score. It may include assigning weights to each of the name score, profile score, content score and interaction score. The verdict further linearly combines a weighted name score, a weighted profile score, a weighted content score, and a weighted interaction score, and applies the linear combination to a machine learning algorithm to ensure its social. It may include determining if the media account is associated with the author of the author object.

ブロック416では、各著作者オブジェクトの著作者に関連したソーシャル・メディア・アカウントからの新たな投稿からデータが抽出されてもよい。ブロック418では、デジタル文書のトピックに基づいて組織化された該データが提供されてもよい。 At block 416, data may be extracted from new posts from social media accounts associated with the author of each author object. Block 418 may provide the data organized on the topic of a digital document.

たとえば、方法400はさらに、ソーシャル・メディア・アカウントでの投稿からトピックを判別することを含んでいてもよい。いくつかの実施形態では、トピックの判別は、閾値単語数より短い投稿を除去することと、投稿内の埋め込まれたリンクからコンテンツを取得することとを含んでいてもよい。トピックの判別はさらに、該コンテンツをまとめ、まとめコンテンツのトピック分布を判別することを含んでいてもよい。 For example, method 400 may further include determining a topic from posts on social media accounts. In some embodiments, topic determination may include removing posts shorter than the threshold number of words and retrieving content from embedded links within the post. Discrimination of topics may further include summarizing the content and discriminating the topic distribution of the summarized content.

いくつかの実施形態では、方法400はさらに、前記複数のデジタル文書を一つまたは複数の源から取得し、各デジタル文書のトピックをトピック・モデル解析を使って決定することを含んでいてもよい。 In some embodiments, the method 400 may further comprise obtaining the plurality of digital documents from one or more sources and determining the topic of each digital document using topic model analysis. ..

図5は、本稿に記載される少なくとも一つの実施形態に基づく、情報の識別および抽出の例示的方法500のフローチャートである。いくつかの実施形態では、方法500に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法500はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法500に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法500のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 5 is a flow chart of an exemplary method 500 for identifying and extracting information, based on at least one embodiment described herein. In some embodiments, one or more of the actions associated with method 500 may be performed by the information gathering system 110. Alternatively or additionally, Method 500 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 500. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks of Method 500 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

方法500はブロック502で始まってもよい。ここで、複数のデジタル文書の各著作者について、データベースにおいて著作者オブジェクトが生成されてもよい。複数のデジタル文書は一つまたは複数の源から得られてもよい。いくつかの実施形態では、著作者プロフィール・データは、著作者の肩書き、著作者の所属、著作者の専門分野および著作者の位置を含んでいてもよい。いくつかの実施形態では、著作者オブジェクトの生成は、名前、著作者プロフィール・データおよび共著者をデジタル文書から抽出することを含んでいてもよい。 Method 500 may start with block 502. Here, for each author of a plurality of digital documents, an author object may be generated in the database. Multiple digital documents may be obtained from one or more sources. In some embodiments, the author profile data may include the title of the author, the affiliation of the author, the area of expertise of the author, and the location of the author. In some embodiments, the generation of the author object may include extracting the name, author profile data and co-authors from the digital document.

ブロック504では、あるソーシャル・メディアにおける諸ソーシャル・メディア・アカウントの指示(an indication)が、前記ソーシャル・メディアにおける著作者オブジェクト内の著作者の名前の検索に基づいて得られてもよい。 At block 504, an indication of social media accounts on a social media may be obtained based on a search for the name of the author in the author object on the social media.

ブロック506では、そのソーシャル・メディア・アカウントがその著作者オブジェクトの著作者に関連しているかどうかが、次のうちの二つ以上に基づいて判定されてもよい:名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコア。 At block 506, whether the social media account is associated with the author of the author object may be determined based on two or more of the following: name score, profile score, content. -Scores and interaction scores.

いくつかの実施形態では、そのソーシャル・メディア・アカウントがその著作者オブジェクトの著作者に関連しているかどうかを名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコアに基づいて判定することは、名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコアのそれぞれに重みを割り当て、重み付けされた名前スコア、重み付けされたプロフィール・スコア、重み付けされたコンテンツ・スコアおよび重み付けされた相互作用スコアを線形結合することを含んでいてもよい。判定はまた、該線形結合を機械学習アルゴリズムに適用して、そのソーシャル・メディア・アカウントがその著作者オブジェクトの著作者に関連しているかどうかを判定することを含んでいてもよい。 In some embodiments, determining whether the social media account is associated with the author of the author object is based on name score, profile score, content score and interaction score. Weights are assigned to each of the name score, profile score, content score, and interaction score, and the weighted name score, weighted profile score, weighted content score, and weighted interaction score are linearly combined. May include doing. The determination may also include applying the linear combination to a machine learning algorithm to determine if the social media account is associated with the author of the author object.

いくつかの実施形態では、名前スコアは、著作者オブジェクトからの名前と、ソーシャル・メディア・アカウントに基づいて生成されたソーシャル・メディア・アカウント・オブジェクトからのソーシャル・メディア名前との比較に基づいて生成されてもよい。 In some embodiments, the name score is generated based on a comparison of the name from the author object with the social media name from the social media account object generated based on the social media account. May be done.

いくつかの実施形態では、プロフィール・スコアは、著作者オブジェクトからの著作者プロフィール・データと、ソーシャル・メディア・アカウント・オブジェクトからのソーシャル・メディア・プロフィール・データとの比較に基づいて生成されてもよい。いくつかの実施形態では、著作者プロフィール・データとソーシャル・メディア・プロフィール・データとの比較は、著作者プロフィール・データを使って著作者ベクトルを構築し、ソーシャル・メディア・プロフィール・データを使ってソーシャル・メディア・ベクトルを構築し、著作者ベクトルとソーシャル・メディア・ベクトルとの間の類似性を計算することを含んでいてもよい。いくつかの実施形態では、計算された類似性がプロフィール・スコアであってもよい。 In some embodiments, the profile score may also be generated based on a comparison of author profile data from the author object with social media profile data from the social media account object. good. In some embodiments, the comparison of author profile data with social media profile data uses author profile data to build an author vector and uses social media profile data. It may include constructing a social media vector and calculating the similarity between the author vector and the social media vector. In some embodiments, the calculated similarity may be a profile score.

いくつかの実施形態では、コンテンツ・スコアは、ソーシャル・メディア・アカウントでの投稿からのトピックと、著作者オブジェクトからの著作者に関連付けられたデジタル文書のそれぞれについてのトピックとの比較に基づいて生成されてもよい。 In some embodiments, the content score is generated based on a comparison of topics from posts in social media accounts with topics about each of the digital documents associated with the author from the author object. May be done.

相互作用スコアは、ソーシャル・メディア・アカウントにおけるソーシャルつながりと、著作者オブジェクトからの著作者に関連付けられたデジタル文書のそれぞれについての共著者との評価に基づいて生成されてもよい。 Interaction scores may be generated based on social connections in social media accounts and co-author ratings for each of the digital documents associated with the author from the author object.

たとえば、方法500はさらに、ソーシャル・メディア・アカウントでの投稿からトピックを判別することを含んでいてもよい。いくつかの実施形態では、トピックの判別は、閾値単語数より短い投稿を除去し、投稿内の埋め込まれたリンクからコンテンツを取得し、該コンテンツをまとめ、まとめコンテンツのトピック分布を判別することを含んでいてもよい。 For example, Method 500 may further include determining a topic from posts on social media accounts. In some embodiments, topic determination removes posts shorter than the threshold number of words, retrieves content from embedded links within the post, summarizes the content, and determines the topic distribution of the summary content. It may be included.

〈ソーシャル・メディア・アカウントと個人学術ウェブページの相互検証〉
一つまたは複数の実施形態において、本開示はソーシャル・メディア・アカウントの、個人学術ウェブページとの相互検証を含んでいてもよい。たとえば、複数の候補ソーシャル・メディア・アカウントのうちのあるソーシャル・メディア・アカウントが実際にある人物に属するかどうかを判定する際に、その人物の個人学術ウェブページとその人物のソーシャル・メディア・アカウントが、両者を相互検証しうる共通の情報または他の側面を含むことがある。それにより、両者がたしかにその人物に関連していると確証されうる。そのような相互検証の使用の例示的な実装が図6~図15においてさらに詳細に記述される。
<Mutual verification of social media accounts and personal academic web pages>
In one or more embodiments, the disclosure may include cross-validation of social media accounts with personal academic web pages. For example, when determining whether a social media account among multiple candidate social media accounts actually belongs to a person, that person's personal academic web page and that person's social media account. However, it may contain common information or other aspects that can mutually verify the two. It can be assured that both are certainly related to the person. An exemplary implementation of the use of such mutual validation is described in more detail in FIGS. 6-15.

図6は、本開示の一つまたは複数の実施形態に基づく、情報の識別および抽出に関して使用されうる例示的なフロー600の図を示している。いくつかの実施形態では、フロー600は、ソーシャル・メディア・アカウントからの情報を識別し、抽出するよう構成されていてもよい。特に、フロー600は、ソーシャル・メディア・アカウントおよび/または個人学術ウェブページがデジタル文書の著作者に関連付けられているかどうかを判定するよう構成されていてもよい。これらおよび他の実施形態において、フロー600の一部は図1のシステム100の動作の例であってもよい。 FIG. 6 shows a diagram of an exemplary flow 600 that can be used for the identification and extraction of information based on one or more embodiments of the present disclosure. In some embodiments, the flow 600 may be configured to identify and extract information from a social media account. In particular, Flow 600 may be configured to determine if a social media account and / or personal academic web page is associated with the author of the digital document. In these and other embodiments, a portion of the flow 600 may be an example of the operation of system 100 in FIG.

フロー600は、ブロック610、612、620、622、630および632を含んでいてもよく、これらはそれぞれ図2のブロック210、212、220、222、230および232と同様または同等であってもよい。図2を参照しての対応するブロックの全記述は図6のこれらのブロックにも等しく適用可能である。 Flow 600 may include blocks 610, 612, 620, 622, 630 and 632, which may be similar to or equivalent to blocks 210, 212, 220, 222, 230 and 232 of FIG. 2, respectively. .. The full description of the corresponding blocks with reference to FIG. 2 is equally applicable to these blocks of FIG.

ブロック640を参照するに、ソーシャル・メディア・アカウント632からソーシャル・メディア・プロフィール・データが抽出されてもよい。ソーシャル・メディア・プロフィール・データは著作者データと同様であってもよい。たとえば、ソーシャル・メディア・プロフィール・データは、ソーシャル・メディア・アカウントを所有する、運営するまたはそれに関連付けられている人についての情報を含んでいてもよい。ソーシャル・メディア・アカウントを所有している、運営しているまたはそのアカウントに関連付けられている人は、ソーシャル・メディア・アカウント所有者と称されてもよい。ソーシャル・プロフィール・データは、ソーシャル・メディア・アカウント所有者についての名前、所属、位置、肩書き、専門分野、ソーシャル・メディア画像、個人ウェブページURLまたは関心領域の記述および他の情報を含んでいてもよい。いくつかの実施形態では、ソーシャル・プロフィール・データは、ソーシャル・メディア・アカウントを所有する人についてのバイオグラフィー、プロフィールまたは他の情報などといった、ソーシャル・メディア・アカウントへの投稿ではないソーシャル・メディア・アカウントからの単語をパースおよび解析することによって収集されてもよい。 With reference to block 640, social media profile data may be extracted from the social media account 632. Social media profile data may be similar to author data. For example, social media profile data may include information about who owns, operates, or is associated with a social media account. Anyone who owns, operates, or is associated with a social media account may be referred to as a social media account owner. Social profile data may include name, affiliation, location, title, specialty, social media image, personal web page URL or area of interest description and other information about the social media account holder. good. In some embodiments, social profile data is a social media account that is not a post to a social media account, such as a biography, profile or other information about the person who owns the social media account. Words from may be collected by parsing and parsing.

いくつかの実施形態では、ソーシャル・メディア・アカウント632につながっているいくつかのソーシャル・メディア・アカウントが判別されてもよい。代替的または追加的に、ソーシャル・メディア・アカウント632につながっているそれらのソーシャル・メディア・アカウントのソーシャル・メディア・アカウント所有者が同定されてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント632から情報を得ているいくつかのソーシャル・メディア・アカウントが判別されてもよい。代替的または追加的に、ソーシャル・メディア・アカウント632によってフォローされているソーシャル・メディア・アカウントのソーシャル・メディア・アカウント所有者が同定されてもよい。いくつかの実施形態では、第二のソーシャル・メディア・アカウントから情報を得る第一のソーシャル・メディア・アカウントは、第一のソーシャル・メディア・アカウントが第二のソーシャル・メディア・アカウントをフォローし、第二の第一のソーシャル・メディア・アカウントが第一のソーシャル・メディア・アカウントによってフォローされていると称されてもよい。 In some embodiments, some social media accounts connected to the social media account 632 may be identified. Alternatively or additionally, the social media account owners of those social media accounts linked to the social media accounts 632 may be identified. In some embodiments, some social media accounts may be identified that are informed by the social media account 632. Alternatively or additionally, the social media account owner of the social media account followed by the social media account 632 may be identified. In some embodiments, the first social media account that obtains information from the second social media account is such that the first social media account follows the second social media account. The second first social media account may be referred to as being followed by the first social media account.

いくつかの実施形態では、ソーシャル・メディア・アカウント632に言及されているまたはつながっているソーシャル・メディア・アカウントのうちの一つまたは複数についてのソーシャル・メディア・アカウント所有者の専門分野が判別されてもよい。これらまたは他の実施形態において、つながっているソーシャル・メディア・アカウントがアクセスされてもよい。つながっているソーシャル・メディア・アカウントの所有者の専門分野が判別されてもよい。いくつかの実施形態では、専門分野は、ソーシャル・メディア・アカウント所有者のプロフィールにおける記述に基づいて判別されてもよい。代替的または追加的に、専門分野は、つながっているソーシャル・メディア・アカウントの投稿のトピックに基づいて判別されてもよい。 In some embodiments, the area of expertise of the social media account holder for one or more of the social media accounts referred to or connected to the social media account 632 is determined. May be good. In these or other embodiments, connected social media accounts may be accessed. The specialty of the owner of the connected social media account may be determined. In some embodiments, the discipline may be determined based on the description in the profile of the social media account holder. Alternatively or additionally, the discipline may be determined based on the topic of posting in a connected social media account.

いくつかの実施形態では、ソーシャル・メディア・アカウント632での投稿のトピックも判別されてもよい。投稿のトピックを判別するためには、閾値単語数より短い投稿は除去されてもよい。閾値単語数はソーシャル・メディアの形に依存してもよい。たとえば、ソーシャル・メディアがマイクロブログであれば、閾値数は、ブログについての閾値数より小さくてもよい。 In some embodiments, the topic of posting on the social media account 632 may also be determined. Posts shorter than the threshold number of words may be removed to determine the topic of the post. The threshold number of words may depend on the shape of social media. For example, if the social media is a microblog, the threshold may be less than the threshold for the blog.

ソーシャル・メディア・アカウント632での投稿に加えて、ソーシャル・メディア・アカウント632での投稿によってリンクされたコンテンツが、ソーシャル・メディア・アカウント632のトピック(複数または単数)を判別するために使われてもよい。これらおよび他の実施形態において、ソーシャル・メディア・アカウント632の投稿内のリンクがアクセスされて、コンテンツが収集されてもよい。具体的には、マイクロブログであるソーシャル・メディア・アカウント632の投稿内のリンクがアクセスされて、コンテンツが収集されてもよい。収集されたコンテンツおよび投稿はまとめられてもよい。まとめられたコンテンツのトピック分布を決定するためにトピック・モデル解析が適用されてもよい。トピック・モデルを使って、ソーシャル・メディア・アカウント632のトピック分布が決定されてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント632の投稿におけるリンクから収集されたコンテンツの著作者も収集されてもよい。ソーシャル・メディア・プロフィール・データ、ソーシャル・メディア相互作用データおよびトピックは、ソーシャル・メディア・アカウント・オブジェクト642として記憶されてもよい。 In addition to postings on social media account 632, content linked by postings on social media account 632 is used to determine the topic (s) of social media account 632. May be good. In these and other embodiments, links within posts of social media account 632 may be accessed to collect content. Specifically, the link in the post of the social media account 632, which is a microblog, may be accessed to collect the content. The collected content and posts may be combined. Topic model analysis may be applied to determine the topic distribution of the aggregated content. The topic model may be used to determine the topic distribution for social media accounts 632. In some embodiments, the author of the content collected from the link in the post of social media account 632 may also be collected. Social media profile data, social media interaction data and topics may be stored as social media account objects 642.

ブロック650では、著作者の個人学術ウェブページとしての候補でありうる個人学術ウェブページ652を求めて検索が実行されてもよい。たとえば、著作者オブジェクト622内の各著作者の名前に基づいてウェブページの検索を実行するよう、一般的な検索エンジンが要求されてもよい。追加的または代替的に、著作者オブジェクト622における各著作者の名前および著作者オブジェクト622における著作者の所属に基づいてウェブページの検索を実行するよう一般的な検索エンジンが要求されてもよい。たとえば、デジタル文書612をパースする際、アンドルー・ウー(Andrew Ng)の著作者名がスタンフォード大学(Stanford University)への所属とともにみつかったとすると、「アンドルー・ウー」(Andrew Ng)および「スタンフォード大学」(Stanford University)の組み合わせた項目に対して検索が実行されてもよい。上記二つの検索の結果は、二つのリストを組み合わせ、重複があれば除去して、可能性のある個人学術ウェブページ652のリストを生成することによってマージされてもよい。いくつかの実施形態では、各検索からの上位10個の結果のような限られた数の上位の結果が候補として含められてもよく、次いでそれらのリストがマージされてもよい。 At block 650, a search may be performed for a personal scholarly web page 652 that may be a candidate for the author's personal scholarly web page. For example, a general search engine may be required to perform a search for a web page based on the name of each author in the author object 622. Additional or alternative, a general search engine may be required to perform a web page search based on the name of each author in the author object 622 and the affiliation of the author in the author object 622. For example, when parsing Digital Document 612, if the author name of Andrew Ng was found along with his affiliation with Stanford University, then "Andrew Ng" and "Stanford University". A search may be performed on a combination of items from (Stanford University). The results of the above two searches may be merged by combining the two lists and removing any duplicates to generate a list of possible personal academic web pages 652. In some embodiments, a limited number of top results, such as the top 10 results from each search, may be included as candidates, and then their list may be merged.

いくつかの実施形態では、結果をマージした後、一つまたは複数の特定のソーシャル・メディアまたは他のプロフィール・ベースのページが同定されてもよい。たとえば、グーグル・スカラー(Google Scholar)のページ、リンクトイン(LinkedIn)のページ、リサーチゲート(ResearchGate)のページおよび/またはその他のためのテンプレートに基づいて、ソーシャル・メディアまたは他のプロフィール・ベースのページが同定されてもよい。そのような同定されたページは潜在的候補のリストから除去されてもよい。追加的または代替的に、そのようなページは相互検証においてソーシャル・メディア・アカウントとして使われてもよく、あるいは個人学術ウェブページについての潜在的候補として使われてもよい。いくつかの実施形態では、ウェブページのマージされた検索結果は、どんな結果が個人学術ウェブページ652であるかを同定するために解析されてもよい。たとえば、特定のウェブページの内容が該ページを分類し、それが個人学術ウェブページ652であるか否かを判定するために、パースされ、解析されてもよい。そのような解析を記述する例示的方法900は、図9aおよび図9bを参照して記述される。 In some embodiments, after merging the results, one or more specific social media or other profile-based pages may be identified. For example, Google Scholar pages, LinkedIn pages, ResearchGate pages and / or other profile-based pages based on templates for others. May be identified. Such identified pages may be removed from the list of potential candidates. In addition or alternatives, such pages may be used as social media accounts in cross-validation or as potential candidates for personal academic web pages. In some embodiments, the merged search results of the web page may be analyzed to identify what result is the personal academic web page 652. For example, the content of a particular web page may be parsed and analyzed to classify the page and determine if it is a personal academic web page 652. An exemplary method 900 for describing such an analysis is described with reference to FIGS. 9a and 9b.

ブロック660を参照するに、ブロック650において個人学術ウェブページ652として同定された候補サイトは、個人学術ウェブページ・オブジェクト662を生成するための情報を抽出するために使われてもよい。たとえば、個人学術ウェブページ652のさまざまな特徴または側面がパースされ、個人学術ウェブページ・オブジェクト662においてデータとして追加されてもよい。いくつかの実施形態では、個人学術ウェブページ・オブジェクト662におけるデータの一部は著作者オブジェクト622のものと同様または同等であってもよい。たとえば、個人学術ウェブページ・データは、ウェブページを所有している、運営しているまたはそれに関連付けられている人についての情報を含んでいてもよい。個人学術ウェブページ・データはさらに、個人学術ウェブページに関連付けられている人についての、名前、所属、位置、肩書き、専門分野、著作者の写真イメージ、刊行物、履歴書、担当クラスまたは行なったレクチャー、関心分野の記述、ソーシャル・メディア・アカウント、連絡先情報、URLおよび/または他の情報を含んでいてもよい。 With reference to block 660, the candidate site identified as personal academic web page 652 in block 650 may be used to extract information for generating personal academic web page object 662. For example, various features or aspects of the personal academic web page 652 may be parsed and added as data in the personal academic web page object 662. In some embodiments, some of the data in the personal academic web page object 662 may be similar to or equivalent to that of the author object 622. For example, personal academic web page data may contain information about who owns, operates, or is associated with a web page. Personal academic web page data also includes names, affiliations, locations, titles, disciplines, author photographic images, publications, resumes, classes or classes of persons associated with personal academic web pages. It may include a lecture, a description of the area of interest, a social media account, contact information, a URL and / or other information.

ブロック670では、著作者オブジェクト622からの著作者の名前を使う検索から帰結するソーシャル・メディア・アカウント632に関連付けられたソーシャル・メディア・アカウント・オブジェクト642が、一つまたは複数の相互検証技法を使って、個人学術ウェブページ652に関連付けられた個人学術ウェブページ・オブジェクト662の一つまたは複数と相互検証されてもよい。たとえば、ソーシャル・メディア・アカウント・オブジェクト642および所与のウェブページ・オブジェクト662はURL一致671(その例示的方法は図10を参照して記載)、ソーシャル・メディア・アカウント一致672(その例示的方法は図11を参照して記載)、写真一致673(その例示的方法は図12を参照して記載)、キーワード一致674(その例示的方法は図13を参照して記載)および/またはリンクされたソーシャル・メディアのキーワードの一致675(その例示的方法は図14を参照して記載)を使って相互検証されてもよい。いくつかの実施形態では、これらの異なる相互検証技法は、相互検証が成立するまで逐次順、たとえば、ULR一致671、ソーシャル・メディア・アカウント一致672、写真一致673、キーワード一致674およびリンクされたソーシャル・メディアのキーワードの一致675で使われてもよい。これらおよび他の実施形態において、個人学術ウェブページ・オブジェクト662とソーシャル・メディア・アカウント・オブジェクト242が正しく所与の著作者オブジェクト222に関連していることを確認することにおいて、単一の相互検証技法が使われてもよく、あるいはすべての相互検証技法が使われてもよい。代替的または追加的に、上記の相互検証技法の二つ以上が並行して使われてもよい。 In block 670, the social media account object 642 associated with the social media account 632 resulting from a search using the author's name from the author object 622 uses one or more cross-validation techniques. And may be cross-validated with one or more of the personal academic web page objects 662 associated with the personal academic web page 652. For example, the social media account object 642 and a given web page object 662 have a URL match 671 (the exemplary method is described with reference to FIG. 10), a social media account match 672 (the exemplary method). Is described with reference to FIG. 11), Photo Match 673 (the exemplary method is described with reference to FIG. 12), Keyword Match 674 (the exemplary method is described with reference to FIG. 13) and / or linked. Mutual verification may be performed using the social media keyword match 675 (an exemplary method is described with reference to FIG. 14). In some embodiments, these different cross-validation techniques are sequentially ordered until mutual validation is established, eg ULR match 671, social media account match 672, photo match 673, keyword match 674 and linked social. -May be used in media keyword match 675. In these and other embodiments, a single mutual validation in ensuring that the personal academic web page object 662 and the social media account object 242 are correctly associated with a given author object 222. Techniques may be used, or all cross-validation techniques may be used. Alternatively or additionally, two or more of the above cross-validation techniques may be used in parallel.

ブロック680を参照するに、ブロック670の相互検証に基づいて、著作者オブジェクト622、所与のソーシャル・メディア・アカウント・オブジェクト642および所与の個人学術ウェブページ・オブジェクト662の間で一致が判別されてもよい。ブロック680の一致は、所与のソーシャル・メディア・アカウント・オブジェクト642および所与の個人学術ウェブページ・オブジェクト662が著作者オブジェクト622に正しく関連付けられていることを示しうる。たとえば、上記の相互検証技術の一つまたは複数がその著作者が前記ソーシャル・メディア・アカウントおよび前記個人学術ウェブページを所有しているのと同じ人物であることを確証すれば、一致が見出されうる。いくつかの実施形態では、一致があるかどうかは、一致の、以前の相互検証に基づいて決定されてもよい。たとえば、フロー600の複数の逐次反復が異なる著作者について決定されてもよく、フロー600の外部で一致が判定されてもよい。いくつかの実施形態では、上記の相互検証技法のいずれもその著作者に関連付けられたソーシャル・メディア・アカウントおよび個人学術ウェブページを同定しない場合には、たとえば図2のフロー200に関して述べたように、ソーシャル・メディア・アカウントのみが著作者オブジェクトと比較されてもよい。 With reference to block 680, a match is determined between the author object 622, a given social media account object 642 and a given personal academic web page object 662, based on the cross-validation of block 670. You may. A match in block 680 may indicate that a given social media account object 642 and a given personal academic web page object 662 are correctly associated with the author object 622. For example, if one or more of the above cross-validation techniques ensure that the author is the same person who owns the social media account and the personal academic web page, a match is found. Can be done. In some embodiments, the presence or absence of a match may be determined on the basis of previous mutual verification of the match. For example, a plurality of successive iterations of the flow 600 may be determined for different authors, or a match may be determined outside the flow 600. In some embodiments, if none of the above cross-validation techniques identify the social media account and personal academic web page associated with the author, as described, for example, with respect to Flow 200 in FIG. , Only social media accounts may be compared to author objects.

本開示の範囲から外れることなくフロー600に修正、追加または省略がなされてもよい。たとえば、いくつかの実施形態では、フロー600は複数のソーシャル・メディア・アカウント632および/または複数の個人学術ウェブページ・オブジェクト662を含んでいてもよい。これらおよび他の実施形態において、それぞれのソーシャル・メディア・アカウント632についてソーシャル・メディア・アカウント・オブジェクト642が生成されてもよく、それぞれの個人学術ウェブページ652について個人学術ウェブページ・オブジェクト662が生成されてもよく、一致を判別するためにさまざまな組み合わせが個々に相互検証されてもよい。たとえば、単一のソーシャル・メディア・アカウント・オブジェクト642が、一致がみつかるまで、前記個人学術ウェブページ・オブジェクト662と相互検証されてもよく、次に、次のソーシャル・メディア・アカウント・オブジェクト642が前記個人学術ウェブページ・オブジェクト662と相互検証されてもよく、逆でもよい(たとえば、個人学術ウェブページ・オブジェクト662が諸ソーシャル・メディア・アカウント・オブジェクト642と相互検証される)。 Flow 600 may be modified, added or omitted without departing from the scope of the present disclosure. For example, in some embodiments, the flow 600 may include a plurality of social media accounts 632 and / or a plurality of personal academic web page objects 662. In these and other embodiments, a social media account object 642 may be generated for each social media account 632, and a personal academic web page object 662 may be generated for each personal academic web page 652. The various combinations may be individually cross-validated to determine a match. For example, a single social media account object 642 may be cross-validated with the personal academic web page object 662 until a match is found, followed by the next social media account object 642. It may be cross-validated with the personal academic web page object 662 and vice versa (eg, the personal academic web page object 662 is cross-validated with various social media account objects 642).

いくつかの実施形態では、異なるソーシャル・メディア・アカウント632のそれぞれについてのソーシャル・メディア・アカウント・オブジェクト642および/または異なる個人学術ウェブページ652のそれぞれについての個人学術ウェブページ・オブジェクト662は、相互検証より前に決定されてもよい。代替的または追加的に、単一のソーシャル・メディア・アカウント632のソーシャル・メディア・アカウント・オブジェクト642および/または単一の諸個人学術ウェブページ・オブジェクト662が生成され、次いで相互検証されることが、他のソーシャル・メディア・アカウント・オブジェクト642および/または個人学術ウェブページ・オブジェクト662が生成される前に行なわれてもよい。 In some embodiments, the social media account object 642 for each of the different social media accounts 632 and / or the personal academic web page object 662 for each of the different personal academic web pages 652 is cross-validated. It may be decided earlier. Alternatively or additionally, a single social media account 632 social media account object 642 and / or a single personal academic web page object 662 may be generated and then cross-validated. , Other social media account objects 642 and / or personal academic web page objects 662 may be done before they are created.

いくつかの実施形態では、デジタル文書612は複数の著作者を含んでいてもよい。これらおよび他の実施形態において、各著作者についての著作者プロフィール・データが収集され、異なる著作者オブジェクト622を生成するために使われてもよい。異なる著作者オブジェクト622のそれぞれについてソーシャル・メディアの検索が行なわれてもよい。要するに、フロー600は、情報の識別および抽出のためのデータ・フローの単に一例であり、本開示はそれに限定されない。 In some embodiments, the digital document 612 may include multiple authors. In these and other embodiments, author profile data for each author may be collected and used to generate different author objects 622. A social media search may be performed for each of the different author objects 622. In short, the flow 600 is merely an example of a data flow for identifying and extracting information, and the present disclosure is not limited thereto.

図7は、本稿に記載される少なくとも一つの実施形態に基づく情報の識別および抽出の例示的方法700のフローチャートを示している。いくつかの実施形態では、方法700に関連する動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法700はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法700に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法700のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 7 shows a flowchart of an exemplary method 700 for identifying and extracting information based on at least one embodiment described herein. In some embodiments, one or more of the actions associated with method 700 may be performed by the information gathering system 110. Alternatively or additionally, the method 700 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 700. Although illustrated as discrete blocks, the stages and behaviors associated with one or more of the blocks in Method 700 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック710では、著作者オブジェクトがデータベースにおいて生成されてもよい。たとえば、情報収集システム(図1の情報収集システム110など)が刊行物システム(図1の刊行物システム120など)から一つまたは複数の刊行物を得てもよい。刊行物は、該刊行物の著作者および該著作者についての著作者プロフィール・データを抽出するためにパースされ、解析されてもよい。これらおよび他の実施形態において、著作者プロフィール・データは、著作者の肩書き、著作者の所属、著作者の専門分野の記述および著作者の位置のうちの一つまたは複数を含んでいてもよい。いくつかの実施形態では、著作者オブジェクトの生成は、名前、著作者プロフィール・データ、著作者の何らかの画像および共著者をデジタル文書から抽出することを含んでいてもよい。追加的または代替的に、著作者オブジェクトは、刊行物に関連するトピックをも含んでいてもよい。たとえば、刊行物の一つまたは複数のキーワードが、それについてその著作者が知識ある人であるトピックに加えられてもよい。 At block 710, author objects may be created in the database. For example, an information gathering system (such as the information gathering system 110 of FIG. 1) may obtain one or more publications from a publication system (such as the publication system 120 of FIG. 1). Publications may be parsed and analyzed to extract author profile data for the author of the publication and the author. In these and other embodiments, the author profile data may include one or more of the title of the author, the affiliation of the author, the description of the area of expertise of the author, and the position of the author. .. In some embodiments, the generation of the author object may include extracting the name, author profile data, any image of the author, and co-authors from the digital document. Additional or alternative, the author object may also contain topics related to the publication. For example, one or more keywords of a publication may be added to a topic for which the author is knowledgeable about it.

ブロック720では、所与の著作者について、その著作者に関連している可能性を含む個人学術ウェブページ候補が得られてもよい。たとえば、情報収集システムは、一般的な検索エンジンがウェブ・ホスティング・システム(たとえば図1のウェブ・ホスティング・システム150)にホストされているウェブページのうちでその著作者の名前および/またはその著作者の名前かつその著作者の所属に対する検索を実行することを要求してもよい。追加的または代替的に、その著作者の肩書き(たとえば学部長)、その著作者の専門分野の記述および/またはその他の項目といった、その著作者に関係した一つまたは複数の項目に基づく別の検索が使われてもよい。いくつの検索が実行されてもよい。いくつかの実施形態では、検索の数は5未満であってもよい。いくつかの実施形態では、それらの検索の結果がマージされて、グーグル・スカラーのページまたはリンクトインのページなど、一つまたは複数の型のウェブページがリストから除去されてもよい。残りの結果は、それらの結果のどれが個人学術ウェブページであるかを判定するためにパースされ、あるいは他の仕方で解析されてもよく、個人学術ウェブページである結果が個人学術ウェブページ候補として含められてもよい。これらおよび他の実施形態において、個人学術ウェブページ候補から、個人学術ウェブページ・オブジェクトを生成するために、データが抽出される。個人学術ウェブページを得る例示的方法が図8に示されており、結果のどれが個人学術ウェブページであるかを判別する例示的方法が図9aおよび図9bに示されている。 At block 720, for a given author, personal scholarly web page candidates may be obtained that include the possibility of being associated with that author. For example, an information gathering system is one of the web pages in which a common search engine is hosted on a web hosting system (eg, the web hosting system 150 in Figure 1), the author's name and / or its authorship. You may request to perform a search for the author's name and the affiliation of the author. Additional or alternative, another based on one or more items related to the author, such as the author's title (eg, Dean), description of the author's area of expertise and / or other items. Search may be used. Any number of searches may be performed. In some embodiments, the number of searches may be less than five. In some embodiments, the results of those searches may be merged to remove one or more types of web pages from the list, such as Google Scholar pages or LinkedIn pages. The remaining results may be parsed or otherwise analyzed to determine which of those results are personal academic web pages, and the results that are personal academic web pages are candidates for personal academic web pages. May be included as. In these and other embodiments, data is extracted from personal academic web page candidates to generate personal academic web page objects. An exemplary method of obtaining a personal academic web page is shown in FIG. 8, and an exemplary method of determining which of the results is a personal academic web page is shown in FIGS. 9a and 9b.

ブロック730では、所与の著作者について、その著作者に関連している可能性を含むソーシャル・メディア・アカウント候補が得られてもよい。たとえば、情報収集システムは、一つまたは複数のソーシャル・メディア・システム(たとえば図1のソーシャル・メディア・システム130)の間で検索が実行されることを要求してもよい。そのような検索は、著作者の名前に基づいて実行されてもよく、追加的または代替的に、他の仕方でその著作者に関係した一つまたは複数の項目を含めてもよい。さらに、そのような検索は、複数のソーシャル・メディア・システムにまたがる複数のソーシャル・メディア・プラットフォームについて実行されてもよい。返される結果は、ソーシャル・メディア・アカウント候補を含んでいてもよい。それらソーシャル・メディア・アカウント候補について、ソーシャル・メディア・アカウント・オブジェクトが生成されてもよい。これはたとえば、ソーシャル・メディア・アカウント候補のプロフィールをパースすることおよび/または他の仕方で情報のさまざまな成分をソーシャル・メディア・アカウント・データとして抽出することによる。 Block 730 may provide potential social media accounts for a given author, including possible associations with that author. For example, the information gathering system may require that the search be performed among one or more social media systems (eg, social media system 130 in FIG. 1). Such searches may be performed based on the name of the author, and may additionally or alternatively include one or more items related to the author in other ways. In addition, such searches may be performed on multiple social media platforms that span multiple social media systems. The returned results may include potential social media accounts. Social media account objects may be generated for those social media account candidates. This is, for example, by parsing the profile of a candidate social media account and / or otherwise extracting various components of the information as social media account data.

ブロック740では、個人学術ウェブページ候補の一つおよびソーシャル・メディア・アカウント候補の一つが、所与の著作者に関連しているとして相互検証されてもよい。たとえば、図10~図14に記載されている相互検証技法のいずれかまたは他のものを使って、情報収集システムは、所与の個人学術ウェブページおよびソーシャル・メディア・アカウントが所与の著作者に正しく関連していることを確認しうる。いくつかの実施形態では、一連の相互検証技法が使われてもよい。たとえば、第一の技法を使い、第一の技法がソーシャル・メディア・アカウント候補と個人学術ウェブページ候補との間の一致を判別しない場合に次の技法に進む。たとえば、情報収集システムは、まずURL照合技法を使い、次いでソーシャル・メディア・アカウント照合技法、次いで写真照合技法、次いでキーワード照合技法、次いでリンクされたソーシャル・メディアのキーワードの照合技法となる。いくつかの実施形態では、ブロック740は複数の相互検証技法を通じて進み、相互検証に関する最終判定をする前に、各相互検証技法についての結果を得てもよい。これらおよび他の実施形態において、ブロック740は、図10~図14の相互検証技法のそれぞれを含みうる。 In block 740, one of the personal scholarly web page candidates and one of the social media account candidates may be cross-validated as related to a given author. For example, using one or the other of the cross-validation techniques described in FIGS. 10-14, the information gathering system is such that a given personal academic web page and social media account are given authors. Can be confirmed to be correctly related to. In some embodiments, a series of cross-validation techniques may be used. For example, use the first technique and proceed to the next technique if the first technique does not determine a match between a candidate social media account and a candidate personal academic web page. For example, an information gathering system first uses a URL matching technique, then a social media account matching technique, then a photo matching technique, then a keyword matching technique, and then a linked social media keyword matching technique. In some embodiments, block 740 may proceed through multiple cross-validation techniques and obtain results for each cross-validation technique before making a final decision on cross-validation. In these and other embodiments, block 740 may include each of the cross-validation techniques of FIGS. 10-14.

いくつかの実施形態では、ブロック740は一つのソーシャル・メディア・アカウント候補で始まり、それを個人学術ウェブページ候補のそれぞれに対して相互検証することを、一致が見出されるまで行なってもよい。あるいはまた、ブロック740は、一つの個人学術ウェブページ候補で始まり、それをソーシャル・メディア・アカウント候補のそれぞれに対して相互検証することを、一致が見出されるまで行なってもよい。ブロック740の終わりには、ソーシャル・メディア・アカウントおよび個人学術ウェブページは所与の著作者に関連付けられうる。 In some embodiments, block 740 may start with one social media account candidate and cross-validate it against each of the personal academic web page candidates until a match is found. Alternatively, block 740 may start with one personal academic web page candidate and cross-validate it against each of the social media account candidates until a match is found. At the end of block 740, social media accounts and personal scholarly web pages may be associated with a given author.

いくつかの実施形態では、所与の著作者は、二つ以上の個人学術ウェブページおよび/または二つ以上のソーシャル・メディア・アカウントをもつことがある。たとえば、大学では教員であり企業ではコンサルタントである著作者について、その著作者は大学がホストしている個人学術ウェブページ、企業がホストしている個人学術ウェブページおよび個人でホストしている個人学術ウェブページをもつことがありうる。追加的または代替的に、著作者はツイッター・アカウント、インスタグラム・アカウントおよびフェイスブック・アカウントを有していてもよい。これらおよび他の実施形態において、本開示は、二つ以上の個人学術ウェブページを、二つ以上のソーシャル・メディア・アカウントに対して相互検証してもよい。これらおよび他の実施形態において、本開示において記述されている前記一つまたは複数のプロセスは、ひとたび一つのソーシャル・メディア・アカウントが一つの個人学術ウェブページに対して相互検証されても終了しなくてもよく、すべてのソーシャル・メディア・アカウント候補および/またはすべての個人学術ウェブページ候補を通じて進行してもよい。これらおよび他の実施形態において、ある著作者に関連しているとして相互検証されたすべてのソーシャル・メディア・アカウントおよび個人学術ウェブページが関連付けられてもよい。追加的または代替的に、単一のソーシャル・メディア・アカウントおよび/または単一の個人学術ウェブページが著作者と関連していることがある。たとえば、フェイスブック・アカウントよりもツイッター・アカウントへの選好が与えられてもよい。別の例として、大学がホストしているウェブページは、個人でホストしているウェブページよりも選好が与えられてもよい。 In some embodiments, a given author may have more than one personal academic web page and / or more than one social media account. For example, for a writer who is a faculty member at a university and a consultant at a company, the author is a university-hosted personal scholarly web page, a company-hosted personal scholarly web page, and an individual-hosted personal scholarship. May have a web page. In addition or alternatives, the author may have a Twitter account, Instagram account and Facebook account. In these and other embodiments, the disclosure may cross-validate two or more personal academic web pages against two or more social media accounts. In these and other embodiments, the one or more processes described in this disclosure will not terminate once one social media account has been cross-validated against one personal academic web page. It may proceed through all social media account candidates and / or all personal academic web page candidates. In these and other embodiments, all social media accounts and personal scholarly web pages that have been reciprocally validated as being related to an author may be associated. In addition or alternatives, a single social media account and / or a single personal scholarly web page may be associated with the author. For example, a preference for a Twitter account may be given over a Facebook account. As another example, university-hosted web pages may be given a preference over personally-hosted web pages.

ブロック750では、ソーシャル・メディア・アカウントおよび個人学術ウェブページをさらなる著作者に関連付けるためにまだ解析がされていないさらなる著作者が残っているかどうかの判定がされてもよい。残っている著作者があるとの判定後、方法700はブロック720に戻って次の著作者についての個人学術ウェブページ候補を取得してもよい。残っている著作者はないとの判定後、方法700はブロック760に進んでもよい。 At block 750, it may be determined if there are additional authors left unanalyzed to associate social media accounts and personal scholarly web pages with further authors. After determining that there are remaining authors, Method 700 may return to block 720 to obtain personal scholarly web page candidates for the next author. After determining that there are no remaining authors, method 700 may proceed to block 760.

ブロック760では、著作者に関連付けられたソーシャル・メディア・アカウントからの新たなソーシャル・メディア投稿が抽出されてもよい。たとえば、新たな投稿を抽出するために、ソーシャル・メディア・オブジェクトおよび/または著作者オブジェクトは、ソーシャル・メディア・アカウントについてのネットワーク・アドレスを含んでいてもよい。情報収集システムは、そのネットワーク・アドレスを使ってソーシャル・メディア・アカウントまでナビゲートして、最近の時間期間からの投稿を、あるいはソーシャル・メディア・アカウントから以前に抽出された投稿がある場合には最後の投稿抽出以降の投稿を、抽出してもよい。これらおよび他の実施形態において、新たな投稿から抽出された情報は組織化されてもよい。いくつかの実施形態では、該情報は、該情報が抽出されたソーシャル・メディア・アカウントに関連付けられた著作者の専門分野、たとえば彼らが知識があるトピックに基づいて組織化されてもよい。 At block 760, new social media posts from the social media account associated with the author may be extracted. For example, to extract new posts, the social media object and / or author object may include a network address for the social media account. The information gathering system will use its network address to navigate to your social media account, if there are posts from a recent time period or previously extracted from your social media account. Posts after the last post extraction may be extracted. In these and other embodiments, the information extracted from the new post may be organized. In some embodiments, the information may be organized based on the area of expertise of the author associated with the social media account from which the information was extracted, eg, a topic they are familiar with.

ブロック770では、組織化されたデータが、それらのソーシャル・メディア・アカウントに関連付けられた著作者の専門分野に基づいて、たとえばトピック別編成で、提供されてもよい。いくつかの実施形態では、該情報は、ウェブページを通じて提供されてもよい。追加的または代替的に、該情報は、収集され、著作者にリンクされているソーシャル・メディア・アカウントのようなソーシャル・メディア・アカウントの集合に、あるいは知識のあるソーシャル・メディア・アカウント所有者の別の集合に通信されてもよい。 At block 770, organized data may be provided, for example, by topical organization, based on the discipline of the author associated with those social media accounts. In some embodiments, the information may be provided through a web page. Additionally or alternatively, the information may be collected in a collection of social media accounts, such as social media accounts linked to the author, or by a knowledgeable social media account owner. It may be communicated to another set.

図8は、本稿に記載される少なくとも一つの実施形態に基づく、個人学術ウェブページを同定する例示的方法800のフローチャートを示している。一人の著作者について説明するが、方法800は任意の数の著作者について繰り返されてもよい。方法800は、図7のブロック720の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法800に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法800はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法800に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法800のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 8 shows a flow chart of an exemplary method 800 for identifying a personal academic web page, based on at least one embodiment described herein. Although one author will be described, Method 800 may be repeated for any number of authors. Method 800 may reflect one embodiment of performing one or more operations of block 720 of FIG. In some embodiments, one or more of the actions associated with method 800 may be performed by the information gathering system 110. Alternatively or additionally, Method 800 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 800. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks of Method 800 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック810につながる破線矢印は、方法800が図7の方法700のブロック710から続いているなど、別の方法の続きでありうることを示している。 The dashed arrow leading to block 810 indicates that method 800 may be a continuation of another method, such as continuing from block 710 of method 700 of FIG.

ブロック810では、著作者の名前に基づいて、たとえばブロック710で生成された著作者オブジェクト内の著作者の名前に基づいて、可能性のある個人学術ウェブページに対する第一の検索が実行されてもよい。たとえば、情報収集システム(たとえば情報収集システム110)は、著作者の名前に基づいて一つまたは複数のウェブ・ホスティング・システム(たとえば図1のウェブ・ホスティング・システム150)によってホストされているウェブページの検索を実行するよう一般的な検索エンジンに要求してもよい。結果は第一のリストに入れられてもよい。第一のリストに入れられる結果の数は、数値または他の任意の基準に基づいて制限され、あるいは打ち切られてもよい。 In block 810, even if the first search for possible personal academic web pages is performed based on the name of the author, for example, based on the name of the author in the author object generated in block 710. good. For example, an information gathering system (eg, information gathering system 110) is a web page hosted by one or more web hosting systems (eg, web hosting system 150 in FIG. 1) based on the author's name. You may ask a common search engine to perform a search for. The results may be included in the first list. The number of results included in the first list may be limited or censored based on numerical values or any other criterion.

ブロック820では、著作者の名前および著作者の所属に基づいて、可能性のある個人学術ウェブページに対する第二の検索が実行されてもよい。たとえば、情報収集システムは、著作者の名前および著作者の所属に基づいて一つまたは複数のウェブ・ホスティング・システムによってホストされているウェブページの検索を実行するよう一般的な検索エンジンに要求してもよい。結果は第二のリストに入れられてもよい。第二のリストに入れられる結果の数は、数値または他の任意の基準に基づいて制限され、あるいは打ち切られてもよい。いくつかの実施形態では、第一のリストと第二のリストのサイズは同じサイズであってもよく、あるいは異なるサイズであってもよい。追加的または代替的に、他の検索項目が使われてもよく、および/または追加的な検索が実行されて第一および第二のリストのほかに追加的なリストを生成してもよい。たとえば、刊行物のタイトルおよび著作者名を含む、あるいは著作者オブジェクトの他の任意の著作者データを使う検索が実行されてもよい。 At block 820, a second search for possible personal academic web pages may be performed based on the author's name and author's affiliation. For example, information gathering systems require common search engines to perform searches for web pages hosted by one or more web hosting systems based on the author's name and affiliation. You may. The results may be included in the second list. The number of results included in the second list may be limited or censored based on numerical values or any other criteria. In some embodiments, the sizes of the first list and the second list may be the same size or different sizes. Additional or alternative, other search items may be used, and / or additional searches may be performed to generate additional lists in addition to the first and second lists. For example, a search may be performed that includes the title and author name of the publication, or that uses any other author data of the author object.

ブロック830では、第一の検索および第二の検索からの結果がマージされてもよい。たとえば、結果は一つのおきの仕方(たとえば、第一のリストからの結果1、第二のリストからの結果1、第一のリストからの結果2、第二のリストからの結果2、第一のリストからの結果3および/またはその他)または他の任意の組み合わせ技法で組み合わされてもよい。いくつかの実施形態では、マージされたリストは複製されてもよい。 At block 830, the results from the first search and the second search may be merged. For example, the results are in every other way (eg, result 1 from the first list, result 1 from the second list, result 2 from the first list, result 2 from the second list, first. Results from the list of 3 and / or others) or any other combination technique may be combined. In some embodiments, the merged list may be duplicated.

ブロック840では、一つまたは複数のソーシャル・メディア・アカウントが、ソーシャル・メディア・アカウントのプロフィール・ページのテンプレートに基づいて、プロフィール・ページであるとして識別されてもよい。たとえば、前記結果は、リンクトインのページ、リサーチゲートのページまたはグーグル・スカラーのページのようなソーシャル・メディア・アカウントについての一つまたは複数のソーシャル・メディア・アカウント・プロフィールのための既知のテンプレートと比較されてもよい。前記結果の一つまたは複数が、一つまたは複数のウェブ要素の位置およびスタイルを含むフォーマットを判別するために解析され、テンプレート・ソーシャル・メディア・ページの既知のレイアウトおよび/またはフォーマットと比較されてもよい。ページをそのようなソーシャル・メディア・ページとして識別した後、ソーシャル・メディア・ページは、個人学術ウェブページ候補のリストに加えられ、検索結果のマージされたリストから除去されてもよい。いくつかの実施形態では、そのようなソーシャル・メディア・アカウント・ページは、学術的なまたはビジネス・ベースのソーシャル・メディア・アカウントに限定されてもよい。 At block 840, one or more social media accounts may be identified as profile pages based on the social media account's profile page template. For example, the above results may be with known templates for one or more social media account profiles for social media accounts such as LinkedIn pages, ResearchGate pages or Google Scalar pages. May be compared. One or more of the above results are analyzed to determine the format, including the location and style of one or more web elements, and compared to the known layout and / or format of the template social media page. May be good. After identifying the page as such a social media page, the social media page may be added to the list of personal academic web page candidates and removed from the merged list of search results. In some embodiments, such social media account pages may be limited to academic or business-based social media accounts.

ブロック850では、結果の前記リストからの所与の結果がパースされて、該所与の結果が個人学術ウェブページであるか否かを識別してもよい。たとえば、所与の結果のさまざまなテキスト要素または視覚的要素が、それらのテキストおよび/または視覚的要素が個人学術ウェブページと整合するかどうかを判定するために、パースされ、解析されてもよい。所与の結果が個人学術ウェブページであることに基づいて、所与の結果は個人学術ウェブページ候補のリストに含められてもよい。結果が個人学術ウェブページであるか否かを識別するために該結果をパースするために利用されうる方法の一例が図9aおよび図9bに関して記載される。結果が個人学術ウェブページであるか否かを識別するために該結果をパースするために利用されうる方法のもう一つの例が米国特許出願第13/732,036号(たとえば図6を含む)に関して記載されている。米国特許出願第13/732,036号の全体はここに参照によって組み込まれる。 At block 850, a given result from the list of results may be parsed to identify whether the given result is a personal academic web page. For example, various text or visual elements of a given result may be parsed and analyzed to determine if those text and / or visual elements are consistent with a personal academic web page. .. Based on the given result being a personal academic web page, the given result may be included in the list of personal academic web page candidates. Examples of methods that can be used to parse the results to identify whether the results are personal academic web pages are described with respect to FIGS. 9a and 9b. Another example of a method that can be used to parse a result to identify whether it is a personal academic web page is described for US Patent Application No. 13 / 732,036 (including, eg, FIG. 6). Has been done. The entire US Patent Application No. 13 / 732,036 is incorporated herein by reference.

ブロック860では、何らかのさらなる結果がパースされるべく残っており該結果が個人学術ウェブページであるか否かについて判定がなされるべきかどうかについて判定がなされてもよい。さらなる結果があるとの判定後、方法800はブロック850に戻ってもよく、次の結果がパースされ、該結果が個人学術ウェブページであるか否かが判定されてもよい。まだパースされていない残っている結果がないとの判定後、方法800は、得られた結果的な個人学術ウェブページ候補を出力してもよい。 At block 860, it may be determined whether any further results remain to be parsed and whether or not the results are personal academic web pages should be determined. After determining that there are further results, Method 800 may return to block 850 and the next result may be parsed to determine if the result is a personal academic web page. After determining that there are no remaining results that have not yet been parsed, Method 800 may output the resulting consequential personal scholarly web page candidates.

方法800の終わりの破線矢印は、それらの個人ウェブページ候補が、図7の方法700のブロック730などの一つまたは複数のさらなるプロセスまたはブロックによって使われてもよいことを示しうる。 The dashed arrow at the end of method 800 may indicate that those personal web page candidates may be used by one or more additional processes or blocks, such as block 730 of method 700 of FIG.

いくつかの実施形態では、ブロック840でソーシャル・メディア・アカウントを識別するのではなく、方法800は結果をパースすることに直接進んでもよい。 In some embodiments, instead of identifying the social media account in block 840, method 800 may proceed directly to parsing the results.

図9aおよび9bは、本開示の一つまたは複数の実施形態に基づく、情報の識別および抽出において使われうるもう一つの例示的方法900のフローチャートを示している。たとえば、図9aおよび9bは、一つまたは複数のウェブページをパースして、そのウェブページが個人学術ウェブページであるかどうかを判定する例示的方法900のフローチャートを示している。一つのウェブページについて説明するが、方法900は任意の数のウェブページについて繰り返されてもよい。方法900は、図8のブロック850の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法900に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法900はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法900に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法900のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 9a and 9b show a flow chart of another exemplary method 900 that can be used in the identification and extraction of information, based on one or more embodiments of the present disclosure. For example, FIGS. 9a and 9b show a flowchart of an exemplary method 900 that parses one or more web pages and determines if the web page is a personal academic web page. Although one web page will be described, Method 900 may be repeated for any number of web pages. Method 900 may reflect one embodiment of performing one or more operations of block 850 of FIG. In some embodiments, one or more of the actions associated with method 900 may be performed by the information gathering system 110. Alternatively or additionally, Method 900 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 900. Although illustrated as discrete blocks, the stages and behaviors associated with one or more of the blocks in Method 900 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

図9aを参照するに、ブロック905につながる破線矢印は、方法900が図8の方法800のブロック840から続いているなど、別の方法の続きでありうることを示している。 Referring to FIG. 9a, the dashed arrow leading to block 905 indicates that method 900 may be a continuation of another method, such as continuing from block 840 of method 800 of FIG.

ブロック905では、ウェブページ結果が解析されてもよい。ウェブページ解析は、該結果のコンテンツに関連付けられたキーワード・スコアを与えてもよい。ブロック905は、ブロック910、915、920および925のうちの一つまたは複数を含め、ウェブページ結果を解析することに含まれてもよい一つまたは複数の動作を含んでいてもよい。 At block 905, web page results may be analyzed. Web page analysis may give a keyword score associated with the resulting content. Block 905 may include one or more of blocks 910, 915, 920 and 925 and may include one or more actions that may be included in analyzing web page results.

ブロック910では、ウェブページが取ってこられてもよい。たとえば、情報収集システム(たとえば図1の情報収集システム110)が、ウェブ・ホスティング・システム(たとえば図1のウェブ・ホスティング・システム150のうちの一つ)にウェブページを要求するために、ネットワークを通じて通信してもよい。 At block 910, web pages may be fetched. For example, an information gathering system (eg, information gathering system 110 in FIG. 1) may request a web page from a web hosting system (eg, one of the web hosting systems 150 in FIG. 1) through a network. You may communicate.

ブロック915では、ウェブページのコンピュータ可読コードが、そのウェブページに含まれる一つまたは複数の情報ブロックを識別するために解析されてもよい。たとえば、ウェブページを表示するためにコンピュータによって使われるコードが解析されて、情報の諸ブロックを含みうるフィールドの位置を判別してもよい。いくつかの実施形態では、ウェブページは、ハイパーテキスト・マークアップ言語(HTML)、拡張可能ハイパーテキスト・マークアップ言語(XHTML)、拡張可能マークアップ言語(XML)、カスケーディングスタイルシート(CSS)、ジャバスクリプトおよび/またはウェブページを記述するコンピュータ可読コードを提供するために使われる他の任意の言語もしくは技法を使って呈示されてもよい。いくつかの実施形態では、コードは、閾値数より多くの単語をもつテキスト・ブロックを識別するために解析されてもよい。もう一つの例として、「刊行物(publications)」、「関心(interests)」、「連絡先情報(contact information)」、「概要(summary)」および/またはその他といったタイトルをもつテキスト・ブロックが検索されてもよい。 At block 915, the computer-readable code of the web page may be parsed to identify one or more blocks of information contained in the web page. For example, the code used by a computer to display a web page may be parsed to determine the location of fields that may contain blocks of information. In some embodiments, the web page is a hypertext markup language (HTML), an extensible hypertext markup language (XHTML), an extensible markup language (XML), a cascading style sheet (CSS), It may be presented using any other language or technique used to provide computer-readable code that describes Javascript and / or web pages. In some embodiments, the code may be parsed to identify text blocks with more words than the threshold number. As another example, search for text blocks with titles such as "publications", "interests", "contact information", "summary" and / or others. May be done.

ブロック920では、ブロック915で識別された情報ブロックからキーワードが抽出されてもよい。たとえば、情報ブロックの単語が情報収集システムによって識別された一つまたは複数のトピックと、あるいは一つまたはトピックに関連付けられたキーワードの他のリストと、比較されてもよい。もう一つの例として、ある種の型の単語が情報ブロック中の単語から除去されてもよく(たとえば「ある(a)」「その(the)」「関心がある(interested)」「楽しむ(enjoy)」「大学(university)」「学部(department)」および/またはその他)、残りの単語がソートされてもよい。追加的または代替的に、他の任意のキーワード抽出技法が使われてもよい。 In block 920, keywords may be extracted from the information block identified in block 915. For example, a word in an information block may be compared to one or more topics identified by an information gathering system, or to another list of keywords associated with one or a topic. As another example, certain types of words may be removed from the words in the information block (eg, "a", "the", "interested", "enjoy". ), "University," "department," and / or others), the remaining words may be sorted. Additional or alternative, any other keyword extraction technique may be used.

ブロック925では、キーワード・スコアが抽出されたキーワードに基づいて生成されてもよい。たとえば、キーワード・スコアは識別されたキーワードの数(8個のキーワードがみつかったことを反映するスコアなど)、全キーワードのうちの、識別されたあるトピックについてのキーワードの数(たとえばあるトピックについて12個中8個のキーワードがみつかったことを反映するスコアなど)、キーワードの頻度(情報ブロック中で使われる単語の四分の一があるトピックについてのキーワードであったことを反映するスコアなど)および/またはその他を表わしていてもよい。 At block 925, keyword scores may be generated based on the extracted keywords. For example, the keyword score is the number of identified keywords (such as a score that reflects the finding of eight keywords), and the number of keywords for a particular topic among all keywords (for example, 12 for a topic). Keyword frequency (such as a score that reflects that 8 of the keywords were found), keyword frequency (such as a score that reflects that a quarter of the words used in the information block were keywords for a topic), and / Or other may be represented.

ブロック930では、前記結果の一つまたは複数のアンカー・テキストが解析されてもよい。アンカー・テキストは、ハイパーリンクに関連付けられた可視テキストを含んでいてもよい。たとえば、アンカー・テキストはハイライトされ、ボールド体にされ、下線を付されあるいはそのテキストがハイパーリンクに関連していることを示すために他の仕方でフォーマットされうる。アンカー・テキスト解析は、アンカー・テキストに基づくアンカー・テキスト・スコアを与えうる。ブロック930は、ブロック935、940および945のうちの一つまたは複数を含め、アンカー・テキストを解析することに含められうる一つまたは複数の動作を含んでいてもよい。 At block 930, one or more anchor texts of the result may be parsed. The anchor text may include visible text associated with the hyperlink. For example, anchor text can be highlighted, bolded, underlined, or otherwise formatted to indicate that the text is related to a hyperlink. Anchor text analysis can give an anchor text score based on the anchor text. Block 930 may include one or more of blocks 935, 940 and 945 and may include one or more actions that may be included in parsing the anchor text.

ブロック935では、結果ウェブページ内で一つまたは複数のアンカー・テキストが識別されてもよい。たとえば、結果ウェブページは、前記結果におけるすべてのハイパーリンクを識別するようパースされてもよい。ハイパーリンクに関連する可視テキストは、アンカー・テキストとして識別されてもよい。 At block 935, one or more anchor texts may be identified within the resulting web page. For example, the results web page may be parsed to identify all hyperlinks in the results. Visible text associated with hyperlinks may be identified as anchor text.

ブロック940では、結果ウェブページのアンカー・テキストは、一つまたは複数のテキスト要素を求めて検索されてもよい。たとえば、アンカー・テキストは、著作者の名前を求めて検索されてもよい。もう一つの例として、アンカー・テキストは一つまたは複数のトピックおよび/または該一つまたは複数のトピックに関連するキーワードを求めて検索されてもよい。これらおよび他の実施形態において、アンカー・テキストは、該アンカー・テキストが何を同定しているかに基づいて範疇分けされてもよい。たとえば、アンカー・テキストが人の名前である場合、それは「名前」として範疇分けされてもよい。 At block 940, the anchor text of the resulting web page may be searched for one or more text elements. For example, anchor text may be searched for the name of the author. As another example, the anchor text may be searched for keywords related to one or more topics and / or the one or more topics. In these and other embodiments, the anchor text may be categorized based on what the anchor text identifies. For example, if the anchor text is a person's name, it may be categorized as a "name."

ブロック945では、アンカー・テキスト・スコアが生成されてもよい。いくつかの実施形態では、アンカー・テキスト・スコアは、著作者名に対応するアンカー・テキスト内の名前、アンカー・テキスト内のキーワード、アンカー・テキストが属する範疇および/またはその他に基づいていてもよい。たとえば、アンカー・テキスト・スコアは、著作者の名前をもつ一つのアンカー・テキスト、アンカー・テキスト内にキーワードをもつ二つのアンカー・テキストおよびトピックに関係した諸範疇内の二つの追加的キーワードがあることを反映してもよい。 At block 945, an anchor text score may be generated. In some embodiments, the anchor text score may be based on the name in the anchor text corresponding to the author's name, the keywords in the anchor text, the category to which the anchor text belongs and / or others. .. For example, the anchor text score has one anchor text with the author's name, two anchor texts with keywords within the anchor text, and two additional keywords within the topic-related categories. It may reflect that.

図9bを参照するに、ブロック950では、前記結果のURLが解析されてもよい。URLは該URLに基づくURLスコアを与えてもよい。ブロック950は、ブロック955、960および965を含め、URLを解析することに含まれうる一つまたは複数の動作を含んでいてもよい。 With reference to FIG. 9b, in block 950, the URL of the result may be parsed. The URL may give a URL score based on the URL. Block 950 may include one or more actions that may be included in parsing the URL, including blocks 955, 960 and 965.

ブロック955では、前記結果のURLが断片に分割されてもよい。たとえば、online.stanford.edu/instructors/andrew-ngを含むURLについては、このURLは「online」「stanford.edu」「instructors」および「andrew-ng」に分解されてもよい。これらおよび他の実施形態において、~、-、*および/またはその他のような特殊文字は断片から除去されてもよく、あるいは断片間の区切りとして使われてもよい。いくつかの実施形態では、URL断片はアンカー・テキストと同様の仕方で範疇分けされてもよい。たとえば、断片「andrew-ng」は名前範疇として範疇分けされてもよく、断片「stanford.edu」は所属またはエンティティとして範疇分けされてもよい。 At block 955, the resulting URL may be split into fragments. For example, for a URL containing online.stanford.edu / instructors / andrew-ng, this URL may be decomposed into "online", "stanford.edu", "instructors" and "andrew-ng". In these and other embodiments, special characters such as ~,-, * and / or others may be removed from the fragments or used as delimiters between fragments. In some embodiments, URL fragments may be categorized in a manner similar to anchor text. For example, the fragment "andrew-ng" may be categorized as a name category and the fragment "stanford.edu" may be categorized as an affiliation or entity.

ブロック960では、名前および/またはキーワードを求めて断片が検索されてもよい。たとえば、著作者の名前の全部または一部を求めて断片が検索されてもよい。追加的または代替的に、トピックまたはあるトピックに関連するキーワードを求めて断片が検索されてもよい。たとえば、著作者は該著作者がそれについて発表した一つまたは複数のトピックをもつことがあり、そのトピックに関連するキーワードが断片の間で検索されてもよい。 At block 960, fragments may be searched for names and / or keywords. For example, a fragment may be searched for all or part of the author's name. Additional or alternative, fragments may be searched for keywords related to a topic or a topic. For example, an author may have one or more topics that the author has published about it, and keywords related to that topic may be searched among the fragments.

ブロック965では、URLスコアが生成されてもよい。いくつかの実施形態では、URLスコアは、著作者の名前に対応する断片内の名前、断片内のキーワード、断片が属する範疇および/またはその他に基づいていてもよい。たとえば、断片スコアは、著作者のラストネームをもつ一つの断片があることを反映してもよい。 At block 965, a URL score may be generated. In some embodiments, the URL score may be based on the name within the fragment corresponding to the author's name, the keywords within the fragment, the category to which the fragment belongs and / or others. For example, the fragment score may reflect that there is one fragment with the author's last name.

ブロック970では、キーワード・スコア、アンカー・テキスト・スコアおよび/またはURLスコアに基づいて、結果ウェブページが個人学術ウェブページとして、あるいは別の型のウェブページとして範疇分けされてもよい。いくつかの実施形態では、キーワード・スコア、アンカー・テキスト・スコアおよびURLスコアはそれぞれ0から1までの間の数値を含んでいてもよく、すべての潜在的にありうるスコアの和は1に等しい。さらに、異なるスコアは異なる重みをかけられてもよい。たとえば、URLスコアはアンカー・テキスト・スコアより大きな重みがあってもよい。それらのスコアがみな等しい重みをかけられる場合には、各スコアは0.3333の可能な値をもちうる。いくつかの実施形態では、ウェブページの範疇分けにおいて機械学習エンジンが利用されてもよい。たとえば、機械学習エンジンが個人学術ウェブページのさまざまな特徴および/または共通性を識別しうるよう、既知の個人学術ウェブページの一つまたは複数のウェブページが、機械学習エンジンのための肯定的なトレーニング・データとして提供されてもよい。もう一つの例として、個人学術ウェブページではないことがわかっている一つまたは複数のウェブページが、機械学習エンジンのための否定的なトレーニング・データとして提供されてもよい。これらおよび他の実施形態において、受領された肯定的および/または否定的なトレーニング・データに基づいて、機械学習エンジンが分類アルゴリズムを生成してもよい。 At block 970, the resulting web page may be categorized as a personal academic web page or another type of web page based on the keyword score, anchor text score and / or URL score. In some embodiments, the keyword score, anchor text score, and URL score may each contain a number between 0 and 1, and the sum of all potentially possible scores is equal to 1. .. In addition, different scores may be weighted differently. For example, the URL score may have a greater weight than the anchor text score. Each score can have a possible value of 0.3333 if all of those scores are weighted equally. In some embodiments, a machine learning engine may be utilized in the categorization of web pages. For example, one or more known personal academic web pages are positive for a machine learning engine so that the machine learning engine can identify different features and / or commonalities of personal academic web pages. It may be provided as training data. As another example, one or more web pages that are known not to be personal academic web pages may be provided as negative training data for a machine learning engine. In these and other embodiments, the machine learning engine may generate a classification algorithm based on the positive and / or negative training data received.

いくつかの実施形態では、さまざまなスコアは、結果ウェブページの解析された側面が典型的な個人学術ウェブページにどのくらい類似しているかの表現でありうる。たとえば、たいていの学術ウェブページは、その人の研究プロジェクトおよび研究関心対象の記述、その人によって提供される科目およびレクチャーの記述、その人による刊行物の記述および/またはその他を含みうる。キーワード・スコア、アンカー・テキスト・スコアおよびURLスコアはまとめておよび/または個々に、結果ウェブページがそれらの型の特徴を含んでいることがどのくらい確からしいかを反映しうる。 In some embodiments, the various scores can be an expression of how similar the analyzed aspects of the resulting web page to a typical personal academic web page. For example, most scholarly web pages may contain descriptions of a person's research projects and interests, descriptions of subjects and lectures offered by that person, descriptions of publications by that person and / or others. Keyword scores, anchor text scores and URL scores can collectively and / or individually reflect how likely it is that the resulting web page will contain features of those types.

いくつかの実施形態では、スコアを使うのではなく、前記結果は、ブロック920で抽出されたキーワード、ブロック935で識別されたアンカー・テキストまたはブロック955の断片の一つまたは複数に基づいて範疇分けされてもよい。追加的または代替的に、範疇分けは、キーワード、アンカー・テキストまたは断片が分類された範疇に基づいていてもよい。 In some embodiments, rather than using scores, the results are categorized based on one or more of the keywords extracted in block 920, the anchor text identified in block 935, or the fragments of block 955. May be done. Additional or alternative, the categorization may be based on the categorization in which the keyword, anchor text or fragment is categorized.

いくつかの実施形態では、前記結果は、ソーシャル・メディア・ページ、個人学術ウェブページ、プロジェクト・ウェブサイト、ビジネス・エンティティ・ウェブサイト、学術部局ウェブサイトおよび/またはその他といった複数の範疇のうちの一つに範疇分けされてもよい。 In some embodiments, the result is one of a plurality of categories such as social media pages, personal academic web pages, project websites, business entity websites, academic department websites and / or others. It may be classified into one category.

ブロック975では、前記結果がブロック970で個人学術ウェブページとして範疇分けされたかどうかについて判定がなされてもよい。前記結果が個人学術ウェブページとして範疇分けされている場合、方法900はブロック980に進んでもよく、結果ウェブページは個人学術ウェブページ候補として追加される。前記結果が個人学術ウェブページとして範疇分けされてない場合、方法900は方法900の終わりの破線矢印に進んでもよい。 At block 975, a determination may be made as to whether the result was categorized as a personal academic web page at block 970. If the results are categorized as personal academic web pages, method 900 may proceed to block 980 and the resulting web pages are added as personal academic web page candidates. If the results are not categorized as a personal academic web page, Method 900 may proceed to the dashed arrow at the end of Method 900.

方法900の終わりの破線矢印は、方法900において同定された個人ウェブページ候補が、図8の方法800のブロック860などの一つまたは複数のさらなるプロセスまたはブロックによって使われてもよいことを示しうる。 The dashed arrow at the end of Method 900 may indicate that the personal web page candidate identified in Method 900 may be used by one or more additional processes or blocks, such as Block 860 of Method 800 in FIG. ..

図10は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントおよび個人学術ウェブページ候補を相互検証することにおいて使われうる例示的方法1000のフローチャートを示している。一つのソーシャル・メディア・アカウント候補に関して説明するが、方法1000は任意の数のソーシャル・メディア・アカウント候補について繰り返されてもよい。方法1000は、図7のブロック740の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法1000に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法1000はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法1000に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法1000のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 10 shows a flowchart of an exemplary method 1000 that can be used in mutual validation of social media accounts and personal academic web page candidates based on one or more embodiments of the present disclosure. Although one social media account candidate will be described, Method 1000 may be repeated for any number of social media account candidates. Method 1000 may reflect one embodiment of performing one or more operations of block 740 of FIG. In some embodiments, one or more of the actions associated with method 1000 may be performed by the information gathering system 110. Alternatively or additionally, Method 1000 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 1000. Although illustrated as discrete blocks, the steps and behaviors associated with one or more of the blocks in Method 1000 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック1010につながる破線矢印は、方法1000が図7の方法700のブロック730から続いているなど、別の方法の続きでありうることを示している。追加的または代替的に、破線矢印は、図11の方法1100、図12の方法1200、図13の方法1300または図14の方法1400の一つまたは複数からの続きであってもよい。 The dashed arrow leading to block 1010 indicates that method 1000 may be a continuation of another method, such as continuing from block 730 of method 700 of FIG. Additional or alternative, the dashed arrow may be a continuation of one or more of the method 1100 of FIG. 11, the method 1200 of FIG. 12, the method 1300 of FIG. 13 or the method 1400 of FIG.

ブロック1010では、ソーシャル・メディア・アカウント候補のプロフィールが取ってこられてもよい。たとえば、情報収集システム(たとえば図1の情報収集システム110)はソーシャル・メディア・システム(たとえば図1のソーシャル・メディア・システムのうちの一つまたは複数)に問い合わせをして、ソーシャル・メディア・アカウント候補のプロフィールを取得してもよい。いくつかの実施形態では、プロフィールだけが取ってこられ、情報収集システムはソーシャル・メディア・アカウント全体を受け取る必要はない。 At block 1010, profiles of potential social media accounts may be fetched. For example, an information gathering system (eg, information gathering system 110 in FIG. 1) contacts a social media system (eg, one or more of the social media systems in FIG. 1) to contact a social media account. You may get the profile of the candidate. In some embodiments, only the profile is fetched and the information gathering system does not need to receive the entire social media account.

ブロック1020では、プロフィール中のURLが識別されてもよい。たとえば、ソーシャル・メディア・アカウントのプロフィールは、該プロフィールが個人ウェブページのためのフィールドを含んでいるかどうかを判定するためにパースまたは解析されてもよい。いくつかの実施形態では、特定のソーシャル・メディア・アカウントはそのようなフィールドを含まなくてもよく、あるいはそのようなフィールドにエントリーを含まなくてもよい。そのようなフィールドが存在し、エントリーを含むとき、対応するエントリーはプロフィール中のURLとして識別されてもよい。いくつかの実施形態では、そのようなフィールドやそのようなフィールド中のエントリーがない場合には、方法1000は終了し、方法1000の終わりにおける破線矢印に進んで別の相互検証技法に進んでもよい。 At block 1020, URLs in the profile may be identified. For example, the profile of a social media account may be parsed or parsed to determine if the profile contains fields for personal web pages. In some embodiments, the particular social media account may or may not include such a field, or may not include an entry in such a field. When such a field exists and contains an entry, the corresponding entry may be identified as a URL in the profile. In some embodiments, if there is no such field or entry in such a field, method 1000 may exit and proceed to the dashed arrow at the end of method 1000 to another cross-validation technique. ..

ブロック1030では、ソーシャル・メディア・アカウント候補のプロフィールのURLは、個人学術ウェブページ候補のURLと比較されてもよい。 At block 1030, the URL of the profile of the candidate social media account may be compared with the URL of the candidate personal academic web page.

ブロック1040では、ソーシャル・メディア・アカウント候補のプロフィールのURLと個人学術ウェブページ候補のURLとの間の一致があるかどうかについて、ブロック1030の比較に基づいて判定がされてもよい。いくつかの実施形態では、判定は厳密な一致の問い合わせであってもよい。追加的または代替的に、問い合わせは、URL間の、少なくとも95%の一致または少なくとも90%の一致など、閾値を超える類似性を要求してもよい。一致があれば、方法1000はブロック1060に進んでもよい。一致がなければ、方法1000はブロック1050に進んでもよい。いくつかの実施形態では、URLのプロトコルおよび/またはサブドメインは、一致の目的のためには無視されてもよい。たとえば、そのような実施形態では、stanford.edu/instructors/andrew-ngとhttp://online.stanford.edu/instructors/andrew-ngというURLは一致と見出されてもよい。 At block 1040, it may be determined based on the comparison of block 1030 whether there is a match between the URL of the profile of the candidate social media account and the URL of the candidate personal academic web page. In some embodiments, the determination may be an exact match query. Additional or alternative, the query may require a similarity above the threshold, such as at least 95% or at least 90% match between URLs. If there is a match, method 1000 may proceed to block 1060. If there is no match, method 1000 may proceed to block 1050. In some embodiments, the URL protocol and / or subdomain may be ignored for matching purposes. For example, in such an embodiment, the URLs stanford.edu/instructors/andrew-ng and http://online.stanford.edu/instructors/andrew-ng may be found to match.

ブロック1050では、ソーシャル・メディア・アカウント候補のプロフィールのURLと比べるべきさらなる個人学術ウェブページ候補があるか否かについて判定がなされてもよい。比べるべき他の個人学術ウェブページ候補がない場合には、方法は方法1000の終わりの破線矢印に進んでもよい。比べるべきさらなる個人学術ウェブページ候補がある場合には、方法1000はブロック1030に戻ってもよい。 At block 1050, a determination may be made as to whether there are additional personal academic web page candidates to compare with the URL of the profile of the social media account candidate. If there are no other personal academic web page candidates to compare, the method may proceed to the dashed arrow at the end of Method 1000. Method 1000 may return to block 1030 if there are more personal academic web page candidates to compare.

ブロック1060では、ブロック1040で見出された一致に基づいて、個人学術ウェブページおよびソーシャル・メディア・アカウント候補が両方とも、前記著作者に関連していると確認されうる。たとえば、ソーシャル・メディア・アカウント・プロフィールのURLおよび個人学術ウェブページのURLを介した相互検証は、ソーシャル・メディア・アカウント候補および個人学術ウェブページ両方が前記著作者に正しく関連している確からしさを高めうる。いくつかの実施形態では、ブロック1060は方法1000の終わりの破線矢印に進んでもよい。追加的または代替的に、方法1000はブロック1060からブロック1050に進んでもよい。たとえば、方法1000は、ソーシャル・メディア・アカウント候補のプロフィールにおける二つ以上のURLがある場合に、ブロック1050に戻ってもよい。 At block 1060, it can be confirmed that both the personal scholarly web page and the social media account candidates are related to the author, based on the matches found in block 1040. For example, mutual validation via the URL of a social media account profile and the URL of a personal academic web page ensures that both the social media account candidate and the personal academic web page are correctly associated with the author. Can be enhanced. In some embodiments, block 1060 may proceed to the dashed arrow at the end of Method 1000. Additional or alternative, method 1000 may proceed from block 1060 to block 1050. For example, Method 1000 may return to block 1050 if there are more than one URL in the profile of a candidate social media account.

方法1000の終わりの破線矢印は、相互検証された個人ウェブページ候補およびソーシャル・メディア・アカウント候補が、図7の方法700のブロック750などの一つまたは複数のプロセスまたはブロックによって使われてもよいことを示しうる。追加的または代替的に、破線矢印は、図11の方法1100、図12の方法1200、図13の方法1300または図14の方法1400の一つまたは複数に進んでもよい。 The dashed arrow at the end of Method 1000 may indicate that mutually validated personal web page candidates and social media account candidates are used by one or more processes or blocks, such as Block 750 of Method 700 in Figure 7. Can show that. Additional or alternative, the dashed arrow may proceed to one or more of the method 1100 of FIG. 11, the method 1200 of FIG. 12, the method 1300 of FIG. 13 or the method 1400 of FIG.

図11は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントおよび個人学術ウェブページ候補を相互検証することにおいて使われうるもう一つの例示的方法1100のフローチャートを示している。一つの個人学術ウェブページ候補に関して説明するが、方法1100は任意の数の個人学術ウェブページ候補について繰り返されてもよい。方法1100は、図7のブロック740の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法1100に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法1100はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法1100に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法1100のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 11 shows a flowchart of another exemplary method 1100 that can be used in mutual validation of social media accounts and personal academic web page candidates based on one or more embodiments of the present disclosure. .. Although one personal academic web page candidate will be described, Method 1100 may be repeated for any number of personal academic web page candidates. Method 1100 may reflect one embodiment of performing one or more operations of block 740 of FIG. In some embodiments, one or more of the actions associated with method 1100 may be performed by the information gathering system 110. Alternatively or additionally, method 1100 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 1100. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks of Method 1100 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック1110につながる破線矢印は、方法1100が図7の方法700のブロック730から続いているなど、別の方法の続きでありうることを示している。追加的または代替的に、破線矢印は、図10の方法1000、図12の方法1200、図13の方法1300または図14の方法1400の一つまたは複数からの続きであってもよい。 The dashed arrow leading to block 1110 indicates that method 1100 may be a continuation of another method, such as continuing from block 730 of method 700 of FIG. Additional or alternative, the dashed arrow may be a continuation of one or more of the method 1000 of FIG. 10, the method 1200 of FIG. 12, the method 1300 of FIG. 13 or the method 1400 of FIG.

ブロック1110では、個人学術ウェブページ候補が取ってこられてもよい。たとえば、情報収集システム(たとえば図1の情報収集システム110)はウェブ・ホスティング・システム(たとえば図1のウェブ・ホスティング・システムの一つ)に問い合わせをして、個人学術ウェブページ候補を取得してもよい。 At block 1110, personal academic web page candidates may be fetched. For example, an information gathering system (eg, information gathering system 110 in FIG. 1) contacts a web hosting system (eg, one of the web hosting systems in FIG. 1) to obtain personal academic web page candidates. May be good.

ブロック1120では、個人学術ウェブページ候補に挙げられているソーシャル・メディア・アカウントを識別するために個人学術ウェブページ候補がパースされてもよい。たとえば、個人学術ウェブページ候補を表示するためにコンピュータによって使われるコードが、フィールドのタイトルまたはボディに一つまたは複数のソーシャル・メディア・プラットフォームを含むようなフィールドの位置を判別するために解析されてもよい。いくつかの実施形態では、そのようなフィールドやボディがなく、個人学術ウェブページ候補にソーシャル・メディア・アカウント識別子が見出されないような場合には、方法1100は終了してもよく、方法1100の終わりの破線矢印に進んで、別の相互検証技法に進んでもよい。 At block 1120, personal academic web page candidates may be parsed to identify social media accounts listed as personal academic web page candidates. For example, the code used by a computer to display personal academic web page suggestions is parsed to determine the location of a field that contains one or more social media platforms in the field title or body. May be good. In some embodiments, method 1100 may be terminated if there is no such field or body and no social media account identifier is found in the personal academic web page candidate. You may follow the dashed arrow at the end to another cross-validation technique.

ブロック1130では、識別されたソーシャル・メディア・アカウントが諸ソーシャル・メディア・アカウント候補と比べられてもよい。たとえば、比較は、個人学術ウェブページに挙げられているツイッターのハンドル、フェイスブック・アカウントの名前または個人学術ウェブページに表わされるソーシャル・メディア・アカウントの他の何らかの一意的な識別子を比べることを含んでいてもよい。 At block 1130, the identified social media account may be compared to various social media account candidates. For example, comparison involves comparing the Twitter handle listed on a personal academic web page, the name of a Facebook account, or any other unique identifier of a social media account represented on a personal academic web page. You may be.

ブロック1140では、ブロック1120において識別されたソーシャル・メディア・アカウントと諸ソーシャル・メディア・アカウント候補のうちのいずれかとの間に一致があるかどうかについて、ブロック1130での比較に基づいて判定がなされてもよい。いくつかの実施形態では、比較は厳密な一致の問い合わせであってもよい。追加的または代替的に、問い合わせは、少なくとも95%の一致または少なくとも90%の一致など、閾値を超える類似性を要求してもよい。一致があれば、方法1100はブロック1150に進んでもよい。一致がなければ、方法1100はブロック1100の終わりの破線矢印に進んでもよい。 In block 1140, a determination is made based on the comparison in block 1130 whether there is a match between the social media account identified in block 1120 and any of the social media account candidates. May be good. In some embodiments, the comparison may be an exact match query. Additional or alternative, the query may require a similarity above the threshold, such as at least 95% match or at least 90% match. If there is a match, method 1100 may proceed to block 1150. If there is no match, method 1100 may proceed to the dashed arrow at the end of block 1100.

ブロック1150では、ブロック1140で見出された一致に基づいて、個人学術ウェブページと、識別された個人学術ウェブページに一致するソーシャル・メディア・アカウント候補とが両方とも、前記著作者に関連していると確認されうる。たとえば、個人学術ウェブページおよび識別されたソーシャル・メディア・アカウントを介した相互検証は、ソーシャル・メディア・アカウント候補および個人学術ウェブページ両方が前記著作者に正しく関連している確からしさを高めうる。 In block 1150, both the personal academic web page and the social media account candidates that match the identified personal academic web page are related to the author, based on the match found in block 1140. It can be confirmed that it is. For example, mutual validation through a personal academic web page and an identified social media account can increase the certainty that both the social media account candidate and the personal academic web page are correctly associated with the author.

方法1100の終わりの破線矢印は、相互検証された個人ウェブページ候補およびソーシャル・メディア・アカウント候補が、図7の方法700のブロック750などの一つまたは複数のプロセスまたはブロックによって使われてもよいことを示しうる。追加的または代替的に、破線矢印は、図10の方法1000、図12の方法1200、図13の方法1300または図14の方法1400の一つまたは複数に進んでもよい。 The dashed arrow at the end of Method 1100 may indicate that mutually validated personal web page candidates and social media account candidates are used by one or more processes or blocks, such as Block 750 of Method 700 in FIG. Can show that. Additional or alternative, the dashed arrow may proceed to one or more of the method 1000 of FIG. 10, the method 1200 of FIG. 12, the method 1300 of FIG. 13 or the method 1400 of FIG.

図12は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントおよび個人学術ウェブページ候補を相互検証することにおいて使われうるもう一つの例示的方法1200のフローチャートを示している。一つの個人学術ウェブページ候補に関して説明するが、方法1200は任意の数の個人学術ウェブページ候補について繰り返されてもよい。方法1200は、図7のブロック740の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法1200に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法1200はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法1200に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法1200のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 12 shows a flowchart of another exemplary method 1200 that can be used in mutual validation of social media accounts and personal academic web page candidates based on one or more embodiments of the present disclosure. .. Although one personal academic web page candidate will be described, Method 1200 may be repeated for any number of personal academic web page candidates. Method 1200 may reflect one embodiment of performing one or more operations of block 740 of FIG. In some embodiments, one or more of the actions associated with method 1200 may be performed by the information gathering system 110. Alternatively or additionally, the method 1200 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 1200. Although illustrated as discrete blocks, the stages and behavior associated with one or more of the blocks of Method 1200 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック1210につながる破線矢印は、方法1200が図7の方法700のブロック730から続いているなど、別の方法の続きでありうることを示している。追加的または代替的に、破線矢印は、図10の方法1000、図11の方法1100、図13の方法1300または図14の方法1400の一つまたは複数からの続きであってもよい。 The dashed arrow leading to block 1210 indicates that method 1200 may be a continuation of another method, such as continuing from block 730 of method 700 of FIG. Additional or alternative, the dashed arrow may be a continuation of one or more of the method 1000 of FIG. 10, the method 1100 of FIG. 11, the method 1300 of FIG. 13 or the method 1400 of FIG.

ブロック1210では、個人学術ウェブページ候補が取ってこられてもよい。たとえば、情報収集システムがウェブ・ホスティング・システムに問い合わせをして、個人学術ウェブページ候補を取得してもよい。 At block 1210, personal academic web page candidates may be fetched. For example, an information gathering system may contact a web hosting system to obtain personal academic web page candidates.

ブロック1220では、第一写真と称される、個人学術ウェブページ候補の一つまたは複数の写真を識別し、抽出するために個人学術ウェブページ候補がパースされてもよい。たとえば、個人学術ウェブページ候補を表示するためにコンピュータによって使われるコードが、個人学術ウェブページ内の画像の位置を判別するために解析されてもよい。いくつかの実施形態では、抽出された写真は、該写真が人の写真であるかどうかを判定するために画像認識を使って解析されてもよい。いくつかの実施形態では、個人学術ウェブページ候補に写真がない場合には、方法1200は終了してもよく、方法1200の終わりの破線矢印に進んで、別の相互検証技法に進んでもよい。 At block 1220, personal academic web page candidates may be parsed to identify and extract one or more photographs of personal academic web page candidates, referred to as first photographs. For example, the code used by the computer to display a personal academic web page candidate may be parsed to determine the location of the image within the personal academic web page. In some embodiments, the extracted photo may be analyzed using image recognition to determine if the photo is a human photo. In some embodiments, if the personal academic web page candidate does not have a photo, method 1200 may be terminated or may proceed to the dashed arrow at the end of method 1200 to another cross-validation technique.

ブロック1230では、ソーシャル・メディア・アカウント候補のプロフィールが取ってこられてもよい。たとえば、情報収集システムがソーシャル・メディア・システムに問い合わせをして、ソーシャル・メディア・アカウント候補のプロフィールを取得してもよい。いくつかの実施形態では、プロフィールだけが取ってこられ、情報収集システムはソーシャル・メディア・アカウント全体を受け取る必要はない。 At block 1230, profiles of potential social media accounts may be fetched. For example, an information gathering system may contact the social media system to obtain a profile of potential social media accounts. In some embodiments, only the profile is fetched and the information gathering system does not need to receive the entire social media account.

ブロック1240では、ソーシャル・メディア・アカウント候補のプロフィールは、第二写真と称される、ソーシャル・メディア・アカウント・プロフィール内の一つまたは複数の写真を識別し、抽出するためにパースされてもよい。たとえば、ソーシャル・メディア・アカウント・プロフィールはしばしば、ソーシャル・メディア・アカウントの視覚的な識別子として、ソーシャル・メディア・アカウントに関連付けられた写真または他の画像を含む。いくつかの実施形態では、ソーシャル・メディア・アカウント候補プロフィールに写真がない場合には、方法1200は終了してもよく、方法1200の終わりの破線矢印に進んで、別の相互検証技法に進んでもよい。 At block 1240, the profile of a candidate social media account may be parsed to identify and extract one or more photos within the social media account profile, referred to as the second photo. .. For example, social media account profiles often include photos or other images associated with social media accounts as visual identifiers for social media accounts. In some embodiments, method 1200 may be terminated if the social media account candidate profile does not have a photo, or may proceed to the dashed arrow at the end of method 1200 to another cross-validation technique. good.

ブロック1250では、第一写真と第二写真が比較されてもよい。特徴比較技法、点ごとの技法および/またはその他など、いかなる画像比較技法が使われてもよい。いくつかの実施形態では、第一写真および/または第二写真は第一写真および第二写真の配向、スケール、クロッピングおよび/または他の特徴を揃えるために前処理されてもよい。いくつかの実施形態では、ブロック1250の比較は人の画像についてのみ実行されてもよい。追加的または代替的に、ブロック1250の比較は、任意の写真について実行されてもよい。一部の研究者は自分の研究プロジェクトの写真または他の同様の写真を自分のソーシャル・メディア・プロフィールおよび自分の個人学術ウェブページにおいて投稿することがあるからである。複数の第一写真および/または第二写真がある場合、第一写真の任意のものまたは全部が、第二写真の任意のものまたは全部と比較されてもよい。 At block 1250, the first and second photographs may be compared. Any image comparison technique may be used, such as feature comparison techniques, pointwise techniques and / or others. In some embodiments, the first and / or second photographs may be pretreated to align the orientation, scale, cropping and / or other features of the first and second photographs. In some embodiments, the comparison of blocks 1250 may only be performed on human images. Additional or alternative, the comparison of blocks 1250 may be performed for any photo. This is because some researchers may post photos of their research projects or other similar photos on their social media profiles and their personal academic web pages. If there are a plurality of first and / or second photographs, any or all of the first photographs may be compared with any or all of the second photographs.

いくつかの実施形態では、第一写真および/または第二写真は、顔認識アルゴリズムを使って解析されてもよい。たとえば、第一写真は個人学術ウェブページ候補の所有者の写真を含んでいることがあり、第二写真はソーシャル・メディア・アカウント候補の所有者の写真を含んでいることがある。いくつかの実施形態では、第一写真の顔認識解析からの結果が、第二写真の顔認識解析からの結果と比較されてもよい。比較は、それらの画像が同じ人物を含んでいる確からしさの指標を与えてもよい。 In some embodiments, the first and / or second photo may be analyzed using a face recognition algorithm. For example, the first photo may contain a photo of the owner of a candidate personal academic web page, and the second photo may contain a photo of the owner of a candidate social media account. In some embodiments, the results from the face recognition analysis of the first photo may be compared to the results from the face recognition analysis of the second photo. The comparison may give an indicator of the certainty that those images contain the same person.

ブロック1260では、第一写真と第二写真の間に一致があるかどうかについて判定がなされてもよい。いくつかの実施形態では、比較は厳密な一致の問い合わせであってもよい。追加的または代替的に、問い合わせは、第一写真と第二写真の間の少なくとも95%の一致または少なくとも90%の一致など、閾値を超える類似性を要求してもよい。一致があれば、方法1200はブロック1280に進んでもよい。一致がなければ、方法1200はブロック1270に進んでもよい。 At block 1260, a determination may be made as to whether there is a match between the first and second photographs. In some embodiments, the comparison may be an exact match query. Additional or alternative, the query may require a similarity above the threshold, such as at least 95% or at least 90% match between the first and second photographs. If there is a match, method 1200 may proceed to block 1280. If there is no match, method 1200 may proceed to block 1270.

ブロック1270では、写真を抽出するために取ってこられるべきさらなるソーシャル・メディア・アカウント候補があるか否かについて判定がなされてもよい。写真を抽出するために取ってこられるべき他のソーシャル・メディア・アカウント候補がない場合には、方法は方法1200の終わりの破線矢印に進んでもよい。写真を抽出するために取ってこられるべきさらなるソーシャル・メディア・アカウント候補がある場合には、方法1200はブロック1230に戻ってもよい。 At block 1270, a determination may be made as to whether there are additional social media account candidates that should be fetched to extract the photos. If there are no other social media account candidates to be fetched to extract the photo, the method may proceed to the dashed arrow at the end of Method 1200. Method 1200 may return to block 1230 if there are additional social media account candidates to be fetched to extract the photos.

ブロック1280では、ブロック1260で見出された一致に基づいて、個人学術ウェブページ候補とソーシャル・メディア・アカウント候補が両方とも、前記著作者に関連していると確認されうる。たとえば、個人学術ウェブページの第一写真およびソーシャル・メディア・アカウント・プロフィールの第二写真を介した相互検証は、ソーシャル・メディア・アカウント候補および個人学術ウェブページ候補両方が前記著作者に正しく関連している確からしさを高めうる。いくつかの実施形態では、ブロック1280は方法1200の終わりの破線矢印に進んでもよい。追加的または代替的に、方法1200はブロック1280からブロック1270に進んでもよい。たとえば、著作者が複数のソーシャル・メディア・アカウントをもっていることがありうるので、方法1200はブロック1270に戻ってもよい。 At block 1280, it can be confirmed that both the personal scholarly web page candidate and the social media account candidate are related to the author, based on the match found in block 1260. For example, mutual validation through the first photo of a personal academic web page and the second photo of a social media account profile shows that both the social media account candidate and the personal academic web page candidate are correctly associated with the author. It can increase the certainty of being. In some embodiments, block 1280 may proceed to the dashed arrow at the end of method 1200. Additional or alternative, method 1200 may proceed from block 1280 to block 1270. For example, method 1200 may return to block 1270, as the author may have multiple social media accounts.

方法1200の終わりの破線矢印は、相互検証された個人ウェブページ候補およびソーシャル・メディア・アカウント候補が、図7の方法700のブロック750などの一つまたは複数のプロセスまたはブロックによって使われてもよいことを示しうる。追加的または代替的に、破線矢印は、図10の方法1000、図11の方法1100、図13の方法1300または図14の方法1400の一つまたは複数に進んでもよい。 The dashed arrow at the end of Method 1200 may indicate that mutually validated personal web page candidates and social media account candidates are used by one or more processes or blocks, such as Block 750 of Method 700 in Figure 7. Can show that. Additional or alternative, the dashed arrow may proceed to one or more of the method 1000 of FIG. 10, the method 1100 of FIG. 11, the method 1300 of FIG. 13 or the method 1400 of FIG.

図13は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントおよび個人学術ウェブページ候補を相互検証することにおいて使われうるもう一つの例示的方法1300のフローチャートを示している。一つの個人学術ウェブページ候補に関して説明するが、方法1300は任意の数の個人学術ウェブページ候補について繰り返されてもよい。方法1300は、図7のブロック740の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法1300に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法1300はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法1300に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法1300のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 13 shows a flow chart of another exemplary method 1300 that may be used in mutual validation of social media accounts and personal academic web page candidates based on one or more embodiments of the present disclosure. .. Although one personal academic web page candidate will be described, Method 1300 may be repeated for any number of personal academic web page candidates. Method 1300 may reflect one embodiment of performing one or more operations of block 740 of FIG. In some embodiments, one or more of the actions associated with method 1300 may be performed by the information gathering system 110. Alternatively or additionally, method 1300 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 1300. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks in Method 1300 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック1310につながる破線矢印は、方法1300が図7の方法700のブロック730から続いているなど、別の方法の続きでありうることを示している。追加的または代替的に、破線矢印は、図10の方法1000、図11の方法1100、図12の方法1200または図14の方法1400の一つまたは複数からの続きであってもよい。 The dashed arrow leading to block 1310 indicates that method 1300 may be a continuation of another method, such as continuing from block 730 of method 700 of FIG. Additional or alternative, the dashed arrow may be a continuation of one or more of the method 1000 of FIG. 10, the method 1100 of FIG. 11, the method 1200 of FIG. 12 or the method 1400 of FIG.

ブロック1310では、個人学術ウェブページ候補が取ってこられてもよい。たとえば、情報収集システム(たとえば図1の情報収集システム110)がウェブ・ホスティング・システム(たとえば図1のウェブ・ホスティング・システムの一つ)に問い合わせをして、個人学術ウェブページ候補を取得してもよい。 At block 1310, personal academic web page candidates may be fetched. For example, an information gathering system (eg, information gathering system 110 in FIG. 1) contacts a web hosting system (eg, one of the web hosting systems in FIG. 1) to obtain personal academic web page candidates. May be good.

ブロック1320では、情報ブロックを識別するために個人学術ウェブページ候補がパースされてもよい。たとえば、個人学術ウェブページを表示するためにコンピュータによって使われるコードが解析されて、情報の諸ブロックを含みうるフィールドの位置を判別してもよい。いくつかの実施形態では、コードは、閾値数より多くの単語をもつテキスト・ブロックを識別するために解析されてもよい。もう一つの例として、「刊行物(publications)」、「関心(interests)」、「連絡先情報(contact information)」、「概要(summary)」および/またはその他といったタイトルをもつテキスト・ブロックが検索されてもよい。 At block 1320, personal academic web page candidates may be parsed to identify information blocks. For example, the code used by a computer to display a personal academic web page may be parsed to determine the location of fields that may contain blocks of information. In some embodiments, the code may be parsed to identify text blocks with more words than the threshold number. As another example, search for text blocks with titles such as "publications", "interests", "contact information", "summary" and / or others. May be done.

ブロック1330では、ブロック1320で識別された情報ブロックからキーワードが抽出されてもよい。たとえば、情報ブロックの単語が情報収集システムによって識別された一つまたは複数のトピックと、あるいは一つまたはトピックに関連付けられたキーワードの他のリストと、比較されてもよい。いくつかの実施形態では、キーワードは、あるトピックについての学術刊行物から自動的に抽出されてもよい。追加的または代替的に、他のいかなるキーワード抽出技法が使われてもよい。いくつかの実施形態では、キーワードは、「研究物理学者(research physicist)」または「ポスドクの志願者(post-doctoral candidate)」といった職業用語を含んでいてもよい。 In block 1330, keywords may be extracted from the information block identified in block 1320. For example, a word in an information block may be compared to one or more topics identified by an information gathering system, or to another list of keywords associated with one or a topic. In some embodiments, keywords may be automatically extracted from scholarly publications on a topic. Additional or alternative, any other keyword extraction technique may be used. In some embodiments, the keyword may include occupational terms such as "research physicist" or "post-doctoral candidate".

ブロック1340では、ソーシャル・メディア・アカウント候補のプロフィールが取ってこられてもよい。たとえば、情報収集システムはソーシャル・メディア・システム(たとえば図1のソーシャル・メディア・システム)に問い合わせをして、ソーシャル・メディア・アカウント候補のプロフィールを取得してもよい。いくつかの実施形態では、プロフィールだけが取ってこられ、情報収集システムはソーシャル・メディア・アカウント全体を受け取る必要はない。 At block 1340, profiles of potential social media accounts may be fetched. For example, the information gathering system may contact a social media system (eg, the social media system of FIG. 1) to obtain a profile of a candidate social media account. In some embodiments, only the profile is fetched and the information gathering system does not need to receive the entire social media account.

ブロック1350では、抽出されたキーワードが、ソーシャル・メディア・アカウント候補プロフィール内のテキストと比較されてもよい。たとえば、ソーシャル・メディア・アカウント・プロフィール内の任意のテキストから、ブロック1330で抽出されたキーワードが検索されてもよい。いくつかの実施形態では、任意のオーバーラップがスコアを与えられてもよく、スコアは連続する一致する用語とともに上昇してもよく、あるいは同じ文における一致する用語の数の増大とともに上昇してもよい。 At block 1350, the extracted keywords may be compared to the text in the social media account candidate profile. For example, the keywords extracted in block 1330 may be searched from any text in the social media account profile. In some embodiments, any overlap may be given a score, the score may increase with consecutive matching terms, or may increase with increasing number of matching terms in the same sentence. good.

ブロック1360では、個人学術ウェブページ候補から抽出されたキーワードがプロフィールからのテキストとの類似性閾値を超えるかどうかについて判定がなされてもよい。たとえば、オーバーラップに関連するスコアが、キーワードにおける高いレベルのオーバーラップを示す閾値を超えるかどうかについて判定がなされてもよい。いくつかの実施形態では、閾値は、どのキーワードがソーシャル・メディア・アカウント候補と個人学術ウェブページ候補両方に現われることが見出されるかに基づいて変わってもよい。たとえば、より一般的なキーワードについては、それほど一般的でないキーワードについてよりも閾値が高くてもよい。類似性閾値を超えているとの判定後、方法1300はブロック1380に進んでもよい。類似性閾値を超えていないとの判定後、方法1300はブロック1370に進んでもよい。 At block 1360, it may be determined whether the keywords extracted from the personal academic web page candidates exceed the similarity threshold with the text from the profile. For example, a determination may be made as to whether the score associated with the overlap exceeds a threshold indicating a high level of overlap in the keyword. In some embodiments, the threshold may vary based on which keywords are found to appear in both social media account candidates and personal academic web page candidates. For example, more general keywords may have a higher threshold than less common keywords. After determining that the similarity threshold is exceeded, method 1300 may proceed to block 1380. After determining that the similarity threshold is not exceeded, method 1300 may proceed to block 1370.

ブロック1370では、前記キーワードと比較するために取ってこられるべきさらなるソーシャル・メディア・アカウント候補があるか否かについて判定がなされてもよい。取ってこられるべき他のソーシャル・メディア・アカウント候補がないとの判定後は、方法は方法1300の終わりの破線矢印に進んでもよい。取ってこられるべきさらなるソーシャル・メディア・アカウント候補があるとの判定後には、方法1300はブロック1340に戻ってもよい。 At block 1370, a determination may be made as to whether there are additional social media account candidates that should be fetched for comparison with the keyword. After determining that there are no other social media account candidates to be fetched, the method may proceed to the dashed arrow at the end of Method 1300. Method 1300 may return to block 1340 after determining that there are additional social media account candidates to be fetched.

ブロック1380では、ブロック1360での判定に基づいて、個人学術ウェブページ候補とソーシャル・メディア・アカウント候補が両方とも、前記著作者に関連していると確認されうる。たとえば、個人学術ウェブページのキーワードおよびソーシャル・メディア・アカウント・プロフィールのプロフィールのテキストを介した相互検証は、ソーシャル・メディア・アカウント候補および個人学術ウェブページ候補両方が前記著作者に正しく関連している確からしさを高めうる。いくつかの実施形態では、ブロック1380は方法1300の終わりの破線矢印に進んでもよい。追加的または代替的に、方法1300はブロック1380からブロック1370に進んでもよい。たとえば、著作者が複数のソーシャル・メディア・アカウントをもっていることがありうるので、方法1300はブロック1370に戻ってもよい。 At block 1380, it can be confirmed that both the personal academic web page candidate and the social media account candidate are related to the author, based on the determination in block 1360. For example, mutual validation through keywords on personal academic web pages and profile texts on social media account profiles shows that both social media account candidates and personal academic web page candidates are correctly associated with the author. It can increase the certainty. In some embodiments, block 1380 may proceed to the dashed arrow at the end of method 1300. Additional or alternative, method 1300 may proceed from block 1380 to block 1370. For example, method 1300 may return to block 1370, as the author may have multiple social media accounts.

方法1300の終わりの破線矢印は、相互検証された個人ウェブページ候補およびソーシャル・メディア・アカウント候補が、図7の方法700のブロック750などの一つまたは複数のプロセスまたはブロックによって使われてもよいことを示しうる。追加的または代替的に、破線矢印は、図10の方法1000、図11の方法1100、図12の方法1200または図14の方法1400の一つまたは複数に進んでもよい。 The dashed arrow at the end of Method 1300 may indicate that mutually validated personal web page candidates and social media account candidates are used by one or more processes or blocks, such as Block 750 of Method 700 in FIG. Can show that. Additional or alternative, the dashed arrow may proceed to one or more of the method 1000 of FIG. 10, the method 1100 of FIG. 11, the method 1200 of FIG. 12 or the method 1400 of FIG.

図14は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントおよび個人学術ウェブページ候補を相互検証することにおいて使われうるもう一つの例示的方法1400のフローチャートを示している。一つの個人学術ウェブページ候補に関して説明するが、方法1400は任意の数の個人学術ウェブページ候補について繰り返されてもよい。方法1400は、図7のブロック740の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法1400に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法1400はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法1400に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法1400のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 14 shows a flow chart of another exemplary method 1400 that can be used in mutual validation of social media accounts and personal academic web page candidates based on one or more embodiments of the present disclosure. .. Although one personal academic web page candidate will be described, Method 1400 may be repeated for any number of personal academic web page candidates. Method 1400 may reflect one embodiment of performing one or more operations of block 740 of FIG. In some embodiments, one or more of the actions associated with method 1400 may be performed by the information gathering system 110. Alternatively or additionally, method 1400 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 1400. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks in Method 1400 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック1410につながる破線矢印は、方法1400が図7の方法700のブロック730から続いているなど、別の方法の続きでありうることを示している。追加的または代替的に、破線矢印は、図10の方法1000、図11の方法1100、図12の方法1200または図13の方法1300の一つまたは複数からの続きであってもよい。 The dashed arrow leading to block 1410 indicates that method 1400 may be a continuation of another method, such as continuing from block 730 of method 700 of FIG. Additional or alternative, the dashed arrow may be a continuation of one or more of the method 1000 of FIG. 10, the method 1100 of FIG. 11, the method 1200 of FIG. 12 or the method 1300 of FIG.

ブロック1410では、個人学術ウェブページ候補が取ってこられてもよい。ブロック1410は図13のブロック1310と同様または同等であってもよい。 At block 1410, personal academic web page candidates may be fetched. Block 1410 may be similar to or equivalent to block 1310 in FIG.

ブロック1420では、情報ブロックを識別するために個人学術ウェブページ候補がパースされてもよい。ブロック1420は図13のブロック1320と同様または同等であってもよい。 At block 1420, personal academic web page candidates may be parsed to identify information blocks. Block 1420 may be similar to or equivalent to block 1320 in FIG.

ブロック1430では、ブロック1420で識別された情報ブロックからキーワードが抽出されてもよい。ブロック1430は図13のブロック1330と同様または同等であってもよい。 In block 1430, keywords may be extracted from the information block identified in block 1420. Block 1430 may be similar to or equivalent to block 1330 in FIG.

ブロック1440では、あるソーシャル・メディア・アカウント候補にリンクされた諸ソーシャル・メディア・アカウントのプロフィールが取ってこられてもよい。たとえば、前記ソーシャル・メディア・アカウント候補から情報を得ている(たとえば前記ソーシャル・メディア・アカウント候補をフォローしている)ソーシャル・メディア・アカウントおよび/または前記ソーシャル・メディア・アカウント候補がそこから情報を得ている(たとえば、前記ソーシャル・メディア・アカウント候補がフォローしている)ソーシャル・メディア・アカウントを識別するために、情報処理システムはソーシャル・メディア・システムに問い合わせしてもよい。ソーシャル・メディア・システムはさらに、それらのフォローしているおよび/またはフォローされているソーシャル・メディア・アカウントのプロフィールを送るよう要求されてもよい。いくつかの実施形態では、要求されるプロフィールの数は数値的に打ち切られてもよく、たとえば50個のプロフィールまたは100個のプロフィールまたは200個のプロフィールおよび/またはその他で打ち切られてもよい。 Block 1440 may fetch profiles of social media accounts linked to certain social media account candidates. For example, a social media account that is getting information from the social media account candidate (eg, following the social media account candidate) and / or the social media account candidate is getting information from it. The information processing system may contact the social media system to identify the social media account it has acquired (eg, followed by the social media account candidate). Social media systems may also be required to send profiles of their following and / or followed social media accounts. In some embodiments, the number of required profiles may be censored numerically, for example 50 profiles or 100 profiles or 200 profiles and / or others.

ブロック1450では、抽出されたキーワードがソーシャル・メディア・アカウント・プロフィールのテキストと比較されてもよい。いくつかの実施形態では、ブロック1450は図13のブロック1350と同様または同等であってもよいが、比較が、前記ソーシャル・メディア・アカウント候補自身のプロフィールではなく、前記ソーシャル・メディア・アカウント候補にリンクされているソーシャル・メディア・アカウントのプロフィールについて実行されるという相違がある。 At block 1450, the extracted keywords may be compared to the text of the social media account profile. In some embodiments, block 1450 may be similar to or equivalent to block 1350 of FIG. 13, but the comparison is to the social media account candidate rather than to the profile of the social media account candidate itself. The difference is that it runs for the profile of the linked social media account.

ブロック1460では、個人学術ウェブページ候補から抽出されたキーワードがリンクされたソーシャル・メディア・アカウントのプロフィールのうち一つまたは複数のプロフィールのテキストとの類似性閾値を超えるかどうかについて判定がなされてもよい。いくつかの実施形態では、判定は各プロフィールについて、あるいはすべてのプロフィールのテキストを横断してなされてもよい。類似性閾値を超えているとの判定後、方法1400はブロック1480に進んでもよい。類似性閾値を超えていないとの判定後、方法1400はブロック1470に進んでもよい。いくつかの実施形態では、方法1400がブロック1470ではなくブロック1480に進む前に、前記類似性閾値を超えるリンクされたソーシャル・メディア・アカウント・プロフィールの最小限の数および/または割合があってもよい。 Block 1460 determines whether keywords extracted from personal academic web page candidates exceed the similarity threshold with the text of one or more of the linked social media account profiles. good. In some embodiments, the determination may be made for each profile or across the text of all profiles. After determining that the similarity threshold is exceeded, method 1400 may proceed to block 1480. After determining that the similarity threshold is not exceeded, method 1400 may proceed to block 1470. In some embodiments, even if there is a minimum number and / or proportion of linked social media account profiles that exceed the similarity threshold before Method 1400 proceeds to block 1480 instead of block 1470. good.

ブロック1470では、前記キーワードと比較するために取ってこられるべきリンクされたアカウントのプロフィールをもつさらなるソーシャル・メディア・アカウント候補があるか否かについて判定がなされてもよい。取ってこられるべき他のソーシャル・メディア・アカウント候補がない場合は、方法は方法1400の終わりの破線矢印に進んでもよい。取ってこられるべきさらなるソーシャル・メディア・アカウント候補がある場合には、方法1400はブロック1440に戻ってもよい。 At block 1470, a determination may be made as to whether there are additional social media account candidates with a linked account profile that should be fetched for comparison with the keyword. If there are no other social media account candidates to be fetched, the method may proceed to the dashed arrow at the end of Method 1400. Method 1400 may return to block 1440 if there are additional social media account candidates to be fetched.

ブロック1480では、ブロック1460での判定に基づいて、個人学術ウェブページ候補とソーシャル・メディア・アカウント候補が両方とも、前記著作者に関連していると確認されうる。たとえば、個人学術ウェブページのキーワードおよびソーシャル・メディア・アカウント候補のリンクされたソーシャル・メディア・アカウントのプロフィールのテキストを介した相互検証は、ソーシャル・メディア・アカウント候補および個人学術ウェブページ両方が前記著作者に正しく関連している確からしさを高めうる。いくつかの実施形態では、ブロック1480は方法1400の終わりの破線矢印に進んでもよい。追加的または代替的に、方法1400はブロック1480からブロック1470に進んでもよい。たとえば、著作者は複数のソーシャル・メディア・アカウントをもつことがあるので、方法1400はブロック1470に戻ってもよい。 At block 1480, it can be confirmed that both the personal academic web page candidate and the social media account candidate are related to the author, based on the determination at block 1460. For example, cross-validation via keywords on personal academic web pages and linked social media account profile texts for social media account candidates is described by both social media account candidates and personal academic web pages. It can increase the certainty that it is correctly related to the author. In some embodiments, block 1480 may proceed to the dashed arrow at the end of method 1400. Additional or alternative, method 1400 may proceed from block 1480 to block 1470. For example, method 1400 may return to block 1470, as the author may have multiple social media accounts.

方法1400の終わりの破線矢印は、相互検証された個人ウェブページ候補およびソーシャル・メディア・アカウント候補が、図7の方法700のブロック750などの一つまたは複数のプロセスまたはブロックによって使われてもよいことを示しうる。追加的または代替的に、破線矢印は、図10の方法1000、図11の方法1100、図12の方法1200または図13の方法1300の一つまたは複数に進んでもよい。 The dashed arrow at the end of Method 1400 may indicate that mutually validated personal web page candidates and social media account candidates are used by one or more processes or blocks, such as Block 750 of Method 700 in FIG. Can show that. Additional or alternative, the dashed arrow may proceed to one or more of the method 1000 of FIG. 10, the method 1100 of FIG. 11, the method 1200 of FIG. 12 or the method 1300 of FIG.

〈センサーとしてのソーシャル・メディア・アカウント〉
一つまたは複数の実施形態において、本開示は、ソーシャル・メディア・アカウントを、他の知識のあるソーシャル・メディア・アカウントを識別するためのセンサーとして使うことを含みうる。たとえば、あるソーシャル・メディア・アカウントが知識のある人物に関連しているかどうかを判定する際、ソーシャル・メディア・アカウントをフォローしているおよび/またはソーシャル・メディア・アカウントによってフォローされているソーシャル・メディア・アカウントが解析されてもよい。本開示の一つまたは複数の実施形態は、知識のある人々が、特定のトピックについて知識のある他者を認識し、該他者からの情報を求めることができることを利用しうる。たとえば、機械学習について著作のある教授は、機械学習について知識のある他の人々をソーシャル・メディア上でフォローし、該他の人々によってフォローされることがありうる。さらに、知識のある人々によってフォローされるアカウントは、知識のある人物をフォローしているアカウントより、所与のトピックについて知識のある人物のアカウントである可能性が高いことがありうる。たとえば、大学院生は所与のトピックについて知識があると知られている特定の教授をフォローすることがあるが、そのことはその特定の教授がその大学院生からの識見を知識があると考えていることは意味しないことがある。既知の知識のある人々のシード・ソーシャル・メディア・アカウントにおけるリンクを解析し、利用することにより、シード・ソーシャル・メディア・アカウントは、他の知識のある人々のソーシャル・メディア・アカウントを識別する際のセンサーとして機能しうる。いくつかの実施形態では、候補ソーシャル・メディア・アカウントのさまざまな集合が生成され、次いで該候補が知識のあるアカウントであるか否か、あるいは学習者ソーシャル・メディア・アカウントのような他の何らかの範疇に含められうるかどうかを判定するために解析されてもよい。知識のあるソーシャル・メディア・アカウントは、所与のトピックについて知識のある人物に関連しているソーシャル・メディア・アカウントを参照することがありうる。学習者ソーシャル・メディア・アカウントは、所与のトピックに関心があるが該所与のトピックについて知識があるかもしれないしないかもしれない人物に関連したソーシャル・メディア・アカウントを参照することがありうる。
<Social media account as a sensor>
In one or more embodiments, the disclosure may include using a social media account as a sensor for identifying other knowledgeable social media accounts. For example, social media that is following a social media account and / or is being followed by a social media account in determining whether a social media account is associated with a knowledgeable person. -Accounts may be analyzed. One or more embodiments of the present disclosure may take advantage of the ability of knowledgeable people to recognize others who are knowledgeable about a particular topic and to seek information from those others. For example, a professor who writes about machine learning may follow other people who are knowledgeable about machine learning on social media and be followed by those other people. In addition, an account followed by a knowledgeable person may be more likely to be an account of a person who is knowledgeable about a given topic than an account that is following a knowledgeable person. For example, a graduate student may follow a particular professor who is known to be knowledgeable about a given topic, considering that particular professor is knowledgeable of the insights from that graduate student. Being may not mean. By analyzing and using links in seed social media accounts of people with known knowledge, seed social media accounts can identify social media accounts of other knowledgeable people. Can function as a sensor for. In some embodiments, various sets of candidate social media accounts are generated, then whether the candidate is a knowledgeable account or some other category, such as a learner social media account. It may be analyzed to determine if it can be included in. A knowledgeable social media account may refer to a social media account associated with a knowledgeable person on a given topic. A learner social media account may refer to a social media account associated with a person who is interested in a given topic but may or may not be knowledgeable about the given topic. ..

図15は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントの候補集合の生成の例示的な概略表現1500を示している。いくつかの実施形態では、概略表現1500は、ソーシャル・メディア・アカウントを知識のあるソーシャル・メディア・アカウントおよび/または学習者ソーシャル・メディア・アカウントについての候補として識別するプロセスまたはプロセスの一部を示しうる。これらおよび他の実施形態において、概略表現1500によって示されるプロセスまたはプロセスの一部の一部は、図1のシステム100の動作の例であってもよい。たとえば、いくつかの実施形態では、情報収集システム110が概略表現1500に示されるように候補集合を生成するよう構成されてもよい。 FIG. 15 shows an exemplary 1500 schematic representation of the generation of a candidate set for social media accounts, based on one or more embodiments of the present disclosure. In some embodiments, the schematic 1500 indicates a process or part of a process that identifies a social media account as a candidate for a knowledgeable social media account and / or a learner social media account. sell. In these and other embodiments, the process or part of a process represented by the schematic representation 1500 may be an example of the operation of system 100 in FIG. For example, in some embodiments, the information gathering system 110 may be configured to generate candidate sets as shown in schematic representation 1500.

図15に示されるように、シード・ソーシャル・メディア・アカウントの集合1510は一つまたは複数のソーシャル・メディア・アカウント1512a~1512g(概括的にシード・ソーシャル・メディア・アカウント(単数または複数)1512と称される)を含んでいてもよい。シード・ソーシャル・メディア・アカウントの集合1510は、所与のトピックについて知識のあるソーシャル・メディア・アカウントであることがわかっているシード・ソーシャル・メディア・アカウント1512を含んでいてもよい。たとえば、(図2および/または図6に示されるような)本開示のプロセスを使って、所与のトピックについての刊行物の著作者がその著作者に関連付けられたソーシャル・メディア・アカウントを有していてもよい。該著作者に関連付けられたソーシャル・メディア・アカウントは、その刊行物のトピックについて知識のある人物のソーシャル・メディア・アカウントでありうる。そのようなソーシャル・メディア・アカウントは、シード・ソーシャル・メディア・アカウント1512の一つとして含められてもよい。追加的または代替的に、ユーザーが、自分自身または別のソーシャル・メディア・アカウントを、シード・ソーシャル・メディア・アカウント1512の一つとして含まれるべきソーシャル・メディア・アカウントとして提出してもよい。シード・ソーシャル・メディア・アカウント1512を同定するために、ピアレビュー、ピア推薦、大学学部識別、組織識別などといった他のいかなる方法またはプロセスが利用されてもよい。 As shown in FIG. 15, a set of seed social media accounts 1510 is one or more social media accounts 1512a-1512g (generally with seed social media accounts (s) 1512). May be included). The set of seeded social media accounts 1510 may include seed social media accounts 1512 that are known to be social media accounts that are knowledgeable about a given topic. For example, using the process of this disclosure (as shown in Figure 2 and / or Figure 6), the author of a publication on a given topic has a social media account associated with that author. You may be doing it. The social media account associated with the author can be a social media account of a person who is knowledgeable about the topic of the publication. Such social media accounts may be included as one of the seed social media accounts 1512. In addition or alternatives, the user may submit himself or another social media account as a social media account that should be included as one of the seed social media accounts 1512. Any other method or process may be used to identify the seed social media account 1512, such as peer reviews, peer recommendations, undergraduate identification, organizational identification, and the like.

シード・ソーシャル・メディア・アカウント1512に付随する矢印は、シード・ソーシャル・メディア・アカウント1512にリンクされているソーシャル・メディア・アカウントを示しうる。たとえば、所与のソーシャル・メディア・アカウントから出て行く矢印は、該所与のソーシャル・メディア・アカウントがそこから情報を得ているソーシャル・メディア・アカウントまたは該所与のソーシャル・メディア・アカウントによってフォローされているソーシャル・メディア・アカウントを示しうる。所与のソーシャル・メディア・アカウントに向かう矢印は、該所与のソーシャル・メディア・アカウントから情報を得ているソーシャル・メディア・アカウントまたは該所与のソーシャル・メディア・アカウントをフォローしているソーシャル・メディア・アカウントを示しうる。たとえば、シード・ソーシャル・メディア・アカウント1512aについて、シード・ソーシャル・メディア・アカウント1512aはソーシャル・メディア・アカウント1522a、1512b、1512cおよび1512eをフォローしており、ソーシャル・メディア・アカウント1512bおよび1532eによってフォローされている。もう一つの例として、ソーシャル・メディア・アカウント1522aについて、ソーシャル・メディア・アカウント1522aはソーシャル・メディア・アカウント1512cをフォローしており、ソーシャル・メディア・アカウント1512a、1512bおよび1512eによってフォローされている。 The arrow attached to the seed social media account 1512 may indicate a social media account linked to the seed social media account 1512. For example, an arrow exiting a given social media account is by the social media account or the given social media account from which the given social media account is informed. Can indicate the social media account being followed. An arrow pointing to a given social media account is the social media account that is getting information from the given social media account or the social media that is following the given social media account. Can indicate a media account. For example, for the seed social media account 1512a, the seed social media account 1512a follows the social media accounts 1522a, 1512b, 1512c and 1512e and is followed by the social media accounts 1512b and 1532e. ing. As another example, for social media account 1522a, social media account 1522a is following social media account 1512c, followed by social media accounts 1512a, 1512b and 1512e.

いくつかの実施形態では、ソーシャル・メディア・アカウントの第一の候補集合1520が生成されてもよい。たとえば、第一の候補集合1520は、シード・ソーシャル・メディア・アカウント1512のソーシャル・メディア・アカウント・プロフィールを取ってきて、シード・ソーシャル・メディア・アカウント1512によってフォローされているすべてのソーシャル・メディア・アカウントを識別することによって生成されてもよく、これらのアカウントは、ソーシャル・メディア・アカウント1522aおよび1522b(ソーシャル・メディア・アカウント1522と称される)として第一の候補集合1520に加えられてもよい。 In some embodiments, a first candidate set 1520 for social media accounts may be generated. For example, the first candidate set 1520 fetches the social media account profile of the seed social media account 1512 and all the social media followed by the seed social media account 1512. They may be created by identifying accounts and these accounts may be added to the first candidate set 1520 as social media accounts 1522a and 1522b (referred to as social media accounts 1522). ..

いくつかの実施形態では、一つまたは複数のソーシャル・メディア・アカウントが第一の候補集合1520から除去されてもよい。たとえば、第一の候補集合1520は解析されて、すでにシード・ソーシャル・メディア・アカウントの集合1510にはいっているソーシャル・メディア・アカウントがあればそれを同定してもよい。たとえば、シード・ソーシャル・メディア・アカウント1512aはソーシャル・メディア・アカウント1512bをフォローしているが、ソーシャル・メディア・アカウント1512bはすでにシード・ソーシャル・メディア・アカウントの集合1510にはいっており、よってソーシャル・メディア・アカウント1512bは第一の候補集合1520から除去されてもよい。 In some embodiments, one or more social media accounts may be removed from the first candidate set 1520. For example, the first candidate set 1520 may be analyzed to identify any social media accounts already in the seed social media account set 1510. For example, the seed social media account 1512a follows the social media account 1512b, while the social media account 1512b is already in the set of seed social media accounts 1510, and thus social. Media account 1512b may be removed from the first candidate set 1520.

もう一つの例として、ソーシャル・メディア・アカウント1522の一つまたは複数が解析されて、人物、組織、刊行物、ソフトウェア・ベンダー、会議またはその他によって所有されているかどうかが判別されてもよい。たとえば、いくつかの会議は、所与のトピックに関連しうるが前記所与のトピックについて知識のある人物に関連しないことがあるソーシャル・メディア投稿を生成するツイッター・アカウントを含むことがある。いくつかの実施形態では、実際の人々によって所有されているソーシャル・メディア・アカウントが第一の候補集合1520に含められる。 As another example, one or more of the social media accounts 1522 may be analyzed to determine if they are owned by a person, organization, publication, software vendor, conference or otherwise. For example, some meetings may include a Twitter account that generates social media posts that may be related to a given topic but not to someone who is knowledgeable about the given topic. In some embodiments, social media accounts owned by real people are included in the first candidate set 1520.

第一の候補集合1520から除去されるソーシャル・メディア・アカウント1522のもう一つの例は、一般的に適用可能なソーシャル・メディア・アカウントまたは一般的ソーシャル・メディア・アカウントを含みうる。たとえば、人気のある映画スターまたは政治家はあるトピックについて多数の知識ある人々によってフォローされることがありうるが、そのことは、その映画スターや政治家が必ずそのトピックについて知識があることを示すのではないことがある。本開示の一つまたは複数の実施形態は、そのような一般的なソーシャル・メディア・アカウントを除去してもよい。そのような手法の例示的な方法は図18に示される。 Another example of a social media account 1522 removed from the first candidate set 1520 may include a generally applicable social media account or a general social media account. For example, a popular movie star or politician may be followed by a large number of knowledgeable people on a topic, which indicates that the movie star or politician is always knowledgeable on the topic. It may not be. One or more embodiments of the present disclosure may eliminate such general social media accounts. An exemplary method of such a technique is shown in FIG.

いくつかの実施形態では、第一の候補集合1520のソーシャル・メディア・アカウント1522が解析されて、ソーシャル・メディア・アカウント1522がシード・ソーシャル・メディア・アカウント1512として含まれているかどうかが判定されてもよい。いくつかの実施形態では、そのような解析は、第一の候補集合1520からさまざまなソーシャル・メディア・アカウントを除去することを含んでいてもよく、残りのソーシャル・メディア・アカウント1522がシード・ソーシャル・メディア・アカウント1510に追加されてもよい。追加的または代替的に、ソーシャル・メディア・アカウント1522に対して追加的な解析が実行されてもよい。これらおよび他の実施形態において、追加的なシード・ソーシャル・メディア・アカウント1512を含めることで、それらの新たに追加されたシード・ソーシャル・メディア・アカウントを使って、さらなるシード・ソーシャル・メディア・アカウントを識別するプロセスが実行されうる。 In some embodiments, the social media account 1522 of the first candidate set 1520 is analyzed to determine if the social media account 1522 is included as the seed social media account 1512. May be good. In some embodiments, such analysis may include removing various social media accounts from the first candidate set 1520, with the remaining social media accounts 1522 being seed social. -May be added to media account 1510. Additional or alternative, additional analysis may be performed on the social media account 1522. In these and other embodiments, by including additional seeded social media accounts 1512, further seeded social media accounts can be used with those newly added seeded social media accounts. The process of identifying is possible.

第一の候補集合1520への追加または代替として、いくつかの実施形態では、ソーシャル・メディア・アカウントの第二の候補集合1530が生成されてもよい。たとえば、第二の候補集合1530は、シード・ソーシャル・メディア・アカウント1512のソーシャル・メディア・アカウント・プロフィールを取ってきて、シード・ソーシャル・メディア・アカウント1512をフォローするすべてのソーシャル・メディア・アカウントを識別することによって生成されてもよく、該フォローしているソーシャル・メディア・アカウントは、ソーシャル・メディア・アカウント1532a~1532c(ソーシャル・メディア・アカウント1532と称される)として第二の候補集合1530に加えられてもよい。 As an addition or alternative to the first candidate set 1520, in some embodiments, a second candidate set 1530 for social media accounts may be generated. For example, the second candidate set 1530 fetches the social media account profile of the seed social media account 1512 and lists all social media accounts that follow the seed social media account 1512. The social media account being followed may be generated by identification in the second candidate set 1530 as social media accounts 1532a-1532c (referred to as social media accounts 1532). May be added.

いくつかの実施形態では、一つまたは複数のソーシャル・メディア・アカウントが第二の候補集合1530から除去されてもよい。たとえば、第二の候補集合1530は解析されて、シード・ソーシャル・メディア・アカウントの集合1510にはいっているソーシャル・メディア・アカウントがあればそれを識別してもよい。たとえば、シード・ソーシャル・メディア・アカウント1512aはソーシャル・メディア・アカウント1512bによってフォローされているが、ソーシャル・メディア・アカウント1512bはすでにシード・ソーシャル・メディア・アカウントの集合1510にはいっており、よってソーシャル・メディア・アカウント1512bは第二の候補集合1530から除去されてもよい。追加的または代替的に、第二の候補集合1530は解析されて、すでに第一の候補集合1520にはいっているソーシャル・メディア・アカウントがあればそれを同定してもよい。たとえば、ソーシャル・メディア・アカウント1522aはシード・ソーシャル・メディア・アカウント1512cをフォローしているが、シード・ソーシャル・メディア・アカウントの集合1510にははいっていない。しかしながら、ソーシャル・メディア・アカウント1522aはすでに第一の候補集合1520にはいっており、よってソーシャル・メディア・アカウント1522aは第二の候補集合1530から除去されてもよい。 In some embodiments, one or more social media accounts may be removed from the second candidate set 1530. For example, the second candidate set 1530 may be analyzed to identify any social media accounts contained in the seed social media account set 1510. For example, the seed social media account 1512a is followed by the social media account 1512b, but the social media account 1512b is already in the set of seed social media accounts 1510, and thus social. Media account 1512b may be removed from the second candidate set 1530. Additional or alternative, the second candidate set 1530 may be analyzed to identify any social media accounts already in the first candidate set 1520. For example, social media account 1522a follows seed social media account 1512c, but is not in the set of seed social media accounts 1510. However, the social media account 1522a is already in the first candidate set 1520, so that the social media account 1522a may be removed from the second candidate set 1530.

第二の候補集合1530から除去されるソーシャル・メディア・アカウント1532のもう一つの例は、一般的に適用可能なソーシャル・メディア・アカウントまたは一般的ソーシャル・メディア・アカウントを含みうる。そのようなアカウントを第一の候補集合1520から除去することを参照して述べたのと同様である。そのような手法の例示的な方法は図23に示される。 Another example of the social media account 1532 removed from the second candidate set 1530 may include a generally applicable social media account or a general social media account. Similar to those mentioned with reference to removing such accounts from the first candidate set 1520. An exemplary method of such a technique is shown in FIG.

いくつかの実施形態では、第二の候補集合1530のソーシャル・メディア・アカウント1532が解析されて、ソーシャル・メディア・アカウント1532が学習者ソーシャル・メディア・アカウントの集合に含められてもよいかどうかが判定されてもよい。いくつかの実施形態では、そのような解析は、第二の候補集合1530からさまざまなソーシャル・メディア・アカウントを除去することを含んでいてもよく、残りのソーシャル・メディア・アカウント1532が学習者ソーシャル・メディア・アカウントの集合に追加されてもよい。追加的または代替的に、ソーシャル・メディア・アカウント1532に対してさらなる解析が実行されてもよい。たとえば、所与のトピックに対するそのソーシャル・メディア・アカウントの関心レベルを判別するために解析が実行されてもよい。 In some embodiments, the social media account 1532 of the second candidate set 1530 may be analyzed to include the social media account 1532 in the learner social media account set. It may be determined. In some embodiments, such analysis may include removing various social media accounts from the second candidate set 1530, with the remaining social media accounts 1532 being learner social. -May be added to a set of media accounts. Additional or alternative, further analysis may be performed on the social media account 1532. For example, an analysis may be performed to determine the level of interest of the social media account for a given topic.

いくつかの実施形態では、シード・ソーシャル・メディア・アカウントの集合1510および学習者ソーシャル・メディア・アカウントの集合に対して、前記ソーシャル・メディア・アカウントがどちらの集合に属するかに基づいて、ある種のコンテンツが送達されてもよい。たとえば、シード・ソーシャル・メディア・アカウントの集合1510には新たな刊行物が提供されてもよく、学習者ソーシャル・メディア・アカウントの集合にはレクチャー・ビデオまたは授業サマリーが提供されてもよい。いくつかの実施形態では、シード・ソーシャル・メディア・アカウントの集合1510には、学習者ソーシャル・メディア・アカウントの集合に提供されるよりも、進んだ内容が提供されてもよい。そのようにして、ソーシャル・メディア・アカウントは、ソーシャル・メディア・アカウントの所有者の知識レベルの人間知覚に間接的に基づいて、ある種のソーシャル・メディア・アカウントを識別し、分類するためにセンサーとして利用されうる。 In some embodiments, the set of seed social media accounts 1510 and the set of learner social media accounts are of some sort based on which set the social media accounts belong to. Content may be delivered. For example, the set of seed social media accounts 1510 may be provided with new publications, and the set of learner social media accounts may be provided with lecture videos or lesson summaries. In some embodiments, the set of seed social media accounts 1510 may be provided with more advanced content than is provided to the set of learner social media accounts. As such, social media accounts are sensors for identifying and classifying certain social media accounts, indirectly based on the human perception of the knowledge level of the owner of the social media account. Can be used as.

本開示の範囲から外れることなく概略表現1500に修正、追加または省略がなされてもよい。たとえば、概略表現1500は、学習者ソーシャル・メディア・アカウントの集合のような、ソーシャル・メディア・アカウントの他の集合またはグループを含んでいてもよい。代替的または追加的に、図15に関して述べた解析の追加的な特徴または詳細は、図16a~図18を参照して記述されうる。 Modifications, additions or omissions may be made to the schematic representation 1500 without departing from the scope of the present disclosure. For example, the schematic representation 1500 may include other sets or groups of social media accounts, such as a set of learner social media accounts. Alternatively or additionally, additional features or details of the analysis described with respect to FIG. 15 may be described with reference to FIGS. 16a-18.

図16aおよび図16bは、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントをセンサーとして使いながらの情報の識別および抽出の例示的方法1600のフローチャートを示している。たとえば、いくつかの実施形態では、方法1600に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法1600はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法1600に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法1600のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 16a and 16b show a flow chart of an exemplary method 1600 of identifying and extracting information while using a social media account as a sensor, based on one or more embodiments of the present disclosure. For example, in some embodiments, one or more of the actions associated with method 1600 may be performed by the information gathering system 110. Alternatively or additionally, Method 1600 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 1600. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks in Method 1600 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック1602では、シード・ソーシャル・メディア・アカウントが取得されてもよい。たとえば、情報収集システム(たとえば図1の情報収集システム110)が、所与のトピックについて知識のある、あらかじめ決定されたソーシャル・メディア・アカウントの集合を与えられてもよい。追加的または代替的に、情報収集システムは、たとえば図2および/または図6のフローのような本開示のプロセス、システムまたは装置の一つまたは複数を使って、刊行物の著作者に関連する一つまたは複数のソーシャル・メディア・アカウントを識別してもよい。 At block 1602, a seed social media account may be acquired. For example, an information gathering system (eg, the information gathering system 110 in FIG. 1) may be given a set of predetermined social media accounts that are knowledgeable about a given topic. Additional or alternative, the information gathering system relates to the author of the publication using one or more of the processes, systems or devices of the present disclosure, such as the flow of FIG. 2 and / or FIG. You may identify one or more social media accounts.

ブロック1604では、所与のシード・ソーシャル・メディア・アカウントについて、ソーシャル・メディア・アカウント・プロフィールが取ってこられてもよい。たとえば、情報収集システムはソーシャル・メディア・システム(たとえば図1のソーシャル・メディア・システムの一つまたは複数)に問い合わせして、ソーシャル・メディア・アカウント候補のプロフィールを取得してもよい。いくつかの実施形態では、プロフィールだけが取ってこられ、情報収集システムはソーシャル・メディア・アカウント全体を取得する必要はない。 At block 1604, a social media account profile may be fetched for a given seed social media account. For example, the information gathering system may contact a social media system (eg, one or more of the social media systems in FIG. 1) to obtain a profile of potential social media accounts. In some embodiments, only the profile is fetched and the information gathering system does not need to acquire the entire social media account.

ブロック1606では、前記プロフィールから、ソーシャル・メディア・アカウントの第一の集合が、シード・ソーシャル・メディア・アカウントによってフォローされているソーシャル・メディア・アカウントとして抽出されてもよい。たとえば、シード・ソーシャル・メディア・アカウントによってフォローされているソーシャル・メディア・アカウントを識別するフィールドを含む前記プロフィールの部分が識別されてもよく、そこに挙げられているソーシャル・メディア・アカウントが、ソーシャル・メディア・アカウントの前記第一の集合として抽出されてもよい。 In block 1606, the first set of social media accounts may be extracted from the profile as social media accounts followed by seed social media accounts. For example, the portion of the profile that contains a field that identifies the social media account being followed by the seed social media account may be identified, and the social media account listed therein may be social. -It may be extracted as the first set of media accounts.

ブロック1608では、前記第一の集合のソーシャル・メディア・アカウントがシード・ソーシャル・メディア・アカウントと比較されてもよい。たとえば、そのような比較は、ソーシャル・メディア・アカウントの前記第一の集合および前記シード・ソーシャル・メディア・アカウントの両方にはいっているソーシャル・メディア・アカウントがあればそれを識別しうる。 At block 1608, the first set of social media accounts may be compared to seed social media accounts. For example, such a comparison may identify any social media accounts that are included in both the first set of social media accounts and the seed social media accounts.

ブロック1610では、ソーシャル・メディア・アカウントの第一の候補集合が、ブロック1608の比較に基づいて構築されてもよい。たとえば、ソーシャル・メディア・アカウントの前記第一の候補集合は、ソーシャル・メディア・アカウントの前記第一の集合にはいっているが、前記シード・ソーシャル・メディア・アカウントにははいっていないソーシャル・メディア・アカウントを含んでいてもよい。いくつかの実施形態では、ブロック1608および1610は同時に行なわれてもよく、これはたとえば、ソーシャル・メディア・アカウントの前記第一の集合および前記シード・ソーシャル・メディア・アカウントの両方にあるソーシャル・メディア・アカウントをそれが識別される都度除去し、前記第一の集合の残りのソーシャル・メディア・アカウントがソーシャル・メディア・アカウントの前記第一の候補集合となることによる。 In block 1610, a first set of candidates for social media accounts may be constructed based on the comparison of block 1608. For example, the first candidate set for a social media account is in the first set of social media accounts, but not in the seed social media account. It may include an account. In some embodiments, blocks 1608 and 1610 may be performed simultaneously, for example, social media in both the first set of social media accounts and the seed social media account. • By removing the account each time it is identified and the remaining social media accounts in the first set become the first candidate set for social media accounts.

ブロック1612では、一つまたは複数の一般的ソーシャル・メディア・アカウントがソーシャル・メディア・アカウントの前記第一の候補集合から除去されてもよい。たとえば、有名人のソーシャル・メディア・アカウントはシード・アカウントの一つまたは複数によってフォローされることがあるが、シード・ソーシャル・メディア・アカウントが知識があるトピックに関して知識があるのではないことがありうる。一つまたは複数の一般的ソーシャル・メディア・アカウントを除去することの例は図18を参照して述べる。 In block 1612, one or more general social media accounts may be removed from the first candidate set of social media accounts. For example, a celebrity social media account may be followed by one or more seed accounts, but the seed social media account may not be knowledgeable on a topic that it is knowledgeable about. .. An example of removing one or more common social media accounts is described with reference to FIG.

ブロック1614では、前記第一の候補集合の候補ソーシャル・メディア・アカウントが解析されて、ソーシャル・メディア・アカウントの型を判別してもよい。たとえば、解析は、候補ソーシャル・メディア・アカウントが人物によって所有されているか組織(たとえばジャーナル、会議、ソフトウェア・ツール、団体など)によって所有されているかを判定するために実行されてもよい。もう一つの例として、解析は、候補ソーシャル・メディア・アカウントが所与のトピックについて、候補ソーシャル・メディア・アカウントが知識のあるアカウントであるかどうかを判定するための閾値より上の関心スコアをもつかどうかを判定するために実行されてもよい。もう一つの例として、解析は、候補ソーシャル・メディア・アカウントの関心レベルが閾値より上であるかどうかを判定するために実行されてもよい。そのような解析の例示的方法はたとえば図17において記述される。 In block 1614, the candidate social media accounts of the first candidate set may be analyzed to determine the type of social media account. For example, the analysis may be performed to determine if the candidate social media account is owned by a person or by an organization (eg, journal, conference, software tool, organization, etc.). As another example, the analysis also has an interest score above the threshold for determining if a candidate social media account is a knowledgeable account for a given topic. It may be executed to determine whether or not it is. As another example, the analysis may be performed to determine if the interest level of the candidate social media account is above the threshold. An exemplary method of such analysis is described, for example, in FIG.

ブロック1616では、候補ソーシャル・メディア・アカウントが知識のあるソーシャル・メディア・アカウントであるかどうかについて判定がなされてもよい。たとえば、判定は、ブロック1614において実行される解析に基づいていてもよい。候補ソーシャル・メディア・アカウントが知識のあるアカウントであるとの判定後、方法1600はブロック1618に進んでもよい。候補ソーシャル・メディア・アカウントが知識のあるアカウントではないとの判定後、方法1600はブロック1620に進んでもよい。 At block 1616, a determination may be made as to whether the candidate social media account is a knowledgeable social media account. For example, the determination may be based on the analysis performed in block 1614. After determining that the candidate social media account is a knowledgeable account, method 1600 may proceed to block 1618. After determining that the candidate social media account is not a knowledgeable account, method 1600 may proceed to block 1620.

ブロック1618では、候補ソーシャル・メディア・アカウントはシード・ソーシャル・メディア・アカウントとして追加されてもよい。 In block 1618, candidate social media accounts may be added as seed social media accounts.

ブロック1620では、ソーシャル・メディア・アカウント候補の前記第一の集合内にさらなる候補ソーシャル・メディア・アカウントがあるかどうかについて判定がなされてもよい。さらなる候補がある場合には、方法1600はブロック1614に戻ってもよい。さらなる候補がない場合には、方法1600はブロック1622に進んでもよい。 At block 1620, a determination may be made as to whether there are additional candidate social media accounts within the first set of social media account candidates. Method 1600 may return to block 1614 if there are more candidates. If there are no further candidates, method 1600 may proceed to block 1622.

図16bを参照するに、ブロック1622において、シード・ソーシャル・メディア・アカウントをフォローしているソーシャル・メディア・アカウントの第二の集合が抽出されてもよい。たとえば、シード・ソーシャル・メディア・アカウントをフォローしているソーシャル・メディア・アカウントを同定するフィールドを含んでいる前記プロフィールの部分が識別されて、そこに挙げられているソーシャル・メディア・アカウントがソーシャル・メディア・アカウントの前記第二の集合として抽出されてもよい。 With reference to FIG. 16b, in block 1622, a second set of social media accounts following the seed social media accounts may be extracted. For example, the portion of the profile that contains a field that identifies the social media account that follows the seed social media account is identified, and the social media account listed there is social. It may be extracted as the second set of media accounts.

ブロック1624では、ソーシャル・メディア・アカウントの第二の候補集合が構築されてもよい。たとえば、ソーシャル・メディア・アカウントの第二の候補集合は、ブロック1622で抽出されたソーシャル・メディア・アカウントの前記第二の集合にはいっているが、ソーシャル・メディア・アカウントの前記第一の集合および前記シード・ソーシャル・メディア・アカウントには含まれないソーシャル・メディア・アカウントを含んでいてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウントの前記第二の集合におけるソーシャル・メディア・アカウントは、前記シード・ソーシャル・メディア・アカウントおよびソーシャル・メディア・アカウントの前記第一の集合と比較されてもよく、重なっているアカウントはソーシャル・メディア・アカウント前記第二の集合から除去されて、ソーシャル・メディア・アカウントの前記第二の候補集合を与えてもよい。 At block 1624, a second set of candidates for social media accounts may be constructed. For example, the second set of social media accounts is in the second set of social media accounts extracted in block 1622, but the first set of social media accounts and It may include a social media account that is not included in the seed social media account. In some embodiments, the social media account in the second set of social media accounts is compared to the seed social media account and the first set of social media accounts. Often, overlapping accounts may be removed from the second set of social media accounts and given the second set of candidates for social media accounts.

ブロック1626では、一つまたは複数の一般的ソーシャル・メディア・アカウントが候補ソーシャル・メディア・アカウントの前記第二の集合から除去されてもよい。ブロック1626はブロック1612と同様または同等であってもよいが、候補ソーシャル・メディア・アカウントの第一の集合ではなく第二の集合に対して実行される。 At block 1626, one or more general social media accounts may be removed from the second set of candidate social media accounts. Block 1626 may be similar to or equivalent to block 1612, but is executed against a second set of candidate social media accounts rather than the first set.

ブロック1628では、ソーシャル・メディア・アカウントの前記第二の候補集合の候補に関連している名前が取得されてもよい。たとえば、ソーシャル・メディア・システムが、候補ソーシャル・メディア・アカウントのプロフィールを提供するよう要求されてもよい。もう一つの例として、特定のソーシャル・メディア・アカウントに関連付けられた名前を、そのソーシャル・メディア・アカウントに関する追加的なデータを要求したり受け取ったりすることなく、提供するよう、ソーシャル・メディア・システムが問い合わせされてもよい。 At block 1628, the name associated with the candidate for the second candidate set of social media accounts may be obtained. For example, a social media system may be required to provide a profile for a candidate social media account. As another example, a social media system to provide the name associated with a particular social media account without requesting or receiving additional data about that social media account. May be inquired.

ブロック1630では、候補アカウントに関連付けられた名前が組織アカウントであるか人物名であるかについての判定がなされてもよい。たとえば、ブロック1628で得られた名前に対してテキスト解析が実行されて、組織の一つまたは複数の指標、たとえば単語「ジャーナル(journal)」「the」「社(inc.)」「会社(co.)」「パッケージ(package)」「グループ(group)」などが存在するかどうかが判定されてもよい。追加的または代替的に、ブロック1628で取得された名前は、「ジョン(John)」「アンドルー(Andrew)」または「サラ(Sarah)」のような名前として典型的に使われるテキスト項目を識別するための名前データベースと比較されてもよい。いくつかの実施形態では、情報収集システムは、あるトピックに関係した既知の組織(たとえば会議、ジャーナル、大学、ソフトウェア・ベンダーおよび/または標準設定団体)のデータベースを維持していてもよく、名前を既知の組織のデータベース中のエントリーと比較してもよい。これらおよび他の実施形態において、名前が組織であるとの判定後、方法1600はブロック1632に進んでもよい。追加的または代替的に、名前が組織であるとの判定後、その組織は既知の組織の前記データベース中のもう一つのエントリーとして追加されてもよい。名前が人物であるとの判定後、方法1600はブロック1634に進んでもよい。 At block 1630, it may be determined whether the name associated with the candidate account is an organization account or a person's name. For example, a text analysis is performed on the name obtained in block 1628 and one or more indicators of the organization, such as the words "journal" "the" "company (inc.)" "Company (co). .) ”,“ Package ”,“ group ”, etc. may be determined. Additional or alternative, the name retrieved in block 1628 identifies a text item typically used as a name such as "John", "Andrew", or "Sarah". May be compared with the name database for. In some embodiments, the information gathering system may maintain a database of known organizations (eg, conferences, journals, universities, software vendors and / or standards-setting bodies) associated with a topic, and may be named. It may be compared to an entry in a database of known organizations. In these and other embodiments, method 1600 may proceed to block 1632 after determining that the name is tissue. Additional or alternative, after determining that the name is an organization, that organization may be added as another entry in said database of known organizations. After determining that the name is a person, method 1600 may proceed to block 1634.

ブロック1632では、名前が組織名であることに基づいて、候補ソーシャル・メディア・アカウントは、候補ソーシャル・メディア・アカウントの前記第二の集合から除去されてもよい。ブロック1632の後、方法1600はブロック1640に進んでもよい。 In block 1632, candidate social media accounts may be removed from the second set of candidate social media accounts based on the name being the organization name. After block 1632, method 1600 may proceed to block 1640.

ブロック1634では、名前が人物名であることに基づいて、その人物の所与のトピックに対する関心を表わす関心スコアが同定されてもよい。たとえば、関心スコアは、候補ソーシャル・メディア・アカウントのソーシャル・メディア投稿において現われる所与のトピックに関係したキーワードの数に基づいていてもよい。追加的または代替的に、関心スコアは、候補ソーシャル・メディア・アカウントの、所与のトピックに関係した閾値数のキーワードを含むソーシャル・メディア投稿の割合に基づいていてもよい。追加的または代替的に、関心スコアは、候補ソーシャル・メディア・アカウントの、所与のトピックに関係した一つまたは複数のキーワードを含む一つまたは複数のソーシャル・メディア投稿との相互作用に基づいていてもよい。いくつかの実施形態では、前記候補の関心スコアは、上記の任意の組み合わせまたはソーシャル・メディア・アカウントの関心ある一つまたは複数のトピックを識別するための他の任意の方法に基づいていてもよい。 At block 1634, an interest score representing an interest in a given topic of a person may be identified based on the name being the person's name. For example, the interest score may be based on the number of keywords related to a given topic that appear in social media posts for candidate social media accounts. Additional or alternative, the interest score may be based on the percentage of candidate social media accounts that contain a threshold number of keywords related to a given topic. Additional or alternative, interest scores are based on the interaction of candidate social media accounts with one or more social media posts that contain one or more keywords related to a given topic. You may. In some embodiments, the candidate's interest score may be based on any combination of the above or any other method for identifying one or more topics of interest in a social media account. ..

ブロック1636では、関心スコアが閾値より上であるかどうかについて判定がなされてもよい。いくつかの実施形態では、閾値レベルは、トピックの人気に基づいていてもよい。追加的または代替的に、閾値レベルは、当該トピックに関係したキーワードがどのくらい頻繁に当該トピックのコンテキストの外部で使われるかに基づいていてもよい。たとえば、用語「機械」および「学習」は学術コンテキストの外でも頻繁に使われることがあり、一方、「単純ベイズ」は学術コンテキストの外ではまれにしか使われない。関心スコアが閾値を超えているとの判定後、方法1600はブロック1638に進んでもよい。関心スコアが閾値を超えないとの判定後、方法1600はブロック1640に進んでもよい。 At block 1636, a determination may be made as to whether the interest score is above the threshold. In some embodiments, the threshold level may be based on the popularity of the topic. Additional or alternative, the threshold level may be based on how often keywords related to the topic are used outside the context of the topic. For example, the terms "machine" and "learning" are often used outside the academic context, while "naive Bayes" is rarely used outside the academic context. After determining that the interest score is above the threshold, method 1600 may proceed to block 1638. After determining that the interest score does not exceed the threshold, method 1600 may proceed to block 1640.

ブロック1638では、関心スコアが閾値を超えているというブロック1636でなされた判定に基づいて、候補ソーシャル・メディア・アカウントが、ソーシャル・メディア・アカウントの第二の集合に追加されてもよい。たとえば、ソーシャル・メディア・アカウントの前記第二の集合は、学習者ソーシャル・メディア・アカウントの集合であってもよい。ソーシャル・メディア・アカウントの前記第二の集合は、特定のトピックについての情報を得ることを望んでいるが、必ずしもそのトピックに関する専門知識またはピアに認識されている知識をもつのではないアカウントであってもよい。 At block 1638, candidate social media accounts may be added to a second set of social media accounts based on the determination made in block 1636 that the interest score exceeds the threshold. For example, the second set of social media accounts may be a set of learner social media accounts. The second set of social media accounts is an account that wants to get information about a particular topic, but does not necessarily have the expertise or knowledge recognized by the peers on that topic. You may.

ブロック1640では、まだ解析されていない、候補ソーシャル・メディア・アカウントの前記第二の集合内のさらなる候補ソーシャル・メディア・アカウントがあるかどうかについて判定がなされてもよい。残っている候補アカウントがあるとの判定後、方法1600はブロック1628に戻ってもよい。さらなる候補ソーシャル・メディア・アカウントがないとの判定後、方法1600はブロック1642に進んでもよい。 At block 1640, a determination may be made as to whether there are additional candidate social media accounts in the second set of candidate social media accounts that have not yet been analyzed. After determining that there are remaining candidate accounts, Method 1600 may return to block 1628. After determining that there are no more candidate social media accounts, Method 1600 may proceed to block 1642.

ブロック1642では、まだ解析されていないさらなるシード・ソーシャル・メディア・アカウントがあるかどうかについて判定がなされてもよい。さらなるシード・ソーシャル・メディア・アカウントがあるとの判定後、方法1600はブロック1604に戻ってもよい。さらなるシード・ソーシャル・メディア・アカウントがない場合には、方法1600はブロック1644に進んでもよい。 At block 1642, a determination may be made as to whether there are additional seeded social media accounts that have not yet been analyzed. After determining that there are more seeded social media accounts, Method 1600 may return to block 1604. If there are no additional seed social media accounts, Method 1600 may proceed to block 1644.

ブロック1644では、シード・ソーシャル・メディア・アカウントと前記第二の集合のソーシャル・メディア・アカウントに異なるコンテンツが提供されてもよい。いくつかの実施形態では、該異なるコンテンツは、同じトピックに関係していてもよいが、それら二つのグループについて異なっていてもよい。たとえば、シード・ソーシャル・メディア・アカウント(これは所与のトピックについて知識があるとわかっている)は、当該トピックに関係した新たな刊行物、発見などのような第一のコンテンツを提供されてもよい。前記第二の集合のソーシャル・メディア・アカウント(これはそのトピックに関心があることはわかっているが、必ずしもそのトピックについて知識があるわけではない)は、当該トピックに関係したレクチャー・ノート、レクチャーのビデオ、授業呈示、概要などを提供されてもよい。 At block 1644, different content may be provided to the seed social media account and the second set of social media accounts. In some embodiments, the different content may be related to the same topic, but may be different for those two groups. For example, a seed social media account (which is known to be knowledgeable about a given topic) is offered primary content such as new publications, discoveries, etc. related to that topic. May be good. The second set of social media accounts (which we know are interested in the topic, but not necessarily knowledgeable about the topic) are lecture notes, lectures related to the topic. Videos, lesson presentations, summaries, etc. may be provided.

いくつかの実施形態では、候補ソーシャル・メディア・アカウントの前記第一および/または第二の集合は、候補ソーシャル・メディア・アカウントの前記第一および/または第二の集合が解析される前に、すべてのシード・ソーシャル・メディア・アカウントについて生成されてもよい。そのような手法は、候補ソーシャル・メディア・アカウントの潜在的に重複した解析を避けうる。これらおよび他の実施形態において、それらの候補を解析した後、さらなるシード・アカウントがあればそれが処理されて、追加的な候補ソーシャル・メディア・アカウントを生成することがありうる。もう一つの例として、ブロック1622ないし1640のいずれも省略されてもよく、前記第一の候補集合のみが構築されて解析されてもよい。追加的または代替的に、前記第二の候補集合のみが構築されて解析されてもよい。 In some embodiments, the first and / or second set of candidate social media accounts is before the first and / or second set of candidate social media accounts is analyzed. It may be generated for all seed social media accounts. Such an approach can avoid potentially duplicate analysis of candidate social media accounts. In these and other embodiments, after analyzing those candidates, additional seed accounts, if any, may be processed to generate additional candidate social media accounts. As another example, any of blocks 1622 to 1640 may be omitted, and only the first candidate set may be constructed and analyzed. In addition or alternatives, only the second candidate set may be constructed and analyzed.

図17は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントをセンサーとして使いながらの情報の識別および抽出において使用されうる例示的方法1700のフローチャートを示している。一つのソーシャル・メディア・アカウントに関して説明するが、方法1700は任意の数のソーシャル・メディア・アカウントについて繰り返されてもよい。方法1700は、図16のブロック1614の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法1700に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法1700はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法1700に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法1700のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 17 shows a flow chart of an exemplary method 1700 that can be used in identifying and extracting information while using a social media account as a sensor, based on one or more embodiments of the present disclosure. Although one social media account will be described, Method 1700 may be repeated for any number of social media accounts. Method 1700 may reflect one embodiment of performing one or more operations of block 1614 of FIG. In some embodiments, one or more of the actions associated with method 1700 may be performed by the information gathering system 110. Alternatively or additionally, Method 1700 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 1700. Although illustrated as discrete blocks, the stages and behavior associated with one or more of the blocks of Method 1700 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック1705につながる破線矢印は、方法1700が図16の方法1600のブロック1612または1620から続いているなど、別の方法の続きでありうることを示している。 The dashed arrow leading to block 1705 indicates that method 1700 may be a continuation of another method, such as continuing from block 1612 or 1620 of method 1600 of FIG.

ブロック1705では、候補ソーシャル・メディア・アカウントの集合におけるある候補ソーシャル・メディア・アカウントであるソーシャル・メディア・アカウントについて名前が取得されてもよい。ブロック1705は図16のブロック1628と同様または同等であってもよい。 At block 1705, a name may be obtained for a social media account that is a candidate social media account in the set of candidate social media accounts. Block 1705 may be similar to or equivalent to block 1628 of FIG.

ブロック1710では、前記名前が組織名であるか人物名であるかについて判定がなされてもよい。ブロック1710は図16のブロック1630と同様または同等であってもよい。前記名前が組織名であるとの判定後、方法1700はブロック1740に進んでもよい。前記名前が人物名であるとの判定後、方法1700はブロック1715に進んでもよい。 In block 1710, it may be determined whether the name is an organization name or a person's name. Block 1710 may be similar to or equivalent to block 1630 in FIG. After determining that the name is an organization name, method 1700 may proceed to block 1740. After determining that the name is a person's name, method 1700 may proceed to block 1715.

ブロック1715では、前記名前が人物名であることに基づき、前記名前は、刊行物のデータベースにおける一つまたは複数の著作者名と比較されてもよい。たとえば、情報収集システム(たとえば図1の情報システム110)が刊行物および/または刊行物の著者のデータベースを含んでいてもよく、前記名前は、前記名前が一つまたは複数の刊行物の著作者として出現するかどうかを判定するために、そのようなデータベースと比較されてもよい。 In block 1715, based on the name being a person's name, the name may be compared to one or more author names in the publication database. For example, an information gathering system (eg, information system 110 in FIG. 1) may include a database of publications and / or authors of publications, wherein the name is the author of one or more publications. It may be compared to such a database to determine if it appears as.

ブロック1720では、前記人物名と刊行物の前記データベースにおける著作者の間に一致があるかどうかについて判定がなされてもよい。いくつかの実施形態では、一致は厳密な一致、厳密な姓の一致、近似割合一致(たとえば80%一致)または他の何らかのその変形を含んでいてもよい。たとえば、Andrew Ng〔アンドルー・ウー〕という著作者名について、さまざまな実施形態において、一致基準に依存して、次のうちの任意のものが一致と考えられてもよい:Andy Ng〔アンディー・ウー〕、A. Ng〔A・ウー〕、Drew Ng〔ドルー・ウー〕、Andi Ng〔アンディ・ウー〕、Andrew G. Ng〔アンドルー・G・ウー〕、Dr. Ng〔ウー博士〕、Doctor Ng〔ドクター・ウー〕など。名前が一致するとの判定後、方法1700はブロック1725に進んでもよい。名前が一致しないとの判定後、方法1700はブロック1730に進んでもよい。 At block 1720, a determination may be made as to whether there is a match between the person's name and the author of the publication in the database. In some embodiments, the match may include an exact match, an exact surname match, an approximate percentage match (eg 80% match) or some other variant thereof. For example, for the author name Andrew Ng, in various embodiments, any of the following may be considered a match, depending on the match criteria: Andy Ng. ], A. Ng [A. Wu], Drew Ng [Drew Wu], Andi Ng [Andy Wu], Andrew G. Ng [Andrew G. Wu], Dr. Ng [Dr. Wu], Doctor Ng [ Dr. Wu] etc. After determining that the names match, method 1700 may proceed to block 1725. After determining that the names do not match, method 1700 may proceed to block 1730.

ブロック1725では、前記名前が前記データベースにおけるある著作者名と一致することに基づいて、候補アカウントが知識のあるアカウントとして範疇分けされてもよく、方法1700は方法1700の終わりの破線に進んでもよい。 In block 1725, candidate accounts may be categorized as knowledgeable accounts based on the fact that the name matches a certain author's name in the database, and method 1700 may proceed to the dashed line at the end of method 1700. ..

ブロック1730では、前記名前が前記データベース中の著作者に一致しないことに基づいて、その候補アカウントについて関心スコアが同定されてもよい。ブロック1730は図16bのブロック1634と同様または同等であってもよい。 At block 1730, interest scores may be identified for the candidate account based on the fact that the name does not match the author in the database. Block 1730 may be similar to or equivalent to block 1634 in FIG. 16b.

ブロック1735では、候補の関心スコアが閾値を超えているかどうかについて判定がなされてもよい。いくつかの実施形態では、閾値はトピックの希少さ、所与のトピックについての刊行物の数または多様な因子のうちの他の任意のものに基づいていてもよい。関心スコアが閾値を超えているとの判定後、方法はブロック1725に進んでもよい。関心スコアが閾値を超えないとの判定後、方法1700はブロック1740に進んでもよい。 At block 1735, a determination may be made as to whether the candidate's interest score exceeds the threshold. In some embodiments, the threshold may be based on the rarity of the topic, the number of publications on a given topic, or any other of a variety of factors. After determining that the interest score is above the threshold, the method may proceed to block 1725. After determining that the interest score does not exceed the threshold, method 1700 may proceed to block 1740.

ブロック1740では、候補はソーシャル・メディア・アカウントの前記集合から除去されてもよい。たとえば、関心スコアが閾値より低いということは、そのアカウントがその所与のトピックについて知識のあるアカウントではないことを示すことがありうる。したがって、そのアカウントは知識のあるアカウントの潜在的な候補としては除去されてもよい。ブロック1740の後、方法1700はブロック1740から、当該方法に続く前の方法に戻ることに進んでもよい。たとえば、方法1700はブロック1745から図16のブロック1620に進んでもよい。 At block 1740, candidates may be removed from the set of social media accounts. For example, a lower interest score below the threshold may indicate that the account is not knowledgeable about the given topic. Therefore, the account may be removed as a potential candidate for a knowledgeable account. After block 1740, method 1700 may proceed from block 1740 back to the previous method following that method. For example, method 1700 may proceed from block 1745 to block 1620 of FIG.

方法1700の終わりの破線矢印は、範疇分けされたソーシャル・メディア・アカウント候補が、アカウントが知識のあるソーシャル・メディア・アカウントであるかどうかについて判定がなされる図16の方法1600のブロック1616および/またはブロック1620など一つまたは複数のプロセスまたはブロックによって使用されてもよいことを示しうる。追加的または代替的に、破線矢印は、ソーシャル・メディア・アカウントが知識のあるものではなく、前記候補リストから除去されたことを示してもよい。 The dashed arrow at the end of Method 1700 indicates whether the classified social media account candidates are knowledgeable social media accounts. Block 1616 and / of Method 1600 in FIG. Alternatively, it may indicate that it may be used by one or more processes or blocks, such as block 1620. Additional or alternative, the dashed arrow may indicate that the social media account is not knowledgeable and has been removed from the candidate list.

図18は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントをセンサーとして使いながらの情報の識別および抽出において使用されうるもう一つの例示的方法1800のフローチャートを示している。一つの候補ソーシャル・メディア・アカウントに関して説明するが、方法1800は、たとえば候補ソーシャル・メディア・アカウントの集合からすべての一般的ソーシャル・メディア・アカウントを除去するために、任意の数のソーシャル・メディア・アカウントについて繰り返されてもよい。追加的または代替的に、方法1800はソーシャル・メディア・アカウントの前記第一の候補集合または前記第二の候補集合の一方または両方について実行されてもよい。方法1800は、図16のブロック1612および/または1626の一つまたは複数の動作を実行する一つの実施形態を反映しうる。いくつかの実施形態では、方法1800に関連付けられた動作の一つまたは複数は情報収集システム110によって実行されてもよい。代替的または追加的に、方法1800はいかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が、方法1800に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで図示されているが、方法1800のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 18 shows a flow chart of another exemplary method 1800 that can be used in the identification and extraction of information while using a social media account as a sensor, based on one or more embodiments of the present disclosure. .. Although one candidate social media account will be described, Method 1800 will describe any number of social media accounts, for example, to remove all common social media accounts from a collection of candidate social media accounts. It may be repeated for the account. Additional or alternative, method 1800 may be performed on one or both of the first candidate set and the second candidate set of social media accounts. Method 1800 may reflect one embodiment of performing one or more operations of blocks 1612 and / or 1626 of FIG. In some embodiments, one or more of the actions associated with method 1800 may be performed by the information gathering system 110. Alternatively or additionally, Method 1800 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 1800. Although illustrated as discrete blocks, the steps and behavior associated with one or more of the blocks in Method 1800 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

ブロック1810につながる破線矢印は、方法1800が図16の方法1600のブロック1610または1624から続いているなど、別の方法の続きでありうることを示している。 The dashed arrow leading to block 1810 indicates that method 1800 may be a continuation of another method, such as continuing from block 1610 or 1624 of method 1600 of FIG.

ブロック1810では、候補ソーシャル・メディア・アカウント・プロフィールが取ってこられてもよい。ブロック1810はブロック1604と同様または同等であってもよいが、シード・ソーシャル・メディア・アカウント・プロフィールではなく、候補ソーシャル・メディア・アカウント・プロフィールが取ってこられてもよい。 At block 1810, candidate social media account profiles may be fetched. Block 1810 may be similar to or equivalent to block 1604, but candidate social media account profiles may be fetched instead of seed social media account profiles.

ブロック1820では、候補ソーシャル・メディア・アカウントのグローバル・フォロワーの第一の数が数えられてもよい。たとえば、候補ソーシャル・メディア・アカウントの全フォロワーの一般的計数がなされてもよい。いくつかの実施形態では、プロフィールを取ってきてプロフィールに挙げられているフォロワーの数を数えるのではなく、特定のソーシャル・メディア・アカウントのフォロワーの数の数値を提供するよう一つまたは複数のソーシャル・メディア・システムが問い合わせされてもよい。たとえば、候補アカウントが130万人のフォロワーをもつ場合、グローバル・フォロワー数は130万となりうる。もう一つの例として、候補アカウントが410人のフォロワーをもつ場合、グローバル・フォロワー数は410となりうる。 Block 1820 may count the first number of global followers for candidate social media accounts. For example, a general count of all followers of a candidate social media account may be made. In some embodiments, one or more socials to provide a number of followers for a particular social media account, rather than fetching the profile and counting the number of followers listed in the profile. -The media system may be inquired. For example, if a candidate account has 1.3 million followers, the number of global followers can be 1.3 million. As another example, if the candidate account has 410 followers, the number of global followers can be 410.

ブロック1830では、候補ソーシャル・メディア・アカウントのローカル・フォロワーの第二の数が数えられてもよい。たとえば、ローカル・フォロワー・ソーシャル・メディア・アカウントは、候補ソーシャル・メディア・アカウントの前記第一の集合および/またはシード・ソーシャル・メディア・アカウントの前記集合からの候補ソーシャル・メディア・アカウントであって、当該候補ソーシャル・メディア・アカウントをフォローしているものを含みうる。いくつかの実施形態では、ローカル・フォロワー・ソーシャル・メディア・アカウントはさらに、候補ソーシャル・メディア・アカウントの前記第二の集合を含んでいてもよい。たとえば、あるソーシャル・メディア・アカウントをフォローしている50のシード・アカウントがあり、そのソーシャル・メディア・アカウントをフォローしている候補ソーシャル・メディア・アカウントの前記第一の集合からの20のアカウントがある場合、ローカル・フォロワーの数は70であってもよい。 At block 1830, a second number of local followers for candidate social media accounts may be counted. For example, a local follower social media account is a candidate social media account from said first set of candidate social media accounts and / or said set of seed social media accounts. It may include those who are following the candidate social media account. In some embodiments, the local follower social media account may further include the second set of candidate social media accounts. For example, there are 50 seed accounts that follow a social media account, and 20 accounts from the first set of candidate social media accounts that follow that social media account. In some cases, the number of local followers may be 70.

ブロック1840では、トピック関連性(relevancy)スコアが生成されてもよい。トピック関連性スコアは、候補ソーシャル・メディア・アカウントのフォロワーのどのくらいの割合が、所与のトピックについて知識があるまたは潜在的に知識があるかを表わしうる。たとえば、トピック関連性スコアは、ローカル・フォロワー数をグローバル・フォロワー数で割った商として生成されてもよい。上記の二つの例の第一のものを使うと、トピック関連性スコアは70/130万、あるいは約5.384×10-5と決定されうる。第二の例については、トピック関連性スコアは70/410、あるいは約0.1707と決定されうる。 At block 1840, topic relevancy scores may be generated. A topic relevance score can indicate how many of the followers of a candidate social media account are knowledgeable or potentially knowledgeable about a given topic. For example, the topic relevance score may be generated as a quotient of local followers divided by global followers. Using the first of the above two examples, the topic relevance score can be determined to be 700 / 1.3 million, or about 5.384 × 10 -5 . For the second example, the topic relevance score can be determined to be 70/410, or about 0.1707.

ブロック1850では、関連性スコアが閾値より上かどうかについて判定がなされてもよい。いくつかの実施形態では、閾値はトピックに基づいていてもよく、あるいはトピックとは独立であってもよい。たとえば、いくつかのトピックはより人気があることがあり、よってそのトピックをフォローする、より多くの人々がいることがありうる。これは関連性スコアを高くしうる。いくつかの実施形態では、上記の数値例を使うと、閾値は0.01から0.0001の間であってもよい。ただし、閾値はより一般には任意の値を取りうる。関連性スコアが閾値より上であるとの判定後、方法1800は方法1800の終わりの破線矢印に進んでもよい。関連性スコアが閾値より低いとの判定後、方法1800はブロック1860に進んでもよい。 At block 1850, a determination may be made as to whether the relevance score is above the threshold. In some embodiments, the threshold may be topic-based or topic-independent. For example, some topics may be more popular, so there may be more people following the topic. This can increase the relevance score. In some embodiments, the threshold may be between 0.01 and 0.0001 using the numerical example above. However, the threshold can be more generally arbitrary. After determining that the relevance score is above the threshold, method 1800 may proceed to the dashed arrow at the end of method 1800. After determining that the relevance score is below the threshold, method 1800 may proceed to block 1860.

ブロック1860では、候補ソーシャル・メディア・アカウントは、候補ソーシャル・メディア・アカウントの集合から除去されてもよい。たとえば、関連性スコアが閾値より上でないことに基づいて、候補ソーシャル・メディア・アカウントは一般的ソーシャル・メディア・アカウントとして範疇分けされてもよい。そのような一般的ソーシャル・メディア・アカウントは候補ソーシャル・メディア・アカウントの前記第一および/または第二の集合から除去されてもよい。追加的または代替的に、そのような候補ソーシャル・メディア・アカウントは学習者ソーシャル・メディア・アカウントの集合および/またはシード・ソーシャル・メディア・アカウントから除去されてもよい。 At block 1860, candidate social media accounts may be removed from the set of candidate social media accounts. For example, candidate social media accounts may be categorized as general social media accounts based on their relevance score not above the threshold. Such general social media accounts may be removed from the first and / or second set of candidate social media accounts. In addition or alternatives, such candidate social media accounts may be removed from the set of learner social media accounts and / or seed social media accounts.

方法1800の終わりの破線矢印は、候補ソーシャル・メディア・アカウントの短縮された集合が、図16の方法1600のブロック1614および/またはブロック1628など一つまたは複数のプロセスまたはブロックによって使用されてもよいことを示しうる。 The dashed arrow at the end of method 1800 indicates that a shortened set of candidate social media accounts may be used by one or more processes or blocks, such as block 1614 and / or block 1628 of method 1600 of FIG. Can show that.

一つまたは複数の実施形態において、本開示は、ソーシャル・メディア・アカウント型に基づいてソーシャル・メディア・アカウントとソーシャル・メディア・コンテンツとの間の相互に補強する関係をモデル化することによってソーシャル・メディア・アカウントおよびソーシャル・メディア・コンテンツのランキングを提供する。本開示は、ソーシャル・メディア・アカウント型を考慮に入れる相互に補強するランキングに基づいて、分野固有の知識をもつ良質のソーシャル・メディア・アカウントを識別し、良質な分野固有のコンテンツを推薦しうる。ソーシャル・メディア・サービスの例としてツイッターを取ると、ツイッター・アカウントは、個人、企業、学術機関、通商会議(trade conference)、学術会議、組織、刊行物、ソフトウェア・ベンダーなどによって生成されうる(たとえば所有されうる)。特定の分野での良質なコンテンツを繰り返してまたは一貫してツイートするまたはリツイートするツイッター・アカウントは、その特定の分野の専門知識をもつ良質なツイッター・アカウントと考えられてもよい。また、特定分野での多くの良質なツイッター・アカウントによってツイートまたはリツイートされるコンテンツはその特定の分野での良質なコンテンツと考えられてもよい。本開示の一つまたは複数の実施形態は、ツイッター型に基づいて分野固有の専門知識をもつ良質のツイッター・アカウントおよび良質な分野固有のコンテンツをランク付けするために、分野固有の専門知識をもつ良質のツイッター・アカウントと良質な分野固有のコンテンツとの間の関係を活用しうる。以下の記述では、ツイッター・アカウントが例示的なソーシャル・メディア・アカウントとして使われ、ツイートおよびリツイートが例示的なソーシャル・メディア投稿またはプロモーションとして使われる。ツイッターに言及してのこうした例にもかかわらず、当業者は、本稿に記載されるさまざまな実施形態は数多くのソーシャル・メディア・サービスの任意のものに適用可能であることを理解するであろう。 In one or more embodiments, the present disclosure is based on a social media account type, by modeling a mutually reinforcing relationship between a social media account and social media content. Provides ranking of media accounts and social media content. This disclosure may identify good quality social media accounts with field-specific knowledge and recommend good field-specific content based on mutually reinforcing rankings that take into account social media account types. .. Taking Twitter as an example of social media services, Twitter accounts can be created by individuals, companies, academic institutions, trade conferences, academic conferences, organizations, publications, software vendors, etc. (eg). Can be owned). A Twitter account that repeatedly or consistently tweets or retweets good quality content in a particular area may be considered a good Twitter account with expertise in that particular area. Also, content that is tweeted or retweeted by many good Twitter accounts in a particular area may be considered good content in that particular area. One or more embodiments of the present disclosure have discipline-specific expertise to rank good quality Twitter accounts with discipline-specific expertise and quality discipline-specific content based on the Twitter type. Take advantage of the relationship between good Twitter accounts and good discipline-specific content. In the description below, Twitter accounts are used as exemplary social media accounts, and tweets and retweets are used as exemplary social media posts or promotions. Despite these examples referring to Twitter, one of ordinary skill in the art will appreciate that the various embodiments described in this article are applicable to any of a number of social media services. ..

図19は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウント型に基づく、ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランク付けに関して使用されうる例示的なフロー1900の図である。いくつかの実施形態では、フロー1900は、ソーシャル・メディア・アカウント型に基づく、ソーシャル・メディア・アカウントおよびソーシャル・メディア・コンテンツの相互に補強するランクキングを決定するプロセスまたはプロセスの一部を示していてもよい。これらおよび他の実施形態において、フロー1900の一部または全部は、図1のシステム100の動作の例であってもよい。たとえば、いくつかの実施形態では、情報収集システム110がフロー1900に示される、ソーシャル・メディア・アカウント型に基づく、ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランクキングを生成するよう構成されてもよい。 FIG. 19 is an exemplary flow of 1900 that can be used with respect to the mutually reinforcing ranking of social media accounts and content based on the social media account type, based on one or more embodiments of the present disclosure. It is a figure. In some embodiments, Flow 1900 illustrates a process or part of a process that determines the mutually reinforcing ranking of social media accounts and social media content based on the social media account type. You may. In these and other embodiments, some or all of the flow 1900 may be an example of the operation of system 100 in FIG. For example, in some embodiments, the information gathering system 110 is configured to generate mutually reinforcing rankings of social media accounts and content based on the social media account type shown in Flow 1900. May be good.

フロー1900はブロック1910で始まってもよく、拡張されたアカウントがセンサーとして得られてもよい。アカウントはソーシャル・メディア・アカウントであってもよく、拡張されたアカウントは、分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントであってもよい。分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントは、所与のトピックについての知識のある人であるとわかっている人々に関連付けられたシード・ソーシャル・メディア・アカウント(たとえば図15のシード・ソーシャル・メディア・アカウント1510)と、該知識のある人によってフォローされているソーシャル・メディア・アカウントであってすでにシード・ソーシャル・メディア・アカウントになっているのではないもの(たとえば図15の第一の候補集合1520)とを含んでいてもよい。いくつかの実施形態では、分野固有の専門知識をもつ拡張されたシード・ソーシャル・メディア・アカウントは、分野固有のコンテンツを識別または発見するためおよびソーシャル・メディア・アカウントのさまざまな型を識別または判別するためのセンサーとして使われてもよい。相互に補強する方法は、ソーシャル・メディア・アカウント型に基づいて有用情報に富むソーシャル・メディア・アカウントを識別し、ソーシャル・メディア内の分野固有のコンテンツを推薦するために適用されてもよい。 Flow 1900 may start at block 1910 and an extended account may be obtained as a sensor. The account may be a social media account and the extended account may be an extended seed social media account with discipline-specific knowledge. An extended seed social media account with discipline-specific knowledge is a seed social media account associated with people who are known to be knowledgeable about a given topic (eg, Figure 15). Seed social media account 1510) and social media accounts followed by the knowledgeable person that are not already seed social media accounts (eg Figure 15). The first candidate set of 1520) and may be included. In some embodiments, an extended seed social media account with discipline-specific expertise identifies or identifies different types of social media accounts for identifying or discovering discipline-specific content. It may be used as a sensor to do so. Mutual reinforcement methods may be applied to identify useful information-rich social media accounts based on social media account types and to endorse discipline-specific content within social media.

ブロック1920では、拡張されたソーシャル・メディア・アカウントから生成された、共有されたおよび/またはコメントされた最近のコンテンツが抽出され、まとめられてもよい。いくつかの実施形態では、コンテンツへのリンクを含むソーシャル・メディア投稿またはプロモーションが考慮されてもよく、コンテンツへのリンクを含まないソーシャル・メディア投稿またはプロモーションは破棄されてもよい(たとえば、ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキングを生成する際に考慮されない)。拡張されたソーシャル・メディア・アカウントからのソーシャル・メディア投稿内に含まれるリンクがアクセスされ、コンテンツが抽出されてもよい。抽出されたコンテンツはまとめられてもよい。ソーシャル・メディア・サービスとしてのツイッターの例では、拡張されたツイッター・アカウント(たとえば分野固有の知識をもつツイッター・アカウント)からのツイートまたはリツイートであってリンクを含むものが考慮されてもよく、リンクを含まないツイートまたはリツイートは破棄されてもよい。各ツイートについて、ツイート内でのリンクが目標ウェブページまでたどられてもよく、該目標ウェブページからのコンテンツが抽出されてもよい。ツイートからの抽出されたコンテンツはまとめられてもよい。よって、リンクを含むツイートまたはリツイート(たとえばツイートまたはリツイートすること)は、より多くの人々によってツイートまたはリツイートされる(たとえば投票される)コンテンツ(たとえば記事、刊行物など)が良質なコンテンツと考えられうるという意味で、一種の票(たとえば投票)と考えられてもよい。逆に、より少数の人々によってツイートまたはリツイートされるコンテンツは良質なコンテンツとは考えられなくてもよい。 Block 1920 may extract and summarize recent shared and / or commented content generated from extended social media accounts. In some embodiments, social media posts or promotions that include links to content may be considered, and social media posts or promotions that do not include links to content may be discarded (eg, social). Not considered when generating mutually reinforcing rankings for media accounts and content). Links contained within social media posts from extended social media accounts may be accessed and content extracted. The extracted content may be grouped together. The example of Twitter as a social media service may consider tweets or retweets from an extended Twitter account (eg, a Twitter account with discipline-specific knowledge) that includes a link. Tweets or retweets that do not contain may be discarded. For each tweet, the link within the tweet may be followed to the target web page, and the content from the target web page may be extracted. Content extracted from tweets may be combined. Therefore, a tweet or retweet containing a link (eg, tweeting or retweet) is considered to be good content if it is tweeted or retweeted (eg, voted) by more people (eg, article, publication, etc.). It may be considered as a kind of vote (for example, a vote) in the sense that it is possible. Conversely, content that is tweeted or retweeted by a smaller number of people does not have to be considered good content.

いくつかの実施形態において、前記拡張されたソーシャル・メディア・アカウントの各拡張されたソーシャル・メディア・アカウントについて、最も最近の特定数の投稿(たとえば最も最近の1000の投稿、最も最近の1100の投稿など)から生成、共有および/またはコメントされたコンテンツが抽出され、まとめられてもよい。ツイッターの例では、それぞれの拡張されたツイッター・アカウントについて、最も最近の特定数のツイートまたはリツイートからのコンテンツが抽出され、まとめられてもよい。すなわち、最も最近の特定数のツイートまたはリツイートに含まれるリンクが対応する目標ウェブページまでたどられてもよく、該目標ウェブページからのコンテンツが抽出され、まとめられてもよい。前記拡張されたソーシャル・メディア・アカウントの各拡張されたソーシャル・メディア・アカウントについて、特定の時間期間または時点内になされた投稿から生成、共有および/またはコメントされたコンテンツ(たとえば、直前の一週間以内の投稿、直前の二週間以内の投稿、直前の一か月以内の投稿など)が抽出され、まとめられてもよい。 In some embodiments, for each extended social media account of the expanded social media account, the most recent specific number of posts (eg, the most recent 1000 posts, the most recent 1100 posts). Content generated, shared and / or commented from (etc.) may be extracted and combined. In the Twitter example, content from the most recent specific number of tweets or retweets may be extracted and combined for each extended Twitter account. That is, the link contained in the most recent specific number of tweets or retweets may be traced to the corresponding target web page, and the content from the target web page may be extracted and summarized. Content generated, shared and / or commented from posts made within a specific time period or time point for each expanded social media account in the expanded social media account (eg, the last week). Posts within, posts within the last two weeks, posts within the last month, etc.) may be extracted and summarized.

ブロック1930では、分野固有の知識をもつ拡張されたソーシャル・メディア・アカウントに含まれるソーシャル・メディア・アカウントのさまざまな型について判別がなされてもよい。所与のトピックについて知識のある人であるとわかっている人々に関連付けられたシード・ソーシャル・メディア・アカウント(たとえば図15のシード・ソーシャル・メディア・アカウント1510)は個人によって作られたソーシャル・メディア・アカウントであってもよい。たとえば、所与のトピックまたは分野についての刊行物の著作者はその著作者に関連付けられたソーシャル・メディア・アカウントを有することがある。その著作者に関連付けられたソーシャル・メディア・アカウントは、その刊行物のトピックまたは分野について知識のある人のソーシャル・メディア・アカウントでありうる。そのようなソーシャル・メディア・アカウントは、個人ソーシャル・メディア・アカウント(たとえば、個人ソーシャル・メディア・アカウント型)と考えられてもよい。知識のある人によってフォローされるソーシャル・メディア・アカウントであってすでにシード・ソーシャル・メディア・アカウントになっているのではないもの(たとえば図15の第一の候補集合1520)は、個人、企業、学術機関、通商会議(trade conference)、学術会議、組織、刊行物、ソフトウェア・ベンダーなどによって生成されたソーシャル・メディア・アカウントであってもよい。知識のある人によってフォローされるソーシャル・メディア・アカウントであってすでにシード・ソーシャル・メディア・アカウントになっているのではないものの型について判別がなされてもよい。たとえば、知識のある人によってフォローされるソーシャル・メディア・アカウントであってすでにシード・ソーシャル・メディア・アカウントになっているのではないものに含まれる各ソーシャル・メディア・アカウントについて、その特定のソーシャル・メディア・アカウントが個人、企業、学術機関、通商会議(trade conference)、学術会議、組織、刊行物、ソフトウェア・ベンダーまたはその他によって所有されているかどうか(たとえば、個人ソーシャル・メディア・アカウント型、企業ソーシャル・メディア・アカウント型、学術機関ソーシャル・メディア・アカウント型、通商会議ソーシャル・メディア・アカウント型など)を判別するために解析が実行されてもよい。分野固有の知識をもつ拡張されたソーシャル・メディア・アカウントに含まれるソーシャル・メディア・アカウントのさまざまな型を判別するための例示的技法は、図20aおよび図20bに示される。 In block 1930, discrimination may be made for different types of social media accounts contained in extended social media accounts with discipline-specific knowledge. Seed social media accounts (eg, seed social media account 1510 in Figure 15) associated with people who are known to be knowledgeable about a given topic are social media created by individuals.・ It may be an account. For example, the author of a publication on a given topic or discipline may have a social media account associated with that author. The social media account associated with the author can be a social media account of someone who is knowledgeable about the topic or discipline of the publication. Such social media accounts may be considered personal social media accounts (eg, personal social media account types). Social media accounts followed by knowledgeable people that are no longer seed social media accounts (eg, first candidate set 1520 in Figure 15) are individuals, companies, It may be a social media account generated by an academic institution, trade conference, academic conference, organization, publication, software vendor, etc. A determination may be made about the type of social media account followed by a knowledgeable person that is not already a seed social media account. For example, for each social media account that is included in a social media account that is followed by a knowledgeable person and is not already a seed social media account, that particular social media. Whether the media account is owned by an individual, company, academic institution, trade conference, academic conference, organization, publication, software vendor or others (eg personal social media account type, corporate social) -Analysis may be performed to determine media account type, academic institution social media account type, trade conference social media account type, etc.). Illustrative techniques for identifying different types of social media accounts contained in extended social media accounts with discipline-specific knowledge are shown in FIGS. 20a and 20b.

ブロック1940では、ソーシャル・メディア・アカウント型に基づいて、ソーシャル・メディア・アカウントおよびソーシャル・メディア・コンテンツの相互に補強するランキングが生成されてもよい。たとえば、相互に補強する方法が適用されて、相互に補強するランキングに基づいて、分野固有の知識をもつ拡張されたソーシャル・メディア・アカウントを識別し(たとえば有用情報に富むソーシャル・メディア・アカウントを識別し)、分野固有の知識をもつ拡張されたソーシャル・メディア・アカウントから生成、共有および/またはコメントされたコンテンツを推薦してもよい。特に、相互に補強するランキングは、分野固有の知識をもつ拡張されたソーシャル・メディア・アカウントのソーシャル・メディア・アカウント型に基づいていてもよい。本開示と整合するそのようなプロセスは、図21に関してさらに詳細に述べる。 Block 1940 may generate mutually reinforcing rankings for social media accounts and social media content based on the social media account type. For example, mutually reinforcing methods are applied to identify extended social media accounts with discipline-specific knowledge based on mutually reinforcing rankings (for example, useful information-rich social media accounts). Identify) and recommend content generated, shared and / or commented from an extended social media account with discipline-specific knowledge. In particular, mutually reinforcing rankings may be based on the social media account type of extended social media accounts with discipline-specific knowledge. Such a process consistent with the present disclosure will be described in more detail with respect to FIG.

図20aおよび図20bは、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウント型の判別に関して使用されうる例示的フロー2000の図を示している。いくつかの実施形態では、フロー2000は、ソーシャル・メディア・アカウントについてのソーシャル・メディア・アカウント型を判別するためのプロセスまたはプロセスの一部を示していてもよい。すなわち、フロー2000は、ソーシャル・メディア・アカウントがどの型のソーシャル・メディア・アカウントであるかを識別するためのプロセスまたはプロセスの一部を示していてもよい。これらおよび他の実施形態において、フロー2000の一部または全部は、図1のシステム100の動作の例であってもよい。たとえば、いくつかの実施形態では、情報収集システム110がフロー2000に示されるように、分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントに含まれる各ソーシャル・メディア・アカウントについて、ソーシャル・メディア・アカウントの型を判別するよう構成されてもよい。 20a and 20b show diagrams of an exemplary flow 2000 that can be used for social media account type discrimination based on one or more embodiments of the present disclosure. In some embodiments, Flow 2000 may indicate a process or part of a process for determining the social media account type for a social media account. That is, Flow 2000 may indicate a process or part of a process for identifying what type of social media account the social media account is. In these and other embodiments, some or all of Flow 2000 may be an example of the operation of system 100 in FIG. For example, in some embodiments, for each social media account contained in an extended seed social media account with discipline-specific knowledge, as the information gathering system 110 is shown in Flow 2000, social. • It may be configured to determine the type of media account.

フロー2000はブロック2010で始まってもよく、ソーシャル・メディア・アカウント2002に対応するアカウント・プロフィールが取得されてもよい。ソーシャル・メディア・アカウント2002は、分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントに含まれるソーシャル・メディア・アカウントであってもよく、ソーシャル・メディア・アカウント2002は、フロー2000に従ってソーシャル・メディア・アカウント2002に対応するソーシャル・メディア・アカウント型を決定するために取得または検索されてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウント2002は、分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントに含まれる、知識のある人によってフォローされるソーシャル・メディア・アカウントであってすでにシード・ソーシャル・メディア・アカウントになっているのではないもの(たとえば図15の第一の候補集合1520)のうちの一つであってもよい。この事例では、分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントに含まれる、所与のトピックについて知識があるとわかっている人々に関連付けられたシード・ソーシャル・メディア・アカウント(たとえば図15のシード・ソーシャル・メディア・アカウント1510)は、個人によって作られたソーシャル・メディア・アカウントであってもよく、個人ソーシャル・メディア・アカウント(たとえば個人ソーシャル・メディア・アカウント型)と考えられてもよい。 Flow 2000 may start at block 2010 and an account profile corresponding to social media account 2002 may be acquired. The social media account 2002 may be a social media account included in an extended seed social media account with discipline-specific knowledge, and the social media account 2002 is social according to Flow 2000. • May be acquired or searched to determine the social media account type that corresponds to the media account 2002. In some embodiments, the social media account 2002 is a social media account that is included in an extended seed social media account with discipline-specific knowledge and is followed by a knowledgeable person. It may be one of those that are not already seed social media accounts (eg, first candidate set 1520 in FIG. 15). In this case, a seed social media account (for example,) that is included in an extended seed social media account with discipline-specific knowledge and is associated with people who are known to be knowledgeable about a given topic. The seed social media account 1510) in FIG. 15 may be a social media account created by an individual and is considered to be a personal social media account (eg, a personal social media account type). May be good.

アカウント・プロフィールは、ソーシャル・メディア・アカウント2002を所有する、運営するまたはそれに関連付けられているエンティティに関する情報を含んでいてもよい。ソーシャル・メディア・アカウントを所有する、運営するまたはそれに関連付けられているエンティティはソーシャル・メディア・アカウント所有者と称されてもよい。アカウント・プロフィールは、ソーシャル・メディア・アカウント所有者に関する名前、写真、記述、リンクURLおよび他の情報を含んでいてもよい。たとえば、アカウント・プロフィールはウェブページであってもよい。 The account profile may contain information about the entity that owns, operates or is associated with the social media account 2002. The entity that owns, operates, or is associated with a social media account may be referred to as the social media account owner. The account profile may include a name, photo, description, link URL and other information about the social media account owner. For example, the account profile may be a web page.

ブロック2020では、ソーシャル・メディア・アカウント2002に関連付けられた名前が、取得されたアカウント・プロフィールから抽出されてもよい。名前は、アカウント・プロフィール・ウェブページに含まれる文字列またはキャラクタ・ストリングであってもよい。たとえば、アカウント・プロフィール・ウェブページは、名前を示しうるキャラクタ・ストリングを求めてパースおよび/または検索されてもよい。抽出された名前は、ソーシャル・メディア・アカウント所有者(たとえば、ソーシャル・メディア・アカウント2002の所有者)の名前であってもよい。たとえば、名前は個人の名前、ジャーナルの名前、企業の名前、会議の名前などであってもよい。 In block 2020, the name associated with the social media account 2002 may be extracted from the acquired account profile. The name may be a string or character string contained in the account profile web page. For example, an account profile web page may be parsed and / or searched for a character string that can indicate a name. The extracted name may be the name of the social media account owner (eg, the owner of the social media account 2002). For example, the name may be an individual's name, a journal's name, a company's name, a meeting's name, and so on.

ブロック2022では、抽出された名前が検査されて名前特徴2024を生成してもよい。名前特徴2024は抽出された名前を表わす数値的な特徴または信号のベクトルであってもよい。すなわち、名前特徴2024は抽出された名前の数値的表現であってもよい。いくつかの実施形態では、抽出された名前は、著作者名データベース、一般的な名前のデータベース、会議名データベース、企業名データベース、名前キーワード・データベースなどといった既知の名前の一つまたは複数のデータベースに対して検査されてもよい。著作者名データベースは、計算機科学、電気工学、機械学習などといった特定の分野またはトピックの公表された論文または刊行物の著作者の名前を含んでいてもよい。一般的な名前のデータベースは、「デイヴ(Dave)」、「ダイアナ(Diana)」、「スーザン(Susan)」などといった人の一般的な名前を含んでいてもよい。企業名データベースは、企業、会社などの名称を含んでいてもよい。名前キーワード・データベースは、「機械(machines)」、「研究(research)」、「会議(conference)」などといったさまざまなソーシャル・メディア・アカウント型の既存の名前から蓄積された個別的なキーワードを含んでいてもよい。抽出された名前とデータベースの一つにある名前との間に一致が見出されたら、名前特徴2024は名前のその特定の型を示すまたは表わすよう設定されてもよい。たとえば、抽出された名前が著作者データベースにおけるある著作者の名前と一致する場合、名前特徴2024は、抽出された名前が著作者の名前であることを示すよう設定されてもよい。もう一つの例では、抽出された名前が一般的な名前のデータベースにおけるある一般的な名前と一致する場合、名前特徴2024は、抽出された名前が一般的な名前であることを示すよう設定されてもよい。さらにもう一つの例では、抽出された名前が名前キーワード・データベースにおけるある特定のキーワードを含むまたは包含する場合、名前特徴2024は、抽出された名前が特定のキーワードを含んでいることを示すよう設定されてもよい。抽出された名前と前記データベースのうちの一つにおける名前との間に一致がみつかる場合、名前特徴2024は、抽出された名前がどの名前データベースにもみつからないことを示すよう設定されてもよい。 In block 2022, the extracted names may be inspected to generate name features 2024. Name feature 2024 may be a vector of numerical features or signals representing the extracted name. That is, the name feature 2024 may be a numerical representation of the extracted name. In some embodiments, the extracted names are in one or more databases with known names, such as author name databases, generic name databases, conference name databases, company name databases, name keyword databases, and so on. It may be inspected. The author name database may contain the names of authors of published articles or publications in specific disciplines or topics such as computer science, electrical engineering, machine learning, and the like. A database of common names may include common names for people such as "Dave", "Diana", "Susan", and so on. The company name database may include the names of companies, companies, and the like. The name keyword database contains individual keywords accumulated from existing names of various social media account types such as "machines", "research", "conference", etc. You may go out. If a match is found between the extracted name and the name in one of the databases, the name feature 2024 may be set to indicate or represent that particular type of name. For example, if the extracted name matches the name of an author in the author database, the name feature 2024 may be set to indicate that the extracted name is the name of the author. In another example, if the extracted name matches a generic name in a generic name database, the name feature 2024 is set to indicate that the extracted name is a generic name. You may. In yet another example, if the extracted name contains or contains a particular keyword in the name keyword database, the name feature 2024 is set to indicate that the extracted name contains a particular keyword. May be done. If a match is found between the extracted name and the name in one of the databases, the name feature 2024 may be set to indicate that the extracted name is not found in any name database.

ブロック2030では、ソーシャル・メディア・アカウント2002に関連する写真が、取得されたアカウント・プロフィールから抽出されてもよい。写真は、アカウント・プロフィール・ウェブページに含まれる画像であってもよい。アカウント・プロフィール・ウェブページは、アカウント・プロフィール内の一つまたは複数の写真を識別し、抽出するためにパースされてもよい。たとえば、ソーシャル・メディア・アカウント・プロフィールはしばしば該ソーシャル・メディア・アカウントに関連する写真または他の画像を、該ソーシャル・メディア・アカウントを視覚的に識別するものとして含んでいる。 At block 2030, photos related to social media account 2002 may be extracted from the acquired account profile. The photo may be an image contained in an account profile web page. The account profile web page may be parsed to identify and extract one or more photos in the account profile. For example, social media account profiles often include photos or other images associated with the social media account as a visual identification of the social media account.

ブロック2032では、抽出された写真が検査されて、写真特徴2034を生成してもよい。写真特徴2034は、抽出された写真を表わす数値的な特徴または信号のベクトルであってもよい。いくつかの実施形態では、抽出された写真は、該写真が人物の顔であるまたは人物の顔を含んでいるかどうかを判定するために検査されてもよい。たとえば、抽出された写真は、該写真が人物の顔であるまたは人物の顔を含むかどうかを判定するために、顔認識アルゴリズムを使って解析されてもよい。該写真が人物の顔であるまたは人物の顔を含む場合、写真特徴2024は該写真が人物の顔であるまたは人物の顔を含むことを示すまたは表わすよう設定されてもよい。逆に、該写真が人物の顔でないまたは人物の顔を含まない場合、写真特徴2024は該写真が人物の顔でないまたは人物の顔を含まないことを示すまたは表わすよう設定されてもよい。 At block 2032, the extracted photographs may be inspected to produce photographic features 2034. The photographic feature 2034 may be a vector of numerical features or signals representing the extracted photo. In some embodiments, the extracted photo may be inspected to determine if the photo is a person's face or contains a person's face. For example, the extracted photo may be analyzed using a facial recognition algorithm to determine if the photo is a person's face or contains a person's face. If the photo is a person's face or contains a person's face, the photographic feature 2024 may be set to indicate or represent that the photo is a person's face or contains a person's face. Conversely, if the photo is not a person's face or does not contain a person's face, the photographic feature 2024 may be set to indicate or represent that the photo is not a person's face or does not contain a person's face.

ブロック2040では、ソーシャル・メディア・アカウント2002に関連する記述が、取得されたアカウント・プロフィールから抽出されてもよい。記述は、アカウント・プロフィール・ウェブページに含まれるテキスト・ストリングまたはコンテンツであってもよく、ソーシャル・メディア・アカウント所有者(たとえばソーシャル・メディア・アカウント2002の所有者)を記述してもよい。たとえば、アカウント・プロフィール・ウェブページは、記述を示しうるテキスト・ストリングまたはコンテンツを求めてパースおよび/または検索されてもよい。個人ソーシャル・メディア・アカウントの例では、記述は、ソーシャル・メディア・アカウント所有者(たとえば当該人物)を「スタンフォード大の機械学習の博士課程の学生」と記述してもよい。会議に関連するソーシャル・メディア・アカウントの例では、記述はソーシャル・メディア・アカウント所有者(たとえば当該会議)を「ニューヨーク市で2016年6月19~24日開催の機械学習の研究者のための最高の国際会議」と記述してもよい。 At block 2040, descriptions related to social media account 2002 may be extracted from the acquired account profile. The description may be a text string or content contained in the account profile web page, or may describe the owner of the social media account (eg, the owner of the social media account 2002). For example, an account profile web page may be parsed and / or searched for text strings or content that may indicate a description. In the example of a personal social media account, the description may describe the social media account owner (eg, that person) as a "Ph.D. student in machine learning at Stanford University." In the example of a social media account related to a conference, the description describes the social media account owner (eg, the conference) as "for machine learning researchers held June 19-24, 2016 in New York City. It may be described as "the best international conference".

ブロック2042では、抽出された記述は、記述特徴2044を生成するよう検査されてもよい。記述特徴2044は、抽出された記述を表わす数値的な特徴または信号のベクトルであってもよい。いくつかの実施形態では、抽出された記述は、該抽出された記述が記述キーワード・データベース内の一つまたは複数の個別的キーワードを含むまたは包含するかどうかを判定するために、記述キーワード・データベースに対して照合される。記述キーワード・データベースは、さまざまなソーシャル・メディア・アカウント型の既存の記述から蓄積された個別的キーワードを含んでいてもよい。抽出された記述が記述キーワード・データベースにおける一つまたは複数の個別的キーワードを含むまたは包含する場合、記述特徴2044は、抽出された記述が前記一つまたは複数の個別的キーワードを含むことを示すよう設定されてもよい。逆に、抽出された記述が記述キーワード・データベースにおけるキーワードを含まない場合、記述特徴2044は、抽出された記述がキーワードを含まないことを示すよう設定されてもよい。 In block 2042, the extracted description may be inspected to produce descriptive feature 2044. The description feature 2044 may be a vector of numerical features or signals representing the extracted description. In some embodiments, the extracted description is a descriptive keyword database to determine if the extracted description contains or contains one or more individual keywords in the descriptive keyword database. Is matched against. The descriptive keyword database may contain individual keywords accumulated from existing descriptions of various social media account types. If the extracted description contains or includes one or more individual keywords in the descriptive keyword database, the descriptive feature 2044 indicates that the extracted description contains the one or more individual keywords. It may be set. Conversely, if the extracted description does not contain a keyword in the descriptive keyword database, the descriptive feature 2044 may be set to indicate that the extracted description does not contain the keyword.

ブロック2050では、ソーシャル・メディア・アカウント2002に関連するリンクURLが、取得されたアカウント・プロフィールから抽出されてもよい。たとえば、アカウント・プロフィール・ウェブページは、アカウント・プロフィールがリンクURLを含んでいるかどうかを判定するためにパースおよび/または解析されてもよい。アカウント・プロフィールがリンクURLを含む場合には、そのリンクURLがアカウント・プロフィール・ウェブページから抽出されてもよい。 At block 2050, the link URL associated with the social media account 2002 may be extracted from the acquired account profile. For example, an account profile web page may be parsed and / or parsed to determine if the account profile contains a link URL. If the account profile contains a link URL, the link URL may be extracted from the account profile web page.

ブロック2052では、抽出されたリンクURLは、プロフィールURL特徴2054を生成するために検査されてもよい。プロフィールURL特徴2054は、抽出されたリンクURLを表わす数値的な特徴または信号のベクトルであってもよい。いくつかの実施形態では、抽出されたリンクURLはアクセスされて、該リンクURLによってポイントされるコンテンツ(たとえばHTMLページ)が取得またはダウンロードされてもよい。ダウンロードされたコンテンツ(たとえばHTMLページ)は解析されて、キーワード特徴ベクトルを生成してもよい。キーワード特徴ベクトルは、プロフィールURL特徴2054に含められてもよく、あるいはプロフィールURL特徴2054の一部であってもよい。いくつかの実施形態では、ダウンロードされたHTMLページは解析されて、該HTMLページに含まれる一つまたは複数の情報ブロックを識別してもよい。たとえば、ダウンロードされたHTMLページを表示するためにコンピュータによって使われるコードが解析されて、情報のブロック(たとえばテキスト・ブロック)を含みうるフィールドの位置を判別してもよい。識別された情報ブロックからキーワードが抽出されてもよい。個人に関連付けられたソーシャル・メディア・アカウント(個人ソーシャル・メディア・アカウント)の例では、キーワードの例は「志願者(Candidate)」、「刊行物(Publications)」、「教授(Teaching)」、「学生(Student)」などを含んでいてもよい。企業に関連付けられたソーシャル・メディア・アカウントの例では、キーワードの例は「当社について(About Us)」、「職種(Careers)」、「採用情報(Join Us)」などを含みうる。会議に関連付けられたソーシャル・メディア・アカウントの例では、キーワードの例は「登録(Registration)」、「論文募集(Call for Papers)」、「編者(Editors)」、「著者(Authors)」、「査読者(Reviewers)」などを含みうる。抽出されたキーワードは、一致があるかどうかについてキーワード・データベースに対して照合されてもよい。キーワード・データベースは、さまざまなソーシャル・メディア・アカウント型の既存のウェブページから蓄積された個別的キーワードを含んでいてもよい。キーワード特徴ベクトルは、抽出されたキーワードと個別的キーワードとの間の一致があればそれを示すよう設定されてもよい。 In block 2052, the extracted link URL may be inspected to generate the profile URL feature 2054. The profile URL feature 2054 may be a vector of numerical features or signals representing the extracted link URL. In some embodiments, the extracted link URL may be accessed to acquire or download the content pointed to by the link URL (eg, an HTML page). Downloaded content (eg HTML pages) may be parsed to generate a keyword feature vector. The keyword feature vector may be included in the profile URL feature 2054 or may be part of the profile URL feature 2054. In some embodiments, the downloaded HTML page may be parsed to identify one or more blocks of information contained within the HTML page. For example, the code used by the computer to display the downloaded HTML page may be parsed to determine the location of fields that may contain blocks of information (eg text blocks). Keywords may be extracted from the identified information block. In the example of a social media account associated with an individual (personal social media account), examples of keywords are "Candidate", "Publications", "Teaching", "Teaching". It may include "Student" and so on. In the example of a social media account associated with a company, examples of keywords could include "About Us," "Careers," "Join Us," and so on. In the example of a social media account associated with a meeting, examples of keywords are "Registration", "Call for Papers", "Editors", "Authors", "Authors". It can include "Reviewers" and so on. The extracted keywords may be matched against the keyword database for a match. The keyword database may contain individual keywords accumulated from existing web pages of various social media account types. The keyword feature vector may be set to indicate any match between the extracted keywords and the individual keywords.

いくつかの実施形態では、抽出されたリンクURLはトークンに分割されてもよく、トークンは解析されてURL特徴ベクトルを生成してもよい。URL特徴ベクトルはプロフィールURL特徴2054に含められてもよく、あるいはプロフィールURL特徴の一部であってもよい。トークンは、一致があるかどうかについてキーURLトークン・データベースに対して照合されてもよい。キーURLトークン・データベースは、さまざまなソーシャル・メディア・アカウント型の既存のリンクURLから蓄積された個別的URLトークンを含んでいてもよい。キーURLトークンの例は「.com」「.org」「.net」「.edu」「.gov」などを含んでいてもよい。URL特徴ベクトルは、前記トークンとキーURLトークン・データベース内の個別的なURLトークンとの間に一致があればそれを示すよう設定されてもよい。 In some embodiments, the extracted link URL may be split into tokens, which may be parsed to generate a URL feature vector. The URL feature vector may be included in the profile URL feature 2054 or may be part of the profile URL feature. The tokens may be matched against the key URL token database for a match. The key URL token database may contain individual URL tokens accumulated from existing link URLs of various social media account types. Examples of key URL tokens may include ".com", ".org", ".net", ".edu", ".gov", and the like. The URL feature vector may be set to indicate a match between the token and the individual URL tokens in the key URL token database.

ブロック2060では、ソーシャル・メディア・アカウント2002に関連付けられた最近のソーシャル・メディア・コンテンツが取得されてもよい。たとえば、ソーシャル・メディア・アカウント2002からの最近のソーシャル・メディア投稿が取得されてもよい。いくつかの実施形態では、取得されたソーシャル・メディア投稿の数は、最も最近のソーシャル・メディア投稿の特定の数であってもよい。いくつかの実施形態では、取得されたソーシャル・メディア投稿の数は、特定の時間期間もしくは時点の間にまたは特定の時間期間もしくは時点にわたってなされたソーシャル・メディア投稿(たとえば直前の一週間以内の投稿、直前の二週間以内の投稿、直前の一か月以内の投稿など)であってもよい。 At block 2060, recent social media content associated with the social media account 2002 may be retrieved. For example, recent social media posts from social media accounts 2002 may be retrieved. In some embodiments, the number of social media posts retrieved may be a particular number of the most recent social media posts. In some embodiments, the number of social media posts retrieved is a social media post made during or over a particular time period or time point (eg, a post within the last week). , Posts within the last two weeks, posts within the last month, etc.).

ブロック2070では、取得された最近のソーシャル・メディア・コンテンツのテキストが抽出されてもよい。ブロック2072では、抽出されたソーシャル・メディア・テキストが検査されて、コンテンツ・テキスト特徴2074を生成してもよい。ある型のソーシャル・メディア・アカウントは、自己プロモーションをしたり自分のコンテンツをプロモーションしたりする傾向がより強いことがある。たとえば、会議に関連付けされたソーシャル・メディア・アカウントは、個人に関連付けられたソーシャル・メディア・アカウントよりも自己プロモーションする傾向が強いことがある。よって、抽出されたソーシャル・メディア・テキストが検査されてもよく、コンテンツ・テキスト特徴2074は自己プロモーションの程度を表わす数値的な特徴または信号のベクトルであってもよい。いくつかの実施形態では、抽出されたソーシャル・メディア・テキストは検査されて、該ソーシャル・メディア・テキストに当該ソーシャル・メディア・アカウント名があるまたはみつかるかどうかが判定されてもよい。ソーシャル・メディア・テキスト内に当該ソーシャル・メディア・アカウント名がみつかる場合には、当該ソーシャル・メディア・アカウント名を含むソーシャル・メディア・コンテンツ項目の割合(たとえば、ソーシャルメディア投稿の割合)について判別がなされてもよい。コンテンツ・テキスト特徴2074は、当該ソーシャル・メディア・アカウント名を含むソーシャル・メディア・コンテンツの割合を示すよう設定されてもよい。追加的または代替的に、抽出されたソーシャル・メディア・テキストは、該ソーシャル・メディア・テキストにハッシュタグがあるまたはみつかるかどうかを判定するために検査されてもよい。ソーシャル・メディア・テキスト内にハッシュタグがみつかる場合、該ハッシュタグの統計または該ハッシュタグに関連した統計が決定されてもよく、コンテンツ・テキスト特徴2074はハッシュタグ特徴を示すよう設定されてもよい。 At block 2070, the text of the acquired recent social media content may be extracted. At block 2072, the extracted social media text may be inspected to generate the content text feature 2074. Certain types of social media accounts may be more prone to self-promotion and promotion of their content. For example, a social media account associated with a meeting may be more likely to self-promote than a social media account associated with an individual. Thus, the extracted social media text may be inspected and the content text feature 2074 may be a vector of numerical features or signals representing the degree of self-promotion. In some embodiments, the extracted social media text may be inspected to determine if the social media text has or is found with the social media account name. If the social media account name is found in the social media text, a determination is made about the percentage of social media content items that include the social media account name (eg, percentage of social media posts). You may. Content text features 2074 may be set to indicate the percentage of social media content that includes the social media account name. Additional or alternative, the extracted social media text may be inspected to determine if the social media text has or is found to have a hashtag. If a hashtag is found in social media text, the hashtag statistics or statistics associated with the hashtag may be determined and the content text feature 2074 may be set to indicate the hashtag feature. ..

ブロック2080では、取得された最近のソーシャル・メディア・コンテンツからリンクURLが抽出されてもよい。ブロック2082では、ソーシャル・メディア・コンテンツからのリンクURLが検査されて、コンテンツURL特徴2084を生成してもよい。上記で論じたように、ある型のソーシャル・メディア・アカウントは、自己プロモーションをしたり自分のコンテンツをプロモーションしたりする傾向がより強いことがある。たとえば、コンテンツから抽出されたリンクURLは検査されてもよく、コンテンツURL特徴2084は自己プロモーションの程度を表わす数値的な特徴または信号のベクトルであってもよい。いくつかの実施形態では、コンテンツから抽出されたリンクURLは検査されて、該抽出されたリンクURLが当該ソーシャル・メディア・アカウント(たとえばソーシャル・メディア・アカウント2002)の同じドメインにリンクするものであるかどうかを判定してもよい。たとえば、コンテンツから抽出されたリンクURLは検査されて、コンテンツから抽出されたリンクURLのいずれかが前記アカウント・プロフィールにおけるリンクURL(たとえば上記のブロック2050を参照)の同じドメインにリンクしているかどうかを判定してもよい。コンテンツURL特徴2084は、コンテンツから抽出されたリンクURLのうち、当該ソーシャル・メディア・アカウントの同じドメインにリンクする割合を示すよう設定されてもよい。 At block 2080, the link URL may be extracted from the recent acquired social media content. At block 2082, link URLs from social media content may be inspected to generate content URL features 2084. As discussed above, certain types of social media accounts may be more prone to self-promotion and promotion of their content. For example, the link URL extracted from the content may be inspected and the content URL feature 2084 may be a numerical feature or a vector of signals representing the degree of self-promotion. In some embodiments, the link URL extracted from the content is inspected and the extracted link URL links to the same domain of the social media account (eg, social media account 2002). It may be determined whether or not. For example, the link URLs extracted from the content are inspected to see if any of the link URLs extracted from the content link to the same domain of the link URL in the account profile (see, for example, block 2050 above). May be determined. The content URL feature 2084 may be set to indicate the percentage of link URLs extracted from the content that link to the same domain of the social media account.

ブロック2090では、ソーシャル・メディア・アカウント2002を表わす数値的な特徴または信号(たとえば名前特徴2024、写真特徴2034、記述特徴2044、プロフィールURL特徴2054、コンテンツ・テキスト特徴2074およびコンテンツURL特徴2084)が、該ソーシャル・メディア・アカウントのソーシャル・メディア・アカウント型2092を判別するために、機械学習ツールに入力されてもよい。入力された数値的な特徴または信号は、たとえばウェブページ内に、特定の特徴(たとえば側面)が存在するか存在しないかを示す。分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントに含まれる、知識のある人によってフォローされるソーシャル・メディア・アカウントであってすでにシード・ソーシャル・メディア・アカウントになっているのではないもの(たとえば図15の第一の候補集合1520)のうちの各ソーシャル・メディア・アカウントについてのソーシャル・メディア・アカウント型が、フロー2000に従って決定されうる。 In block 2090, numerical features or signals representing social media account 2002 (eg, name feature 2024, photo feature 2034, description feature 2044, profile URL feature 2054, content text feature 2074, and content URL feature 2084) are It may be entered into a machine learning tool to determine the social media account type 2092 of the social media account. The entered numerical feature or signal indicates whether a particular feature (eg, a side) is present or absent, eg, within a web page. A social media account that is followed by a knowledgeable person and is already a seed social media account, which is included in an extended seed social media account with discipline-specific knowledge. The social media account type for each social media account out of none (eg, first candidate set 1520 in FIG. 15) may be determined according to Flow 2000.

図21は、本開示の一つまたは複数の実施形態に基づく、ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキングを計算する例示的方法2100のフローチャートを示している。いくつかの実施形態では、方法2100は、情報収集システム110によって実行されてもよい。代替的または追加的に、方法2100は、いかなる好適なシステム、装置またはデバイスによって実行されてもよい。たとえば、図23のシステム2300のプロセッサ2310が方法2100に関連する動作の一つまたは複数を実行してもよい。離散的なブロックで示されているが、方法2100のブロックの一つまたは複数に関連する段階および動作は、所望される実装に依存して、追加的なブロックに分割されたり、より少数のブロックに組み合わされたり、あるいはなくされたりしてもよい。 FIG. 21 shows a flow chart of exemplary method 2100 for calculating mutually reinforcing rankings of social media accounts and content based on one or more embodiments of the present disclosure. In some embodiments, method 2100 may be performed by the information gathering system 110. Alternatively or additionally, method 2100 may be performed by any suitable system, device or device. For example, processor 2310 in system 2300 of FIG. 23 may perform one or more of the operations related to method 2100. Although shown as discrete blocks, the stages and behaviors associated with one or more of the blocks in Method 2100 may be divided into additional blocks or fewer blocks, depending on the desired implementation. May be combined or eliminated.

方法2100はブロック2102で始まってもよく、各ソーシャル・メディア・アカウントについて、ソーシャル・メディア・アカウント型に基づいて一般型重み(general type weight)(gtw)が決定されてもよい。gtwは、分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントのうちの各ソーシャル・メディア・アカウントについて決定されてもよい。いくつかの実施形態では、gtwは、たとえばユーザー選好に基づいて、各ソーシャル・メディア・アカウントに任意に割り当てられてもよい。たとえば、gtwを割り当てることにおける一つの考慮または因子は、自分自身のコンテンツをプロモーションする可能性がより低いソーシャル・メディア・アカウントに対して、より高いgtwを割り当てることであってもよい。すなわち、自分自身のコンテンツをプロモーションする可能性がより低いソーシャル・メディア・アカウントに、より多くの信頼が与えられてもよい。この考慮に基づき、個人、会議、ジャーナル、報道機関、キュレーション、ソフトウェア・ツールなどに関連するソーシャル・メディア・アカウントのような、自分自身のコンテンツをプロモーションする可能性がより低いソーシャル・メディア・アカウントは高いgtwを割り当てられてもよい。逆に、企業、学術機関などに関連するソーシャル・メディア・アカウントのような、自分自身のコンテンツをプロモーションする可能性がより高いソーシャル・メディア・アカウントは低いgtwを割り当てられてもよい。結果は、高いまたはより高いgtwをもつソーシャル・メディア・アカウントによってプロモーションされるコンテンツは、低いまたはより低いgtwをもつソーシャル・メディア・アカウントによってプロモーションされるコンテンツより、重視されるまたは高く評価されるということであってもよい。 Method 2100 may begin at block 2102, and for each social media account, a general type weight (gtw) may be determined based on the social media account type. The gtw may be determined for each social media account among the extended seed social media accounts with discipline-specific knowledge. In some embodiments, gtw may be arbitrarily assigned to each social media account, for example based on user preferences. For example, one consideration or factor in assigning gtw may be to assign higher gtw to social media accounts that are less likely to promote their own content. That is, more trust may be given to social media accounts that are less likely to promote their own content. Based on this consideration, social media accounts that are less likely to promote their own content, such as social media accounts related to individuals, conferences, journals, news outlets, curations, software tools, etc. May be assigned a high gtw. Conversely, social media accounts that are more likely to promote their own content, such as social media accounts related to businesses, academic institutions, etc., may be assigned a lower gtw. The result is that content promoted by a social media account with a high or higher gtw is more important or appreciated than content promoted by a social media account with a lower or lower gtw. It may be that.

ブロック2104では、個別重み(individual weight)(iw)が、各ソーシャル・メディア・アカウントについて、そのアカウント信用(たとえば、各ソーシャル・メディア・アカウントに関連付けられた信用(credit))に基づいて決定されてもよい。iwは、分野固有の知識をもつ拡張されたシード・ソーシャル・メディア・アカウントのうちの各ソーシャル・メディア・アカウントについて決定されてもよい。いくつかの実施形態では、ソーシャル・メディア・アカウントに割り当てられるiwは、再投稿(re-post)の数、いいねの数、ブックマークの数、閲覧数などといった因子に基づいていてもよい。iwを決定する際に使われるこれらおよび他の因子は、アドホックなヒューリスティックな規則または統計的な機械学習に基づいて決定されてもよい。たとえば、前提として、一部のソーシャル・メディア・アカウントはより人気があり、他のソーシャル・メディア・アカウントはそれほど人気がないということがあってもよい。より人気があるソーシャル・メディア・アカウントは高いまたはより高いiwを割り当てられてもよく、それほど人気のないソーシャル・メディア・アカウントは低いまたはより低いiwを割り当てられてもよい。いくつかの実施形態では、各因子は、それぞれの重みを割り当てられてもよく、ソーシャル・メディア・アカウントに割り当てられるiwは各因子に割り当てられたそれぞれの重みの線形結合であってもよい。 In block 2104, an individual weight (iw) is determined for each social media account based on its account credit (eg, the credit associated with each social media account). May be good. The iw may be determined for each social media account among the extended seeded social media accounts with discipline-specific knowledge. In some embodiments, the iw assigned to a social media account may be based on factors such as the number of re-posts, the number of likes, the number of bookmarks, the number of views, and so on. These and other factors used in determining iw may be determined based on ad hoc heuristic rules or statistical machine learning. For example, it may be assumed that some social media accounts are more popular and others are less popular. More popular social media accounts may be assigned higher or higher iw, and less popular social media accounts may be assigned lower or lower iw. In some embodiments, each factor may be assigned its own weight, and the iw assigned to the social media account may be a linear combination of the respective weights assigned to each factor.

ブロック2106では、ユーザー選好に基づいて各コンテンツ型について一般型重みが決定されてもよい。一般型重みは、たとえばユーザー選好に基づいて、ソーシャル・メディア・コンテンツのそれぞれの型に対して任意に割り当てられてもよい。ソーシャル・メディア・コンテンツの型は、記事、論文、スライド(たとえばプレゼンテーション)、ビデオ、写真、オーディオなどを含んでいてもよい。さまざまなソーシャル・メディア・コンテンツ型に割り当てられる一般型重みは、種々の型のコンテンツについての選好(たとえばユーザー選好)を示しうる。 In block 2106, general type weights may be determined for each content type based on user preference. General type weights may be arbitrarily assigned to each type of social media content, for example based on user preferences. Types of social media content may include articles, papers, slides (eg presentations), videos, photographs, audio, and the like. General type weights assigned to different types of social media content can indicate preferences (eg, user preferences) for different types of content.

ブロック2108では、ソーシャル・メディア・アカウントとコンテンツとの間の相互に補強する関係がエンコードされてもよい。相互に補強する関係は、ソーシャル・メディア・アカウントと該ソーシャル・メディア・アカウントによってプロモーションされるコンテンツとの間のリンクまたはプロモーション・リンクとしてエンコードされてもよい。たとえば、コンテンツは、図19のブロック1920を参照して上記で論じたようなソーシャル・メディア・アカウントから生成、共有および/またはコメントされた最近のコンテンツであってもよい。いくつかの実施形態では、相互に補強する関係は、図22に示される二部グラフを構築することによってエンコードされてもよい。 Block 2108 may encode a mutually reinforcing relationship between the social media account and the content. Reinforcing relationships may be encoded as links or promotional links between social media accounts and the content promoted by those social media accounts. For example, the content may be recent content generated, shared and / or commented from a social media account as discussed above with reference to block 1920 in FIG. In some embodiments, the mutually reinforcing relationships may be encoded by constructing the bipartite graph shown in FIG.

図22は、本開示の一つまたは複数の実施形態に基づく、アカウントとコンテンツとの間の相互に補強する関係をエンコードする例示的な二部グラフを表わす図である。より具体的には、諸ソーシャル・メディア・アカウントUと諸コンテンツCとの間の例示的な相互に補強する関係が示されている。あるソーシャル・メディア・アカウントuについて、uによってプロモーションされる(たとえば投稿される)すべてのコンテンツ項目の集合がC_uとして定義されてもよく、あるコンテンツ項目cについて、cをいつかプロモーションする(たとえば投稿する)すべてのソーシャル・メディア・アカウントの集合がU_cとして定義されてもよい。 FIG. 22 is a diagram illustrating an exemplary bipartite graph encoding a mutually reinforcing relationship between an account and content, based on one or more embodiments of the present disclosure. More specifically, exemplary, mutually reinforcing relationships between social media accounts U and content C are shown. For a social media account u, a set of all content items promoted by u (eg, posted) may be defined as C_u, and for a content item c, c will someday be promoted (eg, posted). ) A collection of all social media accounts may be defined as U_c.

図のように、この二部グラフは二つのソーシャル・メディア・アカウントu1およびu2と、五つのコンテンツ項目c1、c2、c3、c4、c5とを含む。ソーシャル・メディア・アカウントu1は、それぞれプロモーション・リンク2202、2204、2206、2208によって示されるコンテンツ項目c1、c2、c3、c4をプロモーションしたことがある。ソーシャル・メディア・アカウントu2は、それぞれプロモーション・リンク2210、2212、2214によって示されるコンテンツ項目c3、c4、c5をプロモーションしたことがある。各プロモーション・リンクは、つながっているソーシャル・メディア・アカウントからのプロモーション(たとえば投稿)を表わしていてもよい。すなわち、各プロモーション・リンクは、つながっているソーシャル・メディア・アカウントとコンテンツ項目との間の相互に補強する関係を表わしうる。 As shown, this bipartite graph contains two social media accounts u1 and u2 and five content items c1, c2, c3, c4, c5. The social media account u1 has promoted the content items c1, c2, c3, c4 indicated by promotional links 2202, 2204, 2206, 2208, respectively. The social media account u2 has promoted the content items c3, c4, c5 indicated by promotional links 2210, 2212, 2214, respectively. Each promotion link may represent a promotion (eg, a post) from a connected social media account. That is, each promotional link can represent a mutually reinforcing relationship between a connected social media account and a content item.

簡単のため、二つのソーシャル・メディア・アカウントおよび五つのコンテンツ項目だけが図22で示され、この例において使われているが、当業者は、異なる数のソーシャル・メディア・アカウントおよびコンテンツ項目があってもよいことを理解するであろう。たとえば、数百、数千、数万または数十万のソーシャル・メディア・アカウントおよび/またはコンテンツ項目があってもよい。 For simplicity, only two social media accounts and five content items are shown in FIG. 22 and are used in this example, but those skilled in the art have different numbers of social media accounts and content items. You will understand that it is okay. For example, there may be hundreds, thousands, tens of thousands, or hundreds of thousands of social media accounts and / or content items.

再び図21を参照するに、ブロック2110において、ソーシャル・メディア・アカウントとコンテンツとの間の基本リンク強さが計算されてもよい。各プロモーション・リンクは、それぞれのプロモーションまたは投票強さを有していてもよく、あるいはそれに関連付けられていてもよい。プロモーションまたは投票強さは、そのプロモーションの強さまたは重みの指標でありうる。すなわち、プロモーションまたは投票強さは、つながっているソーシャル・メディア・アカウントとコンテンツとの間の相互に補強する関係の強さまたは重みの指標であってもよい。たとえば、いくつかの実施形態では、基本リンク強さは、ある分野における良質なコンテンツがその分野における多くの良質な(たとえば知識のある)ソーシャル・メディア・アカウントによってプロモーションされ、特定の分野における良質なソーシャル・メディア・アカウントはその分野における良質なコンテンツをプロモーションするという前提に基づいて決定されてもよい。よって、あるソーシャル・メディア・アカウントとそのソーシャル・メディア・アカウントによってプロモーションされるコンテンツ項目との間の基本リンク強さは、そのソーシャル・メディア・アカウントに割り当てられるgtw、そのソーシャル・メディア・アカウントに割り当てられるiwおよび/またはそのコンテンツ項目のコンテンツ型に割り当てられる一般型重みに基づいて計算されてもよい。 With reference to FIG. 21 again, in block 2110, the basic link strength between the social media account and the content may be calculated. Each promotion link may have its own promotion or voting strength, or may be associated with it. A promotion or voting strength can be an indicator of the strength or weight of the promotion. That is, promotion or voting strength may be an indicator of the strength or weight of a mutually reinforcing relationship between a connected social media account and content. For example, in some embodiments, the basic link strength is that good content in one area is promoted by many good (eg, knowledgeable) social media accounts in that area, and good in a particular area. Social media accounts may be determined on the premise of promoting quality content in the field. Therefore, the basic link strength between a social media account and the content items promoted by that social media account is assigned to the gtw assigned to that social media account, to that social media account. It may be calculated based on the general type weight assigned to the content type of the iw and / or its content item.

いくつかの実施形態では、基本リンク強さは、プロモーションの適時性(timeliness)または新鮮さ(freshness)といった適時性因子を考慮に入れてもよい。たとえば、ソーシャル・メディア・アカウントuがコンテンツ項目cをプロモーションし、プロモーション・リンクが(u,c)として定義されるとすると、基本リンク強さはs(u,c)=t(u,c)*a(u)として定義されてもよい。ここで、t(u,c)はプロモーション適時性であり、a(u)はuのアカウント・スコアである。uのアカウント・スコアa(u)は、uに割り当てられた一般型重みgtw(u)およびuに割り当てられた個別重みiw(u)に依存してもよい。たとえば、アカウント・スコアa(u)は、gtw(u)*iw(u)として定義されてもよい。プロモーションの適時性t(u,c)は、早いプロモーションほど高い重みを与えるよう、単調減少関数を使って定義されてもよい。たとえば、プロモーションの適時性はt(u,c)=exp(-β*k(u,c))として定義されてもよい。ここで、βはスケーリング定数であり、k(u,c)は(u,c)がcのk番目のプロモーションであることを表わすタイムスタンプ関数である。よって、時間的により早いプロモーション(たとえば投稿)が、時間的により遅いプロモーションよりも、より高い基本リンク強さを与えられるまたは割り当てられることができる。いくつかの実施形態では、時間的により最近のプロモーションは、時間的により古いプロモーションよりも、より高い基本リンク強さを与えられるまたは割り当てられるのでもよい。いくつかの実施形態では、より新しいまたはより最近のコンテンツのプロモーションが、より古いコンテンツのプロモーションよりも、より高い基本リンク強さを与えられるまたは割り当てられるのでもよい。 In some embodiments, the basic link strength may take into account timeliness factors such as timeliness or freshness of the promotion. For example, if the social media account u promotes the content item c and the promotion link is defined as (u, c), the basic link strength is s (u, c) = t (u, c). * May be defined as a (u). Where t (u, c) is promotion timely and a (u) is u's account score. The account score a (u) of u may depend on the general type weight gtw (u) assigned to u and the individual weight iw (u) assigned to u. For example, the account score a (u) may be defined as gtw (u) * iw (u). The timeliness of the promotion t (u, c) may be defined using a monotonic decreasing function so that the earlier the promotion, the higher the weight. For example, the timeliness of a promotion may be defined as t (u, c) = exp (−β * k (u, c)). Here, β is a scaling constant, and k (u, c) is a time stamp function indicating that (u, c) is the kth promotion of c. Thus, a promotion that is faster in time (eg, a post) can be given or assigned a higher basic link strength than a promotion that is slower in time. In some embodiments, the more recent promotion in time may be given or assigned a higher basic link strength than the older promotion in time. In some embodiments, promotion of newer or more recent content may be given or assigned higher basic link strength than promotion of older content.

ブロック2112では、ソーシャル・メディア・アカウントとコンテンツとの間の調整されたリンク強さが計算されてもよい。いくつかの実施形態では、基本リンク強さは、プロモーションされたコンテンツに関連するコンテンツ型の選好(たとえばユーザー選好)に基づいて調整されてもよい。たとえば、選好因子f_pがコンテンツの異なる型のそれぞれに対して割り当てられてもよく、調整されたリンク強さがs(u,c)_new=s(u,c)*f_pとして定義されてもよい。追加的または代替的に、基本リンク強さは、リンクまたはプロモーション型(たとえばリンクの型またはプロモーションの型)に基づいて調整されてもよい。たとえば、初期のまたはもとのプロモーション(たとえばコンテンツ項目を新たに生成またはプロモーションするプロモーション)について計算された基本リンク強さが調整されて、結果として得られる調整されたリンク強さが、該初期のまたはもとのプロモーションを再プロモーションするまたは好むプロモーションの調整されたリンク強さよりも、高くなるようにされてもよい。同様に、初期のまたはもとのプロモーションをプロモーションするまたは好むプロモーションについて計算された基本リンク強さが調整されて、結果として得られる調整されたリンク強さが、該初期のまたはもとのプロモーションの調整されたリンク強さよりも、低くなるようにされてもよい。いくつかの実施形態では、初期のまたはもとのプロモーションをプロモーションするまたは好むプロモーション(たとえばツイッターの場合、リツイート)からのリンク強さのいくらかまたは一部が、初期のまたはもとのプロモーションに与えられ、あるいは移転されてもよい。たとえば、ソーシャル・メディア・アカウントuが別のソーシャル・メディア・アカウントu'によってもともと生成またはプロモーションされたコンテンツ項目cを再プロモーションするまたは好むとする。uについての調整されたリンク強さはs(u,c)_new=(1-f_t)*s(u,c)として定義されてもよく、u'についての調整されたリンク強さはs(u',c)_new=s(u',c)+(f_t*s(u,c))として定義されてもよい。ここで、f_tは移転因子である。この事例では、s(u,c)はそのリンク強さの一部を移転因子f_tによってs(u',c)に移転してもよい。いくつかの実施形態では、移転因子f_tはアドホックに割り当てられてもよい。たとえば、f_tは再プロモーションについて10%の移転または割り引き因子を示す0.1を割り当てられてもよく、f_tは再プロモーションについて10%の移転または割引因子を示す0.2を割り当てられてもよい、などとなる。同様に、f_tは初期のまたはもとのプロモーションについて10%の移転または振り込み因子を示す0.1を割り当てられてもよく、f_tは初期のまたはもとのプロモーションについて10%の移転または振り込み因子を示す0.2を割り当てられてもよい、などとなる。 At block 2112, the adjusted link strength between the social media account and the content may be calculated. In some embodiments, the basic link strength may be adjusted based on content type preferences (eg, user preferences) associated with the promoted content. For example, the preference factor f_p may be assigned to each of the different types of content, and the adjusted link strength may be defined as s (u, c) _new = s (u, c) * f_p. .. Additional or alternative, the base link strength may be adjusted based on the link or promotion type (eg, link type or promotion type). For example, the basic link strength calculated for an initial or original promotion (eg, a promotion that creates or promotes a new content item) is adjusted, and the resulting adjusted link strength is that initial. Alternatively, the original promotion may be re-promoted or made to be higher than the adjusted link strength of the desired promotion. Similarly, the base link strength calculated for a promotion that promotes or prefers an initial or original promotion is adjusted so that the resulting adjusted link strength is that of the initial or original promotion. It may be set to be lower than the adjusted link strength. In some embodiments, some or some of the link strength from the promotion or preferred promotion (eg, retweet in the case of Twitter) that promotes the initial or original promotion is given to the initial or original promotion. , Or may be relocated. For example, suppose a social media account u repromotes or prefers content item c originally generated or promoted by another social media account u'. The adjusted link strength for u may be defined as s (u, c) _new = (1-f_t) * s (u, c), and the adjusted link strength for u'is s ( It may be defined as u', c) _new = s (u', c) + (f_t * s (u, c)). Here, f_t is a transfer factor. In this case, s (u, c) may transfer part of its link strength to s (u', c) by the transfer factor f_t. In some embodiments, the transfer factor f_t may be assigned to ad hoc. For example, f_t may be assigned 0.1 for a 10% transfer or discount factor for repromotion, f_t may be assigned 0.2 for a 10% transfer or discount factor for repromotion, and so on. Similarly, f_t may be assigned 0.1 to indicate a 10% transfer or transfer factor for the initial or original promotion, and f_t may indicate a 10% transfer or transfer factor for the initial or original promotion 0.2. May be assigned, and so on.

ブロック2114では、ソーシャル・メディア・アカウントとコンテンツの相互に補強するランキングが計算されてもよい。ソーシャル・メディア・アカウントとコンテンツの相互に補強するコンテンツは、(たとえばブロック2110で計算された)ソーシャル・メディア・アカウントとコンテンツとの間の基本リンク強さおよび/または(たとえばブロック2112で計算された)ソーシャル・メディア・アカウントとコンテンツとの間の調整されたリンク強さに基づいて計算されてもよい。たとえば、ソーシャル・メディア・アカウントとコンテンツの相互に補強するランキングを計算するために、相互に補強する学習ランク付け技法が使われてもよい。 At block 2114, a mutually reinforcing ranking of social media accounts and content may be calculated. The mutually reinforcing content between the social media account and the content was calculated in the basic link strength between the social media account and the content (eg calculated in block 2110) and / or (eg in block 2112). ) It may be calculated based on the adjusted link strength between the social media account and the content. For example, mutually reinforcing learning ranking techniques may be used to calculate mutually reinforcing rankings for social media accounts and content.

当業者は、このプロセスおよび方法ならびに本稿に開示される他のプロセスおよび方法のために、それらのプロセスおよび方法において実行される機能が異なる順序で実装されてもよいことを理解するであろう。さらに、概説された段階および動作は単に例として与えられているのであって、開示される実施形態の本質を損なうことなく、段階および動作のいくつかが任意的であったり、より少数の段階および動作に組み合わされたり、あるいは追加的な段階および動作に展開されたりしてもよい。 Those skilled in the art will appreciate that for this process and method and other processes and methods disclosed herein, the functions performed in those processes and methods may be implemented in different order. Moreover, the steps and actions outlined are given merely as examples, and some of the steps and actions are optional or a smaller number of steps and actions without compromising the essence of the disclosed embodiments. It may be combined with an action or expanded into additional stages and actions.

図23は、本稿に記載される少なくとも一つの実施形態に基づく例示的システム2300を示している。システム2300は、情報を識別し、抽出するよう構成されたいかなる好適なシステム、装置またはデバイスを含んでいてもよい。システム2300は、プロセッサ2310、記憶装置2320、データ記憶部2330および通信装置2340を含んでいてもよい。これらはみな通信上結合されていてもよい。データ記憶部2330は、著作者オブジェクトおよびソーシャル・メディア・アカウント・オブジェクトのようなさまざまな型のデータを含みうる。 FIG. 23 shows an exemplary system 2300 based on at least one embodiment described herein. The system 2300 may include any suitable system, device or device configured to identify and extract information. The system 2300 may include a processor 2310, a storage device 2320, a data storage unit 2330 and a communication device 2340. All of these may be communicatively combined. The data storage unit 2330 may include various types of data such as author objects and social media account objects.

一般に、プロセッサ2310は、さまざまなコンピュータ・ハードウェアまたはソフトウェア・モジュールを含むいかなる好適な専用または汎用コンピュータ、コンピューティング・エンティティまたは処理装置を含んでいてもよく、いかなる適用可能なコンピュータ可読記憶媒体上に記憶された命令を実行するよう構成されていてもよい。たとえば、プロセッサ2310はマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)またはプログラム命令をインタープリットおよび/または実行するおよび/またはデータを処理するよう構成された他の任意のデジタルもしくはアナログ回路を含んでいてもよい。 In general, the processor 2310 may include any suitable dedicated or general purpose computer, computing entity or processing device, including various computer hardware or software modules, on any applicable computer readable storage medium. It may be configured to execute the stored instructions. For example, the processor 2310 interprets and / or executes and / or data a microprocessor, a microcontroller, a digital signal processor (DSP), an application specific integrated circuit (ASIC), a field programmable gate array (FPGA) or a program instruction. It may include any other digital or analog circuit configured to process.

図23では単一のプロセッサとして示されているが、プロセッサ2310は、本開示に記載される任意の数の動作を個々にまたは集団的に実行するよう構成された任意の数のネットワーク位置もしくは物理的位置にまたがって分散された任意の数のプロセッサを含んでいてもよい。いくつかの実施形態では、プロセッサ2310は、プログラム命令をインタープリットおよび/または実行するおよび/またはメモリ2320、データ記憶部2330またはメモリ2320とデータ記憶部2330に記憶されたデータを処理することを行なってもよい。いくつかの実施形態では、プロセッサ2310はデータ記憶部2330からプログラム命令を取ってきて、該プログラム命令をメモリ2320にロードしてもよい。 Although shown as a single processor in FIG. 23, the processor 2310 may be any number of network locations or physics configured to perform any number of operations described herein individually or collectively. It may include any number of processors distributed across target locations. In some embodiments, the processor 2310 interprets and / or executes program instructions and / or processes data stored in memory 2320, data storage 2330 or memory 2320 and data storage 2330. You may. In some embodiments, the processor 2310 may fetch a program instruction from the data storage unit 2330 and load the program instruction into the memory 2320.

プログラム命令がメモリ2320にロードされた後、プロセッサ2310はプログラム命令、たとえばそれぞれ図2、図6、図19、図20、図3、図4、図5、図7、図8、図9、図10、図11、図12、図13、図14、図16、図17、図18および図21のフロー200、600、1900および/または2000および/または方法300、400、500、700、800、900、1000、1100、1200、1300、1400、1600、1700、1800および/または2100を実行してもよい。たとえば、プロセッサ2310はそれぞれ刊行物システムおよびソーシャル・メディア・システムからの情報を使って、著作者オブジェクトおよびソーシャル・メディア・アカウント・オブジェクトを生成してもよい。プロセッサ2310は、著作者オブジェクトおよびソーシャル・メディア・アカウント・オブジェクトからの情報を比較して、著作者オブジェクトからの著作者に関連付けられたソーシャル・メディア・アカウントを識別してもよい。 After the program instructions are loaded into the memory 2320, the processor 2310 will use the program instructions, eg, FIGS. 2, 6, 19, 20, 3, 3, 4, 5, 7, 7, 9, 9, respectively. 10, FIG. 11, FIG. 12, FIG. 13, FIG. 14, FIG. 16, FIG. 17, FIGS. 18 and 21 flows 200, 600, 1900 and / or 2000 and / or method 300, 400, 500, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1600, 1700, 1800 and / or 2100 may be executed. For example, processor 2310 may use information from the publication system and social media system to generate author objects and social media account objects, respectively. Processor 2310 may compare information from the author object and the social media account object to identify the social media account associated with the author from the author object.

メモリ2320およびデータ記憶部2330は、コンピュータ実行可能な命令またはデータ構造を担持するまたは記憶する一つまたは複数のコンピュータ可読記憶媒体を含んでいてもよい。そのようなコンピュータ可読記憶媒体は、プロセッサ2310のような汎用または特殊目的コンピュータによってアクセスされうるいかなる利用可能な媒体を含んでいてもよい。 The memory 2320 and the data storage unit 2330 may include one or more computer-readable storage media that carry or store computer-executable instructions or data structures. Such computer-readable storage media may include any available medium accessible by a general purpose or special purpose computer such as processor 2310.

限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、電気的に消去可能なプログラム可能型読み出し専用メモリ(EEPROM)、コンパクトディスク読み出し専用メモリ(CD-ROM)または他の光ディスク記憶、磁気ディスク記憶または他の磁気記憶デバイス、フラッシュメモリ・デバイス(たとえば半導体メモリ・デバイス)またはコンピュータ実行可能な命令またはデータ構造の形で所望されるプログラム・コードを担持または記憶するために使用されうる、汎用または特殊目的コンピュータによってアクセスされうる他の任意の記憶媒体を含む、非一時的なコンピュータ可読記憶媒体を含んでいてもよい。上記のものの組み合わせも、コンピュータ可読記憶媒体の範囲内に含まれうる。コンピュータ実行可能な命令はたとえば、プロセッサ2310に、ある動作または動作群を実行させるよう構成された命令およびデータを含んでいてもよい。 As an example, but not limited to, such computer-readable storage media include random access memory (RAM), read-only memory (ROM), electrically erasable programmable read-only memory (EEPROM), and compact disk read. Dedicated memory (CD-ROM) or other optical disk storage, magnetic disk storage or other magnetic storage device, flash memory device (eg semiconductor memory device) or computer-executable instruction or desired program in the form of a data structure. It may include non-temporary computer-readable storage media, including any other storage medium that can be used to carry or store the code and that can be accessed by a general purpose or special purpose computer. Combinations of the above may also be included within the scope of computer readable storage media. Computer-executable instructions may include, for example, instructions and data configured to cause the processor 2310 to perform an operation or group of operations.

通信ユニット2340は、ネットワークを通じて情報を送信または受信するよう構成された任意のコンポーネント、装置、システムまたはそれらの組み合わせを含みうる。いくつかの実施形態では、通信ユニット2340は、他の位置、同じ位置にある他の装置、またはさらには同じシステム内の他のコンポーネントと通信してもよい。たとえば、通信ユニット2340は、モデム、ネットワーク・カード(無線または有線)、赤外線通信装置、光通信装置、無線通信装置(たとえばアンテナ)および/またはチップセット(たとえばブルートゥース装置、802.6装置(たとえば都市圏ネットワーク(MAN))、Wi-Fi装置、WiMAX装置、セルラー通信設備および/またはその他)などを含んでいてもよい。通信ユニット2340は、本開示に記載されるネットワークおよび/または他の任意の装置もしくはシステムとデータが交換されることを許容してもよい。たとえば、通信ユニット2340は、システム2300が、図1の刊行物システム120、ソーシャル・メディア・システム130、装置140およびウェブ・ホスティング・システム150のような他のシステムと通信することを許容しうる。 The communication unit 2340 may include any component, device, system or combination thereof configured to transmit or receive information over the network. In some embodiments, the communication unit 2340 may communicate with other locations, other devices at the same location, or even other components within the same system. For example, the communication unit 2340 may include a modem, network card (wireless or wired), infrared communication device, optical communication device, wireless communication device (eg antenna) and / or chipset (eg bluetooth device, 802.6 device (eg urban network)). (MAN)), Wi-Fi equipment, WiMAX equipment, cellular communication equipment and / or others) and the like. Communication unit 2340 may allow data to be exchanged with the network and / or any other device or system described in this disclosure. For example, communication unit 2340 may allow system 2300 to communicate with other systems such as publication system 120, social media system 130, device 140 and web hosting system 150 of FIG.

本開示の範囲から外れることなく、システム2300に修正、追加または省略がなされてもよい。たとえば、データ記憶部2330は、複数の位置に位置しており、ネットワークを通じてプロセッサ2310によってアクセスされる、複数の異なる記憶媒体であってもよい。 Modifications, additions or omissions may be made to System 2300 without departing from the scope of the present disclosure. For example, the data storage unit 2330 may be a plurality of different storage media located at a plurality of positions and accessed by the processor 2310 through the network.

上記のように、本稿に記載される実施形態は、下記でより詳細に論じるような、さまざまなコンピュータ・ハードウェアまたはソフトウェア・モジュールを含む特殊目的または汎用のコンピュータ(たとえば図23のプロセッサ2310)の使用を含んでいてもよい。さらに上記で示したように、本稿に記載される実施形態は、コンピュータ実行可能命令またはデータ構造を担持または記憶しているコンピュータ可読媒体(たとえば図23のメモリ2320またはデータ記憶部2330)を使って実装されてもよい。 As mentioned above, the embodiments described herein are of special purpose or general purpose computers (eg, processor 2310 in FIG. 23), including various computer hardware or software modules, as discussed in more detail below. May include use. Further, as indicated above, the embodiments described herein use a computer-readable medium carrying or storing computer executable instructions or data structures (eg, memory 2320 or data storage 2330 in FIG. 23). It may be implemented.

本開示での用法では、用語「モジュール」または「コンポーネント」は、該モジュールまたはコンポーネントのアクションを実行するよう構成された特定のハードウェア実装および/またはコンピューティング・システムの汎用ハードウェア(たとえばコンピュータ可読媒体、処理装置および/またはその他)に記憶および/または実行さうれるソフトウェア・オブジェクトまたはソフトウェア・ルーチンを指しうる。いくつかの実施形態では、本稿に記載される種々のコンポーネント、モジュール、エンジンおよびサービスは、(たとえば別個のスレッドとして)コンピューティング・システム上で実行されるオブジェクトまたはプロセスとして実装されてもよい。本稿に記載されるシステムおよび方法のいくつかは、一般に、(汎用ハードウェアに記憶および/または実行される)ソフトウェアで実装されるものとして記述されるが、個別のハードウェア実装またはソフトウェアと個別のハードウェア実装の組み合わせも可能であり、考えられている。本開示において、「コンピューティング・エンティティ」は、本稿で先に定義したような任意のコンピューティング・システムまたはコンピューティング・システム上で走る任意のモジュールもしくはモジュールの組み合わせでありうる。 As used in the present disclosure, the term "module" or "component" refers to general-purpose hardware (eg, computer-readable) of a particular hardware implementation and / or computing system that is configured to perform the actions of that module or component. It can refer to a software object or software routine stored and / or executed in a medium, processor and / or other). In some embodiments, the various components, modules, engines and services described herein may be implemented as objects or processes running on a computing system (eg, as separate threads). Some of the systems and methods described in this article are generally described as being implemented in software (stored and / or executed in general purpose hardware), but are separate hardware implementations or software. A combination of hardware implementations is also possible and is considered. In the present disclosure, a "computing entity" can be any computing system as defined earlier in this article or any module or combination of modules running on a computing system.

本稿および特に付属の請求項(たとえば付属の請求項の本文)において使われる用語は一般に「オープン」な用語として意図されている(たとえば、用語「含む」は「含むがそれに限られない」と解釈されるべきであり、用語「もつ」は「少なくとも…をもつ」と解釈されるべきであり、用語「含む」は「含むがそれに限られない」と解釈されるべきであるなど)。 The terms used in this article and in particular in the annexed claims (eg, the body of the annexed claims) are generally intended as "open" terms (eg, the term "contains" is interpreted as "contains, but not limited to". The term "have" should be interpreted as "having at least ..." and the term "include" should be interpreted as "include but not limited to").

さらに、導入される請求項の記載の特定の数が意図される場合、そのような意図は請求項において明示的に記載される。そのような記載のない場合には、そのような意図はない。たとえば、理解の助けとして、以下の付属の請求項は、請求項の記載を導入するために「少なくとも一つの」および「一つまたは複数の」という導入句の使用を含むことがありうる。しかしながら、たとえ同じ請求項が導入句「一つまたは複数の」または「少なくとも一つの」および「a」または「an」のような不定冠詞を含むときでも、そのような句の使用は、不定冠詞「a」または「an」による請求項の記載の導入が、そのように導入された請求項の記載を含む何らかの特定の請求項を、そのような記載を一つだけ含む実施形態に限定することを含意していると解釈されるべきではない(たとえば、「a」および/または「an」は、「少なくとも一つの」または「一つまたは複数の」を意味するものと解釈されるべきである)。同じことは、請求項の記載を導入する定冠詞の使用についても成り立つ。 Further, if a particular number of claims are intended to be introduced, such intent is expressly stated in the claims. Without such a statement, there is no such intention. For example, to aid understanding, the accompanying claims below may include the use of the introductory phrases "at least one" and "one or more" to introduce the claims statement. However, even when the same claim contains indefinite articles such as the introductory phrase "one or more" or "at least one" and "a" or "an", the use of such clauses is an indefinite article. The introduction of a claim statement by "a" or "an" limits any particular claim containing such introduced claim statement to embodiments that include only one such statement. Should not be construed as implying (eg, "a" and / or "an" should be construed to mean "at least one" or "one or more". ). The same is true for the use of definite articles that introduce claims.

さらに、たとえ導入される請求項の記載の特定の数が明示的に記載されていたとしても、当業者は、そのような記載が、少なくともその記載された数を意味すると解釈されるべきであることを認識するであろう(たとえば、他の修飾語なしで単に「二つの記載」という記載は、少なくとも二つの記載または二つ以上の記載を意味する)。さらに、「A、BおよびCなどのうちの少なくとも一つ」または「A、BおよびCなどの一つまたは複数」に類似する慣用句が使われる事例においては、一般に、そのような構文はAだけ、Bだけ、Cだけ、AおよびB両方、AおよびC両方、BおよびC両方またはA、BおよびC全部などを含むことが意図される。 Further, even if a particular number of claims to be introduced is explicitly stated, one of ordinary skill in the art should be construed to mean such statement at least the stated number. You will recognize that (for example, the statement "two statements" without other modifiers means at least two statements or more than one statement). Moreover, in cases where idioms similar to "at least one of A, B and C, etc." or "one or more of A, B, C, etc." are used, such a syntax is generally A. Only, B only, C only, both A and B, both A and C, both B and C or all of A, B and C, etc. are intended to be included.

さらに、明細書であれ請求項であれ図面であれ、二つ以上の代替的な用語を呈示するあらゆる離接的な語句は、該用語の一つを含む、該用語のいずれかを含むまたは該用語の両方を含む可能性を考えているものと理解されるべきである。たとえば、「AまたはB」という句は、「A」または「B」または「AおよびB」の可能性を含むと理解されるべきである。 In addition, any distant phrase presenting two or more alternative terms, whether in the specification, claims or drawings, comprises one of the terms, comprises any of the terms, or said. It should be understood that we are considering the possibility of including both terms. For example, the phrase "A or B" should be understood to include the possibility of "A" or "B" or "A and B".

本稿に記載されるすべての例および条件付きの言辞は、本発明および発明者によって当技術分野の発展のために寄与される概念の理解において読者を助ける教育目的を意図されており、そのような特定的に挙げられる例および条件に限定することなく解釈されるものとする。本開示の実施形態について詳細に述べてきたが、本開示の精神および範囲から外れることなく、これにさまざまな変化、代替および変更をなすことができることは理解しておくべきである。 All examples and conditional language contained herein are intended for educational purposes to assist the reader in understanding the concepts contributed by the present invention and the inventor to the development of the art. It shall be construed without limitation to specific examples and conditions. Although the embodiments of the present disclosure have been described in detail, it should be understood that various changes, alternatives and changes can be made to this without departing from the spirit and scope of the present disclosure.

以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
ソーシャル・メディア・アカウントとコンテンツとの間の相互に補強する関係に基づいてソーシャル・メディア・アカウントおよびコンテンツをランク付けするコンピュータ実装される方法であって:
複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについて一般型重みを決定する段階であって、前記一般型重みは、そのソーシャル・メディア・アカウントに対応するソーシャル・メディア・アカウント型に基づく、段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての個別重みを決定する段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツとの間の相互に補強する関係をエンコードする段階であって、前記相互に補強する関係は、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツのコンテンツ項目との間のプロモーション・リンクとしてエンコードされる、段階と;
基本リンク強さを計算する段階であって、基本リンク強さは各プロモーション・リンクについて計算され、該基本リンク強さは複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記一般型重みと、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記個別重みとに基づく、段階と;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキングを、前記基本リンク強さに基づいて計算する段階とを含む、
方法。
(付記2)
前記基本リンク強さはさらにプロモーション適時性に基づく、付記1記載の方法。
(付記3)
前記プロモーション適時性は単調減少関数を含む、付記2記載の方法。
(付記4)
調整されたリンク強さを計算する段階であって、各プロモーション・リンクについての調整されたリンク強さは、そのプロモーション・リンクについて計算された前記基本リンク強さの調整である、段階と;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの前記相互に補強するランキングを、前記調整されたリンク強さに基づいて計算する段階とをさらに含む、
付記1記載の方法。
(付記5)
前記調整されたリンク強さが選好因子に基づく、付記4記載の方法。
(付記6)
前記調整されたリンク強さがプロモーションの型に基づく、付記4記載の方法。
(付記7)
前記調整されたリンク強さが移転因子に基づく、付記4記載の方法。
(付記8)
一つまたは複数のプロセッサによって実行されたときに動作を実行するおよび/またはその実行を制御するよう構成されている命令を含んでいる非一時的なコンピュータ可読媒体であって、前記動作は:
複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについて一般型重みを決定する段階であって、前記一般型重みは、そのソーシャル・メディア・アカウントに対応するソーシャル・メディア・アカウント型に基づく、段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての個別重みを決定する段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツとの間の相互に補強する関係をエンコードする段階であって、前記相互に補強する関係は、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツのコンテンツ項目との間のプロモーション・リンクとしてエンコードされる、段階と;
基本リンク強さを計算する段階であって、基本リンク強さは各プロモーション・リンクについて計算され、該基本リンク強さは複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記一般型重みと、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記個別重みとに基づく、段階と;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキングを、前記基本リンク強さに基づいて計算する段階とを含む、
コンピュータ可読媒体。
(付記9)
前記基本リンク強さはさらにプロモーション適時性に基づく、付記8記載のコンピュータ可読媒体。
(付記10)
前記プロモーション適時性は単調減少関数を含む、付記9記載のコンピュータ可読媒体。
(付記11)
前記動作がさらに:
前記基本リンク強さを調整し;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの前記相互に補強するランキングを、調整された基本リンク強さに基づいて計算することをさらに含む、
付記8記載のコンピュータ可読媒体。
(付記12)
前記基本リンク強さの調整が選好因子に基づく、付記11記載のコンピュータ可読媒体。
(付記13)
前記基本リンク強さの調整がプロモーションの型に基づく、付記11記載のコンピュータ可読媒体。
(付記14)
前記基本リンク強さの調整が移転因子に基づく、付記11記載のコンピュータ可読媒体。
(付記15)
一つまたは複数のソーシャル・メディア・サーバー;および
一つまたは複数のプロセッサと、前記一つまたは複数のプロセッサによって実行されたときに動作を実行するおよび/またはその実行を制御するよう構成されている命令を含んでいる非一時的なコンピュータ可読媒体とを含むコンピューティング装置を有するシステムであって、
前記動作は:
複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについて一般型重みを決定する段階であって、前記一般型重みは、そのソーシャル・メディア・アカウントに対応するソーシャル・メディア・アカウント型に基づく、段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての個別重みを決定する段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツとの間の相互に補強する関係をエンコードする段階であって、前記相互に補強する関係は、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツのコンテンツ項目との間のプロモーション・リンクとしてエンコードされる、段階と;
基本リンク強さを計算する段階であって、基本リンク強さは各プロモーション・リンクについて計算され、該基本リンク強さは複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記一般型重みと、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記個別重みとに基づく、段階と;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキングを、前記基本リンク強さに基づいて計算する段階とを含む、
システム。
(付記16)
前記基本リンク強さはさらに、単調減少関数を含むプロモーション適時性に基づく、付記15記載のシステム。
(付記17)
前記動作がさらに:
前記基本リンク強さを調整し;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの前記相互に補強するランキングを、調整された基本リンク強さに基づいて計算することをさらに含む、
付記15記載のシステム。
(付記18)
前記基本リンク強さの調整が選好因子に基づく、付記17記載のシステム。
(付記19)
前記基本リンク強さの調整がプロモーションの型に基づく、付記17記載のシステム。
(付記20)
前記基本リンク強さの調整が移転因子に基づく、付記17記載のシステム。
The following additional notes will be further disclosed with respect to the embodiments including the above embodiments.
(Appendix 1)
A computer-implemented way to rank social media accounts and content based on the mutually reinforcing relationships between social media accounts and content:
At the stage of determining the general type weight for each social media account of a plurality of social media accounts, the general type weight is based on the social media account type corresponding to the social media account. With stages;
At the stage of determining the individual weight for each social media account of the multiple social media accounts;
At the stage of encoding the mutually reinforcing relationship between each social media account of the plurality of social media accounts and the content promoted by each social media account of the plurality of social media accounts. The mutually reinforcing relationship is the content item of the content promoted by each social media account of the plurality of social media accounts and each social media account of the plurality of social media accounts. Encoded as a promotional link between and with the stage;
At the stage of calculating the basic link strength, the basic link strength is calculated for each promotion link, and the basic link strength is the general type for each social media account of multiple social media accounts. Stages based on the weights and the individual weights for each social media account of the plurality of social media accounts;
Including the step of calculating the mutually reinforcing ranking of the plurality of social media accounts and contents based on the basic link strength.
Method.
(Appendix 2)
The method described in Appendix 1 is based on the timeliness of promotion as the basic link strength.
(Appendix 3)
The method according to Appendix 2, wherein the promotion timeliness includes a monotonically decreasing function.
(Appendix 4)
At the stage of calculating the adjusted link strength, the adjusted link strength for each promotion link is the adjustment of the basic link strength calculated for that promotion link.
Further including the step of calculating the mutually reinforcing ranking of the plurality of social media accounts and content based on the adjusted link strength.
The method described in Appendix 1.
(Appendix 5)
The method of Appendix 4, wherein the adjusted link strength is based on a preference factor.
(Appendix 6)
The method according to Appendix 4, wherein the adjusted link strength is based on the type of promotion.
(Appendix 7)
The method according to Appendix 4, wherein the adjusted link strength is based on a transfer factor.
(Appendix 8)
A non-temporary computer-readable medium containing instructions that are configured to perform and / or control the execution when executed by one or more processors, said operation:
At the stage of determining the general type weight for each social media account of a plurality of social media accounts, the general type weight is based on the social media account type corresponding to the social media account. With stages;
At the stage of determining the individual weight for each social media account of the multiple social media accounts;
At the stage of encoding the mutually reinforcing relationship between each social media account of the plurality of social media accounts and the content promoted by each social media account of the plurality of social media accounts. The mutually reinforcing relationship is the content item of the content promoted by each social media account of the plurality of social media accounts and each social media account of the plurality of social media accounts. Encoded as a promotional link between and with the stage;
At the stage of calculating the basic link strength, the basic link strength is calculated for each promotion link, and the basic link strength is the general type for each social media account of multiple social media accounts. Stages based on the weights and the individual weights for each social media account of the plurality of social media accounts;
Including the step of calculating the mutually reinforcing ranking of the plurality of social media accounts and contents based on the basic link strength.
Computer readable medium.
(Appendix 9)
The computer-readable medium according to Appendix 8, wherein the basic link strength is further based on promotion timeliness.
(Appendix 10)
The computer-readable medium according to Appendix 9, wherein the promotion timeliness includes a monotonically decreasing function.
(Appendix 11)
The above operation is further:
Adjust the basic link strength;
Further comprising calculating said mutually reinforcing rankings of said multiple social media accounts and content based on adjusted base link strength.
The computer-readable medium described in Appendix 8.
(Appendix 12)
The computer-readable medium according to Appendix 11, wherein the adjustment of the basic link strength is based on a preference factor.
(Appendix 13)
The computer-readable medium according to Appendix 11, wherein the adjustment of the basic link strength is based on the type of promotion.
(Appendix 14)
The computer-readable medium according to Appendix 11, wherein the adjustment of the basic link strength is based on a transfer factor.
(Appendix 15)
One or more social media servers; and one or more processors and configured to perform and / or control the execution of operations when executed by the one or more processors. A system with a computing device that includes a non-temporary computer-readable medium containing instructions.
The operation is:
At the stage of determining the general type weight for each social media account of a plurality of social media accounts, the general type weight is based on the social media account type corresponding to the social media account. With stages;
The stage of determining the individual weight for each social media account of the multiple social media accounts;
At the stage of encoding the mutually reinforcing relationship between each social media account of the plurality of social media accounts and the content promoted by each social media account of the plurality of social media accounts. The mutually reinforcing relationship is the content item of the content promoted by each social media account of the plurality of social media accounts and each social media account of the plurality of social media accounts. Encoded as a promotional link between and with the stage;
At the stage of calculating the basic link strength, the basic link strength is calculated for each promotion link, and the basic link strength is the general type for each social media account of multiple social media accounts. Stages based on the weights and the individual weights for each social media account of the plurality of social media accounts;
Including the step of calculating the mutually reinforcing ranking of the plurality of social media accounts and contents based on the basic link strength.
system.
(Appendix 16)
The system according to Appendix 15, wherein the basic link strength is further based on promotion timeliness, including a monotonically decreasing function.
(Appendix 17)
The above operation is further:
Adjust the basic link strength;
Further comprising calculating said mutually reinforcing rankings of said multiple social media accounts and content based on adjusted base link strength.
The system according to Appendix 15.
(Appendix 18)
The system according to Appendix 17, wherein the adjustment of the basic link strength is based on a preference factor.
(Appendix 19)
The system according to Appendix 17, wherein the adjustment of the basic link strength is based on the type of promotion.
(Appendix 20)
The system according to Appendix 17, wherein the adjustment of the basic link strength is based on a transfer factor.

110 情報収集システム
112 データ記憶部
114 著作者オブジェクト
116 ソーシャル・メディア・アカウント・オブジェクト
118 個人ウェブページ・オブジェクト
140 装置
142 ディスプレイ
150 ウェブ・ホスティング・システム
120 刊行物システム
130 ソーシャル・メディア・システム

210 デジタル文書を取得
212 デジタル文書
220 著作者プロフィール・データおよびトピックを抽出
222 著作者オブジェクト
230 ソーシャル・メディアを検索
232 ソーシャル・メディア・アカウント
240 ソーシャル・メディア・プロフィール・データおよびトピックを抽出
242 ソーシャル・メディア・アカウント・オブジェクト
250 ソーシャル・メディア・オブジェクトと著作者オブジェクトを比較してスコアを生成
252 名前スコア
254 プロフィール・スコア
256 コンテンツ・スコア
258 相互作用スコア
260 一致を判別

302 デジタル文書を取得
304 トピックを判別
306 諸著作者を判別
308 著作者を選択
310 著作者メタデータを取得
312 ソーシャル・メディアを選択
314 ソーシャル・メディアを検索
316 ソーシャル・メディア・アカウントを選択
318 ソーシャル・メディア・アカウント・メタデータを取得
320 スコアを生成
322 他のソーシャル・メディア・アカウント?
324 著作者がソーシャル・メディア・アカウントの所有者であるかどうかをスコアに基づいて判定
326 他のソーシャル・メディア?
328 他の著作者?
330 新規投稿を抽出
332 情報を組織化
334 組織化された情報を提供

402 複数のデジタル文書の各著作者について、データベースにおいて著作者オブジェクトを生成
404 あるソーシャル・メディアにおける諸ソーシャル・メディア・アカウントの指示を、そのソーシャル・メディアにおける著作者オブジェクト内の著作者の名前の検索に基づいて取得
406 著作者オブジェクトからの名前と、ソーシャル・メディア・アカウントに基づいて生成されたソーシャル・メディア・アカウント・オブジェクトからのソーシャル・メディア名前との比較に基づいて名前スコアを生成
408 著作者オブジェクトからの著作者プロフィール・データと、ソーシャル・メディア・アカウント・オブジェクトからのソーシャル・メディア・プロフィール・データとの比較に基づいてプロフィール・スコアを生成
410 ソーシャル・メディア・アカウントでの投稿からのトピックと、著作者オブジェクトからの著作者に関連付けられたデジタル文書のそれぞれについてのトピックとの比較に基づいてコンテンツ・スコアを生成
412 ソーシャル・メディア・アカウントにおけるソーシャルつながりと、著作者オブジェクトからの著作者に関連付けられたデジタル文書のそれぞれについての共著者との評価に基づいて相互作用スコアを生成
414 そのソーシャル・メディア・アカウントがその著作者オブジェクトの著作者に関連しているかどうかを、名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコアに基づいて判定
416 各著作者オブジェクトの著作者に関連したソーシャル・メディア・アカウントからの新規投稿からデータを抽出
418 該データをデジタル文書のトピックに基づく編成において提供

502 複数のデジタル文書の各著作者についてデータベースにおいて著作者オブジェクトを生成
504 あるソーシャル・メディアにおける諸ソーシャル・メディア・アカウントの指示を、前記ソーシャル・メディアにおける著作者オブジェクト内の著作者の名前の検索に基づいて取得
506 そのソーシャル・メディア・アカウントがその著作者オブジェクトの著作者に関連しているかどうかを、名前スコア、プロフィール・スコア、コンテンツ・スコアおよび相互作用スコアのうち二つ以上に基づいて判定

610 デジタル文書を取得
612 デジタル文書
620 著作者プロフィール・データおよびトピックを抽出
622 著作者オブジェクト
630 ソーシャル・メディアを検索
632 ソーシャル・メディア・アカウント
640 ソーシャル・メディア・プロフィールのデータおよび写真を抽出
642 ソーシャル・メディア・アカウント・オブジェクト
650 個人学術ウェブページを検索
652 個人学術ウェブページ
660 個人学術ウェブページのデータおよび写真を抽出
662 個人学術ウェブページ・オブジェクト
670 ソーシャル・メディア・オブジェクトと個人学術ウェブページを相互検証
671 URL一致
672 ソーシャル・メディア・アカウント一致
673 写真一致
674 キーワード一致
675 リンクされたソーシャル・メディア・キーワード一致
680 一致を判別

710 データベースにおいて著作者オブジェクトを生成
720 著作者について個人学術ウェブページ候補を取得
730 該著作者についてソーシャル・メディア・アカウント候補を取得
740 一つの個人学術ウェブページ候補と一つのソーシャル・メディア・アカウントを、その著作者に関連しているとして相互検証
750 さらなる著作者?
760 諸著作者の諸ソーシャル・メディア・アカウントからソーシャル・メディア投稿を抽出
770 前記データをトピックに基づく編成で提供

810 著作者の名前に基づいて個人学術ウェブページに対する第一の検索を実行
820 著作者の名前および著作者の所属に基づいて個人学術ウェブページに対する第二の検索を実行
830 第一の検索および第二の検索からの結果をマージ
840 テンプレートに基づいて個々のプロフィール・ページを識別
850 結果をパースして、結果を個人学術ウェブページとして識別
860 さらなる結果?

905 ウェブページ結果を解析
910 ウェブページを取得
915 ウェブページのコードを、情報ブロックを識別するために解析
920 情報ブロックからキーワードを抽出
925 抽出されたキーワードに基づいてキーワード・スコアを生成
930 前記結果のアンカー・テキストを解析
935 結果ウェブページ内でアンカー・テキストを識別
940 結果ウェブページ内のアンカー・テキストを検索
945 前記アンカー・テキストと前記著作者に一致する前記アンカー・テキスト内の名前とに基づいて、アンカー・テキスト・スコアを生成
950 前記結果のURLを解析
955 URLを断片に分割
960 名前またはキーワードを求めて断片を検索
965 断片内の名前およびキーワードに基づいてURLスコアを生成
970 キーワード・スコア、アンカー・テキスト・スコアおよびURLスコアに基づいて、前記結果を範疇分け
975 前記結果は個人学術ウェブページか?
980 結果を個人学術ウェブページ候補に追加

1010 ソーシャル・メディア・アカウント候補のプロフィールを取得
1020 プロフィール内のURLを識別
1030 個人学術ウェブページ候補のURLをプロフィール中のURLと比較
1040 一致あり?
1050 別の個人学術ウェブページ候補があるか?
1060 その個人学術ウェブページ候補およびそのソーシャル・メディア・アカウント候補が両方とも前記著作者に関連していると確認

1110 個人学術ウェブページ候補を取得
1120 個人学術ウェブページ候補をパースしてソーシャル・メディア・アカウントを識別
1130 識別されたソーシャル・メディア・アカウントを諸ソーシャル・メディア・アカウント候補と比較
1140 一致あり?
1150 その個人学術ウェブページ候補とそのソーシャル・メディア・アカウント候補が両方とも当該著作者に関連していると確認

1210 個人学術ウェブページ候補を取得
1220 個人学術ウェブページ候補をパースして第一写真を抽出
1230 ソーシャル・メディア・アカウント候補のプロフィールを取得
1240 プロフィールをパースして第二写真を抽出
1250 第一写真と第二写真を比較
1260 一致あり?
1270 さらなるソーシャル・メディア・アカウント候補があるか?
1280 個人学術ウェブページ候補とソーシャル・メディア・アカウント候補が両方とも当該著作者に関連していると確認

1310 個人学術ウェブページ候補を取得
1320 個人学術ウェブページ候補のコードをパースして情報ブロックを識別
1330 情報ブロックからキーワードを抽出
1340 ソーシャル・メディア・アカウント候補のプロフィールを取得
1350 抽出されたキーワードをプロフィール内のテキストと比較
1360 それらのワードが類似性閾値を超えるか?
1370 さらなるソーシャル・メディア・アカウント候補があるか?
1380 個人学術ウェブページ候補とソーシャル・メディア・アカウント候補が両方とも当該著作者に関連していると確認

1410 個人学術ウェブページ候補を取得
1420 個人学術ウェブページ候補のコードをパースして情報ブロックを識別
1430 情報ブロックからキーワードを抽出
1440 あるソーシャル・メディア・アカウント候補にリンクされた諸ソーシャル・メディア・アカウントのプロフィールを取得
1450 抽出されたキーワードを、リンクされたソーシャル・メディア・アカウントのプロフィール内のテキストと比較
1460 それらのワードが類似性閾値を超えるか?
1470 さらなるソーシャル・メディア・アカウント候補があるか?
1480 個人学術ウェブページ候補とソーシャル・メディア・アカウント候補が両方とも当該著作者に関連していると確認

1520 第一の候補集合
1510 シード
1530 第二の候補集合

1602 シード・ソーシャル・メディア・アカウントを取得
1604 シード・ソーシャル・メディア・アカウントについて、ソーシャル・メディア・アカウント・プロフィールを取得
1606 シード・ソーシャル・メディア・アカウントによってフォローされているソーシャル・メディア・アカウントの第一の集合を抽出
1608 前記第一の集合のソーシャル・メディア・アカウントをシード・ソーシャル・メディア・アカウントと比較
1610 ソーシャル・メディア・アカウントの前記第一の集合にはいっているが前記シード・ソーシャル・メディア・アカウントにははいっていないソーシャル・メディア・アカウントの第一の候補集合を構築
1612 一般的ソーシャル・メディア・アカウントを除去
1614 前記第一の候補集合の候補ソーシャル・メディア・アカウントを解析して、ソーシャル・メディア・アカウントの型を判別
1616 候補ソーシャル・メディア・アカウントは知識のあるソーシャル・メディア・アカウントか?
1618 候補ソーシャル・メディア・アカウントをシード・ソーシャル・メディア・アカウントとして追加
1620 さらなる第一の候補ソーシャル・メディア・アカウント?
1622 シード・ソーシャル・メディア・アカウントをフォローしているソーシャル・メディア・アカウントの第二の集合を抽出
1624 ソーシャル・メディア・アカウントの前記第二の集合にはいっているが前記シード・ソーシャル・メディア・アカウントにははいっていないソーシャル・メディア・アカウントの第二の候補集合を構築
1626 一般的ソーシャル・メディア・アカウントを除去
1628 候補アカウントに関連している名前を取得
1630 名前か人物名かを判定
1632 候補としては除去
1634 関心スコアを同定
1636 関心スコアが閾値より上か?
1638 候補ソーシャル・メディア・アカウントをソーシャル・メディア・アカウントの第二の集合に追加
1640 さらなる第二の候補ソーシャル・メディア・アカウントがあるか?
1642 さらなるシード・ソーシャル・メディア・アカウント?
1644 シード・ソーシャル・メディア・アカウントと前記第二の集合のソーシャル・メディア・アカウントに異なるコンテンツを提供

1705 ソーシャル・メディア・アカウントの名前を取得
1710 組織か人物名かを判定
1715 刊行物の著作者データベースと比較
1720 一致?
1725 知識のあるアカウントとして範疇分け
1730 関心スコアを同定
1735 スコアが閾値を超えているか?
1740 候補としては除去

1810 候補ソーシャル・メディア・アカウント・プロフィールを取得
1820 候補ソーシャル・メディア・アカウントのグローバル・フォロワーの第一の数を計数
1830 シード・ソーシャル・メディア・アカウントおよび前記第一の集合のソーシャル・メディア・アカウントであって当該候補ソーシャル・メディア・アカウントをフォローしているものを含む候補ソーシャル・メディア・アカウントのローカル・フォロワーの第二の数を計数
1840 トピック関連性スコアを生成
1850 関連性スコアが閾値より上か?
1860 候補ソーシャル・メディア・アカウントを候補、学習者アカウントおよび/またはシード・アカウントとしては除去

1910 拡張アカウントをセンサーとして取得
1920 ソーシャル・メディア・アカウントから生成、共有および/またはコメントされた最近のコンテンツを抽出し、総合
1930 さまざまなソーシャル・メディア・アカウント型を判別
1940 ソーシャル・メディア・アカウント型に基づく、ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキング

2002 ソーシャル・メディア・アカウント
2010 アカウント・プロフィールを取得
2020 アカウント・プロフィール中の名前を抽出
2022 アカウント・プロフィール中の名前を検査
2024 名前特徴
2030 アカウント・プロフィール中の写真を抽出
2032 アカウント・プロフィール中の写真を検査
2034 写真特徴
2040 アカウント・プロフィール中の記述を抽出
2042 アカウント・プロフィール中の記述を検査
2044 記述特徴
2050 アカウント・プロフィール中のリンクURLを抽出
2052 アカウント・プロフィール中のリンクURLを検査
2054 プロフィールURL特徴
2060 最近のソーシャル・メディア・コンテンツを取得
2070 テキスト・コンテンツを抽出
2072 コンテンツ中のテキストを検査
2074 コンテンツ・テキスト特徴
2080 リンクURLを抽出
2072 コンテンツ中のリンクURLを検査
2074 コンテンツURL特徴
2090 機械学習ツール
2092 ソーシャル・メディア・アカウント型

2102 各アカウントについてアカウント型に基づいて一般型重み(gtw)を決定
2104 各アカウントについてそのアカウント信用に基づいて個別重み(iw)を決定
2106 各コンテンツ型についてユーザー選好に基づいて一般型重みを決定
2108 アカウントとコンテンツの間の相互に補強する関係をエンコード
2110 アカウントとコンテンツの間の基本リンク強さを計算
2112 アカウントとコンテンツの間の調整されたリンク強さを計算
2114 アカウントおよびコンテンツの相互に補強するランキングを計算

2300 システム
2310 プロセッサ
2320 メモリ
2330 データ記憶部
2340 通信ユニット
110 Information gathering system 112 Data storage 114 Author object 116 Social media account object 118 Personal web page object 140 Device 142 Display 150 Web hosting system 120 Publication system 130 Social media system

210 Get Digital Documents 212 Digital Documents 220 Extract Author Profile Data and Topics 222 Author Objects 230 Search Social Media 232 Social Media Account 240 Extract Social Media Profile Data and Topics 242 Social Media · Account Object 250 Compare social media objects with author objects to generate scores 252 Name Score 254 Profile Score 256 Content Score 258 Interaction Score 260 Determine Match

302 Get Digital Documents 304 Determine Topics 306 Identify Authors 308 Select Authors 310 Get Author Metadata 312 Select Social Media 314 Search Social Media 316 Select Social Media Account 318 Social Media Get Media Account Metadata 320 Generate Score 322 Other Social Media Accounts?
324 Determine if the author is the owner of a social media account based on the score 326 Other social media?
328 Other authors?
330 Extract new posts 332 Organize information 334 Provide organized information

402 Generate author objects in the database for each author of multiple digital documents 404 Finding the author's name in the author object in the social media with instructions for various social media accounts on that social media. Obtained Based on 406 Generates a name score based on a comparison of the name from the author object with the social media name from the social media account object generated based on the social media account 408 Author Generate profile scores based on comparison of author profile data from objects with social media profile data from social media account objects 410 Topics from posts on social media accounts Generate content scores based on comparisons with topics about each of the digital documents associated with the author from the author object 412 Social connections in social media accounts and associations with authors from the author object Generate interaction scores based on co-author ratings for each of the digital documents 414 Name score, profile score, whether the social media account is related to the author of the author object. 416 Extract data from new posts from social media accounts associated with the author of each author object 418 Provide the data in a topic-based organization of digital documents.

502 Generate author objects in the database for each author of multiple digital documents 504 Directing various social media accounts on some social media to search for the name of the author in the author object on the social media. Obtained Based on 506 Determines if the social media account is related to the author of the author object based on two or more of the name score, profile score, content score, and interaction score.

610 Get Digital Documents 612 Digital Documents 620 Extract Author Profile Data and Topics 622 Author Objects 630 Search Social Media 632 Social Media Account 640 Extract Social Media Profile Data and Photos 642 Social Media -Account Object 650 Search Personal Academic Web Page 652 Personal Academic Web Page 660 Extract Data and Photos of Personal Academic Web Page 662 Personal Academic Web Page Object 670 Mutual Verification of Social Media Objects and Personal Academic Web Page 671 URL Match 672 Social Media Account Match 673 Photo Match 674 Keyword Match 675 Linked Social Media Keyword Match 680 Determine Match

710 Generate author object in database 720 Get personal academic web page candidates for authors 730 Get social media account candidates for the author 740 One personal academic web page candidate and one social media account, Mutual verification as related to that author 750 Further authors?
760 Extracting social media posts from various authors' social media accounts 770 Providing the above data in a topic-based organization

810 Perform a first search for personal academic web pages based on the name of the author 820 Perform a second search for personal academic web pages based on the name of the author and the affiliation of the author 830 First search and first Merge Results from Two Searches 840 Identify Individual Profile Pages Based on Templates 850 Parse Results and Identify Results as Personal Academic Web Pages 860 Further Results?

905 Analyze web page results 910 Get web pages 915 Analyze web page code to identify information blocks 920 Extract keywords from information blocks 925 Generate keyword scores based on extracted keywords 930 Analyze Anchor Text 935 Identify Anchor Text in Result Web Page 940 Search Anchor Text in Result Web Page 945 Based on the anchor text and the name in the anchor text that matches the author. Generate anchor text score 950 Analyze the resulting URL 955 Divide the URL into fragments 960 Search the fragment for a name or keyword 965 Generate a URL score based on the name and keyword in the fragment 970 Keyword score, Categorize the results based on anchor text score and URL score 975 Is the result a personal academic web page?
980 Add results to candidate personal academic web pages

1010 Get profile of candidate social media account 1020 Identify URL in profile 1030 Compare URL of candidate personal academic web page with URL in profile 1040 Match?
1050 Is there another personal academic web page candidate?
1060 Confirmed that both the personal academic web page candidate and the social media account candidate are related to the author.

1110 Get personal academic web page candidates 1120 Parse personal academic web page candidates to identify social media accounts 1130 Compare identified social media accounts with social media account candidates 1140 Match?
1150 Confirmed that both the candidate for personal academic web page and the candidate for social media account are related to the author.

1210 Get personal academic web page candidates 1220 Parse personal academic web page candidates and extract the first photo 1230 Get the profile of social media account candidates 1240 Parse the profile and extract the second photo 1250 With the first photo Compare the second photo 1260 Match?
1270 Are there more candidates for social media accounts?
Confirmed that both 1280 personal academic web page candidates and social media account candidates are related to the author.

1310 Get personal academic web page candidates 1320 Parse the code of personal academic web page candidates to identify information blocks 1330 Extract keywords from information blocks 1340 Get profiles of social media account candidates 1350 Extract extracted keywords in profile Compare with text 1360 Do those words exceed the similarity threshold?
1370 Are There More Social Media Account Candidates?
1380 Confirmed that both personal academic web page candidates and social media account candidates are related to the author

1410 Get Personal Academic Web Page Candidates 1420 Parse Personal Academic Web Page Candidate Codes to Identify Information Blocks 1430 Extract Keywords from Information Blocks 1440 Of Social Media Accounts Linked to Some Social Media Account Candidates Get Profile 1450 Compare extracted keywords with text in profile of linked social media account 1460 Do those words exceed the similarity threshold?
1470 Are there more candidates for social media accounts?
1480 Confirmed that both personal academic web page candidates and social media account candidates are related to the author

1520 First candidate set 1510 Seed 1530 Second candidate set

1602 Get a Seed Social Media Account 1604 Get a Social Media Account Profile for a Seed Social Media Account 1606 First of the Social Media Accounts Followed by a Seed Social Media Account 1608 Compare the social media accounts of the first set with the seed social media accounts 1610 The seed social media of the first set of social media accounts. Build a first candidate set for social media accounts that are not in your account 1612 Remove general social media accounts 1614 Analyze the candidate social media accounts for the first candidate set to socialize Determining the type of media account 1616 Candidate social media accounts are knowledgeable social media accounts?
1618 Add Candidate Social Media Account as Seed Social Media Account 1620 Further First Candidate Social Media Account?
1622 Extract a second set of social media accounts that follow a seed social media account 1624 A seed social media account that is in the second set of social media accounts Build a second set of candidates for social media accounts that are not in 1626 Remove general social media accounts 1628 Get names associated with candidate accounts 1630 Determine if name or person name 1632 As candidate 1634 Identifies Interest Score 1636 Is Interest Score Above Threshold?
1638 Add Candidate Social Media Accounts to the Second Set of Social Media Accounts 1640 Are there additional second candidate social media accounts?
1642 Further Seed Social Media Accounts?
1644 Serving different content to seed social media accounts and the second set of social media accounts mentioned above

1705 Get the name of a social media account 1710 Determine if it is an organization or a person name 1715 Compare with the author database of publications 1720 Match?
1725 Category as knowledgeable account 1730 Identified interest score 1735 Does the score exceed the threshold?
Removed as a 1740 candidate

1810 Get Candidate Social Media Account Profile 1820 Count the first number of global followers for Candidate Social Media Accounts 1830 With Seed Social Media Accounts and the first set of Social Media Accounts Count the second number of local followers for a candidate social media account, including those who are following the candidate social media account 1840 Generate a topic relevance score 1850 Is the relevance score above the threshold? ??
Removed 1860 Candidate Social Media Accounts as Candidate, Learner Accounts and / or Seed Accounts

1910 Acquire extended account as a sensor 1920 Extract recent content generated, shared and / or commented from social media accounts, comprehensive 1930 Identify various social media account types 1940 Social media account types Based on, mutually reinforcing rankings of social media accounts and content

2002 Social Media Account 2010 Get Account Profile 2020 Extract Names in Account Profile 2022 Inspect Names in Account Profile 2020 Name Features 2030 Extract Photos in Account Profile 2032 Extract Photos in Account Profile Inspection 2034 Photo Feature 2040 Extract description in account profile 2042 Examine description in account profile 2044 Description feature 2050 Extract link URL in account profile 2052 Inspect link URL in account profile 2054 Profile URL Feature 2060 Get Recent Social Media Content 2070 Extract Text Content 2072 Examine Text in Content 2074 Content Text Feature 2080 Extract Link URL 2072 Examine Link URL in Content 2074 Content URL Feature 2090 Machine Learning Tool 2092 Social・ Media account type

2102 Determine general type weight (gtw) based on account type for each account 2104 Determine individual weight (iw) based on account credit for each account 2106 Determine general type weight based on user preference for each content type 2108 Encode the mutually reinforcing relationship between the account and the content 2110 Calculate the basic link strength between the account and the content 2112 Calculate the adjusted link strength between the account and the content 2114 Reinforce each other between the account and the content Calculate ranking

2300 System 2310 Processor 2320 Memory 2330 Data storage 2340 Communication unit

Claims (20)

ソーシャル・メディア・アカウントとコンテンツとの間の相互に補強する関係に基づいてソーシャル・メディア・アカウントおよびコンテンツをランク付けするコンピュータ実装される方法であって:
特定の知識分野に関連するエンティティの複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについて一般型重みを決定する段階であって、前記一般型重みは、そのソーシャル・メディア・アカウントに対応するソーシャル・メディア・アカウント型に基づく、段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての個別重みを決定する段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツとの間の相互に補強する関係をエンコードする段階であって、前記相互に補強する関係は、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツのコンテンツ項目との間のプロモーション・リンクとしてエンコードされる、段階と;
基本リンク強さを計算する段階であって、基本リンク強さは各プロモーション・リンクについて計算され、該基本リンク強さは複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記一般型重みと、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記個別重みとに基づく、段階と;
前記コンテンツのランキングを、前記基本リンク強さに基づいて計算する段階とを含む、
方法。
A computer-implemented way to rank social media accounts and content based on the mutually reinforcing relationships between social media accounts and content:
At the stage of determining a general type weight for each social media account of multiple social media accounts of an entity related to a particular field of knowledge, the general type weight corresponds to that social media account. Stages based on social media account type;
At the stage of determining the individual weight for each social media account of the multiple social media accounts;
At the stage of encoding the mutually reinforcing relationship between each social media account of the plurality of social media accounts and the content promoted by each social media account of the plurality of social media accounts. The mutually reinforcing relationship is the content item of the content promoted by each social media account of the plurality of social media accounts and each social media account of the plurality of social media accounts. Encoded as a promotional link between and with the stage;
At the stage of calculating the basic link strength, the basic link strength is calculated for each promotion link, and the basic link strength is the general type for each social media account of multiple social media accounts. Stages based on the weights and the individual weights for each social media account of the plurality of social media accounts;
Including the step of calculating the ranking of the content based on the basic link strength.
Method.
前記基本リンク強さはさらにプロモーション適時性に基づく、請求項1記載の方法。 The method according to claim 1, wherein the basic link strength is further based on promotion timeliness. 前記プロモーション適時性は単調減少関数を含む、請求項2記載の方法。 The method of claim 2, wherein the promotion timeliness comprises a monotonically decreasing function. 調整されたリンク強さを計算する段階であって、各プロモーション・リンクについての調整されたリンク強さは、そのプロモーション・リンクについて計算された前記基本リンク強さの調整である、段階と;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの前記相互に補強するランキングを、前記調整されたリンク強さに基づいて計算する段階とをさらに含む、
請求項1記載の方法。
At the stage of calculating the adjusted link strength, the adjusted link strength for each promotion link is the adjustment of the basic link strength calculated for that promotion link.
Further including the step of calculating the mutually reinforcing ranking of the plurality of social media accounts and content based on the adjusted link strength.
The method according to claim 1.
前記調整されたリンク強さが選好因子に基づく、請求項4記載の方法。 4. The method of claim 4, wherein the adjusted link strength is based on a preference factor. 前記調整されたリンク強さがプロモーションの型に基づく、請求項4記載の方法。 4. The method of claim 4, wherein the adjusted link strength is based on the type of promotion. 前記調整されたリンク強さが移転因子に基づく、請求項4記載の方法。 4. The method of claim 4, wherein the adjusted link strength is based on a transfer factor. 一つまたは複数のプロセッサによって実行されたときに動作を実行するおよび/またはその実行を制御するよう構成されている命令を含んでいる非一時的なコンピュータ可読媒体であって、前記動作は:
特定の知識分野に関連するエンティティの複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについて一般型重みを決定する段階であって、前記一般型重みは、そのソーシャル・メディア・アカウントに対応するソーシャル・メディア・アカウント型に基づく、段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての個別重みを決定する段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツとの間の相互に補強する関係をエンコードする段階であって、前記相互に補強する関係は、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツのコンテンツ項目との間のプロモーション・リンクとしてエンコードされる、段階と;
基本リンク強さを計算する段階であって、基本リンク強さは各プロモーション・リンクについて計算され、該基本リンク強さは複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記一般型重みと、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記個別重みとに基づく、段階と;
前記コンテンツのランキングを、前記基本リンク強さに基づいて計算する段階とを含む、
コンピュータ可読媒体。
A non-temporary computer-readable medium containing instructions that are configured to perform and / or control the execution when executed by one or more processors, said operation:
At the stage of determining a general type weight for each social media account of multiple social media accounts of an entity related to a particular field of knowledge, the general type weight corresponds to that social media account. Stages based on social media account type;
At the stage of determining the individual weight for each social media account of the multiple social media accounts;
At the stage of encoding the mutually reinforcing relationship between each social media account of the plurality of social media accounts and the content promoted by each social media account of the plurality of social media accounts. The mutually reinforcing relationship is the content item of the content promoted by each social media account of the plurality of social media accounts and each social media account of the plurality of social media accounts. Encoded as a promotional link between and with the stage;
At the stage of calculating the basic link strength, the basic link strength is calculated for each promotion link, and the basic link strength is the general type for each social media account of multiple social media accounts. Stages based on the weights and the individual weights for each social media account of the plurality of social media accounts;
Including the step of calculating the ranking of the content based on the basic link strength.
Computer readable medium.
前記基本リンク強さはさらにプロモーション適時性に基づく、請求項8記載のコンピュータ可読媒体。 The computer-readable medium of claim 8, wherein the basic link strength is further based on promotion timeliness. 前記プロモーション適時性は単調減少関数を含む、請求項9記載のコンピュータ可読媒体。 The computer-readable medium of claim 9, wherein the promotion timeliness comprises a monotonically decreasing function. 前記動作がさらに:
前記基本リンク強さを調整し;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの前記相互に補強するランキングを、調整された基本リンク強さに基づいて計算することをさらに含む、
請求項8記載のコンピュータ可読媒体。
The above operation is further:
Adjust the basic link strength;
Further comprising calculating said mutually reinforcing rankings of said multiple social media accounts and content based on adjusted base link strength.
The computer-readable medium according to claim 8.
前記基本リンク強さの調整が選好因子に基づく、請求項11記載のコンピュータ可読媒体。 The computer-readable medium of claim 11, wherein the adjustment of the basic link strength is based on a preference factor. 前記基本リンク強さの調整がプロモーションの型に基づく、請求項11記載のコンピュータ可読媒体。 The computer-readable medium of claim 11, wherein the adjustment of the basic link strength is based on the type of promotion. 前記基本リンク強さの調整が移転因子に基づく、請求項11記載のコンピュータ可読媒体。 The computer-readable medium of claim 11, wherein the adjustment of the basic link strength is based on a transfer factor. 一つまたは複数のソーシャル・メディア・サーバー;および
一つまたは複数のプロセッサと、前記一つまたは複数のプロセッサによって実行されたときに動作を実行するおよび/またはその実行を制御するよう構成されている命令を含んでいる非一時的なコンピュータ可読媒体とを含むコンピューティング装置を有するシステムであって、
前記動作は:
特定の知識分野に関連するエンティティの複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについて一般型重みを決定する段階であって、前記一般型重みは、そのソーシャル・メディア・アカウントに対応するソーシャル・メディア・アカウント型に基づく、段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての個別重みを決定する段階と;
前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツとの間の相互に補強する関係をエンコードする段階であって、前記相互に補強する関係は、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントと前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントによってプロモーションされるコンテンツのコンテンツ項目との間のプロモーション・リンクとしてエンコードされる、段階と;
基本リンク強さを計算する段階であって、基本リンク強さは各プロモーション・リンクについて計算され、該基本リンク強さは複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記一般型重みと、前記複数のソーシャル・メディア・アカウントの各ソーシャル・メディア・アカウントについての前記個別重みとに基づく、段階と;
前記コンテンツのランキングを、前記基本リンク強さに基づいて計算する段階とを含む、
システム。
One or more social media servers; and one or more processors and configured to perform and / or control the execution of operations when executed by the one or more processors. A system with a computing device that includes a non-temporary computer-readable medium containing instructions.
The operation is:
At the stage of determining a general type weight for each social media account of multiple social media accounts of an entity related to a particular field of knowledge, the general type weight corresponds to that social media account. Stages based on social media account type;
At the stage of determining the individual weight for each social media account of the multiple social media accounts;
At the stage of encoding the mutually reinforcing relationship between each social media account of the plurality of social media accounts and the content promoted by each social media account of the plurality of social media accounts. The mutually reinforcing relationship is the content item of the content promoted by each social media account of the plurality of social media accounts and each social media account of the plurality of social media accounts. Encoded as a promotional link between and with the stage;
At the stage of calculating the basic link strength, the basic link strength is calculated for each promotion link, and the basic link strength is the general type for each social media account of multiple social media accounts. Stages based on the weights and the individual weights for each social media account of the plurality of social media accounts;
Including the step of calculating the ranking of the content based on the basic link strength.
system.
前記基本リンク強さはさらに、単調減少関数を含むプロモーション適時性に基づく、請求項15記載のシステム。 15. The system of claim 15, wherein the basic link strength is further based on promotion timeliness, including a monotonically decreasing function. 前記動作がさらに:
前記基本リンク強さを調整し;
前記複数のソーシャル・メディア・アカウントおよびコンテンツの前記相互に補強するランキングを、調整された基本リンク強さに基づいて計算することをさらに含む、
請求項15記載のシステム。
The above operation is further:
Adjust the basic link strength;
Further comprising calculating said mutually reinforcing rankings of said multiple social media accounts and content based on adjusted base link strength.
The system according to claim 15.
前記基本リンク強さの調整が選好因子に基づく、請求項17記載のシステム。 17. The system of claim 17, wherein the adjustment of the basic link strength is based on a preference factor. 前記基本リンク強さの調整がプロモーションの型に基づく、請求項17記載のシステム。 17. The system of claim 17, wherein the adjustment of the basic link strength is based on the type of promotion. 前記基本リンク強さの調整が移転因子に基づく、請求項17記載のシステム。 17. The system of claim 17, wherein the adjustment of the basic link strength is based on a transfer factor.
JP2017155651A 2017-02-01 2017-08-10 Reinforcing rankings for social media accounts and content Active JP7003481B2 (en)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US15/422,383 US20170235835A1 (en) 2016-02-12 2017-02-01 Information identification and extraction
US15/422383 2017-02-01
US15/424730 2017-02-03
US15/424,730 US20170235836A1 (en) 2016-02-12 2017-02-03 Information identification and extraction
US15/653,356 US10776885B2 (en) 2016-02-12 2017-07-18 Mutually reinforcing ranking of social media accounts and contents
US15/653356 2017-07-18

Publications (2)

Publication Number Publication Date
JP2018124966A JP2018124966A (en) 2018-08-09
JP7003481B2 true JP7003481B2 (en) 2022-01-20

Family

ID=63108945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017155651A Active JP7003481B2 (en) 2017-02-01 2017-08-10 Reinforcing rankings for social media accounts and content

Country Status (1)

Country Link
JP (1) JP7003481B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7266838B2 (en) * 2018-08-29 2023-05-01 国立大学法人 東京大学 Information analysis device and program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009289191A (en) 2008-05-30 2009-12-10 Nippon Telegr & Teleph Corp <Ntt> Contribution information provision device, contribution information browsing method, program, and storage medium
WO2012118087A1 (en) 2011-03-03 2012-09-07 日本電気株式会社 Recommender system, recommendation method, and program
JP2016509289A (en) 2012-12-27 2016-03-24 フェイスブック,インク. Implied connections in the social graph
US20160179805A1 (en) 2014-12-17 2016-06-23 International Business Machines Corporation Calculating expertise confidence based on content and social proximity

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009289191A (en) 2008-05-30 2009-12-10 Nippon Telegr & Teleph Corp <Ntt> Contribution information provision device, contribution information browsing method, program, and storage medium
WO2012118087A1 (en) 2011-03-03 2012-09-07 日本電気株式会社 Recommender system, recommendation method, and program
JP2016509289A (en) 2012-12-27 2016-03-24 フェイスブック,インク. Implied connections in the social graph
US20160179805A1 (en) 2014-12-17 2016-06-23 International Business Machines Corporation Calculating expertise confidence based on content and social proximity

Also Published As

Publication number Publication date
JP2018124966A (en) 2018-08-09

Similar Documents

Publication Publication Date Title
US10776885B2 (en) Mutually reinforcing ranking of social media accounts and contents
US10936959B2 (en) Determining trustworthiness and compatibility of a person
Haider et al. Invisible search and online search engines: The ubiquity of search in everyday life
CN111753198B (en) Information recommendation method and device, electronic equipment and readable storage medium
TWI408560B (en) A method, system and apparatus for recommending items or people of potential interest to users in a computer-based network
US10771424B2 (en) Usability and resource efficiency using comment relevance
US20170293864A1 (en) System and Method for Searching and Matching Content Over Social Networks Relevant to an Individual
Cossu et al. A review of features for the discrimination of twitter users: application to the prediction of offline influence
Andryani et al. Social media analytics: data utilization of social media for research
US20170235836A1 (en) Information identification and extraction
US20170235726A1 (en) Information identification and extraction
US20180046628A1 (en) Ranking social media content
CN105045931A (en) Video recommendation method and system based on Web mining
US11232156B1 (en) Seed expansion in social network using graph neural network
Jung ContextGrid: A contextual mashup-based collaborative browsing system
US20200175109A1 (en) Phrase placement for optimizing digital page
Burnap et al. Making sense of self-reported socially significant data using computational methods
US20170235835A1 (en) Information identification and extraction
Cantador et al. Semantic contextualisation of social tag-based profiles and item recommendations
JP7003481B2 (en) Reinforcing rankings for social media accounts and content
US20200175393A1 (en) Neural network model for optimizing digital page
US10809892B2 (en) User interface for optimizing digital page
Al-Abri et al. Aggregation and mapping of social media attribute names extracted from chat conversation for personalized e-learning
US20200175394A1 (en) Active learning model training for page optimization
US20200175476A1 (en) Job identification for optimizing digital page

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200514

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210608

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211213

R150 Certificate of patent or registration of utility model

Ref document number: 7003481

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150