JP2017027265A - Information extraction method, information processing device, information processing system and program - Google Patents
Information extraction method, information processing device, information processing system and program Download PDFInfo
- Publication number
- JP2017027265A JP2017027265A JP2015143607A JP2015143607A JP2017027265A JP 2017027265 A JP2017027265 A JP 2017027265A JP 2015143607 A JP2015143607 A JP 2015143607A JP 2015143607 A JP2015143607 A JP 2015143607A JP 2017027265 A JP2017027265 A JP 2017027265A
- Authority
- JP
- Japan
- Prior art keywords
- information
- predetermined
- predetermined operation
- accounts
- theme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 52
- 230000010365 information processing Effects 0.000 title claims description 30
- 238000000034 method Methods 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 abstract description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- WBMKMLWMIQUJDP-STHHAXOLSA-N (4R,4aS,7aR,12bS)-4a,9-dihydroxy-3-prop-2-ynyl-2,4,5,6,7a,13-hexahydro-1H-4,12-methanobenzofuro[3,2-e]isoquinolin-7-one hydrochloride Chemical compound Cl.Oc1ccc2C[C@H]3N(CC#C)CC[C@@]45[C@@H](Oc1c24)C(=O)CC[C@@]35O WBMKMLWMIQUJDP-STHHAXOLSA-N 0.000 description 3
- 230000006855 networking Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
Images
Abstract
Description
本発明は、情報抽出方法、情報処理装置、情報処理システム、及びプログラムに関する。 The present invention relates to an information extraction method, an information processing apparatus, an information processing system, and a program.
例えば、SNS(Social Networking Service)やミニブログ等、複数の利用者によって投稿されたコメントや画像等を公開するウェブサービスが知られている。 For example, a web service that publishes comments, images, and the like posted by a plurality of users, such as an SNS (Social Networking Service) and a mini blog, is known.
また、サーバに蓄積された投稿者による投稿に基づいて、投稿者により登録された所定の地域や所定のジャンルに対応する飲食店の評価ランキングを生成し、各投稿者の特徴が反映された情報を提供する情報提供システムが知られている(例えば特許文献1参照)。 In addition, based on the contributions posted by the contributors accumulated in the server, the restaurant rankings corresponding to the predetermined regions and predetermined genres registered by the contributors are generated, and the information reflecting the characteristics of each contributor There is known an information providing system that provides information (see, for example, Patent Document 1).
SNS等で公開された投稿には有用な情報が数多く含まれるが、所定のテーマ(例えば、スポーツ、趣味、ペット等)に関する投稿を検索したい場合、これらの投稿には所定のテーマに関するキーワードが含まれていない場合が多い。したがって、従来の技術では、所定のテーマに関するキーワードを含まない投稿を含む複数の投稿の中から、所定のテーマに関する投稿を抽出することには困難を伴っていた。 Posts published on SNS etc. contain a lot of useful information, but if you want to search for posts related to a predetermined theme (for example, sports, hobbies, pets, etc.), these posts include keywords related to the predetermined theme Often not. Therefore, in the conventional technology, it has been difficult to extract a post related to a predetermined theme from a plurality of posts including a post not including a keyword related to the predetermined theme.
本発明の一実施形態は、上記の問題点に鑑みてなされたものであって、所定のテーマに関するキーワードを含まない投稿を含む複数の投稿の中から、所定のテーマに関する投稿を抽出することを容易にする情報抽出方法を提供することを目的とする。 One embodiment of the present invention has been made in view of the above problems, and extracts a post related to a predetermined theme from a plurality of posts including a post not including a keyword related to a predetermined theme. It is an object to provide an information extraction method that facilitates.
上記課題を解決するため、本発明の一実施形態に係る情報提供方法は、複数のアカウントによって公開された情報の中からコンピュータが所定の情報を抽出する情報抽出方法であって、前記コンピュータが、前記公開された情報の中から所定の分野に関連する複数の情報を収集する収集ステップと、前記収集された情報に対して所定の操作を行ったアカウントを特定する特定ステップと、前記特定されたアカウントの中から、前記所定の操作を行った回数に基づいて前記所定の分野における複数の代表アカウントを決定する決定ステップと、前記公開された情報の中から、複数の前記代表アカウントによって前記所定の操作が行われた情報を抽出する抽出ステップと、を含む。 In order to solve the above problems, an information providing method according to an embodiment of the present invention is an information extraction method in which a computer extracts predetermined information from information published by a plurality of accounts, and the computer includes: A collecting step of collecting a plurality of pieces of information related to a predetermined field from the disclosed information, a specifying step of specifying an account that has performed a predetermined operation on the collected information, and the specified A determination step of determining a plurality of representative accounts in the predetermined field based on the number of times the predetermined operation has been performed from among accounts; and the predetermined information by the plurality of representative accounts from among the published information Extracting the information on which the operation has been performed.
本発明の一実施形態によれば、所定のテーマに関するキーワードを含まない投稿を含む複数の投稿の中から、所定のテーマに関する投稿を抽出することを容易にする情報抽出方法を提供することができる。 According to an embodiment of the present invention, it is possible to provide an information extraction method that makes it easy to extract posts related to a predetermined theme from a plurality of posts including posts that do not include a keyword related to a predetermined theme. .
以下に、本発明の実施の形態について、添付の図面を参照して説明する。 Embodiments of the present invention will be described below with reference to the accompanying drawings.
<システムの構成>
図1は一実施形態に係る情報処理システムの構成例を示す図である。図1の例では、情報処理システム100は、複数の情報端末102a、102b、102cと、情報提供サーバ101と、SNS(Social Networking Service)サーバ103と、を含む。なお、以下の説明の中で、複数の情報端末102a〜102cのうち、任意の情報端末を示す場合、「情報端末102」を用いる。また、図1の情報端末102の数は一例であり、他の数であっても良い。
<System configuration>
FIG. 1 is a diagram illustrating a configuration example of an information processing system according to an embodiment. In the example of FIG. 1, the
情報提供サーバ101、情報端末102、及びSNSサーバ103は、例えば、インターネットやLAN(Local Area Network)等のネットワーク104を介して、互いに通信可能である。
The
SNSサーバ103は、例えば1つ以上の情報処理装置を含むシステムである。SNSサーバ103は、例えば、SNSやミニブログ等の、複数の利用者によって投稿されたコメントや画像等を公開するウェブサービスを提供する。
The
情報端末102は、ユーザが利用するスマートフォン、タブレット端末、携帯電話、ノート型PC、ゲーム機器等の端末装置である。ユーザは、情報端末10を用いて、例えば、SNSサーバ103に予め登録されたアカウントを利用してSNSサーバ103にログインし、コメント、画像等の投稿や、他のユーザによる投稿の閲覧等を行うことができる。また、ユーザは、情報端末102を用いて情報提供サーバ101にアクセスし、情報提供サーバ101によって提供されるサービスを利用することができる。
The
情報提供サーバ101は、例えば1つ以上の情報処理装置を含むシステムである。情報提供サーバ101は、例えば、SNSサーバ103等によって公開されている複数の投稿の中から、所定のテーマ毎に有用な投稿を抽出する。また、情報提供サーバ101は、抽出した所定のテーマ毎に有用な投稿を利用者に提供する。SNSサーバ103等によって公開されている投稿の一例を図2に示す。
The
図2は、一実施形態に係る投稿の一例のイメージ図である。図2の例では、所定のテーマの一例として、「インテリア」に関する投稿の例が示されている。 FIG. 2 is an image diagram of an example of posting according to an embodiment. In the example of FIG. 2, an example of posting related to “interior” is shown as an example of a predetermined theme.
図2(a)に示す投稿201には、例えば、椅子等のインテリアに関する画像、ユーザ名(ユーザA)、コメント、及び投稿日時等の情報が含まれている。また、図2(a)の例では、コメントに「インテリアショップ」、「チェア」等のインテリアに関するキーワードが含まれている。したがって、例えば、ユーザは、公開されている複数の投稿に対して、「インテリア」、「チェア」等のキーワードを用いて検索を行うことにより、図2(a)に示すような投稿201を抽出することができると考えられる。
The
一方、図2(b)に示す投稿202には、例えば、ロッキングチェア等のインテリアに関する画像、ユーザ名(ユーザB)、コメント、及び投稿日時等の情報が含まれている。しかし、この投稿202のコメントには、インテリアに直接関係するキーワードが含まれていない。したがって、例えば、ユーザは、公開されている複数の投稿の中から、キーワード検索により図2(b)に示す投稿202を抽出することは困難と考えられる。
On the other hand, the
同様に、図2(c)に示す投稿203には、例えば、テーブルや椅子等のインテリアに関する画像(静止画、又は動画)、ユーザ名(ユーザC)、及び投稿日時等の情報が含まれている。しかし、この投稿203には、コメントがないので、公開されている複数の投稿の中から、キーワード検索により図2(c)に示す投稿203を抽出することは困難である。
Similarly, the
SNSやミニブログ等で公開されている投稿には、例えば、現地情報等の希少な情報が多く含まれているが、これらの投稿には、例えば、図2(b)、(c)に示すように検索に必要なキーワードが含まれていない場合が多い。したがって、一般の利用者が、所定のテーマに関するキーワードを含まない投稿を含む複数の投稿の中から、所定のテーマに関する投稿を見つけ出すことには困難を伴っていた。 Posts published on SNS, mini-blog, etc. contain a lot of rare information such as local information, for example, but these posts are shown in FIGS. 2B and 2C, for example. In many cases, the keywords necessary for the search are not included. Therefore, it has been difficult for a general user to find a post related to a predetermined theme from a plurality of posts including a post not including a keyword related to the predetermined theme.
本実施形態に係る情報提供サーバ101は、このような、所定のテーマに関するキーワードを含まない投稿を含む複数の投稿の中から、予め定められた複数のテーマ毎に価値のある情報を抽出する。また、情報提供サーバ101は、抽出した情報をまとめて利用者に提供するサービス(興味キュレーションサービス)を提供する。
The
なお、図1に示す情報処理システム100の構成は一例である。例えば、情報提供サーバ101はSNSサーバ103の機能を有していても良いし、情報提供サーバ101の機能はSNSサーバ103に含まれていても良い。
The configuration of the
また、図2に示す投稿は、複数のアカウントによって公開された情報の一例である。複数のアカウントによって公開された情報には、文字列や画像だけではなく、例えば、URL(Uniform Resource Locator)、音楽等の様々な情報も含まれる。 The posting shown in FIG. 2 is an example of information published by a plurality of accounts. Information disclosed by a plurality of accounts includes not only character strings and images but also various information such as URL (Uniform Resource Locator) and music.
<ハードウェア構成>
次に、情報処理システム100に含まれる各装置のハードウェア構成について説明する。情報提供サーバ101、情報端末102、及びSNSサーバ103は、一般的なコンピュータの構成有している。
<Hardware configuration>
Next, the hardware configuration of each device included in the
図3は、一実施形態に係るコンピュータのハードウェア構成例を示す図である。図3において、コンピュータ300は、例えば、CPU301、RAM302、ROM303、ストレージ装置304、入力装置305、表示装置306、通信I/F(Interface)307、外部I/F308、及びバス309等を有する。
FIG. 3 is a diagram illustrating a hardware configuration example of a computer according to an embodiment. 3, the
CPU301は、ROM303やストレージ装置304等のメモリからプログラムやデータをRAM302上に読み出し、処理を実行することで、コンピュータ300の制御や機能を実現する演算装置である。ROM303は、コンピュータ300の起動時に実行されるBIOS(Basic Input/Output System)、OS(Operating System)の設定、及び各種設定等のプログラムやデータが格納されている。RAM302は、プログラムやデータを一時保持する揮発性のメモリである。ストレージ装置304は、プログラムやデータを格納している大容量の記憶装置である。
The
入力装置305は、例えばキーボードやマウス等であり、ユーザが各種操作信号を入力するのに用いられる。表示装置306は、例えばディスプレイ等であり、コンピュータ300による処理結果を表示する。なお、入力装置305又は/及び表示装置306は、必要なときに接続して利用する形態であってもよい。
The
通信I/F307は、コンピュータ300をネットワーク104に接続するためのインタフェースである。外部I/F308は、外部装置とのインタフェースである。外部装置には、記録媒体308a等がある。これにより、コンピュータ300は外部I/F308を介して記録媒体308aの読み取り及び/又は書き込みを行うことができる。記録媒体23aには例えば、各種の光学ディスクや、各種のメモリカード等が含まれる。
The communication I /
<機能構成>
次に、本実施形態に係る情報処理システム100の機能構成について説明する。
<Functional configuration>
Next, a functional configuration of the
図43は、一実施形態に係る情報処理システムの機能構成図である。 FIG. 43 is a functional configuration diagram of an information processing system according to an embodiment.
(情報提供サーバの機能構成)
情報提供サーバ101は、例えば、図3に示すコンピュータ300によって所定のプログラムを実行することにより、情報収集部401、アカウント特定部402、代表アカウント決定部403、情報抽出部404、情報提供部405、及び記憶部406等を実現している。
(Functional configuration of information providing server)
The
情報収集部401は、複数のアカウントによって公開された情報の中から、所定の分野に関連する複数の情報を収集する。例えば、情報収集部401は、SNSサーバ103が提供するSNS等で公開された複数の投稿の中から、予め定められた分野(以下、テーマと呼ぶ)に関するキーワードを含む複数の投稿を収集する。
The
例えば、情報収集部401は、SNSサーバ103によって提供されるWebAPI421等を利用して、SNSサーバ103が提供するSNS等で公開された投稿の中から、所定のテーマに関するキーワードを含む情報を収集する。
For example, the
WebAPI421は、SNSサーバ103が提供するサービスやソフトウェアを、Webを通して他のプログラム(例えば、情報提供サーバ101で動作するプログラム等)から利用するためのAPI(Application Programming Interface)である。例えば、Twitter(登録商標)は、Twitter APIとして、ツイートの検索、リツイートしたユーザのID(アカウント)の取得、ユーザのリツイートの取得等、各種のサービスを提供している。
The
好ましくは、情報収集部401は、所定のテーマに関するキーワードを含む情報のうち、所定の操作が所定の回数(例えば20回)以上行われた情報を、例えば、500件程度(又はそれ以上)収集する。
Preferably, the
なお、所定の操作には、例えば、Twitterの「リツイート(RT)」や、Facebook(登録商標)の「シェア」等のように、投稿を再発信、又は再投稿する操作等が含まれる。 The predetermined operation includes, for example, an operation of re-sending or re-posting a post such as “Retweet (RT)” of Twitter, “Share” of Facebook (registered trademark), and the like.
また、所定の操作には、投稿にコメント等を行う操作が含まれていても良い。 In addition, the predetermined operation may include an operation for making a comment or the like on the post.
さらに、所定の操作には、例えば、Facebookの「いいね!」等のように、投稿を推奨することを示す情報、又はお気に入りであることを示す情報等を付与する操作が含まれていても良い。 Furthermore, the predetermined operation may include an operation of giving information indicating that the posting is recommended or information indicating that it is a favorite, such as “Like” of Facebook, for example. good.
このように、所定の操作には、有用な情報に対してユーザが行う各種の操作が含まれる。 Thus, the predetermined operation includes various operations performed by the user on useful information.
アカウント特定部402は、情報収集部401によってテーマ毎に収集された複数の投稿に対して、所定の操作(例えばリツイート)を行ったアカウントを特定する。例えば、アカウント特定部402は、情報収集部401が収集した投稿の各々に対して、所定の操作を行ったアカウントのユーザID等を、例えば、SNSサーバ103が提供するWebAPI421等を利用して取得する。
The
代表アカウント決定部403は、アカウント特定部402によって特定されたアカウントの中から、所定の操作(例えばリツイート)を行った回数に基づいてテーマ毎に複数の代表アカウントを決定する。
The representative
好ましくは、代表アカウント決定部403は、各テーマで所定の操作を行った回数が多い、例えば、70〜100人程度の利用者のアカウントを、各テーマの代表アカウントとして決定する。これにより、代表アカウント決定部403は、各テーマで所定の操作を頻繁に行っている頻出者(目利き)を各テーマの代表アカウントとして決定することができる。
Preferably, the representative
情報抽出部404は、SNSサーバ103が提供するSNS等で、複数のアカウントによって公開された投稿の中から、テーマ毎に、複数の代表アカウントによって所定の操作(例えばリツイート)が行われた投稿を抽出する。テーマ毎の代表アカウントは、各テーマで所定の操作を頻繁に行っている頻出者なので、複数の代表アカウントによって所定の操作が行われた投稿は、複数の代表アカウントが属するテーマに関連する投稿であると考えられる。
The
また、情報抽出部404は、抽出した投稿を、例えば、テーマ毎に記憶部406に抽出情報408として記憶する。
In addition, the
情報提供部405は、情報抽出部404によってテーマ毎に抽出された情報を、各テーマに関する情報として提供する。例えば、情報提供部405は、情報端末102で選択されたテーマに対応する抽出情報408を、情報端末102に提供する。
The
或いは、情報提供部405は、情報抽出部404によってテーマ毎に抽出された情報に、各テーマに関連するキーワードを含む検索用のタグ情報を付与するもの等であっても良い。
Or the
(情報端末の機能構成)
情報端末102は、例えば、図3に示すコンピュータ300によって所定のプログラムを実行することにより、表示制御部411、及び操作受付部412等を実現している。
(Functional configuration of information terminal)
The
表示制御部411は、各種の表示画面を情報端末102の表示装置306等に表示させる。例えば、表示制御部411は、情報提供サーバ101が情報を提供する複数のテーマの中から、情報を表示させたいテーマを選択するテーマ選択画面を情報端末102の表示装置306等に表示させる。また、表示制御部411は、情報提供サーバ101から、情報端末102の通信I/F307等を介して受信した情報(抽出情報等)に基づく表示画面を、情報端末102の表示装置306等に表示させる。
The
操作受付部412は、利用者による入力操作を行い、入力操作に応じた各種の処理を行う。
The
(SNSサーバ)
本実施形態では、SNSサーバ103は、例えば、Twitter等の外部のSNSサーバを利用することを想定している。SNSサーバ103は、外部のプログラム(例えば、情報提供サーバ101で動作するプログラム等)から、SNSサーバ103が提供する各種のサービスを利用するためのWebAPI421を提供している。
(SNS server)
In the present embodiment, it is assumed that the
<処理の流れ>
次に、本実施形態に係る情報処理システム100の処理について説明する。
<Process flow>
Next, processing of the
(情報の抽出処理)
図5は、一実施形態に係る情報提供サーバの抽出処理の例を示すフローチャートである。
(Information extraction process)
FIG. 5 is a flowchart illustrating an example of extraction processing of the information providing server according to the embodiment.
ステップS501において、情報提供サーバ101の情報収集部401は、例えば、SNSサーバ103が提供するSNS等で複数のアカウントによって公開された情報の中から、所定のテーマに関連する複数の投稿を収集する。
In step S501, the
好ましくは、情報提供サーバ101は、図6に示すようなテーマ情報407を記憶部406に予め記憶しておき、情報収集部401は、このテーマ情報407に記憶されたキーワードを用いて、所定のテーマに関する投稿を、例えば500件以上収集する。
Preferably, the
図6は、一実施形態に係るテーマ情報の例を示す図である。図6の例では、テーマ情報407には、項目として、「テーマID」、「テーマ名」、及び「キーワード」等の情報が含まれる。
FIG. 6 is a diagram illustrating an example of theme information according to an embodiment. In the example of FIG. 6, the
「テーマID」は、予め定められた複数のテーマを識別する識別情報である。「テーマ名」は、各テーマの名前である。「キーワード」は、各テーマに関する投稿を検索するためのキーワードである。情報収集部401は、例えば、「キーワード」を組み合わせて、各テーマに関する投稿を、例えば、SNSサーバ103からWebAPI421を用いて収集する。
“Theme ID” is identification information for identifying a plurality of predetermined themes. “Theme name” is the name of each theme. “Keyword” is a keyword for searching for posts related to each theme. For example, the
このとき、情報収集部401は、収集された各投稿に対して所定の操作が行われた回数を、例えば、SNSサーバ103からWebAPI421を用いて取得し、所定の回数(例えば20回)以上、所定の操作が行われた投稿を収集するものであっても良い。
At this time, the
ステップS502において、情報提供サーバ101のアカウント特定部402は、ステップS501で収集された各投稿に対して所定の操作を行ったアカウントを特定する。
In step S502, the
図7は、一実施形態に係るアカウント特定部の処理の例を説明するための図である。
図7の例では、テーマID毎に、ステップS501で収集された投稿(投稿1、投稿2、・・・)が列挙されており、それぞれの投稿に対して、「所定の操作が行われた回数」、及び「所定の操作を行ったユーザID」が示されている。
FIG. 7 is a diagram for explaining an example of processing of the account specifying unit according to the embodiment.
In the example of FIG. 7, the posts (post 1,
アカウント特定部402は、投稿毎に、所定の操作(例えばリツイート)を行ったアカウントのユーザIDを、例えば、SNSサーバ103からWebAPI421を用いて取得し、図7の「所定の操作を行ったユーザID」に記憶する。これにより、各投稿に対して所定の操作を行ったユーザIDが特定される。なお、ユーザIDはアカウントの一例である。また、図7の例では、各投稿に対して所定の操作が行われた回数が多い順番に、収集された投稿が並べられているが、これは好適な一例であり、必須ではない。
For each posting, the
図7の例では、ユーザID「user001」、及び「user004」のアカウントは、複数の投稿に対して所定の操作を行っていることから、テーマID「T0001」のテーマ(インテリア)において、頻出するアカウントであると推定することができる。 In the example of FIG. 7, the accounts with the user IDs “user001” and “user004” frequently perform in the theme (interior) of the theme ID “T0001” because a predetermined operation is performed on a plurality of posts. Can be presumed to be an account.
ステップS503において、情報提供サーバ101の代表アカウント決定部403は、ステップS502で特定されたアカウントの中から、所定の操作(例えばリツイート)を行った回数に基づいて、各テーマにおける複数の代表アカウントを決定する。
In step S503, the representative
図8は、一実施形態に係る代表アカウント決定部の処理の例を説明するための図である。図8の例では、テーマ毎に、所定の操作(例えばリツイート)を行った回数が多い順にユーザIDが並べられている。なお、「所定の操作を行った回数」は、図7の「所定の操作を行ったユーザID」に登場した回数等であっても良いし、代表アカウント決定部403が、例えば、SNSサーバ103からWebAPI421を用いて取得するものであっても良い。
FIG. 8 is a diagram for explaining an example of processing of the representative account determination unit according to the embodiment. In the example of FIG. 8, user IDs are arranged in descending order of the number of times that a predetermined operation (for example, retweet) has been performed for each theme. Note that the “number of times that the predetermined operation has been performed” may be the number of times the user has appeared in the “user ID that has performed the predetermined operation” in FIG. 7, or the representative
代表アカウント決定部403は、例えば、図8において、所定の操作を行った回数が多いユーザID(アカウント)から順に所定の数(例えば、70人〜100人程度)のユーザIDを、各テーマにおける複数の代表アカウントとして決定する。
For example, in FIG. 8, the representative
ステップS504において、情報提供サーバ101の情報抽出部404は、SNSサーバ103が提供するSNS等で公開された情報の中から、ステップS503で決定された複数の代表アカウントによって所定の操作が行われた情報を抽出する。
In step S504, the
図9は、一実施形態に係る情報抽出部の処理の例を説明するための図である。図9(a)の例では、公開された投稿全体の中から、所定の操作を行った、テーマ毎の代表アカウントの数が多い順に投稿が並べられている。 FIG. 9 is a diagram for explaining an example of processing of the information extraction unit according to an embodiment. In the example of FIG. 9A, posts are arranged in the descending order of the number of representative accounts for each theme that has been subjected to a predetermined operation, from the entire posted posts.
情報抽出部404は、例えば、SNSサーバ103のWebAPI421を利用して、各代表アカウントが所定の操作(例えばリツイート)を行った投稿の情報を取得することができる。情報抽出部404は、各代表アカウントによって所定の操作が行われた投稿の情報を集計することにより、図9(a)に示すような情報を作成する。
The
情報抽出部404は、図9(a)において、複数の代表アカウントによって所定の操作が行われた投稿を、所定の数、例えば、1日あたり約30〜200件程度抽出する。例えば、情報抽出部404は、図9(a)において、所定の操作を行った代表アカウントの数が多い順に、所定の数の投稿を抽出する。
In FIG. 9A, the
このとき、抽出された投稿は、各テーマで頻繁に所定の操作(例えばリツイート)を行っている複数の代表アカウントによって、共通して所定の操作が行われた投稿なので、各テーマに関連する投稿である可能性が高い。また、このとき、抽出された情報には、例えば、図2(b)に示すような、各テーマに関するキーワードが含まれていない投稿や、図2(c)に示すような画像のみの投稿等も含まれる。 At this time, the extracted posts are posts that have been subjected to a predetermined operation in common by a plurality of representative accounts that frequently perform a predetermined operation (for example, retweets) on each theme. Is likely. Also, at this time, the extracted information includes, for example, a post that does not include a keyword related to each theme as shown in FIG. 2B, a post that contains only an image as shown in FIG. Is also included.
このように、本実施形態に係る情報処理システム100によれば、所定のテーマに関するキーワードを含まない投稿を含む複数の投稿の中から、所定のテーマに関する投稿を容易に抽出することができるようになる。
As described above, according to the
また、別の一例として、図9(b)の例では、公開された投稿全体の中から、テーマ毎の代表アカウントによって所定の操作が行われた回数が多い順に投稿が並べられている。情報抽出部404は、例えば、図9(b)に示すように、各テーマの代表アカウントによる所定の操作の回数が多い順に、所定の数の投稿を抽出するもの等であっても良い。
As another example, in the example of FIG. 9B, posts are arranged in descending order of the number of times that a predetermined operation has been performed by the representative account for each theme from among the published posts. For example, as illustrated in FIG. 9B, the
要するに、情報抽出部404は、公開された投稿全体の中から、各テーマの複数の代表アカウントによって所定の操作(例えばリツイート)が行われた投稿を、所定の数だけ抽出するものであれば良い。
In short, the
(情報の提供処理)
図10は、一実施形態に係る情報提供処理の例を示すシーケンス図である。なお、図10の処理の開始時点において、情報提供サーバ101は、図5に示す情報の抽出処理により、各テーマに関連する複数の投稿を抽出し、記憶部406に抽出情報408として記憶しているものとする。また、情報端末102では、情報処理システム100に対応するプログラムが動作しているものとする。
(Information provision process)
FIG. 10 is a sequence diagram illustrating an example of information providing processing according to an embodiment. At the start of the processing in FIG. 10, the
ステップS1001において、情報端末102のユーザは、テーマ選択画面の呼出操作を行う。
In step S1001, the user of the
ステップS1002において、情報端末102は、操作受付部412によりユーザによるテーマ選択画面の呼出操作を受け付けると、表示制御部411により、例えば、図11(a)に示すようなテーマ選択画面1101を情報端末102の表示装置306等に表示させる。
In step S <b> 1002, when the
図11(a)の例では、テーマ選択画面1101には、例えば、図6示すテーマ情報407に対応する複数のテーマ1102が、選択可能に表示されている。
In the example of FIG. 11A, for example, a plurality of
ステップS1003において、ユーザは、テーマの選択操作を行う。ここでは、ユーザは、図9(a)に示すテーマ選択画面1101において、例えば、「インテリア」1103を選択するものとする。
In step S1003, the user performs a theme selection operation. Here, it is assumed that the user selects, for example, “interior” 1103 on the
ステップS1004において、情報端末102の操作受付部412は、ユーザによって選択されたテーマ「インテリア」に対応するテーマID「T0001」を含む、抽出情報の取得要求を、通信I/F307を介して情報提供サーバ101に送信する。
In step S1004, the
ステップS1005において、情報提供サーバ101は、情報端末102から抽出情報の取得要求を受信すると、情報提供部405により、要求されたテーマID「T0001」に対応する抽出情報を、記憶部406の抽出情報408から読み出す。
In step S <b> 1005, when the
ステップS1006において、情報提供サーバ101の情報提供部405は、情報提供サーバ101の通信I/F307を介して、要求元の情報端末102に、抽出した抽出情報(テーマID「T0001」)を送信する。
In step S1006, the
ステップS1007において、情報端末102は、情報提供サーバ101から抽出情報を受信すると、表示制御部411により、受信した抽出情報に基づいて、図12(a)に示すような表示画面1201を、情報端末102の表示装置306等に表示させる。
In step S1007, when the
図12(a)の例では、表示画面1201には、ユーザによって選択されたテーマである「インテリア」に関する複数の投稿が表示されている。この複数の投稿には、例えば、画像のみの投稿1203や、テーマに関するキーワードが含まれていない投稿1204等が含まれる。
In the example of FIG. 12A, the
好ましくは、表示画面1201には、表示画面1201に表示されている投稿に対応する日時を示す表示1202が含まれる。例えば、ユーザは、この日時を示す表示1202を上下にドラッグ、又はスワイプさせることにより表示画面1201をスクロールさせて、他の時刻の投稿を閲覧することができる。また、ユーザは、この日時を示す表示1202を選択(タップ、又は長押し等)することにより、カレンダーの選択画面を呼び出すことができる。
Preferably, the
ステップS1008において、ユーザは、この日時を示す表示1202を選択することにより、カレンダー画面の呼出操作を行う。
In step S1008, the user performs a call operation on the calendar screen by selecting the
ステップS1009において、情報端末102の操作受付部412が、ユーザによるカレンダー画面の読出し操作を受け付けると、表示制御部411は、例えば、図11(b)に示すようなカレンダー画面1104を情報端末102の表示装置306等に表示させる。ユーザは、このカレンダー画面1104で日付を選択することにより、選択された日付に対応する抽出情報を呼び出すことができる。
In step S1009, when the
ステップS1010において、ユーザは、表示されたカレンダー画面1104により、日付の選択操作を行う。
In step S <b> 1010, the user performs a date selection operation using the displayed
ステップS1011において、情報端末102の操作受付部412は、ユーザによって選択された日付、及び現在のテーマID「T0001」を含む、抽出情報の取得要求を、通信I/F307を介して情報提供サーバ101に送信する。
In step S <b> 1011, the
ステップS1012において、情報提供サーバ101は、情報端末102から抽出情報の取得要求を受信すると、情報提供部405により、要求された日付、及びテーマID「T0001」に対応する抽出情報を、記憶部406の抽出情報408から読み出す。
In step S <b> 1012, when the
ステップS1013において、情報提供サーバ101の情報提供部405は、情報提供サーバ101の通信I/F307を介して、要求元の情報端末102に、抽出した抽出情報(指定された日付のテーマID「T0001」)を送信する。
In
ステップSS1014において、情報端末102は、情報提供サーバ101から抽出情報を受信すると、表示制御部411により、受信した抽出情報に基づいて、選択された日付の抽出情報を、情報端末102の表示装置306等に表示させる。
In step SS1014, when the
このように、本実施形態に係る情報処理システムによれば、所定のテーマに関するキーワードを含まない投稿を含む複数の投稿の中から、所定のテーマに関する投稿を抽出し、ユーザに提供することができるようになる。 As described above, according to the information processing system according to the present embodiment, it is possible to extract a post related to a predetermined theme from a plurality of posts including a post that does not include a keyword related to the predetermined theme, and provide it to the user. It becomes like this.
なお、本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく種々の変形や変更が可能である。 Note that the present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims.
例えば、上記の実施形態において、情報提供サーバ101は、外部のSNSサーバ103によって提供される投稿を利用する場合の例について説明を行ったが、情報提供サーバ101は、SNSサーバ103の機能を有していても良い。
For example, in the above embodiment, the
また、情報提供部405は、情報抽出部404によって抽出されたテーマ毎に抽出された投稿に、例えば、図12(b)に示すような、検索用のタグ情報を付与するものであっても良い。図12(b)の例では、投稿1205のコメントには、図2(b)の投稿と同様に、テーマ「インテリア」に関するキーワードが含まれていないが、情報提供部405によって付与された「インテリア」、「家具」等の検索用のタグ情報1206が含まれる。
Further, the
この検索用のタグ情報1206により、テーマに関するキーワードが含まれない、例えば、図2(b)、(c)に示すような投稿を、テーマに関連するキーワードで検索することができるようになる。つまり、所定のテーマに関するキーワードを含まない投稿を含む複数の投稿の中から、所定のテーマに関する投稿を抽出することができるようになる。
This
100 情報処理システム
101 情報提供サーバ
102 情報端末
103 SNSサーバ
401 情報収集部(収集手段)
402 アカウント特定部(特定手段)
403 代表アカウント決定部(決定手段)
404 情報抽出部(抽出手段)
405 情報提供部
DESCRIPTION OF
402 Account identification part (identification means)
403 Representative account determination unit (determination means)
404 Information extraction unit (extraction means)
405 Information Department
Claims (21)
コンピュータが、
前記公開された情報の中から所定の分野に関連する複数の情報を収集する収集ステップと、
前記収集された情報に対して所定の操作を行ったアカウントを特定する特定ステップと、
前記特定されたアカウントの中から、前記所定の操作を行った回数に基づいて前記所定の分野における複数の代表アカウントを決定する決定ステップと、
前記公開された情報の中から、複数の前記代表アカウントによって前記所定の操作が行われた情報を抽出する抽出ステップと、
を含む情報抽出方法。 An information extraction method for extracting predetermined information from information published by a plurality of accounts,
Computer
A collecting step of collecting a plurality of pieces of information related to a predetermined field from the published information;
A specific step of identifying an account that has performed a predetermined operation on the collected information;
A determining step of determining a plurality of representative accounts in the predetermined field based on the number of times the predetermined operation is performed from the identified accounts;
An extraction step of extracting information on which the predetermined operation has been performed by a plurality of the representative accounts from the publicized information;
Information extraction method.
前記公開された情報の中から前記所定の分野に関連するキーワードを含む情報を収集する請求項1に記載の情報抽出方法。 The collecting step includes
The information extraction method according to claim 1, wherein information including a keyword related to the predetermined field is collected from the published information.
前記所定の分野に関するキーワードを含む情報のうち、前記所定の操作が所定の回数以上行われた情報を収集する請求項2に記載の情報抽出方法。 The collecting step includes
The information extraction method according to claim 2, wherein information including the keyword related to the predetermined field is collected by performing the predetermined operation a predetermined number of times or more.
前記収集された情報を再発信、又は再投稿する操作を含む請求項1乃至3のいずれか一項に記載の情報抽出方法。 The predetermined operation is:
The information extraction method according to claim 1, further comprising an operation of retransmitting or reposting the collected information.
前記収集された情報に対してコメントを行う操作を含む請求項1乃至4のいずれか一項に記載の情報抽出方法。 The predetermined operation is:
The information extraction method according to any one of claims 1 to 4, further comprising an operation of commenting on the collected information.
前記収集された情報に、推奨することを示す情報、又はお気に入りであることを示す情報を付与する操作を含む請求項1乃至5のいずれか一項に記載の情報抽出方法。 The predetermined operation is:
The information extraction method according to claim 1, further comprising an operation of adding information indicating recommendation or information indicating a favorite to the collected information.
前記特定ステップによって特定されたアカウントのうち、前記所定の操作を行った回数が多いアカウントを前記複数の代表アカウントとして決定する請求項1乃至6のいずれか一項に記載の情報抽出方法。 The determining step includes
The information extraction method according to any one of claims 1 to 6, wherein, among the accounts specified in the specifying step, an account having a large number of times of performing the predetermined operation is determined as the plurality of representative accounts.
前記公開された情報の中から、前記所定の操作を行った前記代表アカウントの数が多い情報を抽出する請求項1乃至7のいずれか一項に記載の情報抽出方法。 The extraction step includes
The information extraction method according to claim 1, wherein information having a large number of the representative accounts that have performed the predetermined operation is extracted from the disclosed information.
前記公開された情報の中から、前記代表アカウントによって前記所定の操作が行われた回数が多い情報を抽出する請求項1乃至7のいずれか一項に記載の情報抽出方法。 The extraction step includes
The information extraction method according to any one of claims 1 to 7, wherein information having a large number of times the predetermined operation is performed by the representative account is extracted from the disclosed information.
前記公開された情報の中から所定の分野に関連する複数の情報を収集する収集手段と、
前記収集された情報の各々に対して所定の操作を行ったアカウントを特定する特定手段と、
前記特定されたアカウントの中から、前記所定の操作を行った回数に基づいて前記所定の分野における複数の代表アカウントを決定する決定手段と、
前記公開された情報の中から、複数の前記代表アカウントによって前記所定の操作が行われた情報を抽出する抽出手段と、
を有する情報処理装置。 An information processing apparatus that processes information published by a plurality of accounts,
A collecting means for collecting a plurality of pieces of information related to a predetermined field from the disclosed information;
Identifying means for identifying an account that has performed a predetermined operation on each of the collected information;
Determining means for determining a plurality of representative accounts in the predetermined field based on the number of times the predetermined operation is performed from among the specified accounts;
Extraction means for extracting information on which the predetermined operation has been performed by a plurality of the representative accounts from the published information;
An information processing apparatus.
前記公開された情報の中から前記所定の分野に関連するキーワードを含む情報を収集する請求項12に記載の情報処理装置。 The collecting means includes
The information processing apparatus according to claim 12, wherein information including a keyword related to the predetermined field is collected from the disclosed information.
前記所定の分野に関するキーワードを含む情報のうち、前記所定の操作が所定の回数以上行われた情報を収集する請求項13に記載の情報処理装置。 The collecting means includes
The information processing apparatus according to claim 13, wherein information including a keyword related to the predetermined field is collected for information on which the predetermined operation is performed a predetermined number of times.
前記収集された情報を再発信、又は再投稿する操作を含む請求項12乃至14のいずれか一項に記載の情報処理装置。 The predetermined operation is:
The information processing apparatus according to any one of claims 12 to 14, including an operation of retransmitting or reposting the collected information.
前記収集された情報に対してコメントを行う操作を含む請求項12乃至15のいずれか一項に記載の情報処理装置。 The predetermined operation is:
The information processing apparatus according to claim 12, further comprising an operation for commenting on the collected information.
前記収集された情報に、推奨することを示す情報、又はお気に入りであることを示す情報を付与する操作を含む請求項12乃至16のいずれか一項に記載の情報処理装置。 The predetermined operation is:
The information processing apparatus according to any one of claims 12 to 16, comprising an operation of adding information indicating recommendation or information indicating favorite to the collected information.
前記特定手段によって特定されたアカウントのうち、前記所定の操作を行った回数が多いアカウントを前記複数の代表アカウントとして決定する請求項12乃至17のいずれか一項に記載の情報処理装置。 The determining means includes
The information processing apparatus according to any one of claims 12 to 17, wherein among the accounts specified by the specifying means, an account having a large number of times of performing the predetermined operation is determined as the plurality of representative accounts.
前記公開された情報の中から、前記所定の操作を行った前記代表アカウントの数が多い情報を抽出する請求項12乃至18のいずれか一項に記載の情報処理装置。 The extraction means includes
The information processing apparatus according to any one of claims 12 to 18, wherein information having a large number of the representative accounts that have performed the predetermined operation is extracted from the published information.
前記公開された情報の中から、前記代表アカウントによって前記所定の操作が行われた回数が多い情報を抽出する請求項12乃至19のいずれか一項に記載の情報処理装置。 The extraction means includes
The information processing apparatus according to any one of claims 12 to 19, wherein information having a large number of times the predetermined operation is performed by the representative account is extracted from the disclosed information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015143607A JP2017027265A (en) | 2015-07-21 | 2015-07-21 | Information extraction method, information processing device, information processing system and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015143607A JP2017027265A (en) | 2015-07-21 | 2015-07-21 | Information extraction method, information processing device, information processing system and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017027265A true JP2017027265A (en) | 2017-02-02 |
Family
ID=57950526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015143607A Pending JP2017027265A (en) | 2015-07-21 | 2015-07-21 | Information extraction method, information processing device, information processing system and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017027265A (en) |
-
2015
- 2015-07-21 JP JP2015143607A patent/JP2017027265A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10733226B2 (en) | Systems and methods for a scalable collaborative, real-time, graphical life-management interface | |
US9531803B2 (en) | Content sharing interface for sharing content in social networks | |
KR101667220B1 (en) | Methods and systems for generation of flexible sentences in a social networking system | |
JP6639528B2 (en) | System and method for creating a call-to-action on social networking system resources | |
JP6164808B2 (en) | Recommended share box | |
KR20170091142A (en) | Web content tagging and filtering | |
US10681169B2 (en) | Social plugin reordering on applications | |
KR20170100640A (en) | Provides translation of electronic messages through social network systems | |
US9350817B2 (en) | Recording a hyper text transfer protocol (HTTP) session for playback | |
CA2896819A1 (en) | Identifying business type using public information | |
US10382500B2 (en) | Systems and methods for binding online content accounts | |
WO2014184745A1 (en) | Automatic website generation | |
US20160275167A1 (en) | Arranging and displaying content from a social media feed based on relational metadata | |
US20190034534A1 (en) | Automatically Generating Multi-Image Posts on Online Social Networks | |
JP2017016294A (en) | Information processing device, control method thereof, and program | |
CN113841140A (en) | Determining and utilizing actual goals of a user-merged collection of electronic content items | |
JP6659700B2 (en) | System and method for creating, selecting, presenting, and performing a call-to-action | |
JP5925324B2 (en) | Social network report | |
JP2017027265A (en) | Information extraction method, information processing device, information processing system and program | |
JP2017084049A (en) | Information provision device and information provision program | |
JP6817612B2 (en) | Donation support system and donation support method | |
JP2015076089A (en) | Server device, method, and system | |
US20160034174A1 (en) | System and method for single-touch engagement with social media and other sites | |
JP2017033058A (en) | Mail transmission device, and mail transmission program | |
JP2014215796A (en) | Information processing apparatus, and program |