WO2013094352A1 - ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。 - Google Patents

ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。 Download PDF

Info

Publication number
WO2013094352A1
WO2013094352A1 PCT/JP2012/079751 JP2012079751W WO2013094352A1 WO 2013094352 A1 WO2013094352 A1 WO 2013094352A1 JP 2012079751 W JP2012079751 W JP 2012079751W WO 2013094352 A1 WO2013094352 A1 WO 2013094352A1
Authority
WO
WIPO (PCT)
Prior art keywords
message
user
computer
messages
sent
Prior art date
Application number
PCT/JP2012/079751
Other languages
English (en)
French (fr)
Inventor
洋平 伊川
美紀 榎
ルディー・レイモンド・ハリー・プテラ
哲哉 那須川
Original Assignee
インターナショナル・ビジネス・マシーンズ・コーポレーション
日本アイ・ビー・エム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターナショナル・ビジネス・マシーンズ・コーポレーション, 日本アイ・ビー・エム株式会社 filed Critical インターナショナル・ビジネス・マシーンズ・コーポレーション
Priority to CN201280062968.6A priority Critical patent/CN104011718B/zh
Priority to GB1409114.4A priority patent/GB2511235A/en
Priority to US14/363,323 priority patent/US9705837B2/en
Priority to JP2013550184A priority patent/JP5602958B2/ja
Priority to DE112012005344.3T priority patent/DE112012005344T5/de
Publication of WO2013094352A1 publication Critical patent/WO2013094352A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/234Monitoring or handling of messages for tracking messages

Definitions

  • the present invention relates to information processing technology, and more particularly to technology for detecting burst information in social media (information spreading at a different scale than usual) more accurately and earlier.
  • burst information includes information (such as hoax, reputation, etc.) that is different from the fact, and in some cases can be a threat to business activities. Therefore, a technique for detecting the “burst” phenomenon with high accuracy and at an early stage is required.
  • Patent Document 1 has a problem of “providing a technology that can extract reputation information from information published on the network and simultaneously extract information related to the information and present it to the user”.
  • Data collection means 1 that receives data published from server devices on the network and stores them as collected data in the collected data storage means, and extracts character strings included in the collected data, based on the character strings
  • a reputation information determination means for obtaining a determination result as to whether or not the collected data is reputation information, reputation information data determined as reputation information, an author of the reputation information data, or contents of the reputation information data, or stored.
  • Related information data related to at least one of the name or network address of the server device and the file information of the reputation information data.
  • Non-Patent Document 1 proposes a technique for detecting whether or not there is a burst by evaluating the degree of increase in the attention word.
  • the present invention has been made in view of such problems, and one of its purposes is to take into account the characteristics of the person sending the information and the content of the information, so that the “burst” phenomenon can be accurately performed.
  • the object is to provide a technique capable of early detection.
  • Diffusibility varies depending on the influence of the sending user (information sent by a high-impact user is more likely to be re-sent).
  • the possibility of spreading differs depending on the frequency of the user's re-transmission (the importance at the time of re-transmission differs between the user who just re-sends and the user who hardly re-sends).
  • the possibility of recurrence varies depending on the specificity of the information (when information of contents different from usual is retransmitted, there is a high possibility that information is diffused), and the present invention was made. Is. Specifically, the following means are adopted.
  • the present invention provides a method for selecting a specific message group from a plurality of messages transmitted by a plurality of users on social media by a computer.
  • the message includes a message retransmitted by another user by citing a message transmitted by one user.
  • the method includes a step of performing a primary evaluation on the possibility of further re-transmission of a message re-transmitted by the other user by quoting a message transmitted by the one user, and a result of the primary evaluation is determined in advance.
  • the retransmitted message group based on the step of identifying the one user who has transmitted a message higher than a defined first threshold and the retransmitted message group by citing the message transmitted by the one user
  • the possibility of further re-transmission can be calculated as an increasing function of the influence degree of the other user. More specifically, the degree of influence of the other users can be calculated as an increasing function of the number of users following the other users. Further, in the primary evaluation or the secondary evaluation step, the possibility of further re-transmission is calculated as a decreasing function of the degree that the other user re-transmits a message that quoted the message of the one user in the past. can do. More specifically, the degree of the re-transmission can be calculated as the number of times that the other user re-transmits a message that quotes the message of the one user during a certain past period.
  • the possibility of further re-transmission is based on the contents of the message re-transmitted by the other user and the message transmitted by the other user in the past. It can be calculated as a decreasing function of similarity. More specifically, the similarity is calculated by character string matching a message retransmitted by the other user and a message transmitted by the other user in the past, or by sentence clustering. It can be calculated.
  • the message may be a message sampled under a predetermined condition from a message posted on the social media.
  • the message may be a message sampled under a condition including a predetermined keyword among messages posted to the social media within a predetermined period.
  • the social media may be a microblog.
  • a computer that hosts the social media and a computer that selects the specific message group are connected via a network, and the host is responsive to the predetermined conditional request from the selecting computer. It may be configured to further include a step of receiving the message transmitted from the computer by the selecting computer. In addition, the method may further include a step of storing the received message in a storage unit of the selected computer.
  • the “burst” phenomenon can be detected with high accuracy and earlyness by taking into account the characteristics of the person sending the information and the content of the information.
  • FIG. 1 is a conceptual diagram illustrating a microblogging system as an example of social media.
  • This system includes a microblog server 2 and a user terminal, which are connected to each other via the Internet 4 so as to communicate with each other.
  • the user terminal any form of computer having a communication function can be adopted.
  • a personal data assistant PDA, personal digital assistant
  • on-vehicle computer netbook, etc. (not shown) can be employed. .
  • FIG. 2 is a conceptual diagram for explaining the follow / follow relationship of a microblog.
  • the microblog user can register in advance friends, acquaintances, and other users who have common interests and interests, and can automatically receive messages sent by them. Such registration is referred to as “follow”, and the follow relationship includes a relationship in which users follow each other and a relationship in which one user unilaterally follows another user.
  • the arrow in FIG. 2 indicates that the user AAA and the user BBB are following each other, the user BBB is unilaterally following the user CCC, and the user CCC is unilaterally following the user AAA.
  • FIG. 3 illustrates a smartphone 31 as a user terminal and its screen display as an example.
  • a microblog application screen is displayed, and the application screen is divided into a home portion 311, a timeline portion 312, and an operation portion 313 from the top.
  • the home portion displays a menu button and that the timeline portion 312 is the user AAA timeline.
  • message portions 312a and 312b of the user AAA and a message portion 312c of the user BBB are displayed in order from the top.
  • These message parts 312a to 3c are displayed in time series. That is, the uppermost remark part 312a corresponds to the latest message.
  • FIG. 4 illustrates the data structure of data stored in the hard disk devices 20 and 21 in the microblog server 2.
  • the transmission date and time (created_at) indicating the date and time when each message was transmitted
  • the message ID (id) specifying each message
  • the message is stored. It includes a user ID (user_id) that identifies the user who made the call and a text that is the content of the message. Note that the text can have a character limit (for example, 140 characters or less).
  • the user relationship table FIG.
  • FIG. 5 explains the types of messages to be transmitted.
  • FIG. 5A illustrates a normal message.
  • the user AAA sends a message to his / her timeline, and these messages are displayed on the timeline of the user AAA and the user following the user AAA (user BBB and user CCC in the example of FIG. 2). Is done.
  • FIG. 5B illustrates the reply message.
  • the reply message is a reply to a specific message and is displayed on the timeline of the user who follows him / herself.
  • the user BBB is, as a reply to the user AAA of the message, "Hi, hello.” Originated the reply message, the reply message to another user BBB person, the user (FIG. 2, which are following the user BBB In the example, it is displayed on the timeline of the user AAA).
  • FIG. 5C and FIG. 5D both illustrate the reprint message, and the user CCC's original message “Started microblogging” of the user AAA displayed on his timeline.
  • a re-transmission message is shown as a re-transmission.
  • the reprint message is displayed on the timeline of the user who is following the user CCC (user BBB in the example of FIG. 2).
  • the name is displayed with the name of the user CCC to be transferred.
  • FIG. 5E illustrates the quote message.
  • User CCC quotes user AAA's original message “I started microblogging” as displayed on his timeline, and then enters his comment “Welcome!” Show. This quote message is displayed on the timeline of the user following the user CCC.
  • FIG. 6 is a block diagram illustrating the hardware configuration of the personal computer 1.
  • the hardware configuration of the computer 1 includes a (low-speed and high-speed) bus 10, a CPU (arithmetic control device) 11 connected to the bus 10, a RAM (random access memory: storage device) 12, a ROM (read-only memory).
  • a memory (storage device) 13, an HDD (hard disk drive: storage device) 14, a communication interface 15, and an input / output interface 16 are provided.
  • a mouse 17 connected to the input / output interface 16, a flat panel display (display device) 18, a keyboard 19 and the like are provided.
  • the computer 1 has been described as adopting a general personal computer architecture, for example, the CPU 11 and the HDD 14 can be multiplexed in order to obtain higher data processing capability and availability. In addition to the desktop type, various types of computer systems can be employed.
  • the software configuration of the computer 1 includes an operating system (OS) that provides basic functions, application software that uses the functions of the OS, and driver software for input / output devices. These pieces of software are loaded onto the RAM 12 together with various data and executed by the CPU 11 or the like, and the computer 1 executes the processing shown in FIG. 7 as a whole.
  • OS operating system
  • driver software driver software for input / output devices.
  • FIG. 7 is a flowchart for explaining processing executed by the computer 1.
  • a condition is transmitted from the computer 1 to the microblog server 2 (S1).
  • the condition may be, for example, specifying a period during which the message is transmitted, specifying a message including a specific keyword in the message, or specifying only a retransmitted message. These may be combined.
  • the computer 1 receives data of a message group that meets the above conditions from the microblog server 2 (S2).
  • S2 receives data of a message group that meets the above conditions from the microblog server 2 (S2).
  • message group data see FIG. 4A
  • user data associated with those messages see FIG. 4B
  • FIG. 8 explains the formulation that is a precondition for calculating the possibility of re-transmission.
  • the retransmitted message means the above-mentioned reprint message (FIGS. 5C and 5D) and the quote message (FIG. 5E). Since the reprint message and the quote message in the first mode shown in FIG.
  • the information is referred to, for example, the message ID (see FIG. 4A).
  • the message ID By setting a message ID indicating it, such as including the user ID of the former user si, the reprint message and the quote message of the first aspect can be specified.
  • the reprint message of the second mode shown in FIG. 5D is not an official function prepared by the server 2 side, in order to specify this, the unique message displayed in the content of the reprint message of the second mode is shown.
  • the reprint message and the information reference source user si in the second mode can be specified using the character string of “RT @”, for example.
  • FIG. 9 illustrates a period Tp (T) that is earlier than the period T for evaluating the spread possibility in the period T.
  • the information transmitted by the user si is retransmitted as the message mi in the period T
  • the spread possibility burst m (mi) of the message mi is defined by the following equation.
  • centrality (u, T) indicates the centrality of user u in period T.
  • centrality (u, T) can be calculated using various existing centralities (such as proximity centrality) in G (T).
  • degree centrality the number of other users following each user
  • centrality (u, T) takes log e (#followers).
  • ref (u ⁇ > s, T) indicates the degree to which the user u refers to the information transmitted by the user s in the period T.
  • ref (u ⁇ > s, T) means whether or not the user u retransmits with reference to the user s in the period T, and takes [0, 1].
  • sim (C, c) indicates the similarity between the content set C (uppercase) and the content c (lowercase). Specifically, sim (C, c) can be calculated using a cosine similarity or the like in the vector space model, and takes [0, 1]. That is, in a vector space model, a document is expressed as a multidimensional vector of words (such as nouns).
  • the similarity between two documents can be calculated as the similarity between vectors.
  • the cosine similarity is a cosine (cos ⁇ ) of an angle ⁇ formed by two document vectors.
  • the cosine similarity is 1 when the two vectors match completely.
  • an arbitrary function that increases in accordance with the degree of similarity can be set, and the numerical range does not have to be 0 to 1.
  • C (u, T) represents a set of blog contents transmitted by the user u during the period T.
  • is a constant that determines the influence of ref.
  • 5.
  • the spreading degree burst m (mi) of the message mi sent in the period T is obtained by the following equation.
  • a similar message group is clustered based on a message set obtained by re-sending a message sent by the identified user (S5). That is, the user S b is detected and is transmitting burst information in the period T b.
  • M (s, T) ⁇ m i
  • t i ⁇ T, s i s ⁇
  • the information sent by user s is re-sent in period T.
  • One is a method by string matching.
  • a message group having the possibility equal to or greater than the second threshold is output (S7). That is, if burst M (M j ) is greater than or equal to a certain threshold (second threshold), it is detected as burst information.
  • the invention can take the form of an entirely hardware embodiment, an entirely software embodiment or an embodiment containing both hardware and software elements.
  • the invention is implemented in software, including but not limited to firmware, resident software, microcode, parsing picocode, and the like.
  • the present invention can also take the form of a computer program or computer-readable medium comprising program code for use by or in connection with a computer or any instruction execution system.
  • a computer-readable medium is any apparatus that can contain, store, communicate, propagate, or transmit a program for use by or in connection with any instruction execution system, apparatus, or device. It can be.
  • the syntax analysis control module described above constitutes an instruction execution system or “computer” in this sense.
  • the medium can be an electronic, magnetic, optical, electromagnetic, infrared, or semiconductor system (or apparatus or device) or a propagation medium.
  • Examples of computer readable media include semiconductor or solid state memory, magnetic tape, removable computer diskette, random access memory (RAM), read-only memory (ROM), rigid magnetic disk. And optical discs. Current examples of optical disks include compact disk read only memory (CD-ROM: compact disk read only memory), compact disk read / write (CD-R / W) memory, DVD Is included.
  • a data processing system suitable for storing and / or executing program code may include at least one processor coupled directly or indirectly to memory elements through a system bus. This memory element contains at least some of the local memory used in the actual execution of the program code, the bulk storage, and the number of times it must be read from the bulk storage during execution.
  • the program code can include a cache memory that provides temporary storage.
  • I / O devices can be coupled to the system either directly or via an intermediary I / O controller.
  • a network adapter to the system so that the data processing system can be connected to other data processing systems or remote printers or storage devices via an intermediary private or public network.
  • Modems, cable modems, and Ethernet cards are just a few of the currently available network adapters.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

 【課題】 ソーシャル・メディアにおけるバースト情報(通常とは異なる規模で拡散している情報)をより精度良く、より早期に検出する。 【解決手段】 ソーシャル・メディアにおいて、複数のユーザが発信する複数のメッセージの中から、特定のメッセージ群を選択する方法を提案する。ここで、前記メッセージには、一のユーザが発信したメッセージを引用して他のユーザが再発信するメッセージを含むものとする。本方法は、前記一のユーザが発信したメッセージを引用して前記他のユーザが再発信するメッセージについて、更に再発信される可能性を一次評価するステップと、前記一次評価の結果が予め定められた第一閾値よりも高いメッセージを発信した前記一のユーザを特定するステップと、前記一のユーザが発信したメッセージを引用して再発信したメッセージ群に基づいて、前記再発信したメッセージ群に類似するメッセージ群を特定するステップと、前記類似するメッセージ群が、更に再発信される可能性を二次評価するステップと、前記二次評価の結果が予め定められた第二閾値よりも高いメッセージ群を選択するステップとを備える。

Description

ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。
 本発明は、情報処理技術に関係し、より詳しくは、ソーシャル・メディアにおけるバースト情報(通常とは異なる規模で拡散している情報)をより精度良く、より早期に検出する技術に係る。
自然災害や社会的に大きな事件が発生すると、ソーシャル・メディア上でその情報が非常に素早く、大規模に拡散される現象が存在し、その現象を「バースト」現象と呼ぶ場合がある。このようなバースト情報の中には、事実とは異なる情報(デマ、風評など)が含まれ、場合によっては企業活動への脅威となり得る。したがって、「バースト」現象を精度良く、早期に検出する技術が求められる。
このような要請に対して、従来からいくつかの技術が提案されてきた。例えば、特許文献1には、「ネットワーク上で公開されている情報から風評情報を取り出すと共に、同時にそれに関連する情報を抽出してユーザに同時に提示可能な技術を提供すること」を課題とし、「ネットワーク上のサーバ装置から公開されているデータを受信して収集データ記憶手段に各々収集データとして格納するデータ収集手段1と、該収集データに含まれる文字列を抽出して、該文字列に基づいて該収集データが風評情報か否かの判定結果を得る風評情報判定手段、風評情報と判定された風評情報データと、その風評情報データの著作者、又は該風評情報データのコンテンツ、又は格納されるサーバ装置の名称若しくはネットワークアドレス、又は該風評情報データのファイル情報の少なくともいずれかが関連する関連情報データをネットワーク上のサーバ装置、又は予め蓄積した関連情報データベースから抽出する関連情報データ抽出手段と、風評情報データと、該関連情報データとを同時に出力する出力手段とを備える」技術が提案されている。また、非特許文献1には、注目語の増加度合いを評価してバーストかどうかを検知する技術が提案されている。
特開2008-165598号公報
J. Kleinberg: Bursty and HierarchicalStructure in Streams, Proceeding of the 8th ACM SIGKDD International Conferenceon Knowledge Discovery and Data Mining, (2002)
しかし、「バースト」現象を精度良く、早期に検出するには、さらなる改良の余地がある。
本発明はこのような課題に鑑みてなされたものであり、その目的の一つは、情報を発信している人の特徴や情報の内容により配慮することで、「バースト」現象を精度良く、早期に検出することができる技術を提供することにある。
すなわち、本発明者らの研究の過程で、1.発信するユーザの影響力によって拡散可能性は異なる(影響力の高いユーザが発信した情報はより再発信されやすい)、2.ユーザが再発信する頻度によって拡散可能性は異なる(再発信ばかりしているユーザと、ほとんど再発信しないユーザでは、再発信時の重要性が異なる)、3.情報の特異性によって再発散可能性は異なる(普段と異なる内容の情報を再発信した場合に、情報拡散が行われている可能性が高い)、という知見を得るに至り、本発明をなしたものである。具体的には、以下の、手段を採用する。
すなわち、本発明は、コンピュータにより、ソーシャル・メディアにおいて、複数のユーザが発信する複数のメッセージの中から、特定のメッセージ群を選択する方法を提供するものである。ここで、前記メッセージには、一のユーザが発信したメッセージを引用して他のユーザが再発信するメッセージを含むものとする。そして、本方法は、前記一のユーザが発信したメッセージを引用して前記他のユーザが再発信するメッセージについて、更に再発信される可能性を一次評価するステップと、前記一次評価の結果が予め定められた第一閾値よりも高いメッセージを発信した前記一のユーザを特定するステップと、前記一のユーザが発信したメッセージを引用して再発信したメッセージ群に基づいて、前記再発信したメッセージ群に類似するメッセージ群を特定するステップと、前記類似するメッセージ群が、更に再発信される可能性を二次評価するステップと、前記二次評価の結果が予め定められた第二閾値よりも高いメッセージ群を選択するステップとを備える。
ここで、前記一次評価又は二次評価するステップにおいて、前記更に再発信される可能性は、前記他のユーザの影響度の増加関数として演算することができる。より具体的には、前記他のユーザの影響度は、前記他のユーザをフォローするユーザの数の増加関数として演算することができる。また、前記一次評価又は二次評価するステップにおいて、前記更に再発信される可能性は、前記他のユーザが過去に前記一のユーザのメッセージを引用したメッセージを再発信した度合いの減少関数として演算することができる。より具体的には、前記再発信した度合いは、前記他のユーザが過去の一定期間に前記一のユーザのメッセージを引用したメッセージを再発信した回数として演算することができる。さらに、前記一次評価又は二次評価するステップにおいて、前記更に再発信される可能性は、前記他のユーザが再発信したメッセージと前記他のユーザがそれよりも過去に発信したメッセージとの内容の類似度の減少関数として演算することができる。より具体的には、前記類似度は、前記他のユーザが再発信したメッセージと前記他のユーザがそれよりも過去に発信したメッセージとを文字列マッチングすることにより演算すること、又は文章クラスタリングにより演算することができる。
 なお、前記メッセージは、前記ソーシャル・メディアに投稿されたメッセージから所定の条件の下にサンプリングされたメッセージとすることができる。また、前記メッセージは、前記ソーシャル・メディアに所定の期間内に投稿されたメッセージのうち、所定のキーワードを含む条件の下にサンプリングされたメッセージとすることができる。さらに、前記ソーシャル・メディアがマイクロブログであってもよい。
さらに、前記ソーシャル・メディアをホストするコンピュータと、前記特定のメッセージ群を選択するコンピュータとがネットワークを介して接続され、前記選択するコンピュータからの前記所定の条件付き要求に応答して、前記ホストするコンピュータから送信される前記メッセージを前記選択するコンピュータが受信するステップを更に備えるように構成することもできる。また、前記受信した前記メッセージを、前記選択するコンピュータの記憶手段に記憶するステップを更に備えることもできる。
 本発明をこれらコンピュータ・プログラム、コンピュータ・システムとして把握した場合にも、上述した本発明を方法として把握した場合と実質的に同一の技術的特徴を備える事ができるのは当然である。
 本発明によれば、情報を発信している人の特徴や情報の内容により配慮することで、「バースト」現象を精度良く、早期に検出することができる。
マイクロブログのシステムを説明する概念図 マイクロブログのフォロー・被フォロー関係を説明する概念図 ユーザ端末としてのスマートフォンとその画面表示の説明図 マイクロブログ・サーバ内のハードディスク装置内に記憶されているデータのデータ構造の説明図 発信されるメッセージの種類の説明図 コンピュータのハードウェア構成を説明するブロック図 このコンピュータが実行する処理を説明するフローチャート 再発信される可能性を演算する前提となる、定式化の説明図 期間Tよりも過去の期間Tp(T)の説明図
実施形態
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて(特段の断りのない限り)同じ要素には同じ番号を付している。
図1は、ソーシャル・メディアの一例として、マイクロブログのシステムを説明する概念図である。本システムは、マイクロブログ・サーバ2と、ユーザ端末とを含み、これらはインタネット4を介して互いに通信可能に接続されている。また、ユーザ端末としては、通信機能を備えたあらゆる形態のコンピュータを採用することができる。例えば、図示するスマートフォン31、タブレット32、(ノート型)パーソナル・コンピュータ33の他にも、図示しないパーソナル・データ・アシスタント(PDA、携帯情報端末)、車載コンピュータ、ネットブック等を採用することができる。
図2は、マイクロブログのフォロー・被フォロー関係を説明する概念図である。マイクロブログのユーザは、友人、知人、興味や関心の共通する他のユーザを予め登録しておくことができ、彼らの発信するメッセージを自動的に受信することができる。このような登録を“フォロー”と呼び、フォローの関係は、ユーザ同士が相互にフォローし合う関係、一のユーザが他のユーザを一方的にフォローする関係が存在する。例えば、図2における矢印は、ユーザAAAとユーザBBBとは相互にフォローし合っており、ユgーザBBBはユーザCCCを一方的にフォローしており、ユーザCCCはユーザAAAを一方的にフォローしていることを示す。
図3は、一例として、ユーザ端末としてのスマートフォン31とその画面表示を説明するものである。このスマートフォン31のタッチスクリーンには、マイクロブログ・アプリケーションの画面が表示されており、当該アプリケーション画面は、上から順に、ホーム部分311、タイムライン部分312、操作部分313に分かれている。ホーム部分には、メニューボタンと、タイムライン部分312がユーザAAAのタイムラインである旨が表示されている。タイムライン部分312には、上から順に、ユーザAAAのメッセージ部分312a、312b、ユーザBBBのメッセージ部分312cが表示されている。これらのメッセージ部分312a~cは、時系列沿って表示されている。つまり、最上部の発言部分312aが最新のメッセージに対応している。
図4は、マイクロブログ・サーバ2内のハードディスク装置20、21内に記憶されているデータのデータ構造を説明するものである。ハードディスク装置20に記憶されているメッセージテーブル(図4(a))には、各メッセージが発信された日時を示す発信日時(created_at)、各メッセージを特定するメッセージID(id)と、そのメッセージを発信したユーザを特定するユーザID(user_id)と、メッセージの内容であるテキスト(text)を備えている。なお、テキストには文字数制限(例えば、140文字以内等)を設けることができる。一方、ハードディスク装置21に記憶されているユーザ関係テーブル(図4(b))には、フォロー関係を登録した日時を示す登録日時(registered_at)、フォロー元のユーザを特定するフォロー元ユーザID(following_user_id)、フォロー先のユーザを特定するフォロー先ユーザID(followed_user_id)を備えている。
図5は、発信されるメッセージの種類を説明するものである。図5(a)は、通常のメッセージを説明するものである。ここでは、ユーザAAAが自らのタイムラインにメッセージを発信しており、ユーザAAAとユーザAAAをフォローしているユーザ(図2の例ではユーザBBB及びユーザCCC)のタイムラインにこれらのメッセージが表示される。図5(b)は、リプライメッセージを説明するものである。リプライメッセージは、特定のメッセージに対する返事であり、自分と自分をフォローしているユーザのタイムラインに表示される。ここでは、ユーザBBBが、ユーザAAAのメッセージに対する返事として、「やあ、こんにちは。」というリプライメッセージを発信し、そのリプライメッセージはユーザBBB本人の他、ユーザBBBをフォローしているユーザ(図2の例ではユーザAAA)のタイムラインに表示される。
図5(c)及び図5(d)は、いずれも転載メッセージを説明するものであり、ユーザCCCが自分のタイムラインに表示されているユーザAAAの元メッセージ「マイクロブログ始めました。」を転載メッセージとして、再発信する様子を示している。いずれの場合も、ユーザCCCをフォローしているユーザ(図2の例ではユーザBBB)のタイムラインに転載メッセージが表示されるが、図5(c)に示す第一態様の場合は、元のユーザAAAの名前でユーザCCCをフォローしているユーザのタイムラインへ表示されるが、図5(d)に示す第二態様の場合は、転送するユーザCCCの名前で表示される。図5(e)は、引用メッセージを説明するものである。ユーザCCCが自分のタイムライン表示されているユーザAAAの元メッセージ「マイクロブログ始めました。」をそのまま引用し、更に自分のコメント「ようこそ!」を入力して引用メッセージとして、再発信する様子を示している。この引用メッセージは、ユーザCCCをフォローしているユーザのタイムラインに表示される。
 図6は、パーソナル・コンピュータ1のハードウェア構成を説明するブロック図である。コンピュータ1のハードウェア構成は、(低速及び高速の)バス10、バス10に接続されるCPU(演算制御装置)11、RAM(ランダム・アクセス・メモリ:記憶装置)12、ROM(リード・オンリ・メモリ:記憶装置)13、HDD(ハード・ディスク・ドライブ:記憶装置)14、通信インタフェース15、入出力インタフェース16を備えている。さらに、入出力インタフェース16に接続されるマウス17、フラット・パネル・ディスプレイ(表示装置)18、キーボード19等を備えている。なお、コンピュータ1は一般的なパーソナル・コンピュータ・アーキテクチャを採用するものとして説明したが、例えば、より高いデータ処理能力や可用性を求めて、CPU11やHDD14等を多重化することができる。また、デスクトップ型の他、様々なタイプのコンピュータ・システムを採用することができる。
 このコンピュータ1のソフトウェア構成は、基本的な機能を提供するオペレーティング・システム(OS)と、OSの機能を利用するアプリケーション・ソフトウェアと、入出力装置のドライバ・ソフトウェアとを備えている。これらの各ソフトウェアは、各種データと共にRAM12上にロードされ、CPU11等により実行され、コンピュータ1は全体として、図7に示す処理を実行する。
図7は、このコンピュータ1が実行する処理を説明するフローチャートである。まずコンピュータ1からマイクロブログ・サーバ2に対して、条件を送信する(S1)。条件としては、例えば、メッセージが発信された期間を指定するものでもよいし、メッセージ中に特定のキーワードを含むものを指定するものでもよいし、再発信されたメッセージのみを指定するものでもよいし、これらを組み合わせても良い。次に、コンピュータ1はマイクロブログ・サーバ2から上記条件に適合するメッセージ群のデータを受信する(S2)。この際、上記条件に適合するメッセージ群のデータ(図4(a)参照)の他、それらのメッセージに関連付けられるユーザのデータ(図4(b)参照)を併せて受信してもよい。 
次に、各メッセージについて、再発信される可能性を演算する(S3)。図8は、再発信される可能性を演算する前提となる、定式化を説明するものである。ここでは、メッセージ mi を、発信時刻ti, 発信ユーザ ui, 情報参照元ユーザ si,コンテンツci の4つ組として、mi = (ti, ui, si, ci), (i=1, 2, …) と定義する。ここで、再発信されるメッセージとは、上述の転載メッセージ(図5(c)及び図5(d))及び引用メッセージ(図5(e))を意味する。図5(c)に示した第一態様の転載メッセージ及び引用メッセージは、いずれもマイクロブログ・サーバ2側が用意する公式機能であるため、例えば、メッセージID(図4(a)参照)に情報参照元ユーザsiのユーザIDを含める等、それを示すメッセージIDを設定することで、第一態様の転載メッセージ、引用メッセージを特定することができる。一方、図5(d)に示した第二態様の転載メッセージはサーバ2側が用意する公式機能ではないため、これを特定するためには、第二態様の転載メッセージの内容中に表示される固有の文字列、例えば、「RT@」等を用いて、第二態様の転載メッセージ及び情報参照元ユーザ siを特定することができる。
図9は、期間Tにおける拡散可能性を評価するための期間Tよりも過去の期間Tp(T)を説明するものである。ここで、期間Tにおけるマイクロブログ上でのフォロー関係の有向グラフをG(T)=(V(T), E(T)) とする。V(T) は期間Tにおけるユーザの集合、E(T)={e(u, s) | 期間 T においてユーザ u がユーザ sをフォロー} である。
次に、メッセージmiの拡散可能性burstm(mi) の定義を行う。ここで、ユーザ si が発信した情報を、期間 T においてユーザ ui がメッセージmi として再発信したとし、メッセージmi の拡散可能性 burstm(mi) を次式により定義する。

ここで、centrality(u, T)は、ユーザuの期間Tにおける中心度を示す。具体的に、centrality(u,T)は、G(T) における既存の各種中心度(近接中心度等)を利用して算出することができる。ここでは、次数中心性(各ユーザをフォローする他のユーザの数)の自然対数を採用し、centrality(u,T)は、loge(#followers) をとる。また、ref(u->s, T)は、期間Tにおいてユーザuがユーザsの発信した情報を参照した度合いを示す。具体的に、ref(u->s,T)は、期間Tにおいてユーザuがユーザsを参照して再発信したかどうかを意味し、[0,1]をとる。ここでは、期間Tにおいてユーザuがユーザsを参照して再発信していれば1,していなければ0とした。もっとも、参照度合いに応じて増加するような任意の関数を設定することができ、その数値範囲が0から1までである必要もない。また、sim(C, c)は、コンテンツの集合C(大文字)とコンテンツc(小文字)の類似度を示す。具体的に、sim(C, c)は、ベクトル空間モデルにおけるコサイン類似度等を利用して算出することができ、[0,1]をとる。つまり、ベクトル空間モデルにおいて、文書を単語(名詞など)の多次元ベクトルとして表現する。その結果、2つの文書の類似度をベクトルの類似度として算出することができる。ここで、コサイン類似度とは、2つの文書ベクトルの成す角θの余弦(cosθ)となる。コサイン類似度は、2つのベクトルが完全に一致する場合に1となる。もっとも、類似度合いに応じて増加するような任意の関数を設定することができ、その数値範囲が0から1である必要もない。また、C(u,T)は、ユーザuが期間Tに発信したブログのコンテンツの集合を示す。また、αは、refの影響度を定める定数であり、ここでは、α=5とした。さらに、βは、simの影響度を定める定数であり、ここでは、β=5とした。
期間 T に発信されるメッセージ mi の拡散度合いburstm(mi) から、ユーザー s が発信した情報の期間 T における拡散度合いbursts(s, T) を次式により求める。
Figure JPOXMLDOC01-appb-M000002

次に、拡散可能性が第一閾値異常のメッセージの参照元となっているユーザを特定する(S4)。すなわち、期間 Ti (i = 1, 2, … ) に対して得られるbursts(s, Ti) の系列から、非特許文献1に開示の既存手法によりバースト検出を行い、バースト情報を発信しているユーザー s を特定する。つまり、隠れ状態として活性度を持ち、与えられた系列に対して、頻度が高ければより高い活性度へ遷移するようなモデルに基づいて、バースト度合いを判定する。
次に、特定されたユーザが発信したメッセージを再発信したメッセージ集合に基づいて、類似するメッセージ群にクラスタリングする(S5)。すなわち、期間 Tb でユーザー Sb がバースト情報を発信していると検知されたとする。ユーザーs が発信した情報を、期間 T で再発信したメッセージの集合 M(s, T)={mi | ti∈T,si=s} に対して、同じ内容のコンテンツ毎にクラスタ Mj⊆M(s, T) (j=1, 2, …) を作成する。この処理には、例えば以下の2つの方法が適用可能である。一つは、文字列マッチによる方法である。これは、メッセージm ∈M(s, T) のコンテンツに含まれる、ユーザーsb が発信したコンテンツ(図8では「うがい薬が放射線に効くらしい。」)を文字列マッチングにより比較し、一致したメッセージを同じクラスタとする。もう一つは、文書クラスタリングによる方法である。これは、M(sb, Tb) に含まれるコンテンツ集合を、既存の文書クラスタリング手法(例えば、k-means法など)を利用してクラスタリングを行う。
次に、各クラスタ群が、更に再発信される可能性を演算する(S6)。すなわち、クラスタ Mj のコンテンツの拡散度合いburstM(Mj)を次式により求める。 
Figure JPOXMLDOC01-appb-M000003

前記可能性が、第二閾値以上のメッセージ群を出力する(S7)。すなわち、burstM(Mj)がある閾値(第二閾値)以上であれば、バースト情報として検出する。
本発明は、全体がハードウェアの実施形態、全体がソフトウェアの実施形態、またはハードウェアおよびソフトウェア両方のエレメントを包含する実施形態の形を取ることができる。ある好適な実施形態において、本発明は、以下に限らないが、ファームウェア、常駐ソフトウェア、マイクロコード、構文解析ピココードなどを含めた、ソフトウェアに実装される。
 さらに、本発明は、コンピュータまたは任意の命令実行システムによってまたはこれに関連させて使用するプログラム・コードを備えるコンピュータ・プログラム、コンピュータ可読媒体の形態を採ることもできる。本説明目的の上で、コンピュータ可読媒体は、任意の命令実行システム、装置、またはデバイスによってまたはこれに関連させて使用するためのプログラムを、収容、格納、通信、伝搬、または伝送できる任意の装置であり得る。具体的には、前述の構文解析制御モジュールは、この意味で命令実行システム、または「コンピュータ」を構成する。
 媒体は、電子的、磁気的、光学的、電磁気的、赤外的、または半導体のシステム(もしくは装置もしくはデバイス)または伝搬媒体とすることができる。コンピュータ可読媒体の例には、半導体または固体メモリ、磁気テープ、着脱可能コンピュータ・ディスケット、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read-only memory)、剛体磁気ディスク、および光ディスクが含まれる。光ディスクの現時点での例には、コンパクト・ディスク読み取り専用メモリ(CD-ROM:compact disk read only memory)、コンパクト・ディスク読み取り/書き込み(CD-R/W:compact disk read/write)メモリ、およびDVDが含まれる。
 プログラム・コードを格納もしくは実行またはその両方を行うのに適したデータ処理システムは、システム・バスを介して直接的または間接的にメモリ・エレメントに連結された少なくとも一つのプロセッサを含み得る。このメモリ・エレメントには、プログラム・コードの実際の実行の過程で使われるローカル・メモリ、バルク記憶装置、および、実行中にバルク記憶装置から読み出さねばならない回数を低減するために、少なくとも一部のプログラム・コードに一時的保管を提供するキャッシュ・メモリを含めることができる。 
 直接に、あるいは仲介I/Oコントローラを介して、入力/出力またはI/Oデバイス(以下に限らないが、キーボード、ディスプレイ、ポインティング・デバイスなどを含む)をシステムに連結することができる。
 また、ネットワーク・アダプタをシステムに連結し、データ処理システムが、仲介の私有または公衆ネットワークを介して、他のデータ処理システムあるいは遠隔のプリンタまたは記憶デバイスに繋がるようにすることができる。モデム、ケーブル・モデム、およびイーサネット(R)カードは、現在入手可能なネットワーク・アダプタのごく一部である。
1…パーソナル・コンピュータ、
11…CPU(演算制御装置)
12…RAM(ランダム・アクセス・メモリ:記憶装置)
13…ROM(リード・オンリ・メモリ:記憶装置)
14…HDD(ハード・ディスク・ドライブ:記憶装置)
15…通信インタフェース
16…入出力インタフェース
17…マウス
18…フラット・パネル・ディスプレイ(表示装置)
2…マイクロブログ・サーバ
20、21…ハード・ディスク・ドライブ
31…スマートフォン
32…タブレット
33…(ノート型)パーソナル・コンピュータ

Claims (16)

  1. コンピュータにより、ソーシャル・メディアにおいて、複数のユーザが発信する複数のメッセージの中から、特定のメッセージ群を選択する方法であり
    前記メッセージには、一のユーザが発信したメッセージを引用して他のユーザが再発信するメッセージを含み、
    前記方法は、
    前記一のユーザが発信したメッセージを引用して前記他のユーザが再発信するメッセージについて、更に再発信される可能性を一次評価するステップと、
    前記一次評価の結果が予め定められた第一閾値よりも高いメッセージを発信した前記一のユーザを特定するステップと、
    前記一のユーザが発信したメッセージを引用して再発信したメッセージ群に基づいて、前記再発信したメッセージ群に類似するメッセージ群を特定するステップと、
    前記類似するメッセージ群が、更に再発信される可能性を二次評価するステップと、
    前記二次評価の結果が予め定められた第二閾値よりも高いメッセージ群を選択するステップと
    を備える方法。
  2. 前記一次評価又は二次評価するステップにおいて、前記更に再発信される可能性は、前記他のユーザの影響度の増加関数として演算される請求項1に記載の方法。
  3. 前記他のユーザの影響度は、前記他のユーザをフォローするユーザの数の増加関数として演算される請求項2に記載の方法。
  4. 前記一次評価又は二次評価するステップにおいて、前記更に再発信される可能性は、前記他のユーザが過去に前記一のユーザのメッセージを引用したメッセージを再発信した度合いの減少関数として演算される請求項1に記載の方法。
  5. 前記再発信した度合いは、前記他のユーザが過去の一定期間に前記一のユーザのメッセージを引用したメッセージを再発信した回数として演算される請求項4に記載の方法。
  6. 前記一次評価又は二次評価するステップにおいて、前記更に再発信される可能性は、前記他のユーザが再発信したメッセージと前記他のユーザがそれよりも過去に発信したメッセージとの内容の類似度の減少関数として演算される請求項1に記載の方法。
  7. 前記類似度は、前記他のユーザが再発信したメッセージと前記他のユーザがそれよりも過去に発信したメッセージとを文字列マッチングすることにより演算される請求項6に記載の方法。
  8. 前記類似度は、前記他のユーザが再発信したメッセージと前記他のユーザがそれよりも過去に発信したメッセージとを文章クラスタリングすることにより演算される請求項6に記載の方法。
  9. 前記メッセージは、前記ソーシャル・メディアに投稿されたメッセージから所定の条件の下にサンプリングされたメッセージである請求項1に記載の方法。
  10. 前記メッセージは、前記ソーシャル・メディアに所定の期間内に投稿されたメッセージのうち、所定のキーワードを含む条件の下にサンプリングされたメッセージである請求項1に記載の方法。
  11. 前記ソーシャル・メディアをホストするコンピュータと、前記特定のメッセージ群を選択するコンピュータとがネットワークを介して接続され、
    前記選択するコンピュータからの前記所定の条件付き要求に応答して、前記ホストするコンピュータから送信される前記メッセージを前記選択するコンピュータが受信するステップを更に備える請求項10に記載の方法。
  12. 前記受信した前記メッセージを、前記選択するコンピュータの記憶手段に記憶するステップを更に備える請求項11に記載の方法。
  13. 前記ソーシャル・メディアがマイクロブログである請求項1に記載の方法。
  14. コンピュータに実行されることで、請求項1乃至13のいずれかに記載の方法のすべてのステップを前記コンピュータに実行させるコンピュータ・プログラム。
  15. ソーシャル・メディアにおいて、複数のユーザが発信する複数のメッセージの中から、特定のメッセージ群を選択するコンピュータであり
    前記メッセージには、一のユーザが発信したメッセージを引用して他のユーザが再発信するメッセージを含み、
    前記コンピュータの記憶手段には、前記複数のメッセージが記憶されており、
    前記コンピュータの演算制御手段が、
    前記一のユーザが発信したメッセージを引用して前記他のユーザが再発信するメッセージについて、更に再発信される可能性を一次評価し、
    前記一次評価の結果が予め定められた第一閾値よりも高いメッセージを発信した前記一のユーザを特定し、
    前記一のユーザが発信したメッセージを引用して再発信したメッセージ群に基づいて、前記再発信したメッセージ群に類似するメッセージ群を特定し、
    前記類似するメッセージ群が、更に再発信される可能性を二次評価し、
    前記二次評価の結果が予め定められた第二閾値よりも高いメッセージ群を選択する
    コンピュータ。
  16. 前記記憶手段に記憶される前記複数のメッセージは、前記ソーシャル・メディアに投稿されるメッセージからサンプリングされたメッセージである請求項15に記載のコンピュータ。
PCT/JP2012/079751 2011-12-19 2012-11-16 ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。 WO2013094352A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201280062968.6A CN104011718B (zh) 2011-12-19 2012-11-16 用于选择识别的消息组的方法、计算机可读介质和计算机
GB1409114.4A GB2511235A (en) 2011-12-19 2012-11-16 Method, computer program, and computer for detecting trends in social medium
US14/363,323 US9705837B2 (en) 2011-12-19 2012-11-16 Method, computer program and computer for detecting trends in social media
JP2013550184A JP5602958B2 (ja) 2011-12-19 2012-11-16 ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。
DE112012005344.3T DE112012005344T5 (de) 2011-12-19 2012-11-16 Verfahren, Computerprogramm und Computer zum Erkennen von Trends in sozialen Medien

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011276973 2011-12-19
JP2011-276973 2011-12-19

Publications (1)

Publication Number Publication Date
WO2013094352A1 true WO2013094352A1 (ja) 2013-06-27

Family

ID=48668251

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/079751 WO2013094352A1 (ja) 2011-12-19 2012-11-16 ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。

Country Status (6)

Country Link
US (1) US9705837B2 (ja)
JP (1) JP5602958B2 (ja)
CN (1) CN104011718B (ja)
DE (1) DE112012005344T5 (ja)
GB (1) GB2511235A (ja)
WO (1) WO2013094352A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160034426A1 (en) * 2014-08-01 2016-02-04 Raytheon Bbn Technologies Corp. Creating Cohesive Documents From Social Media Messages
US11269943B2 (en) * 2018-07-26 2022-03-08 JANZZ Ltd Semantic matching system and method
WO2020061578A1 (en) * 2018-09-21 2020-03-26 Arizona Board Of Regents On Behalf Of Arizona State University Method and apparatus for collecting, detecting and visualizing fake news

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10143712A1 (de) 2001-08-30 2003-04-10 Europroteome Ag Verfahren, Computersystem und Computerprogrammprodukt zur Datenauswertung
JP4012850B2 (ja) * 2003-02-17 2007-11-21 日本電信電話株式会社 アイテムフィルタリング方法及び装置、アイテム決定方法及び装置、アイテム情報提供装置、コンピュータプログラム及び記録媒体
JP3992640B2 (ja) 2003-04-15 2007-10-17 電気化学工業株式会社 金属ベース回路基板の製造方法
JP5008024B2 (ja) 2006-12-28 2012-08-22 独立行政法人情報通信研究機構 風評情報抽出装置及び風評情報抽出方法
US20120290551A9 (en) * 2009-12-01 2012-11-15 Rishab Aiyer Ghosh System And Method For Identifying Trending Targets Based On Citations
US8595234B2 (en) * 2010-05-17 2013-11-26 Wal-Mart Stores, Inc. Processing data feeds
US20120042020A1 (en) 2010-08-16 2012-02-16 Yahoo! Inc. Micro-blog message filtering
US8473437B2 (en) * 2010-12-17 2013-06-25 Microsoft Corporation Information propagation probability for a social network
US9031888B2 (en) * 2011-08-10 2015-05-12 International Business Machines Corporation Predicting influence in social networks
US8725858B1 (en) * 2011-08-31 2014-05-13 Google Inc. Method and system for selecting content based on a user's viral score
US20140129331A1 (en) * 2012-11-06 2014-05-08 Bottlenose, Inc. System and method for predicting momentum of activities of a targeted audience for automatically optimizing placement of promotional items or content in a network environment

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KIYOTAKA GOTO ET AL.: "''A Proposal of a Method for Searching ''Curators'' Based on Activities on Social Medias''", FIT2010 DAI 9 KAI FORUM ON INFORMATION TECHNOLOGY KOEN RONBUNSHU, SEPARATE VOL.4, SADOKU TSUKI RONBUN - IPPAN RONBUN NETWORK SECURITY UBIQUITOUS MOBILE COMPUTING KYOIKU ? JINBUN KAGAKU JOHO SYSTEM, vol. 4, 20 August 2010 (2010-08-20), pages 271 - 272 *
TAUHID R. ZAMAN ET AL.: "Predicting Information Spreading in Twitter", 31 December 2010 (2010-12-31), pages 1 - 4, Retrieved from the Internet <URL:http://research.microsoft. com/pubs/141866/nips10_twitter_final.pdf> [retrieved on 20121204] *
YUSUKE OTA ET AL.: "Twitter ni Okeru Retweet Keiro no Kasaneawase ni yoru User Hakken Shien", FIT2011 DAI 10 KAI FORUM ON INFORMATION TECHNOLOGY KOEN RONBUNSHU, SEPARATE VOL.4, SADOKU TSUKI RONBUN - IPPAN RONBUN NETWORK SECURITY UBIQUITOUS MOBILE COMPUTING KYOIKU - JINBUN KAGAKU JOHO SYSTEM, vol. 4, 22 August 2011 (2011-08-22), pages 73 - 76 *

Also Published As

Publication number Publication date
DE112012005344T5 (de) 2014-08-28
CN104011718A (zh) 2014-08-27
US20150067078A1 (en) 2015-03-05
GB2511235A (en) 2014-08-27
JP5602958B2 (ja) 2014-10-08
US9705837B2 (en) 2017-07-11
GB201409114D0 (en) 2014-07-09
JPWO2013094352A1 (ja) 2015-04-27
CN104011718B (zh) 2018-01-23

Similar Documents

Publication Publication Date Title
US10275448B2 (en) Automatic question generation and answering based on monitored messaging sessions
US20200357081A1 (en) Social media based recommendation information providing apparatus and method
US10511496B2 (en) Method, system and computer program product for interception, quarantine and moderation of internal communications of uncontrolled systems
US9438689B2 (en) Method and system to determine a member profile associated with a reference in a publication
US8838599B2 (en) Efficient lexical trending topic detection over streams of data using a modified sequitur algorithm
US7827165B2 (en) Providing a social network aware input dictionary
US20130159848A1 (en) Dynamic Personal Dictionaries for Enhanced Collaboration
US10733572B2 (en) Data protection using alerts to delay transmission
US20130191451A1 (en) Presence-based Synchronization
JP5961320B2 (ja) ソーシャル・メデイアにおけるユーザの分類方法、コンピュータ・プログラム及びコンピュータ
US9935793B2 (en) Generating a live chat session in response to selection of a contextual shortcut
RU2595533C2 (ru) Система отображения почтовых вложений на странице веб-почты
JP5893050B2 (ja) ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
US20100114938A1 (en) Search results for a topic that include a list of messaging users that have previously searched on that topic
US20200336501A1 (en) Sensitive data detection in communication data
CN107657029A (zh) 被遗忘的附件的检测方法及装置
US10937033B1 (en) Pre-moderation service that automatically detects non-compliant content on a website store page
US10862838B1 (en) Detecting whether a message is addressed to an intended recipient
JP5602958B2 (ja) ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。
US20140081624A1 (en) Methods, Systems, and Program Products for Navigating Tagging Contexts
WO2018076616A1 (zh) 信息交互方法、服务器、客户端、存储介质及设备
US9830397B2 (en) Method and computer-based system for processing a search query from a user associated with an electronic device
US9438545B2 (en) Message-based collaboration
US20160323227A1 (en) Method and system for providing a user with an indication of an unread e-mail count on a client device
JP2011243078A (ja) 記事管理装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12859597

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2013550184

Country of ref document: JP

Kind code of ref document: A

Ref document number: 1409114

Country of ref document: GB

Kind code of ref document: A

Free format text: PCT FILING DATE = 20121116

WWE Wipo information: entry into national phase

Ref document number: 1409114.4

Country of ref document: GB

WWE Wipo information: entry into national phase

Ref document number: 112012005344

Country of ref document: DE

Ref document number: 1120120053443

Country of ref document: DE

WWE Wipo information: entry into national phase

Ref document number: 14363323

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 12859597

Country of ref document: EP

Kind code of ref document: A1