JP7377126B2 - Information provision system, information provision method, and information provision program - Google Patents

Information provision system, information provision method, and information provision program Download PDF

Info

Publication number
JP7377126B2
JP7377126B2 JP2020026505A JP2020026505A JP7377126B2 JP 7377126 B2 JP7377126 B2 JP 7377126B2 JP 2020026505 A JP2020026505 A JP 2020026505A JP 2020026505 A JP2020026505 A JP 2020026505A JP 7377126 B2 JP7377126 B2 JP 7377126B2
Authority
JP
Japan
Prior art keywords
article
user
recommendation
information
articles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020026505A
Other languages
Japanese (ja)
Other versions
JP2021131715A (en
Inventor
暁彦 杉本
信隆 川口
倫宏 重本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020026505A priority Critical patent/JP7377126B2/en
Publication of JP2021131715A publication Critical patent/JP2021131715A/en
Application granted granted Critical
Publication of JP7377126B2 publication Critical patent/JP7377126B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、例えば、サイバー攻撃に関する脅威情報等の記事をユーザに推奨する技術に関する。 The present invention relates to, for example, a technique for recommending articles such as threat information regarding cyber attacks to users.

近年、サイバー攻撃の発生件数は急増しており、その攻撃手段が複雑化している。そのため、もはや機械的なサイバー攻撃の脅威検知・対策技術だけで、サイバー攻撃の脅威に対抗することが難しくなっており、人が最新の脅威情報を把握して、直接対処していくことが必要になっている。そのため、SOC(Security Operation Center)と呼ばれる組織では、セキュリティを専門とする分析官が集って、自組織や顧客組織への脅威を監視し、人の力でセキュリティ運用を図っている。 In recent years, the number of cyber attacks has increased rapidly, and the attack methods have become more complex. As a result, it is no longer possible to counter the threat of cyber attacks using only mechanical threat detection and countermeasure technology, and it is now necessary for humans to grasp the latest threat information and take direct action. It has become. For this reason, in organizations called SOCs (Security Operation Centers), analysts specializing in security gather to monitor threats to their own organizations and customer organizations, and to implement security operations using human power.

SOCの重要な役割の1つは、世の中に雑多に存在するバラエティに富んだニュース記事の中から脅威情報を探し出し、その脅威情報の通知の必要性を判断して、必要であれば適宜自組織内の各部署や各顧客に対してその脅威情報を通知することである。しかし、雑多に情報が溢れている中、SOCの分析官が1つ1つ情報源を人手で確認して回るのは効率的でない。 One of the important roles of the SOC is to search for threat information from the wide variety of news articles that exist in the world, determine whether it is necessary to notify the threat information, and, if necessary, notify the organization itself. This means notifying each department within the company and each customer of the threat information. However, with so much miscellaneous information overflowing, it is not efficient for SOC analysts to manually check each information source one by one.

そこで、雑多なニュース記事の中から、記事を推奨する技術が必要となっている。特に、SOCでは、顧客のシステム環境等を考慮して通知することが求められており、分析官によって必要となる脅威情報が異なるため、分析官が望むニュース記事の傾向を学習し、記事を推奨する技術が望ましい。 Therefore, there is a need for technology to recommend articles from among a variety of news articles. In particular, SOC is required to provide notifications in consideration of the customer's system environment, etc., and since the threat information required differs depending on the analyst, the SOC learns trends in news articles desired by the analyst and recommends articles. A technology that does this is desirable.

ニュース記事を推奨する技術としては、例えば、ユーザが参照した記事の閲覧履歴を記録し、記事から抽出した特徴語に基づいて、過去にユーザが閲覧した記事との類似度を算定することで、ユーザが関心のある記事に関連する記事として、内容が実質的に重複せず、かつユーザ毎の嗜好・関心に合った関連記事を精度良く推奨する関連記事推奨方法(例えば、特許文献1参照)などが提案されている。 As a technology for recommending news articles, for example, by recording the viewing history of articles referenced by the user and calculating the degree of similarity with articles viewed by the user in the past based on feature words extracted from the articles, A related article recommendation method that accurately recommends related articles that have substantially no overlap in content and that match the preferences and interests of each user as articles that are related to articles that the user is interested in (for example, see Patent Document 1) etc. have been proposed.

特開2010-224623号公報JP2010-224623A

特許文献1に記載された技術では、記事を構成する文章から所定のアルゴリズムに基づいて抽出した特徴語に基づいて、過去にユーザが閲覧した記事との類似度を算定することで、ユーザ毎の嗜好・関心に合った関連記事を推奨する。 The technology described in Patent Document 1 calculates the degree of similarity between articles that the user has viewed in the past based on feature words extracted from the sentences that make up the article based on a predetermined algorithm. Recommends related articles that match your tastes and interests.

しかし、実際の日常業務の中では、ユーザが一時的な雑務などから本業務と関係ない記事を参照する場合やユーザが想定した内容と異なる記事を参照してしまう場合がある。この場合、特許文献1に記載された技術では、ユーザの一時的な雑務などの閲覧履歴に基いて記事を推奨してしまい、本業務と関係のない記事を推奨してしまう懸念がある。 However, in actual daily work, the user may refer to an article unrelated to the main job due to temporary chores or the like, or may refer to an article whose content is different from what the user expected. In this case, with the technology described in Patent Document 1, articles are recommended based on the browsing history of the user's temporary chores, etc., and there is a concern that articles unrelated to the main business may be recommended.

本発明は、上記事情に鑑みなされたものであり、その目的は、ユーザに対して、より精度よく有益な記事を推奨することのできる技術を提供することにある。 The present invention has been made in view of the above circumstances, and its purpose is to provide a technology that can more accurately recommend useful articles to users.

上記目的を達成するため、一観点に係る情報提供システムは、ユーザに対して記事を推奨する情報提供システムであって、前記情報提供システムは、情報を記憶する記憶部と、前記記憶部に接続されたプロセッサ部とを備え、前記記憶部は、複数の記事と、前記ユーザが使用した記事の使用履歴と、SNS(Social Networking Service)に投稿されたメッセージの利用状況を示すメッセージ情報とを記憶し、前記プロセッサ部は、前記記事から特徴情報を抽出し、前記記事の特徴情報に基づいて、前記SNSでの前記記事に関連するメッセージを特定し、前記記事に関連するメッセージの利用状況に基づいて、前記記事の拡散度合いを示す拡散度を算出し、前記記事の特徴情報と、前記記事の拡散度と、前記記事の前記ユーザによる使用履歴とに基づいて、所定の記事について前記ユーザに推奨するか否かを判定する。 In order to achieve the above object, an information providing system according to one aspect is an information providing system that recommends articles to users, and the information providing system includes a storage unit that stores information and a connection to the storage unit. the storage unit stores a plurality of articles, usage history of articles used by the user, and message information indicating usage status of messages posted on SNS (Social Networking Service). The processor section extracts characteristic information from the article, identifies messages related to the article on the SNS based on the characteristic information of the article, and identifies messages related to the article on the SNS based on usage status of messages related to the article. Then, a degree of diffusion indicating the degree of diffusion of the article is calculated, and a given article is recommended to the user based on the characteristic information of the article, the degree of diffusion of the article, and the usage history of the article by the user. Determine whether or not to do so.

本発明によれば、ユーザに対して、より精度よく有益な記事を推奨することができる。 According to the present invention, useful articles can be recommended to the user with higher accuracy.

図1は、第一実施形態に係る脅威情報提供システムの構成図である。FIG. 1 is a configuration diagram of a threat information providing system according to the first embodiment. 図2は、第一実施形態に係るニュース配信サーバの機能構成図である。FIG. 2 is a functional configuration diagram of the news distribution server according to the first embodiment. 図3は、第一実施形態に係るSNS配信サーバの機能構成図である。FIG. 3 is a functional configuration diagram of the SNS distribution server according to the first embodiment. 図4は、第一実施形態に係るリコメンド装置の機能構成図である。FIG. 4 is a functional configuration diagram of the recommendation device according to the first embodiment. 図5は、第一実施形態に係るクライアントの機能構成図である。FIG. 5 is a functional configuration diagram of the client according to the first embodiment. 図6は、第一実施形態に係る脅威情報提供システムの各装置を構成するコンピュータのハードウェア構成図である。FIG. 6 is a hardware configuration diagram of a computer configuring each device of the threat information providing system according to the first embodiment. 図7は、第一実施形態に係るデータベースに格納されるデータテーブルを示す図である。FIG. 7 is a diagram showing a data table stored in the database according to the first embodiment. 図8は、第一実施形態に係るニュース記事情報テーブルの構成を説明する図である。FIG. 8 is a diagram illustrating the configuration of the news article information table according to the first embodiment. 図9は、第一実施形態に係る分析官情報テーブルの構成を説明する図である。FIG. 9 is a diagram illustrating the structure of the analyst information table according to the first embodiment. 図10は、第一実施形態に係るSNS情報テーブルの構成を説明する図である。FIG. 10 is a diagram illustrating the configuration of the SNS information table according to the first embodiment. 図11は、第一実施形態に係るリコメンド判定モデル情報テーブルの構成を説明する図である。FIG. 11 is a diagram illustrating the configuration of the recommendation determination model information table according to the first embodiment. 図12は、第一実施形態に係る閲覧履歴情報テーブルの構成を説明する図である。FIG. 12 is a diagram illustrating the configuration of the viewing history information table according to the first embodiment. 図13は、第一実施形態に係るリコメンド判定処理のシーケンス図である。FIG. 13 is a sequence diagram of recommendation determination processing according to the first embodiment. 図14は、第一実施形態に係るリコメンド配信処理のシーケンス図である。FIG. 14 is a sequence diagram of recommendation distribution processing according to the first embodiment. 図15は、第一実施形態に係るリコメンド判定モデル学習処理のシーケンス図である。FIG. 15 is a sequence diagram of recommendation determination model learning processing according to the first embodiment. 図16は、第一実施形態に係る判定モデル機械学習処理のフローチャートである。FIG. 16 is a flowchart of the judgment model machine learning process according to the first embodiment. 図17は、第一実施形態に係るリコメンド画面の表示例である。FIG. 17 is a display example of the recommendation screen according to the first embodiment. 図18は、第二実施形態に係るデータベースに格納されるデータテーブルを示す図である。FIG. 18 is a diagram showing a data table stored in a database according to the second embodiment. 図19は、第二実施形態に係る分析官情報テーブルの構成を説明する図である。FIG. 19 is a diagram illustrating the structure of an analyst information table according to the second embodiment. 図20は、第二実施形態に係るリコメンド判定モデル情報テーブルの構成を説明する図である。FIG. 20 is a diagram illustrating the configuration of a recommendation determination model information table according to the second embodiment. 図21は、第二実施形態に係るレポート配信履歴情報テーブルの構成を説明する図である。FIG. 21 is a diagram illustrating the configuration of a report distribution history information table according to the second embodiment. 図22は、第二実施形態に係る配信先情報テーブルの構成を説明する図である。FIG. 22 is a diagram illustrating the configuration of a distribution destination information table according to the second embodiment. 図23は、第二実施形態に係るリコメンド配信処理のシーケンス図である。FIG. 23 is a sequence diagram of recommendation distribution processing according to the second embodiment. 図24は、第二実施形態に係るリコメンド判定モデル学習処理のシーケンス図である。FIG. 24 is a sequence diagram of recommendation determination model learning processing according to the second embodiment. 図25は、第二実施形態に係る判定モデル機械学習処理のフローチャートである。FIG. 25 is a flowchart of the judgment model machine learning process according to the second embodiment. 図26は、第二実施形態に係るリコメンド画面の表示例である。FIG. 26 is a display example of a recommendation screen according to the second embodiment.

いくつかの実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。 Some embodiments will be described with reference to the drawings. The embodiments described below do not limit the claimed invention, and all of the elements and combinations thereof described in the embodiments are essential to the solution of the invention. is not limited.

以下の説明では、「AAAテーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「AAAテーブル」を「AAA情報」と呼ぶことができる。 In the following description, information may be described using the expression "AAA table," but the information may be expressed using any data structure. That is, the "AAA table" can be referred to as "AAA information" to indicate that the information is independent of data structure.

また、以下の説明では、「記憶部」は、1以上のメモリであってもよく、1以上のHDDやSSD等のドライブであってもよい。少なくとも1つのメモリは、揮発性メモリであってもよいし不揮発性メモリであってもよい。記憶部は、主に、プロセッサ部による処理の際に使用される。 Furthermore, in the following description, the "storage unit" may be one or more memories, or one or more drives such as HDD or SSD. The at least one memory may be volatile memory or non-volatile memory. The storage section is mainly used during processing by the processor section.

また、以下の説明では、「プロセッサ部」は、1以上のプロセッサを含む。少なくとも1つのプロセッサは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサである。1以上のプロセッサの各々は、シングルコアでもよいしマルチコアでもよい。プロセッサは、処理の一部または全部を行うハードウェア回路を含んでもよい。 Furthermore, in the following description, the "processor unit" includes one or more processors. At least one processor is typically a microprocessor such as a CPU (Central Processing Unit). Each of the one or more processors may have a single core or multiple cores. A processor may include hardware circuitry that performs some or all of the processing.

(第一実施形態)
(脅威情報提供システム)
まず、第一実施形態に係る情報提供システムの一例としての脅威情報提供システムについて説明する。
(First embodiment)
(Threat information provision system)
First, a threat information providing system as an example of the information providing system according to the first embodiment will be described.

図1は、第一実施形態に係る脅威情報提供システムの構成図である。 FIG. 1 is a configuration diagram of a threat information providing system according to the first embodiment.

脅威情報提供システム100は、1以上のニュース配信サーバ102(102_1,・・,102_n)、1以上のSNS(Social Networking System)配信サーバ103(103_1,・・,103_n)、リコメンド装置104、1以上のクライアント105(105_1,・・,105_n)、及びデータベース106を備える。ニュース配信サーバ102、SNS配信サーバ103、リコメンド装置104、クライアント105、及びデータベース106は、1以上のネットワーク101(101_1,101_2)を介して接続されている。本実施形態では、ニュース配信サーバ102と、SNS配信サーバ103と、リコメンド装置104とは、ネットワーク101_1(例えば、インターネット)を介して接続され、リコメンド装置104と、クライアント105と、データベース106とは、ネットワーク101_2(例えば、イントラネット)を介して接続されている。情報提供システムとしては、少なくともリコメンド装置104により構成されてもよいし、脅威情報提供システム100のリコメンド装置104以外の1以上の装置を含んで構成されてもよい。 The threat information providing system 100 includes one or more news distribution servers 102 (102_1, . . . , 102_n), one or more SNS (Social Networking System) distribution servers 103 (103_1, . . . , 103_n), one or more recommendation devices 104, and one or more recommendation devices 104. The client 105 (105_1, . . . , 105_n) and a database 106 are provided. The news distribution server 102, the SNS distribution server 103, the recommendation device 104, the client 105, and the database 106 are connected via one or more networks 101 (101_1, 101_2). In this embodiment, the news distribution server 102, the SNS distribution server 103, and the recommendation device 104 are connected via the network 101_1 (for example, the Internet), and the recommendation device 104, the client 105, and the database 106 are It is connected via a network 101_2 (for example, an intranet). The information providing system may include at least the recommendation device 104, or may include one or more devices other than the recommendation device 104 of the threat information providing system 100.

ニュース配信サーバ102は、各種のニュース記事(記事の一例)を配信する装置(例えば、WEBニュースサイト)であり、例えば、リコメンド装置104を管理する機関とは別の機関によって管理されている。 The news distribution server 102 is a device (for example, a web news site) that distributes various news articles (an example of an article), and is managed by, for example, an organization different from the organization that manages the recommendation device 104.

SNS配信サーバ103は、個人の情報(メッセージ)を配信するサービス(例えば、SNSのWEBサービス)を提供する装置であり、この装置を利用して個人は、情報を配信することができる。 The SNS distribution server 103 is a device that provides a service (eg, SNS web service) that distributes personal information (messages), and individuals can distribute information using this device.

リコメンド装置104は、データベース106上の情報に基づいて、ニュース記事をリコメンド(推奨)する処理における各種処理を主として実行するサーバである。 The recommendation device 104 is a server that mainly executes various processes in the process of recommending news articles based on information on the database 106.

クライアント105は、SOCの分析官(ユーザの一例)が直接操作する端末であり、例えば、一般的なコンピュータ端末であってもよい。クライアント105は、リコメンド装置104による処理結果、すなわちニュース記事の推奨結果の主たる出力先となる装置である。 The client 105 is a terminal directly operated by an SOC analyst (an example of a user), and may be, for example, a general computer terminal. The client 105 is a device that is the main output destination of the processing results by the recommendation device 104, that is, the news article recommendation results.

データベース106は、ニュース配信サーバ102から取得したニュース記事に関する情報と、SNS配信サーバ103から取得したSNSメッセージに関する情報と、分析官によるニュース記事の参照履歴情報等を格納する記憶装置である。本実施形態では、データベース106は、ネットワーク101_2を介してリコメンド装置104と通信可能に接続されている。データベース106は、リコメンド装置104を構成するコンピュータ601(図6参照)の外部記憶装置604(図6参照)に構築してもよい。 The database 106 is a storage device that stores information related to news articles obtained from the news distribution server 102, information related to SNS messages obtained from the SNS distribution server 103, reference history information of news articles by analysts, and the like. In this embodiment, the database 106 is communicably connected to the recommendation device 104 via the network 101_2. The database 106 may be constructed in the external storage device 604 (see FIG. 6) of the computer 601 (see FIG. 6) that constitutes the recommendation device 104.

なお、本実施形態においては、ネットワーク101_1、101_2は異なるネットワークとして例示したが、同一のネットワークであってもよい。また、図1において符号を付した構成要素は、必要に応じて複数としてもよい。 Note that in this embodiment, the networks 101_1 and 101_2 are illustrated as different networks, but they may be the same network. Moreover, the constituent elements with reference numerals in FIG. 1 may be plural as required.

(機能構成)
続いて、本実施形態の脅威情報提供システム100が備える各種機能について説明する。ここでは、リコメンド装置104のみならず、脅威情報提供システム100の各装置が、そのメモリ603及び外部記憶装置604(図6参照)に記憶する適宜なプログラムを実行することで実現される機能についてそれぞれ説明する。
(Functional configuration)
Next, various functions included in the threat information providing system 100 of this embodiment will be explained. Here, we will explain not only the recommendation device 104 but also the functions realized by each device of the threat information providing system 100 by executing appropriate programs stored in its memory 603 and external storage device 604 (see FIG. 6). explain.

図2は、第一実施形態に係るニュース配信サーバの機能構成図である。 FIG. 2 is a functional configuration diagram of the news distribution server according to the first embodiment.

ニュース配信サーバ102は、送受信部201及び制御部202を備える。送受信部201は、ネットワーク101_1を介して、他の装置(例えば、リコメンド装置104)との間で情報の送受信を行う。制御部202は、ニュース配信部203を備える。ニュース配信部203は、ニュース記事の識別子や本文等の情報(記事情報)を、送受信部201を介して、他の装置(例えば、リコメンド装置104)に送信する。 The news distribution server 102 includes a transmitting/receiving section 201 and a control section 202. The transmitting/receiving unit 201 transmits and receives information to and from another device (for example, the recommendation device 104) via the network 101_1. The control unit 202 includes a news distribution unit 203. The news distribution unit 203 transmits information such as the identifier and text of the news article (article information) to another device (for example, the recommendation device 104) via the transmission/reception unit 201.

図3は、第一実施形態に係るSNS配信サーバの機能構成図である。 FIG. 3 is a functional configuration diagram of the SNS distribution server according to the first embodiment.

SNS配信サーバ103は、送受信部301及び制御部302を備える。送受信部301は、ネットワーク101_1を介して、他の装置(例えば、リコメンド装置104)との間で情報の送受信を行う。制御部302は、SNS情報配信部303を備える。SNS情報配信部303は、SNS配信サーバ103が提供するSNSへ投稿されたメッセージの識別子や本文等の情報(SNS情報)を、送受信部301を介して、他の装置(例えば、リコメンド装置104)に送信する。 The SNS distribution server 103 includes a transmitting/receiving section 301 and a control section 302. The transmitting/receiving unit 301 transmits and receives information to and from another device (for example, the recommendation device 104) via the network 101_1. The control unit 302 includes an SNS information distribution unit 303. The SNS information distribution unit 303 sends information (SNS information) such as the identifier and text of a message posted to the SNS provided by the SNS distribution server 103 to another device (for example, the recommendation device 104) via the transmission/reception unit 301. Send to.

図4は、第一実施形態に係るリコメンド装置の機能構成図である。 FIG. 4 is a functional configuration diagram of the recommendation device according to the first embodiment.

リコメンド装置104は、送受信部401及び制御部402を備える。送受信部401は、ネットワーク101_1を介して、ニュース配信サーバ102及びSNS配信サーバ103との間で情報の送受信を行い、ネットワーク101_2を介して、クライアント105及びデータベース106との間で情報の送受信を行う。制御部402は、リコメンド判定部403、リコメンド配信部404、及びリコメンド判定モデル学習部405を備える。リコメンド判定部403は、ニュース記事に対して、分析官へのリコメンドの要否を判定し、その結果(リコメンド結果)をデータベース106に格納する。リコメンド配信部404は、データベース106に格納したリコメンド結果を、送受信部401を介して、クライアント105に送信する。リコメンド判定モデル学習部405は、データベース106上の各種情報を用いて、リコメンド判定に必要な判定モデル(リコメンド判定モデル:推奨判定モデル)を学習(機械学習)する。 The recommendation device 104 includes a transmitting/receiving section 401 and a control section 402. The transmitting/receiving unit 401 transmits and receives information between the news distribution server 102 and the SNS distribution server 103 via the network 101_1, and transmits and receives information between the client 105 and the database 106 via the network 101_2. . The control unit 402 includes a recommendation determination unit 403, a recommendation distribution unit 404, and a recommendation determination model learning unit 405. The recommendation determination unit 403 determines whether or not a news article should be recommended to an analyst, and stores the result (recommendation result) in the database 106 . The recommendation distribution unit 404 transmits the recommendation results stored in the database 106 to the client 105 via the transmission/reception unit 401. The recommendation determination model learning unit 405 uses various information on the database 106 to learn (machine learning) a determination model (recommendation determination model: recommendation determination model) necessary for recommendation determination.

図5は、第一実施形態に係るクライアント105の機能構成図である。 FIG. 5 is a functional configuration diagram of the client 105 according to the first embodiment.

クライアント105は、送受信部501、入出力部502、及び制御部503を備える。送受信部501は、ネットワーク101_2を介して他の装置(例えば、リコメンド装置104、ニュース配信サーバ102等)との間で情報の送受信を行う。入出力部502は、キーボードなどのインタフェース機器を介して分析官からの各種情報の入力処理を実行し、また、モニタなどのインタフェース機器を介して分析官向けの出力処理を実行する。制御部503は、リコメンド表示部504及びレポート配信部505を備える。リコメンド表示部504は、リコメンド結果を、送受信部501を介して、リコメンド装置104から受信し、分析官に向けてインタフェース機器の画面に表示する。レポート配信部505は、分析官により作成されたレポートを顧客などに配信する。レポートは、分析官がリコメンドされたニュース記事を確認し、分析することによりまとめられた結果である。 The client 105 includes a transmitting/receiving section 501, an input/output section 502, and a control section 503. The transmitting/receiving unit 501 transmits and receives information to and from other devices (for example, the recommendation device 104, the news distribution server 102, etc.) via the network 101_2. The input/output unit 502 executes input processing of various information from an analyst via an interface device such as a keyboard, and executes output processing for the analyst via an interface device such as a monitor. The control unit 503 includes a recommendation display unit 504 and a report distribution unit 505. The recommendation display unit 504 receives the recommendation result from the recommendation device 104 via the transmitting/receiving unit 501, and displays it on the screen of the interface device for the analyst. A report distribution unit 505 distributes a report created by an analyst to a customer or the like. A report is the result of an analyst reviewing and analyzing recommended news articles.

(ハードウェア構成)
次に、本実施形態の脅威情報提供システム100を構成する装置のハードウェア構成について説明する。
(Hardware configuration)
Next, the hardware configuration of the devices that constitute the threat information providing system 100 of this embodiment will be explained.

図6は、第一実施形態に係る脅威情報提供システム100の各装置を構成するコンピュータのハードウェア構成図である。 FIG. 6 is a hardware configuration diagram of a computer configuring each device of the threat information providing system 100 according to the first embodiment.

脅威情報提供システム100を構成するニュース配信サーバ102、SNS配信サーバ103、リコメンド装置104、及びクライアント105は、例えば、それぞれがコンピュータ装置601により構成される。 The news distribution server 102, SNS distribution server 103, recommendation device 104, and client 105 that configure the threat information providing system 100 are each configured by a computer device 601, for example.

コンピュータ装置(コンピュータ)601は、プロセッサ部の一例としてのCPU602、RAM(Random Access Memory)など揮発性記憶素子で構成されるメモリ603、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される外部記憶装置604、ネットワークインタフェースカード(NIC:Network Interface Card)などの送受信装置605、ディスプレイなどの出力装置606、及びキーボードなどの入力装置607を備える。 A computer device (computer) 601 includes a CPU 602 as an example of a processor section, a memory 603 composed of a volatile memory element such as a RAM (Random Access Memory), and an appropriate non-volatile memory element such as an SSD (Solid State Drive) or a hard disk drive. The device includes an external storage device 604 including an external storage device 604, a transmitting/receiving device 605 such as a network interface card (NIC), an output device 606 such as a display, and an input device 607 such as a keyboard.

出力装置606及び入力装置607は、ニュース配信サーバ102、SNS配信サーバ103、及びリコメンド装置104のいずれもが備えなくてもよい。 The output device 606 and the input device 607 do not need to be included in any of the news distribution server 102, the SNS distribution server 103, and the recommendation device 104.

図2~図5に示す各装置の制御部202,302,402,503は、各装置を構成するコンピュータ装置601のCPU602が、外部記憶装置604に記憶された適宜なプログラムをメモリ603にロードして実行することで実現(構成)される。また、図2~図5に示す各装置の送受信部201,301,401,及び501は、各装置を構成するコンピュータ装置601の送受信装置605により構成される。また、クライアント105における入出力部502は、クライアント105を構成するコンピュータ装置601の出力装置606及び入力装置607により構成される。 The control units 202, 302, 402, and 503 of each device shown in FIGS. It is realized (configured) by executing it. Further, the transmitting/receiving units 201, 301, 401, and 501 of each device shown in FIGS. 2 to 5 are constituted by the transmitting/receiving device 605 of the computer device 601 that constitutes each device. Further, the input/output unit 502 in the client 105 is configured by an output device 606 and an input device 607 of the computer device 601 that constitutes the client 105.

(データ構成)
次に、本実施形態のリコメンド装置104が利用するデータについて説明する。
(Data structure)
Next, data used by the recommendation device 104 of this embodiment will be explained.

リコメンド装置104が利用するデータは、ニュース配信サーバ102が配信するニュース記事情報、SNS配信サーバ103が配信するSNS情報、分析官によるニュース記事の閲覧履歴、及びリコメンド装置104のリコメンド判定処理により生成される判定結果等の情報がある。 The data used by the recommendation device 104 is generated by news article information distributed by the news distribution server 102, SNS information distributed by the SNS distribution server 103, viewing history of news articles by analysts, and recommendation determination processing by the recommendation device 104. There is information such as judgment results.

図7は、第一実施形態に係るデータベースに格納されるデータテーブルを示す図である。 FIG. 7 is a diagram showing a data table stored in the database according to the first embodiment.

データベース106は、ニュース記事情報テーブル701、分析官情報テーブル702、SNS情報テーブル703、リコメンド判定モデル情報テーブル704、及び閲覧履歴情報テーブル705を格納する。これらテーブルは、レコードが含む所定のIDなどにより相互に関連付けられている。 The database 106 stores a news article information table 701, an analyst information table 702, an SNS information table 703, a recommendation determination model information table 704, and a viewing history information table 705. These tables are associated with each other by a predetermined ID included in the record.

図8は、第一実施形態に係るニュース記事情報テーブルの構成を説明する図である。 FIG. 8 is a diagram illustrating the configuration of the news article information table according to the first embodiment.

ニュース記事情報テーブル701は、ニュース記事ごとのレコードを格納する。ニュース記事情報テーブル701のレコードは、ニュース記事ID801、本文802、その他属性情報803、更新日時804、特徴語リスト805、SNS拡散度806、リコメンド判定結果リスト807、及びリコメンド判定日時808をデータ項目として有する。 The news article information table 701 stores records for each news article. The records of the news article information table 701 include news article ID 801, body text 802, other attribute information 803, update date and time 804, characteristic word list 805, SNS diffusion degree 806, recommendation judgment result list 807, and recommendation judgment date and time 808 as data items. have

ニュース記事ID801には、レコードに対応するニュース記事に対してユニークに割り当てられた識別子(ニュース記事ID)が格納される。本文802には、レコードに対応するニュース記事の本文が格納される。その他属性情報803には、レコードに対応するニュース記事のタイトル、ニュース記事のURL(Uniform Resource Locator)等の画面表示に利用されるニュース記事の属性情報が格納される。更新日時804には、レコードに対応するニュース記事の最終更新日時が格納される。特徴語リスト805には、レコードに対応するニュース記事の本文から抽出された特徴語のリスト(特徴情報の一例)が格納される。SNS拡散度806には、レコードに対応するニュース記事のSNSでの拡散度(SNS拡散度)が格納される。リコメンド判定結果リスト807には、レコードに対応するニュース記事についてのリコメンド判定処理の結果が格納される。リコメンド判定処理の結果としては、例えば、各判定モデルによるニュース記事に対するリコメンド判定結果の一覧であり、具体的には、例えば、リコメンド判定モデルID、分析官ID、判定結果の組のリストである。リコメンド判定日時808には、エントリに対応するニュース記事に対してリコメンド判定処理を実施した日時が格納される。 The news article ID 801 stores an identifier (news article ID) uniquely assigned to the news article corresponding to the record. The main text 802 stores the main text of the news article corresponding to the record. Other attribute information 803 stores attribute information of the news article used for screen display, such as the title of the news article corresponding to the record and the URL (Uniform Resource Locator) of the news article. The update date and time 804 stores the last update date and time of the news article corresponding to the record. The feature word list 805 stores a list of feature words (an example of feature information) extracted from the text of the news article corresponding to the record. The SNS diffusion degree 806 stores the degree of diffusion on SNS of the news article corresponding to the record (SNS diffusion degree). The recommendation determination result list 807 stores the results of recommendation determination processing for news articles corresponding to records. The result of the recommendation determination process is, for example, a list of recommendation determination results for news articles by each determination model, and specifically, for example, a list of sets of recommendation determination model ID, analyst ID, and determination results. The recommendation determination date and time 808 stores the date and time when the recommendation determination process was performed on the news article corresponding to the entry.

図9は、第一実施形態に係る分析官情報テーブルの構成を説明する図である。 FIG. 9 is a diagram illustrating the structure of the analyst information table according to the first embodiment.

分析官情報テーブル702は、分析官ごとのレコードを格納する。分析官情報テーブル702のレコードは、分析官ID901及び分析官その他情報902をデータ項目として有する。 Analyst information table 702 stores records for each analyst. The record of the analyst information table 702 has an analyst ID 901 and analyst other information 902 as data items.

分析官ID901には、レコードに対応する分析官に対してユニークに割り当てられた識別子(分析官ID)が格納される。分析官その他情報902には、レコードに対応する分析官の氏名等の画面表示に利用される分析官の属性情報が格納される。 The analyst ID 901 stores an identifier (analyst ID) uniquely assigned to the analyst corresponding to the record. Analyst and other information 902 stores attribute information of the analyst used for screen display, such as the name of the analyst corresponding to the record.

なお、本実施形態では、分析官情報テーブル702は、各分析官のレコードの各情報が事前に定義されて、データベース106に格納されているものとしている。 In this embodiment, it is assumed that in the analyst information table 702, each information of each analyst's record is defined in advance and stored in the database 106.

図10は、第一実施形態に係るSNS情報テーブルの構成を説明する図である。 FIG. 10 is a diagram illustrating the configuration of the SNS information table according to the first embodiment.

SNS情報テーブル703は、SNSに投稿されたメッセージごとのレコードを格納する。SNS情報テーブル703のレコードは、SNS ID1001、メッセージ本文1002、特徴語1003、閲覧数1004、返信数1005、転送数1006、及び高評価数1007をデータ項目として有する。 The SNS information table 703 stores records for each message posted on the SNS. The record of the SNS information table 703 has SNS ID 1001, message body 1002, feature word 1003, number of views 1004, number of replies 1005, number of transfers 1006, and number of high ratings 1007 as data items.

SNS ID1001には、レコードに対応するメッセージに対してユニークに割り当てられた識別子(SNS ID)が格納される。メッセージ本文1002には、レコードに対応するメッセージの本文(メッセージ本文)が格納される。特徴語1003には、レコードに対応するメッセージを検索する際に使用された特徴語が格納される。閲覧数1004には、レコードに対応するメッセージを他のユーザが閲覧した回数(閲覧数)が格納される。返信数1005には、レコードに対応するメッセージに対し、他のユーザが返信を行った回数(返信数)が格納される。転送数1006には、レコードに対応するメッセージを他のユーザが転送した回数(転送数)が格納される。高評価数1007には、レコードに対応するメッセージに対して、他のユーザが高評価を付けた回数(高評価数)が格納される。ここで、閲覧数、返信数、転送数、高評価数は、メッセージの使用状況の一例である。 The SNS ID 1001 stores an identifier (SNS ID) uniquely assigned to a message corresponding to a record. The message body 1002 stores the message body (message body) corresponding to the record. The characteristic word 1003 stores the characteristic word used when searching for a message corresponding to a record. The number of views 1004 stores the number of times other users have viewed the message corresponding to the record (number of views). The number of replies 1005 stores the number of times other users have responded to the message corresponding to the record (number of replies). The number of transfers 1006 stores the number of times another user has transferred a message corresponding to the record (number of transfers). The number of high ratings 1007 stores the number of times other users gave high ratings to the message corresponding to the record (number of high ratings). Here, the number of views, the number of replies, the number of transfers, and the number of high ratings are examples of message usage status.

図11は、第一実施形態に係るリコメンド判定モデル情報テーブルの構成を説明する図である。 FIG. 11 is a diagram illustrating the configuration of the recommendation determination model information table according to the first embodiment.

リコメンド判定モデル情報テーブル704は、リコメンド判定を行うための機械学習により得られたリコメンド判定モデルごとのレコードを格納する。リコメンド判定モデル情報テーブル704のレコードは、リコメンド判定モデルID1101、リコメンド判定モデル1102、及び分析官ID1103をデータ項目として有する。 The recommendation determination model information table 704 stores records for each recommendation determination model obtained by machine learning for making recommendation determinations. The record of the recommendation judgment model information table 704 has a recommendation judgment model ID 1101, a recommendation judgment model 1102, and an analyst ID 1103 as data items.

リコメンド判定モデルID1101には、レコードに対応するリコメンド判定モデルに対してユニークに割り当てられた識別子(判定モデルID)が格納される。リコメンド判定モデル1102には、レコードに対応するリコメンド判定モデルが格納される。分析官ID1103には、レコードに対応するリコメンド判定モデルを学習する際の対象となる分析官に対してユニークに割り当てられた識別子が格納される。 The recommendation judgment model ID 1101 stores an identifier (determination model ID) uniquely assigned to a recommendation judgment model corresponding to a record. The recommendation determination model 1102 stores a recommendation determination model corresponding to a record. The analyst ID 1103 stores an identifier uniquely assigned to an analyst who is a target for learning a recommendation determination model corresponding to a record.

図12は、第一実施形態に係る閲覧履歴情報テーブルの構成を説明する図である。 FIG. 12 is a diagram illustrating the configuration of the viewing history information table according to the first embodiment.

閲覧履歴情報テーブル705は、分析官によるニュース記事の閲覧ごとのレコードを格納する。閲覧履歴情報テーブル705のレコードは、ニュース記事ID1201、分析官ID1202、及び閲覧日時1203をデータ項目として有する。 The viewing history information table 705 stores records for each viewing of a news article by an analyst. A record in the viewing history information table 705 has a news article ID 1201, an analyst ID 1202, and a viewing date and time 1203 as data items.

ニュース記事ID1201には、レコードに対応する閲覧において、閲覧されたニュース記事のIDが格納される。分析官ID1202には、レコードに対応する閲覧において、閲覧した分析官のIDが格納される。閲覧日時1203には、レコードに対応する閲覧が行われた日時が格納される。 The news article ID 1201 stores the ID of the news article viewed during the viewing corresponding to the record. The analyst ID 1202 stores the ID of the analyst who viewed the record. The viewing date and time 1203 stores the date and time when the corresponding record was viewed.

なお、本実施形態においては、ニュース記事情報テーブル701、分析官情報テーブル702、SNS情報テーブル703、リコメンド判定モデル情報テーブル704、及び閲覧履歴情報テーブル705をデータベース106上に構築しているが、本発明はこれに限られず、これらテーブルの少なくとも一部をリコメンド装置104に格納するようにしてもよい。また、各テーブルの少なくともいずれか複数を結合して1つのテーブルとしてもよく、より正規化されたテーブルとしてもよい。 In this embodiment, a news article information table 701, an analyst information table 702, an SNS information table 703, a recommendation judgment model information table 704, and a browsing history information table 705 are constructed on the database 106. The invention is not limited to this, and at least a portion of these tables may be stored in the recommendation device 104. Further, at least one or more of the respective tables may be combined to form a single table, or a more normalized table may be formed.

次に、本実施形態における脅威情報提供システム100による脅威情報提供方法の処理動作について説明する。以下で説明する脅威情報提供方法の処理における各種動作は、例えばリコメンド装置104がプログラム(情報提供プログラム)をメモリ603などに読み出してCPU602が実行することによって実現される。このプログラムは、以下に説明される各種の動作を行うためのコードを含む。なお、以下の説明においては、リコメンド装置104が実行する処理のみならず、他の装置が実行する処理についても適宜説明する。 Next, processing operations of the threat information providing method by the threat information providing system 100 in this embodiment will be described. Various operations in the process of the threat information providing method described below are realized by, for example, the recommendation device 104 reading out a program (information providing program) into the memory 603 or the like, and the CPU 602 executing the program. This program includes code for performing various operations described below. In the following description, not only the processing executed by the recommendation device 104 but also the processing executed by other devices will be explained as appropriate.

(リコメンド判定処理)
図13は、第一実施形態に係るリコメンド判定処理のシーケンス図である。ここで、リコメンド判定処理は、ニュース配信サーバ102よりニュース記事情報を取得する処理と、SNS配信サーバ103よりSNS情報を取得する処理と、ニュース記事に対して、リコメンドの要否を判定する処理とが含まれる。
(Recommendation judgment process)
FIG. 13 is a sequence diagram of recommendation determination processing according to the first embodiment. Here, the recommendation determination process includes a process of acquiring news article information from the news distribution server 102, a process of acquiring SNS information from the SNS distribution server 103, and a process of determining whether a recommendation is necessary for the news article. is included.

まず、リコメンド装置104のリコメンド判定部403は、定期的に(例えば、1時間に1度)リコメンド判定処理を起動する(S1301)。なお、本実施形態では、定期的にリコメンド判定処理を起動しているが、ニュース配信サーバ102から新規のニュース記事が配信されたタイミングなどの通知を受けた後にリコメンド判定処理を起動してもよい。 First, the recommendation determination unit 403 of the recommendation device 104 starts a recommendation determination process periodically (for example, once every hour) (S1301). Note that in this embodiment, the recommendation determination process is started periodically, but the recommendation determination process may be started after receiving a notification from the news distribution server 102 such as the timing of a new news article being distributed. .

次に、リコメンド装置104のリコメンド判定部403は、ニュース配信サーバ102にニュース記事の配信を依頼する。ニュース記事の配信の依頼を受けたニュース配信サーバ102のニュース配信部203は、リコメンド装置104に未配信のニュース記事についてのニュース記事情報を1件配信する。リコメンド判定部403は、配信されたニュース記事情報を取得する(ニュース記事取得処理:S1302)。なお、配信されるニュース記事情報は、例えば、ニュース記事情報テーブル701に格納される、ニュース記事ID、ニュース記事本文、その他属性情報等を含んでおり、ニュース記事情報は、後述するデータベース保存処理(S1308)によりニュース記事情報テーブル701に格納される。 Next, the recommendation determination unit 403 of the recommendation device 104 requests the news distribution server 102 to distribute the news article. The news distribution unit 203 of the news distribution server 102, which has received a request to distribute a news article, distributes one piece of news article information regarding an undistributed news article to the recommendation device 104. The recommendation determination unit 403 acquires the distributed news article information (news article acquisition process: S1302). Note that the news article information to be distributed includes, for example, the news article ID, news article text, and other attribute information stored in the news article information table 701, and the news article information is stored in the database storage process (described later). S1308) is stored in the news article information table 701.

次に、リコメンド装置104のリコメンド判定部403は、ニュース記事情報に含まれるニュース記事の本文から特徴語を抽出する(特徴語抽出処理:S1303)。なお、特徴語を抽出する方法としては、ニュース記事の本文の文章を形態素解析して抽出する方法や、事前に定義された辞書を用いて固有表現抽出する方法を利用してもよく、また、その他の方法を利用してもよい。なお、抽出された特徴語は、後述するデータベース保存処理(S1308)により、ニュース記事情報テーブル701の特徴語リスト805に格納される。 Next, the recommendation determination unit 403 of the recommendation device 104 extracts a characteristic word from the main text of the news article included in the news article information (characteristic word extraction process: S1303). In addition, as a method for extracting feature words, a method of extracting by morphological analysis of the main text of a news article, a method of extracting a named entity using a predefined dictionary, or a method of extracting a named entity using a predefined dictionary may be used. Other methods may also be used. Note that the extracted feature words are stored in the feature word list 805 of the news article information table 701 through database storage processing (S1308), which will be described later.

次に、リコメンド装置104のリコメンド判定部403は、SNS配信サーバ103に、特徴語抽出処理(S1303)により抽出した特徴語に関係するメッセージの情報の配信を依頼する。この依頼を受けたSNS配信サーバ103のSNS情報配信部303は、依頼に対応する特徴語に基づいてメッセージを検索することで、ニュース記事に関連するメッセージを特定し、リコメンド装置104に、特定したメッセージのSNS情報を一括して配信する(S1304)。なお、配信されるSNS情報には、例えば、SNS情報テーブル703に格納されるSNS IDや、メッセージ本文、特徴語、閲覧数、返信数、転送数、及び高評価数が含まれている。SNS情報は、後述するデータベース保存処理(S1308)によりSNS情報テーブル703に格納される。 Next, the recommendation determination unit 403 of the recommendation device 104 requests the SNS distribution server 103 to distribute message information related to the characteristic word extracted by the characteristic word extraction process (S1303). Upon receiving this request, the SNS information distribution unit 303 of the SNS distribution server 103 searches for messages based on the characteristic word corresponding to the request, identifies messages related to the news article, and sends the identified messages to the recommendation device 104. The SNS information of the message is distributed all at once (S1304). Note that the SNS information to be distributed includes, for example, the SNS ID stored in the SNS information table 703, message text, characteristic words, number of views, number of replies, number of transfers, and number of high ratings. The SNS information is stored in the SNS information table 703 through database storage processing (S1308), which will be described later.

次に、リコメンド装置105のリコメンド判定部403は、ニュース記事に対してSNSでの拡散の度合いを示すSNS拡散度(単に、拡散度ともいう)を評価する(S1305)。なお、ニュース記事のSNS拡散度を評価する方法としては、ニュース記事に関連するメッセージのエンゲージメント数を算定し、このエンゲージメント数を拡散度とする方法がある。エンゲージメント数としては、例えば、閲覧数、返信数、転送数、高評価数の少なくともいずれか1つの以上の値に基づくものでもよく、複数の値の合算値としてもよい。本実施形態では、例えば、エンゲージメント数として、閲覧数、返信数、転送数、及び高評価数の総和を用いる。なお、評価により得られた拡散度は、後述するデータベース保存処理(S1308)により、ニュース記事情報テーブル701のSNS拡散度806に格納される。 Next, the recommendation determination unit 403 of the recommendation device 105 evaluates the SNS diffusion level (also simply referred to as the diffusion level) indicating the degree of diffusion of the news article on SNS (S1305). Note that as a method for evaluating the degree of SNS diffusion of a news article, there is a method of calculating the number of engagements of messages related to the news article and using this number of engagements as the degree of diffusion. The number of engagements may be based on at least one of the number of views, the number of replies, the number of transfers, and the number of high ratings, or may be the sum of a plurality of values. In this embodiment, for example, the sum of the number of views, the number of replies, the number of transfers, and the number of high ratings is used as the number of engagements. Note that the degree of diffusion obtained through the evaluation is stored in the SNS degree of diffusion 806 of the news article information table 701 through database storage processing (S1308), which will be described later.

次に、リコメンド装置104のリコメンド判定部403は、リコメンド判定モデル情報テーブル704に格納されているリコメンド判定モデルを全て取得する(S1306)。なお、リコメンド判定モデルは、後述するリコメンド判定モデル学習処理(図15参照)で生成される、機械学習によって学習されたモデルのデータである。 Next, the recommendation determination unit 403 of the recommendation device 104 acquires all recommendation determination models stored in the recommendation determination model information table 704 (S1306). Note that the recommendation determination model is data of a model learned by machine learning, which is generated in a recommendation determination model learning process (see FIG. 15) that will be described later.

次に、リコメンド装置104のリコメンド判定部403は、ニュース記事のリコメンド要否の判定を行うリコメンド判定処理を行う(S1307)。なお、ニュース記事のリコメンド判定処理としては、例えば、予めニュース記事から抽出した特徴語又は特徴語群に対応するデータを入力パラメータとして、LSTM(Long short-term memory)等の機械学習手法で学習されたニューラルネットワークモデル(リコメンド判定モデル)を用いて、判定対象のニュース記事の特徴語又は特徴語群に対応するデータをリコメンド判定モデルに入力することにより、判定対象のニュース記事のリコメンドの要否を判定する。このリコメンド判定処理において、リコメンド判定部403は、取得したリコメンド判定モデル毎にニュース記事のリコメンド要否の判定を行う。なお、リコメンド要否の判定結果は、後述するデータベース保存処理(S1308)により、ニュース記事情報テーブル701のニュース記事に対応するレコードのリコメンド判定結果リスト807に格納される。 Next, the recommendation determination unit 403 of the recommendation device 104 performs recommendation determination processing to determine whether or not a news article needs to be recommended (S1307). Note that the news article recommendation determination process is performed using machine learning methods such as LSTM (Long short-term memory) using data corresponding to feature words or feature word groups extracted in advance from news articles as input parameters. By using a neural network model (recommendation determination model) that inputs data corresponding to a feature word or a group of characteristic words of the news article to be determined into the recommendation determination model, it is possible to determine whether or not the news article to be determined needs to be recommended. judge. In this recommendation determination process, the recommendation determination unit 403 determines whether or not a news article needs to be recommended for each acquired recommendation determination model. Note that the determination result of whether or not a recommendation is necessary is stored in the recommendation determination result list 807 of the record corresponding to the news article in the news article information table 701 through database storage processing (S1308), which will be described later.

次に、リコメンド装置104のリコメンド判定部403は、各種取得した情報や、リコメンド判定処理で得られた判定結果をデータベース106に保存する(データベース保存処理:S1308)。なお、本実施形態では、データベース保存処理(S1308)において一括して各種データを格納するようにしているが、ステップS1302~S1307の過程で適宜データベース106に各種データを格納するようにしてもよい。 Next, the recommendation determination unit 403 of the recommendation device 104 stores various acquired information and determination results obtained in the recommendation determination process in the database 106 (database storage process: S1308). Note that in this embodiment, various data are stored all at once in the database storage process (S1308), but various data may be stored in the database 106 as appropriate in the process of steps S1302 to S1307.

次に、リコメンド装置104のリコメンド判定部403は、ステップS1302~S1307の処理を繰り返す。この処理の繰り返しは、ニュース記事取得処理(S1302)でニュース配信サーバ102から配信されるニュース記事がなくなるまで反復実行される。なお、本実施形態では、ニュース記事取得処理(S1302)において、ニュース記事を1件ずつ取得しているが、一括して全件取得するようにしてもよい。 Next, the recommendation determination unit 403 of the recommendation device 104 repeats the processing of steps S1302 to S1307. This process is repeated until there are no more news articles distributed from the news distribution server 102 in the news article acquisition process (S1302). In this embodiment, news articles are acquired one by one in the news article acquisition process (S1302), but all articles may be acquired at once.

(リコメンド通知処理)
図14は、第一実施形態に係るリコメンド通知処理のシーケンス図である。ここで、リコメンド通知処理は、リコメンド装置104よりリコメンド結果を取得する処理と、クライアント105によりリコメンド結果を表示する処理とが含まれる。
(Recommendation notification processing)
FIG. 14 is a sequence diagram of recommendation notification processing according to the first embodiment. Here, the recommendation notification process includes a process of acquiring a recommendation result from the recommendation device 104 and a process of displaying the recommendation result by the client 105.

まず、クライアント105は、入出力部502を介して分析官の操作を受け付け、クライアント105側でのリコメンド通知処理を起動する。クライアント105のリコメンド表示部504は、リコメンド装置104にリコメンド結果の配信を依頼する。(リコメンド結果配信依頼処理:S1401)。なお、このリコメンド結果の依頼には、少なくとも分析官IDが含まれている。分析官IDの入力方法としては、クライアント105において、事前にログイン画面を提供し、そのログイン画面に対して入力させる方法でもよく、機器認証などによって分析官IDを入力させる方法でもよい。 First, the client 105 receives an operation from the analyst via the input/output unit 502, and starts a recommendation notification process on the client 105 side. The recommendation display unit 504 of the client 105 requests the recommendation device 104 to distribute the recommendation results. (Recommendation result distribution request processing: S1401). Note that this request for recommendation results includes at least the analyst ID. The method for inputting the analyst ID may be a method in which a login screen is provided in advance on the client 105 and input is made to the login screen, or a method in which the analyst ID is input through device authentication or the like may be used.

次に、リコメンド結果の配信の依頼を受けたリコメンド装置104のリコメンド配信部404は、ニュース記事情報テーブル701からニュース記事情報を取得する(ニュース記事情報取得処理:S1402)。ニュース記事情報取得処理(S1402)では、リコメンド配信部404は、ニュース記事情報テーブル701のレコードのリコメンド判定結果807を参照し、リコメンド判定結果807の値が、依頼に含まれる分析官IDに対応するリコメンド判定モデルによってリコメンド要と判定されていることを示しているレコードのニュース記事のみのニュース記事情報を取得する。なお、ニュース記事情報取得処理で取得するニュース記事情報としては、ニュース記事ID、その他属性情報、及び更新日時を含んでいてもよい。 Next, the recommendation distribution unit 404 of the recommendation device 104 that has received the request to distribute the recommendation results acquires news article information from the news article information table 701 (news article information acquisition process: S1402). In the news article information acquisition process (S1402), the recommendation distribution unit 404 refers to the recommendation determination result 807 of the record in the news article information table 701, and determines whether the value of the recommendation determination result 807 corresponds to the analyst ID included in the request. News article information of only news articles of records that are determined to require recommendation by the recommendation determination model is acquired. Note that the news article information acquired in the news article information acquisition process may include a news article ID, other attribute information, and update date and time.

次に、リコメンド装置104のリコメンド配信部404は、リコメンド画面(例えば、図17参照)のデータを生成し、クライアント105にリコメンド画面のデータを送信する(S1403)。なお、リコメンド画面の例については、後述する。 Next, the recommendation distribution unit 404 of the recommendation device 104 generates data for a recommendation screen (for example, see FIG. 17), and transmits the data for the recommendation screen to the client 105 (S1403). Note that an example of the recommendation screen will be described later.

次に、リコメンド画面のデータを受信したクライアント105のリコメンド表示部504は、入出力部502を介して、分析官にリコメンド画面を表示する。分析官は、適宜にリコメンド画面上のニュース記事へのハイパーリンクをクリックすることで、ニュース記事の閲覧を指示することができる。分析官からニュース記事の閲覧の指示を受け付けたクライアント105のリコメンド表示部504は、リコメンド装置104に記事閲覧依頼を送信する(記事閲覧依頼処理:S1404)。記事閲覧依頼には、例えば、分析官から指示された閲覧を希望するニュース記事IDと、分析官ID、閲覧日時が含まれる。 Next, the recommendation display unit 504 of the client 105, which has received the data on the recommendation screen, displays the recommendation screen to the analyst via the input/output unit 502. The analyst can instruct viewing of a news article by clicking on a hyperlink to the news article on the recommendation screen as appropriate. The recommendation display unit 504 of the client 105, which has received the instruction to view the news article from the analyst, transmits an article viewing request to the recommendation device 104 (article viewing request process: S1404). The article viewing request includes, for example, the news article ID that the analyst wishes to view as instructed by the analyst, the analyst ID, and the viewing date and time.

次に、リコメンド装置104のリコメンド配信部404は、受信した記事閲覧依頼に含まれている情報を、閲覧履歴情報テーブル705に新たなレコードを追加して格納する。(S1405) Next, the recommendation distribution unit 404 of the recommendation device 104 adds a new record to the viewing history information table 705 and stores the information included in the received article viewing request. (S1405)

次に、リコメンド装置104は、クライアント105に表示させる画面をニュース配信サーバ102が提供するニュース記事の画面へとリダイレクトさせる(S1406)。なお、分析官によって、リコメンド画面上のニュース記事へのハイパーリンクのクリックが行われることにより、クライアント105とリコメンド装置104では、ステップS1404~S1407の処理が繰り返して実行されることとなる。 Next, the recommendation device 104 redirects the screen displayed on the client 105 to the news article screen provided by the news distribution server 102 (S1406). Note that when the analyst clicks on a hyperlink to a news article on the recommendation screen, the client 105 and the recommendation device 104 repeatedly execute the processes of steps S1404 to S1407.

これにより、分析官は、日常業務の中で、クライアント105を介して、所望するニュース記事を閲覧して、サイバー攻撃に関する脅威情報を確認等することができる。 This allows the analyst to view desired news articles and check threat information regarding cyber attacks through the client 105 during daily work.

この後、分析官は、収集した情報を基に脅威情報に関するレポートを作成することとなる。クライアント105のレポート配信部505は、分析官により作成されたレポートを所定の顧客に配信する(S1407)。なお、レポートを顧客に配信する方法は、レポートを電子メールに含めて配信してもよいし、顧客用の通知ポータルなどにレポートの内容を掲載するようにしてもよい。 Analysts will then create a threat intelligence report based on the information they have collected. The report distribution unit 505 of the client 105 distributes the report created by the analyst to a predetermined customer (S1407). Note that the report may be distributed to the customer by including the report in an e-mail or by posting the contents of the report on a notification portal for the customer.

(リコメンド判定モデル学習処理)
図15は、第一実施形態に係るリコメンド判定モデル学習処理のシーケンス図である。ここで、リコメンド判定モデル学習処理には、リコメンド装置104によりリコメンド判定モデルを学習(機械学習)するための処理が含まれる。
(Recommendation decision model learning process)
FIG. 15 is a sequence diagram of recommendation determination model learning processing according to the first embodiment. Here, the recommendation determination model learning process includes processing for learning (machine learning) a recommendation determination model by the recommendation device 104.

まず、リコメンド装置104のリコメンド判定モデル学習部405は、定期的に(例えば、1時間に1度)リコメンド判定モデル学習処理を起動する(S1501)。 First, the recommendation judgment model learning unit 405 of the recommendation device 104 starts a recommendation judgment model learning process periodically (for example, once every hour) (S1501).

次に、リコメンド装置104のリコメンド判定モデル学習部405は、閲覧履歴情報テーブル705から閲覧履歴情報を全て取得する。なお、取得する閲覧履歴情報には、例えば、ニュース記事ID及び分析官IDが含まれる。なお、取得する閲覧履歴情報を、所定の期間内における閲覧履歴情報のみとしてもよい。 Next, the recommendation determination model learning unit 405 of the recommendation device 104 acquires all viewing history information from the viewing history information table 705. Note that the acquired viewing history information includes, for example, a news article ID and an analyst ID. Note that the browsing history information to be acquired may be only browsing history information within a predetermined period.

次に、リコメンド装置104のリコメンド判定モデル学習部405は、ニュース記事情報テーブル701からニュース記事情報を全て取得する(S1503)。なお、取得するニュース記事情報には、例えば、ニュース記事ID、特徴語リスト、SNS拡散度が含まれる。なお、取得するニュース記事情報を、所定の期間内におけるニュース記事情報のみとしてもよい。また、取得するニュース記事情報を、所定の内容を含むニュース記事情報のみとしてもよい。 Next, the recommendation determination model learning unit 405 of the recommendation device 104 acquires all news article information from the news article information table 701 (S1503). Note that the news article information to be acquired includes, for example, a news article ID, a list of characteristic words, and a degree of SNS diffusion. Note that the news article information to be acquired may be only news article information within a predetermined period. Further, the news article information to be acquired may be only news article information including predetermined content.

次に、リコメンド装置104のリコメンド判定モデル学習部405は、リコメンド判定モデルを機械学習する(判定モデル機械学習処理:S1504)。判定モデル機械学習処理については、図16を用いて後述する。 Next, the recommendation judgment model learning unit 405 of the recommendation device 104 performs machine learning on the recommendation judgment model (determination model machine learning process: S1504). The determination model machine learning process will be described later using FIG. 16.

次に、リコメンド装置104のリコメンド判定モデル学習部405は、判定モデル機械学習処理(S1504)で生成したリコメンド判別モデルをリコメンド判定モデル情報テーブル704に格納し(S1505)、リコメンド判定モデル学習処理を終了する。 Next, the recommendation judgment model learning unit 405 of the recommendation device 104 stores the recommendation judgment model generated in the judgment model machine learning process (S1504) in the recommendation judgment model information table 704 (S1505), and ends the recommendation judgment model learning process. do.

次に、判定モデル機械学習処理(S1504)について説明する。 Next, the judgment model machine learning process (S1504) will be explained.

図16は、第一実施形態に係る判定モデル機械学習処理のフローチャートである。 FIG. 16 is a flowchart of the judgment model machine learning process according to the first embodiment.

判定モデル機械学習処理では、リコメンド装置104のリコメンド判定モデル学習部405は、分析官情報テーブル702から分析官IDを取得し、分析官IDのユニークなリスト(分析官IDリスト)を作成する(S1601)。 In the judgment model machine learning process, the recommendation judgment model learning unit 405 of the recommendation device 104 acquires analyst IDs from the analyst information table 702 and creates a unique list of analyst IDs (analyst ID list) (S1601 ).

次に、リコメンド判定モデル学習部405は、分析官IDリストのそれぞれの分析官IDを対象として、ループ1の処理(S1604~S1608)を反復的に実行する。ここで、処理対象の分析官IDを対象分析官IDということとする。 Next, the recommendation determination model learning unit 405 repeatedly executes the process of loop 1 (S1604 to S1608) for each analyst ID in the analyst ID list. Here, the analyst ID to be processed is referred to as the target analyst ID.

ループ1の処理において、リコメンド判定モデル学習部405は、ニュース記事情報テーブル701のそれぞれのレコードのニュース記事を対象として、ループ2の処理(S1604~S1607)を反復的に実行する。ここで、処理対象のニュース記事を対象ニュース記事ということとする。 In the process of Loop 1, the recommendation determination model learning unit 405 repeatedly executes the process of Loop 2 (S1604 to S1607) for the news articles in each record of the news article information table 701. Here, the news article to be processed is referred to as a target news article.

ループ2の処理では、リコメンド判定モデル学習部405は、対象ニュース記事のSNS拡散度(対応するレコードのSNS拡散度806の値)と所定の閾値とを比較し、SNS拡散度が閾値より高い場合には、対象ニュース記事を正のグループに分類し、SNS拡散度が閾値より低い場合には、対象ニュース記事を負のグループに分類する(ニュース記事分類処理:S1604)。対象ニュース記事を正のグループに分類した場合には、リコメンド判定モデル学習部405は、処理をステップS1605に進める一方、対象ニュース記事を負のグループに分類した場合には、処理をステップS1607に進める。なお、本実施形態では、閾値は、事前にパラメータとして定義され、ハードコーディングされたものとしているが、閾値をコンフィグファイルなどで定義し、事後に動的に変化させるようにしてもよい。 In the process of loop 2, the recommendation judgment model learning unit 405 compares the SNS diffusion degree of the target news article (the value of the SNS diffusion degree 806 of the corresponding record) with a predetermined threshold, and if the SNS diffusion degree is higher than the threshold value, In this case, the target news article is classified into a positive group, and if the SNS diffusion degree is lower than a threshold value, the target news article is classified into a negative group (news article classification process: S1604). If the target news article is classified into a positive group, the recommendation determination model learning unit 405 advances the process to step S1605, whereas if the target news article is classified into a negative group, the recommendation determination model learning unit 405 advances the process to step S1607. . Note that in this embodiment, the threshold value is defined in advance as a parameter and hard-coded, but the threshold value may be defined in a configuration file or the like and dynamically changed after the fact.

ステップS1605では、リコメンド判定モデル学習部405は、対象ニュース記事のニュース記事IDと対象分析官IDとを検索キーとして、閲覧履歴情報テーブル705を参照し、対象分析官IDの分析官による対象ニュース記事の閲覧の有無を判定し、対象ニュース記事が閲覧されていた場合には、対象ニュース記事を正のグループに分類し、対象ニュース記事が閲覧されていなかった場合には、対象ニュース記事を負のグループに分類する。対象ニュース記事が正のグループに分類された場合には、リコメンド判定モデル学習部405は、処理をステップS1606に進める一方、対象ニュース記事を負のグループに分類した場合には、処理をステップS1607に進める。 In step S1605, the recommendation determination model learning unit 405 refers to the viewing history information table 705 using the news article ID of the target news article and the target analyst ID as search keys, and searches for the target news article by the analyst with the target analyst ID. If the target news article has been viewed, the target news article is classified into a positive group, and if the target news article has not been viewed, the target news article is classified into a negative group. Categorize into groups. If the target news article is classified into a positive group, the recommendation determination model learning unit 405 advances the process to step S1606, whereas if the target news article is classified into a negative group, the recommendation determination model learning unit 405 advances the process to step S1607. Proceed.

ステップS1606では、対象ニュース記事を正の学習データとみなし、リコメンド判定モデル学習部405は、対象ニュース記事のレコードの特徴語リスト805の特徴語リストに対して、機械学習のための事前処理を実施する。ここで、正の学習データとは、リコメンド要として判断すべきニュース記事のデータである。なお、機械学習のための事前処理としては、例えば、ニュース記事の特徴語リストをトークナイズ等の方法により、数値ベクトル化する処理でもよく、機械学習手法(例えば、LSTMなど)が定義する所定のアルゴリズムを利用した処理でもよく、要は、判定モデルに対して入力するデータ形式とする処理であればよい。 In step S1606, the target news article is regarded as positive learning data, and the recommendation determination model learning unit 405 performs pre-processing for machine learning on the feature word list 805 of the record of the target news article. do. Here, the positive learning data is data of a news article that should be determined as requiring recommendation. Note that the preprocessing for machine learning may be, for example, a process of converting a feature word list of a news article into a numerical vector by a method such as tokenizing, or using a predetermined process defined by a machine learning method (such as LSTM). It may be a process using an algorithm, and in short, any process that uses a data format to be input to the judgment model is sufficient.

一方、ステップS1607では、対象ニュース記事を負の学習データとみなし、リコメンド判定モデル学習部405は、対象ニュース記事のレコードの特徴語リスト805の特徴語リストに対して、機械学習のための事前処理を実施する。ここで、負の学習データとは、リコメンド不要として判断すべきニュース記事のデータである。なお、機械学習の事前処理は、上記した正の学習データに対する事前処理と同様な処理とすることができる。 On the other hand, in step S1607, the target news article is regarded as negative learning data, and the recommendation determination model learning unit 405 performs preprocessing for machine learning on the feature word list 805 of the record of the target news article. Implement. Here, the negative learning data is data of news articles that should be determined as requiring no recommendation. Note that the preprocessing for machine learning can be similar to the preprocessing for the positive learning data described above.

上記したループ2の処理を、ニュース記事情報テーブル701の全てのレコードを対象として実行した後、ループ2の処理を抜けて、リコメンド判定モデル学習部405は、正の学習データと負の学習データとを用いて、リコメンド判定モデルを生成する(S1608)。本実施形態では、リコメンド判定モデルの生成方法としては、機械学習手法(例えばLSTMなど)が定める所定のアルゴリズムを利用し、機械学習によりリコメンド判定モデルを生成する。ここで、ステップS1608で生成されたコメント判定モデルは、対象分析官IDの分析官の閲覧履歴に対応したモデルとなっている。 After executing the process of loop 2 described above for all records in the news article information table 701, the process exits from the process of loop 2, and the recommendation judgment model learning unit 405 collects positive learning data and negative learning data. A recommendation determination model is generated using (S1608). In this embodiment, as a method for generating a recommendation determination model, a predetermined algorithm determined by a machine learning method (for example, LSTM) is used to generate a recommendation determination model by machine learning. Here, the comment determination model generated in step S1608 is a model corresponding to the viewing history of the analyst with the target analyst ID.

次いで、リコメンド判定モデル学習部405は、分析官IDリストの全ての分析官IDに対して、ループ1の処理(S1604~S1608)を実行することで、各分析官IDに対して、リコメンド判定モデルを1つずつ生成する。 Next, the recommendation judgment model learning unit 405 executes the process of loop 1 (S1604 to S1608) for all analyst IDs in the analyst ID list, thereby creating a recommendation judgment model for each analyst ID. Generate one by one.

そして、リコメンド判定モデル学習部405は、分析官IDリストの全ての分析官IDに対してループ1の処理を実行した後、ループ1の処理を抜けて、判定モデル機械学習処理を終了する。 After executing the process of loop 1 for all analyst IDs in the analyst ID list, the recommendation judgment model learning unit 405 exits the process of loop 1 and ends the judgment model machine learning process.

上記した判定モデル機械学習処理によると、分析官のニュース記事に対する閲覧履歴と、ニュース記事のSNS拡散度とに基づいて、リコメンド判定モデルを生成することで、分析官が脅威情報の解析とは違う目的で閲覧してしまったニュース記事が正の学習データとして学習されてしまう可能性を低減することができる。これにより、リコメンド判定モデルによって分析官に対して、脅威情報の解析に有益なニュース記事を適切にリコメンドすることができるようになる。本実施形態は、脅威に関する記事の社会的な拡散度を重要視する傾向のあるSOCにおいて、社会的な拡散度の低い記事への閲覧は、誤閲覧である可能性が高く、誤閲覧の記事を正の学習データとされないようにすることができるので、特に有効である。 According to the above-mentioned decision model machine learning process, the recommendation decision model is generated based on the analyst's viewing history of news articles and the degree of SNS dissemination of the news article, which is different from the analysis of threat information by the analyst. It is possible to reduce the possibility that news articles that have been viewed for that purpose will be learned as positive learning data. This makes it possible to appropriately recommend news articles that are useful for analyzing threat information to analysts using the recommendation determination model. In this embodiment, in an SOC that tends to place importance on the degree of social dissemination of articles related to threats, the view of an article with a low degree of social dissemination is likely to be an erroneous view, and the erroneously viewed article This is particularly effective because it prevents the data from being treated as positive learning data.

(リコメンド表示画面)
図17は、第一実施形態に係るリコメンド画面の表示例である。
(Recommendation display screen)
FIG. 17 is a display example of the recommendation screen according to the first embodiment.

リコメンド画面1701は、分析官ID表示領域1702、更新日時表示領域1703、ニュース記事情報表示領域1704、及びニュース記事へのハイパーリンク1705を備えている。 The recommendation screen 1701 includes an analyst ID display area 1702, an update date/time display area 1703, a news article information display area 1704, and a hyperlink 1705 to the news article.

分析官ID表示領域1702には、リコメンド通知処理のリコメンド結果配信依頼処理(S1401)で与えられた分析官IDが表示される。なお、本実施形態では、リコメンド画面1701に分析官IDを表示しているが、分析官情報テーブル702の分析官IDに対応するレコードの分析官その他属性情報902の値を参照して、分析官の氏名を表示するようにしてもよい。 The analyst ID display area 1702 displays the analyst ID given in the recommendation result distribution request process (S1401) of the recommendation notification process. In this embodiment, the analyst ID is displayed on the recommendation screen 1701, but the value of the analyst other attribute information 902 of the record corresponding to the analyst ID in the analyst information table 702 is referred to, and the analyst ID is displayed on the recommendation screen 1701. The name of the person may be displayed.

更新日時表示領域1703には、表示対象のニュース記事に対応するニュース記事情報テーブル701のレコードの更新日時804の情報(更新日時)が表示される。本実施形態では、リコメンド配信部404は、更新日時に基づいてニュース記事情報をソートしている。 In the update date and time display area 1703, information on the update date and time 804 (update date and time) of the record in the news article information table 701 corresponding to the news article to be displayed is displayed. In this embodiment, the recommendation distribution unit 404 sorts the news article information based on the update date and time.

ニュース記事情報表示領域1704には、表示対象のニュース記事に対応するニュース記事情報テーブル701のレコードのその他属性情報803の値や、SNS拡散度806のSNS拡散度、リコメンド判定結果リスト807の情報が表示される。なお、表示対象のニュース記事は、リコメンド判定がリコメンド要となっているニュース記事だけとしてもよい。 The news article information display area 1704 displays the value of the other attribute information 803 of the record of the news article information table 701 corresponding to the news article to be displayed, the SNS diffusion degree of the SNS diffusion degree 806, and the information of the recommendation determination result list 807. Is displayed. Note that the news articles to be displayed may be only the news articles for which the recommendation determination requires recommendation.

ハイパーリンク1705は、ニュース配信サーバ102の表示対象のニュース記事へのURLリンクであり、表示対象のニュース記事に対応するニュース記事情報テーブル701のレコードのその他属性情報803の情報に基づいて生成される。ハイパーリンク1705がクリックされると、リコメンド通知処理の記事閲覧依頼処理(S1404)が呼び出され、閲覧履歴情報テーブル705には、このニュース記事に対する閲覧履歴が記録され、ニュース配信サーバ102が配信するこのニュース記事へリダイレクトされる。 The hyperlink 1705 is a URL link to the news article to be displayed on the news distribution server 102, and is generated based on the information in the other attribute information 803 of the record in the news article information table 701 corresponding to the news article to be displayed. . When the hyperlink 1705 is clicked, the article viewing request process (S1404) of the recommendation notification process is called, the viewing history for this news article is recorded in the viewing history information table 705, and this news article distributed by the news distribution server 102 is You will be redirected to the news article.

(第二実施形態)
次に、第二実施形態に係る情報提供システムの一例としての脅威情報提供システムについて説明する。
(Second embodiment)
Next, a threat information providing system as an example of the information providing system according to the second embodiment will be described.

第二実施形態に係る脅威情報提供システムでは、リコメンド判定モデルの学習データとして、分析官から顧客へ配信されたレポート情報を利用する点、リコメンド判定モデルに配信先の顧客の属性等からタグ付けする点、リコメンド判定モデルに付されたタグに基づき、他分析官用に生成されたリコメンド判定モデルをリコメンド判定に活用する点が第一実施形態と相違する。なお、第二実施形態の説明においては、第一実施形態との相違点を中心に説明し、第一実施形態と共通する点については説明を省略する。また、第二実施形態の説明において、第一実施形態と同一又は同様な部分については同一符号を付して説明する。 The threat information providing system according to the second embodiment uses report information distributed from an analyst to a customer as learning data for a recommendation determination model, and tags the recommendation determination model based on the attributes of the customer to whom the recommendation determination model is distributed. This embodiment differs from the first embodiment in that a recommendation judgment model generated for another analyst is utilized for recommendation judgment based on the tag attached to the recommendation judgment model. In addition, in the description of the second embodiment, the differences from the first embodiment will be mainly explained, and the description of the common points with the first embodiment will be omitted. In addition, in the description of the second embodiment, parts that are the same as or similar to those of the first embodiment will be described with the same reference numerals.

(脅威情報提供システム)
第二実施形態に係る脅威情報提供システムの構成は、図1に示す第一実施形態に係る脅威情報提供システムの構成と同様である。
(Threat information provision system)
The configuration of the threat information providing system according to the second embodiment is similar to the configuration of the threat information providing system according to the first embodiment shown in FIG.

(機能構成)
第二実施形態の脅威情報提供システムが備える機能は、第一実施形態に係る脅威情報提供システムと同様な機能に対して、一部の機能が追加又は変更されている。
(Functional configuration)
The functions provided in the threat information providing system of the second embodiment are similar to those of the threat information providing system according to the first embodiment, but some functions are added or changed.

(ハードウェア構成)
第二実施形態の脅威情報提供システム100を構成する各装置のハードウェアは、第一実施形態と同様に、図6に示すコンピュータ601により構成されている。
(Hardware configuration)
The hardware of each device constituting the threat information providing system 100 of the second embodiment is configured by the computer 601 shown in FIG. 6, as in the first embodiment.

(データ構成)
次に、第二実施形態のリコメンド装置104が利用するデータについて説明する。
(Data structure)
Next, data used by the recommendation device 104 of the second embodiment will be explained.

第二実施形態で利用するデータは、分析官によるニュース記事の閲覧履歴を含まない代わりに、分析官による顧客へのレポート配信履歴を含んでいる点が第一実施形態と相違する。 The data used in the second embodiment differs from the first embodiment in that the data used in the second embodiment does not include the viewing history of news articles by analysts, but instead includes the history of report distribution by analysts to customers.

図18は、第二実施形態に係るデータベースに格納されるデータテーブルを示す図である。 FIG. 18 is a diagram showing a data table stored in a database according to the second embodiment.

データベース106は、ニュース記事情報テーブル701、分析官情報テーブル1801、SNS情報テーブル703、リコメンド判定モデル情報テーブル1802、レポート配信履歴情報テーブル1803、及び配信先情報テーブル1804を格納する。これらテーブルは、レコードが含む所定のIDなどにより相互に関連付けられている。なお、ニュース記事情報テーブル701、及びSNS情報テーブル703は、第一実施形態と同一の構成である。 The database 106 stores a news article information table 701, an analyst information table 1801, an SNS information table 703, a recommendation judgment model information table 1802, a report distribution history information table 1803, and a distribution destination information table 1804. These tables are associated with each other by a predetermined ID included in the record. Note that the news article information table 701 and the SNS information table 703 have the same configuration as the first embodiment.

図19は、第二実施形態に係る分析官情報テーブルの構成を説明する図である。 FIG. 19 is a diagram illustrating the structure of an analyst information table according to the second embodiment.

分析官情報テーブル1801は、分析官ごとのレコードを格納する。分析官情報テーブル1801のレコードは、分析官ID1901、分析官その他属性情報1902、及び配信先属性タグリスト1903をデータ項目として有する。 Analyst information table 1801 stores records for each analyst. A record in the analyst information table 1801 has an analyst ID 1901, analyst and other attribute information 1902, and distribution destination attribute tag list 1903 as data items.

分析官ID1901には、レコードに対応する分析官に対してユニークに割り当てられた識別子(分析官ID)が格納される。分析官その他属性情報1902には、レコードに対応する分析官の氏名等の画面表示に利用される分析官の属性情報が格納される。配信先属性タグリスト1903には、レコードに対応する分析官がレポートを配信する配信先(顧客)の属性を表すタグ(配信先属性タグ)のリストが格納される。配信先属性タグとしては、例えば、配信先の業種を表すタグや、配信先への配信内容を表すタグ、配信先のシステム環境を表すタグなどがある。 The analyst ID 1901 stores an identifier (analyst ID) uniquely assigned to the analyst corresponding to the record. Analyst and other attribute information 1902 stores analyst attribute information used for screen display, such as the name of the analyst corresponding to the record. The distribution destination attribute tag list 1903 stores a list of tags (distribution destination attribute tags) representing the attributes of distribution destinations (customers) to which the analyst corresponding to the record will distribute the report. Delivery destination attribute tags include, for example, tags representing the industry of the delivery destination, tags representing the content of distribution to the delivery destination, and tags representing the system environment of the delivery destination.

なお、本実施形態では、分析官情報テーブル1801は、各分析官のレコードの各情報が事前に定義されて、データベース106に格納されているものとしている。 In this embodiment, it is assumed that in the analyst information table 1801, each information of each analyst's record is defined in advance and stored in the database 106.

図20は、第二実施形態に係るリコメンド判定モデル情報テーブルの構成を説明する図である。 FIG. 20 is a diagram illustrating the configuration of a recommendation determination model information table according to the second embodiment.

リコメンド判定モデル情報テーブル1802は、リコメンド判定を行うための機械学習により得られたリコメンド判定モデルごとのレコードを格納する。リコメンド判定モデル情報テーブル1802のレコードは、リコメンド判定モデルID2001、リコメンド判定モデル2002、及び配信先属性タグ2003をデータ項目として有する。 The recommendation determination model information table 1802 stores records for each recommendation determination model obtained by machine learning for making recommendation determinations. The record of the recommendation judgment model information table 1802 has a recommendation judgment model ID 2001, a recommendation judgment model 2002, and a distribution destination attribute tag 2003 as data items.

リコメンド判定モデルID2001には、レコードに対応するリコメンド判定モデルに対してユニークに割り当てられた識別子(判定モデルID)が格納される。リコメンド判定モデル2002には、レコードに対応するリコメンド判定モデルが格納される。配信先属性タグ2003には、レコードに対応するリコメンド判定モデルが対象としている配信先の属性を表すタグ(配信先属性タグ)が格納される。 The recommendation judgment model ID 2001 stores an identifier (determination model ID) uniquely assigned to a recommendation judgment model corresponding to a record. The recommendation judgment model 2002 stores recommendation judgment models corresponding to records. The distribution destination attribute tag 2003 stores a tag (distribution destination attribute tag) representing the attribute of the distribution destination targeted by the recommendation determination model corresponding to the record.

図21は、第二実施形態に係るレポート配信履歴情報テーブルの構成を説明する図である。 FIG. 21 is a diagram illustrating the configuration of a report distribution history information table according to the second embodiment.

レポート配信履歴情報テーブル1803は、レポートの配信履歴ごとのレコードを格納する。ここで、レポートの配信履歴は、以下の構成からわかるように、レポートにおけるニュース記事の使用履歴ということもできる。レポート配信履歴情報テーブル1803のレコードは、レポートID2101、参照記事IDリスト2102、配信先ID2103、及び配信日時2104をデータ項目として有する。 The report distribution history information table 1803 stores records for each report distribution history. Here, the report distribution history can also be referred to as the usage history of news articles in the report, as can be seen from the configuration below. A record in the report distribution history information table 1803 has a report ID 2101, a reference article ID list 2102, a distribution destination ID 2103, and a distribution date and time 2104 as data items.

レポートID2101には、レコードに対応するレポートに対してユニークに割り当てられた識別子(レポートID)が格納される。参照記事IDリスト2102には、レコードに対応するレポートにおいて参照(使用)された記事IDのリスト(参照記事IDリスト)が格納される。配信先ID2103には、レコードに対応するレポートを配信した配信先(顧客)のID(顧客ID:配信先ID)が格納される。配信日時2104には、レコードに対応するレポートを配信した日時が格納される。 The report ID 2101 stores an identifier (report ID) uniquely assigned to a report corresponding to a record. The reference article ID list 2102 stores a list of article IDs (reference article ID list) referenced (used) in the report corresponding to the record. The distribution destination ID 2103 stores the ID of the distribution destination (customer) to which the report corresponding to the record was distributed (customer ID: distribution destination ID). The distribution date and time 2104 stores the date and time when the report corresponding to the record was distributed.

図22は、第二実施形態に係る配信先情報テーブルの構成を説明する図である。 FIG. 22 is a diagram illustrating the configuration of a distribution destination information table according to the second embodiment.

配信先情報テーブル1804は、レポートの配信先ごとのレコードを格納する。配信先情報テーブル1804のレコードは、配信先ID2201及び配信先属性タグリスト2202をデータ項目として有する。 The distribution destination information table 1804 stores records for each report distribution destination. A record in the distribution destination information table 1804 has a distribution destination ID 2201 and a distribution destination attribute tag list 2202 as data items.

配信先ID2201には、レコードに対応する配信先(顧客)に対してユニークに割り当てられた識別子(顧客ID)が格納される。配信先属性タグリスト2202には、レコードに対応する配信先の属性を表すタグ(配信先属性タグ)のリストが格納される。 The distribution destination ID 2201 stores an identifier (customer ID) uniquely assigned to the distribution destination (customer) corresponding to the record. The distribution destination attribute tag list 2202 stores a list of tags (distribution destination attribute tags) representing attributes of the distribution destination corresponding to the record.

なお、本実施形態では、配信先情報テーブル1804は、各配信先に対応するレコードの各情報が事前に定義されて、データベース106に格納されているものとしている。 In this embodiment, it is assumed that in the distribution destination information table 1804, each information of a record corresponding to each distribution destination is defined in advance and stored in the database 106.

次に、第二実施形態における脅威情報提供システム100による脅威情報提供方法の処理動作について説明する。以下で説明する脅威情報提供方法の処理における各種動作は、例えばリコメンド装置104がプログラム(情報提供プログラム)をメモリ603などに読み出してCPU602が実行することによって実現される。このプログラムは、以下に説明される各種の動作を行うためのコードを含む。なお、以下の説明においては、リコメンド装置104が実行する処理のみならず、他の装置が実行する処理についても適宜説明する。 Next, processing operations of the threat information providing method by the threat information providing system 100 in the second embodiment will be described. Various operations in the process of the threat information providing method described below are realized by, for example, the recommendation device 104 reading out a program (information providing program) into the memory 603 or the like, and the CPU 602 executing the program. This program includes code for performing various operations described below. In the following description, not only the processing executed by the recommendation device 104 but also the processing executed by other devices will be explained as appropriate.

(リコメンド判定処理)
第二実施形態に係る脅威情報提供システムにおけるリコメンド判定処理は、第一実施形態の脅威情報提供システムと同一である。
(Recommendation judgment process)
The recommendation determination process in the threat information providing system according to the second embodiment is the same as that in the threat information providing system according to the first embodiment.

(リコメンド通知処理)
図23は、第二実施形態に係るリコメンド通知処理のシーケンス図である。ここで、リコメンド通知処理は、リコメンド装置104よりリコメンド結果を取得する処理と、クライアント105によりリコメンド結果を表示する処理が含まれる。なお、第一実施形態に係るリコメンド通知処理(図14)と同一のステップには、同一の符号を付す。
(Recommendation notification processing)
FIG. 23 is a sequence diagram of recommendation notification processing according to the second embodiment. Here, the recommendation notification process includes a process of acquiring a recommendation result from the recommendation device 104 and a process of displaying the recommendation result by the client 105. Note that the same steps as in the recommendation notification process (FIG. 14) according to the first embodiment are given the same reference numerals.

まず、クライアント105は、リコメンド結果配信依頼処理(S1401)を実行する。次に、リコメンド結果の配信の依頼を受けたリコメンド装置104のリコメンド配信部404は、ニュース記事情報テーブル701からニュース記事情報を取得する(ニュース記事情報取得処理:S2301)。ニュース記事情報取得処理(S2301)では、リコメンド配信部404は、依頼に含まれる分析官IDを検索キーとして、分析官情報テーブル1802から配信先属性タグリスト1903の配信先属性タグリストを取得し、配信先属性タグリストの配信先属性タグを検索キーとしてリコメンド判定モデル情報テーブル1802を参照することにより、配信先属性タグに対応するリコメンド判定モデルIDを取得し、ニュース記事情報テーブル701から、取得したリコメンド判定モデルIDのリコメンド判定モデルによってリコメンド要と判定されていることを示しているレコードのニュース記事情報を取得する。なお、ニュース記事情報取得処理で取得するニュース記事情報としては、ニュース記事ID、その他属性情報、及び更新日時を含んでいてもよい。 First, the client 105 executes recommendation result distribution request processing (S1401). Next, the recommendation distribution unit 404 of the recommendation device 104, which has received the request to distribute the recommendation results, acquires news article information from the news article information table 701 (news article information acquisition process: S2301). In the news article information acquisition process (S2301), the recommendation distribution unit 404 uses the analyst ID included in the request as a search key to acquire the distribution destination attribute tag list of the distribution destination attribute tag list 1903 from the analyst information table 1802, By referring to the recommendation judgment model information table 1802 using the delivery destination attribute tag in the delivery destination attribute tag list as a search key, the recommendation judgment model ID corresponding to the delivery destination attribute tag is obtained, and the recommendation judgment model ID corresponding to the delivery destination attribute tag is obtained from the news article information table 701. News article information of a record indicating that it is determined that a recommendation is required by the recommendation determination model of the recommendation determination model ID is acquired. Note that the news article information acquired in the news article information acquisition process may include a news article ID, other attribute information, and update date and time.

次に、リコメンド通知処理では、ステップS1403~ステップS1407の処理を実施する。 Next, in the recommendation notification process, steps S1403 to S1407 are executed.

レポート配信処理(S1407)の後、クライアント105のレポート配信部505は、送受信部501を介して、リコメンド装置104にレポート配信履歴情報を転送する(S2302)。なお、レポート配信履歴情報には、レポートID、配信先ID、配信日時、及びレポート本文を含んでいてもよい。 After the report distribution process (S1407), the report distribution unit 505 of the client 105 transfers the report distribution history information to the recommendation device 104 via the transmission/reception unit 501 (S2302). Note that the report distribution history information may include a report ID, a distribution destination ID, a distribution date and time, and a report text.

次に、リコメンド装置104のリコメンド配信部404は、取得したレポート配信履歴情報に含まれるレポート本文から特徴語を抽出し、抽出した特徴語を検索キーとしてニュース記事情報テーブル701の特徴語リスト805を検索し、得られたレコードのニュース記事ID801からレポートに関連するニュース記事のニュース記事IDを特定する(S2303)。このように特定したニュース記事IDをリスト化したものが、レポート配信履歴情報テーブル1803の参照記事IDリスト2102に格納される参照記事IDリストに該当する。 Next, the recommendation distribution unit 404 of the recommendation device 104 extracts characteristic words from the report text included in the acquired report distribution history information, and uses the extracted characteristic words as a search key to search the characteristic word list 805 of the news article information table 701. The search is performed, and the news article ID of the news article related to the report is specified from the news article ID 801 of the obtained record (S2303). A list of news article IDs identified in this manner corresponds to the reference article ID list stored in the reference article ID list 2102 of the report distribution history information table 1803.

次に、リコメンド装置104のリコメンド配信部404は、レポート配信履歴情報テーブル1803に、レポート配信履歴情報(ここでは、レポートID、参照記事IDリスト、配信先ID、及び配信日時)を格納する(S2304)。 Next, the recommendation distribution unit 404 of the recommendation device 104 stores report distribution history information (here, report ID, reference article ID list, distribution destination ID, and distribution date and time) in the report distribution history information table 1803 (S2304 ).

上記したリコメンド配信処理では、配信先属性タグを利用して配信するニュース記事を特定することで、新規に加入して、まだ十分な履歴情報が蓄積されていない分析官に対して、配信先属性タグが表す配信先に適したニュース記事をリコメンドすることができる。 In the above-mentioned recommendation distribution process, by specifying the news article to be distributed using the distribution destination attribute tag, the distribution destination attribute is sent to newly subscribed analysts who have not yet accumulated sufficient history information. It is possible to recommend news articles suitable for the distribution destination represented by the tag.

(リコメンド判定モデル学習処理)
図24は、第二実施形態に係るリコメンド判定モデル学習処理のシーケンス図である。ここで、リコメンド判定モデル学習処理は、リコメンド装置104によりリコメンド判定モデルを学習(機械学習)するための処理が含まれる。なお、第一実施形態に係るリコメンド判定モデル学習処理(図15)と同一のステップには、同一の符号を付す。
(Recommendation decision model learning process)
FIG. 24 is a sequence diagram of recommendation determination model learning processing according to the second embodiment. Here, the recommendation judgment model learning process includes processing for learning (machine learning) a recommendation judgment model by the recommendation device 104. Note that the same steps as in the recommendation determination model learning process (FIG. 15) according to the first embodiment are given the same reference numerals.

まず、定期起動処理(S1501)を実行する。次に、リコメンド装置104のリコメンド判定モデル学習部405は、レポート配信履歴情報テーブル1803に配信先IDをキーとして配信先情報テーブル1804を結合させ、レポート配信履歴情報を全て取得する。なお、ここで取得するレポート配信履歴情報には、例えば、レポートID、参照記事IDリスト、及び配信先属性タグリストが含まれている。次に、リコメンド装置104のリコメンド判定モデル学習部405は、ニュース記事情報テーブル701からニュース記事情報を全て取得する(S2401)。なお、取得するニュース記事情報には、ニュース記事ID、特徴語リスト、SNS拡散度が含まれている。 First, periodic startup processing (S1501) is executed. Next, the recommendation determination model learning unit 405 of the recommendation device 104 combines the report distribution history information table 1803 with the distribution destination information table 1804 using the distribution destination ID as a key, and acquires all report distribution history information. Note that the report distribution history information acquired here includes, for example, a report ID, a reference article ID list, and a distribution destination attribute tag list. Next, the recommendation determination model learning unit 405 of the recommendation device 104 acquires all news article information from the news article information table 701 (S2401). Note that the news article information to be acquired includes a news article ID, a list of characteristic words, and a degree of SNS diffusion.

次に、記事取得処理(S1503)を実行する。次に、リコメンド装置104のリコメンド判定モデル学習部405は、リコメンド判定モデルを機械学習する(判定モデル機械学習処理:S2402)。判定モデル機械学習処理については、図25を用いて後述する。 Next, article acquisition processing (S1503) is executed. Next, the recommendation judgment model learning unit 405 of the recommendation device 104 performs machine learning on the recommendation judgment model (determination model machine learning process: S2402). The determination model machine learning process will be described later using FIG. 25.

次に、リコメンド装置104のリコメンド判定モデル学習部405は、判定モデル機械学習処理(S2402)で生成した判別モデルをリコメンド判定モデル情報テーブル1802に格納し(S2403)、リコメンド判定モデル学習処理を終了する。 Next, the recommendation judgment model learning unit 405 of the recommendation device 104 stores the discrimination model generated in the judgment model machine learning process (S2402) in the recommendation judgment model information table 1802 (S2403), and ends the recommendation judgment model learning process. .

次に、判定モデル機械学習処理(S2402)について説明する。 Next, the judgment model machine learning process (S2402) will be explained.

図25は、第二実施形態に係る判定モデル機械学習処理のフローチャートである。なお、第一実施形態に係る判定モデル機械学習処理(図16)と同一のステップには、同一の符号を付す。 FIG. 25 is a flowchart of the judgment model machine learning process according to the second embodiment. Note that the same steps as in the judgment model machine learning process (FIG. 16) according to the first embodiment are given the same reference numerals.

判定モデル機械学習処理では、リコメンド装置104のリコメンド判定モデル学習部405は、リコメンド判定モデル情報テーブル1802の配信先属性タグを取得し、配信先属性タグのユニークなリスト(配信先属性タグリスト)を作成する(S2501)。 In the judgment model machine learning process, the recommendation judgment model learning unit 405 of the recommendation device 104 acquires the distribution destination attribute tags of the recommendation judgment model information table 1802, and creates a unique list of distribution destination attribute tags (distribution destination attribute tag list). Create (S2501).

次に、リコメンド判定モデル学習部405は、配信先属性タグリストのそれぞれの配信先属性タグを対象として、ループ1Aの処理(S1604、S2503、S1606~S1608)を反復的に実行する。ここで、処理対象の配信先属性タグを対象属性タグということとする。 Next, the recommendation determination model learning unit 405 repeatedly executes the process of loop 1A (S1604, S2503, S1606 to S1608) for each distribution destination attribute tag in the distribution destination attribute tag list. Here, the distribution destination attribute tag to be processed is referred to as a target attribute tag.

ループ1Aの処理において、リコメンド判定モデル学習部405は、ニュース記事情報テーブル701のそれぞれのレコードのニュース記事を対象として、ループ2Aの処理(S1604、S2503、S1606、S1607)を反復的に実行する。ここで、処理対象のニュース記事を対象ニュース記事ということとする。 In the process of loop 1A, the recommendation determination model learning unit 405 repeatedly executes the process of loop 2A (S1604, S2503, S1606, S1607) for the news articles of each record of the news article information table 701. Here, the news article to be processed is referred to as a target news article.

ループ2Aの処理において、リコメンド判定モデル学習部405は、ニュース記事分類処理(S1604)で対象ニュース記事を正のグループに分類した場合には、対象ニュース記事のニュース記事IDと対象属性タグとを検索キーとして、レポート配信履歴情報テーブル1803を検索することにより、対象ニュース記事の対象属性タグに対応する配信先のレポートでの参照(使用)の有無を判定し、レポートでの参照があった場合、対象ニュース記事を正のグループに分類する一方、レポートでの参照がなかった場合、対象ニュース記事を負のグループに分類する(S2503)。 In the process of loop 2A, if the target news article is classified into a positive group in the news article classification process (S1604), the recommendation determination model learning unit 405 searches the news article ID and target attribute tag of the target news article. By searching the report distribution history information table 1803 as a key, it is determined whether the target attribute tag of the target news article is referenced (used) in the report of the distribution destination corresponding to the target attribute tag, and if there is a reference in the report, The target news article is classified into a positive group, and if there is no reference in the report, the target news article is classified into a negative group (S2503).

次に、リコメンド判定モデル学習部405は、対象ニュース記事を正のグループに分類した場合には、ステップS1606の処理を実行し、対象ニュース記事を負のグループに分類した場合には、ステップS1607の処理を実行する。 Next, the recommendation determination model learning unit 405 executes the process of step S1606 when the target news article is classified into a positive group, and executes the process of step S1607 when the target news article is classified into a negative group. Execute processing.

上記したループ2Aの処理を、ニュース記事情報テーブル701の全てのレコードを対象として実行した後、ループ2Aの処理を抜けて、リコメンド判定モデル学習部405は、ステップS1608の処理を実行する。ここで、ステップS1608で生成されたコメント判定モデルは、対象属性タグに対応する配信先へのレポートでのニュース記事の参照履歴に対応したモデルとなっている。 After executing the process of loop 2A described above for all records in the news article information table 701, the process exits from the process of loop 2A, and the recommendation determination model learning unit 405 executes the process of step S1608. Here, the comment determination model generated in step S1608 is a model corresponding to the reference history of the news article in the report to the distribution destination corresponding to the target attribute tag.

次いで、リコメンド判定モデル学習部405は、配信先属性タグリストの全ての配信先属性タグに対して、ループ1Aの処理(S1604、S2503、S1606~S1608)を実行することで、各配信先属性タグに対して、リコメンド判定モデルを1つずつ生成する。 Next, the recommendation judgment model learning unit 405 executes the process of loop 1A (S1604, S2503, S1606 to S1608) for all the distribution destination attribute tags in the distribution destination attribute tag list, thereby adjusting each distribution destination attribute tag. Recommendation decision models are generated one by one for each.

そして、リコメンド判定モデル学習部405は、各配信先属性タグリストの全ての配信先属性タグに対してループ1Aの処理を実行した後、ループ1Aの処理を抜けて、判定モデル機械学習処理を終了する。 After executing the process of loop 1A for all the distribution destination attribute tags in each distribution destination attribute tag list, the recommendation judgment model learning unit 405 exits the process of loop 1A and ends the judgment model machine learning process. do.

上記した判定モデル機械学習処理によると、配信先属性タグに対応する配信先へのレポートにおけるニュース記事の参照履歴と、ニュース記事のSNS拡散度との組合せに基づいて、配信先属性タグ毎にリコメンド判定モデルを生成することで、配信先属性タグに対応する配信先のレポートで参照されたニュース記事を正の学習データとして利用するので、このリコメンド判定モデルによって、分析官に対して、配信先の属性に適した有益なニュース記事を適切にリコメンドすることができるようになる。 According to the above-described decision model machine learning process, recommendations are made for each destination attribute tag based on a combination of the reference history of news articles in reports to the destination corresponding to the destination attribute tag and the SNS diffusion degree of the news article. By generating a judgment model, the news articles referenced in the report of the delivery destination corresponding to the delivery destination attribute tag are used as positive learning data, so this recommendation judgment model allows the analyst to It becomes possible to appropriately recommend useful news articles suitable for attributes.

(リコメンド表示画面)
図26は、第二実施形態に係るリコメンド画面の表示例である。なお、第一実施形態に係るリコメンド画面1701(図17)と同一の構成には、同一の符号を付す。
(Recommendation display screen)
FIG. 26 is a display example of a recommendation screen according to the second embodiment. Note that the same components as the recommendation screen 1701 (FIG. 17) according to the first embodiment are given the same reference numerals.

リコメンド画面2601は、分析官ID表示領域1702、更新日時表示領域1703、ニュース記事情報表示領域1704、ニュース記事へのハイパーリンク1705、及び属性タグ表示領域2602を備えている。 The recommendation screen 2601 includes an analyst ID display area 1702, an update date and time display area 1703, a news article information display area 1704, a hyperlink to the news article 1705, and an attribute tag display area 2602.

属性タグ表示領域2602は、ニュース記事情報テーブル701のリコメンド判定結果リスト807における、リコメンド要の判定結果と対応付けられているリコメンド判定モデルに対応付けられている配信先属性タグ(リコメンド判定モデル情報テーブル1802の配信先属性タグ2003の値)が表示される。 The attribute tag display area 2602 displays the distribution destination attribute tag (recommendation model information table 1802 (value of distribution destination attribute tag 2003) is displayed.

このように、リコメンド画面2601において、ニュース記事に配信先属性タグを付して表示することにより、分析官はニュース記事がどういった分類の中でリコメンドされているか容易且つ適切に知ることができる。例えば、「金融」という配信先属性タグが付いていれば、金融分野の顧客に向けたレポートでよく参照されているニュース記事に基づいて、リコメンドされていることがわかる。これにより、分析官は、関与する顧客に応じて、閲覧すべきニュース記事を迅速且つ適切に把握することができる。 In this way, by displaying a news article with a distribution destination attribute tag on the recommendation screen 2601, the analyst can easily and appropriately know in what category the news article is recommended. . For example, if the destination attribute tag is "financial", you can see that the recommendation is based on news articles that are frequently referenced in reports aimed at customers in the financial field. This allows the analyst to quickly and appropriately grasp the news articles to be viewed depending on the customer involved.

なお、本発明は、上述の各実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。例えば、上記した各実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。 Note that the present invention is not limited to the above-described embodiments, and can be implemented with appropriate modifications without departing from the spirit of the present invention. For example, each of the embodiments described above has been described in detail to explain the present invention in an easy-to-understand manner, and the present invention is not necessarily limited to having all the configurations described.

例えば、上記第一実施形態では、ニュース記事の拡散度が所定の閾値より高く、且つ、閲覧履歴により分析官により閲覧されたことがあるニュース記事を、正の学習データに分類し、正の学習データに分類された記事以外の記事を負の学習データとして、機械学習を行うことにより、リコメンド判定モデルを生成していたが、本発明はこれに限られず、例えば、ニュース記事の拡散度が所定の閾値より低い記事と、閲覧履歴によりユーザにより閲覧されたことがないニュース記事とを、負の学習データに分類し、負の学習データに分類された記事以外の記事を正の学習データとして、機械学習を行うことにより、リコメンド判定モデルを生成するようにしてもよい。 For example, in the first embodiment, a news article whose diffusion degree is higher than a predetermined threshold and which has been viewed by an analyst based on the viewing history is classified as positive learning data, and the news article is classified as positive learning data. A recommendation judgment model has been generated by performing machine learning using articles other than articles classified as data as negative learning data, but the present invention is not limited to this. Articles lower than the threshold and news articles that have never been viewed by the user based on the viewing history are classified as negative learning data, and articles other than those classified as negative learning data are treated as positive learning data. A recommendation determination model may be generated by performing machine learning.

また、上記した各実施形態では、機械学習により生成されたリコメンド判定モデルにより、ニュース記事をリコメンドするか否かを判定するようにしていたが、本発明はこれに限られず、ニュース記事の特徴情報と、ニュース記事の拡散度と、ニュース記事のユーザによる使用履歴とに基づいて、ニュース記事をリコメンドするか否かを判定する所定のアルゴリズムを予め生成しておき、判定する対象のニュース記事の特徴情報と、そのニュース記事の拡散度と、そのニュース記事のユーザによる使用履歴とに基づいて、所定のアルゴリズムにより、ニュース記事をリコメンドするか否かを判定するようにしてもよい。 Further, in each of the above-described embodiments, it is determined whether or not to recommend a news article using a recommendation determination model generated by machine learning, but the present invention is not limited to this, and the feature information of a news article A predetermined algorithm is generated in advance to determine whether or not to recommend a news article based on the degree of spread of the news article and the usage history of the news article by the user, and the characteristics of the news article to be determined are generated in advance. A predetermined algorithm may be used to determine whether or not to recommend a news article based on the information, the degree of spread of the news article, and the usage history of the news article by the user.

また、上記の各構成、機能、処理部、処理手段などは、それらの一部又は全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。また、上記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイルなどの情報は、メモリや、ハードディスク、SSD(Solid State Drive)などの記録装置、または、ICカード、SDカード、DVDなどの記録媒体に置くことができる。 Further, each of the above-mentioned configurations, functions, processing units, processing means, etc. may be partially or entirely realized in hardware by, for example, designing an integrated circuit. Further, each of the above configurations, functions, etc. may be realized by software by a processor interpreting and executing a program for realizing each function. Information such as programs, tables, and files for realizing each function can be stored in a memory, a recording device such as a hard disk, a solid state drive (SSD), or a recording medium such as an IC card, an SD card, or a DVD.

また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。 Further, the control lines and information lines are shown to be necessary for explanation purposes, and not all control lines and information lines are necessarily shown in the product. In reality, almost all components may be considered to be interconnected.

100 脅威情報提供システム、101 ネットワーク、102 ニュース配信サーバ、103 SNS配信サーバ、104 リコメンド装置、105 クライアント、106 データベース、602 CPU、603 メモリ、604 外部記憶装置、605 送受信装置、606 出力装置、607 入力装置、701 ニュース記事情報テーブル、702 分析官情報テーブル、703 SNS情報テーブル、704 リコメンド判定モデル情報テーブル、705 閲覧履歴情報テーブル、1801 分析官情報テーブル、1802 リコメンド判定モデル情報テーブル、1803 レポート配信履歴情報テーブル、1804 配信先情報テーブル

100 threat information providing system, 101 network, 102 news distribution server, 103 SNS distribution server, 104 recommendation device, 105 client, 106 database, 602 CPU, 603 memory, 604 external storage device, 605 transmitting/receiving device, 606 output device, 607 input device, 701 news article information table, 702 analyst information table, 703 SNS information table, 704 recommendation judgment model information table, 705 viewing history information table, 1801 analyst information table, 1802 recommendation judgment model information table, 1803 report distribution history information Table, 1804 Delivery destination information table

Claims (8)

ユーザに対して記事を推奨する情報提供システムであって、
前記情報提供システムは、情報を記憶する記憶部と、前記記憶部に接続されたプロセッサ部とを備え、
前記記憶部は、複数の記事と、前記ユーザが使用した記事の使用履歴と、SNS(Social Networking Service)に投稿されたメッセージの利用状況を示すメッセージ情報とを記憶し、
前記プロセッサ部は、
前記記事から特徴情報を抽出し、
前記記事の特徴情報に基づいて、前記SNSでの前記記事に関連するメッセージを特定し、
前記記事に関連するメッセージの利用状況に基づいて、前記記事の拡散度合いを示す拡散度を算出し、
前記記事の特徴情報と、前記記事の拡散度と、前記記事の前記ユーザによる使用履歴とに基づいて、所定の記事について前記ユーザに推奨するか否かを判定し、
前記プロセッサ部は、
前記記事の拡散度と、前記記事の前記ユーザによる使用履歴とに基づいて、前記記事を前記ユーザに推奨するか否かを決定し、
前記記事の特徴情報と、前記ユーザに推奨するか否かの結果とに基づいた学習データにより機械学習を行うことにより、記事を推奨するか否かを判定する推奨判定モデルを生成し、
前記推奨判定モデルに対して、所定の記事の特徴情報を入力することにより、前記所定の記事について前記ユーザに推奨するか否かを判定する
情報提供システム。
An information provision system that recommends articles to users,
The information providing system includes a storage unit that stores information, and a processor unit connected to the storage unit,
The storage unit stores a plurality of articles, usage history of articles used by the user, and message information indicating usage status of messages posted on SNS (Social Networking Service),
The processor section includes:
Extract feature information from the article,
Identifying messages related to the article on the SNS based on characteristic information of the article,
Calculating the degree of diffusion indicating the degree of diffusion of the article based on the usage status of messages related to the article,
Determining whether or not to recommend a given article to the user based on characteristic information of the article, the degree of spread of the article, and a usage history of the article by the user ;
The processor section includes:
determining whether to recommend the article to the user based on the degree of spread of the article and the usage history of the article by the user;
Generating a recommendation determination model for determining whether to recommend an article by performing machine learning using learning data based on feature information of the article and a result of whether to recommend it to the user;
By inputting characteristic information of a predetermined article into the recommendation determination model, it is determined whether or not to recommend the predetermined article to the user.
Information provision system.
前記記事の前記ユーザによる使用履歴は、前記ユーザの前記記事の閲覧履歴であり、
前記プロセッサ部は、
前記記事の拡散度が所定の閾値より高く、且つ、前記閲覧履歴により前記ユーザにより閲覧されたことがある記事を、正の学習データに分類し、正の学習データに分類された記事以外の記事を負の学習データとして、機械学習を行うことにより、前記推奨判定モデルを生成する
請求項に記載の情報提供システム。
The usage history of the article by the user is a viewing history of the article by the user,
The processor section includes:
Articles for which the degree of diffusion of the article is higher than a predetermined threshold and have been viewed by the user according to the viewing history are classified as positive learning data, and articles other than articles classified as positive learning data The information providing system according to claim 1 , wherein the recommendation determination model is generated by performing machine learning using as negative learning data.
前記記事の前記ユーザによる使用履歴は、前記ユーザの前記記事の閲覧履歴であり、
前記プロセッサ部は、
前記記事の拡散度が所定の閾値より低い記事と、前記閲覧履歴により前記ユーザにより閲覧されたことがない記事とを、負の学習データに分類し、負の学習データに分類された記事以外の記事を正の学習データとして、機械学習を行うことにより、前記推奨判定モデルを生成する
請求項に記載の情報提供システム。
The usage history of the article by the user is a viewing history of the article by the user,
The processor section includes:
Articles whose diffusion degree is lower than a predetermined threshold and articles that have not been viewed by the user according to the browsing history are classified as negative learning data, and articles other than those classified as negative learning data are classified as negative learning data. The information providing system according to claim 1 , wherein the recommendation determination model is generated by performing machine learning using articles as positive learning data.
前記記事の前記ユーザによる使用履歴は、前記ユーザによって作成されたレポートでの記事の使用履歴であり、
前記プロセッサ部は、
前記記事の拡散度が所定の閾値より高く、且つ、前記レポートに前記ユーザにより使用された記事を、正の学習データに分類し、正の学習データに分類された記事以外の記事を負の学習データとして、機械学習を行うことにより、前記推奨判定モデルを生成する
請求項に記載の情報提供システム。
the usage history of the article by the user is the usage history of the article in a report created by the user;
The processor section includes:
Articles whose degree of spread is higher than a predetermined threshold and are used by the user in the report are classified as positive learning data, and articles other than the articles classified as positive training data are subjected to negative learning. The information providing system according to claim 1 , wherein the recommendation determination model is generated by performing machine learning on the data.
前記記事の前記ユーザによる使用履歴は、前記ユーザによって作成されたレポートでの記事の使用履歴であり、
前記プロセッサ部は、
前記記事の拡散度が所定の閾値より低い記事と、前記レポートに前記ユーザにより使用されたことがない記事とを、負の学習データに分類し、負の学習データに分類された記事以外の記事を正の学習データとして、機械学習を行うことにより、前記推奨判定モデルを生成する
請求項に記載の情報提供システム。
The usage history of the article by the user is the usage history of the article in a report created by the user;
The processor section includes:
Articles whose degree of spread is lower than a predetermined threshold and articles that have never been used by the user in the report are classified as negative learning data, and articles other than the articles classified as negative learning data are classified as negative learning data. The information providing system according to claim 1 , wherein the recommendation determination model is generated by performing machine learning using as positive learning data.
前記記事の前記ユーザによる使用履歴は、前記ユーザによって作成されたレポートでの記事の使用履歴であり、
前記記憶部は、前記ユーザが前記レポートを配信した配信先の属性を示す属性情報を記憶し、
前記プロセッサ部は、
配信先の前記属性情報が同じレポートでの使用履歴のみを用いて、
前記記事の拡散度が所定の閾値より高く、且つ、配信先の前記属性情報が同じ前記レポートに前記ユーザにより使用された記事を、正の学習データに分類し、正の学習データに分類された記事以外の記事を負の学習データとして、機械学習を行うことにより、前記属性情報の配信先用の前記推奨判定モデルを生成し、
前記プロセッサ部は、
ユーザの配信先に対応する属性情報の配信先用の前記推奨判定モデルを用いて、所定の記事について前記ユーザに推奨するか否かを判定する
請求項に記載の情報提供システム。
The usage history of the article by the user is the usage history of the article in a report created by the user;
The storage unit stores attribute information indicating an attribute of a distribution destination to which the user has distributed the report,
The processor section includes:
Using only the usage history of reports with the same attribute information of the delivery destination,
An article in which the degree of spread of the article is higher than a predetermined threshold and the attribute information of the distribution destination is the same and is used by the user in the report is classified as positive learning data; Generating the recommendation judgment model for the distribution destination of the attribute information by performing machine learning using articles other than articles as negative learning data;
The processor section includes:
The information providing system according to claim 1 , wherein the recommendation determination model for a distribution destination of attribute information corresponding to a distribution destination of a user is used to determine whether or not to recommend a predetermined article to the user.
ユーザに対して記事を推奨する情報提供システムによる情報提供方法であって、
複数の記事と、前記ユーザが使用した記事の使用履歴と、SNS(Social Networking Service)に投稿されたメッセージの利用状況を示すメッセージ情報とを記憶し、
前記記事から特徴情報を抽出し、
前記記事の特徴情報に基づいて、前記SNSでの前記記事に関連するメッセージを特定し、
前記記事に関連するメッセージの利用状況に基づいて、前記記事の拡散度合いを示す拡散度を算出し、
前記記事の特徴情報と、前記記事の拡散度と、前記記事の前記ユーザによる使用履歴とに基づいて、所定の記事について前記ユーザに推奨するか否かを判定し、
前記記事の拡散度と、前記記事の前記ユーザによる使用履歴とに基づいて、前記記事を前記ユーザに推奨するか否かを決定し、
前記記事の特徴情報と、前記ユーザに推奨するか否かの結果とに基づいた学習データにより機械学習を行うことにより、記事を推奨するか否かを判定する推奨判定モデルを生成し、
前記推奨判定モデルに対して、所定の記事の特徴情報を入力することにより、前記所定の記事について前記ユーザに推奨するか否かを判定する
情報提供方法。
An information provision method using an information provision system that recommends articles to users, the method comprising:
Stores a plurality of articles, usage history of articles used by the user, and message information indicating usage status of messages posted on SNS (Social Networking Service),
Extract feature information from the article,
Identifying messages related to the article on the SNS based on characteristic information of the article,
Calculating the degree of diffusion indicating the degree of diffusion of the article based on the usage status of messages related to the article,
Determining whether or not to recommend a given article to the user based on characteristic information of the article, the degree of spread of the article, and a usage history of the article by the user ;
determining whether to recommend the article to the user based on the degree of spread of the article and the usage history of the article by the user;
Generating a recommendation determination model for determining whether to recommend an article by performing machine learning using learning data based on feature information of the article and a result of whether to recommend it to the user;
By inputting characteristic information of a predetermined article into the recommendation determination model, it is determined whether or not to recommend the predetermined article to the user.
Information provision method.
ユーザに対して記事を推奨する処理をコンピュータに実行させるための情報提供プログラムであって、
記憶部に、複数の記事と、前記ユーザが使用した記事の使用履歴と、SNS(Social Networking Service)に投稿されたメッセージの利用状況を示すメッセージ情報とを記憶させておき、
前記コンピュータに、
前記記事から特徴情報を抽出させ、
前記記事の特徴情報に基づいて、前記SNSでの前記記事に関連するメッセージを特定させ、
前記記事に関連するメッセージの利用状況に基づいて、前記記事の拡散度合いを示す拡散度を算出させ、
前記記事の特徴情報と、前記記事の拡散度と、前記記事の前記ユーザによる使用履歴とに基づいて、所定の記事について前記ユーザに推奨するか否かを判定させ、
前記記事の拡散度と、前記記事の前記ユーザによる使用履歴とに基づいて、前記記事を前記ユーザに推奨するか否かを決定させ、
前記記事の特徴情報と、前記ユーザに推奨するか否かの結果とに基づいた学習データにより機械学習を行うことにより、記事を推奨するか否かを判定する推奨判定モデルを生成させ、
前記推奨判定モデルに対して、所定の記事の特徴情報を入力することにより、前記所定の記事について前記ユーザに推奨するか否かを判定させる
情報提供プログラム。
An information providing program for causing a computer to perform a process of recommending articles to a user,
A storage unit stores a plurality of articles, usage history of articles used by the user, and message information indicating usage status of messages posted on SNS (Social Networking Service),
to the computer;
Extract feature information from the article,
Identifying messages related to the article on the SNS based on characteristic information of the article;
Calculating the degree of diffusion indicating the degree of diffusion of the article based on the usage status of messages related to the article,
determining whether or not to recommend a predetermined article to the user based on characteristic information of the article, a degree of diffusion of the article, and a usage history of the article by the user ;
determining whether to recommend the article to the user based on the degree of spread of the article and the usage history of the article by the user;
Generating a recommendation determination model for determining whether to recommend an article by performing machine learning using learning data based on feature information of the article and a result of whether to recommend the article to the user;
By inputting characteristic information of a predetermined article into the recommendation determination model, it is determined whether or not to recommend the predetermined article to the user.
Information program.
JP2020026505A 2020-02-19 2020-02-19 Information provision system, information provision method, and information provision program Active JP7377126B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020026505A JP7377126B2 (en) 2020-02-19 2020-02-19 Information provision system, information provision method, and information provision program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020026505A JP7377126B2 (en) 2020-02-19 2020-02-19 Information provision system, information provision method, and information provision program

Publications (2)

Publication Number Publication Date
JP2021131715A JP2021131715A (en) 2021-09-09
JP7377126B2 true JP7377126B2 (en) 2023-11-09

Family

ID=77551016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020026505A Active JP7377126B2 (en) 2020-02-19 2020-02-19 Information provision system, information provision method, and information provision program

Country Status (1)

Country Link
JP (1) JP7377126B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165284A (en) 2006-12-27 2008-07-17 Nec Corp System and method for monitoring rumor and program
JP2014081882A (en) 2012-10-18 2014-05-08 Hitachi Ltd Trend analysis device, method and program
JP2019164648A (en) 2018-03-20 2019-09-26 Sales Robotics株式会社 Information processing device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165284A (en) 2006-12-27 2008-07-17 Nec Corp System and method for monitoring rumor and program
JP2014081882A (en) 2012-10-18 2014-05-08 Hitachi Ltd Trend analysis device, method and program
JP2019164648A (en) 2018-03-20 2019-09-26 Sales Robotics株式会社 Information processing device

Also Published As

Publication number Publication date
JP2021131715A (en) 2021-09-09

Similar Documents

Publication Publication Date Title
US10614077B2 (en) Computer system for automated assessment at scale of topic-specific social media impact
US8620718B2 (en) Industry specific brand benchmarking system based on social media strength of a brand
US11507989B2 (en) Multi-label product categorization
Varnagar et al. Web usage mining: a review on process, methods and techniques
CN107077486A (en) Affective Evaluation system and method
CN103930921A (en) Reputation services for a social media identity
US20190132352A1 (en) Nearline clustering and propagation of entity attributes in anti-abuse infrastructures
US20160188601A1 (en) Method and systems of implementing a ranked health-content article feed
JP6868416B2 (en) Failure response support system
US20160092960A1 (en) Product recommendations over multiple stores
Cherqi et al. Analysis of hacking related trade in the darkweb
CN114817746A (en) Insurance product recommendation method, device, equipment and storage medium
CN110188291A (en) Document process based on proxy log
Dongo et al. A qualitative and quantitative comparison between Web scraping and API methods for Twitter credibility analysis
Ebrahimi et al. Unsupervised summarization of privacy concerns in mobile application reviews
JP6308339B1 (en) Clustering system, method and program, and recommendation system
Gentile et al. Extracting semantic user networks from informal communication exchanges
JP7170689B2 (en) Output device, output method and output program
JP6872853B2 (en) Detection device, detection method and detection program
JP7377126B2 (en) Information provision system, information provision method, and information provision program
Hoti et al. Identifying Fake News written on Albanian language in social media using Naïve Bayes, SVM, Logistic Regression, Decision Tree and Random Forest algorithms
JP2019036344A (en) Method for processing connection data of platform of internet site
Lekshmi et al. Spam Detection Framework for Online Reviews Using Hadoop’s Computational Capability
NL2031046B1 (en) System and method for detecting reputation attacks
JP7457626B2 (en) Search and registration device and search and registration method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220525

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231027

R150 Certificate of patent or registration of utility model

Ref document number: 7377126

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150