JP7260439B2 - Extraction device, extraction method and extraction program - Google Patents

Extraction device, extraction method and extraction program Download PDF

Info

Publication number
JP7260439B2
JP7260439B2 JP2019149987A JP2019149987A JP7260439B2 JP 7260439 B2 JP7260439 B2 JP 7260439B2 JP 2019149987 A JP2019149987 A JP 2019149987A JP 2019149987 A JP2019149987 A JP 2019149987A JP 7260439 B2 JP7260439 B2 JP 7260439B2
Authority
JP
Japan
Prior art keywords
content
event
information
provider
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019149987A
Other languages
Japanese (ja)
Other versions
JP2021033428A (en
Inventor
民夫 栗田
理絵子 北久保
寛子 米村
優 櫃本
俊策 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2019149987A priority Critical patent/JP7260439B2/en
Publication of JP2021033428A publication Critical patent/JP2021033428A/en
Priority to JP2023062340A priority patent/JP2023076694A/en
Application granted granted Critical
Publication of JP7260439B2 publication Critical patent/JP7260439B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Description

本発明は、抽出装置、抽出方法及び抽出プログラムに関する。 The present invention relates to an extraction device, an extraction method, and an extraction program.

近年、コンテンツを自動的に検査する技術が知られている。このような技術の一例として、誇張表現の禁止や、下品な言葉の禁止などといった方針を広告が順守しているかを自動的に検査し、検査の結果を用いて広告を承認するかどうかを決定する技術が知られている。 In recent years, techniques for automatically inspecting content are known. An example of such technology is automatically testing ads for compliance with policies such as no exaggeration and no profanity, and using the results of those tests to determine whether to approve the ad. There are known techniques for

特開2011-204248号公報Japanese Unexamined Patent Application Publication No. 2011-204248

しかしながら、上述した従来技術では、発生した事象から、コンテンツに用いられることが想定されるキーワードを把握できるとは限らない。 However, with the conventional technology described above, it is not always possible to grasp the keywords expected to be used in the content from the events that have occurred.

例えば、上述した従来技術では、誇張表現や、下品な言葉などといった、単に公序良俗に反する単語が含まれているか否かを検査しているに過ぎない。したがって、上述した従来技術では、発生した事象から、コンテンツに用いられることが想定されるキーワードを把握できるとは限らない。 For example, the conventional technology described above simply checks whether or not words that are offensive to public order and morals, such as exaggerated expressions and vulgar words, are included. Therefore, with the conventional technology described above, it is not always possible to grasp the keywords expected to be used in the content from the events that have occurred.

本願は、上記に鑑みてなされたものであって、発生した事象から、コンテンツに用いられることが想定されるキーワードを把握することを目的とする。 The present application has been made in view of the above, and an object of the present application is to grasp keywords that are assumed to be used in content from events that have occurred.

本願に係る抽出装置は、所定の期間に発生する事象を示す事象情報を取得する取得部と、前記取得部により取得された事象情報に基づいて、前記事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する抽出部とを備えることを特徴とする。 An extraction device according to the present application includes an acquisition unit that acquires event information indicating an event that occurs in a predetermined period, and based on the event information acquired by the acquisition unit, a keyword related to the event, which is distributed and an extracting unit that extracts a keyword that satisfies a predetermined condition with respect to the provider of the target content.

実施形態の一態様によれば、発生した事象から、コンテンツに用いられることが想定されるキーワードを把握することができるという効果を奏する。 According to one aspect of the embodiment, there is an effect that a keyword that is assumed to be used in content can be grasped from an event that has occurred.

図1は、実施形態に係る抽出処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of extraction processing according to an embodiment. 図2は、実施形態にかかる抽出処理システムの構成例を示す図である。FIG. 2 is a diagram illustrating a configuration example of an extraction processing system according to the embodiment; 図3は、実施形態に係る抽出装置の構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of an extraction device according to the embodiment; 図4は、実施形態に係る提供主情報記憶部の一例を示す図である。FIG. 4 is a diagram illustrating an example of a provider information storage unit according to the embodiment; 図5は、実施形態に係る事象情報記憶部の一例を示す図である。5 is a diagram illustrating an example of an event information storage unit according to the embodiment; FIG. 図6は、実施形態に係る抽出処理の手順の一例を示すフローチャートである。FIG. 6 is a flowchart illustrating an example of an extraction process procedure according to the embodiment. 図7は、抽出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 7 is a hardware configuration diagram showing an example of a computer that implements the functions of the extraction device.

以下に本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Embodiments for implementing the extraction device, extraction method, and extraction program according to the present application (hereinafter referred to as "embodiments") will be described in detail below with reference to the drawings. Note that the extraction device, extraction method, and extraction program according to the present application are not limited to this embodiment. Also, in each of the following embodiments, the same parts are denoted by the same reference numerals, and overlapping descriptions are omitted.

〔1.実施形態〕
図1を用いて、本実施形態の抽出装置等により実現される抽出処理を説明する。図1は、実施形態に係る抽出処理の一例を示す図である。実施形態にかかる抽出処理は、図1に示す抽出装置100によって行われる。
[1. embodiment]
Extraction processing realized by the extraction device and the like of this embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of extraction processing according to an embodiment. The extraction process according to the embodiment is performed by the extraction device 100 shown in FIG.

図1の説明に先立って、図2を用いて、実施形態にかかる抽出処理システム1について説明する。図2は、実施形態にかかる抽出処理システムの構成例を示す図である。実施形態にかかる抽出処理システム1は、図2に示すように、提供主端末10と、外部装置20と、抽出装置100とを含む。提供主端末10、外部装置20、抽出装置100は、ネットワークNを介して有線または無線により通信可能に接続される。なお、図2に示す抽出処理システム1には、複数台の提供主端末10や、複数台の外部装置20や、複数台の抽出装置100が含まれてよい。 Before describing FIG. 1, an extraction processing system 1 according to an embodiment will be described with reference to FIG. FIG. 2 is a diagram illustrating a configuration example of an extraction processing system according to the embodiment; The extraction processing system 1 according to the embodiment includes a main provider terminal 10, an external device 20, and an extraction device 100, as shown in FIG. The main provider terminal 10, the external device 20, and the extraction device 100 are connected via a network N so as to be able to communicate by wire or wirelessly. The extraction processing system 1 shown in FIG. 2 may include multiple provider terminals 10 , multiple external devices 20 , and multiple extraction devices 100 .

提供主端末10は、広告の提供主(広告主)によって利用される情報処理装置である。例えば、提供主端末10は、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等である。なお、図1に示す例において、提供主端末10は、利用者によって利用されるノート型PCである場合を示す。提供主端末10は、提供主の操作に応じて広告を抽出装置100に入稿(提供)する。なお、図1に示す例において、提供主端末10は、提供主によって利用されるノート型PCである場合を示す。 The provider terminal 10 is an information processing device used by an advertisement provider (advertiser). For example, the main provider terminal 10 is a smart phone, a tablet terminal, a notebook PC (Personal Computer), a desktop PC, a mobile phone, a PDA (Personal Digital Assistant), or the like. In the example shown in FIG. 1, the main provider terminal 10 is a notebook PC used by the user. The provider terminal 10 submits (provides) an advertisement to the extraction device 100 according to the provider's operation. In the example shown in FIG. 1, the provider terminal 10 is a notebook PC used by the provider.

外部装置20は、各種コンテンツを利用者に配信する情報処理装置である。なお、外部装置20が配信するコンテンツは、例えば、ポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピング(電子商取引)サイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、施設予約サイト、SNS(Social Networking Service)サイト、ウェブブログなどに関するコンテンツであってもよい。また、外部装置20が配信するコンテンツは、例えば、利用者が利用する端末装置にインストールされた各種アプリケーション(以下、「アプリ」と記載する場合がある)に関するコンテンツであってもよい。具体的には、ポータルアプリ、ニュースアプリ、オークションサイト、天気予報アプリ、ショッピングアプリ、ファイナンス(株価)アプリ、路線検索アプリ、地図提供アプリ、旅行アプリ、飲食店紹介アプリ、施設予約アプリ、SNSアプリ、ブログ閲覧アプリ等に関するコンテンツであってもよい。 The external device 20 is an information processing device that distributes various contents to users. The contents distributed by the external device 20 include, for example, portal sites, news sites, auction sites, weather forecast sites, shopping (electronic commerce) sites, finance (stock prices) sites, route search sites, map providing sites, travel sites, The content may be a restaurant introduction site, a facility reservation site, an SNS (Social Networking Service) site, a web blog, or the like. Also, the content distributed by the external device 20 may be, for example, content related to various applications (hereinafter sometimes referred to as “apps”) installed in the terminal device used by the user. Specifically, portal applications, news applications, auction sites, weather forecast applications, shopping applications, finance (stock prices) applications, route search applications, map provision applications, travel applications, restaurant introduction applications, facility reservation applications, SNS applications, The content may be related to a blog browsing application or the like.

抽出装置100は、広告を利用者に配信する情報処理装置である。例えば、抽出装置100は、提供主端末10から提供される広告に関する情報を管理する。そして、抽出装置100は、利用者が利用する端末装置から送信される広告配信要求(例えば、外部装置20が配信するコンテンツ上で表示される広告の配信要求)に応じて、広告を当該端末装置に配信する。なお、抽出装置100は、抽出装置100の管理者によって定められたガイドラインに違反しているか否か等に基づいて審査が行われ、配信が許可された広告を配信するものとする。ここで、広告の審査は、抽出装置100が行ってもよく、抽出装置100の管理者と所定の関係を有する外部の情報処理装置によって行われてもよい。 The extraction device 100 is an information processing device that distributes advertisements to users. For example, the extraction device 100 manages information regarding advertisements provided from the provider terminal 10 . Then, the extraction device 100 responds to an advertisement distribution request (for example, a distribution request for an advertisement displayed on content distributed by the external device 20) transmitted from the terminal device used by the user, and distributes the advertisement to the terminal device. deliver to Note that the extraction device 100 distributes advertisements that have been examined based on whether or not the guidelines set by the administrator of the extraction device 100 are violated, and whose distribution is permitted. Here, the examination of the advertisement may be performed by the extraction device 100 or may be performed by an external information processing device having a predetermined relationship with the administrator of the extraction device 100 .

また、抽出装置100は、外部装置20が配信するコンテンツにおいて利用者が入力した検索クエリやコメントなどに関する入力情報や、利用者のコンテンツの閲覧履歴などの情報を取得する。 The extraction device 100 also acquires input information related to search queries and comments input by the user in the content distributed by the external device 20, and information such as the browsing history of the user's content.

以下、図1を用いて、抽出装置100が行う抽出処理について説明する。なお、以下の説明では、提供主端末10を利用する提供主に応じて、提供主端末10を提供主端末10-1~10-N(Nは任意の自然数)として説明する。例えば、提供主端末10は、提供主ID「U1」により識別される提供主(提供主U1)により使用される提供主端末10である。また、以下では、提供主端末10-1~10-Nについて、特に区別なく説明する場合には、提供主端末10と記載する。 Extraction processing performed by the extraction device 100 will be described below with reference to FIG. In the following explanation, provider terminal 10 will be explained as provider terminal 10-1 to 10-N (N is an arbitrary natural number) depending on the provider who uses provider terminal 10. FIG. For example, the provider terminal 10 is the provider terminal 10 used by the provider (provider U1) identified by the provider ID "U1". Further, hereinafter, the main provider terminals 10-1 to 10-N will be referred to as the main provider terminal 10 when they are described without distinction.

まず、抽出装置100は、提供主端末10から提供主に関する提供主情報を取得する(ステップS1)。例えば、図1の例において、抽出装置100は、各提供主から提供される広告に関する広告情報を取得する。具体的には、抽出装置100は、広告情報として、広告に関連する画像(広告画像)や、テキスト情報などを取得する。そして、抽出装置100は、広告情報と、広告の属性(広告対象)とを提供主情報として、提供主に対応付けて記憶部に格納する。 First, the extraction device 100 acquires provider information about the provider from the provider terminal 10 (step S1). For example, in the example of FIG. 1, the extraction device 100 acquires advertisement information regarding advertisements provided by each provider. Specifically, the extraction device 100 acquires an image related to the advertisement (advertisement image), text information, and the like as the advertisement information. Then, the extraction device 100 associates the advertisement information and the attribute of the advertisement (advertisement target) with the provider as provider information and stores them in the storage unit.

なお、抽出装置100は、提供主情報に含まれる属性として、提供主の業種や、提供主が扱う商材、提供主が提供するサービスなどを示す情報を取得してもよい。 Note that the extraction device 100 may acquire, as attributes included in the provider information, information indicating the type of business of the provider, products handled by the provider, services provided by the provider, and the like.

続いて、抽出装置100は、外部装置20から所定の期間に発生する事象を示す事象情報を取得する(ステップS2)。なお、図1の例では、抽出装置100が、外部装置20が配信するコンテンツのうち、所定の期間(例えば、直近の24時間、1日、3日など)における利用者の閲覧回数が所定の閾値以上であるコンテンツC1(ニュースコンテンツ)に関する情報(例えば、画像情報、テキスト情報)を、事象情報として取得したものとする。 Subsequently, the extraction device 100 acquires event information indicating events occurring in a predetermined period from the external device 20 (step S2). In the example of FIG. 1, the extraction device 100 determines that the content distributed by the external device 20 is viewed by the user in a predetermined period (for example, the most recent 24 hours, 1 day, 3 days, etc.). It is assumed that information (for example, image information, text information) related to content C1 (news content) that is equal to or greater than the threshold is acquired as event information.

続いて、抽出装置100は、事象情報に基づいて事象の属性を特定し、特定した属性に紐付けられた情報に対応するキーワードを抽出する(ステップS3)。例えば、図1の例において、抽出装置100は、形態素解析等の自然言語処理技術を適宜用いてコンテンツC1のテキスト情報を解析することにより、コンテンツC1が示す事象の属性「災害」を特定したものとする。この場合、抽出装置100は、属性「災害」に紐付けられた情報に対応するキーワードをコンテンツC1に関する情報から抽出する。具体的には、抽出装置100は、属性「災害」に紐付けられた「被災地」や「災害の種類」などといった概念を示す文字列(例えば、普通名詞や固有名詞など)をキーワードとして、コンテンツC1のテキスト情報から抽出する。ここで、図1の例では、抽出装置100が、被災地を示す「地域A」、並びに、災害の種類を示す「大雨」及び「土砂災害」をキーワードとして、コンテンツC1のテキスト情報から抽出したものとする。 Subsequently, the extraction device 100 identifies an event attribute based on the event information, and extracts a keyword corresponding to information linked to the identified attribute (step S3). For example, in the example of FIG. 1, the extraction device 100 identifies the attribute "disaster" of the event indicated by the content C1 by analyzing the text information of the content C1 using a natural language processing technique such as morphological analysis as appropriate. and In this case, the extraction device 100 extracts the keyword corresponding to the information linked to the attribute "disaster" from the information regarding the content C1. Specifically, the extraction device 100 uses character strings (for example, common nouns, proper nouns, etc.) indicating concepts such as “disaster area” and “disaster type” linked to the attribute “disaster” as keywords, Extract from the text information of the content C1. Here, in the example of FIG. 1, the extraction device 100 extracts from the text information of the content C1 using "region A" indicating the disaster area and "heavy rain" and "landslide disaster" indicating the type of disaster as keywords. shall be

なお、図1の例において、抽出装置100によるキーワードの抽出処理は、事象の属性と、当該属性に紐付く情報とが設定されたルールベースで実現されてもよく、各種モデルを用いて実現されてもよい。 In the example of FIG. 1, the keyword extraction processing by the extraction device 100 may be realized on a rule basis in which the attribute of the event and the information associated with the attribute are set, and may be realized using various models. may

続いて、抽出装置100は、事象の属性に関連する広告を提供する提供主を特定する(ステップS4)。例えば、図1の例において、抽出装置100は、コンテンツC1が示す事象の属性「災害」に紐付けられた属性(広告対象)に属する広告を提供する提供主を特定する。ここで、図1の例において、抽出装置100は、属性「災害」に対し、属性「インフラ」、「医療」及び「防災グッズ」が紐付けられているものとする。この場合、抽出装置100は、属性「防災グッズ」に属する広告を提供する提供主U1を、コンテンツC1が示す事象の属性「災害」に関連する広告を提供する提供主と特定する。 Subsequently, the extraction device 100 identifies providers who provide advertisements related to the attribute of the event (step S4). For example, in the example of FIG. 1, the extraction device 100 identifies providers who provide advertisements belonging to attributes (advertising targets) linked to the attribute "disaster" of the event indicated by the content C1. Here, in the example of FIG. 1, the extraction device 100 associates the attribute "disaster" with the attributes "infrastructure", "medical care", and "disaster prevention goods". In this case, the extraction device 100 identifies the provider U1 who provides the advertisement belonging to the attribute "disaster prevention goods" as the provider who provides the advertisement related to the attribute "disaster" of the event indicated by the content C1.

なお、図1の例において、抽出装置100による提供主の特定処理は、事象の属性と、当該属性に紐付く広告の属性とが設定されたルールベースで実現されてもよい。 Note that, in the example of FIG. 1, the process of specifying a provider by the extraction device 100 may be implemented on a rule basis in which an attribute of an event and an attribute of an advertisement linked to the attribute are set.

続いて、抽出装置100は、配信対象の広告が、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する(ステップS5)。例えば、図1の例において、抽出装置100は、提供主U1が提供する広告のうち、ステップS3において抽出したキーワードを含む広告を、配信を許可するか否かの審査(再審査)の対象、若しくは、配信停止の対象と判定する。 Subsequently, the extraction device 100 determines whether or not the advertisement to be distributed is subject to a predetermined examination or to suspension of distribution (step S5). For example, in the example of FIG. 1, the extraction device 100 is subject to examination (re-examination) as to whether or not to permit distribution of advertisements including the keyword extracted in step S3 among the advertisements provided by the provider U1. Alternatively, it is determined that the distribution is to be stopped.

なお、抽出装置100は、抽出したキーワードのうち所定数(例えば、抽出したキーワードの半数)以上を含む広告を所定の審査の対象、若しくは、配信停止の対象と判定してもよい。また、抽出装置100は、抽出したキーワードのうち、特定のキーワード(例えば、地名や人名などの固有名詞)を含む広告を所定の審査の対象、若しくは、配信停止の対象と判定してもよい。 Note that the extraction device 100 may determine that an advertisement including a predetermined number (for example, half of the extracted keywords) or more of the extracted keywords is subject to a predetermined examination or distribution suspension. Further, the extraction device 100 may determine that an advertisement including a specific keyword (for example, a proper noun such as a place name or a person's name) among the extracted keywords is subject to a predetermined examination or distribution suspension.

また、抽出装置100は、再審査の対象となった広告に含まれる文字列を学習したモデルを用いて、キーワードの抽出処理を実現してもよい。例えば、抽出装置100は、再審査において配信不可と判定された事由である文字列の分散表現と、事象情報が入力された際にモデルが出力するキーワードの分散表現とが類似するように学習されたモデルを用いて、キーワードの抽出処理を実現する。 In addition, the extraction device 100 may implement keyword extraction processing using a model that has learned the character strings included in the advertisements that are subject to reexamination. For example, the extraction device 100 is trained so that the distributed representation of the character string that is the reason for the determination that the distribution is not possible in the reexamination is similar to the distributed representation of the keyword output by the model when the event information is input. Keyword extraction processing is realized by using the model.

コンテンツの提供主は、利用者への訴求効果を高めることを目的として、利用者の関心を集めやすい時事的なワードを広告に用いることが想定される。これに対し、実施形態に係る抽出装置100は、直近の期間に発生した事象に関連するキーワードを抽出するため、提供主がコンテンツに用いることが想定される時事的なキーワードを把握することができる。これにより、実施形態に係る抽出装置100は、例えば、自然災害や訃報などといった、接触した利用者の感情が否定的になると推定される時事的な事象に関連するワードが用いられたコンテンツを特定できるため、公序良俗の観点からコンテンツの質を担保することを可能とする。 Content providers are expected to use topical words that tend to attract the interest of users in advertisements for the purpose of enhancing the effect of appealing to users. On the other hand, since the extraction device 100 according to the embodiment extracts keywords related to events that occurred in the most recent period, it is possible to grasp topical keywords that providers are expected to use in content. . As a result, the extraction device 100 according to the embodiment identifies content that uses words related to current events that are estimated to negatively affect the user's feelings, such as natural disasters and obituaries. Therefore, it is possible to guarantee the quality of contents from the viewpoint of public order and morals.

〔2.抽出装置の構成〕
次に、図3を用いて、抽出装置100の構成について説明する。図3は、実施形態に係る抽出装置の構成例を示す図である。図3に示すように、抽出装置100は、通信部110と、記憶部120と、制御部130とを有する。
[2. Configuration of extraction device]
Next, the configuration of the extraction device 100 will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration example of an extraction device according to the embodiment; As shown in FIG. 3, the extraction device 100 has a communication unit 110, a storage unit 120, and a control unit .

(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、提供主端末10、外部装置20等との間で情報の送受信を行う。
(Regarding communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. The communication unit 110 is connected to the network N by wire or wirelessly, and transmits and receives information to and from the provider terminal 10, the external device 20, and the like.

(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3に示すように、記憶部120は、提供主情報記憶部121と、事象情報記憶部122とを有する。
(Regarding storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. As shown in FIG. 3 , storage unit 120 has provider information storage unit 121 and event information storage unit 122 .

(提供主情報記憶部121について)
提供主情報記憶部121は、提供主に関する提供主情報を記憶する。ここで、図4を用いて、提供主情報記憶部121が記憶する提供主情報の一例を説明する。図4は、実施形態に係る提供主情報記憶部の一例を示す図である。図4の例において、提供主情報記憶部121は、「提供主ID」、「属性」、「広告情報」といった項目を有する。
(Regarding provider information storage unit 121)
The provider information storage unit 121 stores provider information about the provider. Here, an example of provider information stored in the provider information storage unit 121 will be described with reference to FIG. FIG. 4 is a diagram illustrating an example of a provider information storage unit according to the embodiment; In the example of FIG. 4, the provider information storage unit 121 has items such as "provider ID", "attribute", and "advertisement information".

「提供主ID」は、提供主を識別するための識別情報を示す。「属性」は、広告の属性(広告対象)を示す。なお、「属性」の項目には、提供主の業種や、提供主が扱う商材、提供主が提供するサービスなどを示す情報が格納されてもよい。「広告情報」は、提供主が提供した広告に関する情報を示す。なお、図4に示す例では、「広告情報」に「広告情報#1」といった概念的な情報が格納される例を示したが、実際には、広告に含まれるテキスト情報、静止画像や動画像等若しくはこれらの所在を示すURL(Uniform Resource Locator)、格納場所を示すファイルパス名などが格納される。 "Provider ID" indicates identification information for identifying a provider. "Attribute" indicates the attribute of the advertisement (advertisement target). The "attribute" item may store information indicating the type of industry of the provider, the merchandise handled by the provider, the service provided by the provider, and the like. "Advertisement information" indicates information about advertisements provided by providers. In the example shown in FIG. 4, conceptual information such as "advertisement information #1" is stored in "advertisement information". Images, etc., URLs (Uniform Resource Locators) indicating their locations, file path names indicating storage locations, and the like are stored.

すなわち、図4では、提供主ID「U1」によって識別される提供主が属性「防災グッズ」、広告情報が「広告情報#1」である広告を提供する例を示す。 That is, FIG. 4 shows an example in which the provider identified by the provider ID "U1" provides an advertisement having the attribute "disaster prevention goods" and the advertisement information "advertisement information #1".

(事象情報記憶部122について)
事象情報記憶部122は、発生した事象を示す事象情報を記憶する。ここで、図5を用いて、事象情報記憶部122が記憶する情報の一例を説明する。図5は、実施形態に係る事象情報記憶部の一例を示す図である。図5の例では、事象情報記憶部122は、「事象ID」、「日時」、「事象情報」、「属性」、「キーワード」といった項目を有する。
(Regarding event information storage unit 122)
The event information storage unit 122 stores event information indicating events that have occurred. An example of information stored in the event information storage unit 122 will now be described with reference to FIG. 5 is a diagram illustrating an example of an event information storage unit according to the embodiment; FIG. In the example of FIG. 5, the event information storage unit 122 has items such as "event ID", "date and time", "event information", "attribute", and "keyword".

「事象ID」は、事象を識別するための識別情報を示す。「日時」は、事象情報が取得された日時を示す。「事象情報」は、発生した事象を示す情報であり、例えば、利用者の閲覧回数が所定の閾値以上となったコンテンツに関する情報や、利用者の入力回数が所定の閾値以上となった検索クエリに関する情報を記憶する。なお、図5では、「事象情報」に「コンテンツ情報#1」といった概念的な情報が格納される例を示したが、実際には、事象を示すテキスト情報、静止画像や動画像等若しくはこれらの所在を示すURL、格納場所を示すファイルパス名などが格納される。「属性」は、事象の属性を示す。「キーワード」は、事象に関連するキーワードを示す。 "Event ID" indicates identification information for identifying an event. "Date and time" indicates the date and time when the event information was acquired. "Event information" is information indicating an event that has occurred. For example, information related to content that has been viewed by users more than a predetermined threshold, or search queries that have been entered by users more than a predetermined threshold. store information about FIG. 5 shows an example in which conceptual information such as "content information #1" is stored in "event information". A URL indicating the location of the file, a file path name indicating the storage location, and the like are stored. "Attribute" indicates an attribute of an event. "Keyword" indicates a keyword associated with the event.

すなわち、図5では、事象情報「コンテンツ情報#1」が日時「日時#1」に取得され、当該事象情報が示す事象が事象ID「M1」によって識別され、当該事象の属性が「災害」、キーワードが「地域A、大雨、・・・」である例を示す。 That is, in FIG. 5, the event information "content information #1" is acquired at the date and time "date and time #1", the event indicated by the event information is identified by the event ID "M1", and the attribute of the event is "disaster". An example in which the keywords are "region A, heavy rain, ..." is shown.

(制御部130について)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、抽出装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。実施形態に係る制御部130は、図3に示すように、取得部131と、抽出部132と、特定部133と、判定部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
(Regarding the control unit 130)
The control unit 130 is a controller. For example, various programs stored in a storage device inside the extraction device 100 are controlled by a CPU (Central Processing Unit), MPU (Micro Processing Unit), etc., using the RAM as a work area. It is realized by being executed. Also, the control unit 130 is a controller, and is implemented by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array). As shown in FIG. 3, the control unit 130 according to the embodiment includes an acquisition unit 131, an extraction unit 132, an identification unit 133, and a determination unit 134, and performs information processing functions and actions described below. Realize or carry out.

(取得部131について)
取得部131は、所定の期間に発生する事象を示す事象情報を取得する。例えば、図1の例において、直近の24時間、1日、3日内に発生する事象を示す事象情報を取得し、事象情報記憶部122に格納する。
(Regarding the acquisition unit 131)
Acquisition unit 131 acquires event information indicating an event occurring in a predetermined period. For example, in the example of FIG. 1, event information indicating events occurring within the last 24 hours, 1 day, or 3 days is acquired and stored in the event information storage unit 122 .

また、取得部131は、事象情報として、所定の期間における入力回数が所定の閾値以上である検索クエリを示す情報を取得してもよい。例えば、図1の例において、取得部131は、外部装置20から取得した入力情報に基づき、入力回数が所定の割合上昇した検索クエリを示すテキスト情報を取得する。 Further, the acquiring unit 131 may acquire, as event information, information indicating a search query whose number of times of input in a predetermined period is equal to or greater than a predetermined threshold. For example, in the example of FIG. 1, the acquisition unit 131 acquires text information indicating search queries whose number of inputs has increased by a predetermined rate based on the input information acquired from the external device 20 .

また、取得部131は、事象情報として、所定の期間における閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得してもよい。例えば、図1の例において、取得部131は、外部装置20から取得した利用者のコンテンツの閲覧履歴に基づき、閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得する。 Further, the acquisition unit 131 may acquire, as the event information, information indicating content for which the number of viewing times during a predetermined period is equal to or greater than a predetermined threshold. For example, in the example of FIG. 1 , the acquisition unit 131 acquires information indicating content that has been viewed more than a predetermined threshold based on the user's content viewing history acquired from the external device 20 .

また、取得部131は、事象情報として、所定の期間に開催されるイベントを示す情報を取得してもよい。例えば、取得部131は、所定数以上の動員が想定されるコンサートや、舞台公演、スポーツなどの、現時点から所定の期間未来に開催されるイベントを示す情報を取得する。 Further, the acquisition unit 131 may acquire information indicating an event held during a predetermined period as the event information. For example, the acquisition unit 131 acquires information indicating events that will be held in the future for a predetermined period from the present time, such as concerts, stage performances, sports, etc., that are expected to attract a predetermined number of people or more.

また、取得部131は、事象のうち、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得してもよい。例えば、取得部131は、自然災害や、訃報、戦争、事故などといった、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得する。 Further, the acquisition unit 131 may acquire event information indicating an event, among the events, that is estimated to cause the contacting user's emotion to become negative. For example, the acquisition unit 131 acquires event information indicating an event such as a natural disaster, an obituary, a war, an accident, etc., which is estimated to make the user in contact feel negative.

また、取得部131は、事象情報として、配信対象のコンテンツのうち、所定の期間における表示回数が所定の閾値以上であるコンテンツを示す情報を取得してもよい。例えば、取得部131は、配信対象の広告のうち、インプレッション数や、CTR(Click Through Rate)が所定の閾値以上である広告を示す広告情報を取得する。 In addition, the acquisition unit 131 may acquire, as the event information, information indicating content whose number of times of display in a predetermined period is equal to or greater than a predetermined threshold among the content to be distributed. For example, the acquisition unit 131 acquires advertisement information indicating advertisements whose number of impressions or CTR (Click Through Rate) is equal to or greater than a predetermined threshold among advertisements to be distributed.

また、取得部131は、事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、所定の期間において配信不可と判定されたコンテンツに関する情報を取得してもよい。例えば、取得部131は、所定の期間に抽出装置100の管理者によって定められたガイドラインに違反しているか否か等に基づいて審査が行われ、配信不可と判定された広告を示す広告情報を取得する。 The acquisition unit 131 may also acquire, as the event information, information about content that has been examined as to whether or not it should be distributed, and that has been determined to be undistributable within a predetermined period of time. For example, the acquisition unit 131 acquires advertisement information indicating advertisements that are judged to be undistributable after being examined based on whether or not they violate guidelines set by the administrator of the extraction device 100 during a predetermined period of time. get.

(抽出部132について)
抽出部132は、取得部131により取得された事象情報に基づいて、事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する。例えば、抽出部132は、提供主が自身のコンテンツに用いることが想定されるキーワードを、事象情報から抽出する。例えば、図1の例において、抽出部132は、形態素解析等の自然言語処理技術を適宜用いてコンテンツC1のテキスト情報を解析することにより、コンテンツC1が示す事象の属性「災害」を特定し、特定した属性に対応するキーワードをコンテンツC1に関する情報から抽出する。
(Regarding the extraction unit 132)
Based on the event information acquired by the acquisition unit 131, the extraction unit 132 extracts keywords that are related to the event and that satisfy a predetermined condition for the relationship with the provider of the content to be distributed. For example, the extraction unit 132 extracts keywords that the provider is expected to use in his/her own content from the event information. For example, in the example of FIG. 1, the extraction unit 132 identifies the attribute "disaster" of the event indicated by the content C1 by analyzing the text information of the content C1 using a natural language processing technique such as morphological analysis as appropriate, A keyword corresponding to the specified attribute is extracted from the information about the content C1.

また、抽出部132は、事象の属性に紐付けられた情報に対応するキーワードを抽出してもよい。例えば、図1の例において、抽出部132は、コンテンツC1が示す事象の属性「災害」に紐付けられた情報に対応するキーワードをコンテンツC1に関する情報から抽出する。 Also, the extracting unit 132 may extract a keyword corresponding to information linked to the attribute of the event. For example, in the example of FIG. 1, the extraction unit 132 extracts a keyword corresponding to information linked to the attribute "disaster" of the event indicated by the content C1 from the information regarding the content C1.

また、抽出部132は、取得部131により取得されたコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出してもよい。例えば、抽出部132は、所定の期間において配信不可と判定された広告に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワード、若しくは、出現回数が割合所定の割合上昇したキーワードを抽出する。 Further, the extracting unit 132 may extract a keyword whose number of appearances is equal to or greater than a predetermined threshold among the keywords included in the information about the content acquired by the acquiring unit 131 . For example, the extracting unit 132 extracts keywords whose number of appearances is equal to or greater than a predetermined threshold, or keywords whose number of appearances has increased by a predetermined rate, from the keywords included in the advertisements determined to be undeliverable in a predetermined period. do.

また、抽出部132は、審査において配信不可と判定された事由であるキーワードを抽出してもよい。例えば、抽出部132は、所定の期間において配信不可と判定された広告に含まれるキーワードであって、配信不可と判定された事由であるキーワードを抽出する。 Moreover, the extraction unit 132 may extract a keyword that is the reason why the distribution is determined to be impossible in the examination. For example, the extracting unit 132 extracts a keyword included in an advertisement that was determined to be undeliverable during a predetermined period of time and that is the reason why the advertisement was determined to be undeliverable.

また、抽出部132は、配信不可と判定されたコンテンツのうち、提供主が提供するコンテンツと属性が類似するコンテンツからキーワードを抽出してもよい。例えば、抽出部132は、所定の期間において配信不可と判定されたコンテンツのうち、提供主が提供する広告と属性が類似するコンテンツからキーワードを抽出する。 Further, the extracting unit 132 may extract keywords from content similar in attribute to content provided by the provider, among the content determined to be undistributable. For example, the extraction unit 132 extracts keywords from content similar in attributes to advertisements provided by the provider, among the content determined to be undistributable during a predetermined period.

(特定部133について)
特定部133は、提供主のうち、事象と所定の関連性を有する提供主を特定する。例えば、図1の例において、特定部133は、コンテンツC1が示す事象の属性「災害」に紐付けられた属性に属する広告を提供する提供主U1を特定する。
(Regarding the specifying unit 133)
The identifying unit 133 identifies a provider having a predetermined relationship with the event among the providers. For example, in the example of FIG. 1, the identifying unit 133 identifies the provider U1 who provides advertisements belonging to the attribute linked to the attribute "disaster" of the event indicated by the content C1.

また、特定部133は、提供主のうち、事象の属性と関連するコンテンツを提供する提供主を特定してもよい。例えば、図1の例において、特定部133は、コンテンツC1が示す事象の属性「災害」と関連する属性「防災グッズ」に属する広告を提供する提供主U1を特定する。 Further, the identifying unit 133 may identify, among the providers, providers who provide content related to the attribute of the event. For example, in the example of FIG. 1, the identifying unit 133 identifies a provider U1 who provides an advertisement belonging to the attribute "disaster prevention goods" related to the attribute "disaster" of the event indicated by the content C1.

(判定部134について)
判定部134は、抽出部132により抽出されたキーワードと、特定部133により特定された提供主が提供するコンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する。例えば、図1の例において、判定部134は、コンテンツC1に関する情報から抽出したキーワードに基づいて、提供主U1が提供する広告を、配信を許可するか否かの審査(再審査)の対象、若しくは、配信停止の対象とするか否かを判定する。
(Regarding the determination unit 134)
Based on the keyword extracted by the extracting unit 132 and the information on the content provided by the provider specified by the specifying unit 133, the determining unit 134 determines whether the content is subject to a predetermined examination or is subject to suspension of distribution. Determine whether or not to be targeted. For example, in the example of FIG. 1, the determination unit 134 determines whether or not to permit the distribution of advertisements provided by the provider U1 based on keywords extracted from the information about the content C1. Alternatively, it is determined whether or not the distribution is to be stopped.

また、判定部134は、コンテンツのうち、キーワードを含むコンテンツを所定の審査の対象、若しくは、配信停止の対象と判定してもよい。例えば、図1の例において、判定部134は、提供主U1が提供する広告のうち、コンテンツC1に関する情報から抽出したキーワードを含む広告を、配信を許可するか否かの審査(再審査)の対象、若しくは、配信停止の対象と判定する。 Further, the determination unit 134 may determine that content including a keyword is subject to a predetermined examination or distribution suspension. For example, in the example of FIG. 1, the determination unit 134 examines (re-examines) whether or not to permit distribution of an advertisement including a keyword extracted from information about the content C1 among advertisements provided by the provider U1. It is judged as a target or a target for distribution suspension.

〔3.抽出処理のフロー〕
ここで、図6を用いて、実施形態に係る抽出装置100の抽出処理の手順について説明する。図6は、実施形態に係る抽出処理の手順の一例を示すフローチャートである。
[3. Extraction process flow]
Here, a procedure of extraction processing of the extraction device 100 according to the embodiment will be described with reference to FIG. 6 . FIG. 6 is a flowchart illustrating an example of an extraction process procedure according to the embodiment.

図6に示すように、抽出装置100は、所定の期間に発生する事象を示す事象情報を取得する(ステップS101)。例えば、図1の例において、抽出装置100は、直近の期間内における利用者の閲覧回数が所定の閾値以上であるコンテンツC1に関する情報を事象情報として取得する。 As shown in FIG. 6, the extraction device 100 acquires event information indicating events occurring in a predetermined period (step S101). For example, in the example of FIG. 1, the extraction device 100 acquires, as event information, information related to the content C1 for which the user's browsing count in the most recent period is equal to or greater than a predetermined threshold.

続いて、抽出装置100は、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する(ステップS102)。例えば、抽出装置100は、提供主がコンテンツに用いることが想定される時事的なキーワードを、事象情報から抽出する。続いて、抽出装置100は、事象と所定の関連性を有する提供主を特定する(ステップS103)。例えば、図1の例において、抽出装置100は、事象の属性に紐付けられた属性に属する広告を提供する提供主を特定する。 Subsequently, the extracting device 100 extracts keywords that satisfy a predetermined condition of the relationship with the provider of the content to be distributed (step S102). For example, the extraction device 100 extracts topical keywords that the provider is expected to use in the content from the event information. Subsequently, the extraction device 100 identifies a provider who has a predetermined relationship with the event (step S103). For example, in the example of FIG. 1, the extraction device 100 identifies providers who provide advertisements belonging to attributes linked to the attributes of the event.

続いて、抽出装置100は、配信対象のコンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する(ステップS104)。例えば、図1の例において、抽出装置100は、特定した提供主が提供する広告のうち、抽出したキーワードを含む広告を、配信を許可するか否かの審査の対象、若しくは、配信停止の対象と判定する。 Subsequently, the extraction device 100 determines whether or not the content to be distributed is subject to a predetermined examination or to suspension of distribution (step S104). For example, in the example of FIG. 1, the extraction device 100 selects, from among the advertisements provided by the specified provider, the advertisements containing the extracted keywords as targets for examination as to whether or not to permit distribution, or for suspension of distribution. I judge.

〔4.変形例〕
上述の実施形態は一例を示したものであり、種々の変更及び応用が可能である。
[4. Modification]
The above-described embodiment is an example, and various modifications and applications are possible.

〔4-1.提供主が提供するコンテンツについて〕
上述の実施形態では、判定部134が、事象情報から抽出されたキーワードと、事象の属性と関連する広告に関する情報とに基づいて、当該広告が、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する例を示したが、判定部134の判定対象は広告に限定されない。例えば、判定部134は、事象情報から抽出されたキーワードと、事象の属性と関連する各種コンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定してもよい。
[4-1. Regarding the content provided by the provider]
In the above-described embodiment, the determination unit 134 determines whether the advertisement is subject to a predetermined examination or distribution suspension based on the keyword extracted from the event information and the information on the advertisement related to the attribute of the event. Although an example of determining whether or not is shown, the determination target of the determination unit 134 is not limited to advertisements. For example, the determination unit 134 determines whether the content is subject to a predetermined examination or distribution suspension based on the keyword extracted from the event information and the information on various content related to the attribute of the event. It may be determined whether

〔4-2.事象と関連性を有する提供主の特定処理について〕
上述の実施形態では、特定部133が、事象の属性と関連するコンテンツを提供する提供主を特定する例を示したが、特定部133の機能はこのような構成に限定されない。例えば、抽出部132により、利用者の関心度が極めて高い事象を示す事象情報(例えば、閲覧数が平均よりも所定の閾値以上高いコンテンツに関する情報)からキーワードが抽出された場合、特定部133は、当該事象の属性に関連するコンテンツを提供する提供主だけでなく、当該事象の属性に関連しないコンテンツを提供する提供主も特定してよい。
[4-2. Concerning the identification process of the provider who is related to the event]
In the above-described embodiment, an example was given in which the identifying unit 133 identifies a provider who provides content related to the attribute of an event, but the function of the identifying unit 133 is not limited to such a configuration. For example, when the extracting unit 132 extracts a keyword from event information indicating an event of which the degree of interest of the user is extremely high (for example, information about content whose number of views is higher than the average by a predetermined threshold or more), the identifying unit 133 , not only providers providing content related to the attributes of the event, but also providers providing content unrelated to the attributes of the event may be specified.

〔5.効果〕
上述してきたように、実施形態に係る抽出装置100は、取得部131と、抽出部132と、特定部133と、判定部134とを有する。取得部131は、所定の期間に発生する事象を示す事象情報を取得する。抽出部132は、取得部131により取得された事象情報に基づいて、事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する。また、抽出部132は、事象の属性に紐付けられた情報に対応するキーワードを抽出する。特定部133は、提供主のうち、事象と所定の関連性を有する提供主を特定する。判定部134は、抽出部132により抽出されたキーワードと、特定部133により特定された提供主が提供するコンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する。
[5. effect〕
As described above, the extraction device 100 according to the embodiment has the acquisition unit 131, the extraction unit 132, the identification unit 133, and the determination unit . Acquisition unit 131 acquires event information indicating an event occurring in a predetermined period. Based on the event information acquired by the acquisition unit 131, the extraction unit 132 extracts keywords that are related to the event and that satisfy a predetermined condition for the relationship with the provider of the content to be distributed. Also, the extracting unit 132 extracts a keyword corresponding to information linked to the attribute of the event. The identifying unit 133 identifies a provider having a predetermined relationship with the event among the providers. Based on the keyword extracted by the extracting unit 132 and the information on the content provided by the provider specified by the specifying unit 133, the determining unit 134 determines whether the content is subject to a predetermined examination or is subject to suspension of distribution. Determine whether or not to be targeted.

これにより、実施形態に係る抽出装置100は、直近の期間に発生した事象に関連するキーワードを抽出するため、提供主がコンテンツに用いることが想定されるキーワードを把握することができる。 As a result, since the extraction device 100 according to the embodiment extracts keywords related to events that occurred in the most recent period, it is possible to grasp the keywords that the provider is expected to use in the content.

また、実施形態に係る抽出装置100において、例えば、取得部131は、事象情報として、所定の期間における入力回数が所定の閾値以上である検索クエリを示す情報を取得する。また、取得部131は、事象情報として、所定の期間における閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得する。また、取得部131は、事象情報として、所定の期間に開催されるイベントを示す情報を取得する。また、取得部131は、事象のうち、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得する。また、取得部131は、事象情報として、配信対象のコンテンツのうち、所定の期間における表示回数が所定の閾値以上であるコンテンツを示す情報を取得する。また、取得部131は、事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、所定の期間において配信不可と判定されたコンテンツに関する情報を取得する。そして、抽出部132は、取得部131により取得されたコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出する。また、抽出部132は、審査において配信不可と判定された事由であるキーワードを抽出する。また、抽出部132は、配信不可と判定されたコンテンツのうち、提供主が提供するコンテンツと属性が類似するコンテンツからキーワードを抽出する。 Further, in the extraction device 100 according to the embodiment, for example, the acquisition unit 131 acquires, as event information, information indicating search queries whose number of inputs during a predetermined period is equal to or greater than a predetermined threshold. In addition, the acquisition unit 131 acquires, as the event information, information indicating the content for which the number of viewing times in a predetermined period is equal to or greater than a predetermined threshold. In addition, the acquisition unit 131 acquires information indicating an event held during a predetermined period as event information. In addition, the acquisition unit 131 acquires event information indicating an event that is estimated to cause the contacting user's emotion to become negative among the events. In addition, the acquisition unit 131 acquires, as event information, information indicating content whose number of times of display in a predetermined period is equal to or greater than a predetermined threshold among the content to be distributed. In addition, the acquisition unit 131 acquires, as event information, information about content that has been examined as to whether or not it should be distributed, and that has been determined to be undistributable within a predetermined period. Then, the extracting unit 132 extracts keywords whose number of appearances is equal to or greater than a predetermined threshold, from the keywords included in the information about the content acquired by the acquiring unit 131 . Also, the extracting unit 132 extracts a keyword that is the reason why distribution is determined to be impossible in the examination. Further, the extracting unit 132 extracts keywords from content similar in attributes to content provided by the provider, among the content determined to be undistributable.

これにより、実施形態に係る抽出装置100は、各種の事象情報からキーワードを抽出するため、提供主がコンテンツに用いることが想定されるキーワードを幅広く把握することができる。 As a result, since the extraction device 100 according to the embodiment extracts keywords from various types of event information, it is possible to grasp a wide range of keywords that the provider is expected to use for content.

また、実施形態に係る抽出装置100において、例えば、特定部133は、提供主のうち、事象の属性と関連するコンテンツを提供する提供主を特定する。また、判定部134は、コンテンツのうち、キーワードを含むコンテンツを所定の審査の対象、若しくは、配信停止の対象と判定する。 Further, in the extraction device 100 according to the embodiment, for example, the identifying unit 133 identifies, among the providers, providers who provide content related to the attribute of the event. Further, the determining unit 134 determines that the content including the keyword is subject to a predetermined examination or distribution suspension.

これにより、実施形態に係る抽出装置100は、キーワードが悪用される場合でも、事象の属性や抽出したキーワードに応じて提供主を特定し、特定した提供主が提供するコンテンツを判定対象とできるため、コンテンツの質を担保することを可能とする。 As a result, even if the keyword is abused, the extraction device 100 according to the embodiment can identify the provider according to the attribute of the event and the extracted keyword, and can determine the content provided by the identified provider. , to ensure the quality of the content.

〔6.ハードウェア構成〕
また、上述してきた各実施形態に係る抽出装置100は、例えば、図7に示すような構成のコンピュータ1000によって実現される。以下、抽出装置100を例に挙げて説明する。図7は、抽出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、ROM1200、RAM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[6. Hardware configuration]
Also, the extraction device 100 according to each of the embodiments described above is implemented by, for example, a computer 1000 configured as shown in FIG. Hereinafter, the extraction device 100 will be described as an example. FIG. 7 is a hardware configuration diagram showing an example of a computer that implements the functions of the extraction device. Computer 1000 has CPU 1100 , ROM 1200 , RAM 1300 , HDD 1400 , communication interface (I/F) 1500 , input/output interface (I/F) 1600 and media interface (I/F) 1700 .

CPU1100は、ROM1200又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1200は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。 The CPU 1100 operates based on programs stored in the ROM 1200 or HDD 1400 and controls each section. The ROM 1200 stores a boot program executed by the CPU 1100 when the computer 1000 is started, programs dependent on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。 The HDD 1400 stores programs executed by the CPU 1100, data used by the programs, and the like. Communication interface 1500 receives data from another device via communication network 500 (corresponding to network N in the embodiment) and sends it to CPU 1100, and also transmits data generated by CPU 1100 via communication network 500 to other devices. Send to device.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。 The CPU 1100 controls output devices such as displays and printers, and input devices such as keyboards and mice, through an input/output interface 1600 . CPU 1100 acquires data from an input device via input/output interface 1600 . Also, CPU 1100 outputs the generated data to an output device via input/output interface 1600 .

メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1300を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1300上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。 Media interface 1700 reads programs or data stored in recording medium 1800 and provides them to CPU 1100 via RAM 1300 . CPU 1100 loads such a program from recording medium 1800 onto RAM 1300 via media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or a PD (Phase change rewritable disc), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. etc.

例えば、コンピュータ1000が抽出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1300上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、抽出装置100の記憶装置内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。 For example, when the computer 1000 functions as the extraction device 100 , the CPU 1100 of the computer 1000 implements the functions of the control unit 130 by executing programs loaded on the RAM 1300 . In addition, each data in the storage device of the extraction device 100 is stored in the HDD 1400 . CPU 1100 of computer 1000 reads these programs from recording medium 1800 and executes them, but as another example, these programs may be obtained from another device via a predetermined communication network.

〔7.その他〕
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
[7. others〕
As described above, some of the embodiments of the present application have been described in detail based on the drawings. It is possible to carry out the invention in other forms with modifications.

また、上述した抽出装置100は、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。 In addition, the configuration of the extraction apparatus 100 described above can be flexibly changed, for example, by calling an external platform or the like using an API (Application Programming Interface), network computing, or the like, depending on the function.

また、特許請求の範囲に記載した「部」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。 In addition, the "unit" described in the claims can be read as "means", "circuit", or the like. For example, the acquisition unit can be read as acquisition means or an acquisition circuit.

10 提供主端末
20 外部装置
100 抽出装置
110 通信部
120 記憶部
121 提供主情報記憶部
122 事象情報記憶部
130 制御部
131 取得部
132 抽出部
133 特定部
134 判定部
10 provider terminal 20 external device 100 extraction device 110 communication unit 120 storage unit 121 provider information storage unit 122 event information storage unit 130 control unit 131 acquisition unit 132 extraction unit 133 identification unit 134 determination unit

Claims (13)

所定の期間に発生する事象を示す事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、前記所定の期間において配信不可と判定されたコンテンツに関する情報を取得する取得部と、
前記審査において配信不可と判定された前記コンテンツのうち、提供主が提供するコンテンツと属性が類似するコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出する抽出部と
を備えることを特徴とする抽出装置。
An acquisition unit that acquires, as event information indicating an event that occurs during a predetermined period, information about content that has been examined as to whether or not it should be distributed and that has been determined to be undistributable during the predetermined period. and,
An extraction unit for extracting a keyword whose number of appearances is equal to or greater than a predetermined threshold, among keywords included in information about content similar in attributes to content provided by a provider, among the content determined to be undistributable in the examination. and .
前記抽出部は、
前記事象の属性に紐付けられた情報に対応するキーワードを抽出する
ことを特徴とする請求項1に記載の抽出装置。
The extractor is
The extracting device according to claim 1, extracting a keyword corresponding to information linked to the attribute of the event.
前記取得部は、
前記事象情報として、前記所定の期間における入力回数が所定の閾値以上である検索クエリを示す情報を取得する
ことを特徴とする請求項1または2に記載の抽出装置。
The acquisition unit
3. The extracting device according to claim 1, wherein information indicating a search query whose number of times of input in the predetermined period is equal to or greater than a predetermined threshold is acquired as the event information.
前記取得部は、
前記事象情報として、前記所定の期間における閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得する
ことを特徴とする請求項1から3のいずれか一つに記載の抽出装置。
The acquisition unit
4. The extracting device according to any one of claims 1 to 3, wherein, as the event information, information indicating a content whose number of viewing times in the predetermined period is equal to or greater than a predetermined threshold is acquired.
前記取得部は、
前記事象情報として、前記所定の期間に開催されるイベントを示す情報を取得する
ことを特徴とする請求項1から4のいずれか一つに記載の抽出装置。
The acquisition unit
5. The extracting device according to any one of claims 1 to 4, wherein information indicating an event held during the predetermined period is obtained as the event information.
前記取得部は、
前記事象のうち、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得する
ことを特徴とする請求項1から5のいずれか一つに記載の抽出装置。
The acquisition unit
6. The extracting device according to any one of claims 1 to 5, wherein event information indicating an event, among the events, that is estimated to cause the contacting user's emotion to become negative, is acquired.
前記取得部は、
前記事象情報として、前記配信対象のコンテンツのうち、前記所定の期間における表示回数が所定の閾値以上であるコンテンツを示す情報を取得する
ことを特徴とする請求項1から6のいずれか一つに記載の抽出装置。
The acquisition unit
7. Acquiring, as the event information, information indicating content whose number of times of display in the predetermined period is equal to or greater than a predetermined threshold among the contents to be distributed as the event information. The extraction device according to .
前記抽出部は、
前記審査において配信不可と判定された事由であるキーワードを抽出する
ことを特徴とする請求項1から7のいずれか一つに記載の抽出装置。
The extractor is
8. The extracting device according to any one of claims 1 to 7, extracting a keyword that is a reason why distribution is determined to be impossible in the examination.
前記提供主のうち、前記事象と所定の関連性を有する提供主を特定する特定部と、
前記抽出部により抽出されたキーワードと、前記特定部により特定された提供主が提供するコンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する判定部
をさらに備えることを特徴とする請求項1からのいずれか一つに記載の抽出装置。
a specifying unit that specifies a provider having a predetermined relationship with the event, from among the providers;
Based on the keyword extracted by the extracting unit and the information on the content provided by the provider specified by the specifying unit, whether the content is subject to a predetermined examination or distribution suspension The extracting device according to any one of claims 1 to 8 , further comprising a determination unit that determines whether.
前記特定部は、
前記提供主のうち、前記事象の属性と関連するコンテンツを提供する提供主を特定する
ことを特徴とする請求項に記載の抽出装置。
The identification unit
10. The extracting device according to claim 9 , wherein, among the providers, a provider who provides content related to the attribute of the event is specified.
前記判定部は、
前記コンテンツのうち、前記キーワードを含むコンテンツを所定の審査の対象、若しくは、配信停止の対象と判定する
ことを特徴とする請求項または10に記載の抽出装置。
The determination unit is
11. The extracting device according to claim 9 , wherein, among the contents, contents including the keyword are determined to be subject to a predetermined examination or to be subject to suspension of distribution.
抽出装置が実行する抽出方法であって、
所定の期間に発生する事象を示す事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、前記所定の期間において配信不可と判定されたコンテンツに関する情報を取得する取得工程と、
前記審査において配信不可と判定された前記コンテンツのうち、提供主が提供するコンテンツと属性が類似するコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出する抽出工程と
を含むことを特徴とする抽出方法。
An extraction method performed by an extraction device, comprising:
An acquisition step of acquiring, as event information indicating an event that occurs during a predetermined period, information relating to content that has been examined as to whether or not it should be distributed and that has been determined to be undistributable during the predetermined period. and,
An extraction step of extracting a keyword whose number of appearances is equal to or greater than a predetermined threshold among keywords included in information about content similar in attributes to content provided by a provider, among the content determined to be undistributable in the examination. An extraction method characterized by comprising and .
所定の期間に発生する事象を示す事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、前記所定の期間において配信不可と判定されたコンテンツに関する情報を取得する取得手順と、
前記審査において配信不可と判定された前記コンテンツのうち、提供主が提供するコンテンツと属性が類似するコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出する抽出手順と
をコンピュータに実行させるための抽出プログラム。
Acquisition procedure for acquiring, as event information indicating an event that occurs during a predetermined period, information relating to content that has been examined as to whether or not it should be distributed and that has been determined to be undistributable during the predetermined period. and,
An extraction procedure for extracting a keyword whose number of appearances is equal to or greater than a predetermined threshold among keywords included in information about content similar in attributes to content provided by a provider, among the content determined to be undistributable in the examination. An extraction program for executing and on a computer.
JP2019149987A 2019-08-19 2019-08-19 Extraction device, extraction method and extraction program Active JP7260439B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019149987A JP7260439B2 (en) 2019-08-19 2019-08-19 Extraction device, extraction method and extraction program
JP2023062340A JP2023076694A (en) 2019-08-19 2023-04-06 Extraction device, extraction method and extraction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019149987A JP7260439B2 (en) 2019-08-19 2019-08-19 Extraction device, extraction method and extraction program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023062340A Division JP2023076694A (en) 2019-08-19 2023-04-06 Extraction device, extraction method and extraction program

Publications (2)

Publication Number Publication Date
JP2021033428A JP2021033428A (en) 2021-03-01
JP7260439B2 true JP7260439B2 (en) 2023-04-18

Family

ID=74676528

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019149987A Active JP7260439B2 (en) 2019-08-19 2019-08-19 Extraction device, extraction method and extraction program
JP2023062340A Pending JP2023076694A (en) 2019-08-19 2023-04-06 Extraction device, extraction method and extraction program

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023062340A Pending JP2023076694A (en) 2019-08-19 2023-04-06 Extraction device, extraction method and extraction program

Country Status (1)

Country Link
JP (2) JP7260439B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080300971A1 (en) 2007-05-30 2008-12-04 Microsoft Corporation Advertisement approval based on training data
JP2009037420A (en) 2007-08-01 2009-02-19 Yahoo Japan Corp Evaluation application device, program, and method for harmful content
JP2011039575A (en) 2009-08-06 2011-02-24 Nippon Telegr & Teleph Corp <Ntt> Content detection support device, content detection support method, and content detection support program
US20120115447A1 (en) 2010-11-04 2012-05-10 Electronics And Telecommunications Research Institute System and method for providing safety content service
JP2016177620A (en) 2015-03-20 2016-10-06 ヤフー株式会社 Information processing device, information processing method, information processing program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080300971A1 (en) 2007-05-30 2008-12-04 Microsoft Corporation Advertisement approval based on training data
JP2009037420A (en) 2007-08-01 2009-02-19 Yahoo Japan Corp Evaluation application device, program, and method for harmful content
JP2011039575A (en) 2009-08-06 2011-02-24 Nippon Telegr & Teleph Corp <Ntt> Content detection support device, content detection support method, and content detection support program
US20120115447A1 (en) 2010-11-04 2012-05-10 Electronics And Telecommunications Research Institute System and method for providing safety content service
JP2016177620A (en) 2015-03-20 2016-10-06 ヤフー株式会社 Information processing device, information processing method, information processing program

Also Published As

Publication number Publication date
JP2023076694A (en) 2023-06-01
JP2021033428A (en) 2021-03-01

Similar Documents

Publication Publication Date Title
US20190294642A1 (en) Website fingerprinting
JP6408014B2 (en) Selecting content items for presentation to social networking system users in news feeds
KR20110032878A (en) Keyword ad. method and system for social networking service
JP2010170436A (en) Method for distributing recommendation advertisement to optional keyword in internet web page (digital content) to display the same, method for evaluating quality of advertisement, and method for charging on the basis of quality evaluation
JP2009193465A (en) Information processor, information providing system, information processing method, and program
JP6679250B2 (en) Determination device, determination method, and determination program
JP2017126215A (en) Device, method, and program for selecting information
JP2016038822A (en) Extraction device, extraction method, and extraction program
KR20200045354A (en) Automatic advertisement execution device, method for automatically generating campaign information for an advertisement medium to execute an advertisement and computer program for executing the method
KR101735019B1 (en) Apparatus of providing feed contents, and computer readable recoding medium and for executing the method
JP2017138880A (en) Learning device, learning method and learning program
JP7160757B2 (en) Determination device, determination method and determination program
JP2018136721A (en) Distribution system, distribution method and distribution program
JP6243559B2 (en) Learning device, learning method, and learning program
JP2020154824A (en) Determination device, determination method, and determination program
JP7260439B2 (en) Extraction device, extraction method and extraction program
JP7195293B2 (en) Information processing device, information processing method, and information processing program
JP7042787B2 (en) Judgment device, judgment method, and judgment program
JP7174743B2 (en) Information selection device, information selection method and information selection program
JP7139270B2 (en) Estimation device, estimation method and estimation program
Hahn Influence of digital transformation on the customer relationship
KR20160110333A (en) Multi-media network service system and method based on template
KR20210052237A (en) Product catalog automatic classification system based on artificial intelligence
JP6549675B2 (en) Learning apparatus, learning method and learning program
JP7407779B2 (en) Information processing device, information processing method, and information processing program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230406

R150 Certificate of patent or registration of utility model

Ref document number: 7260439

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350