JP7170959B2 - DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM - Google Patents

DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM Download PDF

Info

Publication number
JP7170959B2
JP7170959B2 JP2019141406A JP2019141406A JP7170959B2 JP 7170959 B2 JP7170959 B2 JP 7170959B2 JP 2019141406 A JP2019141406 A JP 2019141406A JP 2019141406 A JP2019141406 A JP 2019141406A JP 7170959 B2 JP7170959 B2 JP 7170959B2
Authority
JP
Japan
Prior art keywords
broadcast data
name
website
displayed
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019141406A
Other languages
Japanese (ja)
Other versions
JP2021026306A5 (en
JP2021026306A (en
Inventor
文弥 古谷
敦 松原
高志 石渡
Original Assignee
ノバセル株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノバセル株式会社 filed Critical ノバセル株式会社
Priority to JP2019141406A priority Critical patent/JP7170959B2/en
Publication of JP2021026306A publication Critical patent/JP2021026306A/en
Publication of JP2021026306A5 publication Critical patent/JP2021026306A5/ja
Application granted granted Critical
Publication of JP7170959B2 publication Critical patent/JP7170959B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、TVCMを抽出可能とするためのデータの生成装置、生成方法及びそのためのプログラムに関する。 The present invention relates to a data generation device, a generation method, and a program therefor for making it possible to extract TVCM.

TVで放映されるCM(以下「TVCM」と呼ぶ。)について、いつどのようなCMが放映されたかについてのデータが有益である場面があり、自社でTVCMの利用を検討している場面はその一つである。TVCMの制作に当たって過去のTVCMが参考となり、また、放映日時の決定においても参考となるからである。このことは、TVCMの利用を検討している企業を顧客として広告代理店としてサービスを提供する企業においても同様である。 Regarding commercials aired on TV (hereinafter referred to as "TV commercials"), there are situations where data on when and what kind of commercials were aired is useful. is one. This is because past TV commercials can serve as a reference when producing TV commercials, and can also serve as a reference for determining the broadcast date and time. This is the same for companies that provide services as an advertising agency to companies that are considering using TVCM as customers.

しかしながら、起用されたタレント、放映された日時等であれば現在又は過去のTVCMを参考とすることは容易であるものの、競合企業等の自社事業に関連性を有する企業はどのようなTVCMを放映しているのかという視点に立ったとき、困難が生じる。すなわち、そのようなTVCMを効率的に現在又は過去の放映データから特定する手法がないのである。競合企業の企業名が明らかであれば、当該企業によるTVCMの特定は容易であるが、自社事業又は顧客事業に関連性を有する企業であって、TVCMの放映経験のある企業を広く認識していることは稀である。 However, although it is easy to refer to current or past TV commercials based on the talents used, the date and time of airing, etc. Difficulties arise when we stand in the perspective of whether In other words, there is no method for efficiently identifying such TV commercials from current or past broadcast data. If the name of the competitor company is clear, it is easy to identify the TV commercial by the company. They are rare.

本発明は、このような問題点に鑑みてなされたものであり、その目的は、現在又は過去のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成装置、生成方法及びそのためのプログラムに関する。 The present invention has been made in view of such problems, and its purpose is to extract TV commercials by a first company or a second company related to its business from current or past TV commercials. The present invention relates to a data generation device, a generation method, and a program therefor.

このような目的を達成するために、本発明の第1の態様は、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成方法であって、コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、前記コンピュータが、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、前記コンピュータが、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶するステップとを含むことを特徴とする。 In order to achieve such an object, a first aspect of the present invention selects a TVCM by a first company or a second company related to its business from one or more current or past TVCMs. A method for generating data to be extractable, comprising: a step of a computer reading each broadcast data of one or more of the current or past TV commercials; a step of inputting at least one of a company name and a product name, a service name, or a brand name included in the broadcast data into a search engine as a keyword; The website displayed first and the domain that can be owned by a corporation that is one level below the general top-level domain or the domain that can be owned by a corporation that is two or one level below the country code top-level domain a step of acquiring one or more character strings described in any meta tag or title tag of the same website; and storing.

また、本発明の第2の態様は、第1の態様において、前記メタタグは、descriptionメタタグ又はkeywordsメタタグを含むことを特徴とする。 A second aspect of the present invention is characterized in that, in the first aspect, the metatag includes a description metatag or a keywords metatag.

また、本発明の第3の態様は、第1の態様において、前記メタタグは、OGP又はtwitterのdescriptionタグを含むことを特徴とする。 A third aspect of the present invention is characterized in that, in the first aspect, the metatag includes a description tag of OGP or twitter.

また、本発明の第4の態様は、第1の態様において、前記1又は複数の文字列は、前記メタタグ又はタイトルタグのcontent属性の記載に対する解析によって抽出される1又は複数の名詞の少なくとも一部であることを特徴とする。 Further, according to a fourth aspect of the present invention, in the first aspect, the one or more character strings are at least one of one or more nouns extracted by analyzing the content attribute description of the metatag or title tag. It is characterized by being a part.

また、本発明の第5の態様は、第1から第4のいずれかの態様において、前記1又は複数の文字列の少なくとも一部は、前記キーワードを含まないことを特徴とする。 Further, according to a fifth aspect of the present invention, in any one of the first to fourth aspects, at least part of the one or more character strings does not include the keyword.

また、本発明の第6の態様は、第1から第5のいずれかの態様において、前記入力は、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名をキーワードとして行うことを特徴とする。 Further, according to a sixth aspect of the present invention, in any one of the first to fifth aspects, the input is performed using a company name, product name, service name, or brand name included in the broadcast data as a keyword. Characterized by

また、本発明の第7の態様は、第1から第6のいずれかの態様において、前記入力は、前記放映データに含まれるサービス名又はブランド名をキーワードとして行い、前記サービス名又はブランド名は、インターネットサービスのサービス名又はブランド名であることを特徴とする。 Further, according to a seventh aspect of the present invention, in any one of the first to sixth aspects, the input is performed using a service name or brand name included in the broadcast data as a keyword, and the service name or brand name is , the service name or brand name of an Internet service.

また、本発明の第8の態様は、第1から第7のいずれかの態様において、前記取得は、前記検索結果からさらに所定の1又は複数のウェブサイトを除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が所有可能なドメイン又は国別コードトップレベルドメインの二階層下又は一階層下の法人が所有可能なドメインが同一のウェブサイトのいずれかに対して行うことを特徴とする。 Further, according to an eighth aspect of the present invention, in any one of the first to seventh aspects, the acquisition is displayed first by excluding a predetermined one or more websites from the search results. and the domain that can be owned by a corporation that is one level below the general top-level domain, or the website that has the same domain that can be owned by a corporation that is two levels or one level below the country code top-level domain It is characterized by performing against.

また、本発明の第9の態様は、第8の態様において、前記所定の1又は複数のウェブサイトは、ECサイト、求人サイト及び事典サイト又は辞書サイトの少なくともいずれかを含むことを特徴とする。 A ninth aspect of the present invention is characterized in that, in the eighth aspect, the predetermined one or more websites include at least one of an EC site, a recruiting site, an encyclopedia site, or a dictionary site. .

また、本発明の第10の態様は、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータ構造であって、第1から第9のいずれかの態様の生成方法によって生成されるデータ構造である。 In addition, a tenth aspect of the present invention provides a data structure for extracting a TVCM by a first company or a second company related to its business from one or more current or past TVCMs. and is a data structure generated by the generation method according to any one of the first to ninth aspects.

また、第11の態様において、コンピュータに、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成方法を実行させるためのプログラムであって、前記生成方法は、前記コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、前記コンピュータが、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、前記コンピュータが、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶するステップとを含むことを特徴とする。 In addition, in the eleventh aspect, the computer stores data for extracting TVCM by a first company or a second company related to its business from one or more current or past TVCM. A program for executing a generation method, the generation method comprising the steps of: reading each broadcast data of one or more of the current or past TVCMs by the computer; a step of inputting at least one of a company name and a product name, a service name, or a brand name included in the broadcast data into a search engine as a keyword for each identifier; The website displayed first except for the results of the above and the domain that can be owned by a corporation one level below the general top-level domain, or owned by a corporation two or one level below the country code top-level domain a step of acquiring one or more character strings described in any meta tag or title tag of a website having the same possible domain; and storing in association with the data.

また、第12の態様において、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成装置であって、前記現在又は過去の1又は複数のTVCMの各放映データを読み出し、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力して、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得し、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶することを特徴とする。 In addition, in the twelfth aspect, a data generation device for extracting TVCM by a first company or a second company related to its business from one or more current or past TVCM reading each broadcast data of one or more of the current or past TVCM, and at least one of a company name and a product name, a service name, or a brand name included in the broadcast data for each CM identifier included in the broadcast data; is entered as a keyword into a search engine, and the website displayed first by excluding the results displayed as advertisements in the search engine from the search results and the corporation one level below the general top level domain can be owned domain, or a domain that is two levels below or one level below the country code top-level domain and that can be owned by a corporation has the same website. , at least part of the one or more character strings are stored in association with the broadcast data.

本発明の一態様によれば、現在又は過去の1又は複数のTVCMの放映データに、CM識別子ごとに、放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして得られた検索エンジンの検索結果を用いて当該放映データを放映した企業又はその事業に関連性を有する企業又はその事業を紐づける文字列を取得して、当該放映データに関連づけて記憶することによって、第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能なデータが生成可能となる。 According to one aspect of the present invention, at least one of a company name, a product name, a service name, or a brand name included in the broadcast data is used as a keyword for each CM identifier in the broadcast data of one or a plurality of current or past TV commercials. By using the obtained search engine search results to obtain a character string that links the company that broadcast the broadcast data or a company that is related to that business or its business, and stores it in association with the broadcast data , data from which TV commercials by a first company or a second company with relevance to its business can be extracted.

本発明の一実施形態にかかる生成装置を示す図である。1 is a diagram showing a generating device according to an embodiment of the invention; FIG. 本発明の一実施形態にかかる生成方法の流れを示す図である。It is a figure which shows the flow of the production|generation method concerning one Embodiment of this invention. 本発明の一実施形態にかかるウェブサイトのソースコードの一部を示す図である。It is a figure which shows a part of source code of the website concerning one Embodiment of this invention.

以下、本発明の実施形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail.

図1に、本発明の一実施形態にかかる生成装置を示す。生成装置100は、現在又は過去の1又は複数のTVCMの放映データが記憶されたデータベース110から各放映データを読み出すことができ、また、インターネットなどのIPネットワーク上で検索エンジンを提供するサーバ120と通信することができる。 FIG. 1 shows a generating device according to one embodiment of the invention. The generation device 100 can read out each broadcast data from a database 110 in which broadcast data of one or a plurality of current or past TVCM are stored, and a server 120 that provides a search engine on an IP network such as the Internet. can communicate.

データベース110に記憶された各放映データは、CMを識別するCM識別子と、CMを放映する会社名と、CMの対象である商品、サービス又はブランド(以下「商品等」と呼ぶ。)の名称とを含む。CMは、同一の商品等を対象とするものであっても異なるバージョンのものが複数存在することがあり、その場合には異なるCM識別子が付与されることがある。会社名と商品等の名称については、いずれか一方のみが含まれることもあり、また、これらの正式名称の略称が用いられることもある。また、放映データには、放映開始日時、放映終了日時、CMの秒数、出演したタレント名、使用された曲名、使用された曲のアーティスト名などをさらに含んでもよい。 Each piece of broadcast data stored in the database 110 includes a CM identifier that identifies the CM, the name of the company broadcasting the CM, and the name of the product, service, or brand (hereinafter referred to as "products, etc.") that is the target of the CM. including. A CM may have a plurality of different versions even if it targets the same product or the like, and in such cases, different CM identifiers may be assigned. Only one of the company name and product name may be included, and abbreviations of these formal names may be used. In addition, the broadcast data may further include broadcast start date and time, broadcast end date and time, number of seconds of CM, names of entertainers who appeared, names of songs used, artist names of songs used, and the like.

装置100は、通信インターフェースなどの通信部101と、プロセッサ、CPU等の処理部102と、メモリ、ハードディスク等の記憶装置又は記憶媒体を含む記憶部103とを備え、各処理を行うためのプログラムを実行することによって構成することができ、1又は複数の装置ないしサーバを含むことがある。また、当該プログラムは、1又は複数のプログラムを含むことがあり、また、コンピュータ読み取り可能な記憶媒体に記録して非一過性のプログラムプロダクトとすることができる。当該プログラムは、記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶しておき、処理部102において実行することができる。 The device 100 includes a communication unit 101 such as a communication interface, a processing unit 102 such as a processor and a CPU, and a storage unit 103 including a storage device or storage medium such as a memory and a hard disk, and stores programs for performing each process. It can be constructed by executing and may include one or more devices or servers. Also, the program may include one or more programs, and may be recorded on a computer-readable storage medium to be a non-transitory program product. The program can be stored in a storage device or storage medium accessible from the storage unit 103 or the device 100 and executed by the processing unit 102 .

以下では、装置100がデータベース110から放映データを読み出すものとして説明を行うが、データベース110に記憶された放映データは、装置100の記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶しておいてもよい。 In the following description, it is assumed that the device 100 reads broadcast data from the database 110, but the broadcast data stored in the database 110 is stored in the storage unit 103 of the device 100 or in a storage device or storage medium accessible from the device 100. You can keep it.

まず、装置100は、現在又は過去の1又は複数のTVCMの各放映データを読み出す(S201)。次に、装置100は、放映データに含まれるCM識別子ごとに、当該放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力する(S202)。 First, the device 100 reads out each broadcast data of one or a plurality of current or past TVCM (S201). Next, the device 100 inputs at least one of the company name, product name, service name, and brand name included in the broadcast data into the search engine as a keyword for each CM identifier included in the broadcast data (S202).

検索エンジンへのキーワードの入力は、一例として、装置100が、ウェブブラウザを操作して当該検索エンジンの入力欄にキーワードの入力を行うことで実行することができる。装置100は、記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶されたウェブブラウザを操作可能であり、必要に応じてウェブブラウザを操作するためのライブラリを用いて書かれたコードを実行することによって当該ウェブブラウザを操作可能とすることができる。ウェブブラウザの例としては、Chrome(登録商標)が挙げられる。検索エンジンへのキーワードの入力は、ヘッドレスでウェブブラウザを操作してもよい。検索エンジンへのキーワードの入力及び検索結果の受信は、ウェブブラウザの操作によってではなく、HTTP又はHTTPSプロトコルに従ったデータの送受信によって行うこともできる。当該データの送受信に用いることのできるライブラリの例として、curl(商標)が挙げられる。 A keyword can be input to the search engine, for example, by the device 100 operating a web browser and inputting the keyword in the input field of the search engine. The device 100 can operate a web browser stored in the storage unit 103 or in a storage device or storage medium accessible from the device 100, and code written using a library for operating the web browser as necessary. The web browser can be made operable by executing Examples of web browsers include Chrome (registered trademark). The input of keywords to the search engine may be operated headless with a web browser. The input of keywords to the search engine and the reception of search results can also be performed by transmitting and receiving data according to the HTTP or HTTPS protocol instead of operating the web browser. An example of a library that can be used to transmit and receive such data is curl (trademark).

次いで、装置100は、検索エンジンの検索結果から、当該検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトのメタタグに記載された1又は複数の文字列を取得する(S203)。また、メタタグではなく、タイトルタグに記載された文字列の取得を行うことも考えられる。メタタグ又はタイトルタグの記載をウェブサイトのhtmlファイルから取得するためのライブラリの例としては、Beautiful Soup(商標)が挙げられる。 Next, from the search results of the search engine, the device 100 excludes the results displayed as advertisements in the search engine, and acquires one or more character strings described in the metatags of the first displayed website. (S203). It is also conceivable to acquire the character string described in the title tag instead of the meta tag. Beautiful Soup (trademark) is an example of a library for obtaining descriptions of metatags or title tags from website html files.

メタタグの例としては、descriptionメタタグ又はkeywordsメタタグを挙げることができる。これらのメタタグは、当該ウェブサイトの公開者が自社又は自社の事業に関連性を有すると考える単語又は表現を記載し、検索エンジンの検索結果において自社又は自社の事業に関連性を有する他社のウェブサイトと比較されるように、あるいは当該他社のウェブサイトよりも上位に表示されるようにするためのものであるから、ここに記載された文字列が共通する会社同士又は商品等同士は、互いに競合企業であり、少なくとも自社又はその事業に関連性を有する企業又はその事業であると評価することができることを発明者らは見出した。メタタグの例としては他に、OGPのdescriptionタグ、twitter(登録商標)のdescriptionタグなどを含むことができる。文字列取得のさらなる詳細は、その一例を後述する。 Examples of metatags can include the description metatag or the keywords metatag. These meta tags describe words or expressions that the publisher of the website considers to be relevant to their company or their business, and are used by search engines to identify the websites of other companies that are relevant to their company or their business. Since it is intended to be compared with the website or to be displayed higher than the website of the other company, companies or products that share the same character string described here The inventors have found that they can be evaluated as competitors and at least as companies or businesses related to them or their businesses. Other examples of meta tags may include an OGP description tag, a twitter (registered trademark) description tag, and the like. Further details of string acquisition will be described later with an example.

そして、装置100は、取得した1又は複数の文字列の少なくとも一部を当該CM識別子の放映データに関連づけて記憶する(S204)。記憶は、データベース110にて行うことができ、又は記憶部103若しくは装置100からアクセス可能な記憶装置若しくは記憶媒体にて行ってもよい。また、記憶される1又は複数の文字列の少なくとも一部は、入力されたキーワードを含まないようにしてもよい。キーワードとして使用された会社名又は商品等の名称は、個別の会社又は商品等を表すものであり、そうした単語を除くことで、会社同士又は商品等同士に関連性があることをより表す文字列を抽出可能となるからである。 Then, the device 100 stores at least part of the one or more character strings obtained in association with the broadcast data of the CM identifier (S204). Storage may be in database 110 or may be in a storage device or medium accessible from storage 103 or device 100 . Also, at least part of the one or more character strings to be stored may not include the input keyword. The company names or product names used as keywords represent individual companies or products, and by removing such words, the character string more expresses the relationship between companies or products. can be extracted.

このように、現在又は過去の1又は複数のTVCMの放映データにCM識別子ごとに上記1又は複数の文字列の少なくとも一部を関連づけて記憶することで、当該放映データの中から第1の企業若しくは法人又はその事業に関連性を有する第2の企業又は法人によるTVCMを抽出可能なデータが生成される。 In this way, by associating at least a part of the one or more character strings with each CM identifier to broadcast data of one or more TV commercials currently or in the past, the first company can be identified from the broadcast data. Alternatively, data is generated that can extract TVCM by a corporation or a second corporation or corporation that has relevance to its business.

TVCMの放映データは、購入可能なものも存在する。そして、CMの内容を表す分類コードが放映データに含まれるものがある。たとえば、「食品」「調味料」「ソース」などのように大中小の分類でCMの内容を特定されることがある。しかしながら、たとえば、現在さまざまなインターネットサービスが生まれ、こうしたサービスを提供する企業によるTVCMも増加しているが、分類というものの性質上次々と生まれる多様なインターネットサービスに適切に付与することが困難である。実際、現状では「パソコン・AV」「その他」「Webサイト」という分類が様々なインターネットサービスに纏めて付与され、関連性を有する商品等を区別するための分類としての機能を果たし得ていない。本発明は、こうしたインターネット上で提供されるサービスであるインターネットサービスのように、変化が速く、適切な分類化が困難な商品等において特に有益性が高い。 Some broadcast data of TVCM are available for purchase. Some broadcast data includes a classification code representing the content of the commercial. For example, the content of a commercial may be identified by large, medium, or small categories such as "food", "seasoning", and "sauce". However, for example, various Internet services are currently being created, and TV commercials by companies that provide such services are increasing. In fact, at present, classifications such as "personal computer/AV", "others", and "website" are collectively given to various Internet services, and they cannot function as classifications for distinguishing related products. The present invention is particularly useful for products that change rapidly and that are difficult to classify appropriately, such as Internet services, which are services provided on the Internet.

本実施形態にかかる生成方法により生成されたデータを用いて現在又は過去のTVCMを抽出することを考える。生成されたデータをデータベースとして、図3に示した「ハコベル」を例に「シェアリング」の文字列で当該データベースを検索した場合、「シェアリング」の文字列が関連付けて記憶された1又は複数の放映データが取得され、それらの含まれる会社名、商品等の名称、放送日時、タレント名等の少なくとも一部をユーザーの表示画面に表示することができる。 Consider extracting current or past TVCM using data generated by the generation method according to the present embodiment. Using the generated data as a database, when searching the database with the character string "sharing" using the example of "Hacobell" shown in FIG. are acquired, and at least part of the company name, product name, broadcast date and time, talent name, etc. included in the broadcast data can be displayed on the user's display screen.

なお、上述の説明では、装置100は、検索エンジンの検索結果から、当該検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトを対象としたが、1つ目に表示されるウェブサイトと「com」などの一般トップレベルドメイン(gTLD)の一階層下の企業又は法人が保有可能なドメイン又は「jp」などの国別コードトップレベルドメイン(ccTLD)の二階層下又は一階層下の企業又は法人が保有可能なドメインが同一のウェブサイトを対象としてもよい。ccTLDの場合、「abc.co.jp」のような二階層下のドメインのほかに「abc.jp」のような一階層下のドメインを企業又は法人が保有可能なことがある。キーワードとして会社名及び商品等の名称が入力された場合、当該商品等の公式サイトのメタタグ又はタイトルタグをスクレイピングすることが高い正確性を与えるものと考えられるところ、必ずしも1つ目に表示されるものではなく、同一ドメインのウェブサイトを対象としても本発明の精神から逸脱するものではない。 In the above description, the device 100 targets the first website displayed by excluding the results displayed as advertisements in the search engine from the search results of the search engine. The website displayed on the website and a domain that can be owned by a company or corporation that is one level below a general top-level domain (gTLD) such as "com", or a two-level country code top-level domain (ccTLD) such as "jp" Websites with the same domain that can be owned by companies or corporations one level below or one level below may be targeted. In the case of ccTLDs, companies or corporations may be able to own domains one level lower such as "abc.jp" in addition to domains two levels lower such as "abc.co.jp". When a company name or product name is entered as a keyword, scraping the meta tag or title tag of the official website of the product is considered to give high accuracy, but it is not always displayed first. It does not deviate from the spirit of the present invention to target websites of the same domain.

また、検索結果から「amazon.com(登録商標)」などのECサイトを除外して対象とするウェブサイトを決定することが好ましい。こうしたECサイトが検索結果の上位に表示されることがあるからである。同様に「wikipedia(登録商標).org」などの事典サイト又は辞書サイトについても、除外することが好ましい。また、求人サイトについても検索結果の上位に表示されることがあり、除外することが好ましい。 In addition, it is preferable to determine target websites by excluding EC sites such as "amazon.com (registered trademark)" from the search results. This is because such EC sites may be displayed at the top of search results. Similarly, encyclopedia sites or dictionary sites such as "wikipedia (registered trademark).org" are preferably excluded. In addition, it is preferable to exclude job search sites as they may be displayed at the top of the search results.

また、「××のみに基づいて」、「××のみに応じて」、「××のみの場合」というように「のみ」との記載がなければ、本明細書においては、付加的な情報も考慮し得ることが想定されていることに留意されたい。また、一例として、「aの場合にbする」という記載は、明示した場合を除き、「aの場合に常にbする」ことを必ずしも意味しないことに留意されたい。 In addition, unless there is a description of "only" such as "based on XX only", "only in response to XX", or "in the case of XX only", in this specification, additional information Note that it is assumed that . Also, as an example, it should be noted that the statement "when a, do b" does not necessarily mean "when a, do b", unless explicitly stated otherwise.

また、念のため、なんらかの方法、プログラム、端末、装置、サーバ又はシステム(以下「方法等」)において、本明細書で記述された動作と異なる動作を行う側面があるとしても、本発明の各態様は、本明細書で記述された動作のいずれかと同一の動作を対象とするものであり、本明細書で記述された動作と異なる動作が存在することは、当該方法等を本発明の各態様の範囲外とするものではないことを付言する。 Also, just in case, any method, program, terminal, device, server, or system (hereinafter "method, etc."), even if there is an aspect that operates differently from the operations described in this specification, each of the present invention Aspects are directed to acts that are identical to any of the acts described herein, and that there are acts that are different from those described herein, the methods, etc. It should be added that it is not out of the scope of the embodiments.

文字列取得の詳細
図3に、出願人が提供するサービスである「ハコベル(登録商標)」のサービス名を検索エンジン「グーグル(登録商標)」で検索し、広告を除外して1つ目に表示されたウェブサイトである当該サービスの公式ウェブサイトのソースコードの一部を示す。
Get string details
Figure 3 shows the first website displayed after excluding advertisements after searching for the service name of "Hacobel (registered trademark)", which is a service provided by the applicant, using the search engine "Google (registered trademark)". A part of the source code of the official website of the service is shown.

タイトルタグから文字列を取得する場合には、タイトルタグのcontent属性の記載に対して形態素解析を行い、名詞に該当する1又は複数の文字列を抽出することができる。図3の例では、「物流」「シェリング」「プラットフォーム」などの文字列を取得することができる。このことは、descriptionメタタグ、OGPのdescriptionタグなどについても同様である。keywordsメタタグについても同様に形態素解析による文字列の取得を行ってもよいが、content属性の記載がカンマで区切られていることから、カンマで分割して1又は複数の文字列を取得するかたちの解析をしてもよい。 When a character string is obtained from the title tag, morphological analysis can be performed on the description of the content attribute of the title tag to extract one or more character strings corresponding to nouns. In the example of FIG. 3, character strings such as "distribution", "schelling", and "platform" can be acquired. This also applies to description meta tags, OGP description tags, and the like. The keywords meta tag may also be obtained by morphological analysis in the same way. You can do the analysis.

100 装置
101 通信部
102 処理部
103 記憶部
110 データベース
120 検索エンジンサーバ
100 device 101 communication unit 102 processing unit 103 storage unit 110 database 120 search engine server

Claims (8)

現在又は過去の1又は複数のTVCMの中から他の企業によるTVCMを抽出可能とするためのデータの生成方法であって、
コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、
前記コンピュータが、読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、
前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、
前記コンピュータが、前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データに関連づけて検索可能に記憶するステップと
を含むことを特徴とする方法。
A method for generating data for extracting TVCMs by other companies from one or more current or past TVCMs,
a step in which a computer reads each broadcast data of the current or past one or more TV commercials;
a step in which the computer inputs at least one of the company name and product name, service name, or brand name included in the read broadcast data as a keyword into a search engine;
A step in which the computer acquires one or more character strings described in any meta tag or title tag of a website displayed by excluding results displayed as advertisements in the search engine from search results;
and a step in which the computer stores at least part of the one or more character strings, at least part of which does not include the keyword, in a searchable manner in association with the broadcast data. Method.
前記メタタグは、descriptionメタタグ又はkeywordsメタタグを含むことを特徴とする請求項1に記載の方法。 2. The method of claim 1, wherein the metatags include description metatags or keywords metatags. 前記メタタグは、OGP又はtwitterのdescriptionタグを含むことを特徴とする請求項1に記載の方法。 2. The method of claim 1, wherein the meta tags include OGP or twitter description tags. 前記入力は、読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名をキーワードとして行うことを特徴とする請求項1から3のいずれかに記載の方法。 4. The method according to any one of claims 1 to 3, wherein said input is performed using a company name, product name, service name, or brand name included in the read broadcast data as a keyword. 前記取得は、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのメタタグ又はタイトルタグ、又は前記ウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列の取得であることを特徴とする請求項1から4のいずれかに記載の方法。 The above acquisition can be held by the meta tag or title tag of the website displayed by excluding the results displayed as advertisements on the search engine from the search results, or by a corporation one level below the website and the general top-level domain One or more character strings described in any meta tag or title tag of a website with the same domain that can be owned by a corporation that is two levels below or one level below the country code top-level domain. 5. A method according to any one of claims 1 to 4, characterized in that 前記取得は、前記検索結果からさらに所定の1又は複数のウェブサイトを除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が所有可能なドメイン又は国別コードトップレベルドメインの二階層下又は一階層下の法人が所有可能なドメインが同一のウェブサイトのいずれかに対して行うことを特徴とする請求項5に記載の方法。 Said acquisition is the domain or country code that can be owned by the corporation one level below the website displayed first by excluding one or more predetermined websites from the search results and the general top-level domain 6. The method of claim 5, wherein the website is either two levels below the top-level domain or one level below the top-level domain and the corporate-owned domain is the same. コンピュータに、現在又は過去の1又は複数のTVCMの中から他の企業によるTVCMを抽出可能とするためのデータの生成方法を実行させるためのプログラムであって、前記生成方法は、
前記コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、
前記コンピュータが、読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、
前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、
前記コンピュータが、前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データに関連づけて検索可能に記憶するステップと
を含むことを特徴とするプログラム。
A program for causing a computer to execute a data generation method for extracting TVCMs by other companies from one or more current or past TVCMs, wherein the generation method comprises:
a step of the computer reading each broadcast data of the current or past one or more TV commercials;
a step in which the computer inputs at least one of the company name and product name, service name, or brand name included in the read broadcast data as a keyword into a search engine;
A step in which the computer acquires one or more character strings described in any meta tag or title tag of a website displayed by excluding results displayed as advertisements in the search engine from search results;
and a step in which the computer stores at least part of the one or more character strings, at least part of which does not include the keyword, in a searchable manner in association with the broadcast data. program.
現在又は過去の1又は複数のTVCMの中から他の企業によるTVCMを抽出可能とするためのデータの生成装置であって、
前記現在又は過去の1又は複数のTVCMの各放映データを読み出し、
読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力して、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得し、
前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データに関連づけて検索可能に記憶することを特徴とする生成装置。
A data generation device for extracting TVCMs by other companies from one or more current or past TVCMs,
reading each broadcast data of the current or past one or more TVCM;
At least one of the company name and product name, service name, or brand name included in the read broadcast data is entered as a keyword into a search engine, and results displayed as advertisements in the search engine are excluded from the search results. Acquire one or more character strings described in any meta tag or title tag of the displayed website,
A generation device characterized by storing at least part of the one or more character strings, at least part of which does not include the keyword, in a searchable manner in association with the on-air data.
JP2019141406A 2019-07-31 2019-07-31 DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM Active JP7170959B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019141406A JP7170959B2 (en) 2019-07-31 2019-07-31 DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019141406A JP7170959B2 (en) 2019-07-31 2019-07-31 DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM

Publications (3)

Publication Number Publication Date
JP2021026306A JP2021026306A (en) 2021-02-22
JP2021026306A5 JP2021026306A5 (en) 2021-09-09
JP7170959B2 true JP7170959B2 (en) 2022-11-15

Family

ID=74664689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019141406A Active JP7170959B2 (en) 2019-07-31 2019-07-31 DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM

Country Status (1)

Country Link
JP (1) JP7170959B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001297106A (en) 2000-04-13 2001-10-26 Sony Corp Method for preparing data base
JP2007058853A (en) 2005-08-05 2007-03-08 Cross Media Co Inc Method and system for allocating advertising budget to media in online advertising
JP2014007659A (en) 2012-06-26 2014-01-16 Toshiba Corp Information output device, information output method, and information output program
US20170318329A1 (en) 2015-08-25 2017-11-02 Tencent Technology (Shenzhen) Company Limited Information processing method, apparatus, and device
JP2018147437A (en) 2017-03-09 2018-09-20 ヤフー株式会社 Data collection system, data collection method, and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4320508B2 (en) * 2000-11-28 2009-08-26 ソニー株式会社 Recording / reproducing apparatus and method, and recording medium
JP6104053B2 (en) * 2013-01-31 2017-03-29 アルパイン株式会社 Internet search apparatus and internet search method
JP2016143098A (en) * 2015-01-30 2016-08-08 キヤノンマーケティングジャパン株式会社 Content providing system, control method, and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001297106A (en) 2000-04-13 2001-10-26 Sony Corp Method for preparing data base
JP2007058853A (en) 2005-08-05 2007-03-08 Cross Media Co Inc Method and system for allocating advertising budget to media in online advertising
JP2014007659A (en) 2012-06-26 2014-01-16 Toshiba Corp Information output device, information output method, and information output program
US20170318329A1 (en) 2015-08-25 2017-11-02 Tencent Technology (Shenzhen) Company Limited Information processing method, apparatus, and device
JP2018147437A (en) 2017-03-09 2018-09-20 ヤフー株式会社 Data collection system, data collection method, and program

Also Published As

Publication number Publication date
JP2021026306A (en) 2021-02-22

Similar Documents

Publication Publication Date Title
US8195634B2 (en) Domain-aware snippets for search results
US7849081B1 (en) Document analyzer and metadata generation and use
AU2010226779C1 (en) Online ad placement based on user metrics for hosted media
JP6343035B2 (en) Generate ad campaign
CN105900117B (en) Method and system for collecting, normalizing, matching and enriching data
US11748408B2 (en) Analyzing user searches of verbal media content
US20140316890A1 (en) Entity Bidding
WO2015196910A1 (en) Search engine-based summary information extraction method, apparatus and search engine
US20080294625A1 (en) Item recommendation system
JP5296045B2 (en) Advertisement information providing device
US10475068B2 (en) Systems and methods of generating digital campaigns
US20110307483A1 (en) Entity detection and extraction for entity cards
US20110307482A1 (en) Search result driven query intent identification
CN109191158B (en) Processing method and processing equipment for user portrait label data
TW201207649A (en) Search engine optimization at scale
JP2020504879A (en) System and method for collecting data related to malicious content in a networked environment
US20170322984A1 (en) Multi-dimensional search
US20170228378A1 (en) Extracting topics from customer review search queries
JP2011107826A (en) Action-information extracting system and extraction method
US20090125381A1 (en) Methods for identifying documents relating to a market
KR100964090B1 (en) Method and system for recommending advertisement keyword by analyzing log
JP2007233584A (en) Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program
US20150278828A1 (en) Market analysis for an online business
JP7170959B2 (en) DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM
US8131752B2 (en) Breaking documents

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210727

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210727

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210727

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220930

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20221013

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221013

R150 Certificate of patent or registration of utility model

Ref document number: 7170959

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150