JP7170959B2 - DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM - Google Patents
DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM Download PDFInfo
- Publication number
- JP7170959B2 JP7170959B2 JP2019141406A JP2019141406A JP7170959B2 JP 7170959 B2 JP7170959 B2 JP 7170959B2 JP 2019141406 A JP2019141406 A JP 2019141406A JP 2019141406 A JP2019141406 A JP 2019141406A JP 7170959 B2 JP7170959 B2 JP 7170959B2
- Authority
- JP
- Japan
- Prior art keywords
- broadcast data
- name
- website
- displayed
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 23
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000003860 storage Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000011194 food seasoning agent Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、TVCMを抽出可能とするためのデータの生成装置、生成方法及びそのためのプログラムに関する。 The present invention relates to a data generation device, a generation method, and a program therefor for making it possible to extract TVCM.
TVで放映されるCM(以下「TVCM」と呼ぶ。)について、いつどのようなCMが放映されたかについてのデータが有益である場面があり、自社でTVCMの利用を検討している場面はその一つである。TVCMの制作に当たって過去のTVCMが参考となり、また、放映日時の決定においても参考となるからである。このことは、TVCMの利用を検討している企業を顧客として広告代理店としてサービスを提供する企業においても同様である。 Regarding commercials aired on TV (hereinafter referred to as "TV commercials"), there are situations where data on when and what kind of commercials were aired is useful. is one. This is because past TV commercials can serve as a reference when producing TV commercials, and can also serve as a reference for determining the broadcast date and time. This is the same for companies that provide services as an advertising agency to companies that are considering using TVCM as customers.
しかしながら、起用されたタレント、放映された日時等であれば現在又は過去のTVCMを参考とすることは容易であるものの、競合企業等の自社事業に関連性を有する企業はどのようなTVCMを放映しているのかという視点に立ったとき、困難が生じる。すなわち、そのようなTVCMを効率的に現在又は過去の放映データから特定する手法がないのである。競合企業の企業名が明らかであれば、当該企業によるTVCMの特定は容易であるが、自社事業又は顧客事業に関連性を有する企業であって、TVCMの放映経験のある企業を広く認識していることは稀である。 However, although it is easy to refer to current or past TV commercials based on the talents used, the date and time of airing, etc. Difficulties arise when we stand in the perspective of whether In other words, there is no method for efficiently identifying such TV commercials from current or past broadcast data. If the name of the competitor company is clear, it is easy to identify the TV commercial by the company. They are rare.
本発明は、このような問題点に鑑みてなされたものであり、その目的は、現在又は過去のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成装置、生成方法及びそのためのプログラムに関する。 The present invention has been made in view of such problems, and its purpose is to extract TV commercials by a first company or a second company related to its business from current or past TV commercials. The present invention relates to a data generation device, a generation method, and a program therefor.
このような目的を達成するために、本発明の第1の態様は、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成方法であって、コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、前記コンピュータが、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、前記コンピュータが、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶するステップとを含むことを特徴とする。 In order to achieve such an object, a first aspect of the present invention selects a TVCM by a first company or a second company related to its business from one or more current or past TVCMs. A method for generating data to be extractable, comprising: a step of a computer reading each broadcast data of one or more of the current or past TV commercials; a step of inputting at least one of a company name and a product name, a service name, or a brand name included in the broadcast data into a search engine as a keyword; The website displayed first and the domain that can be owned by a corporation that is one level below the general top-level domain or the domain that can be owned by a corporation that is two or one level below the country code top-level domain a step of acquiring one or more character strings described in any meta tag or title tag of the same website; and storing.
また、本発明の第2の態様は、第1の態様において、前記メタタグは、descriptionメタタグ又はkeywordsメタタグを含むことを特徴とする。 A second aspect of the present invention is characterized in that, in the first aspect, the metatag includes a description metatag or a keywords metatag.
また、本発明の第3の態様は、第1の態様において、前記メタタグは、OGP又はtwitterのdescriptionタグを含むことを特徴とする。 A third aspect of the present invention is characterized in that, in the first aspect, the metatag includes a description tag of OGP or twitter.
また、本発明の第4の態様は、第1の態様において、前記1又は複数の文字列は、前記メタタグ又はタイトルタグのcontent属性の記載に対する解析によって抽出される1又は複数の名詞の少なくとも一部であることを特徴とする。 Further, according to a fourth aspect of the present invention, in the first aspect, the one or more character strings are at least one of one or more nouns extracted by analyzing the content attribute description of the metatag or title tag. It is characterized by being a part.
また、本発明の第5の態様は、第1から第4のいずれかの態様において、前記1又は複数の文字列の少なくとも一部は、前記キーワードを含まないことを特徴とする。 Further, according to a fifth aspect of the present invention, in any one of the first to fourth aspects, at least part of the one or more character strings does not include the keyword.
また、本発明の第6の態様は、第1から第5のいずれかの態様において、前記入力は、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名をキーワードとして行うことを特徴とする。 Further, according to a sixth aspect of the present invention, in any one of the first to fifth aspects, the input is performed using a company name, product name, service name, or brand name included in the broadcast data as a keyword. Characterized by
また、本発明の第7の態様は、第1から第6のいずれかの態様において、前記入力は、前記放映データに含まれるサービス名又はブランド名をキーワードとして行い、前記サービス名又はブランド名は、インターネットサービスのサービス名又はブランド名であることを特徴とする。 Further, according to a seventh aspect of the present invention, in any one of the first to sixth aspects, the input is performed using a service name or brand name included in the broadcast data as a keyword, and the service name or brand name is , the service name or brand name of an Internet service.
また、本発明の第8の態様は、第1から第7のいずれかの態様において、前記取得は、前記検索結果からさらに所定の1又は複数のウェブサイトを除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が所有可能なドメイン又は国別コードトップレベルドメインの二階層下又は一階層下の法人が所有可能なドメインが同一のウェブサイトのいずれかに対して行うことを特徴とする。 Further, according to an eighth aspect of the present invention, in any one of the first to seventh aspects, the acquisition is displayed first by excluding a predetermined one or more websites from the search results. and the domain that can be owned by a corporation that is one level below the general top-level domain, or the website that has the same domain that can be owned by a corporation that is two levels or one level below the country code top-level domain It is characterized by performing against.
また、本発明の第9の態様は、第8の態様において、前記所定の1又は複数のウェブサイトは、ECサイト、求人サイト及び事典サイト又は辞書サイトの少なくともいずれかを含むことを特徴とする。 A ninth aspect of the present invention is characterized in that, in the eighth aspect, the predetermined one or more websites include at least one of an EC site, a recruiting site, an encyclopedia site, or a dictionary site. .
また、本発明の第10の態様は、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータ構造であって、第1から第9のいずれかの態様の生成方法によって生成されるデータ構造である。 In addition, a tenth aspect of the present invention provides a data structure for extracting a TVCM by a first company or a second company related to its business from one or more current or past TVCMs. and is a data structure generated by the generation method according to any one of the first to ninth aspects.
また、第11の態様において、コンピュータに、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成方法を実行させるためのプログラムであって、前記生成方法は、前記コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、前記コンピュータが、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、前記コンピュータが、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶するステップとを含むことを特徴とする。 In addition, in the eleventh aspect, the computer stores data for extracting TVCM by a first company or a second company related to its business from one or more current or past TVCM. A program for executing a generation method, the generation method comprising the steps of: reading each broadcast data of one or more of the current or past TVCMs by the computer; a step of inputting at least one of a company name and a product name, a service name, or a brand name included in the broadcast data into a search engine as a keyword for each identifier; The website displayed first except for the results of the above and the domain that can be owned by a corporation one level below the general top-level domain, or owned by a corporation two or one level below the country code top-level domain a step of acquiring one or more character strings described in any meta tag or title tag of a website having the same possible domain; and storing in association with the data.
また、第12の態様において、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成装置であって、前記現在又は過去の1又は複数のTVCMの各放映データを読み出し、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力して、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得し、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶することを特徴とする。 In addition, in the twelfth aspect, a data generation device for extracting TVCM by a first company or a second company related to its business from one or more current or past TVCM reading each broadcast data of one or more of the current or past TVCM, and at least one of a company name and a product name, a service name, or a brand name included in the broadcast data for each CM identifier included in the broadcast data; is entered as a keyword into a search engine, and the website displayed first by excluding the results displayed as advertisements in the search engine from the search results and the corporation one level below the general top level domain can be owned domain, or a domain that is two levels below or one level below the country code top-level domain and that can be owned by a corporation has the same website. , at least part of the one or more character strings are stored in association with the broadcast data.
本発明の一態様によれば、現在又は過去の1又は複数のTVCMの放映データに、CM識別子ごとに、放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして得られた検索エンジンの検索結果を用いて当該放映データを放映した企業又はその事業に関連性を有する企業又はその事業を紐づける文字列を取得して、当該放映データに関連づけて記憶することによって、第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能なデータが生成可能となる。 According to one aspect of the present invention, at least one of a company name, a product name, a service name, or a brand name included in the broadcast data is used as a keyword for each CM identifier in the broadcast data of one or a plurality of current or past TV commercials. By using the obtained search engine search results to obtain a character string that links the company that broadcast the broadcast data or a company that is related to that business or its business, and stores it in association with the broadcast data , data from which TV commercials by a first company or a second company with relevance to its business can be extracted.
以下、本発明の実施形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail.
図1に、本発明の一実施形態にかかる生成装置を示す。生成装置100は、現在又は過去の1又は複数のTVCMの放映データが記憶されたデータベース110から各放映データを読み出すことができ、また、インターネットなどのIPネットワーク上で検索エンジンを提供するサーバ120と通信することができる。
FIG. 1 shows a generating device according to one embodiment of the invention. The
データベース110に記憶された各放映データは、CMを識別するCM識別子と、CMを放映する会社名と、CMの対象である商品、サービス又はブランド(以下「商品等」と呼ぶ。)の名称とを含む。CMは、同一の商品等を対象とするものであっても異なるバージョンのものが複数存在することがあり、その場合には異なるCM識別子が付与されることがある。会社名と商品等の名称については、いずれか一方のみが含まれることもあり、また、これらの正式名称の略称が用いられることもある。また、放映データには、放映開始日時、放映終了日時、CMの秒数、出演したタレント名、使用された曲名、使用された曲のアーティスト名などをさらに含んでもよい。
Each piece of broadcast data stored in the
装置100は、通信インターフェースなどの通信部101と、プロセッサ、CPU等の処理部102と、メモリ、ハードディスク等の記憶装置又は記憶媒体を含む記憶部103とを備え、各処理を行うためのプログラムを実行することによって構成することができ、1又は複数の装置ないしサーバを含むことがある。また、当該プログラムは、1又は複数のプログラムを含むことがあり、また、コンピュータ読み取り可能な記憶媒体に記録して非一過性のプログラムプロダクトとすることができる。当該プログラムは、記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶しておき、処理部102において実行することができる。
The
以下では、装置100がデータベース110から放映データを読み出すものとして説明を行うが、データベース110に記憶された放映データは、装置100の記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶しておいてもよい。
In the following description, it is assumed that the
まず、装置100は、現在又は過去の1又は複数のTVCMの各放映データを読み出す(S201)。次に、装置100は、放映データに含まれるCM識別子ごとに、当該放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力する(S202)。
First, the
検索エンジンへのキーワードの入力は、一例として、装置100が、ウェブブラウザを操作して当該検索エンジンの入力欄にキーワードの入力を行うことで実行することができる。装置100は、記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶されたウェブブラウザを操作可能であり、必要に応じてウェブブラウザを操作するためのライブラリを用いて書かれたコードを実行することによって当該ウェブブラウザを操作可能とすることができる。ウェブブラウザの例としては、Chrome(登録商標)が挙げられる。検索エンジンへのキーワードの入力は、ヘッドレスでウェブブラウザを操作してもよい。検索エンジンへのキーワードの入力及び検索結果の受信は、ウェブブラウザの操作によってではなく、HTTP又はHTTPSプロトコルに従ったデータの送受信によって行うこともできる。当該データの送受信に用いることのできるライブラリの例として、curl(商標)が挙げられる。
A keyword can be input to the search engine, for example, by the
次いで、装置100は、検索エンジンの検索結果から、当該検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトのメタタグに記載された1又は複数の文字列を取得する(S203)。また、メタタグではなく、タイトルタグに記載された文字列の取得を行うことも考えられる。メタタグ又はタイトルタグの記載をウェブサイトのhtmlファイルから取得するためのライブラリの例としては、Beautiful Soup(商標)が挙げられる。
Next, from the search results of the search engine, the
メタタグの例としては、descriptionメタタグ又はkeywordsメタタグを挙げることができる。これらのメタタグは、当該ウェブサイトの公開者が自社又は自社の事業に関連性を有すると考える単語又は表現を記載し、検索エンジンの検索結果において自社又は自社の事業に関連性を有する他社のウェブサイトと比較されるように、あるいは当該他社のウェブサイトよりも上位に表示されるようにするためのものであるから、ここに記載された文字列が共通する会社同士又は商品等同士は、互いに競合企業であり、少なくとも自社又はその事業に関連性を有する企業又はその事業であると評価することができることを発明者らは見出した。メタタグの例としては他に、OGPのdescriptionタグ、twitter(登録商標)のdescriptionタグなどを含むことができる。文字列取得のさらなる詳細は、その一例を後述する。 Examples of metatags can include the description metatag or the keywords metatag. These meta tags describe words or expressions that the publisher of the website considers to be relevant to their company or their business, and are used by search engines to identify the websites of other companies that are relevant to their company or their business. Since it is intended to be compared with the website or to be displayed higher than the website of the other company, companies or products that share the same character string described here The inventors have found that they can be evaluated as competitors and at least as companies or businesses related to them or their businesses. Other examples of meta tags may include an OGP description tag, a twitter (registered trademark) description tag, and the like. Further details of string acquisition will be described later with an example.
そして、装置100は、取得した1又は複数の文字列の少なくとも一部を当該CM識別子の放映データに関連づけて記憶する(S204)。記憶は、データベース110にて行うことができ、又は記憶部103若しくは装置100からアクセス可能な記憶装置若しくは記憶媒体にて行ってもよい。また、記憶される1又は複数の文字列の少なくとも一部は、入力されたキーワードを含まないようにしてもよい。キーワードとして使用された会社名又は商品等の名称は、個別の会社又は商品等を表すものであり、そうした単語を除くことで、会社同士又は商品等同士に関連性があることをより表す文字列を抽出可能となるからである。
Then, the
このように、現在又は過去の1又は複数のTVCMの放映データにCM識別子ごとに上記1又は複数の文字列の少なくとも一部を関連づけて記憶することで、当該放映データの中から第1の企業若しくは法人又はその事業に関連性を有する第2の企業又は法人によるTVCMを抽出可能なデータが生成される。 In this way, by associating at least a part of the one or more character strings with each CM identifier to broadcast data of one or more TV commercials currently or in the past, the first company can be identified from the broadcast data. Alternatively, data is generated that can extract TVCM by a corporation or a second corporation or corporation that has relevance to its business.
TVCMの放映データは、購入可能なものも存在する。そして、CMの内容を表す分類コードが放映データに含まれるものがある。たとえば、「食品」「調味料」「ソース」などのように大中小の分類でCMの内容を特定されることがある。しかしながら、たとえば、現在さまざまなインターネットサービスが生まれ、こうしたサービスを提供する企業によるTVCMも増加しているが、分類というものの性質上次々と生まれる多様なインターネットサービスに適切に付与することが困難である。実際、現状では「パソコン・AV」「その他」「Webサイト」という分類が様々なインターネットサービスに纏めて付与され、関連性を有する商品等を区別するための分類としての機能を果たし得ていない。本発明は、こうしたインターネット上で提供されるサービスであるインターネットサービスのように、変化が速く、適切な分類化が困難な商品等において特に有益性が高い。 Some broadcast data of TVCM are available for purchase. Some broadcast data includes a classification code representing the content of the commercial. For example, the content of a commercial may be identified by large, medium, or small categories such as "food", "seasoning", and "sauce". However, for example, various Internet services are currently being created, and TV commercials by companies that provide such services are increasing. In fact, at present, classifications such as "personal computer/AV", "others", and "website" are collectively given to various Internet services, and they cannot function as classifications for distinguishing related products. The present invention is particularly useful for products that change rapidly and that are difficult to classify appropriately, such as Internet services, which are services provided on the Internet.
本実施形態にかかる生成方法により生成されたデータを用いて現在又は過去のTVCMを抽出することを考える。生成されたデータをデータベースとして、図3に示した「ハコベル」を例に「シェアリング」の文字列で当該データベースを検索した場合、「シェアリング」の文字列が関連付けて記憶された1又は複数の放映データが取得され、それらの含まれる会社名、商品等の名称、放送日時、タレント名等の少なくとも一部をユーザーの表示画面に表示することができる。 Consider extracting current or past TVCM using data generated by the generation method according to the present embodiment. Using the generated data as a database, when searching the database with the character string "sharing" using the example of "Hacobell" shown in FIG. are acquired, and at least part of the company name, product name, broadcast date and time, talent name, etc. included in the broadcast data can be displayed on the user's display screen.
なお、上述の説明では、装置100は、検索エンジンの検索結果から、当該検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトを対象としたが、1つ目に表示されるウェブサイトと「com」などの一般トップレベルドメイン(gTLD)の一階層下の企業又は法人が保有可能なドメイン又は「jp」などの国別コードトップレベルドメイン(ccTLD)の二階層下又は一階層下の企業又は法人が保有可能なドメインが同一のウェブサイトを対象としてもよい。ccTLDの場合、「abc.co.jp」のような二階層下のドメインのほかに「abc.jp」のような一階層下のドメインを企業又は法人が保有可能なことがある。キーワードとして会社名及び商品等の名称が入力された場合、当該商品等の公式サイトのメタタグ又はタイトルタグをスクレイピングすることが高い正確性を与えるものと考えられるところ、必ずしも1つ目に表示されるものではなく、同一ドメインのウェブサイトを対象としても本発明の精神から逸脱するものではない。
In the above description, the
また、検索結果から「amazon.com(登録商標)」などのECサイトを除外して対象とするウェブサイトを決定することが好ましい。こうしたECサイトが検索結果の上位に表示されることがあるからである。同様に「wikipedia(登録商標).org」などの事典サイト又は辞書サイトについても、除外することが好ましい。また、求人サイトについても検索結果の上位に表示されることがあり、除外することが好ましい。 In addition, it is preferable to determine target websites by excluding EC sites such as "amazon.com (registered trademark)" from the search results. This is because such EC sites may be displayed at the top of search results. Similarly, encyclopedia sites or dictionary sites such as "wikipedia (registered trademark).org" are preferably excluded. In addition, it is preferable to exclude job search sites as they may be displayed at the top of the search results.
また、「××のみに基づいて」、「××のみに応じて」、「××のみの場合」というように「のみ」との記載がなければ、本明細書においては、付加的な情報も考慮し得ることが想定されていることに留意されたい。また、一例として、「aの場合にbする」という記載は、明示した場合を除き、「aの場合に常にbする」ことを必ずしも意味しないことに留意されたい。 In addition, unless there is a description of "only" such as "based on XX only", "only in response to XX", or "in the case of XX only", in this specification, additional information Note that it is assumed that . Also, as an example, it should be noted that the statement "when a, do b" does not necessarily mean "when a, do b", unless explicitly stated otherwise.
また、念のため、なんらかの方法、プログラム、端末、装置、サーバ又はシステム(以下「方法等」)において、本明細書で記述された動作と異なる動作を行う側面があるとしても、本発明の各態様は、本明細書で記述された動作のいずれかと同一の動作を対象とするものであり、本明細書で記述された動作と異なる動作が存在することは、当該方法等を本発明の各態様の範囲外とするものではないことを付言する。 Also, just in case, any method, program, terminal, device, server, or system (hereinafter "method, etc."), even if there is an aspect that operates differently from the operations described in this specification, each of the present invention Aspects are directed to acts that are identical to any of the acts described herein, and that there are acts that are different from those described herein, the methods, etc. It should be added that it is not out of the scope of the embodiments.
文字列取得の詳細
図3に、出願人が提供するサービスである「ハコベル(登録商標)」のサービス名を検索エンジン「グーグル(登録商標)」で検索し、広告を除外して1つ目に表示されたウェブサイトである当該サービスの公式ウェブサイトのソースコードの一部を示す。
Get string details
Figure 3 shows the first website displayed after excluding advertisements after searching for the service name of "Hacobel (registered trademark)", which is a service provided by the applicant, using the search engine "Google (registered trademark)". A part of the source code of the official website of the service is shown.
タイトルタグから文字列を取得する場合には、タイトルタグのcontent属性の記載に対して形態素解析を行い、名詞に該当する1又は複数の文字列を抽出することができる。図3の例では、「物流」「シェリング」「プラットフォーム」などの文字列を取得することができる。このことは、descriptionメタタグ、OGPのdescriptionタグなどについても同様である。keywordsメタタグについても同様に形態素解析による文字列の取得を行ってもよいが、content属性の記載がカンマで区切られていることから、カンマで分割して1又は複数の文字列を取得するかたちの解析をしてもよい。 When a character string is obtained from the title tag, morphological analysis can be performed on the description of the content attribute of the title tag to extract one or more character strings corresponding to nouns. In the example of FIG. 3, character strings such as "distribution", "schelling", and "platform" can be acquired. This also applies to description meta tags, OGP description tags, and the like. The keywords meta tag may also be obtained by morphological analysis in the same way. You can do the analysis.
100 装置
101 通信部
102 処理部
103 記憶部
110 データベース
120 検索エンジンサーバ
100
Claims (8)
コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、
前記コンピュータが、読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、
前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、
前記コンピュータが、前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データに関連づけて検索可能に記憶するステップと
を含むことを特徴とする方法。 A method for generating data for extracting TVCMs by other companies from one or more current or past TVCMs,
a step in which a computer reads each broadcast data of the current or past one or more TV commercials;
a step in which the computer inputs at least one of the company name and product name, service name, or brand name included in the read broadcast data as a keyword into a search engine;
A step in which the computer acquires one or more character strings described in any meta tag or title tag of a website displayed by excluding results displayed as advertisements in the search engine from search results;
and a step in which the computer stores at least part of the one or more character strings, at least part of which does not include the keyword, in a searchable manner in association with the broadcast data. Method.
前記コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、
前記コンピュータが、読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、
前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、
前記コンピュータが、前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データに関連づけて検索可能に記憶するステップと
を含むことを特徴とするプログラム。 A program for causing a computer to execute a data generation method for extracting TVCMs by other companies from one or more current or past TVCMs, wherein the generation method comprises:
a step of the computer reading each broadcast data of the current or past one or more TV commercials;
a step in which the computer inputs at least one of the company name and product name, service name, or brand name included in the read broadcast data as a keyword into a search engine;
A step in which the computer acquires one or more character strings described in any meta tag or title tag of a website displayed by excluding results displayed as advertisements in the search engine from search results;
and a step in which the computer stores at least part of the one or more character strings, at least part of which does not include the keyword, in a searchable manner in association with the broadcast data. program.
前記現在又は過去の1又は複数のTVCMの各放映データを読み出し、
読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力して、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得し、
前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データに関連づけて検索可能に記憶することを特徴とする生成装置。 A data generation device for extracting TVCMs by other companies from one or more current or past TVCMs,
reading each broadcast data of the current or past one or more TVCM;
At least one of the company name and product name, service name, or brand name included in the read broadcast data is entered as a keyword into a search engine, and results displayed as advertisements in the search engine are excluded from the search results. Acquire one or more character strings described in any meta tag or title tag of the displayed website,
A generation device characterized by storing at least part of the one or more character strings, at least part of which does not include the keyword, in a searchable manner in association with the on-air data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019141406A JP7170959B2 (en) | 2019-07-31 | 2019-07-31 | DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019141406A JP7170959B2 (en) | 2019-07-31 | 2019-07-31 | DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021026306A JP2021026306A (en) | 2021-02-22 |
JP2021026306A5 JP2021026306A5 (en) | 2021-09-09 |
JP7170959B2 true JP7170959B2 (en) | 2022-11-15 |
Family
ID=74664689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019141406A Active JP7170959B2 (en) | 2019-07-31 | 2019-07-31 | DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7170959B2 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001297106A (en) | 2000-04-13 | 2001-10-26 | Sony Corp | Method for preparing data base |
JP2007058853A (en) | 2005-08-05 | 2007-03-08 | Cross Media Co Inc | Method and system for allocating advertising budget to media in online advertising |
JP2014007659A (en) | 2012-06-26 | 2014-01-16 | Toshiba Corp | Information output device, information output method, and information output program |
US20170318329A1 (en) | 2015-08-25 | 2017-11-02 | Tencent Technology (Shenzhen) Company Limited | Information processing method, apparatus, and device |
JP2018147437A (en) | 2017-03-09 | 2018-09-20 | ヤフー株式会社 | Data collection system, data collection method, and program |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4320508B2 (en) * | 2000-11-28 | 2009-08-26 | ソニー株式会社 | Recording / reproducing apparatus and method, and recording medium |
JP6104053B2 (en) * | 2013-01-31 | 2017-03-29 | アルパイン株式会社 | Internet search apparatus and internet search method |
JP2016143098A (en) * | 2015-01-30 | 2016-08-08 | キヤノンマーケティングジャパン株式会社 | Content providing system, control method, and program |
-
2019
- 2019-07-31 JP JP2019141406A patent/JP7170959B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001297106A (en) | 2000-04-13 | 2001-10-26 | Sony Corp | Method for preparing data base |
JP2007058853A (en) | 2005-08-05 | 2007-03-08 | Cross Media Co Inc | Method and system for allocating advertising budget to media in online advertising |
JP2014007659A (en) | 2012-06-26 | 2014-01-16 | Toshiba Corp | Information output device, information output method, and information output program |
US20170318329A1 (en) | 2015-08-25 | 2017-11-02 | Tencent Technology (Shenzhen) Company Limited | Information processing method, apparatus, and device |
JP2018147437A (en) | 2017-03-09 | 2018-09-20 | ヤフー株式会社 | Data collection system, data collection method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP2021026306A (en) | 2021-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8195634B2 (en) | Domain-aware snippets for search results | |
US7849081B1 (en) | Document analyzer and metadata generation and use | |
AU2010226779C1 (en) | Online ad placement based on user metrics for hosted media | |
JP6343035B2 (en) | Generate ad campaign | |
CN105900117B (en) | Method and system for collecting, normalizing, matching and enriching data | |
US11748408B2 (en) | Analyzing user searches of verbal media content | |
US20140316890A1 (en) | Entity Bidding | |
WO2015196910A1 (en) | Search engine-based summary information extraction method, apparatus and search engine | |
US20080294625A1 (en) | Item recommendation system | |
JP5296045B2 (en) | Advertisement information providing device | |
US10475068B2 (en) | Systems and methods of generating digital campaigns | |
US20110307483A1 (en) | Entity detection and extraction for entity cards | |
US20110307482A1 (en) | Search result driven query intent identification | |
CN109191158B (en) | Processing method and processing equipment for user portrait label data | |
TW201207649A (en) | Search engine optimization at scale | |
JP2020504879A (en) | System and method for collecting data related to malicious content in a networked environment | |
US20170322984A1 (en) | Multi-dimensional search | |
US20170228378A1 (en) | Extracting topics from customer review search queries | |
JP2011107826A (en) | Action-information extracting system and extraction method | |
US20090125381A1 (en) | Methods for identifying documents relating to a market | |
KR100964090B1 (en) | Method and system for recommending advertisement keyword by analyzing log | |
JP2007233584A (en) | Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program | |
US20150278828A1 (en) | Market analysis for an online business | |
JP7170959B2 (en) | DATA GENERATION DEVICE, GENERATION METHOD AND PROGRAM THEREFROM FOR EXTRACTING TVCM | |
US8131752B2 (en) | Breaking documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210727 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210727 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210727 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220930 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20221013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20221013 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7170959 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |