JP6960553B2 - Brand dictionary creation device, product evaluation device, brand dictionary creation method and program - Google Patents

Brand dictionary creation device, product evaluation device, brand dictionary creation method and program Download PDF

Info

Publication number
JP6960553B2
JP6960553B2 JP2021093596A JP2021093596A JP6960553B2 JP 6960553 B2 JP6960553 B2 JP 6960553B2 JP 2021093596 A JP2021093596 A JP 2021093596A JP 2021093596 A JP2021093596 A JP 2021093596A JP 6960553 B2 JP6960553 B2 JP 6960553B2
Authority
JP
Japan
Prior art keywords
brand
product
query
target text
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021093596A
Other languages
Japanese (ja)
Other versions
JP2021176085A (en
Inventor
健治 長利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021093596A priority Critical patent/JP6960553B2/en
Publication of JP2021176085A publication Critical patent/JP2021176085A/en
Application granted granted Critical
Publication of JP6960553B2 publication Critical patent/JP6960553B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムに関する。 The present invention relates to a brand dictionary creation device, a product evaluation device, a brand dictionary creation method, and a program.

所定の検索クエリと、コンテンツのカテゴリ毎の所定の検索クエリに対する対応度合いとを関連付けた情報が格納されるクエリカテゴリ辞書と、ユーザ端末から送信された過去の検索クエリを示す検索クエリ履歴を取得する検索履歴取得手段と、検索クエリ履歴を用いて、クエリカテゴリ辞書から、コンテンツのカテゴリ毎の過去の検索クエリに対する対応度合いを関連付けた情報を抽出し、抽出された情報に基づき、コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴量を算出するユーザ特徴量算出手段と、ユーザ端末から送信された検索要求時の検索クエリに対応すると共にカテゴリに対応付けられたコンテンツを示す情報を含むコンテンツの検索結果を取得する検索結果取得手段と、ユーザ特徴量に基づき、コンテンツの検索結果を出力する出力手段とを備えるコンテンツ検索結果提供システムが知られている(特許文献1参照)。 Acquires a query category dictionary that stores information that associates a predetermined search query with the degree of correspondence to a predetermined search query for each content category, and a search query history that indicates past search queries sent from the user terminal. Using the search history acquisition method and the search query history, information related to the degree of correspondence to the past search query for each content category is extracted from the query category dictionary, and based on the extracted information, the user for the content category. Includes a user feature amount calculation means that calculates a user feature amount that indicates the degree of correspondence of each preference, and information that indicates content that corresponds to a search query at the time of a search request sent from a user terminal and is associated with a category. A content search result providing system including a search result acquisition means for acquiring a content search result and an output means for outputting a content search result based on a user feature amount is known (see Patent Document 1).

特開2016−110260号公報Japanese Unexamined Patent Publication No. 2016-11260

ショッピングサイトなどで商品やサービス(以下、商品等)を検索するためにクエリが入力されることがある。検索ヒット数は、ショッピングサイトにおける商品等のランキングに影響する場合があるため、検索ヒット数を高くする目的で、タイトルや商品紹介欄に、その商品とは無関係な複数のブランド名を掲載することが行われている。このような行為は、過剰なSEO(Search Engine Optimization)あるいはブラックハットSEOと称される。過剰なSEOは、商品等の適正なランキング形成を妨げるものであるため、過剰なSEOの目的で販売画面が構成された商品等を発見したいというニーズが存在する。過剰なSEOが行われている商品等を発見するためには、ブランド名を集めた適切な辞書(ブランド辞書)を作成しておくことが望ましい。しかしながら、従来の技術では、精度が不十分であり、適切なブランド辞書を作成することができない場合があった。 A query may be entered to search for a product or service (hereinafter referred to as a product, etc.) on a shopping site or the like. Since the number of search hits may affect the ranking of products etc. on the shopping site, in order to increase the number of search hits, list multiple brand names unrelated to the product in the title and product introduction column. Is being done. Such an act is called excessive SEO (Search Engine Optimization) or black hat SEO. Since excessive SEO hinders the formation of an appropriate ranking of products and the like, there is a need to discover products and the like whose sales screen is configured for the purpose of excessive SEO. In order to discover products with excessive SEO, it is desirable to create an appropriate dictionary (brand dictionary) that collects brand names. However, the conventional technique has insufficient accuracy, and there are cases where an appropriate brand dictionary cannot be created.

本発明は、このような事情を考慮してなされたものであり、より適切なブランド辞書を作成することができるブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and provides a brand dictionary creation device, a product evaluation device, a brand dictionary creation method and a program capable of creating a more appropriate brand dictionary. It is one of the purposes.

本発明の一態様は、ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部と、前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する判定部と、を備えるブランド辞書作成装置である。 One aspect of the present invention includes a query acquisition unit that acquires a query input to a sales screen for selling a product or service (hereinafter, product, etc.) via a network, and the acquired query. It is a brand dictionary creating device including a determination unit for determining whether or not to include the target text in the brand dictionary based on the number of occurrences of the target text for each position in the query for each target text.

本発明の一態様によれば、より適切なブランド辞書を作成することができる。 According to one aspect of the present invention, a more suitable brand dictionary can be created.

商品等評価装置を利用した販売仲介サーバ200と、ブランド辞書作成装置300との構成および使用環境の一例を示す図である。It is a figure which shows an example of the configuration and use environment of the sales intermediary server 200 using the product evaluation apparatus, and the brand dictionary creation apparatus 300. 商品等の販売画面IM1の一例を示す図である。It is a figure which shows an example of the sale screen IM1 of a product or the like. 検索結果表示画面IM2の一例を示す図である。It is a figure which shows an example of the search result display screen IM2. 商品等表示画面IM3の一例を示す図である。It is a figure which shows an example of the product display screen IM3. 過剰なSEOがなされた商品等表示画面IM4の一例である。This is an example of the product display screen IM4 in which excessive SEO is performed. 商品等データ220の内容の一例を示す図である。It is a figure which shows an example of the content of the product data 220. ランキングデータ222の内容の一例を示す図である。It is a figure which shows an example of the content of ranking data 222. ブランド辞書240の内容の一例を示す図である。It is a figure which shows an example of the contents of a brand dictionary 240. 販売仲介サーバ200の対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234により実行される処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the process executed by the target word acquisition unit 230, the brand name extraction unit 232, and the attention target product etc. specific unit 234 of the sales intermediary server 200. 出現数カウント部312による処理の内容を説明するための図である。It is a figure for demonstrating the content of processing by the appearance number counting part 312. ブランド辞書作成装置300により実行される処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of processing executed by the brand dictionary creation apparatus 300. S212の処理の一例を示すフローチャートである。It is a flowchart which shows an example of the process of S212.

以下、図面を参照し、本発明のブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムの実施形態について説明する。 Hereinafter, with reference to the drawings, the brand dictionary creation device, the product evaluation device, the brand dictionary creation method, and the embodiment of the program of the present invention will be described.

[全体構成]
図1は、商品等評価装置を利用した販売仲介サーバ200と、ブランド辞書作成装置300との構成および使用環境の一例を示す図である。販売仲介サーバ200は、端末装置100によってアクセスされ、商品またはサービス(以下、商品等)の販売を仲介するための装置であり、いわゆるショッピングサイトやオークションサイトを提供する装置である。ここで、「サイト」とは、ブラウザによって再生されるウェブサイトの他、アプリケーションプログラムによって表示されるアプリ画面の元データを含むものとする。販売仲介サーバ200の運営者には、商品等の出品者により出品される商品等に関する商品等データが提供される。商品等データは、商品等のタイトルや詳細説明などを含む。
[overall structure]
FIG. 1 is a diagram showing an example of a configuration and a usage environment of a sales brokerage server 200 using a product evaluation device and a brand dictionary creating device 300. The sales brokerage server 200 is a device that is accessed by the terminal device 100 to mediate the sale of a product or service (hereinafter, product or the like), and is a device that provides a so-called shopping site or auction site. Here, the "site" includes the original data of the application screen displayed by the application program in addition to the website played by the browser. The operator of the sales brokerage server 200 is provided with product data related to the product or the like exhibited by the seller of the product or the like. Product data includes titles and detailed explanations of products.

端末装置100では、ブラウザやアプリケーションプログラムなどのUA(User Agent)110が起動する。UA110は、販売仲介サーバ200から提供された販売画面を表示すると共に、端末装置100の利用者によってなされた入力操作に応じたリクエストを販売仲介サーバ200に送信する。販売仲介サーバ200は、UA110からのリクエストに応じて商品等の販売を決定する。 In the terminal device 100, a UA (User Agent) 110 such as a browser or an application program is activated. The UA 110 displays the sales screen provided by the sales intermediary server 200, and transmits a request corresponding to the input operation made by the user of the terminal device 100 to the sales intermediary server 200. The sales brokerage server 200 decides to sell the product or the like in response to the request from the UA 110.

また、販売仲介サーバ200には、ブランド辞書作成装置300により作成されたブランド辞書が提供される。ブランド辞書とは、ある商品等の紹介画面について原則的に一つのみ掲載される筈のブランド名であって、ブランドの名称である確からしさが高い単語を集めた電子的な辞書である。図では、販売仲介サーバ200とブランド辞書作成装置300が別体であるように示しているが、これらは統合されて一つのハードウェアにより実現されてもよい。 Further, the sales brokerage server 200 is provided with a brand dictionary created by the brand dictionary creation device 300. A brand dictionary is a brand name that should be posted on the introduction screen of a certain product in principle, and is an electronic dictionary that collects highly certain words that are the names of the brands. In the figure, the sales brokerage server 200 and the brand dictionary creation device 300 are shown as separate bodies, but these may be integrated and realized by one hardware.

端末装置100、販売仲介サーバ200、およびブランド辞書作成装置300は、ネットワークNWを介して互いに通信する。これらの構成要素は、ネットワークNWに接続するためのネットワークカード、無線通信モジュールなどを備える。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、無線基地局、プロバイダ端末、専用回線などを含む。 The terminal device 100, the sales brokerage server 200, and the brand dictionary creation device 300 communicate with each other via the network NW. These components include a network card for connecting to the network NW, a wireless communication module, and the like. The network NW includes, for example, the Internet, a WAN (Wide Area Network), a LAN (Local Area Network), a wireless base station, a provider terminal, a dedicated line, and the like.

[販売仲介サーバ]
販売仲介サーバ200は、例えば、販売画面提供部210と、ランキング処理部212と、ログ収集部214と、対象語句取得部230と、ブランド名抽出部232と、注意対象商品等特定部234とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
[Sales brokerage server]
The sales brokerage server 200 includes, for example, a sales screen providing unit 210, a ranking processing unit 212, a log collecting unit 214, a target word acquisition unit 230, a brand name extraction unit 232, and a product identification unit 234 to be noted. Be prepared. These components are realized by, for example, a processor such as a CPU (Central Processing Unit) executing a program (software). In addition, some or all of these components are realized by hardware such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), and GPU (Graphics Processing Unit). It may be done, or it may be realized by the collaboration of software and hardware.

また、販売仲介サーバ200は、RAM(Random Access Memory)やHDD(Hard Disk Drive)、フラッシュメモリ、ROM(Read Only Memory)などの記憶装置に、商品等データ220、ランキングデータ222、ログ情報224、ブランド辞書240などのデータを格納している。なお、これらのデータは、販売仲介サーバ200がネットワークNWを介してアクセス可能なNAS(Network Attached Storage)などに格納されてもよい。 Further, the sales mediation server 200 is stored in a storage device such as a RAM (Random Access Memory), an HDD (Hard Disk Drive), a flash memory, and a ROM (Read Only Memory), and includes product data 220, ranking data 222, log information 224, and the like. It stores data such as the brand dictionary 240. These data may be stored in NAS (Network Attached Storage) or the like that can be accessed by the sales brokerage server 200 via the network NW.

販売画面提供部210は、商品等データ220およびランキングデータ222を参照し、商品等の販売画面を端末装置100に提供する。図2は、商品等の販売画面IM1の一例を示す図である。販売画面IM1には、商品等を検索するためのクエリを入力するためのクエリ入力欄A1、および、入力されたクエリで検索を実行させるための検索ボタンB1が設けられている。クエリ入力欄A1にクエリが入力され、検索ボタンB1が操作されると、検索結果表示画面IM2に遷移する。なお、クエリは一語だけのクエリもあるし、複数の子クエリがスペースなどで結合された複数語を含むクエリもある。 The sales screen providing unit 210 refers to the product data 220 and the ranking data 222, and provides the product sales screen to the terminal device 100. FIG. 2 is a diagram showing an example of the sales screen IM1 of a product or the like. The sales screen IM1 is provided with a query input field A1 for inputting a query for searching for a product or the like, and a search button B1 for executing a search with the input query. When a query is input to the query input field A1 and the search button B1 is operated, the screen transitions to the search result display screen IM2. Some queries are only one word, and some queries include multiple words in which multiple child queries are combined with spaces.

図3は、検索結果表示画面IM2の一例を示す図である。検索結果表示画面IM2には、検索結果表示欄A2が含まれる。検索結果表示欄A2には、ランキング処理部212によって決定されたクエリ毎のランキング順に、商品等の画像や説明が並べて表示される。検索結果表示画面IM2において一つの商品等の画像や説明が操作されると、商品等表示画面IM3に遷移する。 FIG. 3 is a diagram showing an example of the search result display screen IM2. The search result display screen IM2 includes a search result display field A2. In the search result display field A2, images and explanations of products and the like are displayed side by side in the ranking order for each query determined by the ranking processing unit 212. When an image or description of one product or the like is operated on the search result display screen IM2, the screen transitions to the product or the like display screen IM3.

図4は、商品等表示画面IM3の一例を示す図である。商品等表示画面IM3には、商品等画像表示欄A3−1、タイトル欄A3−2、商品等説明欄A3−3などが含まれる。タイトル欄A3−2や商品等説明欄A3−3には、製造元、商品の素材、使用、その他の内容が掲載される。このような内容が通常の商品等表示画面IM3であるが、過剰なSEOがなされた商品等表示画面は、異なる態様を示すものとなる。 FIG. 4 is a diagram showing an example of a product or the like display screen IM3. The product or the like display screen IM3 includes a product or the like image display column A3-1, a title column A3-2, a product or the like explanation column A3-3, and the like. In the title column A3-2 and the product description column A3-3, the manufacturer, the material of the product, the use, and other contents are posted. Such a content is a normal product or the like display screen IM3, but the product or the like display screen in which excessive SEO is performed shows a different mode.

図5は、過剰なSEOがなされた商品等表示画面IM4の一例である。商品等表示画面IM4では、製造元が「○○社」であるにも関わらず、商品等説明欄A4−3に、無関係なA社、B社、C社(いずれも○○社と同じカテゴリのブランド名)が掲載されている。この結果、クエリとして「A社」、「B社」、または「C社」のいずれかを指定して検索が行われた結果、それらの商品等でないにも関わらず、この商品等が検索にヒットする場合がある。このような商品等の掲載を回避あるいは抑制するために、販売仲介サーバ200は、ブランド辞書240を用いた注意対象商品等の特定処理を実行する。これについては、後述する。 FIG. 5 is an example of the product display screen IM4 in which excessive SEO is performed. On the product display screen IM4, although the manufacturer is "○○ company", the product explanation column A4-3 shows unrelated companies A, B, and C (all of the same category as company XX). Brand name) is posted. As a result, as a result of performing a search by designating any of "Company A", "Company B", or "Company C" as a query, this product, etc. is searched even though it is not such a product, etc. May hit. In order to avoid or suppress the listing of such products, the sales brokerage server 200 executes a specific process of the product or the like to be noted using the brand dictionary 240. This will be described later.

話を戻し、販売画面提供部210は、図2〜5に例示した各種表示画面を、商品等データ220に基づいて生成する。図6は、商品等データ220の内容の一例を示す図である。商品等データ220は、商品等の識別情報である商品等IDに対して、商品カテゴリ、商品等画像、タイトル、商品等説明、価格(オークションであれば基準価格または入札価格)、発送条件、その他のデータが対応付けられたものである。 Returning to the story, the sales screen providing unit 210 generates various display screens illustrated in FIGS. 2 to 5 based on the product data 220. FIG. 6 is a diagram showing an example of the contents of the product or the like data 220. The product data 220 includes a product category, a product image, a title, a product description, a price (standard price or bid price in the case of an auction), shipping conditions, and the like for the product ID, which is identification information of the product. The data of is associated.

ランキング処理部212は、過去に入力されたクエリのそれぞれに対して、種々の基準によりランキング処理を行い、ランキングデータ222を生成する。図7は、ランキングデータ222の内容の一例を示す図である。ランキングデータ222は、例えば、クエリに対して、商品等IDのランキングが対応付けられたものである。ランキングデータ222は、例えば、ログ収集部214により収集されたログ情報に基づいて、クリック数が多い順、購入数が多い順、CVR(Conversion Ratio)が高い順、お気に入り登録数が多い順、または価格が安い順、或いはこれらを組み合わせたスコア順に、高いランキングとする。また、ランキング処理は、ランダムに商品等をランキングに含めることを含んでもよい。 The ranking processing unit 212 performs ranking processing on each of the queries input in the past according to various criteria, and generates ranking data 222. FIG. 7 is a diagram showing an example of the contents of the ranking data 222. The ranking data 222 is, for example, associated with a query by ranking of product IDs. The ranking data 222 is, for example, based on the log information collected by the log collection unit 214, in the order of the number of clicks, the order of the number of purchases, the order of high CVR (Conversion Ratio), the order of the number of favorites registered, or The ranking is high in ascending order of price or in order of score combining these. In addition, the ranking process may include randomly including products and the like in the ranking.

ログ収集部214は、端末装置100において入力されたクエリを含む情報であって、端末装置100からリクエストのあったページを時系列で並べた行動履歴などの情報を、ログ情報224として蓄積する。 The log collecting unit 214 stores information including a query input in the terminal device 100, such as an action history in which pages requested by the terminal device 100 are arranged in chronological order, as log information 224.

対象語句取得部230は、商品等データ220に含まれるデータのうち、商品等IDで示される商品等毎の対象語句を取得する。対象語句は任意に定めてよいが、例えば、タイトルおよび商品等説明に含まれる語句が対象語句に設定される。 The target word / phrase acquisition unit 230 acquires the target word / phrase for each product or the like indicated by the product or the like ID among the data included in the product or the like data 220. The target phrase may be arbitrarily defined, but for example, the phrase included in the title and the description of the product or the like is set as the target phrase.

ブランド名抽出部232は、ブランド辞書240を参照し、対象語句取得部230により取得された対象語句の中に含まれるブランド名を抽出する。より具体的に、ブランド名抽出部232は、対象語句が取得された元の商品等のカテゴリに合致するブランド名を抽出する。図8は、ブランド辞書240の内容の一例を示す図である。ブランド辞書240は、例えば、商品等のカテゴリ毎にブランド名を列挙したものである。 The brand name extraction unit 232 refers to the brand dictionary 240 and extracts the brand name included in the target word / phrase acquired by the target word / phrase acquisition unit 230. More specifically, the brand name extraction unit 232 extracts a brand name that matches the category of the original product or the like from which the target phrase was acquired. FIG. 8 is a diagram showing an example of the contents of the brand dictionary 240. The brand dictionary 240 is, for example, a list of brand names for each category such as a product.

ブランド名抽出部232は、例えば、既に行った検索結果を活かすため、AhoCorasick法などの共通接頭辞検索(Common Prefix Search)を行うことで、辞書中からパターンマッチングを行うオートマトンを構築し、入力テキストに対して線形な計算時間を実現する。 The brand name extraction unit 232 constructs an automaton that performs pattern matching from the dictionary by performing a common prefix search (Common Prefix Search) such as the AhoCorasick method in order to utilize the search results that have already been performed, and inputs text. Achieve a linear calculation time for.

注意対象商品等特定部234は、ブランド名抽出部232により抽出されたブランド名の数に基づいて、注意対象商品等を特定する。例えば、注意対象商品等特定部234は、所定数k以上のブランド名が対象語句に含まれている商品等を、注意対象商品等として特定する。例えばk=2である。 The attention target product etc. specifying unit 234 specifies the caution target product etc. based on the number of brand names extracted by the brand name extraction unit 232. For example, the attention target product identification unit 234 specifies a product or the like whose target phrase includes a brand name of a predetermined number of k or more as a caution target product or the like. For example, k = 2.

そして、注意対象商品等特定部234は、特定した注意対象商品等について、(1)出品者に対する注意を行うため、表示装置に商品等IDを表示させ、あるいは出品者に対して注意する電子メールを生成して送信する、(2)ランキングデータ222における当該商品等のランキングを下げる、(3)商品等データ220から削除する(出品を取り消す)などの処理を行う。 Then, the attention target product identification unit 234 displays the product ID on the display device or pays attention to the seller in order to (1) pay attention to the seller regarding the specified attention target product or the like. Is generated and transmitted, (2) the ranking of the product or the like in the ranking data 222 is lowered, or (3) the product or the like is deleted from the product or the like data 220 (the listing is canceled).

注意対象商品等特定部234は、ブランド名抽出部232により特定されたブランド名の数に応じて、上記(1)〜(3)の処理を段階的に行ってもよい。例えば、2つのブランド名が対象語句に含まれている商品等について(1)の処理を、3つのブランド名が対象語句に含まれている商品等について(2)の処理を、4つ以上のブランド名が対象語句に含まれている商品等について(3)の処理を行ってもよい。 Attention The target product identification unit 234 may perform the above-mentioned processes (1) to (3) step by step according to the number of brand names specified by the brand name extraction unit 232. For example, processing (1) for products, etc. in which two brand names are included in the target phrase, and processing (2) for products, etc. in which three brand names are included in the target phrase, four or more. The process (3) may be performed for a product or the like whose brand name is included in the target phrase.

また、注意対象商品等特定部234は、出品者毎に、注意対象商品等に該当した商品等の数をカウントし、注意対象商品等に該当した商品等の数に応じて上記(1)〜(3)の処理を段階的に行ってもよい。例えば、注意対象商品等に該当した商品等の数が第1閾値C1以上、第2閾値C2未満の出品者に対して(1)の処理を、注意対象商品等に該当した商品等の数が第2閾値C2以上、第3閾値C3未満の出品者の注意対象商品等に対して(2)の処理を、注意対象商品等に該当した商品等の数が第3閾値C3以上の出品者の注意対象商品等(或いは全ての商品等)に対して(3)の処理を行ってもよい(C1<C2<C3)。 In addition, the caution target product identification unit 234 counts the number of products, etc. that correspond to the caution target products, etc. for each seller, and according to the number of products, etc. that correspond to the caution target products, etc., the above (1) to The process of (3) may be performed step by step. For example, the process of (1) is applied to the seller whose number of products, etc. corresponding to the caution target product, etc. is equal to or more than the first threshold value C1 and less than the second threshold value C2, and the number of products, etc. corresponding to the caution target product, etc. The process of (2) is applied to the seller's attention target products, etc. with the second threshold C2 or more and less than the third threshold C3, and the number of products, etc. corresponding to the caution target products, etc. is the seller with the third threshold C3 or more. Note The process (3) may be performed on the target product or the like (or all the products or the like) (C1 <C2 <C3).

図9は、販売仲介サーバ200の対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234により実行される処理の流れの一例を示すフローチャートである。本フローチャートの処理は、任意のタイミングで開始される。 FIG. 9 is a flowchart showing an example of a processing flow executed by the target word acquisition unit 230, the brand name extraction unit 232, and the attention target product and the like specific unit 234 of the sales brokerage server 200. The processing of this flowchart is started at an arbitrary timing.

まず、対象語句取得部230が、商品等データ220から一つの商品等を選択し(S100)、対象語句を取得する(S102)。次に、ブランド名抽出部232が、S102で取得された対象語句からブランド名を抽出する(S104)。 First, the target word / phrase acquisition unit 230 selects one product or the like from the product or the like data 220 (S100) and acquires the target word or phrase (S102). Next, the brand name extraction unit 232 extracts the brand name from the target words and phrases acquired in S102 (S104).

次に、注意対象商品等特定部234が、S104で抽出されたブランド名が所定数k以上であるか否かを判定する(S106)。S104で抽出されたブランド名が所定数k以上である場合、注意対象商品等特定部234は、S100で選択した商品等を注意対象商品として特定する(S108)。 Next, the product identification unit 234 to be careful determines whether or not the brand name extracted in S104 is a predetermined number k or more (S106). When the brand name extracted in S104 is a predetermined number of k or more, the caution target product or the like specifying unit 234 specifies the product or the like selected in S100 as the caution target product (S108).

次に、対象語句取得部230が、商品等データ220から今回の処理対象である全ての商品等を選択したか否かを判定する(S110)。全ての商品等を選択していない場合はS100に処理が戻され、全ての商品等を選択した場合は本フローチャートの処理が終了する。なお、図9に例示したループ処理は、並列コンピューティングによって同時並行的に実行されてもよい。 Next, the target word / phrase acquisition unit 230 determines whether or not all the products or the like to be processed this time are selected from the product or the like data 220 (S110). If all products and the like are not selected, the process is returned to S100, and if all products and the like are selected, the process of this flowchart ends. The loop processing illustrated in FIG. 9 may be executed in parallel by parallel computing.

このように、販売仲介サーバ200(商品等評価装置)によれば、ネットワークNWを介して販売される商品等の紹介画面に含まれる対象語句を取得する対象語句取得部230と、ブランド名を記述したブランド辞書240を参照し、対象語句の中に含まれるブランド名を抽出するブランド名抽出部232と、ブランド名抽出部232により抽出されたブランド名の数に基づいて、注意対象の商品等を特定する注意対象商品等特定部234と、を備えることにより、注意対象の商品等を、効率よく発見することができる。なお、対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234を合わせたものが「商品等評価装置」の一例である。また、注意対象商品等特定部234は、「監視部」の一例である。 In this way, according to the sales mediation server 200 (product evaluation device), the target word acquisition unit 230 for acquiring the target word included in the introduction screen of the product or the like sold via the network NW and the brand name are described. Based on the number of brand name extraction unit 232 that extracts the brand name included in the target phrase and the brand name extraction unit 232, and the number of brand names extracted by the brand name extraction unit 232, the products to be noted are selected. By providing the identification unit 234 for the product or the like to be specified, the product or the like to be specified can be efficiently found. An example of the "product evaluation device" is a combination of the target word acquisition unit 230, the brand name extraction unit 232, and the attention target product identification unit 234. In addition, the product identification unit 234 to be noted is an example of the “monitoring unit”.

なお、上記の説明では、商品等のカテゴリに応じたブランド辞書240を用いて注意対象商品等を特定するものとしたが、カテゴリを特定せずに全てのブランド辞書240を用いて注意対象商品等を特定してもよい。 In the above explanation, the brand dictionary 240 according to the category of the product or the like is used to specify the product or the like to be noted, but the product or the like to be noted is specified by using all the brand dictionaries 240 without specifying the category. May be specified.

[ブランド辞書作成装置]
以下、ブランド辞書240を作成するブランド辞書作成装置300について説明する。ブランド辞書作成装置300は、例えば、クエリ取得部310と、出現数カウント部312と、判定部314と、作成部316とを備える。これらの構成要素は、例えば、CPUなどのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
[Brand dictionary creation device]
Hereinafter, the brand dictionary creating device 300 for creating the brand dictionary 240 will be described. The brand dictionary creation device 300 includes, for example, a query acquisition unit 310, an appearance number counting unit 312, a determination unit 314, and a creation unit 316. These components are realized by, for example, a processor such as a CPU executing a program (software). In addition, some or all of these components may be realized by hardware such as LSI, ASIC, FPGA, GPU, or may be realized by collaboration between software and hardware.

また、ブランド辞書作成装置300は、RAMやHDD、フラッシュメモリ、ROMなどの記憶装置に、クエリログ320、作成中のブランド辞書322などのデータを格納している。なお、これらのデータは、ブランド辞書作成装置300がネットワークNWを介してアクセス可能なNASなどに格納されてもよい。 Further, the brand dictionary creating device 300 stores data such as a query log 320 and a brand dictionary 322 being created in a storage device such as a RAM, an HDD, a flash memory, or a ROM. These data may be stored in NAS or the like accessible by the brand dictionary creation device 300 via the network NW.

クエリ取得部310は、販売仲介サーバ200が蓄積するログ情報224のうち、クエリに関する情報を取得し、クエリログ320として記憶装置に格納させる。クエリログ320に含まれる各クエリには、そのクエリを用いて検索した結果として表示された商品等およびそのカテゴリが付随している。なお、商品等のカテゴリは階層的に付与されている場合があるが、ここではブランド辞書のカテゴリに対応する階層のカテゴリに着目して説明する。 The query acquisition unit 310 acquires information about the query from the log information 224 accumulated by the sales brokerage server 200, and stores it in the storage device as the query log 320. Each query included in the query log 320 is accompanied by a product or the like displayed as a result of searching using the query and its category. The categories such as products may be assigned hierarchically, but here, the categories of the hierarchy corresponding to the categories of the brand dictionary will be described.

出現数カウント部312は、クエリログ320に含まれる各クエリに基づいて、クエリに含まれるテキストであり、ブランド辞書に含めるか否かを判定される判定対象のテキスト(以下、対象テキスト)の出現回数をカウントする。対象テキストは、例えば、形態素解析などの所定のロジックにより、意味的にひとまとまりであると解釈されるものである。また、対象テキストは、スペース等で区切られた子クエリのそれぞれであってもよく、子クエリを複数結合したものであってもよい。出現数カウント部312は、カテゴリによっては、対象テキストを3文字以上のカタカナに限定するなど、対象テキストを構成する要素に限定を追加してもよい。 The appearance count unit 312 is the text included in the query based on each query included in the query log 320, and the number of occurrences of the judgment target text (hereinafter referred to as the target text) for which it is determined whether or not to include it in the brand dictionary. To count. The target text is interpreted as a semantic unit by a predetermined logic such as morphological analysis. Further, the target text may be each of the child queries separated by a space or the like, or may be a combination of a plurality of child queries. Depending on the category, the appearance number counting unit 312 may add a limitation to the elements constituting the target text, such as limiting the target text to katakana of three or more characters.

まず、出現数カウント部312は、あるカテゴリ(以下、対象カテゴリ)のブランド辞書を作成する際に、クエリログ320から対象カテゴリに対応しているクエリ(以下、対象クエリ)を抽出する。クエリログ320には、クエリと、クエリの検索結果画面においてクリックされた商品等を示す情報とが、互いに対応付けられて記憶される(クリックログ)。出現数カウント部312は、例えば、クリックログにおいて、対象カテゴリに対応する商品等が最も多く対応付けられているクエリを、対象クエリとして抽出する。例えば、クエリログ320に含まれるクエリAに対応付けられる商品等のカテゴリが、ファッション40%、食品20%、アウトドア10%、美容10、その他20%である場合、出現数カウント部312は、最も比率の高い対象カテゴリである「ファッション」のブランド辞書の作成に用いる対象クエリとして、クエリAを抽出する。 First, the appearance number counting unit 312 extracts a query (hereinafter, target query) corresponding to the target category from the query log 320 when creating a brand dictionary of a certain category (hereinafter, target category). In the query log 320, the query and the information indicating the product or the like clicked on the search result screen of the query are stored in association with each other (click log). The appearance number counting unit 312 extracts, for example, the query to which the product or the like corresponding to the target category is most associated with the click log as the target query. For example, when the categories of products and the like associated with query A included in the query log 320 are fashion 40%, food 20%, outdoor 10%, beauty 10, and others 20%, the appearance number counting unit 312 has the highest ratio. Query A is extracted as a target query used to create a brand dictionary of "fashion", which is a high target category.

なお、出現数カウント部312は、クエリに対応付けられる商品等のカテゴリのうち、最も比率が高いカテゴリのブランド辞書を作成する際に、当該クエリを用いてもよい。また、出現数カウント部312は、クエリに対応付けられる商品等のカテゴリのうち、高い比率のカテゴリが複数存在する場合、当該クエリが多様な意味のクエリとして用いられている可能性が高い(つまり、意味の特定がしづらいクエリである)と推定し、複数の対象カテゴリに関するブランド辞書について当該クエリを処理対象としてもよいし、そもそも、そのような傾向を示すクエリを処理対象から除外してもよい。 The appearance number counting unit 312 may use the query when creating a brand dictionary of the category having the highest ratio among the categories such as products associated with the query. Further, when there are a plurality of categories having a high ratio among the categories such as products associated with the query, the appearance number counting unit 312 has a high possibility that the query is used as a query having various meanings (that is,). , It is a query whose meaning is difficult to specify), and the query may be processed for brand dictionaries related to multiple target categories, or queries showing such a tendency may be excluded from the processing target in the first place. good.

次に、出現数カウント部312は、抽出された対象クエリを構成する対象テキストの出現回数をカウントする。図10は、出現数カウント部312による処理の内容を説明するための図である。出現数カウント部312は、対象クエリに含まれる各対象テキストについて、単独でクエリとして入力された回数をs0、複数の対象テキストを含むクエリの中で、一番目に出現した回数をs1、二番目に出現した回数をs2、三番目以降に出現した回数をs3としてカウントする。 Next, the appearance number counting unit 312 counts the number of occurrences of the target text constituting the extracted target query. FIG. 10 is a diagram for explaining the content of processing by the appearance number counting unit 312. For each target text included in the target query, the number of occurrences counting unit 312 is s0 for the number of times it is input as a single query, s1 for the number of times it appears first among the queries including a plurality of target texts, and the second. The number of appearances in is counted as s2, and the number of appearances after the third is counted as s3.

また、出現数カウント部312は、対象クエリに含まれる各対象テキストが、データ収集期間に出現した回数(つまり、s0〜s3の総和)である総出現数ntをカウントする。データ収集期間とは、ブランド辞書作成装置300が一回の処理の対象とする期間(対象期間)である。ブランド辞書作成装置300は、その期間において収集されたクエリログ320に基づいて、ブランド辞書の作成処理を行う。データ収集期間は、例えば、1年程度の期間である。 Further, the appearance number counting unit 312 counts the total number of appearances nt, which is the number of times each target text included in the target query appears in the data collection period (that is, the sum of s0 to s3). The data collection period is a period (target period) that the brand dictionary creation device 300 targets for one process. The brand dictionary creation device 300 performs a brand dictionary creation process based on the query log 320 collected during that period. The data collection period is, for example, a period of about one year.

また、出現数カウント部312は、対象クエリに含まれる各対象テキストが、データ収集期間において出現した(観測された)日数である出現日数ctを併せてカウントする。図10の例では、対象テキスト「aaa」に関して、一番目に1回出現し、単独で1回出現しているため、s0とs1にそれぞれ1が与えられている。 In addition, the appearance number counting unit 312 also counts the number of appearance days ct, which is the number of days that each target text included in the target query has appeared (observed) in the data collection period. In the example of FIG. 10, with respect to the target text “aaa”, since it appears once at the first time and appears once alone, 1 is given to s0 and s1 respectively.

判定部314は、出現数カウント部312によって、データ収集期間を対象として上記各種指標がカウントされた対象クエリについて、以下の条件のうち一部または全部に基づいて、ブランド辞書に含めるか否かを判定する。 The determination unit 314 determines whether or not the target query for which the above various indicators are counted for the data collection period by the appearance number counting unit 312 is included in the brand dictionary based on some or all of the following conditions. judge.

(条件1)
判定部314は、条件式(1)で示すように、対象テキストの先頭出現数(つまり、s1)を、対象テキストの総出現数ntによって除した指標値(割合)rを導出する。判定部314は、導出した指標値rが、第1閾値thrよりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、rは、指標値rであり、thrは、第1閾値thrである(0<thr<1、より好ましくは、thrは0.5程度)。
r>thr …(1)
(Condition 1)
As shown in the conditional expression (1), the determination unit 314 derives an index value (ratio) r obtained by dividing the number of appearances at the beginning of the target text (that is, s1) by the total number of appearances nt of the target text. The determination unit 314 determines that the target text is included in the brand dictionary when the derived index value r is larger than the first threshold value thr and other conditions are satisfied. In the formula, r is an index value r, and thr is the first threshold value thr (0 <thr <1, more preferably thr is about 0.5).
r> thr ... (1)

指標値rは、複数の対象テキストを含むクエリの一番目に出現した頻度に着目しているが、これは、ファッションのカテゴリに適した規則である。ファッションのカテゴリにおいてクエリ検索を行う場合、一番目にブランド名を入力することが多いという傾向が予め分かっているからである。これによって、判定部314は、ブランド名である可能性が高い対象テキストを、より適切にブランド辞書に含めることができる。 The index value r focuses on the frequency of occurrence of the first occurrence of a query containing a plurality of target texts, which is a rule suitable for a fashion category. This is because it is known in advance that when performing a query search in a fashion category, the brand name is often entered first. As a result, the determination unit 314 can more appropriately include the target text, which is likely to be a brand name, in the brand dictionary.

(条件2)
判定部314は、条件式(2)で示すように、対象テキストの総出現数ntが、所定の閾値(例えば、第2閾値thnとデータ収集期間の日数とを乗じた値)よりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、ntは、総出現数ntであり。Dは、データ収集期間の日数であり、thnは、第2閾値thnである(1<thn、好ましくは、10〜100程度)。
nt>thn×D…(2)
(Condition 2)
As shown in the conditional expression (2), the determination unit 314 has a case where the total number of appearances nt of the target text is larger than a predetermined threshold value (for example, a value obtained by multiplying the second threshold value thn by the number of days in the data collection period). , If other conditions are met, it is determined that the target text is included in the brand dictionary. In the formula, nt is the total number of occurrences nt. D is the number of days in the data collection period, and thn is the second threshold value thn (1 <thn, preferably about 10 to 100).
nt> thn × D ... (2)

総出現数ntが所定の閾値に達していない対象テキストは、例えば、クエリとしてあまり検索されないマイナーな単語である可能性が高い。これによって、判定部314は、マイナーな単語以外の対象テキストであり、ブランド名である可能性が高い対象テキストを、ブランド辞書に含めることができる。ここで、対象区間の日数は、「単位期間」の一例であり、第2閾値thnとデータ収集期間の日数とを乗じた値は、「単位期間の数の長さに対する比率」の一例である。 The target text in which the total number of occurrences nt does not reach a predetermined threshold value is likely to be, for example, a minor word that is not often searched as a query. As a result, the determination unit 314 can include the target text, which is a target text other than a minor word and is likely to be a brand name, in the brand dictionary. Here, the number of days in the target section is an example of the "unit period", and the value obtained by multiplying the second threshold value thn by the number of days in the data collection period is an example of the "ratio to the length of the number of unit periods". ..

(条件3)
判定部314は、条件式(3)で示すように、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、所定の閾値(例えば、第3閾値thcと出現日数とを乗じた値)よりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、ctは、出現日数ctであり、Dは、データ収集期間の日数であり、thcは、第3閾値thcである(0<thc<1、より好ましくは、thcは0.5〜0.9程度)。
nt>thn×D…(2)
(Condition 3)
As shown in the conditional expression (3), the determination unit 314 sets the number of appearance days ct in which the query including the target text is observed during the data collection period to a predetermined threshold value (for example, the third threshold value thc and the number of appearance days). If it is larger than (multiplied value), and if other conditions are met, it is determined that the target text is included in the brand dictionary. In the formula, ct is the number of days of appearance ct, D is the number of days in the data collection period, thc is the third threshold thc (0 <thc <1, more preferably thc is 0.5 to 0). About 9.9).
nt> thn × D ... (2)

出現日数ctが所定の閾値に達していない対象テキストは、例えば、流行語に関連して多数検索されたテキスト(バズワード)である可能性が高い。これによって、判定部314は、恒常的に用いられているブランド名である可能性が高い対象テキストを、ブランド辞書に含めることができる。 The target text in which the number of appearance days ct does not reach a predetermined threshold is likely to be, for example, a text (buzzword) searched in large numbers in relation to a buzzword. As a result, the determination unit 314 can include the target text, which is likely to be a brand name that is constantly used, in the brand dictionary.

作成部316は、判定部314による判定の結果、ブランド辞書に含めると判定された対象テキストを集めて、ブランド辞書を作成する。ブランド辞書は、例えば販売仲介サーバ200に提供される。 The creation unit 316 creates a brand dictionary by collecting the target texts determined to be included in the brand dictionary as a result of the determination by the determination unit 314. The brand dictionary is provided to, for example, the sales brokerage server 200.

以下、ブランド辞書作成装置300により実行される処理の流れについて、フローチャートを用いて説明する。図11は、ブランド辞書作成装置300により実行される処理の流れの一例を示すフローチャートである。 Hereinafter, the flow of processing executed by the brand dictionary creation device 300 will be described with reference to a flowchart. FIG. 11 is a flowchart showing an example of the flow of processing executed by the brand dictionary creating device 300.

まず、ブランド辞書作成装置300は、対象カテゴリを決定する(S200)。対象カテゴリは、例えば外部(オペレータを含む)からの指示に基づいて決定される。次に、判定部314が、対象カテゴリに対応するクエリをクエリログ320から抽出する(S202)。 First, the brand dictionary creation device 300 determines the target category (S200). The target category is determined based on, for example, an instruction from the outside (including the operator). Next, the determination unit 314 extracts the query corresponding to the target category from the query log 320 (S202).

次に、判定部314は、S202で抽出したクエリを一つ選び(S204)、クエリを対象テキストに分割する(S206)。次に、判定部314は、対象テキスト毎に、出現位置毎の出現数、総出現数ntおよび出現日数ctをカウントアップする(S208)。 Next, the determination unit 314 selects one of the queries extracted in S202 (S204) and divides the query into target texts (S206). Next, the determination unit 314 counts up the number of appearances, the total number of appearances nt, and the number of appearance days ct for each appearance position for each target text (S208).

そして、判定部314は、S204で全てのクエリを選択したか否かを判定する(S210)。全てのクエリを選択していない場合、S204に処理が戻される。 Then, the determination unit 314 determines whether or not all the queries have been selected in S204 (S210). If all queries are not selected, the process is returned to S204.

全てのクエリを選択した場合、判定部314は、前述した各種条件に基づいて、対象テキストをブランド辞書に含めるか否かを判定する(S212)。S212の処理の詳細については、後述する。作成部316は、判定部314による判定の結果、ブランド辞書に含めると判定された対象テキストをブランド名として対象カテゴリの辞書に含める(S214)。なお、図11に例示したS204〜S210のループ処理は、並列コンピューティングによって同時並行的に実行されてもよい。 When all the queries are selected, the determination unit 314 determines whether or not to include the target text in the brand dictionary based on the various conditions described above (S212). Details of the processing of S212 will be described later. The creation unit 316 includes the target text determined to be included in the brand dictionary as a brand name in the dictionary of the target category as a result of the determination by the determination unit 314 (S214). The loop processing of S204 to S210 illustrated in FIG. 11 may be executed in parallel by parallel computing.

図12は、S212の処理の一例を示すフローチャートである。S212において、判定部314は、対象テキストが3文字以上のカタカナで構成されているか否かを判定する(S300)。判定部314は、対象テキストが3文字のカタカナで構成されていない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。 FIG. 12 is a flowchart showing an example of the processing of S212. In S212, the determination unit 314 determines whether or not the target text is composed of three or more characters of katakana (S300). If the target text is not composed of three characters of katakana, the determination unit 314 determines that the target text is not included in the brand dictionary, and ends the process.

判定部314は、対象テキストが3文字以上のカタカナである場合、対象テキストの指標値rが、第1閾値thrよりも大きいか否かを判定する(条件1)(S302)。判定部314は、対象テキストの指標値rが、第1閾値thr以下である場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。 When the target text is katakana of three or more characters, the determination unit 314 determines whether or not the index value r of the target text is larger than the first threshold value thr (condition 1) (S302). When the index value r of the target text is equal to or less than the first threshold value thr, the determination unit 314 determines that the target text is not included in the brand dictionary, and ends the process.

判定部314は、対象テキストの指標値rが、第1閾値thrよりも大きい場合、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きいか否かを判定する(条件2)(S304)。判定部314は、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きくない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。判定部314は、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きい場合、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きいか否かを判定する(S306)。 When the index value r of the target text is larger than the first threshold value thr, the determination unit 314 determines whether the total number of appearances nt of the target text is larger than the value obtained by multiplying the second threshold value thn by the number of days in the data collection period. It is determined whether or not (Condition 2) (S304). If the total number of appearances nt of the target text is not larger than the value obtained by multiplying the second threshold thn by the number of days of the data collection period, the determination unit 314 determines that the target text is not included in the brand dictionary and ends the process. do. When the total number of appearances nt of the target text is larger than the value obtained by multiplying the second threshold value thn by the number of days in the data collection period, the determination unit 314 indicates that a query including the target text is observed during the data collection period. It is determined whether or not the number of days ct is larger than the value obtained by multiplying the third threshold value thc by the number of appearance days (S306).

判定部314は、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きくない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。判定部314は、象期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きい場合(つまり、条件1〜3を満たす場合)、対象テキストをブランド辞書に含めると判定し、S214に処理を進める。 The determination unit 314 includes the target text in the brand dictionary when the number of appearance days ct in which the query including the target text is observed during the data collection period is not larger than the value obtained by multiplying the third threshold value thc and the number of appearance days. It is determined that there is no such thing, and the process is terminated. In the determination unit 314, when the number of appearance days ct in which the query including the target text is observed in the elephant period is larger than the value obtained by multiplying the third threshold thc and the number of appearance days (that is, when conditions 1 to 3 are satisfied). ), It is determined that the target text is included in the brand dictionary, and the process proceeds to S214.

なお、クエリから対象テキストに分割する手法は、上記の手法に限られない。例えば、「aaa bbb ccc」なるクエリの中に含まれる「aaa bbb」が、ブランド名として世に広まっているような場合も考えられる。これに対し、ブランド辞書作成装置300は、「aaa bbb ccc」から「aaa」、「bbb」、「ccc」、「aaa bbb」、「bbb ccc」のように、単純に形態素解析などを行った場合には二つ以上の対象テキストとなるようなワードも含めて、一つの対象テキストとして扱ってよい。この場合において、例えば「aaa」と「aaa bbb」の双方が絞り込みを通過して残った場合、条件式(3)の左辺の値が大きい方を採用し、小さい方を除外してもよい。「aaa」よりも「aaa bbb」の方が世間の認知度が高い場合、むしろ「aaa bbb」を登録した方が適切に過剰なSEOを検出できるからである。 The method of dividing the query into the target text is not limited to the above method. For example, it is conceivable that "aaaa bbb" included in the query "aaaa bbb ccc" has become widespread as a brand name. On the other hand, the brand dictionary creating device 300 simply performed morphological analysis and the like from "aaaa bbb ccc" to "aaa", "bbbb", "ccc", "aaaa bbb", and "bbbb ccc". In some cases, it may be treated as one target text including words that are two or more target texts. In this case, for example, when both "aaa" and "aaa bbb" have passed through the narrowing down and remain, the one with the larger value on the left side of the conditional expression (3) may be adopted and the smaller one may be excluded. This is because when "aaaa bbb" has a higher public awareness than "aaaa", it is better to register "aaaa bbb" to detect excessive SEO appropriately.

また、作成部316のブランド辞書の作成処理は、既に存在するブランド辞書(例えば、ブランド辞書240)を更新する処理であってもよい。作成部316は、例えば、判定部314によってブランド辞書に含めないと判定された対象テキストが、ブランド辞書240に含まれる場合、当該対象テキストをブランド辞書240から除外し、判定部314によってブランド辞書に含めると判定された対象テキストが、ブランド辞書240に含まれていない場合、当該対象テキストをブランド辞書240に含めることにより、ブランド辞書240を更新するようにしてもよい。 Further, the brand dictionary creation process of the creation unit 316 may be a process of updating an existing brand dictionary (for example, the brand dictionary 240). For example, when the target text determined not to be included in the brand dictionary by the determination unit 314 is included in the brand dictionary 240, the creation unit 316 excludes the target text from the brand dictionary 240 and adds the target text to the brand dictionary by the determination unit 314. If the target text determined to be included is not included in the brand dictionary 240, the brand dictionary 240 may be updated by including the target text in the brand dictionary 240.

以上説明したブランド辞書作成装置300によれば、ネットワークNWを介して商品等を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部310と、取得されたクエリに含まれる対象テキスト毎に、対象テキストがクエリの先頭に出現した先頭出現数と、クエリの中における位置を問わず対象テキストがクエリの中に出現した出現数とをカウントする出現数カウント部312と、対象テキスト毎に先頭出現数を総出現数ntによって除した指標値rを導出し、導出した指標値rに基づいて、対象テキストをブランド辞書に含めるか否かを判定する判定部314とを備えることにより、より適切なブランド辞書を作成することができる。 According to the brand dictionary creating device 300 described above, the query acquisition unit 310 that acquires the query input to the sales screen for selling the product or the like via the network NW, and the target included in the acquired query. For each text, the appearance count unit 312 that counts the number of occurrences of the target text appearing at the beginning of the query and the number of appearances of the target text appearing in the query regardless of the position in the query, and the target text By deriving an index value r obtained by dividing the number of first appearances by the total number of appearances nt for each, and providing a determination unit 314 for determining whether or not to include the target text in the brand dictionary based on the derived index value r. , You can create a more suitable brand dictionary.

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above using the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.

100…端末装置、200…販売仲介サーバ、210…販売画面提供部、212…ランキング処理部、214…ログ収集部、220…商品等データ、222…ランキングデータ、224…ログ情報、230…対象語句取得部、232…ブランド名抽出部、234…注意対象商品等特定部、240…ブランド辞書、300…ブランド辞書作成装置、310…クエリ取得部、312…出現数カウント部、314…判定部、316…作成部、320…クエリログ、322…ブランド辞書、C1、thr…第1閾値、C2、thn…第2閾値、C3、thc…第3閾値、ct…出現日数、k…所定数、nt…総出現数、r…指標値 100 ... terminal device, 200 ... sales brokerage server, 210 ... sales screen providing unit, 212 ... ranking processing unit, 214 ... log collecting unit, 220 ... product data, 222 ... ranking data, 224 ... log information, 230 ... target words Acquisition unit, 232 ... Brand name extraction unit, 234 ... Caution target product identification unit, 240 ... Brand dictionary, 300 ... Brand dictionary creation device, 310 ... Query acquisition unit, 312 ... Appearance count unit, 314 ... Judgment unit, 316 ... Creation unit, 320 ... Query log, 322 ... Brand dictionary, C1, thr ... 1st threshold, C2, thn ... 2nd threshold, C3, thc ... 3rd threshold, ct ... Number of appearance days, k ... Predetermined number, nt ... Total Number of appearances, r ... Index value

Claims (11)

ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部と、
前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する判定部と、
を備えるブランド辞書作成装置。
A query acquisition unit that acquires a query entered for a sales screen for selling a product or service (hereinafter, product, etc.) via a network, and a query acquisition unit.
For each target text included in the acquired query, a determination unit that determines whether or not to include the target text in the brand dictionary based on the number of occurrences of the target text for each position in the query.
A brand dictionary creation device equipped with.
前記判定部は、前記対象テキストがクエリの先頭に出現した割合に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する、
請求項1記載のブランド辞書作成装置。
The determination unit determines whether or not to include the target text in the brand dictionary based on the ratio of the target text appearing at the beginning of the query.
The brand dictionary creating device according to claim 1.
前記判定部は、前記割合が第1閾値よりも大きい場合、前記対象テキストを前記ブランド辞書に含めると判定する、
請求項2に記載のブランド辞書作成装置。
When the ratio is larger than the first threshold value, the determination unit determines that the target text is included in the brand dictionary.
The brand dictionary creating device according to claim 2.
前記判定部は、更に、前記出現数が観測された期間のデータ収集期間に対する比率に基づいて、前記対象テキストを前記ブランド辞書に含めるか否かを判定する、
請求項1から3のうちいずれか一項に記載のブランド辞書作成装置。
The determination unit further determines whether or not to include the target text in the brand dictionary based on the ratio of the number of occurrences to the data collection period during the observed period.
The brand dictionary creating device according to any one of claims 1 to 3.
前記判定部は、更に、データ収集期間の中で前記対象テキストを含むクエリが観測された単位期間の数の、前記データ収集期間の長さに対する比率に基づいて、前記対象テキストを前記ブランド辞書に含めるか否かを判定する、
請求項1から4のうちいずれか一項に記載のブランド辞書作成装置。
The determination unit further puts the target text into the brand dictionary based on the ratio of the number of unit periods in which the query including the target text was observed during the data collection period to the length of the data collection period. Determine whether to include,
The brand dictionary creating device according to any one of claims 1 to 4.
前記判定部は、前記対象テキストが3文字以上のカタカナで構成されない場合、前記対象テキストを前記ブランド辞書に含めないと判定する、
請求項1から5のうちいずれか一項に記載のブランド辞書作成装置。
The determination unit determines that the target text is not included in the brand dictionary when the target text is not composed of three or more characters of katakana.
The brand dictionary creating device according to any one of claims 1 to 5.
請求項1から請求項6のうちいずれか一項に記載のブランド辞書作成装置と、
ネットワークを介して販売される商品またはサービス(以下、商品等)の紹介画面に含まれる対象語句を取得する対象語句取得部と、
前記ブランド辞書を参照し、前記対象語句の中に含まれるブランド名を抽出するブランド名抽出部と、
前記ブランド名抽出部により抽出されたブランド名の数に基づいて、注意対象の商品等を特定する監視部と、
を備える商品等評価装置。
The brand dictionary creating device according to any one of claims 1 to 6.
The target phrase acquisition unit that acquires the target phrase included in the introduction screen of the product or service (hereinafter, product, etc.) sold via the network,
A brand name extraction unit that extracts the brand name included in the target phrase by referring to the brand dictionary, and
A monitoring unit that identifies products to be noted based on the number of brand names extracted by the brand name extraction unit, and
Product evaluation device equipped with.
前記監視部は、前記ブランド名抽出部により抽出されたブランド名の数が所定数以上である場合、前記対象語句が取得された取得元の商品等を前記注意対象の商品等と特定する、
請求項7に記載の商品等評価装置。
When the number of brand names extracted by the brand name extraction unit is equal to or greater than a predetermined number, the monitoring unit identifies the acquisition source product or the like from which the target phrase has been acquired as the caution target product or the like.
The product evaluation device according to claim 7.
前記監視部は、前記ブランド名抽出部により抽出されたブランド名の数に基づいて、前記注意対象の商品等を出品した出品者に対する段階的な処理を行う、
請求項7又は請求項8に記載の商品等評価装置。
Based on the number of brand names extracted by the brand name extraction unit, the monitoring unit performs stepwise processing on the seller who has put up the product or the like to be noted.
The product evaluation device according to claim 7 or 8.
コンピュータが、
ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得し、
前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する、
ブランド辞書作成方法。
The computer
Get the query entered for the sales screen to sell a product or service (hereinafter, product, etc.) via the network.
For each target text included in the acquired query, it is determined whether or not the target text is included in the brand dictionary based on the number of occurrences of the target text for each position in the query.
How to create a brand dictionary.
コンピュータに、
ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得させ、
前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定させる、
プログラム。
On the computer
Get the query entered for the sales screen for selling products or services (hereinafter, products, etc.) via the network.
For each target text included in the acquired query, it is determined whether or not the target text is included in the brand dictionary based on the number of occurrences of the target text for each position in the query.
program.
JP2021093596A 2018-08-29 2021-06-03 Brand dictionary creation device, product evaluation device, brand dictionary creation method and program Active JP6960553B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021093596A JP6960553B2 (en) 2018-08-29 2021-06-03 Brand dictionary creation device, product evaluation device, brand dictionary creation method and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018160217A JP6894875B2 (en) 2018-08-29 2018-08-29 Brand dictionary creation device, product evaluation device, brand dictionary creation method and program.
JP2021093596A JP6960553B2 (en) 2018-08-29 2021-06-03 Brand dictionary creation device, product evaluation device, brand dictionary creation method and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018160217A Division JP6894875B2 (en) 2018-08-29 2018-08-29 Brand dictionary creation device, product evaluation device, brand dictionary creation method and program.

Publications (2)

Publication Number Publication Date
JP2021176085A JP2021176085A (en) 2021-11-04
JP6960553B2 true JP6960553B2 (en) 2021-11-05

Family

ID=69668173

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018160217A Active JP6894875B2 (en) 2018-08-29 2018-08-29 Brand dictionary creation device, product evaluation device, brand dictionary creation method and program.
JP2021093596A Active JP6960553B2 (en) 2018-08-29 2021-06-03 Brand dictionary creation device, product evaluation device, brand dictionary creation method and program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018160217A Active JP6894875B2 (en) 2018-08-29 2018-08-29 Brand dictionary creation device, product evaluation device, brand dictionary creation method and program.

Country Status (1)

Country Link
JP (2) JP6894875B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313187A (en) * 2021-06-09 2021-08-27 有米科技股份有限公司 Brand identification method and device based on text information

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004070405A (en) * 2002-08-01 2004-03-04 Mitsubishi Electric Corp Rumor information extraction device for web page
US20110113063A1 (en) * 2009-11-09 2011-05-12 Bob Schulman Method and system for brand name identification
JP2011175453A (en) * 2010-02-24 2011-09-08 Kansai Electric Power Co Inc:The Keyword retrieval system
JP5138025B2 (en) * 2010-12-28 2013-02-06 ヤフー株式会社 Spam candidate extraction apparatus and method
JP2012247948A (en) * 2011-05-26 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> Dictionary management apparatus, dictionary management method and dictionary management program
JP5113936B1 (en) * 2011-11-24 2013-01-09 楽天株式会社 Information processing apparatus, information processing method, information processing apparatus program, and recording medium
US8751478B1 (en) * 2011-12-28 2014-06-10 Symantec Corporation Systems and methods for associating brands with search queries that produce search results with malicious websites
EP2778959B1 (en) * 2012-06-27 2020-04-08 Rakuten, Inc. Information processing device, information processing method, and information processing program
US9659259B2 (en) * 2014-12-20 2017-05-23 Microsoft Corporation Latency-efficient multi-stage tagging mechanism
WO2016103383A1 (en) * 2014-12-25 2016-06-30 楽天株式会社 Information processing device, information processing method, program, and storage medium
US20160188660A1 (en) * 2014-12-31 2016-06-30 Ebay Inc. Determining search results using session based refinements
CN107330752B (en) * 2017-05-31 2020-09-29 北京京东尚科信息技术有限公司 Method and device for identifying brand words

Also Published As

Publication number Publication date
JP2020035126A (en) 2020-03-05
JP6894875B2 (en) 2021-06-30
JP2021176085A (en) 2021-11-04

Similar Documents

Publication Publication Date Title
JP5238437B2 (en) Web browsing purpose classification device, web browsing purpose classification method, and web browsing purpose classification program
JP4962967B2 (en) Web page search server and query recommendation method
US8812505B2 (en) Method for recommending best information in real time by appropriately obtaining gist of web page and user&#39;s preference
JP5083669B2 (en) Information extraction system, information extraction method, information extraction program, and information service system
US10360605B2 (en) Server apparatus, information providing method, information providing program, recording medium recording the information providing program, and information providing system
JP6018338B1 (en) Information processing apparatus, information processing method, and information processing program
JP2007018285A (en) System, method, device, and program for providing information
JP2012073966A (en) Data generation device, data generation method and data generation program
JP2011107826A (en) Action-information extracting system and extraction method
US20150347423A1 (en) Methods for completing a user search
JP6960253B2 (en) Product evaluation device, product evaluation method, and program
JP6960553B2 (en) Brand dictionary creation device, product evaluation device, brand dictionary creation method and program
JP2007233584A (en) Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program
CN111552795B (en) Book list page display method, electronic equipment and storage medium
JP6424194B2 (en) Information processing apparatus, information processing method, and information processing program
JP6964445B2 (en) Brand dictionary creation device, brand dictionary creation method, and program
JP6993955B2 (en) Information processing equipment, information processing methods, and programs
JP7140561B2 (en) Information processing device, information processing method, and program
JP2001229171A (en) Article retrieval system
JP3474803B2 (en) Search system, search server, search method, and recording medium
JP6506839B2 (en) Dissatisfied information processing device and system
JP6879958B2 (en) Information processing equipment, information processing methods, and programs
TW201407515A (en) Method and system for processing shopping information over internet, and a readable storage medium
JP3992964B2 (en) Information providing system, server computer, program, and recording medium
JP5908338B2 (en) Feature word selection server and feature word selection method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210618

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210914

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211011

R150 Certificate of patent or registration of utility model

Ref document number: 6960553

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350