JP2021176085A - ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム - Google Patents

ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム Download PDF

Info

Publication number
JP2021176085A
JP2021176085A JP2021093596A JP2021093596A JP2021176085A JP 2021176085 A JP2021176085 A JP 2021176085A JP 2021093596 A JP2021093596 A JP 2021093596A JP 2021093596 A JP2021093596 A JP 2021093596A JP 2021176085 A JP2021176085 A JP 2021176085A
Authority
JP
Japan
Prior art keywords
brand
query
product
target text
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021093596A
Other languages
English (en)
Other versions
JP6960553B2 (ja
Inventor
健治 長利
Kenji Nagatoshi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021093596A priority Critical patent/JP6960553B2/ja
Publication of JP2021176085A publication Critical patent/JP2021176085A/ja
Application granted granted Critical
Publication of JP6960553B2 publication Critical patent/JP6960553B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】商品等のカテゴリ毎に適切なブランド辞書を作成することができるブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムを提供すること。【解決手段】ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部と、前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する判定部と、を備えるブランド辞書作成装置。【選択図】図1

Description

本発明は、ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムに関する。
所定の検索クエリと、コンテンツのカテゴリ毎の所定の検索クエリに対する対応度合いとを関連付けた情報が格納されるクエリカテゴリ辞書と、ユーザ端末から送信された過去の検索クエリを示す検索クエリ履歴を取得する検索履歴取得手段と、検索クエリ履歴を用いて、クエリカテゴリ辞書から、コンテンツのカテゴリ毎の過去の検索クエリに対する対応度合いを関連付けた情報を抽出し、抽出された情報に基づき、コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴量を算出するユーザ特徴量算出手段と、ユーザ端末から送信された検索要求時の検索クエリに対応すると共にカテゴリに対応付けられたコンテンツを示す情報を含むコンテンツの検索結果を取得する検索結果取得手段と、ユーザ特徴量に基づき、コンテンツの検索結果を出力する出力手段とを備えるコンテンツ検索結果提供システムが知られている(特許文献1参照)。
特開2016−110260号公報
ショッピングサイトなどで商品やサービス(以下、商品等)を検索するためにクエリが入力されることがある。検索ヒット数は、ショッピングサイトにおける商品等のランキングに影響する場合があるため、検索ヒット数を高くする目的で、タイトルや商品紹介欄に、その商品とは無関係な複数のブランド名を掲載することが行われている。このような行為は、過剰なSEO(Search Engine Optimization)あるいはブラックハットSEOと称される。過剰なSEOは、商品等の適正なランキング形成を妨げるものであるため、過剰なSEOの目的で販売画面が構成された商品等を発見したいというニーズが存在する。過剰なSEOが行われている商品等を発見するためには、ブランド名を集めた適切な辞書(ブランド辞書)を作成しておくことが望ましい。しかしながら、従来の技術では、精度が不十分であり、適切なブランド辞書を作成することができない場合があった。
本発明は、このような事情を考慮してなされたものであり、より適切なブランド辞書を作成することができるブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムを提供することを目的の一つとする。
本発明の一態様は、ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部と、前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する判定部と、を備えるブランド辞書作成装置である。
本発明の一態様によれば、より適切なブランド辞書を作成することができる。
商品等評価装置を利用した販売仲介サーバ200と、ブランド辞書作成装置300との構成および使用環境の一例を示す図である。 商品等の販売画面IM1の一例を示す図である。 検索結果表示画面IM2の一例を示す図である。 商品等表示画面IM3の一例を示す図である。 過剰なSEOがなされた商品等表示画面IM4の一例である。 商品等データ220の内容の一例を示す図である。 ランキングデータ222の内容の一例を示す図である。 ブランド辞書240の内容の一例を示す図である。 販売仲介サーバ200の対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234により実行される処理の流れの一例を示すフローチャートである。 出現数カウント部312による処理の内容を説明するための図である。 ブランド辞書作成装置300により実行される処理の流れの一例を示すフローチャートである。 S212の処理の一例を示すフローチャートである。
以下、図面を参照し、本発明のブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラムの実施形態について説明する。
[全体構成]
図1は、商品等評価装置を利用した販売仲介サーバ200と、ブランド辞書作成装置300との構成および使用環境の一例を示す図である。販売仲介サーバ200は、端末装置100によってアクセスされ、商品またはサービス(以下、商品等)の販売を仲介するための装置であり、いわゆるショッピングサイトやオークションサイトを提供する装置である。ここで、「サイト」とは、ブラウザによって再生されるウェブサイトの他、アプリケーションプログラムによって表示されるアプリ画面の元データを含むものとする。販売仲介サーバ200の運営者には、商品等の出品者により出品される商品等に関する商品等データが提供される。商品等データは、商品等のタイトルや詳細説明などを含む。
端末装置100では、ブラウザやアプリケーションプログラムなどのUA(User Agent)110が起動する。UA110は、販売仲介サーバ200から提供された販売画面を表示すると共に、端末装置100の利用者によってなされた入力操作に応じたリクエストを販売仲介サーバ200に送信する。販売仲介サーバ200は、UA110からのリクエストに応じて商品等の販売を決定する。
また、販売仲介サーバ200には、ブランド辞書作成装置300により作成されたブランド辞書が提供される。ブランド辞書とは、ある商品等の紹介画面について原則的に一つのみ掲載される筈のブランド名であって、ブランドの名称である確からしさが高い単語を集めた電子的な辞書である。図では、販売仲介サーバ200とブランド辞書作成装置300が別体であるように示しているが、これらは統合されて一つのハードウェアにより実現されてもよい。
端末装置100、販売仲介サーバ200、およびブランド辞書作成装置300は、ネットワークNWを介して互いに通信する。これらの構成要素は、ネットワークNWに接続するためのネットワークカード、無線通信モジュールなどを備える。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、無線基地局、プロバイダ端末、専用回線などを含む。
[販売仲介サーバ]
販売仲介サーバ200は、例えば、販売画面提供部210と、ランキング処理部212と、ログ収集部214と、対象語句取得部230と、ブランド名抽出部232と、注意対象商品等特定部234とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
また、販売仲介サーバ200は、RAM(Random Access Memory)やHDD(Hard Disk Drive)、フラッシュメモリ、ROM(Read Only Memory)などの記憶装置に、商品等データ220、ランキングデータ222、ログ情報224、ブランド辞書240などのデータを格納している。なお、これらのデータは、販売仲介サーバ200がネットワークNWを介してアクセス可能なNAS(Network Attached Storage)などに格納されてもよい。
販売画面提供部210は、商品等データ220およびランキングデータ222を参照し、商品等の販売画面を端末装置100に提供する。図2は、商品等の販売画面IM1の一例を示す図である。販売画面IM1には、商品等を検索するためのクエリを入力するためのクエリ入力欄A1、および、入力されたクエリで検索を実行させるための検索ボタンB1が設けられている。クエリ入力欄A1にクエリが入力され、検索ボタンB1が操作されると、検索結果表示画面IM2に遷移する。なお、クエリは一語だけのクエリもあるし、複数の子クエリがスペースなどで結合された複数語を含むクエリもある。
図3は、検索結果表示画面IM2の一例を示す図である。検索結果表示画面IM2には、検索結果表示欄A2が含まれる。検索結果表示欄A2には、ランキング処理部212によって決定されたクエリ毎のランキング順に、商品等の画像や説明が並べて表示される。検索結果表示画面IM2において一つの商品等の画像や説明が操作されると、商品等表示画面IM3に遷移する。
図4は、商品等表示画面IM3の一例を示す図である。商品等表示画面IM3には、商品等画像表示欄A3−1、タイトル欄A3−2、商品等説明欄A3−3などが含まれる。タイトル欄A3−2や商品等説明欄A3−3には、製造元、商品の素材、使用、その他の内容が掲載される。このような内容が通常の商品等表示画面IM3であるが、過剰なSEOがなされた商品等表示画面は、異なる態様を示すものとなる。
図5は、過剰なSEOがなされた商品等表示画面IM4の一例である。商品等表示画面IM4では、製造元が「○○社」であるにも関わらず、商品等説明欄A4−3に、無関係なA社、B社、C社(いずれも○○社と同じカテゴリのブランド名)が掲載されている。この結果、クエリとして「A社」、「B社」、または「C社」のいずれかを指定して検索が行われた結果、それらの商品等でないにも関わらず、この商品等が検索にヒットする場合がある。このような商品等の掲載を回避あるいは抑制するために、販売仲介サーバ200は、ブランド辞書240を用いた注意対象商品等の特定処理を実行する。これについては、後述する。
話を戻し、販売画面提供部210は、図2〜5に例示した各種表示画面を、商品等データ220に基づいて生成する。図6は、商品等データ220の内容の一例を示す図である。商品等データ220は、商品等の識別情報である商品等IDに対して、商品カテゴリ、商品等画像、タイトル、商品等説明、価格(オークションであれば基準価格または入札価格)、発送条件、その他のデータが対応付けられたものである。
ランキング処理部212は、過去に入力されたクエリのそれぞれに対して、種々の基準によりランキング処理を行い、ランキングデータ222を生成する。図7は、ランキングデータ222の内容の一例を示す図である。ランキングデータ222は、例えば、クエリに対して、商品等IDのランキングが対応付けられたものである。ランキングデータ222は、例えば、ログ収集部214により収集されたログ情報に基づいて、クリック数が多い順、購入数が多い順、CVR(Conversion Ratio)が高い順、お気に入り登録数が多い順、または価格が安い順、或いはこれらを組み合わせたスコア順に、高いランキングとする。また、ランキング処理は、ランダムに商品等をランキングに含めることを含んでもよい。
ログ収集部214は、端末装置100において入力されたクエリを含む情報であって、端末装置100からリクエストのあったページを時系列で並べた行動履歴などの情報を、ログ情報224として蓄積する。
対象語句取得部230は、商品等データ220に含まれるデータのうち、商品等IDで示される商品等毎の対象語句を取得する。対象語句は任意に定めてよいが、例えば、タイトルおよび商品等説明に含まれる語句が対象語句に設定される。
ブランド名抽出部232は、ブランド辞書240を参照し、対象語句取得部230により取得された対象語句の中に含まれるブランド名を抽出する。より具体的に、ブランド名抽出部232は、対象語句が取得された元の商品等のカテゴリに合致するブランド名を抽出する。図8は、ブランド辞書240の内容の一例を示す図である。ブランド辞書240は、例えば、商品等のカテゴリ毎にブランド名を列挙したものである。
ブランド名抽出部232は、例えば、既に行った検索結果を活かすため、AhoCorasick法などの共通接頭辞検索(Common Prefix Search)を行うことで、辞書中からパターンマッチングを行うオートマトンを構築し、入力テキストに対して線形な計算時間を実現する。
注意対象商品等特定部234は、ブランド名抽出部232により抽出されたブランド名の数に基づいて、注意対象商品等を特定する。例えば、注意対象商品等特定部234は、所定数k以上のブランド名が対象語句に含まれている商品等を、注意対象商品等として特定する。例えばk=2である。
そして、注意対象商品等特定部234は、特定した注意対象商品等について、(1)出品者に対する注意を行うため、表示装置に商品等IDを表示させ、あるいは出品者に対して注意する電子メールを生成して送信する、(2)ランキングデータ222における当該商品等のランキングを下げる、(3)商品等データ220から削除する(出品を取り消す)などの処理を行う。
注意対象商品等特定部234は、ブランド名抽出部232により特定されたブランド名の数に応じて、上記(1)〜(3)の処理を段階的に行ってもよい。例えば、2つのブランド名が対象語句に含まれている商品等について(1)の処理を、3つのブランド名が対象語句に含まれている商品等について(2)の処理を、4つ以上のブランド名が対象語句に含まれている商品等について(3)の処理を行ってもよい。
また、注意対象商品等特定部234は、出品者毎に、注意対象商品等に該当した商品等の数をカウントし、注意対象商品等に該当した商品等の数に応じて上記(1)〜(3)の処理を段階的に行ってもよい。例えば、注意対象商品等に該当した商品等の数が第1閾値C1以上、第2閾値C2未満の出品者に対して(1)の処理を、注意対象商品等に該当した商品等の数が第2閾値C2以上、第3閾値C3未満の出品者の注意対象商品等に対して(2)の処理を、注意対象商品等に該当した商品等の数が第3閾値C3以上の出品者の注意対象商品等(或いは全ての商品等)に対して(3)の処理を行ってもよい(C1<C2<C3)。
図9は、販売仲介サーバ200の対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234により実行される処理の流れの一例を示すフローチャートである。本フローチャートの処理は、任意のタイミングで開始される。
まず、対象語句取得部230が、商品等データ220から一つの商品等を選択し(S100)、対象語句を取得する(S102)。次に、ブランド名抽出部232が、S102で取得された対象語句からブランド名を抽出する(S104)。
次に、注意対象商品等特定部234が、S104で抽出されたブランド名が所定数k以上であるか否かを判定する(S106)。S104で抽出されたブランド名が所定数k以上である場合、注意対象商品等特定部234は、S100で選択した商品等を注意対象商品として特定する(S108)。
次に、対象語句取得部230が、商品等データ220から今回の処理対象である全ての商品等を選択したか否かを判定する(S110)。全ての商品等を選択していない場合はS100に処理が戻され、全ての商品等を選択した場合は本フローチャートの処理が終了する。なお、図9に例示したループ処理は、並列コンピューティングによって同時並行的に実行されてもよい。
このように、販売仲介サーバ200(商品等評価装置)によれば、ネットワークNWを介して販売される商品等の紹介画面に含まれる対象語句を取得する対象語句取得部230と、ブランド名を記述したブランド辞書240を参照し、対象語句の中に含まれるブランド名を抽出するブランド名抽出部232と、ブランド名抽出部232により抽出されたブランド名の数に基づいて、注意対象の商品等を特定する注意対象商品等特定部234と、を備えることにより、注意対象の商品等を、効率よく発見することができる。なお、対象語句取得部230、ブランド名抽出部232、および注意対象商品等特定部234を合わせたものが「商品等評価装置」の一例である。また、注意対象商品等特定部234は、「監視部」の一例である。
なお、上記の説明では、商品等のカテゴリに応じたブランド辞書240を用いて注意対象商品等を特定するものとしたが、カテゴリを特定せずに全てのブランド辞書240を用いて注意対象商品等を特定してもよい。
[ブランド辞書作成装置]
以下、ブランド辞書240を作成するブランド辞書作成装置300について説明する。ブランド辞書作成装置300は、例えば、クエリ取得部310と、出現数カウント部312と、判定部314と、作成部316とを備える。これらの構成要素は、例えば、CPUなどのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
また、ブランド辞書作成装置300は、RAMやHDD、フラッシュメモリ、ROMなどの記憶装置に、クエリログ320、作成中のブランド辞書322などのデータを格納している。なお、これらのデータは、ブランド辞書作成装置300がネットワークNWを介してアクセス可能なNASなどに格納されてもよい。
クエリ取得部310は、販売仲介サーバ200が蓄積するログ情報224のうち、クエリに関する情報を取得し、クエリログ320として記憶装置に格納させる。クエリログ320に含まれる各クエリには、そのクエリを用いて検索した結果として表示された商品等およびそのカテゴリが付随している。なお、商品等のカテゴリは階層的に付与されている場合があるが、ここではブランド辞書のカテゴリに対応する階層のカテゴリに着目して説明する。
出現数カウント部312は、クエリログ320に含まれる各クエリに基づいて、クエリに含まれるテキストであり、ブランド辞書に含めるか否かを判定される判定対象のテキスト(以下、対象テキスト)の出現回数をカウントする。対象テキストは、例えば、形態素解析などの所定のロジックにより、意味的にひとまとまりであると解釈されるものである。また、対象テキストは、スペース等で区切られた子クエリのそれぞれであってもよく、子クエリを複数結合したものであってもよい。出現数カウント部312は、カテゴリによっては、対象テキストを3文字以上のカタカナに限定するなど、対象テキストを構成する要素に限定を追加してもよい。
まず、出現数カウント部312は、あるカテゴリ(以下、対象カテゴリ)のブランド辞書を作成する際に、クエリログ320から対象カテゴリに対応しているクエリ(以下、対象クエリ)を抽出する。クエリログ320には、クエリと、クエリの検索結果画面においてクリックされた商品等を示す情報とが、互いに対応付けられて記憶される(クリックログ)。出現数カウント部312は、例えば、クリックログにおいて、対象カテゴリに対応する商品等が最も多く対応付けられているクエリを、対象クエリとして抽出する。例えば、クエリログ320に含まれるクエリAに対応付けられる商品等のカテゴリが、ファッション40%、食品20%、アウトドア10%、美容10、その他20%である場合、出現数カウント部312は、最も比率の高い対象カテゴリである「ファッション」のブランド辞書の作成に用いる対象クエリとして、クエリAを抽出する。
なお、出現数カウント部312は、クエリに対応付けられる商品等のカテゴリのうち、最も比率が高いカテゴリのブランド辞書を作成する際に、当該クエリを用いてもよい。また、出現数カウント部312は、クエリに対応付けられる商品等のカテゴリのうち、高い比率のカテゴリが複数存在する場合、当該クエリが多様な意味のクエリとして用いられている可能性が高い(つまり、意味の特定がしづらいクエリである)と推定し、複数の対象カテゴリに関するブランド辞書について当該クエリを処理対象としてもよいし、そもそも、そのような傾向を示すクエリを処理対象から除外してもよい。
次に、出現数カウント部312は、抽出された対象クエリを構成する対象テキストの出現回数をカウントする。図10は、出現数カウント部312による処理の内容を説明するための図である。出現数カウント部312は、対象クエリに含まれる各対象テキストについて、単独でクエリとして入力された回数をs0、複数の対象テキストを含むクエリの中で、一番目に出現した回数をs1、二番目に出現した回数をs2、三番目以降に出現した回数をs3としてカウントする。
また、出現数カウント部312は、対象クエリに含まれる各対象テキストが、データ収集期間に出現した回数(つまり、s0〜s3の総和)である総出現数ntをカウントする。データ収集期間とは、ブランド辞書作成装置300が一回の処理の対象とする期間(対象期間)である。ブランド辞書作成装置300は、その期間において収集されたクエリログ320に基づいて、ブランド辞書の作成処理を行う。データ収集期間は、例えば、1年程度の期間である。
また、出現数カウント部312は、対象クエリに含まれる各対象テキストが、データ収集期間において出現した(観測された)日数である出現日数ctを併せてカウントする。図10の例では、対象テキスト「aaa」に関して、一番目に1回出現し、単独で1回出現しているため、s0とs1にそれぞれ1が与えられている。
判定部314は、出現数カウント部312によって、データ収集期間を対象として上記各種指標がカウントされた対象クエリについて、以下の条件のうち一部または全部に基づいて、ブランド辞書に含めるか否かを判定する。
(条件1)
判定部314は、条件式(1)で示すように、対象テキストの先頭出現数(つまり、s1)を、対象テキストの総出現数ntによって除した指標値(割合)rを導出する。判定部314は、導出した指標値rが、第1閾値thrよりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、rは、指標値rであり、thrは、第1閾値thrである(0<thr<1、より好ましくは、thrは0.5程度)。
r>thr …(1)
指標値rは、複数の対象テキストを含むクエリの一番目に出現した頻度に着目しているが、これは、ファッションのカテゴリに適した規則である。ファッションのカテゴリにおいてクエリ検索を行う場合、一番目にブランド名を入力することが多いという傾向が予め分かっているからである。これによって、判定部314は、ブランド名である可能性が高い対象テキストを、より適切にブランド辞書に含めることができる。
(条件2)
判定部314は、条件式(2)で示すように、対象テキストの総出現数ntが、所定の閾値(例えば、第2閾値thnとデータ収集期間の日数とを乗じた値)よりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、ntは、総出現数ntであり。Dは、データ収集期間の日数であり、thnは、第2閾値thnである(1<thn、好ましくは、10〜100程度)。
nt>thn×D…(2)
総出現数ntが所定の閾値に達していない対象テキストは、例えば、クエリとしてあまり検索されないマイナーな単語である可能性が高い。これによって、判定部314は、マイナーな単語以外の対象テキストであり、ブランド名である可能性が高い対象テキストを、ブランド辞書に含めることができる。ここで、対象区間の日数は、「単位期間」の一例であり、第2閾値thnとデータ収集期間の日数とを乗じた値は、「単位期間の数の長さに対する比率」の一例である。
(条件3)
判定部314は、条件式(3)で示すように、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、所定の閾値(例えば、第3閾値thcと出現日数とを乗じた値)よりも大きい場合、その他の条件を満たすのであれば、対象テキストをブランド辞書に含めると判定する。式中、ctは、出現日数ctであり、Dは、データ収集期間の日数であり、thcは、第3閾値thcである(0<thc<1、より好ましくは、thcは0.5〜0.9程度)。
nt>thn×D…(2)
出現日数ctが所定の閾値に達していない対象テキストは、例えば、流行語に関連して多数検索されたテキスト(バズワード)である可能性が高い。これによって、判定部314は、恒常的に用いられているブランド名である可能性が高い対象テキストを、ブランド辞書に含めることができる。
作成部316は、判定部314による判定の結果、ブランド辞書に含めると判定された対象テキストを集めて、ブランド辞書を作成する。ブランド辞書は、例えば販売仲介サーバ200に提供される。
以下、ブランド辞書作成装置300により実行される処理の流れについて、フローチャートを用いて説明する。図11は、ブランド辞書作成装置300により実行される処理の流れの一例を示すフローチャートである。
まず、ブランド辞書作成装置300は、対象カテゴリを決定する(S200)。対象カテゴリは、例えば外部(オペレータを含む)からの指示に基づいて決定される。次に、判定部314が、対象カテゴリに対応するクエリをクエリログ320から抽出する(S202)。
次に、判定部314は、S202で抽出したクエリを一つ選び(S204)、クエリを対象テキストに分割する(S206)。次に、判定部314は、対象テキスト毎に、出現位置毎の出現数、総出現数ntおよび出現日数ctをカウントアップする(S208)。
そして、判定部314は、S204で全てのクエリを選択したか否かを判定する(S210)。全てのクエリを選択していない場合、S204に処理が戻される。
全てのクエリを選択した場合、判定部314は、前述した各種条件に基づいて、対象テキストをブランド辞書に含めるか否かを判定する(S212)。S212の処理の詳細については、後述する。作成部316は、判定部314による判定の結果、ブランド辞書に含めると判定された対象テキストをブランド名として対象カテゴリの辞書に含める(S214)。なお、図11に例示したS204〜S210のループ処理は、並列コンピューティングによって同時並行的に実行されてもよい。
図12は、S212の処理の一例を示すフローチャートである。S212において、判定部314は、対象テキストが3文字以上のカタカナで構成されているか否かを判定する(S300)。判定部314は、対象テキストが3文字のカタカナで構成されていない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。
判定部314は、対象テキストが3文字以上のカタカナである場合、対象テキストの指標値rが、第1閾値thrよりも大きいか否かを判定する(条件1)(S302)。判定部314は、対象テキストの指標値rが、第1閾値thr以下である場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。
判定部314は、対象テキストの指標値rが、第1閾値thrよりも大きい場合、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きいか否かを判定する(条件2)(S304)。判定部314は、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きくない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。判定部314は、対象テキストの総出現数ntが、第2閾値thnとデータ収集期間の日数とを乗じた値よりも大きい場合、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きいか否かを判定する(S306)。
判定部314は、データ収集期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きくない場合、対象テキストをブランド辞書に含めないと判定し、処理を終了する。判定部314は、象期間の中で対象テキストを含むクエリが観測された出現日数ctが、第3閾値thcと出現日数とを乗じた値よりも大きい場合(つまり、条件1〜3を満たす場合)、対象テキストをブランド辞書に含めると判定し、S214に処理を進める。
なお、クエリから対象テキストに分割する手法は、上記の手法に限られない。例えば、「aaa bbb ccc」なるクエリの中に含まれる「aaa bbb」が、ブランド名として世に広まっているような場合も考えられる。これに対し、ブランド辞書作成装置300は、「aaa bbb ccc」から「aaa」、「bbb」、「ccc」、「aaa bbb」、「bbb ccc」のように、単純に形態素解析などを行った場合には二つ以上の対象テキストとなるようなワードも含めて、一つの対象テキストとして扱ってよい。この場合において、例えば「aaa」と「aaa bbb」の双方が絞り込みを通過して残った場合、条件式(3)の左辺の値が大きい方を採用し、小さい方を除外してもよい。「aaa」よりも「aaa bbb」の方が世間の認知度が高い場合、むしろ「aaa bbb」を登録した方が適切に過剰なSEOを検出できるからである。
また、作成部316のブランド辞書の作成処理は、既に存在するブランド辞書(例えば、ブランド辞書240)を更新する処理であってもよい。作成部316は、例えば、判定部314によってブランド辞書に含めないと判定された対象テキストが、ブランド辞書240に含まれる場合、当該対象テキストをブランド辞書240から除外し、判定部314によってブランド辞書に含めると判定された対象テキストが、ブランド辞書240に含まれていない場合、当該対象テキストをブランド辞書240に含めることにより、ブランド辞書240を更新するようにしてもよい。
以上説明したブランド辞書作成装置300によれば、ネットワークNWを介して商品等を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部310と、取得されたクエリに含まれる対象テキスト毎に、対象テキストがクエリの先頭に出現した先頭出現数と、クエリの中における位置を問わず対象テキストがクエリの中に出現した出現数とをカウントする出現数カウント部312と、対象テキスト毎に先頭出現数を総出現数ntによって除した指標値rを導出し、導出した指標値rに基づいて、対象テキストをブランド辞書に含めるか否かを判定する判定部314とを備えることにより、より適切なブランド辞書を作成することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
100…端末装置、200…販売仲介サーバ、210…販売画面提供部、212…ランキング処理部、214…ログ収集部、220…商品等データ、222…ランキングデータ、224…ログ情報、230…対象語句取得部、232…ブランド名抽出部、234…注意対象商品等特定部、240…ブランド辞書、300…ブランド辞書作成装置、310…クエリ取得部、312…出現数カウント部、314…判定部、316…作成部、320…クエリログ、322…ブランド辞書、C1、thr…第1閾値、C2、thn…第2閾値、C3、thc…第3閾値、ct…出現日数、k…所定数、nt…総出現数、r…指標値

Claims (11)

  1. ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得するクエリ取得部と、
    前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する判定部と、
    を備えるブランド辞書作成装置。
  2. 前記判定部は、前記対象テキストがクエリの先頭に出現した割合に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する、
    請求項1記載のブランド辞書作成装置。
  3. 前記判定部は、前記割合が第1閾値よりも大きい場合、前記対象テキストを前記ブランド辞書に含めると判定する、
    請求項2に記載のブランド辞書作成装置。
  4. 前記判定部は、更に、前記出現数が観測された期間のデータ収集期間に対する比率に基づいて、前記対象テキストを前記ブランド辞書に含めるか否かを判定する、
    請求項1から3のうちいずれか一項に記載のブランド辞書作成装置。
  5. 前記判定部は、更に、データ収集期間の中で前記対象テキストを含むクエリが観測された単位期間の数の、前記データ収集期間の長さに対する比率に基づいて、前記対象テキストを前記ブランド辞書に含めるか否かを判定する、
    請求項1から4のうちいずれか一項に記載のブランド辞書作成装置。
  6. 前記判定部は、前記対象テキストが3文字以上のカタカナで構成されない場合、前記対象テキストを前記ブランド辞書に含めないと判定する、
    請求項1から5のうちいずれか一項に記載のブランド辞書作成装置。
  7. 請求項1から請求項6のうちいずれか一項に記載のブランド辞書作成装置と、
    ネットワークを介して販売される商品またはサービス(以下、商品等)の紹介画面に含まれる対象語句を取得する対象語句取得部と、
    前記ブランド辞書を参照し、前記対象語句の中に含まれるブランド名を抽出するブランド名抽出部と、
    前記ブランド名抽出部により抽出されたブランド名の数に基づいて、注意対象の商品等を特定する監視部と、
    を備える商品等評価装置。
  8. 前記監視部は、前記ブランド名抽出部により抽出されたブランド名の数が所定数以上である場合、前記対象語句が取得された取得元の商品等を前記注意対象の商品等と特定する、
    請求項7に記載の商品等評価装置。
  9. 前記監視部は、前記ブランド名抽出部により抽出されたブランド名の数に基づいて、前記注意対象の商品等を出品した出品者に対する段階的な処理を行う、
    請求項7又は請求項8に記載の商品等評価装置。
  10. コンピュータが、
    ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得し、
    前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定する、
    ブランド辞書作成方法。
  11. コンピュータに、
    ネットワークを介して商品またはサービス(以下、商品等)を販売するための販売画面に対して入力されたクエリを取得させ、
    前記取得されたクエリに含まれる対象テキスト毎に、前記対象テキストがクエリにおいて出現した位置ごとの出現数に基づいて、前記対象テキストをブランド辞書に含めるか否かを判定させる、
    プログラム。
JP2021093596A 2018-08-29 2021-06-03 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム Active JP6960553B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021093596A JP6960553B2 (ja) 2018-08-29 2021-06-03 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018160217A JP6894875B2 (ja) 2018-08-29 2018-08-29 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム。
JP2021093596A JP6960553B2 (ja) 2018-08-29 2021-06-03 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018160217A Division JP6894875B2 (ja) 2018-08-29 2018-08-29 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム。

Publications (2)

Publication Number Publication Date
JP2021176085A true JP2021176085A (ja) 2021-11-04
JP6960553B2 JP6960553B2 (ja) 2021-11-05

Family

ID=69668173

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018160217A Active JP6894875B2 (ja) 2018-08-29 2018-08-29 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム。
JP2021093596A Active JP6960553B2 (ja) 2018-08-29 2021-06-03 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018160217A Active JP6894875B2 (ja) 2018-08-29 2018-08-29 ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム。

Country Status (1)

Country Link
JP (2) JP6894875B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313187A (zh) * 2021-06-09 2021-08-27 有米科技股份有限公司 基于文本信息的品牌识别方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110113063A1 (en) * 2009-11-09 2011-05-12 Bob Schulman Method and system for brand name identification
JP2012141764A (ja) * 2010-12-28 2012-07-26 Yahoo Japan Corp スパム候補抽出装置及びその方法
US8751478B1 (en) * 2011-12-28 2014-06-10 Symantec Corporation Systems and methods for associating brands with search queries that produce search results with malicious websites
US20160180247A1 (en) * 2014-12-20 2016-06-23 Microsoft Technology Licensing, Llc Latency-Efficient Multi-Stage Tagging Mechanism
CN107330752A (zh) * 2017-05-31 2017-11-07 北京京东尚科信息技术有限公司 识别品牌词的方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004070405A (ja) * 2002-08-01 2004-03-04 Mitsubishi Electric Corp Webページの風評情報抽出装置
JP2011175453A (ja) * 2010-02-24 2011-09-08 Kansai Electric Power Co Inc:The キーワード検索システム
JP2012247948A (ja) * 2011-05-26 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> 辞書管理装置、辞書管理方法、辞書管理プログラム
JP5113936B1 (ja) * 2011-11-24 2013-01-09 楽天株式会社 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体
ES2791697T3 (es) * 2012-06-27 2020-11-05 Rakuten Inc Dispositivo de procesamiento de información, método de procesamiento de información, y programa de procesamiento de información
JP5719488B1 (ja) * 2014-12-25 2015-05-20 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
US20160188660A1 (en) * 2014-12-31 2016-06-30 Ebay Inc. Determining search results using session based refinements

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110113063A1 (en) * 2009-11-09 2011-05-12 Bob Schulman Method and system for brand name identification
JP2012141764A (ja) * 2010-12-28 2012-07-26 Yahoo Japan Corp スパム候補抽出装置及びその方法
US8751478B1 (en) * 2011-12-28 2014-06-10 Symantec Corporation Systems and methods for associating brands with search queries that produce search results with malicious websites
US20160180247A1 (en) * 2014-12-20 2016-06-23 Microsoft Technology Licensing, Llc Latency-Efficient Multi-Stage Tagging Mechanism
CN107330752A (zh) * 2017-05-31 2017-11-07 北京京东尚科信息技术有限公司 识别品牌词的方法和装置

Also Published As

Publication number Publication date
JP6894875B2 (ja) 2021-06-30
JP6960553B2 (ja) 2021-11-05
JP2020035126A (ja) 2020-03-05

Similar Documents

Publication Publication Date Title
US10360605B2 (en) Server apparatus, information providing method, information providing program, recording medium recording the information providing program, and information providing system
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
US8812505B2 (en) Method for recommending best information in real time by appropriately obtaining gist of web page and user&#39;s preference
JP5721818B2 (ja) 検索におけるモデル情報群の使用
JP5083669B2 (ja) 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム
AU2012274726B2 (en) Information Processing Apparatus, Information Processing Method, Information Processing Program, Recording the Medium having Stored therein Information Processing Program
TW201944266A (zh) 對話機器人檢索系統、對話機器人檢索方法、及程式
JP5541049B2 (ja) データ生成装置、データの生成方法及びデータ生成プログラム
JP2010086343A (ja) ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
US20150215271A1 (en) Generating suggested domain names by locking slds, tokens and tlds
JP5483269B2 (ja) 情報検索装置、情報検索方法
JP2010044584A (ja) 商品広告配信装置、商品広告配信方法、及び商品広告配信制御プログラム
JP2007018285A (ja) 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム
JP6018338B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20150347423A1 (en) Methods for completing a user search
JP6960253B2 (ja) 商品等評価装置、商品等評価方法、およびプログラム
JP6960553B2 (ja) ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム
KR101655368B1 (ko) 쇼핑 후기를 검색하고 제공하기 위한 방법 및 시스템
JP6964445B2 (ja) ブランド辞書作成装置、ブランド辞書作成方法、およびプログラム
JP6993955B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6982546B2 (ja) 情報提供装置、情報提供方法、およびプログラム
JP2001229171A (ja) 商品検索システム
KR101021204B1 (ko) 인터넷을 이용한 의견 검색 및 광고 서비스 방법
JP6506839B2 (ja) 不満情報処理装置及びシステム
JP2019219731A (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210618

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210914

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211011

R150 Certificate of patent or registration of utility model

Ref document number: 6960553

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350