JP5719488B1 - 情報処理装置、情報処理方法、プログラム、記憶媒体 - Google Patents
情報処理装置、情報処理方法、プログラム、記憶媒体 Download PDFInfo
- Publication number
- JP5719488B1 JP5719488B1 JP2015505751A JP2015505751A JP5719488B1 JP 5719488 B1 JP5719488 B1 JP 5719488B1 JP 2015505751 A JP2015505751 A JP 2015505751A JP 2015505751 A JP2015505751 A JP 2015505751A JP 5719488 B1 JP5719488 B1 JP 5719488B1
- Authority
- JP
- Japan
- Prior art keywords
- product
- keyword
- search
- processing target
- inappropriate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 32
- 238000003860 storage Methods 0.000 title claims description 14
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000012545 processing Methods 0.000 claims abstract description 179
- 238000000034 method Methods 0.000 claims abstract description 104
- 238000000605 extraction Methods 0.000 claims abstract description 41
- 239000000284 extract Substances 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
例えば、特許文献1には、検索のための入力欄(検索入力部)が設けられたウェブページが記載されている。
本発明は、このような課題に鑑みてなされたものであり、商品検索の精度や品質を向上させることを目的とする。
一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出する処理対象商品抽出部と、抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する適否判定部と、前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する不適正キーワード対応処理部と、を備えたものである。
これにより、不適正キーワードを用いた商品検索において適切な検索結果が抽出される。
これにより、商品が属する商品ジャンルにおける検索キーワードの付与傾向を反映した判定が行われる。
これにより、所定回数以上出現するキーワードは、商品ページに必要なキーワードとされ、不適正な検索キーワードとして判定されない。
これにより、商品ごとの事情を鑑み、処理対象商品から除外されるべき商品が処理対象商品として抽出されることが防止される。
これにより、商品ページの情報が記憶されたデータベースが適正化される。
これにより、商品検索の検索結果において、処理対象商品の表示が適正化される。
これにより、商品検索の検索結果において、処理対象商品が表示されない。
この情報処理方法により、商品検索における検索結果が適正なものとなるように処理が実行される。
本発明に係る記憶媒体は、上記プログラムを記憶した記憶媒体である。これらのプログラムや記憶媒体により上記の情報処理装置を実現する。
以下、実施の形態を次の順序で説明する。
<2.ハードウエア構成>
<3.各種データベース>
<4.処理の流れ>
<5.適否判定処理例>
[5−1.適否判定処理の第1例]
[5−2.適否判定処理の第2例]
[5−3.適否判定処理の第3例]
<6.不適正キーワード対応処理例>
[6−1.不適正キーワード対応処理の第1例]
[6−2.不適正キーワード対応処理の第2例]
[6−3.不適正キーワード対応処理の第3例]
[6−4.不適正キーワード対応処理の第4例]
<7.変形例>
<8.まとめ>
<9.プログラム及び記憶媒体>
本実施の形態の電子商取引サーバ1、商品監視サーバ2を含むネットワークシステム全体の構成を図1及び図2を用いて説明する。
図1に示すように、本実施の形態の電子商取引サーバ1は、通信ネットワーク3を介して、商品監視サーバ2、商品提供者端末4、ユーザ端末5と相互に通信可能な状態に接続されている。
処理対象商品抽出部2aは、キーワードDB200Aに記憶されたキーワードセットを用いて検索DB100Eに記憶された情報を検索し、不適正な検索キーワードが紐付けられている可能性のある処理対象商品を抽出する。その際、キーワードDB200Aに記憶された例外商品情報などを利用する。
適否判定部2bは、抽出された処理対象商品に紐付けられている検索キーワードが不適正キーワードであるか否かを判定する。その際、商品DB100Cに記憶された商品情報や商品ページDB100Dに記憶された店舗情報などを利用して判定を行う。
更新処理部2dは、キーワードDB200Aに記憶されたキーワードセットの更新や例外商品情報の更新を行う更新処理を実行する。
また通信ネットワーク3の全部又は一部を構成する伝送媒体についても多様な例が想定される。例えばIEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)、電力線搬送、電話線などの有線でも、IrDA(Infrared Data Association)のような赤外線、ブルートゥース(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網などの無線でも利用可能である。
商品提供者端末4では、必要に応じて各種の送受信処理などが実行される。
ユーザ端末5は、上記の各種サービスを享受するユーザが使用する情報処理装置であり、例えば、通信機能を備えたPC(Personal Computer)やフィーチャーフォンやPDA(Personal Digital Assistants)、或いは、スマートフォンやタブレット端末などのスマートデバイスなどである。
図3は、図1に示した電子商取引サーバ1、商品監視サーバ2、商品提供者端末4及びユーザ端末5のハードウエアを例示する図である。それぞれのサーバや端末におけるコンピュータ装置のCPU(Central Processing Unit)101は、ROM(Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM(Random Access Memory)103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インターフェース105も接続されている。
入出力インターフェース105には、キーボード、マウス、タッチパネルなどよりなる入力装置106、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ、並びにスピーカなどよりなる出力装置107、HDD(Hard Disk Drive)やフラッシュメモリ装置などより構成される記憶部108、通信ネットワーク3を介しての通信処理や機器間通信を行う通信部109が接続されている。
入出力インターフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
CPU101が各種のプログラムに基づいて処理動作を行うことで、電子商取引サーバ1、商品監視サーバ2、商品提供者端末4及びユーザ端末5のそれぞれにおいて後述する情報処理や通信が実行される。
尚、電子商取引サーバ1、商品監視サーバ2、商品提供者端末4及びユーザ端末5を構成するそれぞれの情報処理装置は、図3のようなコンピュータ装置が単一で構成されることに限らず、システム化された複数のコンピュータ装置によって構成されてもよい。複数のコンピュータ装置は、LANなどによりシステム化されていてもよいし、インターネットなどを利用したVPN(Virtual Private Network)などにより遠隔地に配置されたものでもよい。
ユーザDB100Aには、電子商取引サーバ1が提供するサービスを享受する各ユーザの情報が記憶される。
具体的には、例えば図4に示すように、ユーザ情報として、ユーザID(Identification)やログインPW(Passward)、ユーザの氏名や住所や連絡先(電話番号やメールアドレス)などが記憶される。更に、ユーザごとの購入履歴や閲覧履歴などが記憶されてもよい。
尚、ユーザDB100Aには、上記した全ての情報が記憶されている必要はなく、ユーザによって記憶されていない情報があってもよい。但し、少なくともユーザIDとログインPWは記憶されていることが望ましい。
具体的には、例えば図5に示すように、商品提供者情報として、商品提供者ID、ログインPW、店舗名、店舗ロゴ、取扱商品の商品ID(電子商取引サーバ1が商品ごとに付与する商品固有のコード情報)、商品ページURL、商品ごとの価格、商品提供者ページのURL(Uniform Resource Locator)、連絡先(電話番号やメールアドレスなど)などが記憶される。商品ページURLは商品ページごとに付されるURLであり、同一商品であっても商品提供者が異なる場合には、異なる商品ページURLが付される。
店舗ロゴの情報は、画像データそのものでもよいし、保存されている画像データのリンク情報(URL情報)などでもよい。
また、取扱商品情報として、商品IDだけでなく商品の在庫情報などを記憶してもよい。
商品提供者ページのURLとしては、電子商取引サーバ1が提供する商品提供者ページだけでなく、他のサーバによって管理されている商品提供者のウェブページ(例えば店舗のHP(Homepage)など)が記憶されてもよい。
具体的には、例えば図6に示すように、商品情報として、商品ID、商品ジャンル、商品画像、製造者(メーカー)情報、製造者によって付与される型番情報、販売開始日、取扱商品提供者情報などが記憶される。
商品画像の情報は、画像データそのものでもよいし、保存されている画像データのリンク情報(URL情報など)でもよい。
また、商品DB100Cには、上記以外にも、生産地や商品のスペック(色、大きさ、性能情報)などが記憶されてもよい。
具体的には、図7Aに示すように、商品ページごとに、HTMLデータやHTMLデータに記載される画像データなどが紐付けられて記憶される。HTMLデータには、例えば図7Bに示すように、商品名や型番情報、商品ID、価格情報、また、商品画像や商品の説明文などが、ウェブページ上における配置情報と共に記憶される。更に、HTMLデータには、購入する商品の個数を入力する欄などのいくつかの入力欄や、SNS(Social Networking Service)へ当該商品情報を投稿するためのボタンなどの情報も、ウェブページ上における配置情報と共に記憶される。
検索DB100Eに記憶された各種の情報は、定期的に商品ページDB100Dをクローリングすることにより更新される。
具体的には、例えば図9に示すように、キーワードセットIDに対して、複数の検索キーワードと、例外情報が紐付けて記憶される。
また、キーワードセットID0002として、ブランドE、ブランドF、ブランドGが紐付けられている。更にキーワードセットIDがKS0002とされたキーワードセットには、例外情報としてブランドEとブランドGが紐付けられている。ブランドEとブランドGは、例えば姉妹ブランドなどとされ、一つの商品に対して共に紐付けられる可能性があるため、例外情報として記憶される。従って、この場合には、ブランドE、ブランドFの組合せが一つの商品に紐付けられている場合と、ブランドF、ブランドGの組合せが一つの商品に紐付けられている場合には、不適切とされる。
また、キーワードセットIDがKS0267とされたキーワードセットには複数の歌手が紐付けられ、例外情報として、複数の歌手の曲を一つのCD(Compact Disc)にまとめたオムニバスCDの商品ID(I2129)が紐付けられている。
自動的に選定を行う場合、例えば、商品ジャンルが被っているブランド名を選定し、キーワードセットとして登録することが考えられる。
また、キーワードセットには、2個以上であれば、3個、或いは4個の検索キーワードが紐付けられていてもよい。
電子商取引サーバ1が管理する各商品に対して、商品監視サーバ2が不適正キーワードを検出して対応するまでの処理の流れを、図10を参照して説明する。
以下の説明では、「ブランドA」、「ブランドC」を含む複数の検索キーワードが紐付けられた「商品A」を用いて、具体的に説明する。
続いて、ステップS103において、処理対象商品抽出部2aは、ステップS102で選択した検索キーワードを用いた商品検索を行い、検索結果を取得する。商品検索は、例えば、検索DB100Eを対象として行う。このとき、適正フラグが「不適正」とされた商品ページは検索結果として抽出されない。
この場合、続くステップS105において処理対象商品抽出部2aは、ステップS103で取得した各検索キーワードに基づくそれぞれの検索結果に、同一の商品が含まれているか否かを判定する。同一の商品が含まれている場合、処理対象商品抽出部2aは、当該商品を処理対象商品と判定する。尚、同一の商品とは、同一の商品ページで販売されている商品であり、換言すれば、同一の商品提供者によって販売されている同一の商品となる。
同一の商品が複数の検索結果に含まれている場合、当該商品には、一つの商品に対して共に紐付けられにくい複数の検索キーワードが紐付けられている。この場合、処理対象商品抽出部2aは続くステップS106において、当該商品が処理対象商品の例外に該当するか否かを判定する。具体的には、「ブランドA」を用いた商品検索の検索結果と「ブランドC」を用いた商品検索の検索結果に「商品A」が含まれている場合、「商品A」が処理対象商品の例外に該当するか否かを判定する。
当該商品、即ち、「商品A」が例外に該当すると判定した場合には、次にステップS109を実行する。
次に、ステップS109で商品監視サーバ2は、ステップS105において判定した複数の検索結果に含まれる同一の商品が他にあるか判定する。具体的には、「商品A」以外に複数の検索結果に含まれる商品があるか判定する。他の商品がある場合には、ステップS106乃至S109を繰り返し実行する。
他の商品が無い場合には、続くステップS110において商品監視サーバ2は、未調査のキーワードセット(即ち、ステップS102乃至S109の一連の処理が実行されていないキーワードセット)があるか否かを判定する。
未調査のキーワードセットがある場合、商品監視サーバ2はステップS101の処理を再び実行する。未調査のキーワードセットが無い場合、商品監視サーバ2は図10に示す一連の処理を終了する。
[5−1.適否判定処理の第1例]
ここでは、図10のステップS107で説明した適否判定処理の例を説明する。
適否判定処理の第1例では、商品ページにおける検索キーワードの出現回数に基づいて、適否の判定を行う。具体的に、図11を参照して説明する。
先ず、ステップS201において適否判定部2bは、商品ページDB100Dから、処理対象商品としての「商品A」の商品ページの構成を記載したHTMLファイルを取得し、HTMLファイル内に「ブランドA」が出現する回数をカウントする。
続いて、適否判定部2bはステップS202において、出現回数が閾値未満であるか否かを判定する。閾値未満であった場合、続くステップS203において適否判定部2bは「ブランドA」は「商品A」に紐付けられるべきでない不適正キーワードとして判定する。
一方、閾値以上であった場合、適否判定部2bはステップS204において、「ブランドA」は「商品A」に紐付けられていてもよい適正キーワードとして判定する。
適否判定処理の第2例では、商品が属するジャンルに基づいて、適否判定処理の第1例で述べた閾値を変更する。具体的に、図12を参照して説明する。
先ず、適否判定部2bはステップS301において、処理対象商品としての「商品A」の商品ジャンル情報を取得する。
次に、適否判定部2bはステップS302において、商品ジャンルが特定のジャンルであるか否かを判定する。これは、例えば、キーワードDB200Aに記憶された情報を基に判断する。特定のジャンルであると判定した場合、適否判定部2bは続くステップS303において閾値を下げる。特定のジャンルに属する「商品A」に紐付けられたメーカー名の出現回数(HTMLファイル内や商品ページ内での出現回数)の閾値(適否判定処理の第1例で示した閾値)を下げる処理を実行する。
一方、特定のジャンルでないと判定した場合、図12に示した一連の処理を終了する。
例えば、「商品A」のジャンル情報が「デスクトップパソコン」であった場合、「商品A」には様々なメーカーの部品が搭載されていることが予想される。
閾値を下げることにより、各メーカー名の出現回数が閾値を超えやすくなるため、不適正な検索キーワードとして判定されにくくすることができる。
適否判定処理の第3例では、商品ページにおける検索キーワードの出現態様に基づいて、適否判定を行う。具体的に、図13を参照して説明する。
先ず、適否判定部2bはステップS401において、検索キーワードの出現態様を取得する。例えば、検索キーワードが文章中に出現するのか、或いは、羅列された検索キーワードとして出現するのかを取得する。
次に、適否判定部2bはステップS402において、ステップS401の取得結果が単語(検索キーワード)の羅列であるか否かを判定する。単語の羅列であった場合、適否判定部2bはステップS403において、当該検索キーワードを不適正キーワードとして判定する。
一方、単語の羅列でなかった場合、適否判定部2bはステップS404において、当該検索キーワードを適正キーワードとして判定する。
これにより、例えば、「○○と同品質を確保しつつ、低価格を実現!」という文章中にでてくる「○○」は、不適正な検索キーワードとして判定しない。しかし、「○○、△△、□□」のように、検索結果として当該商品が抽出されやすくするために「○○」、「△△」、□□」という検索キーワードを単に羅列したに過ぎない記載に対しては、不適正な検索キーワードとして判定する。
[6−1.不適正キーワード対応処理の第1例]
ここでは、図10のステップS108で説明した不適正キーワード対応処理の例を説明する。
不適正キーワード対応処理の第1例では、検索DB100Eにおいて、検索キーワードが不適正キーワードとして判定された処理対象商品の商品ページと不適正キーワードの紐付けは維持したまま、不適正キーワードを用いた商品検索の検索結果として処理対象商品が抽出されないように情報を書き換える処理を行う。具体的には、図8に示す検索DB100Eにおいて、不適正キーワードとして判定された検索キーワードに紐付けられた処理対象商品の商品ページの適正フラグを「適正」から「不適正」に変更する(図14のステップS501)。
これにより、不適正キーワードを用いた商品検索の検索結果として、処理対象商品が抽出されなくなる。
不適正キーワード対応処理の第2例では、商品ページDB100Eにおいて、検索キーワードが不適正キーワードとして判定された処理対象商品の商品ページのHTMLデータから、不適正キーワードの削除を行う(図15のステップS601)。これにより、商品ページDB100Eの更新時における商品ページのクローリング作業において、不適正キーワードと処理対象商品の紐付けが解消される。従って、以降の不適正キーワードを用いた商品検索において、紐付けが解消された処理対象商品が検索結果として抽出されなくなる。
尚、HTMLデータから不適正キーワードの削除を行う替わりに、HTMLデータに記載された不適正キーワードを別の文言に書き換えてもよい。具体的には、不適正キーワードを「削除されました」等の文言に書き換えるなどである。これによっても、上記した効果を得ることができる。
不適正キーワード対応処理の第3例では、検索DB100Eに記憶された優先度(表示優先度)を低下させる処理を行う。具体的には、検索キーワードに紐付けられた各商品ページの一覧の中で、当該検索キーワードが不適正キーワードとして判定された処理対象商品の商品ページの優先度情報を低下させる(図16のステップS701)。これにより、不適正キーワードを用いた商品検索の検索結果として、処理対象商品が上位に表示されなくなる。
不適正キーワード対応処理の第4例では、検索DB100Eにおいて処理対象商品が紐付けられた全ての検索キーワードに対して、当該処理対象商品の適正フラグを「適正」から「不適正」に変更する非表示処理を実行する(図17のステップS801)。この処理は、例えば、当該商品が検索結果として表示される機会を増やすために様々な検索キーワードを商品ページに記載しているような悪質な商品ページに対して行われる。これにより、何れの検索キーワードを用いて商品検索を行っても、検索結果に当該処理対象商品が抽出されなくなる。即ち、商品検索の検索結果から処理対象商品が除外される。
先のステップS105の説明において、同一の商品が複数の検索結果に含まれているか否かを判定したが、所定の数の検索結果に含まれているか否かを判定してもよい。具体的に、図18を参照して説明する。尚、図10で説明した処理と同様の処理は、図10と同じ符号を付して説明を省略する。
例えば、所定の数として3を選択した場合、ステップS101とステップS102の間のステップS701において、処理対象商品抽出2aは、取得したキーワードセットに所定の数(=3)以上の検索キーワードが含まれているかを判定する。
所定の数以上の検索キーワードが含まれていなかった場合、処理対象商品抽出2aは、ステップS110の処理で次のキーワードセットを取得するか否かを判定する。
所定の数以上の検索キーワードが含まれていた場合、ステップS102の検索キーワード取得処理を実行する。
尚、処理対象商品抽出2aは、図10のステップS105の替わりに図18のステップS702として、所定の数(=3)以上の検索結果に該当する商品があるか否かを判定する。
これにより、商品が過剰に処理対象商品として判定されてしまうことを抑制することができる。
具体的に図19を参照して説明する。尚、図10で説明した処理と同様の処理は、図10と同じ符号を付し、図18で説明した処理と同様の処理は図18と同じ符号を付し、説明を省略する。
検索キーワードが所定の数以上含まれているキーワードセットであった場合、続いて、処理対象商品抽出2aは、ステップS801において、キーワードセットに属する検索キーワードから所定の数の検索キーワードを一つの組合せとして選択する。次のステップS802では、処理対象商品抽出2aは、ステップS801で選択した所定の数の検索キーワードを用いた商品検索を実行する。このときの商品検索は、複数の検索キーワード全てに紐付けられた商品が抽出されるアンド検索となる。
実行していない組合せが無い場合、処理対象商品抽出2aはステップS110において、未調査のキーワードセットがあるか否かを判定する。
ステップS803において、アンド検索の検索結果として抽出された商品があると判定した場合、処理対象商品抽出2aは、先のステップS106乃至ステップS108を実行する。
これまで説明してきたように、本実施の形態の商品監視サーバ2は、一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているキーワードDB200Aを参照し、一つのキーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベース(商品DB100C、商品ページDB100D、検索DB100Eなど)を対象とした商品検索を行い、処理対象商品を抽出する処理対象商品抽出部2aと、抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する適否判定部2bと、不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する不適正キーワード対応処理部2cと、を備えている。
これにより、不適正キーワードを用いた商品検索において適切な検索結果が抽出される。
従って、商品検索の精度や品質を向上させることができる。
これにより、商品が属する商品ジャンルにおける検索キーワードの付与傾向を反映した判定が行われる。例えば、複数のメーカー名が紐付けられた商品が多い商品ジャンルにおいては、前述した適否判定処理の第2例のように、閾値を下げることで、各メーカー名が不適正な検索キーワードとして判定されてしまうことを防止することができる。
商品ページにおいて所定回数以上出現するキーワードは、単に商品ページが商品検索に掛かりやすくするために記載されたものでなく、商品の説明を行う上で必要なものである可能性が高い。従って、上記の判定を実行することにより、商品ページにおいて所定回数以上出現するキーワードは、必要なキーワードとされ、不適正な検索キーワードとして判定されない。
これにより、商品の説明に必要なキーワードなどが不適正キーワードとして判定されることを抑制することができる。
これにより、商品ごとの事情を鑑み、処理対象商品から除外されるべき商品が処理対象商品として抽出されることが防止される。例えば、様々な商品によって構成される福袋などの商品は、様々なキーワードが紐づけられる可能性が高いことは明らかである。そこで、そのような商品は、処理対象商品から除外されることが望ましい。
先のステップS106で説明した処理を実行することにより、このような商品が処理対象商品から除外され、適切に処理対象商品の抽出を行うことができる。
具体的には、先の不適正キーワード対応処理の第2例で説明したように、商品ページのHTMLデータから当該不適正キーワードを削除する処理や、書き換える処理などを実行する。
これにより、商品ページの情報が記憶されたデータベースが適正化される。
従って、商品検索によって抽出される検索結果の適正化が図られる。
これにより、商品検索の検索結果において、処理対象商品の表示が適正化される。
従って、商品検索の精度が向上すると共に、不適正な記載のある商品ページをユーザが閲覧する頻度が低下し、商品検索の品質の低下を感じさせることを抑制することができる。
例えば、処理対象商品が紐付けられた全ての検索キーワードに対して、当該処理対象商品の適正フラグを「適正」から「不適正」に変更する処理を実行する。
これにより、商品検索の検索結果において、処理対象商品が表示されない。
従って、不適正な記載のある商品ページをユーザが閲覧する頻度が更に低下し、商品検索の品質の低下を感じさせることを、より抑制することができる。
以上、本発明の商品監視サーバ2を説明してきたが、実施の形態のプログラムは、商品監視サーバ2における処理を演算処理装置(CPUなど)に実行させるプログラムである。
また、一つのキーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い処理対象商品を抽出する処理を演算処理装置に実行させる。
更に、抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する処理を演算処理装置に実行させる。
加えて、不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を演算処理装置に実行させる。
即ちこのプログラムは、演算処理装置に対して、図10で説明したステップS101乃至ステップS110の各処理、図11で説明したステップS201乃至ステップS204の各処理、図12で説明したステップS301乃至ステップS303の各処理、図13で説明したステップS401乃至ステップS404の各処理、図14のステップS501の処理、図15のステップS601の処理、図16のステップS701の処理、図17のステップS801の処理、図18で説明した各処理、図19で説明した各処理を実行させるプログラムである。
そしてこのようなプログラムはコンピュータ装置などの機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROMなどに予め記憶しておくことができる。或いはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的或いは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータなどにインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
Claims (10)
- 一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出する処理対象商品抽出部と、
抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する適否判定部と、
前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する不適正キーワード対応処理部と、を備えた
情報処理装置。 - 前記適否判定部は、前記処理対象商品が属するジャンル情報を用いて前記判定を行う
請求項1に記載の情報処理装置。 - 前記適否判定部は、前記処理対象商品の商品情報が記載された商品ページにおける前記不適正キーワードの出現回数を用いて前記判定を行う
請求項1に記載の情報処理装置。 - 前記処理対象商品抽出部は、前記処理対象商品から除外される商品情報が記憶されたデータベースを参照して前記抽出を行う
請求項1に記載の情報処理装置。 - 前記不適正キーワード対応処理部は、前記不適正キーワード対応処理として、商品ページの情報が記憶されたデータベースにおいて、前記処理対象商品の商品ページに係る前記不適正キーワードの記載に対する適正化処理を実行する
請求項1に記載の情報処理装置。 - 前記不適正キーワード対応処理部は、前記不適正キーワード対応処理として、商品検索の検索結果における前記処理対象商品の表示優先度を低下させる処理を実行する
請求項1に記載の情報処理装置。 - 前記不適正キーワード対応処理部は、前記不適正キーワード対応処理として、商品検索の検索結果の表示から前記処理対象商品を除外する非表示処理を実行する
請求項1に記載の情報処理装置。 - 情報処理装置に実行させる情報処理方法であって、
一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出し、
抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定し、
前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する
情報処理方法。 - 一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出する手順と、
抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する手順と、
前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する手順とを
演算処理装置に実行させるプログラム。 - 一つの商品に対して共に付与されにくい複数の検索キーワードの組み合わせがキーワードセットとして予め選定され、登録されているデータベースを参照し、一つの前記キーワードセットに属する各検索キーワードを用いて、商品情報が記憶されたデータベースを対象とした商品検索を行い、処理対象商品を抽出する手順と、
抽出された処理対象商品について、処理対象商品抽出に用いたキーワードセットの各検索キーワードのうちで、当該処理対象商品に付与されるべきでない検索キーワードを不適正キーワードとして判定する手順と、
前記不適正キーワードと判定された検索キーワードを用いた商品検索の検索結果を適正化させる不適正キーワード対応処理を実行する手順とを
演算処理装置に実行させるプログラムを記憶した記憶媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/084255 WO2016103383A1 (ja) | 2014-12-25 | 2014-12-25 | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5719488B1 true JP5719488B1 (ja) | 2015-05-20 |
JPWO2016103383A1 JPWO2016103383A1 (ja) | 2017-04-27 |
Family
ID=53277823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015505751A Active JP5719488B1 (ja) | 2014-12-25 | 2014-12-25 | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10846773B2 (ja) |
JP (1) | JP5719488B1 (ja) |
TW (1) | TWI573032B (ja) |
WO (1) | WO2016103383A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108876424A (zh) * | 2017-05-12 | 2018-11-23 | 广东原昇信息科技有限公司 | 一种sem关键词投放决策方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6964445B2 (ja) * | 2017-06-21 | 2021-11-10 | ヤフー株式会社 | ブランド辞書作成装置、ブランド辞書作成方法、およびプログラム |
JP6894875B2 (ja) * | 2018-08-29 | 2021-06-30 | ヤフー株式会社 | ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム。 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007286701A (ja) * | 2006-04-12 | 2007-11-01 | Fumio Kobayashi | 電子ショッピングモールシステム及び電子ショッピングモールシステム用コンピュータ装置 |
JP2012234340A (ja) * | 2011-04-28 | 2012-11-29 | Tensor Consulting Co Ltd | 商品キーワード管理システム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8676830B2 (en) * | 2004-03-04 | 2014-03-18 | Yahoo! Inc. | Keyword recommendation for internet search engines |
US20090299998A1 (en) * | 2008-02-15 | 2009-12-03 | Wordstream, Inc. | Keyword discovery tools for populating a private keyword database |
TWI547888B (zh) | 2010-08-27 | 2016-09-01 | Alibaba Group Holding Ltd | A method of recording user information and a search method and a server |
CN102567408B (zh) * | 2010-12-31 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 推荐搜索关键词的方法和装置 |
JP5596101B2 (ja) | 2012-10-26 | 2014-09-24 | 楽天株式会社 | 商品検索支援サーバ、商品検索支援方法、商品検索支援プログラム、及びそのプログラムを記憶するコンピュータ読み取り可能な記録媒体 |
-
2014
- 2014-12-25 WO PCT/JP2014/084255 patent/WO2016103383A1/ja active Application Filing
- 2014-12-25 JP JP2015505751A patent/JP5719488B1/ja active Active
- 2014-12-25 US US15/527,413 patent/US10846773B2/en active Active
-
2015
- 2015-12-21 TW TW104142951A patent/TWI573032B/zh active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007286701A (ja) * | 2006-04-12 | 2007-11-01 | Fumio Kobayashi | 電子ショッピングモールシステム及び電子ショッピングモールシステム用コンピュータ装置 |
JP2012234340A (ja) * | 2011-04-28 | 2012-11-29 | Tensor Consulting Co Ltd | 商品キーワード管理システム |
Non-Patent Citations (1)
Title |
---|
"アクセス数を狙って無関係なキーワードを商品説明に入れるのは楽天でNGに", [ONLINE], vol. [検索日2015.3.10],インターネット, JPN6015010272, 25 September 2012 (2012-09-25), JP, ISSN: 0003029948 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108876424A (zh) * | 2017-05-12 | 2018-11-23 | 广东原昇信息科技有限公司 | 一种sem关键词投放决策方法 |
Also Published As
Publication number | Publication date |
---|---|
TWI573032B (zh) | 2017-03-01 |
TW201629809A (zh) | 2016-08-16 |
US20170330260A1 (en) | 2017-11-16 |
US10846773B2 (en) | 2020-11-24 |
JPWO2016103383A1 (ja) | 2017-04-27 |
WO2016103383A1 (ja) | 2016-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6619024B2 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
US10438270B2 (en) | Apparatus and method for information processing and recording | |
US20140019442A1 (en) | Using Application Market Log Data To Identify Applications Of Interest | |
JP5627061B1 (ja) | 検索装置、検索方法、プログラム及び記憶媒体 | |
JP6204637B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP6469194B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
WO2015198376A1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP5728630B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP2020057321A (ja) | 情報処理装置、情報処理方法 | |
JP5719488B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP6754808B2 (ja) | 情報処理装置、情報処理方法 | |
JP6085730B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
TWI569157B (zh) | Information processing device, information processing method, memory media | |
JP6349466B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記憶媒体 | |
JP5899386B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP5890079B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP5890081B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP5639315B1 (ja) | 検索装置、サジェストワード提示方法、プログラム及び記憶媒体 | |
JP5871352B1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JPWO2017037867A1 (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20150305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150317 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5719488 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |