JP6382139B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP6382139B2 JP6382139B2 JP2015058224A JP2015058224A JP6382139B2 JP 6382139 B2 JP6382139 B2 JP 6382139B2 JP 2015058224 A JP2015058224 A JP 2015058224A JP 2015058224 A JP2015058224 A JP 2015058224A JP 6382139 B2 JP6382139 B2 JP 6382139B2
- Authority
- JP
- Japan
- Prior art keywords
- score
- diffusivity
- category
- matching
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 18
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000009792 diffusion process Methods 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 29
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000000877 morphologic effect Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000003712 anti-aging effect Effects 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、第1の実施形態に係るサービス提供システム100の全体構成を示す図である。図1に示すように、サービス提供システム100は、サービス提供サーバ1、複数のユーザ端末2とを有する。サービス提供システム100において、サービス提供サーバ1とユーザ端末2とは、インターネット、LAN、携帯電話網などの通信ネットワーク3を介して通信可能に接続されている。
図2は、サービス提供サーバ1のハードウェア構成を示す図である。
図3は、検索先情報管理DB14が管理する、検索先情報管理テーブルの一例を示す図である。検索先情報管理DB14は、図3に示す検索先情報管理テーブルにて、通知情報ID、アカウント、カテゴリー、通知情報の項目を含む検索先情報を管理する。通知情報IDは、広告、商品、記事等の検索対象に応じた通知情報を識別するための情報である。アカウントは、通知情報の提供者の情報であり、例えば、広告主の企業等である。カテゴリーは、検索対象またはそのアカウントが属する領域の情報であり、検索対象に対応付けて予め登録される。通知情報は、ユーザ端末2に通知する情報であり、例えば、広告やレコメンド等のタイトルと本文の情報であるタイトル/ディスクリプションである。なお、レコメンドとは、ショッピング、オークション、ニュース等のサービスを提供するWebサイトにて表示する、ユーザにお勧めする商品や記事等のことである。
図1に示すように、寄与度算出部11は、拡散度算出部112、スコア算出部113、寄与度判断部114を有する。
ここで、Nは全カテゴリーの数であり、piは、i番目のカテゴリーで当該単語が現れた数である出現回数を、全カテゴリーで当該単語が現れた数で割った値、つまりi番目のカテゴリーに当該単語が現れる割合である。例えば、全カテゴリーの数Nが32であり、「教育」のカテゴリーにおける「家庭教師」の数が1/5であり、「健康」のカテゴリーにおける「家庭教師」の数が1/10であり、それ以外のカテゴリーにおける「家庭教師」の数が0であったとすると、全カテゴリーにおける「家庭教師」の数は1/5+1/10=3/10であり、「教育」、「健康」のカテゴリーにおいて「家庭教師」が現れる割合はそれぞれ(1/5)/(3/10)=2/3、(1/10)/(3/10)=1/3であるから、「家庭教師」のエントロピーH(X)は、H(X)=−2/3×log2(2/3)−1/3×log2(1/3)≒0.39+0.53≒0.92である。
図7は、寄与度算出部11の処理のフローチャートである。
第1の実施形態により、単語毎のカテゴリーに対する拡散度に応じて、検索に用いない単語の集合であるストップワードのリストを自動で生成することができる。それにより、例えば、ユーザの行動履歴から付与されている単語集号やユーザに入力された単語集合に基づいて、広告やレコメンド等の情報を検索するとき、例えば「対策」という単語が、老化対策、地震対策、婚活対策など、美容、保険、ウェディングなどのカテゴリーに分布するような単語である場合は、そのような単語をマッチングから除外することができる。
第1の実施形態では、拡散度算出部112及びスコア算出部113が、通知情報に含まれる要素の拡散度及びスコアを、エントロピーに基づいて算出したが、第2の実施形態では、出現頻度tf(Term Frequency)の変動係数に基づいて算出する。
ここで、分子のnijは単語iのカテゴリーjにおける出現回数、wnはカテゴリーjの総単語数である。例えば、「新品」という単語が、「ゲーム」のカテゴリーで出品されている商品のタイトル等の中で10000回使用されており、「ゲーム」のカテゴリーで出品されている商品等のタイトル中の全単語の全使用回数が100000回である場合、単語「新品」のカテゴリー「ゲーム」における出現頻度tfは、tf=10000/100000=1/10となる。
これにより、例えば、「新品」、「未使用」、「ブラック」等の単語が、「ゲーム」のカテゴリーのみならず、他のカテゴリーにおいても、商品のタイトル等に普遍的に使われている場合は、変動係数CVの値は小さくなる。一方、「N社」、「"ゲーム機の機種名"」等の単語が、「ゲーム」のカテゴリー以外のカテゴリーではあまり使われている場合は、変動係数CVの値は大きくなる。
第2の実施形態により、第1の実施形態と同様の効果を得られる。例えば、オークションサイトにて、ユーザが「新品 未使用 N社 "ゲーム機の機種名" ブラック」というタイトルの商品を閲覧した際に、当該ユーザに対するレコメンドを検索するための単語から、「新品」、「未使用」、「ブラック」等の単語をマッチングから除外し、「N社」、「"ゲーム機の機種名"」の単語に基づいてレコメンドを検索することができる。
第1の実施形態及び第2の実施形態では、通知情報選択部12は、ユーザの行動履歴から付与されている単語集号やユーザに入力された単語集合に基づいて通知情報を検索していたが、第3の実施形態では、Webサイトに含まれる単語集合に基づいて通知情報を検索する。
第1乃至第3の実施形態では、拡散度算出部112は、検索先情報管理DB14に格納されている情報を取得し、取得した情報の要素毎の拡散度を算出していた。
第4の実施形態により、単語毎の検索元情報のカテゴリーに対する拡散度に応じて、検索に用いない単語の集合であるストップワードのリストを自動で生成することができる。それにより、例えば、多くのユーザの行動履歴やWebサイトで使用されている単語、あるいはユーザやWebサイトがクラスターやグループに分けられている場合に、多くのクラスターやグループで用いられている単語を、例えば広告やレコメンド等の情報を検索する際のマッチングから除外することができる。
第5の実施形態では、検索先情報管理DB14に格納されている通知情報と、検索元情報管理DB15に格納されている検索元情報の両方に基づいてスコアを算出する。
第6の実施形態では、寄与度判断部114による判断を行わずに、要素と、当該要素のスコアとを対応付けてサービス提供サーバ1に格納する。それにより、サービス提供サーバ1にて、要素毎のスコアを、マッチングに寄与する度合いを示す連続値のスコアとして用いることができる。
(ステップS408)、ステップS403の処理に戻る。読み出していれば(ステップS407でYES)、全ての通知情報IDを読み出したか判断し(ステップS409)、読み出していなければ(ステップS409でNO)、次の通知情報IDを読み出し(ステップS410)、ステップS402の処理に戻る。読み出していれば(ステップS409でYES)、通知情報スコアが高い順に、ユーザ端末2に通知する所定の数の通知情報IDを選択する(ステップS411)。
第6の実施形態により、単語毎のカテゴリー毎の拡散度に応じて、単語毎に、マッチングに寄与する度合いを示すスコアを算出することができる。また、算出したスコアを、所定のシステムや機械学習の新たな重みとして利用することができる。
なお、検索に用いる要素は、単語に限らず、属性情報や音情報等であってもよい。例えば、ユーザの年齢、性別、資格等の属性情報を検索元情報とし、お見合いや企業の求人等で要求されている属性情報を検索先情報としてもよい。
11 寄与度算出部
112 拡散度算出部
113 スコア算出部
114 寄与度判断部
115 スコア格納部
12 通知情報選択部
13 サービス提供部
14 検索先情報管理DB
15 検索元情報管理DB
16 寄与度管理DB
17 除外要素格納DB
18 検索先寄与度管理DB
19 検索元寄与度管理DB
2 ユーザ端末
3 通信ネットワーク
100 サービス提供システム
Claims (10)
- 検索対象に応じた要素の集合と、前記検索対象が属するカテゴリーを取得し、当該カテゴリー及び他のカテゴリーに属する集合において前記要素が出現する程度に基づき、前記要素の拡散度を算出する拡散度算出手段と、
前記拡散度に基づいて、前記要素がマッチングに寄与する度合いを示すスコアを算出するスコア算出手段と、
を備え、
前記拡散度算出手段は、前記マッチングを行う基となる要素と、前記マッチングを行う対象となる要素の両方の前記拡散度を算出する、情報処理装置。 - 前記要素に対する前記スコアが所定の閾値を超えたか否かに基づいて、前記要素をマッチングから除外するか否かを判断する判断手段と、
マッチングから除外すると判断された前記要素を格納する格納手段と、
を備える請求項1記載の情報処理装置。 - スコア算出部は、
前記拡散度に基づく連続値のスコアを算出し、
前記スコアに基づいて、前記マッチングの結果を選択する選択手段と、
を備える請求項1記載の情報処理装置。 - 前記選択手段は、
前記スコアと、前記要素毎の重みとに基づいて、前記マッチングの結果を選択する、
請求項3記載の情報処理装置。 - 前記拡散度は、
前記カテゴリーに対する前記要素のエントロピーである、
請求項1乃至4いずれか一項に記載の情報処理装置。 - 拡散度算出手段は、前記拡散度を、前記カテゴリーに対する前記要素の出現頻度の変動係数に基づいて算出する、
請求項1乃至4いずれか一項に記載の情報処理装置。 - 前記要素は、前記マッチングを行う対象の情報を形態素解析することにより生成された単語である、
請求項1乃至6いずれか一項に記載の情報処理装置。 - 前記要素は、前記マッチングの結果を通知するユーザに対応付けて記録されている単語、またはユーザがアクセスするコンテンツを形態素解析することにより生成された単語である、
請求項1乃至6いずれか一項に記載の情報処理装置。 - 情報処理装置が実行する情報処理方法であって、
検索対象に応じた要素の集合と、前記検索対象が属するカテゴリーを取得し、当該カテゴリー及び他のカテゴリーに属する集合において前記要素が出現する程度に基づき、前記要素の拡散度を算出する拡散度算出ステップと、
前記拡散度に基づいて、前記要素がマッチングに寄与する度合いを示すスコアを算出するスコア算出ステップと、
を有し、
前記拡散度算出ステップは、前記マッチングを行う基となる要素と、前記マッチングを行う対象となる要素の両方の前記拡散度を算出する、
情報処理方法。 - コンピュータに、
検索対象に応じた要素の集合と、前記検索対象が属するカテゴリーを取得し、当該カテゴリー及び他のカテゴリーに属する集合において前記要素が出現する程度に基づき、前記要素の拡散度を算出する拡散度算出ステップと、
前記拡散度に基づいて、前記要素がマッチングに寄与する度合いを示すスコアを算出するスコア算出ステップと、
を実行させ、
前記拡散度算出ステップは、前記マッチングを行う基となる要素と、前記マッチングを行う対象となる要素の両方の前記拡散度を算出する、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015058224A JP6382139B2 (ja) | 2015-03-20 | 2015-03-20 | 情報処理装置、情報処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015058224A JP6382139B2 (ja) | 2015-03-20 | 2015-03-20 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016177626A JP2016177626A (ja) | 2016-10-06 |
JP6382139B2 true JP6382139B2 (ja) | 2018-08-29 |
Family
ID=57070237
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015058224A Active JP6382139B2 (ja) | 2015-03-20 | 2015-03-20 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6382139B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08221447A (ja) * | 1995-02-10 | 1996-08-30 | Canon Inc | 文書自動分類装置 |
JP3978221B2 (ja) * | 2003-12-26 | 2007-09-19 | 松下電器産業株式会社 | 辞書作成装置および辞書作成方法 |
JP2007164583A (ja) * | 2005-12-15 | 2007-06-28 | Oki Electric Ind Co Ltd | 判定装置,判定方法および判定プログラム |
JP4587236B2 (ja) * | 2008-08-26 | 2010-11-24 | Necビッグローブ株式会社 | 情報検索装置、情報検索方法、およびプログラム |
CN102141977A (zh) * | 2010-02-01 | 2011-08-03 | 阿里巴巴集团控股有限公司 | 一种文本分类的方法及装置 |
CN102609422A (zh) * | 2011-01-25 | 2012-07-25 | 阿里巴巴集团控股有限公司 | 类目错放识别方法和装置 |
-
2015
- 2015-03-20 JP JP2015058224A patent/JP6382139B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016177626A (ja) | 2016-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6388988B2 (ja) | オンライン・ソーシャル・ネットワークにおける検索クエリのための静的ランク付け | |
JP6377807B2 (ja) | オンライン・ソーシャル・ネットワークにおける検索クエリの書き換え | |
US10452662B2 (en) | Determining search result rankings based on trust level values associated with sellers | |
US9858308B2 (en) | Real-time content recommendation system | |
US9244917B1 (en) | Generating a layout | |
JP6334696B2 (ja) | ハッシュタグおよびコンテンツ提示 | |
US11275748B2 (en) | Influence score of a social media domain | |
US20140032264A1 (en) | Data refining engine for high performance analysis system and method | |
US20140278939A1 (en) | Advertisement extraction device and advertisement extraction method | |
US10592565B2 (en) | Method and apparatus for providing recommended information | |
US10262057B2 (en) | Presenting content in accordance with a placement designation | |
US20130246432A1 (en) | Providing content based on online topical trends | |
US11036817B2 (en) | Filtering and scoring of web content | |
US20120124070A1 (en) | Recommending queries according to mapping of query communities | |
US10169711B1 (en) | Generalized engine for predicting actions | |
CA2874614A1 (en) | Product and content association | |
JP5985543B2 (ja) | 情報集計装置、情報集計方法及び情報集計プログラム | |
US9336330B2 (en) | Associating entities based on resource associations | |
CN108694174B (zh) | 内容投放数据的分析方法及装置 | |
KR20210091125A (ko) | 사용자 참여를 사용하는 엔티티 기반 검색 시스템 | |
US9400789B2 (en) | Associating resources with entities | |
JP6382139B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US20180039643A1 (en) | Analysis and management of resources in a network | |
US20160063109A1 (en) | Query-breadth selected search result sorting mechanism | |
JP2012093863A (ja) | 広告選択装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170313 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180801 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6382139 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |