JP5908338B2 - 特徴語選定サーバ及び特徴語選定方法 - Google Patents
特徴語選定サーバ及び特徴語選定方法 Download PDFInfo
- Publication number
- JP5908338B2 JP5908338B2 JP2012107406A JP2012107406A JP5908338B2 JP 5908338 B2 JP5908338 B2 JP 5908338B2 JP 2012107406 A JP2012107406 A JP 2012107406A JP 2012107406 A JP2012107406 A JP 2012107406A JP 5908338 B2 JP5908338 B2 JP 5908338B2
- Authority
- JP
- Japan
- Prior art keywords
- feature word
- speech
- feature
- parts
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010187 selection method Methods 0.000 title claims description 16
- 238000000605 extraction Methods 0.000 claims description 30
- 230000001186 cumulative effect Effects 0.000 claims description 18
- 238000005315 distribution function Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 5
- 230000001747 exhibiting effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 15
- 230000009471 action Effects 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 235000013351 cheese Nutrition 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、本実施形態に係る特徴語選定サーバとしてのレコメンドサーバを含むシステム全体の構成について、図1を用いて説明する。図1は、レコメンドサーバ100を含むシステム全体の構成の概略を説明するための機能構成図であり、図2は、レコメンドサーバ100の物理構成の概略を説明するための物理構成図である。レコメンドサーバ100は、複数のコンテンツ(商品コンテンツを含む)のメタデータから、ユーザの嗜好に合うと思われるコンテンツを特定するための特徴語を選定して、特徴語を多数集録した辞書である特徴辞書を生成するコンピュータ装置である特徴辞書チューニングシステム20と、上述の特徴辞書を用いてユーザに対してコンテンツを推薦(レコメンド)するコンピュータ装置であるレコメンドシステム10との集合体である。
引き続き、フリーワード品詞抽出部21により生成される分類情報の例について、図3及び図4を用いて説明する。図3は、分類情報の例を示すテーブル構成図であり、図4は、この分類情報における品詞出現数を横軸とする確率密度関数を表すグラフである。
次に、特徴語優先度判定部25における特徴語優先度判定処理について説明する。特徴語優先度判定部25は、フリーワード品詞抽出部21により生成された分類情報を用いて、複数の品詞が出現回数の多い順に並べられた場合における第一所定順位から第二所定順位までの頻出品詞を複数選択する。特徴語優先度判定部25は、例えば、上述の複数の品詞に対する累積分布関数NORMDIST値が所定値以下の品詞のうち、複数の品詞が出現回数の多い順に並べられた場合の最も高い順位を第一所定順位と設定してもよい。ここでは、上述の所定値は、0.8(80%)であると予め設定されているとする。このため、「累積分布関数NORMDIST値が0.8(80%)以下の複数の品詞のうち、品詞出現数の最多の品詞である「LOC」の順位が、第一所定順位であると設定される。
引き続き、特徴語追加部26及び特徴語削除部27による特徴語の選択方法の例について、図5及び図6を用いて説明する。図5は、特徴語優先度判定部25により選択された複数の頻出品詞のそれぞれの出現割合を示す表であり、図6は、この出現割合に応じた数だけ、頻出品詞に対応する特徴語を選択する選択方法を表す表である。
引き続き、レコメンドサーバ100による特徴語選定処理の流れ(特徴語選定方法)について、図7を用いて説明する。図7は、レコメンドサーバ100による特徴語選定処理の流れを示すフローチャートである。図7のフローチャートに示される処理は、レコメンドサーバ100の電源がオンされてからオフされるまでの間、所定のタイミングで繰り返し実行される。
引き続き、本実施形態に係るレコメンドサーバ100による作用及び効果について説明する。レコメンドサーバ100によれば、まず、入力された複数のフリーワードの履歴情報(フリーワード入力型ユーザ行動履歴)が取得され、この履歴情報に基づいて、複数のフリーワードが複数の品詞に分類された分類情報が生成される。次に、この分類情報を用いて、複数の品詞が出現回数の多い順に並べられた場合の所定順位までの頻出品詞が複数選択される。そして、選択された複数の頻出品詞に対応するフリーワードが複数のコンテンツのメタデータから特徴語として選択される。
上述の実施例では、上述の複数の品詞のそれぞれの出現回数の平均回数以上出現した品詞のうち、これら複数の品詞が出現回数の多い順に並べられた場合の最も低い品詞の順位を、第二所定順位としている。
Claims (6)
- 複数のコンテンツのメタデータから、ユーザの嗜好に合うと思われるコンテンツの特徴により当該コンテンツを特定するための特徴語を選定する特徴語選定サーバであって、
前記複数のコンテンツのメタデータから特徴語の候補を抽出する特徴語候補抽出手段と、
コンテンツの検索のために入力された複数のキーワードの履歴情報を取得する取得手段と、
前記取得手段により取得された前記履歴情報に基づいて、前記複数のキーワードが複数の品詞に分類された分類情報を生成する生成手段と、
前記生成手段により生成された前記分類情報を用いて、前記複数の品詞が出現回数の多い順に並べられた場合の所定順位までの頻出品詞を複数選択する品詞選択手段と、
前記特徴語候補抽出手段により抽出された前記特徴語の候補のうち、前記品詞選択手段により選択された複数の前記頻出品詞に対応する特徴語を選択する特徴語選択手段と、
を備えることを特徴とする特徴語選定サーバ。 - 前記特徴語選択手段は、前記品詞選択手段により選択された前記複数の頻出品詞における各頻出品詞のそれぞれの出現割合に応じた数だけ、前記頻出品詞に対応する特徴語を、前記特徴語の候補から選択する、
ことを特徴とする請求項1に記載の特徴語選定サーバ。 - 前記品詞選択手段は、前記生成手段により生成された前記分類情報を用いて、前記複数の品詞が出現回数の多い順に並べられた場合の第一所定順位から第二所定順位までの前記頻出品詞を複数選択し、
前記第一所定順位は、前記複数の品詞のそれぞれの出現回数の標準正規分布における累積分布関数の値が所定値以下の品詞のうち、前記複数の品詞が出現回数の多い順に並べられた場合の最も高い順位である、
ことを特徴とする請求項1又は2に記載の特徴語選定サーバ。 - 前記品詞選択手段は、前記生成手段により生成された前記分類情報を用いて、前記複数の品詞が出現回数の多い順に並べられた場合の第一所定順位から第二所定順位までの前記頻出品詞を複数選択し、
前記第一所定順位は、前記複数の品詞が出現回数の多い順に並べられた場合の二番目に高い順位である、
ことを特徴とする請求項1又は2に記載の特徴語選定サーバ。 - 前記第二所定順位は、前記複数の品詞のそれぞれの出現回数の平均回数以上出現した品詞のうち、前記複数の品詞が出現回数の多い順に並べられた場合の最も低い品詞の順位である、
ことを特徴とする請求項3又は4に記載の特徴語選定サーバ。 - 複数のコンテンツのメタデータから、ユーザの嗜好に合うと思われるコンテンツの特徴により当該コンテンツを特定するための特徴語を選定する特徴語選定サーバが行う特徴語選定方法であって、
前記複数のコンテンツのメタデータから特徴語の候補を前記特徴語選定サーバが抽出する特徴語候補抽出ステップと、
コンテンツの検索のために入力された複数のキーワードの履歴情報を前記特徴語選定サーバが取得する取得ステップと、
前記取得ステップにより取得された前記履歴情報に基づいて、前記複数のキーワードが複数の品詞に分類された分類情報を前記特徴語選定サーバが生成する生成ステップと、
前記生成ステップにより生成された前記分類情報を前記特徴語選定サーバが用いて、前記複数の品詞が出現回数の多い順に並べられた場合の所定順位までの頻出品詞を前記特徴語選定サーバが複数選択する品詞選択ステップと、
前記特徴語候補抽出ステップにより抽出された前記特徴語の候補のうち、前記品詞選択ステップにより選択された複数の前記頻出品詞に対応する特徴語を前記特徴語選定サーバが選択する特徴語選択ステップと、
を有することを特徴とする特徴語選定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012107406A JP5908338B2 (ja) | 2012-05-09 | 2012-05-09 | 特徴語選定サーバ及び特徴語選定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012107406A JP5908338B2 (ja) | 2012-05-09 | 2012-05-09 | 特徴語選定サーバ及び特徴語選定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013235421A JP2013235421A (ja) | 2013-11-21 |
JP5908338B2 true JP5908338B2 (ja) | 2016-04-26 |
Family
ID=49761500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012107406A Active JP5908338B2 (ja) | 2012-05-09 | 2012-05-09 | 特徴語選定サーバ及び特徴語選定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5908338B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11272684A (ja) * | 1998-03-19 | 1999-10-08 | Mitsubishi Electric Corp | 情報提供方法および装置 |
US7562069B1 (en) * | 2004-07-01 | 2009-07-14 | Aol Llc | Query disambiguation |
-
2012
- 2012-05-09 JP JP2012107406A patent/JP5908338B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013235421A (ja) | 2013-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5662961B2 (ja) | レビュー処理方法およびシステム | |
KR101644817B1 (ko) | 탐색 결과들을 생성하는 방법 | |
KR100970335B1 (ko) | 사용자의 관심 키워드를 업데이트 하는 방법과 그 방법을수행하기 위한 시스템 | |
JP6405343B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5768492B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US9552415B2 (en) | Category classification processing device and method | |
US20170228378A1 (en) | Extracting topics from customer review search queries | |
JP5281104B2 (ja) | 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体 | |
JP2018504686A (ja) | 検索データを処理するための方法及び装置 | |
JP6434954B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5679194B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5256273B2 (ja) | 意図抽出装置、方法及びプログラム | |
JP6433270B2 (ja) | コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法 | |
JP4755834B2 (ja) | 属性評価装置、属性評価方法および属性評価プログラム | |
JP6960553B2 (ja) | ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム | |
JP2016197332A (ja) | 情報処理システム、情報処理方法、およびコンピュータプログラム | |
JP2012181565A (ja) | 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体 | |
JP5908338B2 (ja) | 特徴語選定サーバ及び特徴語選定方法 | |
JP2019175212A (ja) | 情報表示装置、記事ページ生成装置、情報処理装置、情報表示システム及びプログラム | |
JP6982546B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
JP2009237824A (ja) | 情報分析装置、情報分析方法、及び情報分析プログラム | |
JP2016192067A (ja) | 検索装置 | |
JP2004185135A (ja) | 話題変化抽出方法とその装置及び話題変化抽出プログラムとその情報記録伝送媒体 | |
JP7072476B2 (ja) | 情報処理装置、販売支援システム、情報処理方法、およびプログラム | |
JP5727846B2 (ja) | シリーズアイテム群抽出システム、シリーズアイテム群抽出方法、およびシリーズアイテム群抽出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5908338 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |