JP5677999B2 - 分類装置、分類システム、分類方法及び分類プログラム - Google Patents
分類装置、分類システム、分類方法及び分類プログラム Download PDFInfo
- Publication number
- JP5677999B2 JP5677999B2 JP2012082951A JP2012082951A JP5677999B2 JP 5677999 B2 JP5677999 B2 JP 5677999B2 JP 2012082951 A JP2012082951 A JP 2012082951A JP 2012082951 A JP2012082951 A JP 2012082951A JP 5677999 B2 JP5677999 B2 JP 5677999B2
- Authority
- JP
- Japan
- Prior art keywords
- trend
- time
- distribution
- classification
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000009826 distribution Methods 0.000 claims description 188
- 238000012545 processing Methods 0.000 description 59
- 238000004364 calculation method Methods 0.000 description 53
- 230000008569 process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 239000000284 extract Substances 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Description
例えば、傾向、趨勢、潮流または流行である。トレンドとは、例えば、ある期間内に、ある単語が出現する頻度の傾向である。
本実施形態では、一例として観測変数wはトークンの確率分布で、i番目のトークンwの出現確率分布が観測変数wiとして示されている。ブロック22は、i番目のトークンがトピックzに属する潜在変数ziにより、ブロック18のトピック毎のトークン内の単語の多項分布φを対応させ、そして、ブロック22は、i番目のトークンwの出現確率分布を、観測変数wiとして、推定する。
なお、本実施形態では、三つの階層に分けたが、これに限らず、タイムスタンプの代わりに位置情報、所得などの観測変数を使うことで、地域による分類という階層、所得による分類という階層などに分けても良い。また、階層の数は2以下でも、4以上でもよい。
ブロック121は、図1におけるブロック21と同様に、トピックの潜在変数zを求める。ブロック122は、観測変数wを求める。図1におけるブロック22では、観測変数wは、トピック毎のZ種類のトークン内の単語の多項分布φを用いて推定していた。それに対して、この実施形態では、ブロック122は、スイッチの潜在変数rにより、トピック、トレンドクラス、コミュニティクラス、全体のいずれかの階層に切り替えて、推定を行う。
すなわち、ブロック122は、ブロック118が取得した確率分布を階層に応じて切り替え、切り替えた確率分布に基づいて観測変数を生成する観測変数生成部として機能する。より詳細には、ブロック122は、ブロック118が取得した確率分布のうち、ブロック129が取得したスイッチ変数に応じた階層の確率分布へ切り替える観測変数生成部として機能する。
すなわち、ブロック125は、トレンドを分類するトレンド部類毎に、対象データの時刻毎の出現頻度を定めた時刻頻度分布を取得する時刻頻度分布取得部として機能する。なお、対象データの時刻毎の出現頻度を示すベータ分布λは、0から1(最古時刻を0、現在時刻を1)に正規化されている。本実施形態では、時刻については、ベータ分布を用いている。これは、時刻を連続的に扱うためである。時毎、日毎、周毎、月毎のように、時刻を離散的に扱った場合、ゆっくりと変化するトレンドクラスに対しては、月毎にように周期の長いデータとして扱えるが、頻繁に変化するトレンドクラスに対しては、時毎や日毎のように、周期の短いデータとして扱わなければならなくなり、データ量が増大する。時刻を連続的に扱うことで、ゆっくりと変化するトレンドクラスに対しても、頻繁に変化するトレンドクラスに対しても、分布曲線の形状の違いだけで処理できる。
次に、図2に示したようなモデルで示される処理を実行して、ユーザの興味を推定するための処理について、具体的に説明する。
上式を積分すると、次の式のように表せる。
このように、ディリクレ分布を導入して、積分することで、多項分布のパラメータは消え、ハイパーパラメータと、頻度情報が残る。このように、ディリクレ分布を導入して積分することで、連続型の確率分布は、離散型の確率分布になる。
図12は、ギブスサンプリングにより潜在変数を推定するアルゴリズムを示すものである。
計算処理部522は、このアルゴリズムに従い、初期化処理を行い、ギブスサンプリングの繰り返し回数Niterationを設定する。
そして、計算処理部522は、著者数Aだけ以下の処理を繰り返す。計算処理部522は、著者毎(著者数A)に式(2)によりコミュニティクラスの潜在変数saを推定し、変数nsを更新する。計算処理部522は、この潜在変数saの推定と変数nsの更新処理をする毎に、以下の処理を行う。
また、UC(User Coverage:推薦ユーザの被覆率)は、テスト期間に映画タイトルを視聴したユーザ数に対する各推薦方法が推薦可能なユーザ数の割合である。UCが高いほど、多くのユーザに映画タイトルを推薦できるので、ユーザ全体にとって価値が高いシステムである。
また、POT r={2,3}の場合、ICの値が、従来のどの手法よりも統計的に大きいので、従来よりもユーザ毎に推薦している映画タイトルが異なっている。これにより、本実施形態の分類システムは、幅広い映画タイトルを提示できることから、ユーザにとって価値が高い。
それに対し、本実施形態では、階層(例えば、コミュニティまたはトピック)毎に観測変数wを生成する確率分布を生成し、スイッチ変数rの値によって用いる確率分布を切り替える構成にした。これにより、構成要因を階層(例えば、コミュニティ、トレンド又はトピック)毎に分類することができる。その結果、例えば、分析データについて、著者ID、文書ID、単語IDを付与した場合、分析の際に、例えば、特定著者IDに固有か普遍かを分析することができる。
また、複数の装置を備えるシステムが、本実施形態の計算サーバ502の各処理を、それらの複数の装置で分散して処理してもよい。
また、本実施形態の計算サーバ502の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、計算サーバ502に係る上述した種々の処理を行ってもよい。
502 計算サーバ(分類装置)
503 データベース
504 サービスサーバ
505 ユーザ端末
511 データファイル保存部
521 事前処理部
522 計算処理部
531 計算結果記憶部
541 呼出し部
Claims (6)
- トレンドを分類するトレンド部類毎に、データの時刻毎の出現頻度を定めた時刻頻度分布を取得する時刻頻度分布取得部と、
前記時刻頻度分布取得部が取得した時刻頻度分布に基づいて、時刻情報を含む対象データを複数のトレンド部類のいずれかに分類するトレンド分類部と、
を備えることを特徴とする分類装置。 - 階層毎に、観測変数の確率分布を取得する観測変数確率分布取得部と、
前記観測変数確率分布取得部が取得した確率分布を階層に応じて切り替え、切り替えた確率分布に基づいて観測変数を生成する観測変数生成部と、
を備えることを特徴とする請求項1に記載の分類装置。 - 前記時刻頻度分布は、確率分布であることを特徴とする請求項1または請求項2のいずれか一項に記載の分類装置。
- トレンドを分類するトレンド部類毎に、データの時刻毎の出現頻度を定めた時刻頻度分布を取得する時刻頻度分布取得部と、
前記時刻頻度分布取得部が取得した時刻頻度分布に基づいて、時刻情報を含む対象データを複数のトレンド部類のいずれかに分類するトレンド分類部と、
を備えることを特徴とする分類システム。 - 時刻頻度分布取得部が、トレンドを分類するトレンド部類毎に、データの時刻毎の出現頻度を定めた時刻頻度分布を取得する手順と、
トレンド分類部が、前記時刻頻度分布取得部が取得した時刻頻度分布に基づいて、時刻情報を含む対象データを複数のトレンド部類のいずれかに分類する手順と、
を有することを特徴とする分類方法。 - コンピュータに、
トレンドを分類するトレンド部類毎に、データの時刻毎の出現頻度を定めた時刻頻度分布を取得する時刻頻度分布取得ステップと、
前記時刻頻度分布取得ステップにより取得された時刻頻度分布に基づいて、時刻情報を含む対象データを複数のトレンド部類のいずれかに分類するステップと、
を実行させるための分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012082951A JP5677999B2 (ja) | 2012-03-30 | 2012-03-30 | 分類装置、分類システム、分類方法及び分類プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012082951A JP5677999B2 (ja) | 2012-03-30 | 2012-03-30 | 分類装置、分類システム、分類方法及び分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013214149A JP2013214149A (ja) | 2013-10-17 |
JP5677999B2 true JP5677999B2 (ja) | 2015-02-25 |
Family
ID=49587442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012082951A Active JP5677999B2 (ja) | 2012-03-30 | 2012-03-30 | 分類装置、分類システム、分類方法及び分類プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5677999B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6649182B2 (ja) * | 2016-05-30 | 2020-02-19 | 日本電信電話株式会社 | 確率密度関数推定装置、連続値予測装置、方法、及びプログラム |
AU2017356848A1 (en) * | 2016-11-10 | 2019-06-06 | Search Technology, Inc. | Technological emergence scoring and analysis platform |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5276581B2 (ja) * | 2009-12-25 | 2013-08-28 | 日本電信電話株式会社 | トレンド分析装置、トレンド分析方法およびトレンド分析プログラム |
-
2012
- 2012-03-30 JP JP2012082951A patent/JP5677999B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013214149A (ja) | 2013-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230252094A1 (en) | Computer-implemented system and method for updating user interest profiles | |
Hawalah et al. | Dynamic user profiles for web personalisation | |
CN106503014B (zh) | 一种实时信息的推荐方法、装置和系统 | |
Liu et al. | Social temporal collaborative ranking for context aware movie recommendation | |
Tewari et al. | Sequencing of items in personalized recommendations using multiple recommendation techniques | |
Makhortykh et al. | Detecting race and gender bias in visual representation of AI on web search engines | |
Lommatzsch et al. | Incorporating context and trends in news recommender systems | |
Kanetkar et al. | Web-based personalized hybrid book recommendation system | |
JP2014137757A (ja) | 情報処理システム、情報処理装置、情報処理方法及びプログラム | |
Osmani et al. | Enriched latent dirichlet allocation for sentiment analysis | |
US20120311140A1 (en) | Method of processing web access information and server implementing same | |
CN107908653A (zh) | 一种数据处理方法及装置 | |
Lee et al. | Dynamic item recommendation by topic modeling for social networks | |
Modani et al. | Fairness aware recommendations on behance | |
Liu et al. | Online recommendations based on dynamic adjustment of recommendation lists | |
Kim et al. | Proposing a missing data method for hospitality research on online customer reviews: An application of imputation approach | |
Fraser et al. | Scrutable and persuasive push-notifications | |
JP4879775B2 (ja) | 辞書作成方法 | |
Ashraf et al. | Personalized news recommendation based on multi-agent framework using social media preferences | |
JP6870467B2 (ja) | 広告効果推定装置、広告効果推定方法及び広告効果推定プログラム | |
Zhang et al. | Incorporating temporal dynamics into LDA for one-class collaborative filtering | |
Stakhiyevich et al. | An experimental study of building user profiles for movie recommender system | |
JP5677999B2 (ja) | 分類装置、分類システム、分類方法及び分類プログラム | |
JP5802597B2 (ja) | 分類装置、分類システム、分類方法及び分類プログラム | |
CN106445922B (zh) | 确定多媒体资源的标题的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20140610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140806 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5677999 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |