JP5820765B2 - 話題語獲得装置及び方法及びプログラム - Google Patents
話題語獲得装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5820765B2 JP5820765B2 JP2012111946A JP2012111946A JP5820765B2 JP 5820765 B2 JP5820765 B2 JP 5820765B2 JP 2012111946 A JP2012111946 A JP 2012111946A JP 2012111946 A JP2012111946 A JP 2012111946A JP 5820765 B2 JP5820765 B2 JP 5820765B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- distribution
- frequency
- topic word
- distribution difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
入力された全てのキーワードがどの場所に関して多く出現しているか示す全キーワード分布を算出し、各キーワードの場所毎の個別キーワード分布を算出し、該全キーワード分布と該個別キーワード分布とから場所毎の分布違いを表す分布相違スコアを算出し、キーワード毎にキーワードスコア記憶手段に格納する前処理手段と、
入力されたキーワードに基づいて前記キーワードスコア記憶手段を参照し、該入力されたキーワードに対する分布相違スコアを取得し、該分布相違スコアが高いキーワードの上位N件を選択して出力する話題語獲得手段と、を有する。
ある場所に関するキーワードの出現頻度が格納されたキーワード頻度記憶手段と、
前記キーワード頻度記憶手段中のキーワードの頻度を足し合わせることにより全キーワード頻度を求める全キーワード頻度算出手段と、
前記キーワード頻度記憶手段の各キーワードの場所毎の頻度を取得する個別キーワード頻度取得手段と、
前記全キーワード頻度から得られる全キーワード分布と前記個別キーワード頻度から得られる個別キーワード分布から前記分布相違スコアを算出する分布相違スコア算出手段と、
を含む。
前記分布相違スコアを、カルバック・ライブラー・ダイバージェンス、または、ジェンセン・シャノン・ダイバージェンスを用いて求める。
前記分布相違スコアが高いキーワードの上位R%を選択して出力する。
2 個別キーワード頻度取得部
3 分布相違スコア算出部
4 分布相違スコア取得部
5 話題語候補選択部
6 キーワード頻度データベース
7 キーワードスコアデータベース
Claims (8)
- 指定した場所に関する話題語を獲得する話題語獲得装置であって、
入力された全てのキーワードがどの場所に関して多く出現しているか示す全キーワード分布を算出し、各キーワードの場所毎の個別キーワード分布を算出し、該全キーワード分布と該個別キーワード分布とから、場所毎の分布違いを表す分布相違スコアを算出し、キーワード毎にキーワードスコア記憶手段に格納する前処理手段と、
入力されたキーワードに基づいて前記キーワードスコア記憶手段を参照し、該入力されたキーワードに対する分布相違スコアを取得し、該分布相違スコアが高いキーワードの上位N件を選択して出力する話題語獲得手段と、
を有することを特徴とする話題語獲得装置。 - 前記前処理手段は、
ある場所に関するキーワードの出現頻度が格納されたキーワード頻度記憶手段と、
前記キーワード頻度記憶手段中のキーワードの頻度を足し合わせることにより全キーワード頻度を求める全キーワード頻度算出手段と、
前記キーワード頻度記憶手段の各キーワードの場所毎の頻度を取得する個別キーワード頻度取得手段と、
前記全キーワード頻度から得られる全キーワード分布と前記個別キーワード頻度から得られる個別キーワード分布から前記分布相違スコアを算出する分布相違スコア算出手段と、
を含む
請求項1記載の話題語獲得装置。 - 前記分布相違スコア算出手段は、
前記分布相違スコアを、カルバック・ライブラー・ダイバージェンス、または、ジェンセン・シャノン・ダイバージェンスを用いて求める
請求項2記載の話題語獲得装置。 - 前記話題語獲得手段は、
前記分布相違スコアが高いキーワードの上位R%を選択して出力する
請求項1記載の話題語獲得装置。 - 指定した場所に関する話題語を獲得する話題語獲得方法であって、
前処理手段が、入力された全てのキーワードがどの場所に関して多く出現しているか示す全キーワード分布を算出し、各キーワードの場所毎の個別キーワード分布を算出し、該全キーワード分布と該個別キーワード分布とから、場所毎の分布違いを表す分布相違スコアを算出し、キーワード毎にキーワードスコア記憶手段に格納する前処理ステップと、
話題語獲得手段が、入力されたキーワードに基づいて前記キーワードスコア記憶手段を参照し、該入力されたキーワードに対する分布相違スコアを取得し、該分布相違スコアが高いキーワードの上位N件を選択して出力する話題語獲得ステップと、
を行うことを特徴とする話題語獲得方法。 - 前記前処理ステップにおいて、
ある場所に関するキーワードの出現頻度が格納されたキーワード頻度記憶手段中のキーワードの頻度を足し合わせることにより全キーワード頻度を求める全キーワード頻度算出ステップと、
前記キーワード頻度記憶手段の各キーワードの場所毎の頻度を取得する個別キーワード頻度取得ステップと、
前記全キーワード頻度から得られる全キーワード分布と前記個別キーワード頻度から得られる個別キーワード分布から前記分布相違スコアを算出する分布相違スコア算出ステップと、
を含む
請求項5記載の話題語獲得方法。 - 前記分布相違スコア算出ステップにおいて
前記分布相違スコアを、カルバック・ライブラー・ダイバージェンス、または、ジェンセン・シャノン・ダイバージェンスを用いて求める
請求項6記載の話題語獲得方法。 - コンピュータを、
請求項1乃至4のいずれか1項に記載の話題語獲得装置の各手段として機能させるための話題語獲得プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012111946A JP5820765B2 (ja) | 2012-05-15 | 2012-05-15 | 話題語獲得装置及び方法及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012111946A JP5820765B2 (ja) | 2012-05-15 | 2012-05-15 | 話題語獲得装置及び方法及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2013239042A JP2013239042A (ja) | 2013-11-28 |
| JP5820765B2 true JP5820765B2 (ja) | 2015-11-24 |
Family
ID=49764008
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012111946A Expired - Fee Related JP5820765B2 (ja) | 2012-05-15 | 2012-05-15 | 話題語獲得装置及び方法及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5820765B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2745291B2 (ja) | 1994-09-17 | 1998-04-28 | チュシクウェサ パルマ | 高強度コンクリート管製造装置、その駆動システム及びその自動制御方法 |
| JP2745292B2 (ja) | 1994-09-17 | 1998-04-28 | チュシクウェサ パルマ | 高強度コンクリート管製造用振動転圧ローラ、その駆動装置及びその駆動方法 |
-
2012
- 2012-05-15 JP JP2012111946A patent/JP5820765B2/ja not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2745291B2 (ja) | 1994-09-17 | 1998-04-28 | チュシクウェサ パルマ | 高強度コンクリート管製造装置、その駆動システム及びその自動制御方法 |
| JP2745292B2 (ja) | 1994-09-17 | 1998-04-28 | チュシクウェサ パルマ | 高強度コンクリート管製造用振動転圧ローラ、その駆動装置及びその駆動方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2013239042A (ja) | 2013-11-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10345923B2 (en) | Input method, apparatus, and electronic device | |
| US20220414131A1 (en) | Text search method, device, server, and storage medium | |
| US9412077B2 (en) | Method and apparatus for classification | |
| US20150278706A1 (en) | Method, Predictive Analytics System, and Computer Program Product for Performing Online and Offline Learning | |
| JP2017090912A (ja) | ニューラルネットワークトレーニング装置及び方法と、音声認識装置及び方法 | |
| JP2015109068A5 (ja) | ||
| CN104281649A (zh) | 一种输入方法、装置及电子设备 | |
| US10839308B2 (en) | Categorizing log records at run-time | |
| US20240221727A1 (en) | Voice recognition model training method, voice recognition method, electronic device, and storage medium | |
| CN111666965B (zh) | 改进图像识别的多级别深度特征和多匹配器融合 | |
| JP6819420B2 (ja) | 学習プログラム、学習方法および学習装置 | |
| KR20160064826A (ko) | 지식 그래프 기반에서의 의미적 검색 서비스 제공장치 및 그 방법 | |
| JP5820765B2 (ja) | 話題語獲得装置及び方法及びプログラム | |
| US10108879B2 (en) | Aggregate training data set generation for OCR processing | |
| JP5528402B2 (ja) | キーワード関連地名抽出装置及び方法及びプログラム | |
| US10467530B2 (en) | Searching text via function learning | |
| US20160335327A1 (en) | Context Aware Suggestion | |
| US20150193555A1 (en) | Method and device for pushing media information in real time | |
| JP2020071678A5 (ja) | ||
| US9176948B2 (en) | Client/server-based statistical phrase distribution display and associated text entry technique | |
| JP5361090B2 (ja) | 話題語獲得装置、方法、及びプログラム | |
| CN105302790B (zh) | 处理文本的方法和设备 | |
| US9910846B2 (en) | Conversion device and conversion method | |
| JP5575075B2 (ja) | 代表的文書選択装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
| CN107203512B (zh) | 用于从用户的自然语言输入中提取关键元素的方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141020 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150619 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150707 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150901 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150929 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151005 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5820765 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |
