JP5679194B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents
情報処理装置、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP5679194B2 JP5679194B2 JP2011111644A JP2011111644A JP5679194B2 JP 5679194 B2 JP5679194 B2 JP 5679194B2 JP 2011111644 A JP2011111644 A JP 2011111644A JP 2011111644 A JP2011111644 A JP 2011111644A JP 5679194 B2 JP5679194 B2 JP 5679194B2
- Authority
- JP
- Japan
- Prior art keywords
- topic
- search
- keyword
- unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 19
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000011156 evaluation Methods 0.000 claims description 46
- 238000005259 measurement Methods 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 235000019219 chocolate Nutrition 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 235000013311 vegetables Nutrition 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記流行度判定部は、測定期間iにおけるサンプリング値xiからなる離散系の時系列データとしてデータベースに記録されているインターネット上に公開された情報における前記トピックの頻度を取得し、所定の測定期間t以前の所定の期間に対応するN個のサンプリング値xt,xt−1,・・・,xt−N+1の移動平均mtに基づく移動偏差vtを算出し、測定期間tに対応する移動偏差vtと測定期間t−1に対応する移動偏差vt−1とに基づいて、測定期間tにおける前記離散系の時系列データの急激な変化を示す評価値stを算出する評価値算出部を有することができる。
初めに、本開示の情報処理装置を適用した、実施の形態としての検索装置の概要について説明する。この検索装置は、インターネットまたはイントラネット上で公開されている各種文書を検索対象として、検索キーワードを含む文書を検索し、検索した複数の文書に共通して含まれる文字列(以下、共起キーワードまたはトピックと称する)を抽出する。さらに、検索キーワードと共起キーワードとを含むインターネット上の文書のうち、所定の時点において世間で話題になっているもの(流行している話題)を、検索情報に関連する情報として提示するものである。
図1は、実施の形態である検索装置に含まれる機能ブロックの構成例を示している。この検索装置10は、キーワード設定部11、文書検索部12、ノイズ除去部13、検索インデックス作成部14、流行度判定部15、トピック抽出部16、トピック出力部17、トピック文書出力部18、およびデータベース20を含む。図2は、データベース(DB)20の詳細を示している。データベース20は、検索文書保存データベース(DB)21、文書検索インデックスデータベース(DB)22、およびトピック保存データベース(DB)23を含む。
次に、検索装置10の動作について説明する。図3は、検索装置10による関連情報検索処理を説明するフローチャートである。
文字の種類としては、例えば、スペース(空白)、半角英字、ラテン文字拡張、ひらがな、カタカナ、全角記号、長音記号、半角記号、制御文字、無効文字、漢字、半角数字、句読点、ハングル、タイ文字、アラビア文字、ヘブライ文字、キリル文字、ギリシア文字などが想定される。
トークンの前の文字(前のトークンの最後の文字)が、
長音記号である場合、トピック候補文字列としない。
トークンの初めの文字が、
スペースである場合、トピック候補文字列としない。
全角記号である場合、トピック候補文字列としない。
長音記号である場合、トピック候補文字列としない。
半角記号である場合、トピック候補文字列としない。
制御文字、無効文字である場合、トピック候補文字列としない。
句読点である場合、トピック候補文字列としない。
長音記号である場合、トピック候補文字列としない。
トークンの最後の文字が、
スペースである場合、トピック候補文字列としない。
全角記号である場合、トピック候補文字列としない。
半角記号である場合、トピック候補文字列としない。
制御文字、無効文字である場合、トピック候補文字列としない。
句読点である場合、トピック候補文字列としない。
半角英字、ラテン文字拡張である場合、トピック候補文字列としない。
カタカナである場合、トピック候補文字列としない。
半角数字記号である場合、トピック候補文字列としない。
ハングルである場合、トピック候補文字列としない。
キリル文字である場合、トピック候補文字列としない。
図7は、検索装置10のユーザインタフェースとしての画面の表示例を示している。この画面50には、検索キーワード入力欄51、Get Tweetsボタン52、Get Topic Words from Tweetsボタン53、Show Tweetsボタン54、トピック表示欄55、評価値表示欄56、およびツイート表示欄57が設けられている。
次に、上述した関連情報検索処理のステップS6における、共起キーワードの流行の評価値を算出する方法について説明する。
移動平均mt=(Σxi)/N ・・・(1)
移動偏差vt=√(((Σ(mt−xi))/N) ・・・(2)
評価値st=vt/vt−1 ・・・(3)
なお、Σは、i=tからi=t−N+1に対応するN個の値の総和を意味する。
上述した評価値Stは、共起キーワードの流行判定の他に様々な利用が考えられる。
Claims (7)
- 検索キーワードを含む検索リクエストを受信する受信部と、
データベースに記録されているインターネット上に公開された情報のうち、前記検索キーワードを含む前記情報の間で共通するトピックを抽出する抽出部と、
抽出された前記トピックの流行度を判定する流行度判定部と、
前記検索キーワードと流行している前記トピックを用いてユーザに関連情報を提供する提供部と
を備える情報処理装置。 - 前記流行度判定部は、
測定期間iにおけるサンプリング値xiからなる離散系の時系列データとしてデータベースに記録されているインターネット上に公開された情報における前記トピックの頻度を取得し、所定の測定期間t以前の所定の期間に対応するN個のサンプリング値xt,xt−1,・・・,xt−N+1の移動平均mtに基づく移動偏差vtを算出し、測定期間tに対応する移動偏差vtと測定期間t−1に対応する移動偏差vt−1とに基づいて、測定期間tにおける前記離散系の時系列データの急激な変化を示す評価値stを算出する評価値算出部を有する
請求項1に記載の情報処理装置。 - 前記評価値算出部は、前記評価値st=移動偏差vt/移動偏差vt−1を算出する
請求項2に記載の情報処理装置。 - 前記評価値算出部は、連続的な時系列データを測定期間毎に集計して前記離散系の時系列データに変換する
請求項2または3に記載の情報処理装置。 - 前記評価値算出部は、前記測定期間を時間的に重複して設け、連続的な時系列データを前記測定期間毎に集計して前記離散系の時系列データに変換する
請求項4に記載の情報処理装置。 - 受信部と、
抽出部と、
流行度判定部と、
提供部とを備える情報処理装置の情報処理方法において、
前記受信部による、検索キーワードを含む検索リクエストを受信する受信ステップと、
前記抽出部による、データベースに記録されているインターネット上に公開された情報のうち、前記検索キーワードを含む前記情報の間で共通するトピックを抽出する抽出ステップと、
流行度判定部による、抽出された前記トピックの流行度を判定する流行度判定ステップと、
前記提供部による、前記検索キーワードと流行している前記トピックを用いてユーザに関連情報を提供する提供ステップと
を含む情報処理方法。 - コンピュータを、
検索キーワードを含む検索リクエストを受信する受信部と、
データベースに記録されているインターネット上に公開された情報のうち、前記検索キーワードを含む前記情報の間で共通するトピックを抽出する抽出部と、
抽出された前記トピックの流行度を判定する流行度判定部と、
前記検索キーワードと流行している前記トピックを用いてユーザに関連情報を提供する提供部と
して機能させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011111644A JP5679194B2 (ja) | 2011-05-18 | 2011-05-18 | 情報処理装置、情報処理方法、およびプログラム |
US13/468,519 US20120330986A1 (en) | 2011-05-18 | 2012-05-10 | Information processing apparatus, information processing method, and program |
CN201210147815.3A CN102841913B (zh) | 2011-05-18 | 2012-05-11 | 信息处理装置、信息处理方法和程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011111644A JP5679194B2 (ja) | 2011-05-18 | 2011-05-18 | 情報処理装置、情報処理方法、およびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2012243032A JP2012243032A (ja) | 2012-12-10 |
JP2012243032A5 JP2012243032A5 (ja) | 2014-05-15 |
JP5679194B2 true JP5679194B2 (ja) | 2015-03-04 |
Family
ID=47362830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011111644A Active JP5679194B2 (ja) | 2011-05-18 | 2011-05-18 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120330986A1 (ja) |
JP (1) | JP5679194B2 (ja) |
CN (1) | CN102841913B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101758555B1 (ko) * | 2016-03-08 | 2017-07-17 | 아주대학교산학협력단 | 토픽 표현 추출 방법 및 그 시스템 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9477760B2 (en) * | 2014-02-12 | 2016-10-25 | Facebook, Inc. | Query construction on online social networks |
JP6395287B2 (ja) * | 2014-06-02 | 2018-09-26 | 日本放送協会 | イベント検出装置およびプログラム |
JP2016099875A (ja) * | 2014-11-25 | 2016-05-30 | エコノミックインデックス株式会社 | 情報処理装置及び方法、並びにプログラム |
JP2016110533A (ja) * | 2014-12-10 | 2016-06-20 | 大日本印刷株式会社 | 情報処理装置、情報処理システム及びプログラム |
US10698959B1 (en) * | 2016-09-01 | 2020-06-30 | United Services Automobile Association (Usaa) | Social warning system |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6853950B1 (en) * | 1999-07-20 | 2005-02-08 | Newsedge Corporation | System for determining changes in the relative interest of subjects |
US20060106793A1 (en) * | 2003-12-29 | 2006-05-18 | Ping Liang | Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation |
KR100443483B1 (ko) * | 2004-04-23 | 2004-08-09 | 엔에이치엔(주) | 급상승 검색어 검출 방법 및 시스템 |
US20070073708A1 (en) * | 2005-09-28 | 2007-03-29 | Smith Adam D | Generation of topical subjects from alert search terms |
WO2007043322A1 (ja) * | 2005-09-30 | 2007-04-19 | Nec Corporation | トレンド評価装置と、その方法及びプログラム |
JP4172801B2 (ja) * | 2005-12-02 | 2008-10-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストからキーワードを検索する効率的なシステム、および、その方法 |
CN101059815A (zh) * | 2007-05-09 | 2007-10-24 | 宋鸣 | 网络文摘定制搜索引擎 |
AU2008259833B2 (en) * | 2007-06-01 | 2012-11-08 | Getty Images, Inc. | Method and system for searching for digital assets |
US7860878B2 (en) * | 2008-02-25 | 2010-12-28 | Yahoo! Inc. | Prioritizing media assets for publication |
JP4618325B2 (ja) * | 2008-04-28 | 2011-01-26 | ソニー株式会社 | 情報処理装置及び情報処理方法並びにプログラム |
JP5258532B2 (ja) * | 2008-06-10 | 2013-08-07 | ヤフー株式会社 | 評判指数を出力する方法及び評判指数出力装置 |
US8245135B2 (en) * | 2009-09-08 | 2012-08-14 | International Business Machines Corporation | Producing a visual summarization of text documents |
JP5284990B2 (ja) * | 2010-01-08 | 2013-09-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | キーワードの時系列解析のための処理方法、並びにその処理システム及びコンピュータ・プログラム |
US20110320715A1 (en) * | 2010-06-23 | 2011-12-29 | Microsoft Corporation | Identifying trending content items using content item histograms |
-
2011
- 2011-05-18 JP JP2011111644A patent/JP5679194B2/ja active Active
-
2012
- 2012-05-10 US US13/468,519 patent/US20120330986A1/en not_active Abandoned
- 2012-05-11 CN CN201210147815.3A patent/CN102841913B/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101758555B1 (ko) * | 2016-03-08 | 2017-07-17 | 아주대학교산학협력단 | 토픽 표현 추출 방법 및 그 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP2012243032A (ja) | 2012-12-10 |
CN102841913B (zh) | 2017-03-01 |
US20120330986A1 (en) | 2012-12-27 |
CN102841913A (zh) | 2012-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5768492B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
EP2798540B1 (en) | Extracting search-focused key n-grams and/or phrases for relevance rankings in searches | |
JP6007088B2 (ja) | 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法 | |
US9122680B2 (en) | Information processing apparatus, information processing method, and program | |
JP5679194B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2019504413A (ja) | 絵文字を提案するためのシステムおよび方法 | |
US20130054672A1 (en) | Systems and methods for contextualizing a toolbar | |
JP5143057B2 (ja) | 重要キーワード抽出装置及び方法及びプログラム | |
US20120036144A1 (en) | Information and recommendation device, method, and program | |
JP5541049B2 (ja) | データ生成装置、データの生成方法及びデータ生成プログラム | |
JP5269938B2 (ja) | 急上昇ワード関連付け装置及び方法 | |
KR101541306B1 (ko) | 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체 | |
JP2018504686A (ja) | 検索データを処理するための方法及び装置 | |
JP7055764B2 (ja) | 対話制御システム、対話制御方法及びプログラム | |
JP5427694B2 (ja) | 関連コンテンツ提示装置及びプログラム | |
JP5406794B2 (ja) | 検索クエリ推薦装置及び検索クエリ推薦プログラム | |
CN116508004A (zh) | 用于兴趣点信息管理的方法、电子设备和存储介质 | |
TWI507902B (zh) | A retrieval system, a retrieval condition setting device, a control method of a search condition setting device, a computer program product, and an information memory medium | |
JP5179564B2 (ja) | クエリセグメント位置決定装置 | |
JP2009223372A (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
JP7191763B2 (ja) | 変換装置、変換方法及び変換プログラム | |
JP5844887B2 (ja) | 通信ネットワークを通じたビデオ・コンテンツ検索のための支援 | |
JP5277090B2 (ja) | リンク作成支援装置、リンク作成支援方法およびプログラム | |
JP2018092367A (ja) | 関連語抽出装置及びプログラム | |
WO2013033445A2 (en) | Systems and methods for contextualizing a toolbar, an image and inline mobile banner advertising |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140327 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141224 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5679194 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |