JP5491372B2 - 情報検索システム、情報検索方法、情報検索プログラム - Google Patents
情報検索システム、情報検索方法、情報検索プログラム Download PDFInfo
- Publication number
- JP5491372B2 JP5491372B2 JP2010270384A JP2010270384A JP5491372B2 JP 5491372 B2 JP5491372 B2 JP 5491372B2 JP 2010270384 A JP2010270384 A JP 2010270384A JP 2010270384 A JP2010270384 A JP 2010270384A JP 5491372 B2 JP5491372 B2 JP 5491372B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- information search
- background sound
- sound
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(1)検索サービスを利用するユーザ端末のIPアドレスからユーザが企業内からアクセスしていると判断できる場合であれば、企業向けの情報を含む文書を検索結果の上位に優先的に提示する。
(2)検索サービスが利用された時間帯を判断できる場合であれば、該時間帯に合致した情報を含む文書を検索結果の上位に優先的に提示する。
(3)特に検索サービスを利用する端末装置が携帯端末の場合に顕著であるが、それ以外の場合でも検索サービスを利用するユーザの所在地が判断できれば、その地理的条件に合致した情報を含む文書を検索結果の上位に優先的に提示する。
(4)ユーザの利用する検索サービスが特定のWEBサイトに設置された検索窓であれば、該WEBサイトの読者層に合致した情報を含む文書を上位に優先的に提示する。
(5)ユーザが検索サービスを利用する端末装置の機種を特定できれば、該機種に合致した情報を含む文書を上位に優先的に提示する。
(6)検索サービスがユーザ所有の端末装置に対して、「WEB Cokie」を発行できる場合であれば、該端末装置から過去に行われた複数検索の検索キーワードや検索結果に基づきクリックされた文書などの情報を利用した所謂パーソナライズ検索として、該ユーザの過去の検索行動に合致した情報を含む文書を検索結果の上位に優先的に提示する。
図1に基づき本発明の第1実施形態に係る情報検索システムを説明する。このシステムは、ユーザ所有の情報検索端末1と情報検索サービスを提供する情報検索サーバ2とがインターネット経由でデータ通信自在に接続され、ユーザの検索状況を背景音としてキーワード検索に反映させている。
前記DB21の文書インデックスは、検索対象の文書を微小な単位に分解し、分解された微小な単位をそれが含まれる文書を牽けるデータ構造として格納されている。ここでは微小な単位として単語(形態素)を利用した場合を説明するが、分解の方法は「n−gram」や「Suffix Array」または「フレーズ」などでもよい。
・単語「カラオケ」はWEB文書411には2つ存在し、WEB文書412に2つ存在する。
・単語「予約」はWEB文書411に1つ存在し、WEB文書418に2つ存在する。
・単語「上達」はWEB文書412に1つ存在し、WEB文書416に1つ存在する。
前記計算部22は、ユーザ端末1から送信された検索キーワードに基づき前記DB21の文書インデックスを参照して、該検索キーワードを含む文書をリストアップする(キーワード一致度算出ステップ)。ここでリストアップされた各文書の検索キーワードとの一致度を「tf・idf」や「BM25」、「BM25F」などといった方法で算出する。
(イ)WEB文書411の一致度=2
(ロ)WEB文書412の一致度=2
と算出され、WEB文書411.412の検索キーワード「カラオケ」との一致度は等しくなる。このキーワード一致度(イ)(ロ)は前記計算部24に送られる。
前記テーブル23には、検索対象の文書毎に背景音の種別に応じたスコア加算情報が格納されている。ここで図1中の格納データ例は以下のスコア加算情報を示している。
・「WEB文書411:(A,1),(B,5),(C,1),...」=WEB文書411は背景音の種別Aであれば加算1,背景音の種別Bであれば加算5,背景音の種別Cであれば加算1
・「WEB文書412:(A,5),(B,4),(C,1),...」=WEB文書411は背景音の種別Aであれば加算5,背景音の種別Bであれば加算4,背景音の種別Cであれば加算1
・「WEB文書N:(A,1),(B,1),(C,1),...」=WEB文書Nは背景音の種別Aであれば加算1,背景音の種別Bであれば加算1,背景音の種別Cであれば加算1
ここで格納される背景音(A〜Cなど)は、あらかじめ情報検索サービスの提供者が収集した様々な場面の背景音から加算する背景音を選定し、各背景音の加算値も情報検索サービスの提供者が何らかの方法で定めることができる。例えば各背景音の状況に関連したキーワードのリストを情報検索サービスの提供者が作成し、それらのリスト群と文書の「tf」や「tf・idf」等の一致度を用いる方法でよい。これにより情報検索システムとして状況に応じた検索結果の出力順の調整方法に適用可能となる。
前記計算部24は、情報検索端末1から送信された背景音の種別を前記テーブル23の背景音と比較して確定し、前記テーブル23のスコア加算情報を参照して前記計算部22から送られたキーワード一致度を調整する(背景音一致度計算ステップ)。このとき背景音同士の比較は、それぞれの背景音から抽出された音特徴量の比較でよい。
・WEB文書411:1
・WEB文書412:5
と示されている。ここで前記計算部24の一致度調整製方法を単純加算とすれば、「WEB文書の一致度=WEB文書のキーワード一致度+背景音種別のスコア加算情報」に調整される。この結果、WEB文書411.412の一致度は、
(ハ)WEB文書411の一致度=2+1=3
(ニ)WEB文書412の一致度=2+5=7
に調整される。
・WEB文書411:5
・WEB文書412:4
と示されている。この場合のWEB文書411.412の一致度は、
(ホ)WEB文書411の一致度=2+5=7
(ヘ)WEB文書412の一致度=2+4=6
に調整される。これによりキーワード一致度(イ)(ロ)として等しかったWEB文書411.412は、ユーザが飲食店から検索キーワード「カラオケ」で情報検索サービスを利用すれば、カラオケの予約に関するWEB文書411がカラオケの上達方法に関するWEB文書411よりも高い一致度の値に調整される。ここで調整された一致度(ハ)(ニ).(ホ)(ヘ)は、前記計算部26に送られる。
前記テーブル25には、非特許文献2の「PageRank」や非特許文献3の「HITS」に代表される文書の静的重要度が格納されている。また、前記計算部26は、前記計算部24から送られた調整後の一致度(ハ)(ニ).(ホ)(ヘ)と、前記テーブル25を参照して得たリスト化された各文書(WEB文書411.412等)の重要度とを総合して情報検索端末1に返信する検索結果のランキング、即ち出力順を決定する(総合ランキング決定ステップ)。
図2に基づき本発明の第2実施形態に係る情報検索システムを説明する。このシステムは、放送局の番組音声を利用し、ユーザがどの放送局を視聴しているかを背景音から推定し、放送番組に応じたキーワードを加えて情報検索を行う。
・単語「カラオケ」はWEB文書411には2つ存在し、WEB文書412に2つ存在する。
・単語「ほげほげ」はWEB文書411に1つ存在し、WEB文書418に2つ存在する。
・単語「上達」はWEB文書412に1つ存在し、WEB文書416に1つ存在する。
前記テーブル27は、放送受信機61.62から実時間で放送中の放送局の放送音声から音声信号処理で抽出された音特徴量を格納している。この放送受信機61.62は、TV放送局・ラジオ放送局・有線放送局などの放送サービスの発信元の放送局51.52から放送を受信し、該放送の音声などを前記テーブル27に登録する。すなわち、前記テーブル27を通じて実時間で放送中の放送音声等を参照可能とさせ、放送波受信部・放送音声復調部・音声信号処理部・情報検索サーバ2への通信部などを有している。
前記計算部24は、前記テーブル27を参照して情報携帯端末1から送信された背景音が放送局の放送音声に一致するか否かを判定する(背景音一致度判定ステップ)。このとき情報検索端末1から背景音の音特徴量が送信されれば、前記テーブル27に格納された各放送局の放送音声の音特徴量と比較し、一定以上の類似性があれば、情報携帯端末1の背景音として放送局の放送音声を判定する。
前記テーブル28は、放送局と放送時間とから放送番組の内容を検索可能な状態で放送内容を格納している。例えば市場に存在する電子番組表を流用し、該電子番組表の放送内容を表す文字列をデータ格納してもよい。図2中の格納データ例は、時間情報を省略して現在時点の放送内容を表す文字列を抽出して示している。この時点での放送内容の文字列は、
・放送局A:「TV教室、カラオケ上達方法、...」
・放送局B:「音楽番組、最新ヒット曲、ほげほげ、ふがふが、...」
・放送局N:「天気予報、全国週間天気、...」
と示されている。
前記計算部22は、前記計算部24から背景音を放送局の放送音声と判定した旨の通知を受け取ると、検索キーワードと各文書との一致度を前記テーブル28に格納された放送局の放送内容に応じて調整して計算する(キーワード一致度計算ステップ)。
(ト)WEB文書411の一致度=2
(チ)WEB文書412の一致度=2
と算出され、WEB文書411.412の検索キーワード「カラオケ」との一致度は等しくなる。
本発明は、情報検索サーバ2の各部21〜28の一部もしくは全部として、コンピュータを機能させる文書検索プログラムとして構成することもできる。このプログラムによれば、前記各ステップの一部あるいは全部をコンピュータに実行させることが可能となる。
2…情報検索サーバ
7…TV受信機
11…テンキー
12…マイク(音声収集手段)
13…ディスプレイ
21…文書インデックスDB
22…キーワード一致度計算部(一致度計算手段)
23…文書/背景音テーブル
24…背景音一致度計算部(一致度計算手段)
25…文書重要度テーブル
26…総合ランキング計算部(ランキング決定手段)
27…放送音声テーブル
28…放送内容テーブル
51.52…放送局
61.62…放送受信機
411.412…WEB文書
Claims (9)
- 情報検索サーバが、ユーザの情報検索端末から投入された検索キーワードに基づきWEB文書を検索し、情報検索端末に検索結果を応答する情報検索システムであって、
情報検索端末は、ユーザの背景音を収集する音声収集手段を備え、
情報検索サーバは、検索キーワードと各WEB文書との一致度を音声収集手段で収集された背景音に応じて調整して算出する一致度計算手段と、
一致度計算手段で算出した前記一致度を用いて前記検索結果のランキングを決定するランキング決定手段と、
あらかじめ収集された各場面における背景音の種別毎に前記一致度の調整情報を格納するテーブルと、を備え、
一致度計算手段は、前記テーブルに格納された背景音と音声収集手段で収集された背景音とを比較し、
比較結果が事前に定められた類似度以上であれば、音声収集手段で収集された背景音を前記テーブルの背景音と確定し、
確定された背景音に応じた調整情報を前記一致度に反映させることを特徴とすることを特徴とする情報検索システム。 - 情報検索サーバが、ユーザの情報検索端末から投入された検索キーワードに基づきWEB文書を検索し、情報検索端末に検索結果を応答する情報検索システムであって、
情報検索端末は、ユーザの背景音を収集する音声収集手段を備え、
情報検索サーバは、検索キーワードと各WEB文書との一致度を音声収集手段で収集された背景音に応じて調整して算出する一致度計算手段と、
一致度計算手段で算出した前記一致度を用いて前記検索結果のランキングを決定するランキング決定手段と、
ユーザの過去の検索結果に対するクリック・背景音間の関連性/検索キーワード・検索結果に対するクリック・背景音間の関連性を格納するテーブルと、を備え、
一致度計算手段は、新たに検索キーワードが投入されたときに音声収集手段で収集された背景音と前記テーブル中の背景音とを比較し、
比較結果が事前に定められた類似度以上であれば、前記関連性に応じて前記一致度を調整する
ことを特徴とする情報検索システム。 - 情報検索サーバが、ユーザの情報検索端末から投入された検索キーワードに基づきWEB文書を検索し、情報検索端末に検索結果を応答する情報検索システムであって、
情報検索端末は、ユーザの背景音を収集する音声収集手段を備え、
情報検索サーバは、検索キーワードと各WEB文書との一致度を音声収集手段で収集された背景音に応じて調整して算出する一致度計算手段と、
一致度計算手段で算出した前記一致度を用いて前記検索結果のランキングを決定するランキング決定手段と、を備え、
一致度計算手段は、テーブルに格納された放送局の放送音声と音声収集手段で収集された背景音とを比較し、
比較結果が事前に定められた類似度以上であれば、音声収集手段で収集された背景音を前記テーブルに保持された放送局の放送音声と判定し、
判定された放送局の放送内容に応じて前記一致度を調整することを特徴とする情報検索システム。 - 音声収集手段で収集された背景音の音特徴量を情報検索端末内で抽出し、一致度計算手段が抽出された音特徴量と前記テーブルに格納された背景音/放送音声の音特徴量とを比較する
ことを特徴とする請求項1〜3のいずれか1項に記載の情報検索システム。 - 音声収集手段で収集された背景音の音特徴量を情報検索サーバ内で抽出し、一致度計算手段が抽出された音特徴量と前記テーブルに格納された背景音/放送音声の音特徴量とを比較する
ことを特徴とする請求項1〜3のいずれか1項に記載の情報検索システム。 - 情報検索サーバが、ユーザの情報検索端末から投入された検索キーワードに基づきWEB文書を検索し、情報検索端末に検索結果を応答するシステムの実行する情報検索方法であって、
情報検索サーバが、検索キーワードと各WEB文書との一致度を情報検索端末の音声抽出手段にて収集されたユーザの背景音に応じて調整して算出する一致度計算ステップと、
一致度計算ステップで算出した前記一致度を用いて前記検索結果のランキングを決定するランキング決定ステップと、を有し、
一致度計算ステップは、あらかじめ収集された各場面における背景音の種別毎に前記一致度の調整情報を格納するテーブルを参照して、該テーブルに格納された背景音と音声収集手段で収集された背景音とを比較し、
比較結果が事前に定められた類似度以上であれば、音声収集手段で収集された背景音を前記テーブルの背景音と確定し、
確定された背景音に応じた調整情報を前記一致度に反映させることを特徴とすることを特徴とする情報検索方法。 - 情報検索サーバが、ユーザの情報検索端末から投入された検索キーワードに基づきWEB文書を検索し、情報検索端末に検索結果を応答するシステムの実行する情報検索方法であって、
情報検索サーバが、検索キーワードと各WEB文書との一致度を情報検索端末の音声抽出手段にて収集されたユーザの背景音に応じて調整して算出する一致度計算ステップと、
一致度計算ステップで算出した前記一致度を用いて前記検索結果のランキングを決定するランキング決定ステップと、を有し、
一致度計算ステップは、ユーザの過去の検索結果に対するクリック・背景音間の関連性/検索キーワード・検索結果に対するクリック・背景音間の関連性を格納するテーブルを参照して、
新たに検索キーワードが投入されたときに音声収集手段で収集された背景音と前記テーブル中の背景音とを比較し、
比較結果が事前に定められた類似度以上であれば、前記関連性に応じて前記一致度を調整する
ことを特徴とする情報検索方法。 - 情報検索サーバが、ユーザの情報検索端末から投入された検索キーワードに基づきWEB文書を検索し、情報検索端末に検索結果を応答するシステムの実行する情報検索方法であって、
情報検索サーバが、検索キーワードと各WEB文書との一致度を情報検索端末の音声抽出手段にて収集されたユーザの背景音に応じて調整して算出する一致度計算ステップと、
一致度計算ステップで算出した前記一致度を用いて前記検索結果のランキングを決定するランキング決定ステップと、を有し、
一致度計算ステップは、テーブルに格納された放送局の放送音声と音声収集手段で収集された背景音とを比較し、
比較結果が事前に定められた類似度以上であれば、音声収集手段で収集された背景音を前記テーブルに保持された放送局の放送音声と判定し、
判定された放送局の放送内容に応じて前記一致度を調整することを特徴とする情報検索方法。 - 請求項1〜5のいずれか1項に記載の情報検索システムの各手段としてコンピュータを機能させることを特徴とする情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010270384A JP5491372B2 (ja) | 2010-12-03 | 2010-12-03 | 情報検索システム、情報検索方法、情報検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010270384A JP5491372B2 (ja) | 2010-12-03 | 2010-12-03 | 情報検索システム、情報検索方法、情報検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012118918A JP2012118918A (ja) | 2012-06-21 |
JP5491372B2 true JP5491372B2 (ja) | 2014-05-14 |
Family
ID=46501629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010270384A Expired - Fee Related JP5491372B2 (ja) | 2010-12-03 | 2010-12-03 | 情報検索システム、情報検索方法、情報検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5491372B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9705728B2 (en) | 2013-03-15 | 2017-07-11 | Google Inc. | Methods, systems, and media for media transmission and management |
JP5642229B2 (ja) * | 2013-04-30 | 2014-12-17 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 重要性判定システム、重要性判定方法及びコンピュータプログラム |
US10002191B2 (en) * | 2013-12-31 | 2018-06-19 | Google Llc | Methods, systems, and media for generating search results based on contextual information |
US9456237B2 (en) | 2013-12-31 | 2016-09-27 | Google Inc. | Methods, systems, and media for presenting supplemental information corresponding to on-demand media content |
JP6322125B2 (ja) * | 2014-11-28 | 2018-05-09 | 日本電信電話株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
JP2016173734A (ja) * | 2015-03-17 | 2016-09-29 | 大日本印刷株式会社 | サーバ装置及びそのプログラム、並びに通信システム |
US10204104B2 (en) | 2015-04-14 | 2019-02-12 | Google Llc | Methods, systems, and media for processing queries relating to presented media content |
JP7078837B2 (ja) * | 2017-10-31 | 2022-06-01 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、情報処理装置、その制御方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02277169A (ja) * | 1989-01-26 | 1990-11-13 | Nec Corp | 環境情報による情報検索装置 |
JP3234083B2 (ja) * | 1993-09-20 | 2001-12-04 | 株式会社東芝 | 検索装置 |
JP4738847B2 (ja) * | 2005-03-07 | 2011-08-03 | キヤノン株式会社 | データ検索装置および方法 |
JP2007025076A (ja) * | 2005-07-13 | 2007-02-01 | Xanavi Informatics Corp | 車載用音声認識装置 |
JP5326169B2 (ja) * | 2009-05-13 | 2013-10-30 | 株式会社日立製作所 | 音声データ検索システム及び音声データ検索方法 |
-
2010
- 2010-12-03 JP JP2010270384A patent/JP5491372B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012118918A (ja) | 2012-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5491372B2 (ja) | 情報検索システム、情報検索方法、情報検索プログラム | |
US9378247B1 (en) | Generating query refinements from user preference data | |
US8176029B2 (en) | Composite display method and system for search engine of same resource information based on degree of attention | |
US8117308B1 (en) | Detecting events of interest | |
US9268824B1 (en) | Search entity transition matrix and applications of the transition matrix | |
US9934312B2 (en) | Recommendation search method for search engine, device and computer readable storage medium | |
US8352466B2 (en) | System and method of geo-based prediction in search result selection | |
US8312022B2 (en) | Search engine optimization | |
WO2015196910A1 (zh) | 基于搜索引擎的摘要信息提取方法、装置以及搜索引擎 | |
CN102708174B (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
US20070143300A1 (en) | System and method for monitoring evolution over time of temporal content | |
CN106708817B (zh) | 信息搜索方法及装置 | |
TW201214173A (en) | Methods and apparatus for displaying content | |
US20050222989A1 (en) | Results based personalization of advertisements in a search engine | |
US20070233808A1 (en) | Propagating useful information among related web pages, such as web pages of a website | |
CN106415540B (zh) | 联合搜索 | |
CN110874436B (zh) | 用于基于第三方内容的上下文课程推荐的网络系统 | |
CN106663100B (zh) | 多域查询补全 | |
US20100325129A1 (en) | Determining the geographic scope of web resources using user click data | |
JP2009043156A (ja) | 番組検索装置および番組検索方法 | |
US20160357857A1 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
JP2011108117A (ja) | 話題特定システム、話題特定装置、クライアント端末、プログラム、話題特定方法、および情報処理方法 | |
CN104090757A (zh) | 针对浏览器的富媒体信息展示方法 | |
CN104503988A (zh) | 搜索方法及装置 | |
CN112868003A (zh) | 使用用户互动度的基于实体的搜索系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5491372 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |