JP4995750B2 - Web検索装置、Web検索方法、プログラムおよび記録媒体 - Google Patents
Web検索装置、Web検索方法、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP4995750B2 JP4995750B2 JP2008026334A JP2008026334A JP4995750B2 JP 4995750 B2 JP4995750 B2 JP 4995750B2 JP 2008026334 A JP2008026334 A JP 2008026334A JP 2008026334 A JP2008026334 A JP 2008026334A JP 4995750 B2 JP4995750 B2 JP 4995750B2
- Authority
- JP
- Japan
- Prior art keywords
- activity
- objects
- query
- web search
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、本発明のWeb検索装置の1構成例は、さらに、前記サブクエリに応じて検索されたWebページと前記クラスタとの類似度を求めることにより、前記検索されたWebページを順位付けし直し、最上位のWebページを最終的な検索結果とするリランク手段を備えるものである。
また、本発明のWeb検索方法の1構成例は、さらに、前記メモリに格納されたプログラムに従って前記CPUが、リランク手段として機能し、前記リランク手段が、前記サブクエリに応じて検索されたWebページと前記クラスタとの類似度を求めることにより、前記検索されたWebページを順位付けし直し、最上位のWebページを最終的な検索結果とするリランクステップを備えるものである。
また、本発明の記録媒体は、Web検索プログラムを記録したことを特徴とするものである。
以下、本発明の実施の形態について図面を参照して説明する。本実施の形態は、カップや歯ブラシといった複数の物体の各々に装着したセンサノードから取得した加速度の信号を用いて、ユーザの行動に関係するWebページを検索する技術に関するものである。ここで、ユーザが行っている行動とは、センサノードが装着された物体を使った行動であり、例えば、カップと茶葉の入った茶筒と急須とを使ってお茶を入れる行為に該当する。また、検索されるWebページは、そのような行動に関係するものであり、例えばお茶を入れる行動に関係するWebページとしては、お茶のおいしい入れ方や、茶の効能に関するページなどがある。
まず、Web検索装置1のアクティビティ検出部3は、各センサノード2からセンサデータをn分間収集し(図2ステップS1)、センサノード2ごとに過去n分間のアクティビティを検出する(ステップS2)。本実施の形態におけるアクティビティとは、センサデータ(加速度データ)が大きく変化している時間範囲のことである。この時間範囲を、物体が動いている時間(物体が使用されている時間)とする。
物体XとYのDos(X,Y,t)は、指標Temp(X,Y,t)とHist(X,Y)とSem(X,Y)との積で表される。以下、この3つの指標について詳しく説明する。
指標Temp(X,Y,t)の計算方法を説明する前に、用語を図3を用いて説明する。図3において、xiは物体Xのアクティビティ区間を表し、yjは物体Yのアクティビティ区間を表す。d(xi,yj)はアクティビティ区間xiとyjの時間軸上の距離を表す。距離d(xi,yj)が大きくなれば、指標Temp(X,Y,t)は小さくなる。このような考えを基に、忘却係数の概念を利用して指標Temp(X,Y,t)を下記のように計算する。
次に、指標Hist(X,Y)の計算方法について説明する。ここでは、Web検索システムのアクティビティ検出の対象となる室内環境中でp日分(T1,・・・,Tp)の間に存在した全ての物体のアクティビティがあらかじめ取得され、Dos計算部40が記憶しているものとする。この過去のアクティビティのデータにより、指標Hist(X,Y)は下記の式で表される。
次に、指標Sem(X,Y)の計算方法について説明する。指標Sem(X,Y)は、語彙の関連性を測るのによく使われるシンプソン(Simpson)係数を用いて下記のように表される。
以上で、物体解析部4の処理が終了する。
以前の時区間において一緒に使っていた物体の名前がクエリ生成に役立つことは多い。例えば、ある時区間において、室内環境にいるユーザが、紅茶が入っている茶筒(以下、物体「green-tea」とする)とティーカップ(以下、物体「cup」とする)を用いてお茶をいれていたとする。そして、ユーザは、その後の時区間において物体「cup」を使ってお茶を飲んでいたとする。このとき、「cup」という名前のみを用いてクエリを作成しても、お茶を飲むという行動に関係するWebページを得ることは難しい。
続いて、クエリ作成部50は、拡張した1つのクエリベクトルから複数のサブクエリを作成する。簡単に言うと、クエリベクトルからある程度の数の物体の名前を抽出し、クエリを作成する。物体の名前を抽出して複数のサブクエリを作成することで、物体解析部4による物体のクラスタリングにおいてクラスタに混入したノイズ(すなわち、間違ってクラスタの要素となっている物体)を含まないクエリを作成できる可能性が高くなる。また、ある程度の数の物体の名前(語)を抽出することで、クエリが厳密になり過ぎるのを防ぐことができる。
物体の名前しか含まないクエリは曖昧になることがある。例えば、“cup green-tea”といったクエリから、ユーザが欲するWebページ(生活行動に関する追加情報やtips)を得るのは難しい。一方、参考文献4「R.Kraft and R.Stata,“Finding buying guides with a web carnivore”,Proc.the 1st Latin American Web Congress(LA-WEB),pp.84-92,2003」では、良いクエリを作成するには、トピックに関する語とジャンルに関する語を組み合わせるとよいと言われている。例えばカメラを買いたいときは、“camera”という語と“buying”や“choosing”といった語を組み合わせ、“camera buying”というクエリを作る。
第1の実施の形態のWeb検索装置1は、CPU、メモリおよび外部とのインタフェースを備えたコンピュータと、これらのハードウェア資源を制御するプログラムによって実現することができる。
図6はこのようなコンピュータの構成例を示すブロック図である。図1において、100はCPU、101はRAM、102はROM、103,104はインターフェイス装置(以下、I/Fと略する)である。
このようなコンピュータにおいて、本発明のWeb検索方法を実現させるためのWeb検索プログラムは、フレキシブルディスク、CD−ROM、DVD−ROM、メモリカードなどの記録媒体に記録された状態で提供され、RAM101あるいは外部のハードディスク装置等のメモリに格納される。CPU100は、格納されたプログラムに従って第1の実施の形態で説明した処理を実行する。
Claims (8)
- 複数の物体の各々に装着されたセンサノードからセンサデータを受信し、各物体の使用状況に応じてWeb検索要求であるサブクエリを生成するWeb検索装置において、
前記センサノードから受信したセンサデータに基づいて、各物体が使用された時間範囲であるアクティビティを検出するアクティビティ検出手段と、
前記アクティビティが検出された複数の物体について使用状況の類似度を表す指標であるDosを計算するDos計算手段と、
前記Dosに基づいて、前記アクティビティが検出された複数の物体をクラスタに分類するクラスタ解析手段と、
このクラスタ解析手段が求めたクラスタから、前記アクティビティが検出された複数の物体のうち所定時間以下しか使用されていない物体のみを含むクラスタを削除して残りのクラスタを出力するフィルタ手段と、
このフィルタ手段から出力されたクラスタに所属する物体の名前をキーワードとして含むサブクエリを作成するクエリ作成手段とを備え、
前記Dos計算手段は、前記アクティビティが検出された複数の物体について、これらの物体が近い時刻で使用されたかどうかの程度を表す指標Tempを計算し、前記アクティビティが検出された複数の物体が同時に使われていたかどうかの程度を表す指標Histを、過去のアクティビティのデータから計算し、前記アクティビティが検出された複数の物体が意味的に近いかどうかの程度を表す指標Semを、検索エンジンによる検索結果から計算し、前記TempとHistとSemとの積を前記Dosとすることを特徴とするWeb検索装置。 - 請求項1記載のWeb検索装置において、
前記クエリ作成手段は、前記フィルタ手段から出力されたクラスタから、物体の名前と物体の重要度とからなるクエリベクトルを作成し、このクエリベクトルとの類似度が最も高い過去のクエリベクトルを用いて前記クエリベクトルを拡張し、拡張したクエリベクトルから複数の前記サブクエリを作成し、このサブクエリにあらかじめ用意された用語を組み合わせて前記サブクエリを拡張することを特徴とするWeb検索装置。 - 請求項1記載のWeb検索装置において、
さらに、前記サブクエリに応じて検索されたWebページと前記クラスタとの類似度を求めることにより、前記検索されたWebページを順位付けし直し、最上位のWebページを最終的な検索結果とするリランク手段を備えることを特徴とするWeb検索装置。 - CPUとメモリとを備えたコンピュータからなるWeb検索装置において、前記メモリに格納されたプログラムに従って前記CPUが、アクティビティ検出手段とDos計算手段とクラスタ解析手段とフィルタ手段とクエリ作成手段として機能し、複数の物体の各々に装着されたセンサノードからセンサデータを受信し、各物体の使用状況に応じてWeb検索要求であるサブクエリを生成するWeb検索方法であって、
前記アクティビティ検出手段が、前記センサノードから受信したセンサデータに基づいて、各物体が使用された時間範囲であるアクティビティを検出するアクティビティ検出ステップと、
前記Dos計算手段が、前記アクティビティが検出された複数の物体について使用状況の類似度を表す指標であるDosを計算するDos計算ステップと、
前記クラスタ解析手段が、前記Dosに基づいて、前記アクティビティが検出された複数の物体をクラスタに分類するクラスタ解析ステップと、
前記フィルタ手段が、前記クラスタ解析手段が求めたクラスタから、前記アクティビティが検出された複数の物体のうち所定時間以下しか使用されていない物体のみを含むクラスタを削除して残りのクラスタを出力するフィルタステップと、
前記クエリ作成手段が、前記フィルタステップで得られたクラスタに所属する物体の名前をキーワードとして含むサブクエリを作成するクエリ作成ステップとを備え、
前記Dos計算ステップは、前記アクティビティが検出された複数の物体について、これらの物体が近い時刻で使用されたかどうかの程度を表す指標Tempを計算するステップと、前記アクティビティが検出された複数の物体が同時に使われていたかどうかの程度を表す指標Histを、過去のアクティビティのデータから計算するステップと、前記アクティビティが検出された複数の物体が意味的に近いかどうかの程度を表す指標Semを、検索エンジンによる検索結果から計算するステップと、前記TempとHistとSemとの積を前記Dosとするステップとを含むことを特徴とするWeb検索方法。 - 請求項4記載のWeb検索方法において、
前記クエリ作成ステップは、前記フィルタステップで得られたクラスタから、物体の名前と物体の重要度とからなるクエリベクトルを作成するステップと、このクエリベクトルとの類似度が最も高い過去のクエリベクトルを用いて前記クエリベクトルを拡張するステップと、拡張したクエリベクトルから複数の前記サブクエリを作成するステップと、このサブクエリにあらかじめ用意された用語を組み合わせて前記サブクエリを拡張するステップとを含むことを特徴とするWeb検索方法。 - 請求項4記載のWeb検索方法において、
さらに、前記メモリに格納されたプログラムに従って前記CPUが、リランク手段として機能し、
前記リランク手段が、前記サブクエリに応じて検索されたWebページと前記クラスタとの類似度を求めることにより、前記検索されたWebページを順位付けし直し、最上位のWebページを最終的な検索結果とするリランクステップを備えることを特徴とするWeb検索方法。 - 請求項4乃至6のいずれか1項に記載のWeb検索方法の各ステップをコンピュータに実行させることを特徴とするWeb検索プログラム。
- 請求項7記載のWeb検索プログラムを記録したことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008026334A JP4995750B2 (ja) | 2008-02-06 | 2008-02-06 | Web検索装置、Web検索方法、プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008026334A JP4995750B2 (ja) | 2008-02-06 | 2008-02-06 | Web検索装置、Web検索方法、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009187268A JP2009187268A (ja) | 2009-08-20 |
JP4995750B2 true JP4995750B2 (ja) | 2012-08-08 |
Family
ID=41070441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008026334A Active JP4995750B2 (ja) | 2008-02-06 | 2008-02-06 | Web検索装置、Web検索方法、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4995750B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9081826B2 (en) | 2013-01-07 | 2015-07-14 | Facebook, Inc. | System and method for distributed database query engines |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043236A (ja) * | 1999-07-30 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 類似語抽出方法、文書検索方法及びこれらに用いる装置 |
JP2002149697A (ja) * | 2000-11-07 | 2002-05-24 | Mitsubishi Electric Corp | 類似事例検索装置 |
JP2003157270A (ja) * | 2001-11-22 | 2003-05-30 | Ntt Data Technology Corp | 特許文献検索方法及び特許文献検索システム |
JP4514154B2 (ja) * | 2006-01-13 | 2010-07-28 | 日本電信電話株式会社 | 類似状況検索システムおよび類似状況検索方法 |
US7739221B2 (en) * | 2006-06-28 | 2010-06-15 | Microsoft Corporation | Visual and multi-dimensional search |
-
2008
- 2008-02-06 JP JP2008026334A patent/JP4995750B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009187268A (ja) | 2009-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
El-Beltagy et al. | KP-Miner: A keyphrase extraction system for English and Arabic documents | |
CN106599278B (zh) | 应用搜索意图的识别方法及装置 | |
Zhao et al. | Topical keyphrase extraction from twitter | |
CN109190111A (zh) | 一种文档正文关键词提取方法及装置 | |
JP6381775B2 (ja) | 情報処理システム及び情報処理方法 | |
CN105468596B (zh) | 图片检索方法和装置 | |
CN106202294B (zh) | 基于关键词和主题模型融合的相关新闻计算方法及装置 | |
CN110717038B (zh) | 对象分类方法及装置 | |
CN109829045A (zh) | 一种问答方法和装置 | |
KR20090087269A (ko) | 컨텍스트 기반 정보 처리 방법 및 장치, 그리고 컴퓨터기록 매체 | |
CN113574522A (zh) | 搜索中的富体验的选择性呈现 | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
KR20100023630A (ko) | 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체 | |
JP2006134183A (ja) | 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
KR101178208B1 (ko) | 키워드 추출 장치 및 방법 | |
JP5486667B2 (ja) | クエリ結果を多様化するための方法および装置 | |
CN115827990B (zh) | 搜索方法及装置 | |
JP4995750B2 (ja) | Web検索装置、Web検索方法、プログラムおよび記録媒体 | |
JP3547074B2 (ja) | データ検索方法、その装置および記録媒体 | |
KR100703193B1 (ko) | 비음수 행렬 인수분해를 이용한 문서요약 장치 및 방법 | |
Kramár et al. | Disambiguating search by leveraging a social context based on the stream of user’s activity | |
KR101120040B1 (ko) | 연관 질의어 추천 장치 및 방법 | |
CN111209745B (zh) | 一种资讯可靠性评价方法、设备和存储介质 | |
CN109558586B (zh) | 一种资讯的言据自证评分方法、设备和存储介质 | |
Gupta et al. | A probabilistic framework for time-sensitive search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100127 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111122 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120411 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120508 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120510 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4995750 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |