JP2008541292A - 検索クエリ連関性判断方法及びシステム - Google Patents

検索クエリ連関性判断方法及びシステム Download PDF

Info

Publication number
JP2008541292A
JP2008541292A JP2008512225A JP2008512225A JP2008541292A JP 2008541292 A JP2008541292 A JP 2008541292A JP 2008512225 A JP2008512225 A JP 2008512225A JP 2008512225 A JP2008512225 A JP 2008512225A JP 2008541292 A JP2008541292 A JP 2008541292A
Authority
JP
Japan
Prior art keywords
search
search query
information
query
session
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008512225A
Other languages
English (en)
Other versions
JP4741657B2 (ja
Inventor
チョイ、ジェ‐コル
ムン、サンジュン
キム、ドンウク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2008541292A publication Critical patent/JP2008541292A/ja
Application granted granted Critical
Publication of JP4741657B2 publication Critical patent/JP4741657B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本発明に係る検索クエリ連関性判断方法は、検索セッション及び検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードを含むデータベースを維持する段階(レコードは、所定の時間間隔ごとに生成されてデータベースに記録される)と、各検索クエリ別クリック率情報を所定の記録手段に記録して維持する段階と、データベースを参照して時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成する段階と、データベースを参照して時間間隔内に第1検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、時間間隔内に第2検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成する段階と、データベースを参照して時間間隔内の第1検索クエリ及び第2検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する段階と、第1検索セッション数情報及び第3検索セッション数情報を用いて条件付き確率情報を生成する段階と、総検索セッション数情報、第1検索セッション数情報、第2検索セッション数情報、及び第3検索セッション数情報を用いて相関関係情報を生成する段階と、記録手段を参照して第2検索クエリのクリック率情報を照会する段階と、条件付き確率情報、相関関係情報、及びクリック率情報に基づいて第1検索クエリと第2検索クエリ間の連関性を判断する段階とを含む。
【選択図】図2

Description

本発明は、複数の検索クエリ間の連関性を判断する方法及びそのシステムに関し、より詳細には、各検索クエリが入力された検索セッションの数と該検索クエリを含む検索クエリのペアが入力された検索セッションの数を測定し、これを用いて各検索クエリのクリック率情報を追加的に活用して複数の検索クエリ間の連関性を判断できる検索クエリの連関性を判断する方法及びそのシステムに関する。
一般的に、検索サービスを提供する検索サービスシステムは、ユーザから検索クエリが入力されると、この検索クエリに対応する検索結果(例えば、検索クエリを含むウェブサイト、検索クエリを含む記事、検索クエリを含むファイル名を有するイメージなど)をユーザに提供する。
また、最近の検索サービスシステムでは、ユーザが所望する情報をより迅速かつ正確に検索できるようにするために、ユーザから入力された検索クエリと連関関係がある検索クエリを抽出してユーザに提供する連関検索クエリ提供サービスを提供している。すなわち、検索サービスシステムは、通常、入力された検索クエリに応じて全く異なる検索結果をユーザに提供する。例えば、検索者が「自動車(car)」を入力して得た検索結果と「乗用車(vehicle)」を入力して得られる検索結果は相違する。これにより、検索者は、自身が所望する情報を得るために、自身が所望する情報とより関連性の高い検索クエリを入力しようと努力するものの、そのような検索クエリが思いつかない場合も多々ある。したがって、最近の検索サービスシステムでは、ユーザが入力した検索クエリ及び統計情報を用いて、入力された検索クエリと関連性のある検索クエリをユーザに提供することで、ユーザが異なる検索クエリを用いて検索できるようにするサービスを提供している。
ここで、連関関係がある検索クエリとは、例えば、ユーザから入力された検索クエリの上位概念又は下位概念に該当する検索クエリ(「日本語」が入力された場合に「外国語」、逆に「外国語」が入力された場合に「日本語」)、ユーザから入力された検索クエリと同義語の関係(synonymous relation)にある検索クエリ(「本屋」が入力された場合に「書店」)、ユーザから入力された検索クエリと同等語の関係(equivalent relation)にある検索クエリ(「尻尾」が入力された場合に「鳥の尾」)、ユーザから入力された検索クエリと関係語の関係(a relation in the aspect of meaning)にある検索クエリ(「see」が入力された場合に「saw、seen、seeing」)など、意味的に関連がある検索クエリを意味するものである。また一方で、連関関係がある検索クエリは、単に意味的な関連がある検索クエリのみを意味するものではなく、例えば、ユーザから「パク・チャンホ」が入力された場合には、彼の職業である「野球」、彼の所属リーグである「メジャーリーグ」、彼の出身大学である「漢陽大学」、彼の所属チームである「テキサス・レンジャーズ」、同じメジャーリーグに所属している他の韓国人野球選手の「キム・ビョンヒョン」など、多様な観点において関連がある検索クエリを意味するものである。
しかしながら、従来技術の連関検索クエリ提供サービスは、サービスの運営者が1つの検索クエリと連関性がある他の検索クエリを一つ一つ分類して保存しなければならなかった。これにより、時間的かつ経済的な損失を甘受しなければならないという問題点があった。
また、より少ない時間と費用で連関検索クエリを抽出するために、用語間の関連性を同時に発生する確率で定義した同時発生分類方法、文章を分類した後に各グループで主に現われる用語を関連語として定義する文章分類方法、語学的知識と文章とにおける同時発生特性を用いて用語間の関係を把握する文法分類方法が登場した。しかしながら、これらの方法は、主に用語間の意味的な関係は考慮せず、統計的な関係のみを考慮するものであることから、ユーザが抽出された連関検索クエリ間の連関関係に対して納得できない場合が発生するという問題点があった。
このような問題を解決するために、大韓民国特許登録第10−0372078号では、ユーザから受信した(入力された)質疑語ログを用いて関連語集(thesaurus)を生成し、生成された関連語集を用いて意味的に関連性のある関連語を検索できるようにする関連語検索方法が開示されている。
この関連語検索方法は、ユーザが入力した質疑語のうち、一定のセッション内に成された質疑語の一部を関連語として登録して関連語集を生成し、ユーザが関連語検索装置に質疑語を入力すると、この質疑語の関連語を識別して整列し、これをユーザに提供する。
しかしながら、このような関連語検索方法は、一定のセッション内に成された質疑語ログを用いてクエリ間の連関性を判断することが可能であるものの、下記のような従来技術の問題を有している。
すなわち、関連語検索方法を用いる場合にも、1)同じセッションで1回以上出現した用語であれば、このすべてを関連語として登録するので、ユーザが抽出された関連語間の連関関係に対して納得できない場合が発生する点、2)一定の期間内に累積したデータを体系的に分析して関連語の登録を実行するものではないため、偶然にセッションに出現した用語すべてが関連語として登録される点、3)通常、ユーザから入力されるものは、質疑語ではない検索クエリであるにも拘わらず、質疑語から用語を抽出する方法を採択することで、検索クエリ間の連関関係を把握するために不必要な時間が消費される点、4)同じセッションで1回以上出現した用語であれば、このすべてを関連語として登録することによって、極めて多くの関連語が存在し得る点、などの問題点が依然として存在している。
結局、この関連語検索方法を用いても、ユーザから入力された検索クエリと連関関係がない検索クエリが抽出される可能性が依然として高い。したがって、質の高いサービスの提供及びより迅速かつ正確な情報検索を所望するユーザの欲求を満たすことができないという短所がある。
これにより、ユーザから入力された検索クエリに関するデータを効果的に収集し、収集されたデータを体系的に分析し、これを用いて検索クエリ間の連関性を正確に判断することで、ユーザにより質の高いサービスを提供できる新しい技術の出現が求められている。
本発明は、上述した従来技術の問題点を解決するために案出されたものであって、ユーザから入力された検索クエリに関するデータを効果的に収集及び分析し、検索クエリ間の連関性を自動的に判断できるシステムを構築することで、1つの検索クエリと連関性のある他の検索クエリを一つ一つ分類して保存することによってサービス運営者に起こり得る時間的かつ経済的な損失を減らすことができる検索クエリ連関性判断方法及びシステムを提供することを目的とする。
また、本発明に係る検索クエリ連関性判断方法及びそのシステムは、検索クエリ間の連関性の判断において、各検索クエリのクリック率情報を用い、実際に検索結果が存在しないにも拘らずユーザが同じ検索セッションで入力した回数が多いために連関検索クエリとして決定される検索クエリを除去し、検索クエリのクリック率を追加的に考慮することで、ユーザが実際に検索結果に満足する可能性の高い検索クエリをユーザに提供することを目的とする。
また、本発明に係る検索クエリの連関性を判断する方法及びそのシステムは、連関性判断の対象を拡張し、ある検索クエリと他の検索クエリ間の連関性の判断において検索クエリの入力前に入力された検索クエリがどれであるのかを考慮した連関性判断を行うことで、3つ以上の検索クエリ間の連関性を判断し、ユーザのクエリ入力経過に応じて同じ検索クエリに対しても相異した連関検索クエリを提供できるようにすることを目的とする。
また、本発明に係る検索クエリ連関性判断方法及びそのシステムは、検索クエリ間の連関指数情報を体系的に算定し、ユーザから検索クエリが入力された場合に、連関指数情報を用いてより連関性が高い検索クエリを抽出し、これを優先的にユーザに提供することを目的とする。
また、本発明に係る検索クエリ連関性判断方法及びそのシステムは、ユーザが検索した体系的な前処理過程を経た有用なデータのみを抽出し、適切な数の連関検索クエリを維持することで、本当に意味のある連関検索クエリを抽出し、より質の高い連関検索クエリサービスをユーザに提供することを目的とする。
前記の目的を達成し、上述した従来技術の問題点を解決するために、本発明の一実施形態に係る検索クエリの連関性を判断する方法は、検索セッションと、該検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードであって所定の時間間隔ごとに生成されて記録されるレコードとを含むデータベースを維持する段階と、各検索クエリ別クリック率情報を所定の記録手段に記録して維持する段階と、上記データベースを参照して上記時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成する段階と、上記データベースを参照して上前記時間間隔内に第1検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、上記時間間隔内に第2検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成する段階と、上記データベースを参照して上記時間間隔内に上記第1検索クエリ及び上記第2検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する段階と、上記第1検索セッション数情報及び上記第3検索セッション数情報を用いて条件付き確率(conditional probability)情報を生成する段階と、上記総検索セッション数情報、上記第1検索セッション数情報、上記第2検索セッション数情報、及び上記第3検索セッション数情報を用いて相関関係(correlation)情報を生成する段階と、上記記録手段を参照して上記第2検索クエリのクリック率情報を照会する段階と、上記条件付き確率情報、上記相関関係情報、及び上記クリック率情報に基づいて、上記第1検索クエリと上記第2検索クエリ間の連関性を判断する段階とを含むことを特徴とする。
本発明の他の実施形態に係る検索クエリの連関性を判断する方法は、検索セッションと、該検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードであって所定の時間間隔ごとに生成されて記録されるレコードとを含むデータベースを維持する段階と、上記データベースを参照して上記時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成する段階と、上記データベースを参照して上記時間間隔内に第1検索クエリが受信された後に第2検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成する段階と、上記データベースを参照して上記時間間隔内に第3検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成する段階と、上記データベースを参照して上記時間間隔内に上記第1検索クエリと上記第2検索クエリが受信された後、上記第3検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する段階と、上記第1検索セッション数情報及び上記第3検索セッション数情報を用いて条件付き確率情報を生成する段階と、上記総検索セッション数情報、上記第1検索セッション数情報、上記第2検索セッション数情報、及び上記第3検索セッション数情報を用いて相関関係情報を生成する段階と、上記条件付き確率情報及び上記相関関係情報に基づいて、上記第1検索クエリ及び上記第2検索クエリと上記第3検索クエリ間の連関性を判断する段階とを含むことを特徴とする。
本発明によれば、ユーザから入力された検索クエリに関するデータを効果的に収集及び分析して検索クエリ間の連関性を自動的に判断できるシステムを提供することができ、1つの検索クエリと連関性のある他の検索クエリを一つ一つ分類して保存することによってサービス運営者に起こり得る時間的及び経済的な損失を減らすことができる検索クエリ連関性判断方法及びシステムが提供される。
また、本発明に係る検索クエリ連関性判断方法及びそのシステムによれば、検索クエリ間の連関性の判断において、各検索クエリのクリック率情報を用いることで、実際に検索結果が存在しないにも拘らず、ユーザが同じ検索セッションで入力した回数が多いために連関検索クエリとして決定される検索クエリを除去することが可能となり、検索クエリのクリック率を追加的に考慮し、ユーザが実際に検索結果に満足する可能性の高い検索クエリをユーザに提供することができる。
また、本発明に係る検索クエリ連関性判断方法及びそのシステムによれば、連関性判断の対象を拡張し、ある検索クエリと他の検索クエリ間の連関性の判断において、検索クエリの入力前に入力された検索クエリがどれであるのかを考慮した連関性判断を行うことで、3つ以上の検索クエリ間の連関性を判断し、ユーザのクエリ入力経過によって同じ検索クエリに対しても相違した連関検索クエリを提供することができる。
また、本発明に係る検索クエリ連関性判断方法及びそのシステムによれば、検索クエリ間の連関指数情報を体系的に算定し、ユーザから検索クエリが入力された場合に、連関指数情報を用いてより連関が高い検索クエリを抽出し、これを優先的にユーザに提供することができる。
また、本発明に係る検索クエリ連関性判断方法及びそのシステムによれば、ユーザが検索した体系的な前処理過程を経た有用なデータのみを抽出し、適切な数の連関検索クエリを維持することで、本当に意味ある連関検索クエリを抽出し、より質の高い連関検索クエリサービスをユーザに提供することができる。
以下、添付の図面を参照して、本発明に係る検索クエリ連関性判断方法及び検索クエリ連関性判断システムについて詳しく説明する。
図1は、本発明の一実施形態に係る検索クエリ連関性判断システムのネットワーク連結を示した図である。ユーザは、ユーザ端末機110a又は110bを用い、有無線通信網を介して検索クエリ連関性判断システム100に接続して検索クエリを入力する。検索クエリ連関性判断システム100は、検索クエリに対応する連関検索クエリをユーザ端末機110a又は110bに送信する。また、本発明のさらに他の実施形態に係る検索クエリ連関性判断システム100によれば、連関検索クエリの連関指数情報に応じた順位情報などをユーザ端末機110a又は110bにさらに送信することもできる。
本発明の検索クエリ連関性判断システムは、インターネット検索サービスシステムに統合されて運営される。したがって、ユーザがインターネット検索サービスシステムに接続して検索クエリを入力した場合、検索クエリに対する検索結果をユーザに提供するときには、検索クエリに対する連関検索クエリもユーザに提供される。
図2は、本発明の一実施形態に係る検索クエリ連関性判断方法を示したフローチャートである。本実施形態は、検索クエリ間の連関性の判断において、各検索クエリのクリック率情報を用い、実際に検索結果が存在しないにも拘らずユーザが同じ検索セッションで入力した回数が多いために連関検索クエリとして決定される検索クエリを除去し、検索クエリのクリック率を追加的に考慮して、ユーザが実際に検索結果に満足する可能性の高い検索クエリをユーザに提供する検索クエリ連関性判断方法に関する。本実施形態に係る検索クエリ連関性判断方法は、所定の検索クエリ連関性判断システムを介して実行が可能である。
段階201で、本発明に係る検索クエリ連関性判断システムは、検索セッション(session)と、当該検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードを含むデータベースを維持する。また、検索クエリ連関性判断システムは、段階201で、各検索クエリ別クリック率情報を所定の記録手段に記録して維持する。
本発明の一実施形態では、検索セッションは、ユーザ端末機に検索窓が最初に提供されるときに設定され、所定の時間内にユーザ端末機からデータ送信がない場合に終了する。検索セッションの終了後にユーザ端末機から新しい検索クエリを受信した場合には、新しい検索セッションを開始することを特徴とする検索クエリ連関性判断方法が提供される。
本実施形態において、検索セッションとは、従来の検索セッションとは異なる方式で設定された新しい方式の検索セッションを意味する。従来の検索セッションは、単に任意のユーザが所定の時間内に実行した検索活動を意味するものであり、検索セッションが設定されて終了するまでの時間が事前に決められていた。例えば、その時間が10分であるとすれば、ユーザが検索活動を実行開始から10分後の時点で、従来の検索セッションは終了する。また、終了後の10分間の検索活動は、新しい検索セッションで実行されたものとして見なされるのが従来の検索セッション設定方式である。
これに対して、本実施形態における検索セッションは、ユーザ端末機に検索窓が最初に提供されるときに設定され、所定の時間内にユーザ端末機からデータ送信がない場合に終了することを特徴とする。例えば、その時間が5分であるとすれば、ユーザがユーザ端末機を介して検索サービスウェブページに接続し、検索窓が最初に開かれたときに検索セッションが開始し、ユーザが検索クエリを入力したり検索結果を選択するなどの検索活動が実行された「最終時刻」から5分間にわたって検索活動を全く実行せずに待機する場合には、検索セッションが終了する。すなわち、ユーザの最終検索活動時刻から5分間に渡ってユーザが何らかのアクションも取らずに待機する場合に、検索セッションが終了するように構成されている。また、検索セッションの終了後にユーザ端末機から新しい検索クエリを受信した場合には、新しい検索セッションが開始する。
検索クエリを用いた検索結果がユーザを満足させることができない場合に、ユーザは、検索クエリと関連した他の検索クエリを入力して検索活動を実行するのが一般的であるため、本実施形態に係る検索クエリ連関性判断システムは、最終検索活動時刻から所定の時間内にユーザが何れのアクションも取らずに待機したことを、すでに特定の主題と関連した検索活動を終えたものとして判断する。したがって、検索クエリ連関性判断システムは、この時間が経過した後に新しい検索クエリが入力された場合には、新しい主題に関する検索クエリを入力したものと見なし、新しいセッションを開始する。
一方、長い時間が経過してもユーザから検索活動が継続して実行される場合に、本実施形態に係る検索クエリ連関性判断システムは、ユーザが1つの意図によって特定の主題と関連した多様な検索クエリを入力していると判断する。したがって、検索クエリ連関性判断システムは、このような場合には新しい検索セッションを開始せず、1つの検索セッションを維持する。
検索セッションの開始から終了までの時間を固定的に定めておき、その検索セッションで登場した検索クエリをすべて連関検索クエリとして登録する従来の方式と比較すると、本実施形態は、検索セッションを上述のように新しい方式で定義することによって、同じ検索セッションで受信した検索クエリ間の連関性を極めて高い程度で信頼できる効果が得られる。
また、本発明では、同じ検索セッションで受信した検索クエリをすべて連関検索クエリとして登録するのではなく、後述するように、検索クエリのペアが登場した検索セッションの数をカウントし、検索クエリ間の連関性を判断できる1つの因子として活用することで、検索クエリ間の連関性をより正確に判断できる検索クエリ連関性判断方法及びシステムを提供する。
以下、上述のような検索セッションの新しい定義を用いて、検索セッション及び検索クエリに関するレコードを含むデータベースを維持する段階201の一実施形態について詳しく説明する。図3は、本実施形態によってデータベースを維持する過程を示したフローチャートである。
段階301で、本実施形態に係る検索クエリ連関性判断システムは、第1検索セッションと連関した第1検索セッション識別子を生成してデータベースに記録する。検索クエリ連関性判断システムは、ユーザから検索活動が成されるたびに第1検索セッション識別子及びそれぞれの検索時間に関する時刻情報をユーザ端末機に送信する。ユーザ端末機は、受信された第1検索セッション識別子及び時刻情報をクッキー(cookie)の形態でユーザ端末機内の所定の位置に保存する。
ユーザから最終的な検索活動が成された場合に、段階302で、検索クエリ連関性判断システムは、第1検索セッション識別子及び最終検索時刻に関する第1時刻情報をユーザ端末機に送信する。ここでも、ユーザ端末機は、第1検索セッション識別子及び第1時刻情報をクッキーの形態でユーザ端末機内の所定の位置に保存する。
段階303で、検索クエリ連関性判断システムは、ユーザ端末機から検索クエリを受信し、段階304で、検索クエリが受信された第2時刻情報及び前記第1時刻情報を比較する。
段階305で、上述のように比較した結果、両時刻情報間の差が所定の時間を越えると判断された場合に、検索クエリ連関性判断システムは、段階306で、第2検索セッションと連関した第2検索セッション識別子を生成し、段階307で、第2検索セッション識別子と受信された検索クエリに関するレコードとをデータベースに記録する。
一方、段階305で、両時刻情報間の差が所定の時間以下であると判断された場合、検索クエリ連関性判断システムは、段階308で、第1検索セッション識別子と連関して受信された検索クエリに関するレコードをデータベースに記録する。
本実施形態に係る検索クエリ連関性判断方法によれば、上記のような体系的な過程を介してデータベースを維持することで、検索セッションを効率的に管理できる上に、このように効率的に管理された検索セッションを用いる場合には、同じ検索セッションで受信した検索クエリ間の連関性を極めて高い程度で信頼できる効果が得られる。
図4は、本発明の一実施形態において、データベースに含まれたレコードの一例を示した図である。図4に示すように、レコードは、検索セッション識別子401及び検索セッション識別子401と連関した当該検索セッションの間にユーザ端末機から受信された検索クエリに関する情報を含む。図4の符号402に示すように、「session ID 1」という検索セッション識別子及び「session ID 1」という検索セッション識別子が割り当てられた検索セッションの間にユーザ端末機から受信された検索クエリである「パク・チャンホ」、「メジャーリーグ」、「野球」などがレコードに記録されている。
本発明の一実施形態によれば、検索クエリ連関性判断システムは、レコードを所定の時間間隔ごとに生成してデータベースに記録する。時間間隔は、サービス運営者によって「一日」、「二日」、「一週間」などのように事前に決定することができ、サービス運営者は、既存の時間間隔を他の時間間隔に変更することもできる。本実施形態によれば、一定の時間間隔に応じてデータを収集し、検索クエリ間の連関性の判断において、収集したデータを活用する。したがって、時間の経過に応じて変更し得る検索クエリ間の連関性を持続してチェックできるようになる。例えば、一日間隔でレコードを生成する場合に、二日前のレコードには「パク・チャンホ」と「メジャーリーグ」という検索クエリが同時に受信された検索セッションが多数記録されている場合、昨日の検索クエリ連関性判断システムは、「パク・チャンホ」と「メジャーリーグ」を連関検索クエリとして判断することができる。しかしながら、昨日のレコードには「パク・チャンホ」と「メジャーリーグ」が同時に受信された検索セッションが記録されていなかった場合、今日の検索クエリ連関性判断システムは、「パク・チャンホ」と「メジャーリーグ」とを連関検索クエリではないものとして判断する。したがって、直近のデータに基づいて抽出された連関検索クエリをユーザに提供できるという長所がある。
本発明の一実施形態に係る検索クエリ連関性判断システムは、段階201で、検索セッション又は受信された検索クエリを数字でマッピング(mapping)し、マッピングされた数字を用いてレコードを生成することもできる。
図5は、本実施形態において、検索セッション及び検索クエリを数字でマッピングしたレコードの一例を示した図である。図5に示した符号501を参照すると、図4に示した符号402と比較して、「session ID 1」という検索セッション識別子には「56」という数字がマッピングされ、「パク・チャンホ」、「メジャーリーグ」、「野球」という検索クエリには「18759」、「18760」、「18761」という数字がマッピングされている。
文字列で成されたデータを用いて相互連関した検索クエリを抽出するものと比較して、本実施形態によって数字でマッピングされたデータを用いて本発明に係る各段階を実行する場合には、データをデータベースに記録する際に、メモリの使用率をより抑えることができるため、メモリが節約される。さらに、文字列に比べてその処理が極めて簡単であるため、処理速度の向上を図ることができるという効果も得られる。
本発明の一実施形態によれば、検索クエリ連関性判断システムは、段階201で、特定の検索セッションの間に所定の数を超える検索クエリが受信された場合には、特定の検索セッション及び特定の検索セッションの間に受信された検索クエリに関するレコードを、データベースに含ませないことを特徴とする検索クエリ連関性判断方法が提供される。本実施形態において、検索クエリ連関性判断システムは、1つの検索セッションで発生した検索クエリの数をカウントし、検索クエリの数が所定の数を超える場合には、その検索セッションで受信したデータを一般的な方式ではない予想外の方式で入ってきたデータとして判断する。1つの検索セッションで受信した検索クエリの数が多い場合には、その検索クエリすべてが連関検索クエリである可能性が極めて低い。このため、このようなデータをデータベースに記録しないことで、より正確な連関検索クエリを抽出できるという効果を得ることができる。
また、上記で簡単に説明したように、検索クエリ連関性判断システムは、段階201で、各検索クエリ別クリック率情報を所定の記録手段に記録して維持する。
実際にその検索クエリを用いた検索の際に検索結果が存在しなかったり、適切に出力されない無用な検索クエリであるにも拘らず、多くのユーザが同じ検索セッションでその検索クエリを入力した回数が多いために連関検索クエリとして決定される場合がある。このような検索クエリは、ユーザに不必要な検索クエリであるため、連関検索クエリから除く必要がある。このために、本発明では、各検索クエリのクリック率情報を用いる。クリックは、実際にユーザがその検索クエリを用いた検索結果に満足した場合に発生するものであり、クリック率が高いほどその検索クエリに対するユーザの満足度が高いものと判断きる。したがって、本発明では、クリック率情報を検索クエリ間の連関性を判断する1つの要素として用いる。
記録手段に記録されるクリック率情報は、各検索クエリの検索回数に対する検索結果についてのクリック回数の割合に基づいて生成される。これを数式で示せば次の通りとなる。
Figure 2008541292
段階202で、検索クエリ連関性判断システムは、データベースを参照して、時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成する。例えば、時間間隔が一日である場合に、検索クエリ連関性判断システムは、設定された検索セッションの総数を一日間に渡ってカウントする。
段階203で、検索クエリ連関性判断システムは、データベースを参照して、時間間隔内に第1検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、段階204で、データベースを参照して、時間間隔内に第2検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成する。例えば、時間間隔が一日である場合に、検索クエリ連関性判断システムは、一日間に渡って「パク・チャンホ」という検索クエリが受信された検索セッションの数をカウントし、「メジャーリーグ」という検索クエリが受信された検索セッションの数をカウントする。
段階205で、検索クエリ連関性判断システムは、データベースを参照して、時間間隔内に第1検索クエリ及び第2検索クエリがすべて受信された検索セッションの数をカウントして第3検索セッション数情報を生成する。例えば、時間間隔が一日である場合に、検索クエリ連関性判断システムは、一日間に渡って「パク・チャンホ」という検索クエリ及び「メジャーリーグ」という検索クエリがすべて受信された検索セッションの数をカウントする。
本発明の一実施形態の検索クエリ連関性判断システムは、段階205で、第1検索セッション数情報及び第2検索セッション数情報が所定の数以上である場合に、第3検索セッション数情報を生成することを特徴とする検索クエリ連関性判断方法が提供される。すなわち、本実施形態において、検索クエリ連関性判断システムは、第1検索セッション数情報又は第2検索セッション数情報が所定の数に及ばない場合には、第3検索セッション数情報を生成しない。それぞれの検索クエリが受信された検索セッションの数が少ない場合には、このような検索クエリが互いに連関検索クエリとなる可能性が極めて低いため、所定の数以上の登場がない検索クエリは連関検索クエリを判断するためのデータとして生成しないことで、検索クエリ連関性判断システムの実行速度の向上に大きく寄与するという効果が得られる。
また、本発明の一実施形態では、段階205で、検索セッション数をカウントする際に、ハッシュツリー(Hash−tree)データ構造を用いる検索クエリ連関性判断方法が提供される。
ハッシュツリーデータ構造とは、データを保存して検索するのに用いられるデータ構造の一種であって、検索したい文字列を特定の関数(Hash function)で処理し、得た値を用いてデータの位置を検索する方法として知られている。ハッシュツリーデータ構造は、データを検索する速度にデータの数がほとんど影響を与えないという特性を有しており、これを用いる場合には、効率的かつ迅速にデータの位置を検索できるだけでなく、システム内のメモリを大きく節約することもできる。
図6は、本実施形態において、検索セッション数をカウントするのに用いられるハッシュツリーデータ構造の一例を示した図である。図6では、「チャングムの誓い」という検索クエリと「イ・ヨンエ」という検索クエリとで成された検索クエリのペアが受信された検索セッションがデータベースに存在する場合に、検索セッションの数をハッシュツリーデータ構造を用いてカウントする一例を示している。
段階206で、検索クエリ連関性判断システムは、第1検索セッション数情報及び第3検索セッション数情報を用いて条件付き確率情報を生成する。
条件付き確率情報は、検索クエリ間の連関性を評価する1つの因子として活用される。例えば、「チャングムの誓い」という検索クエリ及び「イ・ヨンエ」という検索クエリ間の連関性は、「チャングムの誓い」が登場した検索セッションの数のうち「イ・ヨンエ」が登場した検索セッションの数がどれ位となるのかに関する確率情報を1つの因子として活用して判断する。すなわち、「チャングムの誓い」が登場した検索セッションに「イ・ヨンエ」が多数登場すれば、両検索クエリ間の連関性を判断する際に強い影響を及ぼし得る1つの因子として活用されるようになる。
条件付き確率情報を生成するのに用いられる数式の一例を下記に示す。
Figure 2008541292
数式2に示すように、「A」検索クエリと「B」検索クエリのすべてが同じ検索セッションに登場する確率を「B」検索クエリが検索セッションに登場する確率で割ることで、「B」検索クエリが登場したセッションに「A」検索クエリも登場する確率情報を生成することができる。
段階207で、検索クエリ連関性判断システムは、総検索セッション数情報、第1検索セッション数情報、第2検索セッション数情報、及び第3検索セッション数情報を用いて相関関係情報を生成する。
相関関係情報は、検索クエリ間の連関性を評価するさらに1つの因子として活用される。ユーザから入力される頻度が極めて高い検索クエリの場合には、実在的な連関性がなくても、生成された条件付き確率情報の値が高い場合があるため、相関関係情報を検索クエリ間の連関性を評価するさらに1つの因子として活用することは、より正確に連関性を判断するのに大きく寄与できる。
確率理論には独立性判断というものが存在するが、相関関係情報は独立性判断に活用される。すなわち、相関関係情報が1に近い値を有する場合には、これを両検索クエリが連関しておらず独立的であると判断し得る強い因子として活用することができる。この反面、相関関係情報が1より相当に大きい値を有する場合には、これを両検索クエリが相互連関していると判断し得る強い因子として活用することができる。
相関関係情報を生成するのに用いられる数式の一例を下記に示す。
Figure 2008541292
数式3に示すように、「A」検索クエリと「B」検索クエリがすべて同じ検索セッションに登場する確率を「A」検索クエリが検索セッションに登場する確率と「B」検索クエリが検索セッションに登場する確率とを掛けた値で割ることで、相関関係情報を生成することができる。また、数式3を展開する場合に、相関関係情報は、「A」検索クエリ及び「B」検索クエリがすべて登場した検索セッションの数に総検索セッション数を掛けた値を「A」検索クエリが登場した検索セッションの数と「B」検索クエリが登場した検索セッションの数で割った値で算定される。したがって、検索クエリ連関性判断システムは、総検索セッション数情報、第1検索セッション数情報、第2検索セッション数情報、及び第3検索セッション数情報を用いて相関関係情報を生成できる。
段階208で、検索クエリ連関性判断システムは、記録手段を参照して第2検索クエリのクリック率情報を照会する。
段階209で、検索クエリ連関性判断システムは、条件付き確率情報、相関関係情報、及びクリック率情報に基づいて第1検索クエリと第2検索クエリ間の連関性を判断する。
例えば、検索クエリ連関性判断システムは、各情報に所定の数値を掛け、これを加えて一定の指数を算定し、この指数を用いて連関性を判断するようになる。
他の例として、検索クエリ連関性判断システムは、条件付き確率情報、相関関係情報、及びクリック率情報の乗算演算値に基づいて第1検索クエリと第2検索クエリ間の連関性を判断することもできる。この場合には、各情報に所定の数値を掛けて、所定の数値が掛けられた各情報を再び掛けて一定の指数を算定し、この指数を用いて連関性を判断することも可能である。このように、乗算演算値に基づいて検索クエリ間の連関性を判断する場合には、クリック率情報が0に近いほど算定される指数も0に近くなるため、クリック率が低い検索クエリは、他の検索クエリとの関係においても連関性が低いものと判断される。
さらに他の例として、検索クエリ連関性判断システムは、クリック率情報が所定の基準数値以上である場合には、第1検索クエリと第2検索クエリの連関性を判断し、クリック率情報が基準数値未満である場合には、第1検索クエリと第2検索クエリの連関性を判断しないことで、クリック率が一定の数値に及ばない無用な検索クエリが他の検索クエリとの関係において連関検索クエリとして提供されることを事前に防ぐことも可能である。
また、上述した方法の他にも、条件付き確率情報、相関関係情報、及びクリック率情報を用いて連関性を判断する方法には多様な実施形態が存在し得ることは、本発明が属する技術分野の当業者にとっては自明であろう。
本発明の一実施形態の検索クエリ連関性判断システムは、段階209で、条件付き確率情報が所定の数値以上である場合に限って連関性を判断することを特徴とする検索クエリ連関性判断方法が提供される。
本実施形態において、検索クエリ連関性判断システムは、条件付き確率情報が所定の数値に達しない程度と極めて低い数値に該当する場合には、すでに検索クエリ間の連関性が極めて低いと判断して連関性を判断しないため、不必要なメモリの所要を減らし、システムの実行速度を向上させるという効果が得られる。
本発明の一実施形態によれば、実施形態における所定の数値は、第1検索セッション数情報の上昇に応じて減少する所定の関数に基づいて変動することを特徴とする検索クエリ連関性判断方法が提供される。
これは、第1検索セッション数情報が極めて低い数値に該当する場合には、条件付き確率情報が正常的に求められず、固定されている所定の数値を遥かに超える可能性があるためである。例えば、「A」検索クエリ及び「B」検索クエリがすべて登場した検索セッションの数が「1」であり、「A」検索クエリが登場した検索セッションの数が「5」である場合に、条件付き確率情報は「1/5」で計算され、極めて高い数値を記録するようになる。この場合に、実際には「A」検索クエリ及び「B」検索クエリ間の連関程度は低いのにも拘らず、両検索クエリ間の連関性が認められ、正確でない連関検索クエリをユーザに提供する可能性がある。したがって、本実施形態のように、所定の数値を第1検索セッション数情報に応じて変動する必要性があり、これによってより正確な連関検索クエリをユーザに提供できるようになる。
本発明の一実施形態によれば、実施形態における所定の関数は、100パーセント(値としては「1」)を第1検索セッション数情報の二乗で割ったパーセンテージ値を関数値として有する関数であることを特徴とする検索クエリ連関性判断方法が提供される。本実施形態によれば、関数は、「100/√(root)第1検索セッション数情報」として表現される。
また、他の実施形態として、所定の関数を下記のような一般的な数式で表現することもできる。
Figure 2008541292
数式4で、yは所定の数値であり、xは第1検索セッション数情報である。また、数式4において、定数aと指数bは、数値を求めるための最善の式を誘導する実験過程を介して求められる。例えば、aは80、bは1の値が用いられる。
上記のような実施形態によれば、条件付き確率情報が所定の数値以上である場合に限って連関性を判断することを特徴とする本発明の一実施形態に係る検索クエリ連関性判断方法において、第1検索セッション数情報が低い数値に該当するほど所定の数値が高くなるため、検索クエリ連関性判断システムは連関性を判断しない場合が増加するようになり、これにより不必要なメモリの所要を減らし、システムの実行速度を向上させるという効果が得られる。
本発明の一実施形態によれば、検索クエリ連関性判断システムは、段階209で、相関関係情報が所定の数値以上である場合に限って連関性を判断することを特徴とする検索クエリ連関性判断方法が提供される。
本実施形態において、検索クエリ連関性判断システムは、相関関係情報が所定の数値に達しない程度と極めて低い数値に該当する場合(例えば、「1」に近接した場合)には、すでに検索クエリ間の連関性が極めて低いと判断して連関性を判断しないことで、不必要なメモリの所要を減らし、システムの実行速度を向上させるという効果が得られる。
本発明の一実施形態に係る検索クエリ連関性判断方法によれば、検索クエリ連関性判断システムは、両検索クエリが連関したものであると判断された場合にこれを記録し、トグルエラー検査(toggle error check)を実行することで、より正確な連関検索クエリを抽出できるようになる。以下、本実施形態について説明する。
一般的に、キーボードにおいてトグルキー(toggle key)とは、1つのキーで2つの以上の機能を実行できるキーを意味する用語である。このようなトグルキーの代表的な例としては、「Insert」、「韓/英」、「Caps Lock」、「Num Lock」、「Scroll Lock」などがある。
本明細書で用いられる「トグルエラー検査」は、トグルキーのうち「韓/英」変換キーと連関した検査に関するものである。例えば、ハングル文字盤を用いて「
Figure 2008541292
」と入力しようとするユーザが、「韓/英」変換キーの設定によって英語文字盤で「ekdma」と入力してしまう場合がある。前記した例のように、実際にユーザが「韓/英」変換キーの設定に応じて、ハングルで成された検索クエリを英語文字盤で入力したり、英語で成された検索クエリをハングル文字盤で入力したりする場合は頻繁に発生し得る。この場合、ユーザは、正確な検索クエリを再び入力するようになるが、これによって元来の検索クエリとトグルエラーによる検索クエリが同じ検索セッションで登場するようになり、両検索クエリ間の連関性が認められる場合が発生する。前記のような例の場合には、「
Figure 2008541292
」のトグルエラーである「ekdma」が「
Figure 2008541292
」の連関検索クエリとして指定される可能性がある。
トグルエラーによって、実際に何れの連関もない検索クエリが連関検索クエリとして指定される場合に、これを記録するために不必要なメモリが必要となり、これによってシステムの実行速度が低下するという問題点が発生する恐れがある。また、不正確な連関検索クエリがユーザに提供され、サービスの信頼度が低くなるという問題点なども発生し得る。しかし、本実施形態に係る検索クエリ連関性判断システムは、このようなトグルエラー検査を実行することによって、上述した問題点を解決できる。
本実施形態に係る検索クエリ連関性判断システムは、段階209で、連関性を判断した結果として連関したものであると判断された場合には、第1検索クエリ及び第2検索クエリを連関検索クエリとして指定して第2データベースに記録する。
また、検索クエリ連関性判断システムは、第2データベースを参照して第1検索クエリ及び第2検索クエリに対するトグルエラー検査を実行する。本発明の一実施形態によれば、検索クエリ連関性判断システムは、形態素分析を用いてトグルエラー検査を実行する。
このように検査した結果、第1検索クエリ及び第2検索クエリがトグルエラー関係にある場合に、検索クエリ連関性判断システムは、第2データベースから連関検索クエリ指定と連関した記録を削除する。
以下では、再び図2を参照して、本発明の他の実施形態に係る検索クエリ連関性判断方法について説明する。本実施形態に係る検索クエリ連関性判断方法も、所定の検索クエリ連関性判断システムを用いて実行が可能である。
本実施形態は、連関性判断の対象を拡張し、ある検索クエリと他の検索クエリ間の連関性の判断において、検索クエリの入力前に入力された検索クエリがどれであるのかを考慮した連関性判断を行うことで、3つ以上の検索クエリ間の連関性を判断し、ユーザのクエリ入力経過に応じて、同じ検索クエリに対しても相違した連関検索クエリを提供できるようにする検索クエリ連関性判断方法に関する。
すなわち、上述した実施形態では、「チャングムの誓い」と「イ・ヨンエ」という2つの検索クエリ間の連関性を判断したが、本実施形態ではこれを拡張し、「チャングムの誓い」、「イ・ヨンエ」が検索された後にどのような検索クエリが検索されるかに対するデータを分析し、3つ以上の検索クエリ間の連関性を判断する。例えば、ユーザが「チャングムの誓い」、「イ・ヨンエ」の順に検索クエリを入力した後には、「チ・ジニ」という検索クエリを入力する場合がさらに多く、「マモンド」、「イ・ヨンエ」の順に検索クエリを入力した後には、「化粧品」という検索クエリを入力する場合がさらに多いというデータ分析結果が出た場合を想定する。この場合に、2つの検索クエリ間の連関性のみを考慮すれば、「イ・ヨンエ」と「チ・ジニ」の連関程度が「イ・ヨンエ」と「化粧品」の連関程度に比べてよい高いとしても、ユーザが「イ・ヨンエ」の前に「マモンド」という検索クエリを入力すれば、本実施形態に係る検索クエリ連関性判断システムは、「チ・ジニ」ではなく「化粧品」を連関検索クエリとして提供する。
以下、具体的な構成について説明する。
段階201で、本発明に係る検索クエリ連関性判断システムは、検索セッション及び検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードを含むデータベースを維持する。
本発明の一実施形態によれば、検索クエリ連関性判断システムは、レコードを所定の時間間隔ごとに生成してデータベースに記録する。時間間隔は、サービス運営者によって「一日」、「二日」、「一週間」などのように事前に決めることができ、サービス運営者は、既存の時間間隔を他の時間間隔に変更することもできる。本実施形態によれば、一定した時間間隔に応じてデータを収集し、検索クエリ間の連関性の判断において、データを活用できる。また、時間の経過に応じて変更し得る検索クエリ間の連関性を持続してチェックできる。
また、検索クエリ連関性判断システムは、段階201で、各検索クエリ別クリック率情報を所定の記録手段に記録して維持する。
段階202で、検索クエリ連関性判断システムは、データベースを参照して時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成する。例えば、時間間隔が一日である場合に、検索クエリ連関性判断システムは、設定された検索セッションの総個数を一日間に渡ってカウントする。
段階203で、検索クエリ連関性判断システムは、データベースを参照して時間間隔内に第1検索クエリが受信された後、第2検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成する。この場合、検索クエリ連関性判断システムは、時間間隔内に順に第1検索クエリ、第2検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成する。
段階204で、データベースを参照して時間間隔内に第3検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成する。
段階205で、検索クエリ連関性判断システムは、データベースを参照して時間間隔内に第1検索クエリと第2検索クエリが受信された後、第3検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する。この場合、検索クエリ連関性判断システムは、時間間隔内に順に第1検索クエリ、第2検索クエリ、第3検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する。
段階206で、検索クエリ連関性判断システムは、第1検索セッション数情報及び第3検索セッション数情報を用いて条件付き確率情報を生成する。
段階207で、検索クエリ連関性判断システムは、総検索セッション数情報、第1検索セッション数情報、第2検索セッション数情報、及び第3検索セッション数情報を用いて相関関係情報を生成する。
段階208で、検索クエリ連関性判断システムは、記録手段を参照して第3検索クエリのクリック率情報を照会する。
段階209で、検索クエリ連関性判断システムは、条件付き確率情報、相関関係情報、及びクリック率情報に基づいて第1検索クエリ、第2検索クエリ、及び第3検索クエリ間の連関性を判断する。この場合、検索クエリ連関性判断システムは、条件付き確率情報、相関関係情報、及びクリック率情報を用いて第1検索クエリ、第2検索クエリ、及び第3検索クエリ間の連関指数情報を生成する。
本発明の一実施形態の検索クエリ連関性判断システムは、検索クエリ間の連関性を判断して記録し、これを用いて連関検索クエリをユーザに提供する。本実施形態に係る検索クエリ連関性判断方法は、段階209から段階212をさらに含む。
段階210で、検索クエリ連関性判断システムは、連関指数情報の降順に従って所定の数の第3検索クエリを選定及びソーティングし、第1検索クエリ及び第2検索クエリに対応する連関検索クエリとして第2データベースに記録する。
図7は、第2データベースの一例を示した図である。第2データベースは、符号701のように、第1検索クエリ及び第2検索クエリを以前の検索クエリと現在の検索クエリとして記録し、符号702のように、これに対応する所定の数の連関語1、連関語2、連関語3などの連関検索クエリを記録する。符号703に示すように、「パク・チャンホ、テキサス」という第1、第2検索クエリに対応する連関検索クエリとして「ドジャース」、「メジャーリーグ」、「野球」などが第2データベースに記録されている。これは、ユーザが検索窓に「パク・チャンホ」、「テキサス」を順に入力した後、再び入力する可能性の高い検索クエリが「ドジャース」、「メジャーリーグ」、「野球」の順であることを意味するものである。
段階211で、検索クエリ連関性判断システムは、ユーザ端末機から第1検索クエリを受信した後に第2検索クエリを受信する。
段階212で、検索クエリ連関性判断システムは、第2データベースを参照して第1検索クエリ及び第2検索クエリに対応する連関検索クエリを抽出する。
段階213で、検索クエリ連関性判断システムは、抽出された連関検索クエリをユーザ端末機に提供する。
このように、本実施形態に係る検索クエリ連関性判断方法は、連関性判断の対象を拡張し、ある検索クエリと他の検索クエリ間の連関性を判断することにおいて、検索クエリの入力前に入力された検索クエリがどれであるのかを考慮した連関性判断を行うことで、3つ以上の検索クエリ間の連関性を判断し、ユーザのクエリ入力経過によって同じ検索クエリに対しても相違した連関検索クエリを提供することができる。
本発明に係る実施形態は、コンピュータにより具現される多様な動作を実行するためのプログラム命令を含むコンピュータ読み取り可能な記録媒体を含む。記録媒体は、プログラム命令、データファイル、データ構造などを単独又は組み合わせて含むこともできる。また、記録媒体及びプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光又は金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるもののような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。
以下、本発明のさらに他の実施形態に係る検索クエリ連関性判断システムについて説明する。
図8は、本発明の一実施形態に係る検索クエリ連関性判断システムを示したブロック図である。本実施形態に係る検索クエリ連関性判断システム800は、データベース801と、データベース管理手段802と、カウンタ手段803と、条件付き確率情報生成手段804と、相関関係情報生成手段805と、連関性判断手段806と、記録手段807とを含む。
データベース801は、検索セッション及び検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードを含む。
検索セッションは、ユーザ端末機に検索窓が最初に提供されるときに設定され、所定の時間内にユーザ端末機からのデータ送信がないときに終了するようになる。また、検索セッションの終了後、ユーザ端末機から新しい検索クエリを受信した場合には、新しい検索セッションを開始する。
図3は、データベース801を維持する過程に関する一実施形態を示したフローチャートであり、図4は、データベース801に含まれたレコードの一例を示した図である。図3及び図4に関しては、本明細書ですでに説明した通りであるため、詳しい説明は省略する。
本発明の一実施形態によれば、検索クエリ連関性判断システム800は、検索セッション又は受信された検索クエリを数字でマッピングし、マッピングされた数字を用いて生成されたレコードを含むデータベース801を維持することもできる。図5は、検索セッション及び検索クエリを数字でマッピングしたレコードの一例を示した図である。図5に関しては、本明細書ですでに説明した通りであるため、詳しい説明は省略する。
データベース管理手段802は、レコードを所定の時間間隔ごとに生成してデータベース801に記録する。
記録手段807は、各検索クエリ別クリック率情報を記録して維持する。
カウンタ手段803は、データベース801を参照して時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成し、時間間隔内に第1検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、時間間隔内に第2検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成し、時間間隔内に第1検索クエリ及び第2検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する。
本発明の一実施形態によれば、カウンタ手段803は、検索セッション数をカウントすることにおいて、ハッシュツリーデータ構造を用いる。
ハッシュツリーデータ構造とは、データを保存して検索するのに用いられるデータ構造の一種であって、検索したい文字列を特定の関数で処理して得た値を用いてデータの位置を検索する方法として知られている。図6は、本実施形態において、検索セッション数をカウントするのに用いられるハッシュツリーデータ構造の一例を示した図である。図6に関しては、本明細書ですでに説明した通りであるため、詳しい説明は省略する。
条件付き確率情報生成手段804は、第1検索セッション数情報及び第3検索セッション数情報を用いて条件付き確率情報を生成する。
相関関係情報生成手段805は、総検索セッション数情報、第1検索セッション数情報、第2検索セッション数情報、及び第3検索セッション数情報を用いて相関関係情報を生成する。
連関性判断手段806は、記録手段807を第2検索クエリのクリック率情報を照会し、条件付き確率情報、相関関係情報、及びクリック率情報に基づいて第1検索クエリと第2検索クエリ間の連関性を判断する。
本発明の一実施形態によれば、連関性判断手段806は、条件付き確率情報が所定の数値以上である場合に連関性を判断し、数値は、第1検索セッション数情報の上昇に応じて減少する所定の関数に基づいて変動する。
本実施形態は、第1検索セッション数情報が極めて低い数値に該当する場合に、条件付き確率情報が正常的に求められず、固定されている所定の数値を遥かに超える場合に備えるためのものである。例えば、「A」検索クエリ及び「B」検索クエリがすべて登場した検索セッションの数が「1」であり、「A」検索クエリが登場した検索セッションの数が「5」である場合、条件付き確率情報は「1/5」で計算され、極めて高い数値を記録するようになる。この場合、実際には、「A」検索クエリ及び「B」検索クエリ間の連関程度は低いにも拘らず、両検索クエリ間の連関性が認められて正確ではない連関検索クエリをユーザに提供する可能性がある。したがって、本実施形態のように、所定の数値を第1検索セッション数情報に応じて変動する必要性があり、これによってより正確な連関検索クエリをユーザに提供できる。
以下、再び図8を参照して、本発明のさらに他の実施形態に拘る検索クエリ連関性判断システムについて説明する。
本実施形態に拘る検索クエリ連関性判断システム800も、データベース801と、データベース管理手段802と、カウンタ手段803と、条件付き確率情報生成手段804と、相関関係情報生成手段805と、連関性判断手段806と、記録手段807とを含む。
データベース801は、検索セッション及び検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードを含む。
データベース管理手段802は、レコードを所定の時間間隔ごとに生成してデータベース801に記録する。
記録手段807は、各検索クエリ別クリック率情報を記録して維持する。
カウンタ手段803は、データベース801を参照して時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成し、時間間隔内に第1検索クエリが受信された後、第2検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、時間間隔内に第3検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成し、データベースを参照して時間間隔内に第1検索クエリと第2検索クエリが受信された後、第3検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する。
この場合、カウンタ手段803は、時間間隔内に順に第1検索クエリ、第2検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、時間間隔内に順に第1検索クエリ、第2検索クエリ、第3検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する。
条件付き確率情報生成手段804は、第1検索セッション数情報及び第3検索セッション数情報を用いて条件付き確率情報を生成する。
相関関係情報生成手段805は、総検索セッション数情報、第1検索セッション数情報、第2検索セッション数情報、及び第3検索セッション数情報を用いて相関関係情報を生成する。
連関性判断手段806は、記録手段を参照して第3検索クエリのクリック率情報を照会し、条件付き確率情報、相関関係情報、及びクリック率情報に基づいて第1検索クエリ、第2検索クエリ、及び第3検索クエリ間の連関性を判断する。この場合、連関性判断手段806は、条件付き確率情報、相関関係情報、及びクリック率情報を用いて第1検索クエリ、第2検索クエリ、及び第3検索クエリ間の連関指数情報を生成する。
本発明のさらに他の実施形態によれば、検索クエリ間の連関性を判断して記録し、これを用いて連関検索クエリをユーザに提供することができる検索クエリ連関性判断システムが提供される。本実施形態に拘る検索クエリ連関性判断システムは、前記した実施形態に係る検索クエリ連関性判断システム800に追加して、符号830に該当する所定の装置をさらに含む。
図8の符号830には、第2データベース808と、第2データベース管理手段809と、検索クエリ受信手段810と、検索クエリ抽出手段811と、検索クエリ提供手段812とが示されている。
第2データベース808は、連関検索クエリに関するレコードを含む。図7は、第2データベース808の一例を示した図である。図7に関しては、本明細書ですでに説明した通りであるため、詳しい説明は省略する。
第2データベース管理手段809は、連関指数情報の降順に従って所定数の第3検索クエリを選定及びソーティングし、第1検索クエリ及び第2検索クエリに対応する連関検索クエリとして第2データベース808に記録する。
検索クエリ受信手段810は、ユーザ端末機から第1検索クエリを受信した後に第2検索クエリを受信する。
検索クエリ抽出手段811は、第2データベース808を参照して第1検索クエリ及び第2検索クエリに対応する連関検索クエリを抽出する。
検索クエリ提供手段812は、抽出された連関検索クエリをユーザ端末機に提供する。
このように、本実施形態に拘る検索クエリ連関性判断システムによれば、連関性判断の対象を拡張してある検索クエリと異なる検索クエリ間の連関性を判断することにおいて、検索クエリの入力前に入力された検索クエリがどれであるのかを考慮した連関性判断を行うことで、3つ以上の検索クエリ間の連関性を判断し、ユーザのクエリ入力経過によって同じ検索クエリに対しても相違した連関検索クエリを提供することができる。
上述したように、本発明を好ましい実施形態に則して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の技術的思想及びその領域から逸脱しない範囲内で、本発明を多様に修正及び変更させることができることを理解することができるであろう。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
本発明の一実施形態に係る検索クエリ連関性判断システムのネットワーク連結を示した図である。 本発明の一実施形態に係る検索クエリ連関性判断方法を示したフローチャートである。 本発明の一実施形態において、データベースを維持する過程を示したフローチャートである。 本発明の一実施形態において、データベースに含まれたレコードの一例を示した図である。 本発明の一実施形態において、検索セッション及び検索クエリを数字でマッピングしたレコードの一例を示した図である。 本発明の一実施形態において、検索セッション数をカウントするのに用いられるハッシュツリーデータ構造の一例を示した図である。 本発明の一実施形態において、連関検索クエリが記録された第2データベースの一例を示した図である。 本発明のさらに他の実施形態に係る検索クエリ連関性判断システムを示したブロック図である。

Claims (20)

  1. 検索クエリ間の連関性を判断する方法であって、
    検索セッションと、前記検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードであって所定の時間間隔ごとに生成されて記録されるレコードとを含むデータベースを維持する段階と、
    各検索クエリ別クリック率情報を所定の記録手段に記録して維持する段階と、
    前記データベースを参照して前記時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成する段階と、
    前記データベースを参照して前記時間間隔内に第1検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、前記時間間隔内に第2検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成する段階と、
    前記データベースを参照して前記時間間隔内に前記第1検索クエリ及び前記第2検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する段階と、
    前記第1検索セッション数情報及び前記第3検索セッション数情報を用いて条件付き確率情報を生成する段階と、
    前記総検索セッション数情報、前記第1検索セッション数情報、前記第2検索セッション数情報、及び前記第3検索セッション数情報を用いて相関関係情報を生成する段階と、
    前記記録手段を参照して前記第2検索クエリのクリック率情報を照会する段階と、
    前記条件付き確率情報、前記相関関係情報、及び前記クリック率情報に基づいて前記第1検索クエリと前記第2検索クエリ間の連関性を判断する段階と、を含むことを特徴とする検索クエリ連関性判断方法。
  2. 前記記録手段に記録される前記クリック率情報は、前記各検索クエリの検索回数に対する検索結果についてのクリック回数の割合に基づいて生成されることを特徴とする請求項1に記載の検索クエリ連関性判断方法。
  3. 第1検索クエリと第2検索クエリ間の連関性を判断する前記段階は、
    前記クリック率情報が所定の基準数値以上である場合に、前記第1検索クエリと前記第2検索クエリの連関性を判断することを特徴とする請求項1に記載の検索クエリ連関性判断方法。
  4. 第1検索クエリと第2検索クエリ間の連関性を判断する前記段階は、
    前記条件付き確率情報、前記相関関係情報、及び前記クリック率情報の乗算演算値に基づいて前記第1検索クエリと前記第2検索クエリ間の連関性を判断することを特徴とする請求項1に記載の検索クエリ連関性判断方法。
  5. 検索クエリ間の連関性を判断する方法であって、
    検索セッションと、前記検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードであって所定の時間間隔ごとに生成されて記録されるレコードとを含むデータベースを維持する段階と、
    前記データベースを参照して前記時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成する段階と、
    前記データベースを参照して前記時間間隔内に第1検索クエリが受信された後、第2検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成する段階と、
    前記データベースを参照して前記時間間隔内に第3検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成する段階と、
    前記データベースを参照して前記時間間隔内に前記第1検索クエリと前記第2検索クエリが受信された後、前記第3検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成する段階と、
    前記第1検索セッション数情報及び前記第3検索セッション数情報を用いて条件付き確率情報を生成する段階と、
    前記総検索セッション数情報、前記第1検索セッション数情報、前記第2検索セッション数情報、及び前記第3検索セッション数情報を用いて相関関係情報を生成する段階と、
    前記条件付き確率情報及び前記相関関係情報に基づいて、前記第1検索クエリ、前記第2検索クエリ、及び前記第3検索クエリ間の連関性を判断する段階と、を含むことを特徴とする検索クエリ連関性判断方法。
  6. 第1検索セッション数情報を生成する前記段階は、
    前記時間間隔内に順に前記第1検索クエリ、前記第2検索クエリが受信された検索セッションの数をカウントして前記第1検索セッション数情報を生成することを特徴とする請求項5に記載の検索クエリ連関性判断方法。
  7. 第3検索セッション数情報を生成する前記段階は、
    前記時間間隔内に順に前記第1検索クエリ、前記第2検索クエリ、前記第3検索クエリが受信された検索セッションの数をカウントして前記第3検索セッション数情報を生成することを特徴とする請求項6に記載の検索クエリ連関性判断方法。
  8. 各検索クエリ別クリック率情報を所定の記録手段に記録して維持する段階と、
    前記記録手段を参照して前記第3検索クエリのクリック率情報を照会する段階と、をさらに含み、
    前記第1検索クエリ、前記第2検索クエリ、及び前記第3検索クエリ間の連関性を判断する前記段階は、
    前記条件付き確率情報、前記相関関係情報、及び前記クリック率情報に基づいて前記第1検索クエリ、前記第2検索クエリ、及び前記第3検索クエリ間の連関性を判断することを特徴とする請求項5に記載の検索クエリ連関性判断方法。
  9. 前記第1検索クエリ、前記第2検索クエリ、及び前記第3検索クエリ間の連関性を判断する前記段階は、
    前記条件付き確率情報、前記相関関係情報、及び前記クリック率情報を用いて前記第1検索クエリ、前記第2検索クエリ、及び前記第3検索クエリ間の連関指数情報を生成する段階を含むことを特徴とする請求項8に記載の検索クエリ連関性判断方法。
  10. 前記連関指数情報の降順に従って所定数の前記第3検索クエリを選定及びソーティングし、前記第1検索クエリ及び前記第2検索クエリに対応する連関検索クエリとして第2データベースに記録する段階と、
    ユーザ端末機から前記第1検索クエリを受信した後、前記第2検索クエリを受信する段階と、
    前記第2データベースを参照して前記第1検索クエリ及び前記第2検索クエリに対応する連関検索クエリを抽出する段階と、
    前記抽出された連関検索クエリを前記ユーザ端末機に提供する段階と、をさらに含むことを特徴とする請求項9に記載の連関検索クエリ抽出方法。
  11. 前記連関性を判断する前記段階は、
    前記条件付き確率情報が所定数値以上である場合に前記連関性を判断し、
    前記数値は、前記第1検索セッション数情報の上昇に応じて減少する所定の関数に基づいて変動することを特徴とする請求項1又は5に記載の検索クエリ連関性判断方法。
  12. 前記検索セッションは、前記ユーザ端末機に検索窓が提供される際に設定され、所定の時間内に前記ユーザ端末機からデータ送信がない場合に終了し、
    前記検索セッションの終了後、前記ユーザ端末機から新しい検索クエリを受信した場合には、新しい検索セッションを開始することを特徴とする請求項1又は5に記載の検索クエリ連関性判断方法。
  13. 検索セッションと、前記検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードとを含むデータベースを維持する前記段階は、
    第1検索セッションと連関した第1検索セッション識別子を生成して前記データベースに記録する段階と、
    前記第1検索セッション識別子及び最終検索時刻に関する第1時刻情報をユーザ端末機に送信する段階と、
    前記ユーザ端末機から検索クエリを受信する段階と、
    前記検索クエリが受信された第2時刻情報及び前記第1時刻情報を比較する段階と、
    前記比較した結果、前記第1時刻情報及び前記第2時刻情報の間の差が所定の時間を超える場合には、第2検索セッションと連関した第2検索セッション識別子を生成して前記第2検索セッション識別子及び前記受信された検索クエリに関するレコードを前記データベースに記録し、前記差が所定の時間以下である場合には、前記第1検索セッション識別子と連関して前記受信された検索クエリに関するレコードを前記データベースに記録する段階と、を含むことを特徴とする請求項1又は5に記載の検索クエリ連関性判断方法。
  14. 請求項1から10のいずれか一項に記載の検索クエリ連関性判断方法を実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体。
  15. 検索クエリ間の連関性を判断するシステムであって、
    検索セッションと、前記検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードであって所定の時間間隔ごとに生成されて記録されるレコードとを含んで維持するデータベースと、
    各検索クエリ別クリック率情報を記録して維持する記録手段と、
    前記データベースを参照して前記時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成し、前記時間間隔内に第1検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、前記時間間隔内に第2検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成し、前記時間間隔内に前記第1検索クエリ及び前記第2検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成するカウンタ手段と、
    前記第1検索セッション数情報及び前記第3検索セッション数情報を用いて条件付き確率情報を生成する条件付き確率情報生成手段と、
    前記総検索セッション数情報、前記第1検索セッション数情報、前記第2検索セッション数情報、及び前記第3検索セッション数情報を用いて相関関係情報を生成する相関関係情報生成手段と、
    前記記録手段を参照して前記第2検索クエリのクリック率情報を照会し、前記条件付き確率情報、前記相関関係情報、及び前記クリック率情報に基づいて、前記第1検索クエリと前記第2検索クエリ間の連関性を判断する連関性判断手段と、を有することを特徴とする検索クエリ連関性判断システム。
  16. 検索クエリ間の連関性を判断するシステムであって、
    検索セッションと、前記検索セッションの間にユーザ端末機から受信された検索クエリに関するレコードであって所定の時間間隔ごとに生成されて記録されるレコードとを含んで維持するデータベースと、
    前記データベースを参照して前記時間間隔内に設定された総検索セッションの数をカウントして総検索セッション数情報を生成し、前記時間間隔内に第1検索クエリが受信された後、第2検索クエリが受信された検索セッションの数をカウントして第1検索セッション数情報を生成し、前記時間間隔内に第3検索クエリが受信された検索セッションの数をカウントして第2検索セッション数情報を生成し、前記データベースを参照して前記時間間隔内に前記第1検索クエリと前記第2検索クエリが受信された後、前記第3検索クエリが受信された検索セッションの数をカウントして第3検索セッション数情報を生成するカウンタ手段と、
    前記第1検索セッション数情報及び前記第3検索セッション数情報を用いて条件付き確率情報を生成する条件付き確率情報生成手段と、
    前記総検索セッション数情報、前記第1検索セッション数情報、前記第2検索セッション数情報、及び前記第3検索セッション数情報を用いて相関関係情報を生成する相関関係情報生成手段と、
    前記条件付き確率情報及び前記相関関係情報に基づいて、前記第1検索クエリ、前記第2検索クエリ、及び前記第3検索クエリ間の連関性を判断する連関性判断手段と、を有することを特徴とする検索クエリ連関性判断システム。
  17. 前記カウンタ手段は、
    前記時間間隔内に順に前記第1検索クエリ、前記第2検索クエリが受信された検索セッションの数をカウントして前記第1検索セッション数情報を生成し、
    前記時間間隔内に順に前記第1検索クエリ、前記第2検索クエリ、前記第3検索クエリが受信された検索セッションの数をカウントして前記第3検索セッション数情報を生成することを特徴とする請求項16に記載の検索クエリ連関性判断システム。
  18. 各検索クエリ別クリック率情報を記録して維持する記録手段をさらに含み、
    前記連関性判断手段は、前記記録手段を参照して前記第3検索クエリのクリック率情報を照会し、前記条件付き確率情報、前記相関関係情報、及び前記クリック率情報に基づいて前記第1検索クエリ、前記第2検索クエリ、及び前記第3検索クエリ間の連関性を判断することを特徴とする請求項16に記載の検索クエリ連関性判断システム。
  19. 前記連関性判断手段は、前記条件付き確率情報が所定数値以上である場合に前記連関性を判断し、前記数値は、前記第1検索セッション数情報の上昇に応じて減少する所定の関数に基づいて変動することを特徴とする請求項15又は16に記載の検索クエリ連関性判断システム。
  20. 前記検索セッションは、前記ユーザ端末機に検索窓が提供される際に設定され、所定の時間内に前記ユーザ端末機からデータ送信がない場合に終了し、
    前記検索セッションの終了後、前記ユーザ端末機から新しい検索クエリを受信した場合には、新しい検索セッションを開始することを特徴とする請求項15又は16に記載の検索クエリ連関性判断システム。
JP2008512225A 2005-06-27 2006-06-16 検索クエリ連関性判断方法及びシステム Active JP4741657B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2005-0055750 2005-06-27
KR1020050055750A KR100544514B1 (ko) 2005-06-27 2005-06-27 검색 쿼리 연관성 판단 방법 및 시스템
PCT/KR2006/002323 WO2007001128A1 (en) 2005-06-27 2006-06-16 Method and system for determining relation between search terms in the internet search system

Publications (2)

Publication Number Publication Date
JP2008541292A true JP2008541292A (ja) 2008-11-20
JP4741657B2 JP4741657B2 (ja) 2011-08-03

Family

ID=37178276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008512225A Active JP4741657B2 (ja) 2005-06-27 2006-06-16 検索クエリ連関性判断方法及びシステム

Country Status (4)

Country Link
US (1) US7693904B2 (ja)
JP (1) JP4741657B2 (ja)
KR (1) KR100544514B1 (ja)
WO (1) WO2007001128A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011530108A (ja) * 2008-07-29 2011-12-15 ヤフー! インコーポレイテッド リサーチセッションの検出に基づくリサーチツールへのアクセス
JP2012511779A (ja) * 2008-12-11 2012-05-24 マイクロソフト コーポレーション 検索結果を伴う最近の履歴を提供すること
JP2015526809A (ja) * 2012-07-20 2015-09-10 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited クエリ拡張

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7747607B2 (en) * 2006-09-21 2010-06-29 Yahoo! Inc. Determining logically-related sub-strings of a string
US8776092B2 (en) * 2006-09-29 2014-07-08 Rockwell Automation Technologies, Inc. Multiple interface support
US9217998B2 (en) * 2006-09-29 2015-12-22 Rockwell Automation Technologies, Inc. Management and development of an industrial environment
US8818757B2 (en) * 2008-09-30 2014-08-26 Rockwell Automation Technologies, Inc. Modular object and host matching
US20080082577A1 (en) * 2006-09-29 2008-04-03 Rockwell Automation Technologies, Inc. Module classification and searching for industrial control systems
US7676279B2 (en) * 2006-09-29 2010-03-09 Rockwell Automation Technologies, Inc. Services for industrial control systems
US7835805B2 (en) * 2006-09-29 2010-11-16 Rockwell Automation Technologies, Inc. HMI views of modules for industrial control systems
US8732658B2 (en) * 2006-09-29 2014-05-20 Rockwell Automation Technologies, Inc. Layered interface in an industrial environment
US8078296B2 (en) * 2006-09-29 2011-12-13 Rockwell Automation Technologies, Inc. Dynamic procedure selection
US9058032B2 (en) * 2006-09-29 2015-06-16 Rockwell Automation Technologies, Inc. Hosting requirements for services
US8041435B2 (en) * 2008-09-30 2011-10-18 Rockwell Automation Technologies, Inc. Modular object dynamic hosting
US7912560B2 (en) * 2006-09-29 2011-03-22 Rockwell Automation Technologies, Inc. Module and controller operation for industrial control systems
US8265775B2 (en) * 2008-09-30 2012-09-11 Rockwell Automation Technologies, Inc. Modular object publication and discovery
US7856279B2 (en) * 2006-09-29 2010-12-21 Rockwell Automation Technologies, Inc. Module structure and use for industrial control systems
US9261877B2 (en) * 2006-09-29 2016-02-16 Rockwell Automation Technologies, Inc. Multiple machine interface
US7920482B2 (en) * 2006-09-29 2011-04-05 Verint Americas Inc. Systems and methods for monitoring information corresponding to communication sessions
JP2008203997A (ja) * 2007-02-16 2008-09-04 Toshiba Corp 文書検索装置及びプログラム
US8655868B2 (en) * 2007-09-12 2014-02-18 Ebay Inc. Inference of query relationships based on retrieved attributes
KR100910515B1 (ko) 2008-01-02 2009-07-31 엔에이치엔(주) 연관 검색어 판단 방법 및 시스템
JP5327784B2 (ja) * 2008-07-30 2013-10-30 株式会社日立製作所 計算機システム、情報収集支援装置及び情報収集支援方法
JP2010102385A (ja) * 2008-10-21 2010-05-06 Kddi Corp ユーザ分類装置、広告配信装置、ユーザ分類方法、広告配信方法、およびプログラム
KR101045955B1 (ko) 2008-11-14 2011-07-04 한국과학기술정보연구원 문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체
US20110184802A1 (en) * 2010-01-25 2011-07-28 Microsoft Corporation Auction format selection using historical data
JP5340491B2 (ja) 2010-11-10 2013-11-13 楽天株式会社 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、記録媒体、および、関連語登録システム
CN103034665B (zh) * 2011-10-10 2016-01-06 阿里巴巴集团控股有限公司 信息查询方法和装置
US20140136295A1 (en) 2012-11-13 2014-05-15 Apptio, Inc. Dynamic recommendations taken over time for reservations of information technology resources
US10417591B2 (en) 2013-07-03 2019-09-17 Apptio, Inc. Recursive processing of object allocation rules
US10325232B2 (en) 2013-09-20 2019-06-18 Apptio, Inc. Allocating heritage information in data models
US11244364B2 (en) 2014-02-13 2022-02-08 Apptio, Inc. Unified modeling of technology towers
GB2556504A (en) 2015-06-30 2018-05-30 Apptio Inc Infrastructure benchmarking based on dynamic cost modeling
US10268979B2 (en) 2015-09-28 2019-04-23 Apptio, Inc. Intermediate resource allocation tracking in data models
US10387815B2 (en) 2015-09-29 2019-08-20 Apptio, Inc. Continuously variable resolution of resource allocation
US10726367B2 (en) 2015-12-28 2020-07-28 Apptio, Inc. Resource allocation forecasting
EP3188038B1 (en) * 2015-12-31 2020-11-04 Dassault Systèmes Evaluation of a training set
US10474974B2 (en) 2016-09-08 2019-11-12 Apptio, Inc. Reciprocal models for resource allocation
US10936978B2 (en) 2016-09-20 2021-03-02 Apptio, Inc. Models for visualizing resource allocation
US10482407B2 (en) 2016-11-14 2019-11-19 Apptio, Inc. Identifying resource allocation discrepancies
US10157356B2 (en) * 2016-12-14 2018-12-18 Apptio, Inc. Activity based resource allocation modeling
US10268980B1 (en) * 2017-12-29 2019-04-23 Apptio, Inc. Report generation based on user responsibility
US10324951B1 (en) 2017-12-29 2019-06-18 Apptio, Inc. Tracking and viewing model changes based on time
US11775552B2 (en) 2017-12-29 2023-10-03 Apptio, Inc. Binding annotations to data objects
US11599538B2 (en) * 2019-09-13 2023-03-07 Oracle International Corporation Associating search results, for a current query, with a recently executed prior query

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011458A (ja) * 1996-06-25 1998-01-16 Hitachi Ltd 情報検索装置
JP2002518748A (ja) * 1998-06-15 2002-06-25 アマゾン ドット コム インコーポレイテッド 検索照会改善システムおよび方法
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6208988B1 (en) * 1998-06-01 2001-03-27 Bigchalk.Com, Inc. Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US6490577B1 (en) * 1999-04-01 2002-12-03 Polyvista, Inc. Search engine with user activity memory
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
KR100372078B1 (ko) 2000-04-11 2003-02-17 이은미 관련어 검색 방법
KR100408965B1 (ko) * 2000-06-26 2003-12-06 주식회사쓰리소프트 검색조건을 추천하는 검색결과 제공방법 및 검색서버
KR100493688B1 (ko) 2003-01-08 2005-06-03 주식회사 옵투스 키워드확장장치 및 방법과 키워드확장장치를 이용한검색시스템
CN1871603B (zh) * 2003-08-21 2010-04-28 伊迪利亚公司 处理查询的系统和方法
US7716219B2 (en) * 2004-07-08 2010-05-11 Yahoo ! Inc. Database search system and method of determining a value of a keyword in a search
US20060212265A1 (en) * 2005-03-17 2006-09-21 International Business Machines Corporation Method and system for assessing quality of search engines

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1011458A (ja) * 1996-06-25 1998-01-16 Hitachi Ltd 情報検索装置
JP2002518748A (ja) * 1998-06-15 2002-06-25 アマゾン ドット コム インコーポレイテッド 検索照会改善システムおよび方法
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011530108A (ja) * 2008-07-29 2011-12-15 ヤフー! インコーポレイテッド リサーチセッションの検出に基づくリサーチツールへのアクセス
JP2012511779A (ja) * 2008-12-11 2012-05-24 マイクロソフト コーポレーション 検索結果を伴う最近の履歴を提供すること
JP2015526809A (ja) * 2012-07-20 2015-09-10 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited クエリ拡張

Also Published As

Publication number Publication date
KR100544514B1 (ko) 2006-01-24
WO2007001128A1 (en) 2007-01-04
JP4741657B2 (ja) 2011-08-03
US7693904B2 (en) 2010-04-06
US20080201297A1 (en) 2008-08-21

Similar Documents

Publication Publication Date Title
JP4741657B2 (ja) 検索クエリ連関性判断方法及びシステム
TWI544351B (zh) Extended query method and system
JP4633162B2 (ja) インデックス生成システム、情報検索システム、及びインデックス生成方法
CN110019658B (zh) 检索项的生成方法及相关装置
US7792833B2 (en) Ranking search results using language types
JP6355840B2 (ja) ストップワード識別方法および装置
US20100131485A1 (en) Method and system for automatic construction of information organization structure for related information browsing
AU2009234120A1 (en) Search results ranking using editing distance and document information
JP2005302042A (ja) マルチセンスクエリについての関連語提案
JP2009122807A (ja) 連想検索システム
JP2003173352A (ja) 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
JP2006323575A (ja) 文書検索システム、文書検索方法、文書検索プログラム及び記録媒体
JP2013054606A (ja) 文書検索装置及び方法及びプログラム
JP4189387B2 (ja) 知識検索システム、知識検索方法及びプログラム
JP2000339322A (ja) ユーザ属性特定方法、ユーザ属性特定装置、および、その方法を記録した記録媒体
KR101096285B1 (ko) 연관 검색 쿼리 추출 방법 및 시스템
KR100525616B1 (ko) 연관 검색 쿼리 추출 방법 및 시스템
JP2003173351A (ja) 情報解析、収集、検索方法、装置、プログラム、および記録媒体
JP5308918B2 (ja) キーワード抽出方法、キーワード抽出装置およびキーワード抽出プログラム
KR100525618B1 (ko) 연관 검색 쿼리 추출 방법 및 시스템
KR100525617B1 (ko) 연관 검색 쿼리 추출 방법 및 시스템
JP5559725B2 (ja) 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法
Sardar et al. Resource Selection in Federated Web Search
KR20050100907A (ko) 연관 검색 쿼리 추출 방법 및 시스템
KR100574888B1 (ko) 정보검색을 위한 무가치 필드의 정의 및 활용 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110419

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110506

R150 Certificate of patent or registration of utility model

Ref document number: 4741657

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250