JP2008537809A - ページグループを用いた情報検索サービス提供サーバー、方法及びシステム - Google Patents

ページグループを用いた情報検索サービス提供サーバー、方法及びシステム Download PDF

Info

Publication number
JP2008537809A
JP2008537809A JP2007557935A JP2007557935A JP2008537809A JP 2008537809 A JP2008537809 A JP 2008537809A JP 2007557935 A JP2007557935 A JP 2007557935A JP 2007557935 A JP2007557935 A JP 2007557935A JP 2008537809 A JP2008537809 A JP 2008537809A
Authority
JP
Japan
Prior art keywords
information
search
url
group
grouped
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007557935A
Other languages
English (en)
Other versions
JP4769822B2 (ja
Inventor
ナム、セ‐ドン
シン、ジュン‐ホ
Original Assignee
チョンヌン インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by チョンヌン インコーポレイテッド filed Critical チョンヌン インコーポレイテッド
Priority claimed from PCT/KR2006/000739 external-priority patent/WO2006107141A1/en
Publication of JP2008537809A publication Critical patent/JP2008537809A/ja
Application granted granted Critical
Publication of JP4769822B2 publication Critical patent/JP4769822B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

ページグループを用いた情報検索サービス提供サーバー、提供方法及びシステムを提供する。収集されたデータから該データの存在していた位置情報を分析して位置情報の形式を生成する段階と、生成された位置情報の形式によって収集されたデータをグループ別にまとめる段階と、まとめられたグループから任意のキーワードと関連したグループを選択し、グループ別グループ化検索結果を提供する段階と、を含む。したがって、質疑語を最も多く含む他、質疑語と関連した情報を多く含む検索結果を提供し、使用者が正確な情報を迅速に検索できるようにする検索サービスを提供できる。
【選択図】図2

Description

本発明は、情報検索サービスに係り、より詳細には、ページグループを用いた情報検索サービス提供サーバー、方法及びそのシステムに関する。
インターネットの発達に伴い、インターネット上の膨大な量の情報をコンピュータを用いて適切に加工し体系的に蓄積し、ユーザがその情報を迅速にかつ正確に探すことができるインターネット情報検索技術が発展されてきている。
インターネット情報検索技術は、インターネット上のイメージ、音声、動映像などの様々な形態の情報をウェブブラウザ(Web Browser)を用いて容易で迅速に検索できるようにするが、幾何級数的に増加する数多くのウェブサイト(Web Site)のうち、どのウェブサイトに必要な情報があるかが確認し難いという欠点がある。このような欠点を克服するために工夫された方法の中で最も一般的なものは、検索エンジン(Search Engine)を利用する方法である。
検索エンジンとは、WWW(World Wide Web)のように、企業や独自のネットワーク又はパーソナルコンピュータ内のコンピュータシステムに格納された情報の検索を手助けするためにデザインされたソフトウェア(プログラム)のことを総称する。検索エンジンは、通常、検索ロボット(Search Robot)やウェブスパイダー(Web Spider)プログラムと呼ばれる検索プログラムが収集したウェブサイトの情報に対する索引(インデックス)作業を行い、データベース(Database)に保存する。そして、インターネット使用者に、予め与えられたワードやフレーズを含む特定の基準に対応したコンテンツに対する問い合わせを許容し、上記基準と一致する参照リストを検索する。
検索エンジンは、ウェブインデックス(Web Index)方式、ウェブディレクトリ(Web Directory)方式、メタ(Meta)検索方式などで具現される。ウェブインデックス方式は、最も一般的な方式で、検索ロボット(Search Robot)やウェブスパイダー(Web Spider)プログラムと呼ばれる検索プログラムがインターネット上のウェブサイトの情報に対して索引作業を行ってデータベース(Database)に保存した後、インターネット使用者に、予め与えられたワードやフレーズを含む特定の基準に対応したコンテンツに対する問い合わせを許容し、上記基準と一致する参照リストを検索する。
また、ウェブディレクトリ方式は、インターネット上に存在するウェブページを主題別、階層別に分類し、項目ディレクトリを作成する。そして、使用者に、検索しようとする情報に最も近い項目の1つを選択させ、検索範囲を次第に狭めながら情報を検索する方式である。
また、メタ検索方式は、ウェブインデックス方式から進化した方式で、ウェブインデックス方式で検索サービスを提供する複数の検索エンジンを集めてメニューとして構成し、使用者が複数の検索エンジンから一つの検索エンジンを選択し、選択した検索エンジンを用いて検索を行うようにした方式である。
しかしながら、これらの検索エンジンは、その方式によってそれぞれ問題点を持っている。すなわち、ウェブディレクトリ方式は、検索結果として得るウェブページの数が比較的少ないために十分な検索結果が得られない他、所望の情報を得るまでは大分類、中分類、小分類、情報などの複数の段階を経なければならず、中間の段階に誤って進入すると検索に時間がかかってしまう。また、ウェブインデックス方式とメタ検索方式は、検索結果が多すぎて使用者を混乱させる恐れがある他、特定の質疑語を含むウェブページを全て収集した結果を提供するので、検索の信頼度が低い。
特に、ウェブインデックス方式を部分的に取り込んだメタ検索方式とウェブインデックス方式は、検索を行うに際して独自のアルゴリズムを用いて信頼度の高いウェブページを優先的に提供するものの、質疑語を含む全てのウェブページを提供するために、検索結果として提供されるウェブページが、使用者が真に所望する情報を含むウェブページである確率は低い。
このような従来の検索方式は、本から情報を検索することに例えると、検索しようとする情報を含む1冊またはそれ以上の本を提供するのではなく、その本において当該の情報を含む各頁を提供することに留まる断片的な検索であって、所望の情報と関連した情報を提供できず、包括的な検索が不可能だった。これに起因する検索結果の低い信頼度を、検索エンジンとは別途に、内部コンテンツ(例えば、ポータル(Portal)サイトのカフェ(Cafe)、ブログ(Blog)、知識人サービス等)を用いて補完している実情にある。
本発明は上記の問題点を解決するためのもので、検索しようとする情報と最も一致する情報を検索すべく、所定の基準に適合する複数のウェブページをグループにまとめて索引し、ウェブページのグループ単位に検索を行う、ページグループを用いた情報検索サービス提供サーバー、方法及びシステムを提供することにある。
上記の目的を達成するために、本発明は、(a)収集されたデータから該データの位置していた位置情報を分析して位置情報の形式を生成する段階と、(b)生成された位置情報の形式によって収集されたデータをグループ別にまとめる段階と、(c)まとめられたグループから任意のキーワードと関連したグループを選択し、グループ化検索結果を提供する段階とを含むグループ化検索サービス提供方法を提供する。
また、上記目的を達成するために本発明は、質疑語を送信し、検索結果を出力する使用者端末機、複数のウェブページを提供するウェブサーバー、及び使用者端末機から質疑語を受信して検索結果を生成し、使用者端末機に送信するグループ化検索サーバーを備えるシステムにおける情報を検索するサービスを提供する方法であって、(a)使用者端末機から質疑語及び検索要請信号を受信する段階と、(b)ウェブサーバーから複数のウェブページを受信する段階と、(c)複数のウェブページを分析してURL形式を生成し、URL形式を用いて複数のウェブページをまとめる段階と、(d)段階(c)でまとめられたウェブページのグループから索引語を抽出し、索引語情報及び索引語が参照するウェブページグループのURL情報を生成する段階と、(e)質疑語を索引語と比較してグループ化検索結果情報を生成した後、使用者端末機に送信する段階とを含むグループ化検索サービス提供方法を提供する。
また、上記の目的を達成するために、本発明は、有無線通信網上の複数のウェブページ内の情報を検索し、検索結果を提供するシステムであって、有無線通信網を用いてウェブサーフィンを行い、質疑語情報及び検索要請信号を送信して検索を要請し、検索の要請に対するグループ化検索結果情報を受信し、備えられた画面に出力する使用者端末機と、情報を複数のウェブページとして生成して提供するウェブサーバーと、複数のウェブページを受信及び分析してURL形式を生成し、複数のウェブページをURL形式を用いてまとめてウェブページのグループ単位に索引し、ウェブページのグループ単位で情報を検索してグループ化検索結果情報を生成した後に使用者端末機に送信するグループ化検索サーバーとを備えるグループ化検索サービス提供システムを提供する。
また、上記の目的を達成するために、本発明は、収集されたデータからそのデータの位置していた位置情報を分析して位置情報の形式を生成する位置情報形式生成モジュールと、生成された位置情報の形式によって収集されたデータをグループ別にまとめるページグループ化モジュールと、まとめられたグループから任意のキーワードと関連したグループを選択し、グループ化検索結果を提供する制御部とを備えるグループ化検索サーバーを提供する。
また、上記の目的を達成するために、本発明は、有無線通信網を用いてウェブサーフィンを行う使用者端末機から質疑語及び検索要請信号を受信してウェブサーバーによって提供されるウェブページ上の情報を検索し、検索結果を使用者端末機に送信する検索サービスを提供するサーバーであって、ウェブページ収集プログラムを実行し、有無線通信網に接続したウェブサーバーによって提供される複数のウェブページを保存するウェブページ収集モジュールと、ウェブページ収集モジュールによって受信された複数のウェブページを分析してURL形式を生成するURL形式生成モジュールと、URL形式生成モジュールによって生成されたURL形式を用いて複数のウェブページをウェブページのグループにまとめるページグループ化モジュールと、ページグループ化モジュールによってまとめられたウェブページのグループから索引語を抽出し、索引語情報及び索引語が参照するウェブページグループのURL情報を生成して保存する索引管理モジュールと、使用者端末機から質疑語及び情報検索要請信号を受信して索引語情報を検索し、質疑語と関連した索引語を持つウェブページグループのURL情報をグループ化検索結果情報として生成した後に使用者端末機に送信する質疑管理モジュールと、グループ化検索サーバーがウェブページのグループを用いて検索を行うように、ウェブページ収集モジュール、URL形式生成モジュール、ページグループ化モジュール、索引管理モジュール及び質疑管理モジュールを制御し、グループ化検索サーバーが有無線通信網を用いて使用者端末機及びウェブサーバーと通信を行うように制御する制御部と、を備えるグループ化検索サーバーを提供する。
本発明によれば、複数のウェブページを分析して位置情報形式を生成し、これを用いて類似な情報を含むウェブページをグループにまとめて情報検索に用いるため、質疑語と関連した情報を含む複数の最上位のウェブページ、すなわち、代表ページとその下位ページをグループにまとめて検索結果として提供し、使用者が正確な情報を迅速に検索できるようにする検索サービスを提供することが可能になる。
以下、本発明の好適な実施例を、添付の図面を参照しつつ詳細に説明する。
図1は、本発明の好適な実施例によるページグループを用いた情報検索サービス提供システムを示すブロック図である。
本発明の好適な実施例によるページグループを用いた情報検索サービス提供システムは、使用者端末機110、有無線通信網120、ウェブサーバー130、グループ化検索サーバー140、グループ化検索データベース(Database:以下、DBと称する)141、索引サーバー150及び索引DB151を含む。
使用者端末機110は、インターネット使用者の操作によって有無線通信網120を介してグループ化検索サーバー140に接続し、質疑語情報と一緒に検索要請信号を送信し、グループ化検索サーバー140が提供するグループ化検索結果情報を受信し、備えられた画面に出力するコンピュータである。
したがって、使用者端末機110は、有無線通信網120を介してグループ化検索サーバー140に接続するためにVDSL(Very High Data Rate Digital Subscriber Line)モデム、ケーブルモデムなどのようなインターネットモデムを含む有線通信手段及び/またはCDMA(Code Division Multiple Access)2000モデム、WCDMA(Wide Band CDMA)モデムなどのような移動通信モデムを含む移動通信手段を備え、使用者から質疑語を受けて情報の検索を要請し、検索結果を画面に出力するためのウェブブラウザ(Web Browser)プログラムを保存したメモリー(Memory)と使用者端末機110の全体的な動作を制御するための演算を行うマイクロプロセッサを有する制御部を備える。
このような使用者端末機110は、デスクトップ(Desktop)コンピュータまたはラップトップ(Lap Top)やノートブックなどの移動コンピュータのような個人用コンピュータ(PC:Personal Computer)などを使用しても良く、PDA(Personal Digital Assistant)、セルラーフォン、PCS(Personal Communication Service)フォン、ハンドヘルドPC(Hand−Held PC)、GSM(Global System for Mobile)フォン、W−CDMA(Wide Band CDMA)フォン、CDMA−2000フォン、MBS(Mobile Broadband System)フォンなどのような移動通信端末機を使用してもよい。
有無線通信網120は、使用者端末機110、ウェブサーバー130、グループ化検索サーバー140、索引サーバー150を有線又は無線で連結し、各構成要素相互間に送受信されるデータを中継する。
ウェブサーバー130は、通常のネットワークサーバーで具現される複数のコンピュータシステム又はコンピュータソフトウェアを含み、様々な情報をウェブページ(Web Page)として提供する。ここで、ネットワークサーバーとは、通常、私設イントラネット又はインターネットのようなコンピューターネットワークを介して他のネットワークサーバーと通信できる下位装置と連結されて作業要請を受け取り、この作業を行ってその結果を提供するコンピュータシステム及びコンピュータソフトウェア(ワークサーバープログラム)のことを意味する。ただし、このようなネットワークサーバープログラムの他にも、ネットワークサーバー上で動作する一連の応用プログラムと、場合によっては内部に構築されている各種データベースを含む広い概念として理解されるべきである。このようなネットワークサーバーは、DOS、Windows(登録商標)、Linux、UNIX(登録商標)又はMac OSなどの運営体制によって様々に提供されているネットワークサーバープログラムを用いて具現されることができる。
索引サーバー150は、通常、ウェブロボット(web robot)と呼ばれるデータ収集プログラムを実行し、有無線通信網120に連結されたウェブサーバー130からデータを収集する。索引サーバー150は周期的に収集データを更新し、索引DB151は、収集されたデータを転置ファイル(inverted file)などを用いて保存する。
グループ化検索サーバー140は、索引サーバー150及び索引DB151との通信によって読み込んだウェブデータの位置情報を分析し、複数の位置情報形式を生成する。ここで、位置情報は、収集されたウェブデータのインターネット上における経路を含む位置情報を意味し、好ましくは、ウェブデータのURL(Uniform Resource Locator)を含む。このようにして生成された複数の位置情報形式間の関係を分析してグループ化(groupong)過程を行う。この過程で、好ましくは、URL形式ツリー(URL Pattern Tree:以下、‘UPツリー'と称する。)情報を用いて、同一でない複数のURL形式間の関係を設定し、URL形式のグループ化フィールド値が同一であるウェブページをグループ化する段階が含まれることができ、URL形式を生成してグループ化する過程においては、あらかじめ定義されたURL形式辞書などを参照する段階が代案的に又は追加的に含まれることができる。
また、グループ化検索サーバー140は、ウェブページのグループ単位に索引語を抽出し、索引語情報と索引語が参照するウェブページグループのURL情報を生成してグループ化検索DB141に保存し、使用者端末機110から質疑語と一緒に情報検索要請信号を受信すると、質疑語と索引語を比較してグループ化検索結果情報を生成する。生成されたグループ化検索結果情報は、質疑語と関連した他の検索結果と一緒に使用者端末機110に転送されることができる。グループ化検索サーバー140に関する詳細は、図2で説明するものとする。
一方、グループ化検索サーバー140は、特定質疑語と関連した使用者からの検索要請信号がない場合にも、任意のキーワードと関連したグループ化検索結果を提供するのに用いられることができる。例えば、使用者入力質疑語を含む上位概念または使用者入力質疑語と関連した任意のキーワードを用いてグループ化検索結果を提供することもでき、イッシュ化したニュースなどに対するキーワードを用いてグループ化検索結果を提供することによって、豊富な情報源の提供に一助できる。
グループ化検索DB141は、グループ化検索サーバー140が生成した索引語情報とウェブページグループの位置情報(URL情報を含む。)を保存する。好ましくは、各グループに対する表題語情報が追加的に保存されることができる。ここで、DBは、データベース管理システム(DBMS:Database Management System)プログラムなどを用いてコンピュータシステムの保存空間に具現されたデータ構造を意味するもので、データの検索、削除、編集及び追加などを自由に行えるデータ保存形態を意味する。このようなデータベースは、Oracle、informix、Sybase、MSSQL(Microsoft Structured Query Language)またはDB2のような関係型データベース管理システム(RDBMS:Relational Database Management System)などを用いて本発明の目的に合うように具現されることができ、データの保存、検索、削除、編集及び追加などの機能を行うための適切なフィールド(Field)又は構成要素を持っている。また。グループ化検索DB141と索引DB151は分離又は統合して運営可能である。
図2は、本発明の好適な実施例によるグループ化検索サーバーを示すブロック図である。
本発明の好適な実施例によるグループ化検索サーバー140は、ウェブページ収集モジュール210、URL形式生成モジュール220、ページグループ化モジュール230、索引管理モジュール240、質疑管理モジュール250及び制御部260を備えるネットワークサーバーである。
ウェブページ収集モジュール210は、有無線通信網120を介してウェブサーバー130に接続してデータを収集する機能を担うもので、索引サーバー150が収集して索引DB151に保存した位置情報によって参照されるデータの変更などを反映するためにグループ化検索サーバー140に選択的に備えられることができる。
URL形式生成モジュール220は、制御部260又はウェブページ収集モジュール210によって獲得されたウェブページのURLを分析し、URL形式を生成する。本発明でいうURL形式は、ウェブページのURLが持つ所定の形式で、情報を検索する際に類似な内容を持つか、類似な形式で作成されたウェブページをグループ化してウェブページのグループとして管理するために生成される。本発明では、類似な複数のウェブページを一つのグループとして管理して情報を検索する。このとき、類似な複数のウェブページを選定する基準が必要とされ、この基準として用いられるのが、URL形式である。
URL形式生成モジュール220は、制御部260又はウェブページ収集モジュール210によって受信したウェブページのURLを分析し、グループ化フィールドを含むURL形式を生成する。すなわち、例えば、(公序良俗違反につき、不掲載)の(公序良俗違反につき、不掲載)サービスのID(Identification)別代表ページのURLを分析してIDをグループ化フィールドとして設定した“(公序良俗違反につき、不掲載)[ID]”というURL形式が生成されることができる。URL形式は、図3を参照して詳細に後述する。なお、本発明においてURL形式は、グループ化フィールドに限定されず、複数のウェブページが共有するHTMLテンプレート又は本文内容などによって様々に生成されてもよい。
本発明のHTMLテンプレートは、ウェブページの作成を容易にするべく、よく使用される部分を一定の構造で作成した基本骨格を意味する。例えば、<Table...><TD>[文番号]</TD><TD>[題名]</TD>...</TABLE>のようにウェブページを作成する際によく使用されるタグ(Tag)の形式である。
通常、ウェブページとして作成されるHTML文書は、HTML文法(構文)に合わせたHTMLタグとテキストとの組合せで構成される。HTML文書は、表現しようとする機能によって複数の機能ブロック、すなわち、例えば、メニューを構成するためのメニューブロック、他のポータルサイトと連結するためのリンクブロック、本文内容を含めるためのメッセージブロックなどで構成される。これらの機能ブロックはウェブページ内でよく使用されるため、HTMLテンプレートで作成され、使用者の便宜を図る。
同じ管理者によって生成されたウェブページは、掲示板(Board)サービス、ブログ(Blog)サービス、マイページ((公序良俗違反につき、不掲載))サービスなどを提供する特定ウェブサーバーによって管理される複数のページに含まれることができる。すなわち、同じHTMLテンプレートを共有する複数のウェブページは、同じ管理者によって生成される可能性が高い上に、ウェブページが含む内容においても類似な事項が含まれる可能性が高い。
掲示板サービス、ブログサービス、マイページサービスなどのサービスを提供する特定ウェブサーバー130は、自身の管理する大部分のウェブページをHTMLテンプレートを用いて作成する。このため、一つのウェブサーバー130によって管理されるウェブページは、同じHTMLテンプレートを共有するようになる。したがって、同じHTMLテンプレートを共有するウェブページは、同じURL形式に変換されることができる。
ページグループ化モジュール230は、URL形式生成モジュール220によって生成されたURL形式を用い、同一でない異なる複数のURL形式を、UPツリー情報を用いてその関係を設定してグループ化した後に、その複数のURL形式のグループのうち同じグループ化フィールド値を持つウェブページをグループ化する。すなわち、ページグループ化モジュール230は、URL形式生成モジュール220によって生成された数多くのURL形式のうち、URL形式は違うものの相互関連しているURL形式を、UPツリー情報を用いてその関係を設定してグループ化した後に、該URL形式のグループのうち、URL形式のグループ化フィールド値が同一なウェブページをウェブページのグループとしてまとめる。
例えば、(公序良俗違反につき、不掲載)に登録された全てのウェブページのURLは、約20個の相異なるURL形式に一般化できるが、このような約20の相異なるURL形式をUPツリー情報を用いて一つのグループとした後に、そのうち、特定使用者のIDをグループ化フィールド値として持つウェブページをウェブページのグループとしてまとめる。これにより、(公序良俗違反につき、不掲載)に登録されたウェブページは、使用者IDを基準にしてグループ化すると、(公序良俗違反につき、不掲載)サービスに登録した使用者数分のグループとなる。また、このような作業は、(公序良俗違反につき、不掲載)だけでなく、ネイバー(Naver)ブログに登録されたウェブページにも同一に適用し、ネイバーブログに登録された使用者ID個数分のウェブページグループが生成されることができる。
なお、本発明でウェブページをグループ化する基準は、グループ化フィールド値の同一性(同一の有無)に限定されることはなく、例えば、複数のグループ化フィールドを‘AND’や‘OR’で組み合わせ、その条件を充足するウェブページをグループ化する等の様々な方法も利用可能である。また、索引管理モジュール240で抽出された索引語と該当するグループとの関連性を評価してページグループを細分化したり、変更する過程などがさらに含まれることができる。例えば、一つのページグループ(グループ)から抽出された索引語が2種類以上の分野に関するものである場合、各分野別の性格によって一つのグループに統合する、又は、二つ以上のグループに細分化する作業が要求されることができる。また、一つのページグループ(グループ)から抽出された索引語がそのグループの内容を好適に表せていない場合、グループ化検索結果の露出順位を後順位に調整する代わりに、一定の数値化した基準に基づいて該当グループをそれ以上維持しないことが、検索結果に対してより信頼性を与えることができるので、該当のグループを削除してもよい。
索引管理モジュール240は、ページグループ化モジュール230によってまとめられたウェブページのグループから索引語を抽出し、索引語情報及びウェブページのURL情報をグループ化検索DB150に保存する。すなわち、索引管理モジュール240は、ウェブページのグループから索引語を抽出して索引語情報を生成し、グループ化検索DB150の索引DB152に保存し、それぞれのウェブページのURL情報をUPツリー情報を用いてその関係を設定したウェブページグループのURL情報を生成し、グループ化検索DB141に保存する。
質疑管理モジュール250は、使用者端末機110からの質疑語又は任意のキーワードに対して索引DB152を検索し、質疑語によってマッチングされる索引語を持つウェブページグループのURL情報をグループ化検索DB141から受信してグループ化検索結果情報を生成する。この質疑語又は任意のキーワードと索引語間のマッチング過程は、あらかじめ定義された用語分類辞書などを使用したり、相互情報MI(Mutual Information)値を用いて行うことができ、それ以外にも公知の従来様々なアルゴリズムを用いて具現することができる。
制御部260は、グループ化検索サーバー140がウェブページのグループを用いて検索を行うように、前述のウェブページ収集モジュール210、URL形式生成モジュール220、ページグループ化モジュール230、索引管理モジュール240、質疑管理モジュール250などを制御する。また、索引サーバー140及び索引DB141との通信機能を行い、使用者端末機110からの質疑語検索要請信号を受信し、生成されたグループ化検索結果を送信する機能を担う。
図3及び図4は、本発明の好適な実施例によるURL形式とUPツリーを説明するための図である。
図3は、(公序良俗違反につき、不掲載)の(公序良俗違反につき、不掲載)((公序良俗違反につき、不掲載):以下、ホームピーと称する。)サービスを利用する特定使用者のホームページとその関連ページのURLを示すものである。図3に示すように、特定使用者のホームピーは、複数のウェブページを含み、複数のウェブページは使用者のIDを自身のURL内に含む。(公序良俗違反につき、不掲載)では、URLがクエリー形態、すなわち、‘?’符号の後で‘変数名=該当変数値'の形態で表現される。したがって、図3で「targetmsrl=」以降の値を、使用者のID形式を識別するための基準と把握してURL形式を生成すると、図4のようになる。あるいは、ポータルサイトなどが提供する個人型ブログ、掲示板などのサービスでは、サービス提供者のドメイン以降に「/」の区分子を用いて使用者及び掲示板を区別することもある。
図4は、ホームピーウェブページのURLを分析して生成したURL形式をツリー構造で示す図である。図3に示すように、ホームピーウェブページのURLを分析すると、各ウェブページはいずれもそのURL内に使用者ID情報を含む。したがって、複数のウェブページのURLの中で使用者のID部分は一般化するために[ID]のグループ化フィールド(Field)に変換され、当該ホームピーに含まれた掲示板分類を表す部分は[boardtype]等のグループ化フィールドに変換されることができる。グループ化フィールド候補グループを生成し、これらの候補グループのうち、そのフィールド値が変更されてもURLによってブラウジングされる内容の実質的な変化がないなどの場合には、URL形式グループ化過程で影響を与えない[IGNORE]フィールドに区分されることができる。また、各グループ化フィールド間の上下位構造は、各グループ化フィールド値の変化による該当のグループ内文書の包含関係、参照(link)関係などの分析によって決定されることができる。
このような過程によってURL形式が生成されると、(公序良俗違反につき、不掲載)の全使用者のウェブページは、生成されたURL形式に一般化可能である。グループ化フィールドの構成は、URLアドレスの分析過程を通じて自動に行うことができ、ポータルサイト、コミュニティサイトなどが提供する個人型ブログ、掲示板などの場合には、該当サービス提供者の政策(ポリシー)によってURLパターンが画一的に生成しがちなため、これらのサイトに対してはURLパターンとグループ化フィールド辞書をあらかじめ定義して参照する方式でURL形式生成とそのグループ化過程を行うことができる。
図5は、本発明の好適な実施例によるページのグループを用いた情報検索サービス提供方法を示すフローチャートである。
インターネットを利用する使用者は、所望の情報検索のために使用者端末機110を用いて質疑語を入力し、質疑語と一緒に検索要請信号をグループ化検索サーバー140に送信する(S410)。一方、ステップS410段階は、場合によって省略してもよい。すなわち、使用者から質疑語入力や検索要請信号の入力なしに、保存されたデータを分析してグループ化検索サービスを行うことができる。
次いで、使用者端末機110から質疑語と一緒に検索要請信号を受信したグループ化検索サーバー140は、索引サーバー150が事前に収集して構築した索引DB151からウェブページと関連した情報(アドレス情報を含む。)を受信する(S420)。グループ化検索サーバー140は、索引DB151から資料を補充するためにウェブページ収集モジュール210を選択的に実行することができる。
一方、使用者からの質疑語や検索要請信号無しに、あらかじめ設定された方法によってウェブロボットプログラムが実行され、ウェブページを受信してデータを保存してもよい。このように受信したデータは、索引サーバー150を通じて索引DB151に保存される。
索引サーバー150からウェブページを受信したグループ化検索サーバー140は、受信したウェブページを分析してURL形式を生成する(S430)。
URL形式を生成したグループ化検索サーバー140は、相異なるURL形式をUPツリー情報を用いてその関係を設定してグループ化した後に、該URL形式のグループのうちURL形式のグループ化フィールド値が同一なウェブページをグループ化する(S440)。
ウェブページをグループ化したグループ化検索サーバー140は、ウェブページのグループからそのグループ単位に索引語を抽出し、索引語情報とその索引語が参照するウェブページグループのURL情報を生成し(S450)、索引語情報とウェブページグループのURL情報をグループ化検索DB150に保存する(S460)。
索引語情報とウェブページグループのURL情報をグループ化検索DB150に保存したグループ化検索サーバー140は、使用者端末機110から受信した質疑語とグループ化検索DB150に保存された索引語を比較して検索し、グループ化検索結果情報を生成して使用者端末機110に送信する(S470)。
グループ化検索サーバー140から検索結果情報を受信した使用者端末機110は、受信した検索結果を、備えられた画面に出力する。一方、使用者から入力された質疑語無しにも本発明のサービスは提供されることができる。
本発明であるグループ化検索サービスは、複数のウェブページをまとめてウェブページのグループとして管理して検索に活用するので、ウェブページに含まれた単語のみを検索する狭い検索サービスではなく、複数のウェブページをグループ化してそれに関連したキーワードを検索する広い概念の検索サービスである。このような検索サービスは、掲示板検索サービスのように活用されることができる。
すなわち、最近では、特定情報に関する資料を登録し、その情報に関する質疑と応答を読み書きすることによって構成員間に特定情報を共有するウェブページ上での掲示板サービスが活性されてきた。したがって、このような掲示板サービスには、使用者の検索しようとする情報をより多く有するウェブページが含まれる。
したがって、使用者が質疑語を入力して検索を要請する際に、単に質疑語を含むウェブページを羅列するよりは、質疑語と関連した情報を共有する特定掲示板を、該掲示板のウェブページ一つ一つではなく、掲示板の代表ページとその下位ページをまとめ、このような複数の掲示板のグループをそのグループ単位に順位を決定したのち羅列して出力することによって、使用者の検索意図にさらに適合した検索結果を出力可能になる。
本発明の好適な実施例では、本発明のグループ化検索サービスを掲示板サービスとして提供することができる。なお、本発明のグループ化検索サービスを掲示板サービスとして提供しているが、これに限らず、複数のウェブページを一つのページグループにして検索する様々なサービスに適用されることができる。
図6は、本発明の好適な実施例によるグループ化検索結果を説明するための図である。
グループ化検索結果情報の提供において、露出順位は、使用者入力質疑語及び任意のキーワードとの関連性、グループ内の文書の数、一定な有効期間におけるグループ内文書増加量、グループ及びグループ文書の生成時刻又はグループ別使用者の閲覧回数を含めた人気度情報などを考慮して変更されることができる。このような関連性を評価するために、使用者入力質疑語及び任意のキーワードの該当グループ内出現頻度数、あらかじめ定義された用語分類辞書を用いた評価手法などを用いることができ、人気度情報は、該当グループ内における文書ヒット数、検索結果として提供されたグループに対する使用者クリック回数などのような反応、一定時間にグループ内に生成されたデータの量を考慮して測定されることができる。
使用者は、使用者端末機110に出力されたグループ化検索サービスを提供するウェブページにおいて質疑語入力方式で入力窓510に質疑語である“psp”を入力し、‘検索’を選択して検索を要請すると、グループ化検索結果530が出力される。図示のグループ化検索結果530は、整列方式メニュー520の‘ネオランキング順’に整列されたものである。使用者は、必要に応じて、整列方式メニュー520の‘関連文順'や‘人気度順’を選択し、グループ化検索結果530を関連文順にまたは人気度順に整列することができる。
グループ化検索結果530は、効率的な情報の提供のためにウェブ文書のグループに対する名称とその内部掲示物の題名などを上下位構造で表示できる。各ページグループに対する情報540はそのグループの分類情報及び含む文書数などを追加的に提供でき、使用者の便宜のために各グループ中の個別文書に対するリスト550が追加的に表示されることができる。また、効果的な情報提示のために各ページグループの情報源に対する分類560を追加的に提示できる。
以上の実施例は、本発明の技術的思想を例示するためのもので、本発明の技術的思想を限定するためのものではない。したがって、本発明の属する技術分野における通常の知識を持つ者にとっては、本発明の本質的な特性を逸脱しない範囲で様々な修正及び変形が可能である。したがって、本発明の技術的範囲は、添付の請求範囲の解釈によって定められるべきであり、これと同等な範囲内における全ての技術的思想は本発明の権利範囲に含まれることは自明である。
本発明の好適な実施例によるページグループを用いた情報検索サービス提供システムを示すブロック図である。 本発明の好適な実施例によるグループ化検索サーバーを示すブロック図である。 本発明の好適な実施例によるURL形式とUPツリーを説明するための図である。 本発明の好適な実施例によるURL形式とUPツリーを説明するための図である。 本発明の好適な実施例によるページグループを用いた情報検索サービス提供方法を示すフローチャートである。 本発明の好適な実施例によるグループ化検索結果画面の一例を示す図である。

Claims (22)

  1. (a)収集されたデータから該データの位置していた位置情報を分析して前記位置情報の形式を生成する段階と、
    (b)前記生成された位置情報の形式によって前記収集されたデータをグループ別にまとめる段階と、
    (c)前記まとめられたグループから任意のキーワードと関連したグループを選択し、グループ化検索結果を提供する段階と、を含むことを特徴とするグループ化検索サービス提供方法。
  2. 前記位置情報は、収集されたデータのURL(Uniform Resource Locator)情報を含み、前記位置情報形式は、前記収集されたデータが共有する所定の形式で、前記データをまとめるためのグループ化フィールドを含むことを特徴とする請求項1に記載のグループ化検索サービス提供方法。
  3. 前記(b)段階は、
    (b1)相異なる複数の前記位置情報形式を、位置情報形式ツリー情報を用いて獲得した複数の前記位置情報形式間の関係に基づいてまとめ、前記位置情報形式のグループを生成する段階と、
    (b2)前記位置情報形式のグループのうち前記位置情報形式のグループ化フィールド値を基準に前記ウェブページをグループにまとめる段階と、を含むことを特徴とする請求項1又は2に記載のグループ化検索サービス提供方法。
  4. 前記(c)段階のグループ化検索結果は、前記各グループと前記任意のキーワードとの関連程度、所定期間中に生成された文書の数及びグループ別閲覧回数のうち、少なくとも一つを考慮して整列されることを特徴とする請求項1または2に記載のグループ化検索サービス提供方法。
  5. 前記(c)段階のグループ化検索結果は、前記各グループと前記任意のキーワードとの関連程度、所定期間中に生成された文書の数及びグループ別閲覧回数のうち、少なくとも一つを考慮して整列されることを特徴とする請求項3に記載のグループ化検索サービス提供方法。
  6. 前記(a)段階の前に、インターネット上のデータをあらかじめ収集して索引化する段階をさらに含むことを特徴とする請求項1に記載のグループ化検索サービス提供方法。
  7. 質疑語を送信し、検索結果を出力する使用者端末機、複数のウェブページを提供するウェブサーバー、及び前記使用者端末機から前記質疑語を受信して前記検索結果を生成し、前記使用者端末機に送信するグループ化検索サーバーを備えるシステムにおける情報を検索するサービスを提供する方法であって、
    (a)前記使用者端末機から前記質疑語及び検索要請信号を受信する段階と、
    (b)前記ウェブサーバーから前記複数のウェブページを受信する段階と、
    (c)前記複数のウェブページを分析してURL形式を生成し、前記URL形式を用いて前記複数のウェブページをまとめる段階と、
    (d)前記段階(c)でまとめられたウェブページのグループから索引語を抽出し、索引語情報及び前記索引語が参照するウェブページグループのURL情報を生成する段階と、
    (e)前記質疑語を前記索引語と比較してグループ化検索結果情報を生成した後、前記使用者端末機に送信する段階と、を含むことを特徴とするグループ化検索サービス提供方法。
  8. 前記(c)段階は、
    (c1)前記複数のウェブページを分析して複数のURL形式を生成する段階と、
    (c2)相異なる複数の前記URL形式を、URL形式ツリー情報を用いて獲得した複数の前記URL形式間の関係に基づいてまとめ、前記URL形式のグループを生成する段階と、
    (c3)前記URL形式のグループ化フィールド値を基準にウェブページを前記ウェブページのグループとしてまとめる段階と、を含むことを特徴とする請求項7に記載のグループ化検索サービス提供方法。
  9. 前記段階(d)は、
    (d1)前記ウェブページのグループに含まれた複数のウェブページから索引語を抽出して索引語情報を生成し、グループ化検索DBに保存する段階と、
    (d2)前記索引語が参照する前記ウェブページグループのURL情報を前記索引語と対応付けて前記グループ化検索DBに保存する段階と、を含むことを特徴とする請求項7に記載のグループ化検索サービス提供方法。
  10. 前記段階(e)は、
    (e1)前記質疑語と関連した前記索引語を検索する段階と、
    (e2)前記段階(e1)で検索した前記索引語が参照する前記ウェブページグループのURL情報を検索する段階と、
    (e3)前記段階(e2)で検索した前記ウェブページグループのURL情報をグループ化検索結果情報として生成する段階と、
    (e4)前記グループ化検索結果情報を前記使用者端末機に送信する段階と、を含むことを特徴とする請求項7に記載のグループ化検索サービス提供方法。
  11. 前記(e)段階においてグループ化検索結果情報は、前記各グループと前記任意のキーワードとの関連程度、所定期間中に生成された文書の数及びグループ別閲覧回数のうち、少なくとも一つを考慮して整列されることを特徴とする請求項7乃至10のいずれか1項に記載のグループ化検索サービス提供方法。
  12. 有無線通信網上の複数のウェブページ内の情報を検索し、検索結果を提供するシステムであって、
    前記有無線通信網を用いてウェブサーフィンを行い、質疑語情報及び検索要請信号を送信して検索を要請し、前記検索の要請に対するグループ化検索結果情報を受信し、備えられた画面に出力する使用者端末機と、
    前記情報を前記複数のウェブページとして生成して提供するウェブサーバーと、
    前記複数のウェブページを受信及び分析してURL形式を生成し、前記複数のウェブページを前記URL形式を用いてまとめてウェブページのグループ単位に索引し、前記ウェブページのグループ単位内の前記情報を検索して前記グループ化検索結果情報を生成した後に前記使用者端末機に送信するグループ化検索サーバーと、を備えることを特徴とするグループ化検索サービス提供システム。
  13. 前記グループ化検索サーバーは、
    ウェブページ収集プログラムを実行し、前記有無線通信網に接続した前記ウェブサーバーによって提供される前記複数のウェブページを前記ウェブサーバーから受信して保存するウェブページ収集モジュールと、
    前記ウェブページ収集モジュールによって受信した前記複数のウェブページを分析して前記URL形式を生成するURL形式生成モジュールと、
    前記URL形式生成モジュールによって生成された前記URL形式を用いて前記複数のウェブページをウェブページのグループにまとめるページグループ化モジュールと、
    前記ページグループ化モジュールによってまとめられた前記ウェブページのグループから索引語を抽出し、索引語情報及び前記索引語が参照するウェブページグループのURL情報を生成して保存する索引管理モジュールと、
    前記使用者端末機から前記質疑語及び前記情報検索要請信号を受信して前記索引語情報を検索し、前記質疑語と関連した索引語を持つ前記ウェブページグループのURL情報をグループ化検索結果情報として生成した後に前記使用者端末機に送信する質疑管理モジュールと、
    前記グループ化検索サーバーが前記ウェブページのグループを用いて検索を行うように、前記ウェブページ収集モジュール、URL形式生成モジュール、ページグループ化モジュール、索引管理モジュール及び質疑管理モジュールを制御し、前記グループ化検索サーバーが前記有無線通信網を用いて前記使用者端末機及び前記ウェブサーバーと通信を行うように制御する制御部と、を備えることを特徴とする請求項12に記載のグループ化検索サービス提供システム。
  14. 前記URL形式生成モジュールは、
    前記URL形式を、前記ウェブページをまとめるための基準として前記ウェブページのうち類似な情報を持つウェブページが共有する所定の形式に生成し、ここで、前記URL形式は、前記ウェブページをまとめるためのグループ化フィールドを含むことを特徴とする請求項12に記載のグループ化検索サービス提供システム。
  15. 前記ページグループ化モジュールは、
    相異なる複数の前記URL形式を、URL形式ツリー情報を用いて獲得した複数の前記URL形式間の関係に基づいてまとめて前記URL形式のグループを生成し、前記URL形式のグループのうち、前記URL形式のグループ化フィールド値が同一なウェブページを前記ウェブページのグループとしてまとめることを特徴とする請求項12に記載のグループ化検索サービス提供システム。
  16. 前記ページグループ化モジュールは、
    前記URL形式のグループ化フィールドを‘AND'または‘OR'で組み合わせた値が同一なウェブページを、前記ウェブページグループとしてまとめることを特徴とする請求項12に記載のグループ化検索サービス提供システム。
  17. 前記索引管理モジュールは、
    前記ウェブページのグループ内の複数のウェブページから索引語を抽出して索引語情報を生成した後に保存し、前記索引語が参照する前記ウェブページグループのURL情報を生成して前記索引語と対応付けて保存することを特徴とする請求項12に記載のグループ化検索サービス提供システム。
  18. 前記グループ化検索サービス提供システムは、
    前記グループ化検索サーバーから受信した前記索引語情報を保存する索引DB及び前記ウェブページグループのURL情報を保存するURLDBを含むグループ化検索DBをさらに備えることを特徴とする請求項12に記載のグループ化検索サービス提供システム。
  19. 収集されたデータからそのデータの位置していた位置情報を分析して前記位置情報の形式を生成する位置情報形式生成モジュールと、
    前記生成された位置情報の形式に基づいて前記収集されたデータをグループ別にまとめるページグループ化モジュールと、
    前記まとめられたグループから任意のキーワードと関連したグループを選択し、グループ化検索結果を提供する制御部と、を備えることを特徴とするグループ化検索サーバー。
  20. 前記位置情報は、収集されたデータのURL情報を含み、前記位置情報形式は、前記収集されたデータが共有する所定の形式で前記データをまとめるためのグループ化フィールドを含むことを特徴とする請求項19に記載のグループ化検索サービス提供方法。
  21. 有無線通信網を用いてウェブサーフィンを行う使用者端末機から質疑語及び検索要請信号を受信し、ウェブサーバーによって提供されるウェブページ上の情報を検索し、検索結果を前記使用者端末機に送信する検索サービスを提供するサーバーであって、
    ウェブページ収集プログラムを実行し、前記有無線通信網に接続した前記ウェブサーバーによって提供される前記複数のウェブページを保存するウェブページ収集モジュールと、
    前記ウェブページ収集モジュールによって受信された前記複数のウェブページを分析して前記URL形式を生成するURL形式生成モジュールと、
    前記URL形式生成モジュールによって生成された前記URL形式を用いて前記複数のウェブページをウェブページのグループにまとめるページグループ化モジュールと、
    前記ページグループ化モジュールによってまとめられた前記ウェブページのグループから索引語を抽出し、索引語情報及び前記索引語が参照するウェブページグループのURL情報を生成して保存する索引管理モジュールと、
    前記使用者端末機から前記質疑語及び前記情報検索要請信号を受信して前記索引語情報を検索し、前記質疑語と関連した索引語を持つ前記ウェブページグループのURL情報をグループ化検索結果情報として生成した後に前記使用者端末機に送信する質疑管理モジュールと、
    前記グループ化検索サーバーが前記ウェブページのグループを用いて検索を行うように、前記ウェブページ収集モジュール、URL形式生成モジュール、ページグループ化モジュール、索引管理モジュール及び質疑管理モジュールを制御し、前記グループ化検索サーバーが前記有無線通信網を用いて前記使用者端末機及び前記ウェブサーバーと通信を行うように制御する制御部と、を備えることを特徴とするグループ化検索サーバー。
  22. 前記グループ化検索サーバーは、
    前記グループ化検索サーバーから受信した前記索引語情報を保存する索引DB及び前記ウェブページグループのURL情報を保存するURLDBを含むグループ化検索DBをさらに備えることを特徴とする請求項21に記載のグループ化検索サーバー。
JP2007557935A 2005-03-04 2006-03-03 ページグループを用いた情報検索サービス提供サーバー、方法及びシステム Active JP4769822B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20050018309 2005-03-04
KR10-2005-0018309 2005-03-04
KR10-2006-0020346 2006-03-03
PCT/KR2006/000739 WO2006107141A1 (en) 2005-03-04 2006-03-03 Server, method and system for providing information search service by using sheaf of pages
KR20060020346A KR100671077B1 (ko) 2005-03-04 2006-03-03 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템

Publications (2)

Publication Number Publication Date
JP2008537809A true JP2008537809A (ja) 2008-09-25
JP4769822B2 JP4769822B2 (ja) 2011-09-07

Family

ID=37623990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007557935A Active JP4769822B2 (ja) 2005-03-04 2006-03-03 ページグループを用いた情報検索サービス提供サーバー、方法及びシステム

Country Status (3)

Country Link
JP (1) JP4769822B2 (ja)
KR (1) KR100671077B1 (ja)
CN (2) CN101133415B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011530118A (ja) * 2008-08-01 2011-12-15 グーグル・インコーポレーテッド 検索クエリーに応答したディスカッションスレッドへの投稿の提供
JP2017522663A (ja) * 2014-06-25 2017-08-10 グーグル インコーポレイテッド ネイティブアプリケーションに関するディープリンク

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5096619B2 (ja) 2009-07-15 2012-12-12 ネオパッド インコーポレーション ホームページ統合サービス提供システム及び方法
WO2015074455A1 (zh) * 2013-11-25 2015-05-28 北京奇虎科技有限公司 一种计算关联网页URL模式pattern的方法和装置
CN104158890B (zh) * 2014-08-21 2018-05-22 广州品唯软件有限公司 电子商务网站的咨询反馈方法及装置
KR101647596B1 (ko) * 2015-04-20 2016-08-10 숭실대학교산학협력단 콘텐츠 서비스를 제공하는 방법 및 서버
CN105045684B (zh) * 2015-07-16 2018-06-15 北京京东尚科信息技术有限公司 索引切换和索引控制的方法及装置
KR20240079505A (ko) 2022-11-29 2024-06-05 한국전자통신연구원 그룹웨어 게시판 검색 방법 및 장치

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934911A (ja) * 1995-07-18 1997-02-07 Fuji Xerox Co Ltd 情報検索装置
JP2001134616A (ja) * 1999-10-25 2001-05-18 Nec Corp 特定の話題に関するウェブ情報の構成方法とその構成システム
JP2001306947A (ja) * 2000-04-20 2001-11-02 Ntt Data Corp アクセス分析システム、アクセス分析方法および記録媒体
JP2002288074A (ja) * 2001-03-28 2002-10-04 Nec Corp 電子コミュニケーションシステム、電子コミュニケーション方法、およびコンピュータプログラム
JP2004021589A (ja) * 2002-06-17 2004-01-22 Nec System Technologies Ltd インターネット情報検索システム
JP2004220251A (ja) * 2003-01-14 2004-08-05 Nippon Telegr & Teleph Corp <Ntt> 情報抽出規則作成システム、情報抽出規則作成方法及び情報抽出規則作成プログラム
JP2004341942A (ja) * 2003-05-16 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類用プログラムおよびコンテンツ分類用プログラムを記憶した記憶媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1439135A (zh) * 2000-05-01 2003-08-27 R.R.唐纳利父子公司 根据印刷出版物和出版商所控制的链接向客户机设备提供网页的方法和装置
KR20010104871A (ko) * 2000-05-16 2001-11-28 임갑철 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템
KR100643979B1 (ko) * 2000-05-18 2006-11-13 엘지전자 주식회사 인터넷을 이용한 정보검색 결과 제공방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934911A (ja) * 1995-07-18 1997-02-07 Fuji Xerox Co Ltd 情報検索装置
JP2001134616A (ja) * 1999-10-25 2001-05-18 Nec Corp 特定の話題に関するウェブ情報の構成方法とその構成システム
JP2001306947A (ja) * 2000-04-20 2001-11-02 Ntt Data Corp アクセス分析システム、アクセス分析方法および記録媒体
JP2002288074A (ja) * 2001-03-28 2002-10-04 Nec Corp 電子コミュニケーションシステム、電子コミュニケーション方法、およびコンピュータプログラム
JP2004021589A (ja) * 2002-06-17 2004-01-22 Nec System Technologies Ltd インターネット情報検索システム
JP2004220251A (ja) * 2003-01-14 2004-08-05 Nippon Telegr & Teleph Corp <Ntt> 情報抽出規則作成システム、情報抽出規則作成方法及び情報抽出規則作成プログラム
JP2004341942A (ja) * 2003-05-16 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類用プログラムおよびコンテンツ分類用プログラムを記憶した記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011530118A (ja) * 2008-08-01 2011-12-15 グーグル・インコーポレーテッド 検索クエリーに応答したディスカッションスレッドへの投稿の提供
JP2017522663A (ja) * 2014-06-25 2017-08-10 グーグル インコーポレイテッド ネイティブアプリケーションに関するディープリンク
US10073911B2 (en) 2014-06-25 2018-09-11 Google Llc Deep links for native applications

Also Published As

Publication number Publication date
KR20060096356A (ko) 2006-09-11
CN101133415B (zh) 2012-03-21
CN102622402B (zh) 2014-12-03
JP4769822B2 (ja) 2011-09-07
CN102622402A (zh) 2012-08-01
KR100671077B1 (ko) 2007-01-17
CN101133415A (zh) 2008-02-27

Similar Documents

Publication Publication Date Title
US20080065632A1 (en) Server, method and system for providing information search service by using web page segmented into several inforamtion blocks
US20180314736A1 (en) Third party search applications for a search system
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
EP2181405B1 (en) Automatic expanded language search
JP4769822B2 (ja) ページグループを用いた情報検索サービス提供サーバー、方法及びシステム
US20200175081A1 (en) Server, method and system for providing information search service by using sheaf of pages
KR20050095230A (ko) 사용자 방문 유알엘 로그를 이용한 정보 서비스 및 정보검색 서비스 제공 방법 및 시스템
JP2000348061A (ja) 半構造化文書情報統合検索装置および半構造化文書情報抽出装置、その方法、ならびにそのプログラムを格納する記録媒体
JP5221664B2 (ja) 情報マップ管理システムおよび情報マップ管理方法
US20030046276A1 (en) System and method for modular data search with database text extenders
US7490082B2 (en) System and method for searching internet domains
KR101347123B1 (ko) 정보검색장치 및 정보검색방법, 컴퓨터 판독가능 기록매체
KR20010107810A (ko) 웹 검색시스템 및 그 방법
JP5559725B2 (ja) 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法
Zhou et al. DoCQS: a prototype system for supporting data-oriented content query
WO2002044946A1 (fr) Moteur de recherche
Bădărînză et al. A dataset for evaluating query suggestion algorithms in information retrieval
JPH10222534A (ja) 情報検索装置
JP5525424B2 (ja) 文書検索装置、文書検索方法及び文書検索プログラム
TWI423053B (zh) Domain Interpretation Data Retrieval Method and Its System
JP2010122932A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
KR20010082966A (ko) 관련 웹 사이트 제공 방법 및 시스템
Mertz et al. LRDB: a Database of Literature Reviews in Computer Science
CN117851535A (zh) 基于事务逻辑的信息文件全结构存储及其无搜索引擎设计方法及系统
Guangjian et al. Cross-Search: A Web-based system for integrated access to multiple heterogeneous information sources

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100323

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100623

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110620

R150 Certificate of patent or registration of utility model

Ref document number: 4769822

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250