JP5063568B2 - 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法 - Google Patents

携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法 Download PDF

Info

Publication number
JP5063568B2
JP5063568B2 JP2008304240A JP2008304240A JP5063568B2 JP 5063568 B2 JP5063568 B2 JP 5063568B2 JP 2008304240 A JP2008304240 A JP 2008304240A JP 2008304240 A JP2008304240 A JP 2008304240A JP 5063568 B2 JP5063568 B2 JP 5063568B2
Authority
JP
Japan
Prior art keywords
web page
index
search
web
linked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008304240A
Other languages
English (en)
Other versions
JP2010128889A (ja
Inventor
浩史 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008304240A priority Critical patent/JP5063568B2/ja
Publication of JP2010128889A publication Critical patent/JP2010128889A/ja
Application granted granted Critical
Publication of JP5063568B2 publication Critical patent/JP5063568B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、携帯端末向けのウェブページのインデックスを作成する検索制御装置及びインデックス作成方法に関する。
近年、携帯端末の普及に伴い、一般的なパーソナルコンピュータ等の端末向けのウェブサイトとは異なる携帯端末向けのウェブサイトを提供するサービスが普及している。
このような携帯端末向けのウェブサイトは、パーソナルコンピュータ等の端末向けのウェブサイトと比較して、通信時間の短縮化、操作性の向上、表示装置の画面の大きさ等の携帯端末固有の制約から、ウェブページの内容を分割して表示しているものがある。例えばパーソナルコンピュータ等の端末向けのウェブページでは、1つのウェブページに記載される内容を、複数のウェブページに分割して表示している携帯端末向けのウェブページがある。
このように携帯端末向けに作成されたウェブページを検索するための技術としては、例えば特許文献1が挙げられる。
特開2006−48141号公報
しかしながら、携帯端末向けのウェブサイトのコンテンツを検索エンジンのクローラ等が収集する場合、分割された複数のウェブページを関連性の無い別々のウェブページとして判別してしまい、このような関連性を検索結果に反映できないという問題があった。
そこで、本発明は、互いに連結する複数の携帯端末向けのウェブページの検索をより好適に行うことができる検索制御装置及びインデックス作成方法を提供することを目的とする。
本発明では、以下のような解決手段を提供する。
(1)携帯端末向けのウェブページのインデックスを作成する検索制御装置であって、前記携帯端末向けのウェブページを取得するウェブページ取得手段と、前記ウェブページ取得手段により取得したウェブページに連結する他のウェブページへのリンクを示すタグに基づいて、前記ウェブページに連結するウェブページを順次抽出するウェブページ抽出手段と、前記ウェブページ抽出手段により抽出した互いに連結する複数のウェブページを一の連結ウェブページとして、インデックスを作成するインデックス作成手段とを備える検索制御装置。
(1)の構成によれば、検索制御装置は、携帯端末向けのウェブページを取得し、取得したウェブページに連結する他のウェブページへのリンクを示すタグに基づいて、取得したウェブページに連結するウェブページを順次抽出する。そして、抽出した互いに連結する複数のウェブページを一のウェブページ(連結ウェブページ)として取り扱って、インデックスを作成する。
このことにより、携帯端末向けのウェブページを検索する際、互いに連結する複数のウェブページが構成する一のウェブページ(連結ウェブページ)に対して作成したインデックスに基づく検索を行うことが可能となる。
したがって、このインデックスを検索の際に参照することにより、様々な理由や制約によって分断された携帯端末向けのウェブページにそれぞれ付けられた、精度の悪いインデックスではなく、これらを本来の一のまとまりのある文書として連結して構成した連結ウェブページに対して作成した精度の良いインデックスに基づいて行った検索結果を提供することができる。
(2)前記インデックス作成手段により作成した前記インデックスの各々に対応するキーワードを含むウェブページを識別するデータを、それぞれ前記インデックスに対応付けて記憶する記憶手段をさらに備える(1)に記載の検索制御装置。
(2)の構成によれば、検索制御装置は、作成したインデックスの各々に対応するキーワードを含むウェブページを識別するデータを、それぞれインデックスに対応付けて記憶する。
このように、一旦連結ウェブページごとに作成したインデックスの各々が検索された際に、検索結果として表示すべき連結前のウェブページを、識別するデータに基づいて抽出して表示することができる。
このように、検索の際には、連結ウェブページに付けたインデックスを用いることにより検索の精度を保ちつつ、検索結果の表示の際には、連結ウェブページをスクロールすることなく、その検索されたキーワードを含む連結前のウェブページをダイレクトに表示することができる。
(3)携帯端末向けのウェブページのインデックスを作成するインデックス作成方法であって、前記携帯端末向けのウェブページを取得するウェブページ取得ステップと、前記ウェブページ取得ステップにより取得したウェブページに連結する他のウェブページへのリンクを示すタグに基づいて前記ウェブページに連結するウェブページを順次抽出するウェブページ抽出ステップと、前記ウェブページ抽出ステップにより抽出した互いに連結する複数のウェブページを一の連結ウェブページとして、インデックスを作成するインデックス作成ステップとを備えるインデックス作成方法。
(3)の構成によれば、(1)の検索制御装置と同様な作用効果を奏する発明を方法として提供可能である。
本発明に係る検索制御装置によれば、携帯端末向けのウェブページを取得し、取得したウェブページに連結する他のウェブページへのリンクを示すタグに基づいて、取得したウェブページに連結するウェブページを順次抽出し、抽出した互いに連結する複数のウェブページを一のウェブページ(連結ウェブページ)として取り扱って、インデックスを作成することができる。その結果、携帯端末向けのウェブページを検索する際、互いに連結する複数のウェブページが構成する一のウェブページ(連結ウェブページ)に対して作成したインデックスに基づく検索を行うことが可能となる。
以下、本発明の実施形態について図面を参照しながら説明する。
[全体構成]
図1は、本発明の一実施形態に係る検索システム1を含む構成の概略を示す図である。検索システム1、携帯端末3、及び外部サーバ4は、ネットワーク2を介して通信可能に接続されている。携帯端末3のユーザは、検索システム1にアクセスし、検索エンジンに対して、所望のWeb文書に辿り着くためのクエリ(検索キーワード)を入力することにより、検索結果を取得する。ユーザは、この検索結果にリストされたURLを選択し、外部サーバ4にて管理されるWebページを閲覧する。
携帯端末3は、携帯電話機、PHS(Personal Handy−phone System:登録商標)、モバイル、PDA(Personal Digital Assistant)等のユーザが携帯可能な携帯端末を代表とするものであり、有線又は無線通信を行うネットワーク2を介して、検索システム1から送信される情報を参照できるものであればどのようなものでもよい。また、検索システム1は、必要に応じてWebサーバ、DBサーバ、アプリケーションサーバを含んで構成してよく、1台のサーバで構成しても、それぞれ別のサーバで構成してもよい。また、検索システム1は、検索制御装置20を含んで構成される。
[検索制御装置20のハードウェア構成]
図2は、本実施形態の検索制御装置20のハードウェア構成を示す図である。図2に示すように、制御部200を構成するCPU(Central Processing Unit)210(マルチプロセッサ構成ではCPU220等複数のCPUが追加されてもよい)、バスライン100、通信I/F(I/F:インタフェース)230、メインメモリ240、BIOS(Basic Input Output System)250、I/Oコントローラ260、ハードディスク270、光ディスクドライブ280、並びに半導体メモリ290を備える。なお、ハードディスク270、光ディスクドライブ280、並びに、半導体メモリ290はまとめて記憶装置310と呼ばれる。
制御部200は、検索制御装置20を統括的に制御する部分であり、ハードディスク270に記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
通信I/F230は、検索制御装置20が、ネットワーク2を介して携帯端末3等の他の装置と情報を送受信する場合のネットワーク・アダプタである。
BIOS250は、検索制御装置20の起動時にCPU210が実行するブートプログラムや、検索制御装置20のハードウェアに依存するプログラム等を記録する。
I/Oコントローラ260には、ハードディスク270、光ディスクドライブ280、及び半導体メモリ290等の記憶装置310を接続することができる。
ハードディスク270は、本ハードウェアを検索制御装置20として機能させるための各種プログラム、本発明の機能を実行するプログラム及び後述するデータベース等を記憶する。なお、検索制御装置20は、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。
光ディスクドライブ280としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク300を使用する。光ディスク300から光ディスクドライブ280によりプログラム又はデータを読み取り、I/Oコントローラ260を介してメインメモリ240又はハードディスク270に提供することもできる。
なお、本発明でいうコンピュータとは、記憶装置、制御部等を備えた情報処理装置をいい、検索制御装置20は、記憶装置310、制御部200等を備えた情報処理装置により構成される。
以上の例は、検索制御装置20について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータをサーバ装置として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明した検索制御装置20により実現される機能は、上述の方法を当該コンピュータにより実行することにより、或いは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
[検索システム1の機能構成]
図3は、本実施形態の検索システム1の機能構成を示す機能ブロック図である。検索システム1は、検索制御装置20と、フロントエンド部31と、を備える。
なお、本実施形態の検索システム1では、フロントエンド部31を検索制御装置20とは、別の装置により構成されることとしたがこれに限らず、検索制御装置20は、フロントエンド部31を含んで構成されていてもよい。
検索制御装置20は、ウェブページ取得部21と、ウェブページ抽出部22と、インデックス作成部23と、検索処理部24と、インデックスデータベース(以下、データベースをDBと称する)25と、を備える。
制御部200は、機能部として、ウェブページ取得部21と、ウェブページ抽出部22と、インデックス作成部23と、検索処理部24とを有する。また、インデックスDB25は、記憶装置310に記憶される。
ウェブページ取得部21は、携帯端末3向けのウェブページを取得する。具体的には、ウェブページ取得部21は、クローラの機能を有しており、ネットワーク2を介して、外部サーバ4に記憶したウェブページ等の文書情報を収集する。なお、クローラとは一般的に検索ロボットともいわれ、ウェブページ等を収集するプログラムである。そして、クローラが、ウェブサイトを探し出す手段や、対象とするウェブページの種類は様々であり、クローラの管理者の設定により、収集されるウェブページの種類や分野も異なる。そして、本実施形態のウェブページ取得部21は、携帯端末3向けのウェブページを収集する。
ウェブページ抽出部22は、ウェブページ取得部21により取得されたウェブページに連結する他のウェブページへのリンクを示すタグに基づいて、取得されたウェブページに連結するウェブページを順次抽出する。具体的には、ウェブページ抽出部22は、以下の処理を行うことができる。
ウェブページ抽出部22は、ウェブページ取得部21により取得されたウェブページの中から、任意のウェブページの全文テキストを、例えば形態素解析方式や分かち書き方式等により分割する。
ウェブページ抽出部22は、分割した任意のウェブページの全文テキスト中に同一のタームが所定数以上含まれるか否かを判定する。
同一のタームが所定数以上含まれる場合、ウェブページ抽出部22は、同一のタームが所定数以上含まれるウェブページが所定の抽出条件を満たすか否かを判定する。ここで、ウェブページ抽出部22は、任意のウェブページに連結する他のウェブページへのリンクを示すタグに基づいて、所定の抽出条件を予め設定することができる。
ここで、図4を参照しながら互いに連結する複数のウェブページの具体例について説明する。
図4は、互いに連結する複数のウェブページの具体例として、各々のウェブページがリンクされている場合を示す模式図である。図4に示すように、ウェブページ取得部21により取得されたウェブページ群Pには、互いに連結する複数のウェブページが含まれている。具体的には、ウェブページ群Pには、アンカータグによりリンク(連結)されたウェブページであるウェブページAAA−1〜AAA−3、BBB−1〜BBB−2、CCC−1〜CCC−3が含まれている。
例えば、ウェブページAAA−1、AAA−2、及びAAA−3は、継続した内容の文書であり、携帯端末3の限られた表示範囲の表示装置に表示するために、3つのウェブページに分割されている。
ウェブページAAA−1には、「>続き」と表記されるアンカータグ41が含まれる。そして、アンカータグ41には、ウェブページAAA−2のURLへのリンクが設定されている。このため、ウェブページAAA−1とウェブページAAA−2とは、アンカータグ41によりリンクされている。また、ウェブページAAA−2には、「>続き」と表記されるアンカータグ42が含まれる。そして、アンカータグ42には、ウェブページAAA−3のURLへのリンクが設定されている。このため、ウェブページAAA−2とウェブページAAA−3とは、アンカータグ42によりリンクされている。
これらのウェブページAAA−1、AAA−2、及びAAA−3は、携帯端末3に表示される際に、まずウェブページAAA−1が表示され、アンカータグ41がクリックされることによりウェブページAAA−2へリンクし、ウェブページAAA−2が表示される。そして、アンカータグ42がクリックされることによりウェブページAAA−3へリンクし、ウェブページAAA−3が表示される。
同様にして、ウェブページBBB−1とウェブページBBB−2とは、アンカータグ51によりリンクされ、ウェブページCCC−1とウェブページCCC−2とは、アンカータグ61によりリンクされ、ウェブページCCC−2とウェブページCCC−3とは、アンカータグ62によりリンクされている。
ウェブページ抽出部22は、上述のような、本来連結して一つのウェブページとして認識すべき複数のウェブページを、アンカータグに基づいて逐次抽出することが好ましい。
インデックス作成部23は、ウェブページ抽出部22により抽出された互いに連結する複数のウェブページを一の連結ウェブページとして、インデックスを作成する。
また、インデックス作成部23は、ウェブページ抽出部22により抽出された互いに連結する複数のウェブページを一の連結ウェブページとして識別する識別情報であるインデックス用ページIDを作成する。
そして、インデックス作成部23は、作成したインデックス及びインデックス用ページIDを対応付けさせてインデックスDB25に記憶させる。
図5は、インデックスDB25に記憶されるインデックス及びインデックス用ページIDの一例を示す図である。図5に示すように、インデックスDB25には、インデックス用ページIDと、ページIDと、インデックスと、互いに連結する複数のウェブページのURLとが対応付けさせて記憶される。なお、インデックスDB25に記憶される情報は、これらの情報に限らず、例えばインデックスが作成され、記憶された日時や、インデックスの属するカテゴリ等が記憶されていてもよい。
また、インデックス作成部23は、作成したインデックスの各々に対応するキーワードを含むウェブページを識別するデータ、すなわちページIDを、それぞれのインデックスに対応付けさせてインデックスDB25に記憶させてもよい。
図6は、インデックスDB25に記憶されるインデックス及びページIDの他の構成例を示す図である。図6に示すように、インデックスDB25には、インデックス用ページIDと、ページIDと、ページIDに対応するインデックスと、互いに連結する複数のウェブページのURLとが対応付けさせて記憶される。
検索処理部24は、フロントエンド部31から受け付けたクエリに応じたインデックスをインデックスDB25から検索する。そして、検索処理部24は、受け付けたクエリに応じたインデックスがインデックスDB25に存在する場合には、このインデックスに対応付けられたページIDに対応するURLを取得し、検索結果として、フロントエンド部31に提示する。
フロントエンド部31は、携帯端末3からのクエリの入力を受け付け、検索処理部24に提示する。また、フロントエンド部31は、検索処理部24からクエリに対する検索結果を受け付け、携帯端末3へネットワーク2を介して提示する。また、フロントエンド部31は、絞り込み検索等の検索オプションの設定を携帯端末3から受け付け、検索処理部24からの検索結果に対して検索オプションに設定された条件を満たす検索結果のみを携帯端末3へ提示するように構成してもよい。
このように本実施形態の検索制御装置20によれば、携帯端末3向けのウェブページを取得し、取得したウェブページに連結する他のウェブページへのリンクを示すタグに基づいて、取得したウェブページに連結するウェブページを順次抽出する。そして、抽出した互いに連結する複数のウェブページを位置の連結ウェブページとして、インデックスを作成する。
このことにより、携帯端末向けのウェブページを検索する際、互いに連結する複数のウェブページが構成する一のウェブページ(連結ウェブページ)に対して作成したインデックスに基づく検索を行うことが可能となる。
したがって、このインデックスを検索の際に参照することにより、様々な理由や制約によって分断された携帯端末向けのウェブページにそれぞれ付けられた、精度の悪いインデックスではなく、これらを本来の一のまとまりのある文書として連結して構成した連結ウェブページに対して作成した精度の良いインデックスに基づいて行った検索結果を提供することができる。
また、本実施形態の検索制御装置20によれば、作成したインデックスの各々に対応するキーワードを含むウェブページを識別するデータを、それぞれインデックスに対応付けてインデックスDB25に記憶させる。
このように、一旦連結ウェブページごとに作成したインデックスの各々が検索された際に、検索結果として表示すべき連結前のウェブページを、識別するデータに基づいて抽出して表示することができる。
そして、検索の際には、連結ウェブページに付けたインデックスを用いることにより検索の精度を保ちつつ、検索結果の表示の際には、連結ウェブページをスクロールすることなく、その検索されたキーワードを含む連結前のウェブページをダイレクトに表示することができる。
また、本実施形態の検索制御装置20は、取得したウェブページから互いに連結する複数のウェブページを抽出するための抽出条件として、取得された各々のウェブページが互いにリンクされていること、取得された各々のウェブページが共通のディレクトリ内に格納されていること、取得された各々のウェブページが共通のホスト名を有していること等を用いる。
このため、本実施形態の検索制御装置20は、様々な互いに連結する複数の携帯端末3向けのウェブページ中から所望するウェブページを抽出することができる。
[処理の流れ]
次に、本実施形態の検索制御装置20の処理の流れについて図7のフローチャートを参照しながら説明する。
ステップS1において、ウェブページ取得部21は、外部サーバ4から携帯端末3向けのウェブページを取得する。
ステップS2において、ウェブページ抽出部22は、ステップS1において取得されたウェブページに連結するウェブページを逐次抽出する。
ステップS3において、インデックス作成部23は、ステップS2においてウェブページ抽出部22により抽出された互いに連結する複数のウェブページを一の連結ウェブページとし、例えば、この一の連結ウェブページ全文中に一定数以上含まれるタームを用いてインデックスを作成する。なお、インデックスの作成手法はこれに限られず、公知の様々なものを用いることができる。
ステップS4において、インデックス作成部23は、連結ウェブページを識別する識別情報であるインデックス用ページIDを作成する。
ステップS5において、インデックス作成部23は、ステップS3において作成したインデックス及びステップS4において作成されたインデックス用ページIDを対応付けさせてインデックスDB25に記憶させる。
ステップS6において、インデックス作成部は、ステップS2〜ステップS5の処理がステップS1において取得した全てのウェブページで実行されたか否か判定する。この判定がYesの場合には、一連の処理を終了する。一方、この判定がNoの場合には、ステップS2へ移る。
[適用例]
次に、本実施形態の検索制御装置20を適用した具体例について、図8及び図9を参照しながら説明する。図8は、携帯端末3向けのウェブページを示す図である。図8に示すように、ウェブページ81及び82は、互いに連結する複数のウェブページの一例であり、1つの文書が2つのウェブページに分割されている。
このような場合、従来は、ウェブページ81に「とんこつラーメン」が記述され、ウェブページ82に「赤坂」が記述されているため、ウェブページ81とウェブページ82とを別々のウェブページとしてインデックスを作成してしまう。したがって、例えば携帯端末3からクエリ「とんこつラーメン 赤坂」を受け付けてもウェブページ81及び82の両方を検索結果に含むことができない可能性があった。
本実施形態の検索制御装置20によれば、ウェブページ81のアンカータグ83及びウェブページ82のアンカータグ84に基づいて、ウェブページ81及び82を互いに連結する複数のウェブページとして抽出し、抽出したウェブページ81及び82を一の連結ウェブページとして「とんこつラーメン」及び「赤坂」を含むインデックスを作成する。
したがって、携帯端末3からのクエリ「とんこつラーメン 赤坂」に応じて、インデックス「とんこつラーメン」及び「赤坂」に対応するウェブページ81及び82の両方を確実に検索結果に含むことができる。
図9は、本実施形態に係る検索システム1において、クエリ「とんこつラーメン 赤坂」に対しての検索結果の一例について示す図である。図9に示すように、検索結果画面86には、検索結果87及び検索結果88が表示される。そして、検索結果87からは、図8のウェブページ81へ直接リンクし、検索結果88からは、図8のウェブページ82へ直接リンクする。
本実施形態の検索制御装置20によれば、インデックス作成部23により作成されたインデックスの各々に対応するキーワードを含むウェブページを識別するページIDを、それぞれインデックスに対応付けてインデックスDB25に記憶させる。
このため、一旦連結ウェブページ81及び82ごとに作成したインデックスの各々が検索された際に、検索結果として表示すべき連結前のウェブページ81及び82を、ページIDに基づいて抽出して表示することができる。
すなわち、検索の際には、連結ウェブページ81及び82に付けたインデックスを用いることにより検索の精度を保ちつつ、検索結果の表示の際には、図9に示すように、連結ウェブページ81及び82をスクロールすることなく、検索されたキーワード(「とんこつラーメン 赤坂」)を含む連結前のウェブページ81及び82をダイレクトに表示することができる。
以上、本発明の好適な実施形態について説明したが、本発明は上述した実施形態に限定されることなく種々の形態で実施することができる。
また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
本発明の一実施形態に係る検索システム1を含む構成の概略を示す図である。 本実施形態の検索制御装置20のハードウェア構成を示す図である。 本実施形態の検索システム1の機能構成を示す機能ブロック図である。 互いに連結する複数のウェブページの具体例を示す模式図である。 インデックスDB25に記憶されるインデックス及びインデックス用ページIDの一例を示す図である。 インデックスDB25に記憶されるインデックス及びページIDの一例を示す図である。 本実施形態の検索制御装置20の処理の流れについて示すフローチャートである。 携帯端末3向けのウェブページを示す図である。 本実施形態に係る検索システム1による検索結果について示す図である。
符号の説明
1 検索システム
2 ネットワーク
3 携帯端末
4 外部サーバ
20 検索制御装置
21 ウェブページ取得部
22 ウェブページ抽出部
23 インデックス作成部
24 検索処理部
25 インデックスDB
31 フロントエンド部

Claims (3)

  1. 一のウェブページが分割され互いに連結する分割ウェブページを含む携帯端末向けウェブページの検索に用いられる検索制御装置であって、
    前記携帯端末向けウェブページを取得するウェブページ取得手段と、
    前記ウェブページ取得手段により取得したウェブページに連結する他のウェブページへのリンクを示すタグに基づいて、前記ウェブページに連結するウェブページを順次抽出するウェブページ抽出手段と、
    前記ウェブページ抽出手段により抽出したウェブページの中から互いに連結する複数の分割ウェブページを一のウェブページとし、当該一のウェブページに含まれるキーワードと当該一のウェブページの各分割ウェブページのアドレス情報とを対応付けて示す検索用のインデックス情報を作成するインデックス作成手段と
    を備える検索制御装置。
  2. 前記インデックス作成手段により作成した前記インデックス情報の各々に対応するキーワードを含むウェブページを識別するデータを、それぞれ前記インデックス情報に対応付けて記憶する記憶手段をさらに備える請求項1に記載の検索制御装置。
  3. 一のウェブページが分割され互いに連結する分割ウェブページを含む携帯端末向けウェブページの検索に用いられる検索制御装置が実行するインデックス作成方法であって、
    前記携帯端末向けのウェブページを取得するウェブページ取得ステップと、
    前記ウェブページ取得ステップにおいて取得したウェブページに連結する他のウェブページへのリンクを示すタグに基づいて、前記ウェブページに連結するウェブページを順次抽出するウェブページ抽出ステップと、
    前記ウェブページ抽出ステップにより抽出したウェブページの中から互いに連結する複数の分割ウェブページを一のウェブページとし、当該一のウェブページに含まれるキーワードと当該一のウェブページの各分割ウェブページのアドレス情報とを対応付けて示す検索用のインデックス情報を作成するインデックス作成ステップと、
    を含むインデックス作成方法。
JP2008304240A 2008-11-28 2008-11-28 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法 Active JP5063568B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008304240A JP5063568B2 (ja) 2008-11-28 2008-11-28 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008304240A JP5063568B2 (ja) 2008-11-28 2008-11-28 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法

Publications (2)

Publication Number Publication Date
JP2010128889A JP2010128889A (ja) 2010-06-10
JP5063568B2 true JP5063568B2 (ja) 2012-10-31

Family

ID=42329225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008304240A Active JP5063568B2 (ja) 2008-11-28 2008-11-28 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法

Country Status (1)

Country Link
JP (1) JP5063568B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362730B (zh) * 2019-07-15 2022-07-12 百度在线网络技术(北京)有限公司 一种索引建立方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006048141A (ja) * 2004-07-30 2006-02-16 Web Do Japan Co Ltd 情報検索システム、情報検索サーバ、情報検索方法、及び情報検索プログラム
JP2008176758A (ja) * 2006-12-20 2008-07-31 Nec Corp グループ関係性表示システム、グループ関係性表示方法およびグループ関係性表示プログラム

Also Published As

Publication number Publication date
JP2010128889A (ja) 2010-06-10

Similar Documents

Publication Publication Date Title
US9268873B2 (en) Landing page identification, tagging and host matching for a mobile application
US8631097B1 (en) Methods and systems for finding a mobile and non-mobile page pair
US20100161592A1 (en) Query Intent Determination Using Social Tagging
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
US20070239692A1 (en) Logo or image based search engine for presenting search results
WO2015081848A1 (zh) 社交化扩展搜索方法及相应的装置、系统
JP2009037501A (ja) 情報検索装置、情報検索方法およびプログラム
US20150339387A1 (en) Method of and system for furnishing a user of a client device with a network resource
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
US7895337B2 (en) Systems and methods of generating a content aware interface
WO2014059851A1 (zh) 一种搜索服务器及搜索方法
RU2693193C1 (ru) Автоматизированное извлечение информации
US20150269268A1 (en) Search server and search method
CN101231655A (zh) 用于处理搜索引擎结果的方法和系统
JP2008191982A (ja) 検索結果出力装置
CN106611022B (zh) 提高网站站内搜索效率的方法和装置
US6928616B2 (en) Method and apparatus for allowing one bookmark to replace another
JP5063568B2 (ja) 携帯端末向けのウェブページの検索に用いられるインデックスを作成する検索制御装置及びインデックス作成方法
JP2012043233A (ja) 対訳辞書生成装置、方法及びプログラム
JP2006155275A (ja) 情報抽出方法及び情報抽出装置
CN110825976B (zh) 网站页面的检测方法、装置、电子设备及介质
CN103902687A (zh) 一种搜索结果的生成方法及装置
JP2006236221A (ja) ウエブページ検索のための管理サーバ装置
JP5416023B2 (ja) 閲覧端末及び方法
JP2008197700A (ja) 文書管理システムおよび文書管理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120124

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120807

R150 Certificate of patent or registration of utility model

Ref document number: 5063568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350