JP6297206B2 - ウェブ閲覧装置およびウェブ閲覧プログラム - Google Patents

ウェブ閲覧装置およびウェブ閲覧プログラム Download PDF

Info

Publication number
JP6297206B2
JP6297206B2 JP2017505271A JP2017505271A JP6297206B2 JP 6297206 B2 JP6297206 B2 JP 6297206B2 JP 2017505271 A JP2017505271 A JP 2017505271A JP 2017505271 A JP2017505271 A JP 2017505271A JP 6297206 B2 JP6297206 B2 JP 6297206B2
Authority
JP
Japan
Prior art keywords
page
area
probability
link
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2017505271A
Other languages
English (en)
Other versions
JPWO2017026047A1 (ja
Inventor
健 宮本
健 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2017026047A1 publication Critical patent/JPWO2017026047A1/ja
Application granted granted Critical
Publication of JP6297206B2 publication Critical patent/JP6297206B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、アクセスされる可能性が高いウェブページを先読みする技術に関するものである。
無線回線を用いてインターネットに接続する情報機器が利用されている。情報機器の一例は携帯電話である。
無線回線を用いる場合、情報機器と基地局との位置関係によって通信状況が異なる。情報機器が基地局から離れている場合、情報機器は通信できず、通信できる場合であっても、通信の帯域幅が狭いため、データの送受信に時間がかかってしまう。
このように通信が困難な状況において、特許文献1に開示された技術は有用である。
特許文献1は、ユーザがアクセスする可能性が高いウェブページを表示するためのページデータを先読みサーバが情報機器に予め送信し、情報機器がウェブページをキャッシュする技術を開示している。ページデータがキャッシュされていれば、ウェブページへのアクセスが要求されてからウェブページが表示されるまでの時間が短縮される。
この技術は、静的なリンクを含んだウェブページを対象にしている。静的なリンクはURL(Uniform Resource Locator)が変わらないリンクである。
しかしながら、動的なリンクを含んだウェブページが存在する。動的なリンクはURLが頻繁に変わるリンクである。
例えば、ユーザに最新の情報を提示するニュースサイトのようなウェブページ、および、ユーザが入力したキーワードに関連する情報を提示する検索サイトのようなウェブページは、動的なリンクを含んだウェブページである。
特許文献1の技術では、アクセス回数が多いウェブページがキャッシュされるため、静的なリンクに関連付いたウェブページがキャッシュされ易い。
これは、静的なリンクに関連付いたウェブページは、静的なリンクを含んだウェブページからアクセスすることが常に可能であり、アクセス回数が多くなり易いためである。
一方、動的なリンクに関連付いたウェブページは、動的なリンクを含んだウェブページからアクセスすることが一時的に可能であり、アクセス回数が多くなり難い。
そのため、動的なリンクに関連付いたウェブページは、特許文献1の技術では、キャッシュされ難い。
したがって、特許文献1の技術は、動的なリンクに関連付いたウェブページの先読みには適さない。
特許文献2は、過去の状況におけるワードの共起性を用いてクエリを推定する技術を開示している。
ユーザが入力する可能性が高いキーワードに対応するクエリを特許文献2の技術によって推定することができれば、ユーザがアクセスする可能性が高いウェブページを先読みすることが可能になると考えられる。
しかし、特許文献2の技術では、過去の状況におけるワードとの共起性が低いクエリを推定することはできない。
特開2011−39899号公報 特表2015−509626号公報
本発明は、ウェブページ内のリンクが示すURLが変更される場合であっても、指定される確率が高いリンクに関連付いたウェブページをキャッシュできるようにすることを目的とする。
本発明のウェブ閲覧装置は、
他のウェブページに関連付いたリンクを複数含んだ遷移元ページでいずれかのリンクが指定される毎に、前記遷移元ページの指定された位置を特定する指定位置情報を履歴ファイルに登録する履歴登録部と、
前記遷移元ページを区切ったページ区域毎に、ページ区域に含まれるリンクが指定される確率を、前記履歴ファイルに登録された指定位置情報を用いて算出する確率算出部と、
ページ区域毎の確率に基づいてページ区域を選択し、選択したページ区域に含まれるリンクを前記遷移元ページから取得し、取得したリンクに関連付いたウェブページを取得するページ取得部と、
取得されたウェブページをメモリに記憶するキャッシュ部とを備える。
本発明によれば、ウェブページ内のページ区域毎にページ区域に含まれるリンクが指定される確率が算出される。そのため、リンクが示すURLが変更される場合であっても、指定される確率が高いリンクに関連付いたウェブページをキャッシュに保存することができる。
実施の形態1におけるウェブ閲覧装置100の機能構成図。 実施の形態1におけるウェブ閲覧処理(S100)のフローチャート。 実施の形態1におけるホームページ200Hの構成例を示す図。 実施の形態1におけるホームページ200Hの構成例を示す図。 実施の形態1におけるウェブページ表示処理(S130)のフローチャート。 実施の形態1におけるウェブページ200の構成例を示す図。 実施の形態1におけるウェブページ200の構成例を示す図。 実施の形態1における履歴ファイル191の構成図。 実施の形態1における履歴登録部120の機能構成図。 実施の形態1における履歴登録処理(S140)のフローチャート。 実施の形態1における履歴ファイル191を示す図。 実施の形態1における履歴ファイル191を示す図。 実施の形態1における地図を示す図。 実施の形態1におけるキャッシュ制御処理(S200)のフローチャート。 実施の形態1における確率算出部130の機能構成図。 実施の形態1における確率算出処理(S210)のフローチャート。 実施の形態1におけるパラメータモデル192Mを示す図。 実施の形態1におけるウェブページ200の構成図。 実施の形態1におけるパラメータモデル192Mを示す図。 実施の形態1における確率パラメータファイル193を示す図。 実施の形態1における確率ファイル194を示す図。 実施の形態1におけるページ取得部140の機能構成図。 実施の形態1におけるページ取得処理(S230)のフローチャート。 実施の形態1におけるウェブページ200の構成図。 実施の形態1における地図を示す図。 実施の形態1におけるウェブ閲覧装置100の構成例を示す図。 実施の形態2におけるウェブページ200の変化を示す図。 実施の形態2におけるウェブ閲覧装置100の構成図。 実施の形態2におけるホームページ200Hの構成例を示す図。 実施の形態2におけるウェブページ200の構成例を示す図。 実施の形態2におけるウェブページ200の構成例を示す図。 実施の形態2における履歴ファイル191を示す図。 実施の形態2におけるキャッシュ制御処理(S200)のフローチャート。 実施の形態2における区域選択部160の機能構成図。 実施の形態2における区域選択処理(S250)のフローチャート。 実施の形態2におけるグループ情報ファイル195を示す図。 実施の形態2における共通識別子群ファイル196を示す図。 実施の形態2における対象識別子ファイル197を示す図。 実施の形態2におけるパラメータモデル192Mを示す図。 実施の形態2における確率ファイル194を示す図。 実施の形態2におけるウェブページ200の構成例を示す図。 実施の形態2における区域識別子の階層構造の例を示す図。 実施の形態2におけるウェブ閲覧装置100の構成例を示す図。
実施の形態1.
閲覧される可能性が高いウェブページを先読みしてキャッシュに保存するウェブ閲覧装置100について、図1から図26に基づいて説明する。
***構成の説明***
図1に基づいて、ウェブ閲覧装置100の構成について説明する。
ウェブ閲覧装置100は、プロセッサ901、メインメモリ920、通信装置904、タッチパネル921、測位装置922といったハードウェアを備えるコンピュータである。具体的には、ウェブ閲覧装置100は、スマートフォンまたはタブレット型コンピュータ等の携帯機器である。
プロセッサ901は信号線910を介して他のハードウェアと接続されている。
プロセッサ901は、プロセッシングを行うIC(Integrated Circuit)であり、他のハードウェアを制御する。プロセッサ901はキャッシュメモリ9011を有する。具体的には、プロセッサ901は、CPU、DSPまたはGPUである。CPUはCentral Processing Unitの略称であり、DSPはDigital Signal Processorの略称であり、GPUはGraphics Processing Unitの略称である。
メインメモリ920はデータを記憶する記憶装置である。具体的には、メインメモリ920はRAM(Random Access Memory)である。
通信装置904は、データを受信するレシーバ9041と、データを送信するトランスミッタ9042とを備える。具体的には、通信装置904は、通信チップまたはNIC(Network Interface Card)である。
タッチパネル921は、データを表示するディスプレイ908と、データの入力に用いられる入力装置907とを備える。ディスプレイ908は表示装置であり、具体的には、LCD(Liquid Crystal Display)である。
測位装置922は、ウェブ閲覧装置100の現在地を測位する装置である。具体的には、測位装置922はGPS受信機である。GPSは、Global Positioning Systemの略称である。
キャッシュメモリ9011には、ウェブページの内容を示すデータであるページデータ199が記憶される。
メインメモリ920には、ウェブ閲覧装置100で使用、生成または入出力されるデータが記憶される。具体的には、メインメモリ920には、履歴ファイル191、パラメータモデルファイル192、確率パラメータファイル193および確率ファイル194等が記憶される。各ファイルの内容については後述する。
また、メインメモリ920にはOS(Operating System)が記憶されている。
さらに、メインメモリ920には、ページ表示部110、履歴登録部120、確率算出部130、ページ取得部140およびキャッシュ部150といった「部」の機能を実現するプログラムが記憶されている。「部」の機能を実現するプログラムは記憶媒体に記憶することができる。「部」の機能については後述する。
プロセッサ901はOSを実行しながら「部」の機能を実現するプログラムを実行する。つまり、「部」の機能を実現するプログラムは、メインメモリ920にロードされ、プロセッサ901によって実行される。
なお、ウェブ閲覧装置100が複数のプロセッサ901を備えて、複数のプロセッサ901が「部」の機能を実現するプログラムを連携して実行してもよい。
プロセッサ901とメインメモリ920とを総称して「プロセッシングサーキットリ」という。
「部」は「工程」、「手順」または「処理」に読み替えてもよい。
***動作の説明***
ウェブ閲覧装置100の動作はウェブ閲覧方法に相当する。また、ウェブ閲覧方法はウェブ閲覧プログラムの処理手順に相当する。
ウェブ閲覧方法は、ウェブ閲覧処理(S100)とキャッシュ制御処理(S200)とを備える。
図2に基づいて、ウェブ閲覧処理(S100)について説明する。
ウェブ閲覧処理(S100)は、ページ表示部110が起動された後に実行される。具体的には、ページ表示部110はウェブブラウザである。
ページ表示部110によって実行されるS110〜S130の処理は、従来のウェブブラウザによって実行される処理と同じである。
S110はホームページ表示処理である。
S110において、ページ表示部110は、ホームページのデータをウェブサーバから取得し、取得したデータを用いてホームページをディスプレイ908に表示する。
ホームページ表示処理(S110)は従来のウェブブラウザによって実行される処理と同じであるため、処理の詳細について説明を省略する。
図3および図4に、ホームページ200Hの構成の一例を示す。
図3において、ホームページ200Hは、4つのリンク201を有している。リンク201の形態はボタンである。リンク201として機能するボタンは遷移ボタンという。ページxが記された遷移ボタンは、ページxという識別子で識別されるウェブページに関連付いたリンクとして機能する。
図4において、ホームページ200Hは、4つのリンク201の他に、コンテンツ202を有している。コンテンツ202は、利用者に提供するために表示されたデータである。具体的には、コンテンツ202は、テキスト、画像または動画である。
リンク201は、ボタンの他に、文字列または画像などの形態で構成することができる。
図2に戻り、S120から説明を続ける。
S120は操作判定処理である。
S120において、ページ表示部110は、表示されたウェブページで行われた操作の種類を判定する。
ここで、ウェブページを遷移させる操作を遷移操作といい、ウェブページの閲覧を終了する操作を終了操作という。
具体的には、遷移操作は、リンク201を指定する操作であるリンク指定、または、検索を実行する操作である検索実行である。リンク指定は、タッチパネル921でリンク201が表示された部分をタップする操作である。ウェブ閲覧装置100にマウスが接続されている場合、マウスカーソルをリンク201に重ね合わせてマウスをクリックする操作がリンク指定である。検索実行は、検索窓と検索ボタンとを有するウェブページで検索キーワードを検索窓に入力して検索ボタンを押下する操作である。検索ボタンはタップまたはクリックによって押下される。
具体的には、終了操作は、ウェブページが表示された表示欄を有するウィンドウで終了ボタンを押下する操作である。通常、終了ボタンは、バツ印が記されたボタンであり、ウィンドウの右上隅に配置されている。終了ボタンはタップまたはクリックによって押下される。
操作判定処理(S120)は、従来のウェブブラウザが有する機能によって実現される処理である。そのため、操作判定処理(S120)の詳細については説明を省略する。また、画面のスクロールのような他の操作が行われた場合の処理についても従来の機能であるため説明を省略する。
遷移操作が行われた場合、処理はS130に進む。
終了操作が行われた場合、ウェブ閲覧処理(S100)は終了する。
S130はウェブページ表示処理である。
S130において、ページ表示部110は、遷移先のウェブページをディスプレイ908に表示する。
図5および図6に基づいて、ウェブページ表示処理(S130)の詳細について説明する。
S131において、ページ表示部110は遷移操作の種類を判定する。
遷移操作がリンク指定である場合、処理はS132に進む。
遷移操作が検索実行である場合、処理はS136に進む。
S132において、ページ表示部110は、表示中のウェブページから、指定されたリンク201に設定されているURL(Uniform Resource Locator)を取得する。取得したURLをリンク先URLと呼ぶ。
S133において、ページ表示部110は、キャッシュメモリ9011を参照し、リンク先URLに対応付いたページデータ199がキャッシュメモリ9011に記憶されているか判定する。
リンク先URLに対応付いたページデータ199がキャッシュメモリ9011に記憶されている場合、処理はS135に進む。
リンク先URLに対応付いたページデータ199がキャッシュメモリ9011に記憶されていない場合、処理はS134に進む。
S134において、ページ表示部110は、リンク先URLで識別されるウェブページのデータをウェブサーバから取得する。
S134は従来のウェブブラウザによって実行される処理と同じであるため、処理の詳細について説明を省略する。
リンク先URLで識別されるウェブページをリンク先ページと呼ぶ。
S135において、ページ表示部110は、キャッシュメモリ9011に記憶されているページデータ199、または、ウェブサーバから取得したデータを用いて、リンク先ページをディスプレイ908に表示する。
S135の後、ウェブページ表示処理(S130)は終了する。
図6および図7に、ウェブページ200の構成の一例を示す。
図6において、ウェブページ200は、検索窓203と、検索ボタン204と、6つのリンク201とを有している。リンク201の形態は文字列である。
検索窓203は検索キーワードが入力される入力欄である。検索ボタン204は、検索窓203に入力された検索キーワードを用いて検索を行う際に押下されるボタンである。
例えば、図3または図4のホームページ200Hでページ1の遷移ボタンが押下された場合に、図6のウェブページ200が表示される。
図7において、ウェブページ200は、リンク201と、コンテンツ202とを有している。具体的には、コンテンツ202はテキスト文書である。
例えば、図6のウェブページ200でページ5〜10のいずれかのリンク201がタップされた場合、図7に示す構成を有するウェブページ200が表示される。
図5に戻り、S136から説明を続ける。
S136において、ページ表示部110は、キャッシュメモリ9011を参照し、検索キーワードに対応付いたページデータ199がキャッシュメモリ9011に記憶されているか判定する。
検索キーワードに対応付いたページデータ199がキャッシュメモリ9011に記憶されている場合、処理はS138に進む。
検索キーワードに対応付いたページデータ199がキャッシュメモリ9011に記憶されていない場合、処理はS137に進む。
S137において、ページ表示部110は、検索キーワードに関する情報を含んだウェブページのデータをウェブサーバから取得する。
S137は従来のウェブブラウザによって実行される処理と同じであるため、処理の詳細について説明を省略する。
検索キーワードに関する情報を含んだウェブページを検索結果ページと呼ぶ。
S138において、ページ表示部110は、キャッシュメモリ9011に記憶されているページデータ199、または、ウェブサーバから取得したデータを用いて、検索結果ページをディスプレイ908に表示する。
例えば、図6のウェブページ200で検索窓203に検索キーワードが入力された後に検索ボタン204が押下された場合、図7に示す構成を有するウェブページ200が表示される。この場合、検索キーワードに関する情報を示すテキスト文書がコンテンツ202として表示される。
S138の後、ウェブページ表示処理(S130)は終了する。
図2に戻り、S140から説明を続ける。
S140は履歴登録処理である。
S140において、履歴登録部120は、他のウェブページに関連付いたリンクを複数含んだ遷移元ページでいずれかのリンクが指定される毎に、遷移元ページの指定された位置を特定する指定位置情報を履歴ファイル191に登録する。遷移元ページは、他のウェブページに関連付いたリンクを複数含んだウェブページである。
具体的には、履歴登録部120は、遷移元ページの中の指定された位置を示す座標値を指定位置情報として履歴ファイル191に登録する。
また、遷移元ページは、検索キーワードが入力される検索窓を有するウェブページが遷移元ページであるものとする。
履歴登録部120は、指定地を特定する指定地情報が検索キーワードとして検索窓に入力されて検索が行われた場合、入力された指定地情報で特定される指定地を示す座標値と、測位された現在地を示す座標値とを履歴ファイル191に登録する。指定地は、検索キーワードで特定される地点である。
S140の後、処理はS120に戻る。
図8に基づいて、履歴ファイル191について説明する。
履歴ファイル191は、状況データとUI情報とが互いに対応付けられたファイルである。UIはUser Interfaceの略称である。
状況データは、No.と日時と所在地とで構成される。UI情報は、遷移元と遷移先と指定位置と指定地とで構成される。
No.の欄は、状況データおよびUI情報を識別する番号を示す。
日時の欄は、遷移操作が行われた日時として、履歴登録処理(S140)が実行された日時を示す。
現在地の欄は、遷移操作が行われた日時におけるウェブ閲覧装置100の位置を特定する現在地情報を示す。具体的には、現在地情報は三次元の座標値である。
遷移元の欄は、遷移元ページのURLを示す。
遷移先の欄は、遷移先ページのURLを示す。具体的には、遷移先ページは、リンク先ページまたは検索結果ページである。
指定位置の欄は、遷移元ページの指定された位置を特定する指定位置情報を示す。具体的には、指定位置情報は、遷移元ページにおける二次元の座標値である。
指定地の欄は、指定地を特定する指定地情報を示す。具体的には、指定地情報は、指定地を特定する三次元の座標値、または、指定地を含んだ場所を識別する場所名である。
図9に基づいて、履歴登録部120の機能構成について説明する。
履歴登録部120は、共通情報登録部121と、操作判定部122と、指定位置登録部123と、指定地登録部124とを備える。
共通情報登録部121は、No.と日時と現在地と遷移元と遷移先とのそれぞれの情報を履歴ファイル191に登録する。
操作判定部122は、遷移操作の種類を判定する。
指定位置登録部123は、遷移操作がリンク指定である場合、指定位置情報を履歴ファイル191の指定位置の欄に登録する。
指定地登録部124は、遷移操作が検索実行である場合、指定地情報を履歴ファイル191の指定地の欄に登録する。
図10に基づいて、履歴登録処理(S140)の詳細について説明する。
S141において、共通情報登録部121は、OSから現在の日時を取得し、取得した日時を履歴ファイル191の日時の欄に登録する。
さらに、共通情報登録部121は、ウェブ閲覧装置100の現在地を示す座標値を測位装置922から取得し、取得した座標値を履歴ファイル191の現在地の欄に登録する。
S142において、共通情報登録部121は、遷移元ページのURLと遷移先ページのURLとをページ表示部110から取得する。
そして、共通情報登録部121は、取得した遷移元ページのURLを履歴ファイル191の遷移元の欄に登録し、取得した遷移先ページのURLを履歴ファイル191の遷移先の欄に登録する。
S143において、操作判定部122は、ページ表示部110から遷移操作の種類を示す情報を取得する。そして、操作判定部122は、取得した情報に基づいて、遷移操作の種類を判定する。
遷移操作がリンク指定である場合、処理はS144に進む。
遷移操作が検索実行である場合、処理はS145に進む。
S144において、指定位置登録部123は、遷移元ページの指定された位置を特定する座標値をページ表示部110から取得し、取得した座標値をページ表示部110の指定位置の欄に登録する。
S144の後、履歴登録処理(S140)は終了する。
図11に、履歴ファイル191に登録される状況データおよびUI情報の一例を示す。
履歴ファイル191のNo.1の行は、2015年5月22日の14時0分に位置Aでリンク指定が行われたことを意味する。さらに、No.1の行は、URLHで識別されるウェブページで、座標値(10,10)で特定される位置に配置されたリンクが指定されたことによって、URL1で識別されるウェブページが表示されたことを意味する。
図10に戻り、S145から説明を続ける。
S145において、指定地登録部124は、検索キーワードの形式が座標値の形式と合致するか判定する。検索キーワードの形式が座標値の形式と合致する場合、実行された検索は指定地の検索である。
検索キーワードの形式が座標値の形式と合致する場合、処理はS146に進む。
検索キーワードの形式が座標値の形式と合致しない場合、指定地登録部124は、検索キーワードと同じ場所名が場所名ファイルに登録されているか判定する。場所名ファイルは、場所名と座標値とが互いに対応付けられたファイルであり、メインメモリ920に予め記憶されている。具体的には、場所名ファイルは地図データである。検索キーワードと同じ場所名が場所名ファイルに登録されている場合、実行された検索は指定地の検索である。
検索キーワードと同じ場所名が場所名ファイルに登録されている場合、指定地登録部124は検索キーワードと同じ場所名に対応付いた座標値を場所名ファイルから取得する。そして、処理はS146に進む。
検索キーワードと同じ場所名が場所名ファイルに登録されていない場合、履歴登録処理(S140)は終了する。
S146において、指定地登録部124は、検索キーワードが示す座標値、または、場所名ファイルから取得した座標値を、履歴ファイル191の指定地の欄に登録する。
S146の後、履歴登録処理(S140)は終了する。
図12に、履歴ファイル191に登録される状況データおよびUI情報の一例を示す。
履歴ファイル191のNo.6の行は、2015年5月22日の14時5分に位置Fで位置Gを検索する操作があったことを意味する。さらに、No.6の行は、URL1で識別されるウェブページで位置Gが検索されたことによって、URL10で識別されるウェブページが表示されたことを意味する。
図13に、図12の履歴ファイル191に登録された位置A〜位置Gを示す地図を示す。位置Fで検索された位置Gは、位置Fから1キロメートル離れた場所にある。
図14に基づいて、キャッシュ制御処理(S200)について説明する。
キャッシュ制御処理(S200)は、定期的に実行される。但し、キャッシュ制御処理(S200)は、ウェブブラウザが起動されたとき、または、利用者によって実行命令が入力されたとき等、所定のタイミングで実行されてもよい。
S210は確率算出処理である。
S210において、確率算出部130は、遷移元ページを区切ったページ区域毎に、ページ区域に含まれるリンクが指定される確率を、履歴ファイル191に登録された指定位置情報を用いて算出する。具体的には、確率算出部130は、ページ区域毎に、履歴ファイル191に含まれる座標値のうち、当該ページ区域に含まれる位置を示す座標値の数に基づいて確率を算出する。
さらに、確率算出部130は、距離範囲毎に、ウェブ閲覧装置100までの距離が当該距離範囲に含まれる地点の検索が行われる確率を、履歴ファイル191に登録された指定地のうち、履歴ファイル191に登録された現在地までの距離が当該距離範囲に含まれる指定地の数に基づいて算出する。
図15に基づいて、確率算出部130の機能構成について説明する。
確率算出部130は、パラメータモデル生成部131と、確率パラメータ生成部132と、確率ファイル生成部133とを備える。
パラメータモデル生成部131は、パラメータモデル192Mを生成し、生成したパラメータモデル192Mの情報を含んだパラメータモデルファイル192を生成する。
パラメータモデル192Mは、URL、ページ区域および距離範囲といったパラメータの関係を木構造で表したモデルである。パラメータモデル192Mにおいて、各パラメータは木構造のノードで表される。
確率パラメータ生成部132は、パラメータの組毎に確率パラメータを生成し、パラメータの組毎の確率パラメータを示す確率パラメータファイル193を生成する。
確率パラメータは、遷移元ノードと、遷移先ノードと、遷移元ノードから遷移先ノードに遷移する事象が発生する確率とを示す情報である。確率は頻度と読み替えることもできる。
確率パラメータ生成部132は、URLパラメータ生成部1321と、区域パラメータ生成部1322と、距離パラメータ生成部1323とを備える。
URLパラメータ生成部1321は、遷移元ノードと遷移先ノードとの組のうち、遷移元ノードと遷移先ノードとのそれぞれがURLを表す組の確率パラメータを生成する。この確率パラメータをURLパラメータと呼ぶ。
区域パラメータ生成部1322は、遷移元ノードと遷移先ノードとの組のうち、遷移元ノードがURLを表し、遷移先ノードがページ区域を表す組の確率パラメータを生成する。この確率パラメータを区域パラメータと呼ぶ。
距離パラメータ生成部1323は、遷移元ノードと遷移先ノードとの組のうち、遷移元ノードがURLを表し、遷移先ノードが距離範囲を表す組の確率パラメータを生成する。この確率パラメータを距離パラメータと呼ぶ。
確率ファイル生成部133は、パラメータ毎に確率を算出し、パラメータ毎の確率を示す確率ファイル194を生成する。
パラメータがURLである場合、算出される確率は、当該URLで識別されるウェブページに遷移する確率である。
パラメータがページ区域である場合、算出される確率は、当該ページ区域に含まれるリンクが指定される確率である。
パラメータが距離範囲である場合、算出される確率は、ウェブ閲覧装置100までの距離が当該距離範囲に含まれる地点が検索される確率である。
図16に基づいて、確率算出処理(S210)の詳細について説明する。
S211において、パラメータモデル生成部131は、遷移元ページと遷移先ページとのそれぞれのデータを取得し、取得したデータを用いてパラメータモデル192Mを生成する。各ウェブページのデータは、キャッシュメモリ9011、メインメモリ920およびウェブサーバのいずれから取得してもよい。
そして、パラメータモデル生成部131は、生成したパラメータモデル192Mの情報を含んだパラメータモデルファイル192を生成する。
具体的には、パラメータモデル生成部131は、以下のようにパラメータモデル192Mを生成する。
パラメータモデル生成部131は、ホームページのURLをメインメモリ920から取得し、取得したURLを表す親ノードを生成する。
次に、パラメータモデル生成部131は、ホームページのデータから遷移先ページのURLを抽出し、抽出したURLを表す子ノードを生成する。
次に、パラメータモデル生成部131は、遷移先ページを区分けし、区分けしたページ区域毎にページ区域を表す孫ノードを生成する。
また、パラメータモデル生成部131は、距離範囲ファイルに定義された距離範囲毎に距離範囲を表す孫ノードを生成する。距離範囲ファイルは、1つ以上の距離範囲を示すファイルであり、メインメモリ920に予め記憶されている。
そして、パラメータモデル生成部131は、親ノードに子ノードを関連付けて、子ノードに孫ノードを関連付ける。
図17に、パラメータモデル192Mの一例を示す。
パラメータモデル192Mにおいて、URLHを表す親ノードにURL1〜4を表す子ノードが関連付けられ、URL1を表す子ノードに区域1〜4を表す孫ノードと距離1〜2を表す孫ノードが関連付けられている。互いに関連する2つのノードを結んだ線をエッジと呼ぶ。
図18に、ウェブページ200のページ区域を示す。
ウェブページ200は、100×100の大きさを有し、4つのページ区域に分割されている。
区域1は、座標(0,0)から座標(49,49)までの矩形の範囲である。区域2は、座標(50,0)から座標(99,49)までの矩形の範囲である。区域3は、座標(0,50)から座標(49,99)までの矩形の範囲である。区域4は、座標(50,50)から座標(99,99)までの矩形の範囲である。
図16に戻り、S212から説明を続ける。
S212において、URLパラメータ生成部1321は、履歴ファイル191とパラメータモデルファイル192とを用いて、URLパラメータを生成する。そして、URLパラメータ生成部1321は、URLパラメータを確率パラメータファイル193に登録する。
具体的には、URLパラメータ生成部1321は、URLパラメータを以下のように生成する。
URLパラメータ生成部1321は、パラメータモデル192Mに含まれる遷移元ノードと遷移先ノードとの組から、遷移元ノードと遷移先ノードとのそれぞれがURLを表す組を選択する。選択した組が、URLパラメータに含まれる遷移元ノードと遷移先ノードになる。
次に、URLパラメータ生成部1321は、選択した組の遷移元ノードに対応する遷移元が設定された行を履歴ファイル191から抽出し、抽出した行の数を数える。この数を遷移元数と呼ぶ。また、抽出した行の集合を遷移元行群と呼ぶ。
次に、URLパラメータ生成部1321は、選択した組の遷移先ノードに対応する遷移先が設定された行を遷移元行群から抽出し、抽出した行の数を数える。この数を遷移先数と呼ぶ。
そして、URLパラメータ生成部1321は、遷移先数を遷移元数で割った値を確率の値として算出する。
S213において、区域パラメータ生成部1322は、履歴ファイル191とパラメータモデルファイル192とを用いて、区域パラメータを生成する。そして、区域パラメータ生成部1322は、区域パラメータを確率パラメータファイル193に登録する。
具体的には、区域パラメータ生成部1322は、区域パラメータを以下のように生成する。
区域パラメータ生成部1322は、パラメータモデル192Mに含まれる遷移元ノードと遷移先ノードとの組から、遷移元ノードがURLを表し、遷移先ノードがページ区域を表す組を選択する。選択した組が、区域パラメータに含まれる遷移元ノードと遷移先ノードになる。
次に、区域パラメータ生成部1322は、選択した組の遷移元ノードに対応する遷移元が設定された行を履歴ファイル191から抽出し、抽出した行の数を数える。この数を遷移元数と呼ぶ。また、抽出した行の集合を遷移元行群と呼ぶ。
次に、区域パラメータ生成部1322は、選択した組の遷移先ノードが表すページ区域に含まれる指定位置が設定された行を遷移元行群から抽出し、抽出した行の数を数える。この数を遷移先数と呼ぶ。
そして、区域パラメータ生成部1322は、遷移先数を遷移元数で割った値を確率の値として算出する。
S214において、距離パラメータ生成部1323は、履歴ファイル191とパラメータモデルファイル192とを用いて、距離パラメータを生成する。そして、距離パラメータ生成部1323は、距離パラメータを確率パラメータファイル193に登録する。
具体的には、距離パラメータ生成部1323は、距離パラメータを以下のように生成する。
距離パラメータ生成部1323は、パラメータモデル192Mに含まれる遷移元ノードと遷移先ノードとの組から、遷移元ノードがURLを表し、遷移先ノードが距離範囲を表す組を選択する。選択した組が、距離パラメータに含まれる遷移元ノードと遷移先ノードになる。
次に、距離パラメータ生成部1323は、選択した組の遷移元ノードに対応する遷移元が設定された行を履歴ファイル191から抽出し、抽出した行の数を数える。この数を遷移元数と呼ぶ。また、抽出した行を遷移元行と呼び、遷移元行の集合を遷移元行群と呼ぶ。
次に、距離パラメータ生成部1323は、遷移元行毎に、遷移元行から現在地と指定地とを取得し、現在地から指定地までの距離を算出する。この距離を指定地距離と呼ぶ。
次に、距離パラメータ生成部1323は、選択した組の遷移先ノードが表す距離範囲に含まれる指定地距離に対応する遷移元行を遷移元行群から抽出し、抽出した行の数を数える。この数を遷移先数と呼ぶ。
そして、距離パラメータ生成部1323は、遷移先数を遷移元数で割った値を確率の値として算出する。
図19において、パラメータモデル192Mは有効グラフであるものとする。つまり、パラメータモデル192Mは、上層から下層へ遷移するが、下層から上層へ遷移しないモデルである。
図20に、図12の履歴ファイル191と図19のパラメータモデル192Mとを用いて生成される確率パラメータファイル193を示す。
確率パラメータファイル193において、No.とパラメータ組と確率とが互いに対応付けられている。
No.の欄は、パラメータ組と確率とを識別する番号を示している。
パラメータ組の欄は、遷移元ノードと遷移先ノードとを示している。P(y|x)は遷移元ノードxから遷移先ノードyに遷移する確率を意味する。
確率の欄は、遷移元ノードから遷移先ノードに遷移する確率を示している。
図16に戻り、S215から説明を続ける。
S215において、確率ファイル生成部133は、確率パラメータファイル193を用いて、パラメータ別の確率を算出する。そして、確率ファイル生成部133は、パラメータ別の確率を確率ファイル194に登録する。
パラメータ別の確率は、Markov Modelを用いて算出することができる。但し、Logistic RegressionまたはBayesian Networkなどの方法を用いて、パラメータ別の確率を算出してもよい。
具体的には、確率ファイル生成部133は、以下の式(1)を計算することによって、ノードNで表されるパラメータの確率P(N)を算出する。但し、親ノードを持たない根ノードが表すパラメータの確率を1とする。
adjacent(N)は、ノードNとエッジで結ばれている隣接ノードの集合を意味する。
Figure 0006297206
図20の確率パラメータファイル193を用いて確率P(区域x)を算出する場合、確率P(区域x)を算出する式は、以下の式(2)で表すことができる。これは、区域xのノードがURL1のノードにのみ関連付けられているからである。
Figure 0006297206
図21に、図20の確率パラメータファイル193を用いて生成される確率ファイル194を示す。
図16において、S215の後、確率算出処理(S210)は終了する。
図14に戻り、S220から説明を続ける。
S220において、キャッシュ部150は、キャッシュメモリ9011の記憶領域が空いているか判定する。
キャッシュメモリ9011の記憶領域が空いている場合、処理はS230に進む。
キャッシュメモリ9011の記憶領域が空いていない場合、キャッシュ制御処理(S200)は終了する。
S230はページ取得処理である。
S230において、ページ取得部140は、ページ区域毎の確率に基づいてページ区域を選択し、選択したページ区域に含まれるリンクを遷移元ページから取得し、取得したリンクに関連付いたウェブページを取得する。
また、ページ取得部140は、距離範囲毎の確率に基づいて距離範囲を選択し、測位された現在地までの距離が選択した距離範囲に含まれる場所の情報を含んだウェブページを取得する。
図22に基づいて、ページ取得部140の機能構成について説明する。
ページ取得部140は、パラメータ選択部141と、リンク取得部142と、場所名取得部143と、URL生成部144と、ページデータ取得部145とを備える。
パラメータ選択部141は、確率ファイル194からパラメータを選択する。
リンク取得部142は、選択されたパラメータがページ区域である場合、当該ページ区域に含まれるリンクが示すURLをウェブページから取得する。
場所名取得部143は、選択されたパラメータが距離範囲である場合、ウェブ閲覧装置100からの距離が当該距離範囲である場所の名称を取得する。
URL生成部144は、特定された場所の情報を含んだウェブページのURLを生成する。
ページデータ取得部145は、URLで識別するウェブページのデータを取得する。
図23に基づいて、ページ取得処理(S230)の詳細について説明する。
S231において、パラメータ選択部141は、確率ファイル194から、確率が高い順にパラメータを1つ選択する。
つまり、図21の確率ファイル194から、URL1、区域2、距離1の順で、パラメータが選択される。
S232において、パラメータ選択部141は、選択したパラメータの種類を判定する。
パラメータがURLである場合、処理はS236に進む。
パラメータがページ区域である場合、処理はS233に進む。
パラメータが距離範囲である場合、処理はS234に進む。
S233において、リンク取得部142は、パラメータモデルファイル192を用いて、選択されたページ区域の親ノードを特定する。
次に、リンク取得部142は、特定した親ノードが表すURLをパラメータモデルファイル192から取得する。
次に、リンク取得部142は、取得したURLで識別される親ページのデータをメインメモリ920から取得する。ここで、親ページのURLの確率はページ区域の確率よりも高いため、後述するS236によってメインメモリ920に既に記憶されている。但し、親ページのデータは、ウェブサーバから新たに取得してもよい。
そして、リンク取得部142は、親ページのデータから、選択されたページ区域に含まれるリンクを取得する。
図17のパラメータモデル192Mにおいて、選択されたパラメータが区域2である場合、親ノードが表すURLはURL1である。
図24に、URL1で識別されるウェブページ200の15時の状態を示す。また、このウェブページ200の14時の状態を図6に示す。この場合、ウェブページ200に含まれるページ8〜ページ10のリンク201は、14時から15時の間に、ページ8’〜ページ10’のリンク201に変更されている。
このような状況において、図24のウェブページ200から、区域2に含まれるページ8’のリンクが取得される。
図23に戻り、S234から説明を続ける。
S234において、場所名取得部143は、ウェブ閲覧装置100の現在地を示す座標値を測位装置922から取得する。
次に、場所名取得部143は、場所名ファイルに含まれる場所名毎に、場所名に対応付けられた座標値と現在地を示す座標値とを用いて距離を算出する。
そして、場所名取得部143は、算出した距離が選択された距離範囲に含まれる場所名を場所名ファイルから取得する。
図25に、現在地と場所Aと場所Bと場所Cとを含んだ地域の地図を示す。
場所Aから現在地までの距離は3キロメートルであり、場所Bから現在地までの距離は3キロメートルであり、場所Cから現在地までの距離は8キロメートルである。
ここで、選択された距離範囲が5キロメートル以内である場合、場所Aの名称と、場所Bの名称が取得される。
図23に戻り、S235から説明を続ける。
S235において、URL生成部144は、パラメータモデルファイル192を用いて、選択された距離範囲の親ノードを特定する。
次に、URL生成部144は、特定した親ノードが表すURLをパラメータモデルファイル192から取得する。
そして、URL生成部144は、取得したURLに場所名を追加することによって、場所名を含んだURLを生成する。
親ノードのURLがhttp://www.page1.com/であり、取得した場所名が場所Aと場所Bである場合、http://www.page1.com/?place=場所AというURLが生成される。さらに、http://www.page1.com/?place=場所BというURLが生成される。ここで、placeとは異なる変数名を用いてもよい。また、変数名および場所名は暗号化してURLに設定してもよい。さらに、場所名の代わりに座標値をURLに設定してもよい。
S236において、ページデータ取得部145は、S231で選択されたパラメータであるURL、S233で取得されたリンクが示すURL、または、S235で生成されたURLを用いて、URLで識別されるウェブページのデータを取得する。そして、ページデータ取得部145は、取得したデータをURLに対応付けてメインメモリ920に記憶する。
具体的には、ページデータ取得部145は、ウェブページのデータを以下のように取得する。
ページデータ取得部145は、URLを含んだHTTPリクエストを生成し、生成したHTTPリクエストをトランスミッタ9042を介してウェブサーバに送信する。HTTPはHyperText Transfer Protocolの略称である。
そして、ページデータ取得部145は、ウェブサーバから送信されるウェブページのデータをレシーバ9041を介して受信する。
S236の後、ページ取得処理(S230)は終了する。
図14に戻り、S240から説明を続ける。
S240はキャッシュ処理である。
S240において、キャッシュ部150は、取得されたウェブページのデータをURLに対応付けてキャッシュメモリ9011に記憶する。キャッシュメモリ9011に記憶されたデータがページデータ199である。
***実施の形態の効果***
ウェブ閲覧装置100は、ウェブページ内のページ区域毎にページ区域に含まれるリンクが指定される確率を算出する。そのため、ウェブ閲覧装置100は、リンクが示すURLが変更される場合であっても、指定される確率が高いリンクに関連付いたウェブページをキャッシュに保存することができる。
ウェブ閲覧装置100は、距離範囲毎に距離範囲内の距離だけ離れた場所が検索される確率を算出する。そのため、ウェブ閲覧装置100は、検索されたことが無い場所も含めて、検索される確率が高い場所に関するウェブページをキャッシュに保存することができる。
***他の構成***
ウェブ閲覧装置100は、ページ区域と距離範囲とのいずれか一方を対象にして確率を算出し、アクセスされる可能性が高いウェブページをキャッシュしてもよい。
メインメモリ920は、ハードディスクのような二次記憶装置に置き換えてもよい。
キャッシュメモリ9011は、メインメモリまたはハードディスクに置き換えてもよい。
メインメモリ920、キャッシュメモリ9011およびハードディスクはメモリの一例である。メモリは記憶部または記憶装置と読み替えることができる。
ウェブ閲覧装置100の機能は、ハードウェアで実現してもよい。
図26に、ウェブ閲覧装置100の機能がハードウェアで実現される場合の構成を示す。
ウェブ閲覧装置100は、処理回路990と、通信装置904と、タッチパネル921と、測位装置922とを備える。これらのハードウェアは信号線910で接続されている。処理回路990はプロセッシングサーキットリともいう。
処理回路990は、ページ表示部110、履歴登録部120、確率算出部130、ページ取得部140、キャッシュ部150、キャッシュ記憶部180および主記憶部190といった「部」の機能を実現する専用の電子回路である。
具体的には、処理回路990は、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックIC、GA、ASIC、FPGAまたはこれらの組み合わせである。GAはGate Arrayの略称であり、FPGAはField Programmable Gate Arrayの略称であり、ASICはApplication Specific Integrated Circuitの略称である。
なお、ウェブ閲覧装置100が複数の処理回路990を備えて、複数の処理回路990が「部」の機能を連携して実現してもよい。
主記憶部190およびキャッシュ記憶部180は、処理回路990の外部に設ける一次記憶装置または二次記憶装置に置き換えてもよい。
ウェブ閲覧装置100の機能は、ソフトウェアとハードウェアとの組み合わせで実現してもよい。つまり、一部の「部」の機能をソフトウェアで実現し、残りの「部」の機能をハードウェアで実現してもよい。
実施の形態2.
ウェブページに含まれるリンクの位置が変化する場合であっても、指定される確率が高いリンクに関連付いたウェブページを先読みしてキャッシュに保存するウェブ閲覧装置100について、図27から図43に基づいて説明する。但し、実施の形態1と重複する説明は省略する。
図27に、異なる時刻のウェブページ200のレイアウトを示す。
(1)のウェブページ200は、2015年5月26日9時のものである。
(2)のウェブページ200は、2015年5月26日10時のものである。
2つのウェブページ200において、コンテンツ202の表示範囲が変化し、リンク201に関連付けられたウェブページのURLが変化している。さらに、コンテンツ202の表示範囲の変化に伴って、リンク201の位置が変化している。コンテンツ202が文書である場合、文書の長さの変化に応じてコンテンツ202の表示範囲が変化する。
***構成の説明***
遷移元ページは、複数のページ区域がレイアウトされて、少なくともいずれかのページ区域にリンクが含まれるウェブページである。
さらに、遷移元ページは、親のページ区域の中に子のページ区域がレイアウトされる階層構造を有する。
図28に基づいて、ウェブ閲覧装置100の構成について説明する。
プロセッサ901は、区域選択部160を含んだ「部」の機能を実現するプログラムを実行する。区域選択部160の機能については後述する。
図29に、ホームページ200Hのレイアウトを示す。
ホームページ200Hは、ページ1のリンク201を含んだページ区域と、ページ2のリンク201を含んだページ区域と、ページ3のリンク201を含んだページ区域と、ページ4のリンク201を含んだページ区域とを有している。
これら4つのページ区域は、ID1〜ID4という区域識別子で識別される。また、ホームページ200Hの全体を範囲とするページ区域は、ID5という区域識別子で識別されている。つまり、ID5で識別される親のページ区域とID1〜ID4で識別される子のページ区域とは階層構造を成している。
具体的には、区域識別子は、HTML(HyperText Markup Language)のIDである。ホームページ200Hの全体を範囲とするページ区域は、HTMLタグまたはBODYタグに相当する。
図30に、ページ1のリンク201に関連付けられたウェブページ200のレイアウトを示す。
ウェブページ200は、コンテンツ202とページ11のリンク201とを含んだページ区域と、ページ12のリンク201とページ13のリンク201とを含んだページ区域とを有している。これら2つのページ区域はID6〜ID7という区域識別子で識別されている。また、ウェブページ200の全体を範囲とするページ区域は、ID8という区域識別子で識別されている。つまり、ID8で識別される親のページ区域とID6〜ID7で識別される子のページ区域とは階層構造を成している。
さらに、ID7で識別されるページ区域は、ページ12のリンク201を含んだページ区域と、ページ13のリンク201を含んだページ区域とを含んでいる。これら2つのページ区域は、ID9〜ID10という区域識別子で識別されている。つまり、ID7で識別される親のページ区域とID9〜ID10で識別される子のページ区域とは階層構造を成している。
図31に、ページ11〜ページ13のリンク201に関連付けられたウェブページ200のレイアウトを示す。
ウェブページ200は、ページ1のリンク201を含んだページ区域を有している。このページ区域は、ID11という区域識別子で識別されている。また、ウェブページ200の全体を範囲とするページ区域はID12という区域識別子で識別されている。つまり、ID12で識別されるページ区域とID11で識別されるページ区域とは階層構造を成している。
***動作の説明***
ウェブ閲覧処理(S100)の流れは実施の形態1と同じである(図2参照)。
但し、履歴登録処理(S140)の内容は、実施の形態1と異なる。
S140において、指定位置登録部123は、指定されたリンクを含んだページ区域を識別する区域識別子を指定位置情報として履歴ファイル191に登録する。
具体的には、指定位置登録部123は、指定されたリンクを含んだ各階層のページ区域の区域識別子を含んだ区域識別子群を履歴ファイル191に登録する。
履歴登録処理(S140)の流れは実施の形態1と同じである(図10参照)。
但し、指定位置登録処理(S144)の内容は、実施の形態1と異なる。
S144において、指定位置登録部123は、遷移元ページで指定されたリンクを含んだページ区域の区域識別子と、当該ページ区域を含んだ各ページ区域の区域識別子とをページ表示部110から取得する。
そして、指定位置登録部123は、取得した各区域識別子を含んだ区域識別子群をページ表示部110の指定位置の欄に登録する。
図32に、履歴ファイル191に登録される指定位置情報の一例を示す。
履歴ファイル191のNo.1の行は、URLHで識別されるウェブページ200において、ページ区域ID5が有するページ区域ID1に含まれるリンクが指定されたことによって、URL1で識別されるウェブページ200が表示されたことを意味する。
履歴ファイル191のNo.4の行は、URL1で識別されるウェブページ200がページ区域ID8を有し、ページ区域ID8にページ区域ID7が含まれ、ページ区域ID7にページ区域ID9が含まれることを示している。さらに、No.4の行は、ページ区域ID9に含まれるリンクが指定されたことによって、URL8で識別されるウェブページが表示されたことを意味する。
図33に基づいて、キャッシュ制御処理(S200)について説明する。
キャッシュ制御処理(S200)は、実施の形態1で説明したS210〜S240の処理の他に、区域選択処理(S250)を有する。
S250において、区域選択部160は、履歴ファイル191に登録された区域識別子群を用いて、確率を算出する対象となる子のページ区域を選択する。
図34に基づいて、区域選択部160の機能構成について説明する。
区域選択部160は、グルーピング部161と、識別子群抽出部162と、識別子選択部163とを備える。
グルーピング部161は、履歴ファイル191に登録された区域識別子群をグループ分けする。
識別子群抽出部162は、グループ別に、グループ内の区域識別子群から、各区域識別子群に共通する1つ以上の区域識別子である共通識別子群を抽出する。
識別子選択部163は、グループ別に、抽出された共通識別子群から、確率を算出する対象となる子のページ区域を識別する区域識別子を選択する。
図35に基づいて、区域選択処理(S250)の詳細について説明する。
S251において、グルーピング部161は、履歴ファイル191に登録された区域識別子群をグループ分けし、グループ分けした結果を示すグループ情報ファイル195を生成する。グループ分けはクラスタリングを意味する。
具体的には、グルーピング部161は、K−means法または他の機械学習方法によって、区域識別子群をグループ分けする。K−means法を用いる場合、グルーピング部161は、各区域識別子群を比較するために、Edit Distanceまたは他の算出方法によって、区域識別子群間の距離を算出する。そして、グルーピング部161は、区域識別子群間の距離を用いて、K−means法によって、区域識別子群をグループ分けする。
但し、グルーピング部161は、ウェブページがHTMLで作成されている場合、TLD(Top Level Domain)に基づいて、区域識別子群をグループ分けしてもよい。また、グルーピング部161は、TLDと機械学習方法とを組み合わせて、区域識別子群をグループ分けしてもよい。
図36に、図32の履歴ファイル191を用いて生成されるグループ情報ファイル195を示す。
グループ情報ファイル195は、3つのグループを示している。
第1グループは区域識別子群ID5−ID1で構成され、第2グループは区域識別子群ID8−ID6で構成される。第3グループは区域識別子群ID8−ID7−ID9と区域識別子群ID8−ID7−ID10とで構成される。
図35に戻り、S252から説明を続ける。
S252において、グルーピング部161は、グループ情報ファイル195から未選択のグループを1つ選択する。
S253において、識別子群抽出部162は、選択されたグループ内の区域識別子群を最上層の区域識別子から順に比較し、最上層の区域識別子から連続して共通する部分を共通識別子群として抽出する。具体的には、識別子群抽出部162は、Top Down MappingまたはRestricted Top Down Mappingと呼ばれる方法によって、共通識別子群を抽出する。
そして、識別子群抽出部162は、抽出した共通識別子群を共通識別子群ファイル196に登録する。
図37に、図36のグループ情報ファイル195を用いて生成される共通識別子群ファイル196を示す。
図36のグループ情報ファイル195において、第3グループに属する2つの区域識別子群は、第1層の区域識別子ID8と第2層の区域識別子ID7とが共通するが、第3層の区域識別子が異なる。そのため、第3グループの共通識別子群は、図37の共通識別子群ファイル196が示すように、ID8−ID7である。
図35に戻り、S254から説明を続ける。
S254において、識別子選択部163は、共通識別子群に含まれる最下層の区域識別子を対象識別子として選択する。対象識別子は、確率を算出する対象となるページ区域の区域識別子である。
そして、識別子選択部163は、選択した対象識別子を対象識別子ファイル197に登録する。
図38に、図37の共通識別子群ファイル196を用いて生成される対象識別子ファイル197を示す。
図37の共通識別子群ファイル196において、第3グループの最下層の区域識別子はID7である。そのため、第3グループの対象識別子は、図38の対象識別子ファイル197が示すように、ID7である。
図35に戻り、S255から説明を続ける。
S255において、グルーピング部161は、未選択のグループが有るか判定する。
未選択のグループが有る場合、処理はS252に戻る。
未選択のグループが無い場合、区域選択処理(S250)は終了する。
図33に戻り、S210から説明を続ける。
S210において、確率算出部130は、ページ区域毎に、履歴ファイル191に含まれる区域識別子のうち、当該ページ区域を識別する区域識別子の数に基づいて確率を算出する。
具体的には、確率算出部130は、選択された子のページ区域毎に当該子のページ区域を識別する区域識別子の数に基づいて確率を算出する。
確率算出処理(S210)の流れは実施の形態1と同じである(図16参照)。
但し、区域パラメータ生成処理(S213)の内容と確率ファイル生成処理(S215)の内容が実施の形態1と異なる。
S213において、区域パラメータ生成部1322は、区域パラメータを以下のように生成する。
区域パラメータ生成部1322は、パラメータモデル192Mに含まれる遷移元ノードと遷移先ノードとの組から、遷移元ノードがURLまたはページ区域を表し、遷移先ノードがページ区域を表す組を選択する。選択した組が、区域パラメータに含まれる遷移元ノードと遷移先ノードになる。
次に、区域パラメータ生成部1322は、選択した組の遷移元ノードに対応する遷移元が設定された行を履歴ファイル191から抽出し、抽出した行の数を数える。この数を遷移元数と呼ぶ。また、抽出した行の集合を遷移元行群と呼ぶ。
次に、区域パラメータ生成部1322は、選択した組の遷移先ノードに対応する指定位置が設定された行を遷移元行群から抽出し、抽出した行の数を数える。この数を遷移先数と呼ぶ。
そして、区域パラメータ生成部1322は、遷移先数を遷移元数で割った値を確率の値として算出する。
S215において、確率ファイル生成部133は、確率パラメータファイル193を用いて、パラメータ別の確率を算出する。そして、確率ファイル生成部133は、パラメータ別の確率を確率ファイル194に登録する。確率を算出する方法は実施の形態1と同じである。
但し、確率ファイル生成部133は、全てのページ区域のうち、対象識別子ファイル197に示される対象識別子で識別されるページ区域の確率を算出する。
図39に、パラメータモデル192Mの一例を示す。
パラメータモデル192Mにおいて、URLHを表す親ノードにID1〜4を表す子ノードが関連付けられ、ID1を表す子ノードにID6〜7を表す孫ノードが関連付けられている。
図40に、図39のパラメータモデル192Mに基づいて生成される確率ファイル194を示す。
***実施の形態の効果***
ウェブ閲覧装置100は、区域識別子毎に、ページ区域に含まれるリンクが指定される確率を算出する。そのため、ウェブ閲覧装置100は、コンテンツの表示範囲の変化に伴ってリンクの位置が変化する場合であっても、指定される確率が高いリンクに関連付いたウェブページをキャッシュに保存することができる。
また、ウェブ閲覧装置100は、区域識別子群をグループ分けする。そして、ウェブページ200は、グループ毎に下層の区域識別子、つまり、狭いページ区域を識別する区域識別子を選択し、選択した区域識別子を対象にして確率を算出する。これにより、キャッシュに保存する対象となるウェブページの数が減るため、ウェブページをキャッシュに保存するための記憶容量および通信量を抑えることができる。
図41に、図30の状態からリンク201の位置が変化したウェブページ200を示す。
コンテンツ202の表示範囲が拡大したことに伴って、ウェブページ200の全体のサイズが大きくなり、リンク201の位置がウェブページ200の下方へ移動している。
しかし、いずれのリンク201についてもリンク201が属するページ区域の区域識別子は変わっていない。
そのため、区域識別子毎に確率を算出することにより、指定される確率が高いリンクに関連付いたウェブページをキャッシュに保存することができる。
***他の構成***
ウェブページがHTMLで作成されている場合、タグ名、ID名およびクラス名などの区域識別子を複合的に用いてもよい。
図42に、これらの区域識別子とページ区域の階層との関係を示す。“−”は、該当する区域識別子が定義されていないことを意味する。この場合、第5層が最下層になる。つまり、第5層のページ区域であるページ区域DIVとページ区域sample2が確率を算出する対象のページ区域となる。
ウェブ閲覧装置100の機能は、実施の形態1と同じく、ハードウェアで実現してもよい。
図43に、ウェブ閲覧装置100の機能がハードウェアで実現される場合の構成を示す。
処理回路990は、区域選択部160を含めた「部」の機能を実現する専用の電子回路である。
各実施の形態は、好ましい形態の例示であり、本発明の技術的範囲を制限することを意図するものではない。各実施の形態は、部分的に実施してもよいし、他の形態と組み合わせて実施してもよい。
フローチャート等を用いて説明した処理手順は、ウェブ閲覧装置、ウェブ閲覧方法およびウェブ閲覧プログラムの処理手順の一例である。
100 ウェブ閲覧装置、110 ページ表示部、120 履歴登録部、121 共通情報登録部、122 操作判定部、123 指定位置登録部、124 指定地登録部、130 確率算出部、131 パラメータモデル生成部、132 確率パラメータ生成部、1321 URLパラメータ生成部、1322 区域パラメータ生成部、1323 距離パラメータ生成部、133 確率ファイル生成部、140 ページ取得部、141 パラメータ選択部、142 リンク取得部、143 場所名取得部、144 URL生成部、145 ページデータ取得部、150 キャッシュ部、160 区域選択部、161 グルーピング部、162 識別子群抽出部、163 識別子選択部、180 キャッシュ記憶部、190 主記憶部、191 履歴ファイル、192 パラメータモデルファイル、192M パラメータモデル、193 確率パラメータファイル、194 確率ファイル、195 グループ情報ファイル、196 共通識別子群ファイル、197 対象識別子ファイル、199 ページデータ、200 ウェブページ、200H ホームページ、201 リンク、202 コンテンツ、203 検索窓、204 検索ボタン、901 プロセッサ、9011 キャッシュメモリ、904 通信装置、9041 レシーバ、9042 トランスミッタ、907 入力装置、908 ディスプレイ、910 信号線、920 メインメモリ、921 タッチパネル、922 測位装置、990 処理回路。

Claims (7)

  1. 他のウェブページに関連付いたリンクを複数含んだ遷移元ページでいずれかのリンクが指定される毎に、前記遷移元ページ指定されたリンクの位置を特定する指定位置情報を履歴ファイルに登録する履歴登録部と、
    前記遷移元ページを区切ったページ区域毎に、ページ区域に含まれるリンクが指定される確率を、前記履歴ファイルに登録された指定位置情報を用いて算出する確率算出部と、
    ページ区域毎の確率に基づいてページ区域を選択し、選択したページ区域に含まれるリンクを前記遷移元ページから取得し、取得したリンクに関連付いたウェブページを取得するページ取得部と、
    取得されたウェブページをメモリに記憶するキャッシュ部と
    を備えるウェブ閲覧装置。
  2. 前記遷移元ページは、複数のページ区域がレイアウトされて、少なくともいずれかのページ区域にリンクが含まれるウェブページであり、
    前記履歴登録部は、指定されたリンクを含んだページ区域を識別する区域識別子を前記指定位置情報として前記履歴ファイルに登録し、
    前記確率算出部は、ページ区域毎に、前記履歴ファイルに含まれる区域識別子のうち、当該ページ区域を識別する区域識別子の数に基づいて前記確率を算出する
    請求項1に記載のウェブ閲覧装置。
  3. 前記遷移元ページは、親のページ区域の中に子のページ区域がレイアウトされる階層構造を有し、
    前記履歴登録部は、指定されたリンクを含んだ各階層のページ区域の区域識別子を含んだ区域識別子群を前記履歴ファイルに登録し、
    前記ウェブ閲覧装置は、
    前記履歴ファイルに登録された区域識別子群を用いて、前記確率を算出する対象となる子のページ区域を選択する区域選択部を備え、
    前記確率算出部は、選択された子のページ区域毎に当該子のページ区域を識別する区域識別子の数に基づいて前記確率を算出する
    請求項2に記載のウェブ閲覧装置。
  4. 前記区域選択部は、
    前記履歴ファイルに登録された区域識別子群をグループ分けし、
    グループ別に、グループ内の区域識別子群から、各区域識別子群に共通する1つ以上の区域識別子である共通識別子群を抽出し、
    グループ別に、抽出した共通識別子群から、前記確率を算出する対象となる子のページ区域を識別する区域識別子を選択する
    請求項3に記載のウェブ閲覧装置。
  5. 前記履歴登録部は、前記遷移元ページの中の指定された位置を示す座標値を前記指定位置情報として前記履歴ファイルに登録し、
    前記確率算出部は、ページ区域毎に、前記履歴ファイルに含まれる座標値のうち、当該ページ区域に含まれる位置を示す座標値の数に基づいて前記確率を算出する
    請求項1に記載のウェブ閲覧装置。
  6. 前記ウェブ閲覧装置は、現在地を測位する機能を有する携帯機器であり、
    前記遷移元ページは、検索キーワードが入力される検索窓を有するウェブページであり、
    前記履歴登録部は、指定地を特定する指定地情報が検索キーワードとして前記検索窓に入力されて検索が行われた場合、入力された指定地情報で特定される指定地を示す座標値と、測位された現在地を示す座標値とを前記履歴ファイルに登録し、
    前記確率算出部は、距離範囲毎に、前記ウェブ閲覧装置までの距離が当該距離範囲に含まれる地点の検索が行われる確率を、前記履歴ファイルに登録された指定地のうち、前記履歴ファイルに登録された現在地までの距離が当該距離範囲に含まれる指定地の数に基づいて算出し、
    前記ページ取得部は、距離範囲毎の確率に基づいて距離範囲を選択し、測位された現在地までの距離が選択した距離範囲に含まれる場所の情報を含んだウェブページを取得する請求項1に記載のウェブ閲覧装置。
  7. 他のウェブページに関連付いたリンクを複数含んだ遷移元ページでいずれかのリンクが指定される毎に、前記遷移元ページ指定されたリンクの位置を特定する指定位置情報を履歴ファイルに登録する履歴登録処理と、
    前記遷移元ページを区切ったページ区域毎に、ページ区域に含まれるリンクが指定される確率を、前記履歴ファイルに登録された指定位置情報を用いて算出する確率算出処理と、
    ページ区域毎の確率に基づいてページ区域を選択し、選択したページ区域に含まれるリンクを前記遷移元ページから取得し、取得したリンクに関連付いたウェブページを取得するページ取得処理と、
    取得されたウェブページをメモリに記憶するキャッシュ処理と
    をコンピュータに実行させるためのウェブ閲覧プログラム。
JP2017505271A 2015-08-11 2015-08-11 ウェブ閲覧装置およびウェブ閲覧プログラム Expired - Fee Related JP6297206B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/072733 WO2017026047A1 (ja) 2015-08-11 2015-08-11 ウェブ閲覧装置およびウェブ閲覧プログラム

Publications (2)

Publication Number Publication Date
JPWO2017026047A1 JPWO2017026047A1 (ja) 2017-08-10
JP6297206B2 true JP6297206B2 (ja) 2018-03-20

Family

ID=57983136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017505271A Expired - Fee Related JP6297206B2 (ja) 2015-08-11 2015-08-11 ウェブ閲覧装置およびウェブ閲覧プログラム

Country Status (5)

Country Link
US (1) US20180203939A1 (ja)
JP (1) JP6297206B2 (ja)
CN (1) CN107851071A (ja)
DE (1) DE112015006795T5 (ja)
WO (1) WO2017026047A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6771705B2 (ja) * 2018-07-31 2020-10-21 三菱電機株式会社 情報処理装置、プログラム及び情報処理方法
CN109376318B (zh) * 2018-09-03 2023-07-21 中国平安人寿保险股份有限公司 一种页面加载方法、计算机可读存储介质及终端设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1124982A (ja) * 1997-06-30 1999-01-29 Nec Corp 履歴に基づくWebページ先読み方式
JP3764291B2 (ja) * 1999-03-02 2006-04-05 株式会社東芝 情報配信システム、移動計算機、情報サーバ装置、キャッシュサーバ装置及び先読みキャッシュ処理方法
EP1356394A2 (en) * 2000-05-16 2003-10-29 divine technology ventures Distributed dynamic web page caching system
US20080000516A1 (en) * 2004-09-14 2008-01-03 Aerosun Technologies Ag Solar Energy Utilization Unit and Solar Energy Utilization System
JP4697491B2 (ja) * 2006-03-31 2011-06-08 日本電気株式会社 ウェブコンテンツ閲覧情報表示装置、方法、プログラム
DE102006036571A1 (de) * 2006-08-04 2008-03-27 Siemens Ag Medizinisches Diagnosesystem und Verfahren zur Erfassung medizinischer Bildinformationen
US7828317B2 (en) * 2008-05-30 2010-11-09 Ford Global Technologies, Llc Integrated support structure for either a fifth wheel hitch or a gooseneck trailer hitch
JP2009295122A (ja) * 2008-06-09 2009-12-17 Nec Corp 構造化文書処理システム、構造化文書処理方法および構造化文書処理プログラム
JP5208884B2 (ja) 2009-08-17 2013-06-12 日本電信電話株式会社 Web情報取得方法および装置
CN102222098A (zh) * 2011-06-20 2011-10-19 北京邮电大学 一种网页预取方法和系统
CN104246757B (zh) 2012-02-22 2018-11-06 诺基亚技术有限公司 预测性服务访问
US9255826B2 (en) * 2013-07-16 2016-02-09 Honeywell International Inc. Temperature compensation module for a fluid flow transducer
CN104699780A (zh) * 2015-03-12 2015-06-10 浪潮集团有限公司 一种大数据量下提高网页响应速度的方法

Also Published As

Publication number Publication date
DE112015006795T5 (de) 2018-04-19
US20180203939A1 (en) 2018-07-19
WO2017026047A1 (ja) 2017-02-16
JPWO2017026047A1 (ja) 2017-08-10
CN107851071A (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
US8984006B2 (en) Systems and methods for identifying hierarchical relationships
US10289700B2 (en) Method for dynamically matching images with content items based on keywords in response to search queries
US10489448B2 (en) Method and system for dynamically ranking images to be matched with content in response to a search query
JP5325579B2 (ja) ロケーション検索クエリのための地理コーディング
US20090132469A1 (en) Geocoding based on neighborhoods and other uniquely defined informal spaces or geographical regions
JP4962959B2 (ja) 地図上の領域を求める方法
CN104090927B (zh) 一种基于电子地图的划线搜索方法和装置
CN104239396A (zh) 一种搜索电子地图上业务对象的方法和装置
JP6363682B2 (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
US10275472B2 (en) Method for categorizing images to be associated with content items based on keywords of search queries
CN110990725A (zh) 基于距离的搜索排名降级
JP6297206B2 (ja) ウェブ閲覧装置およびウェブ閲覧プログラム
US10621770B1 (en) Method and system for labeling line features in electronic maps
CN107430614B (zh) 到对应资源的应用局部深度链接
US20150169567A1 (en) Search result image display environment and background
CN113486215A (zh) 一种基于数据关联性的数据展示方法、装置及设备
IES20070382A2 (en) A method and apparatus for providing an on-line directory service
Aliprantis et al. Linked open data as universal markers for mobile augmented reality applications in cultural heritage
WO2016011699A1 (zh) 一种用于配置浏览器的导航页的方法与装置
JP5426285B2 (ja) 地図情報表示システム
JP5297295B2 (ja) WWW情報閲覧システムと方法およびWebブラウザとプログラム
JP6944320B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20150379027A1 (en) Searching Based On A Local Density Of Entities
US10496698B2 (en) Method and system for determining image-based content styles
JP2006024157A (ja) ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170926

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180220

R150 Certificate of patent or registration of utility model

Ref document number: 6297206

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees