JP2013058148A - 集約装置、集約方法及び集約プログラム - Google Patents

集約装置、集約方法及び集約プログラム Download PDF

Info

Publication number
JP2013058148A
JP2013058148A JP2011197193A JP2011197193A JP2013058148A JP 2013058148 A JP2013058148 A JP 2013058148A JP 2011197193 A JP2011197193 A JP 2011197193A JP 2011197193 A JP2011197193 A JP 2011197193A JP 2013058148 A JP2013058148 A JP 2013058148A
Authority
JP
Japan
Prior art keywords
collection
content
request
storage unit
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011197193A
Other languages
English (en)
Other versions
JP5437335B2 (ja
Inventor
Kenji Yoshida
健児 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2011197193A priority Critical patent/JP5437335B2/ja
Publication of JP2013058148A publication Critical patent/JP2013058148A/ja
Application granted granted Critical
Publication of JP5437335B2 publication Critical patent/JP5437335B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】コンテンツ提供サーバの負荷増大を防止可能にすること。
【解決手段】集約装置が、ネットワーク上に存在するコンテンツを収集する複数の収集装置から受信したコンテンツの収集要求と取得済みのコンテンツとを記憶する記憶部を有する。そして、集約装置が、記憶部に記憶されている収集要求及び取得済みのコンテンツに応じて、処理対象の収集要求における収集条件を調整し、調整した収集条件に従ってコンテンツを取得する。そして、集約装置が、取得したコンテンツを記憶部に格納し、処理対象の収集要求における収集条件を満たすコンテンツを記憶部から取得し、取得したコンテンツを含む応答情報を収集要求の送信元である収集装置に送信する。
【選択図】図1

Description

本発明は、集約装置、集約方法及び集約プログラムに関する。
従来、Webサーバ等によって提供されるテキストデータや画像データなどのコンテンツを周期的に収集するクローラ(Crawler)装置が知られている。クローラ装置によって収集されたコンテンツは、検索エンジン等によって用いられることが多い。このようなクローラ装置は、例えば、検索エンジンが提供する検索サービスに応じて、コンテンツの収集ロジックや収集対象とするコンテンツが異なる。例えば、所定のウェブページに含まれるリンクをたどってウェブページを収集するクローラ装置もあれば、更新頻度の高い特定のウェブページに限定して収集するクローラ装置もある。
特開2005−157965号公報 特開2010−123043号公報 特開2010−146377号公報 特開2008−504612号公報
しかしながら、上記従来のクローラ装置では、コンテンツ提供サーバの負荷を増大させる場合がある。具体的には、クローラ装置によって収集ロジックが異なるので、検索サービスを提供する各企業は、複数のクローラ装置を用いる場合がある。ただし、複数のクローラ装置が全て異なるコンテンツを収集するとは限らず、異なるクローラ装置が同一のコンテンツを収集する場合もある。このため、コンテンツ提供サーバは、各クローラ装置から何度もアクセスされることで負荷が増大することとなる。
本願は、上記に鑑みてなされたものであって、コンテンツ提供サーバの負荷増大を防止可能にすることを課題とする。
本願に係る集約装置は、ネットワーク上に存在するコンテンツを収集する複数の収集装置から受信したコンテンツの収集要求と、取得済みのコンテンツとを記憶する記憶部と、前記記憶部に記憶されている収集要求及び取得済みのコンテンツに応じて、処理対象の収集要求における収集条件を調整する調整部と、前記調整部によって調整された収集条件に従ってコンテンツを取得する取得部と、前記取得部によって取得されたコンテンツを前記記憶部に格納する取得結果格納部と、前記処理対象の収集要求における収集条件を満たすコンテンツを前記記憶部から取得し、取得したコンテンツを含む応答情報を前記収集要求の送信元である収集装置に送信する送信部とを備えたことを特徴とする。
本願に係る集約装置、集約方法及び集約プログラムは、コンテンツ提供サーバの負荷増大を防止することができるという効果を奏する。
図1は、第1の実施形態に係る集約装置の構成例を示す図である。 図2は、第1の実施形態に係る条件/内容DBの一例を示す図である。 図3は、第1の実施形態に係る集約装置による収集要求格納処理の手順を示すフローチャートである。 図4は、第1の実施形態に係る集約装置によるウェブページ収集処理の手順を示すフローチャートである。 図5Aは、第1の実施形態に係る条件/内容DBに記憶される情報の遷移例を示す図である。 図5Bは、第1の実施形態に係る条件/内容DBに記憶される情報の遷移例を示す図である。
以下に、本願に係る集約装置、集約方法及び集約プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面に参照しつつ詳細に説明する。なお、この実施形態により本願に係る集約装置、集約方法及び集約プログラムが限定されるものではない。
(第1の実施形態)
図1〜図5Bを用いて、本願に係る集約装置、集約方法及び集約プログラムの第1の実施形態について説明する。なお、第1の実施形態では、クローラ装置が収集対象とするコンテンツがWebサーバによって提供されるウェブページであり、かかるWebサーバとクローラ装置との管理者が異なるものとする。
〔1−1.構成〕
まず、図1を用いて、第1の実施形態に係る集約装置の構成例について説明する。図1に例示するように、第1の実施形態に係る集約装置100は、クローラ装置10〜10と接続され、さらにネットワーク網を介して第三者Webサーバ20〜20と接続される。クローラ装置10〜10は、「ボット(Bot)」、「ロボット」、「スパイダー」等と呼ばれることもあり、第三者Webサーバ20〜20によって提供される所定のウェブページ(例えば、トップページ)に含まれるリンクをたどって各種ウェブページを収集するための収集要求(リクエスト)を送信する。第三者Webサーバ20〜20は、各種ウェブページを提供する。
集約装置100は、クローラ装置10〜10からウェブページの収集要求を受け付け、かかる収集要求を集約して第三者Webサーバ20〜20からウェブページを収集し、収集したウェブページを含む応答情報をクローラ装置10〜10に送信するコンピュータである。かかる集約装置100は、図1に例示するように、I/O(Input/Output)ポート110と、条件/内容DB(DataBase)120と、キュー130と、要求格納部141と、調整部142と、取得部143と、取得結果格納部144と、リクエスト確認部145と、送信部146とを有する。
I/Oポート110は、NIC(Network Interface Card)等のインタフェースであり、クローラ装置10〜10との間で各種データを送受信する。条件/内容DB120は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置である。なお、条件/内容DB120については、図2を用いて後述する。キュー130は、例えば、デジタル回路等であり、クローラ装置10〜10から送信される収集要求をキューとして記憶する。
要求格納部141〜送信部146は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。また、例えば、要求格納部141〜送信部146は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、図示しない記憶装置に記憶されているプログラムがRAMを作業領域として実行されることにより実現される。これらの要求格納部141〜送信部146は、以下に説明する情報処理の機能や作用を実現又は実行する。
なお、以下では、クローラ装置10〜10を区別する必要がない場合には、これらを総称して「クローラ装置10」と表記する場合がある。また、第三者Webサーバ20〜20を区別する必要がない場合には、これらを総称して「第三者Webサーバ20」と表記する場合がある。
〔1−2.条件/内容DB120〕
次に、図2を用いて、条件/内容DB120の一例について説明する。条件/内容DB120は、クローラ装置10から送信される収集要求や、第三者Webサーバ20から取得済みのウェブページ等を記憶する。図2に示した例では、条件/内容DB120は、「URL(Uniform Resource Locator)」及び「対象デバイス」毎に、「トランザクションID」、「リクエスト情報」、「共通条件」、「コンテンツ情報」、「状況情報」等の情報を対応付けて記憶する。なお、図2に示すように、条件/内容DB120は、1個の「URL」に対して、複数の「トランザクションID」及び「リクエスト情報」を記憶する場合がある。
「URL」は、クローラ装置10〜10から送信される収集要求に含まれる情報であり、収集対象とするウェブページ群のうち最上層のウェブページを示す。「トランザクションID」は、収集要求を識別するための識別情報を示す。
「リクエスト情報」は、収集要求に含まれる情報であり、収集対象とするウェブページ群を特定するための収集条件を示す。図2に示した例では、「リクエスト情報」には、「対象デバイス」、「鮮度(freshness)」、「優先(priority)」、「階層」、「リダイレクト上限回数」等が含まれる。「対象デバイス」は、フルブラウザを搭載するPC(Personal computer)向けのウェブページを収集対象とするか、又は、モバイルブラウザを搭載する携帯電話機向けのウェブページを収集対象とするかを示す。「鮮度」は、取得済みのウェブページを応答情報に含めてもよい場合に収集要求に設定される情報であり、応答情報に含めることが許容されるウェブページの取得日時から現時点までの経過時間を示す。「優先」は、収集要求を処理する順番等の優先度を示す。「階層」は、「URL」によって示されるリクエストにかかるウェブページから、かかるウェブページに関連付けられたウェブページまでのリンクの回数を示す。「リダイレクト上限回数」は、収集対象とするウェブページ間におけるリダイレクトの上限回数を示す。
「共通条件」は、同一のURL及び対象デバイス毎に集約されたリクエスト情報を示す。図2に示した例では、この「共通条件」には、「MAX階層」、「MAXリダイレクト」等が含まれる。「MAX階層」は、同一のURL及び同一の対象デバイスに対応付けて記憶されている「階層」の最大値を示す。「MAXリダイレクト」は、同一のURL及び同一の対象デバイスに対応付けて記憶されている「リダイレクト上限回数」の最大値を示す。「コンテンツ情報」は、第三者Webサーバ20から取得されたウェブページを示す。「状況情報」は、ウェブページの収集処理(クロール処理)が処理済みであるか否かを示す。図2に示した例において、「状況情報」が「未」である場合には、収集処理が行われていないことを示し、「状況情報」が「済」である場合には、収集処理が完了したことを示す。
〔1−3.作用(収集要求格納処理)〕
次に、図3を用いて、第1の実施形態に係る集約装置100による収集要求格納処理の手順について説明する。図3に示すように、要求格納部141の取得結果確認部141aは、クローラ装置10から収集要求を受信した場合に(ステップS101,Yes)、かかる収集要求におけるリクエスト情報(収集条件)を満たすウェブページが条件/内容DB120に存在するか否かを判定する(ステップS102)。
そして、取得結果確認部141aによって存在しないと判定された場合に(ステップS102,No)、トランザクション生成部141bは、クローラ装置10から受信した収集要求に基づいて、収集処理のトランザクションを生成する(ステップS103)。このとき、トランザクション生成部141bは、収集要求を識別するためのトランザクションIDを生成してもよいし、収集要求を識別するための情報が収集要求に含まれる場合には、かかる情報をトランザクションIDとしてもよい。
続いて、格納部141cは、収集要求に設定されているURLやリクエスト情報とトランザクションIDとを条件/内容DB120に格納し(ステップS104)、条件/内容DB120の共通条件を更新する(ステップS105)。
図2に示した例を用いて説明する。ここでは、条件/内容DB120に各種情報が記憶されていないものとする。また、取得結果確認部141aが、URL「www.aaa.jp」と、PC向けのウェブページを収集対象とする情報(対象デバイス)と、24時間以内に取得されたウェブページを応答情報に含めてもよいことを示す情報(鮮度)と、収集処理の優先度が高いことを示す情報(優先)と、URLによって示されるリクエストにかかるウェブページからのリンク回数が3回以内であるウェブページを収集対象とする情報(階層)と、リダイレクト回数が3回以内のウェブページを収集対象とする情報(リダイレクト上限回数)とが設定されている収集要求を受信したものとする。かかる場合に、格納部141cは、図2に示したトランザクションIDが「001」であるレコードのように、URL及びリクエスト情報を条件/内容DB120に格納する。この時点では、URL「www.aaa.jp」に対応するリクエスト情報がトランザクションID「001」のレコードだけであるので、格納部141cは、トランザクションID「001」の階層「3」をMAX階層に格納するとともに、トランザクションID「001」のリダイレクト上限回数「3」をMAXリダイレクトに格納する。
また、図2に示した例では、取得結果確認部141aは、URL「www.aaa.jp」と、PC向けのウェブページを収集対象とする情報(対象デバイス)とが設定されている収集要求をクローラ装置10から順次受信する。そして、格納部141cは、URL「www.aaa.jp」に対応付けて、トランザクションID「002」及び「003」に対応するリクエスト情報を条件/内容DB120に順次格納し、リクエスト情報を格納するたびに共通条件を更新する。例えば、格納部141cは、トランザクションID「002」のリクエスト情報を格納した場合には、URL「www.aaa.jp」に対応するリクエスト情報がトランザクションID「001」及び「002」に対応する2レコードであるので、MAX階層の値を階層「3」及び「5」の最大値「5」に更新するとともに、MAXリダイレクトの値をリダイレクト上限回数「3」及び「5」の最大値「5」に更新する。
また、取得結果確認部141aが、URL「www.aaa.jp」と、携帯電話機向けのウェブページを収集対象とする情報(対象デバイス)とが設定されている収集要求をクローラ装置10から受信したものとする。かかる場合に、格納部141cは、図2に示した例のように、対象デバイス「PC」とは異なるレコードに、URL「www.aaa.jp」とトランザクションID「004」に対応するリクエスト情報とを対応付けて条件/内容DB120に格納する。このように、要求格納部141は、クローラ装置10から収集要求を受信した場合に、URL及び対象デバイス毎に収集要求を条件/内容DB120に格納する。なお、要求格納部141は、条件/内容DB120に収集要求を格納する際には状況情報を「未」とする。
続いて、スケジュール振り分け部141dは、収集要求のトランザクションIDをキュー130に格納する(ステップS106)。このとき、スケジュール振り分け部141dは、収集要求に設定されている「優先」に基づいて、優先度の高い収集要求ほど早く処理されるようにトランザクションIDをキュー130に格納してもよい。
また、取得結果確認部141aは、クローラ装置10から受信した収集要求における収集条件を満たすウェブページが条件/内容DB120に存在する場合には(ステップS102,Yes)、収集要求を条件/内容DB120に格納する処理を格納部141cに行わせない。かかる場合に、送信部146の応答情報生成部146aは、収集要求に設定されている収集条件を満たすウェブページを条件/内容DB120から取得し、取得したウェブページを含む応答情報を生成する(ステップS107)。そして、応答情報生成部146aは、収集要求の送信元であるクローラ装置10に応答情報を送信する(ステップS108)。
例えば、図2に示した状態において、URL「www.aaa.jp」及び対象デバイス「PC」に対応するコンテンツ情報に取得日時が12時間前であるウェブページが格納されているものとする。また、取得結果確認部141aが、URL「www.aaa.jp」、対象デバイス「PC」、鮮度「24時間」、階層「3」及びリダイレクト上限回数「3」が設定されている収集要求を受信したものとする。かかる場合に、応答情報生成部146aは、収集要求における収集条件を満たすウェブページが条件/内容DB120に存在するので、収集条件を満たす条件/内容DB120内のウェブページをクローラ装置10に送信する。
〔1−4.作用(ウェブページ収集処理)〕
次に、図4を用いて、第1の実施形態に係る集約装置100によるウェブページ収集処理の手順について説明する。図4に示すように、集約装置100の調整部142は、キュー130にトランザクションIDが格納されている場合に(ステップS201,Yes)、キュー130からトランザクションIDを取得する(ステップS202)。かかるトランザクションIDによって示される収集要求が処理対象となる。
続いて、調整部142は、ステップS202において取得したトランザクションIDに対応する状況情報を参照して、処理対象の収集要求に対する収集処理が未処理であるか否かを判定する(ステップS203)。そして、調整部142は、収集処理が未処理でない場合には(ステップS203,No)、かかる収集要求に対する収集処理を取得部143に行わせることなく、ステップS101に戻って次のキューについて処理を行う。
一方、調整部142は、収集処理が未処理である場合には(ステップS203,Yes)、条件/内容DB120に記憶されている収集要求及び取得済みのウェブページに応じて、処理対象の収集要求における収集条件を調整する。
具体的には、調整部142は、処理対象の収集要求に設定されている鮮度を満たす一部のウェブページが条件/内容DB120に存在するか否かを判定する(ステップS204)。そして、調整部142は、一部のウェブページが存在しない場合には(ステップS204,No)、処理対象の収集要求に設定されているURLに対応付けて条件/内容DB120に記憶されている各収集条件を全て満たすように、共通条件を収集条件とする(ステップS205)。一方、調整部142は、一部のウェブページが存在する場合には(ステップS204,Yes)、共通条件を満たすウェブページと一部のウェブページとの差分のウェブページを収集するように、収集条件を調整する(ステップS206)。なお、調整部142は、共通条件に含まれる全ての項目(例えば、MAX階層及びMAXリダイレクト)を収集条件としてもよいし、少なくとも1以上の項目(例えば、MAX階層又はMAXリダイレクトのいずれか一方のみ)を収集条件としてもよい。
例えば、図2に示した例において、調整部142は、キュー130からトランザクションID「001」を取得した場合に、トランザクションID「001」の収集条件を共通条件である階層「5」及びリダイレクト上限回数「5」に調整する。また、この例において、リクエストにかかるウェブページからのリンク回数が「1〜2」であり、かつ、トランザクションID「001」〜「003」の鮮度を満たすウェブページが条件/内容DB120に記憶されているものとする。かかる場合、調整部142は、収集条件を階層「3〜5」に調整する。なお、調整部142は、階層及びリダイレクト上限回数の双方を調整せずに、トランザクションID「001」の収集条件を共通条件である階層「5」に調整してもよいし、トランザクションID「001」の収集条件を共通条件であるリダイレクト上限回数「5」に調整してもよい。
続いて、取得部143は、調整部142によって調整された収集条件に従ってウェブページを取得する(ステップS207)。上記例のように、収集条件の階層が「3〜5」である場合には、取得部143は、「www.aaa.jp」によって示されるリクエストにかかるウェブページにアクセスし、かかるウェブページからのリンク回数が3回〜5回であり、かつ、リダイレクト回数が5回以内のウェブページを取得する。例えば、取得部143は、リクエストにかかるウェブページから、かかるウェブページに張られているリンクをたどって、リンク回数が3回目、4回目、5回目であるウェブページを取得する。このとき、取得部143は、リクエストにかかるウェブページからのリンク回数が2回であるウェブページを条件/内容DB120から取得し、取得したウェブページにアクセスすることにより、リンク回数が3回以降のウェブページを取得できる。
なお、上記例において、トランザクションID「001」〜「003」に対応する対象デバイスに「PC」が記憶されているので、取得部143は、PC向けのウェブページを取得する。ただし、取得部143は、対象デバイスに「携帯」が記憶されている場合には、携帯電話機向けのウェブページを取得する。このように、取得部143は、リクエストにかかるURLが同一であっても、対象デバイスが異なる場合には、対象デバイス毎にウェブページの取得処理を行う。
続いて、取得結果格納部144は、取得部143によって取得されたウェブページを条件/内容DB120のコンテンツ情報に格納する(ステップS208)。続いて、リクエスト確認部145は、条件/内容DB120を参照して、処理対象のURLに対応する他のトランザクションが存在するか否かを判定する(ステップS209)。例えば、上記例の場合、リクエスト確認部145は、URL「www.aaa.jp」に対応付けて条件/内容DB120に記憶されているトランザクションIDのうち、処理対象のトランザクションID「001」以外のIDが存在するか否かを判定する。
そして、応答情報一括生成部146bは、リクエスト確認部145によって存在すると判定された場合に(ステップS209,Yes)、応答情報を一括生成し(ステップS210)、リクエスト確認部145によって存在しないと判定された場合に(ステップS209,No)、処理対象の収集要求に対応する応答情報を生成する(ステップS211)。続いて、応答情報一括生成部146bは、生成した応答情報をクローラ装置10に送信する(ステップS212)。そして、応答情報一括生成部146bは、処理対象のURLに対応付けて条件/内容DB120に記憶されている状況情報を「済」に更新するとともに、かかるURLに対応付けて条件/内容DB120に記憶されているトランザクションID及び収集条件を全て削除する(ステップS213)。
上記例の場合、応答情報一括生成部146bは、トランザクションID「001」〜「003」の応答情報を一括生成する。このとき、応答情報一括生成部146bは、条件/内容DB120に記憶されているウェブページのうち、各トランザクションIDに対応する収集条件(リクエスト情報)を満たすウェブページを取得し、取得したウェブページを含む応答情報を生成する。具体的には、応答情報一括生成部146bは、トランザクションID「001」に対する応答情報には、階層「3」かつリダイレクト上限回数「3」を満たすウェブページを含め、トランザクションID「002」に対する応答情報には、階層「5」かつリダイレクト上限回数「5」を満たすウェブページを含め、トランザクションID「003」に対する応答情報には、階層「1」かつリダイレクト上限回数「1」を満たすウェブページを含める。
〔1−5.条件/内容DB120の状態遷移例〕
次に、図5A及び図5Bを用いて、条件/内容DB120に記憶される情報の遷移例について説明する。最初に、条件/内容DB120に記憶されている各種情報が図5Aの<状態1>に示した状態であり、集約装置100がトランザクションID「001」をキュー130から取得したものとする。かかる場合に、条件/内容DB120の状況情報が「未」であり、かつ、コンテンツ情報にウェブページが格納されていないので、集約装置100は、例えば、「www.aaa.jp」によって示されるリクエストにかかるウェブページにアクセスし、かかるウェブページからのリンク回数が5回以内であり、かつ、リダイレクト回数が5回以内のウェブページを取得する。または、集約装置100は、リクエストにかかるウェブページからのリンク回数が5回以内であるウェブページを取得するか、リダイレクト回数が5回以内のウェブページを取得する。例えば、集約装置100は、リクエストにかかるウェブページを取得するとともに、かかるウェブページからリンクするウェブページをたどって、リクエストにかかるウェブページからのリンク回数が5回以内であるウェブページを取得する。そして、集約装置100は、図5Aの<状態2>に示した例のように、取得したウェブページをコンテンツ情報に格納し、状況情報を「済」に更新し、取得したウェブページを含む応答情報を各クローラ装置10に送信する。さらに、集約装置100は、URL「www.aaa.jp」に対応するトランザクションID及びリクエスト情報を全て削除する。
集約装置100は、<状態2>のときに、トランザクションID「002」や「003」をキュー130から取得した場合、トランザクションID「002」や「003」に対応する状況情報が「未」でないので、ウェブページの収集処理を行わない(図4のステップS203を参照)。これは、トランザクションID「001」を処理した際にトランザクションID「002」や「003」に対する応答情報を一括送信しているので、集約装置100は、トランザクションID「002」や「003」に対して収集処理を行う必要がないからである。
続いて、集約装置100は、<状態2>になってから24時間が経過する前に、URL「www.aaa.jp」、鮮度「24時間」、階層「3」及びリダイレクト上限回数「3」が設定されている収集要求を受信したものとする。かかる場合に、集約装置100は、条件/内容DB120のコンテンツ情報から収集条件を満たすウェブページを取得し、取得したウェブページを含む応答情報を収集要求の送信元であるクローラ装置10に送信する。
続いて、集約装置100は、<状態2>になってから24時間以上が経過した後に、URL「www.aaa.jp」及び鮮度「24時間」が設定されている収集要求を受信したものとする。かかる場合に、集約装置100は、図5Aの<状態3>に示した例のように、条件/内容DB120に収集要求を格納するとともに共通条件を更新する。そして、集約装置100は、共通条件に従ってウェブページを取得し、図5Bの<状態4>に示した例のように、条件/内容DB120のコンテンツ情報及び状況情報を更新する。
続いて、集約装置100は、<状態4>になってから24時間が経過する前に、URL「www.aaa.jp」、鮮度「24時間」、階層「8」及びリダイレクト上限回数「8」が設定されている収集要求を受信したものとする。かかる場合に、集約装置100は、図5Bの<状態5>に示した例のように、条件/内容DB120に収集要求を格納するとともに共通条件を更新する。このとき、条件/内容DB120には、階層「3」やリダイレクト上限回数「3」を満たし、かつ、24時間以内に取得されたウェブページが記憶されている。したがって、集約装置100は、階層「3〜5」やリダイレクト上限回数「8」である収集条件により収集処理を行う。
〔1−6.効果〕
上述してきたように、第1の実施形態に係る集約装置100は、条件/内容DB120が、ウェブページを収集する複数のクローラ装置10から受信したウェブページの収集要求と取得済みのウェブページとを記憶し、調整部142が、条件/内容DB120に記憶されている収集要求及び取得済みのウェブページに応じて、処理対象の収集要求における収集条件を調整し、取得部143が、調整部142によって調整された収集条件に従ってウェブページを取得し、取得結果格納部144が、取得部143によって取得されたウェブページを条件/内容DB120に格納し、送信部146が、処理対象の収集要求における収集条件を満たすウェブページを条件/内容DB120から取得し、取得したウェブページを含む応答情報を収集要求の送信元であるクローラ装置10に送信する。
これにより、第1の実施形態に係る集約装置100は、取得済みのウェブページを再取得しない等を実現できるので、各クローラ装置10による収集要求を個別に処理するよりも、第三者Webサーバ20にかかる負荷を低減することができる。
また、第1の実施形態に係る集約装置100は、条件/内容DB120が、収集要求として、URLに対応付けて、かかる収集要求におけるリクエスト情報である収集条件を記憶し、調整部142が、処理対象の収集要求におけるURLに対応付けて条件/内容DB120に記憶されている収集条件を全て満たすように、処理対象の収集要求における収集条件を調整する。
これにより、第1の実施形態に係る集約装置100は、リクエストにかかるウェブページ毎に、各収集要求における収集条件を満たすウェブページを1度に取得できるので、第三者Webサーバ20にかかる負荷を低減することができる。
また、第1の実施形態に係る集約装置100は、条件/内容DB120が、収集条件として、リクエストにかかるウェブページ(例えば、トップページ)からかかるウェブページに関連付けられたウェブページ群(例えば、トップページ下の各ウェブページ)までのリンク回数を示す階層、又は、ウェブページ間のリダイレクト上限回数を記憶し、調整部142が、処理対象の収集要求におけるURLに対応付けて条件/内容DB120に記憶されている複数の階層の最大値の階層、又は、かかるURLに対応付けて条件/内容DB120に記憶されている複数のリダイレクト上限回数の最大値のリダイレクト回数を処理対象の収集要求における収集条件とする。
これにより、第1の実施形態に係る集約装置100は、階層やリダイレクト上限回数が設定されている収集要求を複数受信した場合に、各収集要求における収集条件の最大条件を用いることでウェブページを1度に取得できるので、第三者Webサーバ20にかかる負荷を低減することができる。
また、第1の実施形態に係る集約装置100は、調整部142が、処理対象の収集要求における収集条件を満たす一部のウェブページのみが条件/内容DB120に記憶されている場合に、かかる収集条件を満たすウェブページのうち一部のウェブページ以外のウェブページを収集するように処理対象の収集要求における収集条件を調整する。
これにより、第1の実施形態に係る集約装置100は、収集対象のウェブページの一部が取得済みである場合でも、同一のウェブページの再取得を防止できるので、第三者Webサーバ20にかかる負荷を低減することができる。
また、第1の実施形態に係る集約装置100は、送信部146が、取得結果格納部144によって条件/内容DB120に格納されたウェブページを含む応答情報を収集要求の送信元であるクローラ装置10に送信するとともに、かかるウェブページの一部又は全部を収集対象とする未処理の収集要求における収集条件を満たすウェブページを条件/内容DB120から取得し、取得したウェブページを含む応答情報を未処理の収集要求の送信元であるクローラ装置10に送信する。
これにより、第1の実施形態に係る集約装置100は、同一のウェブページの重複取得を防止できるとともに、各クローラ装置10からの収集要求に対して一括で応答することができる。
また、第1の実施形態に係る集約装置100は、調整部142が、処理対象の収集要求における収集条件を満たすウェブページが条件/内容DB120に記憶されている場合に、取得部143による収集要求に基づくウェブページの取得処理を行わせない。
これにより、第1の実施形態に係る集約装置100は、処理対象の収集要求以外の収集要求を処理した際にウェブページを一括取得している場合には、処理対象の収集要求に対する収集処理を省略することができるので、同一のウェブページの再取得を防止することができる。
また、第1の実施形態に係る集約装置100は、要求格納部141が、クローラ装置10から受信したウェブページの収集要求における収集条件を満たすウェブページが条件/内容DB120に記憶されている場合には、かかる収集要求を条件/内容DB120に格納せず、収集要求における収集条件を満たすウェブページが条件/内容DB120に記憶されていない場合には、かかる収集要求を条件/内容DB120に格納し、送信部146が、要求格納部141によって条件/内容DB120に格納されなかった収集要求における収集条件を満たすウェブページを条件/内容DB120から取得し、取得したウェブページを含む応答情報を収集要求の送信元であるクローラ装置10に送信する。
これにより、第1の実施形態に係る集約装置100は、取得済みのウェブページを再利用することで、同一のウェブページの再取得を防止することができる。
(第2の実施形態)
本願に係る集約装置、集約方法及び集約プログラムは、上述した第1の実施形態以外にも種々の異なる形態にて実施されてよい。第2の実施形態では、他の実施形態について説明する。
〔2−1.共通条件更新処理〕
上記実施形態では、格納部141cが、条件/内容DB120の共通条件を更新する例について説明した。しかし、調整部142が、キュー130に格納されているキューを処理する際に、共通条件を更新してもよい。
〔2−2.共通条件〕
また、上記実施形態では、調整部142が、階層の最大値やリダイレクト上限回数の最大値である共通条件を収集条件とする例を示した(図4のステップS205を参照)。しかし、調整部142は、階層の最大値以上の階層や、リダイレクト上限回数の最大値以上のリダイレクト回数を収集条件としてもよい。
〔2−3.共通条件〕
また、上記実施形態では、調整部142が、URLが同一である全ての収集条件を満たすように共通条件を設定する例を示した。しかし、調整部142は、URLが同一である所定数の収集条件毎に共通条件を調整してもよい。この場合、取得部143は、所定数の収集条件毎にウェブページの取得処理を行う。例えば、条件/内容DB120が所定のURLに対応付けて10個の収集条件を記憶している場合に、調整部142は、5個の収集条件毎に共通条件を調整してもよい。かかる場合に、取得部143は、5個の収集条件毎に調整された共通条件を用いてウェブページの取得処理を行う。この例の場合、取得部143は、URLが同一である10個の収集条件について、収集処理を2回行う。
〔2−4.共通条件〕
また、図2、図5A及び図5Bには図示することを省略したが、条件/内容DB120は、共通条件として鮮度を記憶してもよい。かかる場合、格納部141cは、同一のURL及び対象デバイスに対応する鮮度のうち、最も期間が短い鮮度を共通条件の鮮度とする。そして、調整部142は、処理対象の収集要求に対する収集処理が未処理である場合に、共通条件の鮮度を満たす一部のウェブページが条件/内容DB120に存在するか否かを判定し、一部のウェブページが存在する場合には、かかる一部のウェブページとMAX階層やMAXリダイレクト等の共通条件を満たすウェブページとの差分のウェブページを収集するように、収集条件を調整する。
〔2−5.取得済みウェブページのチェック〕
また、上記実施形態では、取得結果確認部141aが、クローラ装置10から受信した収集要求における収集条件を満たすウェブページが条件/内容DB120に存在するか否かを判定する例を示した(図3のステップS102を参照)。しかし、取得結果確認部141aは、かかる判定処理を行わなくてもよい。すなわち、トランザクション生成部141bは、クローラ装置10から受信した全ての収集要求についてトランザクションを生成してもよい。この場合、調整部142が、収集要求における収集条件を満たすウェブページが条件/内容DB120に存在するか否かを判定することとなり、かかるウェブページが存在する場合には、取得部143による取得処理が行われることなく、送信部146が条件/内容DB120内のウェブページをクローラ装置10に送信する。ただし、上記〔2−4.共通条件〕に記載したように、共通条件として鮮度を用いる場合には、取得結果確認部141aによる確認処理を行うことが望ましい。
〔2−6.要求情報の格納処理〕
また、上記実施形態において、取得部143は、ウェブページの取得処理を開始した場合に、条件/内容DB120の状況情報に処理中であることを示す情報「クロール中」を格納してもよい。このとき、要求格納部141は、条件/内容DB120の状況情報が「クロール中」である状態で新たな収集要求をクローラ装置10から受信した場合、かかる収集要求における収集条件が共通条件に影響を与えなければ、収集要求を条件/内容DB120に格納してもよい。一例を挙げて説明すると、例えば、図5Aの<状態2>において、要求格納部141が、URL「www.aaa.jp」、鮮度「24時間」、階層「2」及びリダイレクト上限回数「2」が設定されている収集要求を受信したものとする。かかる場合に、要求格納部141は、受信した収集要求をURL「www.aaa.jp」に対応する条件/内容DB120のリクエスト情報に追加してもよい。これは、送信部146が、応答情報を一括生成するので、上記例のような共通条件に影響を与えない収集要求を追加した場合であっても、かかる収集要求に対する応答情報が送信されるからである。
〔2−7.要求情報の格納処理〕
また、上記〔2−6.要求情報の格納処理〕において、要求格納部141は、条件/内容DB120の状況情報が「クロール中」である状態で受信した新たな収集要求における収集条件が共通条件に影響を与える場合には、収集処理が完了するまで待機してもよい。例えば、図5Aの<状態1>において、状況情報が「クロール中」である場合に、要求格納部141が、URL「www.aaa.jp」、鮮度「24時間」、階層「7」及びリダイレクト上限回数「7」が設定されている収集要求を受信したものとする。かかる場合に、要求格納部141は、状況情報が「済」となるまで、すなわち、<状態2>になるまで待機し、状況情報が「済」となった後に、かかる収集要求をURL「www.aaa.jp」に対応する条件/内容DB120のリクエスト情報に格納してもよい。
〔2−8.要求情報の格納処理〕
また、上記実施形態では、要求格納部141が、収集要求の収集条件を満たすウェブページが条件/内容DB120に存在する場合に、かかる収集要求を条件/内容DB120に格納しない例を示した(図3のステップS102を参照)。しかし、要求格納部141は、収集要求の収集条件を満たすウェブページが条件/内容DB120に存在する場合であっても、かかる収集要求を条件/内容DB120に格納してもよい。そして、調整部142は、処理対象の収集要求における収集条件を満たすウェブページが条件/内容DB120に存在する場合には、応答情報一括生成部146bにかかる収集要求の応答情報を送信させてもよい。この例の場合、集約装置100は、応答情報生成部146aと応答情報一括生成部146bのうち応答情報一括生成部146bだけを有すればよい。
〔2−9.取得処理〕
また、上記実施形態では、取得部143が、リクエストにかかるウェブページからリンク回数がMAX階層以内であるウェブページをたどることで、ウェブページを取得する例を示した。しかし、取得部143は、収集条件に含まれるURLによって示されるウェブページのみを取得し、取得したウェブページにリンク先のウェブページが存在する場合には、リンク先ウェブページのURLを含む収集要求を要求格納部141に入力してもよい。このとき、取得部143は、例えば、処理中の収集要求における収集条件と、処理中のトランザクションIDとを要求格納部141に入力してもよい。例えば、図2に示した例において、取得部143は、キュー130からトランザクションID「001」を取得した場合に、URL「www.aaa.jp」が示すウェブページを取得する。そして、取得部143は、取得したウェブページにリンク先のウェブページが存在する場合には、リンク先ウェブページのURLとトランザクションID「001」とを含む収集要求を要求格納部141に入力する。要求格納部141は、取得部143から収集要求を入力された場合に、例えば、新たなトランザクションID(ここでは、「006」とする)を生成し、生成したトランザクションID「006」と、収集要求に含まれるトランザクションID「001」と関連付け可能なように、かかる収集要求(リンク先URL等)を条件/内容DB120に格納するとともに、新たなトランザクションIDをキュー130に格納する。例えば、要求格納部141は、条件/内容DB120のトランザクションIDに「006(001)」を格納することで、トランザクションID「006」と、トランザクションID「001」とを関連付ける。そして、取得部143は、キュー130からトランザクションID「006」を取得した場合に、リンク先URLによって示されるウェブページのみを取得し、取得したウェブページにリンク先のウェブページが存在する場合には、リンク先ウェブページのURLを含む収集要求を要求格納部141に再度入力する。そして、取得部143は、このようなリンク先ウェブページのURLを含む収集要求を要求格納部141に入力する処理を共通条件のMAX階層に記憶されている回数だけ繰り返して行う。集約装置100は、このように処理する場合であっても、クローラ装置10からのリクエストにかかるウェブページからリンク回数がMAX階層以内であるウェブページをたどって取得するウェブページと同様のウェブページを取得することができる。
〔2−10.コンテンツ〕
また、上記実施形態では、集約装置100によって収集されるコンテンツとしてウェブページを例に挙げて説明した。しかし、集約装置100は、クローラ装置10からの収集要求に従って、ウェブページ以外の画像データ、音声データ、動画データ、その他各種ファイル等の他のコンテンツを収集してもよい。
〔2−11.Webサーバ〕
また、上記実施形態では、クローラ装置10と第三者Webサーバ20とが異なる企業等によって管理される例を説明した。しかし、クローラ装置10と第三者Webサーバ20とは、同一の企業等によって管理されてもよい。
〔2−12.その他〕
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述した集約装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
10 クローラ装置
20 第三者Webサーバ
100 集約装置
120 条件/内容DB
141 要求格納部
142 調整部
143 取得部
144 取得結果格納部
145 リクエスト確認部
146 送信部

Claims (9)

  1. ネットワーク上に存在するコンテンツを収集する複数の収集装置から受信したコンテンツの収集要求と、取得済みのコンテンツとを記憶する記憶部と、
    前記記憶部に記憶されている収集要求及び取得済みのコンテンツに応じて、処理対象の収集要求における収集条件を調整する調整部と、
    前記調整部によって調整された収集条件に従ってコンテンツを取得する取得部と、
    前記取得部によって取得されたコンテンツを前記記憶部に格納する取得結果格納部と、
    前記処理対象の収集要求における収集条件を満たすコンテンツを前記記憶部から取得し、取得したコンテンツを含む応答情報を前記収集要求の送信元である収集装置に送信する送信部と
    を備えたことを特徴とする集約装置。
  2. 前記記憶部は、
    前記収集要求として、所定のコンテンツを特定するための特定情報に対応付けて該収集要求における収集条件を記憶し、
    前記調整部は、
    前記処理対象の収集要求における特定情報に対応付けて前記記憶部に記憶されている収集条件を全て満たすように、前記処理対象の収集要求における収集条件を調整する
    ことを特徴とする請求項1に記載の集約装置。
  3. 前記記憶部は、
    前記収集条件として、前記所定のコンテンツから該所定のコンテンツに関連付けられたコンテンツ群までのリンク回数を示す階層、又は、コンテンツ間のリダイレクト上限回数を記憶し、
    前記調整部は、
    前記処理対象の収集要求における特定情報に対応付けて前記記憶部に記憶されている複数の階層の最大値以上の階層、又は、該特定情報に対応付けて前記記憶部に記憶されている複数のリダイレクト上限回数の最大値以上のリダイレクト回数を前記処理対象の収集要求における収集条件とする
    ことを特徴とする請求項2に記載の集約装置。
  4. 前記調整部は、
    前記処理対象の収集要求における収集条件を満たす一部のコンテンツのみが前記記憶部に記憶されている場合に、前記収集条件を満たすコンテンツのうち前記一部のコンテンツ以外のコンテンツを収集するように前記処理対象の収集要求における収集条件を調整する
    ことを特徴とする請求項1〜3のいずれか一つに記載の集約装置。
  5. 前記送信部は、
    前記取得結果格納部によって前記記憶部に格納されたコンテンツを含む応答情報を前記収集要求の送信元である収集装置に送信するとともに、該コンテンツの一部又は全部を収集対象とする未処理の収集要求における収集条件を満たすコンテンツを前記記憶部から取得し、取得したコンテンツを含む応答情報を前記未処理の収集要求の送信元である収集装置に送信する
    ことを特徴とする請求項1〜4のいずれか一つに記載の集約装置。
  6. 前記調整部は、
    前記処理対象の収集要求における収集条件を満たすコンテンツが前記記憶部に記憶されている場合に、前記取得部による該収集要求に基づくコンテンツの取得処理を行わせない
    ことを特徴とする請求項1〜5のいずれか一つに記載の集約装置。
  7. 前記収集装置から受信したコンテンツの収集要求における収集条件を満たすコンテンツが前記記憶部に記憶されている場合には、該収集要求を前記記憶部に格納せず、該収集要求における収集条件を満たすコンテンツが前記記憶部に記憶されていない場合には、該収集要求を前記記憶部に格納する要求格納部をさらに備え、
    前記送信部は、
    前記要求格納部によって前記記憶部に格納されなかった収集要求における収集条件を満たすコンテンツを前記記憶部から取得し、取得したコンテンツを含む応答情報を該収集要求の送信元である収集装置に送信する
    ことを特徴とする請求項1〜6のいずれか一つに記載の集約装置。
  8. コンピュータが実行する集約方法であって、
    ネットワーク上に存在するコンテンツを収集する複数の収集装置から受信したコンテンツの収集要求と取得済みのコンテンツとを記憶する記憶部に記憶されている前記収集要求及び前記取得済みのコンテンツに応じて、処理対象の収集要求における収集条件を調整する調整工程と、
    前記調整工程によって調整された収集条件に従ってコンテンツを取得する取得工程と、
    前記取得工程によって取得されたコンテンツを前記記憶部に格納する取得結果格納工程と、
    前記処理対象の収集要求における収集条件を満たすコンテンツを前記記憶部から取得し、取得したコンテンツを含む応答情報を前記収集要求の送信元である収集装置に送信する送信工程と
    を含んだことを特徴とする集約方法。
  9. ネットワーク上に存在するコンテンツを収集する複数の収集装置から受信したコンテンツの収集要求と取得済みのコンテンツとを記憶する記憶部に記憶されている前記収集要求及び前記取得済みのコンテンツに応じて、処理対象の収集要求における収集条件を調整する調整手順と、
    前記調整手順によって調整された収集条件に従ってコンテンツを取得する取得手順と、
    前記取得手順によって取得されたコンテンツを前記記憶部に格納する取得結果格納手順と、
    前記処理対象の収集要求における収集条件を満たすコンテンツを前記記憶部から取得し、取得したコンテンツを含む応答情報を前記収集要求の送信元である収集装置に送信する送信手順と
    をコンピュータに実行させることを特徴とする集約プログラム。
JP2011197193A 2011-09-09 2011-09-09 集約装置、集約方法及び集約プログラム Active JP5437335B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011197193A JP5437335B2 (ja) 2011-09-09 2011-09-09 集約装置、集約方法及び集約プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011197193A JP5437335B2 (ja) 2011-09-09 2011-09-09 集約装置、集約方法及び集約プログラム

Publications (2)

Publication Number Publication Date
JP2013058148A true JP2013058148A (ja) 2013-03-28
JP5437335B2 JP5437335B2 (ja) 2014-03-12

Family

ID=48133971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011197193A Active JP5437335B2 (ja) 2011-09-09 2011-09-09 集約装置、集約方法及び集約プログラム

Country Status (1)

Country Link
JP (1) JP5437335B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001282609A (ja) * 2000-03-29 2001-10-12 Internatl Business Mach Corp <Ibm> ウェブページ取得サービスシステム、プロバイダ、ウェブページ取得方法、記憶媒体及びプログラム伝送装置
JP2003303203A (ja) * 2002-04-10 2003-10-24 Toshiba Corp 知識情報収集システムおよび知識情報収集方法
JP2008146380A (ja) * 2006-12-11 2008-06-26 Sony Computer Entertainment Inc キャッシュサーバ、キャッシュサーバの制御方法、プログラム及び情報記憶媒体
JP2011039884A (ja) * 2009-08-14 2011-02-24 Internatl Business Mach Corp <Ibm> 文書を収集するためのシステムおよびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001282609A (ja) * 2000-03-29 2001-10-12 Internatl Business Mach Corp <Ibm> ウェブページ取得サービスシステム、プロバイダ、ウェブページ取得方法、記憶媒体及びプログラム伝送装置
JP2003303203A (ja) * 2002-04-10 2003-10-24 Toshiba Corp 知識情報収集システムおよび知識情報収集方法
JP2008146380A (ja) * 2006-12-11 2008-06-26 Sony Computer Entertainment Inc キャッシュサーバ、キャッシュサーバの制御方法、プログラム及び情報記憶媒体
JP2011039884A (ja) * 2009-08-14 2011-02-24 Internatl Business Mach Corp <Ibm> 文書を収集するためのシステムおよびプログラム

Also Published As

Publication number Publication date
JP5437335B2 (ja) 2014-03-12

Similar Documents

Publication Publication Date Title
US11720537B2 (en) Bucket merging for a data intake and query system using size thresholds
US20230315785A1 (en) Processing data using containerized nodes in a containerized scalable environment
US11294941B1 (en) Message-based data ingestion to a data intake and query system
US11106734B1 (en) Query execution using containerized state-free search nodes in a containerized scalable environment
US11269939B1 (en) Iterative message-based data processing including streaming analytics
US10776355B1 (en) Managing, storing, and caching query results and partial query results for combination with additional query results
US11663212B2 (en) Identifying configuration parameters for a query using a metadata catalog
US11003714B1 (en) Search node and bucket identification using a search node catalog and a data store catalog
US10984044B1 (en) Identifying buckets for query execution using a catalog of buckets stored in a remote shared storage system
US11250056B1 (en) Updating a location marker of an ingestion buffer based on storing buckets in a shared storage system
US11327992B1 (en) Authenticating a user to access a data intake and query system
US11620288B2 (en) Dynamically assigning a search head to process a query
US11657057B2 (en) Revising catalog metadata based on parsing queries
US11157497B1 (en) Dynamically assigning a search head and search nodes for a query
US11416465B1 (en) Processing data associated with different tenant identifiers
US11567993B1 (en) Copying buckets from a remote shared storage system to memory associated with a search node for query execution
US11526504B1 (en) Search-time field extraction in a data intake and query system
US11550847B1 (en) Hashing bucket identifiers to identify search nodes for efficient query execution
US11562023B1 (en) Merging buckets in a data intake and query system
US9396500B2 (en) Methods and systems for adaptive capacity management
US11620336B1 (en) Managing and storing buckets to a remote shared storage system based on a collective bucket size
US11734266B2 (en) Generic scheduling
US11714823B1 (en) Generating metric data from log data using metricization rules
US11799798B1 (en) Generating infrastructure templates for facilitating the transmission of user data into a data intake and query system
US11663219B1 (en) Determining a set of parameter values for a processing pipeline

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131211

R150 Certificate of patent or registration of utility model

Ref document number: 5437335

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350