JP7018202B2 - 掲載情報検索システム - Google Patents

掲載情報検索システム Download PDF

Info

Publication number
JP7018202B2
JP7018202B2 JP2018221220A JP2018221220A JP7018202B2 JP 7018202 B2 JP7018202 B2 JP 7018202B2 JP 2018221220 A JP2018221220 A JP 2018221220A JP 2018221220 A JP2018221220 A JP 2018221220A JP 7018202 B2 JP7018202 B2 JP 7018202B2
Authority
JP
Japan
Prior art keywords
information
search
company
server
job
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018221220A
Other languages
English (en)
Other versions
JP2020086996A (ja
Inventor
香深 金子
俊彦 愛澤
伸一 山竹
隆弘 藤村
Original Assignee
株式会社クリエイト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社クリエイト filed Critical 株式会社クリエイト
Priority to JP2018221220A priority Critical patent/JP7018202B2/ja
Publication of JP2020086996A publication Critical patent/JP2020086996A/ja
Application granted granted Critical
Publication of JP7018202B2 publication Critical patent/JP7018202B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ウェブサイトに掲載された情報を検索、収集して、営業活動等に利用するためにリストアップする掲載情報検索システムに関する。
従来、インターネット上に公開されている同業種のウェブサイトから検索条件に合致した宿泊施設情報、賃貸物件情報、求人情報等をピックアップするサイトが知られている。このようなサイトを利用すると、ユーザは、各社のウェブサイトに都度アクセスすることなく、必要な情報を一度に取得することができる。
例えば、下記の特許文献1の求人情報の自動収集方法は、求人情報の収集手段を含むサーバと、各求人企業が所有する求人企業サーバと、各求職者が利用する求職者端末とで構成されている。
上記収集手段は、求人関連情報ページにアクセスし、ページの記述情報を受信し、一旦サーバ上のメモリに記憶する。また、解析手段は、収集手段により取得したページの記述情報に対して、HTML等のマークアップ言語の仕様に基づいた解析を行い、文章及びそのレイアウト情報を抽出する。
この結果、サーバの求人情報データベースには、各企業がホームページ上で公開している最新の求人情報が求人案件構成要素毎に整理されて記憶されるので、求職者は、即座にウェブサイトから求人情報を閲覧することができる(特許文献1/段落0020~0027)。
特開2004-326712号公報
しかしながら、特許文献1の求人情報の自動収集方法では、クローラーと呼ばれる手法で情報を収集しているため、本来必要でない情報も取得してしまい、時間がかかる上、出力される情報を閲覧用に整理する手間も生じていた。
本発明は、このような事情に鑑みてなされたものであり、掲載情報の検索から閲覧用の表示までを効率良く実行することができる掲載情報検索システムを提供することを目的とする。
本発明は、ユーザが必要とする情報資源を、誰でも閲覧可能な情報資源が掲載された複数のウェブサイトを検索し、収集する掲載情報検索システムであって、前記収集された情報資源を管理するサーバと、前記収集された情報資源を記憶するデータベースと、前記サーバにネットワーク接続され、前記ユーザが必要とする情報資源の検索及び検索結果の表示を行うユーザ端末と、を備え、前記サーバは、前記ユーザが必要とする情報資源を検索する場合に、それぞれの前記ウェブサイトのウェブサーバから当該情報資源に関連するカテゴリーを特定して検索範囲を限定する検索範囲限定手段を有していることを特徴とする。
本発明の掲載情報検索システムでは、ユーザが、サーバにネットワーク接続されたユーザ端末を利用してウェブサイトから必要な情報資源を検索し、収集する。このとき、サーバの検索範囲限定手段は、検索範囲を当該情報資源に関連するカテゴリーに限定して検索することができるため、検索時に不要な情報資源を拾わず、時間の短縮が可能となる。そして、検索条件に合致した情報資源は、サーバに接続されたユーザ側のデータベースに記憶される。これにより、ユーザは、必要な情報資源を効率良く収集し、ユーザ端末により検索結果を閲覧することができる。
本発明の掲載情報検索システムにおいて、前記検索範囲限定手段は、それぞれの前記ウェブサイトのうち、前記ユーザがアクセスにより生成される動的生成ページを指定可能であることが好ましい。
この構成によれば、ユーザ端末の検索範囲限定手段は、動的生成ページを指定することができる。このため、ユーザは動的生成ページに掲載された情報資源についても検索によりヒットさせ、当該情報資源を利用することができる。
また、本発明の掲載情報検索システムにおいて、前記サーバは、前記収集された情報資源を前記データベースに記憶する際、当該情報資源を検査する情報資源検査手段を有し、前記情報資源検査手段は、前記収集された情報資源に対して表記揺れ補正を行った後、重複情報があるか否かを検査することが好ましい。
この構成によれば、サーバの情報資源検査手段は、検索して収集された情報資源をデータベースに記憶する際、当該情報資源を検査する。複数のウェブサイトで同じ情報資源を異なる態様で掲載している場合があるため、情報資源検査手段は、表記揺れの補正を行った後、重複情報であるか否かを判定する。これにより、重複した情報資源を効率良く発見することができる。
また、本発明の掲載情報検索システムにおいて、前記情報資源検査手段は、重複情報と判断された複数の前記収集された情報資源を1つの情報資源に統合することが好ましい。
この構成によれば、ユーザ端末の情報資源検査手段は、重複情報と判断された複数の情報資源を1つの情報資源に統合することができる。これにより、最終的なリストアップの際、重複した情報資源を排除することができる。
本発明の実施形態に係る掲載情報検索システムの概略図。 情報検索時の範囲限定機能を説明する図。 ヒット情報のデータクレンジングを説明する図。 掲載情報検索システムの情報閲覧を説明する図。 図3の情報閲覧画面(ウェブ画面)の表示例。 図3の情報閲覧画面(スプレッドシート)の表示例。
以下では、図面を参照しながら、本発明の掲載情報検索システムの実施形態について説明する。
図1は、本発明の実施形態に係る掲載情報検索システム1の概略図である。掲載情報検索システム1は、当該システムを利用する社員Hが所属する会社Xのサーバである自社サーバ2と、自社サーバ2に接続された自社データベース3と、自社サーバ2に社内LAN等でネットワーク接続され、掲載情報検索ツール(アプリケーション)がインストールされたユーザ端末7とから構成される。
検索対象としては、賃貸情報や宿泊施設等が考えられるが、ここでは、誰でも閲覧可能な正社員、アルバイト等の求人情報とする。すなわち、会社Xは求人情報を取り扱う企業であり、社員H(本発明の「ユーザ」に相当)はユーザ端末7を利用して、同業他社のウェブサイトから必要とする求人情報を検索、収集することができる。
図示するように、ウェブサイトに様々な職種の求人情報、求人広告を掲載している会社として、会社A、会社B及び会社Cの3つがある。また、会社A、会社B、会社Cのウェブサーバを、それぞれ管理サーバ5A、管理サーバ5B、管理サーバ5Cとし、そのウェブサイトを、それぞれウェブサイトA、ウェブサイトB、ウェブサイトCとする。
このとき、会社Xの社員Hがユーザ端末7の掲載情報検索ツールにより、検索条件をテキスト(キーワード)、チェックボックス等から入力すると、自社サーバ2は、管理サーバ5A、管理サーバ5B及び管理サーバ5Cに順次アクセスして検索を行う。そして、検索条件に合致し、ヒットした情報(以下、ヒット情報という)があれば、ヒット情報を取得して自社データベース3に記憶する。
自社データベース3はハードディスク等の記憶装置であり、登録データの領域3Aと、正規化データの領域3Bとで構成されている。領域3Aには、検索対象のウェブサイトを巡回する巡回ルールに基づいて収集された企業名、職種等の情報が格納される。また、領域Bには、収集された情報から電話番号や住所を所定のフォーマットに正規化する正規化ルールに基づいて編集された正規化データが格納される。
その後、自社サーバ2でソート等の処理が行われ、ヒット情報がリストアップされる。また、検索結果リスト(後述するリスト画面、スプレッドシート)がユーザ端末7の表示画面7aに表示されるので、社員Hは、検索結果リストを元に営業活動を行うことができる。
次に、図2A、図2Bを参照して、掲載情報検索システム1、特に自社サーバ2による情報検索の特徴について説明する。
まず、自社サーバ2による情報検索時の範囲限定機能について説明する。図2Aは、検索対象のウェブサイトのページ構造(リンク)を示している。
社員Hは、ユーザ端末7の掲載情報検索ツールでキーワードや住所を入力して求人情報の検索を行う。この作業により、自社サーバ2がA社、B社、C社のそれぞれの管理サーバ5A、管理サーバ5B及び管理サーバ5Cを巡回するようにアクセスする。そして、ウェブサイトA~Cから検索条件に合致したヒット情報を取得する(図1参照)。
ここで、本発明における情報検索は、ウェブサイトを構成する全ページを検索対象とするクローラー型の情報取得とは異なり、社員Hが必要とする情報に関連するカテゴリーを特定して、所定の範囲を限定して検索を行うことができる。
具体的には、従来のクローラー型の情報取得では、トップページPtop、動的生成ページPdyn、その他のページP1~P8を含むリンクされた全てのページを検索対象とする。
一方、掲載情報検索システム1の自社サーバ2は、特定のカテゴリーのページを検索対象に指定することができる。例えば、ウェブサイトA~Cの求人情報のページは、企業名、電話番号、URL等のある程度決まった情報で構成され、ページが切替わったとき枠内の文字のみが入れ替わる動的生成ページである。自社サーバ2は、動的生成ページPdynのみ、又はこれに加えて所定の情報が掲載されたページP1を検索対象とすることができる。
その方法として、リクエストメソッドの種類、固有の属性(地域名等)、推測可能な要素(ページ数等)、その他の変化する値の条件やタイミングを指定する方法がある。自社サーバ2は、例えば、属性「tokyo(東京)」を指定して対象となる1~500ページを検索し、その後、属性「kanagawa(神奈川)」を指定して同じ1~500ページを検索するといった巡回検索処理を行うことができる。
また、自社サーバ2は、特定の条件で巡回検索処理をスキップする設定を行うこともできる。例えば、固有の属性や推測可能な要素をURLにもつ情報一覧ページ内を巡回し、その中で新規に取得できるリンクがなく、それが所定のページ数連続した場合に、巡回検索処理をスキップする。
これにより、情報検索の際、不要なページの検索に時間をかけたり、不要な情報を取得して自社データベース3の容量を圧迫したりすることがなくなる。その結果、掲載情報検索システム1のランニングコストを抑えつつ、各社員のシステム利用時の負担を軽減することができる。
次に、図2Bを参照して、ヒット情報に対して行われるデータクレンジングについて説明する。
ウェブサイトA~Cには同じ求人情報が掲載されている場合があるので、情報検索を行うと重複してヒットしたと思われる求人情報が取得されることがある。自社サーバ2(図示省略)は、重複ヒットした求人情報(例えば、企業名、住所、電話番号等)の表記が全く同じであれば、一情報と判断して自社データベース3に記憶する。
しかし、ウェブサイトにより、表記揺れが生じている場合がある。企業名の例では、ウェブサイトAにおいて「(株)エース」の表記であるが、ウェブサイトBにおいて「株式会社エース」という表記となっていることがあり得る。
また、住所の例では、ウェブサイトAにおいて「東京都千代田区〇丁目・・・」という表記であるが、ウェブサイトBにおいて「千代田区〇丁目・・・」という都道府県名が省略された表記になっていることがあり得る。
このような場合、自社サーバ2は、求人情報を自社データベース3に記憶する前段階で当該情報の欠落部分や表記揺れの補正、すなわち、データクレンジングを行う。その後、改めて重複ヒットしたと思われる求人情報のマッチングを行い、マッチした場合には一情報と判断して自社データベース3に記憶する。
電話番号については、「-(ハイフン)」の有無の違いや、カッコを使用するか否かの違いがある。このようなルールに則り電話番号の表記を統一する作業は正規化と呼ばれ、データクレンジングの一態様として実行される。なお、この正規化を行うと、自社サーバ2は、容易に複数の求人情報の同一性を判断することができる。
また、自社サーバ2は、取得したページ内のどの箇所をどのように抽出してデータクレンジングを行うかをデータ分類毎に指定することができる。具体的には、自社サーバ2は、電話番号、住所等のラベル(指標)に対して、個別に「抽出方法」、「正規化方法」、「検証方法」を指定することができる。
電話番号の例では、所定の文字列(指標)の直後に出現する「-(ハイフン)」で区切られた全角数字又は半角数字を抽出し、全角数字部分を半角数字に変換する。その後、数字部分のみを抜き出し、その結果が空文字列ではなく、かつ比較先(既にリストに存在する電話番号)に同じ電話番号がなければ、新規の電話番号と判断する。
電話番号(例えば、“09012341234”の11桁)の場合、3桁の数字を取り出し(“090”、“901”、“012”等)、同様の処理を行った比較先の3桁の数字と比較し、スコアを付ける。そして、一致すれば、ハイスコアを付与し、全てのスコアが規定値以下であれば、新規の番号とみなす。
これにより、ウェブサイトA~Cを検索した際に発生する、重複ヒットした求人情報をそのまま自社データベース3に記憶してしまうことを防止することができる。求人情報をリストアップしたとき求人情報に重複があると、社員Hは同じ企業に対して何度も営業活動を行うという事態が生じうるが、掲載情報検索システム1を使用することで、営業効率の向上を図ることができる。
次に、図3~図5を参照して、掲載情報検索システム1によるヒット情報の閲覧について説明する。
まず、図3に示すように、社員Hがユーザ端末7(掲載情報検索ツール)を用いて、検索条件をテキスト等で入力する。また、図4はユーザ端末7の表示画面7aを示しており、表示画面7aの上方が検索指定画面の例である。
検索指定画面では「キーワード」による検索が基本となるため、社員Hは、「製造業」、「経理」といったキーワードを入力し、キーワードのAND検索かOR検索かを選択する。また、「取得日範囲」において求人情報が掲載された日付を指定することができ、「住所検索」において求人情報の中の勤務地を指定することができる。
社員Hが「キーワード」、「取得日範囲」及び「住所検索」から検索条件を入力して、検索ボタン7bをクリックすると、自社サーバ2(図示省略)が会社Aの管理サーバ5Aにアクセスして、ウェブサイトAから検索情報に合致したヒット情報を取得する。また、ここでは図示を省略したが、自社サーバ2は、会社Bの管理サーバB、会社Cの管理サーバCにも順次アクセスする。
次に、自社サーバ2は、上述したデータクレンジングを実行した後、ヒット情報を自社データベース3に記憶する。さらに、自社データベース3に記憶されたヒット情報は、ユーザ端末7の表示画面7a下方のリスト画面に表示される。
リスト画面では、ヒット情報を「取得日」、「媒体名」、「企業名」、「住所」等の複数の項目でソート(昇順又は降順)し、表示することができる。上述したように、重複ヒットした求人情報は一情報にまとまるため、リスト画面には同じ求人情報がリストアップされることはない。また、以前求人情報を出した企業が改めて求人情報を出す場合があるが、最新情報が1つだけ表示される。
リスト画面において、社員Hは、「LINK」項目のURLをクリックして、求人情報の掲載元のウェブサイト(例えば、A社のウェブサイトA)にジャンプすることができる。また、社員Hは、「詳細表示」項目の詳細ボタン7cをクリックして、求人情報の詳細が記載された詳細ページにジャンプすることができる。なお、この詳細ページは、社員Hの会社Xで作成し、自社データベース3に記憶されている求人情報である。
詳細ページに記載された求人情報は、リスト画面に表示されている情報の他に、「E-mail」、「事業内容」、「仕事内容」、「勤務時間」、「雇用形態」、「待遇」、「給与」等がある。社員Hは、リスト画面に表示された求人情報のうち、特に興味がある求人情報について、その詳細を確認することができる。
また、社員Hは、図4の検索指定画面のエクスポートボタン7dをクリックして、自社データベース3に記憶されたヒット情報をスプレッドシートに出力することができる。図5は、ユーザ端末7の表示画面7aに表示された、又はプリンタしたスプレッドシートの例である。
スプレッドシートでは、1段目に「企業名」、「電話番号」、「LINK」等の項目を表示し、2段目以降は、今回のヒット情報が列挙される。スプレッドシートは、基本的に図4のリスト画面と同じ項目が含まれるが、出力する際に社員Hが必要な項目を選択するようにしてもよい。
スプレッドシートを出力する際、ヒット情報をソートできる点、重複情報が排除される点は、図4のリスト画面と同じである。また、スプレッドシートをユーザ端末7の表示画面7aに表示している場合には、「LINK」項目のURLから求人情報が掲載されたウェブサイトにジャンプすることもできる。
社員Hは、スプレッドシートを個人用にカスタマイズすることもできる。例えば、営業用の「連絡済」項目や、「メモ記入欄」項目を追加してもよい。これにより、社員Hは、職種や住所等で絞り込んだ連絡先に対して、電話等により効率良く営業活動を行うことができる。
上記説明は、本発明の実施形態の一部であり、これ以外にも種々な実施形態が考えられる。実施形態において示した検索対象の会社数(図1参照)やウェブサイトの構成(図2A参照)は、例示に過ぎない。ユーザ端末7は、社内のデスクトップPC、ノートPCに限られず、タブレット端末やスマートフォン等、インターネットに接続可能なモバイル機器であってもよい。
また、検索対象の情報も求人情報に限られない。例えば、検索したい情報が飲食店であった場合、ユーザは、ユーザ端末7の掲載情報検索ツールから「韓国料理」、「世田谷区」等の検索条件を指定する。これにより、自社サーバ2が飲食店を紹介する複数のウェブサイトの管理サーバにアクセスして(検索範囲は限定)、検索情報に合致したヒット情報を取得する。
さらに、自社サーバ2は、ヒット情報のデータクレンジングを行い、自社データベース3に記憶する。その後、ユーザ端末7にヒット情報を所定のソートを実行したうえ、リスト画面に表示する。これにより、ユーザは、複数のウェブサイトに都度アクセスすることなく、また、重複ヒットした情報は排除して、飲食店に関する検索結果を閲覧することができる。
また、上記実施形態では、ユーザが自社サーバ2にアクセスできるという設定であるが、ユーザは、外部の企業や人であってもよい。その場合には、外部の企業や人に対して、自社サーバ2に対する特定のアクセス権を付与し、外部の企業や人が、自社サーバ2の上記システムを利用して情報検索ができるようにすることができる。そして、自社サーバ2を有する会社は、外部の企業や人に対して上記サービスを提供することにより、利用料等を請求するビジネスを展開することができる。
1…掲載情報検索システム、2…自社サーバ、3…自社データベース、5A~5C…管理サーバ、7…ユーザ端末、7a…表示画面、7b…検索ボタン、7c…詳細ボタン、7d…エクスポートボタン。

Claims (2)

  1. ユーザが必要とする求人情報を、誰でも閲覧可能な求人情報が掲載された複数の求人情報会社のウェブサイトを検索し、収集する掲載情報検索システムであって、
    前記収集された求人情報を管理するサーバと、
    前記収集された求人情報を記憶するデータベースと、
    前記サーバにネットワーク接続され、前記ユーザが指示した検索条件に基づいて前記ユーザが必要とする求人情報の検索及び検索結果の表示を行うユーザ端末と、を備え、
    前記サーバは、
    前記ユーザが必要とする求人情報を検索する場合に、所定の巡回ルールに従って前記ウェブサイトを巡回して、それぞれの前記ウェブサイトのウェブサーバから当該求人情報に関連するカテゴリーを特定して検索範囲を限定する検索範囲限定手段と、
    前記検索範囲限定手段により限定された検索範囲で前記検索条件に合致するヒット情報を前記データベースに記憶する記憶手段と、
    前記ヒット情報を前記データベースに記憶する際、当該ヒット情報に対して表記揺れ補正を行った後、重複情報があるか否かを検査し、重複情報と判断された複数のヒット情報を1つのヒット情報に統合する情報資源検査手段と、
    を有することを特徴とする掲載情報検索システム。
  2. 前記検索範囲限定手段は、それぞれの前記ウェブサイトのうち、前記ユーザがアクセスにより生成される動的生成ページを指定可能であることを特徴とする請求項1に記載の掲載情報検索システム。
JP2018221220A 2018-11-27 2018-11-27 掲載情報検索システム Active JP7018202B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018221220A JP7018202B2 (ja) 2018-11-27 2018-11-27 掲載情報検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018221220A JP7018202B2 (ja) 2018-11-27 2018-11-27 掲載情報検索システム

Publications (2)

Publication Number Publication Date
JP2020086996A JP2020086996A (ja) 2020-06-04
JP7018202B2 true JP7018202B2 (ja) 2022-02-10

Family

ID=70908341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018221220A Active JP7018202B2 (ja) 2018-11-27 2018-11-27 掲載情報検索システム

Country Status (1)

Country Link
JP (1) JP7018202B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7372497B1 (ja) 2023-04-04 2023-10-31 日本テクノ株式会社 求人サイト募集状況一覧システム

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140423A (ja) 2000-08-25 2002-05-17 Axiom Co Ltd 求人情報処理装置、方法、プログラムおよび該プログラムを記録した記録媒体
KR20030040768A (ko) 2001-11-16 2003-05-23 모영일 인터넷상에서의 정보 관리방법
JP2003157283A (ja) 2001-09-04 2003-05-30 Burittsua:Kk 情報検索プログラム
JP2007018153A (ja) 2005-07-06 2007-01-25 Optim Corp 情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム
JP2007193591A (ja) 2006-01-19 2007-08-02 Casio Comput Co Ltd Web検索サーバ及びWeb検索方法
JP2010231253A (ja) 2009-03-25 2010-10-14 Hitachi Ltd データ名寄せ処理装置及び方法
US20110119242A1 (en) 2009-11-16 2011-05-19 Chen David Y Search engine query customization and search site rating system
JP2012523047A (ja) 2009-04-02 2012-09-27 アリババ グループ ホールディング リミテッド Ajaxウェブページコンテンツを取得する方法およびシステム
US20140236919A1 (en) 2013-02-20 2014-08-21 Microsoft Corporation Executing a fast crawl over a computer-executable application
WO2016075829A1 (ja) 2014-11-14 2016-05-19 富士通株式会社 データ取得プログラム、データ取得方法及びデータ取得装置
JP2018173769A (ja) 2017-03-31 2018-11-08 株式会社リクルートホールディングス 情報提供装置及び情報提供方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140423A (ja) 2000-08-25 2002-05-17 Axiom Co Ltd 求人情報処理装置、方法、プログラムおよび該プログラムを記録した記録媒体
JP2003157283A (ja) 2001-09-04 2003-05-30 Burittsua:Kk 情報検索プログラム
KR20030040768A (ko) 2001-11-16 2003-05-23 모영일 인터넷상에서의 정보 관리방법
JP2007018153A (ja) 2005-07-06 2007-01-25 Optim Corp 情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム
JP2007193591A (ja) 2006-01-19 2007-08-02 Casio Comput Co Ltd Web検索サーバ及びWeb検索方法
JP2010231253A (ja) 2009-03-25 2010-10-14 Hitachi Ltd データ名寄せ処理装置及び方法
JP2012523047A (ja) 2009-04-02 2012-09-27 アリババ グループ ホールディング リミテッド Ajaxウェブページコンテンツを取得する方法およびシステム
US20110119242A1 (en) 2009-11-16 2011-05-19 Chen David Y Search engine query customization and search site rating system
US20140236919A1 (en) 2013-02-20 2014-08-21 Microsoft Corporation Executing a fast crawl over a computer-executable application
WO2016075829A1 (ja) 2014-11-14 2016-05-19 富士通株式会社 データ取得プログラム、データ取得方法及びデータ取得装置
JP2018173769A (ja) 2017-03-31 2018-11-08 株式会社リクルートホールディングス 情報提供装置及び情報提供方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
藤野 真人、外3名,UCEE研究者データベースのコンセプト,情報管理,日本,独立行政法人科学技術振興機構,2007年08月01日,第50巻,第5号,p.266-279

Also Published As

Publication number Publication date
JP2020086996A (ja) 2020-06-04

Similar Documents

Publication Publication Date Title
Thelwall Introduction to webometrics: Quantitative web research for the social sciences
US7996419B2 (en) Query rewriting with entity detection
CN1858733B (zh) 信息检索系统和检索方法
US8312002B2 (en) Selection of advertisements to present on a web page or other destination based on search activities of users who selected the destination
JP4093012B2 (ja) ハイパーテキスト検査装置および方法並びにプログラム
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
CN100547593C (zh) 在web爬取过程期间给网站排优先级的系统和方法
US8099415B2 (en) Method and apparatus for assessing similarity between online job listings
JP4535765B2 (ja) コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置
US8682881B1 (en) System and method for extracting structured data from classified websites
US20130198099A1 (en) Intelligent Job Matching System and Method including Negative Filtration
JP5079845B2 (ja) コンテンツナビゲーションプログラム
US20150172299A1 (en) Indexing and retrieval of blogs
US20150287047A1 (en) Extracting Information from Chain-Store Websites
JP3803961B2 (ja) データベース生成装置、データベース生成処理方法及びデータベース生成プログラム
JP5237353B2 (ja) 検索装置、検索システム、検索方法、検索プログラム、及び検索プログラムを記憶するコンピュータ読取可能な記録媒体
US20110238653A1 (en) Parsing and indexing dynamic reports
EP2933734A1 (en) Method and system for the structural analysis of websites
US11886477B2 (en) System and method for quote-based search summaries
US9552415B2 (en) Category classification processing device and method
TW201617981A (zh) 剖析求職者的方法及系統
US20200293581A1 (en) Systems and methods for crawling web pages and parsing relevant information stored in web pages
JP7018202B2 (ja) 掲載情報検索システム
KR101556714B1 (ko) 검색결과 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
US20090112842A1 (en) Methods and apparatus for web-based research

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200630

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20200630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220124

R150 Certificate of patent or registration of utility model

Ref document number: 7018202

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150