JP2004326712A - Method for collecting job vacancy information on internet automatically and method for supplying the information - Google Patents

Method for collecting job vacancy information on internet automatically and method for supplying the information Download PDF

Info

Publication number
JP2004326712A
JP2004326712A JP2003151636A JP2003151636A JP2004326712A JP 2004326712 A JP2004326712 A JP 2004326712A JP 2003151636 A JP2003151636 A JP 2003151636A JP 2003151636 A JP2003151636 A JP 2003151636A JP 2004326712 A JP2004326712 A JP 2004326712A
Authority
JP
Japan
Prior art keywords
information
job
recruitment
recruiting
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003151636A
Other languages
Japanese (ja)
Inventor
Atsushi Matsumoto
淳 松本
Yoshisuke Toyoyama
良佑 豊山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2003151636A priority Critical patent/JP2004326712A/en
Publication of JP2004326712A publication Critical patent/JP2004326712A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To enable unitary retrieval and browsing of job vacancy information of companies, organizations, groups, a variety of corporations which are scattered on the Internet and difficult to grasp, by accumulating and arranging such a information on a database actively and automatically. <P>SOLUTION: Keywords related to the details of job vacancies and organizational outlines, or location information on the Internet where the job vacancy information is presented are registered and, by an automatic visit system with them as clues, the information on job vacancy and the organizational outlines of the companies, the organizations, the groups, a variety of corporations disclosed on the Internet is regularly collected automatically. The obtained job vacancy information in various forms is stored in a storage medium, an information form is discriminated by the system, the information is automatically arranged and regenerated into a regular unified format of a job on offer, and an effective job-on-offer database is established. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する利用分野】
この発明は、企業・機関・団体・各種法人等が運営するWebサイト上に掲載されている様々な形式の求人情報を、データとして能動的かつ自動的に収集し、かつ内容を解析し、ユーザが一元的に検索・閲覧できるように一定のフォーマットに変換した上でデータベースとして記憶する方法、およびその情報を求職者に対して供給する方法に関する。
【0002】
【従来の技術】
近年、求人・求職マーケットでは、インターネット技術の発達とユーザ層の拡大により、企業や組織から発信する求人情報を各々が運営する自社のWebサイト上に公開することが広く行われている。
【0003】
しかしながら単に自社のWebサイト上に求人情報を掲載するだけでは、多数の情報の中に埋もれてしまって求職者側がその情報まで到達できないことも多いため、求人情報に関する情報を広く世の中に告知するという目的を達成できない。
【0004】
一部の採用意欲が高く、かつ資金力のある企業は、自社の求人内容を世の中に幅広く告知するために、その情報を求人広告として専門の求人情報Webサイトもしくは求人雑誌等に広告を掲載するのが一般的である。また、求職者はそのような求人情報Webサイトもしくは求人雑誌等の媒体の情報を有力な情報源として転職活動を行うのが一般的である。
【0005】
【発明が解決しようとする課題】
しかしながら、情報を探索する側である求職者にとって、専門の求人情報Webサイトや求人情報誌等の媒体を閲覧するだけでは、その求人情報Webサイトや求人媒体に広告や記事を掲載している一部の求人企業以外の求人情報を知ることはできない。
【0006】
また、専門の求人情報Webサイトや求人情報誌等の媒体以外の求人情報を得るために、例えば一般的な検索エンジン等を用いて、求人情報を公開している個々の企業のWebサイトにひとつひとつアクセスし、求人情報の有無とその内容を個別に閲覧するという方法も、甚だ時間がかかり非常に非効率である。
【0007】
加えて、企業や組織が公開する自らのWebサイト上の求人情報には統一的なフォーマットというものがなく、各社・各組織が独自の書式や表現を使用して記述しているため、一般的な検索エンジン等では、専門の求人情報Webサイトに比べると求人を探すという行為においては検索性等に劣るため、効率が悪く労力がかかるという問題がある。
【0008】
さらに、これらWebサイト上の求人情報がいつ更新されるかということは求職者には知り得ないし、最新の求人情報を把握しておくためには常に各サイトを巡回し、その都度確認しなければならないという問題もあるため、求人情報を公開している個々の企業や組織の自らのWebサイトを有力な情報源として実際に転職活動を行うのは甚だ困難である。
【0009】
そのため、求人企業にとっては、自らが運営するWebサイト上での求人告知を求職者に対して効果的に知らしめることはできていないという問題が発生している。また一方で、求人企業が求人情報Webサイトや求人情報誌等の媒体に広告を掲載する際には、その媒体のフォーマットに合わせて自社の求人情報を加工して入稿しなければならず、手間がかかり、また掲載時期に関してはその媒体の更新・発行スケジュールに依存するため、入稿依頼から掲載まで、タイムラグが生じてしまうという問題がある。
【0010】
本発明は、以上のような問題点を解決するために、インターネット上に公開される企業や組織自らのWebサイト上で公開されている求人情報を、能動的に、迅速かつ定期的に収集し、解析し、検索可能な形にした上でデータベース化し、即時にWebサイトを通じて求職者に検索・閲覧可能な情報として供給するシステムを提供することを目的とする。
【0011】
【課題を解決するための手段】
上記目的を達成するために、本発明は、(1)求人企業の運営するWebサイト上において公開されている、求人関連情報ページの場所情報(URL)を検知するためのエンジンと、(2)前記エンジンで得られた場所情報(URL)を格納するための場所情報データベースと、(3)前記場所情報データベースの情報に基づき、一定期間毎(例えば、24時間毎)に前記求人関連情報ページの場所を自動的に巡回し、主にHTMLなどのマークアップ言語で記述された、前記求人関連情報ページの記述情報を受信する機能と、(4)取得した前記求人関連情報の記述情報に対して、自動的に形態素解析を行い、本システムで定義する求人案件構成項目毎に整理された求人案件情報を抽出する機能と、(5)前記求人案件構成項目毎に整理された求人案件情報を記憶するための求人情報データベースと、(6)前記求人情報データベースに格納された、前記整理された求人案件情報を、求職者がWebページ上で検索・閲覧できるインターフェースを提供する機能を備える。
【0012】
前記(1)の求人関連情報ページの場所情報(URL)を検知するための検索エンジンについては、求人案件に特徴的に使用される文章および単語を独自にデータベース化した辞書と、企業Webサイトの情報内で、求人関連情報が掲載されるページが一般的にどのような方法で、どのような配置をされるかという各種パターンを記録したデータベースを参照した上で、それを手かがりとして自動検索を行うことを特徴とする。
【0013】
前記(2)の場所情報(URL)データベースについては、新規に場所情報データが追加された際のアップデートはもちろんのこと、場所情報(URL)の変更、削除があった際には一定期間毎に最新の情報に更新する機能を有する。
【0014】
但し、前記(2)の場所情報(URL)データベースを構築する際には、前記(1)の求人関連情報ページの場所情報(URL)を検知するための検索エンジンを使用する以外にも、システム運営者が自らの判断に基づいて情報の更新を行う、あるいは求人企業からの依頼に基づいて情報の更新を行う、あるいは求職者からの依頼に基づいて情報の更新を行うという手段を併用しても構わない。
【0015】
前記(3)の求人関連情報ページの記述情報を取得する機能については、企業毎、情報毎に巡回する回数や頻度の設定を変えることが可能で、個別の状況や事情に応じて対応できることを特徴とする。また、当該求人関連情報ページ内からのリンク先に対してもアクセスを行い、アクセスしたページが求人関連情報ページであり、かつ場所情報が(URL)が(2)の場所情報データベースに格納されていなければ、場所情報をさらに場所情報データベースに登録する処理を行う。
【0016】
また、前記(4)の求人関連情報の記述情報に対して形態素解析を行うにあたっては、主な記述言語であるHTMLなどのマークアップ言語の仕様、および求人の表現に使用される各種のフォーマットや表現形式に基づいて日本語文章を抽出した上で、例えば募集部門、募集背景、募集職種、募集人数、職務概要、必要要件、必要資格、待遇、休日休暇条件、給与、福利厚生、勤務地、対象年齢、その他備考などの求人案件構成要素に相当する文章および単語を、各求人案件構成要素毎に、自動的に抽出することを特徴とする。
【0017】
また、前記(4)の求人関連情報の記述情報に対して形態素解析を行うにあたっては、求人関連用語およびそれらが実際に利用される場面情報が格納された、求人関連用語辞書データベースを備える。
【0018】
また、前記(5)の求人案件構成項目毎に整理された求人案件情報を格納するための求人情報データベースについては、各企業が個別に表現している職種名称や業務内容に関する様々な記述が統一的な表現に整理された上でデータとして格納され、例として内容更新日時、募集部門、募集背景、募集職種、募集人数、職務概要、必要要件、必要資格、待遇、休日休暇条件、給与、福利厚生、勤務地、対象年齢、その他備考といった各項目が、同一のフォーマット上にデータとして保存されていることを特徴とする。
【0019】
また、前記(6)の求職者がWebページ上で検索・閲覧できるインターフェースを提供する機能については、数多くの求人案件を保有するという特徴を生かしたテキスト全文検索機能や、前記(5)により統一的な表現に整理された職種名称での求人情報検索機能、また、自動で企業Webサイト上の情報を収集するデータベースであるという特徴を生かした、求人案件更新日時順の検索、求人内容情報更新時の電子メールなどによるお知らせ機能等を備える。
【0020】
【発明の実施の形態】1−1:概略構成説明 図1の説明
以下、本発明における実施の形態について、図面を参照して説明する。図1は、本発明の実施形態の全体概略図である。符号1は本発明に関るシステムを含むサーバであり、制御装置、電話回線等を通じてインターネット99に接続されている。符号101、102..は各求人企業が運営するホームページ1011、1021およびそのコンテンツとして求人関連情報ページ10111、10211を含むサーバであり、サーバ1と同様にインターネット99に接続されている。符号201、202..は求職者が利用する各種の利用者端末であり、サーバ1と同様にインターネット99に接続されている。
【0021】1−2:システム構成説明 図2の説明
図2は、サーバ1の構成図である。収集手段11は、求人関連情報ページ10111、10211の収集を行うための手段であり、プログラム等から構成される。この動作については後述する。解析手段12は、収集手段11により取得されたデータを解析するための手段であり、プログラム等から構成される。この動作については後述する。場所情報データベース21は、収集手段11が実行される際に参照される、場所情報が記憶されたデータベースである。企業毎に、企業名、企業ホームページ1011、1021の場所(URL)、求人関連情報ページ10111、10211の場所(URL)等が記憶されている。求人用語情報データベース22は、解析手段12が実行される際に参照される、求人関連求人用語情報が記憶されたデータベースである。用語名、品詞名、解析手段12に対する指示情報等が記憶されている。求人情報データベース23は、解析手段12により解析された情報を記憶する求人情報データベースである。求人案件毎に、内容更新日時、募集部門、募集背景、募集職種、募集人数、職務概要、必要要件、必要資格、待遇、休日休暇条件、給与、福利厚生、勤務地、対象年齢、その他備考の情報から構成される。検索インターフェース31は、求職者端末201、202によりアクセス、操作が行われるWebサイトである。求人情報データベース23の情報を、端末操作者が検索可能なインターフェースを持つ。この動作については後述する。
【0022】2−1:動作説明導入部
次に、本システムの動作形態について説明する。まず、企業Webサイト1011、1021の情報を取得・解析する場合を説明する。
【0023】2−1−1:収集部
まず、場所情報(URL)データベース21は、システム運営者が自らの判断に基づいて場所情報の更新を行う、あるいは後述する収集手段11の動作過程で本システム自らが情報の場所更新を行う、あるいは求人企業からの依頼に基づいて場所情報の更新を行う、あるいは求職者からの依頼に基づいて場所情報の更新を行う事ができるものとする。
【0024】
収集手段11は、あらかじめ設定された一定期間毎(例えば、24時間毎)に、場所情報(URL)データベース21を参照し、そこに記憶されている場所情報(URL)に対して順次アクセスを行い、ページ内情報の受信を行う。例えば、企業ホームページ1011、1021内の求人関連情報ページ10111、10211にアクセスを行い、正常にアクセスできれば、主にHTMLなどのマークアップ言語で記述された、ページの記述情報を受信し、一旦サーバ1上のメモリに記憶する。
【0025】
なお、収集手段11は、求人関連情報ページ10111、10211内からのリンク先に対してもアクセスを行い、アクセスしたページが求人関連情報ページであり、かつ場所情報が(URL)が場所情報データベース21に記憶されていなければ、ページの記述情報を受信し、一旦サーバ1上のメモリに記憶するとともに、場所情報を場所情報データベース21に登録する処理を行う。
【0026】2−1−2:解析部
次に、解析手段12は、収集手段11により取得したページの記述情報に対して、HTMLなどのマークアップ言語の仕様に基づいた解析を行う。この解析は、通常一般的なWWWブラウザが行うものと同様のものであり、これによりマークアップ言語と文章が入り混じったページの記述情報から、文章およびそのレイアウト情報を抽出する。
さらに、解析手段12は、抽出した文章を求人用語情報データベース22を参照しながら、意味のあるまとまり単位に切り分け、さらに文章のまとまり毎に、意味情報を付け加える。例えば、「募集職種名:システムエンジニア」という文章のまとまりは、「募集職種名」「:」「システムエンジニア」に分解され、意味情報としてそれぞれ「募集職種名を表す項目名」「記号」「職種名」といったように解される。そうして得られた文章のまとまり毎の意味情報およびそれらのレイアウト情報から、求人案件の表記パターンを検出する。
このようにして得られた表記パターンに従って募集職種名、職務内容、必要要件、勤務地、対象年齢などの、求人案件構成要素毎の情報を抽出する。求人案件が取得したページ上に複数存在する場合は、全ての求人情報を抽出するまで、繰り返しこの処理が行われる。こうして得られた求人案件構成要素毎に切り分けられた個々の求人情報は、求人企業名を付加した上で求人情報データベース23へ記憶される。
【0027】
このように収集手段と解析手段をあらかじめ設定された一定期間毎(例えば、24時間毎)に、場所情報データベース21に記憶されている全ての企業ホームページに対して行う結果、求人情報データベース23には、常に各企業がホームページ上で公開している最新の求人情報が、求人案件構成要素毎に整理されて記憶されていることになる。
【0028】
求職者は、求人情報データベース23に記憶されている情報に、インターネットを通じてアクセスし、WWWブラウザや専用のアプリケーションを通じて検索・閲覧を行うものとする。
【0029】
【発明の効果】
本各発明に係る求人情報自動収集データベースシステムによれば、インターネット上に散在している企業・機関・団体・各種法人等の求人情報を能動的かつ自動的にデータベース上に蓄積・整理し、それらの情報の一元的な検索・閲覧を可能にするシステムを得ることができる。
【0030】
求人側から見れば、このシステムによりコストや時間をかけることなく自社の求人情報を世の中に流通されることが可能となり、求職者側から見れば、今まではインターネット上に散在していたために把握が困難であった求人情報を、このシステムを利用することによって一元的に把握・管理できるようになるため、求職活動のための情報収集に格段の利便性をもたらすものとなる。
【図面の簡単な説明】
【図1】実施形態の全体概略図である。
【図2】図1のサーバ1の構成図である。
[0001]
FIELD OF THE INVENTION
The present invention actively and automatically collects various types of recruiting information posted on websites operated by companies, organizations, organizations, various corporations, etc. as data, analyzes the contents, and analyzes the contents. The present invention relates to a method of converting the information into a certain format so that it can be searched and browsed in a unified manner and storing it as a database, and a method of supplying the information to job seekers.
[0002]
[Prior art]
2. Description of the Related Art In recent years, in the recruitment and job search market, with the development of Internet technology and the expansion of user classes, it has been widely performed to publish recruitment information transmitted from companies and organizations on their own websites operated by each company.
[0003]
However, simply posting job information on the company's Web site is often buried in a lot of information and job seekers cannot reach that information, so the information about job information is widely disclosed to the world. You cannot achieve your goal.
[0004]
Some highly motivated and well-financed companies post their information as recruitment advertisements on specialized recruitment information websites or recruitment magazines, etc., in order to widely announce their recruiting content to the world. It is common. In addition, job seekers generally perform job change activities using such media information as a job information website or a job magazine.
[0005]
[Problems to be solved by the invention]
However, for a job seeker who seeks information, merely browsing a medium such as a specialized job information website or a job information magazine may cause advertisements or articles to be posted on the job information website or job information medium. It is not possible to know job information other than the recruiting company of the department.
[0006]
In addition, in order to obtain recruiting information other than the media such as a specialized recruiting information Web site and a recruiting information magazine, for example, using a general search engine or the like, individual recruiting information is disclosed to individual company Web sites. The method of accessing and individually browsing the presence / absence of job information and its contents is also extremely time-consuming and very inefficient.
[0007]
In addition, there is no uniform format for recruiting information on their own websites published by companies and organizations, and each company / organization uses its own format and expression to describe it. In a search engine or the like, there is a problem in that the search for a job is inferior in searching for a job as compared with a specialized job information Web site, so that the efficiency is low and labor is required.
[0008]
Furthermore, job seekers do not know when job information on these websites will be updated. To keep up to date with the latest job information, they must visit each site and check each time. There is also a problem that it is necessary to actually perform job change activities using each company or organization's own website that discloses job postings as a powerful information source.
[0009]
For this reason, a problem has arisen that a recruiting company has not been able to effectively notify job seekers of a notice of recruitment on a Web site operated by the recruiting company. On the other hand, when a recruiting company publishes an advertisement on a medium such as a recruiting information Web site or a recruiting information magazine, it must process and submit its own recruiting information according to the format of the medium. Since it takes time and depends on the update / issuance schedule of the medium, there is a problem that a time lag occurs from the submission request to the publication.
[0010]
SUMMARY OF THE INVENTION In order to solve the above problems, the present invention actively, promptly and regularly collects recruitment information published on a company or organization's own website published on the Internet. It is an object of the present invention to provide a system for analyzing, making a database in a searchable form, and immediately supplying the information to a job seeker as searchable / browsable information through a Web site.
[0011]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides (1) an engine for detecting location information (URL) of a recruitment-related information page, which is published on a website operated by a recruiting company, and (2) A location information database for storing location information (URL) obtained by the engine; and (3) the recruitment-related information page at regular intervals (for example, every 24 hours) based on the information in the location information database. A function of automatically patrol a place and receiving description information of the job-related information page mainly described in a markup language such as HTML; and (4) a function of receiving the description information of the obtained job-related information. A function that automatically performs morphological analysis and extracts job offer case information arranged for each job offer item defined by the present system; and (5) a function for organizing each job offer item. And (6) an interface that allows a job seeker to search and browse on the Web page the organized job information stored in the job information database. Has functions.
[0012]
The search engine for detecting the location information (URL) of the recruitment-related information page of (1) above includes a dictionary in which sentences and words characteristically used in recruitment cases are made into a database, and a corporate Web site. Within the information, refer to a database that records various patterns of how and where the pages where job-related information is posted are generally arranged, and then use them as clues to automatically search Is performed.
[0013]
The location information (URL) database of (2) is not only updated when new location information data is added, but also when the location information (URL) is changed or deleted at regular intervals. It has a function to update to the latest information.
[0014]
However, when the location information (URL) database of (2) is constructed, the search engine for detecting the location information (URL) of the job-related information page of (1) is used in addition to the system. Operators update information based on their own judgment, update information based on a request from a recruiting company, or update information based on a request from a job seeker No problem.
[0015]
Regarding the function (3) of acquiring the description information of the job-related information page, it is possible to change the setting of the number of visits and the frequency for each company and each information, and to be able to cope with individual situations and circumstances. Features. In addition, access is made to the link destination from within the job-related information page, and the accessed page is the job-related information page, and the location information is stored in the location information database whose (URL) is (2). If not, a process of further registering the location information in the location information database is performed.
[0016]
In performing the morphological analysis on the description information of the job-related information in the above (4), specifications of a markup language such as HTML, which is a main description language, and various formats used for expression of the job, After extracting Japanese sentences based on the expression form, for example, recruitment department, recruitment background, recruitment occupation, recruitment number, job outline, necessary requirements, qualifications, treatment, holiday leave conditions, salary, benefits, work location, It is characterized in that sentences and words corresponding to recruitment case components such as target age and other remarks are automatically extracted for each recruitment case component.
[0017]
In performing the morphological analysis on the description information of the job-related information in the above (4), a job-related term dictionary database storing job-related terms and scene information in which they are actually used is provided.
[0018]
In the recruiting information database for storing the recruiting case information arranged for each recruiting case configuration item in the above (5), various descriptions about job titles and business contents expressed individually by each company are unified. It is stored as data after being arranged in a typical expression, for example, content update date, recruitment department, recruitment background, recruitment occupation, number of recruitment, job outline, necessary requirements, necessary qualification, treatment, holiday leave conditions, salary, well-being Each item such as welfare, work location, target age, and other remarks is stored as data in the same format.
[0019]
The function of (6) for providing an interface that allows job seekers to search and browse on a Web page is a full-text search function utilizing the characteristic of having a large number of job offers, and the function of (5) is unified. Recruitment information search function based on job titles organized in a typical expression, and a database that automatically collects information on corporate Web sites. It has a notification function by e-mail and the like at the time.
[0020]
BEST MODE FOR CARRYING OUT THE INVENTION 1-1: Description of Schematic Structure Description of FIG. 1 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is an overall schematic diagram of an embodiment of the present invention. Reference numeral 1 denotes a server including a system according to the present invention, which is connected to the Internet 99 through a control device, a telephone line, and the like. Reference numerals 101, 102. . Is a server including homepages 1011 and 1021 operated by each recruiting company and recruitment-related information pages 10111 and 10211 as its contents, and is connected to the Internet 99 in the same manner as the server 1. Reference numerals 201, 202. . Are various user terminals used by job seekers, and are connected to the Internet 99 in the same manner as the server 1.
1-2: Description of System Configuration Description of FIG. 2 FIG. 2 is a configuration diagram of the server 1. The collection unit 11 is a unit for collecting the job-related information pages 10111 and 10211, and includes a program and the like. This operation will be described later. The analysis unit 12 is a unit for analyzing the data acquired by the collection unit 11, and includes a program and the like. This operation will be described later. The location information database 21 is a database that stores location information that is referred to when the collection unit 11 is executed. For each company, the company name, the location (URL) of the company home pages 1011 and 1021, the location (URL) of the job-related information pages 10111 and 10211, and the like are stored. The recruiting term information database 22 is a database that stores recruiting-related recruiting term information that is referred to when the analysis unit 12 is executed. A term name, a part of speech name, instruction information for the analysis unit 12, and the like are stored. The job information database 23 is a job information database that stores information analyzed by the analysis unit 12. For each recruiting case, the content update date, recruitment department, recruitment background, recruitment occupation, recruitment type, recruitment number, job outline, necessary requirements, required qualification, treatment, holiday leave conditions, salary, benefits, work location, target age, other remarks Consists of information. The search interface 31 is a Web site accessed and operated by the job seeker terminals 201 and 202. It has an interface that allows a terminal operator to search for information in the job information database 23. This operation will be described later.
2-1: Operation Explanation Introduction Section Next, an operation mode of the present system will be described. First, a case of acquiring and analyzing information on the company Web sites 1011 and 1021 will be described.
2-1-1: Collection Section First, the location information (URL) database 21 updates the location information based on its own judgment by the system operator, or the location information (URL) database 21 operates in the course of operation of the collection means 11 described later. It is assumed that the system itself can update the location of the information, update the location information based on a request from a recruiting company, or update the location information based on a request from a job seeker.
[0024]
The collection unit 11 refers to the location information (URL) database 21 at predetermined time intervals (for example, every 24 hours) and sequentially accesses the location information (URL) stored therein. , Receiving the in-page information. For example, access is made to the job-related information pages 10111 and 10211 in the company homepages 1011 and 1021, and if it can be accessed normally, the description information of the page mainly described in a markup language such as HTML is received, and once the server 1 Store it in the memory above.
[0025]
The collecting unit 11 also accesses the link destinations in the job-related information pages 10111 and 10211, the accessed page is the job-related information page, and the location information (URL) is the location information database 21. If it is not stored in the server 1, the description information of the page is received and temporarily stored in the memory of the server 1, and the process of registering the location information in the location information database 21 is performed.
2-1-2: Analyzing Unit Next, the analyzing unit 12 analyzes the description information of the page acquired by the collecting unit 11 based on the specification of a markup language such as HTML. This analysis is the same as that performed by a general WWW browser, and thereby extracts a sentence and its layout information from description information of a page in which a markup language and a sentence are mixed.
Further, the analysis unit 12 divides the extracted text into meaningful units while referring to the recruiting term information database 22, and adds semantic information to each sentence. For example, a group of sentences “recruiting job title: system engineer” is decomposed into “recruiting job title”, “:”, and “system engineer”. Name ". The notation pattern of the job offer is detected from the thus obtained semantic information for each unit of the sentence and their layout information.
According to the notation pattern obtained in this way, information for each recruiting case component, such as the job title, job contents, necessary requirements, work location, and target age, is extracted. If there are a plurality of requisitions on the acquired page, this process is repeated until all requisition information is extracted. The individual recruiting information obtained in this way for each recruiting case component is stored in the recruiting information database 23 after adding the recruiting company name.
[0027]
As described above, the collecting means and the analyzing means are performed on all the company homepages stored in the location information database 21 every predetermined period (for example, every 24 hours). In other words, the latest recruiting information that each company always discloses on the homepage is organized and stored for each recruiting case component.
[0028]
It is assumed that the job seeker accesses information stored in the job information database 23 through the Internet and searches and browses through a WWW browser or a dedicated application.
[0029]
【The invention's effect】
According to the recruitment information automatic collection database system according to the present invention, recruitment information of companies, institutions, organizations, various corporations, etc. scattered on the Internet is actively and automatically stored and organized in the database. And a system that enables unified search and browsing of the information.
[0030]
From a job-seeker's perspective, this system makes it possible for the company's recruitment information to be distributed to the world without cost and time, and from a job-seeker's point of view, it has been scattered on the Internet. By using this system, job information that was difficult to find can be centrally grasped and managed, which brings much more convenience to information gathering for job hunting activities.
[Brief description of the drawings]
FIG. 1 is an overall schematic diagram of an embodiment.
FIG. 2 is a configuration diagram of a server 1 of FIG.

Claims (4)

ネットワークを介して他のWebサーバからウェブコンテンツを受信する通信手段と、受信したWebコンテンツ中の求人情報を選択する選択手段と、選択された求人情報をデータベースとして記憶する記憶手段とを備える求人情報収集システムであり、当該記憶手段には求人情報に使用される文字列が予め記憶されており、当該選択手段は、当該文字列に基づいてWebコンテンツ中の求人情報を選択する求人情報収集システム。Recruitment information comprising communication means for receiving web content from another web server via a network, selection means for selecting job information in the received web content, and storage means for storing the selected job information as a database A recruiting information collecting system, wherein a character string used for recruiting information is stored in the storage means in advance, and the selecting means selects recruiting information in Web content based on the character string. 前記選択手段は、Webコンテンツ中の求人情報をその分類ごとに選択する請求項1に記載の求人情報収集システム。The recruitment information collection system according to claim 1, wherein the selection unit selects recruitment information in Web content for each classification. 前記求人情報の分類は、少なくとも「職種名」「職務内容」「必要要件」「勤務地」「年齢」「待遇」のいずれかを含む請求項1又は2に記載の求人情報収集システム。3. The recruitment information collection system according to claim 1, wherein the classification of the recruitment information includes at least one of "occupation type name", "job description", "necessary requirements", "work place", "age", and "treatment". 前記通信手段は、データベースとして記憶された求人情報をネットワークを介して他のクライアント端末に送信する請求項1〜3のいずれかに記載の求人情報収集システム。The recruitment information collection system according to any one of claims 1 to 3, wherein the communication unit transmits the recruitment information stored as a database to another client terminal via a network.
JP2003151636A 2003-04-23 2003-04-23 Method for collecting job vacancy information on internet automatically and method for supplying the information Pending JP2004326712A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003151636A JP2004326712A (en) 2003-04-23 2003-04-23 Method for collecting job vacancy information on internet automatically and method for supplying the information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003151636A JP2004326712A (en) 2003-04-23 2003-04-23 Method for collecting job vacancy information on internet automatically and method for supplying the information

Publications (1)

Publication Number Publication Date
JP2004326712A true JP2004326712A (en) 2004-11-18

Family

ID=33508221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003151636A Pending JP2004326712A (en) 2003-04-23 2003-04-23 Method for collecting job vacancy information on internet automatically and method for supplying the information

Country Status (1)

Country Link
JP (1) JP2004326712A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007122203A (en) * 2005-10-26 2007-05-17 Life & Business Weather Inc Information retrieval system
JP2008537811A (en) * 2005-03-11 2008-09-25 ヤフー! インコーポレイテッド System and method for managing listings
JP2009511991A (en) * 2005-10-12 2009-03-19 グーグル インク. Prioritizing entity display in distributed geographic information systems
JP6308604B1 (en) * 2017-12-11 2018-04-11 株式会社フューチャート Applicant management device, applicant management system, applicant management method and applicant management program
JP2020064516A (en) * 2018-10-18 2020-04-23 ヤフー株式会社 Information processing device, information processing method, and information processing program

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008537811A (en) * 2005-03-11 2008-09-25 ヤフー! インコーポレイテッド System and method for managing listings
US9785648B2 (en) 2005-10-12 2017-10-10 Google Inc. Entity display priority in a distributed geographic information system
JP2009511991A (en) * 2005-10-12 2009-03-19 グーグル インク. Prioritizing entity display in distributed geographic information systems
US8290942B2 (en) 2005-10-12 2012-10-16 Google Inc. Entity display priority in a distributed geographic information system
US8965884B2 (en) 2005-10-12 2015-02-24 Google Inc. Entity display priority in a distributed geographic information system
US9715530B2 (en) 2005-10-12 2017-07-25 Google Inc. Entity display priority in a distributed geographic information system
US9870409B2 (en) 2005-10-12 2018-01-16 Google Llc Entity display priority in a distributed geographic information system
US10592537B2 (en) 2005-10-12 2020-03-17 Google Llc Entity display priority in a distributed geographic information system
US11288292B2 (en) 2005-10-12 2022-03-29 Google Llc Entity display priority in a distributed geographic information system
JP2007122203A (en) * 2005-10-26 2007-05-17 Life & Business Weather Inc Information retrieval system
JP6308604B1 (en) * 2017-12-11 2018-04-11 株式会社フューチャート Applicant management device, applicant management system, applicant management method and applicant management program
JP2019105928A (en) * 2017-12-11 2019-06-27 株式会社フューチャート Applicant management device, applicant management system, applicant management method, and applicant management program
JP2020064516A (en) * 2018-10-18 2020-04-23 ヤフー株式会社 Information processing device, information processing method, and information processing program

Similar Documents

Publication Publication Date Title
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US6694307B2 (en) System for collecting specific information from several sources of unstructured digitized data
CN1988536B (en) System and method for managing web content
CN1858733B (en) Information searching system and searching method
KR101527259B1 (en) Providing posts to discussion threads in response to a search query
US6182067B1 (en) Methods and systems for knowledge management
CN102566945B (en) Method and system for realizing automatic acquisition and on-demand printing of book
JP3896014B2 (en) Information collection system, information collection method, and program causing computer to collect information
US9971828B2 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
CN103745006B (en) Internet information searching system and internet information searching method
Gupta et al. A review on search engine optimization: Basics
CN102214183A (en) Search engine query method for combining feedback contents of pages with fixed ranking
KR100671077B1 (en) Server, Method and System for Providing Information Search Service by Using Sheaf of Pages
JP2006099341A (en) Update history generation device and program
CN102231152A (en) Searching method for precisely inquiring based on IP (Internet Protocol) address of mobile terminal
EP2561452A1 (en) Semantically ranking content in a website
JP2004326712A (en) Method for collecting job vacancy information on internet automatically and method for supplying the information
US8065265B2 (en) Methods and apparatus for web-based research
Deb et al. Setting up an electronic library: the case of TERI
WO2002037320A1 (en) Browsing method and apparatus
CN101840401A (en) Dictionary assistance searching system and method thereof
KR101575802B1 (en) A automatic recording system for information about operations of searching and reading patent documents and the method thereof
US20060143196A1 (en) Information generating apparatus and information generating method
JP2965018B2 (en) Search information display method and search information display device in hypermedia system
Heery et al. Metadata