JP5537124B2 - Attribute analysis method, program and system by first name and last name - Google Patents

Attribute analysis method, program and system by first name and last name Download PDF

Info

Publication number
JP5537124B2
JP5537124B2 JP2009254980A JP2009254980A JP5537124B2 JP 5537124 B2 JP5537124 B2 JP 5537124B2 JP 2009254980 A JP2009254980 A JP 2009254980A JP 2009254980 A JP2009254980 A JP 2009254980A JP 5537124 B2 JP5537124 B2 JP 5537124B2
Authority
JP
Japan
Prior art keywords
name
data
information
last
nominal data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009254980A
Other languages
Japanese (ja)
Other versions
JP2011100332A (en
Inventor
彰展 福村
耕太郎 増田
Original Assignee
株式会社ミクシィ・リクルートメント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ミクシィ・リクルートメント filed Critical 株式会社ミクシィ・リクルートメント
Priority to JP2009254980A priority Critical patent/JP5537124B2/en
Publication of JP2011100332A publication Critical patent/JP2011100332A/en
Application granted granted Critical
Publication of JP5537124B2 publication Critical patent/JP5537124B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、入力された姓名を解析対象としてその属性を解析する方法、プログラム及びシステムに関する。   The present invention relates to a method, a program, and a system for analyzing an attribute of an inputted first and last name as an analysis target.

インターネット上提供されるサービスにおいて、有料/無料を問わず会員制のサービスが多数存在する。通常こうした会員制のサービスにおいてサービスの提供を受けるに際しては、あらかじめ会員登録を行う必要がある。会員登録にあたっては、例えば図12に示すように、氏名、性別、住所、電話番号、メールアドレスなどの情報の入力を促す画面が表示される。登録を希望する者はこれらの情報を適宜入力し、登録会員のためのサービスの提供を受けることができる。   There are many membership-based services available on the Internet, whether paid or free. Normally, membership registration is required in order to receive the service provided by such a membership system service. When registering a member, for example, as shown in FIG. 12, a screen prompting input of information such as name, gender, address, telephone number, and mail address is displayed. Those who wish to register can input such information as appropriate and receive services for registered members.

いわゆる求人情報サイトにおいては、自らが有している職務上のスキルや職歴・学歴等を登録しておくことにより、求人案件とのマッチング頻度が高まる可能性がある。   In the so-called job information site, by registering his / her professional skills, work history, educational background, etc., there is a possibility that the frequency of matching with job offers will increase.

一方で、例えば上述の求人情報サイトにおいては、登録することによって自らの求職活動に不利となる情報については、入力が任意な項目であれば、必ずしも積極的には入力がなされない。また職業安定法(昭和22年11月30日法律第141号)の要請からも、採否可否決定目的で収集することを禁止されている項目(例えば、親の職業、家族構成、本籍など)について必須の入力事項として設定することはできない。   On the other hand, for example, in the above-described job information site, information that is disadvantageous for job hunting activities by registering is not necessarily positively input if it is an optional item. In addition, items that are prohibited from being collected for the purpose of deciding whether or not to accept (for example, parental occupation, family composition, permanent affiliation, etc.) from the request of the Employment Stabilization Law (Law No. 141, November 30, 1947) It cannot be set as a mandatory input item.

求人企業としては、選考過程の省力化の観点から、求職情報サイトの会員登録の段階、或いはその後の追加的なプロフィール登録の段階で入力される項目以外の属性によって一次的な選考(フィルタリング)を行いたいというニーズがある。こうした属性の中には、必須入力事項である氏名から一定程度把握が可能なものもある。   As a recruiting company, from the viewpoint of labor saving in the selection process, primary selection (filtering) is performed according to attributes other than the items entered at the member registration stage of the job search information site or at the subsequent additional profile registration stage. There is a need to do it. Some of these attributes can be grasped to some extent from the name that is an essential input item.

入力された名義を解析する手法として、個人/法人の判断を高速に行うことができる名義解析手法として、姓単語と、その読みと、その種別と、頻度とからなる姓データを記憶した姓辞書記憶手段から入力された名義データと単語もしくは読みの一部が前方一致するものを一度にすべて検索し、一致するものが存在した場合に、その種別によって、入力された名義データが姓か、それ以外かを判定する解析方法が開示されている(例えば、特許文献1)。また光学的文字読取装置(OCR)を用いて姓名を認識する場合に使用される文字認識処理装置として、姓と名との区切りを正しく認識するために、文字の数に応じて姓名特有の仕切りを設定して前半太後半部とに2分割する分割処理部と、前半部を姓辞書と比較照合し、後半部を名辞書と比較照合して姓と名とを認識する姓名認識部と、認識不能な場合に前記分割処理の仕切りの変更を行う認識制御部とを備えた文字認識処理装置が開示されている(例えば、特許文献2)。   A surname dictionary that stores surname data consisting of surname words, their readings, their types, and frequencies Search all the names that match the name data input from the storage means and the word or part of the reading at the same time, and if there is a match, the name data input is either the last name or An analysis method for determining whether other than the above is disclosed (for example, Patent Document 1). In addition, as a character recognition processing device used when recognizing first and last names using an optical character reader (OCR), a partition unique to the first and last names according to the number of characters in order to correctly recognize the separation between first and last names A split processing unit that divides the first half into the latter half of the first half, and a first and last name recognition unit that compares the first half with the last name dictionary and compares the second half with the first name dictionary and recognizes the first name and last name, A character recognition processing device is disclosed that includes a recognition control unit that changes a partition of the division processing when recognition is impossible (for example, Patent Document 2).

特開2004−318699号公報JP 2004-318699 A 特許第2892376号公報Japanese Patent No. 2892376

しかし、特許文献1においては、解析可能なのはその名義が法人/個人のいずれであるかであり、個人名義の属性についてその入力された姓名から解析することはできない。また特許文献2においては、どこまでが姓でどこまでが名であるかの区切りを、当初の分割処理によっては認識できなかった場合にあっても再度認識処理をする制御が示されているのみであり、やはり姓名からこれに一定程度関連付けて認識することが可能な属性について解析することはできない。   However, in Patent Document 1, what can be analyzed is whether the name is a corporation or an individual, and the attribute of the personal name cannot be analyzed from the inputted first and last names. Further, Patent Document 2 only shows a control for performing recognition processing again even when the separation of how far is a last name and where is a first name cannot be recognized by the original division processing. Also, it is impossible to analyze an attribute that can be recognized by associating it with a certain level from the first and last names.

本発明は、上記事情に鑑みてなされたものであり、入力された姓名から、これと関連性を有する属性を解析する方法、プログラム及び解析システムを提供することにある。   The present invention has been made in view of the above circumstances, and it is an object of the present invention to provide a method, a program, and an analysis system for analyzing an attribute having an association with a first name and last name inputted.

請求項1に記載の属性解析方法は、外部からの操作に基づき、名義データの入力を受け付けるステップと、苗字と苗字属性情報とを少なくとも有する苗字データを記憶した苗字辞書記憶手段から、入力された名義データと前方一致する前記苗字データを検索する第一の検索ステップと、名前と名前属性情報とを少なくとも有する名前データを記憶した名前辞書記憶手段から、入力された名義データと後方一致する前記名前データを検索する第二の検索ステップと、前記第一の検索ステップ及び前記第二の検索ステップのいずれにおいても一致する苗字データ又は名前データが存在しなかった場合に、(a)前記名義データが全てカタカナ、(b)前記名義データが全てひらがな、(c)前記名義データが所定文字数以下、(d)前記名義データの中にカタカナが所定文字数以上含まれる、(e)前記名義データの中に英数字が含まれる、のいずれかの特殊情報に該当しないかを判別するステップとを有することを特徴としている(請求項1)。   The attribute analysis method according to claim 1 is inputted from a step of accepting input of nominal data based on an external operation, and a last name dictionary storage unit storing last name data having at least last name and last name attribute information. The first search step for searching for the last name data that matches forward with the nominal data, and the name that stores the name data having at least the name and the name attribute information, and the name that matches backward with the input nominal data When there is no matching surname data or name data in any of the second search step for searching for data and the first search step and the second search step, (a) the nominal data is (B) all the nominal data is hiragana, (c) the nominal data is a predetermined number of characters or less, (d) the nominal data. And (e) determining whether it falls under any of special information that contains alphanumeric characters in the nominal data (claims). Item 1).

なお第二の検索ステップ以降のステップは、第一の検索ステップにおいて前方一致する苗字データが検索されなかった場合にのみ行ない、また(a)ないし(e)のいずれかに該当しないかを判別するステップは、第二の検索ステップにおいて後方一致する名前データが検索されなかった場合にのみ行なうように構成することができる(請求項2)。 The steps after the second search step are performed only when the last matching first surname data is not searched in the first search step, and it is determined whether it does not correspond to any of (a) to (e). The step can be configured to be performed only when name data that matches backward in the second search step is not searched.

また、これらの属性解析方法をコンピュータに実行させるプログラムとして構成することもできる(請求項3)。 Moreover, it can also comprise as a program which makes a computer perform these attribute analysis methods (Claim 3).

また請求項4に記載の属性解析システムは、入力された名義データから当該名義データの属性を解析する属性解析システムであって、苗字と苗字属性情報とを少なくとも有する苗字データが記録されている苗字辞書記憶手段と、名前と名前属性情報とを少なくとも有する名前データが記録されている名前辞書記憶手段と、名義データを入力する手段と、前記苗字辞書記憶手段に記録されている苗字データから、前記入力された名義データと前方一致する苗字データを検索する第一の処理手段と、前記名前辞書記憶手段に記録されている名前データから、前記入力された名義データと後方一致する名前データを検索する第二の処理手段と、(a)前記名義データが全てカタカナ、(b)前記名義データが全てひらがな、(c)前記名義データが所定文字数以下、(d)前記名義データの中にカタカナが所定文字数以上含まれる、(e)前記名義データの中に英数字が含まれる、のいずれかの特殊情報に該当しないかを判別する第三の処理手段と、前記第一の処理手段、前記第二の処理手段及び前記第三の処理手段の処理結果に基づいて前記入力された名義データの属性を判定する判定手段とを有することを特徴としている(請求項4)。 The attribute analysis system according to claim 4 is an attribute analysis system for analyzing an attribute of nominal data from input nominal data, wherein the surname data having at least last name and last name attribute information is recorded. From the dictionary storage means, name dictionary storage means in which name data having at least a name and name attribute information is recorded, means for inputting nominal data, and last name data recorded in the last name dictionary storage means, First name processing means for searching for last name data that matches the entered nominal data first, and name data that matches the input nominal data from the name data recorded in the name dictionary storage means. A second processing means; (a) the nominal data is all katakana; (b) the nominal data is all hiragana; (c) the nominal data is No more than a fixed number of characters, (d) whether the nominal data includes at least a predetermined number of characters in the nominal data, and (e) whether the nominal data includes alphanumeric characters. Three processing means, and a judgment means for judging an attribute of the inputted nominal data based on processing results of the first processing means, the second processing means, and the third processing means. It is characterized (claim 4).

請求項1に記載の発明によれば、解析対象となる名義データを構成する姓名の一部が苗字辞書に含まれる苗字データ又は名前辞書に含まれる名前データを一致するか、また特殊情報に該当しないかによって、姓名に表れる名義データの名義人の属性、例えば出身地などを判定することが出来る。これにより所定のプロフィールを有する個人を抽出する際、一次的なフィルタリングを容易に行うことができる。 According to the first aspect of the present invention, part of the first and last names constituting the nominal data to be analyzed matches the last name data included in the last name dictionary or the name data included in the name dictionary, or corresponds to special information Depending on whether or not, it is possible to determine the attribute of the name holder of the name data appearing in the first and last names, for example, the place of birth. Accordingly, when an individual having a predetermined profile is extracted, primary filtering can be easily performed.

請求項2に記載の発明によれば、各処理ステップのいずれか一を満たした時点でそれ以降の処理を行うことなく属性判定を終了することから、より迅速な判定処理を行うことが可能となる。これらの発明は、専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムとして汎用ハードウェアにより実行するものであってもよい(請求項3)。   According to the second aspect of the present invention, the attribute determination is completed without performing the subsequent processing when any one of the processing steps is satisfied, so that it is possible to perform a quicker determination processing. Become. These inventions may be executed by general-purpose hardware as a program for realizing the functions other than those realized by dedicated hardware (claim 3).

請求項4に記載の発明によれば、解析対象となる名義データを構成する姓名の一部が苗字辞書に含まれる苗字データ又は名前辞書に含まれる名前データを一致するか、また特殊情報に該当しないかによって、姓名に表れる名義データの名義人の属性、例えば出身地などを判定することが出来る。これにより所定のプロフィールを有する個人を抽出する際、一次的なフィルタリングを容易に行うことができる。   According to the invention described in claim 4, a part of the surname that constitutes the nominal data to be analyzed matches the last name data included in the last name dictionary or the name data included in the name dictionary, or corresponds to special information Depending on whether or not, it is possible to determine the attribute of the name holder of the name data appearing in the first and last names, for example, the place of birth. Accordingly, when an individual having a predetermined profile is extracted, primary filtering can be easily performed.

サービス提供サーバ10を含む本発明に係る属性解析システム100の全体構成を示すブロック図である。1 is a block diagram showing an overall configuration of an attribute analysis system 100 according to the present invention including a service providing server 10. FIG. サービス提供サーバ10の構成を示すブロック図である。2 is a block diagram illustrating a configuration of a service providing server 10. FIG. 求職者が会員登録を行う登録画面のイメージ図である。It is an image figure of the registration screen in which a job seeker registers as a member. 同じく求職者が会員登録を行う登録画面のイメージ図である。It is an image figure of the registration screen where a job seeker also performs member registration. 求人企業が求人案件を登録する際の登録画面のイメージ図である。It is an image figure of the registration screen when a recruiting company registers a job offer. 求職者情報記憶手段に記録される求職者データの概念図である。It is a conceptual diagram of job seeker data recorded in the job seeker information storage means. 求人情報記憶手段に記録される求人案件データの概念図である。It is a conceptual diagram of the job offer item data recorded in the job offer information storage means. 名義データに基づく属性解析の流れを示すフローチャートである。It is a flowchart which shows the flow of the attribute analysis based on nominal data. 名義データのプレ処理の態様を示す図である。It is a figure which shows the aspect of the pre-processing of nominal data. 苗字辞書の構成及び名義データとの前方一致検索の処理を示す図である。It is a figure which shows the process of a front matching search with the structure of a last name dictionary, and nominal data. 名前辞書の構成及び名義データとの後方一致検索の処理を示す図である。It is a figure which shows the structure of a name dictionary, and the process of a backward matching search with nominal data. 特徴情報記憶部の構成及び特徴情報該当性の判別処理を示す図である。It is a figure which shows the structure of a feature information storage part, and the discrimination | determination process of feature information applicable property. 会員制サービスにおける会員登録画面のイメージ図である。It is an image figure of the member registration screen in member system service.

本発明を実施するための形態を一実施例に基づいて詳細に説明する。ここでは名義データに基づく解析を求人情報サイトに適用した例を用いて説明する。   The form for implementing this invention is demonstrated in detail based on one Example. Here, a description will be given using an example in which analysis based on nominal data is applied to a job information site.

図1は、本発明の一実施形態に係るサービス提供サーバ10を含む属性解析システム100の全体構成を示すブロック図である。図1に示すように、本属性解析システム100は、サービス提供サーバ10と、複数のユーザ(求職者)端末装置20・・・20と、複数のユーザ(求人企業)端末装置30・・・30とが、ネットワークNに接続可能に構成されている。   FIG. 1 is a block diagram showing an overall configuration of an attribute analysis system 100 including a service providing server 10 according to an embodiment of the present invention. As shown in FIG. 1, the attribute analysis system 100 includes a service providing server 10, a plurality of user (job seeker) terminal devices 20 ... 20, and a plurality of user (job seeking company) terminal devices 30 ... 30. Are configured to be connectable to the network N.

サービス提供サーバ10は、求人情報サービスを提供する情報処理装置である。具体的には後述するが、求職者が会員登録と同時に、又は事後的に自らの履歴書情報をサーバ10内の求職者情報記憶手段111に登録し、求人企業は求人情報を同じくサーバ10内の求人情報記憶手段112に登録する。   The service providing server 10 is an information processing apparatus that provides a job information service. Specifically, as will be described later, the job seeker registers his / her resume information in the job seeker information storage means 111 in the server 10 at the same time or after the member registration, Registered in the job information storage means 112 of

ユーザ(求職者)端末装置20・・・20は、パーソナルコンピュータ(PC)、携帯情報端末(PDA)或いは携帯電話機など、ネットワークNを介した通信機能を有する情報処理装置である。ユーザ(求職者)端末装置20・・・20は、ネットワークNを介してサービス提供サーバ10と接続可能である。   The user (job seeker) terminal device 20 ... 20 is an information processing device having a communication function via the network N, such as a personal computer (PC), a personal digital assistant (PDA), or a mobile phone. The user (job seeker) terminal devices 20... 20 can be connected to the service providing server 10 via the network N.

ユーザ(求人企業)端末装置30・・・30は、典型的にはパーソナルコンピュータ(PC)であるが、やはりネットワークNを介した通信機能を有していればその形態に制限はない。ユーザ(求人企業)端末装置30・・・30もまた、ネットワークNを介してサービス提供サーバ10と接続可能である。   The user (recruitment company) terminal devices 30... 30 are typically personal computers (PCs), but the form is not limited as long as it has a communication function via the network N. User (recruitment company) terminal devices 30... 30 can also be connected to the service providing server 10 via the network N.

ネットワークNは、サービス提供サーバ10とユーザ(求職者)端末装置20・・・20及びユーザ(求人企業)端末装置30・・・30との間で情報を送受信するための通信回線である。例えば、インターネット、LAN、WAN、専用線、電話回線、その他の通信回線及びこれらの組み合わせのいずれであってもよく、また有線であるか無線であるかを問わない。   The network N is a communication line for transmitting and receiving information between the service providing server 10 and user (job seeker) terminal devices 20... 20 and user (job seeking company) terminal devices 30. For example, it may be any of the Internet, LAN, WAN, dedicated line, telephone line, other communication line, and combinations thereof, and it does not matter whether it is wired or wireless.

ここでサービス提供サーバ10の構成のうち、本実施例に特に関連する構成につき、その機能に着目しつつ説明する。   Here, regarding the configuration of the service providing server 10, a configuration particularly related to the present embodiment will be described by paying attention to its function.

図2は、本実施形態におけるサービス提供サーバ10の構成を示すブロック図である。図示するように、サービス提供サーバ10は、情報を記憶するための記憶手段11(ハードウェア構成として例えば、ROM、RAM等のメモリや、HDD等の記憶装置)、各部の動作や処理を制御するための制御手段12(例えば、CPU等のプロセッサ)、ネットワークNを介してシステム内の他のノードと情報を送受信するための通信手段13、及びこれらの各構成を相互に結び情報の授受を行うためのバス14を備えている。 FIG. 2 is a block diagram illustrating a configuration of the service providing server 10 according to the present embodiment. As shown in the figure, the service providing server 10 controls the operation and processing of storage means 11 for storing information (as a hardware configuration, for example, a memory such as a ROM and a RAM, and a storage device such as an HDD), and each unit. Control means 12 (for example, a processor such as a CPU), a communication means 13 for transmitting / receiving information to / from other nodes in the system via the network N, and these components are connected to each other to exchange information. A bus 14 is provided.

記憶手段11には、求職者情報記憶手段111、求人情報記憶手段112、苗字辞書記憶手段113、名前辞書記憶手段114、特徴情報記憶手段115、入力フォーマット記憶手段116が含まれる。また制御手段12には、名義データプレ処理手段121、苗字データ検索手段122、名前データ検索手段123、特徴情報判別手段124、属性判定手段125が含まれる。   The storage means 11 includes job seeker information storage means 111, job offer information storage means 112, last name dictionary storage means 113, name dictionary storage means 114, feature information storage means 115, and input format storage means 116. The control unit 12 includes a nominal data pre-processing unit 121, a surname data search unit 122, a name data search unit 123, a feature information determination unit 124, and an attribute determination unit 125.

求職者情報記憶手段111には、会員登録を行った求職者のプロフィール情報が記録される。図3A及び図3Bは、求職者がユーザ(求職者)端末装置20から自身のプロフィール情報を入力する際に、ユーザ(求職者)端末装置20の表示手段に表示される画面である。これらの画面情報は、入力フォーマット記憶手段116に記録されており、サービス提供サーバ10からネットワークNを介して各ユーザ(求職者)端末装置20・・・20へと送信される。会員情報には、氏名、性別、生年月日、住所、電話番号、メールアドレス、携帯メールアドレスといった書誌的な情報の他、最終学歴や職務経歴、自己PRなど履歴書に記載される項目が含まれる。これらの情報は、会員登録の際に付与される会員ID、及び会員登録の際に設定されるパスワードとともに求職者データとして記録される。   The job seeker information storage unit 111 records profile information of job seekers who have registered as members. 3A and 3B are screens displayed on the display means of the user (job seeker) terminal device 20 when the job seeker inputs his / her profile information from the user (job seeker) terminal device 20. These pieces of screen information are recorded in the input format storage means 116 and transmitted from the service providing server 10 to each user (job seeker) terminal device 20... 20 via the network N. Member information includes bibliographic information such as name, gender, date of birth, address, telephone number, e-mail address, and mobile e-mail address, as well as items described in the resume such as final educational background, work history, and self-promotion. It is. These pieces of information are recorded as job seeker data together with a member ID given at the time of member registration and a password set at the time of member registration.

求職者は、自身のネットワーク接続されているPC等をユーザ(求職者)端末装置20としてこれらの情報を入力し、ネットワークNを介してサービス提供サーバ10へと送信する。送られた情報は求職者情報記憶手段111においてデータベースとして記録される。図5は、求職者情報記憶手段に記録される求職者データの概念図である。後述する応募者フィルタリングに資するよう、上記会員登録の際に入力された各項目をテーブルの中に配置した形で記録している。   The job seeker inputs such information as a user (job seeker) terminal device 20 using his / her PC connected to the network, and transmits it to the service providing server 10 via the network N. The sent information is recorded as a database in the job seeker information storage unit 111. FIG. 5 is a conceptual diagram of job seeker data recorded in the job seeker information storage means. In order to contribute to applicant filtering, which will be described later, each item input at the time of member registration is recorded in a form arranged in a table.

求人情報記憶手段112には、求人企業によって登録された求人案件情報が記録される。図4は、求人案件情報の登録画面中、応募者の一次選別条件である応募者フィルタを設定する画面である。ここで「フィルタ」には、選別にあたって満たすべき必須の条件(例えば就業可能な年齢に至っているかという条件)のほか、選考にあたって積極的或いは消極的に評価される条件(例えばアルバイト経験の有無)も含まれる。この例においては、募集職種「WEBデザイナー」に関するフィルタリング条件として、年齢「18歳未満」、ブランク期間(=就職していない期間)「3ヶ月以内」、アルバイト経験「評価する」、外国人の応募「受け付ける」というフィルタリング条件を設定している。   The job offer information storage unit 112 records job offer information registered by the job offer company. FIG. 4 is a screen for setting an applicant filter, which is a primary selection condition for applicants, in the registration screen for job offer information. Here, in addition to the essential conditions that must be met for selection (for example, whether you have reached the age at which you can work), the “filter” includes conditions that are positively or passively evaluated for selection (for example, whether or not you have part-time work experience). included. In this example, the filtering conditions for the recruiting job category “WEB designer” include age “under 18 years”, blank period (= not working) “within 3 months”, part-time job experience “assessment”, foreign applicants A filtering condition of “Accept” is set.

本実施例における求人案件情報の登録においては、その他に「経験職種」「転職回数」「直近の職務の在籍期間」に基づいて一次選別を行うことができる。また一次選別においてフィルタリングに該当する場合の自動返信メールの文面についてもあらかじめ設定しておくことができる。求人企業は、ユーザ(求人企業)端末装置30から上記示されたようなフィルタリング条件とともに求人案件情報を、ネットワークNを介してサーバ10の求人情報記憶手段112に記録する。   In the registration of job posting information in the present embodiment, primary selection can be performed based on “experienced job type”, “number of job changes”, and “enrollment period of the most recent job”. In addition, the text of the automatic reply mail when filtering is applicable in the primary selection can be set in advance. The job offer company records job offer information from the user (job offer company) terminal device 30 together with the filtering conditions as described above in the job offer information storage unit 112 of the server 10 via the network N.

図6は、求人情報記憶手段112に記録されている求人案件情報の概念図である。例えば「企業ID」0002の「募集企業」株式会社△△デザインは、「募集職種」としてWebデザイナーを登録している。フィルタリング条件として、「年齢18歳未満」、転職回数は「不問」、外国人の応募「有」を設定している。求人案件に対して応募を行ってきた求職者のプロフィール情報がこれらのフィルタリングの結果募集対象外と判断される場合、あらかじめ設定されている自動返信メールが当該求職者に対して配信される。   FIG. 6 is a conceptual diagram of job offer item information recorded in the job offer information storage unit 112. For example, “Recruiting Company” Co., Ltd. Δ △ Design with “Company ID” 0002 has registered a Web designer as “Recruitment Type”. As filtering conditions, “age is under 18 years old”, the number of job changes is “unquestioned”, and foreign applicants are “present”. If the profile information of the job seeker who has applied for the job posting is determined not to be recruited as a result of these filtering, a preset automatic reply mail is distributed to the job seeker.

上記例示したフィルタリング条件のうち、求職者のプロフィール情報に直接記録されているデータについては、それに基づいてフィルタリングの実行の可否が判断される。一方求職者のプロフィール情報には出身地域に関する登録項目はない。そこでプロフィール情報のうち氏名に基づいて出身地域に関する属性の解析を行う。図7は、名義データに基づく属性解析の流れを示すフローチャートである。   Among the filtering conditions exemplified above, regarding data directly recorded in the job seeker's profile information, whether or not filtering can be executed is determined based on the data. On the other hand, there is no registration item for the region of origin in the job applicant's profile information. Therefore, the attributes related to the region of origin are analyzed based on the name in the profile information. FIG. 7 is a flowchart showing the flow of attribute analysis based on nominal data.

求職者から求人案件への応募希望があると、名義データプレ処理手段121は、その求職者の名義データ、つまりプロフィール情報の「氏名」及び「カナ」について解析処理を行うためのプレ処理を行う(ステップS701)。具体的には、その求職者の氏名及びカナとして入力されている文字列からスペースを除去する。図8に示すように、全角スペース、半角スペースとも削除処理を行い、姓名一連の文字列とする。   When there is a request from a job seeker to apply for a job posting, the name data pre-processing means 121 performs pre-processing for analyzing the name data of the job seeker, that is, “name” and “kana” of profile information. (Step S701). Specifically, the space is removed from the character string inputted as the name and kana of the job seeker. As shown in FIG. 8, both full-width and half-width spaces are deleted to form a series of first and last names.

次に、苗字データ検索手段122は、苗字辞書記憶手段113に格納されたデータを使って、与えられた文字列に前方一致検索を実行する(ステップS702)。図9は前方一致検索の処理を示す概念図である。苗字データ検索手段122は、与えられた文字列を頭から一文字ずつ加えていった複数の検索キーを作成する。「佐藤一郎」の場合、「佐」「佐藤」「佐藤一」「佐藤一郎」の4パターンの検索キーが作成される。カナについても同様に複数の検索キーが作成される。   Next, the last name data search unit 122 performs a forward matching search on the given character string using the data stored in the last name dictionary storage unit 113 (step S702). FIG. 9 is a conceptual diagram showing the process of forward matching search. The last name data search means 122 creates a plurality of search keys in which a given character string is added character by character from the beginning. In the case of “Sato Ichiro”, four patterns of search keys “S”, “Sato”, “Sato Ichi”, and “Sato Ichiro” are created. Similarly, multiple search keys are created for kana.

次にこれらを苗字辞書記憶手段113に記録されている苗字データとの完全一致検索を実行する。苗字情報記憶手段113には日本人の苗字として現存する苗字データが集積されている。「佐藤一郎」の場合、「佐藤」「サトウ」がそれぞれ苗字辞書に存在する(ステップS703:YES)。 Next, a complete match search with the last name data recorded in the last name dictionary storage unit 113 is executed. The surname information storage means 113 accumulates surname data existing as Japanese surnames. In the case of “Ichiro Sato”, “Sato” and “Sato” exist in the last name dictionary (step S703: YES).

上記の例(「会員ID」0001=佐藤 一郎)のように、苗字辞書の中に一致する苗字がある場合、その後の検索、判別処理を行うことなく、属性判定手段125は当該名義データを「日本人」と判定する(ステップS708)。しかし例えば「会員ID」0004=テスト 太郎の場合、苗字辞書前方一致検索においては一致する苗字が存在しない(ステップS703:NO)。この場合、名前データ検索手段123により名前辞書後方一致検索が行われる(ステップS704)。図10は後方一致検索の処理を示す概念図である。名前データ検索手段123は、与えられた文字列を末尾から一文字ずつ加えていった複数の検索キーを作成する。「テスト太郎」の場合、「郎」「太郎」「ト太郎」「スト太郎」「テスト太郎」の5パターンの検索キーが作成される。カナについても同様に複数の検索キーが作成される。   As in the above example (“member ID” 0001 = Ichiro Sato), when there is a matching last name in the last name dictionary, the attribute determination unit 125 does not perform the subsequent search and discrimination process, “Japanese” is determined (step S708). However, for example, in the case of “member ID” 0004 = test Taro, there is no matching last name in the last match search for the last name dictionary (step S703: NO). In this case, the name data search means 123 performs a name dictionary backward match search (step S704). FIG. 10 is a conceptual diagram showing the process of backward matching search. The name data search means 123 creates a plurality of search keys in which a given character string is added character by character from the end. In the case of “Test Taro”, five patterns of search keys of “Taro”, “Taro”, “Taro”, “Sto Taro”, and “Test Taro” are created. Similarly, multiple search keys are created for kana.

次にこれらを名前辞書記憶手段114に記録されている名前データとの完全一致検索を実行する。名前情報記憶手段114には日本人の名前として現存する名前データが集積されている。「テスト太郎」の場合、「太郎」「タロウ」がそれぞれ名前辞書に存在する(ステップS705:YES)。   Next, an exact match search with the name data recorded in the name dictionary storage means 114 is executed. In the name information storage means 114, name data existing as Japanese names are accumulated. In the case of “Test Taro”, “Taro” and “Taro” exist in the name dictionary, respectively (step S705: YES).

上記の例(「会員ID」0004=テスト 太郎)のように、名前辞書の中に一致する名前がある場合、その後の判別処理を行うことなく、属性判定手段125は当該名義データを「日本人」と判定する(ステップS708)。しかし例えば「会員ID」0005=ジェームズ.ヨハンセンの場合、名前辞書後方一致検索においても一致する名前が存在しない(ステップS705:NO)。この場合、特徴情報判別手段124により特徴情報該当判別処理が行われる(ステップS706)。図11は特徴情報該当判別処理を示す概念図である。   When there is a matching name in the name dictionary as in the above example (“member ID” 0004 = test Taro), the attribute determination means 125 does not perform subsequent determination processing, and the attribute determination means 125 converts the name data to “Japanese”. Is determined (step S708). However, for example, “member ID” 0005 = James. In the case of Johansen, there is no matching name in the name dictionary backward matching search (step S705: NO). In this case, a feature information appropriate determination process is performed by the feature information determination unit 124 (step S706). FIG. 11 is a conceptual diagram showing the feature information corresponding determination process.

特徴情報判別手段124は、与えられた名義データの文字列を、その構成する文字種ごとに文字数のカウントを行う。「ジェームズ.ヨハンセン」の場合、漢字=0、カタカナ=10、ひらがな=0、英数字=0、記号=1とカウントされる。   The feature information discriminating unit 124 counts the number of characters for each character type constituting the character string of the given nominal data. In the case of “James Johansen”, it is counted that Kanji = 0, Katakana = 10, Hiragana = 0, Alphanumeric = 0, and Symbol = 1.

一方本実施例においては、特徴情報としては以下の5つが定義されている。
(a)文字列が全てカタカナ
(b)文字列が全てひらがな
(c)文字列が3文字以下
(d)文字列の中にカタカナが8文字以上含まれる
(e)文字列の中に英数字が含まれる
On the other hand, in the present embodiment, the following five items are defined as feature information.
(A) All character strings are katakana (b) All character strings are hiragana (c) Three or fewer characters are included (d) There are eight or more katakana characters in the character string (e) Alphanumeric characters in the character string Is included

特徴情報判別手段124は、定義された特徴情報に照らして与えられた名義データの文字列がこれらに該当するか否かを判別する。いずれか一の特徴情報に該当する場合(ステップS707:YES)、外国人と判定し(ステップS709)、その判定結果を出力する(ステップS710)。「ジェームズ.ヨハンセン」の場合、カタカナを10文字含むことから、特徴情報(a)に該当すると判別され、外国人と判定されることとなる。この出力結果に応じて、図4において外国人の応募をフィルタリングの対象としている場合、フィルタリングに該当することとなり、自動返信メールがサービス提供サーバ10から該当するユーザ(求職者)端末装置20に対して送信される。   The feature information discriminating unit 124 discriminates whether or not the character string of the nominal data given in light of the defined feature information corresponds to these. When it corresponds to any one of the feature information (step S707: YES), it is determined to be a foreigner (step S709), and the determination result is output (step S710). In the case of “James Johansen”, since it includes 10 katakana characters, it is determined to be applicable to the feature information (a), and is determined to be a foreigner. According to the output result, when the foreign applicant in FIG. 4 is targeted for filtering, it corresponds to filtering, and the automatic reply mail is sent from the service providing server 10 to the corresponding user (job seeker) terminal device 20. Sent.

なお本発明は、専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムとして汎用ハードウェアにより実行するものであってもよい。   In addition to what is implement | achieved by exclusive hardware, this invention may be performed by general purpose hardware as a program for implement | achieving the function.

以上のように、本発明に係る属性解析方法を用いることにより、登録された個人の属性情報としては登録されていない属性についても登録されている名義データに基づいて解析を行うことができる。これにより多数の個人登録情報から所望の情報を選別する必要がある場合の一次選別を容易化することができる。   As described above, by using the attribute analysis method according to the present invention, an attribute that is not registered as registered individual attribute information can be analyzed based on the registered nominal data. Thereby, primary selection in the case where it is necessary to select desired information from a large number of personal registration information can be facilitated.

なお上記は日本人か否か、というフィルタに適した属性解析方法の例を説明したが、これに限られるものではなく、例えば真正な姓名の登録が求められるようなシステムにおいて、それが偽名や芸名、あるいはハンドルネームではないかというフィルタにも適用可能である。この場合特徴情報記憶手段に定義する特徴情報として、「文字列の中に記号(♂、♪など)が含まれる」といった特徴情報を定義することができる。さらに、本実施例においては求人サイトにおける適用例として説明したが、本発明に係る属性解析方法の適用場面はこれに限られるものではなく、日本人か否かという判別のニーズを持っているシステムであればどんなものにも適用が可能である。   Although the above has described an example of an attribute analysis method suitable for filtering whether or not Japanese, this is not a limitation. For example, in a system that requires registration of genuine first and last names, It can also be applied to a filter for whether it is a stage name or a handle name. In this case, feature information such as “a symbol (♂, ♪, etc.) is included in the character string” can be defined as feature information defined in the feature information storage means. Further, in the present embodiment, the application example has been described as an application example in the recruitment site, but the application scene of the attribute analysis method according to the present invention is not limited to this, and the system has a need for discrimination as to whether it is a Japanese or not. It can be applied to anything.

更に、苗字辞書情報及び名前辞書情報はデータを増やしていくことにより精度の向上が見込まれる。また誤判定については事後的に苗字辞書、名前辞書あるいは特徴情報を再定義することによりやはり精度が向上する。   Furthermore, the accuracy of the last name dictionary information and the name dictionary information can be improved by increasing the data. In addition, the accuracy of erroneous determination can be improved by redefining the surname dictionary, name dictionary, or feature information afterwards.

10 サービス提供サーバ
11 記憶手段
12 制御手段
13 通信手段
14 バス
20 ユーザ(求職者)端末装置
30 ユーザ(求人企業)端末装置
100 属性解析システム
111 求職者情報記憶手段
112 求人情報記憶手段
113 苗字辞書記憶手段
114 名前辞書記憶手段
115 特徴情報記憶手段
116 入力フォーマット記憶手段
121 名義データプレ処理手段
122 苗字データ検索手段
123 名前データ検索手段
124 特徴情報判別手段
125 属性判定手段

DESCRIPTION OF SYMBOLS 10 Service provision server 11 Storage means 12 Control means 13 Communication means 14 Bus 20 User (job seeker) terminal device 30 User (job seeking company) terminal device 100 Attribute analysis system 111 Job seeker information storage means 112 Job offer information storage means 113 Last name dictionary storage Means 114 Name dictionary storage means 115 Feature information storage means 116 Input format storage means 121 Nominal data preprocessing means 122 Last name data search means 123 Name data search means 124 Feature information determination means 125 Attribute determination means

Claims (2)

入力された名義データから当該名義データの属性を解析する属性解析システムであって、
苗字データが記録されている苗字辞書記憶手段と、
名前データが記録されている名前辞書記憶手段と、
名義データを入力する手段と、
前記苗字辞書記憶手段に記録されている苗字データから、前記入力された名義データと前方一致する苗字データを検索する第一の処理手段と、
前記名前辞書記憶手段に記録されている名前データから、前記入力された名義データと後方一致する名前データを検索する第二の処理手段と、
(a)前記名義データが全てカタカナ、
(b)前記名義データが全てひらがな、
(c)前記名義データが所定文字数以下、
(d)前記名義データの中にカタカナが所定文字数以上含まれる、
(e)前記名義データの中に英数字が含まれる、
のいずれかの特殊情報に該当しないかを判別する第三の処理手段と、
前記第一の処理手段、前記第二の処理手段及び前記第三の処理手段の処理結果に基づいて前記入力された名義データの属性を判定する判定手段と
を有することを特徴とする属性解析システム。
An attribute analysis system that analyzes attributes of nominal data from input nominal data,
Last name dictionary storage means in which last name data is recorded,
Name dictionary storage means in which name data is recorded;
Means for entering nominal data;
First processing means for searching for last name data that matches the entered nominal data from the last name data recorded in the last name dictionary storage means;
Second processing means for searching for name data that matches the inputted nominal data from the name data recorded in the name dictionary storage means;
(A) All the nominal data is katakana.
(B) All the nominal data is hiragana,
(C) the nominal data is a predetermined number of characters or less;
(D) Katakana is included in the nominal data by a predetermined number of characters or more.
(E) Alphanumeric characters are included in the nominal data,
A third processing means for determining whether any of the special information is not applicable,
An attribute analysis system comprising: determination means for determining an attribute of the inputted nominal data based on processing results of the first processing means, the second processing means, and the third processing means. .
前記第二の処理手段は、前記第一の処理手段において前方一致する苗字データが検索されなかった場合にのみ行われ、
前記第三の処理手段は、前記第二の処理手段において後方一致する名前データが検索されなかった場合にのみを行われることを特徴とする、請求項1に記載の属性解析システム。

The second processing means is performed only when the last matching last name data is not searched in the first processing means,
2. The attribute analysis system according to claim 1, wherein the third processing unit is performed only when name data that matches backward is not searched in the second processing unit. 3.

JP2009254980A 2009-11-06 2009-11-06 Attribute analysis method, program and system by first name and last name Expired - Fee Related JP5537124B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009254980A JP5537124B2 (en) 2009-11-06 2009-11-06 Attribute analysis method, program and system by first name and last name

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009254980A JP5537124B2 (en) 2009-11-06 2009-11-06 Attribute analysis method, program and system by first name and last name

Publications (2)

Publication Number Publication Date
JP2011100332A JP2011100332A (en) 2011-05-19
JP5537124B2 true JP5537124B2 (en) 2014-07-02

Family

ID=44191450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009254980A Expired - Fee Related JP5537124B2 (en) 2009-11-06 2009-11-06 Attribute analysis method, program and system by first name and last name

Country Status (1)

Country Link
JP (1) JP5537124B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063469A (en) 2014-06-27 2014-09-24 百度在线网络技术(北京)有限公司 Search result display method and search result display device
CN111414569B (en) * 2020-02-18 2023-05-12 北京网聘咨询有限公司 Efficient access control method for network recruitment search technology

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2833871B2 (en) * 1991-02-08 1998-12-09 日本電気ソフトウェア株式会社 Alien name data judgment method
JP2000276467A (en) * 1999-03-29 2000-10-06 Hitachi Ltd Conversion device
JP4076900B2 (en) * 2003-04-18 2008-04-16 日本電信電話株式会社 Name analysis method, apparatus, and program
JP2007323250A (en) * 2006-05-31 2007-12-13 Fuji Xerox Co Ltd System, processing method and program for registering in dictionary for kana-kanji conversion

Also Published As

Publication number Publication date
JP2011100332A (en) 2011-05-19

Similar Documents

Publication Publication Date Title
CN106202382B (en) Link instance method and system
KR101582108B1 (en) Document classification system, document classification method, and document classification program
US8468167B2 (en) Automatic data validation and correction
KR101511656B1 (en) Ascribing actionable attributes to data that describes a personal identity
JP5827208B2 (en) Document management system, document management method, and document management program
WO2014057963A1 (en) Forensic system, forensic method, and forensic program
CN110929125A (en) Search recall method, apparatus, device and storage medium thereof
JP5823942B2 (en) Forensic system, forensic method, and forensic program
JP2015052841A (en) Document analyzing system, document analysis method, and document analysis program
JP2014182477A (en) Program and document processing device
CN110941702A (en) Retrieval method and device for laws and regulations and laws and readable storage medium
JP5098631B2 (en) Mail classification system, mail search system
JP5537124B2 (en) Attribute analysis method, program and system by first name and last name
JP6677093B2 (en) Table data search device, table data search method, and table data search program
JP4362492B2 (en) Document indexing device, document search device, document classification device, method and program thereof
JP2012043258A (en) Retrieval system, retrieval device, retrieval program, recording medium and retrieval method
KR20180137394A (en) A device for extracting and managing terms from a document and a method for extracting and managing terms using the same
JP7268316B2 (en) Information processing device and program
JP4922030B2 (en) Character string search apparatus, method and program
JP6404294B2 (en) Forensic system, forensic method, and forensic program
JP5898371B2 (en) Document separation system, method for controlling document separation system, and control program for document separation system
JP5887455B2 (en) Forensic system, forensic method, and forensic program
JP5746403B2 (en) Document separation system, method for controlling document separation system, and control program for document separation system
CN113111155A (en) Information display method, device, equipment and storage medium
JP2006031242A (en) Work-improvement proposal examination system and computer used for the system

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110428

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121218

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20121218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140425

R150 Certificate of patent or registration of utility model

Ref document number: 5537124

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees