JP5537124B2 - Attribute analysis method, program and system by first name and last name - Google Patents
Attribute analysis method, program and system by first name and last name Download PDFInfo
- Publication number
- JP5537124B2 JP5537124B2 JP2009254980A JP2009254980A JP5537124B2 JP 5537124 B2 JP5537124 B2 JP 5537124B2 JP 2009254980 A JP2009254980 A JP 2009254980A JP 2009254980 A JP2009254980 A JP 2009254980A JP 5537124 B2 JP5537124 B2 JP 5537124B2
- Authority
- JP
- Japan
- Prior art keywords
- name
- data
- information
- last
- nominal data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims description 21
- 238000012545 processing Methods 0.000 claims description 29
- 238000001914 filtration Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 11
- 244000205754 Colocasia esculenta Species 0.000 description 10
- 235000006481 Colocasia esculenta Nutrition 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 4
- 230000007115 recruitment Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、入力された姓名を解析対象としてその属性を解析する方法、プログラム及びシステムに関する。 The present invention relates to a method, a program, and a system for analyzing an attribute of an inputted first and last name as an analysis target.
インターネット上提供されるサービスにおいて、有料/無料を問わず会員制のサービスが多数存在する。通常こうした会員制のサービスにおいてサービスの提供を受けるに際しては、あらかじめ会員登録を行う必要がある。会員登録にあたっては、例えば図12に示すように、氏名、性別、住所、電話番号、メールアドレスなどの情報の入力を促す画面が表示される。登録を希望する者はこれらの情報を適宜入力し、登録会員のためのサービスの提供を受けることができる。 There are many membership-based services available on the Internet, whether paid or free. Normally, membership registration is required in order to receive the service provided by such a membership system service. When registering a member, for example, as shown in FIG. 12, a screen prompting input of information such as name, gender, address, telephone number, and mail address is displayed. Those who wish to register can input such information as appropriate and receive services for registered members.
いわゆる求人情報サイトにおいては、自らが有している職務上のスキルや職歴・学歴等を登録しておくことにより、求人案件とのマッチング頻度が高まる可能性がある。 In the so-called job information site, by registering his / her professional skills, work history, educational background, etc., there is a possibility that the frequency of matching with job offers will increase.
一方で、例えば上述の求人情報サイトにおいては、登録することによって自らの求職活動に不利となる情報については、入力が任意な項目であれば、必ずしも積極的には入力がなされない。また職業安定法(昭和22年11月30日法律第141号)の要請からも、採否可否決定目的で収集することを禁止されている項目(例えば、親の職業、家族構成、本籍など)について必須の入力事項として設定することはできない。 On the other hand, for example, in the above-described job information site, information that is disadvantageous for job hunting activities by registering is not necessarily positively input if it is an optional item. In addition, items that are prohibited from being collected for the purpose of deciding whether or not to accept (for example, parental occupation, family composition, permanent affiliation, etc.) from the request of the Employment Stabilization Law (Law No. 141, November 30, 1947) It cannot be set as a mandatory input item.
求人企業としては、選考過程の省力化の観点から、求職情報サイトの会員登録の段階、或いはその後の追加的なプロフィール登録の段階で入力される項目以外の属性によって一次的な選考(フィルタリング)を行いたいというニーズがある。こうした属性の中には、必須入力事項である氏名から一定程度把握が可能なものもある。 As a recruiting company, from the viewpoint of labor saving in the selection process, primary selection (filtering) is performed according to attributes other than the items entered at the member registration stage of the job search information site or at the subsequent additional profile registration stage. There is a need to do it. Some of these attributes can be grasped to some extent from the name that is an essential input item.
入力された名義を解析する手法として、個人/法人の判断を高速に行うことができる名義解析手法として、姓単語と、その読みと、その種別と、頻度とからなる姓データを記憶した姓辞書記憶手段から入力された名義データと単語もしくは読みの一部が前方一致するものを一度にすべて検索し、一致するものが存在した場合に、その種別によって、入力された名義データが姓か、それ以外かを判定する解析方法が開示されている(例えば、特許文献1)。また光学的文字読取装置(OCR)を用いて姓名を認識する場合に使用される文字認識処理装置として、姓と名との区切りを正しく認識するために、文字の数に応じて姓名特有の仕切りを設定して前半太後半部とに2分割する分割処理部と、前半部を姓辞書と比較照合し、後半部を名辞書と比較照合して姓と名とを認識する姓名認識部と、認識不能な場合に前記分割処理の仕切りの変更を行う認識制御部とを備えた文字認識処理装置が開示されている(例えば、特許文献2)。 A surname dictionary that stores surname data consisting of surname words, their readings, their types, and frequencies Search all the names that match the name data input from the storage means and the word or part of the reading at the same time, and if there is a match, the name data input is either the last name or An analysis method for determining whether other than the above is disclosed (for example, Patent Document 1). In addition, as a character recognition processing device used when recognizing first and last names using an optical character reader (OCR), a partition unique to the first and last names according to the number of characters in order to correctly recognize the separation between first and last names A split processing unit that divides the first half into the latter half of the first half, and a first and last name recognition unit that compares the first half with the last name dictionary and compares the second half with the first name dictionary and recognizes the first name and last name, A character recognition processing device is disclosed that includes a recognition control unit that changes a partition of the division processing when recognition is impossible (for example, Patent Document 2).
しかし、特許文献1においては、解析可能なのはその名義が法人/個人のいずれであるかであり、個人名義の属性についてその入力された姓名から解析することはできない。また特許文献2においては、どこまでが姓でどこまでが名であるかの区切りを、当初の分割処理によっては認識できなかった場合にあっても再度認識処理をする制御が示されているのみであり、やはり姓名からこれに一定程度関連付けて認識することが可能な属性について解析することはできない。
However, in
本発明は、上記事情に鑑みてなされたものであり、入力された姓名から、これと関連性を有する属性を解析する方法、プログラム及び解析システムを提供することにある。 The present invention has been made in view of the above circumstances, and it is an object of the present invention to provide a method, a program, and an analysis system for analyzing an attribute having an association with a first name and last name inputted.
請求項1に記載の属性解析方法は、外部からの操作に基づき、名義データの入力を受け付けるステップと、苗字と苗字属性情報とを少なくとも有する苗字データを記憶した苗字辞書記憶手段から、入力された名義データと前方一致する前記苗字データを検索する第一の検索ステップと、名前と名前属性情報とを少なくとも有する名前データを記憶した名前辞書記憶手段から、入力された名義データと後方一致する前記名前データを検索する第二の検索ステップと、前記第一の検索ステップ及び前記第二の検索ステップのいずれにおいても一致する苗字データ又は名前データが存在しなかった場合に、(a)前記名義データが全てカタカナ、(b)前記名義データが全てひらがな、(c)前記名義データが所定文字数以下、(d)前記名義データの中にカタカナが所定文字数以上含まれる、(e)前記名義データの中に英数字が含まれる、のいずれかの特殊情報に該当しないかを判別するステップとを有することを特徴としている(請求項1)。
The attribute analysis method according to
なお第二の検索ステップ以降のステップは、第一の検索ステップにおいて前方一致する苗字データが検索されなかった場合にのみ行ない、また(a)ないし(e)のいずれかに該当しないかを判別するステップは、第二の検索ステップにおいて後方一致する名前データが検索されなかった場合にのみ行なうように構成することができる(請求項2)。 The steps after the second search step are performed only when the last matching first surname data is not searched in the first search step, and it is determined whether it does not correspond to any of (a) to (e). The step can be configured to be performed only when name data that matches backward in the second search step is not searched.
また、これらの属性解析方法をコンピュータに実行させるプログラムとして構成することもできる(請求項3)。 Moreover, it can also comprise as a program which makes a computer perform these attribute analysis methods (Claim 3).
また請求項4に記載の属性解析システムは、入力された名義データから当該名義データの属性を解析する属性解析システムであって、苗字と苗字属性情報とを少なくとも有する苗字データが記録されている苗字辞書記憶手段と、名前と名前属性情報とを少なくとも有する名前データが記録されている名前辞書記憶手段と、名義データを入力する手段と、前記苗字辞書記憶手段に記録されている苗字データから、前記入力された名義データと前方一致する苗字データを検索する第一の処理手段と、前記名前辞書記憶手段に記録されている名前データから、前記入力された名義データと後方一致する名前データを検索する第二の処理手段と、(a)前記名義データが全てカタカナ、(b)前記名義データが全てひらがな、(c)前記名義データが所定文字数以下、(d)前記名義データの中にカタカナが所定文字数以上含まれる、(e)前記名義データの中に英数字が含まれる、のいずれかの特殊情報に該当しないかを判別する第三の処理手段と、前記第一の処理手段、前記第二の処理手段及び前記第三の処理手段の処理結果に基づいて前記入力された名義データの属性を判定する判定手段とを有することを特徴としている(請求項4)。
The attribute analysis system according to
請求項1に記載の発明によれば、解析対象となる名義データを構成する姓名の一部が苗字辞書に含まれる苗字データ又は名前辞書に含まれる名前データを一致するか、また特殊情報に該当しないかによって、姓名に表れる名義データの名義人の属性、例えば出身地などを判定することが出来る。これにより所定のプロフィールを有する個人を抽出する際、一次的なフィルタリングを容易に行うことができる。 According to the first aspect of the present invention, part of the first and last names constituting the nominal data to be analyzed matches the last name data included in the last name dictionary or the name data included in the name dictionary, or corresponds to special information Depending on whether or not, it is possible to determine the attribute of the name holder of the name data appearing in the first and last names, for example, the place of birth. Accordingly, when an individual having a predetermined profile is extracted, primary filtering can be easily performed.
請求項2に記載の発明によれば、各処理ステップのいずれか一を満たした時点でそれ以降の処理を行うことなく属性判定を終了することから、より迅速な判定処理を行うことが可能となる。これらの発明は、専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムとして汎用ハードウェアにより実行するものであってもよい(請求項3)。 According to the second aspect of the present invention, the attribute determination is completed without performing the subsequent processing when any one of the processing steps is satisfied, so that it is possible to perform a quicker determination processing. Become. These inventions may be executed by general-purpose hardware as a program for realizing the functions other than those realized by dedicated hardware (claim 3).
請求項4に記載の発明によれば、解析対象となる名義データを構成する姓名の一部が苗字辞書に含まれる苗字データ又は名前辞書に含まれる名前データを一致するか、また特殊情報に該当しないかによって、姓名に表れる名義データの名義人の属性、例えば出身地などを判定することが出来る。これにより所定のプロフィールを有する個人を抽出する際、一次的なフィルタリングを容易に行うことができる。
According to the invention described in
本発明を実施するための形態を一実施例に基づいて詳細に説明する。ここでは名義データに基づく解析を求人情報サイトに適用した例を用いて説明する。 The form for implementing this invention is demonstrated in detail based on one Example. Here, a description will be given using an example in which analysis based on nominal data is applied to a job information site.
図1は、本発明の一実施形態に係るサービス提供サーバ10を含む属性解析システム100の全体構成を示すブロック図である。図1に示すように、本属性解析システム100は、サービス提供サーバ10と、複数のユーザ(求職者)端末装置20・・・20と、複数のユーザ(求人企業)端末装置30・・・30とが、ネットワークNに接続可能に構成されている。
FIG. 1 is a block diagram showing an overall configuration of an
サービス提供サーバ10は、求人情報サービスを提供する情報処理装置である。具体的には後述するが、求職者が会員登録と同時に、又は事後的に自らの履歴書情報をサーバ10内の求職者情報記憶手段111に登録し、求人企業は求人情報を同じくサーバ10内の求人情報記憶手段112に登録する。
The
ユーザ(求職者)端末装置20・・・20は、パーソナルコンピュータ(PC)、携帯情報端末(PDA)或いは携帯電話機など、ネットワークNを介した通信機能を有する情報処理装置である。ユーザ(求職者)端末装置20・・・20は、ネットワークNを介してサービス提供サーバ10と接続可能である。
The user (job seeker)
ユーザ(求人企業)端末装置30・・・30は、典型的にはパーソナルコンピュータ(PC)であるが、やはりネットワークNを介した通信機能を有していればその形態に制限はない。ユーザ(求人企業)端末装置30・・・30もまた、ネットワークNを介してサービス提供サーバ10と接続可能である。
The user (recruitment company)
ネットワークNは、サービス提供サーバ10とユーザ(求職者)端末装置20・・・20及びユーザ(求人企業)端末装置30・・・30との間で情報を送受信するための通信回線である。例えば、インターネット、LAN、WAN、専用線、電話回線、その他の通信回線及びこれらの組み合わせのいずれであってもよく、また有線であるか無線であるかを問わない。
The network N is a communication line for transmitting and receiving information between the
ここでサービス提供サーバ10の構成のうち、本実施例に特に関連する構成につき、その機能に着目しつつ説明する。
Here, regarding the configuration of the
図2は、本実施形態におけるサービス提供サーバ10の構成を示すブロック図である。図示するように、サービス提供サーバ10は、情報を記憶するための記憶手段11(ハードウェア構成として例えば、ROM、RAM等のメモリや、HDD等の記憶装置)、各部の動作や処理を制御するための制御手段12(例えば、CPU等のプロセッサ)、ネットワークNを介してシステム内の他のノードと情報を送受信するための通信手段13、及びこれらの各構成を相互に結び情報の授受を行うためのバス14を備えている。
FIG. 2 is a block diagram illustrating a configuration of the
記憶手段11には、求職者情報記憶手段111、求人情報記憶手段112、苗字辞書記憶手段113、名前辞書記憶手段114、特徴情報記憶手段115、入力フォーマット記憶手段116が含まれる。また制御手段12には、名義データプレ処理手段121、苗字データ検索手段122、名前データ検索手段123、特徴情報判別手段124、属性判定手段125が含まれる。
The storage means 11 includes job seeker information storage means 111, job offer information storage means 112, last name dictionary storage means 113, name dictionary storage means 114, feature information storage means 115, and input format storage means 116. The control unit 12 includes a nominal
求職者情報記憶手段111には、会員登録を行った求職者のプロフィール情報が記録される。図3A及び図3Bは、求職者がユーザ(求職者)端末装置20から自身のプロフィール情報を入力する際に、ユーザ(求職者)端末装置20の表示手段に表示される画面である。これらの画面情報は、入力フォーマット記憶手段116に記録されており、サービス提供サーバ10からネットワークNを介して各ユーザ(求職者)端末装置20・・・20へと送信される。会員情報には、氏名、性別、生年月日、住所、電話番号、メールアドレス、携帯メールアドレスといった書誌的な情報の他、最終学歴や職務経歴、自己PRなど履歴書に記載される項目が含まれる。これらの情報は、会員登録の際に付与される会員ID、及び会員登録の際に設定されるパスワードとともに求職者データとして記録される。
The job seeker
求職者は、自身のネットワーク接続されているPC等をユーザ(求職者)端末装置20としてこれらの情報を入力し、ネットワークNを介してサービス提供サーバ10へと送信する。送られた情報は求職者情報記憶手段111においてデータベースとして記録される。図5は、求職者情報記憶手段に記録される求職者データの概念図である。後述する応募者フィルタリングに資するよう、上記会員登録の際に入力された各項目をテーブルの中に配置した形で記録している。
The job seeker inputs such information as a user (job seeker)
求人情報記憶手段112には、求人企業によって登録された求人案件情報が記録される。図4は、求人案件情報の登録画面中、応募者の一次選別条件である応募者フィルタを設定する画面である。ここで「フィルタ」には、選別にあたって満たすべき必須の条件(例えば就業可能な年齢に至っているかという条件)のほか、選考にあたって積極的或いは消極的に評価される条件(例えばアルバイト経験の有無)も含まれる。この例においては、募集職種「WEBデザイナー」に関するフィルタリング条件として、年齢「18歳未満」、ブランク期間(=就職していない期間)「3ヶ月以内」、アルバイト経験「評価する」、外国人の応募「受け付ける」というフィルタリング条件を設定している。
The job offer
本実施例における求人案件情報の登録においては、その他に「経験職種」「転職回数」「直近の職務の在籍期間」に基づいて一次選別を行うことができる。また一次選別においてフィルタリングに該当する場合の自動返信メールの文面についてもあらかじめ設定しておくことができる。求人企業は、ユーザ(求人企業)端末装置30から上記示されたようなフィルタリング条件とともに求人案件情報を、ネットワークNを介してサーバ10の求人情報記憶手段112に記録する。
In the registration of job posting information in the present embodiment, primary selection can be performed based on “experienced job type”, “number of job changes”, and “enrollment period of the most recent job”. In addition, the text of the automatic reply mail when filtering is applicable in the primary selection can be set in advance. The job offer company records job offer information from the user (job offer company)
図6は、求人情報記憶手段112に記録されている求人案件情報の概念図である。例えば「企業ID」0002の「募集企業」株式会社△△デザインは、「募集職種」としてWebデザイナーを登録している。フィルタリング条件として、「年齢18歳未満」、転職回数は「不問」、外国人の応募「有」を設定している。求人案件に対して応募を行ってきた求職者のプロフィール情報がこれらのフィルタリングの結果募集対象外と判断される場合、あらかじめ設定されている自動返信メールが当該求職者に対して配信される。
FIG. 6 is a conceptual diagram of job offer item information recorded in the job offer
上記例示したフィルタリング条件のうち、求職者のプロフィール情報に直接記録されているデータについては、それに基づいてフィルタリングの実行の可否が判断される。一方求職者のプロフィール情報には出身地域に関する登録項目はない。そこでプロフィール情報のうち氏名に基づいて出身地域に関する属性の解析を行う。図7は、名義データに基づく属性解析の流れを示すフローチャートである。 Among the filtering conditions exemplified above, regarding data directly recorded in the job seeker's profile information, whether or not filtering can be executed is determined based on the data. On the other hand, there is no registration item for the region of origin in the job applicant's profile information. Therefore, the attributes related to the region of origin are analyzed based on the name in the profile information. FIG. 7 is a flowchart showing the flow of attribute analysis based on nominal data.
求職者から求人案件への応募希望があると、名義データプレ処理手段121は、その求職者の名義データ、つまりプロフィール情報の「氏名」及び「カナ」について解析処理を行うためのプレ処理を行う(ステップS701)。具体的には、その求職者の氏名及びカナとして入力されている文字列からスペースを除去する。図8に示すように、全角スペース、半角スペースとも削除処理を行い、姓名一連の文字列とする。 When there is a request from a job seeker to apply for a job posting, the name data pre-processing means 121 performs pre-processing for analyzing the name data of the job seeker, that is, “name” and “kana” of profile information. (Step S701). Specifically, the space is removed from the character string inputted as the name and kana of the job seeker. As shown in FIG. 8, both full-width and half-width spaces are deleted to form a series of first and last names.
次に、苗字データ検索手段122は、苗字辞書記憶手段113に格納されたデータを使って、与えられた文字列に前方一致検索を実行する(ステップS702)。図9は前方一致検索の処理を示す概念図である。苗字データ検索手段122は、与えられた文字列を頭から一文字ずつ加えていった複数の検索キーを作成する。「佐藤一郎」の場合、「佐」「佐藤」「佐藤一」「佐藤一郎」の4パターンの検索キーが作成される。カナについても同様に複数の検索キーが作成される。
Next, the last name
次にこれらを苗字辞書記憶手段113に記録されている苗字データとの完全一致検索を実行する。苗字情報記憶手段113には日本人の苗字として現存する苗字データが集積されている。「佐藤一郎」の場合、「佐藤」「サトウ」がそれぞれ苗字辞書に存在する(ステップS703:YES)。
Next, a complete match search with the last name data recorded in the last name
上記の例(「会員ID」0001=佐藤 一郎)のように、苗字辞書の中に一致する苗字がある場合、その後の検索、判別処理を行うことなく、属性判定手段125は当該名義データを「日本人」と判定する(ステップS708)。しかし例えば「会員ID」0004=テスト 太郎の場合、苗字辞書前方一致検索においては一致する苗字が存在しない(ステップS703:NO)。この場合、名前データ検索手段123により名前辞書後方一致検索が行われる(ステップS704)。図10は後方一致検索の処理を示す概念図である。名前データ検索手段123は、与えられた文字列を末尾から一文字ずつ加えていった複数の検索キーを作成する。「テスト太郎」の場合、「郎」「太郎」「ト太郎」「スト太郎」「テスト太郎」の5パターンの検索キーが作成される。カナについても同様に複数の検索キーが作成される。
As in the above example (“member ID” 0001 = Ichiro Sato), when there is a matching last name in the last name dictionary, the
次にこれらを名前辞書記憶手段114に記録されている名前データとの完全一致検索を実行する。名前情報記憶手段114には日本人の名前として現存する名前データが集積されている。「テスト太郎」の場合、「太郎」「タロウ」がそれぞれ名前辞書に存在する(ステップS705:YES)。 Next, an exact match search with the name data recorded in the name dictionary storage means 114 is executed. In the name information storage means 114, name data existing as Japanese names are accumulated. In the case of “Test Taro”, “Taro” and “Taro” exist in the name dictionary, respectively (step S705: YES).
上記の例(「会員ID」0004=テスト 太郎)のように、名前辞書の中に一致する名前がある場合、その後の判別処理を行うことなく、属性判定手段125は当該名義データを「日本人」と判定する(ステップS708)。しかし例えば「会員ID」0005=ジェームズ.ヨハンセンの場合、名前辞書後方一致検索においても一致する名前が存在しない(ステップS705:NO)。この場合、特徴情報判別手段124により特徴情報該当判別処理が行われる(ステップS706)。図11は特徴情報該当判別処理を示す概念図である。 When there is a matching name in the name dictionary as in the above example (“member ID” 0004 = test Taro), the attribute determination means 125 does not perform subsequent determination processing, and the attribute determination means 125 converts the name data to “Japanese”. Is determined (step S708). However, for example, “member ID” 0005 = James. In the case of Johansen, there is no matching name in the name dictionary backward matching search (step S705: NO). In this case, a feature information appropriate determination process is performed by the feature information determination unit 124 (step S706). FIG. 11 is a conceptual diagram showing the feature information corresponding determination process.
特徴情報判別手段124は、与えられた名義データの文字列を、その構成する文字種ごとに文字数のカウントを行う。「ジェームズ.ヨハンセン」の場合、漢字=0、カタカナ=10、ひらがな=0、英数字=0、記号=1とカウントされる。
The feature
一方本実施例においては、特徴情報としては以下の5つが定義されている。
(a)文字列が全てカタカナ
(b)文字列が全てひらがな
(c)文字列が3文字以下
(d)文字列の中にカタカナが8文字以上含まれる
(e)文字列の中に英数字が含まれる
On the other hand, in the present embodiment, the following five items are defined as feature information.
(A) All character strings are katakana (b) All character strings are hiragana (c) Three or fewer characters are included (d) There are eight or more katakana characters in the character string (e) Alphanumeric characters in the character string Is included
特徴情報判別手段124は、定義された特徴情報に照らして与えられた名義データの文字列がこれらに該当するか否かを判別する。いずれか一の特徴情報に該当する場合(ステップS707:YES)、外国人と判定し(ステップS709)、その判定結果を出力する(ステップS710)。「ジェームズ.ヨハンセン」の場合、カタカナを10文字含むことから、特徴情報(a)に該当すると判別され、外国人と判定されることとなる。この出力結果に応じて、図4において外国人の応募をフィルタリングの対象としている場合、フィルタリングに該当することとなり、自動返信メールがサービス提供サーバ10から該当するユーザ(求職者)端末装置20に対して送信される。
The feature
なお本発明は、専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムとして汎用ハードウェアにより実行するものであってもよい。 In addition to what is implement | achieved by exclusive hardware, this invention may be performed by general purpose hardware as a program for implement | achieving the function.
以上のように、本発明に係る属性解析方法を用いることにより、登録された個人の属性情報としては登録されていない属性についても登録されている名義データに基づいて解析を行うことができる。これにより多数の個人登録情報から所望の情報を選別する必要がある場合の一次選別を容易化することができる。 As described above, by using the attribute analysis method according to the present invention, an attribute that is not registered as registered individual attribute information can be analyzed based on the registered nominal data. Thereby, primary selection in the case where it is necessary to select desired information from a large number of personal registration information can be facilitated.
なお上記は日本人か否か、というフィルタに適した属性解析方法の例を説明したが、これに限られるものではなく、例えば真正な姓名の登録が求められるようなシステムにおいて、それが偽名や芸名、あるいはハンドルネームではないかというフィルタにも適用可能である。この場合特徴情報記憶手段に定義する特徴情報として、「文字列の中に記号(♂、♪など)が含まれる」といった特徴情報を定義することができる。さらに、本実施例においては求人サイトにおける適用例として説明したが、本発明に係る属性解析方法の適用場面はこれに限られるものではなく、日本人か否かという判別のニーズを持っているシステムであればどんなものにも適用が可能である。 Although the above has described an example of an attribute analysis method suitable for filtering whether or not Japanese, this is not a limitation. For example, in a system that requires registration of genuine first and last names, It can also be applied to a filter for whether it is a stage name or a handle name. In this case, feature information such as “a symbol (♂, ♪, etc.) is included in the character string” can be defined as feature information defined in the feature information storage means. Further, in the present embodiment, the application example has been described as an application example in the recruitment site, but the application scene of the attribute analysis method according to the present invention is not limited to this, and the system has a need for discrimination as to whether it is a Japanese or not. It can be applied to anything.
更に、苗字辞書情報及び名前辞書情報はデータを増やしていくことにより精度の向上が見込まれる。また誤判定については事後的に苗字辞書、名前辞書あるいは特徴情報を再定義することによりやはり精度が向上する。 Furthermore, the accuracy of the last name dictionary information and the name dictionary information can be improved by increasing the data. In addition, the accuracy of erroneous determination can be improved by redefining the surname dictionary, name dictionary, or feature information afterwards.
10 サービス提供サーバ
11 記憶手段
12 制御手段
13 通信手段
14 バス
20 ユーザ(求職者)端末装置
30 ユーザ(求人企業)端末装置
100 属性解析システム
111 求職者情報記憶手段
112 求人情報記憶手段
113 苗字辞書記憶手段
114 名前辞書記憶手段
115 特徴情報記憶手段
116 入力フォーマット記憶手段
121 名義データプレ処理手段
122 苗字データ検索手段
123 名前データ検索手段
124 特徴情報判別手段
125 属性判定手段
DESCRIPTION OF
Claims (2)
苗字データが記録されている苗字辞書記憶手段と、
名前データが記録されている名前辞書記憶手段と、
名義データを入力する手段と、
前記苗字辞書記憶手段に記録されている苗字データから、前記入力された名義データと前方一致する苗字データを検索する第一の処理手段と、
前記名前辞書記憶手段に記録されている名前データから、前記入力された名義データと後方一致する名前データを検索する第二の処理手段と、
(a)前記名義データが全てカタカナ、
(b)前記名義データが全てひらがな、
(c)前記名義データが所定文字数以下、
(d)前記名義データの中にカタカナが所定文字数以上含まれる、
(e)前記名義データの中に英数字が含まれる、
のいずれかの特殊情報に該当しないかを判別する第三の処理手段と、
前記第一の処理手段、前記第二の処理手段及び前記第三の処理手段の処理結果に基づいて前記入力された名義データの属性を判定する判定手段と
を有することを特徴とする属性解析システム。 An attribute analysis system that analyzes attributes of nominal data from input nominal data,
Last name dictionary storage means in which last name data is recorded,
Name dictionary storage means in which name data is recorded;
Means for entering nominal data;
First processing means for searching for last name data that matches the entered nominal data from the last name data recorded in the last name dictionary storage means;
Second processing means for searching for name data that matches the inputted nominal data from the name data recorded in the name dictionary storage means;
(A) All the nominal data is katakana.
(B) All the nominal data is hiragana,
(C) the nominal data is a predetermined number of characters or less;
(D) Katakana is included in the nominal data by a predetermined number of characters or more.
(E) Alphanumeric characters are included in the nominal data,
A third processing means for determining whether any of the special information is not applicable,
An attribute analysis system comprising: determination means for determining an attribute of the inputted nominal data based on processing results of the first processing means, the second processing means, and the third processing means. .
前記第三の処理手段は、前記第二の処理手段において後方一致する名前データが検索されなかった場合にのみを行われることを特徴とする、請求項1に記載の属性解析システム。
The second processing means is performed only when the last matching last name data is not searched in the first processing means,
2. The attribute analysis system according to claim 1, wherein the third processing unit is performed only when name data that matches backward is not searched in the second processing unit. 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009254980A JP5537124B2 (en) | 2009-11-06 | 2009-11-06 | Attribute analysis method, program and system by first name and last name |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009254980A JP5537124B2 (en) | 2009-11-06 | 2009-11-06 | Attribute analysis method, program and system by first name and last name |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011100332A JP2011100332A (en) | 2011-05-19 |
JP5537124B2 true JP5537124B2 (en) | 2014-07-02 |
Family
ID=44191450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009254980A Expired - Fee Related JP5537124B2 (en) | 2009-11-06 | 2009-11-06 | Attribute analysis method, program and system by first name and last name |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5537124B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104063469A (en) | 2014-06-27 | 2014-09-24 | 百度在线网络技术(北京)有限公司 | Search result display method and search result display device |
CN111414569B (en) * | 2020-02-18 | 2023-05-12 | 北京网聘咨询有限公司 | Efficient access control method for network recruitment search technology |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2833871B2 (en) * | 1991-02-08 | 1998-12-09 | 日本電気ソフトウェア株式会社 | Alien name data judgment method |
JP2000276467A (en) * | 1999-03-29 | 2000-10-06 | Hitachi Ltd | Conversion device |
JP4076900B2 (en) * | 2003-04-18 | 2008-04-16 | 日本電信電話株式会社 | Name analysis method, apparatus, and program |
JP2007323250A (en) * | 2006-05-31 | 2007-12-13 | Fuji Xerox Co Ltd | System, processing method and program for registering in dictionary for kana-kanji conversion |
-
2009
- 2009-11-06 JP JP2009254980A patent/JP5537124B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011100332A (en) | 2011-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106202382B (en) | Link instance method and system | |
KR101582108B1 (en) | Document classification system, document classification method, and document classification program | |
US8468167B2 (en) | Automatic data validation and correction | |
KR101511656B1 (en) | Ascribing actionable attributes to data that describes a personal identity | |
JP5827208B2 (en) | Document management system, document management method, and document management program | |
WO2014057963A1 (en) | Forensic system, forensic method, and forensic program | |
CN110929125A (en) | Search recall method, apparatus, device and storage medium thereof | |
JP5823942B2 (en) | Forensic system, forensic method, and forensic program | |
JP2015052841A (en) | Document analyzing system, document analysis method, and document analysis program | |
JP2014182477A (en) | Program and document processing device | |
CN110941702A (en) | Retrieval method and device for laws and regulations and laws and readable storage medium | |
JP5098631B2 (en) | Mail classification system, mail search system | |
JP5537124B2 (en) | Attribute analysis method, program and system by first name and last name | |
JP6677093B2 (en) | Table data search device, table data search method, and table data search program | |
JP4362492B2 (en) | Document indexing device, document search device, document classification device, method and program thereof | |
JP2012043258A (en) | Retrieval system, retrieval device, retrieval program, recording medium and retrieval method | |
KR20180137394A (en) | A device for extracting and managing terms from a document and a method for extracting and managing terms using the same | |
JP7268316B2 (en) | Information processing device and program | |
JP4922030B2 (en) | Character string search apparatus, method and program | |
JP6404294B2 (en) | Forensic system, forensic method, and forensic program | |
JP5898371B2 (en) | Document separation system, method for controlling document separation system, and control program for document separation system | |
JP5887455B2 (en) | Forensic system, forensic method, and forensic program | |
JP5746403B2 (en) | Document separation system, method for controlling document separation system, and control program for document separation system | |
CN113111155A (en) | Information display method, device, equipment and storage medium | |
JP2006031242A (en) | Work-improvement proposal examination system and computer used for the system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20110428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110428 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121218 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20121218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140425 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5537124 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |