JP3587279B2 - 姓名解析方法及び装置 - Google Patents

姓名解析方法及び装置 Download PDF

Info

Publication number
JP3587279B2
JP3587279B2 JP33400796A JP33400796A JP3587279B2 JP 3587279 B2 JP3587279 B2 JP 3587279B2 JP 33400796 A JP33400796 A JP 33400796A JP 33400796 A JP33400796 A JP 33400796A JP 3587279 B2 JP3587279 B2 JP 3587279B2
Authority
JP
Japan
Prior art keywords
name
reading
dictionary
last
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP33400796A
Other languages
English (en)
Other versions
JPH10171799A (ja
Inventor
成人 岩瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP33400796A priority Critical patent/JP3587279B2/ja
Publication of JPH10171799A publication Critical patent/JPH10171799A/ja
Application granted granted Critical
Publication of JP3587279B2 publication Critical patent/JP3587279B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、姓名解析方法及び装置に係り、特に、人名を扱う顧客システムで、区切なしに入力された人名を姓と名に分割し、姓や名で検索するような業務や、漢字1文字毎にフリガナを対応させることにより、連濁や音便等の音の変化を考慮した検索キーの派生に使用する姓名解析方法及び装置に関する。
【0002】
【従来の技術】
従来から、姓名を登録した辞書を準備し、姓名両方とも辞書にある解を出力する方法が特開昭62−237567等に開示されている。
姓名の片方しか辞書に登録されていない場合には、特開平6−161995に開示されているように、単語分割パターンと単語長から姓名の区切位置を求める方法がある。
【0003】
【発明が解決しようとする課題】
しかしながら、芸名等でかな表記する場合もあること、日本に在住する外国人(特に中国人等、漢字を使用する外国人)の増加、データベースに含まれる間違い等により全ての種類の姓を読みを含めて辞書に登録することは困難である。また、名については、新しい名を付けることは可能なため、辞書に全ての名を登録することは不可能である。
【0004】
そこで、姓名の片方のみ辞書にある場合の区切り位置の決定方法が重要となる。例えば、「石渡隆瑞(イシワタリユウズイ)」という姓名に対し、姓辞書に「石渡(イシワタリ)」と「石渡(イシワタ)」が存在し、名辞書には存在しないとする。その時、名の部分の漢字と読みの対応を取り、「隆瑞」の読みは「リュウズイ」であることが分からないと、「石渡/隆瑞(イシワタ/リユウズイ)」が正解であることが分からない。
【0005】
また、姓名の区切りは辞書に存在している姓または、名の長さや出現頻度のみでは決定できない。例えば、「小野寺和(オノデラカズ)」の場合、辞書に「小野」しか無い場合、名が「寺和」が対応するが、単語の先頭の「寺」を「デラ」と読むことはあり得ないので、単に辞書の存在の有無から姓名の区切を正確に求めることはできない。
【0006】
また、「小野」も「小野寺」も辞書に登録したとしても、出現頻度は「小野」の方が「小野寺」よりも10倍多いため、やはり「小野/寺和」を選択する。
一方、単語の長さのみで判断を行う方法でも正確な判断はできない。例えば、「羽田野里子(ハタノリコ)」に対して辞書に「羽田」と「羽田野」が存在した場合、長さのみからは、「羽田野/里子」を出力するが、正解は、「羽田/野里子」である。
【0007】
本発明は、上記の点に鑑みなされたもので、姓名辞書の片方しか辞書にない人名であっても、正しく姓名の区切を付与し、正しい人名の解析を可能とする人名解析方法及び装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
図1は、本発明の第1の原理を説明するための図である。
本発明は、姓名の区切りなしに入力された個人名とフリガナに対し、表記とフリガナの姓と名の区切り位置及び漢字1文字毎のフリガナの区切り位置を解として得る姓名解析方法において、
姓を登録した姓辞書と、名を登録した名辞書を用いて、姓名区切り解析部が入力された姓名の表記とフリガナを姓と名に分割して姓名の区切り位置を得るステップ(ステップ1)と
文字に対する読みを登録した文字辞書を用いて、姓または名の片方しか姓辞書、名辞書にない場合には、フリガナ解析部が漢字1文字毎にフリガナの対応を取ることにより漢字1文字毎に入力されたフリガナを区切り、フリガナの区切り位置を得るステップ(ステップ2)と、
区切り位置チェック部が、姓名の区切りと漢字毎のフリガナの区切り位置の対応を取ることにより、両者の対応のとれない解候補を棄却するステップ(ステップ3)からなる。
【0010】
また、本発明は、フリガナの区切り位置を得るステップにおいて、文字毎に文字の読みの属性を登録した文字辞書を用いてフリガナを区切り、漢字毎の区切り位置を得ると同時に、漢字毎にフリガナの読み属性を得るステップと、
区切り位置チェック部による解候補の棄却を行うステップの後、読み属性チェック部が文字毎の読みの属性を参照し、フリガナの姓名区切り位置が正しくないと判断された場合は正しくない解候補を棄却するステップを有する。
【0011】
は、本発明の第の原理を説明するため図である。
本発明は、姓辞書及び名辞書に姓 名の出現頻度情報及び姓 名の属性を登録しておき、入力された文字列に対し、姓名の片方しか姓辞書、名辞書にない解候補が複数ある場合は、姓または、名の頻度、辞書に存在した姓または名の長さ、辞書に存在した姓または、名の属性を評価し、最も確からしい解を出力する(ステップ3−3)。
【0012】
本発明は、姓名の区切りなしに入力された個人名とフリガナに対し、表記とフリガナの姓と名の区切り位置及び漢字1文字毎のフリガナの区切り位置を解として得る姓名解析装置であって、
姓を登録した姓辞書と、
名を登録した名辞書と、
文字に対する読みを登録した文字辞書と、
姓辞書と前記名辞書を用いて、入力された姓名の表記とフリガナを姓と名に分割して姓名の区切り位置の候補を得る姓名区切り解析部と、
文字辞書を用いて、姓または名の片方しか姓辞書、名辞書にない場合には、漢字1文字毎にフリガナの対応をとることにより漢字1文字毎に入力されたフリガナを区切り、フリガナの区切り位置を得るフリガナ解析部と、
フリガナの姓名の区切り位置と漢字毎のフリガナの区切り位置の対応を取ることにより、両者の対応のとれない解候補を棄却する区切り位置チェック部と、を有する。
【0013】
本発明は、フリガナ解析部において、
文字毎に文字の読みの属性を登録した文字辞書を用いてフリガナを区切り、漢字毎の区切り位置を得ると同時に、漢字毎にフリガナの読み属性を得る手段を有し、
区切り位置チェック部による解候補の棄却を行うステップの後、読み属性チェック部が文字毎の読みの属性を参照し、フリガナの姓名区切り位置が正しくないと判断された場合は正しくない解候補を棄却する読み属性チェック部を有する。
【0014】
また、上記の姓辞書は、姓の出現頻度情報及び姓の属性を含み、
名辞書は、名の出現頻度情報及び名の属性を含み、
入力された文字列に対し、姓・名の片方しか姓辞書または、名辞書に存在しない解候補が複数る場合には、該姓または、該名の頻度、該姓辞書または、該名辞書に存在した姓または、名の長さ、属性を評価する長さ・属性評価手段と、
長さ・属性評価手段の評価結果に基づいて最も確からしい解を出力する解出力手段とを更に有する。
【0015】
上記のように、本発明では、姓名辞書にない場合でも、文字の区切りを付与するために、漢字1文字毎のフリガナを解析し、読みの多義(「石渡」を「イシワタリ」と読むか「イシワタ」と読むか)を解消するための文字の区切り情報に基づいて姓名辞書での検索結果が正しいかチェックすることができる。
【0016】
また、日本語としてあり得ない区切り方を排除するために漢字1文字毎の読みの属性を求め、属性のチェックをすることが可能となる。
さらに、姓名の長さ、頻度、属性から解候補の評価を行うとで、評価値に基づいた候補の出力が可能となる。
【0017】
また、姓名のどちらかが辞書にない時は、フリガナを解析し、1文字毎の漢字の読みを求め、漢字とフリガナが対応するかをチェックする。これにより「石渡(イシワタリ)」と「石渡(いしわた)」の様に読みが包含関係にある解のチェックを行うことが可能となる。
【0018】
次に、漢字1文字毎に読みの属性を求め、姓の末尾にならない読み、名の先頭にならない読み、1文字の単語でしか読まない文字、2文字以上の単語で読む文字等のチェックを行い、矛盾する候補を棄却する。この処理により、「小野寺和」の「寺(デラ)」が先頭になる様な解を棄却する。
【0019】
最後に、単語の頻度と辞書に存在した単語の長さにより、最も良い評価値の解を出力する。但し、「一郎」「太郎」などの名の場合は、前方に一文字付いて「恵一郎」「栄太郎」のようになる場合が多いので、評価値を下げて評価する。
このように、本発明によれば、姓名辞書の片方にしか存在しない人名でも、フリガナの属性をチェックするので、正しくない解を棄却することができる。また、単語の長さ、頻度、姓名の属性を組み合わせて解の評価を行うので、正しい解を選択することが可能となる。
【0020】
【発明の実施の形態】
は、本発明の第1の姓名解析装置の構成を示す。
同図に示す姓名解析装置の構成は、姓名区切り解析部10、姓辞書20、名辞書30、フリガナ解析部40、文字辞書50、区切り位置チェック部60から構成される。
【0021】
姓名区切り解析部10は、姓辞書20、名辞書30を参照して入力された姓名を分割する。
姓辞書20は、姓が登録された辞書である。また、当該姓に対応する属性、出現頻度情報等を併せて登録しておくようにしてもよい。
【0022】
名辞書30は、名が登録された辞書でる。また、当該名に対応する属性、出現頻度情報等を併せて登録しておくようにしてもよい。
フリガナ解析部40は、入力された姓名に対して漢字とフリガナの対応をとる。
【0023】
文字辞書50は、漢字と読みの対応を登録した辞書である。
区切り位置チェック部60は、姓辞書20、名辞書30による区切りと文字辞書50による区切りをチェックする。
は、本発明の第1の姓名解析装置構成における動作のフローチャートである。
【0024】
ステップ101) まず、姓名区切り解析部10は、姓辞書20及び名辞書30による姓名区切りを解析する。
ステップ102) ここで、姓名の両方の解があるかを判定し、ある場合には、ステップ103に移行し、ない場合には、ステップ104に移行する。
【0025】
ステップ103) 姓名の両方ある解が複数ある場合には、姓名の頻度の合計が多い解を出力する。
ステップ104) 姓名の片方のみ、姓辞書20または、名辞書30にある場合には、フリガナ解析部40において、フリガナの解析を行う。
【0026】
ステップ105) つぎに、区切り位置チェック部60において、フリガナの区切り位置のチェックを行う。
は、本発明の第2の姓名解析装置の構成を示す。
同図に示す構成は、前述の図の構成に読み属性をチェックする読み属性チェック部70を加えた構成である。
【0027】
は、本発明の第2の姓名解析装置構成における動作のフローチャートである。
ステップ201) まず、姓名区切り解析部10は、姓辞書20及び名辞書30による姓名区切りを解析する。
【0028】
ステップ202) ここで、姓名の両方の解があるかを判定し、ある場合には、ステップ203に移行し、ない場合には、ステップ204に移行する。
ステップ203) 姓名の両方ある解が複数ある場合には、姓名の頻度の合計が多い解を出力する。
【0029】
ステップ204) 姓名の片方のみ、姓辞書20または、名辞書30にある場合には、フリガナ解析部40において、フリガナの解析を行う。
ステップ205) つぎに、区切り位置チェック部60において、フリガナの区切り位置のチェックを行う。
【0030】
ステップ206) 読み属性チェック部70は、フリガナ解析部40で取得したフリガナの属性を参照することにより、姓の末尾の文字の読み、名の先頭の文字の読み、姓・名の文字数、読みの種類等をチェックする。
つまり、図に示す動作に上記のステップ206の動作が付加される。
【0031】
は、本発明の第3の姓名解析装置の構成を示す。
同図に示す構成は、前述の図の構成にさらに、単語の長さ・頻度・属性により解候補を評価し、最も評価の良い解を選択する解評価・選択部80が加えられた構成である。
【0032】
は、本発明の第3の姓名解析装置構成における動作のフローチャートである。
ステップ301) まず、姓名区切り解析部10は、姓辞書20及び名辞書30による姓名区切りを解析する。
【0033】
ステップ302) ここで、姓名の両方の解があるかを判定し、ある場合には、ステップ303に移行し、ない場合には、ステップ304に移行する。
ステップ303) 姓名の両方ある解が複数ある場合には、姓名の頻度の合計が多い解を出力する。
【0034】
ステップ304) 姓名の片方のみ、姓辞書20または、名辞書30にある場合には、フリガナ解析部40において、フリガナの解析を行う。
ステップ305) つぎに、区切り位置チェック部60において、フリガナの区切り位置のチェックを行う。
【0035】
ステップ306) 読み属性チェック部70は、フリガナ解析部40で取得したフリガナの属性を参照することにより、姓の末尾の文字の読み、名の先頭の文字の読み、姓・名の文字数、読みの種類等をチェックする。
ステップ307) まだ、解が複数あるかを判定し、ある場合には、ステップ308に移行する。
【0036】
ステップ308) 解評価・選択部80は、姓辞書20、名辞書30のいずれかにある方の単語の長さと頻度、及び名の属性を総合して最もよい解を出力する。
【0037】
【実施例】
以下、図面と共に本発明の実施例を説明する。
[第1の実施例]
第1の実施例は、前述の図及び図に基づいて、図のフローチャートを用いて説明する。図のステップ番号は、図のステップ番号と同様である。
【0038】
まず、入力された姓名に対して、姓辞書20、名辞書30を検索して、姓名の区切りを求める(ステップ101)。この例では、以下の区切りが得られたものとする。なお、%は姓名区切りであり、/は文字区切りであるとして説明する。
Figure 0003587279
次に、姓名が姓辞書20と名辞書30のいずれか一方にある解が1つの場合には、その解を出力して処理を終了する。姓名が姓辞書20及び名辞書30の双方にある解が複数ある場合には姓名の頻度の合計が多い解を出力する(ステップ102)。
【0039】
また、姓名が姓辞書20、名辞書30のいずれか片方の辞書にある場合には、フリガナ解析部40の解析結果に基づいて、区切り位置チェック部60がフリガナの区切り位置のチェックを行う(ステップ104)。
例えば、「石渡隆瑞(イシワタリユウズイ)」に対して「石渡(イシワタリ)」と「石渡(イシワタ)」の姓が辞書に存在する。フリガナ解析部40による結果は、
「石渡隆瑞(イシ/ワタ/リユウ/ズイ)」
となるので、区切り位置チェック部60により、「石渡隆瑞(イシワタリ/ユウズイ)」と区切る解は棄却され、「石渡隆瑞(イシワタ/リユウズイ)」が取得される(ステップ105)。
【0040】
[第2の実施例]
前述の図及び図に基づいて、図のフローチャートを用いて説明する。図10のステップ番号は、図のステップ番号と同様である。図10は、本発明の第2の実施例の動作を説明するフローチャートである。
【0041】
前述の第1の実施例と同様に、姓名区切り解析により、
Figure 0003587279
の2つの解が得られる(ステップ201)。ここで、姓名が姓辞書20、名辞書30の双方にある解が複数存在するため(ステップ202)、第1の実施例と同様にフリガナ解析部40により、フリガナ解析を行う(ステップ204)。例えば、
小野寺和
オ/ノ/デラ/カズ
という解析結果が得られたとする。
【0042】
次に、区切り位置チェック部60の、区切り位置チェックにより、
「小野寺/和(オノデラ/カズ)と「小野/寺和(オノ/デラカズ)」
が取得された場合に(ステップ205)、読み属性チェック部70は、「小野寺和(オノデラカズ)」を「小野/寺和」と区切る解は、文字辞書50を参照することにより、単語の先頭では、「寺」を「デラ」と読まないので、棄却する(ステップ206)。
【0043】
また、「羽田野里子(ハタノリコ)」を「羽田野/里子(ハタノ/リコ)」と区切られた解については、読み属性チェック部70により、「里(リ)」は名の接尾辞「子」を除いて2文字以上で読むので、棄却される。
11に、読み属性チェック部70による参照された文字辞書50の例を示す。
【0044】
[第3の実施例]
次に、本発明の第3の実施例を説明する。
前述の図及び図に基づいて、図12のフローチャートを用いて説明する。図12のステップ番号は、図のステップ番号と同様である。図12は、本発明の第3の実施例の動作を説明するフローチャートである。
【0045】
図1のフローチャートにおいて、ステップ306の処理は無くも構わない。また、処理結果(ステップ306までにおいて)で解候補がなくなれば区切りは無しと判断される。まだ、解がある場合には、読み属性チェック部70により、辞書にある方の単語の長さと頻度及び名の属性(「一郎」「太郎」等の名の一部になる単語は評価を下げる)を総合して最も良い解を出力する(ステップ306)。一般には、頻度よりも単語長を優先させる方が評価関数としては性能がよくなるという実験結果があるので、辞書にあった姓・名が長い解を優先し、同じ長さのとき頻度の多い解を優先させる。
【0046】
例えば、次のような評価式が考えられる。
(単語の長さ)×10+(頻度)
評価式において、(頻度)は単語の頻度logを0から10までに正規化したものである。なお、この正規化された単語の頻度は、姓辞書20、名辞書30に予め登録しておくようにしてもよい。
【0047】
例として、「森沢繁澄(モリサワシゲスミ)」を解析すると、「森」は頻度9、「森沢」は頻度5なので、頻度情報のみで判断すると、「森/沢繁澄」であるが、上記の評価式を用いると、「森」は19、「森沢」は25となり、正解の「森沢/繁澄」を出力する。
【0048】
但し、「一郎」「太郎」のような名の場合は、当該名の前に一文字付加される可能性があるので、解の評価を悪くするように上記評価式を修正して用いる。
また、名が名辞書30辞書にあり、姓の部分が長すぎる(例えば、6文字以上)の場合は、その解は間違った所で切れている可能性が高いので、棄却する。
【0049】
例えば、「アキヤマサダアキ」と仮名で入力された姓名に対し、「アキ」のみが名辞書30にあった場合、当該名部分を除いた姓部分は「アキヤマサダ」になる。しかし、このような長い姓はないので棄却する。
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内で種々変更・応用が可能である。
【0050】
【発明の効果】
上述のように、本発明の姓名解析方法及び装置によれば、姓名辞書の片方にか辞書にない人名でも1文字毎にフリガナの属性をチェックするので、正しく姓名の区切りを付与することができる。また、単語長と頻度と単語の属性を組み合わせて解の評価を行うので、正確な解を出力することができる。
【0051】
また、姓名のどちらかが辞書にあれば、解析できるので、解析率が大幅に向上する。例えば、カバー率95%の姓辞書と名辞書を用いたとしても、姓名両方とも辞書にある確率は、90%程度に低下する。ところが、本発明で示した方法及び装置によれば、姓名の片方が辞書にあれば解析できるので、カバー率は99%以上になる。
【図面の簡単な説明】
【図1】本発明の第1の原理を説明するための図である。
【図2】本発明の第2の原理を説明するための図である。
【図3】本発明の第1の姓名解析装置の構成図である。
【図4】本発明の第1の姓名解析装置構成における動作のフローチャートである。
【図5】本発明の第2の姓名解析装置の構成図である。
【図6】本発明の第2の姓名解析装置構成における動作のフローチャートである。
【図7】本発明の第3の姓名解析装置の構成図である。
【図8】本発明の第3の姓名解析装置構成における動作のフローチャートである。
【図9】本発明の第1の実施例の動作を説明するフローチャートである。
【図10】本発明の第2の実施例の動作を説明するフローチャートである。
【図11】本発明の第2の実施例の文字辞書の例である。
【図12】本発明の第3の実施例の動作を説明するフローチャートである。
【符号の説明】
10 姓名区切り解析部
20 姓辞書
30 名辞書
40 フリガナ解析部
50 文字辞書
60 区切り位置チェック部
70 読み属性チェック部
80 解評価部

Claims (6)

  1. 姓名の区切りなしに入力された個人名とフリガナに対し、表記とフリガナの姓と名の区切り位置及び漢字1文字毎のフリガナの区切り位置を解として得る姓名解析方法において、
    姓を登録した姓辞書と、名を登録した名辞書を用いて、姓名区切り解析部が入力された前記姓名の表記とフリガナを姓と名に分割して姓名の区切り位置の候補を得るステップと
    文字に対する読みを登録した文字辞書を用いて、姓または名の片方しか前記姓辞書、前記名辞書にない場合には、フリガナ解析部が漢字1文字毎にフリガナの対応を取ることにより漢字1文字毎に入力されたフリガナを区切り、フリガナの区切り位置を得るステップと、
    区切り位置チェック部が、フリガナの姓名の区切り位置と漢字毎のフリガナの区切り位置の対応を取ることにより、両者の対応のとれない解候補を棄却するステップからなることを特徴とする姓名解析方法。
  2. 前記漢字毎のフリガナの区切り位置を得るステップにおいて、文字毎に文字の読みの属性を登録した文字辞書を用いてフリガナを区切り、漢字毎の区切り位置を得ると同時に、漢字毎にフリガナの読み属性を得るステップと、
    前記区切り位置チェック部による解候補の棄却を行うステップの後、読み属性チェック部が文字毎の読みの属性を参照し、フリガナの姓名区切り位置が正しくないと判断された場合は正しくない解候補を棄却するステップを有する請求項1記載の姓名解析方法。
  3. 前記姓辞書及び前記名辞書に姓・名の出現頻度情報及び姓・名の属性を登録し、入力された文字列に対し、姓名の片方しか前記姓辞書、前記名辞書にない解候補が複数ある場合は、姓または、名の頻度、辞書に存在した姓または名の長さ、前記辞書に存在した姓または、名の属性を評価し、最も確からしい解を出力する請求項1または、記載の姓名解析方法。
  4. 姓名の区切りなしに入力された個人名とフリガナに対し、表記とフリガナの姓と名の区切り位置及び漢字1文字毎のフリガナの区切り位置を 解として得る姓名解析装置であって、
    姓を登録した姓辞書と、
    名を登録した名辞書と、
    文字に対する読みを登録した文字辞書と、
    前記姓辞書と前記名辞書を用いて、入力された前記姓名の表記とフリガナを姓と名に分割して姓名の区切り位置の候補を得る姓名区切り解析部と、
    前記文字辞書を用いて、姓または名の片方しか前記姓辞書、前記名辞書にない場合には、漢字1文字毎にフリガナの対応をとることにより漢字1文字毎に入力されたフリガナを区切り、フリガナの区切り位置を得るフリガナ解析部と、
    フリガナの姓名の区切り位置と漢字毎のフリガナの区切り位置の対応を取ることにより、両者の対応のとれない解候補を棄却する区切り位置チェック部と、を有することを特徴とする姓名解析装置。
  5. 前記フリガナ解析部において、
    文字毎に文字の読みの属性を登録した文字辞書を用いてフリガナを区切り、漢字毎の区切り位置を得ると同時に、漢字毎にフリガナの読み属性を得る手段を有し、
    前記区切り位置チェック部による解候補の棄却を行うステップの後、読み属性チェック部が文字毎の読みの属性を参照し、フリガナの姓名区切り位置が正しくないと判断された場合は正しくない解候補を棄却する読み属性チェック部を有する請求項4記載の姓名解析装置。
  6. 前記姓辞書は、姓の出現頻度情報及び姓の属性を含み、
    前記名辞書は、名の出現頻度情報及び名の属性を含み、
    前記入力された文字列に対し、姓・名の片方しか前記姓辞書または、前記名辞書に存在しない解候補が複数る場合には、該姓または、該名の頻度、該姓辞書または、該名辞書に存在した姓または、名の長さ、属性を評価する長さ・属性評価手段と、
    前記長さ・属性評価手段の評価結果に基づいて最も確からしい解を出力する解出力手段とを更に有する請求項または、記載の姓名解析装置。
JP33400796A 1996-12-13 1996-12-13 姓名解析方法及び装置 Expired - Lifetime JP3587279B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33400796A JP3587279B2 (ja) 1996-12-13 1996-12-13 姓名解析方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33400796A JP3587279B2 (ja) 1996-12-13 1996-12-13 姓名解析方法及び装置

Publications (2)

Publication Number Publication Date
JPH10171799A JPH10171799A (ja) 1998-06-26
JP3587279B2 true JP3587279B2 (ja) 2004-11-10

Family

ID=18272460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33400796A Expired - Lifetime JP3587279B2 (ja) 1996-12-13 1996-12-13 姓名解析方法及び装置

Country Status (1)

Country Link
JP (1) JP3587279B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101001133B1 (ko) 2008-03-14 2010-12-15 엔에이치엔(주) 일본어 사전 서비스에서 후리가나 레이어 및 한자 읽기레이어를 제공하는 방법 및 시스템
JP2010113678A (ja) * 2008-11-10 2010-05-20 Advanced Media Inc 姓名解析方法、姓名解析装置、音声認識装置、および姓名頻度データ生成方法

Also Published As

Publication number Publication date
JPH10171799A (ja) 1998-06-26

Similar Documents

Publication Publication Date Title
US7424421B2 (en) Word collection method and system for use in word-breaking
Wacholder et al. Disambiguation of proper names in text
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
Ravin et al. Extracting names from natural-language text
US20070005586A1 (en) Parsing culturally diverse names
JP3361563B2 (ja) 形態素解析装置及びキーワード抽出装置
JP3587279B2 (ja) 姓名解析方法及び装置
KR100617317B1 (ko) 복합 명사 전문용어 사전 엔트리의 재분석 방법 및 그 장치
KR19990042430A (ko) 문장의 구조정보를 이용한 명사구 추출장치 및 그 방법
JPH0619960A (ja) 形態素解析処理方法
JPH0619968A (ja) 専門用語自動抽出装置
JP4047895B2 (ja) 文書校正装置およびプログラム記憶媒体
Laitinen et al. Google Books: A shortcut to studying language variability?
JPH077415B2 (ja) 日本文文書誤り検定装置
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体
JP4047894B2 (ja) 文書校正装置およびプログラム記憶媒体
JPH03125264A (ja) キーワード抽出装置
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JPS6368972A (ja) 未登録語処理方式
JP3408007B2 (ja) 形態素解析処理装置
JP2900628B2 (ja) 辞書検索装置
JP3332142B2 (ja) 形態素解析装置とその方法
JPH03123971A (ja) 索引付け支援装置
JPH08305698A (ja) 自然語解析方法及び装置
JPH01114976A (ja) 文書処理装置の辞書構造

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040803

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20040804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040804

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100820

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100820

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110820

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120820

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130820

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term