JPH07192018A - 外国人名検索装置 - Google Patents

外国人名検索装置

Info

Publication number
JPH07192018A
JPH07192018A JP5347278A JP34727893A JPH07192018A JP H07192018 A JPH07192018 A JP H07192018A JP 5347278 A JP5347278 A JP 5347278A JP 34727893 A JP34727893 A JP 34727893A JP H07192018 A JPH07192018 A JP H07192018A
Authority
JP
Japan
Prior art keywords
name
foreigner
conversion
foreign
country information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5347278A
Other languages
English (en)
Inventor
Yoshio Nakayama
好雄 中山
Nobumasa Mukai
信正 向井
Yasuyoshi Inaba
靖宜 稲場
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHISUIN NET KK
Toshiba Corp
Original Assignee
SHISUIN NET KK
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHISUIN NET KK, Toshiba Corp filed Critical SHISUIN NET KK
Priority to JP5347278A priority Critical patent/JPH07192018A/ja
Publication of JPH07192018A publication Critical patent/JPH07192018A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】本発明は、正確なカタカナ表記又はローマ字表
記が判らなくても、高い確率で該当外国人名を検索でき
る装置の提供を目的とする。 【構成】この外国人名検索装置は、カタカナ表記又はロ
ーマ字表記の検索外国人名を保持する第1の人名保持手
段1と、検索外国人名との同否を判断すべき所定表記の
比較対象外国人名を保持する第2の人名保持手段2と、
検索外国人名の本来の所属言語圏を表わす国情報が登録
される国情報登録手段3と、カタカナ表記等の外国人名
及び比較対象外国人名を表現形式に変換する変換テーブ
ル4と、国情報に基づいて変換テーブル4を選択し検索
外国人名及び比較対象外国人名をその選択した変換テー
ブルを使って所定表現形式へ変換する変換手段6と、変
換後検索外国人名と変換後比較対象外国人名との一致率
を算出する一致率算出手段7とを具備してなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、外国人名により検索を
かけるデータベース応用システム、例えば外国人居住者
情報システム,外国人顧客管理システム等に用いること
のできる外国人名検索装置に関する。
【0002】
【従来の技術】外国人顧客管理システムのデータベース
を構築する場合、各顧客の所属言語圏により個人名を表
記する文字種類が異なることから、コンピュータ処理の
便宜等を図るために各外国人名を英字アルファベットで
統一的に表記する方式が採られることが多い。
【0003】そのため、各外国人名に対して正しい一意
のアルファベット表記が必要となるが、各言語固有の発
音があるため英語圏以外の国の顧客名を正確に発音して
一義的にアルファベット表記へ変換するのは非常に難し
い作業である。一般に、よく使われるのはパスポートに
表記されるアルファベット表記を正しい表記として用い
ることである(以下、「パスポート表記」と呼ぶ)。
【0004】従来、外国人名がパスポート表記で登録さ
れたデータベースシステムは、検索対象となる外国人名
のパスポート表記のアルファベットを入力することによ
り外国人名による検索を行うことができる。データベー
スを検索する際に、正しいパスポート表記が判からない
場合がある。このようなときは外国人名の発音から対応
するアルファベットのつづりを類推し、その類推したア
ルファベットを入力する。なお、カタカナ文字をローマ
字へ変換する周知のソフトウエアが開発されており、そ
の様なソフトウエアを備えたデータベースシステムで
は、外国人名の発音から類推したカタカナ表記の外国人
名を入力することによりパスポート表記で登録された外
国人名を検索できる。
【0005】また、データベース検索には、検索用に入
力した入力文字と登録されている登録文字とが完全に一
致しなくても、双方の文字列の前方の数文字又は後方の
数文字が一致すれば検索可能ないわゆる前方一致,後方
一致といった検索方式が知られている。この検索方式を
用いれば検索作業をさらに容易なものとすることができ
る。
【0006】ところで、パスポート表記によりデータベ
ースに検索をかける場合、英語圏の外国人名であれば発
音だけからでもオペレータが正しいつづりを類推して入
力することが可能である。しかし、非英語圏の外国人名
となると、その所属言語圏の言葉に精通していない限り
外国人名の発音だけから正確につづりを類推して入力す
るのは極めて困難である。
【0007】しかも、外国人名の検索には、上記前方一
致,後方一致の検索方式を用いるには限界がある。
【0008】例えば、ある外国人名のパスポート表記が 「VITOON WONGKUSOLKIN」 であるとする。上記パスポート表記がデータベースに登
録されていて、この外国人名の発音から、以下のような
ローマ字表記によるつづりを類推したとする。
【0009】 「BITON UONGUKUSORUKIN」 上記ローマ字表記による類推したアルファベットつづり
で検索を掛けると、前方一致による検索方式では双方の
最初の文字が異なるため検索不可能である。この場合は
後方一致の検索方式を適用すれば検索可能である。しか
しながら、外国人名によっては前方一致及び後方一致の
いずれの検索方式によっても検索が掛からない多くの場
合が考えられるので、高い検索確率が要求されるシステ
ムには不十分であった。
【0010】なお、非英語圏の外国人名であっても最初
の1文字だけであれば比較的容易に予想が付くので、最
初の1文字だけで検索を掛ければ高い確率で該当する外
国人名を検索できる。しかし、同時に多数の候補名が検
索されるため、逆にその中から該当する外国人名を探す
のに手間どるという欠点がある。
【0011】
【発明が解決しようとする課題】このように、従来はパ
スポート表記の外国人名が登録されたデータベースを、
カタカナ表記又はローマ字表記の外国人名により検索す
る場合に、検索対象となる外国人名のカタカナ表記又は
ローマ字表記の正確なつづりが判らなければ外国人名の
検索作業が極めて困難になるという問題があった。
【0012】本発明は、以上のような実情に鑑みてなさ
れたもので、英語圏であるか非英語圏であかを問わず、
且つ正確なカタカナ表記又はローマ字表記が判らなくて
も、非常に高い確率で効率良く該当する外国人名を検索
することのできる外国人名検索装置を提供することを目
的とする。
【0013】
【課題を解決するための手段】上記目的を達成するため
に本発明の外国人名検索装置は、カタカナ表記又はロー
マ字表記された外国人名を入力して、予め所定表記で登
録されている外国人名の中から該当する外国人名を検索
するものにおいて、検索対象として入力されるカタカナ
表記又はローマ字表記の検索外国人名を保持する第1の
人名保持手段と、前記検索外国人名との一致率を判断す
べき所定表記の比較対象外国人名を保持する第2の人名
保持手段と、前記検索外国人名の本来の所属言語圏を表
わす国情報が登録される国情報登録手段と、カタカナ表
記又はローマ字表記の外国人名をある表現形式に変換す
る第1の変換規則と前記所定表記の比較対象外国人名を
前記表現形式に変換する第2の変換規則とが定められた
変換テーブルを少なくとも前記国情報保持手段に保持さ
れている国情報の数備えた変換テーブル群と、前記国情
報登録手段に登録された国情報に基づいて前記変換テー
ブル群から対応する変換テーブルを選択し、前記検索外
国人名及び前記比較対象外国人名をその選択した変換テ
ーブルを使って所定表現形式へ変換する変換手段と、前
記変換手段によって前記表現形式へ変換された変換後検
索外国人名と変換後比較対象外国人名との一致率を算出
する一致率算出手段とを具備する構成とした。
【0014】
【作用】本発明の外国人名検索装置では、国情報登録手
段に登録されている国情報から第1の人名保持手段にあ
る検索外国人名と第2の人名保持手段にある比較対象外
国人名との変換に使用すべき変換テーブルが変換テーブ
ル群から選択される。変換手段が上記変換テーブルを使
ってそれぞれ変換した変換後検索外国人名と変換後比較
対象外国人名とが一致率算出手段へ渡され、そこで両者
の文字の一致率が算出される。この一致率は検索外国人
名と比較対象外国人名との同否の程度を表わすので、一
致率算出手段で算出される一致率がある一定値以上の場
合には検索外国人名と比較対象外国人名とが同一人であ
る可能性が高いので、候補として上げることができる。
【0015】また、カタカナ表記又はローマ字表記の検
索外国人名及び所定表記(例えばパスポート表記)の比
較対象外国人名を、それぞれ第1の変換規則及び第2の
変換規則で本来の所属言語圏を考慮した表現形式に変換
してから一致率を判断しているので、正確なカタカナ表
記又はローマ字表記が判らなくても、非常に高い確率で
効率良く該当する外国人名を検索することのできる。
【0016】
【実施例】以下、本発明の実施例について説明する。
【0017】図1は本発明の一実施例に係る外国人名検
索装置の機能ブロックを示す図である。本実施例の外国
人名検索装置は、コンピュータの記憶装置により検索外
国人名保持部1,比較対象外国人名保持部2,国情報保
持部3,変換テーブル群4が構成され、同コンピュータ
の演算装置によりテーブル選択手段5,変換手段6,一
致率算出手段7が実現されている。
【0018】検索外国人名保持部1は、検索すべき外国
人名のローマ字表記が保持される部分である。そのロー
マ字表記による外国人名はオペレータ入力により不図示
のキーボード等から任意に設定される。
【0019】比較対象外国人名保持部2は、検索外国人
名保持部1で保持している検索外国人名と比較対象とな
るパスポート表記の外国人名が保持される部分である。
そのパスポート表記の外国人名は、データベース等の予
めパスポート表記の外国人名が登録されている部分から
順次読み出されて設定される。
【0020】国情報保持部3は、検索外国人名保持部1
に保持されている検索外国人名に関する国情報が保持さ
れる。国情報は検索の都度検索外国人名と共に設定され
る。なお、多数の検索外国人名に対する一連の検索で
は、それら多数の外国人名に対して包括的な設定とする
こともある。国情報は、2桁の国コードからなり一意的
に国を示すものとする。
【0021】ここで、「国」とは、単なる国名のみなら
ず、同一言語を使用する一地方,又は国のグループまで
含む概念であり、外国人名の本来の所属言語圏を意味す
るものとする。すなわち、同一の変換規則で変換し得る
範囲が一つの国情報で規定され、テーブル内容が同じも
のの単位を表している。
【0022】変換テーブル群4は、国別の外国人名変換
テーブルからなる。外国人名変換テーブルの種類は、国
情報である2桁の国コードが取り得る値の数だけある。
例えば、2桁の国コードが取り得る値が、図2に示すよ
うに“01”“03”“10”の3つであれば、テーブ
ルの種類は3種類である。
【0023】各外国人名変換テーブルは、図3に示すよ
うに、m個のエントリー10−1〜10−mからなり、
各エントリー10は変換種別(4i1),変換前文字列
指示(4i2),変換後文字列指示(4i3)の3項目
からなる。変換種別は、検索外国人名変換規則と比較対
象外国人名変換規則とからなる。変換前文字列指示と変
換後文字列指示とはペアになっている。
【0024】図4は、外国人名変換テーブルの具体例を
示している。同図に示すテーブルでは、変換種別:1が
検索外国人名変換規則を意味し、変換種別:2が比較対
象外国人名変換規則を意味する。このテーブルによれば
変換種別:1の検索外国人名変換規則では、変換前文字
列指示が「R」で変換後文字列指示が「L」であるか
ら、ローマ字表記入力された検索外国人名に含まれる
「R」は「L」へ変換される。また変換種別:2の比較
対象外国人名変換規則では、変換前文字列指示が「T
H」で変換後文字列指示が「T」であるから、パスポー
ト表記されている比較対象外国人名に含まれる「TH」
は「T」へ変換される。
【0025】テーブル変換手段5は、国コードとテーブ
ル番号とを対応させた,図2に示すような対応表を有し
ており、国情報保持部3に保持している国情報に対応す
る外国人名変換テーブルを図2の対応表を参照して変換
テーブル群4の中から選択して変換手段6へ渡す。な
お、変換テーブル群4の各外国人名変換テーブルをナン
バリングしておき、対応表のテーブル番号と一致させて
いる。
【0026】変換手段6は、テーブル変換手段5から渡
される外国人名変換テーブルに従って検索外国人名及び
比較対象外国人名を変換し、その変換後検索外国人名及
び変換後比較対象外国人名を一致率算出手段7へ渡す。
【0027】一致率算出手段7は、変換後検索外国人名
と変換後比較対象外国人名との一致文字数をカウント
し、(一致文字数/変換後検索外国人名文字数)を一致
率として算出する。
【0028】次に、以上のように構成された本実施例の
動作について、図5を参照して説明する。まず、オペレ
ータがキーボード等により検索対象となる外国人名のロ
ーマ字表記を検索外国人名保持部1に登録すると共に、
国情報保持部3に当該検索外国人名の国情報を登録す
る。一方、比較対象外国人名保持部2にはデータベース
から取出されたローマ字表記の比較対象外国人名が設定
される。
【0029】例えば、比較対象外国人名保持部2に、検
索すべき外国人名のパスポート表記である、 「VITOON WONGKUSOLKIN」 が登録され、検索外国人名保持部1に当該外国人名の発
音から類推したローマ字表記である、 「BITON UONGUKUSORUKIN」 が登録されているとする。上記したように上記パスポー
ト表記と上記ローマ字表記とは本来は一致すべき関係に
ある。
【0030】デーブル選択手段5は、検索すべき外国人
名の国情報を国情報保持部3から読取り、その国情報の
国コードから図2に示す対応表を参照して対応する変換
テーブル番号の外国人名変換テーブルを選択する。
【0031】デーブル選択手段5で外国人名変換テーブ
ルが選択されると、その外国人名変換テーブルを使って
変換手段6で変換処理を実行する。すなわち、変換手段
6は、検索外国人名保持部1から上記ローマ字表記の検
索外国人名を読込み、比較対象外国人名保持部2から上
記パスポート表記の比較対象外国人名を読込み、さらに
上記選択した外国人名変換テーブルからエントリーを取
出す。
【0032】例えば、上記選択した外国人名変換テーブ
ル4−kが図4に示すエントリーからなるテーブルであ
れば、該テーブルから一番上のエントリーを取出す。こ
のエントリーの変換種別は「1」であるのでローマ字表
記の検索外国人名に変換前文字列指示に登録されている
文字「R」が含まれているか否か判断する。この例では
1文字含まれているので該当文字「R」を変換後文字列
指示に登録されている文字「L」に変換する。次に2番
目のエントリーを取出すと、変換種別が「2」であるの
でパスポート表記の比較対象外国人名の文字列から該エ
ントリーの変換前文字列指示に登録されている文字「T
H」を探す。この例では含まれていないので当該変換規
則による変換はされない。以下、同様に未処理のエント
リーが無くなるまで上記変換処理を繰返す。この結果、
本例では、ローマ字表記の変換後検索外国人名は、 「BITON UONGUKUSOLUKIN」 となり、パスポート表記の変換後比較対象外国人名は、 「VITOON WONGKUSOLKIN」 となる。
【0033】一致率算出手段7は、以上のようにして変
換手段6により変換された変換後検索外国人名及び変換
後比較対象外国人名の一致率を算出する。そのため、先
ず上記変換後検索外国人名と上記変換後比較対象外国人
名との一致文字数をカウントする。但し、一致文字数を
カウントする場合、同じ文字が2文字以上連続する箇所
のみをピックアップし1文字だけでの対比は行わない。
また「UO」のように相異なる母音が2文字以上連続す
る場合は、その部分を除外して対比する。また「OO」
のように同じ母音が2文字以上連続する場合は、その部
分は当該母音を1文字として扱う。また両者間での一致
文字列が複数回生じる場合には、その中の一つだけを一
致文字として扱う。本実施例において、上記条件を課し
た上で一致する文字は、 「ITON NG KUSOL KIN」 となる。
【0034】次に、一致文字数を変換後検索外国人名文
字数で除算し、その除算結果を一致率として出力する。
本例の場合、一致文字数は14、変換後検索外国人名文
字数は19であるから、一致率は73.7%となる。
【0035】比較対象外国人名保持部2に登録する比較
対象外国人名を順次交換し、比較対象外国人名を交換す
る都度上記図5に示す処理を実施することにより、デー
タベースに登録されている各外国人名と検索外国人保持
部1に保持されている外国人名との一致率が次々と算出
される。この様にして算出された一致率が一定値以上の
ものを候補としてデータベースに登録されているパスポ
ート表記で表示する。この表示された候補者一覧から周
知の手段により任意の候補を選択することとなる。
【0036】このように本実施例によれば、ローマ字表
記の外国人名とパスポート表記の外国人名をそれぞれ所
定の変換規則で変換する変換テーブルを国情報別に予め
用意しておき、検索外国人名の国情報から該当する変換
テーブルを選択して検索外国人名と比較対象外国人名と
をそれぞれ変換し、その変換後検索外国人名と変換後比
較対象外国人名との一致率を算出するようにしたので、
検索外国人名の正確なローマ字表記が判らなくても、検
索外国人名とパスポート表記でデータベースに登録され
た比較対象外国人との一致率を求めることができる。従
って、その一致率が一定値以上の外国人名を候補とすれ
ば、非常に高い確率で、且つ効率良く該当外国人名を検
索することができる。
【0037】なお、上記一実施例では検索外国人名保持
部1にローマ字表記の外国人名を保持しているが、カタ
カナ表記で外国人名を保持するようにしてもよい。この
場合は、カタカナ表記を一意的にローマ字表記に変換す
る周知のカタカナ/ローマ字変換手段を備え、検索外国
人名保持部1から変換手段6へ読み込まれる検索外国人
名をカタカナ表記からローマ字表記へ変換して渡すよう
に構成する。
【0038】また、検索外国人名保持部1にカタカナ表
記の外国人名を保持し、且つカタカナ/ローマ字変換手
段を備える。そして検索外国人名保持部1から変換手段
6へ検索外国人名を渡す際に、上記カタカナ/ローマ字
変換手段でローマ字表記に変換すると共に、前述した図
4に示すような変換種別「1」の変換規則による変換も
併せて行うようにする。この場合は、変換手段6では比
較対象外国人名の変換のみを実行する。
【0039】また、以上の説明ではパスポート表記され
た比較対象外国人名との一致率を例に説明したが、比較
対象外国人名はその他の表記によるものであってもよ
い。この場合は、変換規則は表記方法により個々に定め
る。
【0040】また、上記実施例では一致率を求めるのに
変換後検索外国人名文字数を用いたが、変換後比較対象
外国人名の文字数を用いて(一致文字数/変換後比較対
象外国人名文字数)から算出してもよい。
【0041】本発明は上記実施例に限定されるものでは
なく、本発明の要旨を逸脱しない範囲内で種々変形実施
可能である。
【0042】
【発明の効果】以上詳記したように本発明によれば、検
索外国人名の本来の所属言語圏が英語圏であるか非英語
圏であかを問わず、また正確なカタカナ表記又はローマ
字表記が判らなくても、非常に高い確率で効率良く該当
する外国人名を検索することのできる外国人名検索装置
を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る外国人名検索装置の機
能ブロック図である。
【図2】国コードとテーブル番号との対照表を示す図で
ある。
【図3】外国人名変換テーブルの構成図である。
【図4】変換規則の具体例を示す図である。
【図5】上記一実施例の外国人名検索装置の処理内容を
示すフローチャートである。
【符号の説明】
1…検索外国人名保持部、2…比較対象外国人名保持
部、3…国情報保持部、4…変換テーブル群、5…テー
ブル選択手段、6…変換手段、7…一致率算出手段、1
0−1〜10−m…エントリー。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 稲場 靖宜 東京都港区芝浦一丁目1番1号 株式会社 東芝本社事務所内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 カタカナ表記又はローマ字表記された外
    国人名を入力して、予め所定表記で登録されている外国
    人名の中から該当する外国人名を検索する外国人名検索
    装置において、 検索対象として入力されるカタカナ表記又はローマ字表
    記の検索外国人名を保持する第1の人名保持手段と、 前記検索外国人名との一致率を判断すべき所定表記の比
    較対象外国人名を保持する第2の人名保持手段と、 前記検索外国人名の本来の所属言語圏を表わす国情報が
    登録される国情報登録手段と、 カタカナ表記又はローマ字表記の外国人名をある表現形
    式に変換する第1の変換規則と前記所定表記の比較対象
    外国人名を前記表現形式に変換する第2の変換規則とが
    定められた変換テーブルを少なくとも前記国情報保持手
    段に保持されている国情報の数備えた変換テーブル群
    と、 前記国情報登録手段に登録された国情報に基づいて前記
    変換テーブル群から対応する変換テーブルを選択し、前
    記検索外国人名及び前記比較対象外国人名をその選択し
    た変換テーブルを使って所定表現形式へ変換する変換手
    段と、 前記変換手段によって前記表現形式へ変換された変換後
    検索外国人名と変換後比較対象外国人名との一致率を算
    出する一致率算出手段とを具備したことを特徴とする外
    国人名検索装置。
JP5347278A 1993-12-27 1993-12-27 外国人名検索装置 Pending JPH07192018A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5347278A JPH07192018A (ja) 1993-12-27 1993-12-27 外国人名検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5347278A JPH07192018A (ja) 1993-12-27 1993-12-27 外国人名検索装置

Publications (1)

Publication Number Publication Date
JPH07192018A true JPH07192018A (ja) 1995-07-28

Family

ID=18389139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5347278A Pending JPH07192018A (ja) 1993-12-27 1993-12-27 外国人名検索装置

Country Status (1)

Country Link
JP (1) JPH07192018A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009043148A (ja) * 2007-08-10 2009-02-26 Casio Comput Co Ltd 候補単語表示装置及び候補単語表示プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009043148A (ja) * 2007-08-10 2009-02-26 Casio Comput Co Ltd 候補単語表示装置及び候補単語表示プログラム

Similar Documents

Publication Publication Date Title
US5640575A (en) Method and apparatus of translation based on patterns
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
JPH02299068A (ja) 入力文字列からワードを分離する方法
JPH08314947A (ja) キーワード自動抽出装置
JPH07192018A (ja) 外国人名検索装置
JP2004348514A (ja) 対訳語抽出方法、対訳辞書構築方法及び翻訳メモリ構築方法
JPH08339376A (ja) 外国語検索装置及び情報検索システム
JP3780556B2 (ja) 自然言語事例検索装置及び自然言語事例検索方法
JP2009020567A (ja) 文書検索装置
JPH08115330A (ja) 類似文書検索方法および装置
JPS62249269A (ja) 文書処理装置
JPH03123971A (ja) 索引付け支援装置
JPH10105578A (ja) 点数を利用した類似単語検索方法
JPH05189485A (ja) キーワード検索方式
JPH0342774A (ja) 情報処理装置
JPH03161865A (ja) 文章の検索方法
JPS63133228A (ja) 情報抽出装置
JPH03122768A (ja) 索引付け支援装置
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JP2003091557A (ja) 文書照合装置
Maloney et al. Computer assisted primary index preparation
JPH03125265A (ja) キーワード抽出装置
JPS63136264A (ja) 機械翻訳装置
JPH02297151A (ja) 文書編集装置