JPH07192053A - 顧客名の読みを決定する方法およびこの方法を実施する顧客名集約方法 - Google Patents

顧客名の読みを決定する方法およびこの方法を実施する顧客名集約方法

Info

Publication number
JPH07192053A
JPH07192053A JP33150093A JP33150093A JPH07192053A JP H07192053 A JPH07192053 A JP H07192053A JP 33150093 A JP33150093 A JP 33150093A JP 33150093 A JP33150093 A JP 33150093A JP H07192053 A JPH07192053 A JP H07192053A
Authority
JP
Japan
Prior art keywords
reading
name
customer
customer name
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP33150093A
Other languages
English (en)
Inventor
Hisashi Obara
永 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP33150093A priority Critical patent/JPH07192053A/ja
Publication of JPH07192053A publication Critical patent/JPH07192053A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 計算機を使用して「名寄せ」作業をして「名
寄せ」に失敗した「名寄せ失敗データ」を顧客名の読み
に従ってソートすることにより或る程度顧客名の並べ替
えおよび集約をすることができる可能性のある顧客を一
所にまとめて顧客名の並べ替えおよび「名寄せ」作業を
高効率化する方法を提供する。 【構成】 日本語文章により表記される顧客名の読みを
決定する方法において、単語毎にその読みと他単語との
間の接続条件を1組或は複数組用意した単語辞書を予め
具備し、顧客名を単語単位に分割し、単語辞書を使用し
て顧客名を構成する単語とこの単語の他単語との間の接
続条件の組合せから各単語の読みを求める顧客名の読み
を決定する方法、およびこの方法を採用する顧客名集約
方法。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、顧客名の読みを決定
する方法およびこの方法を実施する顧客名集約方法に関
する。
【0002】
【従来の技術】例えば営業戦略の情報として活用するた
めに顧客情報のオンラインデータベース(DB)を全社
的規模において構築し、これを維持管理することが行な
われている。この様なDBは、登録される情報の信頼性
を確保することは必要である。そのために、入力の仕方
に関する内規その他の約束事を予め制定しておき、これ
に基づいて入力することにより、入力段階において矛盾
の無い入力を行う様にしている。しかし、現実には必ず
しも内規に従った入力が徹底されない場合もあるし、或
は同一社内においても多部門に亘って共通する統一的な
内規を設定するのは困難な場合もあるところから、同一
顧客について部分的に異なった住所氏名による多重登録
のなされる恐れは多分にあり、DBの無矛盾性は一般的
には充分に確保されるとは言い難い。従って、例えば或
る顧客が全社的に見て当社のどの様な製品を購入/利用
しているかという様な営業戦略上必要とされる情報を得
るには、DBの情報を入力として多重登録のなされてい
る同一顧客を集約する「名寄せ」と呼ばれる処理/作業
を行う必要がある。
【0003】「名寄せ」においては、DBに登録される
顧客名、顧客の(本社)住所その他の情報を拠り所とし
て、別のレコードとして登録されている各顧客情報が同
一の顧客に関するものであるか否かを判定して、同一と
判断することができればこれを集約する処理/作業を行
う。この「名寄せ」処理を自動的に実施する際の顧客名
集約処理精度を高めるために、例えば顧客名として「株
式会社」という単語が付加されている/いないという様
なDB中に登録されている各項目の表記のゆれを考慮し
た照合による処理を計算機上において行なっている。
【0004】
【発明が解決しようとする課題】以上の通りの「名寄
せ」処理において、「A製作所α工場」、「A製作所β
営業所」という2通りの顧客名が別のレコードとして登
録されている場合に、人間は一目で「α工場」と「β営
業所」は事業所名であり、これらは何れも「A製作所」
に属する同一顧客であるものと認識することができる。
しかし、この認識を計算機を使用して自動化するには、
例えば「α」、「β」が地名であって、「α工場」、
「β営業所」は「A製作所」のそれぞれの地区にある事
業所であるという格別の知識を援用して処理を行う必要
があり、これを実現することは容易ではない。
【0005】以上の如く、計算機を使用した自動照合の
みによる100%の「名寄せ」を実現することは現実的
には不可能であるので、照合することができなかったレ
コードおよびリストを出力し、人手による「人的名寄
せ」作業により計算機による「名寄せ」を補完する必要
がある。「人的名寄せ」作業は、計算機から出力された
リストを人が参照し、時には直接顧客先に問い合わせを
行なって確認をしながら「名寄せ」作業を進めるもので
ある。これは時間的にもコスト的にも非効率的であり、
この作業をできるだけ効率化することは非常に重要なこ
とである。自動による顧客名集約処理の精度を高めるこ
とが最も有効な方法であることは言うまでもないが、上
述した通り、100%の自動化は困難であり、「人的名
寄せ」作業を0にすることが現実的には不可能である以
上、この「人的名寄せ」作業をもすることを前提とした
作業の高効率化を図る必要がある。
【0006】この発明は、上述の問題を解消した顧客名
の読みを決定する方法およびこの方法を実施する顧客名
集約方法を提供するものである。
【0007】
【課題を解決するための手段】日本語文章により表記さ
れる顧客名の読みを決定する方法において、単語毎にそ
の読みと他単語との間の接続条件を1組或は複数組用意
した単語辞書を予め具備し、顧客名を単語単位に分割
し、単語辞書を使用して顧客名を構成する単語とこの単
語の他単語との間の接続条件の組合せから各単語の読み
を求める顧客名の読みを決定する方法、を構成した。
【0008】そして、上述の顧客名の読みを決定する方
法において、顧客名の表記と読みとを組にした顧客名辞
書を具備し、顧客名辞書に登録されている顧客名につい
ては顧客名辞書から顧客名の読みを決定する顧客名の読
みを決定する方法、を構成した。また、上述の顧客名の
読みを決定する方法の何れかにおいて、顧客名の表記に
カタカナ部分が含まれている場合、カタカナ部分以外の
部分の単語について単語辞書を使用して当該単語の読み
を決定し、決定した各単語の読みとカタカナ部分とを顧
客名の表記順に連結する顧客名の読みを決定する方法、
を構成した。
【0009】更に、「顧客DB」Aから顧客名を入力し
て「計算機による自動名寄せ処理」1を行うことにより
「名寄せ成功データ」Bおよび「名寄せ失敗データ」C
を求め、「名寄せ失敗データ」Cを入力して「顧客名の
読みによるソート処理」2を行うことにより「名寄せ失
敗データ、読みによるソート結果」Dを求め、「名寄せ
失敗データ、読みによるソート結果」Dおよび「名寄せ
成功データ」Bに基づいて「名寄せ結果」Eを作成する
顧客名集約方法、を構成した。
【0010】そして、上述の顧客名集約方法において、
「顧客名の読みによるソート処理」2における顧客名の
読みの決定は上述の顧客名の読みを決定する方法の何れ
かによるものである顧客名集約方法、を構成した。。
【0011】
【実施例】この発明について説明する。先ず、計算機に
より出力されたリストにおいて、或る程度集約すること
ができる可能性のある顧客が一所(ひとところ)にまと
められて出力されていれば、「人的名寄せ」作業の効率
は向上する。このために、以下に示す通り、顧客名を単
にその計算機上の漢字コードに基づく順番に出力するの
みではなく、顧客名の「読み」に基づいてソートした結
果をも出力する必要がある。
【0012】
【表1】
【0013】一方、顧客DBには顧客名の「読み」が必
ずしも情報として盛り込まれておらず、たとえ盛り込ま
れていたとしても、上述した通り、必ずしもDB中の
「読み」フィールドの内容に関する信頼性は高くはない
ので、別の方法により漢字により入力されている顧客名
から「読み」を求める手段を備えた方法を考案する必要
がある。
【0014】この発明においては、自然言語処理技術の
内の実用レベルに到達している日本語の形態素解析処理
技術を、この「読み」作成に使用する。日本語は英語そ
の他の言語とは異なり、文章が単語単位に区切られずに
べた書きとされている。このために、機械翻訳技術その
他多くの自然言語処理応用技術においては、入力される
日本語文章を先ず単語単位に分割する処理を行う必要が
ある。この単語単位に分割する処理を行うのが形態素解
析処理である。形態素解析処理においては、文章を単語
単位に分割する処理の内においてその単語に付随する情
報として品詞、活用形その他の文法的情報をも併せて認
識する。
【0015】自然言語処理応用技術の一つである、入力
された文章を計算機を使用して自動的に合成音声により
出力する音声合成技術の応用分野においては、入力され
る文章に対して正確に読みを付与することは特に重要で
ある。この読みを付与する処理の大半は、形態素解析処
理の内において、単語に付随する情報としてその単語の
読みを認定することで実現されている。この技術を顧客
名の「読み」作成に使用する。
【0016】顧客名の「読み」を付与する方法として
は、全顧客名とその「読み」とを対にして保持する辞書
を準備し、この辞書と照合することにより「読み」を求
めるという方法が考えられる。しかし、日本全国の顧客
名は、例えばNTTの職業別電話帳に基づいて調査して
も一千万件にも及び、しかも日々変化している。このた
めに、この方法は辞書の更新維持の困難性を考慮する
と、このまま直接的に実現しようとしても多くの困難を
伴う。
【0017】これに対して、形態素解析処理は、以下の
例に示す通り、短い単位の単語のみを辞書に登録してお
き、顧客名をこの短かい単位の単語を組み合わせた複合
語として認定することができるので、辞書に登録すべき
単語数は数十万件程度に抑えることができる。
【0018】
【表2】
【0019】しかも、単語の組み合わせに応じた制約情
報を持っているので、以下の例に示す様に正確な「読
み」を作成することができる。
【0020】
【表3】
【0021】この例は、予め辞書に登録されている単語
間の接続制約の条件が一致する組み合わせ、即ち「グル
ープA」、「グループB」同士で「読み」を作成するの
で、同形の単語で異なる「読み」を持つ顧客名に対して
も、正しい「読み」を付与することができる。これら日
本語文章に対して正確な「読み」を付与する技術は、合
成音声出力の技術開発において培われたものであり、そ
の精度は、新聞記事その他のこなれた文章を対象とした
場合、99%以上の精度を保証することができるところ
にまで到達しており、これは顧客名の「読み」付与とい
う特定の応用分野においても充分に適用することができ
る。
【0022】ここで、図1を参照してこの発明を具体的
に説明する。図1は、この発明において対象とする顧客
名集約方法の全体構成を示す。図1において、「顧客D
B」Aを入力として、「計算機による自動名寄せ処理」
1を行い、「名寄せ成功データ」Bと「名寄せ失敗デー
タ」Cを出力する。「計算機による自動名寄せ処理」1
は、従来公知の処理方法であり、上述した通り、「顧客
DB」A中の顧客名、顧客の(本社)住所その他のデー
タを拠り所として異なって登録されている複数の顧客が
同一であるか否かを判定処理をする。判定処理は、顧客
名、顧客の(本社)住所その他の情報を相互に照合する
ことにより行なう。この照合処理においては、例えば顧
客名において「株式会社」の有無その他入力時の表記上
の揺れを考慮することにより、集約精度の向上が図られ
ている。この結果「名寄せ成功データ」Bには集約に成
功したデータを格納し、「名寄せ失敗データ」Cには集
約に失敗したデータを格納している。
【0023】従来の「名寄せ」においては、図1の「名
寄せ失敗データ」Cに基づいて「名寄せ成功データ」B
をも併せて参照しながら「人手による人的名寄せ作業」
3を行い、「名寄せ結果」Eを作成していた。この発明
は、図1の「名寄せ失敗データ」Cを入力として、「顧
客名の読みによるソート処理」2を行い、「名寄せ失敗
データ、読みによるソート結果」Dを出力する。「顧客
名の読みによるソート処理」2は、上述した通り、「顧
客DB」A中に必ずしも「読み」データがあるとは限ら
ないし、あるにしても格納されるデータの信頼性の問題
から信頼するに足りないことを考慮して、自然言語処理
技術の一つである形態素解析処理を使用して漢字表記さ
れた顧客名に対する「読み」を付与する。この付与され
た「読み」に基づいて「名寄せ失敗データ」Cはソート
され、「名寄せ失敗データ、読みによるソート結果」D
を出力する。この処理の詳細については、後で図2を参
照して説明する。
【0024】次に、図1の「名寄せ失敗データ、読みに
よるソート結果」Dに基づいて、「名寄せ成功データ」
Bをも併せて参照しながら、「人手による人的名寄せ作
業」3を行い、「名寄せ結果」Eを作成する。「名寄せ
失敗データ、読みによるソート結果」Dは、漢字の顧客
名が「読み」によりソートし直されているので、「読
み」により比較的に類似している顧客名が一所(ひとと
ころ)に集約されているので、「人手による人的名寄せ
作業」3の効率がその分だけ向上する。なお、「人手に
よる人的名寄せ作業」3自体は、「名寄せ失敗データ」
Cが「名寄せ失敗データ、読みによるソート結果」Dに
置き換わった点を除けば、上述した通りの従来例と共通
しており、「名寄せ成功データ」Bと「名寄せ失敗デー
タ、読みによるソート結果」Dの出力リストを参照しな
がら、人が計算機によるDBのアクセスを通して「名寄
せ成功データ」Bに対して集約可能な顧客を新たに追
加、修正して最終的に「名寄せ結果」Eを作成する。
【0025】次に、図2を参照して、図1における「顧
客名の読みによるソート処理」2の処理慨要を説明す
る。「名寄せ失敗データ」Cおよび「名寄せ失敗デー
タ、読みによるソート結果」Dはそれぞれ図1のCおよ
びDに対応するものである。図2において、「名寄せ失
敗データ」Cを入力して、4の「形態素解析処理、およ
びそれに付随する処理による読み作成」4の処理を行
い、「顧客名の読み情報付き名寄せ失敗データ」Fを作
成する。「形態素解析処理、およびそれに付随する処理
による読み作成」4の処理は、原則的には、形態素解析
処理のみにより顧客名に対する「読み」を作成すれば良
いのであるが、一般的に形態素解析処理は速度が遅く、
一千万件にも及ぶ顧客名のデータを処理するには多少の
工夫を施しておく必要があるが、その詳細はこの発明の
要旨と直接の関係はないので省略する。
【0026】図2においては、更に、「顧客名の読み情
報付き名寄せ失敗データ」Fを入力として、「読みに基
づくソート処理」5を実行し、顧客名が「読み」の順番
に並んだ「名寄せ失敗データ、読みによるソート結果」
Dを作成する。ソート処理自体は周知慣用の技術を適用
する。図3、図4および図5は一蓮托生の図であり、図
2における「形態素解析処理、およびそれに付随する処
理による読み作成」4の処理をフローにより示したもの
である。以下、これらを参照して処理手順を説明する。
なお、作成する読みについて、この実施例はカタカナ表
記を採用しているが、これは便宜上こうしているだけで
あり、カタカナ/ひらがなの何れかに統一されていさえ
すれば良い。
【0027】(1)処理を開始する。 (2)図2の「名寄せ失敗データ」を読み尽くした場合
は、(3)に分岐し、まだデータがある場合は、(4)
に分岐する。即ち、ここにおいて処理の終了条件を判定
している。 (3)処理を終了する。
【0028】(4)図2の「名寄せ失敗データ」から1
レコード、即ち1顧客名に関する情報を読み込む。 (5)読み込んだレコードから顧客名が格納されている
部分を切り出す。 (6)切り出された顧客名がひらがな/カタカナのみか
ら構成されているか判定する。ひらがな/カタカナのみ
から構成されている場合は(7)へ分岐し、そうでない
場合は図4の(8)へ分岐する。即ち、ひらがな/カタ
カナのみから構成される場合は形態素解析を行って読み
を作成する必要がないので、その判定をする。
【0029】(7)顧客名の情報をカタカナ表記に統一
してこれをそのまま顧客名の読みとし、図5の(13)
に進む。 (8)切り出された顧客名にカタカナが含まれるか否か
を判定する。カタカナが含まれている場合は(9)に分
岐し、含まれていない場合は図5の(12)に分岐す
る。上述した通り、顧客名は一般に複数の単語から構成
されるが、カタカナはその外来語部分を表現しており、
カタカナとそれ以外の文字間は、ほぼ単語の切れ目とな
る。この特徴を利用して、顧客名中のカタカナ部分をそ
れ以外の部分と分離して、それ以外の部分のみ形態素解
析の対象とすることにより、形態素解析処理時間を短縮
することができる。ひらがな部分は以下の例に示す通り
漢字と共に単語を構成するので、分離すると形態素解析
により正しい単語認定をすることができず、誤った読み
を作成する可能性があるのでカタカナ部分と同様の取扱
いをすることができない。
【0030】例: ××つけ物店、××仕出し屋 (9)顧客名中で、カタカナ部分とそれ以外の部分を分
離する。 (10)分離されたカタカナ以外の部分を対象にして形
態素解析処理を行い、カタカナ表記の読みを作成する。 (11)形態素解析処理を施して作成した読みと、先に
抽出したカタカナ部分を先に分離した順番に従ってマー
ジして顧客名の読みを作成し、図5の(13)に進む。
【0031】(12)形態素解析処理を行い、カタカナ
表記の読みを作成する。 (13)顧客名とその読みを、読み込んだレコードの他
の情報とマージし、図2の「顧客名の読み情報付き名寄
せデータ」Fに書き込んで、図3の(2)に戻る。
【0032】
【発明の効果】以上の通りであって、この発明によれ
ば、計算機を使用して「名寄せ」作業をして「名寄せ」
に失敗した「名寄せ失敗データ」を、顧客名の読みに従
ってソートすることにより或る程度顧客名の並べ替えお
よび集約をすることができる可能性のある顧客を一所
(ひとところ)にまとめることができ、「人的名寄せ」
作業においてもその作業を高効率化することができる。
【図面の簡単な説明】
【図1】この発明の実施例を説明する図。
【図2】顧客名の読みによるソート処理を説明する図。
【図3】形態素解析処理、およびそれに付随する処理に
よる読み作成の処理フローの一部を示す図。
【図4】形態素解析処理、およびそれに付随する処理に
よる読み作成の処理フローの一部を示す図。
【図5】形態素解析処理、およびそれに付随する処理に
よる読み作成の処理フローの一部を示す図。
【符号の説明】
A 顧客DB」 B 名寄せ成功データ C 名寄せ失敗データ D 名寄せ失敗データ、読みによるソート結果 E 名寄せ結果 1 計算機による自動名寄せ処理 2 顧客名の読みによるソート処理 3 人手による人的名寄せ作業

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 日本語文章により表記される顧客名の読
    みを決定する方法において、単語毎にその読みと他単語
    との間の接続条件を1組或は複数組用意した単語辞書を
    予め具備し、顧客名を単語単位に分割し、単語辞書を使
    用して顧客名を構成する単語とこの単語の他単語との間
    の接続条件の組合せから各単語の読みを求めることを特
    徴とする顧客名の読みを決定する方法。
  2. 【請求項2】 請求項1に記載される顧客名の読みを決
    定する方法において、顧客名の表記と読みとを組にした
    顧客名辞書を具備し、顧客名辞書に登録されている顧客
    名については顧客名辞書から顧客名の読みを決定するこ
    とを特徴とする顧客名の読みを決定する方法。
  3. 【請求項3】 請求項1および請求項2の何れかに記載
    される顧客名の読みを決定する方法において、顧客名の
    表記にカタカナ部分が含まれている場合、カタカナ部分
    以外の部分の単語について単語辞書を使用して当該単語
    の読みを決定し、決定した各単語の読みとカタカナ部分
    とを顧客名の表記順に連結することを特徴とする顧客名
    の読みを決定する方法。
  4. 【請求項4】 「顧客DB」Aから顧客名を入力して
    「計算機による自動名寄せ処理」1を行うことにより
    「名寄せ成功データ」Bおよび「名寄せ失敗データ」C
    を求め、 「名寄せ失敗データ」Cを入力して「顧客名の読みによ
    るソート処理」2を行うことにより「名寄せ失敗デー
    タ、読みによるソート結果」Dを求め、 「名寄せ失敗データ、読みによるソート結果」Dおよび
    「名寄せ成功データ」Bに基づいて「名寄せ結果」Eを
    作成する、 ことを特徴とする顧客名集約方法。
  5. 【請求項5】 請求項4に記載される顧客名集約方法に
    おいて、「顧客名の読みによるソート処理」2における
    顧客名の読みの決定は請求項1ないし請求項3に記載さ
    れる方法の何れかによるものであることを特徴とする顧
    客名集約方法。
JP33150093A 1993-12-27 1993-12-27 顧客名の読みを決定する方法およびこの方法を実施する顧客名集約方法 Pending JPH07192053A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33150093A JPH07192053A (ja) 1993-12-27 1993-12-27 顧客名の読みを決定する方法およびこの方法を実施する顧客名集約方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33150093A JPH07192053A (ja) 1993-12-27 1993-12-27 顧客名の読みを決定する方法およびこの方法を実施する顧客名集約方法

Publications (1)

Publication Number Publication Date
JPH07192053A true JPH07192053A (ja) 1995-07-28

Family

ID=18244336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33150093A Pending JPH07192053A (ja) 1993-12-27 1993-12-27 顧客名の読みを決定する方法およびこの方法を実施する顧客名集約方法

Country Status (1)

Country Link
JP (1) JPH07192053A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002328950A (ja) * 2001-04-16 2002-11-15 Internatl Business Mach Corp <Ibm> プログラム、データ処理システム及び記憶媒体
JP2006163941A (ja) * 2004-12-08 2006-06-22 Nec Corp 重複レコード検出システム、および重複レコード検出プログラム
WO2010113290A1 (ja) * 2009-03-31 2010-10-07 富士通株式会社 名寄せ装置、名寄せ方法および名寄せプログラム
WO2010116475A1 (ja) * 2009-03-30 2010-10-14 富士通株式会社 情報管理装置および情報管理プログラム
JP2011008389A (ja) * 2009-06-24 2011-01-13 Hitachi Information Systems Ltd カナ氏名によるデータの名寄せ処理方法および名寄せ処理システム、ならびにそのためのプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002328950A (ja) * 2001-04-16 2002-11-15 Internatl Business Mach Corp <Ibm> プログラム、データ処理システム及び記憶媒体
JP2006163941A (ja) * 2004-12-08 2006-06-22 Nec Corp 重複レコード検出システム、および重複レコード検出プログラム
WO2010116475A1 (ja) * 2009-03-30 2010-10-14 富士通株式会社 情報管理装置および情報管理プログラム
GB2481930A (en) * 2009-03-30 2012-01-11 Fujitsu Ltd Information management device and information management program
US20120011172A1 (en) * 2009-03-30 2012-01-12 Fujitsu Limited Information management apparatus and computer product
JP5477376B2 (ja) * 2009-03-30 2014-04-23 富士通株式会社 情報管理装置および情報管理プログラム
US9461884B2 (en) 2009-03-30 2016-10-04 Fujitsu Limited Information management device and computer-readable medium recorded therein information management program
WO2010113290A1 (ja) * 2009-03-31 2010-10-07 富士通株式会社 名寄せ装置、名寄せ方法および名寄せプログラム
JP5370478B2 (ja) * 2009-03-31 2013-12-18 富士通株式会社 名寄せ装置、名寄せ方法および名寄せプログラム
US9058358B2 (en) 2009-03-31 2015-06-16 Fujitsu Limited Merging apparatus and merging method
JP2011008389A (ja) * 2009-06-24 2011-01-13 Hitachi Information Systems Ltd カナ氏名によるデータの名寄せ処理方法および名寄せ処理システム、ならびにそのためのプログラム

Similar Documents

Publication Publication Date Title
US5819265A (en) Processing names in a text
US5832480A (en) Using canonical forms to develop a dictionary of names in a text
EP1076861B1 (en) Machine-assisted translation tools
US6345244B1 (en) System, method, and product for dynamically aligning translations in a translation-memory system
US5983171A (en) Auto-index method for electronic document files and recording medium utilizing a word/phrase analytical program
CN101308492A (zh) 信息处理装置、信息处理方法、程序和记录介质
US9594742B2 (en) Method and apparatus for matching misspellings caused by phonetic variations
JPH0765035A (ja) 構造化文書検索装置
US5384702A (en) Method for self-correction of grammar in machine translation
Schreier /h/insertion as a ‘camouflage archaism’? Dialect contact, colonial lag and the feature pool in South Atlantic English
US20050065947A1 (en) Thesaurus maintaining system and method
JPH07192053A (ja) 顧客名の読みを決定する方法およびこの方法を実施する顧客名集約方法
JP2921522B1 (ja) データベース結合方法及び装置及びデータベース結合プログラムを格納した記憶媒体
US20020129066A1 (en) Computer implemented method for reformatting logically complex clauses in an electronic text-based document
CN1830022B (zh) 语音应答系统及其方法
JP3517345B2 (ja) 住所情報による異種データの結合処理方法および装置
JP2001137788A (ja) 地名表記辞書作成方法および地名表記辞書作成装置
Culpeper et al. The borrowing of Classical and Romance words into English: a study based on the electronic Oxford English Dictionary
EP1080424A1 (en) A method and arrangement for translation of information
US6523031B1 (en) Method for obtaining structured information exists in special data format from a natural language text by aggregation
JP5132430B2 (ja) 姓名候補を生成する情報処理装置、情報処理方法、およびプログラム
JPH0782497B2 (ja) 文書処理装置
Whippie A Study of the use of MARC Language Codes in OCLC Catalog Records
JP3095509B2 (ja) 日本文単語変換編集処理方式
JPH08320873A (ja) キーワード自動抽出方法および装置