JPH11353316A - 省略語補完装置 - Google Patents
省略語補完装置Info
- Publication number
- JPH11353316A JPH11353316A JP10156158A JP15615898A JPH11353316A JP H11353316 A JPH11353316 A JP H11353316A JP 10156158 A JP10156158 A JP 10156158A JP 15615898 A JP15615898 A JP 15615898A JP H11353316 A JPH11353316 A JP H11353316A
- Authority
- JP
- Japan
- Prior art keywords
- formal name
- abbreviation
- formal
- name
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 省略した文字に関する記述を省いて装置に入
力することができ、且つ、システム側も正式名称以外の
省略文字を補完するための情報を保持せずに適合する正
式名称を出力することができる。 【解決手段】 入力された省略語の正式名称を抽出する
省略語補完装置において、1つまたは複数の正式名称が
格納されている正式名称情報格納部2と、省略語と正式
名称情報格納部2に格納されている正式名称の文字を比
較し、省略語の文字がすべて含まれている正式名称を正
式名称候補として抽出する省略語補完処理部3とを備え
る。また、省略語補完処理部3が複数の正式名称候補を
抽出した場合は、評価処理部5は予め登録されている1
つまたは複数の評価基準に基づき正式名称を決定する。
更に、評価処理部5は複数の正式名称候補から出力する
正式名称を決定する場合は、省略語と前記複数の正式名
称候補の文字の対応関係に基いて決定する。
力することができ、且つ、システム側も正式名称以外の
省略文字を補完するための情報を保持せずに適合する正
式名称を出力することができる。 【解決手段】 入力された省略語の正式名称を抽出する
省略語補完装置において、1つまたは複数の正式名称が
格納されている正式名称情報格納部2と、省略語と正式
名称情報格納部2に格納されている正式名称の文字を比
較し、省略語の文字がすべて含まれている正式名称を正
式名称候補として抽出する省略語補完処理部3とを備え
る。また、省略語補完処理部3が複数の正式名称候補を
抽出した場合は、評価処理部5は予め登録されている1
つまたは複数の評価基準に基づき正式名称を決定する。
更に、評価処理部5は複数の正式名称候補から出力する
正式名称を決定する場合は、省略語と前記複数の正式名
称候補の文字の対応関係に基いて決定する。
Description
【0001】
【発明の属する技術分野】本発明は、入力された語が正
式な名称でなく、省略された名称であった場合に、適合
する正式な名称を出力する省略語補完装置に関する。
式な名称でなく、省略された名称であった場合に、適合
する正式な名称を出力する省略語補完装置に関する。
【0002】
【従来の技術】従来より、何らかの指令への引数等で正
式名称を与える必要がある場合に、正式名称を直接記述
するのではなく、その正式名称を略した省略語を与える
ことが考えられている。 「文献1」UNIXプログラミング環境 「文献2」特開平7−334510 例えば、コンピュータのOS(operating system)で
は、正規表現と呼ばれる省略形を用いて各種の語を省略
して与える構成をとっている。上記文献1では、UNI
Xにおいてgrepというツールを用いて正規表現が扱える
ことを示している。また、文献2では、ユーザが検索の
問い合わせ入力を自然言語の形式で入力することがで
き、検索入力で不十分である情報を内部の展開規則を用
いて補完する機能を有している。
式名称を与える必要がある場合に、正式名称を直接記述
するのではなく、その正式名称を略した省略語を与える
ことが考えられている。 「文献1」UNIXプログラミング環境 「文献2」特開平7−334510 例えば、コンピュータのOS(operating system)で
は、正規表現と呼ばれる省略形を用いて各種の語を省略
して与える構成をとっている。上記文献1では、UNI
Xにおいてgrepというツールを用いて正規表現が扱える
ことを示している。また、文献2では、ユーザが検索の
問い合わせ入力を自然言語の形式で入力することがで
き、検索入力で不十分である情報を内部の展開規則を用
いて補完する機能を有している。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
省略語補完装置では、以下の様な問題点があった。文献
1においては、正規表現による省略語の表現では、省略
されている語の種類や位置について記述しなければなら
ない。例えば、正式名称「研究促進本部」に適合する省
略語を考えると、「研.*促.*本」や「研.*本.」
のような省略語が必要とされる。ここで、「.」は任意
の1文字を表し、「*」は前の文字種と同一の文字が0
回以上連続する文字列を表すものとする。また、文献2
では検索問い合わせの入力の際には、ユーザは省略する
情報について特に配慮する必要はないが、システムが省
略語の補完処理に必要な展開規則を事前に用意する必要
がある。
省略語補完装置では、以下の様な問題点があった。文献
1においては、正規表現による省略語の表現では、省略
されている語の種類や位置について記述しなければなら
ない。例えば、正式名称「研究促進本部」に適合する省
略語を考えると、「研.*促.*本」や「研.*本.」
のような省略語が必要とされる。ここで、「.」は任意
の1文字を表し、「*」は前の文字種と同一の文字が0
回以上連続する文字列を表すものとする。また、文献2
では検索問い合わせの入力の際には、ユーザは省略する
情報について特に配慮する必要はないが、システムが省
略語の補完処理に必要な展開規則を事前に用意する必要
がある。
【0004】このような点から、本発明は、入力された
語が正式名称の一部を用いた略称である場合において、
省略した文字に関する記述を省いて装置に入力すること
ができ、且つ、システム側も正式名称以外の省略文字を
補完するための情報を保持せずに適合する正式名称を出
力することができる省略語補完装置を提供することを目
的とする。
語が正式名称の一部を用いた略称である場合において、
省略した文字に関する記述を省いて装置に入力すること
ができ、且つ、システム側も正式名称以外の省略文字を
補完するための情報を保持せずに適合する正式名称を出
力することができる省略語補完装置を提供することを目
的とする。
【0005】
【課題を解決するための手段】係る課題を解決するた
め、本発明は、入力された省略語の正式名称を抽出する
省略語補完装置において、1つまたは複数の正式名称が
格納されている正式名称情報格納部と、省略語と正式名
称情報格納部に格納されている正式名称の文字を比較
し、省略語の文字がすべて含まれている正式名称を正式
名称候補として抽出する省略語補完処理部とを備えた省
略語補完装置を提供する。
め、本発明は、入力された省略語の正式名称を抽出する
省略語補完装置において、1つまたは複数の正式名称が
格納されている正式名称情報格納部と、省略語と正式名
称情報格納部に格納されている正式名称の文字を比較
し、省略語の文字がすべて含まれている正式名称を正式
名称候補として抽出する省略語補完処理部とを備えた省
略語補完装置を提供する。
【0006】また、省略語補完処理部が複数の正式名称
候補を抽出した場合は、評価処理部は予め登録されてい
る1つまたは複数の評価基準に基づき正式名称を決定す
る。
候補を抽出した場合は、評価処理部は予め登録されてい
る1つまたは複数の評価基準に基づき正式名称を決定す
る。
【0007】更に、評価処理部は複数の正式名称候補か
ら出力する正式名称を決定する場合は、省略語と前記複
数の正式名称候補の文字の対応関係に基いて決定する。
ら出力する正式名称を決定する場合は、省略語と前記複
数の正式名称候補の文字の対応関係に基いて決定する。
【0008】
【発明の実施の形態】以下、本発明の実施の形態に係る
省略語補完装置について、図面を用いて詳細に説明す
る。
省略語補完装置について、図面を用いて詳細に説明す
る。
【0009】図1は、本発明の省略語補完装置の実施の
形態を示すブロック構成図であり、ワークステーション
やパソコン等の情報処理装置上で実現されるものであ
る。
形態を示すブロック構成図であり、ワークステーション
やパソコン等の情報処理装置上で実現されるものであ
る。
【0010】図1の省略語補完装置は、入力部1、正式
名称情報格納部2、省略語補完処理部3、正式名称格納
部4、評価処理部5、出力部6から構成される。
名称情報格納部2、省略語補完処理部3、正式名称格納
部4、評価処理部5、出力部6から構成される。
【0011】入力部1は、データの検索等に用いる省略
語を入力するものである。図2にユーザが入力する省略
語の例を示す。正式名称情報格納部2は、正式名称に関
する情報が格納されており、省略語補完処理部3に対
し、正式名称情報を出力するものである。図3に正式名
称情報格納部の例を示す。例では、正式名称に番号を付
与し、3つのカテゴリーに分けて格納している。正式名
称の格納方法は図3に限定されず、カテゴリーに分けず
に格納してもよい。
語を入力するものである。図2にユーザが入力する省略
語の例を示す。正式名称情報格納部2は、正式名称に関
する情報が格納されており、省略語補完処理部3に対
し、正式名称情報を出力するものである。図3に正式名
称情報格納部の例を示す。例では、正式名称に番号を付
与し、3つのカテゴリーに分けて格納している。正式名
称の格納方法は図3に限定されず、カテゴリーに分けず
に格納してもよい。
【0012】省略語補完処理部3は、入力部1から入力
された省略語を受け取り、正式名称情報格納部2に格納
されている正式名称情報を獲得し、省略語と正式名称の
対応づけを行い、省略語の文字がすべて含まれる正式名
称を抽出するものである。正式名称格納部4は、省略語
補完処理部3で抽出された正式名称を格納するものであ
る。評価処理部5は、省略語補完処理部3で複数の正式
名称が抽出された場合に、正式名称格納部4に格納され
た正式名称の候補から出力する正式名称を決定するもの
である。出力部6は、省略語補完処理部3により抽出さ
れた正式名称を出力するものである。
された省略語を受け取り、正式名称情報格納部2に格納
されている正式名称情報を獲得し、省略語と正式名称の
対応づけを行い、省略語の文字がすべて含まれる正式名
称を抽出するものである。正式名称格納部4は、省略語
補完処理部3で抽出された正式名称を格納するものであ
る。評価処理部5は、省略語補完処理部3で複数の正式
名称が抽出された場合に、正式名称格納部4に格納され
た正式名称の候補から出力する正式名称を決定するもの
である。出力部6は、省略語補完処理部3により抽出さ
れた正式名称を出力するものである。
【0013】ここで、評価処理部5について詳細に説明
する。
する。
【0014】評価処理部5は、1つまたは複数の評価基
準が予め登録されており、処理の対象に合わせて使用す
る評価基準を選択する。図4に評価基準の例を示す。こ
こでは、3個の評価基準を格納している。番号1の評価
基準は、抽出された正式名称をすべて出力するものであ
る。番号2の評価基準は、正式名称に予め優先順位を付
与しておき、抽出された複数の正式名称のうち、最も優
先順位の高い正式名称を出力するものである。
準が予め登録されており、処理の対象に合わせて使用す
る評価基準を選択する。図4に評価基準の例を示す。こ
こでは、3個の評価基準を格納している。番号1の評価
基準は、抽出された正式名称をすべて出力するものであ
る。番号2の評価基準は、正式名称に予め優先順位を付
与しておき、抽出された複数の正式名称のうち、最も優
先順位の高い正式名称を出力するものである。
【0015】番号3の評価基準は、省略語と正式名称の
文字列の対応づけを行い、連続して対応する箇所の個数
を利用するものである。図5に、連続して対応する箇所
数を表す図を示す。
文字列の対応づけを行い、連続して対応する箇所の個数
を利用するものである。図5に、連続して対応する箇所
数を表す図を示す。
【0016】図5は、省略語「ABCD」に対応する正
式名称が3個抽出された場合を示している。対応関係欄
は、省略語と正式名称との対応関係を示しており、省略
語と正式名称の文字が同一の場合は、その同一文字を示
し、同一文字でない場合は、その箇所を「x」で示して
いる。連続箇所数欄は、対応関係欄において、同一文字
である文字数が、連続して現れる個数を示している。
式名称が3個抽出された場合を示している。対応関係欄
は、省略語と正式名称との対応関係を示しており、省略
語と正式名称の文字が同一の場合は、その同一文字を示
し、同一文字でない場合は、その箇所を「x」で示して
いる。連続箇所数欄は、対応関係欄において、同一文字
である文字数が、連続して現れる個数を示している。
【0017】図5において、省略語「ABCD」に対
し、適合する正式名称は3個あるが、連続対応する個数
が異なっている。連続対応個数が多いほど評価を高くし
た場合、正式名称1、2、3の順に優先順位が付けられ
る。
し、適合する正式名称は3個あるが、連続対応する個数
が異なっている。連続対応個数が多いほど評価を高くし
た場合、正式名称1、2、3の順に優先順位が付けられ
る。
【0018】評価基準は予め使用する基準を設定してお
いてもよいし、処理のつどに選択するようにしてもよ
い。また、評価基準は一つの基準のみではなく、複数の
基準を合わせて判断してもよい。
いてもよいし、処理のつどに選択するようにしてもよ
い。また、評価基準は一つの基準のみではなく、複数の
基準を合わせて判断してもよい。
【0019】連続対応個数による評価基準においては、
連続対応箇所の最長数を利用して正式名称を決定するこ
ともできる。例えば、省略語がABCDの場合の対応関
係が (1)「ABxCDx」 連続対応「AB」「CD」の
2つ (2)「ABCxDx」 連続対応「AB」「BC」の
2つ の場合、連続対応個数は両方とも2つであるが、連続対
応箇所の最長数が(1)は「AB」または「CD」の2
であるのに対し、(2)は「ABC」の3である。連続
対応箇所の最長数が少ないほど評価を高くした場合は正
式名称として1を出力することが可能である。
連続対応箇所の最長数を利用して正式名称を決定するこ
ともできる。例えば、省略語がABCDの場合の対応関
係が (1)「ABxCDx」 連続対応「AB」「CD」の
2つ (2)「ABCxDx」 連続対応「AB」「BC」の
2つ の場合、連続対応個数は両方とも2つであるが、連続対
応箇所の最長数が(1)は「AB」または「CD」の2
であるのに対し、(2)は「ABC」の3である。連続
対応箇所の最長数が少ないほど評価を高くした場合は正
式名称として1を出力することが可能である。
【0020】なお、連続対応箇所の最長数が少ないとい
うことは対象となる正式名称から全体的に文字を拾って
いることを指している。
うことは対象となる正式名称から全体的に文字を拾って
いることを指している。
【0021】次に、本発明の省略語補完装置の動作を図
6に示すフローチャートを用いて説明する。
6に示すフローチャートを用いて説明する。
【0022】ここで、正式名称情報格納部2には、複数
の正式名称情報が格納されているものとする。
の正式名称情報が格納されているものとする。
【0023】まず、入力部1より、省略語を入力する
(ステップ1)。省略語補完処理部3は、正式名称情報
格納部2から、格納されている正式名称情報をすべて読
み込む(ステップ2)。次に、省略語補完処理部3は、
読み込んだ正式名称情報から処理対象に1つ抽出し(ス
テップ3)、省略語と正式名称の文字を比較し、対応づ
けを行う(ステップ4)。
(ステップ1)。省略語補完処理部3は、正式名称情報
格納部2から、格納されている正式名称情報をすべて読
み込む(ステップ2)。次に、省略語補完処理部3は、
読み込んだ正式名称情報から処理対象に1つ抽出し(ス
テップ3)、省略語と正式名称の文字を比較し、対応づ
けを行う(ステップ4)。
【0024】ステップ4の処理において、省略語と正式
名称が適合すると判断された場合は、その適合した正式
名称を正式名称格納部4に格納する(ステップ5)。次
に、読み込んだ正式名称情報のすべてについて処理が終
了したか否かを判断し、未処理の正式名称情報が存在す
る場合は、ステップ3に戻り、ステップ3からステップ
5までの処理を繰り返す。
名称が適合すると判断された場合は、その適合した正式
名称を正式名称格納部4に格納する(ステップ5)。次
に、読み込んだ正式名称情報のすべてについて処理が終
了したか否かを判断し、未処理の正式名称情報が存在す
る場合は、ステップ3に戻り、ステップ3からステップ
5までの処理を繰り返す。
【0025】すべての正式名称情報について処理が終了
した場合は、ステップ7に処理を進める(ステップ
6)。正式名称を抽出した結果、複数の正式名称が抽出
されたかを判断する。複数の正式名称が抽出された場合
は、ステップ8に進み、複数の正式名称が抽出されない
場合はステップ10に進む(ステップ7)。
した場合は、ステップ7に処理を進める(ステップ
6)。正式名称を抽出した結果、複数の正式名称が抽出
されたかを判断する。複数の正式名称が抽出された場合
は、ステップ8に進み、複数の正式名称が抽出されない
場合はステップ10に進む(ステップ7)。
【0026】ステップ8において、予め設定されている
複数の評価基準のうち、使用する評価基準を選択する
(ステップ8)。選択した評価基準に基づき正式名称格
納部4に格納されている正式名称のうち出力する正式名
称を決定する(ステップ9)。ステップ10において、
抽出された正式名称を出力する。
複数の評価基準のうち、使用する評価基準を選択する
(ステップ8)。選択した評価基準に基づき正式名称格
納部4に格納されている正式名称のうち出力する正式名
称を決定する(ステップ9)。ステップ10において、
抽出された正式名称を出力する。
【0027】次に、省略語と正式名称との文字の比較処
理を行うステップ4について、図7のフローチャートを
用いて詳細に説明する。
理を行うステップ4について、図7のフローチャートを
用いて詳細に説明する。
【0028】まず、省略語を配列P(n)に格納し、文
字インデックスiに1を代入する。ここでnは、省略語
の文字数を表す(ステップ21)。正式名称を配列Q
(m)に格納し、文字インデックスjに1を代入する。
ここでmは、正式名称の文字数を表す(ステップ2
2)。次に、省略語Pのi番目の文字と正式名称Qのj
番目の文字が等しいかを判定する。等しければ、ステッ
プ24に進み、等しくない場合はステップ25に処理を
進める(ステップ23)。
字インデックスiに1を代入する。ここでnは、省略語
の文字数を表す(ステップ21)。正式名称を配列Q
(m)に格納し、文字インデックスjに1を代入する。
ここでmは、正式名称の文字数を表す(ステップ2
2)。次に、省略語Pのi番目の文字と正式名称Qのj
番目の文字が等しいかを判定する。等しければ、ステッ
プ24に進み、等しくない場合はステップ25に処理を
進める(ステップ23)。
【0029】ステップ24において、省略語Pの文字イ
ンデックスiに1加算し、次の文字へ処理を移す(ステ
ップ24)。ステップ25においては、ステップ23の
判定結果にかかわらず正式名称Qの文字インデックスj
に1加算し、次の文字に処理を移す(ステップ25)。
ここで省略語Pの文字インデックスiがn+1に達して
いるか否かを判断する。達している場合は、ステップ2
8に進み、達していない場合は、ステップ27に処理を
進める。
ンデックスiに1加算し、次の文字へ処理を移す(ステ
ップ24)。ステップ25においては、ステップ23の
判定結果にかかわらず正式名称Qの文字インデックスj
に1加算し、次の文字に処理を移す(ステップ25)。
ここで省略語Pの文字インデックスiがn+1に達して
いるか否かを判断する。達している場合は、ステップ2
8に進み、達していない場合は、ステップ27に処理を
進める。
【0030】ステップ27において、正式名称Qの文字
インデックスjがm+1に達しているか否かを判断す
る。達している場合は、ステップ29に進み、達してい
ない場合は、ステップ23に戻り、ステップ23からス
テップ26の処理を繰り返す。
インデックスjがm+1に達しているか否かを判断す
る。達している場合は、ステップ29に進み、達してい
ない場合は、ステップ23に戻り、ステップ23からス
テップ26の処理を繰り返す。
【0031】ステップ28においては、iがn+1に達
しているので、正式名称の文字の中に省略語の文字がす
べて含まれていることを表している。よって、読み込ん
だ正式名称が省略語と適合するという結果を返す(ステ
ップ28)。ステップ29においては、iがn+1に達
しておらず、かつ、処理対象である正式名称の最後の文
字まで処理が到達したことを表している。よって、読み
込んだ正式名称は省略語と不適合であるとの結果を返す
(ステップ29)。
しているので、正式名称の文字の中に省略語の文字がす
べて含まれていることを表している。よって、読み込ん
だ正式名称が省略語と適合するという結果を返す(ステ
ップ28)。ステップ29においては、iがn+1に達
しておらず、かつ、処理対象である正式名称の最後の文
字まで処理が到達したことを表している。よって、読み
込んだ正式名称は省略語と不適合であるとの結果を返す
(ステップ29)。
【0032】次に、実際の事例と図6および図7のフロ
ーチャートを用いて、本発明の処理過程を具体的に説明
する。
ーチャートを用いて、本発明の処理過程を具体的に説明
する。
【0033】省略語として、図2に示す省略語例の番号
1「情シ開山本」を用い、正式名称情報として、図3に
示す正式名称情報を用いるものとする。
1「情シ開山本」を用い、正式名称情報として、図3に
示す正式名称情報を用いるものとする。
【0034】まず、省略語「情シ開山本」を入力する
(ステップ1)。正式名称情報格納部2から正式名称情
報をすべて読み込み(ステップ2)、読み込んだ正式名
称のうち、番号1の「情報システム開発山本」を処理の
対象とする(ステップ3)。
(ステップ1)。正式名称情報格納部2から正式名称情
報をすべて読み込み(ステップ2)、読み込んだ正式名
称のうち、番号1の「情報システム開発山本」を処理の
対象とする(ステップ3)。
【0035】ここで、省略語「情シ開山本」を配列P
(n)に格納し、文字インデックスiに1を代入する
(ステップ21)。
(n)に格納し、文字インデックスiに1を代入する
(ステップ21)。
【0036】 (P(1),...,P(5))=("情","シ","開","山","本)。
【0037】次に、正式名称「情報システム開発山本」
を配列Q(m)に格納し、文字インデックスjに1を代
入する(ステップ22)。
を配列Q(m)に格納し、文字インデックスjに1を代
入する(ステップ22)。
【0038】(Q(1),...,Q(10))=("情","報","シ","
ス","テ","ム","開","発","山","本)。
ス","テ","ム","開","発","山","本)。
【0039】省略語の1番目の文字"情"と正式名称の1
番目の文字"情"を比較する(ステップ33)。この場
合、等しい文字であるため、文字インデックスiを1加
算するとともに、文字インデックスjを1加算する(ス
テップ24、25)次に、文字インデックスiが省略語
の文字数5+1と等しいかを判断する。
番目の文字"情"を比較する(ステップ33)。この場
合、等しい文字であるため、文字インデックスiを1加
算するとともに、文字インデックスjを1加算する(ス
テップ24、25)次に、文字インデックスiが省略語
の文字数5+1と等しいかを判断する。
【0040】ここでは、i=1であるため、ステップ2
7に進み、同様に文字インデックスjが正式名称の文字
数10+1と等しいかを判断する。j=1であるため処
理をステップ23に戻す。
7に進み、同様に文字インデックスjが正式名称の文字
数10+1と等しいかを判断する。j=1であるため処
理をステップ23に戻す。
【0041】同様に、S23からS27による省略語と
正式名称の文字の比較を繰り返す。図8(a)に正式名
称「情報システム開発山本」と比較した場合の、このル
ープ処理における内部状態を示す。
正式名称の文字の比較を繰り返す。図8(a)に正式名
称「情報システム開発山本」と比較した場合の、このル
ープ処理における内部状態を示す。
【0042】ステップ26で文字インデックスiが省略
語の文字数5+1と等しくなると、省略語のすべての文
字数が正式名称に含まれていることになるので、処理の
結果として「適合」を出力し、正式名称に適合した「情
報システム開発山本」を、正式名称格納部4に格納する
(ステップ28、ステップ5)。
語の文字数5+1と等しくなると、省略語のすべての文
字数が正式名称に含まれていることになるので、処理の
結果として「適合」を出力し、正式名称に適合した「情
報システム開発山本」を、正式名称格納部4に格納する
(ステップ28、ステップ5)。
【0043】次に、未処理の正式名称情報が存在するか
を判断し(ステップ6)、まだ未処理の物がある場合は
処理を繰り返す。ここでは、図3の番号2の正式名称
「情報システム開発山田」を読み込み、処理の対象とす
る(ステップ3)。
を判断し(ステップ6)、まだ未処理の物がある場合は
処理を繰り返す。ここでは、図3の番号2の正式名称
「情報システム開発山田」を読み込み、処理の対象とす
る(ステップ3)。
【0044】正式名称「情報システム開発山田」を配列
Q(m)に格納し、文字インデックスjに1を代入する
(ステップ22)。
Q(m)に格納し、文字インデックスjに1を代入する
(ステップ22)。
【0045】(Q(1),...,Q(10))=("情","報","シ","
ス","テ","ム","開","発","山","田)。
ス","テ","ム","開","発","山","田)。
【0046】ステップS23からS27による省略語と
正式名称の文字の比較を繰り返す。図8(b)に正式名
称「情報システム開発山田」と比較した場合の、このル
ープ処理における内部状態を示す。
正式名称の文字の比較を繰り返す。図8(b)に正式名
称「情報システム開発山田」と比較した場合の、このル
ープ処理における内部状態を示す。
【0047】ステップ26で文字インデックスiが省略
語の文字数5+1と一致せず、ステップ7で文字インデ
ックスjが正式名称の文字数10+1と等しくなると、
省略語のすべての文字数が正式名称に含まれておらず、
正式名称のすべての文字について対応づけを 終了した
ことになるので、処理の結果として「不適合」を出力す
る(ステップ29)。
語の文字数5+1と一致せず、ステップ7で文字インデ
ックスjが正式名称の文字数10+1と等しくなると、
省略語のすべての文字数が正式名称に含まれておらず、
正式名称のすべての文字について対応づけを 終了した
ことになるので、処理の結果として「不適合」を出力す
る(ステップ29)。
【0048】ここで、正式名称情報のすべてについて処
理が終了し、適合した正式名称は番号1の「情報システ
ム開発山本」のみであるとする。したがって、ステップ
6において正式名称情報が存在せず、ステップ7におい
て正式名称が複数存在しないため、正式名称として、
「情報システム開発山本」を出力する(ステップ1
0)。
理が終了し、適合した正式名称は番号1の「情報システ
ム開発山本」のみであるとする。したがって、ステップ
6において正式名称情報が存在せず、ステップ7におい
て正式名称が複数存在しないため、正式名称として、
「情報システム開発山本」を出力する(ステップ1
0)。
【0049】次に、省略語として、図2に示す省略語例
の番号2「信シ開山本」を用い、正式名称情報として、
図3に示す正式名称情報を用いた場合の文字の比較処理
について説明する。
の番号2「信シ開山本」を用い、正式名称情報として、
図3に示す正式名称情報を用いた場合の文字の比較処理
について説明する。
【0050】ステップS23からS27による省略語と
正式名称の文字の比較を繰り返すと、正式名称5の「通
信システム開発山本」と、正式名称8の「信号システム
開発山本」の2つの正式名称が抽出される。正式名称
「通信システム開発山本」の内部状態を図9(a)に示
し、正式名称「信号システム開発山本」の内部状態を図
9(b)に示す。
正式名称の文字の比較を繰り返すと、正式名称5の「通
信システム開発山本」と、正式名称8の「信号システム
開発山本」の2つの正式名称が抽出される。正式名称
「通信システム開発山本」の内部状態を図9(a)に示
し、正式名称「信号システム開発山本」の内部状態を図
9(b)に示す。
【0051】したがって、ステップ7において複数候補
が有りと判断され、正式名称の選択処理であるステップ
8とステップ9に処理を移す。ステップ8おいて、図4
に示す評価基準から、使用する評価基準を選択する。
が有りと判断され、正式名称の選択処理であるステップ
8とステップ9に処理を移す。ステップ8おいて、図4
に示す評価基準から、使用する評価基準を選択する。
【0052】ここでは、番号3の連続対応個数を利用す
る評価基準を選択し、連続対応個数が多いものほど評価
を高くするものとする。
る評価基準を選択し、連続対応個数が多いものほど評価
を高くするものとする。
【0053】連続対応個数の算出は、比較処理のステッ
プ23からステップ27のループ処理において省略語用
の文字インデックスiが2回連続してインクリメントさ
れた個数をカウントすることで求められる。内部状態表
でいえば、文字インデックスiの項において2からnま
での数で1回しか出現しない数字の個数が連続対応個数
にあたる。
プ23からステップ27のループ処理において省略語用
の文字インデックスiが2回連続してインクリメントさ
れた個数をカウントすることで求められる。内部状態表
でいえば、文字インデックスiの項において2からnま
での数で1回しか出現しない数字の個数が連続対応個数
にあたる。
【0054】例えば、図9(a)文字インデックスiの
項において1回しか出現しない数字は2と5であり、連
続対応個数は2つとなる。文字インデックスiが6の場
合は文末であり、実際の文字を指していないので連続対
応個数としてカウントしない。
項において1回しか出現しない数字は2と5であり、連
続対応個数は2つとなる。文字インデックスiが6の場
合は文末であり、実際の文字を指していないので連続対
応個数としてカウントしない。
【0055】正式名称5および8について、省略語「信
シ開山本」との対応関係を図10に示す。正式名称5の
「通信システム開発山本」は連続対応個数が2つであ
り、正式名称8の「信号システム開発山本」は連続対応
個数が1つある。したがって、ステップ9で「通信シス
テム開発山本」が正式名称に決定され、出力される。
シ開山本」との対応関係を図10に示す。正式名称5の
「通信システム開発山本」は連続対応個数が2つであ
り、正式名称8の「信号システム開発山本」は連続対応
個数が1つある。したがって、ステップ9で「通信シス
テム開発山本」が正式名称に決定され、出力される。
【0056】
【発明の効果】以上のように、本発明によれば、ユーザ
は入力項目に対し正式名称をすべて入力することなしに
省略語で与えることができる。その際に、省略した文字
の位置や種類について言及することなく省略語を与える
ことができる。また、装置が省略語に適合する正式名称
を抽出する際にも特有の展開規則を用意することなく処
理が行える。
は入力項目に対し正式名称をすべて入力することなしに
省略語で与えることができる。その際に、省略した文字
の位置や種類について言及することなく省略語を与える
ことができる。また、装置が省略語に適合する正式名称
を抽出する際にも特有の展開規則を用意することなく処
理が行える。
【0057】さらに、正式名称の候補が複数存在する場
合において、正式名称と省略語の連続対応個数を利用す
ることで適切な正式名称を決定できる。通常、省略語を
作成する際に、正式名称の文字数が多い場合は、文字の
途中から1文字づつ取出して作成することが多く、文字
数が短い場合は連続した文字を用いて作成することが多
い。したがって、正式名称によって判断の基準を連続対
応個数が多いときに高くし、少ないときに低くするなど
適宜変更することで適切な正式名称の決定が可能であ
る。
合において、正式名称と省略語の連続対応個数を利用す
ることで適切な正式名称を決定できる。通常、省略語を
作成する際に、正式名称の文字数が多い場合は、文字の
途中から1文字づつ取出して作成することが多く、文字
数が短い場合は連続した文字を用いて作成することが多
い。したがって、正式名称によって判断の基準を連続対
応個数が多いときに高くし、少ないときに低くするなど
適宜変更することで適切な正式名称の決定が可能であ
る。
【図1】本発明の省略語補完装置の実施の形態を示すブ
ロック図である。
ロック図である。
【図2】省略語の例を示す図である。
【図3】正式名称情報格納部の内容説明図である。
【図4】評価基準の内容説明図である。
【図5】省略語「ABCD」と正式名称の連続対応関係
を示す図である。
を示す図である。
【図6】本発明の省略語補完装置の動作を示すフローチ
ャートである。
ャートである。
【図7】省略語と正式名称の文字比較処理を示すフロー
チャートである。
チャートである。
【図8】省略語「情シ開山本」と正式名称の文字比較処
理における内部状態を示す図である。
理における内部状態を示す図である。
【図9】省略語「信シ開山本」と正式名称の文字比較処
理における内部状態を示す図である。
理における内部状態を示す図である。
【図10】省略語「信シ開山本」と正式名称の連続対応
関係を示す図である。
関係を示す図である。
1 入力部 2 正式名称情報格納部 3 省略語補完処理部 4 正式名称格納部 5 評価処理部 6 出力部
Claims (3)
- 【請求項1】 入力された省略語の正式名称を抽出する
省略語補完装置において、 1つまたは複数の正式名称が格納されている正式名称情
報格納部と、 省略語と前記正式名称情報格納部に格納されている正式
名称の文字を比較し、省略語の文字がすべて含まれてい
る正式名称を正式名称候補として抽出する省略語補完処
理部とを備えることを特徴とする省略語補完装置。 - 【請求項2】 請求項1において、 前記省略語補完処理部が複数の正式名称候補を抽出した
場合は、予め登録されている1つまたは複数の評価基準
に基づき正式名称を決定する評価処理部を備えることを
特徴とする省略語補完装置。 - 【請求項3】 請求項2において、 前記評価処理部は、省略語と前記複数の正式名称候補の
文字の対応関係に基き正式名称を決定することを特徴と
する省略語補完装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10156158A JPH11353316A (ja) | 1998-06-04 | 1998-06-04 | 省略語補完装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10156158A JPH11353316A (ja) | 1998-06-04 | 1998-06-04 | 省略語補完装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11353316A true JPH11353316A (ja) | 1999-12-24 |
Family
ID=15621625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10156158A Pending JPH11353316A (ja) | 1998-06-04 | 1998-06-04 | 省略語補完装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11353316A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010211256A (ja) * | 2009-03-06 | 2010-09-24 | Sky Co Ltd | 正式名称判定システム及び正式名称判定プログラム |
JP2011257922A (ja) * | 2010-06-08 | 2011-12-22 | Ntt Data Corp | 文字列入力支援装置、文字列入力支援方法およびプログラム |
JP2012022354A (ja) * | 2010-07-12 | 2012-02-02 | Fujitsu Ltd | 略称検索装置,方法およびプログラム,ならびに略称検索機能を備えるデータパース装置 |
JP2012190472A (ja) * | 2005-08-24 | 2012-10-04 | Yahoo Inc | 検索クエリ完成前の代替クエリの連想 |
JP2015521331A (ja) * | 2012-05-29 | 2015-07-27 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 地理的場所に基づいて候補用語を推奨する方法および装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01217623A (ja) * | 1988-02-26 | 1989-08-31 | Nippon Telegr & Teleph Corp <Ntt> | キーワード自動生成装置 |
JPH03150668A (ja) * | 1989-11-08 | 1991-06-27 | Fujitsu Ltd | 検索システムの入力文字列正規化方式 |
JPH06325091A (ja) * | 1993-05-13 | 1994-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 類似度評価型データベース検索装置 |
JPH08314947A (ja) * | 1995-05-22 | 1996-11-29 | Mainichi Shinbunsha:Kk | キーワード自動抽出装置 |
JPH1069487A (ja) * | 1996-08-28 | 1998-03-10 | Hitachi Ltd | あいまい名称による情報の管理方法 |
-
1998
- 1998-06-04 JP JP10156158A patent/JPH11353316A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01217623A (ja) * | 1988-02-26 | 1989-08-31 | Nippon Telegr & Teleph Corp <Ntt> | キーワード自動生成装置 |
JPH03150668A (ja) * | 1989-11-08 | 1991-06-27 | Fujitsu Ltd | 検索システムの入力文字列正規化方式 |
JPH06325091A (ja) * | 1993-05-13 | 1994-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 類似度評価型データベース検索装置 |
JPH08314947A (ja) * | 1995-05-22 | 1996-11-29 | Mainichi Shinbunsha:Kk | キーワード自動抽出装置 |
JPH1069487A (ja) * | 1996-08-28 | 1998-03-10 | Hitachi Ltd | あいまい名称による情報の管理方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012190472A (ja) * | 2005-08-24 | 2012-10-04 | Yahoo Inc | 検索クエリ完成前の代替クエリの連想 |
JP2010211256A (ja) * | 2009-03-06 | 2010-09-24 | Sky Co Ltd | 正式名称判定システム及び正式名称判定プログラム |
JP2011257922A (ja) * | 2010-06-08 | 2011-12-22 | Ntt Data Corp | 文字列入力支援装置、文字列入力支援方法およびプログラム |
JP2012022354A (ja) * | 2010-07-12 | 2012-02-02 | Fujitsu Ltd | 略称検索装置,方法およびプログラム,ならびに略称検索機能を備えるデータパース装置 |
JP2015521331A (ja) * | 2012-05-29 | 2015-07-27 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 地理的場所に基づいて候補用語を推奨する方法および装置 |
US10095711B2 (en) | 2012-05-29 | 2018-10-09 | Alibaba Group Holding Limited | Method and apparatus of recommending candidate terms based on geographical location |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3025724B2 (ja) | 類義語生成処理方法 | |
CA2204447C (en) | Document display system and electronic dictionary | |
US7113954B2 (en) | System and method for generating a taxonomy from a plurality of documents | |
US5404299A (en) | Electronic dictionary system | |
JP2006004274A (ja) | 対話処理装置、対話処理方法及び対話処理プログラム | |
US20040049742A1 (en) | Document creation support system | |
JPH11353316A (ja) | 省略語補完装置 | |
JPS63249267A (ja) | 電子ファイリング装置の管理方法 | |
JPS60176169A (ja) | 文章処理装置 | |
KR100355458B1 (ko) | 검색시스템에서의인덱스데이터와영상데이터의자동링크방법 | |
JPH10307835A (ja) | 情報処理装置及びその方法 | |
JPS6049931B2 (ja) | 情報検索方式 | |
JP2588261B2 (ja) | Ocrによる住所データベース検索装置 | |
JPH09231233A (ja) | ネットワーク検索装置 | |
JP3210842B2 (ja) | 情報処理装置 | |
JPH0756945A (ja) | 全文データベースシステム | |
JPH08249346A (ja) | 文書検索装置及び文書生成方法 | |
JPH0736934A (ja) | 情報検索方法及びその装置 | |
JP2001325293A (ja) | 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体 | |
JPH0944496A (ja) | 自然語解析方法及び装置 | |
JPH11219352A (ja) | 文書管理装置および記録媒体 | |
JP2001052022A (ja) | データ集計・参照型検索システム | |
JPH07325841A (ja) | 情報検索方法 | |
JPH0756943A (ja) | 全文データベースシステム | |
JPH0778169A (ja) | 情報検索処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040706 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040901 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041005 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050405 |