JP3224917B2 - 名標辞書作成装置 - Google Patents

名標辞書作成装置

Info

Publication number
JP3224917B2
JP3224917B2 JP23268893A JP23268893A JP3224917B2 JP 3224917 B2 JP3224917 B2 JP 3224917B2 JP 23268893 A JP23268893 A JP 23268893A JP 23268893 A JP23268893 A JP 23268893A JP 3224917 B2 JP3224917 B2 JP 3224917B2
Authority
JP
Japan
Prior art keywords
segment
name
japanese
alphanumeric
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23268893A
Other languages
English (en)
Other versions
JPH0784772A (ja
Inventor
健 飯塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP23268893A priority Critical patent/JP3224917B2/ja
Publication of JPH0784772A publication Critical patent/JPH0784772A/ja
Application granted granted Critical
Publication of JP3224917B2 publication Critical patent/JP3224917B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Stored Programmes (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、名標辞書作成装置に関
するものである。計算機システムのプログラム保守時
に、データ項目名が示すデータの内容を容易に理解する
ために、英数字による記述を日本語化することは有効で
ある。英数字項目名標の件数が非常に多い場合、日本語
に変換するための名標辞書の作成に多大の時間を要する
ので、この名標辞書の作成時間を削減することが要求さ
れている。
【0002】
【従来の技術】従来、プログラム中の英数字項目名標を
日本語項目名標に変換する名標辞書は、英数字項目名標
と、日本語項目名標とを1対1に対応するように日本語
項目名標を手作業によって入力して作成する。そして、
この名標辞書を参照して、ソースプログラム中の英数字
項目名標を理解し易い日本語項目名標に置換するように
していた。
【0003】
【発明が解決しようとする課題】上述したように従来の
名標辞書は、英数字項目名標に対応する日本語項目名標
を1対1に手作業で入力して作成していたため、項目数
が多くなるに伴い、手作業による作業負担が非常に高く
なり、名標辞書の作成に多大の時間が必要となってしま
うという問題があった。
【0004】本発明は、これらの問題を解決するため、
英数字項目名標の文字列からセグメント候補に分割して
意味のあるものの日本語セグメントを入力し、意味の無
いものを削除してセグメントファイルを作成し、このセ
グメントファイルをもとに英数字項目名標から日本語項
目名標を自動生成して名標辞書を作成し、ソースプログ
ラム中の英数字項目名標を日本語項目名標に自動変換す
るための名標辞書の作成時間を削減して迅速に名標辞書
を作成し、ソースプログラム上の英数字項目名標を日本
語項目名標にしてプログラムの保守、再構築時の可読性
を向上させることを目的としている。
【0005】
【課題を解決するための手段】図1を参照して課題を解
決するための手段を説明する。図1において、セグメン
ト分割手段5は、ソースプログラムから抽出した英数字
項目名標の文字列をセグメント候補に分割するものであ
って、英数字項目名標の文字列について先頭文字を含み
後ろから1文字づつ減らした文字列(接頭語)、末尾
文字を含み前から1文字づつ減らした文字列(接尾
語)、および指定された文字数で分割した文字列(固
定文字語)に分割してセグメントを生成するものであ
る。
【0006】セグメント生成手段10は、セグメント候
補をセグメント候補リスト8上に表示して当該セグメン
ト候補リスト8上から意味のある英数字セグメント候補
に対応づけて日本語セグメントをセグメントファイル9
に登録するものである。
【0007】名標生成手段12は、セグメントファイル
9を参照してソースプログラムから抽出した英数字項目
名標に対応する日本語項目名標を組み立てて名標辞書2
2に登録するものである。
【0008】
【作用】本発明は、図1に示すように、セグメント分割
手段5がソースプログラムから抽出した英数字項目名標
の文字列をセグメント候補に分割し、分割したセグメン
ト候補をセグメント候補リスト8上に表示し、セグメン
ト生成手段10が当該セグメント候補リスト8上から意
味のある英数字セグメント候補に対応づけて日本語セグ
メントをセグメントファイル9に登録し、名標生成手段
12がセグメントファイル9を参照してソースプログラ
ムから抽出した英数字項目名標に対応する日本語項目名
標を組み立てて名標辞書22に登録するようにしてい
る。
【0009】この際、セグメント分割手段5が英数字項
目名標の文字列について、先頭文字を含み後ろから1文
字づつ減らした文字列(接頭語)、末尾文字を含み前
から1文字づつ減らした文字列(接尾語)、および指
定された文字数で分割した文字列(固定文字語)をセ
グメント候補とするようにしている。
【0010】また、名標生成手段12がセグメントファ
イル9を参照してソースプログラムから抽出した英数字
項目名標の文字列と、最長一致法(一致したうちの最も
文字数の多いセグメントを選択)、接頭語、接尾
語、固定文字語の優先順位で一致するセグメントの日
本語セグメントを取り出してこれらを組み立てた日本語
項目名標を英数字項目名標に対応づけて登録して名標辞
書22を作成するようにしている。
【0011】従って、英数字項目名標の文字列からセグ
メント候補に分割して意味のあるものの日本語セグメン
トを入力し、意味の無いものを削除してセグメントファ
イル9を作成し、このセグメントファイル9をもとに英
数字項目名標から日本語項目名標を自動生成して名標辞
書22を作成することにより、ソースプログラム中の英
数字項目名標を日本語項目名標に変換するときに必要な
名標辞書22の作成時間を削減して迅速に名標辞書を作
成し、ソースプログラム上の英数字項目名標を日本語項
目名標にしてプログラムの保守、再構築時の可読性を向
上させることが可能となる。
【0012】
【実施例】次に、図1から図10を用いて本発明の実施
例の構成および動作を順次詳細に説明する。
【0013】図1は、本発明のシステム構成図を示す。
図1において、名標抽出手段1は、ソースプログラムか
ら英数字項目名標(変数名や配列名などの名標)を抽出
するものである。この抽出した英数字項目名標は、英数
字項目名標辞書2に登録する。
【0014】セグメントファイル作成手段3は、英数字
項目名標辞書2から英数字項目名標を取り出してその文
字列を抽出し、当該文字列を自動分割してセグメント候
補を作成するものであって、文字列抽出手段4およびセ
グメント分割手段5から構成されるものである(図3を
用いて後述する)。この自動分割して作成したセグメン
ト候補は、セグメント候補ファイル7に保存したり、セ
グメント候補リスト8として印字したりする。
【0015】文字列抽出手段4は、英数字項目名標辞書
2から取り出した英数字名標中から文字列を抽出するも
のである。セグメント分割手段5は、ソースプログラム
から抽出した英数字項目名標の文字列をセグメント候補
に分割するものであって、英数字項目名標の文字列につ
いて先頭文字を含み後ろから1文字づつ減らした文字列
(接頭語)、末尾文字を含み前から1文字づつ減らし
た文字列(接尾語)、および指定された文字数で分割
した文字列(固定文字語)に分割してセグメント候補
を生成するものである(図10の(a)、(b)参
照)。
【0016】ソートファイル6は、セグメント候補を格
納してソートするためのものである。セグメント候補フ
ァイル7は、セグメント分割手段5によって自動分割し
たセグメント候補を格納するものである。
【0017】セグメント候補リスト8は、セグメント候
補を印字したリストである。セグメント生成手段10
は、セグメント候補ファイル7から取り出したセグメン
ト候補から意味のある英数字セグメントに対応づけて日
本語セグメントをセグメントファイル9に登録するもの
である。
【0018】日本語項目名標生成手段11は、日本語項
目名標を生成するものであって、ここでは、名標生成手
段12などから構成されるものである。名標生成手段1
2は、セグメントファイル9を参照してソースプログラ
ムから抽出した英数字項目名標に対応する日本語項目名
標を組み立てて名標辞書(1)14あるいは名標辞書
(2)16に登録するものである。
【0019】ソートファイル13は、不定セグメントを
ソートするためのファイルである。名標辞書(1)14
は、名標生成手段12が作成した日本語項目名標が1つ
の名標を登録するものである。
【0020】名標辞書リスト(1)15は、名標生成手
段12が作成した日本語項目名標が1つの名標のリスト
である。名標辞書(2)16は、名標生成手段12が作
成した日本語項目名標が複数の名標を登録するものであ
る。
【0021】名標辞書リスト(2)17は、名標生成手
段12が作成した日本語項目名標が複数の名標のリスト
である。不足セグメントファイル18は、名標生成手段
12が日本語項目名標の組み立て時に、不足していたセ
グメントを格納するものである。
【0022】不足セグメントリスト19は、名標生成手
段12が日本語項目名標の組み立て時に、不足していた
セグメント候補のリストである。名標辞書(2)20
は、複数の日本語項目名標を登録した名標辞書(2)1
6および名標辞書リスト(2)17を参照してオペレー
タがチェックして不要なものを削除するための印を付加
するなどした後の複数の日本語項目名標を登録するもの
である。
【0023】名標辞書修正手段21は、1つの日本語項
目名標を登録した名標辞書(1)14および複数の日本
語項目名標を登録した名標辞書(2)20からそれぞれ
日本語項目名標を取り出して修正したりなどするもので
ある。
【0024】名標辞書22は、名標辞書修正手段21に
よって修正した後の日本語項目名標を登録するものであ
る。名標置換手段23は、名標辞書22を参照して、ソ
ースプログラムから抽出した英数字項目名標を日本語項
目名標に置換するものである。
【0025】次に、図2のフローチャートを用いて図1
の構成の全体の動作を説明する。図2において、S1
は、ソースプログラムから英数字項目名標(例えば変数
名や配列名の名標)を抽出する。
【0026】S2は、S1で抽出した英数字項目名標を
英数字項目名標辞書2に登録する。S3は、英数字項目
名標から文字列を抽出する。例えば図10の(a)、
(b)に示すように文字列“FG−KBTCD”、“C
HKDGT”を抽出する。
【0027】S4は、英数字文字列をセグメント候補に
分割する。これは、英数字文字列、例えば図10の
(b)の“FG−KBTCD”、“CHKDGT”をセ
グメント候補に自動分割する(図3を用いて詳述す
る)。
【0028】S5は、セグメント候補を表示する。S6
は、セグメント候補のうち、意味のあるものに日本語名
を入力し、無意味なものは削除する。これは、S4で自
動分割したセグメント候補を表示し、オペレータが意味
のあるものに、日本語名(日本語セグメント)をキー入
力すると共に、無意味なセグメント候補を削除する。
【0029】S7は、セグメントファイル9に登録す
る。S8は、セグメントファイル9を基に英数字項目名
標から日本語項目名標を生成する(図6を用いて後述す
る)。
【0030】S9は、生成した日本語項目名標をソース
プログラム中の英数字項目名標と置き換える。これによ
り、英数字項目名標で記述されていたソースプログラム
が日本語項目名標で記述されたソースプログラムに自動
置換されたこととなり、保守・管理がし易くなる。
【0031】以上によって、ソースプログラムから抽出
した英数字項目名標から文字列を抽出し(S1からS
3)、この抽出した文字列を分割(後述する接頭語、
接尾語、固定文字語)してセグメント候補を生成
し、このセグメント候補を表示してその日本語セグメン
トを入力させて対応づけてセグメントファイル9に登録
し(S4からS7)、このセグメントファイル9をもと
に英数字項目名標の日本語項目名標を自動生成して名標
辞書22を作成する。この作成した名標辞書22を参照
してソースプログラムの英数字項目名標を日本語項目名
標に置換する。以下順次詳細に説明する。
【0032】図3は、本発明のセグメントファイルの作
成処理フローチャートを示す。図3の(a)において、
S11は、英数字項目名標辞書2から1件データを読み
込む。
【0033】S12は、ファイル終了か判別する。これ
は、英数字項目名標辞書2から取り出す英数字項目名標
がなくなったか判別する。YESの場合には、S19に
進む。一方、NOの場合には、S13からS18によっ
て、英数字項目名標から抽出した文字列を自動分割して
セグメント候補を生成する。
【0034】S13は、英数字項目名標を“−”(ハイ
フォン)で分割する(文字列化する)。これは、例えば
図4の英数字項目名標“FG−KBTCD−CHKDG
T”について、“−”で分割した文字列(FG、KBT
CD、CHKGT)を生成する。
【0035】S14は、文字列から接頭語を抽出す
る。この接頭語は、図4に示すように、先頭文字を含
み、後ろから1文字づつ減らした文字列を2文字になる
まで繰り返し、抽出する。例えば図4のKBTCDの場
合 ・KBTC ・KBT ・KB という文字列を抽出する。
【0036】S15は、文字列から接尾語を抽出す
る。この接尾語は、図4に示すように、末尾文字を含
み、先頭から1文字づつ減らした文字列を2文字になる
まで繰り返し、抽出する。例えば図4のKBTCDの場
合 ・BTCD ・TCD ・CD という文字列を抽出する。
【0037】S16は、固定文字数分割有りか判別す
る。YESの場合には、S17で文字列を固定文字数で
分割する()。これは、例えば図4の固定文字語
(ここでは2文字)づつ分割する。一方、NOの場合に
は、S18に進む。
【0038】S18は、ソートファイルに追加出力す
る。以上のS11からS18によって、ソースプログラ
ムから抽出した英数字項目名標から文字列を抽出し、こ
の文字列から接頭語、接尾語、固定文字語に対応
して抽出する。これらにより、ソースプログラムの英数
字項目名標からセグメント候補を自動分割することが可
能となる。
【0039】S19は、データ1件もなしか判別する。
YESの場合には、ソートファイルにデータが1件もな
かったので、終了する。一方、NOの場合には、S20
に進む。
【0040】S20は、ソートファイルの内容を区分、
セグメントをキーにしてソートする。S21は、ソート
ファイルから1件データを読み込む。
【0041】S22は、セグメントを退避する。S23
は、ソートファイルから1件データを読み込む。S24
は、ファイル終了か判別する。YESの場合には、S2
8でセグメント候補出力処理(図3の(b)参照)で同
一セグメント数がしきい値以上のときに出力し、しきい
値以下のときには出力しない。一方、NOの場合には、
S25へ進み、S22で退避したセグメントと同一か判
別し、YESのときにS23に戻り、NOのときにS2
6で新セグメントを退避し、S27でセグメント候補出
力処理を行なう。
【0042】以上のS19からS28によって、英数字
項目名標から抽出した文字列について、接頭語、接
尾語、固定文字語による分類し、同じセグメントをま
とめると共にその件数を求めて出力する。
【0043】図3の(b)は、セグメント候補出力処理
を示す。図3の(b)において、S31は、同一セグメ
ントの数がしきい値を越えているか判別する。YESの
場合には、S32でセグメント候補ファイルへ出力する
と共に、S33でセグメント候補リストへ出力する。
【0044】図4は、本発明のセグメント候補抽出時の
分割方法(例)を示す。ここで、英数字項目名標 ・FG−KBTCD−CHKDGT は、“−”によって3つの文字列 ・FG ・KBTCD ・CHKDGT に分割する。そして、例えば第2番目の文字列“KBT
CD”について、接頭語、接尾語、固定文字語に
それぞれ分割する。ここで、図示のように、 接頭語:KBTC KBT KB 接尾語: BTCD TCD CD 固定文字語:KB TC と分割する。ここで、固定文字語は2文字数で分割し
た。
【0045】図5は、本発明のセグメントの説明図を示
す。図5の(a)は、セグメント候補ファイルの内容例
を示す。これは、図3のフローチャートに従い、S28
でセグメント候補ファイル7に出力された内容例を示
す。ここでは、図示のように、“区分”(接頭語、
接尾語、固定文字語)、英数字セグメントを登録す
る。
【0046】図5の(b)は、セグメント候補リストの
内容例を示す。これは、図3のフローチャートに従い、
S28でセグメント候補リスト8に出力した内容例を示
す。例えば図示の下記のようなセグメント候補リスト8
を出力する。
【0047】 セグメント候補 使用回数 分割前の英数字項目名標 CD 1 CD−CHK CHK 2 CD−CHK、KBN−CHK 図5の(c)は、セグメントファイル(セグメント候補
のチェック(追加、削除、変更など)および日本語の入
力後)の内容例を示す。ここでは、例えば セグメント候補 日本語セグメント CD カード CD コード CHK チェック などの日本語セグメントを力する。
【0048】図5の(d)は、セグメントファイル(不
足セグメントの手修正の反映後)の内容例を示す。ここ
では、例えば セグメント候補 日本語項目名標 CD カード CHK チェック と修正する。ここでは、“CD コード”が不要として
削除している。
【0049】次に、図6を用いて名標辞書の生成を詳細
に説明する。図6において、S41は、セグメントファ
イル9の内容を内容テーブルに展開する。
【0050】S42は、英数字項目名標辞書2から1件
データ(英数字項目名標)を読み込む。S43は、終了
か判別する。YESの場合には、S53に進む。一方、
NOの場合には、S44に進む。
【0051】S44は、英数字項目名標の“−”(ハイ
フォン)で分割し、文字列化する。S45は、英数字文
字列内で、内部テーブル(セグメントファイル9)と一
致するセグメントを検索する。
【0052】S46は、セグメントが不足しているか判
別する。YESの場合には、セグメントファイル9には
無く不足しているセグメントをS47でソートファイル
13に追加出力する。一方、NOの場合には、S48に
進む。
【0053】S48は、日本語文字列を組み立てる。S
49は、日本語項目名標を組み立てる。これらS48お
よびS49は、例えば図7の(b)に示すように、英数
字文字列 ・KBTCD のうちの、セグメントファイル9と一致した“KBT”
の日本語“個別”、および“CD”の日本語セグメント
“カード”、“コード”の2つがあるため、これらの組
み合わせとして、図示の下記の ・個別カード ・個別コード の2つの日本語文字列を組み立てる。
【0054】S50は、日本語項目名標が複数か判別す
る。YESの場合(日本語項目名標が複数の場合)に
は、S51で名標辞書(2)(ファイル、帳票)に出力
する。NOの場合(日本語項目名標が1つの場合)に
は、S52で名標辞書(1)(ファイル、帳票)に出力
する。
【0055】S53は、データ1件のなしか判別する。
YESの場合には、終了する。NOの場合には、S54
に進む。S54は、不足セグメントがあるか判別する。
YESの場合には、S55でソートファイルの内容をセ
グメントをキーにしてソートし、S56で不足セグメン
トを出力(ファイル、帳票)する。
【0056】以上によって、セグメントファイル9をも
とに、ソースプログラムから抽出した英数字項目名標の
文字列について検索して一致するセグメントを検索して
その日本語文字列を取り出して組み立て(図7の(d)
参照)、日本語項目名標が複数のときは名標辞書(2)
に出力し、1つのときに名標辞書(1)に出力する。そ
して、後述する図8のフローチャートに従い、名標辞書
22を生成する。
【0057】図7は、本発明の日本語項目名標組み立て
例を示す。図7の(a)は、図4の英数字項目名標“F
G”の例を示す。この“FG”の場合には、セグメント
ファイル9中に当該“FG”に対応づけて日本語セグメ
ント文字列 ・フラグ ・旗 の2つが登録されていたので、これら2つを日本語文字
組み立て例として取り出す(この場合、日本語セグメン
トがそのまま日本語文字列となる)。
【0058】図7の(b)は、図4の英数字文字列“K
BTCD”の例を示す。この“KBTCD”の場合に
は、セグメントファイル9中に当該“KBT”、“C
D”に対応づけて日本語セグメント ・KBT 個別 ・CD カード、 コード が登録されていたので、日本語文字列の組立てとして、 ・個別カード ・個別コード の2つを生成する。
【0059】図7の(c)は、図4の英数字文字列“C
HKDGT”の例を示す。この“CHKDGT”の場合
には、セグメントファイル9中に当該“CHK”、“D
GT”に対応づけて日本語セグメント ・CHK チェック ・DGT デジット 数字 が登録されていたので、日本語文字列の組み立てとし
て、 ・チェックデジット ・チェック数字 の2つを生成する。
【0060】図7の(d)は、日本語項目名標の組み立
て例を示す。これは、図7の(a)、(b)、(c)の
3つを組み合わせた例である。ここでは、図7の
(a)、(b)、(c)の任意に組み合わせ、図示のよ
うな日本語項目名標を作成する。
【0061】図8は、名標辞書の修正処理フローチャー
トを示す。これは、図6のフローチャートに続いて行な
う名標辞書の修正処理フローチャートである。図8にお
いて、S61は、名標辞書(1)から1件データを読み
込む。ここで、名標辞書(1)は1つの日本語項目名標
からなり、名標辞書(2)は複数の日本語項目名標から
なる。
【0062】S62は、名標辞書(1)が終了か判別す
る。YESの場合には、S70からS75によって名標
辞書(2)について処理を行なう。NOの場合には、S
63に進む。
【0063】S63は、名標辞書(2)が終了済か判別
する。YESの場合には、名標辞書(2)が終了したの
で、S64で名標辞書(1)の出力処理を行なう。一
方、NOの場合には、S65に進む。
【0064】S65は、名標辞書(2)から1件データ
を読み込む。S66は、名標辞書(2)が終了か判別す
る。YESの場合には、同様にS64で名標辞書(1)
の出力処理を行なう。NOの場合には、S67に進む。
【0065】S67は、名標辞書(1)のデータの順序
が先か判別する。これは、名標辞書(1)から読み込ん
だデータ(英数字項目名標)のアルファベットの順に名
標辞書(2)から読み込んだデータ(英数字項目名標)
よりも先か判別する。YESの場合には、S68で名標
辞書(1)の出力処理を行なう。一方、NOの場合に
は、S69で名標辞書(2)の出力処理を行なう。
【0066】また、S70からS75によって、名標辞
書(1)が既に終了しているので、名標辞書(2)につ
いて、出力処理を行う。図8の(b)は、名標辞書
(1)の出力処理を示す。この出力処理は、S76に示
すように、名標辞書(1)から入力したデータを名標辞
書22へ出力する。
【0067】図8の(c)は、名標辞書(2)の出力処
理を示す。この出力処理は、S77に示すように、名標
辞書(2)から入力したデータを名標辞書22へ出力す
る。以上によって、1つの日本語項目名標を登録した名
標辞書(1)および複数の日本語項目名標を登録した名
標辞書(2)からアルファベット順に名標辞書22に登
録することが可能となる。
【0068】図9は、本発明の名標辞書の説明図を示
す。図9の(a)は、名標辞書(1)の内容例を示す。
名標辞書(1)は1つの日本語項目名標であるので、英
数字項目名標に対応づけて1つの日本語項目名標を登録
している。その他に順序番号、レコード数、有効文字数
などを登録する。
【0069】図9の(b)は、名標辞書リスト(1)の
内容例を示す。この名標辞書リスト(1)には、図示の
ように、英数字項目名標に対応づけて1対1で日本語項
目名標を印字(印刷)する。
【0070】図9の(c)は、名標辞書(2)の内容例
を示す。名標辞書(2)は複数の日本語項目名標がある
ので、英数字項目名標に対応づけて複数の日本語項目名
標を登録している。ここでは、英数字項目名標“CD−
CHK”に対応づけて“カード−チェック”および“コ
ードチェック”の2つを登録する。
【0071】図9の(d)は、名標辞書リスト(2)の
内容例を示す。この名標辞書リスト(2)には、図示の
ように、英数字項目名標に対応づけて1対1で日本語項
目名標を印字(印刷)する。
【0072】図9の(e)は、名標辞書(2)(名標辞
書(2)のチェック後)の内容例を示す。ここでは、C
D−CHKのに日本語項目名標“コード−チェック”が
削除され、“カード−チェック”が1つ残っている。
【0073】図9の(f)は、名標辞書(日本語項目名
標あり)の内容例を示す。この名標辞書22は、名標辞
書(1)および名標辞書(2)をまとめたものである。
図10は、本発明の日本語項目名標の自動生成手順例を
示す。
【0074】図10の(a)は、英数字項目名標例を示
す。これは、ソースプログラムから抽出した英数字項目
名標“FG−KBTCD−CHKDGT”である。この
英数字項目名標から“−”(ハイフォン)で分割して文
字列とする。そして、既述した接頭語、接尾語、
固定文字語に分割してセグメント候補にする。
【0075】図10の(b)は、英数字文字列の取得例
を示す。ここで、図10の(a)から“−”で分割した
図示の下記の ・FG ・KBTCD ・CHKDGT の3つの文字列を得る。
【0076】図10の(c)は、英数字セグメント(候
補)の抽出例を示す。これは、図10の(b)の文字列
から接頭語、接尾語、固定文字語によるセグメン
ト候補を図示のように抽出する。
【0077】図10の(d)は、日本語セグメントの検
索例を示す。ここで、同一の英数字セグメントに対し
て、複数の日本語セグメントが存在する場合、その全て
を抜き出す。
【0078】図10の(e)は、日本語文字列の組み立
て例を示す。図10の(f)は、日本語項目名標の組み
立て例を示す。ここで、英数字項目名標“FG−KBT
CD−CHKDGT”について、図示のような日本語項
目名標が得られることとなる。
【0079】
【発明の効果】以上説明したように、本発明によれば、
英数字項目名標の文字列からセグメント候補に分割して
意味のあるものの日本語セグメントを入力し、意味の無
いものを削除してセグメントファイルを作成し、このセ
グメントファイルをもとに英数字項目名標から日本語項
目名標を自動生成して名標辞書22を作成する構成を採
用しているため、ソースプログラム中の英数字項目名標
を日本語項目名標に変換するときに必要な名標辞書22
の作成時間を削減して迅速に作成したり、ソースプログ
ラム上の英数字項目名標を日本語項目名標にしてプログ
ラムの保守、再構築時の可読性を向上させたりすること
ができる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の全体の動作説明フローチャートであ
る。
【図3】本発明のセグメントファイルの作成処理フロー
チャートである。
【図4】本発明のセグメント候補抽出時の分割方法
(例)である。
【図5】本発明のセグメントの説明図である。
【図6】本発明の名標辞書の生成フローチャートであ
る。
【図7】本発明の日本語文字列組み立て例である。
【図8】本発明の名標辞書の修正処理フローチャートで
ある。
【図9】本発明の名標辞書の説明図である。
【図10】本発明の日本語項目名標の自動生成手順例を
示す。
【符号の説明】
1:名標抽出手段 2:英数字項目名標辞書 3:セグメントファイル作成手段 4:文字列抽出手段 5:セグメント分割手段 6:ソートファイル 7:セグメント候補ファイル 8:セグメント候補リスト 9:セグメントファイル 10:セグメント生成手段 11:日本語項目名標生成手段 12:名標生成手段 13:ソートファイル 14:名標辞書(1) 15:名標辞書リスト(1) 16:名標辞書(2) 17:名標辞書リスト(2) 21:名標辞書修正手段 22:名標辞書 23:名標置換手段

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】ソースプログラムから抽出した英数字項目
    名標の文字列について、先頭文字を含み後ろから1文字
    づつ減らした文字列である接頭語、末尾文字を含み前か
    ら1文字づつ減らした文字列である接尾語、および指定
    された文字数で分割した文字列である固定文字語でセグ
    メント候補に分割するセグメント分割手段と、 この分割したセグメント候補をセグメント候補リスト上
    に表示して当該セグメント候補リスト上から意味のある
    英数字セグメント候補に対応づけて日本語セグメントを
    セグメントファイルに登録するセグメント生成手段と、 このセグメントファイルを参照して上記ソースプログラ
    ムから抽出した英数字項目名標に対応する日本語項目名
    標を組み立てて名標辞書に登録する名標生成手段とを備
    えたことを特徴とする名標辞書作成装置。
  2. 【請求項2】上記名標生成手段が上記セグメントファイ
    ルを参照してソースプログラムから抽出した英数字項目
    名標の文字列と、最長一致法、上記接頭語、接尾語、固
    定文字語の優先順位で一致するセグメントの日本語セグ
    メントを取り出してこれらを組み立てた日本語項目名標
    を英数字項目名標に対応づけて登録して名標辞書を作成
    するように構成したことを特徴とする請求項記載の名
    標辞書作成装置。
JP23268893A 1993-09-20 1993-09-20 名標辞書作成装置 Expired - Fee Related JP3224917B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23268893A JP3224917B2 (ja) 1993-09-20 1993-09-20 名標辞書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23268893A JP3224917B2 (ja) 1993-09-20 1993-09-20 名標辞書作成装置

Publications (2)

Publication Number Publication Date
JPH0784772A JPH0784772A (ja) 1995-03-31
JP3224917B2 true JP3224917B2 (ja) 2001-11-05

Family

ID=16943234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23268893A Expired - Fee Related JP3224917B2 (ja) 1993-09-20 1993-09-20 名標辞書作成装置

Country Status (1)

Country Link
JP (1) JP3224917B2 (ja)

Also Published As

Publication number Publication date
JPH0784772A (ja) 1995-03-31

Similar Documents

Publication Publication Date Title
KR100798609B1 (ko) 데이터 소트 방법, 데이터 소트 장치 및 데이터 소트 프로그램을 기억하는 기억 매체
EP0293161B1 (en) Character processing system with spelling check function
US20080319987A1 (en) System, method and program for creating index for database
US20020169763A1 (en) Method and system for expanding document retrieval information
JP2000163442A (ja) 記号辞書作成方法及び記号辞書検索方法
JPH09245043A (ja) 情報検索装置
JP3258063B2 (ja) データベース検索システム及び方法
JP3224917B2 (ja) 名標辞書作成装置
JP4208326B2 (ja) 情報索引装置
JP3260428B2 (ja) 情報検索処理装置
JP3253657B2 (ja) 文書検索方法
JP2993540B2 (ja) 昇順整数列データの圧縮および復号システム
JP2000250930A (ja) 構造化文書検索システム
JPH1115845A (ja) 情報検索方法および装置と情報検索プログラムを格納した記録媒体
JPH11232149A (ja) ファイル比較処理方法,装置およびファイルの比較処理プログラムを記憶した媒体
JPH06162096A (ja) レコード検索方法
JPH0660120A (ja) 可変長データの格納方法及び検索装置
JPH05225248A (ja) データベース検索システム
JPS5850044A (ja) インデクス・レコ−ドの検索処理方式
JP3014415B2 (ja) 文書処理方法及び装置
JPH0573627A (ja) 画像検索装置
JP2001060197A (ja) リレーショナルデータベースにおける検索方法及びそのプログラムを記録した記録媒体
JPH10171686A (ja) データベース拡張方法
JPH1097542A (ja) 全文検索装置及び全文検索方法
JPH0540789A (ja) 文字検索装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010807

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080824

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090824

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090824

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100824

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110824

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees