JP2001175684A - 姓データの生成方法及びその生成装置 - Google Patents

姓データの生成方法及びその生成装置

Info

Publication number
JP2001175684A
JP2001175684A JP36381399A JP36381399A JP2001175684A JP 2001175684 A JP2001175684 A JP 2001175684A JP 36381399 A JP36381399 A JP 36381399A JP 36381399 A JP36381399 A JP 36381399A JP 2001175684 A JP2001175684 A JP 2001175684A
Authority
JP
Japan
Prior art keywords
character string
surname
data
random number
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP36381399A
Other languages
English (en)
Other versions
JP3514193B2 (ja
Inventor
Michio Kagii
美知雄 鍵井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP36381399A priority Critical patent/JP3514193B2/ja
Publication of JP2001175684A publication Critical patent/JP2001175684A/ja
Application granted granted Critical
Publication of JP3514193B2 publication Critical patent/JP3514193B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Stored Programmes (AREA)
  • Debugging And Monitoring (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 システムテストで使用される個人名における
姓データを、頻出度の高い姓を利用して現実の分布に近
似させることと、文字列の組合せとから容易に生成し、
この姓データを用いたテスト結果を開示してもトラブル
が生じない姓データの発生方法及びその発生装置に関す
る技術を提供する点にある。 【解決手段】 図1に示すように、本実施の形態に係
る姓データの生成装置は、入力手段5と乱数発生手段1
0と記憶手段20と姓生成手段30と処理振分け手段4
0と禁則チェック手段50と出力手段60とで概略構成
される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、システム開発時に
データベースで用いる架空の姓データを発生する姓デー
タの発生方法及びその発生装置に関する技術に属する。
【0002】
【従来の技術】従来、データベースを有するシステムを
テストする場合、個人に関するテストデータを生成する
場合、数値データについては、統計データ等から作成
し、個人名については、辞書に入っている個人名の候補
を表示し、開発者が選択入力したり、選択された個人名
を変換して使用するなどが行われている。
【0003】
【発明が解決しようとする課題】しかしながら、従来技
術には以下に掲げる問題点があった。少量の個人名の生
成は、開発者によるデータ入力で容易にできるが、多量
の個人名を生成する場合、特に生成された個人名におけ
る姓について、多量に生成された姓データは出現する回
数分布などが現実の頻出姓とかけ離れ、作成されたデー
タベースに現実性がなく、また、現実性を持たせた姓デ
ータについては、もとのデータを類推できてしまうとい
う問題点があった。
【0004】本発明は斯かる問題点を鑑みてなされたも
のであり、その目的とするところは、システムテストで
使用される個人名における姓データを、頻出度の高い姓
を利用して現実の分布に近似させることと、文字列の組
合せとから容易に生成し、この姓データを用いたテスト
結果を開示してもトラブルが生じない姓データの発生方
法及びその発生装置に関する技術を提供する点にある。
【0005】
【課題を解決するための手段】請求項1記載の本発明の
要旨は、システム開発でのテストデータなどに使用する
姓データの生成方法であって、予め、人名辞書や印刷物
などで検索される姓を頻出度順にソートして頻出姓とし
て登録し、必要とする前記姓データの所要件数を設定
し、前記姓データが、設定された該所要件数に対して所
定の比率で前記頻出姓に基づき生成されるための設定値
を設定し、また、前記姓データを文字列の組合せで生成
するために、前記姓データの上位に位置する1つの文
字、又は、文字列からなる複数の上位文字列と、前記姓
データの下位に位置する1つの文字、又は、文字列から
なる複数の下位文字列とを登録する第1の工程と、生成
された前記姓データの生成件数と前記所要件数とを比較
して、前記姓データの生成処理を続行するか終了するか
を判断し、前記生成処理を続行した場合、各々の前記姓
データの生成処理を、登録された前記頻出姓に基づき生
成するか、前記上位文字列と前記下位文字列との組合せ
で生成するかを振分けるため、第1の乱数を発生し、該
第1の乱数の値が前記設定値より大きい/以上かどうか
を比較する第2の工程と、前記第1の乱数が設定値以下
の/より小さい場合、第2の乱数を発生し、該第2の乱
数の値が所定の分布になるように近似処理を施し、該近
似処理が施された値に対応する前記頻出姓を取得するこ
とで前記姓データを生成し、前記生成件数に1を加算す
る第3の工程と、前記第1の乱数が前記設定値より大き
い/以上の場合、第3の乱数と第4の乱数とを発生し、
前記第3の乱数の値に対応する前記上位文字列と前記第
4の乱数の値に対応する前記下位文字列との組合せによ
り前記姓データを生成し、前記生成件数に1を加算する
第4の工程とを備えることを特徴とする姓データの生成
方法に存する。請求項2記載の本発明の要旨は、前記第
1の工程は、前記文字列を前記上位文字列として登録す
るとき、前記文字列が、予め登録された第1の禁則であ
る所定の文字の組合せに該当する場合、前記文字列を登
録せず、前記上位文字列として登録された前記文字、又
は、前記文字列に第1の属性を付加し、前記文字列を前
記下位文字列として登録するとき、前記文字列が、予め
登録された第2の禁則である所定の文字の組合せに該当
する場合、前記文字列を登録せず、前記下位文字列とし
て登録された前記文字、又は、前記文字列に第2の属性
を付加する第5の工程を含むことを特徴とする請求項1
記載の姓データの生成方法に存する。請求項3記載の本
発明の要旨は、前記第3の工程での前記近似処理は、第
2の乱数を発生し、均等分布する前記第2の乱数の値
を、値が小さくなるに従い分布の数が多くなるように、
所定の関数に代入することで補正をして、現実の分布に
近似させることを特徴とする請求項1又は2記載の姓デ
ータの生成方法に存する。請求項4記載の本発明の要旨
は、前記第4の工程は、前記第3の乱数の値と前記第4
の乱数の値とに各々対応する前記上位文字列と前記下位
文字列とを組合せて前記姓データを生成するとき、前記
上位文字列と前記下位文字列とが、予め登録された第3
の禁則である所定の前記文字列の組合せに該当する場
合、又は、前記下位文字列に付加された前記第1の属性
と前記下位文字列に付加された前記第2の属性との組合
せが予め登録された第3の禁則である所定の組合せに該
当する場合、組合された前記文字列を前記姓データから
除外する第6の工程を含むことを特徴とする請求項1乃
至3のいずれかに記載の姓データの生成方法に存する。
請求項5記載の本発明の要旨は、請求項1乃至4のいず
れかに記載の姓データの生成方法を実行可能なプログラ
ムが記録された記憶媒体に存する。請求項6記載の本発
明の要旨は、システム開発でのテストデータなどに使用
する姓データの生成装置であって、乱数を発生させ、ラ
ンダムな値を取得するための乱数発生手段と、入力手段
を介して、前記姓データを生成するため、一般の印刷物
にて頻出度の高い複数の頻出姓と、組合せのための複数
の文字列と、該文字列の組合せで生成した前記姓データ
を除外するための所定の禁則を有する禁則テーブルとが
登録される記憶手段と、前記乱数発生手段による第2の
乱数の値を、小さくなるに従い分布の数が多くなるよう
に近似処理を施して補正し、現実の分布に近似させ、前
記頻出姓から、補正された値に対応する頻出姓を取得し
て姓データを生成する頻出姓生成部と、前記乱数発生手
段による第3の乱数の値と第4の乱数の値に各々対応す
る前記文字列の組合せにより前記姓データを生成し、前
記姓データを生成する毎に生成件数に1を加算する組合
せ姓生成部とを有し、生成された前記データを出力手段
を介して出力する姓生成手段と、前記頻出姓に基づく前
記姓データと前記文字列の組合せに基づく前記姓データ
とが生成される所定の比率を定める設定値と前記乱数発
生手段が発生する第1の乱数とに基づき、前記頻出姓に
基づく前記姓データの生成処理と前記文字列の組合せに
基づく前記姓データの生成処理とを振分ける処理振分け
手段と、前記文字列の組合せにより前記姓データを生成
するとき、前記禁則テーブルが有する禁則を参照して禁
則チェックを行う禁則チェック手段とを備えることを特
徴とする姓データの生成装置に存する。請求項7記載の
本発明の要旨は、前記記憶手段は、人名辞書や印刷物な
どで検索され、頻出度の高い前記頻出姓を頻出順にソー
トして登録される頻出姓テーブルと、組合せにより生成
される前記姓データを構成する前記文字列である、前記
姓データの上位に位置する1つの文字、又は、文字列の
上位文字列と、前記姓データの下位に位置する1つの文
字、又は、文字列の下位文字列とが登録される文字列テ
ーブルと、前記文字列を前記上位文字列として登録する
とき、所定の文字列を除外するための、文字の組合せで
ある第1の禁則と、前記文字列を前記下位文字列として
登録するとき、所定の文字列を除外するための、文字の
組合せである第2の禁則と、前記上位文字列と前記下位
文字列とを組合せて前記姓データを生成するとき、所定
の上位文字列と下位文字列との組合せによる前記姓デー
タを除外し、前記上位文字列に付加された第1の属性と
前記下位文字列に付加された第2の属性との所定の組合
せを除外するための第3の禁則とが登録される禁則テー
ブルとを備えることを特徴とする請求項6記載の姓デー
タの生成装置に存する。請求項8記載の本発明の要旨
は、前記禁則チェック手段は、前記文字列を前記上位文
字列として前記記憶手段に登録するとき、前記禁則テー
ブルの前記第1の禁則を参照して、該当する文字の組合
せとなる前記文字列を登録から除外し、前記文字列を前
記下位文字列として前記記憶手段に登録するとき、前記
禁則テーブルの前記第2の禁則を参照して、該当する文
字の組合せとなる前記文字列を登録から除外し、前記組
合せ姓生成部で前記上位文字列と前記下位文字列とを組
合せて前記姓データを生成するとき、前記禁則テーブル
の前記第3の禁則を参照して、該当する前記上位文字列
と前記下位文字列との組合せによる前記姓データの生成
を除外し、前記禁則テーブルの前記第3の禁則を参照し
て、前記上位文字列に付加された第1の属性と前記下位
文字列に付加された第2の属性との組合せが該当する場
合、前記姓データの生成を除外することを特徴とする請
求項6又は7記載の姓データの生成装置に存する。
【0006】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて詳細に説明する。図1に示すように、本実施
の形態に係る姓データの生成装置は、入力手段5と乱数
発生手段10と記憶手段20と姓生成手段30と処理振
分け手段40と禁則チェック手段50と出力手段60と
で概略構成される。
【0007】入力手段5は、必要とする姓データを生成
するため、予めテーブル等のデータを記憶手段20に登
録するために用いられる。乱数発生手段10は、乱数を
発生してランダムな値を取得する。ここでは、第1の乱
数と第2の乱数と第3の乱数と第4の乱数とを発生す
る。
【0008】記憶手段20は、頻出姓テーブル22と文
字列テーブル23と禁則テーブル26とを有する。頻出
姓テーブル22には、人名辞書や印刷物などで検索され
る複数の姓が頻出順にソートして登録される。文字列テ
ーブル23には、複数の上位文字列24と複数の下位文
字列25とが登録される。上位文字列24は、組合せで
生成される姓データの上位を構成し、下位文字列25は
下位を構成する。上位文字列24には、第1の属性が付
加され、下位文字列25には、第2の属性が付加され
る。また、上位文字列24及び下位文字列25は、とも
に文字、又は、文字列を意味する。本実施の形態では、
この文字列は2文字として説明をする。
【0009】禁則テーブル26は、第1の禁則27と第
2の禁則28と第3の禁則29とを有する。第1の禁則
27は、上位文字列24を登録するとき、所定の文字列
を除外するための、文字の組合せが登録される。第2の
禁則28は、下位文字列25を登録するとき、所定の文
字列を除外するための、文字の組合せが登録される。第
3の禁則29は、上位文字列24と下位文字列25とを
組合せて姓データを生成するとき、所定の文字列の組合
せによる姓データを除外するための、上位文字列24及
び下位文字列25の組合せと、第1の属性及び第2の属
性の組合せとが登録される。
【0010】姓生成手段30は、頻出姓生成部32と組
合せ姓生成部36とを有し、生成された姓データを出力
手段60に送出する。
【0011】頻出姓生成部32は、乱数発生手段10に
よる第2の乱数の値を、値が小さくなるに従い、値の分
布が多くなるように近似処理を施して補正し、現実の分
布に近似させ、登録された頻出姓テーブル22から、補
正により得られた値に対応する頻出姓を取得して姓デー
タを生成し、生成件数に1を加算する。
【0012】組合せ姓生成部36は、乱数発生手段10
による第3の乱数の値に対応する上位文字列24と第4
の乱数の値に対応する下位文字列25との組合せにより
姓データを生成し、生成件数に1を加算する。
【0013】処理振分け手段40は、予め設定された設
定値と乱数発生手段10による第1の乱数とを比較する
ことで、頻出姓生成部32での処理と組合せ姓生成部3
6での処理とを振分ける。
【0014】禁則チェック手段50は、上位文字列24
を登録するとき、第1の禁則27を参照して該当する文
字列を除外し、下位文字列25とを登録するとき、第2
の禁則28を参照して、該当する文字列を除外し、組合
せ姓生成部36で姓データを生成するとき、第3の禁則
29を参照して該当する上位文字列24と下位文字列2
5との組合せと、第1の属性と第2の属性の組合せとに
該当する組合せによる姓データを除外する。
【0015】出力手段60は、姓生成手段30から送出
された姓データを出力する。
【0016】図2は、図1の処理の流れを示すフローチ
ャート図である。図2を参照して姓データの生成装置の
動作を説明する。
【0017】まず、生成された姓の生成件数と所要件数
との比較を行い(図中に「所要件数生成されたか」で示
す)、生成件数が所要件数より小さい(図中「No」
の)場合、処理を続ける(ステップS101)。
【0018】生成する姓を一件毎に頻出姓に基づき生成
するのか、文字列の組合せにより生成するのかの処理を
振分けるため、乱数発生手段10により第1の乱数を発
生する(ステップS102)。この第1の乱数は、0か
ら1未満の値をとる。
【0019】発生した第1の乱数が、予め設定された設
定値より大きい/以上かどうか(図中「設定値より大き
いか」で示す)を比較する(ステップS103)。ここ
で、設定値は、頻出姓生成の処理と組合せ姓生成の処理
とで発生する比率が目的とする振分け比率となるように
設定する。
【0020】発生した第1の乱数が設定値以下の/より
小さい(図中「No」の)場合、頻出姓生成の処理を行
い(ステップS104)、ステップS101に戻る。
【0021】ステップS104の処理を説明する。ま
ず、乱数の発生を行う(ステップS201)。この乱数
を第2の乱数とする。
【0022】第2の乱数は均等分布であるため、第2の
乱数の値を補正して、値の分布を現実の分布に近似させ
る(ステップS202)。
【0023】頻出姓テーブル22から、補正により得ら
れた値に対応する頻出姓を取得(図中「表から姓を取
得」で示す)する(ステップS203)。
【0024】生成件数に1を加算し(ステップS20
4)、ステップS101の処理に戻る。
【0025】ステップS103において、第1の乱数が
設定値より大きい/以上の(図中「Yes」の)場合、
組合せ姓生成の処理を行う(ステップS105)。
【0026】以下、ステップS105の処理を説明す
る。まず、0から100未満の乱数を1組(2つ)発生
(図中「乱数の組を発生」で示す)する(ステップS2
11)。この1組の乱数を第3の乱数と第4の乱数とす
る。
【0027】文字列テーブル23からステップS211
で得られた第3の乱数の値に対応する上位文字列24を
取得し、次に文字列テーブル23から第4の乱数の値に
対応する下位文字列25を取得(図中「表から文字列の
組を取得」で示す)する(ステップS212)。
【0028】禁則テーブル26を参照して禁則チェック
を行い、生成した姓データが第3の禁則29に該当する
かどうか判断(図中「禁則チェック」で示す)する(ス
テップS213)。
【0029】第3の禁則29に該当しない(図中「N
o」の)場合、生成件数に1を加算(ステップS21
4)し、ステップS101の制御に戻る。
【0030】ステップ213において、第3の禁則29
に該当する(図中「Yes」の)場合、生成した姓デー
タを除外して、ステップS211の処理に戻る。
【0031】ステップS101において、姓データの生
成件数が所要件数に達した(図中「Yes」の)場合、
処理を終了する。
【0032】(実施例)本実施の形態に係る姓データの
生成装置を用いた方法の実施例を具体的に説明する。予
め、一般の人名辞書や印刷物などで検索される姓を頻出
順にソートして頻出姓テーブル22に登録する。一例と
して、この登録件数は100件〜1000件程度とす
る。
【0033】次に、データベースのテストで必要とする
姓データの所要件数と、この姓の全体の所要件数に対し
て頻出姓テーブル22に登録された頻出姓に基づき生成
される姓データをどのような比率で生成するかの設定値
を予め設定する。例えば、必要とする姓データの所要件
数を10000件とした場合、頻出順にソートされた上
位100件の頻出姓に基づき、2000件(全体の20
%に相当)の姓データを生成すると設定する。
【0034】次に、文字列の組合せによる姓データを生
成するため、文字列テーブル23に、複数の上位文字列
24と複数の下位文字列25とを登録する。上位文字列
24は、組合せで生成される姓データの上位を構成し、
下位文字列25は、下位を構成する。上位文字列24に
は、第1の属性を付加し、下位文字列25には、第2の
属性を付加する。また、上位文字列24及び下位文字列
25は、ともに1つの文字、又は、文字列を意味する。
【0035】禁則テーブル26は、第1の禁則27と第
2の禁則28と第3の禁則29とを有する。第1の禁則
27は、上位文字列24を登録するとき、所定の文字列
を除外するための、文字の組合せを登録する。第2の禁
則28は、下位文字列25を登録するとき、所定の文字
列を除外するための、文字の組合せを登録する。
【0036】この登録の際、第1の禁則27を参照して
禁則チェックを行い、「佐々」の様に2文字の場合も登
録可能とするが、同じ文字の連続については上位文字列
24から除外する。登録された各々の文字又は文字列に
は、JISなどのように統一されたコードと、第1の属
性(生物/無生物・有形/無形・人造物/非人造物/数
詞/色/方向/時間/関係/地形/その他(下にブラン
クはこない等))とを付加する。
【0037】次に、第2の禁則28を参照して禁則チェ
ックを行い、「河原」の様に2文字の場合も登録可能と
するが、同じ文字の連続については下位文字列25から
除外する。登録された各々の文字には、JISなどのよ
うに統一されたコードと第2の属性(生物/無生物・有
形/無形・人造物/非人造物/数詞/色/方向/時間/
関係等)とを付加する。登録件数は一例として、上位文
字列24、下位文字列25ともに100〜500件程度
とする。
【0038】第3の禁則は、上位文字列24と下位文字
列25とを組合せて姓データを生成するとき、所定の文
字列の組合せによる姓データを除外するための、上位文
字列24及び下位文字列25の組合せと、第1の属性及
び第2の属性の組合せとを登録する。
【0039】次に、必要とする姓データである頻出姓と
組合せ姓の生成を開始する。生成された姓データの生成
件数と所要件数との比較を行い、処理の続行か処理の終
了かを判断する(ステップS101)。ここで、最初に
姓データが生成されるときは、まだ生成件数が0のた
め、生成件数<所要件数となるため姓データの生成を行
う。生成件数=所要件数となれば処理を終了する。
【0040】姓データ一件毎に、頻出姓生成の処理を行
うのか、組合せ姓生成の処理を行うのかを振分けるた
め、0から1未満の第1の乱数を発生する(ステップS
102)。
【0041】発生した第1の乱数が設定値より大きい/
以上かどうかを比較する(ステップS103)。ここ
で、設定値は、頻出姓生成の処理と組合せ姓生成の処理
との比率が目的とする振分け比率となるように予め設定
してある。この例の場合、発生した第1の乱数が0.2
0より小さい場合、頻出姓生成の処理を行い、約200
0件が頻出姓に基づく姓データとなる。
【0042】発生した第1の乱数が設定値以下の/より
小さい場合、頻出姓生成の処理を行う(ステップS10
4)。
【0043】以下、ステップS104の処理の詳細を説
明する。まず、乱数の発生を行う。一例として、1から
500未満の乱数を発生させる(ステップS201)。
【0044】この乱数を第2の乱数とする。第2の乱数
は均等分布であるため、第2の乱数の値を下に凸の関数
(値が小さくなるに従い発生数が多くなる)に代入し小
さい値が多く分布するように補正して、現実の分布に近
似させる(ステップS202)。一例として、以下の関
数に代入することにより現実の分布に近似させる。発生
する第2の乱数の値Rを0から500未満とした場合、
関数を以下に示す。 (0.000017/125)R^3+(0.007/
25)R^2+(0.13/5)R この補正により得られる値は0〜99の値となる。
【0045】頻出姓テーブル22から、補正により得ら
れた値に対応する頻出姓から姓データを生成し(ステッ
プS203)、生成件数に1を加算し(ステップS20
4)、ステップS101の処理に戻る。
【0046】ステップS103において、第1の乱数が
設定値より大きい/以上の場合、組合せ姓生成の処理を
行う(ステップS105)。
【0047】以下、ステップS105の処理の詳細を説
明する。乱数発生手段10により、0から100未満の
乱数を1組(2つ)発生する(ステップS211)。こ
の1組の乱数を第3の乱数と第4の乱数とする。
【0048】文字列テーブル23からステップS211
で得られた第3の乱数の値に対応する上位文字列24を
取得し、次に文字列テーブル23から第4乱数の値に対
応する下位文字列25を取得する(ステップS21
2)。
【0049】ここで、禁則テーブル26の第3の禁則を
参照して禁則チェックを行い、生成した姓データが第3
の禁則に該当するかどうか判断する(ステップS21
3)。この第3の禁則は、取得した1組(2つ)の文字
列が同一の文字列の場合や動物どうしが接続された場合
などを登録しておく。一例として、「河原河原」、「馬
鹿」などはこの第3の禁則に従い除外する。
【0050】登録された第3の禁則に該当しなければ、
姓データを採用し、生成件数に1を加算(ステップS2
14)し、ステップS101の処理に戻る。
【0051】ステップ213において、第3の禁則29
に該当する場合、ステップS211の処理に戻る。
【0052】なお、本実施の形態においては、本発明は
それに限定されず、本発明を適用する上で好適な姓デー
タの発生方法及びその発生装置に関する技術に適用する
ことができる。
【0053】また、上記構成部材の数、位置、形状等は
上記実施の形態に限定されず、本発明を実施する上で好
適な数、位置、形状等にすることができる。また、禁則
テーブル26に登録される禁則を多く設定することでよ
り現実性のある姓データを生成することができる。
【0054】
【発明の効果】本発明は以上のように構成されているの
で、以下に掲げる効果を奏する。システムテストで使用
する人に関する姓データを、公知のデータベースから頻
出度の高い頻出姓から抽出して、現実の姓の分布に近似
させることと、文字列を組合せることとで容易に生成で
き、また、現実の分布に近似した架空の姓データを利用
したテストデータを開示しても流用ではないため問題に
はならない。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る姓データの生成装置
の構成を示すブロック図である。
【図2】図1の処理の流れを示すフローチャート図であ
る。
【符号の説明】
5 入力手段 10 乱数発生手段 20 記憶手段 22 頻出姓テーブル 23 文字列テーブル 24 上位文字列 25 下位文字列 26 禁則テーブル 27 第1の禁則 28 第2の禁則 29 第3の禁則 30 姓生成手段 32 頻出姓生成部 36 組合せ姓生成部 40 処理振分け手段 50 禁則チェック手段 60 出力手段

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 システム開発でのテストデータなどに使
    用する姓データの生成方法であって、 予め、人名辞書や印刷物などで検索される姓を頻出度順
    にソートして頻出姓として登録し、必要とする前記姓デ
    ータの所要件数を設定し、前記姓データが、設定された
    該所要件数に対して所定の比率で前記頻出姓に基づき生
    成されるための設定値を設定し、また、前記姓データを
    文字列の組合せで生成するために、前記姓データの上位
    に位置する1つの文字、又は、文字列からなる複数の上
    位文字列と、前記姓データの下位に位置する1つの文
    字、又は、文字列からなる複数の下位文字列とを登録す
    る第1の工程と、 生成された前記姓データの生成件数と前記所要件数とを
    比較して、前記姓データの生成処理を続行するか終了す
    るかを判断し、前記生成処理を続行した場合、各々の前
    記姓データの生成処理を、登録された前記頻出姓に基づ
    き生成するか、前記上位文字列と前記下位文字列との組
    合せで生成するかを振分けるため、第1の乱数を発生
    し、該第1の乱数の値が前記設定値より大きい/以上か
    どうかを比較する第2の工程と、 前記第1の乱数が設定値以下の/より小さい場合、第2
    の乱数を発生し、該第2の乱数の値が所定の分布になる
    ように近似処理を施し、該近似処理が施された値に対応
    する前記頻出姓を取得することで前記姓データを生成
    し、前記生成件数に1を加算する第3の工程と、 前記第1の乱数が前記設定値より大きい/以上の場合、
    第3の乱数と第4の乱数とを発生し、前記第3の乱数の
    値に対応する前記上位文字列と前記第4の乱数の値に対
    応する前記下位文字列との組合せにより前記姓データを
    生成し、前記生成件数に1を加算する第4の工程とを備
    えることを特徴とする姓データの生成方法。
  2. 【請求項2】 前記第1の工程は、 前記文字列を前記上位文字列として登録するとき、前記
    文字列が、予め登録された第1の禁則である所定の文字
    の組合せに該当する場合、前記文字列を登録せず、前記
    上位文字列として登録された前記文字、又は、前記文字
    列に第1の属性を付加し、前記文字列を前記下位文字列
    として登録するとき、前記文字列が、予め登録された第
    2の禁則である所定の文字の組合せに該当する場合、前
    記文字列を登録せず、前記下位文字列として登録された
    前記文字、又は、前記文字列に第2の属性を付加する第
    5の工程を含むことを特徴とする請求項1記載の姓デー
    タの生成方法。
  3. 【請求項3】 前記第3の工程での前記近似処理は、第
    2の乱数を発生し、均等分布する前記第2の乱数の値
    を、値が小さくなるに従い分布の数が多くなるように、
    所定の関数に代入することで補正をして、現実の分布に
    近似させることを特徴とする請求項1又は2記載の姓デ
    ータの生成方法。
  4. 【請求項4】 前記第4の工程は、 前記第3の乱数の値と前記第4の乱数の値とに各々対応
    する前記上位文字列と前記下位文字列とを組合せて前記
    姓データを生成するとき、前記上位文字列と前記下位文
    字列とが、予め登録された第3の禁則である所定の前記
    文字列の組合せに該当する場合、又は、前記下位文字列
    に付加された前記第1の属性と前記下位文字列に付加さ
    れた前記第2の属性との組合せが予め登録された第3の
    禁則である所定の組合せに該当する場合、組合された前
    記文字列を前記姓データから除外する第6の工程を含む
    ことを特徴とする請求項1乃至3のいずれかに記載の姓
    データの生成方法。
  5. 【請求項5】 請求項1乃至4のいずれかに記載の姓デ
    ータの生成方法を実行可能なプログラムが記録された記
    憶媒体。
  6. 【請求項6】 システム開発でのテストデータなどに使
    用する姓データの生成装置であって、 乱数を発生させ、ランダムな値を取得するための乱数発
    生手段と、 入力手段を介して、前記姓データを生成するため、一般
    の印刷物にて頻出度の高い複数の頻出姓と、組合せのた
    めの複数の文字列と、該文字列の組合せで生成した前記
    姓データを除外するための所定の禁則を有する禁則テー
    ブルとが登録される記憶手段と、 前記乱数発生手段による第2の乱数の値を、小さくなる
    に従い分布の数が多くなるように近似処理を施して補正
    し、現実の分布に近似させ、前記頻出姓から、補正され
    た値に対応する頻出姓を取得して姓データを生成する頻
    出姓生成部と、前記乱数発生手段による第3の乱数の値
    と第4の乱数の値に各々対応する前記文字列の組合せに
    より前記姓データを生成し、前記姓データを生成する毎
    に生成件数に1を加算する組合せ姓生成部とを有し、生
    成された前記データを出力手段を介して出力する姓生成
    手段と、 前記頻出姓に基づく前記姓データと前記文字列の組合せ
    に基づく前記姓データとが生成される所定の比率を定め
    る設定値と前記乱数発生手段が発生する第1の乱数とに
    基づき、 前記頻出姓に基づく前記姓データの生成処理と前記文字
    列の組合せに基づく前記姓データの生成処理とを振分け
    る処理振分け手段と、 前記文字列の組合せにより前記姓データを生成すると
    き、前記禁則テーブルが有する禁則を参照して禁則チェ
    ックを行う禁則チェック手段とを備えることを特徴とす
    る姓データの生成装置。
  7. 【請求項7】 前記記憶手段は、 人名辞書や印刷物などで検索され、頻出度の高い前記頻
    出姓を頻出順にソートして登録される頻出姓テーブル
    と、 組合せにより生成される前記姓データを構成する前記文
    字列である、前記姓データの上位に位置する1つの文
    字、又は、文字列の上位文字列と、前記姓データの下位
    に位置する1つの文字、又は、文字列の下位文字列とが
    登録される文字列テーブルと、 前記文字列を前記上位文字列として登録するとき、所定
    の文字列を除外するための、文字の組合せである第1の
    禁則と、前記文字列を前記下位文字列として登録すると
    き、所定の文字列を除外するための、文字の組合せであ
    る第2の禁則と、前記上位文字列と前記下位文字列とを
    組合せて前記姓データを生成するとき、所定の上位文字
    列と下位文字列との組合せによる前記姓データを除外
    し、前記上位文字列に付加された第1の属性と前記下位
    文字列に付加された第2の属性との所定の組合せを除外
    するための第3の禁則とが登録される禁則テーブルとを
    備えることを特徴とする請求項6記載の姓データの生成
    装置。
  8. 【請求項8】 前記禁則チェック手段は、 前記文字列を前記上位文字列として前記記憶手段に登録
    するとき、前記禁則テーブルの前記第1の禁則を参照し
    て、該当する文字の組合せとなる前記文字列を登録から
    除外し、 前記文字列を前記下位文字列として前記記憶手段に登録
    するとき、前記禁則テーブルの前記第2の禁則を参照し
    て、該当する文字の組合せとなる前記文字列を登録から
    除外し、 前記組合せ姓生成部で前記上位文字列と前記下位文字列
    とを組合せて前記姓データを生成するとき、前記禁則テ
    ーブルの前記第3の禁則を参照して、該当する前記上位
    文字列と前記下位文字列との組合せによる前記姓データ
    の生成を除外し、 前記禁則テーブルの前記第3の禁則を参照して、前記上
    位文字列に付加された第1の属性と前記下位文字列に付
    加された第2の属性との組合せが該当する場合、前記姓
    データの生成を除外することを特徴とする請求項6又は
    7記載の姓データの生成装置。
JP36381399A 1999-12-22 1999-12-22 姓データの生成装置 Expired - Fee Related JP3514193B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36381399A JP3514193B2 (ja) 1999-12-22 1999-12-22 姓データの生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36381399A JP3514193B2 (ja) 1999-12-22 1999-12-22 姓データの生成装置

Publications (2)

Publication Number Publication Date
JP2001175684A true JP2001175684A (ja) 2001-06-29
JP3514193B2 JP3514193B2 (ja) 2004-03-31

Family

ID=18480260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36381399A Expired - Fee Related JP3514193B2 (ja) 1999-12-22 1999-12-22 姓データの生成装置

Country Status (1)

Country Link
JP (1) JP3514193B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293830A (ja) * 2006-03-30 2007-11-08 Japan Research Institute Ltd テストデータ生成システム、そのプログラム、その記録媒体、及びテストデータ生成方法
JP2008065687A (ja) * 2006-09-08 2008-03-21 Fujitsu Ltd テストデータ作成装置
WO2008114452A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 模擬処理装置、模擬処理システム及びコンピュータプログラム
JP2010277481A (ja) * 2009-05-29 2010-12-09 Ntt Data Corp 擬似データ生成装置、擬似データ生成方法及びコンピュータプログラム
JP2016177490A (ja) * 2015-03-19 2016-10-06 株式会社エヌ・ティ・ティ・データ 質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6209312B2 (ja) 2011-03-18 2017-10-04 株式会社リコー 画像形成装置及び画像形成方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293830A (ja) * 2006-03-30 2007-11-08 Japan Research Institute Ltd テストデータ生成システム、そのプログラム、その記録媒体、及びテストデータ生成方法
JP2008065687A (ja) * 2006-09-08 2008-03-21 Fujitsu Ltd テストデータ作成装置
WO2008114452A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 模擬処理装置、模擬処理システム及びコンピュータプログラム
JP4998552B2 (ja) * 2007-03-20 2012-08-15 富士通株式会社 模擬処理装置、模擬処理システム及びコンピュータプログラム
JP2010277481A (ja) * 2009-05-29 2010-12-09 Ntt Data Corp 擬似データ生成装置、擬似データ生成方法及びコンピュータプログラム
JP2016177490A (ja) * 2015-03-19 2016-10-06 株式会社エヌ・ティ・ティ・データ 質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム

Also Published As

Publication number Publication date
JP3514193B2 (ja) 2004-03-31

Similar Documents

Publication Publication Date Title
WO2006020654A2 (en) System and method for generating production-quality data to support software testing
US20030196191A1 (en) Recursive use of model based test generation for middlevare validation
US5638381A (en) Apparatus and method for deriving correspondence between storage elements of a first circuit model and storage elements of a second circuit model
KR102168319B1 (ko) 신규 개체명 단어에 연관된 말뭉치 생성을 위한 문장 자동 생성 장치 및 그 동작 방법
JP2001175684A (ja) 姓データの生成方法及びその生成装置
CN111475402A (zh) 程序功能的测试方法及相关装置
US7647570B2 (en) System and method for checking equivalence between descriptions
CN108170466B (zh) 一种基于程序合成的c/c++程序缺陷自动修复方法
KR102187528B1 (ko) 도메인 기반의 음성 인식 모델의 최적화가 가능한 음성 인식 장치 및 그 동작 방법
US6678853B1 (en) Method and apparatus for generating random code
KR20230082792A (ko) 소스코드 보안 취약점의 종류를 구별하는 인공지능 기반의 구별 모델의 생성을 통해 소스코드에 대한 보안 취약점의 종류를 확인할 수 있도록 지원하는 전자 장치 및 그 동작 방법
JP6971929B2 (ja) 問合せ文出力装置及び問合せ文出力方法
KR20220105549A (ko) 사용자 입력 조건에 기초하여 기계 번역 엔진의 구축에 사용될 학습용 문장 세트를 생성하는 학습용 문장 세트 생성 서버 및 그 동작 방법
CN108958823A (zh) 修改基本输入输出系统设定值的方法
CN112084667A (zh) 一种测试用例的生成方法、装置及电子设备
KR102375572B1 (ko) 기계 번역 모델 생성에 사용할 학습 문장을 자동으로 생성하는 전자 단말 장치 및 그 동작 방법
CN111026876A (zh) 助记词生成方法、公私钥对生成方法、设备和存储介质
KR102395700B1 (ko) 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법
KR102276290B1 (ko) 대용량 테스트 데이터 생성장치
US6035112A (en) Cell library generating method and apparatus
CN109582296B (zh) 一种基于栈增强lstm的程序表示方法
CN112649723B (zh) 转换延迟故障测试压缩环境下测试精简方法和装置
CN116266261A (zh) 一种基于反向查重生成检测报告的方法及系统
US20030035582A1 (en) Dynamic scanner
JP4334278B2 (ja) シーケンシャルシステムを分析する方法及びプログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040106

LAPS Cancellation because of no payment of annual fees