JP7215722B2 - 並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体 - Google Patents

並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP7215722B2
JP7215722B2 JP2019017967A JP2019017967A JP7215722B2 JP 7215722 B2 JP7215722 B2 JP 7215722B2 JP 2019017967 A JP2019017967 A JP 2019017967A JP 2019017967 A JP2019017967 A JP 2019017967A JP 7215722 B2 JP7215722 B2 JP 7215722B2
Authority
JP
Japan
Prior art keywords
data
character string
unit
rearrangement
rearranged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019017967A
Other languages
English (en)
Other versions
JP2020126413A (ja
JP2020126413A5 (ja
Inventor
雅英 中道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2019017967A priority Critical patent/JP7215722B2/ja
Publication of JP2020126413A publication Critical patent/JP2020126413A/ja
Publication of JP2020126413A5 publication Critical patent/JP2020126413A5/ja
Application granted granted Critical
Publication of JP7215722B2 publication Critical patent/JP7215722B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体に関する。
システム開発において、開発したシステムが正常に稼働するか等を確認するシステムテストが行われる。システムテストは、可能な限り前記システムが運用される本番環境と同じ環境で行われることが要求される。このため、システムテストに用いられるデータは、本番環境と同じ形式のデータであることが好ましい。
一方、システムテストに個人情報等の生データを用いると情報漏洩等のリスクがある。そこで、代用データを作成する方法として、生データを特定の文字に置換する方法や、生データの一部を変更する方法がある(特許文献1)。
特開2010-152459号公報
しかしながら、特許文献1で生成された代用データは、可能な限り本番環境を再現するため、生データの一部のみを変更する。このため、代用データから生データを推測し得るため、個人情報等の生データを特定されるリスクがある。また、前記代用データは、前記変更により、システムにとって不自然な文字列となる可能性がある。この場合、前記代用データを用いると、システムテストの精度が低下するという問題がある。
そこで、本発明は、個人情報等の生データが特定されず、且つ、代用データとして用いる場合にシステムに適した並び替えデータを生成可能な並び替えデータ生成装置、及び並び替えデータ生産方法を提供することを目的とする。
前記目的を達成するために、本発明の並び替えデータ生成装置は、
分割部と並び替え部とデータ出力部とを含み、
前記分割部は、並び替え対象の文字列データを、予め決めた単位毎に分割し、
前記並び替え部は、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行い、
前記データ出力部は、前記並び替え後のデータを出力する、装置である。
本発明の並び替えデータ生産方法は、
分割工程と並び替え工程とデータ出力工程とを含み、
前記分割工程は、並び替え対象の文字列データを、予め決めた単位毎に分割し、
前記並び替え工程は、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行い、
前記データ出力工程は、前記並び替え後のデータを出力する、方法である。
本発明のプログラムは、前記本発明の並び替えデータ生産方法をコンピュータに実行させることを特徴とする。
本発明の記録媒体は、前記本発明のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、個人情報等の生データが特定されず、且つ、代用データとして用いる場合にシステムに適した並び替えデータを生成する並び替えデータ生成装置、及び並び替えデータ生産方法を提供可能となる。
図1は、実施形態1の並び替えデータ生成装置の一例の構成を示すブロック図である。 図2は、実施形態1の並び替えデータ生成装置のその他の例を示すブロック図である。 図3は、実施形態1の並び替えデータ生成装置における第1装置のハードウェア構成の一例を示すブロック図である。 図4は、実施形態1の並び替え対象の文字列データおよび単位の一例を示す表である。 図5は、実施形態1の分割した文字列データを、仮想的な器にデータセットとして格納する場合の一例を示す模式図である。 図6は、実施形態1の型情報の一例を示す表である。 図7は、実施形態1の並び替えデータ生成装置における処理の一例を示すフローチャートである。 図8は、実施形態2の分割情報の一例を示す表である。 図9は、実施形態2の並び替え対象の文字列データおよび単位の一例を示す表である。 図10は、実施形態2の分割した文字列データを、仮想的な器にデータセットとして格納する場合の一例を示す模式図である。 図11は、実施形態2の並び替えデータ生成装置における処理の一例を示すフローチャートである。 図12は、実施形態3の並び替えデータ生成装置の一例の構成を示すブロック図である。 図13は、実施形態3の型情報の生成の一例を示す表である。 図14は、実施形態3の並び替えの一例を示す表である。 図15は、実施形態3の並び替えデータ生成装置における処理の一例を示すフローチャートである。 図16は、実施形態4の並び替えデータ生成装置の一例の構成を示すブロック図である。 図17は、実施形態4の並び替えデータ生成装置における処理の一例を示すフローチャートである。 図18は、実施形態4の並び替えデータ生成装置における処理の一例を示すフローチャートである。 図19は、実施形態5の並び替えデータ生成装置の一例の構成を示すブロック図である。 図20は、実施形態5の並び替えデータ生成装置の一例の構成を示すブロック図である。
つぎに、本発明の実施形態について、図1から図20を用いて説明する。本発明は、下記の実施形態によって何ら限定及び制限されない。なお、図1から図20において、同一部分には、同一符号を付している。各実施形態における説明は、それぞれ、互いを援用できる。下記実施形態においては、並び替え対象の文字列データとして個人情報を例に説明するが、本発明は、この例示には制限されない。
[実施形態1]
図1は、本実施形態の並び替えデータ生成装置の一例の構成を示すブロック図である。図1に示すように、並び替えデータ生成装置1は、分割部10と並び替え部20とデータ出力部30とを含む。並び替えデータ生成装置1は、例えば、システムとしてサーバーに組み込まれてもよいし、本発明のプログラムがインストールされたパーソナルコンピューター(PC)でもよい。
並び替えデータ生成装置1は、例えば、前記各部を含む1つの装置でもよいし、それぞれが前記各部を含む、複数の装置を含むシステムでもよい。後者の場合、例えば、図2に示すように、分割部10及びデータ出力部30を含む制御部100と並び替え部20を含む作業部200とが、通信回線網300を介して接続可能な装置でもよい。そして、例えば、制御部100は、作業部200を制御し、作業部200は、制御部100からの指示を受けて、並び替え部20を稼働させ、並び替え後のデータを制御部100に送信する。制御部100及び作業部200の構成は、例えば、それぞれ、後述する、並び替えデータ生成装置1と同様である。制御部100及び作業部200としては、例えば、サーバーがあげられる。通信回線網300は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。通信回線網300は、例えば、インターネット回線、電話回線、LAN(Local Area Network)、WiFi(Wireless Fidelity)等があげられる。
図3に、並び替えデータ生成装置1のハードウェア構成のブロック図を例示する。以下において、並び替えデータ生成装置1が、前記各部を含む1つの装置として示すが、前述したように、これに限定されない。並び替えデータ生成装置1は、例えば、CPU(中央処理装置)101、メモリ102、記憶装置104、入力装置105、ディスプレイ106、通信デバイス107等を有する。並び替えデータ生成装置1の各部は、例えば、バス103を介して、相互に接続されている。
CPU101は、並び替えデータ生成装置1の全体の制御を担う。並び替えデータ生成装置1において、CPU101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的に、並び替えデータ生成装置1は、例えば、CPU101が、分割部10、並び替え部20及びデータ出力部30として機能する。
バス103は、例えば、外部機器とも接続できる。前記外部機器は、例えば、外部記憶装置(外部データベース等)、プリンター等があげられる。並び替えデータ生成装置1は、例えば、バス103に接続された通信デバイス107により、通信回線網(図示せず)に接続でき、前記通信回線網を介して、前記外部機器と接続することもできる。
メモリ102は、例えば、メインメモリを含み、前記メインメモリは、主記憶装置ともいう。CPU101が処理を行う際には、例えば、後述する記憶装置104に記憶されている、本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、CPU101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。メモリ102は、例えば、さらに、ROM(読み出し専用メモリ)を含む。
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記憶媒体と、前記記憶媒体に読み書きするドライブとを含む。前記記憶媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、FD(フロッピー(登録商標)ディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられ、前記ドライブは、特に制限されない。記憶装置104は、例えば、記憶媒体とドライブとが一体化されたハードディスクドライブ(HDD)であってもよい。
並び替えデータ生成装置1は、例えば、さらに、入力装置105、ディスプレイ106を有する。入力装置105は、例えば、タッチパネル、キーボード、マウス等である。ディスプレイ106は、例えば、LEDディスプレイ、液晶ディスプレイ等が挙げられる。
並び替えデータ生成装置1において、メモリ102及び記憶装置104は、並び替え対象の文字列データ及び並び替え後のデータを記憶することも可能である。
つぎに、並び替えデータ生成装置1の各部について説明する。
分割部10は、並び替え対象の文字列データを、予め決めた単位毎に分割する。前記「文字列データ」は、複数の文字から構成される文字列を含めばよく、特に制限されず、例えば、表形式のデータである。前記文字列データは、例えば、情報漏洩の防止が要求される情報であり、具体的には、個人情報、機密情報、秘密情報等があげられる。前記並び替え対象の文字列データは、例えば、1つのデータセットでもよいし、複数のデータセットの集合でもよい。
前記「予め決めた単位」は、例えば、前記文字列データに含まれる文字列の、属性、および文字の種類の少なくとも一方である。前記「予め決めた単位」の文字数は、特に制限されず、例えば、1文字でもよいし、複数でもよい。
図4に、前記並び替え対象の文字列データが、前記個人情報である場合の一例を示す。図4(A)は、前記個人情報を含む表であり、No.1からNo.5までの個人について、前記個人情報として、複数の文字列が表に記載されている。図4(B)は、前記文字列データを分割する前記単位の一例であり、図4(A)の前記個人情報の文字列データを、「属性」として「氏、名、住所、電話番号」の4つ、および「文字の種類」として「1バイト文字、2バイト文字」の2つにより、分割できることを示す。これにより、前記文字列データを、「A:氏を1バイト文字で示す」、「B:氏を2バイト文字で示す」、「C:名を1バイト文字で示す」、「D:名を2バイト文字で示す」、「E:住所を1バイト文字で示す」、「F:住所を2バイト文字で示す」、「G:電話番号を1バイト文字で示す」の、7つの「予め決めた単位」に分割できる。
前記属性は、前記並び替え対象の文字列データに含まれる文字列を分類したものであり、例えば、前記文字列が示す内容に基づき分類したものである。前記属性は、例えば、前記文字列データにおいて、前記文字列に予め付加された情報でもよいし、既知の手段を用いて前記文字列データを分析することにより、取得してもよい。
前記文字列データが、前記個人情報である場合、前記属性としては、例えば、氏名(氏および名)、住所、電話番号、血液型、勤務先、メールアドレス、所属部署、職位等が挙げられる。
前記文字の種類は、特に制限されず、例えば、1バイト文字、およびマルチバイト文字等でもよいし、漢字、ひらがな、カタカナ、アルファベット、数字、記号等でもよい。前記1バイト文字は、例えば、アルファベット及び数字である。前記マルチバイト文字は、例えば、2バイト文字であり、漢字、ひらがな及びカタカナである。
分割部10は、例えば、前記文字列データについて、前記予め決めた単位のうちのいずれであるかを判定し、これに基づき前記分割を行ってもよい。
並び替え部20は、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行う。前記並び替えは、既知の方法により行うことができ、特に制限されず、例えば、前記並び替え対象の文字列データの間で、所定の法則に基づき、前記単位毎に文字を入れ替えてもよいし、以下に示すように、型情報に、前記分割された単位の並び順を入れ替えて割り当ててもよい。
前記型情報を用いた前記単位の並び替えの一例について、図4から図6を用いて説明する。図5は、前記分割した文字列データを、仮想的な器にデータセットとして格納する場合の一例を示す模式図である。なお、図5において、「氏の1バイト文字」および「名の1バイト文字」に対応する前記仮想的な器については、図示を省略しているが、これらを含んでもよい。図5に示すように、図4(A)に示す前記個人情報の文字列データが、「氏の2バイト文字」、「名の2バイト文字」、「住所の2バイト文字」、「住所の1バイト文字」、および「電話番号の1バイト文字」の5つの単位(データセット210a~210e)に分割されて、それぞれの前記仮想的な器に格納される。例えば、前記文字列データの氏名「郵便 花子」の場合、データセット210aには「郵」および「便」の文字のデータが、データセット210bには「花」および「子」の文字のデータが、前記分割された単位として、それぞれ格納される。
並び替え部20は、それぞれのデータセット210a~210eについて、前記分割された単位の並び順の入れ替えを行う。前記並び順の入れ替えは、特に制限されず、例えば、ランダムでよい。
そして、並び替え部20は、前記型情報に、前記並び順の入れ替えを行った、前記分割された単位を割り当てる。前記型情報は、前記文字列データにおける前記単位の配置のひな形である。前記型情報は、予めデータ生成装置1の記憶装置104等に記憶されてもよいし、後述するように、生成してもよい。前記型情報の一例を、図6に示す。図6に示す前記型情報において、例えば、No.1~No.5の個人情報は、それぞれ、図4に示す「B」、「D」、「E」、「F」、および「G」の単位を、表に示す順番で含んでいる。
このように、並び替え部20が、前記型情報に、前記分割された単位の並び順を入れ替えて割り当てることにより、例えば、ユーザの所望の型情報を有する前記並び替え後のデータを生成できる。
データ出力部30は、前記並び替え後のデータを出力する。前記出力は、例えば、ファイルへの出力でもよいし、ディスプレイ106に出力してもよい。これにより、前記並び替え後のデータとして、前記並び替え対象の文字列データとは異なる文字列データが出力される。
つぎに、本実施形態の並び替えデータ生成方法の一例を、図7のフローチャートに基づき説明する。
まず、工程(A1)に先立って、並び替えデータ生成装置1が、前記並び替え対象の文字列データを取得しておく(A0)。前記データの取得は、例えば、キーボードでの入力、スキャナー等によるデータの読み込み、ファイルデータの入力、外部データベースにアクセスしての取得等がある。
次に、分割部10により、前記並び替え対象の文字列データを、予め決めた単位毎に分割する(A1)。この際、例えば、前述のように、前記文字列データについて、前記予め決めた単位のうちのいずれであるかを判定してもよい。
次に、並び替え部20により、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行う(A2)。
次に、データ出力部30により、前記並び替え後のデータを出力し(A3)、終了する(END)。
本実施形態によれば、前記出力された前記並び替え後のデータを、例えば、システムテストに用いた場合、前記並び替え後のデータは、生データに基づき生成された情報であり、また、前記「予め決めた単位」ごとの情報は保持されるため、システムテストの結果の信頼度が高くなる。さらに、個人情報等の生データが特定されず、情報漏洩のリスクは、低くなる。
[実施形態2]
本実施形態の並び替えデータ生成装置1は、分割部10が、並び替え対象の文字列データを、分割情報に基づいて分割する点以外、実施形態1の並び替えデータ生成装置1と同様である。
前記分割情報は、前記分割する前記単位の、具体的な文字列である。前記分割情報は、特に制限されず、例えば、ユーザが任意で設定できる。前記分割情報は、並び替えデータ生成装置1の記憶装置104等において予め記憶されていてもよいし、外部データベースにアクセスして取得してもよいし、前記並び替え対象の文字列データを分析することにより、取得してもよい。
図8に、前記分割情報の一例を示す。以下、前記分割情報として、住所の都道府県及び市区町村の名称を例に挙げて説明するが、本発明は、これに限定されない。図8(A)は、日本郵便株式会社が提供している郵便番号と住所等とを対応させたデータベースからの一部抜粋である(URL:https://www.post.japanpost.jp/zipcode/dl/oogaki-zip.html)。図8(A)の表において、太線の枠で囲んだ箇所は、都道府県及び市区町村を示す。図8(B)は、前記都道府県及び前記市区町村をまとめた表である。そして、図8(B)おける、それぞれの都道府県市区町村の文字列が、前記分割情報である。前記分割情報は、例えば、図8(B)に示すように、前記単位ごとに、任意の識別番号(ID)を紐づけたものでもよい。このように前記識別番号を用いることにより、例えば、データ処理をしやすくすることができる。
本実施形態において、分割部10は、前記並び替え対象の文字列データに前記分割情報が含まれるかを判定し、前記分割情報に基づいて分割する。図9及び図10に、前記分割情報に基づいて分割する一例を示す。図9(A)は、図4(A)と同じ表であり、図9(B)は、前記文字列データを分割する前記単位の一例であり、図9(A)の前記個人情報の文字列データを、「属性」として「氏、名、住所(都道府県及び市区町村)、住所(都道府県及び市区町村以降)、電話番号」の5つ、および「文字の種類」として「1バイト文字、2バイト文字」の2つにより、8つの「予め決めた単位」に分割できることを示す。
並び替え部20は、実施形態1と同様に、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行う。図10は、本実施形態における、前記分割した文字列データを、仮想的な器にデータセットとして格納する場合の一例を示す模式図である。図10に示すように、図9(A)に示す前記個人情報の文字列データが、「氏の2バイト文字」、「名の2バイト文字」、「都道府県及び市区町村のID」、「住所の都道府県市区町村以降の2バイト文字」、「住所の都道府県市区町村以降の1バイト文字」、および「電話番号の1バイト文字」の6つの単位(データセット210a~210f)に分割されて、それぞれの前記仮想的な器に格納される。
並び替え部20は、実施形態1と同様に、それぞれのデータセット210a~210fについて、前記分割された単位の並び順の入れ替えを行う。そして、並び替え部20は、前記型情報に、前記並び順の入れ替えを行った、前記分割された単位を割り当てる。そして、データ出力部30は、前記並び替え後のデータを出力する。
次に、本実施形態の並び替えデータ生成装置1における処理の一例を、図11のフローチャートに基づき説明する。
まず、実施形態1と同様にして、並び替え対象の文字列データを取得する(A0)。
次に、分割部10は、前記文字列データに前記分割情報が含まれるかを判定する(A4)。そして、含まれる場合(YES)、分割部10は、前記文字列データに含まれる前記分割情報を、前記単位とみなして、次の工程に進む。また、分割部10は、例えば、さらに、該当する前記文字列データに前記識別番号を付与してもよい(A5)。一方、含まれない場合(NO)、次の工程に進む。
次に、分割部10は、前記分割情報が含まれると判定されなかった文字列について、実施形態1と同様に、前記並び替え対象の文字列データを単位毎に分割する(A1)。
次に、並び替え部20は、前記単位毎に、実施形態1と同様に、前記並び替え対象の文字列データを並び替え(A2)、データ出力部30が、前記並び替え後のデータを出力し(A3)、終了する(END)。
本実施形態によれば、前記分割情報に基づいて、前記分割を行うため、例えば、システムにとってより自然な代用データを生成できる。
[実施形態3]
図12は、本実施形態の並び替えデータ生成装置の一例の構成を示すブロック図である。図12に示すように、本実施形態の並び替えデータ生成装置1は、さらに、型情報生成部40を含む以外は、実施形態1及び実施形態2の並び替えデータ生成装置1と同様である。また、並び替えデータ生成装置1のハードウェア構成は、CPU101が、さらに、型情報生成部40を含むこと以外、図3と同じである。
型情報生成部40は、前記型情報を生成する。前記型情報は、例えば、前述の通りである。型情報生成部40は、例えば、前記単位毎に分割された前記文字列データの情報を取得し、これに基づき、前記型情報を生成する。
前記型情報は、例えば、前記単位を示す属性記号を用いて、生成してもよい。前記属性記号は、特に制限されず、例えば、アルファベット等である。
図13に、前記型情報の一例を示す。図13(A)は、図4(A)と同様であり、図13(B)は、前記属性記号と前記単位との対応を示す表であり、図13(C)は、前記生成された型情報を示す表である。図13(A)において、前記文字列データの氏名「郵便 花子」の場合、「氏」及び「名」ともに漢字であるので、前記「氏」及び「名」の漢字(2バイト文字)を示す前記属性記号「B」及び「C」を用いて、それぞれ置き換える。すなわち、前記文字列データの氏名「郵便 花子」の型は、前記属性記号で表される型情報にすると、「BB DD」となる。この際、スペース等の記号文字は、例えば、前記属性記号に置き換えず、そのまま前記型情報とすることができる。
前記文字列データが、前記分割情報を参照して分割される場合、例えば、実施形態2と同様にして、前記都道府県市区町村を1単位であると判定し、前記属性記号で表す。具体的には、図13(A)で示す前記文字列データの住所「東京都千代田区○○○ △-△-△」の場合、「東京都千代田区」を、1単位であると判定する。そして、前記都道府県市区町村以降は、1文字単位で分割する。続いて、前記住所の識別番号を示す前記属性記号「E」と、前記都道府県市区町村以降の漢字(2バイト文字)及び数字(1バイト文字)をそれぞれ示す前記属性記号「F」及び「G」を用いて、それぞれ置き換える。すなわち、住所「東京都千代田区○○○ △-△-△」の型は、前記属性記号で表される型情報にすると、「EGGG F-F-F」となる。なお、上記において、○は、漢字一文字又は平仮名一文字が代入されることを示し、△は、アルファベット一文字又は数字一文字が代入されることを示す記号である。
並び替え部20は、前述のようにして、前記型情報に、前記分割された単位の並び順を入れ替えて割り当てることにより、前記並び替えを行う。
図14に、前記割り当ての一例を示す。図14(A)は、図13(C)と同じ表であり、図14(B)は、前記並び替え後のデータである。図14に示すように、前記並び替え後のデータは、同一の前記単位間で並び替えられ、さらに、前記型情報を有する。図14において、前記型情報は、前記並び替え対象のデータに基づき作成されたものであるので、前記並び替え後の文字列データは、前記並び替え対象の文字列データと同じ前記型情報を有している。
次に、本実施形態の並び替えデータ生成装置1における処理の一例を、図12のブロック図及び図15のフローチャートに基づき説明する。
まず、実施形態1及び2と同様にして、並び替えデータ生成装置1が、並び替え対象の文字列データを取得し(A0)、分割部10により、前記並び替え対象の文字列データを、分割する(A1)。
次に、型情報生成部40は、前記型情報を生成する(A6)。
次に、並び替え部20は、前記型情報に、前記分割された単位の並び順を入れ替えて割り当てることにより、前記並び替えを行う(A2)。
次に、データ出力部30は、実施形態1及び2と同様にして、前記並び替え後のデータを出力し(A3)、終了する(END)。
このように、前記型情報を生成して前記並び替えを行うことで、前記並び替え後のデータとして、前記並び替え対象の文字列データと同じ前記型情報を有するデータが出力されるため、例えば、システムテストの結果の信頼度がより高くなる。
[実施形態4]
図16は、本実施形態の並び替えデータ生成装置の一例の構成を示すブロック図である。図16に示すように、本実施形態の並び替えデータ生成装置1は、さらに、位置情報付与部50、記憶部60、及び復元部70を含む以外は、実施形態1から3の並び替えデータ生成装置1と同様である。また、並び替えデータ生成装置1のハードウェア構成は、CPU101が、さらに、位置情報付与部50及び復元部70を含むこと以外、図3と同じである。記憶部60は、例えば、記憶装置104である。
位置情報付与部50は、前記並び替え前の前記文字列データ及び前記並び替え後の前記文字列データに位置情報を付与する。前記位置情報は、オフセット値ともいう。前記位置情報は、前記分割された単位の並び順がわかればよく、特に制限されず、例えば、数字である。位置情報付与部50は、例えば、図5および図10に示す、前記各データセットに格納された前記文字または前記IDのデータに、重複しないようにオフセット値を付与する。すなわち、例えば、前記文字等のデータに、前記分割された単位毎における並び順の先頭から、1、2、3…というように付与する。具体的に、図4(A)の氏「郵便」を例に挙げて説明する。前記予め決めた単位を1文字とすると、前記オフセット値は、前記氏の先頭から、「郵」が1、「便」が2とすることができる。
そして、位置情報付与部50は、前記並び替え後の前記文字列データについても、同様にして、前記オフセット値を付与する。前記並び替え前及び前記並び替え後の前記位置情報は、具体的には、例えば、「郵:1:33」、「便:2:19」となる。前記例において、前の数字が、前記並び替え前の前記オフセット値、後の数字が、前記並び替え後の前記オフセット値である。
記憶部60は、前記並び替え前及び前記並び替え後の前記位置情報を記憶する。
復元部70は、前記並び替え後のデータから、前記並び替え前及び前記並び替え後の前記位置情報を参照し、前記文字列データを復元する。具体的には、前記並び替え後のオフセット値の順番で並べられている前記並び替え後のデータを、前記並び替え前の前記オフセット値の順番で並び直すことで、復元する。
次に、本実施形態の並び替えデータ生成装置1における処理の一例を、図16のブロック図及び図17のフローチャートに基づき説明する。
まず、実施形態1から3と同様にして、並び替えデータ生成装置1が、並び替え対象の文字列データを取得し(A0)、分割部10により、前記並び替え対象の文字列データを、分割する(A1)。
つぎに、位置情報付与部50は、前記並び替え前の前記文字列データに位置情報を付与し、記憶部60が、前記位置情報を記憶する(A7)。
つぎに、並び替え部20は、実施形態1から3と同様にして、前記単位毎に、前記並び替え対象の文字列データを並び替える(A2)。
つぎに、位置情報付与部50は、前記並び替え後の前記文字列データに位置情報を付与し、記憶部60が、前記位置情報を記憶する(A8)。
つぎに、データ出力部30は、実施形態1から3と同様にして、前記並び替え後のデータを出力し(A3)、終了する(END)。
次に、本実施形態の並び替えデータ生成装置1における前記並び替え後のデータの復元処理の一例を、図16のブロック図及び図18のフローチャートに基づき説明する。
まず、並び替えデータ生成装置1が、前記並び替え後のデータを取得する(B0)。前記取得は、実施形態1から3と同様である。
つぎに、分割部10は、前記並び替え後のデータを、分割する(B1)。この際、前記分割は、実施形態1から3と同様である。ここで、型情報生成部40により、型情報を生成してもよい。
つぎに、復元部70は、記憶部60に記憶されている前記位置情報を取得する(B2)。
つぎに、復元部70により、前記並び替え後のデータから、前記並び替え前及び前記並び替え後の前記位置情報を参照し、前記文字列データを復元する(B3)。前記復元において、前記型情報に基づいて、前記文字列データから他の文字列データに並び替えデータの割り当てを行ってもよい。
つぎに、データ出力部30により、前記並び替え前のデータ(前記並び替え対象の文字列データ)を出力し(B4)、復元処理を終了する(END)。
本実施形態によれば、実施形態1から3と同様の効果に加えて、生成された前記並び替え後のデータを前記並び替え前のデータに復元可能である。本実施形態により生成された前記並び替え後のデータは、例えば、バックアップとして好適に利用できる。具体的には、例えば、システムの運用において、前記並び替え後のデータをバックアップとして保存しておくことにより、前記システムに障害が発生した場合等にも、情報漏洩のリスクが低減する。
[実施形態5]
図19は、本実施形態の並び替えデータ生成装置の一例の構成を示す模式図である。図19に示すように、本実施形態の並び替えデータ生成装置1は、分割部10及びデータ出力部30(図示せず)を含む制御部100と、並び替え部20a~20j(図示せず)を含む10個の作業部200a~200jとを含む。本実施形態において、制御部100及び作業部200a~200jは、それぞれ、サーバーである。そして、作業部200a~200jが、それぞれにおいて前記並び替えを行うことにより、前記並び替えデータを生成する。これらの点以外は、実施形態1から4の並び替えデータ生成装置1と同様である。
作業部200a~200jのそれぞれに含まれる並び替え部20a~20j(図示せず)は、任意の順番で前記並び替えを行うことにより、前記並び替え後のデータを生成する。前記任意の順番は、例えば、ユーザが入力した任意の番号、およびシステムが生成した任意の番号の少なくとも一方により定まる順番とすることができる。前記任意の番号は、例えば、4桁である。
ここで、本実施形態において、データ生成装置1は、10個の作業部200a~200jを含む。このため、例えば、10個の作業部200a~200jに、0~9の数字を割り当てておくことにより、前記ユーザが入力した任意の番号における各桁の数字を、10個の作業部200a~200jのいずれかに対応させることができる。すなわち、例えば、前記任意の番号が、「3582」である場合、制御部100は、作業部200c(作業サーバー3)、作業部200e(作業サーバー5)、作業部200h(作業サーバー8)、作業部200b(作業サーバー2)の順に経由させ、それぞれにおいて前記並び替えを行うことで、前記並び替え後のデータを生成できる。
さらに、本実施形態の並び替えデータ生成装置1は、作業部200a~200jが復元部70a~70j(図示せず)を含み、それぞれの復元部70において、前述のようにして、前記並び替え前及び前記並び替え後の前記位置情報から、前記文字列データを復元することが可能である。すなわち、作業部200a~200jにおいて、前記任意の順番の逆の順番で、復元部70がそれぞれ復元を行うことで、元の前記文字列データを復元することができる。このため、例えば、前記任意の番号を暗証番号に設定すれば、前記暗証番号をユーザが入力した場合にのみ、元の前記文字列データを復元することができる。
本実施形態の並び替えデータ生成装置1は、図20に示すように、制御部100と作業部200a~200jとの間にスイッチ400を含んでもよい。スイッチ400は、例えば、制御部100と作業部200a~200jとの通信を制御する。
なお、本実施形態において、データ生成装置1は、10個の作業部200a~200jを含むが、これには制限されず、作業部200は、複数であればよい。また、本実施形態において、作業部200a~200jを連結し、それぞれにおける並び替え部20a~20jが前記並び替えを行っているが、これには制限されず、1つの作業部200が複数の並び替え部20を含み、同様に処理を行ってもよい。また、1つの並び替え部20を、仮想的に2つ以上の異なる並び替え部20として機能させる等により、同様に処理を行ってもよい。
本実施形態によれば、例えば、前記並び替えを複雑化することができ、システムテストの結果の信頼度が高くなるとともに、情報漏洩のリスクがより低くなる。
[実施形態6]
本実施形態のプログラムは、前記実施形態の並び替えデータ生産方法を、コンピュータ上で実行可能なプログラムである。本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体としては、特に限定されず、例えば、読み出し専用メモリ(ROM)、ハードディスク(HD)、光ディスク、フロッピー(登録商標)ディスク(FD)等があげられる。
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
本発明によれば、例えば、個人情報等の生データが特定されず、且つ、代用データとして用いる場合にシステムに適した並び替えデータを生成する並び替えデータ生成装置、及び並び替えデータ生産方法を提供可能となる。
上記の実施形態の一部または全部は、以下の付記のようにも記載しうるが、以下には限定されない。
(付記1)
分割部と並び替え部とデータ出力部とを含み、
前記分割部は、並び替え対象の文字列データを、予め決めた単位毎に分割し、
前記並び替え部は、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行い、
前記データ出力部は、前記並び替え後のデータを出力する、並び替えデータ生成装置。
(付記2)
前記単位が、前記文字列データに含まれる文字列の、属性、および文字の種類の少なくとも一方である、付記1記載の並び替えデータ生成装置。
(付記3)
前記分割部は、前記文字列データに分割情報が含まれるかを判定し、前記分割情報に基づいて、前記分割を行う、付記1または2記載の並び替えデータ生成装置。
(付記4)
前記並び替え部は、型情報に、前記分割された単位の並び順を入れ替えて割り当てることにより、前記並び替えを行う、付記1から3のいずれかに記載の並び替えデータ生成装置。
(付記5)
さらに、型情報生成部を含み、
前記型情報生成部は、前記並び替え対象の文字列データに基づき、型情報を生成する、付記4記載の並び替えデータ生成装置。
(付記6)
さらに、位置情報付与部と記憶部と復元部とを含み、
前記位置情報付与部は、前記並び替え前の前記文字列データ及び前記並び替え後の前記文字列データに位置情報を付与し、
前記記憶部は、前記並び替え前及び前記並び替え後の前記位置情報を記憶し、
前記復元部は、前記並び替え後のデータから、前記並び替え前及び前記並び替え後の前記位置情報を参照し、前記文字列データを復元する、付記1から5のいずれかに記載の並び替えデータ生成装置。
(付記7)
2つ以上の前記並び替え部を含み、
前記2つ以上の並び替え部が、任意の順番で前記並び替えを行うことにより、前記並び替え後のデータを生成する、付記1から6のいずれかに記載の並び替えデータ生成装置。
(付記8)
前記任意の順番が、ユーザが入力した任意の番号、およびシステムが生成した任意の番号の少なくとも一方により定まる順番である、付記7記載の並び替えデータ生成装置。
(付記9)
分割工程と並び替え工程とデータ出力工程とを含み、
前記分割工程は、並び替え対象の文字列データを、予め決めた単位毎に分割し、
前記並び替え工程は、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行い、
前記データ出力工程は、前記並び替え後のデータを出力する、並び替えデータ生産方法。
(付記10)
前記単位が、前記文字列データに含まれる文字列の、属性、および文字の種類の少なくとも一方である、付記9記載の並び替えデータ生産方法。
(付記11)
前記分割工程は、前記文字列データに分割情報が含まれるかを判定し、前記分割情報に基づいて、前記分割を行う、付記9または10記載の並び替えデータ生産方法。
(付記12)
前記並び替え工程は、型情報に、前記分割された単位の並び順を入れ替えて割り当てることにより、前記並び替えを行う、付記9から11のいずれかに記載の並び替えデータ生産方法。
(付記13)
さらに、型情報生成工程を含み、
前記型情報生成工程は、前記並び替え対象の文字列データに基づき、型情報を生成する、付記12記載の並び替えデータ生産方法。
(付記14)
さらに、位置情報付与工程と記憶工程と復元工程とを含み、
前記位置情報付与工程は、前記並び替え前の前記文字列データ及び前記並び替え後の前記文字列データに位置情報を付与し、
前記記憶工程は、前記並び替え前及び前記並び替え後の前記位置情報を記憶し、
前記復元工程は、前記並び替え後のデータから、前記並び替え前及び前記並び替え後の前記位置情報を参照し、前記文字列データを復元する、付記9から13のいずれかに記載の並び替えデータ生産方法。
(付記15)
前記並び替え工程において、2つ以上の並び替え部が、任意の順番で前記並び替えを行うことにより、前記並び替え後のデータを生成する、付記9から14のいずれかに記載の並び替えデータ生産方法。
(付記16)
前記任意の順番が、ユーザが入力した任意の番号、およびシステムが生成した任意の番号の少なくとも一方により定まる順番である、付記15記載の並び替えデータ生産方法。
(付記17)
付記9から16のいずれか一項に記載の方法をコンピュータ上で実行可能なプログラム。
(付記18)
付記17記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。
1 並び替えデータ処理装置
10 分割部
20 並び替え部
30 データ出力部
40 型情報生成部
50 位置情報付与部
60 記憶部
70 復元部
100 制御部
101 CPU
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 ディスプレイ
107 通信デバイス
200 作業部
210 データセット
300 通信回線網
400 スイッチ

Claims (16)

  1. 分割部と並び替え部とデータ出力部とを含み、
    前記分割部は、並び替え対象の文字列データを、予め決めた単位毎に分割し、
    前記並び替え部は、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行い、
    前記データ出力部は、前記並び替え後のデータを出力し、
    前記並び替え部は、型情報に、前記分割された単位の並び順を入れ替えて割り当てることにより、前記並び替えを行う、並び替えデータ生成装置。
  2. 前記単位が、前記文字列データに含まれる文字列の、属性、および文字の種類の少なくとも一方である、請求項1記載の並び替えデータ生成装置。
  3. 前記分割部は、前記文字列データに分割情報が含まれるかを判定し、前記分割情報に基づいて、前記分割を行う、請求項1または2記載の並び替えデータ生成装置。
  4. さらに、型情報生成部を含み、
    前記型情報生成部は、前記並び替え対象の文字列データに基づき、型情報を生成する、請求項1から3のいずれか一項に記載の並び替えデータ生成装置。
  5. さらに、位置情報付与部と記憶部と復元部とを含み、
    前記位置情報付与部は、前記並び替え前の前記文字列データ及び前記並び替え後の前記文字列データに位置情報を付与し、
    前記記憶部は、前記並び替え前及び前記並び替え後の前記位置情報を記憶し、
    前記復元部は、前記並び替え後のデータから、前記並び替え前及び前記並び替え後の前記位置情報を参照し、前記文字列データを復元する、請求項1から4のいずれか一項に記載の並び替えデータ生成装置。
  6. 2つ以上の前記並び替え部を含み、
    前記2つ以上の並び替え部が、任意の順番で前記並び替えを行うことにより、前記並び替え後のデータを生成する、請求項1から5のいずれか一項に記載の並び替えデータ生成装置。
  7. 前記任意の順番が、ユーザが入力した任意の番号、およびシステムが生成した任意の番号の少なくとも一方により定まる順番である、請求項6記載の並び替えデータ生成装置。
  8. 分割工程と並び替え工程とデータ出力工程とを含み、
    前記分割工程は、並び替え対象の文字列データを、予め決めた単位毎に分割し、
    前記並び替え工程は、前記単位毎に、前記文字列データ内における前記単位の並び順の並び替えを行い、
    前記データ出力工程は、前記並び替え後のデータを出力し、
    前記並び替え工程は、型情報に、前記分割された単位の並び順を入れ替えて割り当てることにより、前記並び替えを行い、
    前記各工程が、コンピュータにより実行される、並び替えデータ生産方法。
  9. 前記単位が、前記文字列データに含まれる文字列の、属性、および文字の種類の少なくとも一方である、請求項8記載の並び替えデータ生産方法。
  10. 前記分割工程は、前記文字列データに分割情報が含まれるかを判定し、前記分割情報に基づいて、前記分割を行う、請求項8または9記載の並び替えデータ生産方法。
  11. さらに、型情報生成工程を含み、
    前記型情報生成工程は、前記並び替え対象の文字列データに基づき、型情報を生成する、請求項8から11のいずれか一項に記載の並び替えデータ生産方法。
  12. さらに、位置情報付与工程と記憶工程と復元工程とを含み、
    前記位置情報付与工程は、前記並び替え前の前記文字列データ及び前記並び替え後の前記文字列データに位置情報を付与し、
    前記記憶工程は、前記並び替え前及び前記並び替え後の前記位置情報を記憶し、
    前記復元工程は、前記並び替え後のデータから、前記並び替え前及び前記並び替え後の前記位置情報を参照し、前記文字列データを復元する、請求項8から11のいずれか一項に記載の並び替えデータ生産方法。
  13. 前記並び替え工程において、2つ以上の並び替え部が、任意の順番で前記並び替えを行うことにより、前記並び替え後のデータを生成する、請求項8から12のいずれか一項に記載の並び替えデータ生産方法。
  14. 前記任意の順番が、ユーザが入力した任意の番号、およびシステムが生成した任意の番号の少なくとも一方により定まる順番である、請求項13記載の並び替えデータ生産方法。
  15. 請求項8から14のいずれか一項に記載の方法をコンピュータ上で実行可能なプログラム。
  16. 請求項15記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。
JP2019017967A 2019-02-04 2019-02-04 並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体 Active JP7215722B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019017967A JP7215722B2 (ja) 2019-02-04 2019-02-04 並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019017967A JP7215722B2 (ja) 2019-02-04 2019-02-04 並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体

Publications (3)

Publication Number Publication Date
JP2020126413A JP2020126413A (ja) 2020-08-20
JP2020126413A5 JP2020126413A5 (ja) 2021-09-30
JP7215722B2 true JP7215722B2 (ja) 2023-01-31

Family

ID=72084965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019017967A Active JP7215722B2 (ja) 2019-02-04 2019-02-04 並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP7215722B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209554A (ja) 2000-01-24 2001-08-03 Fujitsu Ltd テストデータ生成装置、テストデータ生成方法及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体
JP2014191431A (ja) 2013-03-26 2014-10-06 Nippon Telegr & Teleph Corp <Ntt> 匿名化システム、所持装置、匿名化装置、利用者装置、匿名化方法、およびプログラム
JP2015079403A (ja) 2013-10-18 2015-04-23 株式会社日立製作所 テストデータの作成方法、システム及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209554A (ja) 2000-01-24 2001-08-03 Fujitsu Ltd テストデータ生成装置、テストデータ生成方法及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体
JP2014191431A (ja) 2013-03-26 2014-10-06 Nippon Telegr & Teleph Corp <Ntt> 匿名化システム、所持装置、匿名化装置、利用者装置、匿名化方法、およびプログラム
JP2015079403A (ja) 2013-10-18 2015-04-23 株式会社日立製作所 テストデータの作成方法、システム及びプログラム

Also Published As

Publication number Publication date
JP2020126413A (ja) 2020-08-20

Similar Documents

Publication Publication Date Title
US7165020B2 (en) Multi-language phrase editor and method thereof
US8117219B2 (en) Generation of updatable anonymized data records for testing and developing purposes
JP4143661B2 (ja) テスト用リソース・ファイル及びテスト用フォントを用いた国際化ソフトウェアのテスト方法、装置及びプログラム
US7409388B2 (en) Generation of anonymized data records for testing and developing applications
JP2729025B2 (ja) データ処理システムにおけるフォント導出の方法
US6466900B1 (en) Multi-language phrase editor and method thereof
US6055365A (en) Code point translation for computer text, using state tables
JP4502615B2 (ja) 類似文検索装置、類似文検索方法、およびプログラム
JP7215722B2 (ja) 並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体
JP6805720B2 (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP6931442B2 (ja) 符号化プログラム、インデックス生成プログラム、検索プログラム、符号化装置、インデックス生成装置、検索装置、符号化方法、インデックス生成方法および検索方法
JP2007179347A (ja) プログラム検証支援システム
JP2018163505A (ja) 検索プログラム、情報処理装置および検索方法
CN115827115A (zh) 微信小程序的h5页面跳转方法、装置、设备及存储介质
JP2015052873A (ja) 文字列からなるテストデータを自動的に生成する方法及び文字列からなるテストデータ中に埋め込まれたシグネチャーを識別する方法、並びに、それらのコンピュータ及びコンピュータ・プログラム
JP4584359B2 (ja) ユニコード・コンバータ
JP6076285B2 (ja) 翻訳装置、翻訳方法及び翻訳プログラム
US20070038617A1 (en) Cultural property independent programming
JP2009093405A (ja) データ検索のためのシステム、方法及びコンピュータプログラム
JP2018181121A (ja) 分析装置、分析プログラム及び分析方法
JPS58151677A (ja) 翻訳文編集方法
JP2000276467A (ja) 変換装置
JP2024058778A (ja) データ処理システム、データ処理プログラム、およびデータ処理方法
JP4061283B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JPH064167A (ja) ディスク媒体障害の復旧方式

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
R151 Written notification of patent or utility model registration

Ref document number: 7215722

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151