JPH1153360A - Device and method for data conversion and medium for recording data conversion program - Google Patents

Device and method for data conversion and medium for recording data conversion program

Info

Publication number
JPH1153360A
JPH1153360A JP9211878A JP21187897A JPH1153360A JP H1153360 A JPH1153360 A JP H1153360A JP 9211878 A JP9211878 A JP 9211878A JP 21187897 A JP21187897 A JP 21187897A JP H1153360 A JPH1153360 A JP H1153360A
Authority
JP
Japan
Prior art keywords
data
conversion
analogy
rule
converting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9211878A
Other languages
Japanese (ja)
Other versions
JP3718328B2 (en
Inventor
Yumiko Shimogoori
祐美子 下郡
Satoshi Ito
聡 伊藤
Tomohiko Sawa
倫彦 澤
Makoto Matsumoto
誠 松本
Rieko Hijikata
理恵子 土方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP21187897A priority Critical patent/JP3718328B2/en
Publication of JPH1153360A publication Critical patent/JPH1153360A/en
Application granted granted Critical
Publication of JP3718328B2 publication Critical patent/JP3718328B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a data conversion device for using a data conversion processing on the basis of a conversion rule and a data conversion processing on the basis of analogy jointly. SOLUTION: A conversion processing of a character string on the basis of a predetermined conversion rule is executed by a conversion rule storage means 1 for storing the conversion rule, an input means 2 with which a user describes a desired conversion rule and a character string conversion processing means for converting character string data. Also, a comparison of the character string is performed between an analogy means 4 provided with a collating data storage part 4a and an analogy conversion processing part 4b and two tables stored in a database 6 and a conversion processing by an analogy is executed by a collating data retrieval means 5 for outputting to the analogy means 4a combination of the largest degree of similarity as the collating data.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、多量の文字列の変
換を行うデータ変換装置及びデータ変換方法に関する。
The present invention relates to a data conversion device and a data conversion method for converting a large number of character strings.

【0002】[0002]

【従来の技術】文字列データの集合は様々なアプリケー
ションに利用され、それぞれ所望の加工がなされる。こ
のように異なるアプリケーションで文字列データを扱う
場合、各アプリケーションが必要とする体系の文字列に
変換しなくてはならない場合がある。
2. Description of the Related Art A set of character string data is used for various applications, and each is processed as desired. When character string data is handled by different applications as described above, it may be necessary to convert the character strings into a character string of a system required by each application.

【0003】例えば、流体を制御する制御装置のプログ
ラムを作成するA社が、B社が販売している商品コード
“FC−1128”、“BC−1001”、“AC−0
001”である機器をプログラム上で識別するとする。
また、A社の制御装置では、制御対象となる機器の識別
コードを“アルファベット1文字+数字”で表さなけれ
ばならないものとする。この場合、A社のプログラマー
は、制御対象となる機器の識別コードを、A社の制御装
置が読み取れる体系に変換しなければならない。定めら
れた体系でなおかつ機器を識別できる値としては、例え
ば、“F1128”、“B1001”、“A0001”
が候補として挙げられる。
For example, a company A that creates a program for a control device for controlling a fluid has product codes “FC-1128”, “BC-1001”, and “AC-0” sold by a company B.
It is assumed that the device of “001” is identified on the program.
Further, in the control device of Company A, it is assumed that the identification code of the device to be controlled must be represented by “one letter of an alphabet + a number”. In this case, the programmer of Company A must convert the identification code of the device to be controlled into a system that can be read by the control device of Company A. Examples of the value that can be used to identify a device in a predetermined system include “F1128”, “B1001”, and “A0001”.
Is a candidate.

【0004】このように、与えられた文字列データを所
望の体系の文字列データに変換する方法としては、ユー
ザが予め変換ルールを記述し、その変換ルールに従っ
て、与えられた文字列データを変換する方法がある。こ
の変換ルールとしては、例えば、文字列を置換するため
のパターンを表現する正規表現で記述を行うものがあ
る。また、この場合、プログラムについて詳しくないユ
ーザ向けに、記述が容易な入力用GUIが提供されるこ
とが一般的である。
As described above, as a method of converting given character string data into character string data of a desired system, a user describes a conversion rule in advance, and converts given character string data according to the conversion rule. There is a way to do that. As this conversion rule, for example, there is a rule that is described using a regular expression that expresses a pattern for replacing a character string. In this case, an input GUI that is easy to describe is generally provided for a user who is not familiar with the program.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上述し
たような従来のデータ変換方法では、データ量が多くな
った場合、ユーザが文字列を調べてすべての変換ルール
を作成するのは非常に困難であり、また、膨大なコスト
がかかる。
However, in the conventional data conversion method as described above, it is very difficult for the user to examine a character string and create all conversion rules when the data amount is large. Yes, and at a huge cost.

【0006】一方、近年、ある問題に対して人間が行う
ような類推のメカニズムについて研究がなされている。
このような類推システムの一つとして、Melanie Mitche
llらが提案したCopycat ("Analogy-Making as Percept
ion: A Computer Model", Melanie Mitchell)がある。
このCopycat は文字列置換問題を題材にした推論システ
ムである。以下、その概略を説明する。
[0006] On the other hand, in recent years, research has been conducted on a mechanism of analogy that is performed by a human for a certain problem.
One such analogy system is Melanie Mitche
Copycat ("Analogy-Making as Percept" proposed by ll et al.
ion: A Computer Model ", Melanie Mitchell.
This Copycat is an inference system based on the character string replacement problem. Hereinafter, the outline will be described.

【0007】すなわち、Copycat が目的とするところ
は、与えられた問題に対して正しい答えを返すことでは
なく、与えられた問題を人間がどう捉えるかをモデル化
することである。また、Copycat は、Slipnet, Workspa
ce, Coderack, 温度の4部分からなっており、Slipnet
は長期記憶に相当し、文字に関する意味ネットである。
Workspace は短期記憶に相当し、与えられた文字列に対
する表象が作られる場所である。この表象は、簡単な特
徴や構造を検出する codeletと呼ばれるperceptual age
ntが多数起動されることによって作られる。このcodele
t は、前記Coderackの中に置かれてランダムに起動され
るが、今システムが注目している概念や構造に関係のあ
る codeletは、Coderack中に比較的多数置かれるため選
ばれる確率が高くなる。そして codelet選択のランダム
ネスを温度によって制御し、表象の形成に伴って温度を
下げていき、解が収束するようになっている。
That is, the purpose of Copycat is not to give a correct answer to a given problem, but to model how humans perceive a given problem. Copycat is Slipnet, Workspa
ce, Coderack, temperature
Is a semantic net corresponding to characters, which corresponds to long-term memory.
Workspace is equivalent to short-term memory, where the representation for a given string is created. This representation is a perceptual age called codelet that detects simple features and structures.
It is created by invoking many nts. This codele
t is randomly placed in the Coderack, but codelets related to the concept or structure that the system is currently focusing on are placed in Coderack in a relatively large number, so the probability of being selected is high. . Then, the randomness of the codelet selection is controlled by the temperature, and the temperature is lowered as the representation is formed, so that the solution converges.

【0008】本発明者等は、このような推論システムに
着目し、すでに格納されたデータ集合上の文字列をサン
プルとして類推を行い、その類推結果に従って文字列を
変換することにより、ユーザの負荷を軽減することがで
きるデータ変換方法を開発すべく、鋭意検討を重ねたも
のである。
The inventors pay attention to such an inference system, perform analogy by using a character string on a data set already stored as a sample, and convert the character string according to the analogy result, thereby reducing the load on the user. In order to develop a data conversion method that can reduce this, we have made intensive studies.

【0009】本発明は、上述したような従来技術の問題
点を解消するために提案されたもので、その目的は、変
換ルールに基づくデータ変換処理と類推に基づくデータ
変換処理とを併用することにより、変換ルールの登録の
負荷を大幅に削減することを可能としたデータ変換装
置、データ変換方法及びデータ変換プログラムを記録し
た媒体を提供することにある。
The present invention has been proposed to solve the above-mentioned problems of the prior art, and an object of the present invention is to use both data conversion processing based on conversion rules and data conversion processing based on analogy. Accordingly, an object of the present invention is to provide a data conversion device, a data conversion method, and a medium on which a data conversion program is recorded, which can greatly reduce the load of conversion rule registration.

【0010】[0010]

【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に記載の発明は、第1のデータを第2の
データに変換するデータ変換装置において、変換ルール
に基いて第1のデータを第2のデータに変換する手段
と、特定の複数のデータ間の組合せに基づいて第1のデ
ータを第2のデータに変換する手段とを備えたことを特
徴とするものである。
According to a first aspect of the present invention, there is provided a data conversion apparatus for converting a first data into a second data. Means for converting one data into second data, and means for converting the first data into second data based on a combination among a plurality of specific data. .

【0011】また、請求項6に記載の発明は、上記請求
項1に記載の発明を方法の観点から捉えたものであっ
て、第1のデータを第2のデータに変換するデータ変換
方法において、変換ルールに基いて第1のデータを第2
のデータに変換するステップと、特定の複数のデータ間
の組合せに基づいて第1のデータを第2のデータに変換
するステップとを含むことを特徴とするものである。
According to a sixth aspect of the present invention, there is provided a data conversion method for converting the first data into the second data. Converts the first data to the second based on the conversion rule.
And a step of converting the first data into the second data based on a combination between a plurality of specific data.

【0012】上記のような構成を有する請求項1に記載
のデータ変換装置及び請求項6に記載のデータ変換方法
によれば、変換の対象となるデータを、所定の変換ルー
ルを用いて所望の体系のデータに変換することができる
だけでなく、すでに格納された変換前後のデータを例題
として類推を行い、この類推に基づいてデータの変換処
理を行うことができるので、ユーザが全ての変換ルール
を構築しなくてもデータの変換が可能となる。
According to the data conversion apparatus according to the first aspect and the data conversion method according to the sixth aspect, the data to be converted is converted into a desired data using a predetermined conversion rule. Not only can it be converted to data of the system, but it is also possible to perform an analogy using the already stored data before and after the conversion as an example, and perform the data conversion process based on this analogy. Data conversion becomes possible without construction.

【0013】請求項2に記載の発明は、第1のデータを
第2のデータに変換するデータ変換装置において、変換
ルールを記憶する記憶手段と、前記変換ルール記憶手段
に変換ルールを登録する手段と、前記変換ルールに従っ
て第1のデータを第2のデータに変換するデータ変換処
理手段と、類推により第1のデータを第2のデータに変
換する類推手段と、前記類推手段に、特定の複数のデー
タ間の組合せである照合データを与える手段とを備えた
ことを特徴とするものである。
According to a second aspect of the present invention, in a data conversion device for converting first data into second data, a storage unit for storing a conversion rule and a unit for registering the conversion rule in the conversion rule storage unit. Data conversion processing means for converting the first data into second data according to the conversion rule; analogy means for converting the first data into second data by analogy; Means for providing collation data, which is a combination between the above data.

【0014】また、請求項7に記載の発明は、上記請求
項2に記載の発明を方法の観点から捉えたものであっ
て、第1のデータを第2のデータに変換するデータ変換
方法において、変換ルールを記憶する記憶処理と、前記
変換ルールを登録する処理と、前記変換ルールに従って
第1のデータを第2のデータに変換する処理と、類推に
より第1のデータを第2のデータに変換する類推処理
と、前記類推処理に際して、特定の複数のデータ間の組
合せである照合データを与える処理とを含むことを特徴
とするものである。
According to a seventh aspect of the present invention, there is provided a data conversion method for converting the first data into the second data. A process of storing a conversion rule, a process of registering the conversion rule, a process of converting the first data to the second data according to the conversion rule, and converting the first data to the second data by analogy. It is characterized by including analogy processing for conversion and processing for providing collation data which is a combination between a plurality of specific data in the analogy processing.

【0015】上記のような構成を有する請求項2に記載
のデータ変換装置及び請求項7に記載のデータ変換方法
によれば、ユーザにより登録され記憶された変換ルール
に従って、変換の対象となるデータを、所望の体系のデ
ータに変換することができるだけでなく、すでに格納さ
れた変換元データと変換先データの組合せである照合デ
ータに基づいて類推を行い、この類推によってデータの
変換処理を行うことができるので、ユーザが全ての変換
ルールを構築しなくてもデータの変換が可能となる。
According to the data conversion apparatus according to the second aspect and the data conversion method according to the seventh aspect, the data to be converted is converted in accordance with the conversion rules registered and stored by the user. Not only can be converted to data of a desired system, but also by analogy based on collation data that is a combination of already stored conversion source data and conversion destination data, and perform data conversion processing by this analogy Therefore, the data can be converted without the user having to construct all the conversion rules.

【0016】請求項3に記載の発明は、請求項1又は請
求項2記載のデータ変換装置において、変換されたデー
タの適否を評価する評価手段を備えたことを特徴とする
ものである。また、請求項8に記載の発明は、上記請求
項3に記載の発明を方法の観点から捉えたものであっ
て、請求項6又は請求項7記載のデータ変換方法におい
て、変換されたデータの適否を評価する評価処理を含む
ことを特徴とするものである。上記のような構成を有す
る請求項3に記載のデータ変換装置及び請求項8に記載
のデータ変換方法によれば、変換評価機能を備えること
により、データの変換結果に不具合がある場合には、ユ
ーザに不具合とその原因を提示することができるので、
変換ルールあるいは類推に基づくデータの自動変換によ
る間違いと、その間違いによるデバッグの負荷を軽減す
ることが可能となる。
According to a third aspect of the present invention, in the data conversion apparatus according to the first or second aspect, an evaluation means for evaluating whether the converted data is appropriate is provided. The invention according to claim 8 is an aspect in which the invention according to claim 3 is grasped from the viewpoint of a method, and in the data conversion method according to claim 6 or 7, the converted data is It is characterized by including an evaluation process for evaluating propriety. According to the data conversion device of the third aspect and the data conversion method of the eighth aspect having the above-described configuration, by providing the conversion evaluation function, when there is a defect in the data conversion result, Since you can show the user the problem and its cause,
It is possible to reduce errors caused by automatic conversion of data based on conversion rules or analogies, and the load of debugging due to the errors.

【0017】請求項4に記載の発明は、請求項2記載の
データ変換装置において、前記類推手段が、前記照合デ
ータを記憶する照合データ記憶部と、類推によってデー
タを変換する類推変換処理部とを備えたことを特徴とす
るものである。また、請求項9に記載の発明は、上記請
求項4に記載の発明を方法の観点から捉えたものであっ
て、請求項7記載のデータ変換方法において、前記類推
処理が、前記照合データを記憶する照合データ記憶ステ
ップと、類推によってデータを変換する類推変換処理ス
テップとを含むことを特徴とするものである。上記のよ
うな構成を有する請求項4に記載のデータ変換装置及び
請求項9に記載のデータ変換方法によれば、類推手段に
照合データを記憶する照合データ記憶部を設けたことに
より、類推処理のたびに照合データを検索する必要がな
くなるので、この照合データに基づく類推変換処理を効
率よく実行することができる。
According to a fourth aspect of the present invention, in the data conversion device according to the second aspect, the analogy means includes a collation data storage unit for storing the collation data, and an analogy conversion processing unit for converting data by analogy. It is characterized by having. According to a ninth aspect of the present invention, the invention of the fourth aspect is grasped from the viewpoint of a method. In the data conversion method according to the seventh aspect, the analogy processing includes converting the collation data. It is characterized by including a collation data storing step of storing and an analogy conversion processing step of converting data by analogy. According to the data conversion device according to the fourth aspect and the data conversion method according to the ninth aspect having the above configuration, the analog inference means is provided with the collation data storage unit for storing the collation data. It is not necessary to search for the collation data every time, so the analogy conversion processing based on this collation data can be executed efficiently.

【0018】請求項5に記載の発明は、請求項2記載の
データ変換装置において、前記類推手段に照合データを
与える手段が、変換元データの集合と変換先データの集
合を比較して、変換元データと変換先データであると予
想される組合せを検索する照合データ検索手段であるこ
とを特徴とするものである。また、請求項10に記載の
発明は、上記請求項5に記載の発明を方法の観点から捉
えたものであって、請求項7記載のデータ変換方法にお
いて、前記類推処理に際して照合データを与える処理
が、変換元データの集合と変換先データの集合を比較し
て、変換元データと変換先データであると予想される組
合せを検索する照合データ検索処理であることを特徴と
するものである。上記のような構成を有する請求項5に
記載のデータ変換装置及び請求項10に記載のデータ変
換方法によれば、変換元データの集合と変換先データの
集合を比較して、変換元データと変換先データであると
予想される最適な組合せを検索し、これを照合データと
して類推手段に提供できるので、より精度の高い類推処
理が実行される。
According to a fifth aspect of the present invention, in the data conversion device according to the second aspect, the means for providing the collation data to the analogization means compares the set of the conversion source data with the set of the conversion destination data to perform the conversion. It is a collation data search means for searching for a combination expected to be original data and conversion destination data. According to a tenth aspect of the present invention, there is provided a data conversion method according to the seventh aspect, wherein matching data is provided at the time of the analogy processing. Is a collation data search process for comparing a set of conversion source data and a set of conversion destination data to search for a combination expected to be the conversion source data and the conversion destination data. According to the data conversion device of the fifth aspect and the data conversion method of the tenth aspect having the above configuration, the set of the conversion source data and the set of the conversion destination data are compared, and Since an optimum combination that is expected to be the conversion destination data can be searched for and provided to the analogization means as collation data, more accurate analogization processing is executed.

【0019】請求項11に記載の発明は、コンピュータ
によってデータの変換を行うデータ変換プログラムを記
録した記録媒体であって、あるデータを所望の体系のデ
ータに変換するに際し、変換ルールに基いてデータを変
換させ、また、変換元のデータと変換先のデータの組合
せサンプルに基づく類推によってデータを変換させるこ
とを特徴とするものである。
An invention according to claim 11 is a recording medium on which a data conversion program for performing data conversion by a computer is recorded, wherein when data is converted into data of a desired system, the data is converted based on a conversion rule. Is converted, and the data is converted by analogy based on a combination sample of the conversion source data and the conversion destination data.

【0020】また、請求項12に記載の発明は、コンピ
ュータによってデータの変換を行うデータ変換プログラ
ムを記録した記録媒体であって、あるデータを所望の体
系のデータに変換するに際し、変換ルールを記憶させ、
前記変換ルールに従ってデータを変換させ、また、類推
によりデータを変換させ、前記類推によりデータを変換
させるに際して、変換元のデータと変換先のデータの組
合せである照合データを付与させることを特徴とするも
のである。
According to a twelfth aspect of the present invention, there is provided a recording medium storing a data conversion program for performing data conversion by a computer, wherein a conversion rule is stored when certain data is converted into data of a desired system. Let
The data is converted according to the conversion rule, the data is converted by analogy, and when the data is converted by analogy, collation data, which is a combination of the data of the conversion source and the data of the conversion destination, is provided. Things.

【0021】上記のような構成を有する請求項11及び
請求項12に記載のデータ変換プログラムを記録した記
録媒体によれば、変換ルールに基づくデータ変換処理及
び類推に基づくデータ変換処理を実行させることができ
るデータ変換プログラムを、容易にユーザに提供するこ
とができる。
According to the recording medium storing the data conversion program according to the present invention, the data conversion processing based on the conversion rule and the data conversion processing based on the analogy are executed. Can be easily provided to the user.

【0022】[0022]

【発明の実施の形態】以下、本発明の実施形態を図1〜
図14を用いて具体的に説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG.
This will be specifically described with reference to FIG.

【0023】[1.構成]図1は本発明の一実施形態の
構成を示すブロック図である。すなわち、本実施形態の
データ変換装置には、与えられた文字列を所望の文字列
に変換するための変換ルールを記憶する変換ルール記憶
手段1が設けられている。また、前記変換ルール記憶手
段1には入力手段2が接続され、この入力手段2を用い
てユーザが所望の変換ルールを記述し、その変換ルール
を前記変換ルール記憶手段1に格納することができるよ
うに構成されている。なお、前記変換ルールには、例え
ば図2に示したように、検索パターン、置換する文字及
び転送文字が記述されている。また、図3は、前記入力
手段2を用いて変換ルールを入力するGUIの例を示し
たものである。
[1. Configuration] FIG. 1 is a block diagram showing a configuration of one embodiment of the present invention. That is, the data conversion device of the present embodiment is provided with the conversion rule storage unit 1 that stores a conversion rule for converting a given character string into a desired character string. An input unit 2 is connected to the conversion rule storage unit 1, and a user can describe a desired conversion rule using the input unit 2 and store the conversion rule in the conversion rule storage unit 1. It is configured as follows. The conversion rule describes a search pattern, a character to be replaced, and a transfer character, for example, as shown in FIG. FIG. 3 shows an example of a GUI for inputting a conversion rule using the input means 2.

【0024】また、本実施形態のデータ変換装置には、
前記変換ルール記憶手段1に記憶された変換ルールの中
から適用する変換ルールを選択し、その変換ルールに付
された優先度に従って、与えられた文字列データの変換
を行う文字列変換処理手段3が設けられている。
Further, the data converter of the present embodiment includes:
A character string conversion processing means 3 for selecting a conversion rule to be applied from the conversion rules stored in the conversion rule storage means 1 and converting given character string data according to the priority assigned to the conversion rule. Is provided.

【0025】そして、前記変換ルール記憶手段1、入力
手段2及び文字列変換処理手段3によって、予め定めら
れた変換ルールに基づく文字列の変換処理が実行され
る。
The conversion rule storing means 1, the input means 2, and the character string conversion processing means 3 execute a character string conversion process based on a predetermined conversion rule.

【0026】次に、類推により文字列を変換する手段に
ついて説明する。すなわち、本実施形態のデータ変換装
置には、照合データ記憶部4aと類推変換処理部4bを
備えた類推手段4が設けられている。なお、類推手段4
は、すでに変換処理がなされた変換元の文字列と変換先
の文字列の組み合わせを入力し、これに基づいて類推を
行い、与えられた文字列を変換するものである。この類
推手段4には前記入力手段2が接続され、ユーザが変換
元の文字列と変換先の文字列の組み合わせ(照合デー
タ)を入力することができるように構成されている。な
お、図4は、前記入力手段2を用いて照合データを入力
するGUIの例を示したものである。
Next, means for converting a character string by analogy will be described. That is, the data conversion device of the present embodiment is provided with the analogy inference means 4 including the collation data storage unit 4a and the analogy conversion processing unit 4b. The analogy means 4
Is to input a combination of a conversion-source character string and a conversion-destination character string that have already been converted, perform an analogy based on the combination, and convert the given character string. The input means 2 is connected to the analogization means 4 so that a user can input a combination (collation data) of a character string of a conversion source and a character string of a conversion destination. FIG. 4 shows an example of a GUI for inputting collation data using the input means 2.

【0027】また、前記類推手段4には、照合データ検
索手段5を介して、データベース6が接続されている。
この照合データ検索手段5は、データベース6に記憶さ
れた2つのテーブル間で文字列の比較を行い、それらの
類似度を計算し、最も大きい類似度を持つ組み合わせを
照合データ(例題)として、類推手段4に出力するもの
である。
A database 6 is connected to the analogy inference means 4 via a collation data search means 5.
The collation data search means 5 compares the character strings between the two tables stored in the database 6, calculates the similarity between them, and uses the combination having the largest similarity as the collation data (example) by analogy. Output to the means 4.

【0028】そして、前記入力手段2を介してユーザが
入力した照合データと、前記照合データ検索手段5を介
して入力された照合データの双方が、照合データ記憶部
4aに記憶され、これらの照合データに基づいて、類推
変換処理部4bにおいて類推変換処理がなされるように
構成されている。これら類推手段4,入力手段2、照合
データ検索手段5及びデータベース6によって、類推に
基づく文字列の変換処理が実行される。
The collation data input by the user via the input means 2 and the collation data input via the collation data search means 5 are both stored in the collation data storage section 4a. The analogy conversion processing unit 4b is configured to perform analogy conversion processing based on the data. By these analogy means 4, input means 2, collation data search means 5 and database 6, a character string conversion process based on analogy is executed.

【0029】なお、類推変換処理部4bにおける類推の
アルゴリズムは種々考えられるが、本実施形態では、類
推に上述したMelanie Mitchellらが提案したCopycat
("Analogy-Making as Perception : A Computer Mode
l", Melanie Mitchell )という類推システムのアルゴ
リズムを利用するものとする。
Although various analogy algorithms can be considered in the analogy conversion processing unit 4b, in the present embodiment, the copycat proposed by Melanie Mitchell et al.
("Analogy-Making as Perception: A Computer Mode
l ", Melanie Mitchell).

【0030】さらに、本実施形態のデータ変換装置には
変換評価手段7が設けられ、前記文字列変換処理手段3
あるいは類推手段4の類推変換処理部4bによって実行
された変換処理に矛盾がないか、変換後の文字列に重複
するものがないかといった評価を行い、その評価結果を
表示部8に表示するように構成されている。
Further, the data conversion device of the present embodiment is provided with a conversion evaluation means 7 and the character string conversion processing means 3
Alternatively, an evaluation is performed to determine whether there is any inconsistency in the conversion processing performed by the analogy conversion processing unit 4b of the analogization means 4 or whether there is any overlap in the converted character string, and display the evaluation result on the display unit 8. Is configured.

【0031】[2.作用]以下、本実施形態のデータ変
換装置の作用を、各処理ごとに例を用いて説明する。
[2. Operation] The operation of the data conversion apparatus according to the present embodiment will be described below using an example for each process.

【0032】[2−1.変換ルールに基づく文字列変換
処理]まず、文字列変換処理手段3によって実行され
る、変換ルールに基づく文字列変換処理について、図5
に示すフローチャートを用いて説明する。なお、ここで
は、変換ルールとして図2に示すルールが変換ルール記
憶手段1に登録され、この変換ルールの登録および適用
のGUIは図3に示すものとする。また、図6に示すデ
ータベースの客先データの属性値から、“アルファベッ
ト1文字+数字4桁”の制限がある制御コードを作成す
るものとする。
[2-1. Character string conversion processing based on conversion rule] First, a character string conversion processing based on a conversion rule, which is executed by the character string conversion processing means 3, will be described with reference to FIG.
This will be described with reference to the flowchart shown in FIG. Here, the rule shown in FIG. 2 is registered in the conversion rule storage unit 1 as a conversion rule, and the GUI for registering and applying this conversion rule is shown in FIG. It is also assumed that a control code having a limitation of "one alphabetic character + four digits" is created from the attribute values of customer data in the database shown in FIG.

【0033】(ステップ501)まず、文字列変換に適
用する変換ルールを図3に示すGUIで選択し、変換ル
ール記憶手段1から指示された優先度順に変換ルールを
取り出す。図3では、ルール3→ルール1→ルール2の
順で処理を行うように優先順位が指示されている。
(Step 501) First, a conversion rule to be applied to character string conversion is selected in the GUI shown in FIG. 3, and the conversion rules are extracted from the conversion rule storage unit 1 in the order of the specified priority. In FIG. 3, the order of priority is instructed so that processing is performed in the order of rule 3 → rule 1 → rule 2.

【0034】(ステップ502)ステップ501で取り
出した変換ルールの内、未処理のものがあるか否かを調
べ、未処理のものがあれば次のステップ503に進み、
なければ文字列の変換処理を終了する。ここでは、変換
処理が開始されたばかりなので、ルール3が適用される
と仮定する。なお、ルール3は「1番目の文字が数字、
2番目の文字が英字、3番目の文字が“−”の場合、H
$4$5$6$1に変換する」というものである。
(Step 502) It is checked whether there is any unprocessed rule among the conversion rules extracted in step 501, and if there is an unprocessed rule, the process proceeds to the next step 503.
If not, the character string conversion process ends. Here, it is assumed that the conversion process has just started, and that rule 3 is applied. Rule 3 states that the first character is a number,
If the second character is alphabetic and the third character is "-", H
{4 に 5 $ 6 $ 1] ".

【0035】(ステップ503)変換元となる文字列を
取り出す。例えば、図6に示す表から、FC−112
8、BC−1001、AC−0001、63FC−1、
65FC−5、FC−6301、8C−112を取り出
す。
(Step 503) A character string to be converted is extracted. For example, from the table shown in FIG.
8, BC-1001, AC-0001, 63FC-1,
Take out 65FC-5, FC-6301 and 8C-112.

【0036】(ステップ504)ステップ503で取り
出した文字列の内、未処理のものがあるか否かを調べ、
未処理のものがあれば次のステップ505に進み、すべ
ての文字列の処理が済んでいる場合には、ステップ50
2に戻り、次の変換ルールを適用する。図6の例では、
FC−1128、BC−1001、AC−0001、6
3FC−1、65FC−5、FC−6301、8C−1
12のすべての文字列について処理が終わっていれば、
ステップ502に戻る。
(Step 504) It is checked whether or not any of the character strings extracted in step 503 is unprocessed.
If there is an unprocessed one, the process proceeds to the next step 505. If all character strings have been processed, the process proceeds to step 50.
Returning to 2, the next conversion rule is applied. In the example of FIG.
FC-1128, BC-1001, AC-0001, 6
3FC-1, 65FC-5, FC-6301, 8C-1
If processing has been completed for all 12 character strings,
Return to step 502.

【0037】(ステップ505)ステップ503で取り
出した文字列が、変換ルールの検索パターンにマッチす
るか否かを調べる。今、ルール3と上記6つの文字列と
を照合すると、8C−112がマッチするので、ステッ
プ506に進み、ルール3に従って文字列を変換する。
一方、それ以外の文字列はルール3の条件にマッチしな
いので、ステップ508に進み、次の文字列が選択さ
れ、ステップ504〜ステップ508の処理が繰り返さ
れる。
(Step 505) It is checked whether or not the character string extracted in step 503 matches the search pattern of the conversion rule. When Rule 3 is compared with the above six character strings, 8C-112 matches. Therefore, the process proceeds to Step 506, and the character string is converted according to Rule 3.
On the other hand, since the other character strings do not match the condition of rule 3, the process proceeds to step 508, the next character string is selected, and the processing of steps 504 to 508 is repeated.

【0038】(ステップ506)変換ルールの転送文字
に従い、文字列を変換する。ルール3と8C−112の
場合、ルール3の転送文字より“H1128”に変換さ
れる。 (ステップ507)変換元の文字列と変換先の文字列、
および適用した変換ルールを記録する。上記の例では変
換元“8C−112”、変換先“H1128”、適用ル
ール“ルール3”という記録が作成される。
(Step 506) The character string is converted according to the transfer character of the conversion rule. In the case of rules 3 and 8C-112, the characters transferred from rule 3 are converted to "H1128". (Step 507) Character string of conversion source and character string of conversion destination,
And record the applied conversion rules. In the above example, a record of the conversion source “8C-112”, the conversion destination “H1128”, and the application rule “rule 3” is created.

【0039】(ステップ508)ステップ505〜ステ
ップ507によって、ある文字列について変換処理が終
了すると、次の文字列が選択され、ステップ504に戻
る。今、ルール3について、すべての文字列の処理が終
了したとすると、ステップ502に戻り、次のルールと
して、優先順位に基づいてルール1が選択され、また、
ステップ503において、文字列としてFC−1128
が選択されたと仮定する。なお、ルール1は「2番目の
文字が“C”、3番目の文字が“−”の場合、$1$4
$5$6$7に変換する」というものである。
(Step 508) When the conversion process for a certain character string is completed in steps 505 to 507, the next character string is selected, and the process returns to step 504. Now, assuming that all character strings have been processed for rule 3, the process returns to step 502, and rule 1 is selected as the next rule based on priority.
At step 503, FC-1128 is used as a character string.
Is selected. Note that rule 1 states that if the second character is "C" and the third character is "-", {1} 4
"Convert to {5} / 6}".

【0040】(ステップ505)今、ルール1とFC−
1128とを照合すると、マッチするのでステップ50
6の処理を行う。なお、ルール1と65FC−5であれ
ばマッチしないので、ステップ508の処理を行う。 (ステップ506)変換ルールの転送文字に従い、文字
列を変換する。ルール1とFC−1128の場合、ルー
ル1の転送文字より“F1128”に変換される。 (ステップ507)変換元の文字列と変換先の文字列、
および適用した変換ルールを記録する。上記の例では変
換元“FC−1128”、変換先“F1128”、適用
ルール“ルール1”という記録が作成される。
(Step 505) Now, rule 1 and FC-
If it is compared with 1128, it matches, so step 50
6 is performed. If the rule 1 and 65FC-5 do not match, the process of step 508 is performed. (Step 506) The character string is converted according to the transfer character of the conversion rule. In the case of Rule 1 and FC-1128, the transfer character of Rule 1 is converted to “F1128”. (Step 507) Character string of conversion source and character string of conversion destination,
And record the applied conversion rules. In the above example, a record of the conversion source “FC-1128”, the conversion destination “F1128”, and the application rule “rule 1” is created.

【0041】このように、変換対象となるすべての文字
列について、適用すべきすべての変換ルールを適用し
て、変換処理がなされる。なお、変換ルールに付された
優先度によって変換結果が異なる場合もある。例えば、
“8C−112”という文字列は、上述したように優先
度がルール3→ルール1→ルール2の順であれば、“H
1128”に変換される。しかし、優先度がルール1→
ルール2→ルール3の順であれば、先にルール1によっ
てパターンマッチが起こり、“8112”となる。
As described above, the conversion process is performed on all the character strings to be converted by applying all the conversion rules to be applied. Note that the conversion result may differ depending on the priority assigned to the conversion rule. For example,
If the priority of the character string “8C-112” is in the order of rule 3 → rule 1 → rule 2 as described above, “H”
1128 ". However, the priority is rule 1 →
In the order of rule 2 → rule 3, a pattern match occurs first according to rule 1, and the result is “8112”.

【0042】[2−2.類推に基づく文字列変換処理]
次に、類推手段4によって実行される文字列変換処理に
ついて、図7に示すフローチャートを用いて説明する。
[2-2. Character string conversion processing based on analogy]
Next, a character string conversion process executed by the analogy inference means 4 will be described with reference to a flowchart shown in FIG.

【0043】(ステップ701)類推手段4において
は、まず、「1.例題入力」か「2.変換」のいずれか
の処理を選択する。
(Step 701) The analogy inference means 4 first selects either "1. Example input" or "2. Conversion".

【0044】(ステップ702)ステップ701におい
て、「1.例題入力」が選択された場合、図4に示した
ようなユーザによって入力された文字列の組み合わせ、
あるいは、次項で説明する照合データ検索手段5によっ
て選ばれた文字列の組み合わせを例題として取り出す。
例えば、FC−1128とF1128の組み合わせ、B
C−1001とB1001の組み合わせ、63FC−1
とF6301の組み合わせを照合データとして取得す
る。
(Step 702) In step 701, when “1. Example input” is selected, a combination of character strings input by the user as shown in FIG.
Alternatively, a combination of character strings selected by the collation data search means 5 described in the next section is extracted as an example.
For example, a combination of FC-1128 and F1128, B
Combination of C-1001 and B1001, 63FC-1
And the combination of F6301 as collation data.

【0045】(ステップ703)ステップ702で取り
出した照合データの内、未処理のものがあるか否かを調
べ、未処理の照合データがある場合には、ステップ70
4に進み、すべての照合データについて処理が終了して
いる場合には、例題の入力処理を終了する。 (ステップ704)所定の類推機構に、未処理の照合デ
ータを例題として与える。ここでは、 Copycatのアルゴ
リズムを応用した類推機構に、未処理の照合データを例
題として与える。 (ステップ705)次の照合データを取得し、この照合
データが未処理であった場合には、所定の類推機構に、
この照合データを例題として与える。このようにして、
すべての照合データを所定の類推機構に例題として与え
ると、例題の入力処理は終了する。
(Step 703) It is checked whether or not there is unprocessed collation data among the collation data extracted in step 702.
Then, if the processing has been completed for all the collation data, the input processing of the example is completed. (Step 704) Unprocessed collation data is given as an example to a predetermined analogy mechanism. Here, unprocessed collation data is given as an example to an analogy mechanism applying the algorithm of Copycat. (Step 705) The next collation data is acquired, and if this collation data has not been processed, a predetermined analogy mechanism
This collation data is given as an example. In this way,
When all the collation data are given to the predetermined analogization mechanism as an example, the example input processing ends.

【0046】次に、類推手段4における文字列変換処理
について説明する。
Next, a description will be given of the character string conversion processing in the analogy inference means 4.

【0047】(ステップ706)上述したように例題の
入力処理が終了し、ステップ701において、「2.変
換」が選択されると、変換元のデータが取得される。例
えば、上記ステップ702に示した文字列の組み合わせ
が、所定の類推機構に例題として与えられている場合
に、AC−2223、12FC−3の文字列が変換元の
文字列として入力されたとする。 (ステップ707)ステップ706で取得された変換元
の文字列データの内、未処理のものがあるか否かを調
べ、未処理の文字列があればステップ708に進み、な
ければ文字列の変換処理を終了する。
(Step 706) As described above, the input processing of the example is completed, and when “2. Conversion” is selected in Step 701, the data of the conversion source is obtained. For example, it is assumed that the character strings of AC-2223 and 12FC-3 are input as the character strings to be converted when the combination of the character strings shown in step 702 is given as an example to the predetermined analogy mechanism. (Step 707) It is checked whether there is any unprocessed character string in the character string data of the conversion source acquired in step 706, and if there is an unprocessed character string, the process proceeds to step 708; The process ends.

【0048】(ステップ708)所定の類推機構に変換
元の文字列データを与えて、ステップ704で与えられ
た例題に基づいて、類推により文字列の変換を行う。こ
こでは Copycatのアルゴリズムを応用した類推機構に、
文字列データAC−2223、12FC−3を与えて変
換する。この場合、AC−2223はA2223に、1
2FC−3はF1203に変換されることが期待でき
る。
(Step 708) The character string data of the conversion source is given to a predetermined analogy mechanism, and the character string is converted by analogy based on the example given in step 704. Here is an analogy mechanism that applies the algorithm of Copycat,
The character string data AC-2223 and 12FC-3 are provided and converted. In this case, AC-2223 sets A2223 to 1
2FC-3 can be expected to be converted to F1203.

【0049】(ステップ709)変換元の文字列データ
と変換先の文字列データ、および推論のために与えられ
た例題を記録する。上記の例では、変換元“AC−22
23”、変換先“A2223”、与えられた例題“FC
−1128→F1128”という記録、変換元“12F
C−3”、変換先“F1203”、与えられた例題“6
3FC−1→F6301”という記録が作成される。 (ステップ710)ある文字列について類推変換処理が
終了すると、次の文字列が選択され、ステップ707に
戻り、変換対象となるすべての文字列について類推に基
づく文字列変換処理がなされる。
(Step 709) The character string data of the conversion source and the character string data of the conversion destination, and the example given for inference are recorded. In the above example, the conversion source “AC-22”
23 ", the conversion destination" A2223 ", and the given example" FC
-1128 → F1128 ”, conversion source“ 12F
C-3 ", the conversion destination" F1203 ", and the given example" 6
A record “3FC-1 → F6301” is created. (Step 710) When the analogy conversion processing is completed for a certain character string, the next character string is selected, and the process returns to Step 707, where all the character strings to be converted are processed. A character string conversion process based on analogy is performed.

【0050】[2−3.照合データ検索処理]次に、照
合データ検索手段5によって実行される照合データの検
索処理について、図8に示すフローチャートを用いて説
明する。なお、ここでは、図6に示した表データの「客
先コード」を比較元データ、図9に示す表データの「制
御コード」を比較先データとする。
[2-3. Collation Data Search Process] Next, the collation data search process executed by the collation data search means 5 will be described with reference to the flowchart shown in FIG. Here, the “customer code” of the table data shown in FIG. 6 is the comparison source data, and the “control code” of the table data shown in FIG. 9 is the comparison data.

【0051】(ステップ801)図6の客先コードの文
字列FC−1128、BC−1001、AC−000
1、63FC−1、65FC−5、FC−6301、8
C−112を比較元データとして取得し、図9の制御コ
ードの文字列A0001、F6301、F1128、F
6505、H1128、B1001を比較先データとし
て取り出す。 (ステップ802)ステップ801で取り出した比較元
データの内、未処理のものがあるか否かを調べ、未処理
の比較元データがある場合にはステップ803に進み、
すべてのデータの処理が終了している場合には、後述す
るステップ807に進む。 (ステップ803)ステップ801で取り出した比較先
データの内、未処理のものがあるか否かを調べ、未処理
の比較先データがある場合にはステップ804に進み、
すべての比較先データの処理が終了している場合には、
ステップ802に戻り、次の比較元データについて処理
がなされる。
(Step 801) Character strings FC-1128, BC-1001, AC-000 of the customer code shown in FIG.
1, 63FC-1, 65FC-5, FC-6301, 8
C-112 is acquired as comparison source data, and the character strings A0001, F6301, F1128, and F
6505, H1128, and B1001 are extracted as comparison destination data. (Step 802) It is checked whether or not there is unprocessed comparison source data among the comparison source data extracted in Step 801. If there is unprocessed comparison source data, the process proceeds to Step 803.
If all data has been processed, the process proceeds to step 807 described below. (Step 803) It is checked whether or not there is unprocessed comparison data among the comparison data extracted in Step 801. If there is unprocessed comparison data, the process proceeds to Step 804.
If all comparison data has been processed,
Returning to step 802, processing is performed on the next comparison source data.

【0052】(ステップ804)比較元データと比較先
データの類似度が、改良したDPマッチング(以下、D
Pマッチング+αという)により計算される。なお、こ
のDPマッチング+αについては、後述する。このDP
マッチングに基づいて求められた比較元データと比較先
データの類似度は、図10に示したようになる。このう
ち、FC−1128とF1128の類似度は“1”であ
り、また、FC−1128とH1128の類似度も同様
に“1”である。従って、DPマッチングのみでは、い
ずれの類似度がより高いかが不明であるので、両者の
「文字数の差」及び「不一致文字数」を勘案して、類似
度を求める。すなわち、FC−1128とF1128に
おいては、「文字数の差」は“2”、「不一致文字数」
は“C−”の2つである。これに対し、FC−1128
とH1128においては、「文字数の差」は“2”、
「不一致文字数」は“FC−”の3つである。その結
果、FC−1128とF1128の類似度の方が、より
高いと判断される。
(Step 804) DP matching (hereinafter referred to as D) in which the similarity between the comparison source data and the comparison destination data is improved.
P matching + α). This DP matching + α will be described later. This DP
The similarity between the comparison source data and the comparison destination data obtained based on the matching is as shown in FIG. Among them, the similarity between FC-1128 and F1128 is “1”, and the similarity between FC-1128 and H1128 is also “1”. Therefore, it is unclear which similarity is higher only by DP matching, and the similarity is calculated in consideration of the “difference in the number of characters” and the “number of mismatched characters”. That is, in FC-1128 and F1128, the "difference in the number of characters" is "2", and the "number of mismatched characters"
Are two of "C-". In contrast, FC-1128
And H1128, the “difference in the number of characters” is “2”,
The “number of mismatched characters” is “FC-”. As a result, it is determined that the similarity between FC-1128 and F1128 is higher.

【0053】(ステップ805)ステップ804で類似
度を計算した比較元データと比較先データの組み合わせ
と、得られた類似度とを記録する。例えば、図10に示
すような記録が作成される。 (ステップ806)次に、別の比較先データを取り出
し、ステップ803に戻る。そして、その比較先データ
が未処理であるか否かが判断され、未処理の場合には、
ステップ804〜ステップ806の処理が繰り返され
る。また、この類似度の計算が、すべての比較元データ
と比較先データの組み合わせについてなされ、類似度の
記録が作成されると、ステップ807に進み、どの組み
合わせがもっとも類似度が高いかが検索される。
(Step 805) The combination of the comparison source data and the comparison destination data for which the similarity was calculated in step 804, and the obtained similarity are recorded. For example, a record as shown in FIG. 10 is created. (Step 806) Next, another comparison destination data is extracted, and the process returns to Step 803. Then, it is determined whether or not the comparison destination data is unprocessed.
Steps 804 to 806 are repeated. When the similarity is calculated for all the combinations of the comparison source data and the comparison target data, and the record of the similarity is created, the process proceeds to step 807 to search which combination has the highest similarity. .

【0054】(ステップ807)まず、ステップ805
で記録された類似度データの中から、一つの比較元デー
タが選択される。 (ステップ808)続いて、この比較元データが未処理
か否かが判断され、未処理であった場合には、ステップ
809に進み、一方、すべての比較元データについて処
理が終了している場合には、照合データ検索処理を終了
する。
(Step 807) First, step 805
One of the comparison source data is selected from the similarity data recorded in the step (1). (Step 808) Subsequently, it is determined whether or not the comparison source data is unprocessed. If not, the process proceeds to Step 809. On the other hand, if the processing has been completed for all the comparison source data. Ends the collation data search process.

【0055】(ステップ809)ある比較元データにつ
いて、ステップ804で求められた類似度が予め設定し
た値以上であるか否かを調べ、設定値以上ならばステッ
プ810に進み、一方、設定値以下ならば、適切な照合
データが得られないので、照合データ検索処理を終了す
る。 (ステップ810)ステップ805で得られた記録を参
照し、最も類似度が高い組み合わせを検索する。図10
の例では、FC−1128とF1128の類似度が最大
値である。
(Step 809) With respect to certain comparison source data, it is checked whether or not the similarity obtained in step 804 is equal to or greater than a preset value. If so, appropriate collation data cannot be obtained, and the collation data search process ends. (Step 810) With reference to the record obtained in Step 805, a combination having the highest similarity is searched. FIG.
In the example, the similarity between FC-1128 and F1128 is the maximum value.

【0056】(ステップ811)ステップ810で検索
した最大の類似度を持つ組み合わせを、照合データとし
て前記類推手段に出力する。図10の例では、FC−1
128とF1128の組み合わせを照合データとして出
力する。 (ステップ812)ある比較元データについて最大類似
度の検索処理が終了すると、次の比較元データが選択さ
れ、ステップ808に戻る。そして、すべての比較元デ
ータについて最大類似度が検索され、最適な照合データ
が類推手段に出力される(図7のステップ702参
照)。
(Step 811) The combination having the maximum similarity retrieved in step 810 is output as collation data to the analog inference means. In the example of FIG.
128 and F1128 are output as collation data. (Step 812) When the search processing of the maximum similarity for a certain comparison source data is completed, the next comparison source data is selected, and the process returns to Step 808. Then, the maximum similarity is searched for all the comparison source data, and the optimum collation data is output to the analogization means (see step 702 in FIG. 7).

【0057】ここで、DPマッチングについて説明す
る。このDPマッチングは、文字列全体にわたってでき
るだけもっともらしいマッチングが行われるように考え
られた方法であって、タイナミックプログラミングの考
え方を用いる方法である。いま、文字列s…s
とt…tとの照合を行うと仮定する。そして、
文字sとtとの近さ(距離)という概念を導入し
て、これをd(s,t)とし、また、部分文字列s
…sとt…tとがもっとも良くマッチ
したというときのずれの量f(i,j)を導入し、これ
を次のような漸化式によって計算するものである。すな
わち、ずれの量f(i,j)が小さいほど、類似度は高
いということができる。
Here, the DP matching will be described. This DP matching is a method designed to perform as plausible matching as possible over the entire character string, and is a method using the concept of dynamic programming. Now, the string s 1 s 2 ... s m
And t 1 t 2 ... T n . And
The concept of closeness (distance) between characters s i and t j is introduced, and this is referred to as d (s i , t j ).
1 s 2 ... introduced amount f (i, j) of the deviation of the time that is the s i and t 1 t 2 ... t j were best match, this one calculated by recurrence formulas as follows is there. In other words, it can be said that the smaller the shift amount f (i, j), the higher the similarity.

【0058】[0058]

【数1】 [2−4.変換評価処理]次に、変換評価手段7によっ
て実行される、上記変換処理に対する評価処理につい
て、図11に示すフローチャートを用いて説明する。
(Equation 1) [2-4. Conversion Evaluation Process] Next, an evaluation process for the conversion process executed by the conversion evaluation means 7 will be described with reference to a flowchart shown in FIG.

【0059】(ステップ1101)類推手段4あるいは
文字列変換処理手段3に記録された変換の記録を取得す
る。例えば、図12のような記録を取得する。なお、図
12に示した記録においては、例えば、変換元“63F
C−1”は、変換ルール2に基づいて“F6301”に
変換されたことを表し、また、変換元“AC−222
3”は、例題“FC−1128→F1128”に基づい
て“A2223”に変換されたことを表している。
(Step 1101) A record of the conversion recorded in the analogical inference means 4 or the character string conversion processing means 3 is obtained. For example, a record as shown in FIG. 12 is obtained. In the recording shown in FIG. 12, for example, the conversion source “63F
“C-1” indicates that the data has been converted to “F6301” based on the conversion rule 2, and the conversion source “AC-222”
"3" indicates that it is converted to "A2223" based on the example "FC-1128 → F1128".

【0060】(ステップ1102)続いて、変換後の文
字列を使用するアプリケーションの文字列制限データベ
ースより、変換後の文字列に対する制限を取得する。例
えば、変換後の文字列は“アルファベット1 文字+数字
4 桁”でなければならないとする。 (ステップ1103)ステップ1101で取り出した変
換記録の内、未処理のものがあるか否かを調べ、未処理
のものがあればステップ1104へ進み、一方、すべて
の変換記録について処理が終了している場合には、変換
評価処理を終了する。
(Step 1102) Subsequently, the restriction on the converted character string is obtained from the character string restriction database of the application that uses the converted character string. For example, the converted character string is "1 alphabet + number
(Step 1103) It is checked whether there is any unprocessed record among the conversion records extracted in Step 1101, and if there is an unprocessed record, the process proceeds to Step 1104. If the processing has been completed for all the conversion records, the conversion evaluation processing ends.

【0061】(ステップ1104)変換先データがステ
ップ1102で取り出した制限を満たしているかどうか
調べ、満たしてない場合にはステップ1106に進み、
エラー表示を行う。一方、制限を満たしている場合に
は、ステップ1105に進む。 (ステップ1105)変換元データが異なるにも関わら
ず、変換先データが同じであるか否かが判断され、変換
先データが同じ場合(すなわち、重複している場合)に
は、ステップ1106に進み、エラー表示を行う。一
方、変換先データが重複していない場合には、ステップ
1107に進む。
(Step 1104) It is checked whether or not the conversion destination data satisfies the restriction extracted in step 1102, and if not, the process proceeds to step 1106.
Perform error display. On the other hand, if the limit is satisfied, the process proceeds to step 1105. (Step 1105) It is determined whether or not the conversion destination data is the same despite the conversion source data being different. If the conversion destination data is the same (that is, if the conversion destination data is duplicated), the process proceeds to step 1106. , Display an error. On the other hand, if the conversion destination data is not duplicated, the process proceeds to step 1107.

【0062】(ステップ1106)変換先データが制限
に違反している場合や、重複している場合には、そのエ
ラー内容及びエラーの状況等をユーザに表示する。例え
ば、図13に示したように、変換元データは異なるのに
(63FC−1、FC−6301)、変換先データが同
一(共に、F6301)となった場合には、重複エラー
として表示される。また、図14に示したように、変換
後の文字列は“アルファベット1 文字+数字4 桁”でな
ければならないのに、変換先データが“AB10”とな
り、与えられた制限に違反している場合には、制限エラ
ーとして表示される。 (ステップ1107)ある変換記録について評価処理が
終了すると、次の変換記録が選択され、ステップ110
3に戻る。そして、すべての変換記録について評価がな
されると、変換評価処理は終了する。
(Step 1106) When the conversion destination data violates the restriction or overlaps, the error contents and the error status are displayed to the user. For example, as shown in FIG. 13, if the conversion source data is different (63FC-1, FC-6301) but the conversion destination data is the same (both are F6301), a duplicate error is displayed. . In addition, as shown in FIG. 14, the converted character string must be “1 alphabet + 4 digits”, but the conversion destination data is “AB10”, which violates the given restriction. If so, it is displayed as a limit error. (Step 1107) When the evaluation processing is completed for a certain conversion record, the next conversion record is selected, and Step 110 is performed.
Return to 3. When all the conversion records have been evaluated, the conversion evaluation processing ends.

【0063】[3.効果]このように本実施形態におい
ては、膨大な文字列データを、所定の変換ルールを用い
て希望する文字列体系に変換することができる。さら
に、すでに格納されたデータの集合上の文字列を例題と
して類推を行い、この類推に基づいて文字列の変換処理
を可能とすることにより、ユーザが全ての変換ルールを
構築しなくても文字列の変換が可能になる。また、本実
施形態においては、変換評価機能を備えることにより、
変換結果に不具合がある場合には、ユーザに不具合とそ
の原因を提示することができるので、変換ルールあるい
は類推に基づく文字列の自動変換による間違いと、その
間違いによるデバッグの負荷を軽減することが可能とな
る。
[3. Effect] As described above, in the present embodiment, a huge amount of character string data can be converted into a desired character string system using a predetermined conversion rule. Furthermore, by performing an analogy using a character string on a set of already stored data as an example and enabling the conversion processing of the character string based on the analogy, the character string can be converted without the user having to construct all conversion rules. Column conversion becomes possible. In the present embodiment, by providing a conversion evaluation function,
If there is a problem in the conversion result, the problem and its cause can be presented to the user. This reduces errors caused by automatic conversion of character strings based on conversion rules or analogies, and reduces the load of debugging due to the error. It becomes possible.

【0064】[4.他の実施形態]なお、本発明は上述
した実施形態に限定されるものではなく、文字列データ
の変換に限らず、他のデータ変換処理に適用できること
は言うまでもない。
[4. Other Embodiments] It is needless to say that the present invention is not limited to the above-described embodiment, and is not limited to character string data conversion but can be applied to other data conversion processing.

【0065】また、類推変換処理部における類推のアル
ゴリズムとしては、Melanie Mitchellらが提案したCopy
cat の他に、Holyoak and Thagard らが提案したACME、
Gentner らが提案した SME、 Erman and V.Lesser らが
提案したHearsay-IIなどの手法を適用することができ
る。また、類似度の判断もDPマッチングに限られない
ことは言うまでもない。さらに、本発明に係るデータ変
換方法における処理は、コンピュータプログラムがコン
ピュータを制御することによって実現され、このプログ
ラムは記録媒体に記録されて提供される。
As an analogy algorithm in the analogy conversion processing unit, a copy algorithm proposed by Melanie Mitchell et al.
In addition to cat, ACME proposed by Holyoak and Thagard et al.
Methods such as SME proposed by Gentner et al. And Hearsay-II proposed by Erman and V. Lesser et al. Can be applied. Needless to say, the determination of similarity is not limited to DP matching. Further, the processing in the data conversion method according to the present invention is realized by a computer program controlling a computer, and the program is provided by being recorded on a recording medium.

【0066】[0066]

【発明の効果】以上述べたように、本発明によれば、変
換ルールに基づくデータ変換処理と類推に基づくデータ
変換処理とを併用することにより、変換ルールの登録の
負荷を大幅に削減することを可能としたデータ変換装
置、データ変換方法及びデータ変換プログラムを記録し
た媒体を提供することができる。
As described above, according to the present invention, the data conversion process based on the conversion rule and the data conversion process based on the analogy are used in combination, thereby greatly reducing the load of the conversion rule registration. , A data conversion method, and a medium recording a data conversion program.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1実施形態の構成を示すブロック図FIG. 1 is a block diagram showing a configuration of a first embodiment of the present invention.

【図2】変換ルールの一例を示す図FIG. 2 shows an example of a conversion rule.

【図3】変換ルールの登録画面の一例を示す図FIG. 3 shows an example of a conversion rule registration screen.

【図4】照合データの登録画面の一例を示す図FIG. 4 is a diagram showing an example of a registration screen of collation data.

【図5】変換ルールに基づく文字列変換処理の流れを示
すフローチャート
FIG. 5 is a flowchart showing a flow of a character string conversion process based on a conversion rule.

【図6】変換対象のデータベースの一例を示す図FIG. 6 is a diagram illustrating an example of a conversion target database;

【図7】類推に基づく文字列変換処理の流れを示すフロ
ーチャート
FIG. 7 is a flowchart showing the flow of a character string conversion process based on analogy;

【図8】照合データ検索処理の流れを示すフローチャー
FIG. 8 is a flowchart showing the flow of a collation data search process;

【図9】照合データベースの一例を示す図FIG. 9 is a diagram illustrating an example of a collation database.

【図10】類似度記録の一例を示す図FIG. 10 is a diagram showing an example of similarity recording.

【図11】変換評価処理の流れを示すフローチャートFIG. 11 is a flowchart showing the flow of a conversion evaluation process;

【図12】文字列変換の記録の一例を示す図FIG. 12 is a diagram illustrating an example of recording of character string conversion.

【図13】重複エラー表示の一例を示す図FIG. 13 is a diagram showing an example of a duplicate error display.

【図14】制限エラー表示の一例を示す図FIG. 14 is a diagram showing an example of a limit error display

【符号の説明】[Explanation of symbols]

1…変換ルール記憶手段 2…入力手段 3…文字列変換処理手段 4…類推手段 4a…照合データ記憶部 4b…類推変換処理部 5…照合データ検索手段 6…データベース 7…変換評価手段 8…表示手段 DESCRIPTION OF SYMBOLS 1 ... Conversion rule storage means 2 ... Input means 3 ... Character string conversion processing means 4 ... Analogue inference means 4a ... Collation data storage part 4b ... Analogue conversion processing part 5 ... Collation data search means 6 ... Database 7 ... Conversion evaluation means 8 ... Display means

───────────────────────────────────────────────────── フロントページの続き (72)発明者 松本 誠 東京都府中市東芝町1番地 株式会社東芝 府中工場内 (72)発明者 土方 理恵子 東京都府中市東芝町1番地 株式会社東芝 府中工場内 ──────────────────────────────────────────────────の Continuing on the front page (72) Inventor Makoto Matsumoto 1 Toshiba-cho, Fuchu-shi, Tokyo Inside the Toshiba Fuchu plant (72) Inventor Rieko 1-Toshiba-cho, Fuchu-shi, Tokyo Inside the Fuchu plant

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 第1のデータを第2のデータに変換する
データ変換装置において、 変換ルールに基いて第1のデータを第2のデータに変換
する手段と、特定の複数のデータ間の組合せに基づいて
第1のデータを第2のデータに変換する手段とを備えた
ことを特徴とするデータ変換装置。
1. A data conversion apparatus for converting first data into second data, comprising: means for converting the first data into second data based on a conversion rule; Means for converting the first data into the second data based on the data.
【請求項2】 第1のデータを第2のデータに変換する
データ変換装置において、 変換ルールを記憶する記憶手段と、 前記変換ルール記憶手段に変換ルールを登録する手段
と、 前記変換ルールに従って第1のデータを第2のデータに
変換するデータ変換処理手段と、 類推により第1のデータを第2のデータに変換する類推
手段と、 前記類推手段に、特定の複数のデータ間の組合せである
照合データを与える手段と、 を備えたことを特徴とするデータ変換装置。
2. A data conversion device for converting first data into second data, wherein: a storage unit for storing a conversion rule; a unit for registering a conversion rule in the conversion rule storage unit; Data conversion processing means for converting one data into second data; analogy means for converting the first data into second data by analogy; and a combination between a plurality of data specified in the analogy means. Means for providing verification data; and a data conversion device.
【請求項3】 変換されたデータの適否を評価する評価
手段を備えたことを特徴とする請求項1又は請求項2記
載のデータ変換装置。
3. The data conversion device according to claim 1, further comprising an evaluation unit for evaluating whether the converted data is appropriate.
【請求項4】 前記類推手段が、前記照合データを記憶
する照合データ記憶部と、類推によってデータを変換す
る類推変換処理部とを備えたことを特徴とする請求項2
記載のデータ変換装置。
4. The analogy inferring means includes a collation data storage unit that stores the collation data, and an analogy conversion processing unit that converts data by analogy.
Data conversion device as described.
【請求項5】 前記類推手段に照合データを与える手段
が、変換元データの集合と変換先データの集合を比較し
て、変換元データと変換先データであると予想される組
合せを検索する照合データ検索手段であることを特徴と
する請求項2記載のデータ変換装置。
5. A collating means for providing collation data to said analogy means, comparing a set of source data and a set of destination data, and searching for a combination expected to be source data and destination data. 3. The data conversion device according to claim 2, wherein the data conversion device is a data search unit.
【請求項6】 第1のデータを第2のデータに変換する
データ変換方法において、 変換ルールに基いて第1のデータを第2のデータに変換
するステップと、特定の複数のデータ間の組合せに基づ
いて第1のデータを第2のデータに変換するステップと
を含むことを特徴とするデータ変換方法。
6. A data conversion method for converting first data into second data, the method comprising: converting the first data into second data based on a conversion rule; Converting the first data into the second data based on the data conversion method.
【請求項7】 第1のデータを第2のデータに変換する
データ変換方法において、 変換ルールを記憶する記憶処理と、 前記変換ルールを登録する処理と、 前記変換ルールに従って第1のデータを第2のデータに
変換する処理と、 類推により第1のデータを第2のデータに変換する類推
処理と、 前記類推処理に際して、特定の複数のデータ間の組合せ
である照合データを与える処理と、 を含むことを特徴とするデータ変換方法。
7. A data conversion method for converting first data into second data, a storage process for storing a conversion rule, a process for registering the conversion rule, and a process for storing the first data in accordance with the conversion rule. 2, a process of converting the first data into a second data by analogy, and a process of providing collation data, which is a combination of a plurality of specific data, in the analogy process. A data conversion method comprising:
【請求項8】 変換されたデータの適否を評価する評価
処理を含むことを特徴とする請求項6又は請求項7記載
のデータ変換方法。
8. The data conversion method according to claim 6, further comprising an evaluation process for evaluating whether the converted data is appropriate.
【請求項9】 前記類推処理が、前記照合データを記憶
する照合データ記憶ステップと、類推によってデータを
変換する類推変換処理ステップとを含むことを特徴とす
る請求項7記載のデータ変換方法。
9. The data conversion method according to claim 7, wherein said analogy inference processing includes a collation data storing step of storing said collation data, and an analogy conversion processing step of converting data by analogy.
【請求項10】 前記類推処理に際して照合データを与
える処理が、変換元データの集合と変換先データの集合
を比較して、変換元データと変換先データであると予想
される組合せを検索する照合データ検索処理であること
を特徴とする請求項7記載のデータ変換方法。
10. A process for providing collation data at the time of the analogy process, comprising comparing a set of source data and a set of destination data to search for a combination expected to be source data and destination data. The data conversion method according to claim 7, wherein the data conversion process is a data search process.
【請求項11】 コンピュータによってデータの変換を
行うデータ変換プログラムを記録した記録媒体であっ
て、 第1のデータを第2のデータに変換させるに際し、変換
ルールに基いて第1のデータを第2のデータに変換さ
せ、また、特定の複数のデータ間の組合せに基づいて第
1のデータを第2のデータに変換させることを特徴とす
るデータ変換プログラムを記録した記録媒体。
11. A recording medium on which a data conversion program for converting data by a computer is recorded, wherein the first data is converted to the second data based on a conversion rule when the first data is converted to the second data. And a data conversion program for converting the first data into the second data based on a combination of a plurality of specific data.
【請求項12】 コンピュータによってデータの変換を
行うデータ変換プログラムを記録した記録媒体であっ
て、 第1のデータを第2のデータに変換させるに際し、変換
ルールを記憶させ、前記変換ルールに従って第1のデー
タを第2のデータに変換させ、 類推により第1のデータを第2のデータに変換させ、 前記類推によりデータを変換させるに際して、特定の複
数のデータ間の組合せである照合データを付与させるこ
とを特徴とするデータ変換プログラムを記録した記録媒
体。
12. A recording medium on which a data conversion program for performing data conversion by a computer is recorded, wherein a conversion rule is stored when the first data is converted into the second data, and the first data is stored in accordance with the conversion rule. Is converted to second data by analogy, the first data is converted to second data by analogy, and when the data is converted by analogy, collation data, which is a combination between a plurality of specific data, is given. A recording medium having recorded thereon a data conversion program.
JP21187897A 1997-08-06 1997-08-06 Data conversion apparatus, data conversion method, and medium recording data conversion program Expired - Fee Related JP3718328B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21187897A JP3718328B2 (en) 1997-08-06 1997-08-06 Data conversion apparatus, data conversion method, and medium recording data conversion program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21187897A JP3718328B2 (en) 1997-08-06 1997-08-06 Data conversion apparatus, data conversion method, and medium recording data conversion program

Publications (2)

Publication Number Publication Date
JPH1153360A true JPH1153360A (en) 1999-02-26
JP3718328B2 JP3718328B2 (en) 2005-11-24

Family

ID=16613125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21187897A Expired - Fee Related JP3718328B2 (en) 1997-08-06 1997-08-06 Data conversion apparatus, data conversion method, and medium recording data conversion program

Country Status (1)

Country Link
JP (1) JP3718328B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293520A (en) * 1999-04-07 2000-10-20 Dainippon Screen Mfg Co Ltd Method and device for electronic composition and computer readable storage medium storing program for the method
US11615111B2 (en) 2020-08-18 2023-03-28 Fujitsu Limited Computer-readable recording medium for storing data processing program, data processing method, and data processing apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293520A (en) * 1999-04-07 2000-10-20 Dainippon Screen Mfg Co Ltd Method and device for electronic composition and computer readable storage medium storing program for the method
US11615111B2 (en) 2020-08-18 2023-03-28 Fujitsu Limited Computer-readable recording medium for storing data processing program, data processing method, and data processing apparatus

Also Published As

Publication number Publication date
JP3718328B2 (en) 2005-11-24

Similar Documents

Publication Publication Date Title
Akyürek et al. Learning to recombine and resample data for compositional generalization
KR102153920B1 (en) System and method for interpreting medical images through the generation of refined artificial intelligence reinforcement learning data
US6233544B1 (en) Method and apparatus for language translation
CN110362723B (en) Topic feature representation method, device and storage medium
US8447720B1 (en) Adaptive case-based reasoning system using dynamic method for knowledge acquisition
US20230161819A1 (en) Genealogy item ranking and recommendation
JPH0196727A (en) Intelligence system
CN111191002A (en) Neural code searching method and device based on hierarchical embedding
JP7230576B2 (en) Generation device, learning device, generation method and program
JP7103264B2 (en) Generation device, learning device, generation method and program
JPH1153360A (en) Device and method for data conversion and medium for recording data conversion program
Surendran et al. Conversational AI-A retrieval based chatbot
KR20190061460A (en) question answering system and method based on reliability
Falzone et al. Measuring similarity for technical product descriptions with a character-level siamese neural network
JP6980616B2 (en) Computer system and learning method
CN117150002B (en) Abstract generation method, system and device based on dynamic knowledge guidance
KR102601932B1 (en) System and method for extracting data from document for each company using fingerprints and machine learning
JP6905237B2 (en) Mail thread extractor, mail thread extraction method, and computer program
US20230367965A1 (en) Information processing apparatus and information processing method
US7676330B1 (en) Method for processing a particle using a sensor structure
JPH1139344A (en) Character string retrieval method using two-dimensional array code
JP2839515B2 (en) Character reading system
US20110314022A9 (en) K engine - process count after build in threads
Wu Sentence Matching for Question Answering with Neural Networks
JP5596188B2 (en) Program development history management system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050902

LAPS Cancellation because of no payment of annual fees