JPH1166076A - データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体 - Google Patents

データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体

Info

Publication number
JPH1166076A
JPH1166076A JP9222367A JP22236797A JPH1166076A JP H1166076 A JPH1166076 A JP H1166076A JP 9222367 A JP9222367 A JP 9222367A JP 22236797 A JP22236797 A JP 22236797A JP H1166076 A JPH1166076 A JP H1166076A
Authority
JP
Japan
Prior art keywords
data
reading
kanji
data record
derivation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9222367A
Other languages
English (en)
Inventor
Masahiro Oku
雅博 奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9222367A priority Critical patent/JPH1166076A/ja
Publication of JPH1166076A publication Critical patent/JPH1166076A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 本発明は、検索キーを清音化することなく再
現率の高い検索が実現されるように検索対象のデータベ
ース中に必要なデータを元のデータから派生させる際
に、不要なデータが派生されないデータ派生装置及び方
法の提供を目的とする。 【解決手段】 本発明のデータ派生装置は、データベー
スからデータレコードを一つずつ読み込む手段と、必要
なデータ派生のみを行うための派生ルール群を、読み込
まれたデータレコードの内容によって検索する手段と、
検索する手段で得られた派生ルールに従ってデータレコ
ードを派生させる手段と、派生させる手段で派生された
データレコードをデータベースに追記するデータベース
書き込み手段とから構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ派生装置及
び方法に係わり、特に、利用者からの検索要求に濁音を
含む場合に、それらの濁音が本来清音である可能性を考
慮して検索ヒット率(再現率)を高めるために予めデー
タベースの中のデータから必要なデータを派生させる際
に、ヒットすべきでないデータを派生させない(適合率
を上げる)ように意図されたデータ派生装置及び方法、
並びに、データ派生プログラムを格納した記憶媒体に関
する。
【0002】
【従来の技術】従来、読みを検索キーとする検索におい
て再現率を上げるために、濁音を清音化してデータベー
スを検索する清音化検索が行われている。例えば、検索
キー=“なかじま”を清音化して得られた“なかしま”
を清音化検索キーとしてデータベースが検索される。こ
こで、再現率とは、検索すべき情報をどの程度検索する
ことができたかを表わす指標であり、 再現率=(検索すべき情報のうち、検索できた情報の件
数)/(検索すべき情報の件数) で表される。消音化検索には、(1)予め清音化して検
索を行なう方法と、(2)元の検索キーで検索を行った
結果として検索に失敗したとき、即ち、データベース内
に当該検索キーを持つ情報がないときに、清音化検索を
行う方法との2通りの方法がある。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の技術では、すべての濁音を清音に変換してし
まうため、本来、清音にすべきではない音まで清音化す
るので、余分(不要)な候補まで検索し、適合率が低下
するという問題がある。例えば、検索キー=“ながし
ま”において、清音化検索キー=“なかしま”を作成し
てデータベースを検索すると、“なかしま”の元の読み
として、“ながしま”、“なかしま”の他に、“なかじ
ま”が検索される。しかし、元の検索キー=“ながし
ま”に対して“なかじま”は検索されるべきではなく、
余分な候補である。ここで、適合率とは、検索すべき情
報がどの程度余分な情報を検索することなく検索するこ
とができたかを示す指標であり、 適合率=(検索すべき情報のうち、検索できた情報の件
数)/(検索した全件数) で表される。
【0004】本発明の目的は、上記の問題点を解決する
ため、検索キーを清音化することなく再現率の高い検索
が実現されるように検索対象のデータベース中に必要な
データを元のデータから派生させる際に、派生ルールが
定められた、不要なデータが派生されないよう意図され
たデータ派生装置及び方法を提供することである。
【0005】
【課題を解決するための手段】図1は本発明のデータ派
生装置の原理構成図である。同図に示す如く、本発明の
データ派生装置70は、検索対象であるデータベースか
らデータレコードを一つずつ読み込むデータ読み込み手
段10と、予め用意された必要なデータ派生のみを行う
ための派生ルールを含む派生ルール群50を、上記デー
タ読み込み手段10に読み込まれたデータレコードの内
容によって検索する派生ルール検索手段20と、上記派
生ルール検索手段20で得られた派生ルールに従ってデ
ータレコードを派生させるデータ派生手段30と、上記
データ派生手段30で派生されたデータレコードを上記
データベース60に追記するデータベース書き込み手段
40とから構成される。
【0006】上記本発明のデータ派生装置は、派生ルー
ル群の記述に従う必要なデータだけを派生するので、デ
ータベース60を検索する際に不要なデータレコードを
検索することが回避され、適合率が上がる。図2は本発
明の原理を説明するための図である。本発明の検索キー
によって検索されるデータベースに対しデータを派生さ
せるデータ派生方法は、上記データベースからデータレ
コードを読み込むデータレコード読み込み段階(ステッ
プ2)と、、上記読み込まれたデータレコードの内容に
よって必要なデータだけを派生させるための派生ルール
を含む派生ルール群を検索する派生ルール検索段階(ス
テップ4)と、検索で得られた派生ルールに従ってデー
タレコードを派生させるデータ派生段階(ステップ
6)、上記データ派生段階で派生されたデータレコード
を上記データベースに追記するデータベース書き込み段
階(ステップ8)とから構成されることを特徴とするデ
ータ派生方法。
【0007】更に、本発明のデータ派生方法は、上記デ
ータベース中の全てのデータレコードに対し、上記デー
タレコード読み込み段階、上記派生ルール検索段階、上
記データ派生段階、及び、上記データベース書き込み段
階を繰り返し行う。更に、本発明は、検索キーによって
検索されるデータベースに対しデータを派生させるデー
タ派生プログラムを格納した記憶媒体である。上記記憶
媒体は、上記データベースからデータレコードを読み込
ませるデータ読み込みプロセスと、上記読み込まれたデ
ータレコードの内容によって必要なデータだけを派生さ
せるための派生ルールを含む派生ルール群を検索させる
派生ルール検索プロセスと、上記得られた派生ルールに
従ってデータレコードを派生させるデータ派生プロセス
と、上記派生されたデータレコードを上記データベース
に追記させるデータベース書き込みプロセスとから構成
されることを特徴とするデータ派生プログラムを格納し
ている。
【0008】
【発明の実施の形態】図2は本発明のデータ派生装置7
0の基本構成図である。データ派生装置70の本体は、
ハードウェア的には、CPU及びメモリにより構成する
ことが可能であり、機能的には、データ読み込み部1
0、派生ルール検索部20、データ派生部30、データ
ベース書き込み部40、及び派生ルール群50から構成
され、データベース60に対しデータを派生させる。
【0009】データ読み込み部10はデータベース60
から1データレコードずつを読み込む。派生ルール検索
部20は、データ読み込み部10で読み込まれたデータ
レコードの内容に依存して派生ルール群50を検索す
る。データ派生部30は、派生ルール検索部20により
得られた派生ルールに従ってデータレコードを発生さ
せ、データベース書き込み部40は、派生されたデータ
レコードをデータベース60に追記する。
【0010】図4は本発明のデータ派生装置の動作フロ
ーチャートである。以下、図4を参照して図3に示した
本発明のデータ派生装置の動作を説明する。 ステップ10:データ読み込み部10は、データ派生指
令を受けて、データベース60から1データレコードを
読み込み、読み込まれたデータレコードを派生ルール検
索部20に送る。
【0011】ステップ12:派生ルール検索部20は、
送られてきたデータレコードの内容によって派生ルール
群50を検索し、読み込まれたデータレコードに適用す
べき派生ルールを取得する。 ステップ14:派生ルール検索部20は、次に、検索が
成功したか否か、即ち、適用すべき派生ルールが得られ
たかどうかを判定する。派生ルールが得られている場合
にはステップ16に進み、派生ルールが得られていない
場合にはステップ20に進む。
【0012】ステップ16:得られた派生ルールとデー
タ読み込み部10で読み込まれたデータレコードとが派
生ルール検索部20からデータ派生部30に送られる。
データ派生部30は、得られた派生ルールの記述に従っ
て元のデータレコードから派生データレコードを生成
し、生成された派生データレコードをデータベース書き
込み部40に送る。
【0013】ステップ18:データベース書き込み部4
0は、派生されたデータレコードをデータベース60に
追記し、制御をデータ読み込み部10に戻す。 ステップ20:データ読み込み部10は、データベース
60中の全てのデータレコードを処理したかどうかを判
定する。データベース60中に未処理のデータレコード
がある場合にはステップ10に戻る。未処理のデータが
存在しない場合には処理を終了する。
【0014】
【実施例】図5は本発明の第1の実施例によるデータ派
生装置71の構成図である。データ派生装置71は、デ
ータベース60からデータレコード62を読み込むデー
タ読み込み部10と、必要なデータだけを派生させる派
生ルールを得るため、上記データ読み込み部10におい
て読み込まれたデータレコード62の内容によって派生
ルール群50を検索する派生ルール検索部20と、上記
派生ルール検索部20で得られた派生ルール52に従っ
てデータレコードを派生させるデータ派生部30と、上
記データ派生部30で派生されたデータレコードを上記
データベース60に追記するデータベース書き込み部4
0とから構成される。
【0015】本発明の第1の実施例において上記派生ル
ール52は、漢字表記53と、対応した可能な読みを列
挙した読みリスト54とからなる。上記派生ルール検索
部20は、漢字表記63及び対応した漢字の読み64を
含み、上記データ読み込み部10で得られた上記データ
レコード62中の漢字表記63を検索キーとして上記派
生ルール群50を検索する。
【0016】上記データ派生部30は、上記派生ルール
検索部20において検索された派生ルール52の中で、
上記データ読み込み部10で得られたデータレコード6
2の中の漢字の読み64と一致する読みを含む上記読み
リスト54を有する派生ルール52を選択する派生ルー
ル選択部32を有する。上記データ派生部30は、上記
データレコード62の中の漢字の読み64が、上記選択
された派生ルール52の読みリスト54に含まれる読み
の中で上記データレコード62の中の漢字の読み64以
外の漢字の読みで置き換えられたデータレコードを派生
させる読み置換部34を更に有する。
【0017】図6は本発明の第1の実施例によるデータ
ベース60の内容の一例を表わす図である。同図には、
データベース60を検索する際のキーとなる読みのフィ
ールド100、漢字表記のフィールド101、及び、例
えば、住所と電話番号とからなる情報本体のフィールド
102が示される。図7は本発明の第1の実施例による
派生ルール群50の内容の一例を表わす図である。派生
ルール群50は、派生ルール群を検索する際のキーとな
る漢字表記のフィールド103と、漢字表記103に対
する可能な読みを列挙した読みのリストのフィールド1
04とからなる。
【0018】以下の本発明の第1の実施例の動作の説明
に使用するステップは、図4に示されたデータ派生装置
の動作フローチャート中のステップと対応している。 ステップ10:データベース読み込み部10は、図6に
示されたデータベース60から1データレコードを読み
込む。データレコード(なかじま 中島 横浜市××区
045-xxx-xxxx)を読み込んだ場合を想定する。更に、
データベース読み込み部10は読み込まれたデータレコ
ードを派生ルール検索部20に送る。
【0019】ステップ12:派生ルール検索部20は、
送られてきたデータレコード(なかじま 中島 横浜市
××区 045-xxx-xxxx)の漢字表記=“中島”をキーと
して、図7に示された派生ルール群50を検索する。こ
のとき、派生ルール(中島なかじま なかしま)の検索
に成功する。 ステップ14:派生ルールの検索に成功したので、処理
はステップ16に進む。
【0020】ステップ16:派生ルール検索部20は、
得られた派生ルール(中島 なかじま なかしま)と、
データ読み込み部10で読み込まれたデータレコード
(なかじま 中島 横浜市××区 045-xxx-xxxx)とを
派生ルール選択部32に送る。派生ルール選択部32
は、派生ルール検索部20で得られた派生ルールの中
で、読み込まれたデータレコードの読みと一致する可能
な読みを含む派生ルールを選択する。この場合、得られ
た派生ルール(中島 なかじま なかしま)は“中島”
に対する可能な読みが“なかじま”、“なかしま”の二
つであることを示すと共に、読み込まれたデータレコー
ドの読みは“なかじま”であるので、派生ルール検索部
20から送られた派生ルール(中島 なかじま なかし
ま)が選択される。置換データレコード生成部34は、
読みとしてデータレコードに含まれていない読み“なか
しま”を含む派生データレコード(なかしま 中島 横
浜市××区 045-xxx-xxxx)を生成し、データベース書
き込み部40に送る。このようにして、データ派生部3
0では、派生ルール(中島 なかじま なかしま)の記
述に従って派生データレコードが生成される。
【0021】ステップ18:データベース書き込み部4
0は、派生データレコード(なかしま 中島 横浜市×
×区 045-xxx-xxxx)をデータベース60に追記し、制
御をデータ読み込み部10に戻す。 ステップ20:データ読み込み部10は、データベース
60の中の全てのデータレコードが処理されたかどうか
を判定する。この例では、未処理のデータレコードがデ
ータベース60に存在するので、ステップ10に戻る。
【0022】上記の処理を図6に示されたデータベース
60の他のデータレコードに対して繰り返し行うことに
より、図6のデータレコード(ながしま 永島 横浜市
○○区 045-yyy-yyyy)、(なかしま 中島 横浜市△
△区 045-zzz-zzzz)、(ながじま 永島 横浜市○△
区 045-vvv-vvvv)の三つのデータレコードに対し、夫
々、(ながじま 永島 横浜市○○区 045-yyy-yyy
y)、(なかじま 中島横浜市△△区 045-zzz-zzz
z)、(ながしま 永島 横浜市○△区 045-vvv-vvv
v)の三つの派生レコードが生成され、データベース6
0に追記される。
【0023】図8は、以上の処理によって得られるデー
タベース60の内容の一例を表わす図である。データベ
ース60の内容は、元のデータレコードと、派生データ
レコードとを含むように更新されている。図9は本発明
の第1の実施例による派生後のデータベースの内容の他
の例を示す図である。読み置換部34は、図9の(a)
に示される如く、元のデータレコードと、派生データレ
コードとの間で共通しない部分だけを派生させ、残りの
共通部分とのリンクは、ポインタ105を介して行うこ
とが可能である。このような構成の場合に、共通する情
報を重複して持つ必要が無くなるのでデータベース容量
を削減することが可能である。
【0024】以上の処理によって、データベース60内
に可能な読みを持つデータレコードのみを派生させるこ
とが可能であるため、当該データベースを検索する際
に、高い再現率が得られるだけではなく、高い適合率の
検索が実現される。図10は本発明の第2の実施例によ
るデータ派生装置72の構成図である。データ派生装置
72は、データベース60からデータレコード62を読
み込むデータ読み込み部10と、必要なデータだけを派
生させる派生ルールを得るため、上記データ読み込み部
10において読み込まれたデータレコード62の内容に
よって派生ルール群50を検索する派生ルール検索部2
0と、上記派生ルール検索部20で得られた派生ルール
52に従ってデータレコードを派生させるデータ派生部
30と、上記データ派生部30で派生されたデータレコ
ードを上記データベース60に追記するデータベース書
き込み部40とから構成される。
【0025】上記派生ルール52は、漢字1文字表記5
5と、ルールの適用条件56と、読みのリスト54との
3つ組から構成される。上記派生ルール検索部20は、
上記データベース60より得られたデータレコード62
に含まれる漢字表記63から漢字表記1文字ずつを取り
出す漢字表記取り出し部22と、上記取り出された漢字
表記1文字を用いて上記派生ルール群50を検索する漢
字表記検索部24と、上記漢字表記検索部24で検索に
成功し、上記適用条件56を満たす上記派生ルール52
に含まれる読みのリスト54を取得する読みリスト取得
部26とを有する。
【0026】上記データ派生部30は、上記取り出され
た漢字表記1文字から取得された読みのリスト54か
ら、上記データ読み込み部10で得られたデータレコー
ド62に含まれる漢字表記63に対する可能な読みを生
成する読み生成部36と、上記データ読み込み部10で
得られた上記データレコード62に含まれる漢字の読み
63が、上記読み生成部36により生成された可能な読
みの中で、上記データ読み込み部10で得られた上記デ
ータレコード62に含まれる漢字の読み63以外の漢字
の読みで置き換えられたデータレコードを派生させる読
み置換部38とから構成される。
【0027】データベース60の内容は、図6に示され
た本発明の第1の実施例によるデータベース60の内容
の一例と一致する場合を考える。図11は本発明の第2
の実施例による派生ルール群50の内容の一例を表わす
図である。派生ルール群50は、派生ルール群を検索す
る際のキーとなる漢字1文字表記のフィールド106
と、派生ルールを適用できるか否かの条件を示す適用条
件のフィールド107と、上記の漢字1文字表記に対す
る可能な読みを列挙した読みのリストのフィールド10
8とからなる。
【0028】以下の本発明の第2の実施例の動作の説明
に使用するステップは、図4に示されたデータ派生装置
の動作フローチャート中のステップと対応している。 ステップ10:データベース読み込み部10は、図6に
示されたデータベース60から1データレコードを読み
込む。データレコード(なかじま 中島 横浜市××区
045-xxx-xxxx)を読み込んだ場合を想定する。更に、
データベース読み込み部10は読み込まれたデータレコ
ードを派生ルール検索部20に送る。
【0029】ステップ12:派生ルール検索部20の漢
字表記取り出し部22は、送られてきたデータレコード
(なかじま 中島 横浜市××区 045-xxx-xxxx)の漢
字表記1文字毎、即ち、“中”及び“島”をキーとし
て、図11に示された派生ルール群50を検索する。こ
のとき、1文字目“中”に対して派生ルール(中 すべ
て (なか))の検索に成功し、2文字目“島”に対し
て(島 1文字目 (しま))及び(島 2文字目以降
(しま じま))の二つの検索に成功し、読みリスト
取得部26は検索に成功した夫々の派生ルールに含まれ
る読みのリストを取得する。
【0030】ステップ14:派生ルールの検索に成功し
たので、処理はステップ16に進む。 ステップ16:読みリスト取得部26は、得られた派生
ルール(中 すべて(なか))、(島 1文字目 (し
ま))及び(島 2文字目以降 (しま じま))と、
データ読み込み部10で読み込まれたデータレコード
(なかじま 中島 横浜市××区 045-xxx-xxxx)とを
読み生成部36に送る。読み生成部36は、1文字目
“中”に対する派生ルール(中 すべて (なか))の
適用条件は無条件である(すべてと記述されている)の
で、1文字目“中”に対して、可能な読みとして“な
か”を取得する。また、“島”は“中島”の2文字目に
存在するので、適用条件として2文字目以降が記述され
ている(島 2文字目以降 (しま じま))のみが使
用される。この派生ルールから2文字目“島”に対する
可能な読みとして、“しま”、“じま”が得られる。夫
々の漢字の可能な読みより、“なかしま”、“なかじ
ま”の二つの読みが生成される。現在処理中のデータレ
コードは(なかじま 中島 横浜市××区 045-xxx-xx
xx)であり、その読みは“なかじま”であるため、上記
の生成された二つの読み“なかしま”、“なかじま”に
含まれる。従って、読み置換部38は、派生データレコ
ード(なかしま 中島 横浜市××区 045-xxx-xxxx)
を生成し、データベース書き込み部40に送る。
【0031】ステップ18:データベース書き込み部4
0は、派生データレコード(なかしま 中島 横浜市×
×区 045-xxx-xxxx)をデータベース60に追記し、制
御をデータ読み込み部10に戻す。 ステップ20:データ読み込み部10は、データベース
60の中の全てのデータレコードが処理されたかどうか
を判定する。この例では、未処理のデータレコードがデ
ータベース60に存在するので、ステップ10に戻る。
【0032】上記の処理を図6に示されたデータベース
60の他のデータレコードに対して繰り返し行うことに
より、図6のデータレコード(ながしま 永島 横浜市
○○区 045-yyy-yyyy)、(なかしま 中島 横浜市△
△区 045-zzz-zzzz)、(ながじま 永島 横浜市○△
区 045-vvv-vvvv)の三つのデータレコードに対し、夫
々、(ながじま 永島 横浜市○○区 045-yyy-yyy
y)、(なかじま 中島横浜市△△区 045-zzz-zzz
z)、(ながしま 永島 横浜市○△区 045-vvv-vvv
v)の三つの派生レコードが生成され、データベース6
0に追記される。
【0033】図8は、以上の処理によって得られるデー
タベース60の内容の一例を表わす図である。データベ
ース60の内容は、元のデータレコードと、派生データ
レコードとを含むように更新されている。尚、本発明の
第2の実施例の場合に、上記本発明の第1の実施例と同
様に、派生後のデータベースの内容の他の例が図9に示
される。読み置換部38は、図9の(a)に示される如
く、元のデータレコードと、派生データレコードとの間
で共通しない部分だけを派生させ、残りの共通部分との
リンクは、ポインタ105を介して行うことが可能であ
る。このような構成の場合に、共通する情報を重複して
持つ必要が無くなるのでデータベース容量を削減するこ
とが可能である。
【0034】以上の処理によって、データベース60内
に可能な読みを持つデータレコードのみを派生させるこ
とが可能であるため、当該データベースを検索する際
に、高い再現率が得られるだけではなく、高い適合率の
検索が実現される。また、上記の実施例では、データ派
生装置70の構成要件に基づいて説明しているが、この
例に限定されることなく、データ派生装置70の各々の
構成要件をソフトウェア(プログラム)で構築し、ディ
スク装置等に格納しておき、必要に応じてデータ派生装
置70のコンピュータにインストールして不要なデータ
が派生されないデータ派生を行うことも可能である。さ
らに、構築されたプログラムをフロッピーディスクやC
D−ROM等の可搬記憶媒体に格納し、このようなシス
テムを用いる場面で汎用的に使用することも可能であ
る。
【0035】本発明は、上記の実施例に限定されること
なく、特許請求の範囲内で種々変更・応用が可能であ
る。
【0036】
【発明の効果】以上の説明から明らかなように、本発明
のデータ派生装置及びデータ派生方法によれば、再現率
の高い検索を実現するために検索対象のデータベース中
に必要なデータを元のデータから派生させる際に、不要
なデータの派生を回避することができる派生ルールを定
めることにより、高い再現率を実現するだけではなく、
高い適合率が得られる検索を実現するためのデータベー
スを生成することが可能になる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の原理説明図である。
【図3】本発明のデータ派生装置の構成図である。
【図4】本発明のデータ派生装置の動作フローチャート
である。
【図5】本発明の第1の実施例によるデータ派生装置の
構成図である。
【図6】本発明の第1の実施例によるデータベースの内
容例を示す図である。
【図7】本発明の第1の実施例による派生ルール群の内
容例を示す図である。
【図8】本発明の第1の実施例によるデータ派生後のデ
ータベースの内容例を示す図である。
【図9】本発明の第1の実施例によるデータ派生後のデ
ータベースの他の内容例を示す図である。
【図10】本発明の第2の実施例によるデータ派生装置
の構成図である。
【図11】本発明の第2の実施例によるデータベースの
内容例を示す図である。
【符号の説明】
10 データ読み込み手段 20 派生ルール検索手段 30 データ派生手段 40 データベース書き込み手段 50 派生ルール群 60 データベース 70 データ派生装置

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 検索キーによって検索されるデータベー
    スに対しデータを派生させるデータ派生装置であって、 上記データベースからデータレコードを読み込むデータ
    読み込み手段と、 上記データ読み込み手段において読み込まれたデータレ
    コードの内容によって必要なデータだけを派生させるた
    めの派生ルールを含む派生ルール群を検索する派生ルー
    ル検索手段と、 上記派生ルール検索手段で得られた派生ルールに従って
    データレコードを派生させるデータ派生手段と、 上記データ派生手段で派生されたデータレコードを上記
    データベースに追記するデータベース書き込み手段とか
    ら構成されることを特徴とするデータ派生装置。
  2. 【請求項2】 上記派生ルールは、漢字表記と、該漢字
    表記と対応した可能な読みを列挙した読みリストとから
    なり、 上記派生ルール検索手段は、上記データ読み込み手段で
    得られた、漢字表記及び対応した漢字の読みを含む上記
    データレコード中の該漢字表記を検索キーとして上記派
    生ルール群を検索し、 上記データ派生手段は、 上記派生ルール検索手段において検索された派生ルール
    の中で、上記データ読み込み手段で得られたデータレコ
    ードの中の漢字の読みと一致する読みを含む上記読みリ
    ストを有する派生ルールを選択する派生ルール選択手段
    と、 上記データレコードの中の漢字の読みが、上記選択され
    た派生ルールの読みリストに含まれる読みの中で上記デ
    ータレコードの中の漢字の読み以外の漢字の読みで置き
    換えられたデータレコードを派生させる読み置換手段と
    を有することを特徴とする請求項1記載のデータ派生装
    置。
  3. 【請求項3】 上記派生ルールは、漢字1文字表記と、
    ルールの適用条件と、該漢字1文字表記に対応した読み
    のリストとの3つ組から構成され、 上記派生ルール検索手段は、 上記データベースより得られたデータレコードに含まれ
    る漢字表記から漢字表記1文字ずつを取り出す漢字表記
    取り出し手段と、 上記取り出された漢字表記1文字を用いて上記派生ルー
    ル群を検索する漢字表記検索手段と、 上記漢字表記検索手段による検索に成功し、上記適用条
    件を満たす上記派生ルールに含まれる読みのリストを取
    得する読みリスト取得手段とを有し、 上記データ派生手段は、 上記取り出された漢字表記1文字から取得された読みの
    リストから、上記データ読み込み手段で得られたデータ
    レコードに含まれる漢字表記に対する可能な読みを生成
    する読み生成手段と、 上記データ読み込み手段で得られた上記データレコード
    に含まれる漢字の読みが、上記読み生成手段により生成
    された可能な読みの中で、上記データ読み込み手段で得
    られた上記データレコードに含まれる漢字の読み以外の
    漢字の読みで置き換えられたデータレコードを派生させ
    る読み置換手段とから構成されることを特徴とする請求
    項1記載のデータ派生装置。
  4. 【請求項4】 検索キーによって検索されるデータベー
    スに対しデータを派生させるデータ派生方法であって、 上記データベースからデータレコードを読み込むデータ
    レコード読み込み段階と、 上記読み込まれたデータレコードの内容によって必要な
    データだけを派生させるための派生ルールを含む派生ル
    ール群を検索する派生ルール検索段階と、 検索で得られた派生ルールに従ってデータレコードを派
    生させるデータ派生段階と、 上記データ派生段階で派生されたデータレコードを上記
    データベースに追記するデータベース書き込み段階とか
    ら構成されることを特徴とするデータ派生方法。
  5. 【請求項5】 上記データベース中の全てのデータレコ
    ードに対し、上記データレコード読み込み段階、上記派
    生ルール検索段階、上記データ派生段階、及び、上記デ
    ータベース書き込み段階を繰り返し行うことを特徴とす
    る請求項4記載のデータ派生方法。
  6. 【請求項6】 上記派生ルールは、漢字表記と、該漢字
    表記に対応した可能な読みを列挙した読みリストとから
    なり、 上記派生ルール検索段階は、上記データ読み込み段階に
    おいて得られた、漢字表記及び対応した漢字の読みを含
    む上記データレコード中の漢字表記を検索キーとして上
    記派生ルール群を検索する段階を有し、 上記データ派生段階は、 上記派生ルール検索段階において検索された派生ルール
    の中で、上記データ読み込み段階において得られたデー
    タレコードの中の漢字の読みと一致する読みを含む上記
    読みリストを有する派生ルールを選択する段階と、 上記データレコードの中の漢字の読みが、上記選択され
    た派生ルールの読みリストに含まれる読みの中で上記デ
    ータレコードの中の漢字の読み以外の漢字の読みで置き
    換えられたデータレコードを派生させる段階とを有する
    ことを特徴とする請求項4又は5記載のデータ派生方
    法。
  7. 【請求項7】 上記派生ルールは、漢字1文字表記と、
    ルールの適用条件と、該漢字1文字表記と対応した読み
    のリストとの3つ組から構成され、 上記派生ルール検索段階は、 上記データベースより得られたデータレコードに含まれ
    る漢字表記から漢字表記1文字ずつを取り出す段階と、 上記取り出された漢字表記1文字を用いて上記派生ルー
    ル群を検索する段階と、 上記段階で検索に成功し、上記適用条件を満たす上記派
    生ルールに含まれる読みのリストを取得する段階とを有
    し、 上記データ派生段階は、 上記取り出された漢字表記1文字から取得された読みの
    リストから、上記データ読み込み手段で得られたデータ
    レコードに含まれる漢字表記に対する可能な読みを生成
    する段階と、 上記データ読み込み段階で得られた上記データレコード
    に含まれる漢字の読みが、上記段階において生成された
    可能な読みの中で、上記データ読み込み段階で得られた
    上記データレコードに含まれる漢字の読み以外の漢字の
    読みで置き換えられたデータレコードを派生させる段階
    とから構成されることを特徴とする請求項4又は5記載
    のデータ派生方法。
  8. 【請求項8】 検索キーによって検索されるデータベー
    スに対しデータを派生させるデータ派生プログラムを格
    納した記憶媒体であって、 上記データベースからデータレコードを読み込ませるデ
    ータ読み込みプロセスと、 上記読み込まれたデータレコードの内容によって必要な
    データだけを派生させるための派生ルールを含む派生ル
    ール群を検索させる派生ルール検索プロセスと、 上記得られた派生ルールに従ってデータレコードを派生
    させるデータ派生プロセスと、 上記派生されたデータレコードを上記データベースに追
    記させるデータベース書き込みプロセスとから構成され
    ることを特徴とするデータ派生プログラムを格納した記
    憶媒体。
  9. 【請求項9】 漢字表記と、該漢字表記に対応した可能
    な読みを列挙した読みリストとを含む上記派生ルールを
    構築させるプロセスと、、 漢字表記及び対応した漢字の読みを含み、上記得られた
    データレコード中の漢字表記を検索キーとして上記派生
    ルール群を検索させるプロセスと、 上記検索された派生ルールの中で、上記得られたデータ
    レコードの中の漢字の読みと一致する読みを含む上記読
    みリストを有する派生ルールを選択させるプロセスと、 上記データレコードの中の漢字の読みが、上記選択され
    た派生ルールの読みリストに含まれる読みの中で上記デ
    ータレコードの中の漢字の読み以外の漢字の読みで置き
    換えられたデータレコードを派生させるプロセスとを有
    することを特徴とする請求項8記載のデータ派生プログ
    ラムを格納した記憶媒体。
  10. 【請求項10】 漢字1文字表記と、ルールの適用条件
    と、該漢字1文字表記に対応した読みのリストとの3つ
    組からなる上記派生ルールを構築させるプロセスと、 上記データベースより得られたデータレコードに含まれ
    る漢字表記から漢字表記1文字ずつを取り出させる漢字
    表記取り出しプロセスと、 上記取り出された漢字表記1文字を用いて上記派生ルー
    ル群を検索させる漢字表記検索プロセスと、 検索に成功し、上記適用条件を満たす上記派生ルールに
    含まれる読みのリストを取得させる読みリスト取得プロ
    セスと、 上記取り出された漢字表記1文字から取得された読みの
    リストから、上記データレコードに含まれる漢字表記に
    対する可能な読みを生成させる読み生成プロセスと、 上記得られた上記データレコードに含まれる漢字の読み
    が、上記生成された可能な読みの中で、上記得られた上
    記データレコードに含まれる漢字の読み以外の漢字の読
    みで置き換えられたデータレコードを派生させる読み置
    換プロセスとから構成されることを特徴とするデータ派
    生プログラムを格納した請求項9記載の記憶媒体。
JP9222367A 1997-08-19 1997-08-19 データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体 Pending JPH1166076A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9222367A JPH1166076A (ja) 1997-08-19 1997-08-19 データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9222367A JPH1166076A (ja) 1997-08-19 1997-08-19 データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JPH1166076A true JPH1166076A (ja) 1999-03-09

Family

ID=16781246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9222367A Pending JPH1166076A (ja) 1997-08-19 1997-08-19 データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JPH1166076A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009277068A (ja) * 2008-05-15 2009-11-26 Aisin Aw Co Ltd 検索装置及び検索プログラム
CN113474837A (zh) * 2019-03-27 2021-10-01 富士胶片株式会社 导出装置、导出方法、导出程序及磁带

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195390A (ja) * 1992-12-24 1994-07-15 Nippon Telegr & Teleph Corp <Ntt> 日本語情報検索法及びそのための日本語情報蓄積法
JPH06325092A (ja) * 1993-05-17 1994-11-25 Nippon Telegr & Teleph Corp <Ntt> 顧客情報検索方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06195390A (ja) * 1992-12-24 1994-07-15 Nippon Telegr & Teleph Corp <Ntt> 日本語情報検索法及びそのための日本語情報蓄積法
JPH06325092A (ja) * 1993-05-17 1994-11-25 Nippon Telegr & Teleph Corp <Ntt> 顧客情報検索方式

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009277068A (ja) * 2008-05-15 2009-11-26 Aisin Aw Co Ltd 検索装置及び検索プログラム
CN113474837A (zh) * 2019-03-27 2021-10-01 富士胶片株式会社 导出装置、导出方法、导出程序及磁带
CN113474837B (zh) * 2019-03-27 2022-07-29 富士胶片株式会社 导出装置、导出方法、存储介质及磁带
US11456015B2 (en) 2019-03-27 2022-09-27 Fujifilm Corporation Derivation device, derivation method, derivation program, and magnetic tape

Similar Documents

Publication Publication Date Title
JPS63198154A (ja) つづり誤り訂正装置
KR100597513B1 (ko) 파일 처리 방법, 데이터 처리 장치 및 기억 매체
WO1996016374A1 (fr) Systeme de base de donnees partage par une pluralite d&#39;appareils clients, procede de mise a jour de donnees et application a un processeur de caracteres
JP2000305822A (ja) データベース管理装置,データベースレコード抽出装置,データベース管理方法及びデータベースレコード抽出方法
CA2275391C (en) File processing method, data processing device, and storage medium
JPH1166076A (ja) データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体
JPH08190571A (ja) 文書検索方法
JP4319827B2 (ja) 文書検索プログラム
JP4187802B2 (ja) 文書作成装置
JPH1166087A (ja) 情報検索装置及び情報検索方法、並びに、情報検索プログラムを格納した記憶媒体
JPH09259132A (ja) 情報登録検索装置及びその方法
JPH0353378A (ja) 同音異字および異字同音の姓を検索する氏名検索方式
JP3508842B2 (ja) データベース検索システムおよびデータベース検索プログラムを記録した記録媒体
JPH08235191A (ja) 文書検索方法及び文書検索装置
JP2001067375A (ja) 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体
JPH05307541A (ja) かな漢字変換システム
JP2002132809A (ja) 文字列検索方法及びその実施装置並びにその処理プログラムを記録した記録媒体
JP5944368B2 (ja) 情報更新装置、情報更新方法、プログラム
JP3017095B2 (ja) 外字登録管理方法
JPH10198693A (ja) 住所録管理装置及び住所録管理方法
JPH0236475A (ja) 文字列検索装置
JPH08101848A (ja) 文書処理装置及び検索方法
JP2002063202A (ja) 情報検索システムおよび方法
JPS61285573A (ja) 仮名漢字変換装置
JPS62267857A (ja) ワ−ドプロセツサ

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040217