JP2009080626A - メタデータ管理装置、プログラムおよび方法 - Google Patents

メタデータ管理装置、プログラムおよび方法 Download PDF

Info

Publication number
JP2009080626A
JP2009080626A JP2007249019A JP2007249019A JP2009080626A JP 2009080626 A JP2009080626 A JP 2009080626A JP 2007249019 A JP2007249019 A JP 2007249019A JP 2007249019 A JP2007249019 A JP 2007249019A JP 2009080626 A JP2009080626 A JP 2009080626A
Authority
JP
Japan
Prior art keywords
dictionary
content
improvement
error
editor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007249019A
Other languages
English (en)
Inventor
Noriko Minamino
典子 南野
Yasutaka Otake
康隆 大嶽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007249019A priority Critical patent/JP2009080626A/ja
Priority to US12/235,632 priority patent/US20090083295A1/en
Publication of JP2009080626A publication Critical patent/JP2009080626A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/289Object oriented databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】コンテンツ編集者と辞書編集者との両者の隔たりを解消し、コンテンツデータの品質向上を図ることができるメタデータ管理装置を提供する。
【解決手段】受付手段が、メタデータである辞書で定義されたコンテンツ記述の制約を含むスキーマに従って記述したコンテンツを、コンテンツ編集者端末を介して受け付けるステップと(S1)、エラー検出手段が、辞書で定義されているコンテンツ記述の制約を満たさない、受付されたコンテンツからエラー内容を検出するステップと(S2)、提案提示手段が、コンテンツ記述のエラーパターンに応じて辞書の改善がルール付けされた辞書改善ルールに基づき、コンテンツから検出したエラー内容から作成した辞書の改善を提案する辞書改善提案を、辞書編集者端末に提示するステップ(S5)と、を含む。
【選択図】 図14

Description

本発明は、メタデータ管理装置、プログラムおよび方法に関する。
オブジェクト指向データベース(OODB)やオブジェクト・リレーショナル型データベース(ORDB)を代表とする階層型データベースでは、下位が上位分類の属性を継承する階層構造を持つ。この階層型データベースにおいては、継承に従って下位の分類では属性が累増する。この上位分類の属性を下位に継承することは、通常「インヘリタンス」と呼ばれている。
また、オブジェクト指向データベースにおいては、階層中の分類は「クラス」と呼ばれることが多い。一方、オブジェクト・リレーショナル型データベース(ORDB)においては、継承を許したテーブルがこれに相当し、上下関係をもつテーブル間において、上位のテーブルから下位のテーブルへ属性、すなわち上位テーブルを構成するコラムのヘッダ情報が下位テーブルへ継承される。各階層の分類に属する同じ属性種を持つデータを「インスタンス」と呼び、その集合をデータの「ポピュレーション」と呼ぶ。データのポピュレーションは、関係データベース(RDB)あるいはORDBにおいては、テーブルと呼ばれる構造に格納されるのが普通である。テーブルにおいてそれを構成する属性の並びをテーブルのヘッダと呼ぶ。
階層型データベースの一つとしては、製品情報を電子的に提供する電子カタログシステムを実装するための国際規格であるISO13584 Parts Library規格(以下、「PLIB」規格という)がある。この「PLIB」規格は、複数の“Part”(通常、「分冊」と訳される)からなる、製品あるいは部品ライブラリデータに関するオブジェクト指向的な記述の方法とその交換ファイル形式のセマンティックス、すなわち、どのような用語や記述方式およびデータ型を用いるかを定める国際規格である。「PLIB」規格のPart42(分冊第42)はIEC61360-2(分冊第2)と内容が共通している。この規格は、オブジェクト指向的に製品を分類し、個々の分類を特徴付ける属性群を明らかにし、分類に対するコンテンツをファイル交換する仕組みであり、勿論、属性の継承の概念もこの中には含まれている。また、この規格はISO6523“Structure for Identification of organizations and organization parts”を引用して作られており、特に、ISO6523の定めるICD(International Code Designator)を活用して属性に対して世界的に一意な識別子を割り振ることが可能である。
近年においては、「PLIB」規格に準拠したシステムがいくつか提案されている(特許文献1,2参照)。
ところで、製品データを記述するために必要な分類(クラス)や属性(プロパティ)群は、辞書と呼ばれている。「PLIB」データモデルに準拠した国際規格辞書としては、計測器に関するISO13584-501、ネジに関するISO13584-511、電気電子製品に関するIEC61360-4などがある。また、工業界標準辞書としては、日本ではECALS辞書、JeMarche辞書などがあり、製品の仕様データ交換に利用されている。世界各国においても、このような辞書の開発が活発となっている。
特開2004−177996号公報 特開2004−178015号公報
ところで、上述したような国際規格の辞書の維持管理においては、RA(Registration Authority)やMA(Maintenance Agency)などの仕組みを用いることにより、辞書の維持管理組織が行っている。維持管理組織(内外)のメンバーから、修正提案を受け、修正提案について多数決などの承認を経て、辞書更新を行う。また、工業会標準辞書でも同様の仕組みを用いて、維持管理を行っている。
一般に、辞書を利用して製品データ(以降、コンテンツ)を記述するコンテンツ編集者は、辞書を作成・維持管理する辞書編集者と異なり、辞書編集者とコンテンツ編集者の辞書定義の理解については隔たりがあることが多い。例えば、辞書編集者が提供する辞書定義がコンテンツ編集者にとっては十分でなく、どう何を書けばいいのか分からない、というものである。また、辞書編集者が意図した内容をコンテンツ編集者が書けない、というものである。或いは、コンテンツ記述者が実際の製品データを記述するにあたって適した辞書定義になっていない、というものである。
上述したような辞書定義の理解についての隔たりは、製品データの正しい記述を妨げ、製品データの品質劣化に直結することになる。
本発明は、上記に鑑みてなされたものであって、コンテンツ編集者と辞書編集者との両者の隔たりを解消し、コンテンツデータの品質向上を図ることができるメタデータ管理装置、プログラムおよび方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明のメタデータ管理装置は、コンテンツ記述の制約を含むスキーマを定義したメタデータである辞書を記憶する辞書記憶部と、コンテンツ記述のエラーパターンに応じて前記辞書の改善がルール付けされた辞書改善ルールを記憶したルール記憶部と、前記スキーマに従って記述したコンテンツを、当該コンテンツの編集者が使用するコンテンツ編集者端末を介して受け付ける受付手段と、前記コンテンツ記述の制約を満たさない、前記受付手段で受付された前記コンテンツからエラー内容を検出するエラー検出手段と、前記エラー内容と当該エラー内容に対応する前記辞書改善ルールとから作成した前記辞書の改善を提案する辞書改善提案を、前記辞書の編集者が使用する辞書編集者端末に提示する提案提示手段と、を備える。
また、本発明のプログラムは、コンピュータを、メタデータである辞書で定義されたコンテンツ記述の制約を含むスキーマに従って記述したコンテンツを、当該コンテンツの編集者が使用するコンテンツ編集者端末を介して受け付ける受付手段と、前記コンテンツ記述の制約を満たさない、前記受付手段で受付された前記コンテンツからエラー内容を検出するエラー検出手段と、コンテンツ記述のエラーパターンに応じて前記辞書の改善がルール付けされた辞書改善ルールに基づき、前記エラー内容から作成した前記辞書の改善を提案する辞書改善提案を、前記辞書の編集者が使用する辞書編集者端末に提示する提案提示手段と、として機能させる。
また、本発明のメタデータ管理方法は、受付手段が、メタデータである辞書で定義されたコンテンツ記述の制約を含むスキーマに従って記述したコンテンツを、当該コンテンツの編集者が使用するコンテンツ編集者端末を介して受け付けるステップと、エラー検出手段が、前記コンテンツ記述の制約を満たさない、前記受付手段で受付された前記コンテンツからエラー内容を検出するステップと、提案提示手段が、コンテンツ記述のエラーパターンに応じて前記辞書の改善がルール付けされた辞書改善ルールに基づき、前記エラー内容から作成した前記辞書の改善を提案する辞書改善提案を、前記辞書の編集者が使用する辞書編集者端末に提示するステップと、を含む。
本発明によれば、メタデータである辞書で定義されているコンテンツ記述の制約を満たさない、受付手段で受付されたコンテンツからエラー内容が検出された場合には、コンテンツ記述のエラーパターンに応じて辞書の改善がルール付けされた辞書改善ルールに基づき、エラー内容から作成した辞書の改善を提案する辞書改善提案が辞書編集者端末に提示されることにより、コンテンツ編集者と辞書編集者との両者の隔たりを解消し、コンテンツデータの品質向上を図ることができる、という効果を奏する。
以下に添付図面を参照して、この発明にかかるメタデータ管理装置、プログラムおよび方法の最良な実施の形態を詳細に説明する。
本発明の実施の一形態を図1ないし図15に基づいて説明する。本実施の形態はメタデータ管理装置としてサーバコンピュータを適用した例である。
図1は、本発明の実施の一形態にかかるメタデータ管理システムのシステム構築例を示す模式図である。メタデータ管理システムは、図1に示すように、サーバコンピュータ(以下、サーバという)1にLAN(Local Area Network)等のネットワーク2を介してクライアントコンピュータ(以下、クライアントという)3が複数台接続されたサーバクライアントシステムを想定する。サーバ1およびクライアント3は、一般的なパーソナルコンピュータである。
図2は、サーバ1およびクライアント3のモジュール構成図である。サーバ1およびクライアント3は、情報処理を行うCPU(Central Processing Unit)101、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)102、各種データを書換え可能に記憶するRAM(Random Access Memory)103、各種データベースとして機能するとともに各種のプログラムを記憶する記憶部であるHDD(Hard Disk Drive)104、記憶媒体110を用いて情報を保管したり外部に情報を配布したり外部から情報を入手するためのCD−ROMドライブ等の媒体読取装置105、ネットワーク2を介して外部の他のコンピュータと通信により情報を伝達するための通信制御装置106、処理経過や結果等を操作者に表示するCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等の表示部107、並びに操作者がCPU101に命令や情報等を入力するためのキーボードやマウス等のポインティングデバイスである入力部108等から構成されており、これらの各部間で送受信されるデータをバスコントローラ109が調停して動作する。
このようなサーバ1およびクライアント3では、オペレータが電源を投入するとCPU101がROM102内のローダーというプログラムを起動させ、HDD104よりOS(Operating System)というコンピュータのハードウェアとソフトウェアとを管理するプログラムをRAM103に読み込み、このOSを起動させる。このようなOSは、オペレータの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。OSのうち代表的なものとしては、Windows(登録商標)等が知られている。これらのOS上で走る動作プログラムをアプリケーションプログラムと呼んでいる。なお、アプリケーションプログラムは、所定のOS上で動作するものに限らず、後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。
ここで、サーバ1は、アプリケーションプログラムとして、メタデータ管理プログラムをHDD104に記憶している。この意味で、HDD104は、メタデータ管理プログラムを記憶する記憶媒体として機能する。
一方、クライアント3は、アプリケーションプログラムとして、編集処理プログラムをHDD104に記憶している。この意味で、HDD104は、編集処理プログラムを記憶する記憶媒体として機能する。
また、一般的には、サーバ1およびクライアント3のHDD104にインストールされるアプリケーションプログラムは、CD−ROMやDVDなどの各種の光ディスク、各種光磁気ディスク、フレキシブルディスクなどの各種磁気ディスク、半導体メモリ等の各種方式のメディア等の記憶媒体110に記録され、この記憶媒体110に記録された動作プログラムがHDD104にインストールされる。このため、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体110も、アプリケーションプログラムを記憶する記憶媒体となり得る。さらには、アプリケーションプログラムは、例えば通信制御装置106を介して外部から取り込まれ、HDD104にインストールされても良い。
サーバ1は、OS上で動作するメタデータ管理プログラムが起動すると、このメタデータ管理プログラムに従い、CPU101が各種の演算処理を実行して各部を集中的に制御する。一方、クライアント3は、OS上で動作する編集処理プログラムが起動すると、この編集処理プログラムに従い、CPU101が各種の演算処理を実行して各部を集中的に制御する。サーバ1およびクライアント3のCPU101が実行する各種の演算処理のうち、本実施の形態の特長的な処理について以下に説明する。
クライアント3は、編集処理プログラムに従うことにより、サーバ1から受信したデータを、GUI(Graphic User Interface)を介して表示部107に出力し、表示部107に表示された各画面上でオペレータが入力部108を介して行った作業や設定内容に基づくデータやコマンドを、GUIを介して受け取り、サーバ1へ送信する。なお、編集処理プログラムは、操作者が有している権限に応じて各種機能を発揮する。詳細は後述するが、本実施の形態におけるクライアント3は、編集処理プログラムに従うことにより、図3に示すように、辞書編集者が使用するものであって辞書の編集を行う辞書編集者端末31、コンテンツ編集者が使用するものであって作成されたコンテンツの入力を許容するコンテンツ編集者端末32として操作者が有している権限に応じて機能する。
一方、サーバ1は、図3に示すように、メタデータ管理プログラムに従うことにより、メタデータ管理装置として機能するものであって、コンテンツ記述の制約を含むスキーマ(プロパティの並び)を定義したメタデータである辞書を記憶する辞書記憶部である辞書DB41と、エラーDB42と、ルール記憶部である辞書改善ルールDB43と、コンテンツ記述知識記憶部であるコンテンツ記述知識DB44と、版管理ルール記憶部である辞書版管理ルールDB45と、処理記録記憶部である処理記録DB46と、辞書改善提案DB47と、を備える。
また、サーバ1は、メタデータ管理プログラムに従うことにより、エラー検出手段として機能するコンテンツエラー検出部51と、提案提示手段として機能する辞書改善提案提示部52と、提案処理手段として機能する改善提案処理部53と、提案受付手段として機能する辞書改善提案受付部54と、コンテンツ編集者の識別子を管理するユーザ管理部55と、エラー知識表示手段として機能するエラー知識表示部56と、辞書改善通知手段として機能する辞書改善通知部57と、を備える。
以下、各部について詳述する。
まず、辞書DB41について説明する。図4は、辞書の一例を示す模式図である。図4に示すように、辞書DB41に記憶される辞書は、製品データを記述するために必要な分類(クラス)や属性(プロパティ)群で構成されている。クラスは階層構造を持ち、そのクラスを構成するプロパティによって特徴付けられる。また、本実施の形態においては、上位クラスで定義されたプロパティは下位のクラスで継承される。さらに、クラスやプロパティは、それぞれを特徴付けるアトリビュートを持っている。例えば、プロパティのアトリビュートとしては、「名称(name)」、「定義(definition)」、「シノニム(synonym)」、「データ型(data type)」、「値の形式(value format)」などがある。このような辞書を用いることにより、クラスで定義されたプロパティをスキーマとしてコンテンツデータ(実際の製品データ)が作成される。すなわち、コンテンツ編集者は、コンテンツ編集者端末32を介してサーバ1から取得した辞書に従って、コンテンツデータ(実際の製品データ)を記述し、入力することができるものとする。
なお、本実施の形態においては、構造を分かりやすく説明するために、図4にコンテンツも記載されているが、本来、辞書には含まれない。また、クラスは必ずしも必要ではなく、プロパティだけから成る辞書も他のデータモデルには存在する。辞書は、少なくともプロパティと、プロパティを定義するためのアトリビュート(定義や名称、データ型など)があればよい。
辞書版管理ルールDB45は、辞書要素(クラス、プロパティ)の変更が及ぼす影響について記載した辞書版管理ルールを記憶するデータベースである。図5は、PLIBデータモデルを例に取り、辞書版管理ルールを示す例である。PLIBデータモデルでは、辞書要素個々に、バージョン、リビジョンを持ち、版管理を行っており、コンテンツに影響を及ぼさない範囲での辞書要素の変更を容認している。すなわち、プロパティの削除は、既に該プロパティを使ってコンテンツを作成している可能性があるため禁止である。また、データ型の変更も、選択肢型の選択肢の追加を除いて、原則禁止である。さらに、定義の変更はバージョンの変更で対応、シノニムの追加はリビジョンの追加で対応するなどのルールが存在する。図5は、そのような辞書版管理ルールの一部を表したものである。図5中の「V」はバージョンの変更、「R」はリビジョンの変更、「X」は禁止、「−」は起こりえないパターンであることを示している。なお、対象とするデータモデルによって、版管理の体系やアトリビュートは異なるので、そのデータモデルに合った辞書版管理ルールを定義するものとする。
辞書改善ルールDB43は、コンテンツ記述のエラーパターンに応じて辞書の改善あるいはコンテンツを記述する際に補助となる知識であるアノテーションの付与がルール付けされた辞書改善ルールを記憶するデータベースである。改善提案ルールとしては、下記に例示する表1〜5のようなルールが考えられる。表1〜5は、PLIBのデータモデルを例に取った場合のプロパティのデータ型エラーに関する処理である。辞書への影響度は、PLIBで定められているものを基本として記述しているが、説明の都合上、異なる場合もある。また、辞書への影響度や用意されているデータ型はモデルによって異なる場合もある。表1〜5の「改善提案」は、改善提案ルールを示すものである。「変更パターン」は、辞書要素のどのアトリビュートに対するどのような変更かを示すものである。「エラーコンテンツの可否」は、仮に改善提案ルールに従って辞書が更新された場合に今回エラーとなったコンテンツがそのまま利用できる(Y)か否(N)かを示すものである。「辞書への影響度」は、辞書版管理ルールDB45の版管理ルールから得られる辞書の変更が及ぼす影響を示すものである。なお、「エラーコンテンツの可否」は、その値が「可(Y)」の場合において辞書改善が実施されると、エラーを起こしたコンテンツ編集者が使用するコンテンツ編集者端末32に通知され、コンテンツの更新に役立たせることができる。
(1)選択肢型の場合
例えば、エラー内容が「プロパティ{P}に、選択肢として定義されていない選択肢{E}を入力した」の場合、表1のような改善対案が提示される。
Figure 2009080626
(2−1)数値型の場合
例えば、エラー内容が「桁数オーバー」の場合、表2のような改善対案が提示される。
Figure 2009080626
(2−2)数値型の場合
例えば、エラー内容が「数値型に反し、文字列が入力された」の場合、表3のような改善対案が提示される。
Figure 2009080626
(3)文字列型の場合
例えば、エラー内容が「制約文字違反」の場合、表4のような改善対案が提示される。制約条件{C}とする。下記に示す表4のID“1”の例は、エラーによって複数パターンを用意しておくものとする。
Figure 2009080626
(4)クラス参照型の場合
データ型「クラス参照型」は、他のクラスへの参照を表し、部品の記述を行うときなどに利用する。辞書では、プロパティのデータ型として、参照先のクラスを定義する。コンテンツでは、辞書で定義された参照先クラス以下(参照先クラスの下位)のクラスの指定と、コンテンツで指定した参照先クラスに存在するプロパティとその値の複数の組を指定する。このようにすることにより、クラス参照型プロパティでは、参照先クラスに存在するコンテンツの参照が行える。
例えば、エラー内容が「コンテンツで指定した参照先クラス{CC}が辞書で定義されている参照先クラス{DC}の子クラスになっていない」とする。改善提案は、下記に示す表5のID“1”〜ID“3”に示すように、正しい参照先クラスを記述するための補助を行う。また、改善提案は、表5のID“4”に示すように、データ型の変更を行って、コンテンツで指定した参照先クラス{CC}をも満たすようなDCとCCの双方の上位クラスを新たに辞書で参照クラスとして定義する。さらに、改善提案は、表5のID“5”に示すように、参照先クラスを{CC}とするような新規プロパティを定義する。なお、表5のID“1”〜ID“3”は辞書編集者が{CC}をエラーと判断した場合、ID“4”,“5”は{CC}の記述も可能とするべく辞書の改善が必要と判断した場合の処理である。ここで、記号subclasses{C1}は、クラスC1以下のすべてのクラスをあらわす。また、superclass{C1,C2}はC1とC2の双方の上位にあるクラスで且つ一番下位のクラスを指す。
Figure 2009080626
コンテンツエラー検出部51は、コンテンツ編集者がコンテンツ編集者端末32を介して辞書DB41内の辞書に従って入力したコンテンツについて、辞書で定義されている制約(データ型、キー、必須など)に従ってエラーを検出する。エラーの内容は、コンテンツ編集者端末32を介してコンテンツ編集者に返され、コンテンツ編集者はコンテンツ編集者端末32でコンテンツを正しく修正する。図6および図7は、コンテンツエラー検出部51でエラーを検出した際、コンテンツ編集者が使用するコンテンツ編集者端末32に対して、検出したエラーについての表示・通知例である。図6に示す例は、データ型が選択肢型であるのに対し、入力した値「wine red」が選択肢に当てはまらずエラーであることをセルの背景を変更して示している例である。図7に示す例は、データ型が実数値型であるのに対し、入力した値「D」が違反していることをポップアップウィンドウWで示している例である。このようなエラーの表示・通知例は、既に通常のカタログシステムなどでも行われている。
加えて、コンテンツエラー検出部51は、検出したエラーの内容をエラーDB42に記録する。図8は、エラーDB42および処理記録DB46の例を示したものである。図8に示す例では、エラーID、ユーザ管理部55で管理しているコンテンツ編集者の識別子、エラーを検出したプロパティ、エラーの内容、エラー理由、改善提案、処理状況、処理内容が記録されている。なお、図3では、便宜上、エラーDB42と処理記録DB46とを分けているが、エラー1つに対して、処理結果が1つ対応するため、1つのデータベースで管理しても問題ない。
なお、異なるプロパティの同種のエラーについては、処理記録DB46を検索し、検索した中から、前回選んだものに対応付ける、選択回数の多いものに対応付ける、などしてもよい。
ここで、図6に示す選択肢型の入力エラーがあった場合について詳述する。図6に示すように、データ型が選択肢型のプロパティ「P1:色」に対して、選択肢として「silver」「red」「white」「black」が辞書で定義されていたとする。コンテンツ編集者は、コンテンツ編集者端末32を介してP1の値として「wine red」を入力する。「wine red」はP1の選択肢として定義されていないため、コンテンツエラー検出部51でエラーとして認識され、コンテンツ編集者にエラーである旨が図6に示すようにセルの背景を変更して通知される。コンテンツ編集者は、エラーであることを認識し、指示に従い修正を行う。加えて、コンテンツエラー検出部51では、P1に対するエラーとして、ユーザ管理部55で管理しているコンテンツ編集者の識別子、エラーの値「wine red」をエラーDB42および処理記録DB46に記録する。
辞書改善提案提示部52は、所定のタイミングで、エラーDB42に蓄積されたエラー内容(例えば、「選択肢エラー」)および当該エラー内容に対応する辞書改善ルールDB43に記述された辞書改善ルールを取得し、実際のエラー内容に合わせた辞書改善提案を作成し、作成された辞書改善提案を辞書改善提案DB47に記憶する。また、辞書改善提案提示部52は、辞書改善提案DB47に記憶された辞書改善提案を呼び出して、辞書編集者が使用する辞書編集者端末31に提示する。ここで、所定のタイミングとは、1年に1回、1時間毎、新しいエラーを蓄積した時、重要度の高いエラーを蓄積したとき、辞書編集者によるトリガー、などが考えられる。なお、改善提案作成時には、同義語などの関係を導き出すのに、辞書に含まれる別の辞書要素の状態を利用することもある。辞書編集者は、辞書編集者端末31に提示された辞書改善提案に従って、コンテンツ記述知識DB44にアノテーション、エラー例示として記録するか、辞書を変更するか、あるいは何も変更しないかを決定する。
例えば、辞書改善ルールDB43では、「選択肢エラー」に対応する辞書改善ルールは表1に示すようになっている。なお、この表1の場合、辞書のデータモデルはISO13584-42を例に取っており、改善によって及ぼされる辞書への影響度は同規格で定められているものである。例えば、プロパティの定義要素であるアトリビュート(プロパティの名称、同義語、省略名称、データ型、定義など)は、利用するデータモデルによって異なるため、改善提案ルールはそのデータモデルによって異なる場合もある。また、そのアトリビュートの変更によって辞書に与える影響も、利用するデータモデルによって異なる。この改善提案ルールに従って、辞書編集者に提示される辞書改善提案は、図9に示すようになる。
図9に示す例によれば、改善提案IDに対応付けて、改善提案、変更パターン、辞書に及ぼす影響度を提示している。図9に示すID102の改善提案は、エラー値「wine red」に対して、正値の選択肢リストに置き換えられるものがないかを検索し、その結果「wine red」が得られたものである。「wine red」と「red」に同義語或いは近似の関係があることは、辞書DB41の辞書で定義されている名称とシノニムの関係や、そのほかの用語データベースから得ることができる。
そして、図9に示すように、辞書編集者は、辞書編集者端末31に提示された辞書改善提案(例えば、ID105の「選択肢に“wine red”を登録する。」)を、入力部108を介して対応するラジオボタンを操作する。操作により選択された辞書改善提案は、処理記録DB46あるいはエラーDB42のエラーデータ内の改善提案に記録される。あるプロパティに対して、一度処理を行ったエラーが再度生じた場合、既に処理済(例えば、シノニム名称の追加など)であることからエラーDB42には登録を行うが、辞書改善提案提示部52には提示を行わない。ただし、同じエラーが頻発する場合には、改善が不十分であったとして、再度、改善提案を行う。
また、本実施の形態においては、辞書に及ぼす影響度と共に辞書改善提案を表示するようにしたことにより、辞書編集者は、影響とエラーの内容とを見比べながら、辞書の改善を行うことができる。通常は、辞書に及ぼす影響が少ないほうが既存コンテンツに与える影響が少ないため、辞書編集者は、辞書への影響度が少ない辞書改善提案を選ぶようにする。
また、上述したような辞書改善提案は、なるべく辞書に及ぼす影響度の低いものから順に提示しても良い。データ型の変更のような大きな変更は、辞書要素のバージョンアップでは対応できず、別の辞書要素として定義しなおす必要がある。既にコンテンツデータと共に利用されている辞書は、なるべく既存コンテンツデータを引き継いで利用できることが望ましく、別の辞書要素とすることはできれば少ないほうが良い。従って、辞書改善提案は、アノテーションや間違い事例の事前提示、リビジョンアップで済むもの、バージョンアップで済むもの、別の辞書要素としなければならないもの、という順番で影響度を付与して表示する(図9参照)。
また、辞書改善提案提示部52は、似たような辞書要素に対して改善提案があった場合には、処理記録DB46を参照して過去に辞書編集者が選択した処理を検索し、辞書改善提案にその情報を付加することにより、過去の事例を優先的に提示するようにしてもよい。
なお、辞書編集者は、辞書改善提案提示部52により辞書編集者端末31に提示された辞書改善提案に実施該当のものがないと判断した場合には、辞書編集者自身で辞書改善ルールや辞書改善提案を新たに作成することができる。
辞書改善提案受付部54は、コンテンツエラー検出部51がエラーを検出した際に、エラーが検出されたものについて、コンテンツ編集者自身がコンテンツ編集者端末32を介して提案した辞書改善提案を受け付ける。図10および図11は、コンテンツ編集者からの辞書改善提案を受け付けた後、辞書編集者端末31に表示される辞書改善提案画面の例である。図10に示す辞書改善提案画面は、コンテンツ編集者がどのプロパティに対して辞書改善提案を行うのかを選択するための画面である。図10に示す画面左で製品分類を選択し、選択した製品分類で定義されているプロパティが図10に示す画面右に表示される。辞書編集者は、その中からプロパティを選択する。すると、図11に示す画面が表示され、プロパティのどのアトリビュート(名称、定義、データ型など)について、何を変更するのかを入力することができる。図11に示す画面では、選択されたプロパティP1に対して、選択肢「red」のシノニム名称「rose」の追加、新たな選択肢「wine red」の提案を行っている。
辞書改善提案受付部54は、上述のようにして受け付けた辞書改善提案を、辞書改善提案DB47に記憶する。辞書改善提案DB47に記憶されたコンテンツ編集者による辞書改善提案は、所定のタイミングで、辞書改善提案提示部52により辞書編集者が使用する辞書編集者端末31に提示される。ここで、所定のタイミングとは、1年に1回、1時間毎、辞書改善提案を受け付けた時、などが考えられる。辞書編集者端末31に提示された辞書改善提案は、上述したエラーから生じた改善提案と同様に処理される。
改善提案処理部53は、辞書編集者により新たに辞書改善ルールが定義された場合には、新たに定義された辞書改善ルールを辞書改善ルールDB43に追加し、次回以降の辞書改善提案提示時に利用する。また、改善提案処理部53は、辞書改善提案を受けて辞書編集者が選択或いは作成した辞書改善策を、辞書版管理ルールに従って、辞書DB41の変更或いはコンテンツ記述知識DB44にアノテーションなどを追加する。なお、辞書DB41の変更の際には、辞書版管理ルールDB45で定義されている版管理ルールに則って、辞書のバージョンやリビジョンなどの変更も行われる。加えて、改善提案処理部53は、エラーと、そのエラーに対して選択あるいは作成された辞書改善提案とを、処理記録DB46に記録する。
エラー知識表示部56は、改善提案処理部53での処理に従って、辞書には入れられないが、付随的につけられたコンテンツ記述に必要な知識であるアノテーション、コメント、エラー事例などを、コンテンツ記述知識DB44から取得し、図12に示すように、コンテンツ編集者がコンテンツを記述する際にコンテンツ編集者端末32に表示する。
辞書改善通知部57は、あるタイミングで辞書の更新が行われた際、処理記録DB46およびエラーDB42から、過去にコンテンツ編集者が起こしたエラーで、且つ、辞書の更新により、エラーではなくなったものに関して、コンテンツ編集者に通知する。これにより、コンテンツ編集者は、より実情に即したコンテンツデータに書き換えることが可能となる。
図13は、過去にコンテンツ編集者が起こしたエラーで、且つ、辞書の更新によりエラーでなくなったものについて、コンテンツ編集者に通知する画面の例である。図13中の背景が変更されているセルは、以前コンテンツ編集者が「wine red」と入力しようとしたが、その時点では「wine red」が選択肢として定義されておらずエラーとなったため、「red」と修正入力した箇所である。前述したように、辞書編集者が、図9に示すID105の「選択肢に“wine red”を登録する。」を指定操作したことにより辞書DB41の辞書が更新され、「wine red」が選択肢に追加された場合には、コンテンツ編集者に対して、入力当初、入力したかった「wine red」への変更も可能であることを画面上で通知している。辞書DB41の辞書が改善され、「wine red」が選択肢になったことにより、コンテンツ編集者は、以前、コンテンツエラー検出部51でエラーとされ、仕方なく「red」に変えて登録したコンテンツのP1の値を「red」から「wine red」に更新することが可能となる。本実施の形態によれば、このようにコンテンツ編集者の意図や要望を、自然に収集し反映することができる。
なお、コンテンツ編集者が過去に編集したコンテンツの閲覧をすることは稀であるため、メール等で辞書の改訂があり、過去のコンテンツの修正の可能性があることを知らせるようにしてもよい。
コンテンツ編集者は、エラーが通知された時点で、コンテンツ投入単位で修正を行うため、再度の誤解がなければ同じプロパティに対する同じエラーは一度に修正される。
なお、過去にコンテンツ編集者が起こしたコンテンツエラー検出部51によるコンテンツエラーチェックの回数をプロパティ毎に集計するようにしても良い。このようにプロパティ毎にコンテンツエラーチェックの回数を集計するのは、コンテンツ編集者は大量のコンテンツを機械的に作成する場合が多いためである。この場合、プロパティの解釈の間違いのために生じるエラーは一度と考えて良い。もちろん、エラーDB42に対して、コンテンツエラーチェックの回数の記憶を行うようにしても良い。これにより、その割合が突出しているコンテンツ編集者の場合には、コンテンツ編集者の理解力自身に問題(専門知識がない)がある場合が考えられる。そのため、辞書改善提案提示部52は、そのようなコンテンツ編集者による辞書改善提案には、マークを付けるなどして、エラーを提示する際にエラー発生度が高いユーザであることを提示することも考えられる。このようにエラー発生度が高いユーザであることを提示することで、辞書編集者は、より注意深く、そのエラーを辞書改善に役立てるべきかを判断することができる。
以上のような各部による処理の内、コンテンツ編集処理および辞書改善提案の提示処理の流れについて説明する。
まず、コンテンツ編集処理について図14のフローチャートを参照して説明する。図14に示すように、コンテンツ編集者からの辞書DB41内の辞書に従ったコンテンツ(実際の製品データ)の入力をコンテンツ編集者端末32を介して受け付けると(ステップS1:受付手段)、コンテンツエラー検出部51は、コンテンツ編集者が入力したコンテンツについて、辞書で定義されている制約(データ型、キー、必須など)に従ってエラーがあるか否かをチェックする(ステップS2)。
エラーがないと判断した場合には(ステップS2のYes)、入力されたコンテンツを記述して(ステップS3)、処理を終了する。
一方、エラーがあると判断した場合には(ステップS2のNo)、コンテンツエラー検出部51は、検出したエラーの内容をエラーDB42に記録するとともに(ステップS4)、コンテンツ編集者端末32を介してコンテンツ編集者にエラーの内容を返信し(ステップS5)、ステップS1に戻る。コンテンツ編集者は、返信されたエラーの内容を参照してコンテンツ編集者端末32でコンテンツを正しく修正する。
次に、辞書改善提案の提示処理について図15のフローチャートを参照して説明する。図15に示すように、辞書改善提案提示部52は、所定のタイミングで、エラーDB42に蓄積されたエラー内容(例えば、「選択肢エラー」)を呼び出すとともに(ステップS11)、当該エラー内容に対応する辞書改善ルールDB43に記述された辞書改善ルールを呼び出し(ステップS12)、実際のエラー内容に合わせた辞書改善ルールに従って辞書改善提案を作成し(ステップS13)、作成された辞書改善提案を辞書改善提案DB47に記憶する(ステップS14)。そして、辞書改善提案提示部52は、このようにして辞書改善提案DB47に記憶された辞書改善提案を呼び出して、辞書編集者が使用する辞書編集者端末31に提示する(ステップS15)。
このように本実施の形態によれば、メタデータである辞書で定義されているコンテンツ記述の制約を満たさない、コンテンツ編集者端末を介して受付手段で受付されたコンテンツからエラー内容が検出された場合には、コンテンツ記述のエラーパターンに応じて辞書の改善がルール付けされた辞書改善ルールに基づき、エラー内容から作成した辞書の改善を提案する辞書改善提案が辞書編集者端末に提示されることにより、コンテンツ編集者と辞書編集者との両者の隔たりを解消し、コンテンツデータの品質向上を図ることができる。
本発明の実施の一形態にかかるメタデータ管理システムのシステム構築例を示す模式図である。 サーバおよびクライアントのモジュール構成図である。 メタデータ管理システムの機能を示すブロック図である。 辞書の一例を示す模式図である。 辞書版管理ルールの一例を示す模式図である。 エラーの表示例を示す正面図である。 エラーの表示例を示す正面図である。 エラーの内容の一例を示す模式図である。 辞書改善提案の表示例を示す正面図である。 辞書改善提案の表示例を示す正面図である。 辞書改善提案の表示例を示す正面図である。 アノテーションの表示例を示す正面図である。 エラー解除を知らせる表示例を示す正面図である。 コンテンツ編集処理の流れを示すフローチャートである。 辞書改善提案の提示処理の流れを示すフローチャートである。
符号の説明
1 メタデータ管理装置
31 辞書編集者端末
32 コンテンツ編集者端末
41 辞書記憶部
43 ルール記憶部
44 コンテンツ記述知識記憶部
45 版管理ルール記憶部
46 処理記録記憶部
51 エラー検出手段
52 提案提示手段
53 提案処理手段
54 提案受付手段
56 エラー知識表示手段
57 辞書改善通知手段

Claims (12)

  1. コンテンツ記述の制約を含むスキーマを定義したメタデータである辞書を記憶する辞書記憶部と、
    コンテンツ記述のエラーパターンに応じて前記辞書の改善がルール付けされた辞書改善ルールを記憶したルール記憶部と、
    前記スキーマに従って記述したコンテンツを、当該コンテンツの編集者が使用するコンテンツ編集者端末を介して受け付ける受付手段と、
    前記コンテンツ記述の制約を満たさない、前記受付手段で受付された前記コンテンツからエラー内容を検出するエラー検出手段と、
    前記エラー内容と当該エラー内容に対応する前記辞書改善ルールとから作成した前記辞書の改善を提案する辞書改善提案を、前記辞書の編集者が使用する辞書編集者端末に提示する提案提示手段と、
    を備えることを特徴とするメタデータ管理装置。
  2. 前記ルール記憶部は、前記辞書の改善に加えて、コンテンツ記述のエラーパターンに応じてコンテンツを記述する際に補助となる知識であるエラー知識の付与がルール付けされた前記辞書改善ルールを記憶しており、
    前記提案提示手段は、前記辞書の改善あるいは前記エラー知識の付与を提案する前記辞書改善提案を作成する、
    ことを特徴とする請求項1記載のメタデータ管理装置。
  3. 前記辞書の変更が及ぼす影響について記載した版管理ルールを記憶する版管理ルール記憶部を備え、
    前記ルール記憶部に記憶された辞書改善ルールには、前記版管理ルールから得られた辞書に及ぼす影響も併記されており、
    前記提案提示手段は、辞書に及ぼす影響度を前記辞書改善提案とともに前記辞書編集者端末に提示する、
    ことを特徴とする請求項1または2記載のメタデータ管理装置。
  4. 前記辞書改善提案を受けて辞書編集者が選択あるいは作成した辞書改善策を、前記辞書編集者端末を介して受け取り、前記版管理ルールに従って前記辞書記憶部を変更する提案処理手段を備える、
    ことを特徴とする請求項1ないし3のいずれか一記載のメタデータ管理装置。
  5. 前記提案処理手段は、前記辞書編集者端末を介して新たに定義された辞書改善ルールを受け取った場合には、当該辞書改善ルールを前記ルール記憶部に追加する、
    ことを特徴とする請求項4記載のメタデータ管理装置。
  6. 前記エラー知識を記憶するコンテンツ記述知識記憶部を備え、
    前記提案処理手段は、前記辞書改善提案を受けて選択あるいは作成した辞書改善策として前記エラー知識を前記辞書編集者端末を介して受け取り、前記版管理ルールに従って前記コンテンツ記述知識記憶部に追加する、
    ことを特徴とする請求項4記載のメタデータ管理装置。
  7. 前記コンテンツ記述知識記憶部に記憶されている前記エラー知識を、前記コンテンツ編集者端末に表示するエラー知識表示手段を備える、
    ことを特徴とする請求項6記載のメタデータ管理装置。
  8. 前記辞書改善提案を前記コンテンツ編集者端末を介して受け付ける提案受付手段を備え、
    前記提案提示手段は、前記辞書改善提案を前記辞書編集者端末に提示する、
    ことを特徴とする請求項1ないし7の何れか一記載のメタデータ管理装置。
  9. 前記提案処理手段による前記辞書に対する改善処理の記録を記憶する処理記録記憶部を備え、
    前記提案提示手段は、類似する辞書要素に対して改善提案があった場合には、前記処理記録記憶部を参照して過去の選択処理を検索し、前記辞書改善提案にその情報を付加することにより、過去の事例を優先的に提示して辞書改善提案を行う、
    ことを特徴とする請求項1ないし8の何れか一記載のメタデータ管理装置。
  10. 前記コンテンツのエラー検出時にはエラーであった内容が前記辞書の改善によりエラーで無くなった場合に、その旨を前記コンテンツ編集者端末に通知する辞書改善通知手段を備える、
    ことを特徴とする請求項1ないし9の何れか一記載のメタデータ管理装置。
  11. コンピュータを、
    メタデータである辞書で定義されたコンテンツ記述の制約を含むスキーマに従って記述したコンテンツを、当該コンテンツの編集者が使用するコンテンツ編集者端末を介して受け付ける受付手段と、
    前記コンテンツ記述の制約を満たさない、前記受付手段で受付された前記コンテンツからエラー内容を検出するエラー検出手段と、
    コンテンツ記述のエラーパターンに応じて前記辞書の改善がルール付けされた辞書改善ルールに基づき、前記エラー内容から作成した前記辞書の改善を提案する辞書改善提案を、前記辞書の編集者が使用する辞書編集者端末に提示する提案提示手段と、
    として機能させることを特徴とするプログラム。
  12. 受付手段が、メタデータである辞書で定義されたコンテンツ記述の制約を含むスキーマに従って記述したコンテンツを、当該コンテンツの編集者が使用するコンテンツ編集者端末を介して受け付けるステップと、
    エラー検出手段が、前記コンテンツ記述の制約を満たさない、前記受付手段で受付された前記コンテンツからエラー内容を検出するステップと、
    提案提示手段が、コンテンツ記述のエラーパターンに応じて前記辞書の改善がルール付けされた辞書改善ルールに基づき、前記エラー内容から作成した前記辞書の改善を提案する辞書改善提案を、前記辞書の編集者が使用する辞書編集者端末に提示するステップと、
    を含むことを特徴とするメタデータ管理方法。
JP2007249019A 2007-09-26 2007-09-26 メタデータ管理装置、プログラムおよび方法 Pending JP2009080626A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007249019A JP2009080626A (ja) 2007-09-26 2007-09-26 メタデータ管理装置、プログラムおよび方法
US12/235,632 US20090083295A1 (en) 2007-09-26 2008-09-23 Apparatus, computer program product, and method for managing meta data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007249019A JP2009080626A (ja) 2007-09-26 2007-09-26 メタデータ管理装置、プログラムおよび方法

Publications (1)

Publication Number Publication Date
JP2009080626A true JP2009080626A (ja) 2009-04-16

Family

ID=40472824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007249019A Pending JP2009080626A (ja) 2007-09-26 2007-09-26 メタデータ管理装置、プログラムおよび方法

Country Status (2)

Country Link
US (1) US20090083295A1 (ja)
JP (1) JP2009080626A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7494090B2 (ja) 2020-10-29 2024-06-03 株式会社東芝 情報処理装置、情報処理方法、およびプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9501556B2 (en) 2014-03-24 2016-11-22 Ca, Inc. Importing metadata into metadata builder
US10289430B2 (en) * 2014-03-24 2019-05-14 Ca, Inc. Interactive user interface for metadata builder
US10289713B2 (en) 2014-03-24 2019-05-14 Ca, Inc. Logical validation for metadata builder
US9934216B2 (en) 2014-03-24 2018-04-03 Ca, Inc. Schema validation for metadata builder
US10679008B2 (en) * 2016-12-16 2020-06-09 Microsoft Technology Licensing, Llc Knowledge base for analysis of text
US10572275B2 (en) * 2017-06-15 2020-02-25 Microsoft Technology Licensing, Llc Compatible dictionary layout
CN111209406B (zh) * 2018-11-21 2023-06-20 中国电信股份有限公司 本体知识库实例数据维护方法和装置
US11017157B2 (en) * 2019-05-15 2021-05-25 International Business Machines Corporation Group pattern based electronic dictionary modification and presentation
US10929596B2 (en) 2019-05-15 2021-02-23 International Business Machines Corporation Pattern based electronic dictionary modification and presentation
CN111475611B (zh) * 2020-03-02 2023-09-15 北京声智科技有限公司 词典管理方法、装置、计算机设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8868914B2 (en) * 1999-07-02 2014-10-21 Steven W. Teppler System and methods for distributing trusted time
JP2004177996A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 階層型データベース装置及び階層型データベースの構築方法
JP4138462B2 (ja) * 2002-11-22 2008-08-27 株式会社東芝 階層構造表示装置および階層構造表示方法
US8200775B2 (en) * 2005-02-01 2012-06-12 Newsilike Media Group, Inc Enhanced syndication

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7494090B2 (ja) 2020-10-29 2024-06-03 株式会社東芝 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
US20090083295A1 (en) 2009-03-26

Similar Documents

Publication Publication Date Title
JP2009080626A (ja) メタデータ管理装置、プログラムおよび方法
US10698755B2 (en) Analysis of a system for matching data records
US7689578B2 (en) Dealing with annotation versioning through multiple versioning policies and management thereof
US8060519B2 (en) Ontology-integration-position specifying apparatus, ontology-integration supporting method, and computer program product
JP5367947B2 (ja) 用語データベース拡張のための方法およびシステム
US8359339B2 (en) Graphical user interface for configuration of an algorithm for the matching of data records
US8176002B2 (en) Method and system for user alteration of the configuration of a data warehouse
US8234562B1 (en) Error checking for data entry
US9171069B2 (en) Method and apparatus for analyzing a document
US7783637B2 (en) Label system-translation of text and multi-language support at runtime and design
US8090677B2 (en) Method and system for altering the configuration of a data warehouse
US20090193420A1 (en) Method and system for batch processing form data
JP2007265249A (ja) データ検索表示装置、データ検索表示システム、検索表示処理プログラムおよびデータ検索表示方法
US20040261047A1 (en) Electrical form design and management method, and recording medium
JP5550959B2 (ja) 文書処理システム、及びプログラム
JP2007265250A (ja) 識別子発行システム、プログラムおよび識別子発行方法
JP2009015511A (ja) メタデータ管理装置、プログラムおよびメタデータ管理方法
JP2008234429A (ja) 部分ライブラリ構築装置、プログラムおよび部分ライブラリ構築方法
JP2010079709A (ja) 文書作成支援装置、プログラムおよび文書作成支援方法
JPH096768A (ja) 文書管理装置