JP2008537266A - 適応性のあるデータクリーニング - Google Patents
適応性のあるデータクリーニング Download PDFInfo
- Publication number
- JP2008537266A JP2008537266A JP2008507805A JP2008507805A JP2008537266A JP 2008537266 A JP2008537266 A JP 2008537266A JP 2008507805 A JP2008507805 A JP 2008507805A JP 2008507805 A JP2008507805 A JP 2008507805A JP 2008537266 A JP2008537266 A JP 2008537266A
- Authority
- JP
- Japan
- Prior art keywords
- data
- source
- data cleaning
- cleaning
- unique
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004140 cleaning Methods 0.000 title claims abstract description 196
- 230000003044 adaptive effect Effects 0.000 title description 5
- 238000000034 method Methods 0.000 claims abstract description 85
- 230000008569 process Effects 0.000 claims abstract description 80
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 238000011068 loading method Methods 0.000 claims abstract description 13
- 238000007726 management method Methods 0.000 claims description 29
- 238000005457 optimization Methods 0.000 claims description 23
- 238000012913 prioritisation Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000013474 audit trail Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 238000013524 data verification Methods 0.000 claims description 2
- 230000007812 deficiency Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 4
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000013068 supply chain management Methods 0.000 abstract description 2
- 230000008859 change Effects 0.000 description 10
- 238000012552 review Methods 0.000 description 9
- 238000004088 simulation Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 3
- 238000013502 data validation Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005201 scrubbing Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B5/00—Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
Abstract
Description
この出願は、2005年4月20日に出願された米国仮出願番号第60/673,420号の利益を主張する。
この発明は概してデータの処理および管理プロセスに関し、より詳細には、適応性のあるデータクリーニングのプロセスおよびシステムに関する。
どの重機のストックの推奨に繋がる決定プロセスを顧客が監査することを妨げる。寿命が長い重機などの修理可能なアイテムについてのサービス部品のストックレベルが数千万ドルから数億ドルに達するので、監査可能性は多くの顧客にとって重要な要件である。
この発明の一局面においては、データクリーニングプロセスは、データフォーマッティングユーティリィティおよびデータクリーニングユーティリィティを用いて、少なくとも2つのソースシステムからロードされたデータを検証するステップと、検証されたデータを正規化データクリーニングリポジトリに付加するステップと、ソースシステムの優先順位を選択するステップと、クリーンなデータベースを作成するステップと、固有のデータ識別子間の相互参照を作成および維持するステップと、クリーンなデータベースからの矛盾がなく、正規化され、かつ、クレンジングされたデータを、当該データを用いるデータシステムおよびソフトウェアツールが必要とするフォーマットにロードするステップと、当該矛盾がなく、正規化され、かつ、クレンジングされたデータを用いて標準化データクリーニングおよび管理レポートを作成するステップと、ソースシステムを更新することなくユーザにより当該矛盾がなく、正規化され、かつ、クレンジングされたデータを更新するステップとを含む。クリーンなデータベースは、少なくとも2つのソースシステムからの各データ要素のための固有のデータ識別子を含む。
以下の詳細な説明は、現在のところ考えられる、この発明を実施する最良の形態である。この発明の範囲が添付の特許請求の範囲によって最もよく規定されるので、この説明は
限定的な意味で取られるべきではなく、この発明の一般的な原理を例示する目的でのみなされる。
跡することによって取込まれ得る。これは、概して疑わしいデータのみにフラグを立てることができ、概して記録のシステムに対して変更がなされることを要求する先行技術のデータクリーニングプロセスと比較した利点である。多くの場合、記録のシステムは、データクリーナが更新権限を持たない顧客のデータベースまたは部門のデータベースである。その結果、ユーザが記録のシステムを更新せざるを得ない先行技術のデータクリーニングソリューションはしばしば実用的ではない。先行技術に反して、この発明の一実施例におけるようなデータクリーニングプロセスは、コンピュータモデルへの入力および出力の両方への日付の入ったバージョニング、時の経過に伴うデータに対する変更の追跡を提供する。既存のETLツールは、時の経過に伴うデータのバージョニングを支援しない。この発明の一実施例におけるようなデータクリーニングプロセスによって、結果ならびにその結果が依拠していたデータおよびデータソースの両方の監査可能性が可能になる。この発明の一実施例におけるようなデータクリーニングプロセスはさらに、ユーザが定義可能なビジネスルールに反するデータを選別することによってデータの完全性を保証する。さらに、この発明の一実施例におけるようなデータクリーニングプロセスによって、ユーザがたとえばソースシステムから部品番号に追加および削除することが可能になり、追加されたものに対するトレーサビリティを維持し、物理的にデータを削除するのではなくトレーサビリティのために削除されたデータにフラグを立てる。その結果、データは、削除されるときに電子的にタグを付けられるが、データリポジトリから物理的に除去されるわけではない。さらに、この発明の一実施例におけるようなデータクリーニングプロセスは、自動化された注を追加し、手製の注を考慮に入れ、これらは、各データ要素に添付されることができ、自動化された処理、フォーマット変換についての情報および他のデータ品質情報を提供し得る。これは、分析のためにデータを変換しなければならないとき、たとえばイギリスポンドからアメリカドルに通貨を正規化するときに、監査可能性を与える。
、既存のインターフェイス11に組込まれるデータクリーニングシステム20を含み得る。データクリーニングシステム20は、ETL(抽出、変換およびロード)ツール21と、データフォーマッティングユーティリティ22と、データクリーニングユーティリティ23と、正規化データクリーニングリポジトリ24と、ソース優先順位付けユーティリティ26と、データ要素およびソースのマスタテーブル30(図2にも図示)と、相互参照ユーティリティ27と、レポート28と、データクリーニングユーザインターフェイス29とを含み得る。既存のインターフェイス11は、企業、顧客および供給者データ12と、ETLツール13と、データウェアハウス14と、外部のデータソース15と、サプライチェーン在庫表最適化システム161、統合情報システム162、在庫表管理システム163、契約および価格付けシステム164、エンジニアリングシステム165、およびシミュレーションシステム166などのデータシステムならびにソフトウェアツール16とを含み得る。企業、顧客および供給者データ12は、ETLツール13を使用してデータウェアハウス14にロードされ得る。
ウントは、異なるデータ要素32に対して相互作表され得る。たとえば、在庫表管理システム163が消耗部品の総数および修理可能な部品の総数を知りたい場合、この情報はラインカウントレポートから引出され得る。さらに、標準化された高ドライバレポート40(図3に図示)を作成し得る。標準化された高ドライバレポート40は、検討のためにデータを優先順位付けすることを可能にし得る。優先順位付けによって、一貫性および精度についてデータを検討するときに異常をすばやく突き止めることが可能になり得る。
ニングテーブルのレイアウトがこの発明の一実施例に従って示される。データ要素およびソースのマスタテーブル30は、フィールド番号を含む列35と、フィールド名を含む列36と、エントリタイプを含む列37と、エントリ幅を含む列38と、説明を含む列39とを含み得る。テーブルの第1の行は、1つ以上の索引付けスキームからの固有のデータ識別子31を含み得る。図2に示すように、与えられる例では、部品は、たとえ固有の参照が1つだけ必要であるとしても、(a)DMC(domestic management code)(国内管理コード)およびIIN(item identification number)(アイテム識別番号)、(b)NSC(NATO (or national) supply classification code)(NATO(もしくは米国)サプライ分類コード)と、NCB(national codification bureau)(米国コード化局用コード)と、IIN(アイテム識別番号)とからなるNSN(NATOストック番号もしくは米国ストック番号)、または(c)Part no.(part number)(部品番号)およびCAGE(commercial and government entity code)(民間および政府のエンティティコード)によって固有に識別されることができる。固有のデータ識別子31に続いて、データ要素32をリストにすることができ、予備品プログラム110(図7に図示)などのプログラム名33が続く。データ要素およびソースのマスタテーブル30にさらにリストにされるのは、データ要素32の値321、(図1に示すデータウェアハウス14または外部のデータソース15などの)データ要素32のソース322、更新情報34、およびデータ要素32に添付されることができかつデータ処理中に使用され得るフラグ323であり得る。データ要素およびソースのマスタテーブル30の最後の行はテキストコメント341を含み得る。データ要素およびソースのマスタテーブル30によって、コードを修正することなくデータ要素およびソースを変更することが可能になり得る。データリポジトリのように、参照の整合性が慎重に実施されることはない。
ッケージ数量当たりの需要を一つの単位当たりの需要に換算することである。
ソースA、BおよびCから最高値を選択する)ために条件文を特定することを可能にし、データが(図1のデータウェアハウス14または外部のデータソース15などの)いかなるソースシステムからも利用可能でない場合、用いるべきデフォルトをユーザが選択することを可能にするステップを含み得る。特定のデータソースは、そのソースからのデータが考慮される必要がなければ選択されなくてもよいかもしれない。ステップ55はさらに、過去のある時点で用いられたデータ選択スキームがたとえば監査の目的で選択され得るように、以前の優先順位付けの履歴記録を維持するステップを含み得る。
た部品番号と製造者コードとの組合せを検討するステップと、有効な固有のデータ識別子31のリストであり得るマスタデータアイテムリストを維持するステップとを含み得る。マスタデータアイテムリストに含まれないアイテムには、疑わしいものとして検討するためにフラグが立てられてもよい。
リーニングアプリケーションは、データクリーニングシステム20(図1に図示)およびデータクリーニングプロセス50(図4に図示)のアプリケーションについての一例であり得る。サプライチェーン70は、埋込まれた(図1に示される)データクリーニングシステム20、(図1に示される)データクリーニングユーザインターフェイス29、統計的需要予測ユーティリティ72、戦略的在庫表最適化ツール73、シミュレーションツール74、戦術分析ユーティリティ75、ウェブポータル76、在庫表管理システム77、統制化されたプロセス78および分散ネットワーク最適化ツール79を有する統合情報システム71を含み得る。統合情報システム71は、(図1に示される)データクリーニングユーザインターフェイス29、統計的需要予測ユーティリティ72、戦略的在庫表最適化ツール73、シミュレーションツール74、戦術分析ユーティリティ75、ウェブポータル76および在庫表管理システム77との間でデータをやり取りし得る。統合情報システム71内に埋込まれた(図1に示される)データクリーニングシステム20によって、有効なデータクリーニングが提供され得る。(図4に示される)データクリーニングプロセス50は、正規化されてクレンジングされたデータの一貫したソースを介して、決定支援(78,72)、最適化(73,79)、シミュレーション(74)、報告(75,76)および在庫表管理ツール(77)をリンクすることによってサプライチェーン70を同期し得る。
データを収集するステップを含み得、この後、ステップ115においてデータクリーニングプロセス50(図4)が実行され得る。ストックレベルの戦略的在庫表最適化がステップ116においてエクスポートされ、リスクを減らすためのシミュレーション166(図1)がステップ117において実行され、ステップ118において内部の検討が実行され得る。ステップ119は、顧客の検討を実行するステップを含み得、この後、ステップ120において、モデルが繰返されるべきかどうかが決定され得る。モデルの繰返しが所望される場合、ステップ120はステップ114に戻るステップを含み得る。モデルの繰返しが必要でない場合、ステップ121において、提案レポートを作成するステップが実行され、この後、ステップ122において、提案を送出し、提案を獲得し、健全なプログラムを実行するステップが続き得る。予備品モデリングプロセス110では、ステップ115におけるデータクリーニングプロセス50(図4)によって与えられる矛盾がなく、正規化され、かつ、クレンジングされたデータのために、確実かつ実施可能な結果が提供され得る。
Claims (24)
- データクリーニングプロセスであって、
データフォーマッティングユーティリティおよびデータクリーニングユーティリティを用いて、少なくとも2つのソースシステムからロードされたデータを検証するステップと、
前記検証されたデータを正規化データクリーニングリポジトリに付加するステップと、
前記ソースシステムの優先順位を選択するステップと、
前記少なくとも2つのソースシステムからの各データ要素のための固有のデータ識別子を含むクリーンなデータベースを作成するステップと、
前記固有のデータ識別子間の相互参照を作成および維持するステップと、
前記クリーンなデータベースからの矛盾がなく、正規化され、かつ、クレンジングされたデータを、前記データを用いるデータシステムおよびソフトウェアツールが必要とするフォーマットにロードするステップと、
前記矛盾がなく、正規化され、かつ、クレンジングされたデータを用いて標準化データクリーニングおよび管理レポートを作成するステップと、
前記ソースシステムを更新することなく、ユーザによって前記矛盾がなく、正規化され、かつ、クレンジングされたデータを更新するステップとを含む、データクリーニングプロセス。 - 抽出、変換およびロードツールを用いたデータクリーニングのために前記少なくとも2つのソースシステムからのデータを共通のフォーマットにロードするステップと、
前記データ要素の各々の最良値を含むアイテムデータの単一のソースとしてデータ要素およびソースのマスタテーブルを作成するステップと、
前記データ要素の各々に注を添付して、前記データ要素をさらに理解させ、前記データ要素およびソースのマスタテーブルにおける注を維持するステップと、
前記データ要素の各々の前記ソースシステムに対するトレーサビリティを維持するステップと、
前記データ要素の各々についての固有の参照番号を作成して、前記データシステムおよびソフトウェアツールが固有のアイテム識別番号を受信することを可能にするステップと、
前記固有のアイテム識別番号を含む刻み目が付けられたマスタデータアイテムリストを維持するステップとをさらに含む、請求項1に記載のデータクリーニングプロセス。 - 前記データ検証ステップはさらに、
少なくとも2つのソースシステムからロードされた前記データを共通のフォーマットに正規化するステップと、
固有のデータ識別子を共通のフォーマットに調整するステップと、
検討のために、無効で、認識されず、かつ、欠落したアイテム識別子にフラグを立てるステップと、
少なくとも2つのソースシステムからロードされた前記データをクリーニングするステップとを含む、請求項1に記載のデータクリーニングプロセス。 - 前記ソースシステムの各々からのすべてのバージョンのデータに対するトレーサビリティを提供するステップと、
履歴上の時点でプルすべきデータの以前の値に対する監査証跡を提供するステップとをさらに含む、請求項1に記載のデータクリーニングプロセス。 - 固有のデータ要素の番号を決定するステップと、
前記固有のデータ要素の各々についての前記ソースシステムの番号を決定するステップ
と、
ユーザ指定の優先順位に従って前記固有のデータ要素の各々についての前記ソースシステムを選択するステップと、
ユーザによる特定のデータプルのために前記優先順位を更新するステップと、
すべての優先順位付けの履歴記録を維持するステップとをさらに含む、請求項1に記載のデータクリーニングプロセス。 - ラインカウントレポートを作成するステップと、
前記データ要素およびソースのマスタテーブルにおける前記固有のアイテム識別子の番号を記録するステップと、
異なるデータ要素に対して前記固有のアイテム識別子を相互作表するステップとをさらに含む、請求項1に記載のデータクリーニングプロセス。 - 高ドライバレポートを作成するステップと、
検討のためにアイテムに優先順位を付けるステップと、
明らかなエラーを速やかに識別するステップとをさらに含む、請求項1に記載のデータクリーニングプロセス。 - 前記ユーザが前記データ要素およびソースのマスタテーブルを更新することを可能にするデータクリーニングユーザインターフェイスを提供することにより、閉ループデータクリーニングを可能にするステップをさらに含む、請求項1に記載のデータクリーニングプロセス。
- サプライチェーンのためのデータクリーニングプロセスであって、
複数のソースシステムからのデータをデータ要素およびソースのマスタテーブルにロードするステップと、
前記ソースシステムの優先度を選択するステップと、
高ドライバおよびエラーレポートに基づいて前記データ要素およびソースのマスタテーブルに含まれるロジスティックスデータをクリーニングするステップと、
前記データ要素およびソースのマスタテーブルの矛盾がなく、正規化され、かつ、クレンジングされたデータを承認し、前記クレンジングされたデータを、前記データを用いるデータシステムおよびソフトウェアツールに供給するステップと、
前記クレンジングされたデータを用いて、戦略的在庫表最適化モデルを用いるストックレベルおよび発注点の在庫表最適化を開始するステップと、
ストックレベルおよび発注点の推奨を含む予備品分析を提供するステップと、
顧客監査証跡のための支援データをアーカイブするステップと、
レポートを作成するステップと、
前記レポートに従って不足をカバーするために予備品を購入するステップとを含む、サプライチェーンのためのデータクリーニングプロセス。 - 前記ソースシステムから前記データを抽出するステップと、
データクリーニングのために前記データを共通のフォーマットに変換するステップと、
前記高ドライバおよびエラーレポートを検討するステップとをさらに含む、請求項9に記載のサプライチェーンのためのデータクリーニングプロセス。 - 前記戦略的在庫表最適化モデルのために前記データ要素およびソースのマスタテーブルからデータを抽出および変換するステップと、
前記予備品分析のために前記データを前記戦略的在庫表最適化モデルから前記レポートにエクスポートするステップとをさらに含む、請求項9に記載のサプライチェーンのためのデータクリーニングプロセス。 - 在庫表最適化を承認するステップと、
レポートおよびウェブのビューを用いて前記予備品分析を検討するステップと、
前記ストックレベルおよび発注点の推奨、戦略的モデル入力、ソースシステム情報ならびにコメントを前記戦略的在庫表最適化モデルからデータリポジトリにエクスポートするステップとをさらに含む、請求項9に記載のサプライチェーンのためのデータクリーニングプロセス。 - 前記ストックレベルおよび前記発注点を在庫表管理システムにエクスポートするステップと、
資産管理のために、前記ストックレベルおよび前記発注点についての前記在庫表管理システムを在庫表管理データウェアハウスに更新するステップとをさらに含む、請求項9に記載のサプライチェーンのためのデータクリーニングプロセス。 - データクリーニングシステムであって、
データフォーマッティングユーティリティを含み、前記データフォーマッティングユーティリティは、少なくとも2つのソースシステムからダウンロードされたデータを検証するのに用いられ、前記データクリーニングシステムはさらに、
データクリーニングユーティリティを含み、前記データクリーニングユーティリティは、前記データをクリーニングするのに用いられ、前記データクリーニングシステムはさらに、
正規化データクリーニングリポジトリを含み、前記正規化データクリーニングリポジトリは前記フォーマットされクレンジングされたデータを受信し、前記データクリーニングシステムはさらに、
ソース優先順位付けユーティリティを含み、前記ソース優先順位付けユーティリティは、前記少なくとも2つのソースシステムの優先順位を選択するのに用いられ、前記データクリーニングシステムはさらに、
クリーンなデータベースを含み、前記クリーンなデータベースは、前記クレンジングされたデータおよび優先順位が付けられたデータを組合せ、前記クリーンなデータベースは、各データ要素のための最良値および固有のデータ識別子を含むアイテムデータの単一のソースであり、前記データクリーニングシステムはさらに、
相互参照ユーティリティを含み、前記相互参照ユーティリティは、前記固有のデータ識別子間の相互参照を作成および維持するのに用いられ、前記データクリーニングシステムはさらに、
データクリーニングユーザインターフェイスを含み、前記データクリーニングユーザインターフェイスは、ユーザが前記クリーンなデータベースを更新することを可能にする、データクリーニングシステム。 - 抽出、変換およびロードツールをさらに含み、前記抽出、変換およびロードツールは、前記少なくとも2つのソースシステムから前記データを抽出し、データクリーニングのために前記データを共通のフォーマットに変換し、前記データを前記データクリーニングシステムにロードする、請求項14に記載のデータクリーニングシステム。
- 前記抽出、変換およびロードツールは、前記クリーンなデータベースからの前記データを、前記データを用いるデータシステムおよびソフトウェアツールにとって必要なフォーマットにロードするのに用いられる、請求項15に記載のデータクリーニングシステム。
- 前記クリーンなデータベースはデータ要素およびソースのマスタテーブルである、請求項14に記載のデータクリーニングシステム。
- 標準化データクリーニングおよび管理レポートをさらに含み、前記レポートは、前記データ要素およびソースのマスタテーブルに含まれる前記データから作成され得る、請求項17に記載のデータクリーニングシステム。
- 前記データクリーニングユーティリティは、前記ソースシステムから前記データクリーニングフォーマットにロードされるデータの有効性を確実にするために用いられる、請求項14に記載のデータクリーニングシステム。
- 前記ソース優先順位付けユーティリティは以前の優先順位付けの履歴記録を維持する、請求項14に記載のデータクリーニングシステム。
- 前記データ要素およびソースのマスタテーブルは各データ要素のソースに対するトレーサビリティを維持する、請求項14に記載のデータクリーニングシステム。
- 前記データクリーニングシステムは前記少なくとも2つのソースシステムからデータを受信し、前記データクリーニングシステムは、前記データシステムおよびソフトウェアツールに対して、矛盾がなく、正規化され、かつ、クレンジングされたデータを供給し、ユーザは、前記ソースシステムを更新することなく前記データクリーニングシステムを更新し得る、請求項14に記載のデータクリーニングシステム。
- 前記ソフトウェアツールはサプライチェーンソフトウェアである、請求項22に記載のデータクリーニングシステム。
- 前記データシステムは在庫表管理システムである、請求項22に記載のデータクリーニングシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67342005P | 2005-04-20 | 2005-04-20 | |
US11/139,407 US20060238919A1 (en) | 2005-04-20 | 2005-05-27 | Adaptive data cleaning |
PCT/US2006/014553 WO2006113707A2 (en) | 2005-04-20 | 2006-04-17 | Supply chain process utilizing aggregated and cleansed data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008537266A true JP2008537266A (ja) | 2008-09-11 |
Family
ID=37115859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008507805A Pending JP2008537266A (ja) | 2005-04-20 | 2006-04-17 | 適応性のあるデータクリーニング |
Country Status (8)
Country | Link |
---|---|
US (1) | US20060238919A1 (ja) |
EP (1) | EP1883922A4 (ja) |
JP (1) | JP2008537266A (ja) |
KR (1) | KR20080002941A (ja) |
AU (1) | AU2006236390A1 (ja) |
CA (1) | CA2604694A1 (ja) |
IL (1) | IL186958A0 (ja) |
WO (1) | WO2006113707A2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282772A (ja) * | 2008-05-22 | 2009-12-03 | Hitachi Ltd | 監査証跡ファイル作成方法及びその実施装置 |
JP2013175096A (ja) * | 2012-02-27 | 2013-09-05 | Hitachi Systems Ltd | データクレンジングシステム及びプログラム |
JP2014512608A (ja) * | 2011-04-08 | 2014-05-22 | ザ・ボーイング・カンパニー | 一時的なデータウェアハウスにデータをロードするための方法およびシステム |
JP2014199504A (ja) * | 2013-03-29 | 2014-10-23 | 株式会社日立システムズ | 顧客別データクレンジング処理システム及び顧客別データクレンジング処理方法 |
JP2015524129A (ja) * | 2012-06-18 | 2015-08-20 | サービスソース・インターナショナル・インコーポレイテッドServiceSource International,Inc. | サービスアセットマネジメントシステム及び方法 |
US9984138B2 (en) | 2012-06-18 | 2018-05-29 | ServiceSource International, Inc. | Visual representations of recurring revenue management system data and predictions |
US9984342B2 (en) | 2012-06-18 | 2018-05-29 | ServiceSource International, Inc. | Asset data model for recurring revenue asset management |
US10769711B2 (en) | 2013-11-18 | 2020-09-08 | ServiceSource International, Inc. | User task focus and guidance for recurring revenue asset management |
US11488086B2 (en) | 2014-10-13 | 2022-11-01 | ServiceSource International, Inc. | User interface and underlying data analytics for customer success management |
Families Citing this family (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7865519B2 (en) | 2004-11-17 | 2011-01-04 | Sap Aktiengesellschaft | Using a controlled vocabulary library to generate business data component names |
US7769579B2 (en) | 2005-05-31 | 2010-08-03 | Google Inc. | Learning facts from semi-structured text |
US8244689B2 (en) | 2006-02-17 | 2012-08-14 | Google Inc. | Attribute entropy as a signal in object normalization |
US9208229B2 (en) | 2005-03-31 | 2015-12-08 | Google Inc. | Anchor text summarization for corroboration |
US7587387B2 (en) | 2005-03-31 | 2009-09-08 | Google Inc. | User interface for facts query engine with snippets from information sources that include query terms and answer terms |
US8682913B1 (en) | 2005-03-31 | 2014-03-25 | Google Inc. | Corroborating facts extracted from multiple sources |
US8996470B1 (en) | 2005-05-31 | 2015-03-31 | Google Inc. | System for ensuring the internal consistency of a fact repository |
US8306986B2 (en) | 2005-09-30 | 2012-11-06 | American Express Travel Related Services Company, Inc. | Method, system, and computer program product for linking customer information |
US8260785B2 (en) | 2006-02-17 | 2012-09-04 | Google Inc. | Automatic object reference identification and linking in a browseable fact repository |
US7991797B2 (en) | 2006-02-17 | 2011-08-02 | Google Inc. | ID persistence through normalization |
US8700568B2 (en) | 2006-02-17 | 2014-04-15 | Google Inc. | Entity normalization via name normalization |
US8122026B1 (en) | 2006-10-20 | 2012-02-21 | Google Inc. | Finding and disambiguating references to entities on web pages |
US7627595B2 (en) * | 2006-12-06 | 2009-12-01 | Verizon Data Services Inc. | Apparatus, method, and computer program product for synchronizing data sources |
US20080208735A1 (en) * | 2007-02-22 | 2008-08-28 | American Expresstravel Related Services Company, Inc., A New York Corporation | Method, System, and Computer Program Product for Managing Business Customer Contacts |
US8347202B1 (en) | 2007-03-14 | 2013-01-01 | Google Inc. | Determining geographic locations for place names in a fact repository |
US7739212B1 (en) * | 2007-03-28 | 2010-06-15 | Google Inc. | System and method for updating facts in a fact repository |
US8239350B1 (en) | 2007-05-08 | 2012-08-07 | Google Inc. | Date ambiguity resolution |
US20080301016A1 (en) * | 2007-05-30 | 2008-12-04 | American Express Travel Related Services Company, Inc. General Counsel's Office | Method, System, and Computer Program Product for Customer Linking and Identification Capability for Institutions |
US20080307262A1 (en) * | 2007-06-05 | 2008-12-11 | Siemens Medical Solutions Usa, Inc. | System for Validating Data for Processing and Incorporation in a Report |
US7966291B1 (en) | 2007-06-26 | 2011-06-21 | Google Inc. | Fact-based object merging |
US8086646B2 (en) * | 2007-07-20 | 2011-12-27 | Sap Ag | Scheme-based identifier |
US7970766B1 (en) | 2007-07-23 | 2011-06-28 | Google Inc. | Entity type assignment |
US8738643B1 (en) | 2007-08-02 | 2014-05-27 | Google Inc. | Learning synonymous object names from anchor texts |
US8170998B2 (en) * | 2007-09-12 | 2012-05-01 | American Express Travel Related Services Company, Inc. | Methods, systems, and computer program products for estimating accuracy of linking of customer relationships |
US8060502B2 (en) | 2007-10-04 | 2011-11-15 | American Express Travel Related Services Company, Inc. | Methods, systems, and computer program products for generating data quality indicators for relationships in a database |
US8812435B1 (en) | 2007-11-16 | 2014-08-19 | Google Inc. | Learning objects and facts from documents |
US8838652B2 (en) * | 2008-03-18 | 2014-09-16 | Novell, Inc. | Techniques for application data scrubbing, reporting, and analysis |
US8195645B2 (en) * | 2008-07-23 | 2012-06-05 | International Business Machines Corporation | Optimized bulk computations in data warehouse environments |
US8744994B2 (en) * | 2008-12-23 | 2014-06-03 | International Business Machines Corporation | Data filtering and optimization for ETL (extract, transform, load) processes |
US8458148B2 (en) * | 2009-09-22 | 2013-06-04 | Oracle International Corporation | Data governance manager for master data management hubs |
US9372917B1 (en) | 2009-10-13 | 2016-06-21 | The Boeing Company | Advanced logistics analysis capabilities environment |
CA2756198C (en) * | 2010-10-26 | 2018-07-17 | Accenture Global Services Limited | Digital analytics system |
US20120150825A1 (en) * | 2010-12-13 | 2012-06-14 | International Business Machines Corporation | Cleansing a Database System to Improve Data Quality |
DE102012210794A1 (de) * | 2011-07-01 | 2013-02-07 | International Business Machines Corporation | System und Verfahren zur Datenqualitätsüberwachung |
US9354968B2 (en) * | 2011-09-30 | 2016-05-31 | Johnson Controls Technology Company | Systems and methods for data quality control and cleansing |
US8812411B2 (en) | 2011-11-03 | 2014-08-19 | Microsoft Corporation | Domains for knowledge-based data quality solution |
US20130117202A1 (en) * | 2011-11-03 | 2013-05-09 | Microsoft Corporation | Knowledge-based data quality solution |
EP2648116A3 (en) * | 2012-04-03 | 2014-05-28 | Tata Consultancy Services Limited | Automated system and method of data scrubbing |
US10120916B2 (en) | 2012-06-11 | 2018-11-06 | International Business Machines Corporation | In-querying data cleansing with semantic standardization |
US9582555B2 (en) * | 2012-09-06 | 2017-02-28 | Sap Se | Data enrichment using business compendium |
US10545932B2 (en) * | 2013-02-07 | 2020-01-28 | Qatar Foundation | Methods and systems for data cleaning |
US10282426B1 (en) | 2013-03-15 | 2019-05-07 | Tripwire, Inc. | Asset inventory reconciliation services for use in asset management architectures |
US9135324B1 (en) * | 2013-03-15 | 2015-09-15 | Ca, Inc. | System and method for analysis of process data and discovery of situational and complex applications |
US9378256B2 (en) * | 2013-11-15 | 2016-06-28 | Ut-Battelle, Llc | Industrial geospatial analysis tool for energy evaluation |
US20160300180A1 (en) * | 2013-11-15 | 2016-10-13 | Hewlett Packard Enterprise Development Lp | Product data analysis |
MY188153A (en) * | 2014-04-23 | 2021-11-24 | Mimos Berhad | System for processing data and method thereof |
US9836488B2 (en) | 2014-11-25 | 2017-12-05 | International Business Machines Corporation | Data cleansing and governance using prioritization schema |
CA2940760C (en) * | 2015-08-31 | 2019-05-21 | Accenture Global Solutions Limited | Intelligent data munging |
DE102015121947A1 (de) * | 2015-12-16 | 2017-06-22 | Endress+Hauser Process Solutions Ag | Verfahren zum Überprüfen von Daten in einer Datenbank eines PAMs |
US11011709B2 (en) | 2016-10-07 | 2021-05-18 | Universal Display Corporation | Organic electroluminescent materials and devices |
US11151100B2 (en) * | 2016-10-17 | 2021-10-19 | Sap Se | Performing data quality functions using annotations |
WO2018089001A1 (en) | 2016-11-10 | 2018-05-17 | Hewlett-Packard Development Company, L.P. | Traceability identifier |
US11062041B2 (en) * | 2017-07-27 | 2021-07-13 | Citrix Systems, Inc. | Scrubbing log files using scrubbing engines |
US11416801B2 (en) * | 2017-11-20 | 2022-08-16 | Accenture Global Solutions Limited | Analyzing value-related data to identify an error in the value-related data and/or a source of the error |
US10839343B2 (en) | 2018-01-19 | 2020-11-17 | The Boeing Company | Method and apparatus for advanced logistics analysis |
US10199067B1 (en) * | 2018-03-23 | 2019-02-05 | Seagate Technology Llc | Adaptive cleaning of a media surface responsive to a mechanical disturbance event |
KR102272401B1 (ko) * | 2019-08-02 | 2021-07-02 | 사회복지법인 삼성생명공익재단 | 의료 데이터 웨어하우스 실시간 자동 업데이트 시스템, 방법 및 이의 기록매체 |
US12013840B2 (en) | 2020-04-17 | 2024-06-18 | International Business Machines Corporation | Dynamic discovery and correction of data quality issues |
KR102660529B1 (ko) * | 2020-12-11 | 2024-04-24 | 인피니텀주식회사 | 혼합학습 모니터링 방법 및 시스템 |
US11397681B2 (en) | 2020-12-21 | 2022-07-26 | Aux Mode Inc. | Multi-cache based digital output generation |
KR102640985B1 (ko) | 2022-03-23 | 2024-02-27 | 코리아에어터보 주식회사 | 소음감소를 위한 에어콤프레셔 설치용 소음방지장치 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3195107A (en) * | 1961-01-24 | 1965-07-13 | Siemens Ag | Secured transmission of coded binary symbols |
US5287363A (en) * | 1991-07-01 | 1994-02-15 | Disk Technician Corporation | System for locating and anticipating data storage media failures |
US5574898A (en) * | 1993-01-08 | 1996-11-12 | Atria Software, Inc. | Dynamic software version auditor which monitors a process to provide a list of objects that are accessed |
US5491818A (en) * | 1993-08-13 | 1996-02-13 | Peoplesoft, Inc. | System for migrating application data definition catalog changes to the system level data definition catalog in a database |
US5745753A (en) * | 1995-01-24 | 1998-04-28 | Tandem Computers, Inc. | Remote duplicate database facility with database replication support for online DDL operations |
SE509645C2 (sv) * | 1996-02-08 | 1999-02-15 | Ericsson Telefon Ab L M | En metod för att samtidigt med protokollbaserad funktionsändring i en databas utföra verifiering av konverterad data |
US6523041B1 (en) * | 1997-07-29 | 2003-02-18 | Acxiom Corporation | Data linking system and method using tokens |
US5909689A (en) * | 1997-09-18 | 1999-06-01 | Sony Corporation | Automatic update of file versions for files shared by several computers which record in respective file directories temporal information for indicating when the files have been created |
US6029174A (en) * | 1998-10-31 | 2000-02-22 | M/A/R/C Inc. | Apparatus and system for an adaptive data management architecture |
US7366708B2 (en) * | 1999-02-18 | 2008-04-29 | Oracle Corporation | Mechanism to efficiently index structured data that provides hierarchical access in a relational database system |
GB2375212B (en) * | 1999-04-29 | 2003-06-11 | Mitsubishi Electric Inf Tech | Method and apparatus for searching for an object using shape |
AU5289100A (en) * | 1999-05-24 | 2000-12-12 | Heat Timer Corporation | Electronic message delivery system utilizable in the monitoring oe remote equipment and method of same |
US6850908B1 (en) * | 1999-09-08 | 2005-02-01 | Ge Capital Commercial Finance, Inc. | Methods and apparatus for monitoring collateral for lending |
JP3750504B2 (ja) * | 2000-08-09 | 2006-03-01 | セイコーエプソン株式会社 | データ更新方法および情報処理装置 |
JP4540194B2 (ja) * | 2000-08-22 | 2010-09-08 | フォルクスワーゲン グループ ジャパン 株式会社 | 集中在庫管理システム及び方法 |
US7146416B1 (en) * | 2000-09-01 | 2006-12-05 | Yahoo! Inc. | Web site activity monitoring system with tracking by categories and terms |
US6604104B1 (en) * | 2000-10-02 | 2003-08-05 | Sbi Scient Inc. | System and process for managing data within an operational data store |
US7328186B2 (en) * | 2000-12-12 | 2008-02-05 | International Business Machines Corporation | Client account and information management system and method |
US6668254B2 (en) * | 2000-12-21 | 2003-12-23 | Fulltilt Solutions, Inc. | Method and system for importing data |
AU2002247046B2 (en) * | 2001-02-02 | 2006-10-05 | Opentv, Inc. | A method and apparatus for reformatting of content fir display on interactive television |
US6670967B2 (en) * | 2001-02-26 | 2003-12-30 | The United States Of America As Represented By The National Security Agency | Method of efficiently increasing readability of framemaker graphical user interface |
US7370272B2 (en) * | 2001-04-14 | 2008-05-06 | Siebel Systems, Inc. | Data adapter |
US7260718B2 (en) * | 2001-04-26 | 2007-08-21 | International Business Machines Corporation | Method for adding external security to file system resources through symbolic link references |
US7969306B2 (en) * | 2002-01-11 | 2011-06-28 | Sap Aktiengesellschaft | Context-aware and real-time item tracking system architecture and scenarios |
US7167574B2 (en) * | 2002-03-14 | 2007-01-23 | Seiko Epson Corporation | Method and apparatus for content-based image copy detection |
US7219104B2 (en) * | 2002-04-29 | 2007-05-15 | Sap Aktiengesellschaft | Data cleansing |
US7254571B2 (en) * | 2002-06-03 | 2007-08-07 | International Business Machines Corporation | System and method for generating and retrieving different document layouts from a given content |
US7324987B2 (en) * | 2002-10-23 | 2008-01-29 | Infonow Corporation | System and method for improving resolution of channel data |
US20040111304A1 (en) * | 2002-12-04 | 2004-06-10 | International Business Machines Corporation | System and method for supply chain aggregation and web services |
US6923932B2 (en) * | 2002-12-12 | 2005-08-02 | Intertec Systems, Llc | Composite structure tightly radiused molding method |
US7461385B2 (en) * | 2003-05-06 | 2008-12-02 | Qad Corporation | Method for establishing a new user interface via an intermingled user interface |
US7315978B2 (en) * | 2003-07-30 | 2008-01-01 | Ameriprise Financial, Inc. | System and method for remote collection of data |
US7302420B2 (en) * | 2003-08-14 | 2007-11-27 | International Business Machines Corporation | Methods and apparatus for privacy preserving data mining using statistical condensing approach |
US20050240592A1 (en) * | 2003-08-27 | 2005-10-27 | Ascential Software Corporation | Real time data integration for supply chain management |
US20050154769A1 (en) * | 2004-01-13 | 2005-07-14 | Llumen, Inc. | Systems and methods for benchmarking business performance data against aggregated business performance data |
US7315883B2 (en) * | 2004-07-02 | 2008-01-01 | Biglist, Inc. | System and method for mailing list mediation |
US7337161B2 (en) * | 2004-07-30 | 2008-02-26 | International Business Machines Corporation | Systems and methods for sequential modeling in less than one sequential scan |
US7299237B1 (en) * | 2004-08-19 | 2007-11-20 | Sun Microsystems, Inc. | Dynamically pipelined data migration |
US7664653B2 (en) * | 2004-09-01 | 2010-02-16 | United States Postal Service | System and method for electronic, web-based, address element correction for uncoded addresses |
US20060247944A1 (en) * | 2005-01-14 | 2006-11-02 | Calusinski Edward P Jr | Enabling value enhancement of reference data by employing scalable cleansing and evolutionarily tracked source data tags |
WO2008005102A2 (en) * | 2006-05-13 | 2008-01-10 | Sap Ag | Consistent set of interfaces derived from a business object model |
-
2005
- 2005-05-27 US US11/139,407 patent/US20060238919A1/en not_active Abandoned
-
2006
- 2006-04-17 KR KR1020077026008A patent/KR20080002941A/ko not_active Application Discontinuation
- 2006-04-17 AU AU2006236390A patent/AU2006236390A1/en not_active Abandoned
- 2006-04-17 WO PCT/US2006/014553 patent/WO2006113707A2/en active Application Filing
- 2006-04-17 EP EP06750560A patent/EP1883922A4/en not_active Withdrawn
- 2006-04-17 JP JP2008507805A patent/JP2008537266A/ja active Pending
- 2006-04-17 CA CA002604694A patent/CA2604694A1/en not_active Abandoned
-
2007
- 2007-10-28 IL IL186958A patent/IL186958A0/en unknown
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282772A (ja) * | 2008-05-22 | 2009-12-03 | Hitachi Ltd | 監査証跡ファイル作成方法及びその実施装置 |
JP2014512608A (ja) * | 2011-04-08 | 2014-05-22 | ザ・ボーイング・カンパニー | 一時的なデータウェアハウスにデータをロードするための方法およびシステム |
JP2013175096A (ja) * | 2012-02-27 | 2013-09-05 | Hitachi Systems Ltd | データクレンジングシステム及びプログラム |
JP2015524129A (ja) * | 2012-06-18 | 2015-08-20 | サービスソース・インターナショナル・インコーポレイテッドServiceSource International,Inc. | サービスアセットマネジメントシステム及び方法 |
US9984138B2 (en) | 2012-06-18 | 2018-05-29 | ServiceSource International, Inc. | Visual representations of recurring revenue management system data and predictions |
US9984342B2 (en) | 2012-06-18 | 2018-05-29 | ServiceSource International, Inc. | Asset data model for recurring revenue asset management |
US10078677B2 (en) | 2012-06-18 | 2018-09-18 | ServiceSource International, Inc. | Inbound and outbound data handling for recurring revenue asset management |
JP2014199504A (ja) * | 2013-03-29 | 2014-10-23 | 株式会社日立システムズ | 顧客別データクレンジング処理システム及び顧客別データクレンジング処理方法 |
US10769711B2 (en) | 2013-11-18 | 2020-09-08 | ServiceSource International, Inc. | User task focus and guidance for recurring revenue asset management |
US11488086B2 (en) | 2014-10-13 | 2022-11-01 | ServiceSource International, Inc. | User interface and underlying data analytics for customer success management |
Also Published As
Publication number | Publication date |
---|---|
EP1883922A2 (en) | 2008-02-06 |
CA2604694A1 (en) | 2006-10-26 |
WO2006113707A2 (en) | 2006-10-26 |
US20060238919A1 (en) | 2006-10-26 |
WO2006113707A3 (en) | 2007-12-21 |
KR20080002941A (ko) | 2008-01-04 |
IL186958A0 (en) | 2009-02-11 |
AU2006236390A1 (en) | 2006-10-26 |
EP1883922A4 (en) | 2009-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008537266A (ja) | 適応性のあるデータクリーニング | |
Adamson | Mastering data warehouse aggregates: solutions for star schema performance | |
KR101117244B1 (ko) | 비즈니스 엔티티들을 링킹하는 방법 및 시스템 | |
US8606624B2 (en) | Risk reports for product quality planning and management | |
US8209300B2 (en) | Online tracking of life-limited parts | |
US20080208661A1 (en) | Method and system of using anrtifacts to identify elements of a component business model | |
US8352414B2 (en) | System for discovering business processes from noisy activities logs | |
US20030120528A1 (en) | System and method for managing compliance with strategic business rules | |
US20110112973A1 (en) | Automation for Governance, Risk, and Compliance Management | |
US20230195715A1 (en) | Systems and methods for detection and correction of anomalies priority | |
WO2021150099A1 (en) | Equipment spare part inventory optimization methods and systems | |
US20080222189A1 (en) | Associating multidimensional data models | |
Accorsi et al. | A practitioner’s view on process mining adoption, event log engineering and data challenges | |
US8688499B1 (en) | System and method for generating business process models from mapped time sequenced operational and transaction data | |
Lucko et al. | Quantitative research: Preparation of incongruous economic data sets for archival data analysis | |
CN117273511A (zh) | 数据分析方法及装置 | |
US7251583B2 (en) | Minimizing use of parts that will reach their end of life prior to the products for which those parts are usable | |
US20140149186A1 (en) | Method and system of using artifacts to identify elements of a component business model | |
Yang et al. | Guidelines of data quality issues for data integration in the context of the TPC-DI benchmark | |
KR101903530B1 (ko) | 업무 및 전산화 체계 최적화 진단 시스템 | |
Roseberry et al. | Improvement of airworthiness certification audits of software-centric avionics systems using a cross-discipline application lifecycle management system methodology | |
CN117972115B (zh) | 一种流程自动化规则库构建方法、设备及介质 | |
Custard et al. | Study of using excess stock to reduce Naval Aviation Depot-Level Repairable piece part backorders | |
Galeta et al. | Product model suited for the ERP system | |
Tu et al. | Study of the performance of reverse logistics for supply chain management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090310 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20091111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100217 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110816 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120321 |