JP6142727B2 - データアクセス分析プログラム、データアクセス分析方法、及びデータアクセス分析装置 - Google Patents
データアクセス分析プログラム、データアクセス分析方法、及びデータアクセス分析装置 Download PDFInfo
- Publication number
- JP6142727B2 JP6142727B2 JP2013167854A JP2013167854A JP6142727B2 JP 6142727 B2 JP6142727 B2 JP 6142727B2 JP 2013167854 A JP2013167854 A JP 2013167854A JP 2013167854 A JP2013167854 A JP 2013167854A JP 6142727 B2 JP6142727 B2 JP 6142727B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- data access
- analysis
- access
- entropy rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0674—Disk device
- G06F3/0676—Magnetic disk device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0653—Monitoring storage devices or systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
Description
図1は、ディスク配置システムの概略構成例を示す図である。図1の例に示すディスク配置システム10は、クライアントコンピュータ11と、データアクセス分析装置12と、データ管理装置13とを有するよう構成されている。また、クライアントコンピュータ11と、データアクセス分析装置12と、データ管理装置13とは、例えばインターネットやLocal Area Network(LAN)等に代表される通信ネットワーク14によりデータの送受信が可能な状態で接続されている。
図2は、データアクセス分析装置の機能構成例を示す図である。図2の例に示すデータアクセス分析装置12は、関連性集計部31と、遷移行列生成部32と、行列反復処理部33、エントロピー率算出部34と、局所性解析部35とを有する。
図3は、データ管理装置の機能構成例を示す図である。図3の例において、データ管理装置13は、入出力管理部41と、解析要否判断部42と、関連性解析部43と、セグメント配置部44と、メモリ装置22と、記憶装置23とを有する。なお、入出力管理部41と、解析要否判断部42と、関連性解析部43と、セグメント配置部44とは、上述したCPU21がプログラムを実行することにより機能する機能部の一例である。
次に、データアクセス分析装置12のハードウェア構成例について、図を用いて説明する。図4は、データアクセス分析装置のハードウェア構成例を示す図である。図4の例において、データアクセス分析装置12は、入力装置51と、出力装置52と、ドライブ装置53と、補助記憶装置54と、主記憶装置55と、CPU56と、ネットワーク接続装置57とを有し、これらはシステムバスBで相互に接続されている。
次に、上述したディスク配置システム10の処理の一例について、フローチャートを用いて説明する。図5は、ディスク配置システムの処理の一例を示すフローチャートである。なお、図5の例は、データ管理装置13に対してデータ要求がなされる度に実行される。
次に、上述したS04に相当するデータアクセス分析装置12における処理の一例について、フローチャートを用いて説明する。図6は、データアクセス分析装置の処理の一例を示すフローチャートである。
ここで、上述した本実施形態におけるデータアクセスの分析について具体的に説明する。近年では安価で高性能なサーバの入手が容易となり、これらのサーバを用いたデータの分散処理が可能となったことから、ビッグデータの分野に注目が集まっている。ビッグデータを処理する際、メモリに入らない大量データを扱うことが多いため、ディスクを活用する必要が生じる。ディスク上のデータを処理する際、ディスクアクセスは、メモリアクセスに比べて非常に効率が悪いため、特にディスクアクセス回数やシーク時間を削減することが重要になる。
次に、上述したマルコフ連鎖として定式化した遷移行列について図を用いて説明する。図8は、マルコフ連鎖として定式化した遷移行列を説明するための図である。本実施形態では、アクセスシーケンスをマルコフ連鎖として定式化する。例えば、ある2つのデータが続けてアクセスされる確率を遷移行列として表現すると、図8に示すような値となる。なお、図8の例では、1つのデータセット(データ群)の中にデータ1,2,3を有するものとする。また、データセットは、1つのセッション内でアクセスされるデータ群である。
Qk=(α0I+α1P+α2P2+・・・+αk−1Pk−1)/(α0+α1+・・・+αk−1)
なお、上述のα0+α1+・・・+αk−1は、正の実数である。また、Iは単位行列である。
例えば、セグメントサイズをsとしたとき、このセグメントの特定のデータ(レコード)を予測するには、log2sビットが必要となる。実際のエントロピー率eが、この数値程度に変化(増大)したとき、単一のセグメント内に保持しきれなくなる。このときのホップ数hを求める。
次に、データ管理装置13におけるデータ再配置の具体例について説明する。なお、以下の説明では、セグメント管理庫22A及び関連性保管庫22Bに格納されるデータが、入出力管理部41に入力されたクライアントコンピュータ11からのデータ要求に応じてどのように変化するかについて説明する。なお、以下の説明において、データ要求Rqの一例であるRead(x,y)とは、例えばデータxを読みにいく要求と共に、データxとデータyとの間に関連性があることを入出力管理部41に通知することを意味する。
(付記1)
データアクセスの履歴情報から遷移行列を求め、
前記遷移行列を用いて、遷移回数毎のエントロピー率を算出し、
前記算出された個々のエントロピー率に基づき、前記データアクセスの相互関連度を判定し、
前記相互関連度に応じてディスクへのデータ配置を行う、処理をコンピュータに実行させるためのデータアクセス分析プログラム。
(付記2)
前記相互関連度は、
前記データアクセスに対し、N階(Nは自然数)のマルコフ連鎖としたときのエントロピー率を、N=1から複数のNに対して求め、
前記エントロピー率のNに対する変化状況に基づいて推定することを特徴とする付記1に記載のデータアクセス分析プログラム。
(付記3)
前記相互関連度に基づいて、前記データアクセスによるデータのディスク配置を制御させることを特徴とする付記1又は2に記載のデータアクセス分析プログラム。
(付記4)
前記エントロピー率と予め設定されたアクセスパターンとに基づいて取得されたキャッシュヒット率又はキャッシュミス率に対応させてデータの局所化の効果を分析することを特徴とする付記1乃至3のうち何れか1項に記載のデータアクセス分析プログラム。
(付記5)
前記キャッシュヒット率又は前記キャッシュミス率は、前記エントロピー率が予め設定されたセグメントサイズの対数を超える前記遷移回数に基づいて算出されることを特徴とする付記4に記載のデータアクセス分析プログラム。
(付記6)
データアクセス分析装置が、
データアクセスの履歴情報から遷移行列を求め、
前記遷移行列を用いて、遷移回数毎のエントロピー率を算出し、
前記算出された個々のエントロピー率に基づき、前記データアクセスの相互関連度を判定し、
前記相互関連度に応じてディスクへのデータ配置を行うことを特徴とするデータアクセス分析方法。
(付記7)
データアクセスの履歴情報から遷移行列を生成する遷移行列生成部と、
前記遷移行列生成部から得られる前記遷移行列を用いて、遷移回数毎のエントロピー率を算出するエントロピー率算出部と、
前記エントロピー率算出部により算出された個々のエントロピー率に基づき、前記データアクセスの相互関連度を判定し、前記相互関連度に応じて局所性を解析する局所性解析部とを有することを特徴とするデータアクセス分析装置。
11 クライアントコンピュータ
12 データアクセス分析装置
13 データ管理装置
14 通信ネットワーク
21,56 CPU
22 メモリ装置
23 記憶装置
31 関連性集計部
32 遷移行列生成部
33 行列反復処理部
34 エントロピー率算出部
35 局所性解析部
41 入出力管理部
42 解析要否判断部
43 関連性解析部
44 セグメント配置部
51 入力装置
52 出力装置
53 ドライブ装置
54 補助記憶装置
55 主記憶装置
57 ネットワーク接続装置
58 記録媒体
Claims (6)
- データアクセスの履歴情報から遷移行列を求め、
前記遷移行列を用いて、遷移回数毎のエントロピー率を算出し、
前記算出された個々のエントロピー率に基づき、前記データアクセスの相互関連度を判定し、
前記相互関連度に応じてディスクへのデータ配置を行う、処理をコンピュータに実行させるためのデータアクセス分析プログラム。 - 前記相互関連度は、
前記データアクセスに対し、N階(Nは自然数)のマルコフ連鎖としたときのエントロピー率を、N=1から複数のNに対して求め、
前記エントロピー率のNに対する変化状況に基づいて推定することを特徴とする請求項1に記載のデータアクセス分析プログラム。 - 前記相互関連度に基づいて、前記データアクセスによるデータのディスク配置を制御させることを特徴とする請求項1又は2に記載のデータアクセス分析プログラム。
- 前記エントロピー率と予め設定されたアクセスパターンとに基づいて取得されたキャッシュヒット率又はキャッシュミス率に対応させてデータの局所化の効果を分析することを特徴とする請求項1乃至3のうち何れか1項に記載のデータアクセス分析プログラム。
- データアクセス分析装置が、
データアクセスの履歴情報から遷移行列を求め、
前記遷移行列を用いて、遷移回数毎のエントロピー率を算出し、
前記算出された個々のエントロピー率に基づき、前記データアクセスの相互関連度を判定し、
前記相互関連度に応じてディスクへのデータ配置を行うことを特徴とするデータアクセス分析方法。 - データアクセスの履歴情報から遷移行列を生成する遷移行列生成部と、
前記遷移行列生成部から得られる前記遷移行列を用いて、遷移回数毎のエントロピー率を算出するエントロピー率算出部と、
前記エントロピー率算出部により算出された個々のエントロピー率に基づき、前記データアクセスの相互関連度を判定し、前記相互関連度に応じて局所性を解析する局所性解析部とを有することを特徴とするデータアクセス分析装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013167854A JP6142727B2 (ja) | 2013-08-12 | 2013-08-12 | データアクセス分析プログラム、データアクセス分析方法、及びデータアクセス分析装置 |
US14/176,238 US9383944B2 (en) | 2013-08-12 | 2014-02-10 | Data access analysis using entropy rate |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013167854A JP6142727B2 (ja) | 2013-08-12 | 2013-08-12 | データアクセス分析プログラム、データアクセス分析方法、及びデータアクセス分析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015036865A JP2015036865A (ja) | 2015-02-23 |
JP6142727B2 true JP6142727B2 (ja) | 2017-06-07 |
Family
ID=52449498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013167854A Active JP6142727B2 (ja) | 2013-08-12 | 2013-08-12 | データアクセス分析プログラム、データアクセス分析方法、及びデータアクセス分析装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9383944B2 (ja) |
JP (1) | JP6142727B2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9720792B2 (en) | 2012-08-28 | 2017-08-01 | Synopsys, Inc. | Information theoretic caching for dynamic problem generation in constraint solving |
US11468218B2 (en) * | 2012-08-28 | 2022-10-11 | Synopsys, Inc. | Information theoretic subgraph caching |
CN104133836B (zh) * | 2014-06-24 | 2015-09-09 | 腾讯科技(深圳)有限公司 | 一种实现变更数据检测的方法及装置 |
WO2016147279A1 (ja) * | 2015-03-13 | 2016-09-22 | 富士通株式会社 | データ管理制御プログラム、データ管理制御装置、及びデータ管理制御方法 |
WO2016157417A1 (ja) * | 2015-03-31 | 2016-10-06 | 富士通株式会社 | データ配置プログラム、データ配置装置、及びデータ配置方法 |
US10599174B2 (en) | 2015-08-05 | 2020-03-24 | Lutron Technology Company Llc | Load control system responsive to the location of an occupant and/or mobile device |
US10678578B2 (en) * | 2016-06-30 | 2020-06-09 | Microsoft Technology Licensing, Llc | Systems and methods for live migration of a virtual machine based on heat map and access pattern |
US10474588B1 (en) * | 2017-04-05 | 2019-11-12 | EMC IP Holding Company LLC | Method and system for memory-based data caching |
US20190346897A1 (en) * | 2018-05-13 | 2019-11-14 | Sean Joseph Rostami | Introspective Power Method |
JP7302178B2 (ja) | 2019-01-22 | 2023-07-04 | 富士通株式会社 | ストレージ制御装置、ストレージ制御プログラム、及び、ストレージシステム |
JP7427896B2 (ja) * | 2019-09-27 | 2024-02-06 | 日本電気株式会社 | データベースの分割システム、データベースの分割方法、及びデータベースの分割プログラム |
DE102021209321A1 (de) * | 2021-08-25 | 2023-03-02 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren zum Betreiben eines Cachespeichers, Cachespeicher und Recheneinheit |
CN113761034B (zh) * | 2021-09-15 | 2022-06-17 | 深圳信息职业技术学院 | 一种数据处理方法及其装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07319902A (ja) | 1994-05-24 | 1995-12-08 | Hitachi Ltd | 文書一覧表示方法 |
JPH0887432A (ja) * | 1994-09-16 | 1996-04-02 | Toshiba Corp | 情報記録再生装置のデータ配置方法 |
US6088718A (en) * | 1998-01-15 | 2000-07-11 | Microsoft Corporation | Methods and apparatus for using resource transition probability models for pre-fetching resources |
US6678805B1 (en) * | 2000-05-25 | 2004-01-13 | Microsoft Corporation | Structure organization for improved cache performance |
JP4412676B2 (ja) * | 2007-05-30 | 2010-02-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | メインメモリに書き込むデータをキャッシュする技術 |
US8032714B2 (en) * | 2007-09-28 | 2011-10-04 | Aggregate Knowledge Inc. | Methods and systems for caching data using behavioral event correlations |
WO2010025362A2 (en) * | 2008-08-28 | 2010-03-04 | Massachusetts Institute Of Technology | Random linear network coding for time division duplexing |
WO2012011153A1 (en) * | 2010-07-22 | 2012-01-26 | Hitachi, Ltd. | Data storage apparatus and data storage control method for the same |
JP2013114538A (ja) | 2011-11-30 | 2013-06-10 | Toshiba Corp | 情報処理装置、情報処理方法及び制御プログラム |
GB2503266A (en) * | 2012-06-21 | 2013-12-25 | Ibm | Sharing aggregated cache hit and miss data in a storage area network |
-
2013
- 2013-08-12 JP JP2013167854A patent/JP6142727B2/ja active Active
-
2014
- 2014-02-10 US US14/176,238 patent/US9383944B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150046385A1 (en) | 2015-02-12 |
US9383944B2 (en) | 2016-07-05 |
JP2015036865A (ja) | 2015-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6142727B2 (ja) | データアクセス分析プログラム、データアクセス分析方法、及びデータアクセス分析装置 | |
JP6725671B2 (ja) | 拡張されたシステム性能のための適応可能な値範囲のプロファイリング | |
US20170372230A1 (en) | Machine learning management method and machine learning management apparatus | |
US11262717B2 (en) | Optimization device and control method of optimization device based on temperature statistical information | |
JP5673152B2 (ja) | 検索装置およびプログラム | |
JP5229731B2 (ja) | 更新頻度に基づくキャッシュ機構 | |
Liu et al. | A global optimization algorithm for simulation-based problems via the extended DIRECT scheme | |
US8229968B2 (en) | Data caching for distributed execution computing | |
TWI433035B (zh) | 按比例調整指令間隔以識別用於代表性指令追蹤的收集點 | |
WO2017052539A1 (en) | Graph database query classification | |
JP2016058082A (ja) | 公開データ源を選択する方法およびシステム | |
Liao et al. | Prefetching on storage servers through mining access patterns on blocks | |
CN104424361A (zh) | 自动定义热存储和大工作负载 | |
Yang et al. | {CacheSack}: Admission Optimization for Google Datacenter Flash Caches | |
JP2017027296A (ja) | 性能評価方法、性能評価プログラム及び情報処理装置 | |
US20140310261A1 (en) | Database index profile based weights for cost computation | |
CN110162272B (zh) | 一种内存计算缓存管理方法及装置 | |
WO2013114911A1 (ja) | リスク評価システム、リスク評価方法、及びプログラム | |
Yang et al. | SGDP: A stream-graph neural network based data prefetcher | |
Yang et al. | CacheSack: Theory and experience of Google’s admission optimization for datacenter flash caches | |
Chang et al. | Sampling-based phase classification and prediction for multi-threaded program execution on multi-core architectures | |
JP6005583B2 (ja) | 検索装置、検索方法および検索プログラム | |
US20150134919A1 (en) | Information processing apparatus and data access method | |
Niu et al. | FlashWalker: An In-Storage Accelerator for Graph Random Walks | |
Qvick | Parallel construction of variable length Markov models for DNA sequences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160510 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6142727 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |