JP7468068B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP7468068B2
JP7468068B2 JP2020060909A JP2020060909A JP7468068B2 JP 7468068 B2 JP7468068 B2 JP 7468068B2 JP 2020060909 A JP2020060909 A JP 2020060909A JP 2020060909 A JP2020060909 A JP 2020060909A JP 7468068 B2 JP7468068 B2 JP 7468068B2
Authority
JP
Japan
Prior art keywords
attribute
received data
physical address
hash value
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020060909A
Other languages
English (en)
Other versions
JP2021162891A (ja
Inventor
禎秀 尾芦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2020060909A priority Critical patent/JP7468068B2/ja
Publication of JP2021162891A publication Critical patent/JP2021162891A/ja
Application granted granted Critical
Publication of JP7468068B2 publication Critical patent/JP7468068B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Memory System (AREA)

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
特許文献1には、LBA(Logical Block Addressing)の値が連続しているデータのブロックをシーケンシャルに検出してストレージに書き込む技術が開示されている。
特表2018-511112号公報
受け入れたデータのブロックのハッシュ値を、記憶手段が記憶しているデータのブロックのハッシュ値と照らし合わせて、受け入れた当該データのうち、重複するデータを排除して当該記憶手段を更新する技術が知られている。しかし、受け入れたデータのブロックが多くなると多数のハッシュ値を照らし合わせる必要があり、重複を排除した記憶手段の更新において長い処理時間を要している。
本発明の目的は、上述した課題を解決する情報処理装置、情報処理方法及びプログラムを提供することにある。
本発明に係る情報処理装置は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置において、前記受入データのブロック単位のハッシュ値を計算する計算手段と、前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録する第1記録手段と、優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと、記憶手段が記憶している記憶データとが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定する判定手段と、前記受入データが重複していないと判定された場合、前記更新を行う更新手段と、を備える
本発明に係る情報処理方法は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置において、前記受入データのブロック単位のハッシュ値を計算するステップと、前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録するステップと、優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと、記憶手段が記憶している記憶データとが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定するステップと、前記受入データが重複していないと判定された場合、前記更新を行うステップと、を有する
本発明に係るプログラムは、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置のコンピュータを、前記受入データのブロック単位のハッシュ値を計算するステップと、前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録するステップと、優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと、記憶手段が記憶している記憶データとが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定するステップと、前記受入データが重複していないと判定された場合、前記更新を行うステップと、として実行させる
上記態様のうち少なくとも1つの態様によれば、更新の可能性の高いデータに対して優先的に重複の排除を行うことにより、当該排除にかかる処理を効率良く行うことができる。
一実施形態に係る情報処理装置の構成を示す概略ブロック図である。 一実施形態に係るアドレス情報の一例を示す図である。 一実施形態に係る属性情報の一例を示す図である。 一実施形態に係る管理情報の一例を示す図である。 一実施形態に係る優先情報の一例を示す図である。 一実施形態に係るタイムスタンプの一例を示す図である。 一実施形態に係る情報処理装置の動作を示すフローチャートである。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
〈第1の実施形態〉
《情報処理装置の構成》
以下、図面を参照しながら実施形態に係る情報処理装置10ついて詳しく説明する。
図1は、第1の実施形態に係る情報処理装置10の構成を示す概略ブロック図である。
情報処理装置10は、受入データのブロックのハッシュ値を照らし合わせて、重複するデータを排除して更新を行う装置である。
情報処理装置10は、入出力部101と、記録部102と、計算部103と、判定部104と、更新部105と、記憶部106を備える。
情報処理装置10は、図示しないサーバと有線又は無線で接続する。
入出力部101は、サーバから受入データと仮想アドレスを受け入れる。また、入出力部101は更新完了を示す信号をサーバに出力する。上記受入データとは、入出力部101がサーバから受け入れるデータである。
計算部103は、入出力部101が受け入れた受入データのブロック単位のハッシュ値を計算する。計算部103は計算手段の一例である。
記録部102は、アドレス情報200と、属性情報300と、管理情報400と、優先情報500と、タイムスタンプ600を記憶部106に記録する。記録部102は第1記録手段と、第2記録手段と、第3記録手段の一例である。
アドレス情報200と、属性情報300と、管理情報400と、優先情報500と、タイムスタンプ600のそれぞれと、記録部102の動作の詳細について、以下において説明する。
図2は、アドレス情報200の一例を示す図である。アドレス情報200は、入出力部101がサーバから受け入れた仮想アドレスと記憶部106の領域を示す物理アドレスとが関連付けられた情報である。
記録部102は、更新部105により記憶部106の更新が行われた場合、当該更新が行われた記憶部106の物理アドレスと、当該更新に係る受入データのブロックに関連付けられた仮想アドレスを関連付けてアドレス情報200として記憶部106に記録する。
図3は、属性情報300の一例を示す図である。属性情報300は、記憶部106の物理アドレスと、属性が関連付けられた情報である。
記録部102は、アドレス情報200に基づいて、連続する仮想アドレスの値に関連付けられた複数の物理アドレスを特定して属性情報300を記憶部106に記録する。例えば、アドレス情報200において仮想アドレスの値は1000から1002まで連続し、2000から2002まで連続する。そのため、記録部102は、仮想アドレスの値が1000から1002までに関連付けられた物理アドレスの0010と、0020と、0030を、同一の属性である「データA」と特定して、属性情報300として記憶部106に記録する。また、記録部102は、仮想アドレスの値が2000から2002までに関連付けられた物理アドレスの0010と、0020と、0040を、同一の属性である「データB」と特定して、属性情報300として記憶部106に記録する。すなわち、属性情報300は、複数の物理アドレスの0010と、0020と、0030とが、同一の属性の「データA」であることを示す。また、属性情報300は、複数の物理アドレスの0010と、0020と、0040とが、同一の属性の「データB」であることを示す。
図4は、管理情報400の一例を示す図である。管理情報400は、物理アドレスと、当該物理アドレスの更新にかかる受入データのハッシュ値と、当該物理アドレスの属性が関連付けられた情報である。
記録部102は、属性情報300と、計算部103が計算したハッシュ値に基づいて管理情報400を記憶部106に記録する。例えば、物理アドレスの0010の領域に対して更新が行われた受入データのブロックのハッシュ値がxxxである場合、図4に示すように管理情報400が特定される。また、記録部102は、物理アドレスの0010と関連付けられた属性情報300がデータAとデータBであるため、図4に示すように管理情報を特定する。
図5は、優先情報500の一例を示す図である。優先情報500は、情報処理装置10が優先して重複判定する属性を示す情報である。
記録部102は、判定部104により、受入データと記憶データが重複していると判定された回数が閾値以上である場合、管理情報400に基づいて、当該記憶データと関連付けられた属性を優先情報として記憶部106に記録する。上記記憶データとは記憶部106が記憶しているデータである。例えば、物理アドレスの0010の領域の記憶データと、受入データとが重複している1回判定され、物理アドレスの0030の領域の記憶データと、受入データとが重複していると1回判定されたとする。また、上記閾値は2回とする。この場合、物理アドレスの0010に関連付けられた属性はデータAとデータBであり、物理アドレスの0030に関連付けられた属性はデータAである。属性のデータAに対しては2回重複していると判定され、属性のデータBに対しては1回重複していると判定される。そのため、閾値である2回以上に重複判定された属性のデータAが有線情報として記憶部106に記録される。
図6は、タイムスタンプ600の一例を示す図である。タイムスタンプ600は属性とタイムスタンプとを関連付けた情報である。タイムスタンプとは、属性に関連付けられた記憶データが最後に更新された時刻である。例えば、属性のデータAに関連付けられた記憶データが最後に更新された時刻が2020年3月10日10時である場合、図6に示すようなタイムスタンプ600になる。
記録部102は、更新部105により記憶データの更新が行われた場合、管理情報400に基づいて当該記憶データが記憶された物理アドレスに関連付けられた属性と、当該更新が行われた時刻を関連付けてタイムスタンプ600として記憶部106に記録する。
判定部104は、管理情報400と優先情報500及びタイムスタンプ600に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶データが重複しているか否かを判定する。判定部104は判定手段の一例である。判定部104の動作の一例を以下に説明する。
判定部104は、受入データのハッシュ値と管理情報400に照らし合わせて受入データの属性を特定する。判定部104は特定した属性が優先情報500に存在するか否かを判定する。優先情報500に特定した属性が存在する場合、タイムスタンプ600に基づいて存在する属性の中において最新のタイムスタンプに係る属性を特定する。判定部104は、管理情報400に基づいて、最新のタイムスタンプに係る属性に関連付けられたハッシュ値を特定する。判定部104は受入データのハッシュ値と特定されたハッシュ値とを照らし合わせて、受入データと記憶データとが重複しているか否かを判定する。その後、判定部104は、優先情報500に存在する属性の中で、最新のタイムスタンプに係る属性ではない属性に係るハッシュ値を特定する。判定部104は特定されたハッシュ値と受入データのハッシュ値を照らし合わせて、受入データと記憶データとが重複しているか否かを判定する。
特定した属性が優先情報500に存在しないと判定された場合、判定部104は受入データのハッシュ値と管理情報400における全てのハッシュ値とを照らし合わせて、受入データと記憶データとが重複しているか否かを判定する。
このように、判定部104は受入データの属性が優先情報500に存在する場合、当該属性に係るハッシュ値と、受入データのハッシュ値とを照らし合わせて受入データと記憶データの重複を判定することができる。すなわち、判定部104は管理情報400に存在する全てのハッシュ値に対して、受入データのハッシュ値を照らし合わせなくても受入データと記憶データとの重複を判定することができる。そのため、情報処理装置10は受入データと記憶データとの重複判定における情報処理を高速化することができる。
更新部105は、判定部104により受入データが重複していないと判定された場合、当該受入データに基づいて記憶部106の更新を行う。更新部105は更新手段の一例である。また、更新部105は、判定部104により受入データが重複していると判定された場合、当該受入データと重複する記憶データの物理アドレスを示す参照アドレスを記憶部106に作成する。これにより、受入データと記憶データが重複している場合、記憶部106の更新が行われなくても、サーバは上記参照アドレスを用いて記憶データを参照することができる。すなわち、情報処理装置10のユーザは、記憶部106の更新の回数を減らすことができ、記憶部106の更新寿命をより長く保つことができる。
記憶部106は、記憶データと、アドレス情報200と、属性情報300と、管理情報400と、優先情報500と、タイムスタンプ600を記憶する記憶装置である。記憶部106の例としては、SSDと、HDD(Hard Disk Drive)が挙げられる。
《情報処理装置の動作》
以下、情報処理装置10の動作について説明する。
図7は、情報処理装置10の動作を示すフローチャートである。
サーバは情報処理装置10に対して更新要求を送信する。情報処理装置10の入出力部101は、サーバからデータと仮想アドレスを受け入れる(ステップS1)。
計算部103は、受入データのブロック単位でハッシュ値を計算する(ステップS2)。
判定部104は、ステップS2で計算されたハッシュ値を管理情報400に照らし合わせて属性を特定する(ステップS3)。この場合、判定部104は受入データに属する全てのブロックに係る属性を特定する必要はなく、1つのブロックに係る属性を特定しても良い。
判定部104は、ステップS3で特定した属性を優先情報500に照らし合わせて、当該属性が優先情報500に存在するか否かを判定する(ステップS4)。
属性が優先情報500に存在する場合(ステップS4:YES)、判定部104はタイムスタンプ600に基づいてタイムスタンプの順に、タイムスタンプ係る属性のハッシュ値と、受入データのハッシュ値とを照らし合わせて重複を判定する(ステップS5)。
他方、属性が優先情報500に存在しない場合(ステップS4:NO)、判定部104は、管理情報400の全てのハッシュ値に受入データのハッシュ値を照らし合わせて、重複を判定する(ステップS6)。
ステップS5又はステップS6により、受入データと記憶データの重複が判定された後、更新部105は受入データに基づいて更新を行う。又は、更新部105は参照アドレスを作成する(ステップS7)。
このように、判定部104は受入データの属性が優先情報500に存在する場合、当該属性に係るハッシュ値と、受入データのハッシュ値とを照らし合わせて受入データと記憶データの重複を判定することができる。すなわち、判定部104は管理情報400に存在する全てのハッシュ値に対して、受入データのハッシュ値を照らし合わせなくても受入データと記憶データとの重複を判定することができる。そのため、情報処理装置10は受入データと記憶データとの重複判定における情報処理を高速化することができる。
《作用・効果》
本発明に係る情報処理装置10は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報200に基づいて、当該物理アドレスの領域の更新を行う情報処理装置10において、受入データのブロック単位のハッシュ値を計算する計算手段と、物理アドレスの属性に基づいて、物理アドレスと当該物理アドレスの属性と当該物理アドレスの更新にかかる受入データのハッシュ値を関連付けた管理情報400を記録する第1記録手段と、優先して重複判定する属性を示す優先情報500に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶手段が記憶している記憶データが重複しているか否かを判定する判定手段と、受入データが重複していないと判定された場合、更新を行う更新手段を備える。
情報処理装置10は優先情報500に基づいて記憶データと受入データとの重複を判定する。そのため、情報処理装置10は受入データと記憶データとの重複判定における情報処理を高速化することができる。
また、情報処理装置10は、アドレス情報200に基づいて、連続する仮想アドレスの値に関連付けられた複数の物理アドレスを特定して、当該複数の物理アドレスの属性が同一であることを示す属性情報300を記録する第2記録手段を備え、第1記録手段は属性情報300に基づいて管理情報400を記録する。
情報処理装置10は受入データの属性に係る入力が無くても、連続する仮想アドレスの値に関連付けられた複数の物理アドレスが同一の属性であることを特定する。そのため、情報処理装置10は当該属性に係る優先情報に基づいて、受入データと記憶データとの重複判定における情報処理を高速化することができる。
また、情報処理装置10は、受入データと記憶データが重複していると判定された場合、管理情報400に基づいて、当該記憶データと関連付けられた属性を優先情報500として記憶手段に記録する第3記録手段を備える。
情報処理装置10は受入データと記憶データが重複している回数などに基づいて優先情報500を記録する。そのため、情報処理装置10は当該属性に係る優先情報に基づいて、受入データと記憶データとの重複判定における情報処理を高速化することができる。
また、情報処理装置10の記憶手段は、SSDである。
情報処理装置10は、効率良く受入データと記憶データの重複を排除することができ、更新寿命のあるSSDを長く使用することができる。
本発明に係る情報処理方法は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報200に基づいて、当該物理アドレスの領域の更新を行う情報処理装置10において、受入データのブロック単位のハッシュ値を計算するステップと、物理アドレスの属性に基づいて、物理アドレスと当該物理アドレスの属性と当該物理アドレスの更新にかかる受入データのハッシュ値を関連付けた管理情報400を記録するステップと、優先して重複判定する属性を示す優先情報500に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶手段が記憶している記憶データが重複しているか否かを判定するステップと、受入データが重複していないと判定された場合、更新を行うステップを有する。
情報処理方法のユーザは情報処理方法を用いることにより、優先情報500に基づいて記憶データと受入データとの重複を判定できる。そのため、情報処理方法のユーザは受入データと記憶データとの重複判定における情報処理を高速化することができる。
本発明に係るプログラムは、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報200に基づいて、当該物理アドレスの領域の更新を行う情報処理装置10のコンピュータを、受入データのブロック単位のハッシュ値を計算するステップと、物理アドレスの属性に基づいて、物理アドレスと当該物理アドレスの属性と当該物理アドレスの更新にかかる受入データのハッシュ値を関連付けた管理情報400を記録するステップと、優先して重複判定する属性を示す優先情報500に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶手段が記憶している記憶データが重複しているか否かを判定するステップと、受入データが重複していないと判定された場合、更新を行うステップとして実行させる。
プログラムのユーザはプログラムを実行させることにより、優先情報500に基づいて記憶データと受入データとの重複を判定できる。そのため、プログラムのユーザは受入データと記憶データとの重複判定における情報処理を高速化することができる。
〈基本構成〉
以下、基本構成に係る情報処理装置10について説明する。
基本構成に係る情報処理装置10の構成は、第1の実施形態に係る情報処理装置10の構成と同様である。すなわち、基本構成に係る情報処理装置10は、入出力部101と、記録部102と、計算部103と、判定部104と、更新部105と、記憶部106を備える。
基本構成に係る情報処理装置10は、受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報200に基づいて、当該物理アドレスの領域の更新を行う情報処理装置10において、受入データのブロック単位のハッシュ値を計算する計算手段と、物理アドレスの属性に基づいて、物理アドレスと当該物理アドレスの属性と当該物理アドレスの更新にかかる受入データのハッシュ値を関連付けた管理情報400を記録する第1記録手段と、優先して重複判定する属性を示す優先情報500に基づいて、ハッシュ値を管理情報400に照らし合わせて、受入データと記憶手段が記憶している記憶データが重複しているか否かを判定する判定手段と、受入データが重複していないと判定された場合、更新を行う更新手段を備える。
情報処理装置10は優先情報500に基づいて記憶データと受入データとの重複を判定する。そのため、情報処理装置10は受入データと記憶データとの重複判定における情報処理を高速化することができる。
〈コンピュータ構成〉
図8は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
コンピュータ1100は、プロセッサ1110、メインメモリ1120、ストレージ1130、インタフェース1140を備える。
上述の情報処理装置10は、コンピュータ1100に実装される。そして、上述した各処理部の動作は、プログラムの形式でストレージ1130に記憶されている。プロセッサ1110は、プログラムをストレージ1130から読み出してメインメモリ1120に展開し、当該プログラムに従って上記処理を実行する。また、プロセッサ1110は、プログラムに従って、上述した各記憶部に対応する記憶領域をメインメモリ1120に確保する。
プログラムは、コンピュータ1100に発揮させる機能の一部を実現するためのものであってもよい。例えば、プログラムは、ストレージ1130に既に記憶されている他のプログラムとの組み合わせ、または他の装置に実装された他のプログラムとの組み合わせによって機能を発揮させるものであってもよい。なお、他の実施形態においては、コンピュータ1100は、上記構成に加えて、または上記構成に代えてPLD(Programmable Logic Device)などのカスタムLSI(Large Scale Integrated Circuit)を備えてもよい。PLDの例としては、PAL(Programmable Array Logic)、GAL(Generic Array Logic)、CPLD(Complex Programmable Logic Device)、FPGA(Field Programmable Gate Array)が挙げられる。この場合、プロセッサ1110によって実現される機能の一部または全部が当該集積回路によって実現されてよい。
ストレージ1130の例としては、磁気ディスク、光磁気ディスク、半導体メモリ等が挙げられる。ストレージ1130は、コンピュータ1100のバスに直接接続された内部メディアであってもよいし、インタフェース1140または通信回線を介してコンピュータに接続される外部メディアであってもよい。また、このプログラムが通信回線によってコンピュータ1100に配信される場合、配信を受けたコンピュータ1100が当該プログラムをメインメモリ1120に展開し、上記処理を実行してもよい。少なくとも1つの実施形態において、ストレージ1130は、一時的でない有形の記憶媒体である。
また、当該プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、当該プログラムは、前述した機能をストレージ1130に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
10 情報処理装置
101 入出力部
102 記録部
103 計算部
104 判定部
105 更新部
106 記憶部
200 アドレス情報
300 属性情報
400 管理情報
500 優先情報
600 タイムスタンプ
1100 コンピュータ
1110 プロセッサ
1120 メインメモリ
1130 ストレージ
1140 インタフェース

Claims (6)

  1. 受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置において、
    前記受入データのブロック単位のハッシュ値を計算する計算手段と、
    前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録する第1記録手段と、
    優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと記憶手段が記憶している記憶データが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定する判定手段と、
    前記受入データが重複していないと判定された場合、前記更新を行う更新手段と、
    を備える情報処理装置。
  2. 前記アドレス情報に基づいて、連続する前記仮想アドレスの値に関連付けられた複数の前記物理アドレスを特定して、当該複数の物理アドレスの前記属性が同一であることを示す属性情報を記録する第2記録手段を備え、
    前記第1記録手段は前記属性情報に基づいて管理情報を記録する
    請求項1に記載の情報処理装置。
  3. 前記受入データと前記記憶データが重複していると判定された場合、前記管理情報に基づいて、当該記憶データと関連付けられた前記属性を優先情報として前記記憶手段に記録する第3記録手段と、
    を備える請求項1又は請求項2に記載の情報処理装置。
  4. 前記記憶手段は、SSD(Solid State Drive)である
    請求項1から請求項3の何れか1項に記載の情報処理装置。
  5. 受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置において、
    前記受入データのブロック単位のハッシュ値を計算するステップと、
    前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録するステップと、
    優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと記憶手段が記憶している記憶データが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定するステップと、
    前記受入データが重複していないと判定された場合、前記更新を行うステップと、
    を有する情報処理方法。
  6. 受入データと当該受入データの仮想アドレスを受け入れて、当該仮想アドレスと記憶手段の物理アドレスが関連付けられたアドレス情報に基づいて、当該物理アドレスの領域の更新を行う情報処理装置のコンピュータを、
    前記受入データのブロック単位のハッシュ値を計算するステップと、
    前記物理アドレスの属性に基づいて、前記物理アドレスと当該物理アドレスの前記属性と当該物理アドレスの更新にかかる前記受入データの前記ハッシュ値を関連付けた管理情報を記録するステップと、
    優先して重複判定する前記属性を示す優先情報に基づいて、前記ハッシュ値を前記管理情報に照らし合わせて、最新のタイムスタンプに係る属性に関連付けられた前記ハッシュ値に関する前記受入データと記憶手段が記憶している記憶データが重複しているか否かを判定した後、前記最新のタイムスタンプに係る属性ではない属性に関連付けられた前記ハッシュ値に関する前記受入データと、前記記憶手段が記憶している記憶データとが重複しているか否かを判定するステップと、
    前記受入データが重複していないと判定された場合、前記更新を行うステップと、
    として実行させるプログラム。
JP2020060909A 2020-03-30 2020-03-30 情報処理装置、情報処理方法及びプログラム Active JP7468068B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020060909A JP7468068B2 (ja) 2020-03-30 2020-03-30 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020060909A JP7468068B2 (ja) 2020-03-30 2020-03-30 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2021162891A JP2021162891A (ja) 2021-10-11
JP7468068B2 true JP7468068B2 (ja) 2024-04-16

Family

ID=78003331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020060909A Active JP7468068B2 (ja) 2020-03-30 2020-03-30 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7468068B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012523023A (ja) 2009-09-18 2012-09-27 株式会社日立製作所 重複したデータを排除するストレージシステム
JP2017156959A (ja) 2016-03-01 2017-09-07 日本電気株式会社 ストレージ装置およびストレージ方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012523023A (ja) 2009-09-18 2012-09-27 株式会社日立製作所 重複したデータを排除するストレージシステム
JP2017156959A (ja) 2016-03-01 2017-09-07 日本電気株式会社 ストレージ装置およびストレージ方法

Also Published As

Publication number Publication date
JP2021162891A (ja) 2021-10-11

Similar Documents

Publication Publication Date Title
JP7329518B2 (ja) 追加専用記憶デバイスを使用するデータベース管理のためのシステム及び方法
US9645754B2 (en) Data duplication that mitigates storage requirements
JP5369807B2 (ja) ストレージ装置
JP5881859B2 (ja) ストレージ装置
JP6805816B2 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
WO2016041384A1 (zh) 重复数据删除方法和装置
KR20140117994A (ko) 복제 파일 중복 제거 방법 및 장치
JP6341307B1 (ja) 情報処理装置
US11132265B2 (en) Multi-replica data restoration method and apparatus
JP2017079053A (ja) ストレージジャーナリングを改善する方法およびシステム
JP6094267B2 (ja) ストレージシステム
WO2017143957A1 (zh) 一种数据重分布的方法及装置
KR20190043998A (ko) Ssd 내 핫 데이터 및 스트림을 식별하기 위한 시스템 및 방법
US12008263B2 (en) Garbage collection and data storage method and apparatus, and storage system
JP5464269B2 (ja) ファイルストレージ装置、データ格納方法およびデータ格納プログラム
US20160246587A1 (en) Storage control device
JP6098301B2 (ja) ストレージ制御装置、ストレージ制御方法、およびストレージ制御プログラム
WO2020077534A1 (zh) 一种磁盘管理方法、磁盘管理装置及电子设备
JP5821744B2 (ja) データ有無判定装置、データ有無判定方法及びデータ有無判定プログラム
JP6089890B2 (ja) ストレージ制御装置、ストレージ制御装置の制御方法およびストレージ制御装置の制御プログラム
CN104123102B (zh) 一种ip硬盘及其数据处理方法
JP7468068B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN106528876A (zh) 分布式系统的信息处理方法及分布式信息处理系统
CN110309149B (zh) 一种数据表处理方法、装置、电子设备及存储介质
CN107846327A (zh) 一种网管性能数据的处理方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240318

R150 Certificate of patent or registration of utility model

Ref document number: 7468068

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150