CN102782659B - 信息处理方法、以及信息处理装置 - Google Patents

信息处理方法、以及信息处理装置 Download PDF

Info

Publication number
CN102782659B
CN102782659B CN201180011527.9A CN201180011527A CN102782659B CN 102782659 B CN102782659 B CN 102782659B CN 201180011527 A CN201180011527 A CN 201180011527A CN 102782659 B CN102782659 B CN 102782659B
Authority
CN
China
Prior art keywords
catalogue
file
path
information
prime number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180011527.9A
Other languages
English (en)
Other versions
CN102782659A (zh
Inventor
福永博臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lotte Group Co.,Ltd.
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Publication of CN102782659A publication Critical patent/CN102782659A/zh
Application granted granted Critical
Publication of CN102782659B publication Critical patent/CN102782659B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

识别信息取得部(74)取得用于识别待记录或读取的记录信息的识别信息。质数取得部(75)从相同位数的质数中取得与识别信息对应的质数。运算部(76)运算使识别信息的每位的值、与从所取得的质数中减去对应于位的差分得到的差相乘而得到的乘积的总和,即关于识别信息的所有位的总和。路径决定部(77)根据总和决定表示存储记录信息的目录的路径。本发明可应用于NFS(Network File System:网络文件系统)。

Description

信息处理方法、以及信息处理装置
技术领域
本发明涉及信息处理方法、信息处理装置、程序以及记录介质。
背景技术
由基于IETF(Internet Engineering Task Force:互联网工程任务组)的RFC(Requestfor Comments:请求注解)3530规定的分布式文件系统及其协议即NFS(Network FileSystem:网络文件系统)被广泛使用。分布式文件系统是使单一的文件系统分布存在于多个计算机节点的网络文件系统,通过使用NFS能够将文件存储到分布于网络的存储装置中,并且参考该存储装置的文件。为了利用分布于网络的存储装置,需要管理文件的存储场所的方法。作为管理文件的存储场所的方法,公开有以下的文献。
在专利文献1中,记载了设置表和检索单元的方法,所述表附带完整路径地存储有包含在任意一个目录中的所有文件名,并且与文件名关联地存储各个文件在存储装置内的存储位置的信息,所述检索单元在输入文件名带完整路径时,使用带完整路径的输入文件名来检索表并检索输入文件名在存储装置内的存储位置的信息。该情况下,由用户或程序看到的输入文件名与具有分级结构的一般的文件系统完全没有变化,能够维持外在的多层结构,而且,用一个表管理包含在任意一个目录中的所有文件名,因此内在地能够设为平面的文件管理。
在专利文献2中记载了如下方法:由在存在于目录层级的目录的登记、删除和ID更新时,对管理条目的祖先关系的表进行变更的条目管理单元、进行基于属性条件的条目检索的过滤检索单元、和利用条目的祖先关系的表进行范围检索的范围判定单元构成,在目录检索时,用过滤检索单元取得满足属性条件的条目,用范围判定单元在其中进一步缩小满足范围条件的条目。
在专利文献3中记载了如下方法:在处理器内,索引生成部使用文件名和索引一对一对应的函数,根据表示读取对象文件的文件名,生成表示读取对象文件的文件管理信息的索引,索引/文件管理信息对应部从按照索引顺序排列文件管理信息的文件管理信息排列中,读出与由索引生成部生成的索引对应的文件管理信息,从而得到与由文件管理信息指定的读取对象文件相关的存储装置内的存储位置。
现有技术文献
专利文献
专利文献1:日本特开平10-74154号公报
专利文献2:日本特开2000-242538号公报
专利文献3:日本特开2004-185214号公报
发明内容
发明所要解决的课题
在专利文献1至专利文献3所述的发明中,在输入文件名带完整路径时,使用带完整路径的输入文件名检索表并检索输入文件名在存储装置内的存储位置的信息等,需要记录表和索引等并对其进行检索,需要记录容量和检索时间。
为了解决这种课题,还考虑使用作为相对于被赋予的输入而输出128位的哈希值的哈希函数MD5(Message Digest Algorithm 5:消息摘要算法5)来决定路径。但是,在MD5的运算中,需要复杂的计算,因此CPU(Central Processing Unit:中央处理器)的负荷变大,而且还花费时间。此外,MD5本来是面向电子签名开发的,为了生成4位左右的值以指定文件夹,技术要求苛刻,在其范围内,不需要严密的计算。
本发明就是鉴于这种状况而完成的,其目的在于不需要表和索引等,能够以简单的计算迅速地求出可没有偏差地进行记录的路径。
用于解决课题的手段
本发明的一个方面的信息处理方法是对记录信息的存储目的地的目录进行管理的方法,其中,该信息处理方法构成为具有:标识符取得步骤,从URL的地址信息中取得用于识别所述记录信息的标识符;数值计算步骤,根据所述标识符计算代表该标识符的多位的数值;以及决定步骤,对使用由所述数值确定的整数和所述数值的位数的数字运算出的值进一步相互进行运算,根据运算结果,决定所述记录信息的存储目的地的目录。另外,此处所说的数字除了0~9以外,还包含用字母记述的数字(例如16进制的A~F)。
此处,在所述数值计算步骤,可以使用不是完美哈希函数的哈希函数计算所述数值。此外,在所述决定步骤中,可以将使用所述数值从预先准备的整数的集合中选择出的不同的整数用于与所述数值的位数的数字的运算。此外,还可以包含生成步骤,在该生成步骤中,当不存在所述决定步骤中决定的所述目录时,生成所述目录。
本发明的一个方面的信息处理装置对记录信息的存储目的地的目录进行管理,其中,该信息处理装置构成为具有:标识符取得部,其从URL的地址信息中取得用于识别所述记录信息的标识符;数值计算部,其根据所述标识符计算代表该标识符的多位的数值;以及决定部,其对使用由所述数值确定的整数和所述数值的位数的数字运算出的值进一步相互进行运算,根据运算结果,决定所述记录信息的存储目的地的目录。
本发明的一个方面的程序对记录信息的存储目的地的目录进行管理,其中,该程序构成为使计算执行以下步骤的程序:标识符取得步骤,从URL的地址信息中取得用于识别所述记录信息的标识符;数值计算步骤,根据所述标识符计算代表该标识符的多位的数值;以及决定步骤,对使用由所述数值确定的整数和所述数值的位数的数字运算出的值进一步相互进行运算,根据运算结果,决定所述记录信息的存储目的地的目录。
本发明的一方面的计算机可读记录介质记录了对记录信息的存储目的地的目录进行管理的程序,其中,该计算机可读取记录介质构成为记录用于使计算执行以下步骤的程序:标识符取得步骤,从URL的地址信息中取得用于识别所述记录信息的标识符;数值计算步骤,根据所述标识符计算代表该标识符的多位的数值;以及决定步骤,对使用由所述数值确定的整数和所述数值的位数的数字运算出的值进一步相互进行运算,根据运算结果,决定所述记录信息的存储目的地的目录。
在本发明的一个方面中,从URL的地址信息中取得用于识别记录信息的标识符,根据标识符计算代表该标识符的多位的数值,将数值的位数的数字、和由数值确定的整数运算出的值进一步相互进行运算,根据运算结果,决定记录信息的存储目的地的目录。
发明效果
根据本发明的一个方面,能够根据URL的地址信息决定目录,因此不需要表和索引等,能够以简单的计算迅速地求出可无偏差地进行记录的路径。并且,能够根据URL唯一地求出目录,并且与代表标识符的多位的数值的偏差无关地能够分布到各目录来存储文件。
附图说明
图1是示出本发明的一个实施方式的信息提供系统的结构的例子的图。
图2是示出网络服务器11的硬件的结构例的框图。
图3是示出在执行程序的网络服务器11中实现的功能的结构的例子的框图。
图4是说明路径的例子的图。
图5是示出在服务器组13中记录为文件的数据的例子的图。
图6是说明文件的记录处理的流程图。
图7是说明路径决定的处理的详细情况的流程图。
图8是说明路径决定的处理的详细情况的流程图。
图9是说明文件读取的处理的流程图。
图10是示出计算时间和记录在目录中的文件的最大数的图。
图11是示出依据本实施方式的记录在目录中的文件数的分布的图。
图12是示出依据以往方式的记录在目录中的文件数的分布的图。
具体实施方式
以下对本发明的实施方式进行说明,但是在例示本发明的结构要件、和发明的详细说明中记载的实施方式的对应关系时,如下所示进行。该记载是用于确认在发明的详细说明中记载了支持本发明的实施方式的记载。因此,虽然记载在发明的详细说明中,但是作为与本发明的结构要件对应的实施方式,即使此处存在没有记载的实施方式,该情况也不意味该实施方式不是与该结构要件对应的实施方式。反之,即使此处实施方式记载为与结构要件对应的实施方式,该情况也不意味该实施方式不与该结构要件以外的结构要件对应。
本发明的一个方面的程序使计算机执行包含以下步骤的处理:识别信息取得步骤(例如图7的步骤S31的过程),取得用于识别待记录或读取的记录信息的识别信息;质数取得步骤(例如图7的步骤S33和步骤S34的过程),从相同位数(例如3位)的质数中取得与所述识别信息对应的质数;运算步骤(例如图7的步骤S38至步骤S42的过程),运算使所述识别信息的每位的值、与从所取得的所述质数中减去对应于所述位的差分(例如从最高位起的位数-1)得到的差相乘而得到的乘积的总和,即关于所述识别信息的所有位的总和;以及决定步骤(例如图8的步骤S43至步骤S48的过程),根据所述总和决定表示存储所述记录信息的目录的路径。
能够使计算机执行还包含生成步骤(例如图6的步骤S14的过程)的处理,在该生成步骤中,当不存在由所决定的所述路径示出的所述目录时,生成由所述路径表示的所述目录。
本发明的一个方面的信息处理装置具有:识别信息取得单元(例如图3的识别信息取得部74),其取得用于识别待记录或读取的记录信息的识别信息;质数取得单元(例如图3的质数取得部75),其从相同位数(例如3位)的质数中取得与所述识别信息对应的质数;运算单元(例如图3的运算部76),其运算使所述识别信息的每位的值、与从所取得的所述质数中减去对应于所述位的差分(例如从最高位起的位数-1)得到的差相乘而得到的乘积的总和,即关于所述识别信息的所有位的总和;以及决定单元(例如图3的路径决定部77),其根据所述总和决定表示存储所述记录信息的目录的路径。
本发明的一个方面的信息处理方法包含:识别信息取得步骤(例如图7的步骤S31的过程),取得用于识别待记录或读取的记录信息的识别信息;质数取得步骤(例如图7的步骤S33和步骤S34的过程),从相同位数(例如3位)的质数中,取得与所述识别信息对应的质数;运算步骤(例如图7的步骤S38至步骤S42的过程),运算使所述识别信息的每位的值、与从所取得的所述质数中减去对应于所述位的差分(例如从最高位起的位数-1)得到的差相乘而得到的乘积的总和,即关于所述识别信息的所有位的总和;以及决定步骤(例如图8的步骤S43至步骤S48的过程),根据所述总和决定表示存储所述记录信息的目录的路径。
图1是示出本发明的一个实施方式的信息提供系统的结构的例子的图。信息提供系统由网络服务器11、网络12和服务器组13构成,其经由互联网21,分别向客户机22-1~22-3提供网页的数据。
网络服务器11响应于来自客户机22-1~22-3的请求,经由互联网21向进行了请求的对方发送网页的数据。例如,网络服务器11经由互联网21,向客户机22-1~22-3发送出售商品等的电子商务交易的网页的数据。
此时,网络服务器11从提供一个记录区域的服务器组13,经由网络12,读取记录为文件的各种数据。此外,网络服务器11经由网络12使服务器组13将各种数据记录作为文件。
网络服务器11在使服务器组13记录文件的情况下、或者从服务器组13读取文件的情况下,决定表示存储该文件的目录的路径。网络12是所谓的内部网络,由10吉比特以太网(注册商标)等、频带大的网络构成。网络12使网络服务器11和服务器组13相互连接。
服务器组13由NFS服务器14-1~NFS服务器14-N(N为正整数)构成。NFS服务器14-1~NFS服务器14-N各自的存储器的区域构成为被安装成一个记录区域,能够作为一个记录区域记录或读取。即,网络服务器11能够与自己的存储器的记录区域同样地虚拟地处理由NFS服务器14-1~NFS服务器14-N构成的服务器组13的记录区域。
图2是示出网络服务器11的硬件的结构例的框图。
在网络服务器11中,CPU(Central Processing Unit:中央处理器)31、ROM(ReadOnly Memory:只读存储器)32和RAM(Random Access Memory:随机存取存储器)33通过总线34相互连接。
在总线34上,还连接有输入输出接口35。在输入输出接口35上,连接有由键盘、鼠标、麦克风等构成的输入部36,由显示器、扬声器等构成的输出部37,由硬盘或非易失性的存储器等构成的存储部38,由网络接口等构成的通信部39,驱动磁盘、光盘、磁光盘或者半导体存储器等可除移介质41的驱动器40。
在如上那样构成的网络服务器11(计算机)中,CPU 31例如经由输入输出接口35和总线34将存储在存储部38中的程序加载到RAM 33中并执行,进行后述的一系列的处理。
网络服务器11(CPU 31)执行的程序例如记录在由磁盘(包含软盘)、光盘(CD-ROM(Compact Disc-Read Only Memory:只读式光盘)、DVD(Digital VersatileDisc:数字多功能光盘)等)、磁光盘或半导体存储器等构成的作为封装介质的可除移介质41中,或者经由局域网、互联网21、网络12、数字卫星广播这样的有线或无线的传送介质而被提供。
并且,能够通过将可除移介质41安装到驱动器40,经由输入输出接口35将程序存储到存储部38中,由此将程序安装到计算机。还能够由通信部39经由有线或无线的传送介质接收程序,并将程序存储到存储部38中,由此将程序安装到计算机。另外,能够通过将程序预先存储到ROM 32或存储部38中,将程序预先安装到计算机。
图3是示出在执行程序的网络服务器11中实现的功能的结构例的框图。即,在网络服务器11执行程序时,实现网络服务器功能51、页面数据生成部52、页面设定部53和文件读写控制部54。
网络服务器功能51例如通过执行Apache HTTP Server等所谓的网络服务器程序来实现,根据由HTTP(Hypertext Transfer Protocol:超文本传输协议)规定的步骤,提供包含文本或图像等的各种对象的HTML(HyperText Markup Language:超文本标记语言)方式或XML(Extensible Markup Language:可扩展标记语言)方式等的网页的数据。
页面数据生成部52生成由网络服务器功能51提供的网页的数据。页面设定部53设定配置在分别提供到客户机22-1~22-3的网页中的文本或图像等的各种数据。
文件读写控制部54响应于来自页面设定部53的请求,经由网页12将配置在网页中的图像或文本等的各种数据作为文件记录到服务器组13中。此外,在分别向客户机22-1~22-3提供网页的情况下,文件读写控制部54响应于来自页面数据生成部52的请求,经由网络12从服务器组13读取配置在网页中的图像或文本等的各种数据。
文件读写控制部54在经由网络12使服务器组13记录文件,或者从服务器组13读取文件的情况下,决定表示记录有文件的目录和文件名的路径。路径示出的目录是用分级的树形结构表述服务器组13的记录区域的记录单位。在各个目录中存储有1个或多个文件。
图4是说明将与电子商务交易的网页中登载的商品相关的数据记录为文件的情况下的路径的例子的图。按照出售商品的网页的URL(Uniform Resource Locator:统一资源定位符)方式的每个地址(图中的#{shop_url}),将与该网页登载的商品(图4中的item)相关的商品信息(图4中的#{manage_numberl}_item.xml)和表示该商品有无库存的库存信息(图4中的#{manage_numberl}_inv.xml)存储到预定的目录中。此时,根据商品的商品管理编号#{manage_numberl},求出路径初始值M作为用于识别商品信息和库存信息的识别信息(标识符),该路径初始值M用于表示用作存储商品信息和库存信息的目录。此外,也可以根据URL方式的地址信息所包含的商品管理编号求出用于表示用作存储商品信息和库存信息的目录的路径初始值M。
假如在该路径初始值M是5D79……的情况下,根据路径决定值M的高4位5D79决定路径。即,决定5D即上级的目录,并决定5D即上级的目录下方的79即下级的目录,作为存储商品信息和库存信息的目录,商品信息和库存信息被存储到5D即上级的目录下方的79即下级的目录中。该情况下,文件读写控制部54决定表示5D即上级的目录、和79即下级的目录的路径。另外,该情况下,布局信息另外记录。此外,虽然说明了使用路径初始值M的高4位来决定路径的例子,但是也可以使用多于4位的位数来决定路径。
图5是示出作为文件记录在服务器组13中的、与电子商务交易的网页中登载的商品相关的数据的例子的图。例如,在电子商务交易的网页中,在配置有商品说明书、商品的图像、商品的动态图像、商品名称、商品信息、形式以及出售方法独立说明书的情况下,通过商品说明部分(商品说明数据)、和在服务器组13中记录为文件F的商品信息(图5中的商品信息XML(图4中的#{manage_numberl}_item.xml))生成网页的商品说明书的数据,并且通过商品信息部分(商品信息数据)、和在服务器组13中记录为文件F的商品信息(图5中的商品信息XML)和库存信息(图5中的库存信息XML(图4中的#{manage_numberl}_inv.xml))生成网页的商品信息的数据。
另外,同样使用在服务器组13中记录为文件的商品信息(商品信息XML),生成网页的商品的图像、商品的动态图像、商品名称、形式以及出售方法独立说明书的数据。并且,使用在服务器组13中记录为文件的商品信息(商品信息XML),生成网页的导航和脚注(未图示)的数据。
返回图3,文件读写控制部54包含记录控制部71、目录生成部72、读取控制部73、识别信息取得部74(标识符取得部)、质数取得部75、运算部76(数值计算部)、路径决定部77(决定部)和质数表存储部78。记录控制部71基于分布式文件系统的协议,控制借助网络12向服务器组13的作为文件的各种数据的记录。目录生成部72在服务器组13的记录区域中,不存在要记录文件的目录的情况下,生成目录。
读取控制部73基于分布式文件系统的协议,控制借助网络12的从服务器组13的文件的读取。识别信息取得部74取得用于识别记录或读取为文件的数据(记录信息)的识别信息。具体而言,例如在记录或读取与电子商务交易的网页中登载的商品相关的数据作为文件的情况下,识别信息被设为用于确定商品的商品管理编号。
质数取得部75从存储在质数表存储部78中的相同位数的质数中,取得与所取得的识别信息对应的质数。运算部76运算使识别信息的每位的值、和从所取得的质数减去对应于位的差分得到的差相乘而得到的乘积的总和,即关于识别信息的所有位的总和。运算部76中的总和运算的详细情况将后述。
路径决定部77根据在运算部76中运算出的总和,决定表示存储有作为文件的数据(记录信息)的目录的路径。质数表存储部78存储配置有相同位数的质数的质数表。具体而言,例如质数表存储部78存储配置有从101到997的100个质数(3位的质数)的质数表。配置在质数表中的质数按照大小的顺序排列或随机排列。另外,质数的位数不限于3,可以是2、4、5、6等中的任意一个。并且,质数被设为排列,或者还可以利用指针(pointer)进行配置。
接着,参照图6至图9说明基于网络服务器11的文件记录和文件读取的处理。
首先,说明文件的记录处理。例如,在页面设定部53向文件读写控制部54请求经由网页12将配置在网页中的商品信息作为文件记录到服务器组13中的情况下,进行文件的记录处理。
图6是说明文件的记录处理的流程图。在从页面设定部53请求将配置在网页中的数据文件记录到服务器组13时,该文件由页面设定部53提供,因此在步骤S11中,文件读写控制部54取得该待记录的文件。在步骤S12中,文件读写控制部54进行路径的决定处理。路径的决定处理的详细情况将参照图7和图8的流程图后述。
在步骤S13中,文件读写控制部54的记录控制部71判定由所决定的路径示出的目录是否处于服务器组13中。在步骤S13中,在判定为由所决定的路径示出的目录不处于服务器组13中的情况下,过程进入到步骤S14,目录生成部72基于分布式文件系统的协议,经由网络12向服务器组13指示由所决定的路径示出的目录的生成,由此在服务器组13中生成目录。在步骤S14后,过程进入到步骤S15。
在步骤S13中,在判定为由所决定的路径示出的目录处于服务器组13中的情况下,不需要生成目录,因此跳过步骤S14的过程,过程进入到步骤S15。
在步骤S15中,记录控制部71将文件记录到由所决定的路径示出的服务器组13的目录中,并结束文件的记录处理。
接着,参照图7和图8的流程图,对步骤S12的路径的决定处理的详细情况进行说明。在步骤S31中,识别信息取得部74取得作为识别信息的一例的商品管理编号。商品管理编号是用于确定被文件记录的商品信息所表示的商品的编号。例如在步骤S31中,识别信息取得部74通过从由页面设定部53提供的文件中进行提取,取得ABC-001即商品管理编号。此外,例如在步骤S31中,识别信息取得部74取得由页面设定部53作为文件名提供的ABC-001即商品管理编号。此外,例如在步骤S31中,识别信息取得部74通过从由页面设定部53提供的URL方式的地址中进行提取,取得ABC-001即商品管理编号。另外,识别信息取得部74还可以从存储与商品相关的数据的商品数据库(未图示)等的网络服务器11的内部或外部数据库中取得商品管理编号等识别信息。
在步骤S32中,运算部76对所取得的商品管理编号应用简单的哈希函数。另外,运算部76不仅可以使用简单的哈希函数,还可以使用根据原数据(标识符)生成代表该原数据的数值(例如多位的整数)的函数。此处,简单的哈希函数是指不是单射即相对于正的输入而输出不同的哈希值的完美哈希函数。具体而言,例如在步骤S32中,运算部76对商品管理编号应用在作为编程语言的C++的库中标准包含的哈希函数。更具体而言,例如在步骤S32中,运算部76对ABC-001即商品管理编号应用简单的哈希函数,取得489014746即哈希值。
在步骤S33中,质数取得部75用在步骤S32的过程中得到的哈希值除以133,得到其余数。这里哈希值除以的除数(约数)被设为143以下、且足够大的数(例如100以上)。143是101到997的100位质数(3位的质数)中的数。
例如在步骤S33中,质数取得部75用哈希值489014746除以133,得到余数80。
在步骤S34中,质数取得部75从预先存储在质数表存储部78中的、配置有100个质数的质数表中取得由余数示出位置的质数a。具体而言,例如质数取得部75在余数为80的情况下,从质数表存储部78中取得在质数表存储部78中配置在第80个质数631作为质数a。
在步骤S35中,运算部76将在步骤S32的过程中得到的哈希值转换为16进制。例如在步骤S35中,运算部76将哈希值489014746转换为16进制数1d25c5da。通过这样地转换为16进制,能够抑制位数地进行后述的运算。
在步骤S36中,运算部76将0设定为作为用于指示位的变量的位指示变量n的初始值。在步骤S37中,运算部76将在步骤S34的过程中得到的质数a设定为路径初始值M。路径初始值M是根据质数a和商品管理编号计算的用于决定路径的值。例如在步骤S37中,运算部76将631即质数a设定为路径初始值M。
在步骤S38中,运算部76提取从用16进制表示的哈希值的最高位起的第(n+1)位的值b。例如在最初执行的步骤S38中,位指示变量n为0,因此运算部76提取作为用16进制表示的哈希值的最高位的位的1的值b。此外,例如在通过反复而第3次执行的步骤S38中,位指示变量n为2,因此运算部76提取从作为用16进制表示的哈希值的最高位起的第3位的2的值b。
在步骤S39中,运算部76将在步骤S38的过程中提取出的值b转换为10进制。在步骤S40中,运算部76从质数a中减去位指示变量n,并将作为其结果得到的差乘以10进制的值b。运算部76将作为乘法运算结果得到的乘积与路径初始值M相加。换言之,在步骤S40中,运算部76计算值b×(质数a-位指示变量n),并将其结果与路径初始值M相加。该情况下,对应于位的差分是位指示变量n,但可以使用作为任意的整数(例如-3、-2、-1、2、3等中的任意一个)的常数k,设为值b×(质数a-位指示变量n×常数k)。
在步骤S41中,运算部76使位指示变量n增加1。在步骤S42中,运算部判定是否已提取出了用16进制表示的哈希值的最低位的位,在判定为没有提取出最低位的位的情况下,由于还存在应提取的位,因此过程返回步骤S38,针对下一位,重复上述处理。
即,通过在步骤S38至S40中重复过程,逐位地将商品管理编号与质数a相乘,此时,将质数a逐个减去1,从而求出其总和。
例如,在质数a为631、16进制的哈希值为1d25c5da的情况下,在步骤S37的过程中,路径初始值M被设为631,在最初执行的步骤S38至S40的过程中,使用质数a和作为16进制的哈希值最高位的位的1的值b,根据1×631求出631,并将631与路径初始值M相加。然后,在接下来执行的步骤S38至S40的过程中,使用质数a和从16进制的哈希值的最高位起的第2位的d、即用10进制表示时为13的值b,根据13×(631-1)求出8190,并将8190与路径初始值M相加。
同样,通过重复步骤S38至S40的过程,使用质数a和作为从16进制的哈希值的最高位起的第3位的2的值b,根据2×(631-2)求出1258,并将1258与路径初始值M相加,使用质数a和作为从16进制的哈希值的最高位起的第4位的5的值b,根据5×(631-3)求出3140,并将3140与路径初始值M相加,使用质数a和从16进制的哈希值的最高位起的第5位的c、即用10进制表示时为12的值b,根据12×(631-4)求出7524,并将7524与路径初始值M相加。并且,通过重复步骤S38至S40的过程,使用质数a和作为从16进制的哈希值的最高位起的第6位的5的值b,根据5×(631-5)求出3130,并将3130与路径初始值M相加,使用质数a和从16进制的哈希值的最高位起的第7位的d、即用10进制表示时为13的值b,根据13×(631-6)求出8125,并将8125与路径初始值M相加,使用质数a和从16进制的哈希值的最低位的a、即用10进制表示时为10的值b,根据10×(631-7)求出6240,并将6240与路径初始值M相加。
通过以上的运算求出38869即路径初始值M。
在步骤S42中判定为提取出了最低位的位的情况下,由于不存在应提取的位,因此过程进入到步骤S43,路径决定部77判定路径初始值M是否为4096以下。在步骤S43中,在判定为路径初始值M为4096以下的情况下,过程进入到步骤S44,路径决定部77将路径初始值M乘以50。此处,在路径初始值M为4096以下的情况下,将路径初始值M乘以50是为了在转换为16进制时将路径初始值M设为4位以上。在步骤S44后,过程进入到步骤S45。
在步骤S43中,在判定为路径初始值M不为4096以下、即路径初始值M超过了4096的情况下,跳过步骤S44的过程,过程进入到步骤S45。
在步骤S45中,路径决定部77将路径初始值M转换为16进制数。例如在步骤S45中,路径决定部77将作为38869的路径初始值M转换为作为16进制的97D5的路径初始值M。另外,能够通过使用16进制的路径,处理比同一位数的10进制大的值,因此与使用10进制的路径的情况相比能够使文件的存储目的地的目录分散。
在步骤S46中,路径决定部77将16进制的路径初始值M反转,以交替高位侧的位和低位侧的位。例如在步骤S46中,路径决定部77通过将reverse函数应用到路径初始值M,倒转排列路径初始值M。具体而言,例如在步骤S46中,路径决定部77将作为97D5的路径初始值M反转,成为5D79。
在步骤S47中,路径决定部77从反转后的路径初始值M中提取高位4位。在步骤S48中,路径决定部77设提取出的4位中的高位2位表示上级的目录,低位2位表示下级的目录,设商品管理编号为文件名,决定路径,并结束路径的决定处理。
例如在步骤S48中,路径决定部77设作为5D79的路径初始值M中的高位2位的5D表示上级的目录,低位2位的79表示下级的目录,设商品管理编号为文件名,将/5D/79/商品管理编号决定为路径。
由此,能够以简单的计算迅速地求出可没有偏差地进行记录的路径。此外,能够避免路径复杂且不清楚可以将文件存储在哪个文件夹中的状况,并且之后的数据移交等维护变得容易。
接着,说明文件的读取。例如,在分别从客户机22-1~22-3请求了网页的情况下,生成该网页的数据的页面数据生成部52在向文件读写控制部54请求借助网络12的从服务器组13的文件的读取时,进行文件的读取处理。
图9是说明文件的读取处理的流程图。在从页面数据生成部52请求借助网络12的从服务器组13的文件的读取时,从页面数据生成部52提供URL方式的地址和表示与其对应的文件名的商品管理编号等,因此在步骤S71中,文件读写控制部54取得待读取的文件的文件名。例如,文件读写控制部54可以从网页的URL方式的地址所包含的文字信息中取得文件名(商品管理编号)。在步骤S72中,文件读写控制部54进行路径的决定处理。步骤S72中的路径决定的处理与步骤S12的处理相同,因此省略其说明。
在步骤S73中,文件读写控制部54的读取控制部73从由所决定的路径示出的服务器组13的目录中读取文件,结束文件的读取处理。
由此,在文件的读取中,不需要表和索引等。此外,在用户终端等上显示网页时,能够在所显示的URL中不显示保存有商品信息等的层级的情况下,将数据简单地保存到由分级结构构成的文件夹。此外,不需要将路径细致地记载到URL,因此能够缩短待显示的URL。并且,通过缩短URL,显示/识别/处理变得容易。
即,能够在URL自身不具有层级的状态下,使用URL实现多个层级。例如,在图4所示的URL方式的地址中,根据本实施方式的信息处理方法,仅显示为(http://○○○.△△.co.jp/SHOP_URL/ITEM_URL/)即可,不需要生成(http://○○○.△△.co.jp/SHOP_URL/▽▽/××/ITEM_URL/)中的“/▽▽/××/”。如果是以往的方法,则需要生成“/▽▽/××/”,用数据库等的管理文件进行关联管理。并且,在参照时,也需要按照URL取得、APP处理、管理文件参照、询问、目录确定、文件参照的顺序进行处理。与此相对,如果是本实施方式的方法,则用URL取得、APP处理、目录确定、文件参照这样的处理,且仅根据URL的地址信息进行就能够到达文件。
此处,参照图10至图12,说明使用了MD5的以往方式、和本实施方式示出的方式的比较结果。
图10是示出路径决定所需的计算时间和记录在1个目录中的文件的最大数的图。此处示出的计算时间是进行了5次计算后的计算时间的平均值。
首先,在对根据用连字符联结3位字母数字(alphanumeric character)和7位数值而成的300万个商品管理编号决定路径的情况进行比较时,在本实施方式所示的方式中,需要15,025ms的计算时间,记录在1个目录中的文件的最大数为78个,与此相对,在使用了MD5的以往方式中,需要39,669ms的计算时间,记录在1个目录中的文件的最大数为83个。此外,在对根据用连字符联结3位字母数字和7位数值而成的200万个商品管理编号决定路径的情况进行比较时,在本实施方式所示的方式中,需要9,809ms的计算时间,记录在1个目录中的文件的最大数为61个,与此相对,在使用了MD5的以往方式中,需要26,542ms的计算时间,记录在1个目录中的文件的最大数为54个。
而且,在对根据用连字符联结3位字母数字和7位数值而成的100万个商品管理编号决定路径的情况进行比较时,在本实施方式所示的方式中,需要5,082ms的计算时间,记录在1个目录中的文件的最大数为37个,与此相对,在使用了MD5的以往的方式中,需要13,733ms的计算时间,记录在1个目录中的文件的最大数为34个。
进而,在对根据电影关联的24,946万个商品管理编号决定路径的情况进行比较时,在本实施方式所示的方式中,需要106ms的计算时间,记录在1个目录中的文件的最大数为5个,与此相对,在使用了MD5的以往方式中,需要407ms的计算时间,记录在1个目录中的文件的最大数为5个。此外,在对将1,565,419册的书籍的ISBN(International Standard Book Number:国际标准书号)作为商品管理编号决定路径的情况进行比较时,在本实施方式所示的方式中,需要7,575ms的计算时间,记录在1个目录中的文件的最大数为48个,与此相对,在使用了MD5的以往的方式中,需要19,601ms的计算时间,记录在1个目录中的文件的最大数为49个。
在该比较中,本实施方式所示的方式中的1件的处理时间为0.005ms,与此相对,使用了MD5的以往方式中的1件的处理时间为0.013ms。
另外,在对根据改变了1到3,000,000的位数的商品管理编号来决定路径的情况进行比较时,在本实施方式所示的方式中,记录在1个目录中的文件的最大数为83个,与此相对,在使用了MD5的以往的方式中,记录在1个目录中的文件的最大数为75个。另外,在对根据将0000001到3,000,000的位数设为相同的商品管理编号决定路径的情况进行比较时,在本实施方式所示的方式中,记录在1个目录中的文件的最大数为86个,与此相对,在使用了MD5的以往的方式中,记录在1个目录中的文件的最大数为76个。
由此可知,根据本实施方式所示的方式,相比于使用了MD5的以往的方式,能够迅速地求出路径。此外,可知按照每位而不同的数字(质数a-位指示变量n)优选至少为3位以上,在根据路径至少为4位以上的数值生成目录时能够得到良好的效果。
图11是示出在根据用连字符联结3位字母数字和7位数值而成的300万个随机的商品管理编号,利用本实施方式所示的方式决定路径的情况下,记录在目录中的文件的数量分布的图。如参照图10所说明那样,计算时间为15,025ms,记录在1个目录中的文件的最大数为78个。
如图11所示,记录45个文件的目录的数量大约为3700,最多记录在1个目录中的文件数量与存储该数量的文件的目录的数量之间的关系成为接近正态分布的分布。
图12是示出在根据用连字符联结3位字母数字和7位数值而成的300万个随机的商品管理编号,利用使用了MD5的以往的方式决定路径的情况下,记录在目录中的文件的数量分布的图。如参照图10所说明地那样,计算时间为39,669ms,记录在1个目录中的文件的最大数为83个。
如图11所示,记录44个、45个或47个文件的目录的数量大约为3800,最多记录在1个目录中的文件数量与存储该数量的文件的目录数量之间的关系成为接近正态分布的分布。
由此可知,根据本实施方式所示的方式,与使用了MD5的以往的方式同样,能够相对于目录求出可无偏差地记录文件的路径。此外,可知按照每位而不同的数字(质数a-位指示变量n)优选至少为3位以上,在根据路径至少为4位以上的数值生成目录时能够得到良好的效果。
另外,以上对读写存储了与电子商务交易的网页中登载的商品相关的数据的文件的例子进行了说明,但是待读写的数据不限于此,不限定数据的种类,可以是图像、声音、文本和数值等的任意一种数据。该情况下,关于识别信息,只要能够识别数据(记录信息)即可,可以设为文件名、数据名、记录日期时刻、确定数字照相机等设备的设备ID(Identification)、Mac地址(Media Access Control address:介质访问控制地址)、确定用户的用户ID、表示所记录的场所的纬度经度,以及对这些信息进行了组合的信息。
另外,以上生成了示出2个层级的目录的路径,但是路径不限于2个层级,可以设为1个层级或3个层级以上。
由此,根据本实施方式所示的方式,能够以简单的计算迅速地求出可无偏差地进行记录的路径。
如上所述,在取得用于识别待记录或读取的记录信息的识别信息,从相同位数的质数中,取得与识别信息对应的质数,运算使识别信息的每位的值、和从所取得的质数减去对应于位的差分得到的差相乘而得到的乘积的总和,即关于识别信息的所有位的总和,并根据总和决定表示存储有记录信息的目录的路径的情况下,不需要表和索引等,能够迅速地求出可无偏差地进行记录的路径。即,能够基于通过简单的哈希法求出的哈希值,运算该哈希值的位数的数字、和根据整数的集合使用哈希值选择出的不同的整数,并根据对该运算结果相互进行运算处理而求出的值决定目录。并且,能够根据URL唯一地求出目录,并且不论哈希值的偏差如何都能够分布到各目录来存储文件。
关于上述一系列处理,既可以通过硬件执行,也可以通过软件执行。
另外,计算机所执行的程序既可以是按照本说明书所述的顺序以时间序列执行处理的程序,也可以是并行或者在进行了调用时等必要的时机进行处理的程序。
此外,本发明的实施方式不限于上述实施方式,可以在不脱离本发明主旨的范围内进行各种变更。
例如,在上述实施方式的步骤S34中,从质数表(集合)中取得了质数a,但也可以用其他方法取得。例如,可以从不连续且整数的集合中取得,也可以从预先设定的表中取得。
此外,在上述实施方式的步骤S44中,说明了在转换为16进制时为了使路径初始值M为4位以上路径决定部77将路径初始值M乘以50的例子,但也可以根据需要进行省略。
此外,在上述实施方式的步骤S39中,说明了按照每位计算值b×(质数a-位指示变量n)并相加的例子,但是与值b相乘的值只要是按照每位而不同的整数则可以是任何值,可以如上所述那样不仅从质数a中减去位指示变量n还进行相加,也可以不根据质数a求出。例如,可以使用随机数求出不同的整数。此外,对按照每位乘以值b不同的整数的例子进行了说明,但是也可以相加/相减/相除。
标号说明
11:网络服务器;12:网络;13:服务器组;14-1~14-N:NFS服务器;31:CPU;32:ROM;33:RAM;38:存储部;39:通信部;41:可除移介质;51:网络服务器功能;52:页面数据生成部;53:页面设定部;54:文件读写控制部;71:记录控制部;72:目录生成部;73:读取控制部;74:识别信息取得部;75:质数取得部;76:运算部;77:路径决定部;78:质数表存储部。

Claims (5)

1.一种信息处理方法,其是对记录信息的存储目的地的目录进行管理的方法,其中,该信息处理方法具有:
标识符取得步骤,从URL的地址信息中取得用于识别所述记录信息的标识符;
数值计算步骤,根据所述标识符计算代表该标识符的多位的数值;以及
决定步骤,取得使用由所述数值确定的整数、和构成所述数值中的多个位的多个数字分别运算出的多个值,并对所取得的该多个值进一步相互进行运算,根据运算结果,决定所述记录信息的存储目的地的目录。
2.根据权利要求1所述的信息处理方法,其中,
在所述数值计算步骤中,使用不是完美哈希函数的哈希函数计算所述数值。
3.根据权利要求1所述的信息处理方法,其中,
在决定步骤中,将使用所述数值从预先准备的整数的集合中选择出的不同的整数用于与所述数值的位数的数字之间的运算。
4.根据权利要求1~3中的任意一项所述的信息处理方法,其中,
该信息处理方法还包含生成步骤,在该生成步骤中,当不存在所述决定步骤中决定的所述目录时,生成所述目录。
5.一种信息处理装置,其对记录信息的存储目的地的目录进行管理,其中,该信息处理装置具有:
标识符取得部,其从URL的地址信息中取得用于识别所述记录信息的标识符;
数值计算部,其根据所述标识符计算代表该标识符的多位的数值;以及
决定部,其取得使用由所述数值确定的整数、和构成所述数值中的多个位的多个数字分别运算出的多个值,并对所取得的该多个值进一步相互进行运算,根据运算结果,决定所述记录信息的存储目的地的目录。
CN201180011527.9A 2010-03-11 2011-03-11 信息处理方法、以及信息处理装置 Active CN102782659B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010-055159 2010-03-11
JP2010055159 2010-03-11
PCT/JP2011/055832 WO2011111837A1 (ja) 2010-03-11 2011-03-11 情報処理方法、情報処理装置、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
CN102782659A CN102782659A (zh) 2012-11-14
CN102782659B true CN102782659B (zh) 2015-09-30

Family

ID=44563634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180011527.9A Active CN102782659B (zh) 2010-03-11 2011-03-11 信息处理方法、以及信息处理装置

Country Status (6)

Country Link
US (1) US8812568B2 (zh)
EP (1) EP2546750B1 (zh)
JP (1) JP5129409B2 (zh)
CN (1) CN102782659B (zh)
ES (1) ES2703767T3 (zh)
WO (1) WO2011111837A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8767954B2 (en) * 2011-12-01 2014-07-01 Colloid, Llc Methods and systems for deriving a cryptographic framework
JP2013171493A (ja) * 2012-02-22 2013-09-02 Sony Corp 情報処理装置及び方法、並びにプログラム
CN104239376B (zh) * 2013-11-07 2018-02-02 大唐网络有限公司 数据存储方法和装置
CN111414337B (zh) * 2019-01-08 2023-05-26 阿里巴巴集团控股有限公司 一种文件读取方法、装置、计算设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1366767A (zh) * 2000-04-18 2002-08-28 松下电器产业株式会社 存储媒体、数据采集装置、数据保持装置、数据采集方法和数据保持方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6202136B1 (en) * 1994-12-15 2001-03-13 Bmc Software, Inc. Method of creating an internally consistent copy of an actively updated data set without specialized caching hardware
JPH1074154A (ja) 1996-08-30 1998-03-17 Digital Vision Lab:Kk ファイル管理装置
JP2000242538A (ja) 1999-02-22 2000-09-08 Nec Corp ディレクトリ検索システム、ディレクトリ検索方法およびディレクトリ検索用プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000357115A (ja) 1999-06-15 2000-12-26 Nec Corp ファイル検索装置及びファイル検索方法
JP2004185214A (ja) 2002-12-02 2004-07-02 Renesas Technology Corp ファイル管理装置
JP4141239B2 (ja) * 2002-12-06 2008-08-27 三洋電機株式会社 撮影初期化方法とこの方法に利用可能な撮像装置および画像サーバ
US7412449B2 (en) * 2003-05-23 2008-08-12 Sap Aktiengesellschaft File object storage and retrieval using hashing techniques
JP4315876B2 (ja) * 2004-08-17 2009-08-19 富士通株式会社 ファイル管理プログラム、ファイル管理方法、及びファイル管理装置
US20070112784A1 (en) * 2004-11-17 2007-05-17 Steven Blumenau Systems and Methods for Simplified Information Archival
JP2007004604A (ja) * 2005-06-24 2007-01-11 Nippon Telegr & Teleph Corp <Ntt> ファイル所在管理方法、端末、およびファイル所在管理サーバ
US7840540B2 (en) * 2006-04-20 2010-11-23 Datascout, Inc. Surrogate hashing
US7809685B2 (en) * 2006-04-21 2010-10-05 Ricoh Co., Ltd. Secure and efficient methods for logging and synchronizing data exchanges
JP2008210318A (ja) * 2007-02-28 2008-09-11 Keytel:Kk 電子ファイル受渡システム、プログラム及び計算機システム
TWI476610B (zh) * 2008-04-29 2015-03-11 Maxiscale Inc 同級間冗餘檔案伺服器系統及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1366767A (zh) * 2000-04-18 2002-08-28 松下电器产业株式会社 存储媒体、数据采集装置、数据保持装置、数据采集方法和数据保持方法

Also Published As

Publication number Publication date
EP2546750A4 (en) 2015-01-07
EP2546750A1 (en) 2013-01-16
US8812568B2 (en) 2014-08-19
EP2546750B1 (en) 2018-11-28
US20130041928A1 (en) 2013-02-14
ES2703767T3 (es) 2019-03-12
WO2011111837A1 (ja) 2011-09-15
JPWO2011111837A1 (ja) 2013-06-27
CN102782659A (zh) 2012-11-14
JP5129409B2 (ja) 2013-01-30

Similar Documents

Publication Publication Date Title
CN106126630B (zh) 一种业务对象的收藏、搜索方法和装置
TWI712907B (zh) 一種透過文件獲取對網頁進行區塊鏈存證的方法及裝置
TWI705342B (zh) 一種透過網頁監測對網頁進行區塊鏈存證的方法及裝置
US7921097B1 (en) Systems and methods for generating a descriptive uniform resource locator (URL)
US20140108127A1 (en) Method and System for Processing Published Content on the Internet
CN102782659B (zh) 信息处理方法、以及信息处理装置
US9672558B2 (en) Table-form presentation of hierarchical data
US20050172217A1 (en) System and method for schemaless data mapping with nested tables
US20130185429A1 (en) Processing Store Visiting Data
US10169757B1 (en) Scalable data storage and retrieval
KR20030045668A (ko) 전자 카탈로그
JP5676522B2 (ja) 文字列変換方法及びプログラム
CN111352960B (zh) 快件订单信息查询方法、装置、设备及存储介质
JP6751960B1 (ja) 情報処理システムおよび情報処理方法
Lakic et al. Link-Rot in Web-Sourced Multimedia Datasets
EP2887240B1 (en) Electronic product information display system
JP2021140646A (ja) ターゲットユーザ特徴抽出方法、ターゲットユーザ特徴抽出システム及びターゲットユーザ特徴抽出サーバ
Krechowicz et al. SD2DS-based datastore for large files
CN112711480B (zh) 数据链路解析方法及系统
US11360994B1 (en) Compact storage of non-sparse high-dimensionality data
US20090182781A1 (en) Data object logging
Cirera et al. Adoption of Sector-Specific Technologies
CN117725327A (zh) 一种支持自定义配置的系统功能集成方法
Yap A productivity toolbox for owner of online store
CN116541397A (zh) 状态数据查询方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Tokyo, Japan

Patentee after: Lotte Group Co.,Ltd.

Address before: Tokyo, Japan

Patentee before: Rakuten, Inc.