WO2015099018A1 - キャッシュ管理装置、キャッシュ管理方法、プログラム - Google Patents

キャッシュ管理装置、キャッシュ管理方法、プログラム Download PDF

Info

Publication number
WO2015099018A1
WO2015099018A1 PCT/JP2014/084258 JP2014084258W WO2015099018A1 WO 2015099018 A1 WO2015099018 A1 WO 2015099018A1 JP 2014084258 W JP2014084258 W JP 2014084258W WO 2015099018 A1 WO2015099018 A1 WO 2015099018A1
Authority
WO
WIPO (PCT)
Prior art keywords
web content
list
access list
access
deleted
Prior art date
Application number
PCT/JP2014/084258
Other languages
English (en)
French (fr)
Inventor
泰明 住吉
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to CN201480070446.XA priority Critical patent/CN105849704B/zh
Priority to US15/107,218 priority patent/US20170034299A1/en
Priority to JP2015554988A priority patent/JP6160710B2/ja
Priority to EP14873593.9A priority patent/EP3089038A4/en
Publication of WO2015099018A1 publication Critical patent/WO2015099018A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • H04L67/5682Policies or rules for updating, deleting or replacing the stored data

Definitions

  • the present invention relates to a cache management device, a cache management method, and a program.
  • a mechanism in which a plurality of distribution servers (cache servers) are installed between a server device that provides Web content on the Internet and a user terminal device, and a Web content is also provided from the distribution server device is called a CDN (Contents Delivery Network).
  • CDN Contents Delivery Network
  • a provider who provides such a CDN as a service may decide in advance which Web content to cache with the content provider and store the Web content in the distribution server device.
  • the storage device built in the distribution server device or connected to the distribution server device has a capacity limit. For this reason, it is not realistic to cache all Web contents in the distribution server device.
  • the Web content stored in the distribution server device is managed by the storage capacity of the storage device and the last access time to the Web content. For example, when the data size of the accumulated data exceeds a predetermined upper limit value, the free space is created by deleting the content with the oldest access date in order, and the free space is newly accessed This is a method of storing new Web contents (see Patent Document 1).
  • a Web content cache function provided in a gateway on a communication network and a distribution server device provided in the vicinity of the gateway by a communication provider that provides the communication network.
  • the purpose of using a cache function by a content provider is to obtain a business opportunity by enabling a user who accesses the provider's Web content to comfortably access specific content provided by the company. It is to prevent the load from being concentrated on the company's own content providing server device.
  • the purpose of the telecommunications carrier using the cache function is different from that of the content provider.
  • the communication carrier introduces a distribution server device (cache function) for the purpose of reducing unnecessary communication and preventing the communication network bandwidth provided by the company from being saturated and the communication speed from decreasing.
  • the communication carrier does not have to handle only specific content like the content provider and the CDN service provider, but has to handle all the contents accessed by the user.
  • a telecommunications carrier expects to improve the bandwidth usage efficiency of a communication network provided by himself / herself for all Web contents on the Internet by using a cache function. For example, if only Web content with a low access rate is accumulated, traffic due to access to the Web content with a high access rate may increase, resulting in pressure on the line. On the other hand, if only Web content with a high access rate can be accumulated, traffic due to access to the Web content is restricted only between the distribution server device and the user terminal device, and the bandwidth usage efficiency of the communication network is improved. May be possible. In other words, the goal of the telecommunications carrier is to accumulate only Web content with a high access rate as much as possible in a limited storage capacity in an environment where the target Web content and the devices that access it cannot be restricted in advance. is there.
  • An example of an object of the present invention is to provide a cache management device, a cache management method, and a program that solve the above-described problem.
  • a cache management device includes: a latest access list acquisition unit that acquires a latest access list indicating a history of Web content accessed within a predetermined period in the past set with the current as a reference; and a distribution server device When adding Web content based on the latest access list to the high-frequency access list indicating Web content to be stored as cache data, the Web content to be deleted that is the Web content to be deleted from the high-frequency access list is determined.
  • a deletion target determination unit specifies Web content whose access frequency is lower than a lower limit reference for each of a plurality of different periods, and selects the Web content to be deleted from the specified Web content.
  • the latest access list indicating the history of Web content accessed within a predetermined period in the past set based on the present is acquired, and the distribution server device should store the cache data as cache data
  • the distribution server device should store the cache data as cache data
  • determining a Web content to be deleted that is a Web content to be deleted from the high-frequency access list includes specifying Web content whose access frequency is lower than a lower limit reference for each of a plurality of different periods, and selecting the Web content to be deleted from the specified Web content. Including.
  • a program acquires a latest access list indicating a history of Web content accessed within a predetermined period in the past set on the basis of the current time in a computer of a cache management apparatus, and the distribution server apparatus caches Determining a Web content to be deleted, which is a Web content to be deleted from the high-frequency access list, when adding Web content to the high-frequency access list indicating Web content to be stored as data based on the latest access list Is executed. Determining the Web content to be deleted includes specifying Web content whose access frequency is lower than a lower limit reference for each of a plurality of different periods, and selecting the Web content to be deleted from the specified Web content. Including.
  • FIG. 1 shows a configuration of a cache management apparatus according to the first embodiment.
  • FIG. 1 shows a cache management device 1.
  • the cache management device 1 includes at least a latest access list acquisition unit 20 and a deletion target determination unit 50.
  • the cache management apparatus 1 is an apparatus that manages Web content cached by a distribution server (cache server) apparatus.
  • the latest access list acquisition unit 20 acquires a “latest access list” indicating Web contents accessed a predetermined number of times or more in a predetermined period from a history of Web contents requested by the user (“all latest access list”).
  • the deletion target determination unit 50 determines Web content to be deleted from the current cache data in order to secure a storage space for caching new Web content.
  • the deletion target determination unit 50 identifies Web content with a low access frequency for each of a plurality of different length periods in the past with respect to already cached Web content, and determines the Web content as a deletion target.
  • the plurality of periods having different lengths in the past are, for example, the past 24 hours, the past 7 days, and the past 4 weeks.
  • FIG. 2 shows a specific configuration of the cache management apparatus according to the first embodiment.
  • functional units other than the latest access list acquisition unit 20 and the deletion target determination unit 50 constituting the cache management device 1 will be described.
  • the all-latest access list creation unit 10 creates the all-latest access list based on the access information to the Web content received from the distribution server device 2 (see FIG. 3).
  • the Web content identification information and the number of accesses to the Web content identification information within a predetermined time are recorded.
  • the predetermined time is, for example, 10 minutes or 1 hour.
  • the Web content identification information includes, for example, access destination URL including a query, partial information constituting the access destination Web content, key information generated by hashing based on the access source user terminal information and the like. The reason why the Web content identification information includes a part of the information constituting the access destination Web content is that the Web content may be changed even if the access destination URL is the same.
  • the reason for including the user terminal information in the Web content identification information is that even if the Web content is the same access destination, for example, the response from the mobile terminal is different from the response from the PC terminal. Because there is. It is assumed that the access information received from the distribution server device 2 includes information necessary for the Web content identification information and information on the data size of the Web content.
  • the web content is web content indicated by web content identification information.
  • the high-frequency access list creation unit 30 creates a “high-frequency access list” that accumulates information on the “latest access list” that indicates Web content that has been accessed frequently among recent user accesses.
  • the storage unit of the distribution server device 2 stores content indicated by the Web content identification information recorded in the “high frequency access list”.
  • the high-frequency access list creation unit 30 adds the “latest access list” information to the “high-frequency access list”, the “high-frequency access list” increases. As a result, the capacity of the Web content accumulated in the storage unit of the distribution server device 2 increases, and eventually exceeds the storage capacity of the storage unit included in the distribution server device 2.
  • the high-frequency access list creation unit 30 deletes the Web content identification information indicating the content to be excluded from the cache target from the “high-frequency access list” according to the determination of the deletion target determination unit 50 described above.
  • the “high frequency access list” includes information such as Web content identification information, past access history, and last access date and time.
  • the past access history is, for example, the number of daily accesses in the past four weeks or the time in all accesses.
  • the access frequency output unit 40 outputs an “access frequency list” for a plurality of periods based on the past access history information in the “high frequency access list”. For example, the access frequency output unit 40 displays, for each Web content identification information, a list in the order of high frequency access in the past 24 hours, a list in the high frequency order of access in the past 7 days, and a list in the high frequency order of access in the past 4 weeks. create. Alternatively, the access frequency output unit 40 may count the number of accesses in the past 7 days and 4 weeks by day of the week.
  • the deletion target determination unit 50 determines the cache data to be deleted according to the access tendency information generated by the access frequency output unit 40.
  • the communication unit 60 receives the web content identification information of the web content requested by the user from the distribution server device 2. Further, the communication unit 60 transmits information instructing Web content to be stored in the distribution server device 2 or deleted from the distribution server device 2.
  • the storage unit 70 stores a high-frequency access list and a latest access list.
  • All latest access list creation unit 10, latest access list acquisition unit 20, high-frequency access list creation unit 30, access frequency output unit 40, and deletion target determination unit 50 are programmed by the CPU (Central Processing Unit) provided in cache management device 1. This is a function provided in the cache management device 1 by executing. *
  • FIG. 3 shows an outline of the network system S including the cache management apparatus 1 according to the first embodiment.
  • the outline of the network system S will be described with reference to FIG.
  • the network system S includes a cache management device 1, a distribution server device 2, a user terminal device 3, a content provider server device 4, and a communication network 5.
  • the distribution server device 2 transmits access information to the cache management device 1 and makes an inquiry to the cache management device 1 (see arrow R1).
  • the cache management device 1 instructs the distribution server device 2 to add or delete a cache (see arrow R2).
  • the user terminal device 3 includes a computer terminal 3A and a mobile terminal 3B. Lists generated by each functional unit in the cache management device 1 will be described.
  • the list includes an all latest access list L100, a latest access list L101, a high frequency access list L102, a 7 DAYS list L104, a 4WEEK list L105, and a deletion list L106. A method for creating these lists will be described later with reference to FIG.
  • the all-latest access list L100 is a list in which the all-latest access list creating unit 10 records the number of accesses for all Web contents accessed during a predetermined time.
  • the all-latest access list L100 is created based on the access information transmitted by the distribution server device 2.
  • the latest access list L101 is a list that the latest access list acquisition unit 20 selects from the all latest access list L100 Web contents whose number of accesses is a predetermined number or more.
  • the high-frequency access list L102 is a list indicating Web contents to be cached in the distribution server device 2 created by the high-frequency access list creation unit 30.
  • the distribution server device 2 inquires of the cache management device 1 which content should be cached.
  • the cache management device 1 refers to the high-frequency access list L102 and instructs which content should be cached and which content should not be cached.
  • the 24H list L103 is a list of the number of accesses in the past 24 hours.
  • the 7DAYS list L104 is a list of the number of accesses in the past seven days.
  • the 4WEEK list L105 is a list of the number of accesses in the past four weeks.
  • the 24H list L103, the 7DAYS list L104, and the 4WEEK list L105 are lists created and output by the access frequency output unit 40 based on the high frequency access list L102.
  • the deletion list L106 is a list indicating which contents of the currently accumulated cache data determined by the deletion target determination unit 50 based on the 24H list L103, the 7DAYS list L104, and the 4WEEK list L105 should be deleted.
  • the cache management apparatus 1 instructs the distribution server apparatus 2 to delete cache data based on the deletion list L106.
  • the distribution server device 2 receives a request for access to Web content from the user terminal device 3. If the requested web content has already been cached, the distribution server device 2 reads the web content from the storage unit included in the device, and transmits a response (web content) to the read web content user terminal device 3. If the distribution server device 2 does not cache the Web content, the content server server 4 is accessed to acquire the content, and a response (Web content) is transmitted to the user terminal device 3.
  • the distribution server device 2 transmits a response (access information) to the user terminal device 3, creates access information from the request received from the user terminal device 3 and Web content transmitted to the user terminal device 3, and caches the access information. It transmits to the management apparatus 1.
  • the distribution server device 2 inquires of the cache management device 1 whether the web content should be cached.
  • the cache management device 1 instructs the distribution server device 2 to cache the content via the communication unit 60.
  • Send instruction information instructs the distribution server device 2 not to cache the content via the communication unit 60 unless the Web content identification information corresponding to the Web content that has been inquired is recorded in the frequent access list L102.
  • Send instruction information When the distribution server device 2 receives the instruction information for instructing to cache the content, the distribution server device 2 caches the Web content according to the instruction information.
  • the contents of the high-frequency access list L102 change every predetermined time as the contents of the latest access list L101 are added and the contents of the deletion list L106 are deleted.
  • the distribution server device 2 can cache the Web content according to the latest access tendency.
  • the cache management device 1 transmits information indicating the Web content to be deleted from the cache data recorded in the deletion list L106 to the distribution server device 2 via the communication unit 60.
  • the total data size of the Web content indicated by the deletion list L106 is at least equal to or greater than the total data size of the content that the distribution server device 2 will newly cache.
  • the distribution server device 2 receives the deletion instruction information, the distribution server device 2 deletes the Web content data instructed from the already accumulated cache data according to the instruction. As a result, it is possible to prevent the data size of the cache data from exceeding the capacity of the storage device of the distribution server device 2.
  • the cache management device 1 selects and manages the cache target so as to increase the hit rate of the cache data stored in the distribution server device 2.
  • the communication by the request from the user is kept between the user terminal device 3 and the distribution server device 2 to reduce the amount of data flowing through the communication network 5, to secure the bandwidth of the communication network 5, and to reduce the communication speed. Can be prevented.
  • FIG. 4 shows a processing flow of the cache management apparatus according to the present embodiment.
  • 5A to 5C show examples of lists created by the cache management apparatus according to the present embodiment.
  • a process in which the cache management apparatus 1 creates the above-described lists L100 to L106 will be described with reference to the processing flow shown in FIG.
  • the distribution server device 2 transmits access information regarding the request to the cache management device 1.
  • the access information includes the data size of the Web content.
  • Step S1 "All latest access list” update process
  • the all latest access list creation unit 10 creates Web content identification information using the access information. Then, the all latest access list creation unit 10 reads the all latest access list L100 from the storage unit 70, and determines whether or not the created Web content identification information exists in the current all latest access list L100. If it is determined that the Web content identification information exists, the all-newest access list creation unit 10 adds “1” to the access count value of the Web content identification information in the all-newest access list L100. If it is determined that the Web content identification information does not exist, the all-newest access list creation unit 10 newly registers the Web content identification information in the all-newest access list L100 and records the access count value as “1”. .
  • the all-latest access list creation unit 10 stores the all-latest access list L100 in the storage unit 70 when the number of accesses of the Web content identification information is updated.
  • the all-latest access list creation unit 10 records the received data size and the last access time in the all-latest access list L100 in association with the Web content identification information.
  • Step S2 “Latest access list” creation process
  • the latest access list acquisition unit 20 reads the all latest access list L100 from the storage unit 70 every predetermined time, and extracts Web content identification information that has been accessed a predetermined number of times or more in a predetermined time.
  • the predetermined time may be, for example, about 10 minutes or 1 hour.
  • the predetermined time may be set according to the number of accesses or the traffic state of the communication network.
  • the latest access list acquisition unit 20 records the extracted Web content identification information in the storage unit 70. This recorded information is the latest access list L101.
  • the latest access list acquisition unit 20 selects a cache target based on the access frequency.
  • Step S3 “Frequent access list” creation process
  • the high frequency access list creation unit 30 updates the high frequency access list L102 using the information of the latest access list L101 at that timing.
  • a case will be described in which certain Web content identification information registered in the latest access list L101 is already posted in the high-frequency access list L102.
  • the high-frequency access list creation unit 30 updates the last access time or updates (adds) the number of accesses.
  • certain Web content identification information registered in the latest access list L101 is not Web content identification information not included in the high-frequency access list L102 will be described. In this case, the high frequency access list creation unit 30 newly registers the identification information in the high frequency access list L102.
  • the high-frequency access list creation unit 30 acquires the data sizes of all Web contents newly added to the high-frequency access list L102 from the latest access list L101 from the latest access list L101 and calculates the sum thereof. This total value is the capacity of the storage device that is required when the distribution server device 2 caches Web content newly added to the high-frequency access list L102.
  • the high frequency access list creation unit 30 records the total value in the storage unit 70.
  • the high-frequency access list L102 indicates Web content that the distribution server device 2 caches. By extracting only Web contents with high access frequency, which are aggregated at relatively short time intervals such as 10 minutes or 1 hour, and targeting them, the hit rate is increased, and access to Web contents with the same communication network bandwidth is performed. It can be prevented from being occupied by traffic.
  • the procedure for adding only frequently accessed content to the cache target has been described. While the capacity of the storage device provided in the distribution server device 2 is sufficient, it is only necessary to add the contents of the latest access list L101 to the high-frequency access list L102. However, the capacity of the cache content that can be stored in the distribution server device 2 is limited. For this reason, the cache content having a data size corresponding to the data size of the newly added Web content must be deleted from the distribution server device 2. In general, on the Internet, access is concentrated on some Web contents. For this reason, hit rates differ greatly depending on whether or not Web contents with high access frequency can be cached. Therefore, the cache data is deleted so that Web contents with high access frequency remain in the cache data.
  • Step S4 “Access Frequency List” creation process
  • the access frequency output unit 40 When the Web content to be added to the high-frequency access list L102 is determined, the access frequency output unit 40 next creates an access frequency list that serves as an index for determining which cache content should be deleted.
  • the access frequency output unit 40 creates an access frequency list for each of a plurality of different periods.
  • the access frequency list is, for example, a 24H list L103, a 7DAYS list L104, and a 4WEEK list L105.
  • the access frequency output unit 40 aggregates the number of accesses for each Web content identification information in the past 24 hours from the access history recorded in the high frequency access list L102, and creates a 24H list L103.
  • FIG. 5A is an example of the 24H list L103 generated by the access frequency output unit 40.
  • the access frequency output unit 40 aggregates the number of accesses for each Web content identification information in the past seven days, and creates a 7-DAYS list L104.
  • the access frequency output unit 40 aggregates the number of accesses for each Web content identification information in the past four weeks, and creates a 4WEEK list L105.
  • FIG. 5B is an example of the 7DAYS list L104 generated by the access frequency output unit 40.
  • FIG. 5C is an example of the 4WEEK list L105 generated by the access frequency output unit 40.
  • the access frequency output unit 40 records the created 24H list L103, 7DAYS list L104, and 4WEEK list L105 in the storage unit 70.
  • Step S5 “Delete List” creation process
  • the deletion target determining unit 50 reads the 24H list L103, the 7DAYS list L104, and the 4WEEK list L105 from the storage unit 70, and determines Web contents to be deleted.
  • a method by which the deletion target determining unit 50 determines the deletion target will be described with reference to FIGS. 5A to 5C.
  • the first line of the 24H list L103 in FIG. 5A indicates that there have been “10111” access requests in the past 24 hours for the content indicated by the Web content identification information “Ah”.
  • the 24H list L103 is listed in order from the most accessed content.
  • the Web content indicated by the Web content identification information “F”, “Cd”, and “Bw” is the content that has been least accessed in the last 24 hours.
  • the contents indicated by “F” and “Cw” are the contents that have been least accessed in the past seven days.
  • the contents indicated by “F” and “H” are the contents that have been least accessed in the past four weeks.
  • the contents with a small number of accesses in the plurality of periods are contents included in the high-frequency access list L102, that is, contents with a small number of accesses in each period among the contents currently cached.
  • the deletion target determining unit 50 reads each of the lists L103 to L105, and extracts content that has been accessed less frequently in each period.
  • the extraction method only the contents having a predetermined access count or less may be extracted using the access count.
  • content on which the number of accesses is equal to or lower than a predetermined order may be extracted by specifying the order on the list.
  • the deletion target determining unit 50 selects content to be deleted from the extracted deletion candidates. This will be described with reference to FIGS. 5A to 5C.
  • the deletion target determining unit 50 selects “F”, “Cd”, “Bw” from the 24H list L103, “F”, “Cw” from the 7-DAYS list L104, and “F” from the 4WEEK list L105. A case where “H” is selected as a deletion candidate will be described.
  • the deletion target determining unit 50 determines a deletion target from the extracted deletion candidates. Specifically, the deletion target determining unit 50 sets the deletion candidate content as a deletion target if the access frequency is not high in any of the three lists. First, the deletion target determining unit 50 examines “F”. “F” has the lowest number of accesses in any list. Accordingly, the deletion target determining unit 50 determines “F” as a deletion target. Next, the deletion target determining unit 50 examines “Cd”. “Cd” is the lowest in the 24H list L103, but is the third most frequently accessed in the 7DAYS list L104. In other words, “Cd” has not been accessed much in the latest 24H, but has been accessed well in the past seven days.
  • the deletion target determining unit 50 determines that such content is likely to be accessed in a future (for example, next week) or more than a certain level, and determines that “Cd” is not to be deleted. Next, the deletion target determining unit 50 examines “Bw” and “Cw”. “Bw” is the lowest in the 24H list L103. In the deletion target determining unit 50, “Cw” is the lowest in the 7-DAYS list L104. However, in the deletion target determination unit 50, “Bw” and “Cw” are one of the highest-level contents in the 4WEEK list L105.
  • the deletion target determining unit 50 determines that “Bw” and “Cw” are contents that have a certain access for four weeks (monthly) and that more than a certain access can be expected next month. And “Cw” are determined not to be deleted.
  • cache data with a low access frequency is deleted based on the access frequency in different past periods. For this reason, for example, the access rate is not high in the latest 24 hours, but it is not necessary to delete content that can be expected to have a high access rate in 7 days. That is, it is possible to efficiently select a new content group that proliferates in a short time and an existing cache.
  • the deletion target determining unit 50 examines “H”. “H” has the lowest number of accesses in the 4WEEK list L105.
  • the deletion target determination unit 50 sets this “H” as a deletion target based on a criterion for determining how many times the access frequency is predetermined in the 24H list L103 and the 7DAYS list L105 and that the access frequency is high. Determine whether or not. Further, if there is no access to the Web content indicated by “H” within the last seven days, the deletion target determining unit 50 determines that “H” is not recorded in the 24H list L103 and the 7DAYS list L105. In this case, the deletion target determining unit 50 determines “H” as a deletion target.
  • the deletion target determining unit 50 sets a reference for the lower limit of the number of accesses, and extracts content having a smaller number of accesses than the reference for the lower limit. Further, the deletion target determining unit 50 sets a reference for the upper limit of the number of accesses. The deletion target determining unit 50 sets the upper limit of the access counts set in the separate access frequency list as the access count in the separate access frequency list of the content extracted as the content having the lower access count than the lower limit criterion. It is judged whether it is over. Further, the deletion target determining unit 50 determines whether or not the content that has been accessed less than the lower limit criterion is recorded in another access frequency list.
  • the deletion target determining unit 50 for a Web content that has been accessed less in any of the access frequency lists, does not exceed the upper limit criterion in any of the other access frequency lists, or When it is determined that the Web content is not recorded in any other access frequency list, the Web content is determined as a deletion target.
  • the deletion target determining unit 50 repeats the procedure for determining the deletion target until the size of the data to be deleted is equal to or larger than the data size to be added. Specifically, the deletion target determining unit 50 reads from the storage unit 70 the data size (additional data size) necessary for the newly cached content calculated by the high-frequency access list creation unit 30. Further, the deletion target determining unit 50 reads the data size of the Web content that has already been determined as the deletion target (content indicated by “F” in FIGS. 5A to 5C) from the storage unit 70 and calculates the total of the read data sizes. (Delete data size). The deletion target determination unit 50 compares the additional data size with the deletion data size, and repeats the deletion target determination procedure described above until the deletion data size reaches the additional data size.
  • the deletion target determination unit 50 increases the number of contents extracted as content with a small number of accesses by raising the lower limit criterion according to the number of repetitions of the determination procedure, and determines the deletion target in the same procedure. Good.
  • the deletion target determination unit 50 reduces the number of contents excluded from deletion candidates by leaving the lower limit criterion as it is and raising the upper limit of the access count according to the number of repetitions of the determination procedure, The deletion target may be determined in the same procedure again.
  • the deletion target determination unit 50 creates a deletion list L106 indicating the Web content identification information of the Web content to be deleted. Further, the deletion target determining unit 50 transmits the deletion list L106 to the distribution server device 2 via the communication unit 60. Further, the deletion target determining unit 50 outputs the deletion list L106 to the high frequency access list creating unit 30. The high-frequency access list creation unit 30 deletes the Web content identification information recorded in the deletion list L106 from the high-frequency access list L102. This processing flow ends.
  • the deletion target determining unit 50 determines the Web content to be deleted from the cache data from the viewpoint of leaving only the Web content having a high access frequency in a plurality of different length periods in the past set based on the present. In this way, by considering the access frequency in different periods in which the lengths are set in multiple stages, it is possible to generate cache data based on different patterns of access tendencies according to the lengths of the periods. The number of accesses accepted by the communication network of the telecommunications carrier is enormous. For this reason, if a general method of caching accessed Web contents one after another and deleting old cache data one after another is used, the cache data may be replaced in a very short period (for example, several minutes). It can be.
  • the distribution server device may be forced to generate cache data without increasing the hit rate.
  • it is not limited to the most recent access, but grasps the long-term access tendency from the viewpoint of different periods such as daily, weekly, monthly, etc., and stores only Web contents that are meaningful to cache. To generate cache data. As a result, cache data with a small hit size and a high hit rate can be generated.
  • the cache management device 1 updates the high-frequency access list L102 as described with reference to FIG. Accordingly, the contents stored in the distribution server device 2 are managed.
  • the communication carrier can increase the use efficiency of the provided network.
  • the above-described cache management device 1 has a computer inside.
  • Each process of the cache management apparatus 1 described above is stored in a computer-readable recording medium in the form of a program.
  • the above processing is performed by the computer reading and executing this program.
  • the computer-readable recording medium includes a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, a semiconductor memory, and the like.
  • the computer program may be distributed to the computer via a communication line, and the computer that has received the distribution may execute the program.
  • the above program may be for realizing a part of the functions described above.
  • the program may be a so-called difference file (difference program) that can realize the above-described functions in combination with a program already recorded in the computer system.
  • (Appendix 1) Latest access list acquisition unit for acquiring a latest access list indicating a history of Web contents accessed within a predetermined period in the past set based on the present, and Web contents to be accumulated as cache data by the distribution server device
  • a deletion target determination unit that determines a Web content to be deleted, which is a Web content to be deleted from the high frequency access list when adding Web content to the high frequency access list indicating the latest access list
  • the cache management device wherein the deletion target determination unit specifies Web content whose access frequency is lower than a lower limit criterion for a plurality of different periods, and selects the Web content to be deleted from the specified Web content.
  • the said deletion object determination part stores the sum total of the data size of the said Web content of the deletion object newly in the said delivery server apparatus among the Web contents which the said latest access list added to the said high frequency access list shows
  • the cache management device according to any one of appendix 1 to appendix 3, wherein the deletion target is determined so as to be equal to or greater than a total data size of Web content to be performed.
  • a high-frequency access list that acquires a latest access list indicating a history of Web contents accessed within a predetermined period in the past set based on the present, and indicates Web contents to be accumulated as cache data by the distribution server device Determining a Web content to be deleted, which is a Web content to be deleted from the high-frequency access list, and adding the Web content based on the latest access list.
  • a cache management method comprising: specifying Web content whose access frequency is lower than a lower limit reference for each of a plurality of different periods, and selecting the Web content to be deleted from the specified Web content.
  • the latest access list which shows the log
  • the Web content to be deleted is determined from the high-frequency access list, and the deletion is executed.
  • Determining target Web content includes specifying Web content whose access frequency is lower than a lower limit reference for each of a plurality of different periods, and selecting the Web content to be deleted from the specified Web content .
  • the present invention may be applied to a cache management device, a cache management method, and a program.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 キャッシュ管理装置は、現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得する最新アクセスリスト取得部と、配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定する削除対象決定部とを備える。前記削除対象決定部は、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択する。

Description

キャッシュ管理装置、キャッシュ管理方法、プログラム
 本発明は、キャッシュ管理装置、キャッシュ管理方法、プログラムに関する。
 インターネットにおいてWebコンテンツを提供するサーバ装置とユーザ端末装置との間に複数の配信サーバ(キャッシュサーバ)装置を設置し、その配信サーバ装置からもWebコンテンツを提供する仕組みをCDN(Contents Delivery Network)という。CDNによれば、ユーザからのアクセスが分散され、各サーバ装置やネットワークへの負荷が減らされる。
 このようなCDNをサービスとして提供する事業者は、コンテンツ提供者とどのWebコンテンツについてキャッシュするかを事前に取り決めておき、そのWebコンテンツを配信サーバ装置にて蓄積しておく場合がある。
 配信サーバ装置が内蔵する又は配信サーバ装置に接続された記憶装置には容量の限界がある。このため、全てのWebコンテンツを配信サーバ装置にキャッシュすることは現実的ではない。配信サーバ装置に蓄えるWebコンテンツは、記憶装置の記憶容量とWebコンテンツへの最終アクセス時間によって管理することが一般的である。例えば、蓄積されたデータのデータサイズが予め定められた上限値を超えた場合に、最終アクセス日時の最も古いコンテンツから順に削除して空き容量を作成し、その空き容量に新たにアクセスのあった新しいWebコンテンツを蓄積するという方法である(特許文献1参照)。
 次に通信網を提供する通信事業者が、通信網上のゲートウェイに具備するWebコンテンツのキャッシュ機能やゲートウェイ付近に備える配信サーバ装置について考える。例えば、コンテンツ提供事業者がキャッシュ機能を用いる目的は、事業者のWebコンテンツにアクセスするユーザが自社の提供する特定のコンテンツに対して快適にアクセスすることができるようにすることで商機を得たり、自社のコンテンツ提供サーバ装置に負荷が集中してダウンするのを防ぐことである。これに対して、通信事業者がキャッシュ機能を用いる目的は、コンテンツ提供事業者とは異なる。通信事業者は、無駄な通信を削減し自社が提供する通信網の帯域が飽和し通信速度が低下するのを防ぐ目的で配信サーバ装置(キャッシュ機能)を導入する。通信事業者は、コンテンツ提供事業者及びCDNサービス提供事業者のように特定のコンテンツだけを扱えば良いのではなく、ユーザからアクセスのある全てのコンテンツを扱わなければならない。通信事業者は、キャッシュ機能を用いることにより、インターネット上の全てのWebコンテンツを対象として、自身の提供する通信網の帯域使用効率を向上させることを期待する。例えばアクセス率の低いWebコンテンツばかりを蓄積すれば、アクセス率の高いWebコンテンツへのアクセスによるトラフィックが増大し回線を圧迫する結果となる可能性がある。一方、アクセス率の高いWebコンテンツだけを蓄積することができれば、そのWebコンテンツに対するアクセスによるトラフィックを配信サーバ装置とユーザの端末装置間との間だけに留め、通信網の帯域使用効率を向上させることができる可能性がある。つまり通信事業者の目標は、対象とするWebコンテンツもアクセスして来るデバイスも事前に制限する事が出来ない環境で、限られた記憶容量になるべくアクセス率の高いWebコンテンツだけを蓄積することである。
日本国特開2006-185169号公報
 特許文献1の方法で蓄積したキャッシュデータを管理する方法を通信事業者の配信サーバ装置に適用した場合の問題点について述べる。
 (1)特許文献1の方法では、容量制限を超えるとアクセス時間の古いコンテンツから順に削除している。この場合、アクセス時間の古いコンテンツは確かにそのアクセスがあった時間から現在まではアクセスが無かったのだからその期間に関してはアクセス率が低かったといえる。しかし、新しくアクセスがあったからといってそのWebコンテンツをキャッシュしたとしてもそのWebコンテンツへのアクセスが今後どの程度あるかは予測不能であり、二度とアクセスがないまま配信サーバ装置から削除される可能性がある。それに対して、先に古いという理由で削除したWebコンテンツには、最後にアクセスされるまでの間に一定以上のアクセスがあり、定期的に一定以上のアクセスがあるかもしれない。その場合、キャッシュから削除してしまうと再度アクセス数に応じたトラフィックが発生してしまう。つまり最終アクセス時間が古いからといってそのキャッシュデータを削除することは通信網の帯域使用効率の観点からは必ずしも適切ではない。
 (2)キャンペーンサイトの様に瞬間的に爆発的なアクセスが発生するサイトに対して、キャッシュ生成を行い保存しても、爆発的なアクセスの発生は継続しない。よって、その後のアクセスが無くキャッシュが無駄になったり、そのキャッシュ保存の為に一定のアクセスがあるWebコンテンツのキャッシュデータが削除されることになりキャッシュの管理効率が低下する。
 つまり新しくアクセスがあったからといってそのWebコンテンツをキャッシュしても、通信網の使用率向上という観点からは必ずしも適切ではない。
 本発明の目的の一例は、上述した解題を解決するキャッシュ管理装置、キャッシュ管理方法、プログラムを提供することである。
 本発明は、上述の課題を解決すべくなされた。本発明の実施態様に係るキャッシュ管理装置は、現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得する最新アクセスリスト取得部と、配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定する削除対象決定部とを備える。前記削除対象決定部は、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択する。
 本発明の実施態様に係るキャッシュ管理方法は、現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得し、配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定することを含む。前記削除対象のWebコンテンツを決定することは、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択することを含む。
 本発明の実施態様に係るプログラムは、キャッシュ管理装置のコンピュータに、現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得し、配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定することを実行させる。前記削除対象のWebコンテンツを決定することは、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択することを含む。
 本発明によれば、限られた記憶容量にヒット率の高いWebコンテンツのキャッシュデータを蓄積することが可能になる。
本発明の第一の実施形態によるキャッシュ管理装置の構成を示す図である。 本発明の第一の実施形態によるキャッシュ管理装置の具体的な構成を示す図である。 本発明の第一の実施形態によるキャッシュ管理装置を含むネットワークシステムの概要を示す図である。 本発明の第一の実施形態によるキャッシュ管理装置の処理フローを示す図である。 本発明の第一の実施形態によるキャッシュ管理装置が作成する24Hリストの一例を示す図である。 本発明の第一の実施形態によるキャッシュ管理装置が作成する7DAYSリストの一例を示す図である。 本発明の第一の実施形態によるキャッシュ管理装置が作成する4WEEKリストの一例である。
<第一の実施形態>
 以下、本発明の第一の実施形態によるキャッシュ管理装置を図1~図5Cを参照して説明する。
 図1は第一の実施形態によるキャッシュ管理装置の構成を示す。
 図1、キャッシュ管理装置1を表している。図1に示す通り、キャッシュ管理装置1は最新アクセスリスト取得部20、削除対象決定部50を少なくとも備えている。キャッシュ管理装置1は、配信サーバ(キャッシュサーバ)装置がキャッシュするWebコンテンツを管理する装置である。
 最新アクセスリスト取得部20は、ユーザのリクエストがあったWebコンテンツの履歴(「全最新アクセスリスト」)から所定期間に所定回数以上アクセスされたWebコンテンツを示す「最新アクセスリスト」を取得する。
 削除対象決定部50は、新しいWebコンテンツをキャッシュする記憶スペースを確保するために、現在のキャッシュデータから削除するWebコンテンツを決定する。
 削除対象決定部50は、既にキャッシュしたWebコンテンツに対して、過去における複数の異なる長さの期間ごとに、アクセス頻度の低いWebコンテンツを特定し、そのWebコンテンツを削除対象と決定する。なお、過去における複数の異なる長さの期間とは、例えば過去24時間、過去7日間、過去4週間である。
 図2は第一の実施形態によるキャッシュ管理装置の具体的な構成を示す。
図2を参照してキャッシュ管理装置1を構成する最新アクセスリスト取得部20、削除対象決定部50以外の機能部について説明する。
 全最新アクセスリスト作成部10は、配信サーバ装置2(図3参照)から受信したWebコンテンツへのアクセス情報に基づいて全最新アクセスリストを作成する。全最新アクセスリストには、Webコンテンツ識別情報とそのWebコンテンツ識別情報に対する所定時間内のアクセス回数などが記録されている。ここで所定時間とは例えば10分間あるいは1時間などである。Webコンテンツ識別情報とは、例えばクエリーを含むアクセス先のURL、アクセス先Webコンテンツを構成する一部の情報、アクセス元のユーザ端末情報などに基づいてハッシュして生成されたキー情報を含む。
 Webコンテンツ識別情報にアクセス先Webコンテンツを構成する一部の情報が含まれる理由は、アクセス先URLが同じでもWebコンテンツに変更がある場合があり、コンテンツが変更される前の場合と、コンテンツが変更された後の場合とを区別する必要があるからである。Webコンテンツ識別情報にユーザ端末情報を含める理由は、同じアクセス先のWebコンテンツであっても例えば携帯端末からアクセスされる場合と、PC端末からアクセスされる場合とではレスポンスされるWebコンテンツが異なる場合があるからである。
 配信サーバ装置2から受信するアクセス情報にはWebコンテンツ識別情報に必要な情報、及びWebコンテンツのデータサイズの情報が含まれていると仮定する。
 以下においてWebコンテンツとは、Webコンテンツ識別情報が示すWebコンテンツである。
 高頻度アクセスリスト作成部30は、直近のユーザによるアクセスのうちアクセス頻度の高かったWebコンテンツを示す「最新アクセスリスト」の情報を蓄積した「高頻度アクセスリスト」を作成する。配信サーバ装置2の記憶部には、「高頻度アクセスリスト」に記録されているWebコンテンツ識別情報が示すコンテンツが蓄積されている。高頻度アクセスリスト作成部30が、「高頻度アクセスリスト」へ「最新アクセスリスト」の情報を追加すると「高頻度アクセスリスト」が増加する。それに伴い配信サーバ装置2の記憶部に蓄積されるWebコンテンツの容量が増加し、やがて配信サーバ装置2の備える記憶部の記憶容量を超えてしまう。従って高頻度アクセスリスト作成部30は、先に説明した削除対象決定部50の決定に従い「高頻度アクセスリスト」からキャッシュ対象から除外するコンテンツを示すWebコンテンツ識別情報を削除する。「高頻度アクセスリスト」には、Webコンテンツ識別情報、過去のアクセス履歴、最終アクセス日時などの情報が含まれている。過去のアクセス履歴とは、例えば過去4週間における日別のアクセス数、あるいは全アクセスにおける時刻である。
 アクセス頻度出力部40は、「高頻度アクセスリスト」における過去のアクセス履歴の情報に基づいて複数の期間についての「アクセス頻度リスト」を出力する。例えば、アクセス頻度出力部40はWebコンテンツ識別情報ごとに過去24時間におけるアクセスの高頻度順の一覧、過去7日間におけるアクセスの高頻度順の一覧、過去4週間におけるアクセスの高頻度順の一覧を作成する。別法として、アクセス頻度出力部40は、過去7日間及び4週間におけるアクセス回数を曜日別に集計してもよい。削除対象決定部50は、アクセス頻度出力部40が生成したアクセス傾向の情報に従って削除対象のキャッシュデータを決定する。
 通信部60は、ユーザがリクエストしたWebコンテンツのWebコンテンツ識別情報を配信サーバ装置2から受信する。また、通信部60は、配信サーバ装置2に蓄積すべき又は配信サーバ装置2から削除すべきWebコンテンツを指示する情報を送信する。
 記憶部70は、高頻度アクセスリストや最新アクセスリストを記憶している。
 全最新アクセスリスト作成部10、最新アクセスリスト取得部20、高頻度アクセスリスト作成部30、アクセス頻度出力部40、削除対象決定部50は、キャッシュ管理装置1に備わるCPU(Central Processing Unit)がプログラムを実行することによりキャッシュ管理装置1に備わる機能である。 
 図3は第一の実施形態によるキャッシュ管理装置1を含むネットワークシステムSの概要を示す。
 図3を参照してネットワークシステムSの概要について説明する。
 ネットワークシステムSは、キャッシュ管理装置1、配信サーバ装置2、ユーザ端末装置3、コンテンツ提供元サーバ装置4、および通信網5を含む。配信サーバ装置2は、キャッシュ管理装置1にアクセス情報を送信し、またキャッシュ管理装置1に問い合わせを行う(矢印R1参照)。キャッシュ管理装置1は、配信サーバ装置2にキャッシュの追加または削除を指示する(矢印R2参照)。図3に示す例において、ユーザ端末装置3は、コンピュータ端末3Aおよびモバイル端末3Bを含む。
 キャッシュ管理装置1において各機能部が生成するリスト類について説明する。リスト類は、全最新アクセスリストL100、最新アクセスリストL101、高頻度アクセスリストL102、7DAYSリストL104、4WEEKリストL105、および削除リストL106を含む。これらのリストの作成方法については後に図4を用いて説明する。
 全最新アクセスリストL100は、所定時間においてアクセスがあった全てのWebコンテンツについて全最新アクセスリスト作成部10がアクセス数を記録したリストである。
 全最新アクセスリストL100は、配信サーバ装置2が送信するアクセス情報に基づいて作成される。
 最新アクセスリストL101は、最新アクセスリスト取得部20が全最新アクセスリストL100の中からアクセス回数が所定回数以上のWebコンテンツを選択してできたリストである。
 高頻度アクセスリストL102は、高頻度アクセスリスト作成部30が作成した配信サーバ装置2においてキャッシュする対象となるWebコンテンツを示すリストである。配信サーバ装置2はキャッシュ管理装置1にどのコンテンツをキャッシュすべきかを問い合わせる。キャッシュ管理装置1は高頻度アクセスリストL102を参照していずれのコンテンツをキャッシュすべきであるか、およびまたは、いずれのコンテンツをキャッシュすべきでないかを指示する。
 24HリストL103は、過去24時間の期間におけるアクセス数の一覧である。7DAYSリストL104は、過去7日間の期間におけるアクセス数の一覧である。4WEEKリストL105は、過去4週間の期間におけるアクセス数の一覧である。24HリストL103、7DAYSリストL104、4WEEKリストL105は、アクセス頻度出力部40が高頻度アクセスリストL102に基づいて作成および出力したリストである。
 削除リストL106は、削除対象決定部50が24HリストL103、7DAYSリストL104、4WEEKリストL105に基づいて決定した現在蓄積されたキャッシュデータのうちどのコンテンツを削除すべきかを示すリストである。キャッシュ管理装置1は、削除リストL106に基づいて配信サーバ装置2にキャッシュデータの削除を指示する。
 次に図3のネットワークシステムSにおける動作の説明を行う。
 配信サーバ装置2は、ユーザ端末装置3からWebコンテンツへのアクセスのリクエストを受け付ける。配信サーバ装置2は、リクエストのあったWebコンテンツを既にキャッシュしていれば自装置の備える記憶部からそのWebコンテンツを読み出し、読み出したWebコンテンツユーザ端末装置3へレスポンス(Webコンテンツ)を送信する。配信サーバ装置2がそのWebコンテンツをキャッシュしていなければコンテンツ提供元サーバ装置4へアクセスしてそのコンテンツを取得し、ユーザ端末装置3へレスポンス(Webコンテンツ)を送信する。
 配信サーバ装置2は、ユーザ端末装置3へレスポンス(アクセス情報)を送信するとともに、ユーザ端末装置3から受け付けたリクエストやユーザ端末装置3に送信するWebコンテンツからアクセス情報を作成しそのアクセス情報をキャッシュ管理装置1へ送信する。配信サーバ装置2は、リクエストのあったWebコンテンツをキャッシュしていない場合、キャッシュ管理装置1へそのWebコンテンツをキャッシュすべきかどうかを問い合わせる。
 キャッシュ管理装置1は、問い合わせのあったWebコンテンツに対応するWebコンテンツ識別情報が高頻度アクセスリストL102に記録されていれば通信部60を介して配信サーバ装置2へそのコンテンツをキャッシュするよう指示する指示情報を送信する。キャッシュ管理装置1は、問い合わせのあったWebコンテンツに対応するWebコンテンツ識別情報が高頻度アクセスリストL102に記録されていなければ通信部60を介して配信サーバ装置2へそのコンテンツをキャッシュしないよう指示する指示情報を送信する。
 配信サーバ装置2は、コンテンツをキャッシュするよう指示する指示情報を受信した場合は、その指示情報に従ってWebコンテンツをキャッシュする。
 高頻度アクセスリストL102の内容は、最新アクセスリストL101の内容が加わり削除リストL106の内容が削除されることにより所定時間ごとに変化する。よって、配信サーバ装置2からの問い合わせに対するキャッシュ管理装置1が行うキャッシュするか否かの指示も所定時間ごとに変化する可能性がある。これによって配信サーバ装置2は、最新のアクセス傾向に従ってWebコンテンツをキャッシュすることができる。
 高頻度アクセスリストの内容が変化するとキャッシュ管理装置1は削除リストL106に記録されたキャッシュデータから削除すべきWebコンテンツを示す情報を通信部60を介して配信サーバ装置2へ送信する。後に図4を参照して説明するように削除リストL106が示すWebコンテンツのデータサイズの合計は、少なくとも配信サーバ装置2が新たにキャッシュすることになるコンテンツのデータサイズの合計以上である。
 配信サーバ装置2は、削除指示情報を受信するとその指示に従って既に蓄積したキャッシュデータから指示のあったWebコンテンツのデータを削除する。これによってキャッシュデータのデータサイズが配信サーバ装置2の記憶装置の容量をオーバーすることを防ぐことができる。
 このようにして、キャッシュ管理装置1は、配信サーバ装置2が蓄積するキャッシュデータのヒット率を高めるようにキャッシュ対象の選択および管理を行う。その結果、ユーザからのリクエストによる通信をユーザ端末装置3と配信サーバ装置2との間に留めて通信網5を流れるデータ量を削減し、通信網5の帯域を確保し通信速度の低下などを防ぐことができる。
 図4は本実施形態によるキャッシュ管理装置の処理フローを示す。
 図5A~5Cは本実施形態によるキャッシュ管理装置が作成するリストの例を示す。
 図4に示す処理フローを参照してキャッシュ管理装置1が上述のリストL100~L106を作成する処理について説明する。
 まず、図3を参照して説明したようにユーザのWebコンテンツへのリクエストがあると配信サーバ装置2は、そのリクエストについてのアクセス情報をキャッシュ管理装置1へ送信する。アクセス情報にはそのWebコンテンツのデータサイズが含まれている。
 (ステップS1:「全最新アクセスリスト」更新処理)
 キャッシュ管理装置1では、全最新アクセスリスト作成部10がアクセス情報を用いてWebコンテンツ識別情報を作成する。そして、全最新アクセスリスト作成部10が記憶部70から全最新アクセスリストL100を読み出し、作成したWebコンテンツ識別情報が現在の全最新アクセスリストL100に存在するか否かを判断する。Webコンテンツ識別情報が存在すると判断した場合、全最新アクセスリスト作成部10は、全最新アクセスリストL100のそのWebコンテンツ識別情報のアクセス回数の値に“1”を加算する。Webコンテンツ識別情報が存在しないと判断した場合、全最新アクセスリスト作成部10は、そのWebコンテンツ識別情報を新たに全最新アクセスリストL100に登録し、そのアクセス回数の値を“1”として記録する。全最新アクセスリスト作成部10はWebコンテンツ識別情報のアクセス回数などを更新すると全最新アクセスリストL100を記憶部70に保存する。また、全最新アクセスリスト作成部10は、受信したコンテンツのデータサイズと最終アクセス時刻をWebコンテンツ識別情報に対応付けて全最新アクセスリストL100に記録する。
 (ステップS2:「最新アクセスリスト」作成処理)
 次に所定の時間ごとに最新アクセスリスト取得部20が記憶部70から全最新アクセスリストL100を読み出して、所定時間に所定回数以上アクセスがあったWebコンテンツ識別情報を抽出する。所定の時間は、例えば10分、または1時間程度であってもよい。所定の時間は、アクセス数や通信網のトラフィック状態などに応じて設定してもよい。最新アクセスリスト取得部20は、抽出したWebコンテンツ識別情報を記憶部70に記録する。この記録した情報は、最新アクセスリストL101である。
 最新アクセスリスト取得部20が、アクセス頻度に基づいてキャッシュ対象を選別する。その結果、新しくアクセスされたすべてのコンテンツをキャッシュ対象に設定してしまい、その代償にある程度頻度の高いアクセスが見込めるキャッシュデータを削除してしまう可能性を低減することができる。例えば一時的に多数のアクセスがあっても1時間(所定時間)におけるアクセス数が所定回数以上でなければキャッシュ対象に加えないことで、意味のないキャッシュデータを作成したり、キャッシュの管理効率の低下を防ぐことができる。
 (ステップS3:「高頻度アクセスリスト」作成処理)
 最新アクセスリスト取得部20が最新アクセスリストL101を作成すると、そのタイミングで高頻度アクセスリスト作成部30が、最新アクセスリストL101の情報を用いて高頻度アクセスリストL102を更新する。最新アクセスリストL101に登録されたあるWebコンテンツ識別情報が既に高頻度アクセスリストL102に掲載されていれる場合について説明する。この場合、高頻度アクセスリスト作成部30は、その最終アクセス時間を更新したり、アクセス回数を更新(加算)する。最新アクセスリストL101に登録されたあるWebコンテンツ識別情報が高頻度アクセスリストL102にないWebコンテンツ識別情報でない場合について説明する。この場合、高頻度アクセスリスト作成部30は、新規にその識別情報を高頻度アクセスリストL102に登録する。
 また、高頻度アクセスリスト作成部30は、最新アクセスリストL101のうち高頻度アクセスリストL102に新たに追加する全てのWebコンテンツのデータサイズを最新アクセスリストL101から取得しその合計を算出する。この合計値は新たに高頻度アクセスリストL102に追加したWebコンテンツを配信サーバ装置2にてキャッシュした場合に必要となる記憶装置の容量である。高頻度アクセスリスト作成部30は、この合計値を記憶部70に記録する。
 高頻度アクセスリストL102は、配信サーバ装置2がキャッシュするWebコンテンツを示している。10分や1時間などの比較的短い時間間隔ごとに集計したアクセス頻度の高いWebコンテンツだけを抽出してキャッシュ対象とすることでヒット率を高め、通信網の帯域が同じWebコンテンツへのアクセスによるトラフィックで占有されることを防ぐことができる。
 ここまでは、アクセス頻度の高いコンテンツだけをキャッシュ対象に加える手順について説明した。配信サーバ装置2が備える記憶装置の容量に余裕がある間は、高頻度アクセスリストL102に最新アクセスリストL101の内容を追加するだけで良い。しかし、配信サーバ装置2が蓄積できるキャッシュコンテンツの容量には限りがある。このため、新たに加えたWebコンテンツのデータサイズに相当するデータサイズを有するキャッシュコンテンツを配信サーバ装置2から削除しなければならない。一般にインターネットにおいてはアクセスが一部のWebコンテンツに集中している。このため、アクセス頻度の高いWebコンテンツをキャッシュすることができるかどうかでヒット率は大きく異なる。従ってアクセス頻度の高いWebコンテンツがキャッシュデータに残るようにキャッシュデータの削除を行う。
 (ステップS4:「アクセス頻度リスト」作成処理)
 高頻度アクセスリストL102に追加するWebコンテンツが決定すると、次に、アクセス頻度出力部40が、どのキャッシュコンテンツを削除すべきかを判断する指標となるアクセス頻度リストを作成する。アクセス頻度出力部40は、複数の異なる期間ごとにアクセス頻度リストを作成する。アクセス頻度リストとは、例えば、24HリストL103、7DAYSリストL104、および4WEEKリストL105である。
 まず、アクセス頻度出力部40は、高頻度アクセスリストL102に記録されたアクセス履歴から、過去24時間におけるWebコンテンツ識別情報ごとのアクセス回数を集計し、24HリストL103を作成する。図5Aは、アクセス頻度出力部40が生成した24HリストL103の一例である。
 同様にアクセス頻度出力部40は、過去7日間におけるWebコンテンツ識別情報ごとのアクセス回数を集計し、7DAYSリストL104を作成する。また、アクセス頻度出力部40は、過去4週間におけるWebコンテンツ識別情報ごとのアクセス回数を集計し、4WEEKリストL105を作成する。図5Bは、アクセス頻度出力部40が生成した7DAYSリストL104の一例である。図5Cは、アクセス頻度出力部40が生成した4WEEKリストL105の一例である。
 アクセス頻度出力部40は、作成した24HリストL103、7DAYSリストL104、4WEEKリストL105を記憶部70に記録する。
 (ステップS5:「削除リスト」作成処理)
 次に削除対象決定部50は、24HリストL103、7DAYSリストL104、4WEEKリストL105を記憶部70から読み出して削除対象となるWebコンテンツを決定する。図5A~5Cを参照しながら削除対象決定部50が削除対象を決定する方法について説明する。
図5Aの24HリストL103の1行目は、Webコンテンツ識別情報「Ah」が示すコンテンツに対して過去の24時間に「10111」回アクセス要求があったことを示している。24HリストL103にはアクセス回数の高いコンテンツから順に掲載されている。24HリストL103においてはWebコンテンツ識別情報「F」、「Cd」、「Bw」が示すWebコンテンツは、直近の24時間において最もアクセス回数が少なかったコンテンツであることを示している。
 7DAYSリストL104においては「F」、「Cw」が示すコンテンツが過去7日間において最もアクセス回数が少なかったコンテンツであることを示している。4WEEKリストL105においては「F」、「H」が示すコンテンツが過去4週間において最もアクセス回数が少なかったコンテンツであることを示している。これら複数の期間におけるアクセス回数の少ないコンテンツは高頻度アクセスリストL102に含まれるコンテンツ、つまり現在キャッシュ対象となっているコンテンツの中でそれぞれの期間においてアクセス回数が少なかったコンテンツである。
 削除対象決定部50は、各リストL103~L105を読み込んでそれぞれの期間においてアクセス回数の少なかったコンテンツを抽出する。抽出の方法の一例として、アクセス回数を用いて所定のアクセス回数以下のコンテンツだけを抽出してもよい。抽出の方法の別の例として、リスト上の順位を指定してアクセス回数が所定の順位以下のコンテンツを抽出してもよい。
 次に削除対象決定部50は、抽出した削除候補の中から削除すべきコンテンツを選択する。図5A~5Cを例にして説明する。まず、抽出の結果、削除対象決定部50は、24HリストL103から「F」、「Cd」、「Bw」を、7DAYSリストL104から「F」、「Cw」を、4WEEKリストL105から「F」、「H」を削除候補として選択した場合について説明する。
 次に削除対象決定部50は、抽出した削除候補から削除対象を決定する。具体的には削除対象決定部50は、削除候補のコンテンツが3つのリストにおいて何れもアクセス頻度が高くなければ削除対象とする。
 まず、削除対象決定部50は「F」について検討する。「F」はいずれのリストにおいてもアクセス回数が最下位である。従って削除対象決定部50は、「F」を削除対象として決定する。次に削除対象決定部50は「Cd」について検討する。「Cd」は24HリストL103では最下位であるが7DAYSリストL104では3番目にアクセス回数が高い。つまり直近の24Hにおいて「Cd」はあまりアクセスされなかったが、過去7日間においては良くアクセスされたコンテンツである。削除対象決定部50は、このようなコンテンツは未来において(例えば来週になったら)また一定以上アクセスされる可能性が高いと判断し、「Cd」を削除対象としないことを決定する。次に削除対象決定部50は「Bw」、「Cw」について検討する。「Bw」は、24HリストL103では最下位である。削除対象決定部50は「Cw」は、7DAYSリストL104では最下位である。しかし、削除対象決定部50は「Bw」及び「Cw」は4WEEKリストL105では、最上位のコンテンツのうちの一つである。削除対象決定部50は、「Bw」及び「Cw」が4週間(月単位)では一定のアクセスがあるコンテンツであり、また来月になれば一定以上のアクセスが見込めると判断し、「Bw」及び「Cw」を削除対象としないことを決定する。
 このように、第一実施形態においては、過去の異なる期間におけるアクセス頻度に基づいて、アクセス頻度の低いキャッシュデータを削除する。このため、例えば直近24時間においてはアクセス率が高くないが7日間でみればアクセス率が高いことが見込めるコンテンツを削除せずに済む。つまり短時間で増殖する新コンテンツ群と既存キャッシュの取捨選択を効率的に行うことができる。
 次に削除対象決定部50は「H」について検討する。「H」は4WEEKリストL105においてはアクセス回数が最下位である。削除対象決定部50は、24HリストL103、7DAYSリストL105において予め定められたどの程度のアクセス回数があればアクセス頻度が高いとするかの判断基準に基づいて、この「H」を削除対象にするか否かを決定する。また、削除対象決定部50は、直近の7日間以内においてこの「H」が示すWebコンテンツにアクセスが無ければ、「H」が24HリストL103、7DAYSリストL105に記録がないこと判断される。その場合は、削除対象決定部50は、「H」を削除対象として決定する。
 このように削除対象決定部50は、アクセス回数の下限の基準を設け、下限の基準よりもアクセス回数の少なかったコンテンツを抽出する。また、削除対象決定部50は、アクセス回数の上限の基準を設ける。削除対象決定部50は、下限の基準よりもアクセス回数の少なかったコンテンツとして抽出したコンテンツの別のアクセス頻度リストにおけるアクセス回数が、その別のアクセス頻度リストに設定されているアクセス回数の上限の基準を上回っているかを判定する。また、削除対象決定部50は、下限の基準よりもアクセス回数の少なかったコンテンツが別のアクセス頻度リストに記録されているか否かを判定する。削除対象決定部50は、いずれかのアクセス頻度リストにおいてアクセス回数の少なかったWebコンテンツに関して、そのWebコンテンツのアクセス回数が別のいずれのアクセス頻度リストにおいてもその上限の基準を超えていない、または、そのWebコンテンツが別のいずれのアクセス頻度リストにも記録されていないと判断した場合、そのWebコンテンツを削除対象に決定する。
 削除対象決定部50は、この削除対象を決定する手順を削除するデータのサイズが追加するデータサイズ以上となるまで繰り返す。
 具体的には、削除対象決定部50は、高頻度アクセスリスト作成部30が計算した新たにキャッシュするコンテンツに必要なデータサイズ(追加データサイズ)を記憶部70から読み出す。また、削除対象決定部50は、既に削除対象と決定したWebコンテンツ(図5A~5Cにおいては「F」が示すコンテンツ)のデータサイズを記憶部70から読み出して、読み出したデータサイズの合計を算出(削除データサイズ)する。削除対象決定部50は、追加データサイズと削除データサイズとを比較し、削除データサイズが追加データサイズに達するまで、上述の削除対象の決定手順を繰り返す。
 削除対象決定部50は、決定手順の繰り返し数に応じて下限の基準を引き上げることによりアクセス回数の少なかったコンテンツとして抽出されるコンテンツの数を増加させ、同様の手順で削除対象を決定してもよい。別法として、削除対象決定部50は、下限の基準をそのままとし、決定手順の繰り返し数に応じてアクセス回数の上限の基準を引き上げることにより、削除候補から除外されるコンテンツの数を減少させ、再度同様の手順で削除対象を決定してもよい。
 削除対象の決定が完了すると、削除対象決定部50は、削除対象となるWebコンテンツのWebコンテンツ識別情報を示した削除リストL106を作成する。さらに、削除対象決定部50は、通信部60を介して削除リストL106を配信サーバ装置2へ送信する。また、削除対象決定部50は、削除リストL106を高頻度アクセスリスト作成部30に出力する。高頻度アクセスリスト作成部30は、高頻度アクセスリストL102から削除リストL106に記録されたWebコンテンツ識別情報を削除する。
 以上で本処理フローは終了する。
 このように削除対象決定部50は、現在を基準に設定した過去における複数の異なる長さの期間においてアクセス頻度の高いWebコンテンツだけを残すという観点で、キャッシュデータから削除するWebコンテンツを決定する。このように多段階に長さを設定した異なる期間におけるアクセス頻度を考慮することで、その期間の長さに応じた異なったパターンのアクセス傾向に基づいたキャッシュデータを生成することができる。通信事業者の通信網が受け付けるアクセスの数は膨大である。このため、アクセスがあるWebコンテンツを次々にキャッシュし、古いキャッシュデータを次々に削除するという一般的な方法を用いると、ごく短い期間(例えば数分など)でキャッシュデータが置き換わってしまうことにもなりかねない。そのような場合、配信サーバ装置では、ヒット率を上げることができないままキャッシュデータの生成に追われるようなことになりかねない。一方で、本実施形態によれば、直近のアクセスだけにとらわれず、日毎、週毎、月毎など異なる期間の観点から長期間におけるアクセス傾向を把握し、キャッシュする意味のあるWebコンテンツだけを蓄積してキャッシュデータを生成する。その結果、小さなデータサイズでヒット率の高いキャッシュデータを生成することができる。
 高頻度アクセスリストL102が更新され、また配信サーバ装置2において削除リストL106に掲載されたキャッシュデータの削除が完了すると、図3で説明したようにキャッシュ管理装置1は更新された高頻度アクセスリストL102に従って配信サーバ装置2に蓄積されるコンテンツを管理する。
 本実施形態によれば、限られた記憶容量にヒット率の高いWebコンテンツのキャッシュデータを蓄積することが可能になるという効果が得られる。それによって通信事業者は、提供する回線網の使用効率を高めることができる。
 上述のキャッシュ管理装置1は内部にコンピュータを有している。上述したキャッシュ管理装置1の各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されている。このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。コンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等を含む。このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータがそのログラムを実行するようにしてもよい。
 上記プログラムは、前述した機能の一部を実現するためのものであってもよい。上記プログラムは、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
 その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。
 上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下に限られない。
(付記1)現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得する最新アクセスリスト取得部と、配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定する削除対象決定部とを備え、前記削除対象決定部は、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択するキャッシュ管理装置。
(付記2)前記削除対象決定部は、前記複数の異なる期間のうちのいずれかにおいてアクセス頻度が上限基準よりも高いWebコンテンツを前記削除対象から除外する付記1に記載のキャッシュ管理装置。
(付記3)前記最新アクセスリストは、前記所定期間に所定回数以上アクセスされたWebコンテンツを示すアクセスリストである付記1又は付記2に記載のキャッシュ管理装置。
(付記4)前記削除対象決定部は、前記削除対象のWebコンテンツのデータサイズの合計が、前記高頻度アクセスリストに追加する前記最新アクセスリストが示すWebコンテンツのうち新たに前記配信サーバ装置に蓄積するWebコンテンツのデータサイズの合計以上となるように前記削除対象を決定する付記1から付記3の何れか1つに記載のキャッシュ管理装置。
(付記5)前記複数の異なる期間とは、現在を基準とした過去24時間、及び過去7日間を含んでいる付記1から付記4の何れか1つに記載のキャッシュ管理装置。
(付記6)現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得し、配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定することを含み、前記削除対象のWebコンテンツを決定することは、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択することを含むキャッシュ管理方法。
(付記7)キャッシュ管理装置のコンピュータに、現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得し、配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定することを実行させ、前記削除対象のWebコンテンツを決定することは、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択することを含むプログラム。
 この出願は、2013年12月25日に出願された日本国特願2013-266917を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 本発明は、キャッシュ管理装置、キャッシュ管理方法、プログラムに適用してもよい。
1・・・キャッシュ管理装置
2・・・配信サーバ装置
3・・・ユーザ端末装置
4・・・コンテンツ提供元サーバ装置
5・・・通信網
10・・・全最新アクセスリスト作成部
20・・・最新アクセスリスト取得部
30・・・高頻度アクセスリスト作成部
40・・・アクセス頻度出力部
50・・・削除対象決定部
60・・・通信部
70・・・記憶部
L100・・・全最新アクセスリスト
L101・・・最新アクセスリスト
L102・・・高頻度アクセスリスト
L103・・・24Hリスト
L104・・・7DAYSリスト
L105・・・4WEEKリスト
L106・・・削除リスト

Claims (7)

  1.  現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得する最新アクセスリスト取得部と、
     配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定する削除対象決定部とを備え、
     前記削除対象決定部は、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択する
     キャッシュ管理装置。
  2.  前記削除対象決定部は、前記複数の異なる期間のうちのいずれかにおいてアクセス頻度が上限基準よりも高いWebコンテンツを前記削除対象から除外する
     請求項1に記載のキャッシュ管理装置。
  3.  前記最新アクセスリストは、前記所定期間に所定回数以上アクセスされたWebコンテンツを示すアクセスリストである
     請求項1又は請求項2に記載のキャッシュ管理装置。
  4.  前記削除対象決定部は、前記削除対象のWebコンテンツのデータサイズの合計が、前記高頻度アクセスリストに追加する前記最新アクセスリストが示すWebコンテンツのうち新たに前記配信サーバ装置に蓄積するWebコンテンツのデータサイズの合計以上となるように前記削除対象を決定する
     請求項1から請求項3の何れか1項に記載のキャッシュ管理装置。
  5.  前記複数の異なる期間とは、現在を基準とした過去24時間、及び過去7日間を含んでいる
     請求項1から請求項4の何れか1項に記載のキャッシュ管理装置。
  6.  現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得し、
     配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定する
     ことを含み、
     前記削除対象のWebコンテンツを決定することは、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択することを含む
     キャッシュ管理方法。
  7.  キャッシュ管理装置のコンピュータに、
     現在を基準に設定した過去の所定期間内にアクセスされたWebコンテンツの履歴を示す最新アクセスリストを取得し、
     配信サーバ装置がキャッシュデータとして蓄積すべきWebコンテンツを示す高頻度アクセスリストに前記最新アクセスリストに基づいてWebコンテンツを追加するに際し、前記高頻度アクセスリストから削除すべきWebコンテンツである削除対象のWebコンテンツを決定する
     ことを実行させ、
     前記削除対象のWebコンテンツを決定することは、複数の異なる期間ごとにアクセス頻度が下限基準よりも低いWebコンテンツを特定し、前記特定されたWebコンテンツから前記削除対象のWebコンテンツを選択することを含む
     プログラム。
PCT/JP2014/084258 2013-12-25 2014-12-25 キャッシュ管理装置、キャッシュ管理方法、プログラム WO2015099018A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201480070446.XA CN105849704B (zh) 2013-12-25 2014-12-25 缓存管理装置和缓存管理方法
US15/107,218 US20170034299A1 (en) 2013-12-25 2014-12-25 Cash management device, cash management method, and program
JP2015554988A JP6160710B2 (ja) 2013-12-25 2014-12-25 キャッシュ管理装置、キャッシュ管理方法、プログラム
EP14873593.9A EP3089038A4 (en) 2013-12-25 2014-12-25 Cash management device, cash management method, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013-266917 2013-12-25
JP2013266917 2013-12-25

Publications (1)

Publication Number Publication Date
WO2015099018A1 true WO2015099018A1 (ja) 2015-07-02

Family

ID=53478865

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/084258 WO2015099018A1 (ja) 2013-12-25 2014-12-25 キャッシュ管理装置、キャッシュ管理方法、プログラム

Country Status (5)

Country Link
US (1) US20170034299A1 (ja)
EP (1) EP3089038A4 (ja)
JP (1) JP6160710B2 (ja)
CN (1) CN105849704B (ja)
WO (1) WO2015099018A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107819804B (zh) * 2016-09-14 2021-03-16 先智云端数据股份有限公司 云端储存设备系统及决定其架构的高速缓存中数据的方法
CN107577618B (zh) * 2017-09-13 2020-09-29 武大吉奥信息技术有限公司 一种三路均衡缓存淘汰方法及装置
CN112364016B (zh) * 2020-10-27 2021-08-31 中国地震局地质研究所 一种异频数据对象的时间嵌套缓存模型的构建方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07182220A (ja) * 1993-12-21 1995-07-21 Hitachi Ltd 分散ファイルシステムおよびそのファイルキャッシング方法
JP2001356956A (ja) * 2000-06-15 2001-12-26 Seiko Epson Corp キャッシュサーバ装置及びキャッシング方法
JP2003036199A (ja) * 2001-07-26 2003-02-07 Nippon Telegr & Teleph Corp <Ntt> インターネットにおける情報キャッシュ方法
JP2006185169A (ja) 2004-12-27 2006-07-13 Toshiba Corp キャッシュ制御装置、キャッシュ制御方法およびキャッシュ制御プログラム
JP2008204055A (ja) * 2007-02-19 2008-09-04 Hitachi Ltd コンテンツ管理方法、ファイルサーバおよび読み出し制御プログラム
JP2014160343A (ja) * 2013-02-19 2014-09-04 Nippon Telegr & Teleph Corp <Ntt> コンテンツキャッシュ制御装置およびその動作方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949533B2 (en) * 2010-02-05 2015-02-03 Telefonaktiebolaget L M Ericsson (Publ) Method and node entity for enhancing content delivery network
US9167049B2 (en) * 2012-02-02 2015-10-20 Comcast Cable Communications, Llc Content distribution network supporting popularity-based caching
US9491253B2 (en) * 2012-11-27 2016-11-08 Fastly, Inc. Data storage based on content popularity

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07182220A (ja) * 1993-12-21 1995-07-21 Hitachi Ltd 分散ファイルシステムおよびそのファイルキャッシング方法
JP2001356956A (ja) * 2000-06-15 2001-12-26 Seiko Epson Corp キャッシュサーバ装置及びキャッシング方法
JP2003036199A (ja) * 2001-07-26 2003-02-07 Nippon Telegr & Teleph Corp <Ntt> インターネットにおける情報キャッシュ方法
JP2006185169A (ja) 2004-12-27 2006-07-13 Toshiba Corp キャッシュ制御装置、キャッシュ制御方法およびキャッシュ制御プログラム
JP2008204055A (ja) * 2007-02-19 2008-09-04 Hitachi Ltd コンテンツ管理方法、ファイルサーバおよび読み出し制御プログラム
JP2014160343A (ja) * 2013-02-19 2014-09-04 Nippon Telegr & Teleph Corp <Ntt> コンテンツキャッシュ制御装置およびその動作方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3089038A4

Also Published As

Publication number Publication date
JP6160710B2 (ja) 2017-07-12
US20170034299A1 (en) 2017-02-02
JPWO2015099018A1 (ja) 2017-03-23
EP3089038A4 (en) 2017-06-28
EP3089038A1 (en) 2016-11-02
CN105849704A (zh) 2016-08-10
CN105849704B (zh) 2019-04-09

Similar Documents

Publication Publication Date Title
US10574778B2 (en) Content replacement and refresh policy implementation for a content distribution network
EP3519974B1 (en) System and method for improvements to a content delivery network
Elayoubi et al. Performance and cost effectiveness of caching in mobile access networks
US10067885B2 (en) Caching policies for selection and replacement of objects
JP4662618B2 (ja) キャッシングのためのシステム
KR101825770B1 (ko) 공유된 캐시 저장 시스템에서 파일의 업로드를 관리하기 위한 시스템 및 방법
US7860993B2 (en) Streaming media content delivery system and method for delivering streaming content
US8068512B2 (en) Efficient utilization of cache servers in mobile communication system
US20100235329A1 (en) System and method of embedding second content in first content
JP7176209B2 (ja) 情報処理装置
US20140258375A1 (en) System and method for large object cache management in a network
US9408050B2 (en) Reducing bandwidth usage of a mobile client
JP6160710B2 (ja) キャッシュ管理装置、キャッシュ管理方法、プログラム
KR20130026908A (ko) 클라우드 기반 로컬 장치와 로컬 장치의 파일 읽기 및 저장 방법
JP2010273298A (ja) コンテンツ配信システム、配信制御装置及び配信制御プログラム
KR20140018753A (ko) 콘텐츠 이용 특성에 기초하여 콘텐츠를 관리하는 콘텐츠 제공 장치
US11593268B2 (en) Method, electronic device and computer program product for managing cache
US10165040B2 (en) Small disk support for large cloud-based storage systems
US11516083B2 (en) Systems, computer-readable media and computer-implemented methods for automated, dynamic capacity planning using HTTP response header fields
JP5798523B2 (ja) 通信制御システム、集約サーバおよび通信制御方法
US10970250B2 (en) System, data management method, and file server
CN113742131B (zh) 用于存储管理的方法、电子设备和计算机程序产品
JP2019153189A (ja) セッション情報セットをキャッシュするサーバ、及び、セッション情報セットのキャッシュ制御方法
JP5003742B2 (ja) コンテンツフィルタリングシステム、コンテンツフィルタリング方法及びゲートウェイ
JP2012147272A (ja) トラヒックキャッシュシステム及びキャッシュ置き換え方法及びキャッシュ装置及びキャッシュプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14873593

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 15107218

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2015554988

Country of ref document: JP

Kind code of ref document: A

REEP Request for entry into the european phase

Ref document number: 2014873593

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2014873593

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE