BR112016005391B1

BR112016005391B1 - Método e servidor para buscar ponto divisório de corrente de dados com base em servidor

Info

Publication number: BR112016005391B1
Application number: BR112016005391-5A
Authority: BR
Inventors: Chuanshuai YU; Chengwei Zhang; Linbo XU
Original assignee: Huawei Technologies Co., Ltd.
Priority date: 2014-02-14
Filing date: 2014-02-27
Publication date: 2019-04-30
Also published as: US10264045B2; KR101912727B1; IL244830A0; AU2014382891B2; AU2014382891A1; CA2922994A1; CA2922994C; RU2016114526A; US20160350026A1; US20190215352A1; MX2016004935A; WO2015120645A1; US10542062B2; RU2639947C2; SG11201601357TA; US20180219930A1; SG10201703412SA; BR112016005391B8; IL244830B; EP3026585A1

Abstract

modalidades da presente invenção fornecem um método para buscar um ponto divisório de corrente de dados com base em um servidor. nas modalidades da presente invenção, um ponto divisório de corrente de dados é buscado por determinar se pelo menos uma parte de dados em uma janela de m janelas atende uma condição predefinida, e quando a pelo menos uma parte de dados na janela não atende a condição predefinida, um comprimento de n*u é pulado, de modo a obter um próximo ponto divisório potencial, desse modo aumentando a eficiência na busca por um ponto divisório de corrente de dados.

Description

“MÉTODO E SERVIDOR PARA BUSCAR PONTO DIVISÓRIO DE CORRENTE DE DADOS COM BASE EM SERVIDOR” [0001] A presente invenção se refere ao campo de tecnologias de informações, e em particular, a um método e um servidor para buscar um ponto divisório de corrente de dados com base em um servidor.

ANTECEDENTES [0002] Na medida em que os montantes de dados continuam crescendo, torna-se um desafio crucial fornecer armazenamento de dados suficiente no campo do armazenamento atualmente. No presente, uma maneira de lidar com um desafio como esse é usando uma tecnologia de desduplicação por meio de uma característica de redundância de dados que precisam ser armazenados, de modo a reduzir um montante de dados armazenados.

[0003] Em um algoritmo de eliminar dados duplicados com base em uma fatia definida por conteúdo (Fatia Definida por Conteúdo, CDC) na técnica anterior, uma corrente de dados a ser armazenada é primeiramente dividida em múltiplas fatias de dados. Para dividir uma corrente de dados em fatias de dados, um ponto divisório adequado precisa ser encontrado na corrente de dados, e os dados entre dois pontos divisórios adjacentes na corrente de dados formam uma fatia de dados. Um valor característico de uma fatia de dados é calculado, de modo a se constatar se existem fatias de dados tendo um mesmo valor característico. Se forem encontradas fatias de dados tendo um mesmo valor característico, é considerado que existem dados duplicados. Especificamente, em uma tecnologia de eliminar dados duplicados com base em uma fatia definida por conteúdo, uma técnica de janela deslizante (Técnica de Janela Deslizante) é aplicada para que se busque um ponto divisório de uma fatia com base no conteúdo de um arquivo, isto é, uma impressão digital Rabin de dados em uma janela é calculada para determinar um ponto divisório de corrente de dados. Presume-se que um ponto divisório é buscado da esquerda para a direita em uma corrente de dados. Uma

Petição 870160008725, de 11/03/2016, pág. 273/698

2/200 impressão digital de dados em uma janela deslizante é calculada de cada vez, e após uma operação de módulo ser realizada em um valor de impressão digital com base em um determinado número inteiro K, um resultado da operação de módulo é comparado com um determinado resto R. Se o resultado da operação de módulo for igual ao determinado resto R, a extremidade direita da janela é um ponto divisório de corrente de dados. Se assim não for, a janela continua a ser deslizada na direção direita em um byte, e o cálculo e a comparação são realizados em sequência e ciclicamente até que se chegue à extremidade da corrente de dados. Em um processo de eliminar dados duplicados com base em uma fatia definida por conteúdo, uma grande quantidade de recursos de computação precisa ser consumida para buscar um ponto divisório de corrente de dados, o que, portanto, se torna um obstáculo para aperfeiçoar o desempenho de eliminação de dados duplicados.

SUMÁRIO [0004] De acordo com um primeiro aspecto, uma modalidade da presente invenção fornece um método para buscar um ponto divisório de corrente de dados com base em um servidor, onde uma regra é predefinida no servidor, onde a regra é: para um ponto divisório potencial k, determinar M pontos p_x, uma janela W_x[p_x-A_x, p_x+B_x] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela ^Wx [ Px - ^Ax , Px + ^Bx ], onde x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros; e o método inclui:

(a) determinar um ponto p_Iz e uma janela ^Wz [ p,z - Az, pz + ^Bz ] que corresponde ao ponto p_z para um ponto divisório potencial corrente k_t de acordo com a regra, onde i e z são números inteiros, e 1<z<M;

(b) determinar se pelo menos uma parte dos dados na janela W _z [p_z- A, p_l2 + B_z ] atende uma condição predefinida C_z; e quando a pelo menos uma parte de dados na janela W_z [ p_z - A, p_z + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U

Petição 870160008725, de 11/03/2016, pág. 274/698

3/200 para buscar um ponto divisório de corrente de dados a partir do ponto p_Iz ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que IIB_z 11+ max_x(II A_x ||+||(k_t -p_x)||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela ^Wx [^Px ^Αχ, ^Pix+^Bx ] de M janelas do ponto divisório potencial corrente ^ki atende a C k condição predefinida ^x, selecionar o ponto divisório potencial corrente ¹, como um ponto divisório de corrente de dados.

[0005] Com referência ao primeiro aspecto, em uma primeira maneira de implantação possível, a regra inclui adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições A_e = A_f, Be = B_f, e Ce = C_f.

[0006] Com referência à primeira maneira de implantação possível do primeiro aspecto, em uma segunda maneira de implantação possível, a regra inclui adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos pe e pf, estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.

[0007] Com referência à primeira maneira de implantação possível ou à segunda maneira de implantação possível do primeiro aspecto, em uma terceira maneira de implantação possível, a regra inclui adicionalmente que uma distância entre os pelo menos dois pontos pe e pf é de 1 U.

[0008] Com referência ao primeiro aspecto, ou a qualquer uma da primeira à terceira maneiras de implantação possíveis do primeiro aspecto, em uma quarta maneira de implantação possível, determinar se pelo menos uma parte de dados na janela W_iz [ p_Iz- A_z, p_z+B_z] atende uma condição predefinida Cz inclui especificamente:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ p_lz - A_z, p_z + B_z] atende a condição predefinida Cz.

[0009] Com referência à quarta maneira de implantação possível do primeiro aspecto, em uma quinta maneira de implantação possível,

Petição 870160008725, de 11/03/2016, pág. 275/698

4/200 determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_z [ p_z - A, p_iz+B_z ] atende a condição predefinida C_z é especificamente: determinar, usando uma função hash, se a pelo menos uma parte de dados na janela W_lz [ p_lz - A, p_z+B_z ] atende a condição predefinida C_z.

[00010] Com referência ao primeiro aspecto, ou a qualquer uma da primeira à quinta maneiras de implantação possíveis do primeiro aspecto, em uma sexta maneira de implantação possível, quando a pelo menos uma parte de dados na janela W_lz [ p_lz - A, P_z+B_z ] não atende a condição predefinida Cz, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto piz ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W [ p_tc - A_c, p_tc + B_c ] que corresponde a um ponto p_cc que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [p_lz- A, p_z+B_z ] ou um limite à esquerda de uma janela W_ic [ p_cc - A_c, p_c+B_c ] que corresponde a um ponto p_ic que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_lz [ p_lz - A, p_z + B_z ], onde o ponto p_ic determinado para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.

[00011] Com referência à quarta maneira de implantação possível do primeiro aspecto, em uma sétima maneira de implantação possível, determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_z [ p_iz- A_z, p_iz + B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_iz [ p_iz - A_z, p_iz + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é

Petição 870160008725, de 11/03/2016, pág. 276/698

5/200 formado por 8 bits, que são indicados por a_m1, ..., e a_m8, representando do

primeiro bit ao	oitavo b
correspondem	aos F
C ^a1,1	^a1,2 ··	^a1,8 '
^a2,1	^a2,2 ··	^a2,8
Ç ^a F*H ,1	^aF *H ,2 ··	^aF*H ,8 J
V = am,n	-1, onde a	m,n ^rep^re

it de um emésimo byte nos F*H bytes, bits que *H bytes podem ser representados como:

, onde quando a =1, V =1, e quando a =0, ’ ~ m,n ’ am,n ’ ~ m ,n ’ qualquer um dentre a_{m 1}, ..., e a_{m 8}, uma matriz

V é obtida de acordo com uma relação de conversão entre a e V a a s m ,n am,n partir dos bits que correspondem aos F*H bytes, a matriz V_a é representada

C v v .. ... v .. 1 como:

^F a1,1	^v a1,2	a1,8
V 2,1	V ^v a2,2	V ^v a2,8
_Ç ^VaF*H ,1	^VaF*H ,2	^VaF*H ,8

, F*H*8 números aleatórios são selecionados a partir de números aleatórios seguindo-se uma distribuição normal para formar h 1 ^rl1,8 h

^,l2,8 uma matriz R, a matriz R é representada como:

' ^h1,1 ^h2,1 ^h1,2 ^h2,2 h

^,lF*H ,2 h

^riF*H ,8 J números aleatórios em uma emésima linha da matriz V_a e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1 * h_m1 + V_am,₂ * h_{m 2}+···+ V_am8*h_m8, S_a1, S_a2, e S_aF*_H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entreS_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W [ P_iz-A_z, P_iz + B_z ] atende a condição predefinida C_z.

[00012] De acordo com um segundo aspecto, uma modalidade da presente invenção fornece um método para buscar um ponto divisório de corrente de dados com base em um servidor, onde uma regra é predefinida no servidor, onde a regra é: para um ponto divisório potencial k, determinar M janelas W_x [k - A_x, k+B_x ], e uma condição predefinida C_x que corresponde à

Petição 870160008725, de 11/03/2016, pág. 277/698

6/200 janela W_x [k - A_x, k+B_x ], onde x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_x são números inteiros; e o método inclui:

(a) determinar uma janela correspondente ^W z [^k - Az, ^k + ^Bz ] para um ponto divisório potencial corrente k, de acordo com a regra, onde i e z são números inteiros, e 1<z<M;

(b) determinar se pelo menos uma parte de dados na janela W_lz [ k, A_z, k_t + B_z] atende uma condição predefinida C_z; e quando a pelo menos uma parte de dados na janela W„ [ k, - A,, k, + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que || B_z || +max_x(|| A_x ||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela W_x [k, A_x, k, + B_x ] de M janelas do ponto divisório potencial corrente k, atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k, como um ponto divisório de corrente de dados.

[00013] Com referência ao segundo aspecto, em uma primeira maneira de implantação possível, a regra inclui adicionalmente que pelo menos duas janelas W_ie [ k, - A_e, k, + B_e ] e W_lf [ k, - A_f, k, + B_f ] atendem as condições | ^Ae ^{+ B}e ^{|=| A}f ^{+ B}f ^{1 e C}e = ^Cf [00014] Com referência à primeira maneira de implantação possível do segundo aspecto, em uma segunda maneira de implantação possível, a regra inclui adicionalmente que A_e e A_f são números inteiros positivos.

[00015] Com referência à primeira maneira de implantação possível ou à segunda maneira de implantação possível do segundo aspecto, em uma terceira maneira de implantação possível, a regra inclui adicionalmente que A_e 1=Af e B_e +1 = Bf.

Petição 870160008725, de 11/03/2016, pág. 278/698

7/200 [00016] Com referência ao segundo aspecto, ou qualquer uma dentre a primeira à terceira maneiras de implantação possíveis do segundo aspecto, em uma quarta maneira de implantação possível, determinar de pelo menos uma parte de dados na janela W_z [ k, - A, k,+B_z ] atende a condição predefinida C_z inclui especificamente:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_z [k, - A_z, k_t + B_z] atende a condição predefinida C_z.

[00017] Com referência à quarta maneira de implantação possível do segundo aspecto, em uma quinta maneira de implantação possível, determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_z [k, - A_z, k_t+B_z] atende a condição predefinida C_z é especificamente: determinar, usando uma função hash, se a pelo menos uma parte de dados na janela W_z [ k, - A, k,+B_z ] atende a condição predefinida C_z.

[00018] Com referência ao segundo aspecto, ou a qualquer uma da primeira à quinta maneiras de implantação possíveis do segundo aspecto, em uma sexta maneira de implantação possível, quando a pelo menos uma parte de dados na janela W_z [k_t - A_z, k_t + B_z ] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto divisório potencial corrente k_t ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W [ki -A_c, k,+B_c ] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_z [k_t - A_z, k_t + B_z ] ou um limite à esquerda de uma janela W_ic | k, -A_c, k,+B_c ] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_z [ k , - Az, k, + B_z ], onde a janela ^W [ ^k _; - A_c, k_; + B_c ] determinada para o novo ponto divisório potencial é uma janela colocada como a primeira em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados de M janelas que são determinadas para o novo ponto divisório potencial

Petição 870160008725, de 11/03/2016, pág. 279/698

8/200 de acordo com a regra.

[00019] Com referência à quarta maneira de implantação possível do segundo aspecto, em uma sétima maneira de implantação possível, determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [k_t - A_z, k_t + B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_lz [ k_l - A_z, k_l + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é formado por 8 bits, que são indicados como a_m1,..., e a_m8 representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que correspondem í ^a1,1 ^a2,1 ^ai,2 ^a2,2 aos ^ai,8 ^a2,8

F*H bytes podem ser representados como: í ^{, onde} q^uando amn=^1, Vamn =^{1, e} q^uando amn =^0, ( ^a F*H ,1 ^Vam,n =^{-1, onde}

V_a é obtida de acordo com uma relação de conversão entre a e V a partir a s m,n am,n ~ a

m,n ^aF*H ,8 y , representa qualquer um dentre a_m1,..., e a_m8, uma matriz dos bits que correspondem aos F*H bytes, a matriz V_a é representada como: í V V . . ... V . í

^F a1,1	a1,2	a1,8
Va 2,1	V · a2,2	V ^v a2,8
^^VaF*H ,1	^VaF*H ,2	^VaF*H,8 _y

, F*H*8 números aleatórios são selecionados a partir de números aleatórios seguindo-se uma distribuição í ^h1,1

- — - — - - ^h2,1 uma matriz R, a matriz R é representada como:

normal ^h1,2 ^h2,2 para formar h 3

1,8 h

^,l2,8 h

^lF*H ,1 h

^,lF*H ,2 h

^rlF *H ,8 y números aleatórios em uma emésima linha da matriz V_a e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1* h_m1 + V_am2* h_m2+...+ V_am8*h_m8, S_a1, S_a2, e S_aFH são obtidos de um mesmo modo, uma

Petição 870160008725, de 11/03/2016, pág. 280/698

9/200 quantidade K de valores maiores que 0 entre S_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_lz [ k_t-A_z, k_l + B_z ] atende a condição predefinida C_z.

[00020] De acordo com um terceiro aspecto, uma modalidade da presente invenção fornece um servidor para buscar um ponto divisório de corrente de dados, onde o servidor inclui uma unidade de processamento central e uma memória principal, a unidade de processamento central se comunica com a memória principal, e uma regra é predefinida no servidor, onde a regra é: para um ponto divisório potencial k, determinar M pontos p_x, uma janela W_x [ p_x - A_x, p_x+B_x] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [ p_x - A_x, p_x+B_x], onde x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_x são números inteiros;

e a memória principal é configurada para armazenar uma instrução executável, e a unidade de processamento central executa a instrução executável para realizar as seguintes etapas:

(a) determinar um ponto p_Iz e uma janela ^W [ plz - Az, Piz+^Bz] que corresponde ao ponto plz para um ponto divisório potencial corrente k_t de acordo com a regra, onde i e z são números inteiros, e 1<z<M;

(b) determinar se pelo menos uma parte de dados na janela W_lz [p_lzA, p_z+B_z] atende uma condição predefinida C_z; e quando a pelo menos uma parte de dados na janela W_lz [ p_lz - A, p_iz+ B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p_lz ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que || B_z || +max_x( || A_x || + || (k. - p _ix) ||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela W_x [ p_x A_x, p_x+B_x] de M janelas do ponto divisório potencial corrente k_i atende a

Petição 870160008725, de 11/03/2016, pág. 281/698

10/200 condição predefinida C_x, selecionar o ponto divisório potencial corrente k como um ponto divisório de corrente de dados.

[00021] Com referência ao terceiro aspecto, em uma primeira maneira de implantação possível, a regra inclui adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições A_e = A_f, B_e=B_f, e C_e=c _f .

[00022] Com referência à primeira maneira de implantação possível do terceiro aspecto, em uma segunda maneira de implantação possível, a regra inclui adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos p_e e p_f, estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.

[00023] Com referência à primeira maneira de implantação possível ou a segunda maneira de implantação possível do terceiro aspecto, em uma terceira maneira de implantação possível, a regra inclui adicionalmente que uma distância entre os pelo menos dois pontos p_e e p_f é de 1 U.

[00024] Com referência ao terceiro aspecto, ou qualquer uma dentre a primeira à terceira maneiras de implantação possíveis, em uma quarta maneira de implantação possível, a unidade de processamento central é especificamente configurada para:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_z [ p_z - A, p_z+B_z] atende a condição predefinida C_z.

[00025] Com referência à quarta maneira de implantação possível do terceiro aspecto, em uma quinta maneira de implantação possível, a unidade de processamento central é especificamente configurada para determinar, usando uma função hash, se a pelo menos uma parte de dados na janela W_Iz [ p_Iz - A, p_z+B_z] atende a condição predefinida C_z.

[00026] Com referência ao terceiro aspecto, ou a qualquer uma da primeira à quinta maneiras de implantação possíveis, em uma sexta maneira de implantação possível, quando a pelo menos uma parte de dados na janela

Petição 870160008725, de 11/03/2016, pág. 282/698

11/200

W_iz [ p_iz- A, p_iz+B_z] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto p_lz ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W_ic [p_cc -A_c, p_ic+B_c ] que corresponde a um ponto p_cc que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [ p_lz - A, p_lz+B_z] ou um limite à esquerda de uma janela W_ic [p_c -A_c, p_ic+B_c] que corresponde a um ponto p_ic que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_iz [ p_iz - A, p_z+B_z ], onde o ponto p_c determinado para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.

[00027] Com referência à quarta maneira de implantação possível do terceiro aspecto, em uma sétima maneira de implantação possível, determinar, pela unidade de processamento central usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ p_iz - A_z, p_iz + B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_iz [ p_iz - A_z, p_iz + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é formado por 8 bits, que são indicados como a_m1, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que

F*H bytes podem ser representados como:

correspondem aos

' ^ai,1	^ai,2 ·	· ^ai,8 '
^a2,1	^a2,2 ·	· ^a2,8
( ^a f*h ,1	^aF *H ,2 ·	· ^aF*H ,8 /

, onde quando a =1, V =1, e quando a 0, V > ~ m ,n ’ am,n ’ ~ m,n ’ am,n =-1, onde a_mn ’ m ,n representa qualquer um dentre a_m1, ..., e a_m8, uma matriz V_a é obtida de acordo com uma relação de conversão entre a e V a partir dos s m,n am,n ~

Petição 870160008725, de 11/03/2016, pág. 283/698

12/200 bits que correspondem aos F*H bytes, a matriz V_amn é representada como:

' ν_Λ,	^Va1,2	V 1 ^F a1,8
V 2,1	V a2,2	V ^v a2,8
V V aF*H ,1	V ^v aF*H ,2	.. V ^v aF*H ,8 J

F*H*8 números aleatórios são selecionados a partir de números aleatórios seguindo-se uma distribuição Γ ^h1,1

- — - — - - ^h2,1 uma matriz R, a matriz R é representada como:

normal ^h1,2 ^h2,2 h

^rlF*H ,2 para formar h 1

1,8 h

^fl2,8 • »5 h

^hF*H ,8 J números aleatórios em uma emésima linha da matriz V_a e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1* h_m1 + V_am2* h_m2+...+ V_am,₈*h_m,₈, S_a1, S_a2, e S_aF*_Hsão obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entre S_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W [ P_iz-A_z, P_iz + B_z ] atende a condição predefinida C_z.

De acordo com um quarto aspecto, uma modalidade da presente invenção fornece um servidor para buscar um ponto divisório de corrente de dados, onde o servidor inclui uma unidade de processamento central e uma memória principal, a unidade de processamento central se comunica com a memória principal, e uma regra é predefinida no servidor, onde a regra é: para um ponto divisório potencial k, determinar M janelas W_x [ k- A_x, k + B_x] e uma condição predefinida C_x que corresponde à janela W_x [ k- A_x, k + B_x] onde x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_xsão números inteiros; e a memória principal é configurada para armazenar uma instrução executável, e a unidade de processamento central executa a instrução executável para realizar as seguintes etapas:

(a) determinar uma janela correspondente W [^k, - Az, ^k + ^Bz ] para um ponto divisório potencial corrente k_i de acordo com a regra, onde i e z são

Petição 870160008725, de 11/03/2016, pág. 284/698

13/200 números inteiros, e 1<z<M;

(b) determinar se pelo menos uma parte dos dados na janela W_lz [ k, A_z, k,+B_z] atende uma condição predefinida C_z; e quando a pelo menos uma parte de dados na janela Wz [ k, - A, k, + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k, ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que || B_z || +max_x(|| A_x ||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela W_Ix [ k, A_x, k,+B_x ] de M janelas do ponto divisório potencial corrente k, atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k, como um ponto divisório de corrente de dados.

[00028] Com referência ao quarto aspecto, em uma primeira maneira de implantação possível, a regra inclui adicionalmente que pelo menos duas janelas W_Ie [ k, - A_e, k, + B_e ] e w _f [ k, - a _f, k, + b _f ] atendem as condições | ^Ae + ^Be|=| Af + Bf | e ^Ce = Cf .

[00029] Com referência à primeira maneira de implantação possível do quarto aspecto, em uma segunda maneira de implantação possível, a regra inclui adicionalmente que A_e e A _f são números inteiros positivos.

[00030] Com referência à primeira maneira de implantação possível ou à segunda maneira de implantação possível do quarto aspecto, em uma terceira maneira de implantação possível, a regra inclui adicionalmente A_e-1 = A_f e Be +1 = B_f .

[00031] Com referência ao quarto aspecto, ou qualquer uma dentre a primeira à terceira maneiras de implantação possíveis, em uma quarta maneira de implantação possível, a unidade de processamento central é especificamente configurada para:

determinar, usando-se uma função aleatória, se a pelo menos uma

Petição 870160008725, de 11/03/2016, pág. 285/698

14/200 parte de dados na janela W_iz [k, - A_z, k,+B_z] atende a condição predefinida C_z.

[00032] Com referência à quarta maneira de implantação possível do quarto aspecto, em uma quinta maneira de implantação possível, a unidade de processamento central é especificamente configurada para determinar, usando uma função hash, se a pelo menos uma parte de dados na janela Wz [k, -A_z, k,+B_z] atende a condição predefinida C_z.

[00033] Com referência ao quarto aspecto, ou qualquer uma da primeira à quinta maneiras de implantação possíveis, em uma sexta maneira de implantação possível, quando a pelo menos uma parte de dados na janela W_z [k_t - A_z, k_t + B_z ] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto divisório potencial corrente k_t ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial e, de acordo com a regra, um limite à esquerda de uma janela W_ic [k, -A_c, k, + B_c ] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [k_t - A_z, k_t + B_z ], ou um limite à esquerda de uma janela Wic [kl -A_c, k_i + B_c] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_iz [ k_t - A_z, k_t + B_z ], onde a janela W_ic[k_l-A_c, k_l+B_c] determinada para o novo ponto divisório potencial é a janela colocada como a primeira em uma sequência, que é obtida de acordo com a direção de busca de corrente de dados, de M janelas que são determinadas para o novo ponto divisório potencial de acordo com a regra.

[00034] Com referência à quarta maneira de implantação possível do quarto aspecto, em uma sétima maneira de implantação possível, determinar, pela unidade de processamento central usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W,z [ k, - A_z, k, + B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_z [ k_t - A_z, k_t + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é

Petição 870160008725, de 11/03/2016, pág. 286/698

15/200 formado por 8 bits, que são indicados por a_m1, ..., e a_m8, representando do

primeiro bit ao	oitavo b
correspondem	aos F
C ^a1,1	^a1,2 ··	^a1,8 '
^a2,1	^a2,2 ··	^a2,8
Ç ^a F*H ,1	^aF *H ,2 ··	^aF*H ,8 J
V = am,n	-1, onde a	mn ^rep^re

, onde quandoa =1, V =1, e quando a =0, ’ ~ m,n ’ am,n ’ ~ m ,n ’ qualquer um dentre a_{m 1}, ..., e a_{m 8}, uma matriz

C v v .. ... v .. í como:

^F a1,1	a1,2	a1,8
Va 2,1	V a2,2	V ^v a2,8
_Ç ^VaF*H ,1	^VaF*H ,2	^VaF*H ,8

, F*H*8 números aleatórios são selecionados a partir de números aleatórios seguindo-se uma distribuição normal para formar h í ^H1,8 h

^fl2,8 uma matriz R, a matriz R é representada como:

' ^h1,1 ^h2,1 ^h1,2 ^h2,2 h

^,lF*H ,2 h

^riF*H ,8 J números aleatórios em uma emésima linha da matriz V_a e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1 * h_m1 + V_am2 * h_{m 2}+···+ V_am8*h_m8, S_a1, S_a2, e S_aF*_H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entreS_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W [ P_iz-A_z, P_iz + B_z ] atende a condição predefinida C_z.

[00035] De acordo com um quinto aspecto, uma modalidade da presente invenção fornece um servidor para buscar um ponto divisório de corrente de dados, onde uma regra é predefinida no servidor, onde a regra é: para um ponto divisório potencial k, determinar M pontos p_x, uma janela W_x[ P_x - A_x, P_x+B_x ] que corresponde ao ponto p_x, e uma condição predefinida C_x

Petição 870160008725, de 11/03/2016, pág. 287/698

16/200 que corresponde à janela W_x [ p_x - A_x, p_x+B_x ], onde x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros; e o servidor inclui: uma unidade de processamento, configurada para realizar a etapa (a):

(a) determinar um ponto p_Iz e uma janela ^Wz [ ptz - A, Pz + ^Bz ] que corresponde ao ponto pz para um ponto divisório potencial corrente k_t de acordo com a regra, onde i e z são números inteiros, e 1<z<M; e uma unidade de julgamento e processamento, configurada para: determinar se pelo menos uma parte de dados na janela ^WIZ [ p z - Az., pIZ + ^Bz ] atende uma condição predefinida C_z;

quando a pelo menos uma parte de dados na janela W_z [ p_z - A, p_z + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p_z ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que IIB_z 11+ max_x(II A_x 11+11( k_I -p_x)||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a) para o novo ponto divisório potencial; e quando pelo menos uma parte de dados em cada janela ^Wix ^[ pix - ^Ax , p_ix+B_x ] de M janelas do ponto divisório potencial corrente k_I atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_I, como um ponto divisório de corrente de dados.

[00036] Com referência ao quinto aspecto, em uma primeira maneira de implantação possível, a regra inclui adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições A_e = A_f, B_e = B_f, e C_e = C_f.

[00037] Com referência à primeira maneira de implantação possível do quinto aspecto, em uma segunda maneira de implantação possível, a regra inclui adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos p_e e p_f estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.

Petição 870160008725, de 11/03/2016, pág. 288/698

17/200 [00038] Com referência à primeira maneira de implantação possível ou à segunda maneira de implantação possível do quinto aspecto, em uma terceira maneira de implantação possível, a regra inclui adicionalmente que uma distância entre os pelo menos dois pontos p_e e p_f é de 1 U.

[00039] Com referência ao quinto aspecto, ou qualquer uma dentre a primeira à terceira maneiras de implantação possíveis, em uma quarta maneira de implantação possível, a unidade de julgamento e processamento determina especificamente, usando uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ p_lz - A, p_iz+B_z] atende a condição predefinida C_z.

[00040] Com referência à quarta maneira de implantação possível do quinto aspecto, em uma quinta maneira de implantação possível, a unidade de julgamento e processamento é especificamente configurada para determinar, usando uma função hash, se a pelo menos uma parte de dados na janela W_lz [ p_lz- A_z, p_iz + B_z] atende a condição predefinida C_z.

[00041] Com referência ao quinto aspecto, ou qualquer uma da primeira à quinta maneiras de implantação possíveis, em uma sexta maneira de implantação possível, a unidade de julgamento e processamento é configurada para: quando a pelo menos uma parte de dados na janela W_lz [p_lzA.., p_z+B_z] não atende a condição predefinida C_z, pular o mínimo N de unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p_lz ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, onde a unidade de determinação realiza a etapa (a) para o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W_ic [ p_ic - A_c, p_ic+B_c ] que corresponde a um ponto p_c que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [ p_lz - A, p_iz+B_z] ou um limite à esquerda de uma janela W_ic [p_c -A_c, p_c+B_c ], que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W _z [ p_lz

Petição 870160008725, de 11/03/2016, pág. 289/698

18/200

- A, P_iz+B_z ], ^{onde a} janela W_Ic [ p_Ic - A_c, p_Ic+B_c ] determinada para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.

[00042] Com referência à quarta maneira de implantação possível do quinto aspecto, em uma sétima maneira de implantação possível, o fato de que a unidade de julgamento e processamento seja especificamente configurada para determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_ic [ p_c - A_c, p_Ic+B_c ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_lz [ p_Iz - A_z, p_Iz + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é formado por 8 bits, que são indicados como a_m1, e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que

correspondem	aos F*H bytes podem ser representados	como:
' ^ai,1	^a1,2	... ^a1,8
^a2,1	^a2,2	... ^a2,8	, onde	quandoa =1, V =1, e quando ~ m,n ’ am,n ’ ~	a =0, m ,n ’
( ^a F*H ,1	^aF *H ,2	... ^aF*H ,8 >
V =- am,n	1, onde	a_mn representa qualquer um dentre a_m1, ..., e a_{m 8}, uma matriz
V_a é obtida de acordo com uma relação de conversão entre a e a s m ,n	V a am,n
partir dos bits que correspondem	aos F*H bytes, a matriz V_a é representada
	' Va_U	V_fl1,2 -	V ^F a1,8
como:	V_a 2,1	V ··· ^v a2,2	V ^v a2,8	, FH8 números aleatórios são selecionados
	_< ^VaF*H ,1	^VaF*H, 2 ’ ”	^VaF*H ,8

a partir de números aleatórios seguindo-se uma distribuição normal para formar

Petição 870160008725, de 11/03/2016, pág. 290/698

19/200

	' ^h1,1	^h1,2 ··	h j 1,8
	h₂,	h ··	h^
uma matriz R, a matriz R é representada como:	2,1	2,2	2,8 • 5
	h V F*H ,1	h ⁿF*H ,2	h f *h ,8 y
números aleatórios em uma emésima linha da matriz V e	em uma	emésima

linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1 * h_m1 + V_am2 * h_{m 2}+···+ V_am,₈*h_m8, S_a1, S_a2, e S_aF*._H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entreS_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W [ P_iz-A_z, P_iz + B_z ] atende a condição predefinida C_z.

[00043] De acordo com um sexto aspecto, uma modalidade da presente invenção fornece um servidor para buscar um ponto divisório de corrente de dados, onde uma regra é predefinida no servidor, onde a regra é: para um ponto divisório potencial k , determinar M janelas W_x [k- A_x, k+B_x] e uma condição predefinida C_x que corresponde à janela ^Wx [ k - ^Ax , k + ^Bx ], onde x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros; e o servidor inclui: uma unidade de determinação, configurada para realizar a etapa (a):

(a) determinar uma janela correspondente ^{W k} - Az, ^k, + ^Bz ] para um ponto divisório potencial corrente k, de acordo com a regra, onde i e z são números inteiros, e 1<z<M; e uma unidade de julgamento e processamento, configurada para: determinar se pelo menos uma parte de dados na janela W [ k, - Az, k,+Bz ] atende uma condição predefinida C_z quando a pelo menos uma parte de dados na janela W [ k, - Az, k, + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k_i ao longo de uma direção de buscar um ponto divisório de

Petição 870160008725, de 11/03/2016, pág. 291/698

20/200 corrente de dados, onde N*U não é maior que || B_z || +max_x(|| A_x ||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela W_a [ k_I A_x, k_I+B_x ] de M janelas do ponto divisório potencial corrente k_I atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_Icomo um ponto divisório de corrente de dados.

[00044] Com referência ao sexto aspecto, em uma primeira maneira de implantação possível, a regra inclui adicionalmente que pelo menos duas janelas W_Ie [ k_I - A_e, k_I + B_e ] e w_If [ k_I - A_f, k_I + b _f ] atendem as condições | ^Ae ^{+ B}e ^|=| A f ⁺ B f ^{1 e C}e = C _f .

[00045] Com referência à primeira maneira de implantação possível do sexto aspecto, em uma segunda maneira de implantação possível, a regra inclui adicionalmente que A_e e A_f são números inteiros positivos.

[00046] Com referência à primeira maneira de implantação possível ou à segunda maneira de implantação possível do sexto aspecto, em uma terceira maneira de implantação possível, a regra inclui adicionalmente A_e-1= A_f e ^Be +1= B_f .

[00047] Com referência ao sexto aspecto, ou qualquer uma dentre a primeira à terceira maneiras de implantação possíveis, em uma quarta maneira de implantação possível, a unidade de julgamento e processamento é especificamente configurada para:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_z [ k_t - A, k_t + B_z ] atende a condição predefinida C_z.

[00048] Com referência à quarta maneira de implantação possível do sexto aspecto, em uma quinta maneira de implantação possível, a unidade de julgamento e processamento é especificamente configurada para determinar, usando uma função hash, se a pelo menos uma parte de dados na janela W_iz [ k_I - A., k_I+B_z] atende a condição predefinida C_z.

[00049] Com referência ao sexto aspecto, ou qualquer uma da

Petição 870160008725, de 11/03/2016, pág. 292/698

21/200 primeira à quinta maneiras de implantação possíveis, em uma sexta maneira de implantação possível, a unidade de julgamento e processamento é configurada para: quando a pelo menos uma parte de dados na janela W_z [ k_t A_z, k_l + B_z ] não atende a condição predefinida C_z, pular o mínimo N de unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k_t ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, a unidade de determinação realiza a etapa (a) para o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W [kl -A_c, k_l+B_c ] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [ k_t - A_z, k_t + B_z ] ou um limite à esquerda de uma janela Wlc [kl -A_c, k_l+B_c ] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_lz [k_t A_z, k_t + B_z ], onde a janela W_lc [k_l -A_c, k_l+B_c] determinada para o novo ponto divisório potencial é uma janela colocada como a primeira em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M janelas que são determinadas para o novo ponto divisório potencial de acordo com a regra.

[00050] Com referência à quarta maneira de implantação possível do sexto aspecto, em uma sétima maneira de implantação possível, o fato de que a unidade de julgamento e processamento para determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ k_t A_z, k + B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_lz [ k_t - A_z, k + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é formado por 8 bits, que são indicados como a_ml,..., e a_m8 representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que correspondem aos F*H bytes podem ser representados como:

Petição 870160008725, de 11/03/2016, pág. 293/698

22/200 ' ^a ^a2,1 «1,2 ^a2,2 ^ai,8 ^a2,8 ^{, onde} q^uando amn =1, l =1, ^e q^uando amn =^0,

V ^a F*H ,1 ^Vamn =^{-1, onde}

V é obtida de acordo com uma relação de conversão entre a e V a partir a m ,n am ,n a

m,n ^aF*H ,8 y , representa qualquer um dentre a_m1e a_m8, uma matriz dos bits que correspondem aos F*H bytes, a matriz V_a é representada como:

C v v .. ... v .. í

^v a1,1	a1,2	a1,8
Va 2,1	V a2,2	^Va 2,8
^^VaF*H ,1	^VaF*H ,2	^VaF*H,8 _y

, F*H*8 números aleatórios são selecionados a partir de números aleatórios seguindo-se uma distribuição

C ^h1,1

- — - — - - ^h2,1 uma matriz R, a matriz R é representada como:

normal ^h1,2 ^h2,2 para formar h í

1,8 h

^,l2,8 h

^lF*H ,1 h

^,lF*H ,2 h

^rlF *H ,8 y números aleatórios em uma emésima linha da matriz V_a e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1* h_m1 + V_am2* h_m2+...+ V_am8*h_m8, S_a1, S_a2, e S_aFH são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entre S_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_iz [ k_i- A_z, k_t + B_z ] atende a condição predefinida C_z.

[00051] De acordo com um sétimo aspecto, uma modalidade da presente invenção fornece um meio de armazenamento legível por computador, onde o meio de armazenamento legível por computador é configurado para armazenar uma instrução executável, um servidor executa a instrução executável para buscar um ponto divisório de corrente de dados, e uma regra é predefinida no servidor, onde a regra é: para um ponto divisório potencial k, determinar M pontos p_x, uma janela ^W [Px-^Ax, Px + ^Bx] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à

Petição 870160008725, de 11/03/2016, pág. 294/698

23/200 janela W_x [ p_x - A_x, p_x+B_x ], onde x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros; e o servidor executa a instrução executável para realizar as seguintes etapas:

(a) de acordo com a regra, para um ponto divisório potencial corrente k_t, determinar um ponto p_Iz e uma janela W_Iz [ p_Iz - A.., p_lz+B_z] que corresponde ao ponto p_lz para um ponto divisório potencial corrente k_t de acordo com a regra, onde i e z são números inteiros, e 1<z<M;

(b) determinar se pelo menos uma parte de dados na janela W_lz [p_lzA, p_z+B_z] atende a condição predefinida C_z; e quando a pelo menos uma parte de dados na janela W_lz [ p_lz - A, p_z + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p _z ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que IIB_z 11+ max_x(|| A_x ll+ll( k_I -p_x)||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela W_ix [ p_x A_x, p_x+B_x] de M janelas do ponto divisório potencial corrente k_I atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_I, como um ponto divisório de corrente de dados.

[00052] Com referência ao sétimo aspecto, em uma primeira maneira de implantação possível, a regra inclui adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições A_e = A_f, B_e = B_f, e C_e = C_f.

[00053] Com referência à primeira maneira de implantação possível do sétimo aspecto, em uma segunda maneira de implantação possível, a regra inclui adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos pe e pf, estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.

[00054] Com referência à primeira maneira de implantação possível

Petição 870160008725, de 11/03/2016, pág. 295/698

24/200 ou à segunda maneira de implantação possível do sétimo aspecto, em uma terceira maneira de implantação possível, a regra inclui adicionalmente que uma distância entre os pelo menos dois pontos p_e e p_f é de 1 U.

[00055] Com referência ao sétimo aspecto, ou qualquer uma dentre a primeira à terceira maneiras de implantação possíveis do sétimo aspecto, em uma quarta maneira de implantação possível, determinar, pelo servidor, se pelo menos uma parte de dados na janela W_lz [ p_z - A, p_iz+B_z ] atende a condição predefinida C_z inclui especificamente:

determinar, pelo servidor usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ p_z- A_z, p_iz+B_z] atende a condição predefinida C_z.

[00056] Com referência à quarta maneira de implantação possível do sétimo aspecto, em uma quinta maneira de implantação possível, determinar, pelo servidor usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ p_lz - A, P_z+B_z ] atende a condição predefinida C_z inclui especificamente:

determinar, pelo servidor usando uma função hash, se a pelo menos uma parte de dados na janela W_lz [ p_lz - A, p_z+B_z ] atende a condição predefinida C_z.

[00057] Com referência ao sétimo aspecto, ou qualquer uma da primeira à quinta maneiras de implantação possíveis do sétimo aspecto, em uma sexta maneira de implantação possível, quando a pelo menos uma parte de dados na janela W_lz [ p_lz- A, p_z+B_z] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto p_lz ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W [p_c -A_c, p_c+B_c ] que corresponde a um ponto p_c que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [p_lz

Petição 870160008725, de 11/03/2016, pág. 296/698

25/200

- A, Piz+B_z ] ^{ou um} limite à esquerda de uma janela W_ic [ p - A_c, p_ic+B_c ] que corresponde a um ponto p_cc que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_z [ p_z- A, p_z + B_z ], onde o ponto p_ic determinado para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.

[00058] Com referência à quarta maneira de implantação possível do sétimo aspecto, em uma sétima maneira de implantação possível, determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_z [ p_iz - A, p_iz + B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_z [ p_iz - A, p_iz + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é formado por 8 bits, que são indicados por a_m1, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que *H bytes podem ser representados como:

correspondem	aos F
C ^ai, 1	^a1,2	... ^ai,₈
^a2,1	^a2,2	... ^a2,₈
^a F*H ,1	^aF *H ,2	... ^aF*H ,8 J
V = am,n	-1, onde	amn ^rep^re

, onde quando a =1, V =1, e quando a =0, ’ ~ m,n ’ am,n ’ ~ m ,n ’ qualquer um dentre a_m1, ..., e a_m8, uma matriz

C v v .. ... v .. í como:

^F a1,1	^v a1,2	^v a1,8
V_a 2,1	V ^v a2,2	V ^v a2,8
^^VaF*H ,1	^VaF*H ,2	^VaF*H ,8

, F*H*8 números aleatórios são selecionados a partir de números aleatórios seguindo-se uma distribuição normal para formar

Petição 870160008725, de 11/03/2016, pág. 297/698

26/200

	' ^h1,1	^h1,2 ··	h j 1,8
	h₂,	h ~ ··	h^
uma matriz R, a matriz R é representada como:	2,1	2,2	2,8 • 5
	h V f*h ,1	h ⁿF*H ,2	h f *h ,8 y
números aleatórios em uma emésima linha da matriz V e	em uma	emésima

linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1 * h_m1 + V_am2 * h_{m 2}+···+ V_am,₈*h_m8, S_a1, S_a2, e S_aF*._H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entreS_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_IZ[ P_iz - A, P_iz + B_z ] atende a condição predefinida C_z.

[00059] De acordo com um oitavo aspecto, uma modalidade da presente invenção fornece um meio de armazenamento legível por computador, onde o meio de armazenamento legível por computador é configurado para armazenar uma instrução executável, um servidor executa a instrução executável para buscar um ponto divisório de corrente de dados, e uma regra é predefinida no servidor, onde a regra é: para um ponto divisório potencial k, determinar M janelas W_x [k - A_x, k+B_x], e uma condição predefinida C_x que corresponde à janela W_x [k- A_x, k+B_x], onde x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_x são números inteiros; e o servidor executa a instrução executável para realizar as seguintes etapas:

(a) determinar uma janela correspondente ^Wiz [^k - Az, ^k, + ^Bz ] para um ponto divisório potencial corrente k, de acordo com a regra, onde i e z são números inteiros, e 1<z<M;

(b) determinar se pelo menos uma parte de dados na janela W_lz [ k, A., k_i+B_z ] atende a condição predefinida C_z; e quando a pelo menos uma parte de dados na janela W, [ k, - Az, k, + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório

Petição 870160008725, de 11/03/2016, pág. 298/698

27/200 potencial corrente k ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que || B_z || +max_x(|| A_x ||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela W_x [ p_x A_x, p_x+B_x] de M janelas do ponto divisório potencial corrente k_i atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_icomo um ponto divisório de corrente de dados.

[00060] Com referência ao segundo aspecto, em uma primeira maneira de implantação possível, a regra inclui adicionalmente que pelo menos duas janelas W_ie [ k - A_e, k_I + B_e ] e W_f [ k_t - A_f, k_t + B_f ] atendem as condições | ^Ae ^{+ B}e ^{|=| A}f ^{+ B}f ^{1 e C}e = ^Cf [00061] Com referência à primeira maneira de implantação possível do oitavo aspecto, em uma segunda maneira de implantação possível, a regra inclui adicionalmente que A_e e A_f são números inteiros positivos.

[00062] Com referência à primeira maneira de implantação possível ou à segunda maneira de implantação possível do oitavo aspecto, em uma terceira maneira de implantação possível, a regra inclui adicionalmente que A_e 1=a _f e B_e +1= b _f [00063] Com referência ao oitavo aspecto, ou qualquer uma dentre a primeira à terceira maneiras de implantação possíveis do oitavo aspecto, em uma quarta maneira de implantação possível, determinar, pelo servidor, se pelo menos uma parte de dados na janela W_lz [ k_t - A, k_t + B_z ] atende a condição predefinida C_z inclui especificamente:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ k_t - A, k_I+B_z ] atende a condição predefinida C_z.

[00064] Com referência à quarta maneira de implantação possível do oitavo aspecto, em uma quinta maneira de implantação possível, determinar, pelo servidor usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_Iz [ k_t - A, k_I+B_z] atende a condição predefinida

Petição 870160008725, de 11/03/2016, pág. 299/698

28/200

C_z é especificamente: determinar, pelo servidor usando uma função hash, se a pelo menos uma parte de dados na janela ^{W k} - Az, ^k+Bz ] atende a condição predefinida C_z.

[00065] Com referência ao oitavo aspecto, ou qualquer uma da primeira à quinta maneiras de implantação possíveis do oitavo aspecto, em uma sexta maneira de implantação possível, quando a pelo menos uma parte de dados na janela W_z [k_t - A_z, k_t + B_z ] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto divisório potencial corrente k_t ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W [kl -A_c, k_l+B_c ] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [k_t - A_z, k_t + B_z ] ou um limite à esquerda de uma janela W_lc [k_i -A_c, k_i+B_c ] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela Wlz [ k, - Az, k, + B_z ], onde a janela ^W lc [ ^kl -Ac, k_l + B_c] determinada para o novo ponto divisório potencial é uma janela colocada como a primeira em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M janelas que são determinadas para o novo ponto divisório potencial de acordo com a regra.

[00066] Com referência à quarta maneira de implantação possível do oitavo aspecto, em uma sétima maneira de implantação possível, determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [k_t - A_z, k_t + B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_lz [ k_t - A_z, k_t + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é formado por 8 bits, que são indicados por a_m1, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que

Petição 870160008725, de 11/03/2016, pág. 300/698

29/200

correspondem	aos F
C ^ai,1	^a1,2	··· ^a1,8 '
^a2,1	^a2,2	··· ^a2,8
( ^a F*H ,1	^a _p *_H ,2	··· ^aF*H,8 J
V = am,n	-1, onde	am,n repre

*H bytes podem ser representados como:

C v v .. ... v .. ã como:

^v a1,1	a1,2	^v a1,8
V_a 2,1	V ₂₂ a2,2	^Va 2,8
^^VaF*H ,1	^VaF*H ,2	^VaF*H ,8

uma matriz R, a matriz R é representada como:	C ^h1,1 ^h2,1	^h1,2 · ^h2,2 ·	h ã 1,8 h ^fl2,8
	h p <F*H ,1	h ^,lF*H ,2	h ^t,F*H ,8 J

números aleatórios em uma emésima linha da matriz V_a e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1 * h_m1 + V_am2 * h_{m 2}+···+ V_am8*h_m8, S_a1, S_a2, e S_aF*_H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entreS_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_iz [ k_i- A_z, k_t + B_z ] atende a condição predefinida C_z.

[00067] Nas modalidades da presente invenção, um ponto divisório de corrente de dados é buscado quando se determina se pelo menos uma parte de dados em uma janela de M janelas atende uma condição predefinida, e quando a pelo menos uma parte de dados na janela não atende a condição predefinida, um comprimento de N*U é pulado, de modo a obter um próximo ponto divisório potencial, desse modo aumentando a eficiência de buscar um ponto divisório de corrente de dados.

Petição 870160008725, de 11/03/2016, pág. 301/698

30/200

BREVE DESCRIÇÃO DOS DESENHOS [00068] A Figura 1 é um diagrama esquemático de uma situação de aplicação de acordo com uma modalidade da presente invenção;

[00069] A Figura 2 é um diagrama esquemático de um ponto divisório de corrente de dados;

[00070] A Figura 3 é um diagrama esquemático de buscar um ponto divisório de corrente de dados;

[00071] A Figura 4 é um diagrama esquemático de um método de acordo com uma modalidade da presente invenção;

[00072] A Figura 5 e a Figura 6 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00073] A Figura 7 e a Figura 8 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00074] A Figura 9 e a Figura 10 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00075] A Figura 11, a Figura 12, e a Figura 13 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00076] A Figura 14 e a Figura 15 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00077] A Figura 16 e a Figura 17 são diagramas esquemáticos de determinar se pelo menos uma parte de dados em uma janela atende uma condição predefinida;

[00078] A Figura 18 é um diagrama estrutural de um servidor para desduplicação;

Petição 870160008725, de 11/03/2016, pág. 302/698

31/200 [00079] A Figura 19 é um diagrama estrutural de um servidor para desduplicação;

[00080] A Figura 20 é um diagrama esquemático de um método de acordo com uma modalidade da presente invenção;

[00081] A Figura 21 e a Figura 22 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00082] A Figura 23 e a Figura 24 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00083] A Figura 25 e a Figura 26 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00084] A Figura 27, a Figura 28, e a Figura 29 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados;

[00085] A Figura 30 e a Figura 31 são diagramas esquemáticos de uma maneira de implantação de busca de um ponto divisório de corrente de dados; e [00086] A Figura 32 e a Figura 33 são diagramas esquemáticos de determinar se pelo menos uma parte de dados em uma janela atende uma condição predefinida.

DESCRIÇÃO DE MODALIDADES [00087] Com o contínuo progresso de tecnologias de armazenamento, os montantes de dados gerados crescem cada vez mais, e um grande montante de dados levantou a questão de maiores exigências quanto à capacidade de armazenamento. Os custos com a compra de equipamento de TI aumentam juntamente com a capacidade de armazenamento. Para mitigar o conflito de demanda entre os montantes de

Petição 870160008725, de 11/03/2016, pág. 303/698

32/200 dados e a capacidade de armazenamento e baixar os custos com a compra de equipamento de TI, uma tecnologia de eliminar dados duplicados é introduzida no campo de armazenamento de dados.

[00088] Uma situação de uso de uma modalidade da presente invenção é uma situação de backup de dados. O backup de dados é um processo de fazer, usando um servidor para backup, um backup de dados em outro meio de armazenamento para impedir a perda de dados que se deve a várias razões. A Figura 1 mostra uma arquitetura de um sistema de backup de dados. O sistema de backup de dados inclui clientes (101a, 101b, ..., e 101n), um servidor para backup 102, um servidor para eliminação de dados duplicados (denominado um servidor para desduplicação ou um servidor para eliminação de duplicação de forma resumida) 103, e dispositivos de armazenamento (104a, 104b, ..., e 104n). Os clientes (101a, 101b, ..., e 101n) podem ser servidores do aplicativo, estações de trabalho ou similares. O servidor para backup 102 é configurado para fazer um backup de dados gerados pelos clientes. O servidor para desduplicação 103 é configurado para executar uma tarefa de eliminar dados duplicados para os dados de backup. Os dispositivos de armazenamento (104a, 104b, ..., e 104n) servem de mídia de armazenamento que armazena dados a partir dos quais dados duplicados foram eliminados, e pode ser mídia de armazenamento tal como arranjos de disco e bibliotecas em fita. Os clientes (101a, 101b, ..., e 101n), o servidor para backup 102, o servidor para eliminação de dados duplicados 103, e os dispositivos de armazenamento (104a, 104b, ..., e 104n) podem ser conectados de uma maneira tal como usando um comutador, uma rede de área local, a internet, ou uma fibra óptica. Os supracitados dispositivos podem ser localizados em um mesmo site, ou podem ser localizados em sites diferentes. O servidor para backup 102, o servidor para eliminação de duplicação 103, e os dispositivos de armazenamento (104a, 104b, ..., e 104n) podem ser dispositivos físicos independentes, ou podem ser fisicamente integrados como

Petição 870160008725, de 11/03/2016, pág. 304/698

33/200 um todo em uma implantação específica, ou o servidor para backup 102 e o servidor para eliminação de duplicação 103 são integrados como um todo, ou o servidor para eliminação de duplicação 103 e os dispositivos de armazenamento (104a, 104b, ..., e 104n) são integrados como um todo, ou similares.

[00089] O servidor para desduplicação 103 realiza uma operação de eliminar dados duplicados em uma corrente de dados de dados de backup, onde a operação em geral inclui as seguintes etapas:

(1) buscar um ponto divisório de corrente de dados: buscar um ponto divisório de corrente de dados em uma corrente de dados de acordo com um algoritmo específico;

(2) realizar uma divisão de acordo com o ponto divisório encontrado de corrente de dados para obter fatias de dados;

(3) calcular um valor característico de cada fatia de dados: calcular o valor característico da fatia de dados, o que serve como uma característica para identificar a fatia de dados; e adicionar o valor característico obtido por meio de cálculo a uma lista característica da fatia de dados de um arquivo que corresponde à corrente de dados, onde um algoritmo SHA-1 ou MD5 é em geral usado para calcular um valor característico de uma fatia de dados;

(4) detectar uma mesma fatia de dados: comparar o valor característico da fatia de dados obtida por meio de cálculo com um valor característico que já existe na lista característica da fatia de dados para determinar se uma fatia de dados idêntica existe ou não; e (5) eliminar bloco de dados duplicados: caso seja constatado pela detecção da mesma fatia de dados que um valor característico igual àquele da fatia de dados existe na lista característica da fatia de dados, pular o armazenamento da fatia de dados ou determinar se armazenar ou não a fatia de dados de acordo com uma quantidade de armazenamento de fatias de dados duplicados que é determinada de acordo com uma política do backup.

Petição 870160008725, de 11/03/2016, pág. 305/698

34/200 [00090] Pode ser conhecido, a partir da etapa de realizar, pelo servidor para desduplicação 103, a operação de eliminar dados duplicados em uma corrente de dados de dados de backup, que a busca de um ponto divisório de corrente de dados, servindo como uma etapa chave na operação de eliminar dados duplicados, determina diretamente o desempenho de eliminação de dados duplicados.

[00091] Em uma modalidade da presente invenção, o servidor para desduplicação 103 recebe um arquivo para backup enviado pelo servidor para backup 102, e realiza processamento de eliminar dados duplicados no arquivo. Um arquivo para backup a ser processado é usualmente apresentado na forma de uma corrente de dados no servidor para desduplicação 103. Quando o servidor para desduplicação 103 busca por um ponto divisório em uma corrente de dados, uma unidade mínima para buscar um ponto divisório de corrente de dados usualmente precisa ser determinada. Especificamente, conforme mostrado na Figura 2, por exemplo, um ponto divisório potencial k está localizado entre duas unidades mínimas consecutivas, cujos números na sequência são 1 e 2, para buscar um ponto divisório de corrente de dados. Um ponto divisório potencial significa um ponto para o qual precisa ser determinado se o ponto pode serve como um ponto divisório de corrente de dados. Quando o ponto k é um ponto divisório de corrente de dados, em uma direção de buscar um ponto divisório de corrente de dados mostrada por uma seta na Figura 2, um próximo ponto divisório potencial k₇ é buscado, isto é, um ponto localizado entre duas unidades mínimas consecutivas, cujos números na sequência são 7 e 8, para buscar um ponto divisório de corrente de dados. Quando o ponto divisório potencial k₇ é um ponto divisório de corrente de dados, dados entre os dois pontos divisórios de corrente de dados adjacentes kj, e k₇ é a fatia de dados 1. A unidade mínima para buscar um ponto divisório de corrente de dados pode especificamente ser determinada de acordo com uma real exigência, e aqui 1 byte (Byte) é usado como um exemplo, isto é,

Petição 870160008725, de 11/03/2016, pág. 306/698

35/200 todas as unidades mínimas, cujos números na sequência são 1, 2, 7, e 8, para buscar um ponto divisório de corrente de dados têm um tamanho de 1 byte. A direção de buscar um ponto divisório de corrente de dados mostrada na Figura 2 usualmente representa uma direção de busca de um cabeçalho de arquivo para um fim de arquivo ou a direção de um fim de arquivo para um cabeçalho de arquivo, e nessa modalidade, a direção de busca de um cabeçalho de arquivo para um fim de arquivo é usada como um exemplo.

[00092] Em uma situação de eliminar dados duplicados, uma fatia de dados menor em geral indica uma taxa de eliminar dados duplicados mais alta e um modo mais fácil de encontrar uma fatia de dados duplicados, mas um quantidade maior de metadados gerados a partir daí; além disso, após uma fatia de dados diminuir parcialmente, a taxa de eliminar dados duplicados não aumenta mais, mas o montante de metadados aumenta rapidamente. Portanto, um tamanho de uma fatia de dados pode ser controlado. Em aplicações reais, um valor mínimo de uma fatia de dados, por exemplo, 4 KB (4096 bytes), é usualmente definido; em consideração da taxa de eliminar dados duplicados ao mesmo tempo, um valor máximo de uma fatia de dados também é definido, isto é, o tamanho de uma fatia de dados não pode exceder o valor máximo, por exemplo, 12 KB (12288 bytes). Uma maneira de implantação específica é mostrada na Figura 3. O servidor para desduplicação 103 busca por um ponto divisório de corrente de dados ao longo da direção mostrada pela seta. k_a é um ponto divisório de corrente de dados encontrado naquele momento, e a partir de k_a, um próximo ponto divisório potencial é buscado na direção de buscar um ponto divisório de corrente de dados. Para atender a exigência de uma fatia de dados mínima, usualmente começando a partir de um ponto divisório de corrente de dados, um tamanho da fatia de dados mínima é pulada ao longo de uma direção de buscar um ponto divisório de corrente de dados, e a busca começa a partir de uma posição de extremidade da fatia de dados mínima, isto é, a posição de extremidade da fatia de dados mínima serve como

Petição 870160008725, de 11/03/2016, pág. 307/698

36/200 um próximo ponto divisório potencial k_t. Nessa modalidade da presente invenção, uma fatia de dados mínima de 4 KB, isto é, 4*1024=4096 bytes pode ser primeiramente pulada a partir do ponto k_a ao longo da direção de buscar um ponto divisório de corrente de dados. 4096 bytes são pulados a partir do ponto k_a ao longo da direção de buscar um ponto divisório de corrente de dados, e o ponto k_t é obtido em uma posição de extremidade de um quatro milésimo nonagésimo sexto byte para servir como um ponto divisório potencial. Por exemplo, k_t está localizado entre duas unidades mínimas consecutivas, cujos números na sequência são 4096 e 4097, para buscar um ponto divisório de corrente de dados. Ainda usando a Figura 3 como um exemplo, k_a é um ponto divisório de corrente de dados encontrado naquele momento, e um próximo ponto divisório de corrente de dados é buscado ao longo da direção mostrada na Figura 3. Se nenhum próximo ponto divisório de corrente de dados é encontrado após um valor máximo de uma fatia de dados ser excedido, começando a partir do ponto k_a na direção de buscar um ponto divisório de corrente de dados, um ponto k_z em que o valor máximo de uma fatia de dados é conseguido serve como o próximo ponto divisório de corrente de dados e a é realizada uma divisão forçada.

[00093] Uma modalidade da presente invenção fornece um método para buscar um ponto divisório de corrente de dados com base em um servidor para duplicação, que, conforme mostrado na Figura 4, inclui:

[00094] Uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar M pontos p_x, uma janela W_x [ p_x - A_x, p_x+B_x ] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x[p_x-A_x, p_x+B_x], onde x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros, onde uma distância entre p_x e o ponto divisório potencial k é de d_x unidades mínimas para buscar um ponto divisório de corrente de dados, a unidade mínima para buscar um ponto divisório de corrente de dados

Petição 870160008725, de 11/03/2016, pág. 308/698

37/200 é representada como U, e nessa modalidade, U=1 byte. Em uma maneira de implantação mostrada na Figura 3, sobre um valor de M, em uma maneira de implantação, um valor de M*U não é maior que uma distância máxima predefinida entre dois pontos divisórios de corrente de dados adjacentes, isto é, um comprimento máximo predefinido de uma fatia de dados. É determinado se pelo menos uma parte de dados em uma janela W_z [p_z -A_z, p_z+B_z ] que corresponde a um ponto p_z atende uma condição predefinida C_z, onde z é um número inteiro, 1<z<M, e (p_z - A_z) e (p_z+B_z) representam dois limites da janela W_z [p_z -A_z, p_z + B_z]. Quando é determinado que pelo menos uma parte de dados em uma janela W_z [p_z -A_z, p_z+B_z ] de qualquer ponto p_z não atende a condição predefinida C_z, N bytes são pulados a partir do ponto p_z que corresponde à janela W_z [ p_z - A_z, p_z+B_z ] que não atende a condição predefinida ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N< || B_z ||+max_x(|| A_x || + || (k-p_x) ||), onde II (k-p_x) || representa uma distância entre qualquer ponto dos M pontos p_x e o ponto divisório potencial k, max_x (|| A_x || + || (k- p_x) ||) representa um valor máximo de uma soma de um valor absoluto da distância entre qualquer ponto dentre os M pontos p_x e o ponto divisório potencial k e um valor absoluto de A_x que corresponde ao qualquer ponto, e IIB_z II representa um valor absoluto de B_z em W_z [p_z -A_z, p_z+B_z]. Um princípio para definir um valor de N é especificamente apresentado nas modalidades a seguir. Quando é determinado que pelo menos uma parte de dados em cada janela W_x [ p_x- A_x, p_x+B_x] das M janelas atende a condição predefinida C_x,, o ponto divisório potencial k é um ponto divisório de corrente de dados.

[00095] Especificamente, para um ponto divisório potencial corrente k_t, as seguintes etapas são realizadas de acordo com a regra:

[00096] Etapa 401: Determinar um ponto p_lz e uma janela W_lz [ p_lzA., p_z+B_z] que correspondem ao ponto p_lz para um ponto divisório potencial corrente k_i de acordo com a regra, onde i e z são números inteiros, e 1<z<M.

Petição 870160008725, de 11/03/2016, pág. 309/698

38/200 [00097] Etapa 402: Determinar se pelo menos uma parte de dados na janela W_lz [p_lz- A_z, p_iz + B_z] atende uma condição predefinida C_z;

quando a pelo menos uma parte de dados na janela W_lz [ p_lz - A, p_z + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p_lz ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que II B_z 11+ max,. (II A_x ||+||( k_I - p_x)H), de modo a obter um novo ponto divisório potencial, e realizar a etapa 401; e quando pelo menos uma parte de dados em cada janela W_Ix [ p_x- A_x, p_x+B_x] de M janelas do ponto divisório potencial corrente k_I atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_Icomo um ponto divisório de corrente de dados.

[00098] Além disso, a regra inclui adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições A_e=A_f, B_e=B_f, e C_e=C_f.

[00099] A regra inclui adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos p_e e p_f estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.

[0100] A regra inclui adicionalmente que uma distância entre os pelo menos dois pontos p_e e p_f é de 1 U.

[0101] Determinar se pelo menos uma parte de dados na janela W_IZ [ p_iz- A, p_iz + B_z ] atende a condição predefinida C_z inclui especificamente:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ p_lz - A, p_z + B_z ] atende a condição predefinida Cz [0102] Determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ p_lz- A, p_z + B_z] atende a condição predefinida C_z é especificamente: determinar, usando uma função hash, se a pelo menos uma parte de dados na janela ^Wz [ plz- Az, Piz + ^Bz ] atende a condição predefinida Cz.

[0103] Quando a pelo menos uma parte de dados na janela W_iz [ k_t

Petição 870160008725, de 11/03/2016, pág. 310/698

39/200

-A_z, k_t + B_z ] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto p_lz ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W_ic [p_ic- A_c, p_ic+B_c] correspondente a um ponto p_ic que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [ p_lz- A, p_iz + B_z ] ou um limite à esquerda de uma janela W_ic [p_ic-A_c, p_ic+B_c] correspondente a um ponto p_icque é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_lz [p_lz- A, p_iz + B_z ], onde o ponto p_ic determinado para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.

[0104] Nessa modalidade da presente invenção, um ponto divisório de corrente de dados é buscado determinando se pelo menos uma parte de dados em uma janela de M janelas atende uma condição predefinida, e quando a pelo menos uma parte de dados na janela não atende a condição predefinida, um comprimento de N*U é pulado, onde N*U não é maior que || B_z II max..(|| A_x || + || (k_i - p_ix) ||), de modo a se obter um próximo ponto divisório potencial, desse modo aumentando a eficiência na busca de um ponto divisório de corrente de dados.

[0105] Em um processo de eliminar dados duplicados, considerase assegurar um tamanho uniforme de uma fatia de dados, um tamanho de uma fatia de dados comum (também denominada uma fatia comum). Isto é, embora limites em um tamanho de uma fatia de dados mínima e um tamanho de uma fatia de dados máxima sejam atendidos, o tamanho da fatia de dados comum é determinado para assegurar um tamanho uniforme de uma fatia de dados obtida. Uma probabilidade (representada como P(n)) de encontrar um

Petição 870160008725, de 11/03/2016, pág. 311/698

40/200 ponto divisório de corrente de dados depende de dois fatores, isto é, a quantidade M dos pontos p_x e uma probabilidade de que pelo menos uma parte de dados na janela W_x [ p_x- A_x, p_x + B_x] que corresponde ao ponto p_xatenda a condição predefinida C_x, onde a primeira afeta um comprimento para pular, a última afeta uma probabilidade de pular, e as duas juntas afetam o tamanho da fatia comum. Em geral, quando o tamanho da fatia comum é fixo, à medida que a quantidade M dos pontos p_x aumenta, a probabilidade de que pelo menos uma parte de dados em uma janela W_x[p_x-A_x, p_x+B_x] que corresponde a um único ponto p_x atenda a condição predefinida C_x também aumenta. Por exemplo, a regra predefinida no servidor para desduplicação 103 é: para um ponto divisório potencial k, determinar 11 pontos p_x, onde x indica números naturais consecutivos de 1 a 11 separadamente, e uma probabilidade de que pelo menos uma parte de dados em uma janela W_x[p_x-A_x, p_x+B_x] que corresponde a qualquer ponto p_x dos 11 pontos atenda a condição predefinida C_x é de 1/2. Outro grupo de regras predefinidas no servidor para desduplicação 103 é: selecionar 24 pontos p_x para o ponto divisório potencial k, onde x indica números naturais consecutivos de 1 a 24 separadamente, e uma probabilidade de que pelo menos uma parte de dados em uma janela W_x[ p_x- A_x, p_x+B_x] que corresponde a qualquer ponto p_x dos 24 pontos atenda a condição predefinida C_x é de 3/4. Para a definição de uma probabilidade de que pelo menos uma parte de dados em uma janela específica W_x [ p_x- A_x, p_x+ B_x ] atenda a condição predefinida C_x, referência pode ser feita à descrição da parte de determinar se a pelo menos uma parte de dados na janela Wx [ px - Ax, p_x + B_x ] atende a condição predefinida C_x. P(n) depende dos dois fatores, isto é, da quantidade M de pontos p_x e da probabilidade de que pelo menos uma parte de dados na janela Wx [ px - Ax p_x + B_x ] que corresponde ao ponto p_x atenda a condição predefinida C_x , e P(n) representa a probabilidade de que nenhum ponto divisório de corrente de dados seja encontrado, após n unidades mínimas para buscar um ponto divisório de corrente de dados em uma busca a

Petição 870160008725, de 11/03/2016, pág. 312/698

41/200 partir de uma a posição inicial/ponto divisório de corrente de dados anterior de uma corrente de dados. Um processo de calcular P(n) que depende dos dois fatores é na verdade uma sequência Fibonacci de n etapas, que é descrita abaixo em detalhe. Após P(n) ser obtida, 1-P(n) é uma função de distribuição de um ponto divisório de corrente de dados, e (1-P(n))-(1-P(n-1))=P(n-1)-P(n) é uma probabilidade de que um ponto divisório de corrente de dados seja encontrado em um enésimo ponto, isto é, uma função de densidade de um

12*1024 ponto divisório de corrente de dados. A integração nχ (P(n-1) -P(n)) n=4*1024 pode ser realizada de acordo com a função de densidade de um ponto divisório de corrente de dados, de modo a obter um comprimento esperado de um ponto divisório de corrente de dados, isto é, o tamanho da fatia comum, onde 4*1024 (bytes) representa um comprimento da fatia de dados mínima, e 12*1024 (bytes) representa um comprimento da fatia de dados máxima.

[0106] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 5, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 pontos p_x, uma janela W_x [ p_x - A_x, p_x+B_x ] (janela W_x de forma resumida) que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [ p_x ^Ax ’ ^px ^{+ B}x ^{] onde A}1 = ^A2 = ^A3 = ^A4 = ^A5 = ^A6= ^A7 = ^A8 = ^A9 = ^A10 = ^A11=¹⁶⁹, ^B1 = ^B2 = b₃=B4=b,=B6=b,=b,= B,= B,0=B,,=0, e C,=C_z=C,=C,=C,=C6=C,=C,=C, =C₁₀ =C₁₁. Uma distância entre o ponto p_x e o ponto divisório potencial k é de d_x bytes. Especificamente, uma distância entre um ponto p_x e o ponto divisório potencial k é de 0 byte, uma distância entre um ponto p₂ e o ponto divisório potencial k 1 byte, uma distância entre um ponto p₃ e o ponto divisório potencial k é de 2 bytes, uma distância entre um ponto p₄e o ponto divisório potencial k é de 3 bytes, uma distância entre um ponto p₅ e o ponto divisório potencial k é de 4 bytes, uma distância entre um ponto p₆ e o ponto

Petição 870160008725, de 11/03/2016, pág. 313/698

42/200 divisório potencial k é de 5 bytes, uma distância entre um ponto p₇ e o ponto divisório potencial k é de 6 bytes, uma distância entre um ponto p₈ e o ponto divisório potencial k é de 7 bytes, uma distância entre um ponto p₉ e o ponto divisório potencial k é de 8 bytes, uma distância entre um ponto p₁₀ e o ponto divisório potencial k é de 9 bytes, uma distância entre um ponto p₁₁ e o ponto divisório potencial k é de 10 bytes, e com relação ao ponto divisório potencial k, todos os pontos p₂, p₃, p₄, p₅, p₆, p₇, p₈, p₉, p_w, e p„ estão em uma direção oposta a uma direção de buscar um ponto divisório de corrente de dados. k_a é um ponto divisório de corrente de dados, e a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 5 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k,, e um ponto p_x é determinado para o ponto divisório potencial k,. Nessa modalidade, de acordo com uma regra predefinida no servidor para desduplicação 103, x indica números naturais consecutivos de 1 a 11 separadamente. Na maneira de implantação mostrada na Figura 5, 11 pontos são determinados para o ponto divisório potencial k,, e são p_ü, p_i2, p.₃, p.₄, p.5, p.6, p.7, p.8, p_t9, p_ao, e p.11 separadamente, e janelas que ^corresp^{ondem aos} p^ontos p,1, p_t 2, p_t 3, p_t 4, p,5, p,6, p,7, p,₈, p,9, p^, ^e

p.11 ^são W1^[ p,1-^169, Pü\, W 2^[ p,2-^169, Pill ^W,3^[ Pi 3-^169, Pi 3^{1, W}i 4^[ p,4^-169,

Pi4 L ^Wi5 ^[ p>5 ^-169, p,5 L W6 ^[ p,6 ^-169, p,6 L W7 ^[ #7 ^-169, #7 L ^Wi8 ^[ As ^-169, p_l8 L ^Wi9 ^[ p,9 ^-169, p,91, ^W,1o^[ p,1o^-169, p.10^{1, e W},11^[ p,11^-169, p.11¹ respectivamente. As supracitadas janelas são separadamente denominadas como W1, W-2, W,3, W-4, W-5, W-6, W-7, W_t8, W_t9, W_tW, e

W-ii de forma resumida. Uma distância entre o ponto p_x e o ponto divisório potencial k, é de d_x bytes. Especificamente, uma distância entre p_n e k, é de 0 byte, uma distância entre p ₂ e k é de 1 byte, uma distância entre p ₃ e k é de 2 bytes, uma distância entre p ₄ e k é de 3 bytes, uma distância entre p ₅ e k é de 4

Petição 870160008725, de 11/03/2016, pág. 314/698

43/200 bytes, uma distância entre p_i6 e k_i é de 5 bytes, uma distância entre p_i7 e k_ié de 6 bytes, uma distância entre p_i8 e k_t é de 7 bytes, uma distância entre p_i9 e k_t é de 8 bytes, uma distância entre p_i10 e k_t é de 9 bytes, uma distância entre p_t11 e k_t é de 10 bytes, e com relação ao ponto divisório potencial k_t, todos os

Pi 2’ Pi 3’ Pi 4’ Pi 5’ Pi6, Pi 7’ P*, Pi9, Pi10’ ^e Pi1 estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em W_n[ P,1-169, p_ü] atende uma condição predefinida , é determinado se pelo menos uma parte de dados em W_t2[ p_i2-169, p.₂] atende uma condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_l3[ p_i3-¹⁶⁹, pt3] ^atendeuma condição predefinida C3, é determinado se pelo menos uma parte de dados em W_i4[ p_i4-169, p₄] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados na w,5[ p,5-^169, p,5] ^atendeuma condição predefinida C5, é determinado se pelo menos uma parte de dados na Wi6[ pi6-169, pi6] atende uma condição predefinida C6, é determinado se pelo menos uma parte de dados na W,7 [ p,7-169, pn] atende uma condição predefinida C7, é determinado se pelo menos uma parte de dados em wiS[ pi8-169, pi8] atende uma condição predefinida C8, é determinado se pelo menos uma parte de dados em w,9 [ Pi9 -169, pt9 ] atende uma condição predefinida C9, é determinado se pelo menos uma parte de dados em Wi10 [ pi10-169, pi10] atende uma condição predefinida C10, e é determinado se pelo menos uma parte de dados em Wm[ Pm-^169, Pm] ^atendeuma condição predefinida C11. Quando é determinado que a pelo menos uma parte de dados na janela w_n atende a condição predefinida C,, a pelo menos uma parte de dados na janela W_t2 atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_i3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_t4 atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_i5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_t6 atende a

Petição 870160008725, de 11/03/2016, pág. 315/698

44/200 condição predefinida C₆, a pelo menos uma parte de dados na janela W_i7atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W₈ atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_t9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela w₁₀ atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_i11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_t é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das 11 janelas não atende a condição predefinida correspondente, por exemplo, conforme mostrado na Figura 6, pelo menos uma parte de dados em ^Wi5[ Pi5^-169, p.5] não atende a condição predefinida correspondente C₅, N bytes são pulados a partir do ponto p_i5 ao longo da direção de buscar um ponto divisório de corrente de dados, onde os N bytes não são maiores que || B₅ || + max_x(II 4c II + II (k - p_ix) II). Em uma maneira de implantação mostrada na Figura 6, os N bytes que são pulados não são maiores que 179 bytes, e nessa modalidade, N=11, de modo a se obter um próximo ponto divisório potencial. Para diferenciação do ponto divisório potencial k_t, o novo ponto divisório potencial é representado como k. no presente documento. De acordo com a regra predefinida no servidor para desduplicação 103 na maneira de implantação mostrada na Figura 5, 11 pontos são determinados para o ponto divisório ^{potencial k}j ^{, e são} p. 1, p.2, pj3, p.4, p.5, p.6, p.7, p.g, p.9, pjW , ^e p separadamente, e janelas que correspondem ao pontos p. 1, p.p_j3, p.₄, p.₅, p.6, p.7^, p^ pjio> ^e p.11 ^são determinadas, ^{e são} .Pj1-^169, Pj 1 ], ^W2 ^[ p. 2^-169, p. 2^{] W} 3^[ p.,-3^-169, p.3 ^{] W} \ p. 4^-169, p. 4^{] W}. 5^[ p.5^-169, p.5 L ^W 6^[ P. 6169, .], Wp[ p.7-169, p.7], W_p[ p₈-169, p.₈], W_p[ p.,-169, _Pj9], W_jW[ -169, p ], e W.₁₁[ p.₁₁-169, p.₁₁] respectivamente. Uma distância entre p._x e o ponto divisório potencial k. é de d_x bytes. Especificamente, uma distância entre p.₁ e k. é de 0 byte, uma distância entre p.₂ e k. é de 1 byte, uma distância entre p.₃ e k. é de 2 bytes, uma distância entre p.₄ e k. é de 3

Petição 870160008725, de 11/03/2016, pág. 316/698

45/200 bytes, uma distância entre p.₅ e k. é de 4 bytes, uma distância entre p.₆ e k. é de 5 bytes, uma distância entre p.₇ e k. é de 6 bytes, uma distância entre p_j8 e k. é de 7 bytes, uma distância entre p e k. é de 8 bytes, uma distância entre p_j10 e k. é de 9 bytes, uma distância entre p.₁₁ e k. é de 10 bytes, e com relação ao ponto divisório potencial k., todos os p . 1, p.p_fi, p.₄, . p_J6, p.₇, p p_j9, p_J10, e p estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados. Na maneira de implantação mostrada na Figura 6,quando a décima primeira janela W_J11[ p_J11-169, p.₁₁] é determinada para o ponto divisório potencial k., para assegurar que uma faixa entre o ponto divisório potencial k_t e o ponto divisório potencial k. esteja junto com as outras dentro de uma determinada faixa, nessa maneira de implantação, pode ser assegurado que um limite à esquerda da janela W_jn[p -169, p.₁₁] coincida com um limite à direita p_i5 de W_i5 [ p_i5-169, p.₅] ou caia dentro de uma faixa de W₅[ p,₅-169, p₅] onde o ponto p.₁₁ determinado para o ponto divisório potencial k. é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M pontos que são determinados para o ponto divisório potencial k_. de acordo com a regra. Portanto, dentro desse limite, quando a pelo menos uma parte de dados em W_i5[ p_i5-169, p₅] não atende a condição predefinida C₅, uma distância para pular a partir de p_i5 ao longo da direção de buscar um ponto divisório de corrente de dados não é maior que II B₅ II + max_x (|| A_x || + || (k_t p_x) II), onde M=11, e 11*U não é maior que max_x(|| A_x || + || (k_t - p_Ix) ||), e portanto, uma distância para pular a partir de p ₅ ao longo da direção de buscar um ponto divisório de corrente de dados não é maior que 179. É determinado se pelo menos uma parte de dados em W_J1[ p.₄-169, p.J atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W.₂[ p.₂-169, p.₂] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W.₃[p.₃-169, p.₃] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W 4^[ p. 4^-

Petição 870160008725, de 11/03/2016, pág. 317/698

46/200

169, p_}4] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_j5[p_j5-169, p_}5] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[ p_{} 6}-169, p_{} 6}] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_j7[ p_{} 7}-169, p_{} 7}] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[p_j8-169, p_j8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em ^Wj9^[ p}9169, pj9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[ p_j10-169, p_j10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em ^WJ11^[ p711^-169, p711^]atende a condição predefinida C11. Certamente, nessa modalidade da presente invenção, a regra também é seguida quando é determinado se o ponto divisório potencial ka é um ponto divisório de corrente de dados, a implantação específica não é descrita novamente, e referência pode ser feita à descrição de determinação do ponto divisório potencial kt. Quando é determinado que a pelo menos uma parte de dados na janela Wj1 atende a condição predefinida C1, a pelo menos uma parte de dados na janela W}2 atende a condição predefinida C2, a pelo menos uma parte de dados na janela Wj3 atende a condição predefinida C3, a pelo menos uma parte de dados na janela W}4 atende a condição predefinida C4, a pelo menos uma parte de dados na janela Wj5 atende a condição predefinida C5, a pelo menos uma parte de dados na janela Wj6 atende a condição predefinida C6, a pelo menos uma parte de dados na janela Wj7 atende a condição predefinida C7, a pelo menos uma parte de dados na janela Wj8 atende a condição predefinida C8, a pelo menos ^uma parte de dados na Janela ^W . atende a condição predefrnda C,, a pelo menos uma parte de dados na janela Wj10 atende a condição predefinida C₁₀, e ^a p^eto ^{menos uma} p^{arte de dados na janela W}711 ^{atende a condi}ç^ãopredefinida C11, o ponto divisório potencial corrente k_} é um ponto divisório de corrente de dados, e os dados entre k_} e k_a formam 1 (uma) fatia de dados.

Petição 870160008725, de 11/03/2016, pág. 318/698

47/200

Entretanto, um tamanho mínimo de fatia de 4 KB é pulado de uma maneira igual àquela de k_a para se obter um próximo ponto divisório potencial, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103, se o próximo ponto divisório potencial é ou não um ponto divisório. Quando é determinado que o ponto divisório potencial k_} não é um ponto divisório de corrente de dados, 11 bytes são pulados de uma maneira igual àquela de k_t para se obter um próximo ponto divisório potencial, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103 e com o supracitado método, se o próximo ponto divisório potencial é ou não um ponto divisório. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado.

[0107] Na maneira de implantação mostrada na Figura 5, de acordo com a regra predefinida no servidor para desduplicação 103, começando a partir da determinação quanto a se a pelo menos uma parte de dados em W_n[ p_i4-169, p_n ] atende a condição predefinida C₁, quando é determinado que a pelo menos uma parte de dados em W1[ p_n-169, p_ti] atende a condição predefinida C₁, é determinado que a pelo menos uma parte de dados em W_t2[ p_t2-169, p_t2] atende a condição predefinida C₂, é determinado que a pelo menos uma parte de dados em W3[ p_t3-169, p_t3] atende a condição predefinida C ₃, é determinado que a pelo menos uma parte de dados em W_i4 [ p_i4-169, p_i4] atende a condição predefinida C₄, e é determinado que a pelo menos uma parte de dados em W-5^[ p,5^-169, p,5^{] não}atende a condição predefinida C₅, 10 bytes são pulados a partir do ponto p_i5ao longo da direção de buscar um ponto divisório de corrente de dados, e um novo ponto divisório potencial é obtido em uma posição de extremidade de um décimo byte, que é representado como k_g no presente documento para diferenciação de outros pontos divisórios potenciais. De acordo com a regra

Petição 870160008725, de 11/03/2016, pág. 319/698

48/200 predefinida no servidor para desduplicação 103, 11 pontos p_gx são determinados para o ponto divisório potencial k_g, onde x indica números naturais consecutivos de 1 a 11 separadamente, e são p_g1, p_g2, p_g3, p_g4, p_g5, Pg6, pg7, pg8, pg9, pgio, e p_gU separadamente, e janelas que correspondem aos p^ontos pgi, p , pg3, pg4, pg5, pg6, pg7, pg8, pg9, pgW, ^e pgii ^sãodeterminadas, e são Wgi[pgX-169, pgX], Wg2[pg2-169, pg2], Wg3[pg3-169, pj, Wg4Í pg4-169, pgA], Wg5[ pg5-169, p^], Wg6[ pg6-169, pg6], Wg7[ pg7-169, p^], Wg8[ pgS-169, pg8], Wg9[ pg9-169, pg9], WgW[ pgV>-W9, pgW], e WgU[ pg^-169, pg11] respectivamente. Uma distância entre pgx e o ponto divisório potencial kg é de dx bytes. Especificamente, uma distância entre pg1 e kg é de 0 byte, uma distância entre pg2 e kg é de 1 byte, uma distância entre pg3 e kg é de 2 bytes, uma distância entre pg4 e kg é de 3 bytes, uma distância entre pg5 e kg é de 4 bytes, uma distância entre pg6 e kg é de 5 bytes, uma distância entre pg7 e kg é de 6 bytes, uma distância entre pg8 e kg é de 7 bytes, uma distância entre pg9 e kg é de 8 bytes, uma distância entre pg10 e kg é de 9 bytes, uma distância entre pg11 e kg é de 10 bytes, e com relação ao ponto divisório p^{otencial k}g ^{, todos os} pg2 ^, pg3 ^, pg4 ^, pg5 ^, pg6 ^, pg7 ^, pg8 ^, pg9 ^, pg10 ^{, e} p g11 ^estãoem uma direção oposta à direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em Wg1[ pg1-169, pg1] atende a condição predefinida C_x, é determinado se pelo menos uma parte de dados em W_g2[p_g2-169, p_g2] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_g3[p_g3-169, p_g3] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_{g 4}[ p_{g 4}169, p_{g 4}] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_g5[ p_g5-169, p_g5] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_g6[p_g6-169, p_g6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_{g 7} [ p_{g 7}-169, p_g7] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_g8 [ p_g8 -169, p_g8 ] atende a condição

Petição 870160008725, de 11/03/2016, pág. 320/698

49/200 predefinida C₈, é determinado se pelo menos uma parte de dados em W_g9[ p_g9169, p_g9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_g10 [ p_g10-169, p_g10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em Wg_U[ pg„-169, pg_U] atende a condição predefinida C₁₁. Portanto, o ponto p_g11 que corresponde ao ponto divisório potencial k_g coincide com o ponto p_i5 que corresponde ao ponto divisório potencial k_t, a janela W_g11[ p_g11-169, p_g11] que corresponde ao ponto p_g11 coincide com a janela W_i5[ p_i5-169, p_i5] que corresponde ao ponto p_i5, e C₅ =C_n; portanto, para o ponto divisório potencial k_i, quando é determinado que a pelo menos uma parte de dados em ^Wi5^[ p,5^-169, Bi5^{] não}atende a condição predefinida C₅, o ponto divisório potencial k_g obtido por pular 10 bytes a partir do ponto p_i5 ao longo da direção de buscar um ponto divisório de corrente de dados ainda não atende uma condição de servir como um ponto divisório de corrente de dados. Portanto, se existe repetição de cálculo quando 10 bytes são pulados a partir do ponto p_i5 ao longo da direção de buscar um ponto divisório de corrente de dados, então a repetição de cálculo pode ser reduzida e a eficiência é maior quando11 bytes são pulados a partir do ponto p_i5 ao longo da direção de buscar um ponto divisório de corrente de dados. Portanto, uma velocidade de buscar um ponto divisório de corrente de dados é aumentada. Quando em uma especificação predefinida , a probabilidade de que pelo menos uma parte de dados na janela W_x [ p_x - A_x, p_x+ B_x ] que corresponde ao ponto p_x atenda a condição predefinida C_x é de 1/2, isto é, uma probabilidade de executar o pulo é de 1/2, no máximo 179 bytes podem ser pulados de cada vez.

[0108] Nessa maneira de implantação, uma regra predefinida é: para um ponto divisório potencial k, determinar 11 pontos p_x, uma janela W_x[ p_x - A, p_x+B_x ] que corresponde ao ponto p_x, e uma condição predefinida C_xque corresponde à janela W_x [ p_x- A_x, p_x+B_x], onde x indica números naturais consecutivos de 1 a 11 separadamente, onde uma probabilidade de que pelo

Petição 870160008725, de 11/03/2016, pág. 321/698

50/200 menos uma parte de dados na janela W_x [ p_x - A_x, p_x+B_x ], que corresponde ao ponto p_x atenda a condição predefinida é de 1/2, e P(n) pode ser calculada usando-se os dois fatores, isto é, a quantidade de pontos p_x e a probabilidade de que pelo menos uma parte de dados na janela W_x [ p_x - A_x, p_x+B_x ], que corresponde ao ponto p_x atenda a condição predefinida. Além disso, 4 = A₂ =

A₃ = A₄= A₅ = A₆= A₇ = A₈ = A₉= A₁₀ = A_n=169,

B1 = B2= ^B3 = ^B4= ^B5 = ^B6= ^B7 = ^B8 =

B 9= Bio= B11 =^{0, e}

C =C = C =C = C = C = C = C = C = C = C H ^v 2 ^V3 ^V 4 ^V5 ^V6 ^V7 ^V9 ^10 H1 , onde uma distância entre p_x e o ponto divisório potencial k é de d_x bytes.

Especificamente, uma distância entre p₁ e o ponto divisório potencial k é de 0 byte, uma distância entre p₂ e k é de 1 byte, uma distância entre p₃ e k é de 2 bytes, uma distância entre p₄ e k é de 3 bytes, uma distância entre p₅ e k é de 4 bytes, uma distância entre p₆ e k é de 5 bytes, uma distância entre p₇e k é de 6 bytes, uma distância entre p₈ e k é de 7 bytes, uma distância entre p₉ e k é de 8 bytes, uma distância entre p₁₀ e k é de 9 bytes, uma distância entre p₁₁ e k é de 10 bytes, e com relação ao ponto divisório potencial k, todos os p2, p3, p4 , p5, p, p7, p₈, p9, p_w, e p„ estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados. Portanto, se o ponto divisório potencial k é ou não um ponto divisório de corrente de dados depende de que ocorra ou não que pelo menos uma parte de dados em cada janela de janelas que correspondem aos 11 pontos consecutivos atende a condição predefinida C_x. Após um comprimento mínimo de fatia de 4096 bytes ser pulado a partir de uma posição inicial/ponto divisório de corrente de dados anterior de uma corrente de dados, um quatro centésimo octogésimo sexto ponto é encontrado retrocedendo-se 10 bytes em uma direção oposta à direção de buscar um ponto divisório de corrente de dados, e não existe nenhum ponto divisório de corrente de dados no ponto; portanto, P(4086)=1, e P(4087)=1, ..., P(4095)=1, e assim por diante. Em um quatro centésimo nonagésimo sexto ponto, isto é, um ponto que é usado para obter a fatia mínima, com uma probabilidade de (1/2)^Λ11, pelo menos uma parte de

Petição 870160008725, de 11/03/2016, pág. 322/698

51/200 dados em cada janela das janelas que correspondem aos 11 pontos atende a condição predefinida C_x. Logo, com a probabilidade de (1/2)^Λ11, um ponto divisório de corrente de dados existe; com uma probabilidade de 1-(1/2)^Λ11, não existe nenhum ponto divisório de corrente de dados; portanto P(11)=1(1/2)^Λ11.

[0109] Em um enésimo ponto, pode haver 12 casos de obter P(n) por meio de recursividade.

P(n)

Não encontrado

1/2

Encontrado

P(n-l)

Não encontrado

1/2

Encontrado

P(n-2)

1/2

Não encontrado

Encontrado

Pelo menos uma parte de ' ' ' dados em cada janela das janelas correspondente a 11 pontos consecutivos atende uma condição predefinida [0110] Caso 1: com uma probabilidade de 1/2, pelo menos uma parte de dados em uma janela que corresponde ao enésimo ponto não atende a condição predefinida; nesse caso, com a probabilidade de P(n-1), não existem 11 pontos consecutivos entre (n-1) pontos antes do enésimo ponto, onde pelo menos uma parte de dados em cada janela de janelas que correspondem aos 11 pontos consecutivos separadamente atende uma

Petição 870160008725, de 11/03/2016, pág. 323/698

52/200 condição predefinida. Portanto, P(n) inclui 1/2*P(n-1). Um caso em que a pelo menos uma parte de dados na janela que corresponde ao enésimo ponto não atende a condição predefinida, e existem 11 pontos consecutivos entre os (n-1) pontos antes do enésimo ponto, onde pelo menos uma parte de dados em cada janela de janelas que correspondem aos 11 pontos consecutivos separadamente atende a condição predefinida, não é relacionado a P(n).

[0111] Caso 2: com uma probabilidade de 1/2, pelo menos uma parte de dados em uma janela que corresponde ao enésimo ponto atende a condição predefinida, e com a probabilidade de 1/2, pelo menos uma parte de dados em uma janela que corresponde a um enésimo menos um ponto não atende a condição predefinida; nesse caso, com uma probabilidade de P(n-2), não existem 11 pontos consecutivos entre (n-2) pontos antes do ponto (n-1), onde pelo menos uma parte de dados em cada janela de janelas que correspondem a 11 pontos consecutivos separadamente atende a condição predefinida. Portanto, P(n) inclui 1/2*1/2*P(n-2). Um caso em que a pelo menos uma parte de dados na janela que corresponde ao enésimo ponto atende a condição predefinida, a pelo menos uma parte de dados na janela que corresponde ao enésimo menos um ponto não atende a condição predefinida, e existem 11 pontos consecutivos entre os (n-2) pontos antes do enésimo menos um ponto, onde pelo menos uma parte de dados em cada janela de janelas que correspondem aos 11 pontos consecutivos separadamente atende a condição predefinida, não é relacionado a P(n).

[0112] De acordo com a descrição supracitada, caso 11: com uma probabilidade de (1/2)^Λ10, pelo menos uma parte de dados na janelas corresponder do enésimo até o enésimo menos 9 pontos atende uma condição predefinida, e com uma probabilidade de 1/2, pelo menos uma parte de dados em uma janela corresponder a um enésimo menos 10 ponto não atende uma condição predefinida; nesse caso, com uma probabilidade de P(n-11), não existem 11 pontos consecutivos entre (n-11) pontos antes do ponto (n-10), onde

Petição 870160008725, de 11/03/2016, pág. 324/698

53/200 pelo menos uma parte de dados em cada janela de janelas que correspondem aos 11 pontos consecutivos separadamente atende uma condição predefinida. Portanto, P(n) inclui (1/2)^A10*1/2*P(n-11). Um caso em que a pelo menos uma parte de dados nas janelas que corresponde do enésimo ao enésimo-9 pontos atende a condição predefinida, a pelo menos uma parte de dados na janela que corresponde ao enésimo menos 10 ponto não atende a condição predefinida, e existem 11 pontos consecutivos entre os (n-11) pontos antes do enésimo menos 10 ponto, onde pelo menos uma parte de dados em cada janela de janelas que correspondem aos 11 pontos consecutivos separadamente atende a condição predefinida, não é relacionado a P(n).

[0113] Caso 12: com uma probabilidade de (1/2)^Λ11, pelo menos uma parte de dados em janelas que correspondem do enésimo ao enésimo menos 10 pontos atende uma condição predefinida, e esse caso não é relacionado a P(n).

[0114] Portanto, P(n)=1/2*P(n-1)+(1/2f2*P(n-2)+...+(1/2^11*P(n11). Outra regra predefinida é: para um ponto divisório potencial k, determinar 24 pontos p_x, uma janela W_x [ p_x - A_x, p_x+B_x ] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [ p_x - A_x, p_x+B_x ] onde x indica números naturais consecutivos de 1 a 24 separadamente, onde uma probabilidade de que pelo menos uma parte de dados na janela Wx [ px A_x, p_x+B_x ] que corresponde ao ponto p_x atenda a condição predefinida C_x é de 3/4, e P(n) pode ser calculada usando-se os dois fatores, isto é, a quantidade de pontos p_x e a probabilidade de que pelo menos uma parte de dados na janela W_x [ p_x - A_x, p_x+B_x ] que corresponde ao ponto p_x atenda a condição predefinida. Além disso, A₁= A₂ = A₃ = A₄= A₅ = A₆ = A₇ = A₈ = A₉= A₁₀ = A₁₁=169, B= b₂= b₃ = b₄ = b₅ = b₆ = b₂= b= b₉ = b₁₀ = B_n=0, e C1 = C₂ = C₃ = C₄ = C₅=C₆=C₇=C₈=C₉=...=C₂₂ = C₂₃=C₂₄, onde uma distância entre p_x e o ponto divisório potencial k é de d_x bytes. Especificamente, uma distância entre p₁ e o ponto divisório potencial k é de 0 byte, uma distância entre p₂ e k é de 1

Petição 870160008725, de 11/03/2016, pág. 325/698

54/200 byte, uma distância entre p₃ e k é de 2 bytes, uma distância entre p₄ e k é de 3 bytes, uma distância entre p₅ e k é de 4 bytes, uma distância entre p₆ e k é de 5 bytes, uma distância entre p₇ e k é de 6 bytes, uma distância entre p₈ e k é de 7 bytes, uma distância entre p₉ e k é de 8 bytes, uma distância entre p₂₂ e k é de 21 bytes, uma distância entre p₂₃ e k é de 22 bytes, uma distância entre p₂₄ e k é de 23 bytes, e com relação ao ponto divisório potencial k, todos os P2, P3, p_A, P5, p₆, P7, p₈, P9, ..., P22, P23, e p₂₄ estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados. Portanto, se o ponto divisório potencial k é ou não um ponto divisório de corrente de dados depende de que ocorra que pelo menos uma parte de dados em cada janela de janelas que correspondem aos 24 pontos consecutivos atende a condição predefinida C_x, e o cálculo pode ser realizado usando-se as seguintes fórmulas:

P(4073)=1, P(4074)=1, ..., P(4095)=1, Ρ(4096)=1-(3/4)^Λ24, e

P(n)=1/4*P(n-1)+1/4*(3/4)*P(n-2)+...+1/4*(3/4)^A23*P(n-24).

[0115] Após o cálculo, P(5*1024)=0,78, P(11*1024)=0,17, e P(12*1024)=0,13. Isto é, se nenhum ponto divisório de corrente de dados é encontrado com uma probabilidade de 13% após se prosseguir com uma busca para um ponto a uma distância de 12 KB a partir de uma posição inicial/ponto divisório de corrente de dados anterior de uma corrente de dados, e é realizada uma divisão forçada. Uma função de densidade de um ponto divisório de corrente de dados é obtida usando-se essa probabilidade, e após a integração, é obtido que, em média, um ponto divisório de corrente de dados é encontrado após se prosseguir com uma busca para um ponto a uma distância de cerca de 7,6 KB a partir da posição inicial/ponto divisório de corrente de dados anterior da corrente de dados, isto é, um comprimento de fatia comum é cerca de 7,6 KB. Diferente daquela pelo menos uma parte de dados na janelas que corresponde a 11 pontos consecutivos atende uma condição predefinida com uma probabilidade de 1/2, um algoritmo CDC convencional pode alcançar um

Petição 870160008725, de 11/03/2016, pág. 326/698

55/200 efeito de um comprimento de fatia comum ser de 7,6 KB apenas quando uma janela atende uma condição com uma probabilidade de 1/2^Λ12.

[0116] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 7, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 pontos p_x, uma janela W_x[p_x-A_x, p_x+B_x] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x[p_x-A_x, p_x+B_x], onde x indica números naturais consecutivos de 1 a 11 separadamente, onde uma probabilidade de que pelo menos uma parte de dados na janela W_x[p_x-A_x, p_x+B_X] que corresponde ao ponto p_x atenda a condição predefinida p_x é de

onde uma distância entre p_x e o ponto divisório potencial k é de d_x bytes.

Especificamente, uma distância entre // e o ponto divisório potencial k é de 2 bytes, uma distância entre p₂ e k é de 3 bytes, uma distância entre p₃ e k é de 4 bytes, uma distância entre /?₄ e k é de 5 bytes, uma distância entre p₅ e k é de 6 bytes, uma distância entre p₆ e k é de 7 bytes, uma distância entre ρ_Ί e k é de 8 bytes, uma distância entre p* e k é de 9 bytes, uma distância entre p₉ e k é de 10 bytes, uma distância entre k e [fj é de 1 byte, uma distância entre p_n e k é de 0 byte, e com relação ao ponto divisório potencial k, todos os ρ_λ, p₂, p₃, p₄, p₅, p₆, ρ_Ί, p_g, p₉, e p_w estão em uma direção oposta a uma direção de buscar um ponto divisório de corrente de dados. k_a é um ponto divisório de corrente de dados, e a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 7 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k_t, e um ponto p^ é determinado para o ponto divisório potencial k_t. Nessa

Petição 870160008725, de 11/03/2016, pág. 327/698

56/200 modalidade, de acordo com a regra predefinida no servidor para desduplicação

103, x indica números naturais consecutivos de 1 a 11 separadamente. Na maneira de implantação mostrada na Figura 7, de acordo com a regra predefinida, 11 pontos são determinados para o ponto divisório potencial k,, e ^são Pn

Pi2’ Pi 3’ Pi4, Pi 5’ Pi6 ’ Pi 7’

Pi8, Pi9, Pm, e P_in separadamente, e janelas que correspondem aos pontos p_i1,

Pi2 ’ Pi 3’ Pi 4’ Pi5’ Pi6 ’ Pi7’ Pi8 ’

Pi9’ Pno” ^e Pm ^{são W}n^[ Pn ^-169, P,1 L ^169, P,1 L ^W,2 í P,2^-169, Pnl ^W,3^[ P,3^-

169, Pi3], W_t4^[ P,4-¹⁶⁹, P.4], ^Wi5^[ Pi5^-169, Pi5], Wt6[ P,6-¹⁶⁹, Pi6], ^W, ^[ P,7-¹⁶⁹,

Pi7^]’ ^Wi8^[ Pi8^-169, P_fsL ^Wi9^[ P,9^-169, Pi9 ^Wi10^[ P,10^-169, Pi10^]’ ^{e W}i11^[ Pi11^-169,

P_i11] respectivamente. Uma distância entre o ponto p_x e o ponto divisório potencial k, é de d_x bytes. Especificamente, uma distância entre p_n e k, é de 2 bytes, uma distância entre p_i2 e k, é de 3 bytes, uma distância entre p,₃ e k, é de 4 bytes, uma distância entre p_i4 e k, é de 5 bytes, uma distância entre P,₅ e k, é de 6 bytes, uma distância entre p_i6 e k, é de 7 bytes, uma distância entre p_i7 e k, é de 8 bytes, uma distância entre p_i8 e k, é de 9 bytes, uma distância entre p_i9 e k, é de 10 bytes, uma distância entre p_i10 e k, é de 1 byte, uma distância entre ρ_Λ1 e k, é de 0 byte, e com relação ao ponto divisório potencial k,,, todos os p_i1

2' 3 > 4 ’ 5 ’ 6 > 7 , 8 >

P_i1o estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em W_a [ p_i1 -169, p_i1 ] atende uma condição predefinida C₁, é determinado se pelo menos uma parte de dados em w,₂[ p_i2-169, p,₂] atende uma condição predefinida C₂, é determinado se pelo menos uma parte de dados em W,3[ Pi3169, p,₃] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_i4 [ p_i4-169, p_i4] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados na WJ Pi5^-169, Ρ,5^]atende uma condição predefinida C₅, é determinado se pelo menos uma parte de dados na W_i6 [ p_i6-169, p_i6] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados na W,7 [ p.7-169, Pi,] atende

Petição 870160008725, de 11/03/2016, pág. 328/698

57/200 uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em w_iS[ p_iS-169, p_iS] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em Wi9 [ Pi9 -169, Pi9 ] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [ p_i10-169, p_i10] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em Wii[ p,u-^169, p,u] ^atendeuma condição predefinida C₁₁. Quando é determinado que a pelo menos uma parte de dados na janela w_n atende a condição predefinida C₁, a pelo menos uma parte de dados na janela w,₂ atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_i3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_t4 atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_i5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_t6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_i7atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_i8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela w,₉ atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_i10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_i11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_t é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das 11 janelas não atende a condição predefinida correspondente, conforme mostrado na Figura 8, que a pelo menos uma parte de dados em W_i3[ p_t3-169, p.₃] não atenda a condição predefinida C₃ e que 11 bytes sejam pulados a partir do ponto p, ₃ ao longo de uma direção de buscar um ponto divisório de corrente de dados é usado como um exemplo para descrição. Conforme mostrado na Figura 8, quando é determinado que W₃ não atende uma condição predefinida, a partir de p₃ que serve como um ponto inicial, N bytes são pulados ao longo da direção de buscar um ponto divisório de corrente de dados, onde os N bytes

Petição 870160008725, de 11/03/2016, pág. 329/698

58/200 não são maiores que H B₃ ||+max_x(II A_x II + H (k_l - p_lx) H). Na maneira de implantação mostrada na Figura 6, N bytes são pulados, e especificamente não são maiores que 179 bytes, e nessa modalidade, N=11. Um próximo ponto divisório potencial é obtido em uma posição de extremidade de um décimo primeiro byte. Para diferenciação do ponto divisório potencial k_l, o novo ponto divisório potencial é representado como k_j no presente documento. De acordo com a regra predefinida no servidor para desduplicação 103, 11 pontos são determinados para o ponto divisório potencial k_}, e são ρ_]λ, p_j2, p_j3, p_j4, p_j5, p_j6, p_j7, p_j8, p_j9, p_j10, e p_j41 separadamente, e janelas que correspondem ^aos p^ontos p7i, pj 2, pj 3, pj 4, pj5, p} 6, p} 7, pjS, pj9, pjW, ^e p fl1 ^sãodeterminadas, e são Wfl[pF-169, pj, Wj2[p}.2-169, p}.2], Wj3[p}.3-169, p}.3], Wj4[ pj4-169, pj, Wj5[ pj5-169, pj, W/6[ p^-169, p^], Wp[ pp-169, p.], Wj8 ^[ pj8^-169, pj8^]> ^Wj9^[ pj 9^-169, pj 9^{] W}j10^[ pj10^-169, pj10 L ^{e W}j11^[ pj11^-169, p j11^]respectivamente. Uma distância entre pjx e o ponto divisório potencial k_j é de d_x bytes. Especificamente, uma distância entre p_j4 e k_j é de 2 bytes, uma distância entre p_j2 e k_} é de 3 bytes, uma distância entre p_j3 e k_j é de 4 bytes, uma distância entre p_j4 e k_} é de 5 bytes, uma distância entre p_j5 e k_jé de 6 bytes, uma distância entre p_j6 e k_j é de 7 bytes, uma distância entre p_j7 e k_j é de 8 bytes, uma distância entre p_j8 e k_j é de 9 bytes, uma distância entre p_j9 e k_} é de 10 bytes, uma distância entre p_j10 e k_j é de 1 byte, uma distância entre p_j41 e k_j é de 0 byte, e com relação ao ponto divisório potencial ^kj ^{, todos os} pj1 ^, pj2 ^, pj3 ^, pj4 ^, pj5 ^, pj6 ^, pj7 ^, pj8 ^, pj9 ^, pjW ^e p^{estão em}uma direção oposta à direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em j pj1^-169, pj1^]atende a condição predefinida C1, é determinado se pelo menos uma parte de dados em Wj ₂[ p_{j 2}-169, p_{j 2}] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_j3[ p_j3-169, p_j3] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W 4^[ pj 4169, p_{j 4}] atende a condição predefinida C₄, é determinado se pelo menos uma

Petição 870160008725, de 11/03/2016, pág. 330/698

59/200 parte de dados em W_j5[p_j5-169, p_j5] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[ p_{j 6}-169, p_{j 6}] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_j7[ Pj ₇-169, Pj ₇] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[p_j8-169, p_j8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em ^Wj9^[ pj9169, p_j9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_J10[p_J10-169, p_J10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em ^WJ11^[ p711^-169, p711^]atende a condição predefinida C₁₁. Certamente, nessa modalidade da presente invenção, a regra também é seguida quando é determinado se o ponto divisório potencial k_a é ou não um ponto divisório de corrente de dados, a implantação específica não é descrita novamente, e referência pode ser feita à descrição de determinação do ponto divisório potencial k_t. Quando é determinado que a pelo menos uma parte de dados na janela W_j1 k_t atende a condição p^redefinida C, ^a p^e^ ^{menos uma} p^{arte de dados na janela} W2 ^{atende a}condição predefinida C₂, a pelo menos uma parte de dados na janela W_j3atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_{j 4} atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_j5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_j6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_j7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_j8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_j10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_j11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_j é um ponto divisório de corrente de dados, e os dados entre k_j e k_a formam 1 (uma) fatia de dados. Entretanto, um tamanho mínimo de fatia de 4 KB é pulado de uma maneira

Petição 870160008725, de 11/03/2016, pág. 331/698

60/200 igual àquela de k_a para se obter um próximo ponto divisório potencial, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103, se o próximo ponto divisório potencial é ou não um ponto divisório de corrente de dados. Quando é determinado que o ponto divisório potencial não é um ponto divisório de corrente de dados, 11 bytes são pulados de uma maneira igual àquela de k_t para se obter um próximo ponto divisório potencial, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103 e o supracitado método, se o próximo ponto divisório potencial é ou não um ponto divisório de corrente de dados. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado. Certamente, a implantação de o método é restringida por um comprimento da fatia de dados máxima e um tamanho de um arquivo que forma a corrente de dados, que não é descrito novamente no presente documento.

[0117] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 9, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 pontos p_x, uma janela W_x [ p_x- A_x, p_x+B_x] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [ p_x- A_x, p_x+B_x], onde A = A₂ = A₃= A₄= A₅ = A₆= A₇ = A₈ = A₉= A₁₀ = An =169, B = B 2= B3 = B ₄= B₅ = B ₆= B ₇ = B₈ = B ₉= B₁₀ = B₁₁=0, e C₁=C₂ = C₃ = C₄=C₅ = C₆=C₇= C₈=C₉=C₁₀=C₁₁,,. Uma distância entre p_x e o ponto divisório potencial k é de d_x bytes. Especificamente, uma distância entre p_} e o ponto divisório potencial k é de 3 bytes, uma distância entre p₂ e k é de 2 bytes, uma distância entre p₃ e k é de 1 byte, uma distância entre p₄ e k é de 0 byte, uma distância entre p₅ e k é de 1 bytes, uma distância entre p₆ e k é de 2 bytes, uma distância entre p₇ e k é de 3 bytes, uma distância entre p₈ e k é de 4 bytes, uma distância entre p₉ e k é

Petição 870160008725, de 11/03/2016, pág. 332/698

61/200 de 5 bytes, uma distância entre p_w k é de 1 byte, uma distância entre e k é de 7 bytes, e todos os p_x, p₂, p₃, p₄, p₅, p₆, p₇, p₈, p₉, e p₁₀ estão com relação ao ponto divisório potencial k, em uma direção oposta a uma direção de buscar um ponto divisório de corrente de dados, e todos os p₁, p₂, e p₃ estão, com relação ao ponto divisório potencial k, na direção de buscar um ponto divisório de corrente de dados. k_a é um ponto divisório de corrente de dados, e a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 9 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k., e um ponto p_x é determinado para o ponto divisório potencial k.. Nessa modalidade, de acordo com a regra predefinida no servidor para desduplicação 103, x indica números naturais consecutivos de 1 a 11 separadamente. Na maneira de implantação mostrada na Figura 9, 11 pontos são determinados para um ponto divisório potencial k., ^{e são} Ρ_Λ, p.2’ p.3’ p,4 ’ p.5’ p.6’ Ρί_Ί, p_tS, p,9, p,io, e p.11 separadamente, e janelas que correspondem aos pontos p_ü,

p.2’ p. 3’ p. 4’ p.5’ p.6’ p.7’ p.8’

p.9’ p.10’’ ^e p.11 ^{são W}n^[ p,1-^169, p,1]’ ^169, p,1]’ ^W \ p,2-^169, p,2]’ ^W.3^[ p.3^- ¹⁶⁹’ Pi 3 ^]’ ^W. 4^[ p.4^-169’ ^W.5^[ p. 5^-169’ C 5 ^]’ ^W. 6^[ p.6^-169’ Ρί₆1 W ^[ p.7^-169’ p,7^]’ ^W.8^[ p.8^-169’ p,8^]’ ^W.9^[ p.9 ^-169’ Ρί91 ^W,10Í p.10^-169’ Λαοί’ ^{e W}.11^[ p.11^-169’ p.11] respectivamente. Uma distância entre o ponto p_x e o ponto divisório potencial k. é de d _x bytes. Especificamente, uma distância entre p_n e k. é de 3 bytes, uma distância entre p_i2 e k_i é de 2 bytes, uma distância entre p_i3 e k_ié de 1 byte, uma distância entre p_i4 e k_i é de 0 byte, uma distância entre p_i5 e k. é de 1 byte, uma distância entre p.₆ e k. é de 2 bytes, uma distância entre p.₇ e k. é de 3 bytes, uma distância entre p.₈ e k. é de 4 bytes, uma distância entre p_i9 e k_i é de 5 bytes, uma distância entre p_i10 e k_i é de 6 bytes, uma distância entre p._n e k_t é de 7 bytes, todos os p^, p_i6, p_tl, p^ , p.₉ , p_ao e p.₁₁ estão, com relação ao ponto divisório potencial k., em uma direção oposta

Petição 870160008725, de 11/03/2016, pág. 333/698

62/200 à direção de buscar um ponto divisório de corrente de dados e todos os p_n, p,₂, p,₃, estão, com relação ao ponto divisório potencial k,, na direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em W_n [ p_i4 -169, p_i4 ] atende uma condição predefinida C₁, é determinado se pelo menos uma parte de dados em W2^[ Pi2^-169, P,2^]atende uma condição predefinida C2, é determinado se pelo menos uma parte de dados em Wi3[ p,3-169, p.3] atende uma condição predefinida C3, é determinado se pelo menos uma parte de dados em W,4[ pi4-169, pi4] atende uma condição predefinida C4, é determinado se pelo menos uma parte de dados na Wi5[ p,5-169, p.5] atende uma condição predefinida C5, é determinado se pelo menos uma parte de dados na W,6[ p,6-^169, p,6] ^atendeuma condição predefinida C6, é determinado se pelo menos uma parte de dados na W_i7[ p,₇-169, p.₇] atende uma condição predefinida C₇,é determinado se pelo menos uma parte de dados em W-₈[ p_l8-^169, pl8] ^atendeuma condição predefinida C8, é determinado se pelo menos uma partede dados em W_i9[ p,.₉-169, p.₉] atende uma condição predefinida C₉,é determinado se pelo menos uma parte de dados em w,₁₀ [ p,₁₀-169, p,₁₀] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_i11[ p,₁₁-169, p,₁₁] atende uma condição predefinida C₁₁. Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida C₁, a pelo menos uma parte de dados na janela w,₂atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_i3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W₄ atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W ₅ atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W ₆ atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W ₇ atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_i8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_i9 atende a condição predefinida

Petição 870160008725, de 11/03/2016, pág. 334/698

63/200

C₉, a pelo menos uma parte de dados na janela W₁₀ atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_t11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_i é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das 11 janelas não atende a condição predefinida correspondente, por exemplo, conforme mostrado na Figura 10, pelo menos uma parte de dados em W_i7[ p_í7-169, p_i7} não atende uma condição predefinida, N bytes são pulados a partir do ponto p_i7 ao longo da direção de buscar um ponto divisório de corrente de dados, onde os N bytes não são maiores que || B₄ ||+max_x(II A_x II + || (k_i - p_ix) ||). Em uma maneira de implantação mostrada na Figura 10, N bytes que são pulados especificamente não são maiores que 179 bytes, e nessa modalidade, N=8, de modo a se obter um novo ponto divisório potencial. Para diferenciação do ponto divisório potencial k_t, o novo ponto divisório potencial é representado como k_j no presente documento. De acordo com a regra predefinida no servidor para desduplicação 103 na maneira de implantação mostrada na Figura 9, 11 pontos são determinados para o ponto divisório potencial k_;, e são p_}1, p_j2, p_j3, p_j4, Pj5, p_}6, p_}7, p_Jg, p_}9, p_jW, e p_jU separadamente, e janelas que ^corresp^{ondem aos} p^ontos p7i, p}2, p]3, p}4, p}5, p}6, p}7, p}8, pj9, pjW , ^e pfll são determinadas, e são W_;1[p^-169, p,.J, Wj₂[p_}2-169, p_}2], W_j3[p_j3-169, pj3l ^Wj4^[ pj 4^-169, pj 4^{] W}j5^[ pj5^-169, p \- ^Wj6^[ p^ 6^-169, p^ 6^{] W}j 7^[ p^ 7^-169, p^ 7^]Wj₈[pj₈-169, pj₈], Wj9[pj9-169, pj₉], Wj_W[p^-169, p^], e Wj_U[pj_U-169, p_j11] respectivamente. Uma distância entre p_jx e o ponto divisório potencial k_jé de d_x bytes. Especificamente, uma distância entre p_j4 e k_j é de 3 bytes, uma distância entre p_j2 e k_j é de 2 bytes, uma distância entre p_j3 e k_j é de 1 byte, uma distância entre p_j4 e k_j é de 0 byte, uma distância entre p_j5 e k_j é de 1 byte, uma distância entre p_j6 e k_j é de 2 bytes, uma distância entre p_j7 e k_j é de 3 bytes, uma distância entre p_j8 e k_j é de 4 bytes, uma distância entre p_j9 e k_j é de 5 bytes, uma distância entre p_j10 e k_j é de 6 bytes, uma

Petição 870160008725, de 11/03/2016, pág. 335/698

64/200 distância entre p_]U e k_} é de 7 bytes, todos os p_}5, p_}6, p_}7, p^, p_j9, p_]W e p _j11 estão com relação ao ponto divisório potencial k_j, em uma direção oposta à direção de buscar um ponto divisório de corrente de dados, e todos os p_j4, p_j2, p_j3, estão com relação ao ponto divisório potencial k_j, na direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em W_j1[p_j4-169, p_j4] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W_{j 2}[ p_{j 2}-169, p_{j 2}] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_j3[p_j3-169, p_j3] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_j4[ p_j4-169, p_j4] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em

169, p_j5] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[ p_j6-169, p_j6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_j7[ p_{j 7}-169, p_{j 7}] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[p_j8-169, p_j8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_j9[ p_j9-169, p_j9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[ p_j10-169, p_j10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_jU[ p_j41-169, p_j41] atende a condição predefinida C₁₁. Certamente, nessa modalidade da presente invenção, a regra também é seguida quando é determinado se o ponto divisório potencial k_a é ou não um ponto divisório de corrente de dados, a implantação específica não é descrita novamente, e referência pode ser feita à descrição de determinação do ponto divisório potencial k_t. Quando é determinado que a pelo menos uma p^{arte de dados na janela W atende a condi}ç^ão p^{redefinida , a} p^e^ ^{menos uma} p^{arte de dados na janela W atende a condi}ç^ão p^{redefinida C}2 ^{, a} p^e^ menos uma parte de dados na janela W_j3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_j4 atende a condição predefinida

Petição 870160008725, de 11/03/2016, pág. 336/698

65/200

C₄, a pelo menos uma parte de dados na janela W_j5 atende a condição predefinida C, ^{a peo me}n°^{s uma} p^{arte de dados na} Janete ^{W atende a}condição predefinida C₆, a pelo menos uma parte de dados na janela W_j7atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_j8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_j10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_jU atende a condição predefinida C₁₁, o ponto divisório potencial corrente é um ponto divisório de corrente de dados, e os dados entre k_} e k_a formam 1 (uma) fatia de dados. Entretanto, um tamanho mínimo de fatia de 4 KB é pulado de uma maneira igual àquela de k_a para se obter um próximo ponto divisório potencial, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103, se o próximo ponto divisório potencial é ou não um ponto divisório de corrente de dados. Quando é determinado que o ponto divisório potencial k_j não é um ponto divisório de corrente de dados, 11 bytes são pulados de uma maneira igual àquela de k_tpara se obter um próximo ponto divisório potencial, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103 e o supracitado método, se o próximo ponto divisório potencial é ou não um ponto divisório de corrente de dados. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado.

[0118] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 11, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 pontos p_x, uma janela W_x [ p_x- A_x, p_x+B_x] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [ p_x- A_x, p_x+B_x], onde A = A₂ = A₃

Petição 870160008725, de 11/03/2016, pág. 337/698

66/200 = A. A_s = A₆= Α_ί = A_g = A9= A10=169, A11 =182, B = B2 = B3 = B4= B5 = B₆= B7= B_s = B₉= B₁₀ = B₁₁=0, e C₁ = C₂ = C₃=C₄=C₅=C₆= C₇=C₈ = C₉= C₁₀á C₁₁. Uma distância entre p_x e o ponto divisório potencial k é de d_x bytes. Especificamente, uma distância entre p₁ e o ponto divisório potencial k é de 0 byte, uma distância entre p₂ e k é de 1 byte, uma distância entre p₃ e k é de 2 bytes, uma distância entre p₄ e k é de 3 bytes, uma distância entre p₅ e k é de 45 bytes, uma distância entre p₆ e k é de 5 bytes, uma distância entre p₇ e k é de 6 bytes, uma distância entre p₈ e k é de 7 bytes, uma distância entre p₉ e k é de 8 bytes, uma distância entre p₁₀ k é de 1 byte, uma distância entre p_n e k é de 3 bytes, e todos os , p₂, p3, p_A, p5, ía, p₇, p₈, e p9 estão com relação ao ponto divisório potencial k, em uma direção oposta a uma direção de buscar um ponto divisório de corrente de dados, e tanto p₁₀ quanto p₁₁ estão, com relação ao ponto divisório potencial k, na direção de buscar um ponto divisório de corrente de dados. k_a é um ponto divisório de corrente de dados, e a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 11 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k,, e um ponto p_ix é determinado para o ponto divisório potencial k,. Nessa modalidade, de acordo com a regra predefinida no servidor para desduplicação 103, x indica números naturais consecutivos de 1 a 11 separadamente. Na maneira de implantação mostrada na Figura 11, 11 pontos são determinados para o ponto divisório potencial k,, e ^são p,1 p,-2» Pi 3» p,4> Pi 5» p,6> Pi 7» p,₈, p,9» p,10» e p,11 separadamente, e janelas que correspondem aos pontos p_n, p,2» Pi 3» Pi 4» p,5» p,6» p,7» p,8» p,9» p,10»» ^e p,11 ^{são W},1^[ p,1^-169» p,1^]» ^169, p,1^]» ^W 2 I p,2'¹⁶⁹» p,2 ^]» ^W,3^[ p.3^- ¹⁶⁹» Pi3 ^]» ^Wi4^[ p,4’¹⁶⁹» p,4^]» W-5Í p>5^-169» p>5 ^]» ^Wi6^[ p,6^-169» /A. ^]» ^W,7 ^[ p,7^-169» p,7^]» Wsí p,8^-169» p,8^]» ^Wi 9^[ p,9^-169» /11' ^W,10^[ p,10^-169» p,10^]» ^{e W},11^[ p,11^-182» p,₁₁] respectivamente. Uma distância entre o ponto p_x e o ponto divisório

Petição 870160008725, de 11/03/2016, pág. 338/698

67/200 potencial k. é de d_x bytes. Especificamente, uma distância entre p_n e k. é de 0 byte, uma distância entre p.₂ e k. é de 1 byte, uma distância entre p.₃ e k. é de 2 bytes, uma distância entre p.₄ e k. é de 3 bytes, uma distância entre p.₅e k. é de 4 bytes, uma distância entre p.₆ e k. é de 5 bytes, uma distância entre p.₇ e k. é de 6 bytes, uma distância entre p.₈ e k. é de 7 bytes, uma distância entre p.₉ e k. é de 8 bytes, uma distância entre p_i10 e k. é de 1 byte, uma distância entre p_fll e k_t é de 3 bytes, todos os p_i2, p.3, p.4, p.5, p.₆, p.7, p_i8, e p.₉ estão, com relação ao ponto divisório potencial k., em uma direção oposta à direção de buscar um ponto divisório de corrente de dados e tanto p_i10 quanto p_t11, estão, com relação ao ponto divisório potencial k_t, na direção de buscar um ponto divisório de corrente de dados. Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida C₁, a pelo menos uma parte de dados na janela W_t2 atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W₃ atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_t4atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W₅ atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W₆ atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W₇ atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W₈ atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W₉ atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_i10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W ₁₁ atende a condição predefinida C₁₁, o ponto divisório potencial corrente k. é um ponto divisório de corrente de dados. Quando é determinado que a pelo menos uma parte de dados na janela W ₁₁ não atende a condição predefinida C₁₁ , 1 byte é pulado a partir do ponto divisório potencial k_t ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter um novo ponto divisório potencial. Para diferenciação do ponto divisório potencial k , o novo ponto divisório potencial é

Petição 870160008725, de 11/03/2016, pág. 339/698

68/200 representado como k_j no presente documento. Quando a pelo menos uma parte de dados em qualquer janela das 10 janelas W_a, W_t2, W_i3, W_t4, W_i5, W_i6, W₇, Ws, W₉, e W_i1o não atende a condição predefinida correspondente, por exemplo, W_i4[ p,.₄-169, p.₄] mostrada na Figura 12, N bytes são pulados a partir do ponto p_i4 ao longo da direção de buscar um ponto divisório de corrente de dados, onde os N bytes não são maiores que || B₄ || + max_x(II A_x I + II (k - p_Ix) II). Em uma maneira de implantação mostrada na Figura 12, os N bytes que são pulados são especificamente não maiores que 179, e nessa modalidade, especificamente, N=9, de modo a se obter um novo ponto divisório potencial k_t, o novo ponto divisório potencial é representado como k_jno presente documento. De acordo com a regra predefinida no servidor para desduplicação 103 na maneira de implantação mostrada na Figura 11, 11 pontos são determinados para o ponto divisório potencial k_j, e são p_j1, p_j2, Pj3, p_}4, p₇5, p_}6, pj7, p₇s, p₇9, p₇io, e p.11 separadamente, e janelas que ^corresp^{ondem aos} p^ontos p7i, p}2, p73, p}4, p}5, p}6, p}7, p^, pj9, pjW ^{, e} pjU são determinadas, e são W_;4[p^-169, pj, W_}2[ _P]2-169, _P]2], W_j3[ pj₃-169, pp ^{] W}j4^[ pj 4^-169, pj 4 1» ^Wj5^[ pj5^-169, pp ^{] W}j6^[ pj 6^-169, pj 6^{] W}j7^[ pj 7^-169, pj 7^]Wj8[ pjs-169, pjs], Wj,[ pj,-169, pj9], pjW-169, pjW], e WjU[ ^-182, p^] respectivamente. Uma distância entre pjx e o ponto divisório potencial kj é de dx bytes. Especificamente, uma distância entre pj1 e kj é de 0 bytes, uma distância entre pj2 e kj é de 1 byte, uma distância entre pj3 e kj é de 2 bytes, uma distância entre pj4 e kj é de 3 bytes, uma distância entre pj5 e kj é de 4 bytes, uma distância entre pj6 e kj é de 5 bytes, uma distância entre pj7 e kj é de 6 bytes, uma distância entre pj8 e kj é de 7 bytes, uma distância entre pj9 e kj é de 8 bytes, uma distância entre pj10 e kj é de 1 byte, uma distância ^entre pj11 ^{e k}j ^{é de 3 b}y^tes ^{todos os} pj2^, pj3^, pj4^, pj5^, p ^ pj7^, p^ ^{, e} pj9 estão, com relação ao ponto divisório potencial k_j, em uma direção oposta à direção de buscar um ponto divisório de corrente de dados, e tanto p_j10 quanto p_j11 estão, com relação ao ponto divisório potencial k_j, na direção de buscar

Petição 870160008725, de 11/03/2016, pág. 340/698

69/200 um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados na W_j1[p_y1-169, p_}1] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados na Wj ₂[ p_{} 2}-169, p_{} 2}] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados na W_j3[ p_}3-169, p ] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados na W_j4[ p_{} 4}-169, p_{} 4}] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados na ^Wj5^[ p}5^-169, p I atende a condição predefinida C5, é determinado se pelo menos uma parte de dados na W_j6[p_}6-169, p_}6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados na W_j7[p_}7-169, p_}7] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados na ^Wj8^[ p78169, pj8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados na W_j9[p_}9-169, p_j9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados na W_J10 [ p_j10-169, p_j10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados na [ W_fl1 p_j41-182, p_j11) atende a condição predefinida C₁₁. Certamente, nessa modalidade da presente invenção, a regra também é seguida quando é determinado se o ponto divisório potencial k_a é ou não um ponto divisório de corrente de dados, a implantação específica não é descrita novamente, e referência pode ser feita à descrição de determinação do ponto divisório potencial k_t. Quando é determinado que a pelo menos uma parte de dados na janela W_j1 atende a condição predefinida C₁, a pelo menos uma parte de dados na janela W_j2 atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_j3 atende a condição predefinida C₃, a pelo menos ^uma p^{arte de dados na janela W}j4 ^{atende a condi}ç^ão p^{redefinida C, a} p^eto menos uma parte de dados na janela W_j5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_j6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_j7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_j8 atende a

Petição 870160008725, de 11/03/2016, pág. 341/698

70/200 condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_j10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_j11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente é um ponto divisório de corrente de dados, e os dados entre e k_a formam 1 (uma) fatia de dados. Entretanto, um tamanho mínimo de fatia de 4 KB é pulado de uma maneira igual àquela de k_a para se obter um próximo ponto divisório potencial, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103, se o próximo ponto divisório potencial é ou não um ponto divisório de corrente de dados. Quando é determinado que o ponto divisório potencial k_} não é um ponto divisório de corrente de dados, 11 bytes são pulados de uma maneira igual àquela de k_t para se obter um próximo ponto divisório potencial, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103 e o supracitado método, se o próximo ponto divisório potencial é ou não um ponto divisório de corrente de dados. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado.

[0119] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 13, uma regra que é predefinida em um servidor para desduplicação 103 é: para um ponto divisório potencial k, determinar 11 pontos p_x, uma janela W_x [ p_x- A_x, p_x+B_x] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [ p_x - A_x, p_x + B_x] onde x indica números naturais consecutivos de 1 a 11 separadamente, onde uma probabilidade de que pelo menos uma parte de dados na janela W_x[ p_x- A_x, p_x+B_x] que corresponde ao ponto p_x atenda uma condição predefinida é de 1/2, A = A₂ = A₃ = A₄= A₅ = A₆= A₇ = A₈ = A9= A1O = A11=169, B_l = B 2 = B₃ = B ₄ = B₅ = B ₆= B ₇ = B₈ = B₉ = B₁₀ = B₁₁=0, e C₁=C₂=C3=C₄=C5=C6=C₇= C₈=C9= C_w=C_n„, onde uma

Petição 870160008725, de 11/03/2016, pág. 342/698

71/200 distância entre p_x e o ponto divisório potencial k é de d_x bytes. Especificamente, uma distância entre p₁ e o ponto divisório potencial k é de 0 byte, uma distância entre p₂ e k é de 2 bytes, uma distância entre p₃ e k é de 4 bytes, uma distância entre p₄ e k é de 6 bytes, uma distância entre p₅ e k é de 8 bytes, uma distância entre p₆ e k é de 10 bytes, uma distância entre p₇ e k é de 12 bytes, uma distância entre p₈ e k é de 14 bytes, uma distância entre p₉ e k é de 16 bytes, uma distância entre p₁₀ e k é de 18 bytes, uma distância entre p₁₁ e k é de 20 bytes, e com relação ao ponto divisório potencial k todos os P2, P3, p₄, P5, pp, P7, p₈, P9, P_w e p„ estão em uma direção oposta a uma direção de buscar um ponto divisório de corrente de dados. k_a é um ponto divisório de corrente de dados, e a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 13 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k,, e um ponto p_ix é determinado para o ponto divisório potencial k,.

Nessa modalidade, de acordo com a regra predefinida no servidor para desduplicação 103, x indica números naturais consecutivos de 1 a 11 separadamente. Na maneira de implantação mostrada na Figura 13, de acordo com a regra predefinida, 11 pontos são determinados para o ponto divisório p^otencial k, ^{, e são} p,i, p,2, p,3, p,4, p,5, p,6, p,7, p,.8, p,9, P,10, ^e P,n separadamente, e janelas que correspondem aos pontos p_n, p,₂,

Pi3> Pi4 ^,

Pi 5’ Pi6 ^,

Pi7 ’ P,8 ^, P,9, Pi10» ^e P111 ^são W1^[ P,1^-169, P,1 L ^169, PÍ1L

W₂[ p,2^169, Pi 2^]

W₃[ P,3^-169, Pil\, ^W,4^[ P,4^-169, P,4^]’ ^W,5^[ P,5^-169, P,5^]’ ^W,6 ^[ P,6^-169,

P,₆l W,₇ ^[ p,7^-169, ΡίΊ], ^W,8^[ P,8^-169, P,8^]’ W 9^[ P,9^-169, Pi9), W10^[ P,10^-169, p_fl0], e W_i11[ p,₁₁-169, p_I11] respectivamente. Uma distância entre o ponto p_x e o ponto divisório potencial k_i é de d_ix bytes. Especificamente, uma distância entre p_i1 e k_i é de 0 byte, uma distância entre p_i2 e k_i é de 2 bytes, uma distância entre p,₃ e k, é de 4 bytes, uma distância entre p,₄ e k, é de 6 bytes,

Petição 870160008725, de 11/03/2016, pág. 343/698

72/200 uma distância entre p.₅ e k. é de 8 bytes, uma distância entre p.₆ e k. é de 10 bytes, uma distância entre p.₇ e k. é de 12 bytes, uma distância entre p₈ e k. é de 14 bytes, uma distância entre p₉ e k. é de 16 bytes, uma distância entre p_i10 e k. é de 18 bytes, uma distância entre p_i11 e k. é de 20 bytes, e com relação ao ponto divisório potencial k., todos os p.₂, p.₃, p.₄, p_i5, p_i6, p_i7, p_i8, p_l9, p_i10, e p_ai estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em w_n[ p_ü-169, p_n] atende uma condição predefinida C₁, é determinado se pelo menos uma parte de dados em W2[ p.2-169, p.2] atende uma condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_i3[ p.₃-169, p.₃] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W,4[ p.4-169, p.4] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados na W_i5[ p,₅-169, p.₅] atende uma condição predefinida C₅, é determinado se pelo menos uma parte de dados na W,₆[ p.6-^169, p,6] ^atendeuma condição predefinida C₆, é determinado se pelo menos uma parte de dados na W_i7[ p,₇-169, p.₇] atende uma condição predefinida C₇,é determinado se pelo menos uma parte de dados em WJ p_l8-¹⁶⁹, pi8] ^atendeuma condição predefinida C8, é determinado se pelo menos uma partede dados em W_i9[ p,₉-169, p.₉] atende uma condição predefinida C₉,é determinado se pelo menos uma parte de dados em W_I10 [ p.₁₀-169, p_I10] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_i41[ p._n -169, p_fl1] atende uma condição predefinida C₁₁. Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida C₁, a pelo menos uma parte de dados na janela w.₂ atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_i3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W₄ atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W₅ atende a condição predefinida C₅, a pelo menos uma

Petição 870160008725, de 11/03/2016, pág. 344/698

73/200 parte de dados na janela w_{6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_t7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela w_i8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_i9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela w_i10 atende a condição predefinida C_io, e a pelo menos uma parte de dados na janela w_i11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_t é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das 11 janelas não atende a condição predefinida correspondente, por exemplo, conforme mostrado na Figura 14, a pelo menos uma parte de dados em W₄ [ p_t4-169, p_t4 ] não atende a condição predefinida C₄, um próximo ponto divisório potencial é selecionado. Para diferenciação do ponto divisório potencial k_i , o próximo ponto divisório potencial é representado como k. no presente documento, onde k. está localizado à direita de k_t, e uma distância entre k. e k_t é de 1 byte. Conforme mostrado na Figura 14, de acordo com a regra predefinida no servidor para desduplicação 103, 11 pontos são determinados para o ponto divisório potencial k., e são p. ₁, p .₂, p p .₄, . p.6, p.7, p_jg, p.9, p.io, e p.11 separadamente, e janelas que correspondem ^{ao pontos} p. 1, p.2, p.3, p.4, p.5, p.6, p..7 , p..g , p.9, p.^, ^e p.n ^sãodeterminadas, e são W_F[p.i-169, p.i ], W.₂[p₂-169, p.J, W.₃[p.₃-169, p.J,

W_j4[p,-169, p.,], W_j5[p.,-169, p.₅], W.₆[p._ó-169, p.₆], W_p[p.₇-169, pj, W.

^[ p.8^{-169, W}.9^[ p.9^{-169, W}.10^[ p.10^-169, p.10 L ^{e W}. 11^[ P .11 ^-169, P .11 ^]

C₈=C₉=C_io=C₁₁. Uma distância entre p e o ponto divisório potencial k.é de d _x bytes. Especificamente, uma distância entre p.₁ e k. é de 0 byte, uma distância entre p.₂ e k. é de 2 bytes, uma distância entre p.₃ e k. é de 4 bytes, uma distância entre p.₄ e k. é de 6 bytes, uma distância entre p_j5 e k. é de 8 bytes, uma distância entre p_j6 e k. é de 10 bytes, uma distância entre

Petição 870160008725, de 11/03/2016, pág. 345/698

74/200 p_j7 e k_j é de 12 bytes, uma distância entre p_j8 e k_j é de 14 bytes, uma distância entre p_j9 e k_j é de 16 bytes, uma distância entre p_j10 e k_j é de 18 bytes, uma distância entre p_j41 e k_j é de 20 bytes, e com relação ao ponto divisório potencial kj, todos os pj₂, pj₃, pj₄, p.₅, pj₆, pj7, />., e pj₉ estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados na ^Wji^[ pji-^169, pfl^]atende a condição predefinida C1, é determinado se pelo menos uma parte de dados na W_j2[p_j2-169, p_j2] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados na W_j3[p_j3-169, p_j3] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados na ^Wj 4^[ pj 4169, pj4] atende a condição predefinida C4, é determinado se pelo menos uma parte de dados na Wj5[pj5-169, pj5] atende a condição predefinida C5, é determinado se pelo menos uma parte de dados na Wj6[pj6-169, pj6] atende a condição predefinida C6, é determinado se pelo menos uma parte de dados na Wj7[pj7-169, pj7] atende a condição predefinida C7, é determinado se pelo menos uma parte de dados na Wj8[pj8-169, pj8] atende a condição predefinida C8, é determinado se pelo menos uma parte de dados na ^Wj9^[ pj9^-169, pj9^]atende a condição predefinida C9, é determinado se pelo menos uma parte de dados na W_j10[p_j10-169, p_j10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados na [ W_j11 p_j11-182, p_j41] atende a condição predefinida C₁₁. Quando é determinado que a pelo menos uma p^{arte de dados na janela} Wj1 ^{atende a condi}ç^ão p^redefinida C1^{, a} p^eto ^{menos uma} p^{arte de dados na janela} Wj2 ^{atende a condi}ç^ão p^{redefinida C, a} p^eto menos uma parte de dados na janela Wj3 atende a condição predefinida C3, a pelo menos uma parte de dados na janela Wj4 atende a condição predefinida C4, a pelo menos uma parte de dados na janela Wj5 atende a condição predefinida C,^, a pelo menos uma parte de dados na janela ^W atende a condição predefinida C6, a pelo menos uma parte de dados na janela W_j7atende a condição predefinida C₇, a pelo menos uma parte de dados na janela

Petição 870160008725, de 11/03/2016, pág. 346/698

75/200

W_j8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_j10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W)._n atende a condição predefinida C₁₁, o ponto divisório potencial corrente é um ponto divisório de corrente de dados, Quando é determinado que a pelo menos uma parte de dados em qualquer janela das janelas W_fl, W_j2, W_j3, Wj₄, w_/5, W_/6, W^, W^, W_J9, W^, e W₇₁₁ não atende a condição predefinida, por exemplo, conforme mostrado na Figura 15, quando a pelo menos uma parte de dados em W_j3[ p_{} 3}-169, p_{} 3}] não atende a condição predefinida C₃, o ponto p₄ está localizado à esquerda do ponto p_j3com relação à direção de buscar um ponto divisório de corrente de dados, e 21 bytes são pulados a partir do ponto p.₄ ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter um próximo ponto divisório potencial. Para diferenciação dos pontos divisórios potenciais k. e k_}, o próximo ponto divisório potencial é representado como k_l. De acordo com a regra predefinida no servidor para desduplicação 103 na maneira de implantação mostrada na Figura 13, 11 pontos são determinados para o ponto ^divisório p^otencial , ^{e são} pn , pt2 , pt3 , pt4 , pt5 , pt6 , pt7 , pt8 , pi9 , pnQ , ^epl11 separadamente, janelas que correspondem aos pontos p„, p_l2, p_l3, p_l4, pi5’ pi 6’ pi 7’ p18> pi 9’ P ’ ^e «11 ^{são W}l1^[ ^1^-169, «11, ^Wl 2^[ Bl 2^-169, Bl 2^]’ ^Wl3^[ pí3^-169, pí3^]’ ^Wl4^[ pi 4^-169, pi4^]’ ^Wl5^[ pi5^-169, «sL ^Wl6^[ pi6^-169, «6 L ^Wl7 ^[ pi7^-169, pi7^]’ ^Wl8^[ pi8^-169, «sL ^Wl9^[ ^9^-169, «Λ ^Wl10 ^[ A10^{-169 e W}l11^[ pi11^-

169, p_l11] respectivamente, onde uma distância entre p_lx e o ponto divisório potencial k_l é de d_x bytes. Especificamente, uma distância entre p_l1 e o ponto divisório potencial k_l é de 0 byte, uma distância entre p_l2 e k_l é de 2 bytes, uma distância entre p_l3 e k_l é de 4 bytes, uma distância entre p_l4 e k_l é de 6 bytes, uma distância entre p_l5 e k_l é de 8 bytes, uma distância entre p_l6 e k_lé de 10 bytes, uma distância entre p_l7 e k_l é de 12 bytes, uma distância entre p_l8 e k_l é de 14 bytes, uma distância entre p_l9 e k_l é de 16 bytes, uma

Petição 870160008725, de 11/03/2016, pág. 347/698

76/200 distância entre p_n0 e k_t é de 18 bytes, uma distância entre p_;11 e k_t é de 20 bytes, e com relação ao ponto divisório potencial k_t, todos os p_t2, p_t3, p_t4, Pt5, Pt6, Pt_Ί, Pt8, Pt9, Ptio, e p_ni estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em W_n [ p_;1 -169, p_;1 ] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W_l2 [ p_{l 2}-169, p_{l 2}] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_l3 [ p_t3-169, p_t3] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_l4[ p_l4-169, p_l4] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_l5[ p_{1 5}169, p_{t 5}] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_l6[ p_t6-169, p_t6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_lΊ [ p_tΊ-169, p_tΊ] atende a condição predefinida C₁₁, é determinado se pelo menos uma parte de dados em W_l8 [ p_l8 -169, p_l8 ] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_l9[ p_l9-169, p_l9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_l10[ p_l10-169, p_l10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_l11 [ p_l11 -169, p_l11 ] atende a condição predefinida C₁₁. Quando é determinado que a pelo menos uma parte de dados na janela W_l1 atende a condição predefinida C₁, a pelo menos uma parte de dados na janela W_l2 atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_{l 3} atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_l4 atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_{l 5} atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_l6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_lΊ atende a condição predefinida C_?, a pelo menos uma parte de dados na janela W_l8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_l9

Petição 870160008725, de 11/03/2016, pág. 348/698

77/200 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_l10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_l11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_l é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das janelas W_l1, W_l2, W_l3, W_l4, W_l5, W_l6, W_l7, W_l8, W_l9, W_l10, e W_l11 não atende a condição predefinida, um próximo ponto divisório potencial é selecionado. Para diferenciação dos pontos divisórios potenciais k_t, kj, e k_l, o próximo ponto divisório potencial é representado como k_m, onde k_m está localizado à direita de k_l, e uma distância entre k_m e k_l é de 1 byte. De acordo com a regra predefinida no servidor para desduplicação 103 na modalidade mostrada na Figura 13, 11 pontos são determinados para o ponto divisório potencial k_m, e são p_m1, p_m2, p_m3, p_m4, Pm5 ’ Pm6 ’ Pm7’ Pm8’ Pm9 ’ Pm10 ^{, e} Pm11 ^{e janelas} q^ue ^{correspondem aos pontos} Pm1, Pm2, Pm3 ’ Pm4’ Pm5’ Pm6’ Pm7 ^, Pm8’ Pm9 ^, Pm10 ^{, e} Pm11 ^{são W}m1^[ Pm1^-169’ Pm1^]’ ^Wm2 ^[ Pm2^-169’ Pm2 ^]’ ^Wm3^[ Pm3^-169’ Pm3^]’ ^Wm4 ^[ Pm4^-169’ Pm4^]’ ^Wm5^[ Pm5^-169’ Pm5^]’ ^Wm6^[ Pm6^-169’ Pm6 ^]’ ^Wm7^[ Pm7^-169’ Pm7 ^]’ ^Wm8^[ Pm8^-169’ Pm8^]’ ^Wm9 ^[ Pm9^-169’ Pm9 ^]’ ^Wm10 ^[ Pm10^-169’ Pm10 ^]’ ^{e W}m11 ^[ Pm11^-

169, P_m11] respectivamente, onde uma distância entre e o ponto divisório potencial k_m é de d_x bytes. Especificamente, uma distância entre p_m1 e o ponto divisório potencial k_m é de 0 byte, uma distância entre P_m2 e k_m é de 2 bytes, uma distância entre p_m3 e k_m é de 4 bytes, uma distância entre p_m4 e k_m é de 6 bytes, uma distância entre p_m5 e k_m é de 8 bytes, uma distância entre P_m6 e k_m é de 10 bytes, uma distância entre P_m7 e k_m é de 12 bytes, uma distância entre P_m8 e k_m é de 14 bytes, uma distância entre P_m9 e k_m é de 16 bytes, uma distância entre P_m10 e k_m é de 18 bytes, uma distância entre p_m11 e k_m é de 20 bytes, e com relação ao ponto divisório potencial k_m, todos ^os Pm2’ Pm3 ’ Pm4’ Pm5’ Pm6’ Pm7’ Pm8’ Pm9’ Pm10 ’ ^e Pm11 ^{estão em uma} direção oposta à direção de buscar um ponto divisório de corrente de dados. É determinado se pelo menos uma parte de dados em W«1[ Pm1-¹⁶⁹’ Pm1L ^atende

Petição 870160008725, de 11/03/2016, pág. 349/698

78/200 a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W_m2[p_m2-169, p_m2] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_m3[ p_m3-169, p_m3] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_m4[p_m4-169, p_m4] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_m5[ p_m5-169, p_m5] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_m6[ p_m6-169, p_m6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_m7[ p_m7-169, p_m7] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_m8 [ p_m8-169, p_m8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_m9[ p_m9-169, p_m9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_m10 [ p_m10 -169, p_m10 ] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_m11 [ p_m11-169, p_m11] atende a condição predefinida C_n. Quando é determinado que a pelo menos uma parte de dados na janela W_m1 atende a condição predefinida C_x, a pelo menos uma parte de dados na janela W_m2atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_m3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_m4 atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_m5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_{m 6} atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_m7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_m8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_m9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_m10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_m11 atende a condição predefinida C_n, o ponto divisório potencial corrente k_m é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em

Petição 870160008725, de 11/03/2016, pág. 350/698

79/200 qualquer janela não atende a condição predefinida, o pulo é executado de acordo com a solução descrita acima, de modo a obter um próximo ponto divisório potencial, e é determinado se o próximo ponto divisório potencial é ou não um ponto divisório.

[0120] Uma modalidade da presente invenção fornece um método para determinar se pelo menos uma parte de dados em uma janela ^Wiz [ Pz - A , p_iz + B_z ] atende uma condição predefinida C_z. Nessa modalidade, é determinado, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ p_iz-A_z, p_iz + B_z ] atende a condição predefinida C_z e a maneira de implantação mostrada na Figura 5 é usada como um exemplo. De acordo com uma regra predefinida em um servidor para desduplicação 103, um ponto p_n e uma janela W_t1[ p_n-169, p_i1} que corresponde ao ponto p_n são determinados para um ponto divisório potencial k_i, e é determinado se pelo menos uma parte de dados em W_iI[ ρ_ι4-169, ρ_Λ] atende uma condição predefinida C₁. Conforme mostrado na Figura 16, Wii representa a janela [ p_i4-169, ρ_Λ] e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_t1[ ρ_ι4-169, p_n ] atende a condição predefinida C₁. Na Figura 16, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os 5 bytes de dados selecionados são usados repetidamente 51 vezes para se obter 255 bytes no total, de modo a aumentar a aleatoriedade. Cada um desses bytes é formado por 8 bits, que são indicados por a_m1, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos 255 bytes, e, portanto, bits que correspondem aos 255 bytes podem ser representados como:

' ^a1,1	^a1,2 ·	· ^a1,8 '
^a2,1	^a2,2 ·	· ^a2,8
( ^aF*H, 1	^aF *H ,2 ·	· ^aF*H ,8 /

, onde quando a =1, V ’ ~ m,n ’ am,n =1, e quando a =, V =-1, onde a ’ ~ m,n ’ am,n ’ m ,n representa qualquer um dentre a_m1, ..., e a_m8, uma matriz V_a é obtida de acordo com uma relação de conversão entre a_mn e V_{am n} a partir dos bits que correspondem aos 255 bytes, e pode ser

Petição 870160008725, de 11/03/2016, pág. 351/698

80/200

	^v a1,1	a1,2	^F a1,8
	V ₂₁	V	V
representada como:	a 2,1	a2,2	a 2,8
	V V aF*H ,1	V ^v aF*H ,2	.. V ^v aF*H ,8 7

. Uma grande quantidade de números aleatórios é selecionada para formar uma matriz, e uma vez formada, a matriz formada pelos números aleatórios permanece inalterada. Por exemplo, 255*8 números aleatórios são selecionados a partir de números aleatórios que seguem uma distribuição específica (a distribuição normal é usada como um

exemplo	no	presente	documento) para formar uma matriz R:
' ^h1,1	^h1,2	h Ί 1,8
h₂₁	h
2,1	2,2	... 2,8 • »5	onde números aleatórios de uma emésima linha da
h h \^ríFH ,1 ^lFH ,2	h ^flF *H ,8 7

matriz V_a e de uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado ^{como S}am = ^VamA ^hm,1 ^{+ V} . ^S , ^Sa2, ^{e S}a255 ^são obtidos de acordo com o método, e uma quantidade K de valores que atendem uma condição específica (ser maior que 0 é usado como um exemplo no presente documento) entre S_a1, S_a2, ...e S_a255 é contada. Uma vez que a matriz R segue uma distribuição normal, S_am ainda segue uma distribuição normal assim como a matriz R. De acordo com a teoria da probabilidade, a probabilidade de que um número aleatório em distribuição normal seja maior que 0 é de 1/2; uma probabilidade de que cada valor entre S_a1, S_a2, ...,..., e

S_a255 seja maior que 0 é de 1/2, e portanto, K atende a distribuição binomial:

P(k = n) = C^)ⁿ (' ) ⁿ = CAt¹)²⁵⁵ ²⁵⁵ 2

De acordo com um resultado de contagem, é determinado se a quantidade K de valores maiores que 0 entre S_a1, S_a2, ...,..., e S_a255 é um número par; uma probabilidade de que um número aleatório em distribuição binomial seja um número par é de 1/2, e portanto, K atende uma condição com uma probabilidade de 1/2. Quando K é um número par, isso indica que a pelo menos uma parte de dados em ^Wfí[ Pn^-169, P,1}

Petição 870160008725, de 11/03/2016, pág. 352/698

81/200 atende a condição predefinida C₁. Quando K é um número ímpar, isso indica que a pelo menos uma parte de dados em w_n [ p_n -169, p_n ] não atende a condição predefinida C_x. C_} no presente documento significa que a quantidade

K, que é obtida de acordo com a maneira supracitada, de valores maior que 0 entre S_al, S_a2, e S_a255 é um número par. Na maneira de implantação mostrada na Figura 5, para w_a [ _Pn -169, _Pn ], w_t2 [ p_l2-169, p_i2], w_t3 [ _Pi3-169,

PiA PiA ^ÍAS’¹⁶⁹- A5L ^6 í Pi6 -¹⁶⁹> ΡίβΥ [/V^l69:

Ρ1Λ ^sÍAs-¹⁶⁹’ Ρ1Λ Nl/V¹⁶⁹, ΡΛ ^Wno [ Aio’¹⁶⁹, AioL θ ^iiÍAn-¹⁶⁹’ p_iU ], as janelas são de tamanho igual, isto é, todas as janelas têm um tamanho de 169 bytes, e as maneiras de se determinar se pelo menos uma parte de dados em uma janela atende uma condição predefinida são também as mesmas. Quanto a detalhes, fazer referência à descrição supracitada de determinar se a pelo menos uma parte de dados em w_n [ p_n -169, _Pn ] atende a condição predefinida C₃. Portanto, conforme mostrado na Figura 16, Ê&J representa 1 byte selecionado quando é determinado se pelo menos uma parte de dados na janela w_i2 [p_i2-169, p_í2] atende uma condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para se obter 255 bytes no total, de modo a aumentar a aleatoriedade. Cada um desses bytes é formado por8 bits, que são indicados como b_ml,e b_mg, representando do primeiro bit ao oitavo bit de um emésimo byte nos 255 bytes, e portanto, bits que correspondem

	^1,2
^2,1	^2,2

255,2 aos

255 bytes , onde quando podem ser representados como:

b_m,„ =1, „ =1, e quando b_mn =0, V_{bm n} =-

255,1

1, onde b_mn representa qualquer um dentre Z>_ml, ..., e b_mg, e uma matriz v_b é obtida de acordo com uma relação de conversão entre b_mn e v_bmn a partir dos bits que correspondem aos 255 bytes, e pode ser representada como:

Petição 870160008725, de 11/03/2016, pág. 353/698

82/200

' b1,1	b1,2	^rb1,8
Vb2,t	Vb2,2 .	. Vb2,8
_b ^Vb 255,1	^Vb 255,2 .	. ^Vb255,8 _y

. Uma maneira de determinar se pelo menos uma parte de dados em W_n [ p_n -169, p_t1 ] atende uma condição predefinida é igual a uma maneira de determinar se pelo menos uma parte de dados na janela W. ₂ [ p.₂-169, p.₂] atende uma condição predefinida; portanto a matriz R é usada: ' h_u ^h2,1 ^h1,2 ^h2,2 h

V '255,1 h

^,l255,2 h

255,8 y , e números aleatórios de uma emésima linha da matriz da emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como

Ç = V * h + V * h + + V * h bm ^v bm,1 m,1 ^F bm,2 m,2 ^v bm,8 m,8 '

Sb1, Sb₂, ..., e Sb255 são obtidos de acordo com o método, e uma quantidade K de valores que atendem uma condição específica (ser maior que 0 é usado como um exemplo no presente documento) entre S_b1, S_b2, ..., e S_b255 é contada. Uma vez que a matriz R segue uma distribuição normal, S_bm ainda segue uma distribuição normal assim como a matriz R. De acordo com a teoria da probabilidade, a probabilidade de que um número aleatório em distribuição normal seja maior que 0 é de 1/2; uma probabilidade de que cada valor entre S_b1, S_b2, ..., e S_b255 seja maior que 0 é de

1/2, portanto, K atende

P(k = n) = C₂55(i)ⁿ (j = c Λ ²⁵⁵ 2 2 ²⁵⁵ 2 . D_e acordo distribuição binomial: com um resultado de contagem, é determinado se a quantidade K de valores maiores que 0 entre

S_b1, S_b2, ..., e S_b255 é um número par; a probabilidade de que um número aleatório em distribuição binomial seja um número par é de 1/2, e, portanto, K atende uma condição com uma probabilidade de 1/2. Quando K é um número par, isso indica que a pelo menos uma parte de dados em W2^[ p,2^-169, p,2^]atende a condição predefinida C₂. Quando K é um número ímpar, isso indica que a pelo menos uma parte de dados em w.₂[ p.₂-169, p.₂] não atende a

Petição 870160008725, de 11/03/2016, pág. 354/698

83/200 condição predefinida C₂. C₂ no presente documento significa que a quantidade K, que é obtida de acordo com a maneira supracitada, de valores maiores que 0 entre s_bl, S_b2, e s_b255 é um número par. Na maneira de implantação mostrada na Figura 3, a pelo menos uma parte de dados em [ p_i2-169, A₂] atende a condição predefinida C₂.

[0121] Portanto, conforme mostrado na Figura 16, S representa 1 byte selecionado quando é determinado se pelo menos uma parte de dados na janela w_i3 [ p₃-169, p_i3 \ atende uma condição predefinida C₃, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Então, o método para determinar se pelo menos uma parte de dados nas janelas [ p_n -169, p_n ] e W_i2 [ p_i2 -169, p₂] atende uma condição predefinida é usado para determinar se pelo menos os dados em W/₃[p₃-169, p_i3\ atendem uma condição predefinida C₃. Na maneira de implantação mostrada na Figura 5, a pelo menos uma parte de dados em W/₃[p₃-169, p_i3\ atende a condição predefinida. Conforme mostrado na Figura 16, representa 1 byte selecionado quando é determinado se pelo menos uma parte de dados na janela Fa lP.4'¹⁶⁹, p,4] atende uma condição predefinida C4, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Então, o método para determinar se pelo menos uma parte de dados nas janelas ^Ί[Α1-169, P1I], pti2[A2-169, a.2], e ^3[A3-169, A.3j atende uma condição predefinida é usado para determinar se a pelo menos uma parte de dados em wi4 [ pi4-169, pi4] atende a condição predefinida C4. Na maneira de implantação mostrada na Figura 5, a pelo menos uma parte de dados em wi4 [ pi4-169, pi4] atende a condição predefinida C4. Conforme mostrado na Figura 16, E representa 1 byte selecionado quando é determinado se pelo menos uma parte de dados na janela ^[α5-¹⁶⁹> a5]

Petição 870160008725, de 11/03/2016, pág. 355/698

84/200 atende uma condição predefinida C₅, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Então, o método para determinar se pelo menos uma parte de dados nas janelas w_n[ p_n-169, p_n], W_i2[ p^-169, p_i2], w_a[ p_t3-169, p_t3], e

W₄ [ p.₄-169, p.₄] atende uma condição predefinida é usado para determinar se pelo menos uma parte de dados em W₁₅[ p,.₅-169, p.₅] atende a condição predefinida C₅ Na maneira de implantação mostrada na Figura 5, a pelo menos uma parte de dados em W₁₅[ p.₅-169, p₅] não atende a condição predefinida

C5.

[0122] Quando a pelo menos uma parte de dados em ^W.5^[ p,5^-169, p.₅] não atende a condição predefinida C₅, 11 bytes são pulados a partir de um ponto p. ₅ ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um próximo ponto divisório potencial é obtido em uma posição de extremidade de um décimo primeiro byte. Conforme mostrado na Figura 6, de acordo com a regra predefinida no servidor para desduplicação 103, um ponto p_}1 e uma janela W_y1[ p_j4-169, p_j4] que corresponde ao ponto p_}1 são determinados para o ponto divisório potencial k_}. Uma maneira de determinar se pelo menos uma parte de dados na janela W_y1[ p_;1-169, p_y1] atende a condição predefinida C_x é a mesma maneira de determinar se pelo menos uma parte de dados na janela w_n [ p_n -169, p_n ] atende a condição predefinida C_x. Portanto, conforme mostrado na Figura ^{17, W} representa a janela W_n[ p.1169, p_i4 ] e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_y1[ p_y1-169, p_y1] atende a condição predefinida C_x. Na Figura 17, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os 5 bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Cada um desses bytes é formado por 8 bits, que são indicados como a_m1',, ..., e a_m8', representando do primeiro bit ao oitavo bit de um

Petição 870160008725, de 11/03/2016, pág. 356/698

85/200 emésimo byte nos 255 bytes, e portanto, bits que correspondem aos 255 bytes

C a ¹ ^u1,1 a ¹ ^u 2,1 podem ser representados como:

=1 ^Vam,n '=^{1, e} q^uando ^dentre V^, ...^{, e} a_m8 ^, ^a1,2 ^a2,2 ^a1,8 ^a2,8' , onde quando a_mn' a '

V⁴ 255,1 amn ' =^{0, V} n ' =^{-1, onde} e uma matriz V_a' é obtida de acordo com uma relação de conversão entre a m,n a ' ^u255,2 a

m,n a ' ^u255,8 J j representa qualquer um ' e V_amn' a partir dos bits que correspondem aos 255 bytes, e pode ser representada como:

C v ' ^v a1,1

V ’ ^v a2,1

V ’ a1,2

V ’ a2,2

V ’ ^v a1,8

V ’ ^v a2,8

V ’

V a255,1

V ' a255,2 maneira de determinar se pelo menos uma parte de dados na janela j Pji169, p_j4] atende uma condição predefinida é igual a uma maneira de determinar

C h

1,1 ^h2,1 se pelo menos uma parte de dados na janela W_n[ p_n-169, p_n ] atende uma h i

1,8 h

'*2,8 ^1,2 ^h2,2 h

V ^z255,1 h

^rl255,2

... h

255,8 J condição predefinida. Portanto, a matriz R é usada: v ’²⁵⁵,‘ ”²⁵⁵,² ”²⁵⁵,^{8 J}, e números aleatórios de uma emésima linha da matriz V_a' e da emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S^ ’= V^’* h_m4 + V_am2* h_m2+...+ V_am; *h_m8. S_a1', S_a2', ..., e S_a255' são obtidos de acordo com o método, e uma quantidade K de valores que atendem uma condição específica (ser maior que 0 é usado como um exemplo no presente documento) entre S_a1', S_a2', ..., e S_{a 255}' é contada. Uma vez que a matriz R segue uma distribuição normal, S_am' ainda segue uma distribuição normal assim como a matriz R. De acordo com a teoria da probabilidade, a probabilidade de que um número aleatório em distribuição normal seja maior que 0 é de 1/2; a probabilidade de que cada valor entre S_a1', S_a2', ..., e S_a255' seja maior que 0 é de 1/2, e portanto, K atende a distribuição binomial:

P(k = n) = (!)”-“ = (2

De acordo com

Petição 870160008725, de 11/03/2016, pág. 357/698

86/200 um resultado de contagem, é determinado se a quantidade K de valores maiores que 0 entre S_al', S_a2,e S_a255’ é um número par; a probabilidade de que um número aleatório em distribuição binomial seja um número par é de 1/2, e, portanto, K atende uma condição com uma probabilidade de 1/2. Quando K é um número par, isso indica que a pelo menos uma parte de dados em WjAPj^-169, p_jX\ atende a condição predefinida Q. Quando K é um número ímpar, isso indica que a pelo menos uma parte de dados em 169, p_jX\ não atende a condição predefinida C_x.

[0123] Uma maneira de determinar se pelo menos uma parte de dados em W₁₂ [ />_;2-169, p_i2\ atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em ^₂[/r₂-169, p_]2 \ atende a condição predefinida C₂. Portanto, conforme mostrado na Figura 17, representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela W_j2[p_j2-169, p.₂] atende a condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Cada um desses bytes é formado por 8 bits, que são indicados como b_ml', , θ b_m8 , representando do primeiro bit ao oitavo bit de um emésimo byte nos 255 bytes, e portanto, bits que correspondem aos 255 bytes podem ser representados b ' ^1,2 b ' ^2,2 como:

( b ' ^1,1 h ' ^2,1 b ' ^255,2 , onde quando Z>_m„'=1, V_bmn'=1, e quando b ' m,n h ’ \/255,l =o, V_bJ=A, onde b, • ¹ m,n b ' ^255,8 y representa qualquer um dentre b_ml', , θ b_{m 8} , e uma matriz V_b' é obtida de acordo com uma relação de conversão entre b_t ' ’ Θ m,n bits que correspondem aos 255 bytes, e pode ser

V_bJ a partir dos

		Y«,2 ·	'
representada como:	V ^y />2,1	F>2,2 ·
	V £255,1	V ^v b255,2	v ^y />255,8 J

. Maneiras de se pelo menos

Petição 870160008725, de 11/03/2016, pág. 358/698

87/200 uma parte de dados nas janelas r₂[p₂-169, p₂\ e ^₂[g₂-169, g₂] atende a condição predefinida são as mesmas, e, portanto, a matriz R é ainda usada: ^1,2 ^1,8

255,2

255,1

^{255 8} Λ Números aleatórios de uma emésima linha da matriz e da emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especifícamente representado como S_bm' = V_bm^h_mX+V_bm2'*h_m2+...+ V_bJ*h_mi. S_bx', S_b2,...,e S_b255' são obtidos de acordo com o método, e uma quantidade K de valores atende uma condição específica (ser maior que 0 é usado como um exemplo no presente documento) entre S_bx , S_b2 , e S_b255' é contada. Uma vez que a matriz R segue uma distribuição normal, S_bm' ainda segue uma distribuição normal assim como a matriz R. De acordo com a teoria da probabilidade, a probabilidade de que um número aleatório em distribuição normal seja maior que 0 é de 1/2; uma probabilidade de que cada valor entre S_bx , S_b2 , e S_b255' seja maior que 0 é de 1/2, e, portanto, K atende a distribuição binomial: P(k = ri) = C₂₅₅ (-)” (-)²⁵⁵~” = C₂₅₅ (-)²⁵⁵ ^{22 2} . De acordo com um resultado de contagem, é determinado se a quantidade K de valores maiores que 0 entre S_bl', S_b2 , e S_b255' é um número par; a probabilidade de que um número aleatório em distribuição binomial seja um número par é de 1/2, e, portanto, K atende uma condição com uma probabilidade de 1/2. Quando K é um número par, isso indica que a pelo menos uma parte de dados em ^₂[A2-¹⁶⁹’ PjP atende a condição predefinida C2. Quando K é um número ímpar, isso indica que a pelo menos uma parte de dados em Wj2[pj2-169, p.2] não atende a condição predefinida C2. Similarmente, uma maneira de determinar se pelo menos uma parte de dados em -I6⁹, pl3] atende a condição predefinida

C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em -I6⁹, PjP atende a condição predefinida C₃. Similarmente, é

Petição 870160008725, de 11/03/2016, pág. 359/698

88/200 determinado se pelo menos uma parte de dados em Wj ₄[ pj 4-169, pj ₄] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_j5[p_j5-169, p_j5] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[p_j6-169, p_j6] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_J7[ pj 7169, p_j7] atende uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[p_j8-169, p_j8] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em ^Wj9[ pj 9-169, p_]9] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[p_j10-169, p_j10] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_jn[ p_j11-169, p_jn] atende uma condição predefinida C_n, que não são descritas novamente no presente documento.

[0124] Ainda usando a maneira de implantação mostrada na Figura 5 como um exemplo, um método para determinar se pelo menos uma parte de dados em uma janela W_iz [ p_iz- A_z, p_iz + B_z ] atende uma condição predefinida C_z é fornecido. Nessa modalidade, é determinado, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela ^Wz^[ p_lz - A, p_iz + B_z ] atende a condição predefinida C_z. De acordo com uma regra predefinida em um servidor para desduplicação 103, um ponto p_n e uma janela W_n[ p_n-169, p_n] que corresponde a p_n são determinados para um ponto divisório potencial k_t, e é determinado se pelo menos uma parte de dados em W_n[ p_n-169, p_n] atende uma condição predefinida C₄. Conforme mostrado na Figura 16, W_n representa a janela W_n[ p_n-169, p_n] e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [ p_n-169, p_n] atende a condição predefinida C₄. Na Figura 16, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados . Em uma maneira de implantação, uma função hash é usada para calcular os 5 bytes selecionados, e valores obtidos por meio de cálculo usando a função

Petição 870160008725, de 11/03/2016, pág. 360/698

89/200 hash estão em distribuição fixa e uniforme. Se um valor obtido por meio de cálculo usando a função hash é um número par, é determinado que a pelo menos uma parte de dados em W_n [ p_t1 -169, p_t1 ] atende a condição predefinida C_r, isto é, C₁ representa que um valor obtido por meio de cálculo usando a função hash e de acordo com a maneira supracitada é um número par. Portanto, uma probabilidade de se pelo menos uma parte de dados em W_n [ p_t1-169, p_t1] atende uma condição predefinida é de 1/2. Na maneira de implantação mostrada na Figura 5, é determinado, usando-se uma função hash, se pelo menos uma parte de dados em W_t2[ p_t2-169, p_t2] atende uma condição predefinida C₂, se pelo menos uma parte de dados em W_i3[ p,3-169, p_i3] atende uma condição predefinida C₃, se pelo menos uma parte de dados em W_i4[ p_i4-169, p_i4] atende uma condição predefinida C₄, e se pelo menos uma parte de dados em W_t5[ p_i5-169, p_i5] atende uma condição predefinida C₅. Para implantação específica, referência pode ser feita à descrição da maneira de determinar, usando-se uma função hash, se pelo menos uma parte de dados em W_n[ p_i1-169, p_i1] atende a condição predefinida C₃ na maneira de implantação mostrada na Figura 5, que não é descrita novamente no presente documento.

[0125] Quando a pelo menos uma parte de dados em W_iS[ p-5-169, p_i5] não atende a condição predefinida C₅, 11 bytes são pulados a partir de um ponto p_i5 ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente kj é obtido em uma posição de extremidade de um décimo primeiro byte. Conforme mostrado na Figura 6, de acordo com a regra predefinida no servidor para desduplicação 103, um ponto p_fl e uma janela W_y1[ p_y1-169, p_}1] que corresponde ao ponto p_fl são determinados para o ponto divisório potencial kj. Uma maneira de determinar se pelo menos uma parte de dados na janela W_y1[ p_y1-169, p_}1] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_y1[ p_j4-169, p_j4] atende a condição predefinida C₃.

Petição 870160008725, de 11/03/2016, pág. 361/698

90/200

Portanto, conforme mostrado na Figura 17, representa a janela WplPp169, ρ_]λ] e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em JF_yl[p_jX-169, p_jX] atende a condição predefinida C_P Na Figura 17, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados Os 5 bytes selecionados a partir da janela Wp [p_jX-\69, ρ_]λ] são calculados usando-se uma função hash. Se um valor obtido é um número par, a pelo menos uma parte de dados em {p_n -¹⁶⁹, Ρ]λ] atende a condição predefinida C3. Na Figura 17, uma maneira de determinar se pelo menos uma parte de dados em Wn [ pn-\69, pn] atende a condição predefinida C2 é a mesma maneira de determinar se pelo menos uma parte de dados em JFyl[pjX-169, pjX] atende a condição predefinida C2. Portanto, conforme mostrado na Figura 17, representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela ^2[Λ2-¹⁶⁹’ Pj^ atende a condição predefinida C2, e há 42 bytes entre dois bytes adjacentes selecionados fcssl. Cinco (5) bytes selecionados são calculados usando-se uma função hash. Se um valor obtido é um número par, a pelo menos uma parte de dados em JF₇₂[/r₂-169, p_J2] atende a condição predefinida C₂. Na Figura 17, uma maneira de determinar se pelo menos uma parte de dados em W₁₃[ /2_í3-169, p₁₃] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em ^₃[^3·¹⁶⁹’ Λτΐ ^{atende a}condição predefinida C₃. Portanto, conforme mostrado na Figura 17, representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela W_j3[p_]3 -169, p_]3] atende a condição predefinida C₃, e há 42 bytes entre dois bytes adjacentes selecionados E3. Cinco (5) bytes selecionados são calculados usando-se uma função hash. Se um valor obtido é um número par, a pelo menos uma parte de dados em 1ξ₃[/Λ₃-169, p_]3] atende a condição predefinida C₃. Na Figura 17, uma maneira de determinar se pelo menos uma parte de dados em W_l4 [ /?,₄-169, p_i4] atende a condição predefinida C₄ e uma maneira de determinar se pelo menos uma parte de

Petição 870160008725, de 11/03/2016, pág. 362/698

91/200 dados na janela W_i4 [ #₄-169, p_i4\ atende a condição predefinida C₄. Portanto, conforme mostrado na Figura 17, representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela ^4[Λ4-¹⁶⁹’ Pja} atende a condição predefinida C₄, e há 42 bytes entre dois bytes adjacentes selecionados Cinco (5) bytes selecionados são calculados usando-se uma função hash. Se um valor obtido é um número par, a pelo menos uma parte de dados em W_j4[p_j4-169, p_j4] atende a condição predefinida C₄. De acordo com o supracitado método, é determinado se pelo menos uma parte de dados em W_j5[p_j5-169, p.₅] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[p_J6-169, p_J6] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_J7[P_]7l⁶⁹, Pp] atende uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_jS[p_]S-169, p_JS] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em fF₇₉[jr₉-169, p_]9] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_J10 [/x₁₀-169, jr₁₀] atende uma condição predefinida Cj₀, e é determinado se pelo menos uma parte de dados em W_fll[p_JU-1.69, p_jYÍ\ atende uma condição predefinida C_n, que não são descritas novamente no presente documento.

[0126] Usando a maneira de implantação mostrada na Figura 5 como um exemplo, um método para determinar se pelo menos uma parte de dados em uma janela W_lz\p_lz-A_z, p_lz+B_z] atende uma condição predefinida C_z é fornecido. Nessa modalidade, é determinado, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz\p_lz-A_z, p_lz+B_z] atende a condição predefinida c_z. De acordo com uma regra predefinida em um servidor para desduplicação 103, um ponto p_iX e uma janela ^JAi-169, p_iX ] que corresponde a p_n são determinados para um ponto divisório potencial ξ., e é determinado se pelo menos uma parte de dados em ^[Λι-169, _Pn] atende uma condição predefinida Cj. Conforme mostrado na Figura 16, W_n

Petição 870160008725, de 11/03/2016, pág. 363/698

92/200 representa a janela W_n[ p_n-169, p_n], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [ p_n -169, p_n ] atende a condição predefinida C₁. Na Figura 16, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são convertidos em valores decimais que são representados como a ₁, a₂, a₃, a₄, e a₅ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer a_r de a ₁, a₂, a₃, a₄, e a₅ atende 0< a_r <255. a ₁ ^a4^, e a₅ formam uma matriz 1*5. 256*5 números aleatórios são selecionados a partir de números aleatórios que seguem uma distribuição ( h ''0,1 ^h1,1 matriz R que é representada como:

^h0,2

k.,2 binomial para formar uma h F '^l0,5 ^h1,5 [0127] ^h255,5 ^h255,5 ^h255,5 y

A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a ₁ e uma coluna em que a ₁ está localizado. Por exemplo, se a ₁ =36, e a ₁ está localizado em uma primeira coluna, um valor que corresponde a h₃₆,₁ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₂ e uma coluna em que a₂ está localizado. Por exemplo, se a₂ =48, e a₂ está localizado em uma segunda coluna, um valor que corresponde a h₄₈,₂ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₃ e uma coluna em que a₃ está localizado. Por exemplo, se a₃ =26, e a₃ está localizado em uma terceira coluna, um valor que corresponde a h₂₆,₃ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₄ e uma coluna em que a₄está localizado. Por exemplo, se a₄ =26, e a₄ está localizado em uma quarta coluna, um valor que corresponde a h₂₆,₄ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₅ e uma

Petição 870160008725, de 11/03/2016, pág. 364/698

93/200 coluna em que a₅ está localizado. Por exemplo, se a₅=88, e a₅ está localizado em uma quinta coluna, um valor que corresponde a h_{ss 5} é buscado. V ⁼ ^6,i+^48,2 + ^26,3+^6,4+^88.5, ^{e uma ν}θ^ζ Πυθ ^a matriz R segue uma distribuição binomial, também segue uma distribuição binomial. Quando é um número par, a pelo menos uma parte de dados em ^[^-169, p_n] atende a condição predefinida Cpquandos; é um número ímpar, a pelo menos uma parte de dados em W_n [ p_n-169, p_n] não atende a condição predefinida Cj. Uma probabilidade de que seja um número par é de 1/2, e C_x representa que que é obtido por meio de cálculo de acordo com a maneira supracitada é um número par. Na modalidade mostrada na Figura 5, a pelo menos uma parte de dados em W_n [ p_n -169, p_n ] atende a condição predefinida Cj. Conforme mostrado na Figura 16, representa 1 byte separadamente selecionado quando é determinado se pelo menos uma parte de dados em uma janela W_i2 [ j>_!2-169, p_n] atende uma condição predefinida C₂. Na Figura 16, bytes são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes & cujos números na sequência são 170, 128, 86, 44 e 2 são convertidos em valores decimais que são representados como b_x, b₂, b₃, z>₄, e b₅ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer b_r de b_x, b₂, b₃, b₃, e b₅ atende 0<Z>/<255. &₁₅ b₂, b₃, b₃, e b₅ formam uma matriz 1*5. Nessa maneira de implantação, maneiras de determinar se pelo menos uma parte de dados em W_n e JV_i2atende uma condição predefinida são as mesmas, e, portanto, a matriz R é ainda usada. A matriz R é submetida a uma busca por um valor correspondente de acordo com 0 valor de b, e uma coluna em que está localizado. Por exemplo, se b, =66, e está localizado em uma primeira coluna, um valor que corresponde a h₆₆₁ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com 0 valor de b₂ e uma coluna em que b₂está localizado. Por exemplo, se b₂ =48, e b₂ está localizado em uma segunda

Petição 870160008725, de 11/03/2016, pág. 365/698

94/200 coluna, um valor que corresponde a é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₃ e uma coluna em que b₃ está localizado. Por exemplo, se b₃ =99, e b₃ está localizado em uma terceira coluna, um valor que corresponde a h₉₉,₃ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₄ e uma coluna em que b₄ está localizado. Por exemplo, se b₄ =26, e b₄ está localizado em uma quarta coluna, um valor que corresponde a h₂₆,₄ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₅ e uma coluna em que b₅ está localizado. Por exemplo, se b₅ =90, e b₅ está localizado em uma quinta coluna, um valor que corresponde a h₉₀,₅ é buscado. s₂ = h₆₆₁+ h₄₈,₂ + h₉₉,₃+ h₂₆,₄ + h₉₀,₅, e uma vez que a matriz R segue uma distribuição binomial, s ₂ também segue uma distribuição binomial. Quando s ₂ é um número par, a pelo menos uma parte de dados em W₂[ p.₂-169, p.₂] atende a condição predefinida C₂; quando s₂ é um número ímpar, a pelo menos uma parte de dados em W.₂ [ p.₂-169, p.₂] não atende a condição predefinida C₂. Uma probabilidade de que s ₂ seja um número par é de 1/2. Na modalidade mostrada na Figura 5, a pelo menos uma parte de dados em W.₂[ p_i2-169, p_i2] atende a condição predefinida C₂. Usando a mesma regra, separadamente, é determinado se pelo menos uma parte de dados em W_i3[ p_i3-169, p_i3] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W.₄[ p.₄-169, p.₄] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_i5[ p_i5-169, p_i5] atende uma condição predefinida C₅,é determinado se pelo menos uma parte de dados em W.₆ [ p_i6-169, p_i6] atende uma condição predefinida C₆, é determinado se pelo menos uma partede dados em W.₇[ p.₇-169, p.₇] atende uma condição predefinida C₇,é determinado se pelo menos uma parte de dados em W_i8[ p_ig-169, p_ig] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em W.₉[ p.₉-169, p.₉] atende uma condição predefinida C₉, é

Petição 870160008725, de 11/03/2016, pág. 366/698

95/200 determinado se pelo menos uma parte de dados em W_i10 [ p_i10-169, p_i10] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em Wi₁₁[ p_m-169, p_m] atende uma condição predefinida C₁₁. Na maneira de implantação mostrada na Figura 5, a pelo menos uma parte de dados em W_i5[ p_i5-169, p_i5] não atende a condição predefinida C₅, 11 bytes são pulados a partir de um ponto p_i5 ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente k_jé obtido em uma posição de extremidade de um décimo primeiro byte. Conforme mostrado na Figura 6, de acordo com a regra predefinida no servidor para desduplicação 103, um ponto p_j4 e uma janela ^WJ1[ pji-169, p_fl] que corresponde ao ponto p_j4 são determinados para o ponto divisório potencial k_j. Uma maneira de determinar se pelo menos uma parte de dados na janela W_j1[p^-169, p_j4] atende a condição predefinida C₁ é a mesma maneira de determinar se pelo menos uma parte de dados na janela W[ p_n-169, p_n] atende a condição predefinida C_x. Portanto, conforme mostrado na Figura 17, representa a janela W_fl[p^-169, p_]X], e é determinado se a pelo menos uma parte de dados em W_fl[p^-169, p_jX), atende a condição predefinida C_x. Na Figura 17, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são convertidos em valores decimais que são representados como aj, aj, aj , aj, e a₅' respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer a_r' de aj, aj, a₃ , aj, e a₅' atende 0<a_s <255. aj, aj, aj, aj, e a5 formam uma matriz 1*5. A maneira de determinar se pelo menos uma parte de dados na janela Wj1[ pp169, p_j4] atende a condição predefinida C_x é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_n[ p_n-169, p_n] atende a condição predefinida C_x, e portanto, a matriz R é ainda usada, e é

Petição 870160008725, de 11/03/2016, pág. 367/698

96/200 representada como:

( h

0,1 ^h1,1 ^h0,2 ’ ” ^h0,5 ^h1,2 ^h1,5

[0128] A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de al e uma coluna em que al está localizado. Por exemplo, se a₁' =16, e a₁' está localizado em uma primeira coluna, um valor que corresponde a h₁₆,₁ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₂' e uma coluna em que a₂' está localizado. Por exemplo, se a₂' =98, e a₂' está localizado em uma segunda coluna, um valor que corresponde a h₉₈,₂ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₃' e uma coluna em que a₃' está localizado. Por exemplo, se a ₃' =56, e a₃' está localizado em uma terceira coluna, um valor que corresponde a h₅₆,₃ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₄' e uma coluna em que a₄' está localizado. Por exemplo, se a₄' =36, e a₄' está localizado em uma quarta coluna, um valor que corresponde a h₃₆,₄ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a ₅' e uma coluna em que a₅' está localizado. Por exemplo, se a ₅' =99, e a₅' está localizado em uma quinta coluna, um valor que corresponde a h₉₉,₅ é buscado. s₁' = h₁₆,₁+ h₉₈,₂+ h₅₆,₃+ h₃₆,₄+ h₉₉,₅, e uma vez que a matriz R segue uma distribuição binomial, s₁' também segue uma distribuição binomial. Quando s₁' é um número par, a pelo menos uma parte de dados em ^W _fl[ Pj1-169, Pj1] atende a condição predefinida C₁; quandos₁' é um número ímpar, a pelo menos uma parte de dados em W_fl[ p_]1-169, p_j4] não atende a condição predefinida C₁. Uma probabilidade de que s₁' seja um número par é de 1/2.

[0129] Uma maneira de determinar se pelo menos uma parte de dados em W_t2[ p_t2-169, p_t2] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em Wj ₂[ p, 2-169,

Petição 870160008725, de 11/03/2016, pág. 368/698

97/200 p_j2\ atende a condição predefinida C₂. Portanto, conforme mostrado na Figura

17, representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela W_j2[p_j2-\69, p_j2\ atende a condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados.

Os bytes cujos números na sequência são 170, 128, 86, 44 e 2 são convertidos em valores decimais que são representados como b_x', b₂', b₃', b₄', e b₃' respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer b_r' de b_x', b₂', b₃', b₄', e b₅' atende Q<b_r' <255. b_x', b₂', b₃', b₄', e b₅' formam uma matriz 1*5. A matriz R a mesma que aquela usada quando é determinado se a pelo menos uma parte de dados na janela W_i2 [ #₂-169, p_i2] atende a condição predefinida C₂ é usada. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de 6/ e uma coluna em que b^ está localizado. Por exemplo, se 6/=210, e b^ está localizado em uma primeira coluna, um valor que corresponde a /z₂₁₀₁ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₂' e uma coluna em que b₂’ está localizado. Por exemplo, se 6/=156, e b₂’ está localizado em uma segunda coluna, um valor que corresponde a A₁₅₆₂ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₃' e uma coluna em que b₃' está localizado. Por exemplo, se 6/=144, e b₃' está localizado em uma terceira coluna, um valor que corresponde a /?_l443 é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₄’ e uma coluna em que b₄’ está localizado. Por exemplo, se &₄’=60, e b₄’ está localizado em uma quarta coluna, um valor que corresponde a A₆₀₄ é buscado.

A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₅' e uma coluna em que b₅' está localizado. Por exemplo, se b₅' =90, e b₅' está localizado em uma quinta coluna, um valor que corresponde

Petição 870160008725, de 11/03/2016, pág. 369/698

98/200 a h₉₀,₅ é buscado. s₂' = h_210>1+ h₁₅₆,₂ + h₁₄₄,₃+ h₆₀,₄ + h₉₀,₅. A mesma condição determinante de s ₂, quando s ₂' é um número par, a pelo menos uma parte de dados em W_j2[p,₂-169, p,₂] atende a condição predefinida C₂, e quando s₂' é um número ímpar, a pelo menos uma parte de dados em W 2[ Pj 2-169, Pj 2] não atende a condição predefinida C₂. Uma probabilidade de que s₂' seja um número par é de 1/2.

[0130] Similarmente, uma maneira de determinar se pelo menos uma parte de dados em W_l3[p_i3-169, p_l3] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em W,3[ Pj3 -169, p_j3] atende a condição predefinida C₃. Similarmente, é determinado se pelo menos uma parte de dados em W_j4[p_j4-169, p_j4] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em Wj5[ Pj5169, p_j5 ] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[p_j6-169, p_j6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em Wj ₇[ Pj ₇-169, Pj ₇] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[ p_j8-169, p_j8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W,₉[ p,₉-169, p_j9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[p_j10-169, p_j10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_jn[p^-169, p_j41] atende a condição predefinida C_n, que não são descritas novamente no presente documento.

[0131] Usando a maneira de implantação mostrada na Figura 5 como um exemplo, um método para determinar se pelo menos uma parte de dados em uma janela W_iz [ p_iz- A_z, p_iz + B_z ] atende uma condição predefinida C_z é fornecido. Nessa modalidade, é determinado, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ p_iz - A_z, p_iz + B_z ] atende a condição predefinida C _z. De acordo com uma regra predefinida em um servidor para desduplicação 103, um ponto p_i4 e uma janela W_n[ P1-169,

Petição 870160008725, de 11/03/2016, pág. 370/698

99/200 p_n] que corresponde a p_n são determinados para um ponto divisório potencial k_t, e é determinado se pelo menos uma parte de dados em W_n[ p_n-169, p_n] atende uma condição predefinida C₁. Conforme mostrado na Figura 16, W_nrepresenta a janela W1[ Pii-169, pj, e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [ p_t1-169, p_n] atende a condição predefinida C₁. Na Figura 16, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são convertidos em valores decimais que são representados como a₁, a₂, a₃, a₄, e a₅ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer a_s de a₁, a₂, a₃, a₄, e a₅ ^as atende 0<a_s ^255. a₁, a₂, a₃, a₄, e a₅ formam uma matriz 1*5. 256*5 números aleatórios são selecionados a partir de números aleatórios que seguem uma distribuição binomial para formar uma matriz R que é representada como:

\1 ^h0,2 ^h1,2 ^0,5 ^h1,5

256*5 números ^h255,5 h

255,5 h

^,l255,5 7 aleatórios são selecionados a partir de números aleatórios que seguem uma distribuição binomial para formar uma matriz G que é representada como:

^g0,1 ^g0,2 ’’’ ^g0,5 ^g1,1 ^g1,2 ’’ ’ ^g1,5 (^g255,5 ^g255,5 ^g255,5 / [0132] De acordo com o valor de a₁ e uma coluna em que a₁ está localizado, por exemplo, a₁ =36, e a₁ está localizado em uma primeira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₃₆₁, e é efetuada uma busca na matriz G por um valor que corresponde a g₃₆₁. De acordo com o valor de a₂ e uma coluna em que a₂ está localizado, por exemplo, a₂ =48, e a₂ está localizado em uma segunda coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{48 2}, e é efetuada uma

Petição 870160008725, de 11/03/2016, pág. 371/698

100/200 busca na matriz G por um valor que corresponde a g₄₈,₂. De acordo com o valor de a₃ e uma coluna em que a₃ está localizado, por exemplo, a₃ =26, e a₃está localizado em uma terceira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₂₆,₃, e é efetuada uma busca na matriz G por um valor que corresponde a g₂₆,₃. De acordo com o valor de a₄ e uma coluna em que a₄ está localizado, por exemplo, a₄ =26, e a₄ está localizado em uma quarta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₂₆,₄, e é efetuada uma busca na matriz G por um valor que corresponde a g₂₆,₄. De acordo com o valor de a₅ e uma coluna em que a₅está localizado, por exemplo, a₅ =88, e a₅ está localizado em uma quinta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{88 5}, e é efetuada uma busca na matriz G por um valor que corresponde a g₈₈,₅. S_1h = h₃₆₁+ h₄₈₂ + h_{26 3}+ h₂₆₄+ h₈₈₅, e uma vez que a matriz R segue uma distribuição binomial, S_1h também segue uma distribuição binomial. S_1g=g_{36 1} + g₄₈,₂+g₂₆,₃+ g₂₆, ₄+gs8,₅, e uma vez que a matriz G segue uma distribuição binomial, S_1g também segue uma distribuição binomial. Quando um de S_1h e S_1g é um número par, a pelo menos uma parte de dados em W_n[ p_n-\69, p_n} atende a condição predefinida C₁; quando tanto S_1h quanto S_1g são números ímpares, a pelo menos uma parte de dados em W_n [ p_i1-169, p_n] não atende a condição predefinida C₁, e C₁ indica que um de S_1h e S_1g obtidos de acordo com o supracitado método é um número par. Uma vez que tanto S_1h quanto ^S1g seguem uma distribuição binomial, uma probabilidade de que S_1h seja um número par é de 1/2, uma probabilidade de que S_1g seja um número par é de 1/2, e uma probabilidade de que um de S_1h e S_1g seja um número par é de 1

1/4=3/4. Portanto, uma probabilidade de que a pelo menos uma parte de dados em W_ü[ p_i1-169, p_i1] atenda a condição predefinida C₁ é de 3/4. Na modalidade mostrada na Figura 5, a pelo menos uma parte de dados em W_n[p_i1-169, p_n] atende a condição predefinida C₁. Na maneira de implantação mostrada na Figura 5, para W_n[ p_n-\69, p_n] W₂[p_t2-169, p_t2], Wfi p_B-169,

Petição 870160008725, de 11/03/2016, pág. 372/698

101/200

W_i4[_Pi4-169, p_i4], ^₅[A₅-169, p_i5], JV_i6[ p_i6-169, p_i6], ^₇[_Λ.₇-169,

Pn L as janelas são de tamanho igual, isto é, todas as janelas têm um tamanho de 169 bytes, e entretanto maneiras de determinar se pelo menos uma parte de dados em uma janela atende a condição predefinida são também as mesmas. Quanto a detalhes, fazer referência à descrição supracitada de determinar se a pelo menos uma parte de dados em ^[/^-169, p_n\ atende a condição predefinida C_x. Portanto, conforme mostrado na Figura 16, representa 1 byte separadamente selecionado quando é determinado se pelo menos uma parte de dados na janela W_i2 [ p_i2-169, p_i2] atende uma condição predefinida C₂. Na Figura 16, bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes Ei cujos números na sequência são 170,

128, 86, 44 e 2 são convertidos em valores decimais que são representados como b_x, b₂, b₃, b₄, e b₅ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte

serve como um valor, e qualquer b_s de b_x, b₂, b₃, b₄,e b₅ atende 0</ç<255. b_x, b₂, b₃, b₄,e b₅ formam uma matriz 1*5. Nessa maneira de implantação, as maneiras de determinar se pelo menos uma parte de dados em cada janela atende uma condição predefinida são as mesmas, e, portanto, as mesmas matrizes R e G são ainda usadas. De acordo com o valor de b_x e uma coluna em que b_x está localizado, por exemplo, ^=66, e b_x está localizado em uma primeira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₆₆₁, e é efetuada uma busca na matriz G por um valor que corresponde a g₆₆₁. De acordo com o valor de b₂ e uma coluna em que b₂ está localizado, por exemplo, 6₂=48, e b₂ está localizado em uma segunda coluna, é efetuada uma busca na matriz R por um valor que corresponde a /z_{48 2}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{48 2}. De acordo com o valor de b₃ e uma coluna em que b₃ está localizado, por exemplo, b₃ =99, e b₃ está localizado em uma terceira coluna, é

Petição 870160008725, de 11/03/2016, pág. 373/698

102/200 efetuada uma busca na matriz R por um valor que corresponde a h₉₃, e é efetuada uma busca na matriz G por um valor que corresponde a g_{99 3}. De acordo com o valor de b₄ e uma coluna em que b₄ está localizado, por exemplo, b₄ =26, e b₄ está localizado em uma quarta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h>₆₄, e é efetuada uma busca na matriz G por um valor que corresponde a g₂₆₄. De acordo com o valor de b₅ e uma coluna em que b₅ está localizado, por exemplo, b₅ =90, e b₅está localizado em uma quinta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₉₀,₅, e é efetuada uma busca na matriz G por um valor que corresponde a g₉₀,₅. S_2h = h_66>1+ h₄₈,₂ + h₉₉,₃ + h₂₆,₄ + h₉₀,₅, e uma vez que a matriz R segue uma distribuição binomial, S_2h também segue uma distribuição binomial. S_2g = g_66>1+g₄₈,₂ +g₉₉,₃+g₂₆,₄+g_90>5, e uma vez que a matriz G segue uma distribuição binomial, S_2g também segue uma distribuição binomial. Quando um de S_2h e S_2g é um número par, a pelo menos uma parte de dados em W,₂ [ p,₂-169, p,₂] atende a condição predefinida C₂;quando tanto S_{2 h} quanto S_2g são números ímpares, a pelo menos uma parte de dados em W,₂[ p,₂-169, p,₂] não atende a condição predefinida C₂. Uma probabilidade de que um de S_2h e S_2g seja um número par é de 3/4. Na modalidade mostrada na Figura 5, a pelo menos uma parte de dados em W,₂ [ p,₂-169, p,₂] atende a condição predefinida C₂. Usando a mesma regra, separadamente, é determinado se pelo menos uma parte de dados em W,₃[p,₃-169, p,₃] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_t4[ p,₄-169, p,₄] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados em W,₅[ p,₅-169, p,₅] atende uma condição predefinida C₅, é determinado se pelo menos uma parte de dados em W,₆[ p,₆-169, p,₆] atende uma condição predefinida C₆,é determinado se pelo menos uma parte de dados em W,₇[ p,₇-169, p,₇] atende uma condição predefinida C₇, é determinado se pelo menos uma partede dados em W,₈[ p,₈-169, p,₈] atende uma condição predefinida C₈,é

Petição 870160008725, de 11/03/2016, pág. 374/698

103/200 determinado se pelo menos uma parte de dados em W_t9 [ p_i9-169, p_i9] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [ p_i10-169, p_i10] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_m [ p_i11-169, p_m] atende uma condição predefinida C_n. Na maneira de implantação mostrada na Figura 5, a pelo menos uma parte de dados em W_i5[ p_i5-169, p_i5] não atende a condição predefinida C₅, 11 bytes são pulados a partir de um ponto p_i5 ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente k_j é obtido em uma posição de extremidade de um décimo primeiro byte. Conforme mostrado na Figura 6, de acordo com a regra predefinida no servidor para desduplicação 103, um ponto p_jX e uma janela W_jX[p^-169, p_jX] que corresponde ao ponto p_]X são determinados para o ponto divisório potencial k_j. Uma maneira de determinar se pelo menos uma parte de dados na janela W_j1[ p_j1-169, p_j4] atende a condição predefinida C₄ é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_n[ p_i1-169, p_n] atende a condição predefinida C₄. Portanto, conforme mostrado na Figura 17, representa a janela ^Wj1[pj1-169, p]4], e é determinado se a pelo menos uma parte de dados em ^Wj1[ pj1-169, pfl], atende a condição predefinida C₄. Na Figura 17, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são convertidos em valores decimais que são representados como a/, a₂' , a₃ , a₄', e a₅' respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer a_s' de a/, a₂', a₃ , a₄', e a₅' atende 0<a_s'<255. a/, a₂', a₃ , a₄', e a₅' formam uma matriz 1*5. As matrizes R e G as mesmas que aquelas usadas quando é determinado se a pelo menos uma parte de dados na janela a/, a₂ , a₃ , a₄', e a₅' atende a condição predefinida C₄ são usadas, e são

Petição 870160008725, de 11/03/2016, pág. 375/698

104/200

	Ã1 ^h0, 2	·· h» ^Λ		' go,1	^g0,2	• g),5
representadas como:	^h1,1 ^hl,2	^h1,5	e	g1,1	^g1,2	• g1,5
	^^h255,5 ^h255,5	^h255,5 ^y		< ^g255,5	^g255,5	^g255,5 /

respectivamente.

[0133] De acordo com o valor de α_λ' e uma coluna em que α_λ' está localizado, por exemplo, α_λ' =16, e α_λ' está localizado em uma primeira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₁₆₁, e é efetuada uma busca na matriz G por um valor que corresponde a g₁₆₁. De acordo com o valor de a₂' e uma coluna em que a₂' está localizado, por exemplo, a₂' =98, e a₂' está localizado em uma segunda coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{98 2}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{98 2}. De acordo com o valor de a₃' e uma coluna em que a ₃' está localizado, por exemplo, a₃' =56, e a₃' está localizado em uma terceira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{56 3}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{56 3}. De acordo com o valor de a₄' e uma coluna em que a₄' está localizado, por exemplo, a₄' =36, e a₄' está localizado em uma quarta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{36 4}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{36 4}. De acordo com o valor de a₅' e uma coluna em que a₅' está localizado, por exemplo, a₅' =99, e a₅' está localizado em uma quinta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{99 5} , e é efetuada uma busca na matriz G por um valor que corresponde a g_{99 5}. S_1h' = h_{16 1}+ h_{98 2} + h_{56 3} + h_{36 4} + h_{99 5} , e uma vez que a matriz R segue uma distribuição binomial, S_1h' também segue uma distribuição binomial. ^S1g ' = g16, 1 ⁺g98 2 + g56 3+g36 4 +g99 5 , e uma vez que a matriz G segue uma distribuição binomial, S1g' também segue uma distribuição binomial. Quando um de S1h' e S1g' é um número par, a pelo menos uma parte de dados em j PjT¹⁶⁹, Pj11 atende a condição predefinida C1; quando tanto S_1h' quanto S_1g' são números

Petição 870160008725, de 11/03/2016, pág. 376/698

105/200 ímpares, a pelo menos uma parte de dados em Ψ₇₁[ρ_}1-169, p._x] não atende a condição predefinida C_x. A probabilidade de que um de S_lh' e S_lg' seja um número par é de 3/4.

[0134] Uma maneira de determinar se pelo menos uma parte de dados em W_i2 [ #₂-169, p_i2] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em ^2^469, p_]2\ atende a condição predefinida C₂. Portanto, conforme mostrado na Figura 17, Ei representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela JF₇₂[t?_j2-169, p_J2] atende a condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Na

Figura 17, bytes selecionados são representados como números na sequência

170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes Ei cujos números na sequência são 170, 128, 86, 44 e 2 são convertidos em valores decimais que são representados como 6/, Z>₂', b₃ , b₄', e b₃ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada

serve como um valor, e qualquer b_s' de b_x

b₄',e b₅' atende byte

b₄, e b₅' formam uma matriz 1*5. As matrizes R e G as mesmas que aquelas usadas quando é determinado se a pelo menos uma parte de dados na janela W_i2[ p_i2-\69, p_i2\ atende a condição predefinida C₂ são usadas. De acordo com o valor de 6/ e uma coluna em que b_x está localizado, por exemplo, />/=210, e />/ está localizado em uma primeira coluna, é efetuada uma busca na matriz R por um valor que corresponde a /z₂₁₀₁, e é efetuada uma busca na matriz G por um valor que corresponde a g₂₁₀₁. De acordo com o valor de b₂ e uma coluna em que b₂ está localizado, por exemplo, Z>₂'=156, e b₂ está localizado em uma segunda coluna, é efetuada uma busca na matriz R por um valor que corresponde a /z₁₅₆₂, e é efetuada uma busca na matriz G por um valor que corresponde a g_{156 2}. De acordo com o valor de b₃ e uma coluna em que b₃' está localizado, por exemplo, b₃ =144, e b₃ está localizado em uma terceira coluna, é efetuada uma busca na matriz

Petição 870160008725, de 11/03/2016, pág. 377/698

106/200

R por um valor que corresponde a h₁₄₄,₃, e é efetuada uma busca na matriz G por um valor que corresponde a g₁₄₄,₃. De acordo com o valor de b₄' e uma coluna em que b₄' está localizado, por exemplo, b₄' =60, e b₄' está localizado em uma quarta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₆₀,₄, e é efetuada uma busca na matriz G por um valor que corresponde a g₆₀,₄. De acordo com o valor de g₆₀,₄ e uma coluna em que g₆₀,₄está localizado, por exemplo, g₆₀,₄ =90, e g₆₀,₄ está localizado em uma quinta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₉₀,₅, e é efetuada uma busca na matriz G por um valor que corresponde a

^S2g ^g210,1 ^{+ g}156,2 ^{+ g}144,3 ^{+ g}60,4 ^{+ g}90,5 ·

Quando um de S_2h' e S_2g' é um número par, a pelo menos uma parte de dados em Wj₂[ p_j2-169, p_j2] atende a condição predefinida C₂; quando tanto S_2h' quanto S_2g' são números ímpares, a pelo menos uma parte de dados em W_j2[p_j2-169, p_j2] não atende a condição predefinida C₂. Uma probabilidade de que um de S_2h' e S_2g' seja um número par é de 3/4.

[0135] Similarmente, uma maneira de determinar se pelo menos uma parte de dados em W_t3[ p_i3-169, p_i3] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em Wj3[ Pj3 -169, p_j3] atende a condição predefinida C₃. Similarmente, é determinado se pelo menos uma parte de dados em W_j4[p_j4-169, p_j4] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em Wj5[ pj5169, p_j5 ] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[p_j6-169, p_j6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em Wj₇[ pj ₇-169, pj ₇] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[p_j8-169, p_j8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em Wj₉[ p₂₉-169, p_j9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[p_j10-169, p_j10] atende a condição predefinida C₁₀, e é determinado se pelo

Petição 870160008725, de 11/03/2016, pág. 378/698

107/200 menos uma parte de dados em W_y11[p_}11-169, p_j11\ atende a condição predefinida C₁₁, que não são descritas novamente no presente documento.

[0136] Usando a maneira de implantação mostrada na Figura 5 como um exemplo, um método para determinar se pelo menos uma parte de dados em uma janela W_z [ p_lz- A_z, p_iz + B_z \ atende uma condição predefinida C_z é fornecido. Nessa modalidade, é determinado, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ p_lz - A_z, p_lz + B_z \ atende a condição predefinida C _z. De acordo com a regra predefinida em um servidor para desduplicação 103, um ponto p_n e uma janela W_n[ p_n-169, p_n\ que corresponde a p_l1 são determinados para um ponto divisório potencial k_l, e é determinado se pelo menos uma parte de dados em W1[ p,1-169, p_n\ atende a condição predefinida C_z. Conforme mostrado na Figura 16, W_nrepresenta a janela W1[ p_n-169, p_n\, e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [ p_l1-169, p_n \ atende a condição predefinida C _z. Na Figura 16, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são considerados como 40 bits sequenciais, que são representados como a₁, a₂, a₃, e a₄₀ separadamente. Para qualquer a_t de a₂, a₃, a₄,..., e a₄₀, quando ^at = ^{0, V}at =1, e quando at =1, Vat=1. De acordo com uma correspondência entre at e Vat, Va1, Va2, Va3, Va4,..., e a40 são gerados. 40 números aleatórios são selecionados a partir de números aleatórios que seguem uma distribuição normal, e são representados como: h15 h2, h3, h4,..., e h40 separadamente. Sa = V/^h1+ Va2* ^h2 + Va3*h3 + Va4* ^h4+...+ Va40* h. . Uma vez que Z, h3, h₄,..., e h₄₀ seguem uma distribuição normal, S_a também segue uma distribuição normal. Quando S_a é um número positivo, a pelo menos uma parte de dados em W_n [ p_n-169, p_n\ atende a condição predefinida C₁; quandoS_a é um número negativo ou 0, a pelo menos uma parte de dados em S_a não atende

Petição 870160008725, de 11/03/2016, pág. 379/698

108/200 a condição predefinida Cj. Uma probabilidade de que S_a seja um número positivo é de 1/2. Na modalidade mostrada na Figura 5, a pelo menos uma parte de dados em S_aatende a condição predefinida C_x. Conforme mostrado na Figura 16, representa 1 byte separadamente selecionado quando é determinado se pelo menos uma parte de dados em uma janela p_i2] atende a condição predefinida C₂. Na Figura 16, bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes Ei cujos números na sequência são 170, 128, 86, 44 e 2 são considerados como 40 bits sequenciais, que são representados como b_x, b₂, b₃, b₄,..., e b₄₀ separadamente. Para qualquer b_t de b_x, b₂, b₃, b₄,..., e Z>₄₀, quando b_t=0, V_bt=A, e quando ξ=1, V_bt=V V_bl, V_b2, V_b3, V_b4,..., e K_M0 são gerados de acordo com uma correspondência entre b_t e V_bt. Uma maneira de determinar se pelo menos uma parte de dados na janela ^[ρ,-169, pj atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados na janela JP_l2[ p_l2-169, p_i2] atende a condição predefinida C₂, e portanto, os mesmos números aleatórios são usados: h_x, h₂, h₃, h₄,..., e h₄₀. S_b = V_bl*h₁+v_b2*h₂+v_b3*h₃ + V_b4*h₄+...+ v_b40*h₄₀.. Uma vez que h_x, h₂, h₃, h₄,..., e h₄₀. seguem uma distribuição normal, S_b também segue uma distribuição normal. Quando S_b é um número positivo, a pelo menos uma parte de dados em JP_l2[ p_l2-169, p_i2] atende a condição predefinida C₂; quando S_b é um número negativo ou 0, a pelo menos uma parte de dados em W_j2 [ p_i2-\69, p_j2] não atende a condição predefinida C₂. Uma probabilidade de que S_b seja um número positivo é de 1/2. Na modalidade mostrada na Figura 5, a pelo menos uma parte de dados em W₁₂[p₁₂-169, p₁₂] atende a condição predefinida C₂. Usando a mesma regra, separadamente, é determinado se pelo menos uma parte de dados em W_i3[ p_i3-\69, p_i3] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_i4[p_i4-169, p_i4] atende uma condição predefinida C₄, é

Petição 870160008725, de 11/03/2016, pág. 380/698

109/200 determinado se pelo menos uma parte de dados em W_i5[ p₁₅-169, p_i5] atende uma condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_t6[ p_t6-169, p_t6] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_t7[ p_i7-169, p_i7] atende uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_i8[ p_i8-169, p_l8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_t9 [ p_i9 -169, p_i9 ] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [ p_i10-169, p_i10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_m[ p_i11-169, p_i11] atende uma condição predefinida C₁₁. Na maneira de implantação mostrada na Figura 5, a pelo menos uma parte de dados em W_i5[ p_i5-169, p_i5] não atende a condição predefinida C₅, 11 bytes são pulados a partir de um ponto p_i5 ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente k_jé obtido em uma posição de extremidade de um décimo primeiro byte. Conforme mostrado na Figura 6, de acordo com a regra predefinida no servidor para desduplicação 103, um ponto p_j1 e uma janela W_j1[p_j4-169, p_j1] que corresponde ao ponto p_j4 são determinados para o ponto divisório potencial k_j. Uma maneira de determinar se pelo menos uma parte de dados na janela W_j1[ p_j1-169, p_j4] atende a condição predefinida C₁ é a mesma maneira de determinar se pelo menos uma parte de dados na janela W₄[ p_n-169, p_n] atende a condição predefinida C₁. Portanto, conforme mostrado na Figura 17, ^WJ1 representa a janela W_j1[p_}1-169, p_}1], e para determinar se pelo menos uma parte de dados em W_j1[ p_j4-169, p_j4], atende a condição predefinida C₁, 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_j1[p_j1-169, p_}1], atende a condição predefinida C₁. Na Figura 17, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43

Petição 870160008725, de 11/03/2016, pág. 381/698

110/200 e 1 são considerados como 40 bits sequenciais, que são representados como a/, a₂, a₃', a₄ , e a₄₀' separadamente. Para qualquer a_t' de a/, a₂, a₃', a₄',...,e a₄₀', quando<=0, K_flí'=-1, e quando α/=1, K_flí'=1. Κ_α1', Κ_α2', K_fl3', V_a4', e V_a40' são gerados de acordo com uma correspondência entre a_t' e V_at'. k maneira de determinar se pelo menos uma parte de dados na janela -169, ρ_]λ] atende a condição predefinida C, é a mesma maneira de determinar se pelo menos uma parte de dados na janela ^[^-169, _A1] atende a condição predefinida C₄, e portanto, os mesmos números aleatórios são usados: h₂, h₃, h₄,..., e Λ₄₀. K_fl2'*/z₂+K_fl3'*/z₃ + K_fl4'*/z₄

+...+ Κ_α40'*/?₄₀. Uma vez que h₄, h₂, h₃, h₄,..., e h₄₀ seguem uma distribuição normal, S_a' também segue uma distribuição normal. Quando S_a' é um número positivo, a pelo menos uma parte de dados em ^[^-169, ρ_]λ] atende a condição predefinida C₄; quando S_a' é um número negativo ou 0, a pelo menos uma parte de dados em W_j3[p_jX -169, ρ_]λ] não atende a condição predefinida C₄. Uma probabilidade de que S_a' seja um número positivo é de 1/2.

[0137] A maneira de determinar se pelo menos uma parte de dados em W_i2 [ j>_!2-169, p_i2] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em ^₂[^₂-169, p_J2] atende a condição predefinida C₂. Portanto, conforme mostrado na Figura 17, Ei representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela W_j2[p_]2-I69, p_J2] atende a condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Na Figura 17, bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes Ei cujos números na sequência são 170, 128, 86, 44 e 2 são considerados como 40 bits sequenciais, que são representados como b₃ , b₂, b₃', b₄', e Z>₄₀' separadamente. Para qualquer b_t' de b₃, b₂, b₃', Z>₄', ..., e Z>₄₀', quando/>/=0, 1/,/=-1, e quando />/=1, 1/,/=1. 1/,/, V_b2', V_b3',

Petição 870160008725, de 11/03/2016, pág. 382/698

111/200

V_be V_b40' são gerados de acordo com uma correspondência entre b_t' e V_bt'. A maneira de determinar se pelo menos uma parte de dados em W_t2 [ p_t2169, p_t2] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em W_j2[p_j2-169, p_j2] atende a condição predefinida C₂, e portanto, os mesmos números aleatórios são usados: h₄, h₂, h₃, ^h4^,...t ^{e h}40 . ^Sb ' = ^Vbi'* ^hi+ ^Vbd* ^h2^{+ V}b3* ^h3^{+ V}b4* ^h4⁺---^{+ V}b4o'* ^h40·· ^Umavez que h1, h₂, h₃, h₄,..., e h₄₀. seguem uma distribuição normal, S_b' também segue uma distribuição normal. Quando S_b' é um número positivo, a pelo menos uma parte de dados em Wj₂[p_j2-169, p_j2] atende a condição predefinida C₂, quando S_b' é um número negativo ou 0, a pelo menos uma parte de dados em Wj ₂[ p_{j 2}-169, p_{j 2}] não atende a condição predefinida C₂. A probabilidade de que S_b' seja um número positivo é de 1/2.

[0138] Similarmente, uma maneira de determinar se pelo menos uma parte de dados em W_t3[ p_i3-169, p_i3] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em Wj ₃[ p_p-169, p_j3] atende a condição predefinida C₃. Similarmente, é determinado se pelo menos uma parte de dados em W_j4[p_j4-169, p_j4] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em Wj₅[ p_]5169, p_j5 ] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[p_j6-169, p_j6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em Wj₇[ pj ₇-169, pj ₇] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[p_j8-169, p_j8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em Wj₉[p_}9-169, p_]9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[p_j10-169, p_j10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_jn[p_jU-169, p_j11] atende a condição predefinida C_n, que não são descritas novamente no presente documento.

[0139] Ainda usando a maneira de implantação mostrada na

Petição 870160008725, de 11/03/2016, pág. 383/698

112/200

Figura 5 como um exemplo, um método para determinar se pelo menos uma parte de dados em uma janela W_iz [ p_iz - A_z, p_lz + B_z ] atende a condição predefinida C _z é fornecido. Nessa modalidade, é determinado, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela ^Wiz ^[ Piz - ^Az , piz + Bz ] atende a condição predefinida C z. De acordo com a regra predefinida em um servidor para desduplicação 103, um ponto pn e uma janela Wn [ pn169, pl1] que corresponde a pi1 são determinados para um ponto divisório potencial , e é determinado se pelo menos uma parte de dados em Wi1 [ pi1169, pn] atende uma condição predefinida C1. Conforme mostrado na Figura 16, Wn representa a janela W4[ ph-169, pn], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em Wn [ pn-169, pn] atende a condição predefinida Cx. Na Figura 16, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 é convertido em 1 número decimal, cuja faixa é 0-(2^Λ40-1). Um gerador para distribuição uniforme de número aleatório é usado para gerar 1 valor designado para cada número decimal em 0-(2Λ40-1), e uma correspondência R entre cada número decimal em 0-(2Λ40-1) e o valor designado é gravado. Uma vez designado, um valor designado que corresponde a um número decimal permanece inalterado, e o valor designado segue distribuição uniforme. Se o valor designado é um número par, a pelo menos uma parte de dados em Wn [ p_n-169, p_n] atende a condição predefinida C_x; se o valor designado é um número ímpar, a pelo menos uma parte de dados em W_ü[ p_n-169, p_n] não atende a condição predefinida C_x. C_x representa que o valor designado obtido de acordo com o supracitado método é um número par. Uma vez que uma probabilidade de que um número aleatório em distribuição uniforme seja um número par é de 1/2, uma probabilidade de que a pelo menos uma parte de dados em [ pn-169, p_n] atenda a condição predefinida C_x é de 1/2. Na maneira de implantação

Petição 870160008725, de 11/03/2016, pág. 384/698

113/200 mostrada na Figura 5, usando a mesma regra, separadamente, é determinado se pelo menos uma parte de dados em W_t2 [ p_t2 -169, p_t2 ] atende uma condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_{t 3}[ p_i3169, p_t3] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_{t 4}[ p_{t 4}-169, p_{t 4}] atende uma condição predefinida C₄, e é determinado se pelo menos uma parte de dados em W_I5[ p_i5-169, p_i5] atende uma condição predefinida C₅, que não são descritas novamente no presente documento.

[0140] Quando a pelo menos uma parte de dados em W_i5[ p,5-169, p_i5] não atende a condição predefinida C₅, 11 bytes são pulados a partir de um ponto p_{t 5} ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente kj é obtido em uma posição de extremidade de um décimo primeiro byte. Conforme mostrado na Figura 6, de acordo com a regra predefinida no servidor para desduplicação 103, um ponto p_fl e uma janela W_j1[ p_]1-169, p_j4] que corresponde ao ponto p_fl são determinados para o ponto divisório potencial kj. Uma maneira de determinar se pelo menos uma parte de dados na janela jp_yl-169, p_fl] atende a condição predefinida C₄ é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_i1[ p_i1-169, p_n] atende a condição predefinida C₄. Portanto, a mesma correspondência R entre cada número decimal em 0-(2^Λ401) e um valor designado é usada. Conforme mostrado na Figura 17, representa a janela W_j1[p^-169, p₇₁], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em j p-1-169, pj, atende a condição predefinida C₄. Na Figura 17, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados Cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 é convertido em 1 número decimal, e R é buscado um valor designado que corresponde ao número decimal. Se o valor designado é um número par, a pelo menos uma parte de dados em W_j1[p^-169, p_]X] atende a condição predefinida C₄; se o

Petição 870160008725, de 11/03/2016, pág. 385/698

114/200 valor designado é um número ímpar, a pelo menos uma parte de dados em W [p_]3-169, p_]X] não atende a condição predefinida C₁. Uma vez que a probabilidade de que um número aleatório em uma distribuição uniforme seja um número par é de 1/2, a probabilidade de que a pelo menos uma parte de dados em W_j1[ρ_]λ-169, ρ_]λ] atenda a condição predefinida C₃ é de 1/2. Similarmente, uma maneira de determinar se pelo menos uma parte de dados em W_t2 [ p.₂-169, p.₂] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em ^W \ Pj 2-169, pj 2] atende a condição predefinida C₂, e uma maneira de determinar se pelo menos uma parte de dados em W_t3[p_i3-169, p_i3] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em Wj3[ pj3169, p_j3] atende a condição predefinida C₃. Similarmente, é determinado se pelo menos uma parte de dados em W_j4[p_j4-169, p_j4] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em Wj5[ pj5169, p_j5 ] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[p_j6-169, p_j6] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em Wj₇[pj₇-169, pj₇] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[p_j8-169, p_j8] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em Wj₉[p_}9-169, p_j9] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[p_j10-169, p_j10] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_j11[p_]U-169, p_jn] atende a condição predefinida C_n, que não são descritas novamente no presente documento.

[0141] O servidor para desduplicação 103 na modalidade da presente invenção mostrada na Figura 1 se refere a um aparelho que pode implantar uma solução técnica descrita em uma modalidade da presente invenção, e conforme mostrado na Figura 18, usualmente inclui uma unidade de processamento central, uma memória principal, e uma interface de

Petição 870160008725, de 11/03/2016, pág. 386/698

115/200 entrada/saída. A unidade de processamento central, a memória principal, e a interface de entrada/saída se comunicam entre si. A memória principal armazena uma instrução executável, e a unidade de processamento central executa a instrução executável armazenada na memória principal, de modo a realizar uma função específica, por exemplo, buscar um ponto divisório de corrente de dados descrito na Figura 4 à Figura 17 nas modalidades da presente invenção. Portanto, conforme mostrado na Figura 19, de acordo com as modalidades da presente invenção mostradas na Figura 4 à Figura 17, para o servidor para desduplicação 103, a regra é predefinida no servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar M pontos p_x, uma janela W_x [ p_x - A_x, p_x+B_x ] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x[p_x-A_x, p_x+B_x], onde x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros. O servidor para desduplicação 103 inclui uma unidade de determinação 1901 e uma unidade de julgamento e processamento 1902. A unidade de determinação 1901 é configurada para realizar a etapa (a): (a) determinar um ponto p_Iz e uma janela W_iz [ p_iz - A, p_z + B_z] que corresponde ao ponto p_z para um ponto divisório potencial corrente k_t de acordo com a regra, em que i e z são números inteiros, e 1<z<M. A unidade de julgamento e processamento 1902 é configurada para: se pelo menos uma parte de dados na janela W_z [ p_z - A, p_z + B_z ] atende uma condição predefinida C_z;

quando a pelo menos uma parte de dados na janela W_Iz [ p_Iz - A, p_z + B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p _z ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que IIB_z 11+ max_x(II A_x 11+11( k_i -p_x)||), de modo a obter um novo ponto divisório potencial, onde a unidade de determinar realiza a etapa (a) para o novo ponto divisório potencial; e quando pelo menos uma parte de dados em cada janela W_ix [ p_Ix - A_x, p_Ix + B_x ] de M janelas do ponto divisório potencial

Petição 870160008725, de 11/03/2016, pág. 387/698

116/200 corrente k_t atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_t, como um ponto divisório de corrente de dados.

[0142] Além disso, a regra inclui adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições A_e = A_f, B_e = B_f, e C_e = C_f. Além disso, a regra inclui adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos p_e e p_f estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.

[0143] Além disso, a regra inclui adicionalmente que uma distância entre os pelo menos dois pontos p_e e p_f é de 1 U.

[0144] Além disso, a unidade de julgamento e processamento 1902 é especificamente configurada para determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_z [ p_z - A, p_lz + B_z ] atende a condição predefinida C_z. Especificamente, a unidade de julgamento e processamento 1902 é especificamente configurada para determinar, usando uma função hash, se a pelo menos uma parte de dados na janela W_lz [ p_a - A, p_z + B_z ] atende a condição predefinida C_z. Especificamente, que a unidade de julgamento e processamento 1902 seja especificamente configurada para determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ p_lz - A, p_z+B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_iz [ p_iz - A_z, p_iz + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F>1, cada byte é formado por 8 bits, que são indicados por a_m1, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que correspondem ' ^ai,1 ^ai,2 ^a2,1 ^a2,2 \ f*h ,1 ^aF*H, 2 aos F*H bytes podem ser representados como: _a ) ^u1,8 ^a2,8 ^aF*H ,8 y onde quando a =1, V =1, e quando a =0, ~ m,n ’ am,n ’ ~ m ,n ’ v_amn =-1, onde a_mn representa qualquer um dentre a_m1 e a_m8, uma matriz

Petição 870160008725, de 11/03/2016, pág. 388/698

117/200

V é obtida de acordo com uma relação de conversão entre a e V a a s m ,n am,n partir dos bits que correspondem aos F*H bytes, a matriz V_a é representada como:

V ^F a1,8

V ^F a 2,8

F*H*8 números aleatórios são selecionados

V

V aF*H ,1

V ^F aF *H ,2

V ^v aF *H ,8 y a partir de números aleatórios seguindo-se uma distribuição normal para formar

	' ^h1,1	^h1,2 ··	h % 1,8
uma matriz R, a matriz R é representada como:	^h2,1	^h2,2 ··	^h2,8 • 5
	h ^lF*H ,1	h ^rlF*H ,2	h ^rlF*H ,8 y
números aleatórios em uma emésima linha da matriz V_a e	em uma	emésima

linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1 * h_m1 + V_am,₂ * h_m2+···+ V_am,₈*h_m,₈, S_a1, S_a2, e S_aF*_H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entreS_a1, S_a2, e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_iz[ P_z - A, Piz + B_z ] atende a condição predefinida C_z.

[0145] Além disso, a unidade de julgamento e processamento 1902 é configurada para: quando a pelo menos uma parte de dados na janela W_iz [ p_iz- A, p_iz+B_z] não atende a condição predefinida C_z, pular o mínimo N de unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p_iz ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e a unidade de determinação 1901 realiza a etapa (a) para o novo ponto divisório potencial, onde e de acordo com a regra, um limite à esquerda de uma janela W_ic [ p_Ic - A, p_ic+B_c] que corresponde a um ponto p_ic que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela ^W [ plz - Az^, Piz⁺Bz] ou um limite à esquerda de uma janela ^W [ Pic - Ac^, Pic^+B 1, q^{ue é} determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_lz [ p_lz - Az, p_iz+Bz ], onde a janela ^W _lc [ p_lc - A_c, p_ic + B_c ] determinada

Petição 870160008725, de 11/03/2016, pág. 389/698

118/200 para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.

[0146] De acordo com o método para buscar um ponto divisório de corrente de dados com base em um servidor nas modalidades da presente invenção mostradas na Figura 4 à Figura 17, um ponto p_x e uma janela W [ P_lx -A_x, P_lx + ^B _x] do ponto p_x são determinados para um ponto divisório potencial k_t, onde x indica números naturais consecutivos de 1 a M separadamente, e M>2. Pode ser determinado em paralelo se pelo menos uma parte de dados em cada janela de M janelas atende uma condição predefinida C_x, ou pode ser determinado em sequência se pelo menos uma parte de dados nas janelas atende uma condição predefinida, ou pode ser primeiramente determinado que pelo menos uma parte de dados em uma janela W_n [ p_n- a₁₅ p_n +b J atende a condição predefinida C_}, então é determinado que pelo menos uma parte de dados em W_im [ p_im - A_m, p_im + B_m ] atende a condição predefinida C₂, até ser determinado que pelo menos uma parte de dados em W_im [ p_im - A_m, p_im + B_m ] atende a condição predefinida C_m. Outras janelas nessa modalidade são determinadas da mesma maneira que acima, que não é descrita novamente.

[0147] Além disso, de acordo com as modalidades da presente invenção mostradas na Figura 4 à Figura 17, em aplicações concretas, uma regra é predefinida no servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar M pontos p_x, uma janela W_x[p_x- A_x, p_x+B_x] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x[p_x-A_x, p_x+B_x], onde x indica números naturais consecutivos de 1 a M separadamente, e M>2. Na regra predefinida, A₁, A₂, A₃, ..., e A_m podem ser não todos iguais, b₁₅ b₂, B₃, ..., e B_m podem ser não todos iguais, e C_n C₂, C₃, ..., e C_M podem também ser não todos iguais. Na

Petição 870160008725, de 11/03/2016, pág. 390/698

119/200 maneira de implantação mostrada na Figura 5, para as janelas W_n[ p_n-169,

P/1], W 2^[ Pi 2^-169, Pi 2^{] W}i3^[ Pi3^-169, Pi 3], ^W<l Pi4^-169, Pi4 L ^Wi5^[ P ~¹⁶⁹- Pü],

W_i6[ Pi6-169, Pi₆], W₁₇[ Pi₇-169, p_i7], W_iS[ P_iS-169, P₁₈], W₉ [ Pi9-169, P_i9l

-169, P_i10], e W-n[P_in-169, P_n1], as janelas são de tamanho igual, isto ^Wi10 ^[ Pi10 é, todas as janelas têm um tamanho de 169 bytes, e entretanto maneiras de determinar se pelo menos uma parte de dados em uma janela atende a condição predefinida são também as mesmas. Quanto a detalhes, fazer referência à descrição supracitada de determinar se a pelo menos uma parte de dados em W_n [ p_i1-169, p_i1] atende a condição predefinida C₁. Entretanto, na maneira de implantação mostrada na Figura 11, as janelas W_n[ Pi,-169,

Pi1^] W 2^[ Pi 2^-169, Pi 2^{] W}i3 ^[ Pi3^-169, Pi 3^]» ^Wi4^[ Pi4^-169, Pi4 L ^Wi5^[ Pi5^-169, Pi5^]

W₆[ Pi6-169, PiJ, W-7[ Pí7-169, Pi7], ^₈[ Pi8-169, p.₈], W_i9[ p.₉-169, p.₉],

WU Pi₁o-169, Pi!o], e W._n[ P_ni-182, P_ül] podem ser diferentes em tamanho, e entretanto as maneiras de determinar se pelo menos uma parte de dados em uma janela atende a condição predefinida podem também ser diferentes. Em todas as modalidades, de acordo com a regra predefinida no servidor para desduplicação 103, uma maneira de determinar se pelo menos uma parte de dados na janela W_i1 atende a condição predefinida C₁ é certamente a mesma maneira de determinar se pelo menos uma parte de dados em uma janela ^Wj1 atende a condição predefinida C₁, uma maneira de determinar se pelo menos uma parte de dados em W ₂ atende a condição predefinida C₂ é certamente a mesma maneira de determinar se pelo menos uma parte de dados em W_j2atende a condição predefinida C₂, ..., e uma maneira de determinar se pelo menos uma parte de dados em uma janela W_iM atende a condição predefinida C_M é certamente a mesma maneira de determinar se pelo menos uma parte de dados em uma janela W_jM atende a condição predefinida W_jM, que não são descritas novamente no presente documento. Entretanto, de acordo com as modalidades da presente invenção mostradas na Figura 4 à Figura 17, embora M=11 seja usado como um exemplo, o valor de M não é limitado a 11 de

Petição 870160008725, de 11/03/2016, pág. 391/698

120/200 acordo com uma exigência concreta, e uma pessoa especialista na técnica determines o valor de M de acordo com a descrição nas modalidades da presente invenção.

[0148] De acordo com as modalidades da presente invenção mostradas na Figura 4 à Figura 17, a regra é predefinida no servidor para desduplicação 103, k_a, k_t, k₇, k_t, e k_m são pontos divisórios potenciais obtidos ao se buscar um ponto divisório ao longo de uma direção de buscar um ponto divisório de corrente de dados, e k_a, k_t, k₇, k_t, e k_m todos seguem a regra. A janela W_x [ p_x - A_x, p_x + B_x] nessa modalidade da presente invenção representa uma faixa específica, e dados são selecionados na faixa específica para determinar se os dados atendem a condição predefinida C_x. Especificamente, na faixa específica, uma parte de dados pode ser selecionada ou todos os dados podem ser selecionados para determinar se os dados atendem a condição predefinida C_x. Referência pode ser feita à janela ^Wx^[ px ^{- A}x^, px ⁺B_x ] quanto ao conceito de uma janela especificamente usada nessa modalidade da presente invenção, que não é descrita novamente no presente documento.

[0149] De acordo com as modalidades da presente invenção mostradas na Figura 4 à Figura 17, na janela ^Wx ^[ px ^- Ax. ^, px ^{+ B}x ^{] (} p. ^{- A}x ^{) e}(px + Bx) representam dois limites da janela ^Wx [ p - A ^, px ^{+ B}x ], ^{onde (} p Ax) representa um limite, que está em uma direção oposta à direção de buscar um ponto divisório de corrente de dados com relação ao ponto px , da janela ^Wx ^[ px ^- A ^, px ^{+ B}x ^{] e (} px ^{+ B}x ⁾ representa um limite, que está na direção de buscar um ponto divisório de corrente de dados com relação ao ponto px , da janela ^Wx ^[ px ^- A ^, px ^{+ B}x ^]. Especificamente, na modalidade da presente invenção, a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 3 à Figura 15 é da esquerda para a direita; portanto, (px Ax) representa um limite (isto é, um limite à esquerda), que está em uma direção oposta à direção de buscar um ponto divisório de corrente de dados

Petição 870160008725, de 11/03/2016, pág. 392/698

121/200 com relação ao ponto p_x, da janela W [ Px-Αχ, Px + B_X], e ( Px + Bx) representa um limite (isto é, um limite à direita), que está na direção de buscar um ponto divisório de corrente de dados com relação ao ponto p_x, da janela W_x [ P_x - A_x, p_x + B_x]. Se a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 3 à Figura 15 é da direita para a esquerda, ( p_x - A_x) representa um limite (isto é, um limite à direita), que está em uma direção oposta à direção de buscar um ponto divisório de corrente de dados com relação ao ponto p_x , da janela ^Wx ^[ px ^{- A}x p_x + B_x], e ( p_x + B_x) representa um limite (isto é, um limite à esquerda), que está na direção de buscar um ponto divisório de corrente de dados com relação ao ponto p_x , da janela ^Wx ^[ px ^- A , px ^{+ B}x ^].

[0150] Uma pessoa de habilidade comum na técnica pode estar ciente de que, em conjunto com várias unidades exemplificativas e etapas de algoritmo descritas nas modalidades da presente invenção, uma característica chave nas modalidades da presente invenção pode ser combinada com outras tecnologias e apresentada em uma forma mais complexa; entretanto, a característica chave da presente invenção é ainda incluída. Um ponto divisório alternativo pode ser usado em um ambiente concreto. Por exemplo, em uma maneira de implantação, de acordo com uma regra predefinida em um servidor para desduplicação 103, 11 pontos p_x são determinados para um ponto divisório potencial k_t, onde x indica números naturais consecutivos de 1 a 11, e uma janela W_x [ p_x- A_x, p_x+B_x] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [ p_x- A_x, p_x+B_x] são determinados. Quando pelo menos uma parte de dados em cada janela Wx [ p_x - A_x, p_x + B_x] de 11 janelas atende a condição predefinida C_x, o ponto divisório potencial k_t é um ponto divisório de corrente de dados. Quando nenhum ponto divisório é encontrado quando uma fatia de dados máxima definida é excedida, uma regra predefinida para o ponto alternativo pode ser usada nesse caso. A regra predefinida para o ponto alternativo é similar à regra

Petição 870160008725, de 11/03/2016, pág. 393/698

122/200 predefinida no servidor para desduplicação 103, e a regra predefinida para o ponto alternativo é: por exemplo, para um ponto divisório potencial k_t, 10 pontos p_x são determinados, onde x indica números naturais consecutivos de 1 a 10, e uma janela W_x [ p_x - A_x, p_x + B_x] que corresponde a p_x e uma condição predefinida C_x que corresponde à janela W_x [ p_x - A_x, p_x + B_x ] são determinados. Quando pelo menos uma parte de dados em cada janela ^Wx [ p_x - A_x, p_x + B_x] de 10 janelas atende a condição predefinida C_x, o ponto divisório potencial k_t é um ponto divisório de corrente de dados; quando nenhum ponto divisório de corrente de dados é encontrado quando a fatia de dados máxima definida é excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado.

[0151] Uma regra é predefinida no servidor para desduplicação 103, e na regra, M pontos são determinados para um ponto divisório potencial k. Não é necessariamente exigido que haja um ponto divisório potencial k antecipadamente, e o ponto divisório potencial k pode ser determinado usandose os M pontos determinados.

[0152] Uma modalidade da presente invenção fornece um método para buscar um ponto divisório de corrente de dados com base em um servidor para duplicação, que, conforme mostrado na Figura 20, inclui:

[0153] Uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar M janelas W_x [ k- A_x, k + B_x] e uma condição predefinida C_x que corresponde à janela W_x [ k- A_x, k+ B_x], onde x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_x são números inteiros. Na maneira de implantação mostrada na Figura 3, sobre um valor de M, em uma maneira de implantação, um valor de M*U não é maior que uma distância máxima predefinida entre dois pontos divisórios de corrente de dados adjacentes, isto é, um comprimento máximo predefinido de uma fatia de dados. É determinado se pelo menos uma parte de dados em uma janela W_z [ k- A_z, k + B_z ] atende uma

Petição 870160008725, de 11/03/2016, pág. 394/698

123/200 condição predefinida C_z, onde, z é um número inteiro, 1<z<M, e (k- A_z) e (k+ B_z) separadamente representam dois limites da janela W_z. Quando é determinado que pelo menos uma parte de dados em qualquer uma janela ^Wz [ k- Az, k + Bz ] não atende a condição predefinida Cz, N bytes são pulados a partir do ponto divisório potencial k ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N<ll Bz || + maxx(|| Ax ||). || Bz || representa um valor absoluto de Bz em Wz [ k- Az, k+ Bz ], ^maxx (|| Ax II) representa um valor máximo entre o valor absoluto de A_x nas M janelas, e um princípio de determinar um valor de N é especificamente apresentado nas modalidades a seguir. Quando é determinado que pelo menos uma parte de dados em cada janela W_x [ k- A_x, k + B_x ] das M janelas atende a condição predefinida C_x, o ponto divisório potencial k é um ponto divisório de corrente de dados.

[0154] Especificamente, para um ponto divisório potencial corrente k_l, as seguintes etapas são realizadas de acordo com a regra:

[0155] Etapa 2001: Determinar uma janela correspondente W_lz [k_t A_z, k_t + B_z ] para o ponto divisório potencial corrente k_l de acordo com a regra, onde i e z são números inteiros, e 1<z<M.

[0156] Etapa 2002: Determinar se pelo menos uma parte de dados na janela W_z [k_l - A_z, k_l + B_z ] atende a condição predefinida C_z;

quando a pelo menos uma parte de dados na janela W_z [k_l - A_z, k_l+ B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k_i ao longo da direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que || B_z II +^maxx(|| ^Ax ||), de modo a obter um novo ponto divisório potencial, e realizar a etapa 2001; e quando pelo menos uma parte de dados em cada janela W_ix [k_l - A_x, k_l+B_x ] de M janelas do ponto divisório potencial corrente k_t atende a condição predefinida C_x , selecionar o ponto divisório potencial corrente k_i como um

Petição 870160008725, de 11/03/2016, pág. 395/698

124/200 ponto divisório de corrente de dados.

[0157] Além disso, a regra inclui adicionalmente que pelo menos duas janelas W_ie [ k_t - A_e, k_t + B_e ] e W_If [ k_I - A_f, k_t + B_f ] atendem as condições | A_e+B_e |=| A_f+B_f |, e C_e = C_f. Além disso, a regra inclui adicionalmente que A_e e A_f são números inteiros positivos. Mais ainda, a regra inclui adicionalmente que A_e-1 = A_f e B_e +1=B_f. | A_e + B_e | representa um tamanho da janela W_e, e | ^Af^+Bf^| representa um tamanho da janela W.

[0158] Além disso, determinar se pelo menos uma parte de dados na janela W_z [ k_t - A_z, k_t + B_z ] atende a condição predefinida C_z inclui especificamente: determinar, usando uma função aleatória, se a pelo menos uma parte de dados na janela W_z [k_t - A_z, k_t + B_z ] atende a condição predefinida C_z. Mais ainda, determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela ^Wz [^k -A, ^k + ^Bz ] atende a condição predefinida Cz é especificamente: determinar, usando a função hash, se a pelo menos uma parte de dados na janela ^W.z [^k -A, ^k+^Bz ] atende a condição predefinida Cz.

[0159] Quando a pelo menos uma parte de dados na janela W_iz [ k_I- A_z, k_t + B_z ] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto divisório potencial corrente k_t ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial. De acordo com a regra, um limite à esquerda de uma janela W_Ic [k_I A_c, k_I + B_c] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_z [k_t - A_z, k_t + B_z ] ou um limite à esquerda de uma janela W_Ic [k_I - A_c, k_I + B_c ] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_z [ k_t - A_z, k_t + B_z ], onde a janela W_Ic [k_I - A_c, k_I + B_c ] determinada para o novo ponto divisório potencial é uma janela colocada como a primeira em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, de M janelas que são

Petição 870160008725, de 11/03/2016, pág. 396/698

125/200 determinadas para o novo ponto divisório potencial de acordo com a regra.

[0160] Nessa modalidade da presente invenção, um ponto divisório de corrente de dados é buscado ao se determinar se pelo menos uma parte de dados em uma janela de M janelas atende uma condição predefinida, e quando a pelo menos uma parte de dados na janela não atende a condição predefinida, um comprimento de N*U é pulado, onde N*U não é maior que || B_z ll+max_x(|| A_x ||), de modo a se obter um próximo ponto divisório potencial, desse modo aumentando a eficiência na busca de um ponto divisório de corrente de dados.

[0161] Em um processo de eliminar dados duplicados, para assegurar um tamanho uniforme de uma fatia de dados, um tamanho de uma fatia de dados comum (também denominada uma fatia comum) é considerado. Isto é, embora limites em um tamanho de uma fatia de dados mínima e um tamanho de uma fatia de dados máxima sejam atendidos, o tamanho das fatias de dados comuns é determinado para assegurar um tamanho uniforme de uma fatia de dados obtida. Uma probabilidade (representada como P(n)) de encontrar um ponto divisório de corrente de dados depende de dois fatores, isto é, a quantidade M das janelas W_x [ k- A_x, k + B_x ] e uma probabilidade de que pelo menos uma parte de dados na janela W_x [ k- A_x, k + B_x ] atenda uma condição predefinida, onde a primeira afeta um comprimento para pular, a última afeta uma probabilidade de pular, e as duas juntas afetam o tamanho da fatia comum. Em geral, quando o tamanho da fatia comum é fixo, à medida que o montante de W_x [ k- A_x, k+B_x ] aumenta, a probabilidade de que pelo menos uma parte de dados em uma só janela W_x [ k- A_x, k + B_x ] atenda uma condição predefinida também aumenta. Por exemplo, uma regra é predefinida no servidor para desduplicação 103, e a regra é: para um ponto divisório potencial k, determinar 11 janelas W_x [ k- A_x, k + B_x ], onde x indica números naturais consecutivos de 1 a 11 separadamente, e a probabilidade de que pelo menos uma parte de dados em qualquer janela W_x [ k- A_x, k + B_x ] das 11 janelas

Petição 870160008725, de 11/03/2016, pág. 397/698

126/200 atenda uma condição predefinida é de 1/2. Outro grupo de regras predefinidas no servidor para desduplicação 103 é: determinar 24 janelas W_x [ k- Αχ, k+ Βχ ] para o ponto divisório potencial k, onde x indica números naturais consecutivos de 1 a 24 separadamente, e uma probabilidade de que pelo menos uma parte de dados em qualquer janela W_x [ k- A_x, k+B_x ] das 24 janelas atende a condição predefinida C_x é de 3/4. Para a definição de uma probabilidade de que pelo menos uma parte de dados em uma janela específica W_x [ ^k - Ax, k+ B_x ] atende uma condição predefinida, referência pode ser feita à descrição da parte de determinar se pelo menos uma parte de dados na janela W_x [ k- A_x, k +B_x ] atende uma condição predefinida. P(n) depende dos dois fatores, isto é, a quantidade M de janelas Wx [ k- Ax, k+ Bx ] e a probabilidade de que pelo menos uma parte de dados na janela W_x [ k- A_x, k + B_x ] atenda uma condição predefinida, e P(n) representa: uma probabilidade de que nenhum ponto divisório de corrente de dados seja encontrado após n unidades mínimas para buscar um ponto divisório de corrente de dados em uma busca a partir de uma posição inicial ou um ponto divisório de corrente de dados anterior de uma corrente de dados. Um processo de calcular P(n) que depende dos dois fatores é na verdade uma sequência Fibonacci de n etapas, que é descrita abaixo em detalhe. Após P(n) ser obtido, 1-P(n) é uma função de distribuição de um ponto divisório de corrente de dados, e (1-P(n))-(1-P(n-1))=P(n-1)-P(n) é uma probabilidade de que um ponto divisório de corrente de dados seja encontrado a uma distância de n unidades mínimas para buscar um ponto divisório de corrente de dados, isto é, uma função de densidade de um ponto divisório de

12*1024 corrente de dados. A integração nx (P(n-1)-P(n)) pode ser realizada de n 4*1024 acordo com a função de densidade de um ponto divisório de corrente de dados, de modo se a obter um comprimento esperado de um ponto divisório de corrente de dados, isto é, o tamanho da fatia comum, onde 4*1024 (bytes) representa um comprimento da fatia de dados mínima, e 12*1024 (bytes)

Petição 870160008725, de 11/03/2016, pág. 398/698

127/200 representa um comprimento da fatia de dados máxima.

[0162] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 21, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 janelas W_x[ k- A_x, k+B_x ] e uma condição predefinida C_x que corresponde à janela Wx [ k -A_x, k + B_x], onde x indica números naturais consecutivos de 1 a 11, e A_x e B_xsão números inteiros. 4=169, B_}=0; A₂=170, B₂=-1; A₃=171, B₃=-2; A₄=172, B₄=-3; A₅=173, B₅=-4; A6=174, B₆=-5; A₂=175, B7=-6; A₈=176, B₈=-7; A9 =177, B9=-8; Ajo=178, B_w=-9; A„=179, B„=-10. Ç = C2 = C₃ = C₄ = C5 = C6 = C7 = C8 =C₉=C₁₀=C₁₁. Portanto, as 11 janelas são WJk-169, k], W₂[k-170, k-1], W₃[k171, k-2], W₄[k-172, k-3], W₅[k-173, k-4], W₆[k-174, k-5], W₇[k-175, k-6], W₈ [k176, k-7], W₉[k-177, k-8], W₁₀[k-178, k-9], e W_n [k-179, k-10]. k_a é um ponto divisório de corrente de dados, e uma direção de buscar um ponto divisório de corrente de dados mostrada na Figura 21 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k,. De acordo com a regra predefinida para o servidor para desduplicação 103, uma janela Wx [ k, A_x, k, + B_x ] é determinada para o ponto divisório potencial k,, e nessa modalidade, x indica números naturais consecutivos de 1 a 11 separadamente.

Na maneira de implantação mostrada na Figura 21, 11 janelas são determinadas para o ponto divisório potencial k_i , e são W_n[ k,-169, k, ], W2[ k,

170, k_t-1], W_/3[ k,-171, k, -2], W_i4[ k,-172, k, -3], W₅[ k,-173, k, -4], W_i6[ k,-174, k, 5], W ₇[ k-175, k, -6], W.[ k,-176, k, -7], W_i9[ k,-177, k, -8], W_/w [ k,-178, k, -9], e

W-n [ k,-179, k,-10] separadamente. É determinado se pelo menos uma parte de dados em W_{1[ k, -169, k, ] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W₂[k,-170, k,-1] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W 3[k

Petição 870160008725, de 11/03/2016, pág. 399/698

128/200

171, k, -2] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W,₄[k, -172, k, -3] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W,₅[ k,-173, k, -4] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W₆[ k,-174, k, -5] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W₇ [k,-175, k, -6] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W,[ k,-176, k, -7] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W,₉[ k,-177, k, -8] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W,₁₀ [k, -178, k, -9] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W-u [k, -179, k,-10] atende a condição predefinida C_u . Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida Cj, a pelo menos uma parte de dados na janela w,₂ atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W₃ atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W₄atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W₅ atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W₆ atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W₇ atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W,₈ atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_i9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W,₁₀ atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_t11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k, é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das 11 janelas não atende a condição predefinida correspondente, por exemplo, W,₅[k, -173, k, -4] mostrada na Figura 22, N bytes são pulados a partir do ponto divisório potencial k, ao longo da direção de buscar um ponto divisório de

Petição 870160008725, de 11/03/2016, pág. 400/698

129/200 corrente de dados, onde os N bytes não são maiores que || B₅ || + max_x (|| A_x ||). Em uma maneira de implantação mostrada na Figura 22, os N bytes que são pulados não são maiores que 183 bytes, e nessa modalidade, N=7, de modo a obter um novo ponto divisório potencial. Para diferenciação do ponto divisório potencial , o novo ponto divisório potencial no presente documento é representado como k, no presente documento. De acordo com a maneira de implantação mostrada na Figura 21, uma regra é predefinida no servidor para desduplicação 103, onde a regra é: determinar uma janela W [ ^k - A, k + B, ] para o ponto divisório potencial k,, onde nessa modalidade, x indica números naturais consecutivos de 1 a 11 separadamente. Onze (11 )janelas são determinadas para o ponto divisório potencial k j , e são ,^k,-169, ^k, ], WJ2 [ k,-170, k,-1], W_J3[ k,-171, k, -2], W_]4[ kj-172, k, -3], W,A k,-173, k,-4], W,₆[k,-174, k, -5], W ₇[k,-175, k, -6], W Jk,-176, k,-7], W_y9[ k,-177, k,-8], W^ [ k,-178, k, -9], e W_y11[ k,-179, k,-10] separadamente. Conforme mostrado na Figura 22,quando a décima primeira janela W,_Ί1[k,.-179, k,-10] é determinada para o ponto divisório potencial, para assegurar que uma faixa entre o ponto divisório potencial k_t e o ponto divisório potencial k, cai completamente dentro de uma faixa de determinação, nessa maneira de implantação, pode ser assegurado que um limite à esquerda da janela W_y11[k,-179, k,-10] coincide com um limite à direita (k_t -4) da janela W_i5 [k_t -173, k_t -4], ou cai dentro de uma faixa da janela W_i5[ k_t -173, k_t -4], onde a janela W,_Ί1[ k,-179, k,-10] é uma janela colocada como a primeira em uma sequência, que é obtida de acordo com uma direção de busca de corrente de dados, das M janelas que são determinadas para o ponto divisório potencial k, de acordo com a regra. Portanto, dentro desse limite, quando pelo menos uma parte de dados na janela W_t5[k_t-173, k_t -4] não atende a condição predefinida C₅, uma distância para pular a partir do ponto divisório potencial k_t ao longo da direção de buscar um ponto divisório de corrente de dados não é maior que || B₅ || + max_x (|| A_x ||). É determinado se pelo menos uma parte de dados em W,₄[ k,-169, k, ]

Petição 870160008725, de 11/03/2016, pág. 401/698

130/200 atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W_j2[ k_j-170, k_j-1] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_j3[ k_j-171, k_j -2] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em ^Wj 4[ ^kJ 172, kj -3] atende a condição predefinida C4, é determinado se pelo menos uma parte de dados em Wj5 [ kj-173, kj -4] atende a condição predefinida C5, é determinado se pelo menos uma parte de dados em Wj6[ kj-174, kj-5] atende a condição predefinida C6, é determinado se pelo menos uma parte de dados em Wj 7[ kj-175, kj -6] atende a condição predefinida C7, é determinado se pelo menos uma parte de dados em Wj8[ kj-176, kj -7] atende a condição predefinida C8, é determinado se pelo menos uma parte de dados em Wj 9[ kj 177, kj-8] atende a condição predefinida C9, é determinado se pelo menos uma parte de dados em Wj10[ kj-178, kj -9] atende a condição predefinida C10, e é determinado se pelo menos uma parte de dados em WjU[ kj-179, kj-10] atende a condição predefinida C11. Quando é determinado que a pelo menos ^uma p^{arte de dados na janela atende a condi}ç^ão p^redefinida C^{, a} p^eto menos uma parte de dados na janela W}2 atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_j3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_j4 atende a condição predefiruda ^C., a pelo menos uma parte de dados na janela ^W„ atende a condição predefinida C5, a pelo menos uma parte de dados na janela ^Wj6 atende a condição predefinida C6, a pelo menos uma parte de dados na janela W_j7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_j8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janeta j atende a coação predefrnda C_lo ^, e a peto menos uma parte de dados na janela W_jn atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_t é um ponto divisório de corrente de dados, e dados entre k_j e k_a formam 1 (uma) fatia de dados. Entretanto, um tamanho

Petição 870160008725, de 11/03/2016, pág. 402/698

131/200 mínimo de fatia de 4 KB é pulado de uma maneira igual àquela de k_a para se obter um próximo ponto divisório potencial, e de acordo com a regra predefinida no servidor para desduplicação 103, é determinado se o próximo ponto divisório potencial é ou não um ponto divisório de corrente de dados. Quando é determinado que o ponto divisório potencial k_j não é um ponto divisório de corrente de dados, um próximo ponto divisório potencial é obtido de uma maneira igual àquela de k_i, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103 e o supracitado método, se o próximo ponto divisório potencial é um ponto divisório. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado.

[0163] Na maneira de implantação mostrada na Figura 21, de acordo com a regra predefinida no servidor para desduplicação 103, começando por determinar se a pelo menos uma parte de dados em w_ü[ ki 169, k_i ] atende a condição predefinida C₁, quando é determinada a pelo menos uma parte de dados na pelo menos uma parte de dados em W,[ ki-169, ki ], a pelo menos uma parte de dados em W_i2 [k_i-170, k_i-1], a pelo menos uma parte de dados em W_i3 [ k_t -171, k_i -2], e a pelo menos uma parte de dados em W ₄[ ki 172, k_t -3] atendem as condições predefinidas C1, C2, C3, e C4 respectivamente, e é determinado que a pelo menos uma parte de dados em W_t5[ k_i -173, k_i -4] não atende a condição predefinida C₅, 6 bytes são pulados a partir do ponto divisório potencial k_i ao longo da direção de buscar um ponto divisório de corrente de dados, e um novo ponto divisório potencial é obtido em uma posição de extremidade de um sexto byte. Para diferenciação de outros pontos divisórios potenciais, o novo ponto divisório potencial é representado como k_g no presente documento. De acordo com a regra predefinida no servidor para desduplicação 103, 11 janelas são determinadas para o ponto divisório potencial k_g, e são W_gl[k_g-169, k_g], W_g2[k_g-170, k_g-1], W._;|k_g-171,

Petição 870160008725, de 11/03/2016, pág. 403/698

132/200 k_g -2], W_g4[ k_g-172, k_g -3], W_g5[ k_g-173, k_g -4], W_g6[ k_g-174, k_g -5], W_g7[ k_g-175, k_g -6], Wg₈[ k_g-176, k_g -7], W ,| k_g-177, k_g -8], Wg₁₀[ k_g-178, k_g -9], e W_gll[ k_g 179, k_g-10] separadamente. É determinado se pelo menos uma parte de dados em W_g1[ k_g-169, k_g ] atende a condição predefinida , é determinado se pelo menos uma parte de dados em W_g2[k_g-170, k_g-1] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em Wg si kg 171, k_g -2] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_{g 4}[ k_g-172, k_g -3] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_g5[ k_g-173, k_g -4] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_g6[ k_g-174, k_g-5] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_g7[k_g-175, k_g-6] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em Wg8[kg 176, k_g -7] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_g9[k_g-177, k_g -8] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em Wg₃o[ kg-178, kg -9] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_g11[ k_g-179, k_g-10] atende uma condição predefinida C_n. A janela W_g11[k_g-179, k_g-10] coincide com a janela W_i5[k_t-173, k_t-4], e C₅ = C₁₁;

portanto, quando é determinado que a pelo menos uma parte de dados em W_i5 [k_t -173, k_t -4] não atende a condição predefinida C₅, um ponto divisório potencial k_g obtido por pular T bytes a partir do ponto divisório potencial k_t ao longo da direção de buscar um ponto divisório de corrente de dados ainda não atende a condição para servir como um ponto divisório de corrente de dados. Portanto, se existe cálculo repetido quando 6 bytes são pulados a partir do ponto divisório potencial k_t ao longo da direção de buscar um ponto divisório de corrente de dados, então o cálculo repetido pode ser reduzido e a eficiência é maior quando 7 bytes são pulados a partir do ponto divisório potencial k_t ao longo da direção de buscar um ponto divisório de corrente de dados. Portanto,

Petição 870160008725, de 11/03/2016, pág. 404/698

133/200 uma velocidade de buscar um ponto divisório de corrente de dados é aumentada. Quando em uma especificação predefinida, uma probabilidade de que pelo menos uma parte de dados na janela W_x [k- A_x, k+ B_x ] atenda a condição predefinida C_x é de 1/2, isto é, uma probabilidade de executar o pulo é de 1/2, no máximo || B_n || + || A_n || =189 bytes podem ser pulados de cada vez.

[0164] Nessa maneira de implantação, uma regra predefinida é que: 11 janelas W_x [k- A_x, k+ B_x] são determinadas para um ponto divisório potencial k e pelo menos uma parte de dados na janela W_x [k- Ax, k+ Bx ] atende uma condição predefinida C_x, onde uma probabilidade de que pelo menos uma parte de dados em W_x [k- A_x, k+ B_x ] atenda a condição predefinida C_x é de 1/2, onde x indica números naturais consecutivos de 1 a 11 separadamente, e A_x e B_x são números inteiros4=169, B,=ü; A₂=170, B₂=-1; A₃=171, B₃=-2; A₄=172, B₄=-3; A₅=173, B₅=-4; A₆=174, B₆=-5; A₇=175, B₇ =6; A₈=176, B₈=-7; A9=177, B9 =-8; A₁o=178, B_w=-9; A„=179, B„=-10. Ç = C2 = C₃=C₄=C₅=C₆=C₇=C₈=C₉=C₁₀= C₁₁. Isto é, 11 janelas são selecionadas para o ponto divisório potencial k, e as 11 janelas são consecutivas; P(n) pode ser calculada usando os dois fatores, isto é, a quantidade de janelas e a probabilidade de que pelo menos uma parte de dados na janela W_x [ p_x - A_x, p_x+ B_x ] atenda a condição predefinida C_x. Uma maneira de selecionar as 11 janelas e determinar que pelo menos uma parte de dados em cada janela das 11 janelas atende a condição predefinida C_x segue a regra predefinida no servidor para desduplicação 103, e portanto, se o ponto divisório potencial k é ou não um ponto divisório de corrente de dados depende de que ocorra que pelo menos uma parte de dados em cada janela das 11 janelas consecutivas atenda a condição predefinida C_x . Um vão entre dois bytes é denominado um ponto. P(n) representa uma probabilidade de que 11 janelas consecutivas que atendem uma condição não existam entre n janelas consecutivas, isto é, uma probabilidade de que não exista nenhum ponto divisório de corrente de dados.

Petição 870160008725, de 11/03/2016, pág. 405/698

134/200

Após um tamanho mínimo de fatia de 4 KB ser pulado a partir de um cabeçalho de arquivo/ ponto divisório prévio, um quatro centésimo octogésimo sexto ponto é encontrado retrocedendo-se 10 bytes em uma direção oposta à direção de buscar um ponto divisório de corrente de dados, e não existe nenhum ponto divisório de corrente de dados no ponto; portanto, P(4086)=1, e P(4087)=1, ..., P(4095)=1, e assim por diante. Em um quatro centésimo nonagésimo sexto ponto, isto é, um ponto que é usado para obter a fatia mínima, com uma probabilidade de (1/2)^Λ11, pelo menos uma parte de dados em cada janela das 11 janelas atende a condição predefinida C_x. Logo, com uma probabilidade de (1/2)^Λ11, um ponto divisório de corrente de dados existe; com uma probabilidade de 1-(1/2)^Λ11, não existe nenhum ponto divisório de corrente de dados; portanto Ρ(4096)=1-(1/2)^Λ11.

[0165] Em uma enésima janela, pode haver 12 casos de obter P(n) por meio de recursividade.

[0166] Caso 1: com a probabilidade de 1/2, pelo menos uma parte de dados na enésima janela não atende uma condição predefinida; nesse caso, com uma probabilidade de P(n-1), 11 janelas consecutivas não existem entre (n-1) janelas antes da enésima janela, onde pelo menos uma parte de dados em cada janela das 11 janelas consecutivas atende uma condição predefinida. Portanto, P(n) inclui 1/2*P(n-1). Um caso em que a pelo menos uma parte de

Petição 870160008725, de 11/03/2016, pág. 406/698

135/200 dados na enésima janela não atende a condição predefinida, e 11 janelas consecutivas existem entre as (n-1) janelas antes do enésimo ponto, onde pelo menos uma parte de dados em cada janela das 11 janelas consecutivas atende a condição predefinida, não é relacionado a P(n).

[0167] Caso 2: com a probabilidade de 1/2, pelo menos uma parte de dados na enésima janela atende a condição predefinida, e com a probabilidade de 1/2, pelo menos uma parte de dados em uma enésima 1(uma) janela não atende a condição predefinida; nesse caso, com a probabilidade de P(n-2), 11 janelas consecutivas não existem entre (n-2) janelas antes da enésima-1 (uma) janela, onde pelo menos uma parte de dados em cada janela das 11 janelas consecutivas atende a condição predefinida. Portanto, P(n) inclui 1/2*1/2*P(n-2). Um caso em que a pelo menos uma parte de dados na enésima janela atende a condição predefinida, a pelo menos uma parte de dados na janela do enésimo menos um ponto não atende a condição predefinida, e 11 janelas consecutivas existem entre as (n-2) janelas antes da enésima-1 (uma) janela, onde pelo menos uma parte de dados em cada janela das 11 janelas consecutivas atende a condição predefinida, não é relacionado a P(n).

[0168] De acordo com a descrição supracitada, caso 11: com uma probabilidade de (1/2)^Λ10, pelo menos uma parte de dados na enésima à enésima-9 janelas atende uma condição predefinida, e com uma probabilidade de 1/2, pelo menos uma parte de dados em uma enésimo menos 10 janela não atende uma condição predefinida; nesse caso, com a probabilidade de P(n-11), 11 janelas consecutivas não existem entre (n-11) janelas antes da enésimo menos 10 janela, onde pelo menos uma parte de dados em cada janela das 11 janelas consecutivas atende a condição predefinida. Portanto, P(n) inclui (1/2^10*1/2*P(n-11). Um caso em que a pelo menos uma parte de dados em na enésima à enésima-9 janelas atende a condição predefinida, a pelo menos uma parte de dados na enésima menos 10 janela não atende a condição

Petição 870160008725, de 11/03/2016, pág. 407/698

136/200 predefinida, e 11 janelas consecutivas existem entre as (n-11) janelas antes da enésimo menos 10 janela, onde pelo menos uma parte de dados em cada janela das 11 janelas consecutivas atende a condição predefinida, não é relacionado a P(n).

[0169] Caso 12: com uma probabilidade de (1/2)^Λ11, pelo menos uma parte de dados em enésima a (n-10) janelas atende uma condição predefinida é, e esse caso não é relacionado a P(n).

[0170] Portanto, P(n)=1/2*P(n-1)+(1/2f2*P(n-2)+...+(1/2^11*P(n11). Outra regra predefinida é: para um ponto divisório potencial k, 24 janelas W_x [ k- A_x, k + B_x] e uma condição predefinida C_x que corresponde à janela W_x[ k- A_x, k + B_x ] são determinadas, onde x indica números naturais consecutivos de 1 a 11, 4=169, 4=0; A₂=170, B₂=-1; A₃=171, B₃=-2; A₄=172, B₄=-3; A₅=173, B5=-4; A₆=174, B₆=-5; A7=175, B7=-6; A₈=176, B_s=-7; A₉=177, B₉ =-8; A10=178, B10=-9; A„=179, B„=-10, ..., e A_u =192, B24 =-23. A24=192, B24-23. C₁=C₂ =C₃=C₄=C₅=C₆=C₇=C₈=C₉=...=C₂₄. Uma probabilidade de que pelo menos uma parte de dados na janela W_x [ k- A_x, k + B_x] atenda a condição predefinida C_x é de 3/4, e P(n) pode ser calculada usando os dois fatores, isto é, a quantidade de janelas e a probabilidade de que pelo menos uma parte de dados na janela W_x [ p_x - A_x, p_x + B_x ] atenda a condição predefinida C_x.

[0171] Portanto, se o ponto divisório potencial k é um ponto divisório de corrente de dados depende de que ocorra que pelo menos uma parte de dados em cada janela das 24 janelas consecutivas atende a condição predefinida C_x, um cálculo pode ser realizado usando-se as seguintes fórmulas:

P(1)=1, P(2), ..., P(23)=1, P(24)=1-(3/4^24, e

P(n)=1/4*P(n-1)+1/4*(3/4)*P(n-2)+...+1/4*(3/4^23*P(n-24).

[0172] Após o cálculo, P(5*1024)=0,78, P(11*1024)=0,17, e P(12*1024)=0,13. Isto é, nenhum ponto divisório de corrente de dados é encontrado com uma probabilidade de 13% após se prosseguir com uma busca

Petição 870160008725, de 11/03/2016, pág. 408/698

137/200 para um ponto a uma distância de 12 KB a partir de uma posição inicial/ponto divisório de corrente de dados anterior de uma corrente de dados, e é realizada uma divisão forçada. Uma função de densidade de um ponto divisório de corrente de dados é obtida usando essa probabilidade, e após a integração, é obtido que em média, um ponto divisório de corrente de dados é encontrado após se prosseguir com uma busca para um ponto a uma distância de cerca de 7,6 KB a partir da posição inicial/ponto divisório de corrente de dados anterior da corrente de dados, isto é, uma comprimento de fatia comum é de cerca de 7,6 KB. Diferente de que pelo menos uma parte de dados em 11 janelas consecutivas atende uma condição predefinida com uma probabilidade de 1/2, um algoritmo CDC convencional pode alcançar um efeito de um comprimento de fatia comum ser de 7,6 KB apenas quando uma janela atende uma condição com uma probabilidade de 1/2^Λ12.

[0173] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 23, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 janelas W_x[ k- A_x, k+B_x ] e uma condição predefinida C_x que corresponde à janela Wx [ k -A_x, k + B_x], onde x indica números naturais consecutivos de 1 a 11, e A_x e B_xsão números inteiros. Uma probabilidade de que pelo menos uma parte de dados na janela W_x [ k- A_x, k + B_x] atenda a condição predefinida C_x é de 1/2 A =171, Bj=-2; A₂=172, B₂=-3; A₃=173, B₃=-4; A₄=174, B₄=-5; A₅=175, B₅=-6; A₆=176, B6=-7; A7=177, B7 =-8; A_s=178, B₈=-9; A₉=179, B₉=-10; 4₀=17Ü, B_w=-1; A₁₁=169, B₁₁=0. C₁=C₂ = C₃=C₄=C₅ = C₆=C₇=C₈=C₉= C₁₀= C₁₁. k_a é um ponto divisório de corrente de dados, e uma direção de buscar um ponto divisório de corrente de dados mostrada na Figura 23 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k_t. De acordo com a

Petição 870160008725, de 11/03/2016, pág. 409/698

138/200 regra predefinida no servidor para desduplicação 103, para o ponto divisório potencial ^k . ^Wx [^k - Ax, ^{k +} Bx^{] e} a condição predefinida C_x que corresponde à janela W_x [ k- A_x, k + B_x] são determinadas, onde x indica números naturais consecutivos de 1 a 11. Onze (11) janelas determinadas são W_n[ k,-171, k, -2],

Wi2[ k,-172, k, -3],

W_i3[ k,-173, k, -4], W_i4[ k,-174, k, -5], W_i5[ k, -175, k, -6], W_i6[ k,

-176, ki -7], W_/7[ ki -177, ki -8], W,_s[ ki-178, ξ. -9], Wi_g [ k_t-179, k_t-10], W_no[ k_t-170, k_t-1], e W-u [k_t-169, k, ] separadamente. É determinado se pelo menos uma parte de dados em W_{1[ k_t-171, k_t -2] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W· ₂ [ k,-172, k, -3] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_t3[k, -173, k, -4] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W,₄ [k,-174, k, -5] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em Ws [ k,-175, k, -6] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_i6[ k,-176, k, -7] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W,₇[k,-177, k, -8] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em WJ k, 178, k, -9] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_i9[k,-179, k,-10] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [k, -170, k, -1] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W-ní k,-169, k, ] atende a condição predefinida C_u. Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida C,, a pelo menos uma parte de dados na janela W_t2 atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_i3atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W· ₄ atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_i5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_i6 atende a condição predefinida C₆, a pelo menos uma

Petição 870160008725, de 11/03/2016, pág. 410/698

139/200 parte de dados na janela w.₇ atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_i8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_{t 9} atende a condição predefinida C₉, a pelo menos uma parte de dados na janela w_i10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_ni atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_t é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das 11 janelas não atende a condição predefinida correspondente, conforme mostrado na Figura 24, o fato de que a pelo menos uma parte de dados em W_i3[ p₁₃-169, p_i3] não atende a condição predefinida C₃, 11 bytes são pulados a partir de um ponto p_i3 ao longo de uma direção de buscar um ponto divisório de corrente de dados é usado como um exemplo para descrição. Conforme mostrado na Figura 24, quando é determinado que W3 não atende a condição predefinida C₃, a partir de k_t que serve como um ponto inicial, N bytes são pulados ao longo da direção de buscar um ponto divisório de corrente de dados, onde os N bytes não são maiores que || B₃ || + max_x (|| A_x ||). Nessa modalidade, N=7, e um próximo ponto divisório potencial é obtido em uma posição de extremidade de um sétimo byte. Para diferenciação do ponto divisório potencial k_i , o novo ponto divisório potencial é representado como k_j no presente documento. De acordo com a regra predefinida no servidor para desduplicação 103, para o ponto divisório potencial k_j, 11 janelas W_jx [ k_j - A_x, k_j + B_x] são determinadas, e são W_j1[ k_j-171, k_j -2], W_j2[ k_j-172, kj -3], Wj₃[ kj-173, kj -4], W_J4[ kj-174, kj -5], W_j5[ kj-175, kj-6], W_j6[ kj-176, kj 7], Wj ₇[ kj-177, kj -8], Wj₈[ kj-178, kj -9], W_j9[ kj-179, kj-10], W_fl0[ kj-170, kj 1], e W_j11[ k_j-169, k_j ] separadamente. É determinado se pelo menos uma parte de dados em W_j1[k_j-171, k_j -2] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W_j2[ k_j-172, k_j -3] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_j3[ k_j -173, k_j -4] atende a condição predefinida C₃, é determinado se pelo

Petição 870160008725, de 11/03/2016, pág. 411/698

140/200 menos uma parte de dados em W_j4[-174, kj-5] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em ^W I ^kj 175, kj -6] atende a condição predefinida C5, é determinado se pelo menos uma parte de dados em Wj6[kj-176, kj -7] atende a condição predefinida C6, é determinado se pelo menos uma parte de dados em Wj7[kj-177, kj-8] atende a condição predefinida C7, é determinado se pelo menos uma parte de dados em Wj8[ kj -178, kj -9] atende a condição predefinida C8, é determinado se pelo menos uma parte de dados em Wj9[kj-179, kj-10] atende a condição predefinida C10, é determinado se pelo menos uma parte de dados em Wjto[ kj -170, kj-1] atende a condição predefinida C10 e é determinado se pelo menos uma parte de dados em Wj11[kj-169, kj ] atende a condição predefinida C11. Certamente, nessa modalidade da presente invenção, a regra também é seguida quando é determinado se o ponto divisório potencial ka é um ponto divisório de corrente de dados, a implantação específica não é descrita novamente, e referência pode ser feita à descrição de determinação do ponto divisório potencial kt. Quando é determinado que a pelo menos uma parte de dados na janela Wj1 atende a condição predefinida Cx, a pelo menos uma parte de dados na janela W} 2 atende a condição predefinida C2, a pelo menos ^uma parte de dados na ^jane^{la W} atende a condição predefrnda C,, a pelo menos uma parte de dados na ^jane^{la W}4 atende a condução predefirida C, a pelo menos uma parte de dados na janela Wj5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_j6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_j7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_j8atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_j10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_j11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_} é um ponto divisório de corrente de dados, e os dados

Petição 870160008725, de 11/03/2016, pág. 412/698

141/200 entre k_} e k_a formam 1 (uma) fatia de dados. Entretanto, um tamanho mínimo de fatia de 4 KB é pulado de uma maneira igual àquela de k_a para se obter um próximo ponto divisório potencial, e de acordo com a regra predefinida no servidor para desduplicação 103, é determinado se o próximo ponto divisório potencial é ou não um ponto divisório de corrente de dados. Quando é determinado que o ponto divisório potencial k_} não é um ponto divisório de corrente de dados, um próximo ponto divisório potencial é obtido de uma maneira igual àquela de k_t, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103 e o método supracitado, se o próximo ponto divisório potencial é um ponto divisório de corrente de dados. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado. Certamente, a implantação do método é restringida por um comprimento da fatia de dados máxima e um tamanho de um arquivo que forma a corrente de dados, o que não é descrito novamente no presente documento.

[0174] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 25, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 janelas W_x[ k- A_x, k + B_x ] e uma condição predefinida C_x que corresponde à janela W_x [ kA_x, k+B_x ], onde x indica números naturais consecutivos de 1 a 11. . 4=166, B. =3; A₂=167, B₂ =2; A₃=168, B₃=1; A₄=169, B₄=0; A₅=170, B₅=-1; A₆=171, B₆ =2; A7=172, B7=-3; A8=173, B8=-4; A9=174, B9-5; 4,0=175, B_w=-6; A„=176, Bjj=-7. C₁=C₂= C₃=C₄ = C₅=C₆ = C₇= C₈ = C₉= C₁₀= C₁₁ e as 11 janelas são W\ [k166, k+3], W₂ [k-167, k+2], W₃ [k-168, k+1], W₄ [k-169, k], W₅ [k-170, k-1], W₆[k-171, k-2], W₇ [k-172, k-3], W₈ [k-173, k-4], W₉ [k-174, k-5], W₁₀ [k-175, k-6], e W_n [k-176, k-7] separadamente. k_a é um ponto divisório de corrente de dados, e uma direção de buscar um ponto divisório de corrente de dados

Petição 870160008725, de 11/03/2016, pág. 413/698

142/200 mostrado na Figura 25 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k,. Nessa modalidade, de acordo com a regra predefinida no servidor para desduplicação 103, para o ponto divisório potencial k,, 11 janelas W_x [k- A_x, k+ B_x ] e a condição predefinida C_x que corresponde à janela W_ix [k- A_x, k+ B_x ] são determinadas, onde x indica números naturais consecutivos de 1 a 11 separadamente. Na maneira de implantação mostrada na Figura 25, para o ponto divisório potencial k,, as 11 janelas que são determinadas W_n[k,-166, k, +3], W-₂[k,-167, k, +2], W_i3[k,-168, k_t +1], W₁₄[ k, -169, k, ], W_I5[ k,-170, k_t-1], W_i6 [ k_t-171, k_t -2], W„ [ k_t-172, k_t -3],

W8Í k, -173, k, -4], W_i9[ k, -174, k, -5], WU k,-175, k, -6], e W_ni[ k,-176, k, -7] separadamente. É determinado se pelo menos uma parte de dados em W 1[k

166, k, +3] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W_i2[k,-167, k, +2] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W,₃[ k,-168, k, +1] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em

W₄[ k,-169, k, ] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W₅[k-170, k, -1]atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W6[ k,-171, k, -2] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_i7 W_i7[k,-172, k,-3] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W,₈[k,-173, k, -4] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em

W₉ [k,-174, k, -5] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W,₁₀[ k,-175, k, -6] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_Ü1[k, -176, k, -7] atende a condição predefinida C_u. Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida

Petição 870160008725, de 11/03/2016, pág. 414/698

143/200

C₁, a pelo menos uma parte de dados na janela Wi₂ atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_i3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_t4atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W₅ atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W₆ atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_i7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W₈ atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W₉ atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_I10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_t11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_t é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das 11 janelas não atende a condição predefinida correspondente, por exemplo, W ₇[ k-172, k -3] mostrada na Figura 26, N bytes são pulados a partir do ponto divisório potencial k_t ao longo da direção de buscar um ponto divisório de corrente de dados, onde os N bytes não são maiores que || B₇ || + max_x (|| A_x ||). Em uma maneira de implantação mostrada na Figura 26, os N bytes que são pulados não são maiores que 185 bytes, e nessa modalidade, N=5, de modo a se obter um novo ponto divisório potencial. Para diferenciação do ponto divisório potencial k_t, o novo ponto divisório potencial é representado como k_jno presente documento. De acordo com a regra predefinida no servidor para desduplicação 103 na maneira de implantação mostrada na Figura 25, para o ponto divisório potencial k_j, 11 janelas são determinadas, e são Wj1[ kj-166, kj +3], Wj₂[ kj-167, kj +2], Wj₃[ kj-168, k_} +1], Wj4[ kj-169, kj ], W_j5[ k_}-170, k_} 1], Wj6[ kj-171, kj -2], Wj₇[ kj-172, kj -3], Wj.[ kj-173, kj -4], Wft kj-174, kj-5], W_j10[k_j-175, k_j -6], e W_j11[k_j-176, k_j -7] separadamente. É determinado se pelo menos uma parte de dados em W_j1[ k_j-166, k_j +3] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em Wj₂[ k₂

Petição 870160008725, de 11/03/2016, pág. 415/698

144/200

167, kj +2] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_j3[ k_j-168, k_j +1] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_{j 4}[ k_j-169, k_j ] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_j5[k_j-170, k_j-1] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[k_j-171, k_j-2] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em Wj₇[ kj 172, k_j -3] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[k_j-173, k_j-4] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_j9[ k_j-174, k_j-5] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[ k_j-175, k_j -6] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_j11[ k_j-176, k_j -7] atende a condição predefinida C₁₁. Certamente, nessa modalidade da presente invenção, a regra também é seguida quando é determinado se o ponto divisório potencial k_a é um ponto divisório de corrente de dados, a implantação específica não é descrita novamente, e referência pode ser feita à descrição de determinação do ponto divisório potencial k_t. Quando é determinado que a pelo menos uma p^{arte de dados na janela} Wfl ^{atende a condi}ç^ão p^redefinida C^{, a} p^e^ ^{menos uma} p^{arte de dados na janela} Wj2 ^{atende a condi}ç^ão p^{redefinida C}2 ^{, a} p^e^ menos uma parte de dados na janela Wj3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_j4 atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_j5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_j6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_j7atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_j8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_j10 atende a condição predefinida C₁₀, e a pelo menos uma

Petição 870160008725, de 11/03/2016, pág. 416/698

145/200 parte de dados na janela W_jU atende a condição predefinida C„, o ponto divisório potencial corrente é um ponto divisório de corrente de dados, e os dados entre k_} e k_a formam 1 (uma) fatia de dados. Entretanto, um tamanho mínimo de fatia de 4 KB é pulado de uma maneira igual àquela de k_a para se obter um próximo ponto divisório potencial, e de acordo com a regra predefinida no servidor para desduplicação 103, é determinado se o próximo ponto divisório potencial é um ponto divisório. Quando é determinado que o ponto divisório potencial kj não é um ponto divisório de corrente de dados, um próximo ponto divisório potencial é obtido de uma maneira igual àquela de k_t, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103 e o supracitado método, se o próximo ponto divisório potencial é um ponto divisório. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado.

[0175] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 27, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 janelas W_x[k- A_x, k+ B_x ] e uma condição predefinida C_x que corresponde à janela W_x [kA, k+ B_x ], onde x indica números naturais consecutivos de 1 a 11. 4=169, B. =0; A₂=170, B₂=-1; A₃=171, B₃=-2; A₄=172, B₄=-3; A₅=173, B₅=-4; A6=174, B6 =-5; A7=175, B7 =-6; A₈=176, B_s=-7; A9=177, B9 =-8; A,o=168, B_w=1; A„=179, B₁₁=3. C₁=C₂ =C₃=C₄ = C₅=C₆ = C₇= C₈ = C₉= C₁₀áC₁₁, e 11 janelas são are W\ [k169, k], W₂[k-170, k-1], W₃[k-171, k-2], W₄[k-172, k-3], W₅[k-173, k-4], W₆[k-174, k-5], W₇[k-175, k-6], W₈[k-176, k-7], W₉[k-177, k-8], W₁₀[k-168, k+1], e W_n [k179, k+3] separadamente. k_a é um ponto divisório de corrente de dados, e uma direção de buscar um ponto divisório de corrente de dados mostrado na Figura 27 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser

Petição 870160008725, de 11/03/2016, pág. 417/698

146/200 pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k_t. Nessa modalidade, de acordo com a regra predefinida no servidor para desduplicação 103, para o ponto divisório potencial k_i, uma janela W_ix [k_t - A_x, k_i + B_x ] é determinada, onde x indica números naturais consecutivos de 1 a 11 separadamente. Na maneira de implantação mostrada na Figura 27, para o ponto divisório potencial k_i, 11 janelas que são determinadas são W_n[ k_t-169, k_t ], W_{t 2}[ k_t-170, k_t-1], W_i3[ k_t-171, k_t -2], W_i4[ k_i

172, k_t -3], WAki-173, k_t -4], W_i6 [ k_t-174, k_t -5], W_t7(k_t-175, k_t -6], ^₈[ k_t-176, k_t 7], W_i9[ k_i-177, k_i -8], W_i10 [ k_t-168, k_t +1], e W_in[ k_t-179, k_t +3] separadamente. É determinado se pelo menos uma parte de dados em W_i.₁[k_i-169, k_i ] atende a condição predefinida C_x, é determinado se pelo menos uma parte de dados em W₂[k_t-170, k_t-1] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W_i3 [ k_i -171, k_i -2] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_i4[ ki-172, ki -3] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_i5[ k_i-173, k_i -4] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_i6[ k_i-174, k_i -5] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W₇[ ki 175, k_i -6] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_i8[ k_t-176, k_i -7] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_i9 [k_i-177, k_i -8] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [k_t-168, k_t +1] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W-ník_i-179, k_i +3] atende a condição predefinida C₁₁. Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida C_x, a pelo menos uma parte de dados na janela W_t2 atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W ₃ atende a condição predefinida C₃, a pelo menos

Petição 870160008725, de 11/03/2016, pág. 418/698

147/200 uma parte de dados na janela Wi₄ atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_i5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_i6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_i7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_i8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_i9atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_i10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_Ü1 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_i é um ponto divisório de corrente de dados. Quando é determinado que a pelo menos uma parte de dados na janela W_Ü1 não atende a condição predefinida C_u, 1 byte é pulado a partir do ponto divisório potencial k, ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter um novo ponto divisório potencial. Para diferenciação do ponto divisório potencial k_i, o novo ponto divisório potencial é representado como k_j no presente documento. Quando a pelo menos uma parte de dados em qualquer janela das 10 janelas W_a, W_t2, W_I3, W_t4,

W,9^{, e} W_ao ^não atende a condição predefinida correspondente, por exemplo, W-4Í k,-172, k, -3] mostrada na Figura 28, N bytes são pulados a partir do ponto k_t ao longo da direção de buscar um ponto divisório de corrente de dados, onde os N bytes não são maiores que || B₄ || + max_x(|| A_x ||). Em uma maneira de implantação mostrada na Figura 28, os N bytes que são pulados não são maiores que 182 bytes, e nessa modalidade, N=6, de modo a obter um novo ponto divisório potencial. Para diferenciação do ponto divisório potencial k_i o novo ponto divisório potencial é representado como k_j no presente documento. De acordo com a regra predefinida no servidor para desduplicação 103 na maneira de implantação mostrada na Figura 27, janelas determinado para o ponto divisório potencial k_j são W_J3[ kj-169, kj ], Wj2[ kj-170, kj-1], Wj3[ kj-171, kj -2], W_]4[ kj -172, kj -3], Wj5[ kj-173, kj -4], W_J6[ kj-174, kj -5], W_y7[ kj-175, kj-6], kj Petição 870160008725, de 11/03/2016, pág. 419/698

148/200

176, kj -7], W_J9[ kj-177, kj -8], W_J1O[ k_}-168, k_} +1], e W_jn[ kj-179, kj +3] separadamente. É determinado se pelo menos uma parte de dados em j ^kj -169, kj ] atende a condição predefinida Cx, é determinado se pelo menos uma parte de dados em Wj2[kj-170, kj-1] atende a condição predefinida C2, é determinado se pelo menos uma parte de dados em Wj3[ kj-171, kj -2] atende a condição predefinida C3, é determinado se pelo menos uma parte de dados em Wj 4[ kj-172, kj -3] atende a condição predefinida C4, é determinado se pelo menos uma parte de dados em Wj5[kj-173, kj-4] atende a condição predefinida C5, é determinado se pelo menos uma parte de dados em j ^kj 174, kj-5] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_j7[ k_j-175, k_j -6] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[ k_j-176, k_j -7]] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_j9[ k_j-177, k_j -8] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[k_j-168, k_j +1] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_jU[k_j-179, k_j +3] atende a condição predefinida C₁₁. Certamente, nessa modalidade da presente invenção, a regra também é seguida quando é determinado se o ponto divisório potencial k_a é um ponto divisório de corrente de dados, a implantação específica não é descrita novamente, e referência pode ser feita à descrição de determinação do ponto divisório potencial k_t. Quando é determinado que a pelo menos uma parte de dados na janela ^Wj1 atende a condição predefinida Cx, a pelo menos uma parte de dados na janela Wj2 atende a condição predefinida C2, a pelo menos uma parte de dados na janela Wj3 atende a condição predefinida C3, a pelo menos uma parte de dados na janela Wj4 atende a condição predefinida C4, a pelo menos uma parte ^de dados na janela ^W,s atende a concisão predefinida ^C , a pelo menos uma parte de ^dados na Janela atentte a condão preteMda C^, a peto menos uma parte de dados na janela W_j7 atende a condição predefinida C₇, a

Petição 870160008725, de 11/03/2016, pág. 420/698

149/200 pelo menos uma parte de dados na janela W_j8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_j10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela ^Watende a condição predefinida C₁₁, o ponto divisório potencial corrente é um ponto divisório de corrente de dados, e os dados entre k_} e k_a formam 1 (uma) fatia de dados. Entretanto, um tamanho mínimo de fatia de 4 KB é pulado de uma maneira igual àquela de k_a para se obter um próximo ponto divisório potencial, e de acordo com a regra predefinida no servidor para desduplicação 103, é determinado se o próximo ponto divisório potencial é ou não um ponto divisório. Quando é determinado que o ponto divisório potencial kj não é um ponto divisório de corrente de dados, um próximo ponto divisório potencial é obtido de uma maneira igual àquela de k_t, e é determinado, de acordo com a regra predefinida no servidor para desduplicação 103 e o supracitado método, se o próximo ponto divisório potencial é ou não um ponto divisório. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado.

[0176] Com base na busca de um ponto divisório de corrente de dados mostrado na Figura 3, em uma maneira de implantação mostrada na Figura 29, uma regra é predefinida em um servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar 11 janelas W_x[ P_x - Ac, P_x+B_x ] e uma condição predefinida C_x que corresponde à janela W_x[ P_x --A-, p_x+B_x], onde x indica números naturais consecutivos de 1 a 11 separadamente, onde uma probabilidade de que pelo menos uma parte de dados na janela W_x [ p_x - A_x, p_x+B_x ] atenda uma condição predefinida é de 1/2.

A=169, B,=0; A₂=171, B₂ =-2; A₃=173, B₃=-4; A₄=175, B₄=-6; A₅=177, B₅=-8;

A₆=179, B6=-10; A₇=181, B₇=-12; A8=183, B8=-14; A9=185, B9-16; A_w=187,

B₁₀=-18; A₁₁=189, B₁₁=-20. C_x=C₂ = C₃=C₄=C₅=C₆ = C₇= C₈ = C₉= C₁₀= C_n, e as 11

Petição 870160008725, de 11/03/2016, pág. 421/698

150/200 janelas são WJk-169, k], W₂[k-171, k-2], W₃[k-173, k-4], W₄[k-175, k-6], W₅ [k177, k-8], W₆[k-179, k-10], W₇[k-181, k-12], W₈[k-183, k-14], W₉[k-185, k-16], W₁₀[k-187, k-18], e w₁₁[k-189, k-20] separadamente. k_a é um ponto divisório de corrente de dados, e uma direção de buscar um ponto divisório de corrente de dados mostrada na Figura 29 é da esquerda para a direita. Após uma fatia de dados mínima de 4 KB ser pulada a partir do ponto divisório de corrente de dados k_a, uma posição de extremidade da fatia de dados mínima de 4 KB serve como um próximo ponto divisório potencial k., e um ponto p_ix é determinado para o ponto divisório potencial k.. Nessa modalidade, de acordo com a regra predefinida no servidor para desduplicação 103, x indica números naturais consecutivos de 1 a 11 separadamente. Na maneira de implantação mostrada na Figura 29, de acordo com a regra predefinida, 11 janelas determinadas para o ponto divisório potencial k. são W_n[ k.-169, k. ], W 2[ ki

171, ki -2], W_/3[ ki-173, k. -4], W_i4[ k_t-175, k_t -6], W₅[ k_t-177, k_t -8], W_i6 [ k_t-179, k_t 10], W₇[ki-181, k_t-12], W_i3[ki-183, k-14], W_i9 [k_t-185, k_t-16], W_ii0[ki-187, k

18], e W-n[k_i -189, k_t -20] separadamente. É determinado se pelo menos uma parte de dados em W_i1[k_t-169, k_t ] atende a condição predefinida C, é determinado se pelo menos uma parte de dados em W₂ [k.-171, k. -2] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W.₃[k. -173, k. -4] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W.₄ [k.-175, k. -6]atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em Ws [ ki-177, ki -8] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W.₆ [k_t-179, k_t-10] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_i7 [k.-181, k.-12] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em WJ k. 183, k_t-14] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_t9 [k.-185, k.-16] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [k. -187, k.-18] atende

Petição 870160008725, de 11/03/2016, pág. 422/698

151/200 a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_ni[ k_t-189, k_t -20] atende a condição predefinida C₁₁. Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida C_}, a pelo menos uma parte de dados na janela W_t2atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_i3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W₄ atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_i5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W₆ atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_i7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W₈ atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W₉ atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_no atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_t11 atende a condição predefinida C_u, o ponto divisório potencial corrente k, é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das 11 janelas não atende a condição predefinida correspondente, por exemplo, conforme mostrado na Figura 30, a pelo menos uma parte de dados em W₄[k-175, k_t -6] não atende a condição predefinida C₄, um próximo ponto divisório potencial é selecionado. Para diferenciação do ponto divisório potencial k , o próximo ponto divisório potencial é representado como k_j no presente documento, onde k_j está localizado à direita de k_t, e uma distância entre k_j e k_t é de 1 byte. Conforme mostrado na Figura 30, de acordo com a regra predefinida para o servidor para desduplicação 103, para o ponto divisório potencial k_j, 11 janelas são determinadas, e são Wj1[ kj-169, kj ], Wj2[ kj-171, kj -2], Wj₃[ kj-173, kj -4], kj-175, kj -6], W_y5[ kj-177, kj 8], Wj6[kj-179, kj-10], Wj₇[kj-181, kj-12], W_y8[kj-183, kj-14], W_y9[kj-185, kj 16], W_j10[k_j-187, k_j-18], e W_j11[k_j-k_j 189, k_j-20] separadamente, onde C_}=C₂=C₃=C₄= C₅=C₆=C₇=C₈=C₉= C₁₀= Cjj. É determinado se pelo menos uma parte

Petição 870160008725, de 11/03/2016, pág. 423/698

152/200 de dados em W_jl[kj-169, kj ] atende a condição predefinida C₁, é determinado se pelo menos uma parte de dados em W_j2[k_j-171, k_j-2] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W₇₃[ kj 173, kj -4 atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_j4[k_j-175, k_j-6] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_j5[ k_j-177, k_j-8] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[ k_j-179, k_j-10] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_j7[k_j-181, k_j-12]atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em Wj8[ kj 183, k_j-14] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_j9[ k_j-185, k_j-16] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em Wj₁o[ kj -187, kj-18] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_j11[ k_j-189, k_j -20] atende a condição predefinida C₁₁. Quando é determinado que a pelo menos uma parte de dados na janela W_]X atende a condição predefinida C_x, a pelo menos uma parte de dados na janela W_j2atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_j3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_}4 atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_j5 atende a condição predefinida C₅, a pelo menos uma parte ^de dados na janela ^W atende a concisão predefinida ^C, a pelo menos uma parte de ^dados na Janela ^W atentte a condão predeMda f,, a peto menos uma parte de dados na janela W_j8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_j9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_j10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_jU atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_j é um ponto divisório de corrente de dados, e os dados entre k_j e k_a formam 1 (uma) fatia

Petição 870160008725, de 11/03/2016, pág. 424/698

153/200 de dados. Quando é determinado que a pelo menos uma parte de dados em qualquer janela das janelas W_}1, W_}2, W_j3, W_}4, W_j5, W_j6, W_P, W_j8, W_j9, W_J10, e W_jU não atende uma condição predefinida, por exemplo, conforme mostrado na Figura 31, quando a pelo menos uma parte de dados em W_J3[ kj-173, kj -4] não atende a condição predefinida C₃, k_j está localizado à direita de k_t e N bytes são pulados a partir de k_t ao longo da direção de buscar um ponto divisório de corrente de dados, onde os N bytes não são maiores que || B₄ || + max_x(|| A_x ||). Na maneira de implantação mostrada na Figura 28, os N bytes não são maiores que 195 bytes, e nessa modalidade, N=15, de modo a obter um próximo ponto divisório potencial. Para diferenciação dos pontos divisórios potenciais k_t e k_j, o próximo ponto divisório potencial é representado como k_t.

De acordo com a regra predefinida para o servidor para desduplicação 103 na maneira de implantação na Figura 29, para o ponto divisório potencial k_t, 11 janelas são determinadas, e são W_n[ k,-169, k, ], W, 2[ k,-171, k, -2], W_n[ k,-173, k_l -4], W_l4[ k,-175, k, -6], W_l5[ k_t-177, k_t -8], W_l6[ k_t-179, k_t-10], W_l7[ k_t-181, k_t

12], W_l8[k,-183, k,-14], W_w[k,-185, k,-16], W_no[k,-187, k,-18], e W_m[k_t-189, k,

-20] separadamente. É determinado se pelo menos uma parte de dados em W_n[k_t-169, k_t] atende a condição predefinida C_x, é determinado se pelo menos uma parte de dados em W_t2 [k_t-171, k, -2]atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em W,3[ k_t-173, k_t -4] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W,₄[k,-175, k,-6]atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_l5[k_t-177, k_t-8] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W, 6[ k, 179, k_t-10] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W,₇ [ k_i-181, k_i-12] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W,₈ [k_i-183, k_i-14] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_t9 [k_i-185, k_i-16] atende a condição predefinida C₉, é determinado se pelo

Petição 870160008725, de 11/03/2016, pág. 425/698

154/200 menos uma parte de dados em W_l10[k_l-187, k_l-18] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em [ k_l-189, k_l -20] atende a condição predefinida C₁₁. Quando é determinado que a pelo menos uma parte de dados na janela W_n atende a condição predefinida C₁, a pelo menos uma parte de dados na janela W_l2 atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_l3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_l4atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_{l 5} atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_l6 atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_l7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_l8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_l9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_l10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_l11 atende a condição predefinida C₁₁, o ponto divisório potencial corrente k_l é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela das janelas W„, W_l2, W_l3, W_l4, W_l5, W_l6, W_l7, W_K, W_l9, W_lw, e W_ln não atende uma condição predefinida, um próximo ponto divisório potencial é selecionado. Para diferenciação dos pontos divisórios potenciais k_t, k_}, e k_l, o próximo ponto divisório potencial é representado como k_m, onde k_m está localizado à direita de k_l, e uma distância entre k_m e k_l é de 1 byte. De acordo com a regra predefinida para o servidor para desduplicação 103 na modalidade mostrada na Figura 29, 11 janelas determinadas para o ponto divisório potencial k_m são Wm1[ km -169, km ], [ km-171, km -2], W^ km-173, km -4], ' km-175, km -6],

Wm5[ km -177, km -8], W km -179, km-10], W \ k_m-181, km-12], W,_s[ km-183, km -14], W | km-185, km-16], W_wW[ km-187, km-18], 6 W„11[ km-189, km -20] separadamente. É determinado se pelo menos uma parte de dados em W_m1[k_m -169, k_m ] atende a condição predefinida C₁, é determinado se pelo menos

Petição 870160008725, de 11/03/2016, pág. 426/698

155/200 uma parte de dados em W_m2 [k_m -171, k_m -2] atende a condição predefinida C₂, é determinado se pelo menos uma parte de dados em Wm₃[ km -173, km -4] atende a condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_m4 [k_m -175, k_m -6] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_m5[ k_m-177, k_m -8] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em Wm6[ km 179, k_m -10] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_m7 [ k_m -181, k_m -12] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em Wm8[ km -183, km-14] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_m9 [k_m-185, k_m-16]atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em Wm,o[ km -187, km -18] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_m11[ k_m -189, k_m -20] atende a condição predefinida C_n. Quando é determinado que a pelo menos uma parte de dados na janela W_m1 atende a condição predefinida C_x, a pelo menos uma parte de dados na janela W_m2atende a condição predefinida C₂, a pelo menos uma parte de dados na janela W_m3 atende a condição predefinida C₃, a pelo menos uma parte de dados na janela W_m4 atende a condição predefinida C₄, a pelo menos uma parte de dados na janela W_m5 atende a condição predefinida C₅, a pelo menos uma parte de dados na janela W_{m 6} atende a condição predefinida C₆, a pelo menos uma parte de dados na janela W_m7 atende a condição predefinida C₇, a pelo menos uma parte de dados na janela W_m8 atende a condição predefinida C₈, a pelo menos uma parte de dados na janela W_m9 atende a condição predefinida C₉, a pelo menos uma parte de dados na janela W_m10 atende a condição predefinida C₁₀, e a pelo menos uma parte de dados na janela W_m11 atende a condição predefinida C_xx, o ponto divisório potencial corrente k_m é um ponto divisório de corrente de dados. Quando a pelo menos uma parte de dados em qualquer janela não atende a condição predefinida, o pulo é executado de

Petição 870160008725, de 11/03/2016, pág. 427/698

156/200 acordo com a solução descrita acima para se obter um próximo ponto divisório potencial, e é determinado se o próximo ponto divisório potencial é ou não um ponto divisório.

[0177] Uma modalidade da presente invenção fornece um método para determinar se pelo menos uma parte de dados em uma janela W_lz [ k_t - A, k + B_z ] atende uma condição predefinida C_z. Nessa modalidade, é determinado, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [ k_l - A_z, k_l + B_z ] atende a condição predefinida C_z, e a maneira de implantação mostrada na Figura 21 é usada como um exemplo. De acordo com uma regra predefinida em um servidor para desduplicação 103, uma janela W_n [k_t -169, k_t ] é determinada para um ponto divisório potencial k_t, e é determinado se pelo menos uma parte de dados em W_i1 [ k_t-169, k_t ] atende uma condição predefinida C₁. Conforme mostrado na Figura 32, W_n representa a janela W_n [k_t-169, k_t ], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [k_t -169, k_t ] atende a condição predefinida C₁. Na Figura 32, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os 5 bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Cada um desses bytes é formado por 8 bits, que são indicados por a_m1, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos 255 bytes, e, portanto, bits que correspondem aos 255 bytes podem '1,8 ^a2,8 ser representados como:

' ^a11 ^a2,1 ^a1,2 ^a2,2

a.

, ^onde q^uando amn =^1, V_amn ’ ’ ’ ^a255,8 y representa qualquer um dentre a_m1, ..., e a_m8, e uma matriz V_a é obtida de acordo com uma relação de conversão ^a255,2 ^a255,1 =1, e quando a =, V =-1, onde a ’ ~ m,n ’ am,n ’ m ,n entre a e V m ,n am,n a partir dos bits que correspondem aos 255 bytes, e pode ser

Petição 870160008725, de 11/03/2016, pág. 428/698

157/200 (

representada como:	^F a1,1 V_a 2,1	a1,2 V ₂₂ · a2,2	^v a1,8 V ^v a 2,8
	V V a 255,1	V a255,2	.. V ^v a 255,8 J

Uma grande quantidade de números aleatórios é selecionada para formar uma matriz. Uma vez formada, a matriz formada pelos números aleatórios permanece inalterada. Por exemplo, 255*8 números aleatórios são selecionados a partir de números aleatórios que seguem uma distribuição específica (a distribuição normal é usada como um exemplo no presente documento) para formar uma matriz R:

	^h1,2	h18 Ί
^h2,1	^h2,2	_h ^ri2,8

h h

V 255,1 255,2 h

255,8 J onde números aleatórios de uma emésima linha da matriz V_a e de uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado ^{como S}am - ^Vam,i* ^hm,1 ^{+ V}am,2* ^hm,2⁺-'^{+ V}am ,8* ^hm ,8' ^S a1 ’ ^Sa 2’ e S ₂₅₅ são a 255 obtidos de acordo com o método, e uma quantidade K de valores que atendem uma condição específica (ser maior que 0 é usado como um exemplo no presente documento) entre S_a1, S_a2, ...,..., e S_a255 é contada. Uma vez que a matriz R segue uma distribuição normal, S_am ainda segue uma distribuição normal assim como a matriz R. De acordo com uma teoria da probabilidade, uma probabilidade de que um número aleatório em distribuição normal seja maior que 0 é de 1/2; uma probabilidade de que cada valor entre S_a1, S_a2, ...,..., e S_a255 seja maior que 0 é de 1/2, e portanto, K atende a distribuição binomial:

P(k = n) = C^C¹)ⁿ (¹) = c (¹) ²⁵⁵ 2 2 ²⁵⁵ 2

De acordo com um resultado de contagem, é determinado se a quantidade K de valores maiores que 0 entre S_a1, S_a2, ...,..., e S_a255 é um número par; uma probabilidade de que um número aleatório em distribuição binomial seja um número par é de 1/2, e portanto, K atende uma condição com uma probabilidade de 1/2. Quando K é um número par, isso indica que a pelo menos uma parte de dados em ^1[ ki-169,

Petição 870160008725, de 11/03/2016, pág. 429/698

158/200

Ã/Jatende a condição predefinida A. Quando Ké um número ímpar, isso indica que a pelo menos uma parte de dados em YJ^-169, A/Jnão atende a condição predefinida Q. Ç no presente documento significa que a quantidade K, que é obtida de acordo com a maneira supracitada, de valores maiores que 0 entre S_al, S_a2, e S_a255 é um número par. Na maneira de implantação mostrada na Figura 21, para [ξ-169, ξ], W_i2 [ξ-170, ξ-l], W^A-171, A2], YJY172, k,-3], ^AA-173, k,-4], W₁₆ [£,-174, k_t-5], W_i7 [£,-175, k_t-6], W_iS[ξ-176, k_t-7], W_t9[k_t-177, k_t-8], W_tW[k_t-178, k_t-9], e ^[£,-179, £,-10], as janelas são de tamanho igual, isto é, todas as janelas têm um tamanho de 169 bytes, e entretanto, maneiras de determinar se pelo menos uma parte de dados em uma janela atende uma condição predefinida são também as mesmas. Quanto a detalhes, fazer referência à descrição supracitada de determinar se a pelo menos uma parte de dados em ^[£,-169, £,] atende a condição predefinida CA Portanto, conforme mostrado na Figura 32, representa 1 byte selecionado quando é determinado se pelo menos uma parte de dados na janela W_j2 [//,-170, £,-l] atende uma condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Cada um desses bytes é formado por8 bits, que são indicados como b_ml,e b_mg, representando do primeiro bit ao oitavo bit de um emésimo byte nos 255 bytes, e portanto, bits que correspondem

	Ã,2
^k2,l	^2,2

255,2 aos

255 bytes %

, onde quando podem ser representados como:

b_m,_n =1, A_m,_n =1, θ quando =0, V_bm,_n =-

255,1

1, onde b_mn representa qualquer um dentre b_ml, e b_m8, e uma matriz JA é obtida de acordo com uma relação de conversão entre b_mn e V_bmn a partir dos bits que correspondem aos 255 bytes, e pode ser representada como:

Petição 870160008725, de 11/03/2016, pág. 430/698

159/200 %

^rb1,1	b1,2	^rb1,8
Vb21	Vb2,2 .	. Vb2,8
_b ^Vb 255,1	^Vb 255,2 .	. ^Vb255,8

. Uma maneira de determinar se pelo menos uma parte de dados em W_n [k_t-169, k_t ] atende uma condição predefinida é igual a uma maneira de determinar se pelo menos uma parte de dados na janela W_{t 2} [k_t -170, k_t -1] atende uma condição predefinida; portanto a matriz R é usada: ' h_u ^h2,1 ^h1,2 ^h2,2 h

V 255,1 h

255,2 h

255,8 / , e números aleatórios de uma emésima linha da matriz da emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como

S = V * h + V * h + + V * h bm ^y bm,1 m,1 ^y bm,2 m,2 ^y bm,8 m,8 '

Sb1, Sb2, ..., e Sb255 são obtidos de acordo com o método, e uma quantidade K de valores que atendem uma condição específica (ser maior que 0 é usado como um exemplo no presente documento) entre S_b1, S_b2, ..., e S_b255 é contada. Uma vez que a matriz R segue uma distribuição normal, S_bm ainda segue uma distribuição normal assim como a matriz R. De acordo com a teoria da probabilidade, a probabilidade de que um número aleatório em distribuição normal seja maior que 0 é de 1/2; uma probabilidade de que cada valor entre S_b1, S_b2, ..., e S_b255 seja maior que 0 é de

1/2, portanto, K atende

P(k = n) = C.. (')ⁿ (J = c Λ ²⁵⁵ 2 2 ²⁵⁵ 2 . D_e acordo distribuição binomial: com um resultado de contagem, é determinado se a quantidade K de valores maiores que 0 entre

S_b1, S_b2, ..., e S_b255 é um número par; a probabilidade de que um número aleatório em distribuição binomial seja um número par é de 1/2, e, portanto, K atende uma condição com uma probabilidade de 1/2. Quando K é um número par, isso indica que a pelo menos uma parte de dados em W ₂[ k_t-170, k_t-1] atende a condição predefinida C₂. Quando K é um número ímpar, isso indica que a pelo menos uma parte de dados em W_t2[ k_t-170, k_t-1] não atende a

Petição 870160008725, de 11/03/2016, pág. 431/698

160/200 condição predefinida C₂. C₂ no presente documento significa que a quantidade K, que é obtida de acordo com a maneira supracitada, de valores maiores que 0 entre s_bl, S_b2, e s_b255 é um número par. Na maneira de implantação mostrada na Figura 3, a pelo menos uma parte de dados em £,-i] atende a condição predefinida C₂.

[0178] Portanto, conforme mostrado na Figura 32, representa 1 byte selecionado quando é determinado se pelo menos uma parte de dados na janela W_i3 [k_t -171, £,-2]atende uma condição predefinida C₃, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Então, o método para determinar se pelo menos uma parte de dados nas janelas W_n [£,-169, £,] e W_i2 [£,-170, £,-l] atende uma condição predefinida é usado para determinar se pelo menos dados em W_i3 [£,-171, k_t-2\ atendem a condição predefinida C₃. Na maneira de implantação mostrada na Figura 21, a pelo menos uma parte de dados em W_i3\k_rVA, k_t-2\ atende a condição predefinida. Conforme mostrado na Figura 32, representa 1 byte selecionado quando é determinado se pelo menos uma parte de dados na janela W_i4 [£,-172, k_t-3] atende uma condição predefinida C₄, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Então, o método para determinar se pelo menos uma parte de dados nas janelas ^[ξ-169, ξ], W_i2[£,-170, £,-l], e W_j3 [£,-171, £,-2] atende uma condição predefinida é usado para determinar se a pelo menos uma parte de dados em ^₄[£,-172, £,-3] atende a condição predefinida C₄. Na maneira de implantação mostrada na Figura 21, a pelo menos uma parte de dados em ^.₄[£,.-172, £,-3] atende a condição predefinida C₄. Conforme mostrado na Figura 32, EBI representa 1 byte selecionado quando é determinado se pelo menos uma parte de dados na janela W_i5[£,-173, £,-4] atende uma condição predefinida C₅, e há 42 bytes

Petição 870160008725, de 11/03/2016, pág. 432/698

161/200 entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Então, o método para determinar se pelo menos uma parte de dados nas janelas W_n[ ki-169, ki ], Wi ₂[ ki-170, ki-1], W_t3[ k_t -171, k_t -2], e W_t4 [ k_t-172, k_i -3] atende uma condição predefinida é usado para determinar se pelo menos uma parte de dados em Wi₅[ ki-173, ki -4] atende a condição predefinida C₅. Na maneira de implantação mostrada na Figura 21, a pelo menos uma parte de dados em W_i5[ k_i-173, k_i -4] não atende a condição predefinida C₅.

[0179] Quando a pelo menos uma parte de dados em Wi5[ ki-173, k_i -4] não atende a condição predefinida C₅, 7 bytes são pulados a partir de um ponto Pi ₅ ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um próximo ponto divisório potencial k_j é obtido em uma posição de extremidade de um sétimo byte. Conforme mostrado na Figura 22, de acordo com a regra predefinida para o servidor para desduplicação 103, uma janela W_j1[ k_j-169, k_j ] é determinada para o ponto divisório potencial k_j. Uma maneira de determinar se pelo menos uma parte de dados na janela ^WJ1[ ^kj 169, kj ] atende a condição predefinida C, é a mesma maneira de determinar se pelo menos uma parte de dados na janela Wj1[ kj-169, kj ] atende a condição predefinida C}. Portanto, conforme mostrado na Figura 33, ^WJ1 representa uma janela, e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados na janela atende a condição predefinida Cx. Na Figura 33, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os 5 bytes de dados selecionados são usados repetidamente 51 vezes para obter 255 bytes no total, de modo a aumentar a aleatoriedade. Cada um desses bytes é formado por 8 bits, que são indicados como a_m1', ..., e a_m8', representando do primeiro bit ao oitavo bit de um emésimo byte nos 255 bytes, e, portanto, bits que correspondem aos 255 bytes

Petição 870160008725, de 11/03/2016, pág. 433/698

162/200 podem ser representados como:

C a ¹ ^u1,1 a ¹ u 2,1 ^a1,2' ^a2,2 ^a1,8 ^a2,8' , onde quando a_mn' =1 ^V '=^{1, e} q^uando ^dentre V^, ...^{, e} a_mf ^, a '

V⁴ 255,1 amn' =^{0, V}am,n' =-^{1, onde} e uma matriz V_a' é obtida de acordo com uma relação a ' ^u255,2 a

m,n a ' ^u255,8 J ' representa qualquer um de conversão entre a m,n ' e V_amn' a partir dos bits que correspondem aos 255 bytes, e pode ser representada como:

C v ' ^v a1,1

V ’ ^v a2,1

V ’ a1,2

V ’ a2,2

V ’ ^v a1,8

V ’ a2,8

V ’

V a255,1

V ' a255,2 maneira de determinar se pelo menos uma parte de dados na janela atende h, i h

2,8 uma condição predefinida é igual a uma maneira de determinar se pelo menos uma parte de dados na janela w„[ k,-169, h_u ^h2,1 k, ] atende uma condição ^h1,2 ^h2,2 h

V ^Z255,1 h

255,2 h

^rí255,8 J , e números predefinida. Portanto, a matriz R é usada:

aleatórios de uma emésima linha da matriz V_a' e da emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é ^esp^{ecificamente re}p^{resentado como} Sam ’ = ^Vam,1' * ^hm,1 ^{+ V}am,2' * ^hm,2⁺-⁺ Krnf * ^hm.8^.Sa1', S_a2',e S_a255' são obtidos de acordo com o método, e uma quantidade K de valores que atendem uma condição específica (ser maior que 0 é usado como um exemplo no presente documento) entre S_a1', S_a2', ..., e S_a255' é contada. Uma vez que a matriz R segue uma distribuição normal, S_am' ainda segue uma distribuição normal assim como a matriz R. De acordo com a teoria da probabilidade, a probabilidade de que um número aleatório em distribuição normal seja maior que 0 é de 1/2; uma probabilidade de que cada valor entre

S_a1', S_a2', ..., e S_a255' seja maior que 0 é de 1/2, e portanto, K atende a distribuição binomial:

P(k_n)_(2)

255-n _ cn ( ¹ )255 _ C255 ⁽2⁾ . De acordo com um resultado de contagem, é determinado se a quantidade K de valores maiores

Petição 870160008725, de 11/03/2016, pág. 434/698

163/200 que 0 entre 5_α1', S_a2,e S_a255' é um número par; a probabilidade de que um número aleatório em distribuição binomial seja um número par é de 1/2, e, portanto, K atende uma condição com uma probabilidade de 1/2. Quando K é um número par, isso indica que a pelo menos uma parte de dados em

169, kj] atende a condição predefinida C_x. Quando Ké um número ímpar, isso indica que a pelo menos uma parte de dados em JF₇₁[^₇-169, não atende a condição predefinida C_x.

[0180] Uma maneira de determinar se pelo menos uma parte de dados em W_i2 [ξ -170, ξ -1] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em W'¹⁷⁰, k_r

1] atende a condição predefinida C₂. Portanto, conforme mostrado na Figura 33, ül representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela W_]2[k_j-170, £_;-1] atende a condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Cinco (5) bytes de dados selecionados são usados repetidamente 51 vezes para se obter 255 bytes no total, de modo a aumentar a aleatoriedade. Cada um desses bytes é formado por 8 bits, que são indicados como b_mX e b_m8 , representando do primeiro bit ao oitavo bit de um emésimo byte nos 255 bytes, e, portanto, bits que correspondem aos 255 bytes podem ser representados h ¹ ^1,2 h ' ^2,2 como:

( b ' ^1,1 h ' ^2,1 h ’ \^m255,1 =0, ^„'=-1, h ' ^255,2 onde b.

> ¹ m,n matriz V_b' é obtida de , onde quando Z>_m„'=1, A_m„'=1, e quando li ' ₂55,8 y representa qualquer um dentre b_mX e b_mS', e acordo com uma relação de conversão entre b_t b ¹ m,n uma ' ' e m,n bits que correspondem aos 255 bytes, e pode ser a partir dos

	' Au	Ai,₂ ·	• Al,8 '
representada como:	V ^v &₂,1	A₂,₂ ·	• A₂,8
	^A₂55,l	A₂55,₂	A₂55,8_y

. Maneiras de se pelo menos

Petição 870160008725, de 11/03/2016, pág. 435/698

164/200 uma parte de dados nas janelas W₂ [ p₂-169, p₂ ] e W₂ [ q₂-169, q₂ ] atende a condição predefinida são as mesmas, e, portanto, a matriz R é ainda usada:

' A, ^h2,1 ^h1,2 ^h2,2 *1.8 Ί h

2,8 h

V '255,1 h

255,2 h

255,8 7 . Números aleatórios de uma emésima linha da matriz da emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como ^S' = Vbm,*^hm, + ^V.'*^h . +...+ Vbm8*^h 8. ^Sbi', ^Sb2' e ^Sb255' são obtidos de acordo com o método, e uma quantidade K de valores atende uma condição específica (ser maior que 0 é usado como um exemplo no presente documento) entre S_b1', S_b2',..., e S_b255' é contada. Uma vez que a matriz R segue uma distribuição normal, S_bm' ainda segue uma distribuição normal assim como a matriz R. De acordo com a teoria da probabilidade, a probabilidade de que um número aleatório em distribuição normal seja maior que 0 é de 1/2; uma probabilidade de que cada valor entre S_b1', S_b2',..., e S_b255' seja maior que 0 é de 1/2, e, portanto, K atende a distribuição binomial:

P(k = n) = ( ¹)(|)^2SS- = C,’„(|)^2SS

De acordo com um resultado de contagem, é determinado se a quantidade K de valores maiores que 0 entre

S_b1', S_b2' ,..., e S_b255' é um número par; a probabilidade de que um número aleatório em distribuição binomial seja um número par é de 1/2, e, portanto, K atende uma condição com uma probabilidade de 1/2. Quando K é um número par, isso indica que a pelo menos uma parte de dados em atende a condição predefinida C₂. Quando K é um número ímpar, isso indica que a pelo menos uma parte de dados em W_J2[k_J-170, k_J-1]não atende a condição predefinida C₂. Similarmente, uma maneira de determinar se pelo menos uma parte de dados em W_i3 [k_t -171, k_t -2] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em W_J3 [ ^kj-^{171, k}j -

2] atende a condição predefinida C₃. Similarmente, é determinado se pelo

Petição 870160008725, de 11/03/2016, pág. 436/698

165/200 menos uma parte de dados em W_j4[k_j-172, k_j -3] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em ^W [ ^kj 173, k_j -4] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6 [k_j-174, k_j -5] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_j7[k_j-175, k_j -6] atende uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8 [k_j-176, k_j -7] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_{j 9} [ k_j-177, k_j -8] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10 [k_j -178, k_j -9] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em Wjii [ kj-179, kj 10]atende uma condição predefinida C₁₁, que não são descritas novamente no presente documento.

[0181] Nessa modalidade, é determinado, usando-se uma função aleatória, se pelo menos uma parte de dados em uma janela W_iz [k_t - A_z, k_t + B_z ] atende uma condição predefinida C _z. A maneira de implantação mostrada na Figura 21 é ainda usada como um exemplo. De acordo com uma regra predefinida em um servidor para desduplicação 103, uma janela W1[ k-169, k- ] é determinada para um ponto divisório potencial k_t, e é determinado se pelo menos uma parte de dados em W_n [k_t -169, k_t ] atende a condição predefinida Cj. Conforme mostrado na Figura 32, W_n representa a janela W_n[ k-169, k_t ], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W-i [k_t-169, k_t ] atende a condição predefinida C₁. Na Figura 32, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados . Em uma maneira de implantação, uma função hash é usada para calcular os cinco (5) bytes selecionados, e valores obtidos por meio de cálculo usando a função hash estão em distribuição fixa e uniforme. Se um valor obtido por meio de cálculo usando a função hash é um número par, é determinado que a pelo menos uma parte de dados em W_n [k_t-169, k_t ] atende

Petição 870160008725, de 11/03/2016, pág. 437/698

166/200 a condição predefinida Q. Isto é, Q representa que um valor obtido de acordo com a maneira supracitada e por meio de cálculo usando a função hash é um número par. Portanto, uma probabilidade de se pelo menos uma parte de dados em W_n[k_t-169, k_t ] atende uma condição predefinida é de 1/2. Na maneira de implantação mostrada na Figura 21, é determinado, usando uma função hash, se pelo menos uma parte de dados em W_t2 [k_t-170, k_t-1] atende uma condição predefinida C₂, se pelo menos uma parte de dados em W₃[ k_t 171, k_t -2] atende uma condição predefinida C₃, se pelo menos uma parte de dados em W_i4 [k_t-172, k_t -3] atende uma condição predefinida C₄, e se pelo menos uma parte de dados em W_i5[k_t -173, k_t -4] atende uma condição predefinida C₅. Para implantação específica, referência pode ser feita à descrição da maneira de determinar, usando uma função hash, se pelo menos uma parte de dados em W_n[ k_t-169, k_t ] atende a condição predefinida Q na maneira de implantação mostrada na Figura 21, que não é descrita novamente no presente documento.

[0182] Quando a pelo menos uma parte de dados em Wsí k_t-173, k_t -4] não atende a condição predefinida C₅, 7 bytes são pulados a partir do ponto divisório potencial k_t ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente k_j é obtido em uma posição de extremidade de um sétimo byte. Conforme mostrado na Figura 22, de acordo com a regra predefinida para o servidor para desduplicação 103, uma janela W_j1[ k_j-169, k_j ] é determinada para o ponto divisório potencial k_j. Uma maneira de determinar se pelo menos uma parte de dados na janela W_j1[k_j-169, k_j ] atende a condição predefinida C_x é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_n[ k_t 169, k_t ] atende a condição predefinida C₁. Portanto, conforme mostrado na Figura 33, ^W1 representa a janela W_j1[ k_j-169, k_j ] e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em Wj₁[ kj-169, kj ] atende a condição predefinida C₁. Na Figura 33, representa 1 byte

Petição 870160008725, de 11/03/2016, pág. 438/698

167/200 selecionado, e há 42 bytes entre dois bytes adjacentes selecionados Os 5 bytes selecionados a partir da janela W_fl[£,-169, k_}] são calculados usandose uma função hash. Se um valor obtido é um número par, a pelo menos uma parte de dados em JF₇₁[£,-169, k_}] atende a condição predefinida C_P Na Figura 33, uma maneira de determinar se pelo menos uma parte de dados em W_j2 [£, -170, £,-l] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em JF,₂[£,-170, £,-1] atende a condição predefinida C₂. Portanto, conforme mostrado na Figura 33, ü representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela JF,₂[£,-170, £,-1] atende a condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados ü. Cinco (5) bytes selecionados são calculados usando-se uma função hash. Se um valor obtido é um número par, a pelo menos uma parte de dados em JF₇₂[£₇-170, £,-1] atende a condição predefinida C₂. Na Figura 33, uma maneira de determinar se pelo menos uma parte de dados em JF).₃ [£,.-171, £,-2] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em JF,₃[£,-171, £,.-2] atende a condição predefinida C₃. Portanto, conforme mostrado na Figura 33, representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela JF₇₃[£₇-171, kj-2] atende a condição predefinida C₃, e há 42 bytes entre dois bytes adjacentes selecionados S. Cinco (5) bytes selecionados são calculados usando-se uma função hash. Se um valor obtido é um número par, a pelo menos uma parte de dados em JF,₃[£,-171, £,.-2] atende a condição predefinida C₃. Na Figura 33, uma maneira de determinar se pelo menos uma parte de dados em W_p[kj-112, kj-3] atende a condição predefinida C₄ e uma maneira de determinar se pelo menos uma parte de dados na janela w_i4 [£,-172, £,-3]] atende a condição predefinida C₄. Portanto, conforme mostrado na Figura 33, representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela ^₄[£_y-172, £,-3] atende a condição predefinida

Petição 870160008725, de 11/03/2016, pág. 439/698

168/200

C₄, e há 42 bytes entre dois bytes adjacentes selecionados Cinco (5) bytes selecionados são calculados usando-se uma função hash. Se um valor obtido é um número par, a pelo menos uma parte de dados em -1’2. k,3]atende a condição predefinida C₄. De acordo com o supracitado método, é determinado se pelo menos uma parte de dados em W_j5\kj-Y13, £_y-4] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[kj-WÁ, kj-5] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em JF₇₇[^₇-175, £₇-6]atende uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em ^wAk_r176, kj-Ί] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_j9\kj-vn, £_y-8] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em JF_71O[^-178, k_r9\ atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_jn [ £,-179, £,-10] atende uma condição predefinida C_n, que não são descritas novamente no presente documento.

[0183] Nessa modalidade, é determinado, usando-se uma função aleatória, se pelo menos uma parte de dados em uma janela W_lz\k_rA_z, k, + B_z} atende uma condição predefinida C_z. A maneira de implantação mostrada na Figura 21 é usada como um exemplo. De acordo com uma regra predefinida em um servidor para desduplicação 103, uma janela ^.-169, k_t] é determinada para um ponto divisório potencial ξ, e é determinado se pelo menos uma parte de dados em in W_n [ξ-169, k_t] atende a condição predefinida C;. Conforme mostrado na Figura 32, W_n representa a janela em ^[ξ-169, £_;], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [ξ -169, ξ ] atende a condição predefinida Q. Na Figura 32, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são convertidos em valores decimais que são representados como α_γ, a₂,

Petição 870160008725, de 11/03/2016, pág. 440/698

169/200 a ₃, a ₄, e a ₅ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer a₅ de a_λ, a₂, a₃, a₄, e a₅ atende 0<a_r<255. a ₁, a₂, a₃, a₄, e a₅ formam uma matriz 1*5. 256*5 números aleatórios são selecionados a partir de números aleatórios que seguem uma distribuição binomial para formar uma matriz R que é representada como ^h0,1 ^h0,2 ” ’ ^h0,5 _: ^h1,1 ^h1,2 ” ’ ^h1,5 h h ·· · h

V 255,5 255,5 255,5 J [0184] A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a ₁ e uma coluna em que a ₁ está localizado. Por exemplo, se a₁ =36, e a ₁ está localizado em uma primeira coluna, um valor que corresponde a h₃₆₁ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a ₂ e uma coluna em que a ₂ está localizado. Por exemplo, se a ₂ =48, e a ₂ está localizado em uma segunda coluna, um valor que corresponde a h₄₈₂ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a ₃ e uma coluna em que a ₄ está localizado. Por exemplo, se a ₄ =26, e a ₄ está localizado em uma terceira coluna, um valor que corresponde a h₂₆₄ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₅ e uma coluna em que onde a₅ está localizado. Por exemplo, se a₅ =88, e a₅ está localizado em uma quinta coluna, um valor que corresponde a h₈₈₅ é buscado. S₁ = h₃₆₁ + h₄₈₂ + h_{26 3} + h_{26 4} + h_{88 5}, e uma vez que a matriz R segue uma distribuição binomial, S₁ também segue uma distribuição binomial. Quando S₁ é um número par, a pelo menos uma parte de dados em W_n [k_t -169, k_t ] atende a condição predefinida C₁; quando S₁ é um número ímpar, a pelo menos uma parte de dados em W_n [k_t -169, k_t ] não atende a condição predefinida C₁. Uma probabilidade de que S₁ seja um número par é de 1/2, e C₁ representa que S₁ que é obtido por meio de cálculo de acordo com a maneira supracitada é um número par. Na modalidade mostrada na Figura

Petição 870160008725, de 11/03/2016, pág. 441/698

170/200

21, a pelo menos uma parte de dados em W_n [k_t -169, Ã/Jatende a condição predefinida Q. Conforme mostrado na Figura 32, Ei representa 1 byte separadamente selecionado quando é determinado se pelo menos uma parte de dados na janela W_i2 [Ãy-170, Ay -1] atende uma condição predefinida C₂. Na Figura 32, bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes Ei cujos números na sequência são 170, 128, 86, 44 e 2 são convertidos em valores decimais que são representados como b₂, b₃, b₄, e b₅ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte Ei serve como um valor, e qualquer b_r de b_x, b₂, b₃, b₄, e b₅ atende 0< b_r <255. b_x, b₂, b₃, b₄, e b₅ formam uma matriz 1*5. Nessa maneira de implantação, as maneiras de determinar se pelo menos uma parte de dados em W_n e JV_i2 atendem uma condição predefinida são as mesmas, e, portanto, a matriz R é ainda usada. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b_x e uma coluna em que b_x está localizado. Por exemplo, se ^=66, e b_x está localizado em uma primeira coluna, um valor que corresponde a h₆₆₁ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₂ e uma coluna em que b₂ está localizado. Por exemplo, se ô₂=48, e b₂ está localizado em uma segunda coluna, um valor que corresponde a h₄₈₂ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₃ e uma coluna em que b₃ está localizado. Por exemplo, se b₃ =99, e b₃ está localizado em uma terceira coluna, um valor que corresponde a h₉₉₃ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₄ e uma coluna em que b₄ está localizado. Por exemplo, se ô₄=26, e b₄ está localizado em uma quarta coluna, um valor que corresponde a h₂₆₄ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₅ e uma coluna em que b₅está localizado. Por exemplo, se 6₅=90, e b₅ está localizado em uma quinta

Petição 870160008725, de 11/03/2016, pág. 442/698

171/200 coluna, um valor que corresponde a h_9o, é buscado. S ₂ = h_66>1 + h₄₈,₂ + h₉₉₃ + h₂₆,₄+ h_{90 5}, e uma vez que a matriz R segue uma distribuição binomial, S₂ também segue uma distribuição binomial. Quando S₂ é um número par, a pelo menos uma parte de dados em W,₂ [k,-170, k, -1] atende a condição predefinida C₂; quando S₂ é um número ímpar, a pelo menos uma parte de dados em W2 [k_t 170, k,-1] não atende a condição predefinida C₂. Uma probabilidade de que S ₂seja um número par é de 1/2. Na modalidade mostrada na Figura 21, a pelo menos uma parte de dados em W_t2 [k,-170, k, -1] atende a condição predefinida C₂. Usando-se a mesma regra, separadamente, é determinado se pelo menos uma parte de dados em W_i3 [k,-171, k, -2] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W 4 [ k_t 172, k_t -3] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_i5 [k_t -173, k, -4] atende uma condição predefinida C₅, é determinado se pelo menos uma parte de dados em W,₆ [k,-174, k, -5] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em W,₇ [k, -175, k_t -6] atende uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_i8 [k, -176, k, -7] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_t9 [k, -177, k_t -8] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [k,-178, k, -9] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W-u [k-179, k, -10] atende uma condição predefinida C_u. Na maneira de implantação mostrada na Figura 21, a pelo menos uma parte de dados em W₅ [k -173, k_t -4] não atende a condição predefinida C₅, 7 bytes são pulados a partir do ponto divisório potencial k, ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente kj é obtido em uma posição de extremidade de um sétimo byte. Conforme mostrado na Figura 22, de acordo com a regra predefinida para o servidor para desduplicação 103, uma janela W_j1 [kj-169, kj ] é determinada

Petição 870160008725, de 11/03/2016, pág. 443/698

172/200 para o ponto divisório potencial kj. Uma maneira de determinar se pelo menos uma p^{arte de dados na janela} WJX ^{[ k}j-Ί69, k ^{] atende a condi}çã^o predefirnda C1 é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_n [k_t -169, k_t ] atende a condição predefinida C₁. Portanto, conforme mostrado na Figura 33, ^Wj1 representa a janela Wjj [ kj-169, kj ], e é determinado se a pelo menos uma parte de dados em W_j1 [ k_j-169, k_j ], atende a condição predefinida C₁. Na Figura 33, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são convertidos em valores decimais que são representados como aj, a₂', a₃', a₄ , e a₅' respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer a_r' de aj, a₂', a₃', a₄', e a₅' atende 0< a_r'<255. aj, a₂', a₃', a₄', e a₅' formam uma matriz 1*5. A maneira de determinar se pelo menos uma parte de dados na janela W_j1 [k_j-169, k_j ] atende a condição predefinida C₁ é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_j1 [ k_j-169, k_j ] atende a condição predefinida C₁. Portanto, a matriz R é ainda usada, e é representada como:

' hu ^h1,1 ho,5 ^{Λ h}1,5 h

V 255,5 ^h0,2 ^hl,2 [0185] A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₁' e uma coluna em que a₁' está localizado. Por exemplo, se a₁' =16, e a₁' está localizado em uma primeira coluna, um valor que corresponde a hj₆₁ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₂' e uma coluna em que a₂' está localizado. Por exemplo, se a₂' =98, e a₂' está localizado em uma segunda coluna, um valor que corresponde a h₉₈₂ é buscado. A matriz R é submetida a uma busca por um valor correspondente de

Petição 870160008725, de 11/03/2016, pág. 444/698

173/200 acordo com o valor de a₃ e uma coluna em que a₃ está localizado. Por exemplo, se a₃'=56, e a₃ está localizado em uma terceira coluna, um valor que corresponde a h_{56 3} é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₄' e uma coluna em que a₄ está localizado. Por exemplo, se a₄'=36, e a₄' está localizado em uma quarta coluna, um valor que corresponde a h₃₆₄ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de a₅' e uma coluna em que a₅' está localizado. Por exemplo, se a₅'=99, e a₅' está localizado em uma quinta coluna, um valor que corresponde a Λ_{99 5} é buscado. s/ = h_g82+ h_{56 3} + h₃₆₄+ h_gg5, e uma vez que a matriz R segue uma distribuição binomial, s; também segue uma distribuição binomial. Quando s; é um número par, a pelo menos uma parte de dados em W^A-169, kj atende a condição predefinida Cj; quandos; é um número ímpar, a pelo menos uma parte de dados em JF₇₁[^₇-169, £_y] não atende a condição predefinida Cf Uma probabilidade de que s/ seja um número paré de 1/2.

[0186] Uma maneira de determinar se pelo menos uma parte de dados em W_i2 [ £,-170, ξ -l] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em W_j2[k_r17(), k_r1] atende a condição predefinida C₂. Portanto, conforme mostrado na Figura 33 El· representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela W_j2[kj-Y70, £₇-l] atende a condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados.

Os bytes cujos números na sequência são 170, 128, 86, 44 e 2 são convertidos em valores decimais que são representados como bf b₂', b₃ , b₄', e b₃ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer b_r' de b_x', b₂', b₃ , b₄', e b₅' atende Q<b_r' <255. bf b₂', b₃ , b₄', e b₅' formam uma matriz 1*5. A matriz R a mesma que

Petição 870160008725, de 11/03/2016, pág. 445/698

174/200 aquela usada quando é determinado se a pelo menos uma parte de dados na janela W_t2 [k_t-170, k_t-1] atende a condição predefinida C₂ é usada. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de bi e uma coluna em que b₁' está localizado. Por exemplo, se b₁' =210, e b₁' está localizado em uma primeira coluna, um valor que corresponde a h_210>1 é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₂' e uma coluna em que b₂' está localizado. Por exemplo, se b₂'=156, e b₂' está localizado em uma segunda coluna, um valor que corresponde a h₁₅₆₂ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₃' e uma coluna em que b₃' está localizado. Por exemplo, se b₃' =144, e b₃' está localizado em uma terceira coluna, um valor que corresponde a h₁₄₄,₃ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₄' e uma coluna em que b₄' está localizado. Por exemplo, se b₄' =60, e b₄' está localizado em uma quarta coluna, um valor que corresponde a h₆₀,₄ é buscado. A matriz R é submetida a uma busca por um valor correspondente de acordo com o valor de b₅' e uma coluna em que b₅' está localizado. Por exemplo, se b₅' =90, e b₅' está localizado em uma quinta coluna, um valor que corresponde a h₉₀,₅ é buscado. s₂' = h_210>1+ h₁₅₆,₂+ h₁₄₄,₃ + h₆₀,₄ + h₉₀,₅. A mesma condição determinante de s₂, quando s₂' é um número par, a pelo menos uma parte de dados em W_j2[k_j-170, k_j-1]atende a condição predefinida C₂, e quando s₂' é um número ímpar, a pelo menos uma parte de dados em W_{j 2}[ k_j-170, k_j-1]não atende a condição predefinida C₂. Uma probabilidade de que s₂' seja um número par é de 1/2.

[0187] Similarmente, uma maneira de determinar se pelo menos uma parte de dados em W_i3 [k_t-171, k_t -2] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em Wj 3[ kj 171, k_j -2] atende a condição predefinida C₃. Similarmente, é determinado se pelo menos uma parte de dados em W_j4[k_j-172, k_j-3] atende a condição

Petição 870160008725, de 11/03/2016, pág. 446/698

175/200 predefinida C₄, é determinado se pelo menos uma parte de dados em ^WA k 173, k_j -4] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[ k_j-174, k_j -5] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_{j 7}[ k_j-175, k_j -6] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[ k_j -176, k_j -7] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_j9[ k_j-177, k_j-8] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_fl0[kj 178, k_j -9] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_j11 [ k_j-179, k_j-10] atende a condição predefinida C_u, que não são descritas novamente no presente documento.

[0188] Nessa modalidade, é determinado, usando-se uma função aleatória, se pelo menos uma parte de dados em uma janela W_iz [ k_t - A_z, k_t + B_z ] atende uma condição predefinida C _z. A maneira de implantação mostrada na Figura 21 é usada como um exemplo. De acordo com uma regra predefinida em um servidor para desduplicação 103, uma janela W_n [ ki-169, ki ] é determinada para um ponto divisório potencial k_i, e é determinado se pelo menos uma parte de dados em W_n [k_i -169, k_i ] atende uma condição predefinida C₁. Conforme mostrado na Figura 32, W-i representa a janela W_n[k_t-169, k_t ], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [k_t-169, k_i ] atende a condição predefinida C₁. Na Figura 32, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são convertidos em valores decimais que são representados como a₁, a₂, a₃, a₄, e a₅ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer a_s de a₁, a₂, a₃, a₄, e a₅ atende 0<a_s <255. a₁, a₂, a₃, a₄, e a₅ formam uma matriz 1*5. 256*5 números aleatórios são selecionados a partir de números aleatórios que seguem uma

Petição 870160008725, de 11/03/2016, pág. 447/698

176/200 distribuição ^h0,1 ^h0,2 ^h1,1 ^h1,2 binomial para formar uma matriz R que é representada como:

^h0,5 ^h1,5

256*5 números aleatórios são selecionados a partir de

números aleatórios que seguem uma distribuição binomial para formar uma

C matriz G que é representada como:

^g0,1	^g0,2 ”	^g0,5
g1,1	g1,2	’· g1,5
^g255,5	^g255,5 ’ ”	^g255,5

[0189] De acordo com o valor de a₁ e uma coluna em que a₁ está localizado, por exemplo, a₁ =36, e a₁ está localizado em uma primeira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₃₆₁, e é efetuada uma busca na matriz G por um valor que corresponde a g₃₆₁. De acordo com o valor de a₂ e uma coluna em que a₂ está localizado, por exemplo, a₂ =48, e a₂ está localizado em uma segunda coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{48 2}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{48 2}. De acordo com o valor de a₃ e uma coluna em que a₃ está localizado, por exemplo, a₃ =26, e a₃ está localizado em uma terceira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{26 3}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{26 3}. De acordo com o valor de a₄ e uma coluna em que a₄ está localizado, por exemplo, a₄ =26, e a₄ está localizado em uma quarta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₂₆₄, e é efetuada uma busca na matriz G por um valor que corresponde a g_{26 4}. De acordo com o valor de a₅ e uma coluna em que a₅está localizado, por exemplo, a₅ =88, e a₅ está localizado em uma quinta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{88 5}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{88 5}. S_1h = h_{36 1} + h_{48 2} + h_{26 3} + h_{26 4} + h_{88 5}, e uma vez que a matriz R segue uma distribuição binomial, S_1h também segue uma distribuição binomial. ^S1g = g36, 1 ⁺

Petição 870160008725, de 11/03/2016, pág. 448/698

177/200 <?4s,2⁺ <?26,3⁺ <§26,4⁺ <§88,5 > θ uma ^νθ^ζ que ^a matriz G segue uma distribuição binomial, Slg também segue uma distribuição binomial. Quando um de Slh e Slg é um número par, a pelo menos uma parte de dados em ^[^-169, kl atende a condição predefinida Cj quando tanto Slh quanto Slg são números ímpares, a pelo menos uma parte de dados em Wn [ξ -169, ξ ] não atende a condição predefinida Q, e indica que um de Slh e Slg obtidos de acordo com o supracitado método é um número par. Uma vez que tanto Slh quanto seguem uma distribuição binomial, uma probabilidade de que seja um número par é de 1/2, uma probabilidade de que Slg seja um número par é de 1/2, e uma probabilidade de que um de Slh e Slg seja um número par é de 11/4=3/4. Portanto, uma probabilidade de que a pelo menos uma parte de dados em Wn [k -169, ξ] atenda a condição predefinida é de 3/4. Na modalidade mostrada na Figura 21, a pelo menos uma parte de dados em ^[ξ-169, k\ atende a condição predefinida CP Na maneira de implantação mostrada na Figura 21, para ^[ξ-169, ξ], ^2[ξ-170, ξ-1], ^3[ξ-171, ξ-2], Wi4[ktm, k-3], W15[kA73, k-4], ^6[^-174, ^-5], Wi7 [Ãg-175, k-Q], ^[^-176, k-U ^ÍM⁷⁷· V⁸l. ^loíM⁷⁸· θ ^iit^-179, ξ-10], as janelas são de tamanho igual, isto é, todas as janelas têm um tamanho de 169 bytes, e, entretanto maneiras de determinar se pelo menos uma parte de dados em uma janela atende uma condição predefinida são também as mesmas. Quanto a detalhes, fazer referência à descrição supracitada de determinar se a pelo menos uma parte de dados em Wn [ξ -169, ξ] atende a condição predefinida Cj. Portanto, conforme mostrado na Figura 32, representa 1 byte separadamente selecionado quando é determinado se pelo menos uma parte de dados na janela W_n [^-170, ^-1] atende uma condição predefinida C₂. Na Figura 32, bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes Ei cujos números na sequência são 170, 128, 86, 44 e 2 são convertidos em valores decimais que são representados como h_}, Z>₂,

Petição 870160008725, de 11/03/2016, pág. 449/698

178/200 b₃, b₄, e b₅ respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer b_s de b_x, b₂, b₃, b₄, e b₅ atende 0< A <255. b_x, b₂, b₃, b₄, e b₅ formam uma matriz 1*5. Nessa maneira de implantação, maneiras de determinar se pelo menos uma parte de dados em cada janela atende uma condição predefinida são as mesmas, e, portanto, as mesmas matrizes R e G são ainda usadas. De acordo com o valor de b_x e uma coluna em que b_x está localizado, por exemplo, b_x =66, e b_x está localizado em uma primeira coluna, é efetuada uma busca na matriz R por um valor que corresponde a Zz₆₆₁, e é efetuada uma busca na matriz G por um valor que corresponde a g₆₆₁. De acordo com o valor de b₂ e uma coluna em que b₂ está localizado, por exemplo, b₂ =48, e b₂ está localizado em uma segunda coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{48 2}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{48 2}. De acordo com o valor de b₃ e uma coluna em que b₃ está localizado, por exemplo, 6₃=99, e b₃ está localizado em uma terceira coluna, é efetuada uma busca na matriz R por um valor que corresponde a Zz₉₉₃, e é efetuada uma busca na matriz G por um valor que corresponde a g_{99 3}. De acordo com o valor de b₄ e uma coluna em que b₄ está localizado, por exemplo, b₄ =26, e b₄está localizado em uma quarta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₂₆₄, e é efetuada uma busca na matriz G por um valor que corresponde a g₂₆₄. De acordo com o valor de b₅ e uma coluna em que b₅ está localizado, por exemplo, 6₅=90, e b₅ está localizado em uma quinta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{90 5}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{90 5} ^S2h⁼ ^66,1+ ^48,2 ^{+ /?}99 3 ⁺ ^26,4 ⁺ ^90,5- θ ^{Um3 ν}θ^Ζ Π^υθ ³ ΠΊθίΓΙΖ R SeÇUe URia distribuição binomial, S2h também segue uma distribuição binomial. 52g=g661 + <§48,2⁺ <§99,3⁺ <§26,4⁺ <§90,5 > θ uma ^νθ^ζ Π¹¹® ³ rnatriz G segue uma distribuição binomial, S2g também segue uma distribuição binomial. Quando um de S_2h e S_2g é um número par, a pelo menos uma parte de dados em ^₂ [^-170, ^-1]

Petição 870160008725, de 11/03/2016, pág. 450/698

179/200 atende a condição predefinida C₂; quando tanto S_2h quanto S_2g são números ímpares, a pelo menos uma parte de dados em W_t2 [ k_t-170, k_t -1] não atende a condição predefinida C₂. Uma probabilidade de que um de S_2h e S_2g seja um número par é de 3/4. Na modalidade mostrada na Figura 21, a pelo menos uma parte de dados em W_t2 [k_t-170, k_t -1] atende a condição predefinida C₂. Usando a mesma regra, separadamente, é determinado se pelo menos uma parte de dados em W_t3 [k_t -171, k_t -2] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_i4 [k_t-172, k_t -3] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_i5 [k_t -173, k_t -4] atende uma condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_i6 [k_t-174, k_t -5] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_t7 [k_t -175, k_t -6] atende uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_i8 [k_t -176, k_t -7] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_t9 [k_t -177, k_t -8] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [k_t-178, k_t -9] atende uma condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_m [k_t-179, k_t -10] atende uma condição predefinida C₁₁. Na maneira de implantação mostrada na Figura 21, a pelo menos uma parte de dados em W_t5 [k_t -173, k_t -4] não atende a condição predefinida C₅, 7 bytes são pulados a partir do ponto divisório potencial k_t ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente k_j é obtido em uma posição de extremidade de um sétimo byte. Conforme mostrado na Figura 22, de acordo com a regra predefinida para o servidor para desduplicação 103, uma janela W_j1 [k_j-169, k_j ] é determinada para o ponto divisório potencial k_j. Uma maneira de determinar se pelo menos ^uma p^{arte de dados na janela W}ji ^[kj^{-169, k}j^{] atende a condi}ç^ão p^redefinidaC₁ é a mesma maneira de determinar se pelo menos uma parte de dados na

Petição 870160008725, de 11/03/2016, pág. 451/698

180/200 janela W_n [k_t -169, k_t ] atende a condição predefinida C₁. Portanto, conforme mostrado na Figura 33, representa a janela [ k_J-169, k_J ] e é determinado se a pelo menos uma parte de dados em W_j3 [ k_j-169, k_j ] atende a condição predefinida C₁. Na Figura 33, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são convertidos em valores decimais que são representados como a_x', a₂', a₃', a₄', e a₅' respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte serve como um valor, e qualquer a_s' de a_x, a₂', a₃', a₄', e a₅' atende 0<a_s'<255. a_x, a₂', a₃', a₄', e a₅' formam uma matriz 1*5. As matrizes R e G as mesmas que aquelas usadas quando é determinado se a pelo menos uma parte de dados na janela w_n [ ki 169, k_t ] atende a condição predefinida C₁ são usadas, e são representadas como:

^h0,1 ^h0, 2	·· h 0,5		' go,1	^g0,2	^g0,5
^h1,1 ^h1,2	^h1,5	e	g1,1	^g1,2	• g1,5	respectivamente
^h255,5 ^h255,5	^h255,5 ^J		< ^g255,5	^g255,5	^g255,5 y

[0190]

De acordo valor de com o a_x e uma coluna em que a_x está localizado, por exemplo, a₁' =16, e a₁' está localizado em uma primeira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{16 1}, e é efetuada uma busca na matriz G por um valor que corresponde a g₁₆₁. De acordo com o valor de a₂' e uma coluna em que a₂' está localizado, por exemplo, a₂' =98, e a₂' está localizado em uma segunda coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{8 2}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{98 2}. De acordo com o valor de a₃' e uma coluna em que a ₃' está localizado, por exemplo, a₃' =56, e a₃' está localizado em uma terceira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h_{56 3}, e é efetuada uma busca na matriz G por um valor que corresponde a g_{56 3}. De acordo com o valor de a₄' e uma coluna em que a₄' está localizado, por exemplo, a₄' =36, e a₄' está localizado em uma

Petição 870160008725, de 11/03/2016, pág. 452/698

181/200 quarta coluna, é efetuada uma busca na matriz R por um valor que corresponde a /z₃₆₄, e é efetuada uma busca na matriz G por um valor que corresponde a g_{36 4}. De acordo com o valor de a₅' e uma coluna em que a₅' está localizado, por exemplo, a₅'=99, e a₅' está localizado em uma quinta coluna, é efetuada uma busca na matriz R por um valor que corresponde a /?_{99 5}, e é efetuada uma busca na matriz G por um valor que corresponde a <§99,5· ^1/,^^6,1+^98,2 + ^56.3+^36,4+^99.5, θ ^{uma vez} ci^{ue a} matriz R segue uma distribuição binomial, S1A' também segue uma distribuição binomial. 5lg'=g161 + <§98,2+^56,3+<§36,4+<§99,5, θ ^{uma vez} ci^{ue a} matriz G segue uma distribuição binomial, Slg' também segue uma distribuição binomial. Quando um de S_1A' e S_lg' é um número par, a pelo menos uma parte de dados em W_J1[k_J-169, kj] atende a condição predefinida Cj quando tanto S_1A' quanto S_lg' são números ímpares, a pelo menos uma parte de dados em W_j3 [£,-169, k_}] não atende a condição predefinida C_}. Uma probabilidade de que um de S_1A' e S_lg' seja um número par é de 3/4.

[0191] Uma maneira de determinar se pelo menos uma parte de dados em ^.₂[£_;-170, £,-1] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em ^.₂[£_y-170, k_r1] atende a condição predefinida C₂. Portanto, conforme mostrado na Figura 33, representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela JF,₂[£,-170, £,-1] atende a condição predefinida C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Na Figura 33, bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes Ei cujos números na sequência são 170, 128, 86, 44 e 2 são convertidos em valores decimais que são representados como 6/, b₂', b₃', b₄', e b₅' respectivamente. Uma vez que 1 byte é formado por 8 bits, cada byte Ei serve como um valor, e qualquer b_s' de 6/, Z>₂', b₃', b₄', e b₅' atende 0<6/<255. 6/, b₂', b₃', b₄', e b₅' formam uma matriz 1*5. As matrizes R e G as

Petição 870160008725, de 11/03/2016, pág. 453/698

182/200 mesmas que aquelas usadas quando é determinado se a pelo menos uma

W k k parte de dados na janela ^j2[ ¹ -170, ¹ -1] atende a condição predefinida C₂são usadas. De acordo com o valor de b e uma coluna em que b/ está localizado, por exemplo, b/ =210, e b/ está localizado em uma primeira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₂₁₀,₁, e é efetuada uma busca na matriz G por um valor que corresponde a g_210>1. De acordo com o valor de b₂' e uma coluna em que b₂' está localizado, por exemplo, b₂'=156, e b₂' está localizado em uma segunda coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₁₅₆,₂, e é efetuada uma busca na matriz G por um valor que corresponde a g₁₅₆,₂. De acordo com o valor de b₃' e uma coluna em que b₃' está localizado, por exemplo, b₃' =144, e b₃' está localizado em uma terceira coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₁₄₄,₃, e é efetuada uma busca na matriz G por um valor que corresponde a g₁₄₄,₃. De acordo com o valor de b₄' e uma coluna em que b₄' está localizado, por exemplo, b₄' =60, e b₄' está localizado em uma quarta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₆₀,₄, e é efetuada uma busca na matriz G por um valor que corresponde a g₆₀,₄. De acordo com o valor de b₅' e uma coluna em que b₅' está localizado, por exemplo, b₅' =90, e b₅' está localizado em uma quinta coluna, é efetuada uma busca na matriz R por um valor que corresponde a h₉₀,₅, e é efetuada uma busca na matriz G por um valor que corresponde a ^g90,5 · ^S2h ^h210,1^{+ h}156,2 ^{+ h}144,3 ^{+ h}60,4 ^{+ h}90,5, ^{e S}2g S210,1^{+ g}156,2^{+ g}144,3 ^{+ g}60,4 ^{+ g}90,5 ·

Quando um de S_2h' e S_2g' é um número par, a pelo menos uma parte de dados em W_j2[k_j-170, k_j-1] atende a condição predefinida C₂; quando tanto S_2h' quanto S_2g' são números ímpares, a pelo menos uma parte de dados em W_j2[ k_j-170, k_j -1] não atende a condição predefinida C₂. Uma probabilidade de que um de S_2h' e S_2g' seja um número par é de 3/4.

[0192] Similarmente, uma maneira de determinar se pelo menos uma parte de dados em W_t3[k_t-171, k_t -2] atende a condição predefinida C₃ é a

Petição 870160008725, de 11/03/2016, pág. 454/698

183/200 mesma maneira de determinar se pelo menos uma parte de dados em W,si kj 171, k, -2] atende a condição predefinida C₃. Similarmente, é determinado se pelo menos uma parte de dados em W_j4[k,-172, k,-3] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em WjA k, 173, k, -4] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_j6[k,-174, k,-5] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W, ₇[ k,-175, k, -6] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W,₈[ k, -176, k, -7] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W,₉[ k,-177, k,-8] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W,₁o[ k, 178, k, -9] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_y11 [ k,-179, k,-10] atende a condição predefinida C₁₁, que não são descritas novamente no presente documento.

[0193] Nessa modalidade, é determinado, usando-se uma função aleatória, se pelo menos uma parte de dados na janela Wz [k - A_z, k +B_Z ] atende a condição predefinida C_z. A maneira de implantação mostrada na Figura 21 é usada como um exemplo. De acordo com uma regra predefinida em um servidor para desduplicação 103, uma janela W_n[ ki-169, ki ] é determinada para um ponto divisório potencial k_i, e é determinado se pelo menos uma parte de dados em W_n[ k_i-169, k_i ] atende uma condição predefinida C_x. Conforme mostrado na Figura 32, W_n representa a janela W_n[k_t -169, k_t ], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [k_i-169, k_i ] atende a condição predefinida C_x. Na Figura 32, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são considerados como 40 bits sequenciais, que são representados como «1 , «2 , ^a3, ^a4, e a₄₀ separadamente. Para qualquer a_t de a_x, a₂, a₃, a₄,..., e

Petição 870160008725, de 11/03/2016, pág. 455/698

184/200 α₄₀, quandoa_t=0, Κ_αί=-1, e quando a_t=l, Κ_αί=1. De acordo com uma correspondência entre a_t e V_at, V_aX, V_a2, V_a3, V_a4,..., e K_fl40 são gerados. Quarenta (40) números aleatórios são selecionados a partir de números aleatórios que seguem uma distribuição normal, e são representados como: 4, h₂, h₃, h₄,..., e /?₄₀ separadamente. S_a=V_aX*h_x+V_a2*h₂+V_a3*h₃+V_a4*h₄+...+ V_a40*h₄₀. Uma vez que 4, h₂, h₃, h₄, e h₄₀ seguem uma distribuição normal, h₄₀ também segue uma distribuição normal. QuandoS_a é um número positivo, a pelo menos uma parte de dados em [4-169, k_t] atende a condição predefinida C/ quandoS_a é um número negativo ou 0, a pelo menos uma parte de dados em W_n [4-169, 4] não atende a condição predefinida C_PUma probabilidade de que S_a seja um número positivo é de 1/2. Na modalidade mostrada na Figura 21, a pelo menos uma parte de dados em W_n[4-169, 4] atende a condição predefinida Q. Conforme mostrado na Figura 32, ® representa 1 byte separadamente selecionado quando é determinado se pelo menos uma parte de dados em uma janela ^[4-170, 4-1] atende uma condição predefinida C₂. Na Figura 32, bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 170, 128, 86, 44 e 2 são considerados como 40 bits sequenciais, que são representados como 4, 4, b₃, b₄,..., e b₄₀ separadamente. Para qualquer b_t de 4, b₂, b₃, b₄,..., e Z>₄₀, quando 4⁼⁰> ^Vbt⁼A, θ quando 4=1, P_bt=l.. De acordo com uma correspondência entre 4 e V_bt, V_bx, V_b2, V_b3, V_b4,e V_b40 são gerados. Uma maneira de determinar se pelo menos uma parte de dados na janela ^[4169, 4] atende a condição predefinida Q éa mesma maneira de determinar se pelo menos uma parte de dados na janela W_i2 [4-170, 4-1] atende a condição predefinida C₂. Portanto, os mesmos números aleatórios são usados: 4, 4, 4> h₄, e h₄₀, e S_b=V_bx* h_x + V_b2* h₂+V_b3* h₃ + V_b4* h₄+...+ V_b40 *h₄₀. Uma vez que 4, h₂, h₃, h₄,e 4₀ seguem uma distribuição normal, S_b também segue

Petição 870160008725, de 11/03/2016, pág. 456/698

185/200 uma distribuição normal. Quando S_b é um número positivo, a pelo menos uma parte de dados em W_t2 [k_t-170, k_t-1] atende a condição predefinida C₂; quando S_b é um número negativo ou 0, a pelo menos uma parte de dados em W ₂[ ki 170, k_t -1] não atende a condição predefinida C₂. Uma probabilidade de que S_bseja um número positivo é de 1/2. Na modalidade mostrada na Figura 21, a pelo menos uma parte de dados em W_t2[k_t-170, k_t-1] atende a condição predefinida C₂. Usando a mesma regra, separadamente é determinado se pelo menos uma parte de dados em W_t3[k_t -171, k_t -2] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W 4Í k_t 172, k_t -3] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_i5[ k_t-173, k_t -4] atende uma condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_t6 [k_t-174, k_t -5] atende uma condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_t7[k_t-175, k_t -6] atende uma condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_i8[ k_t-176, k_t -7] atende uma condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_t9[k_t-177, k_t -8] atende uma condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_i10 [k_t -178, k_t -9] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W-iiík_t-179, k_t-10] atende uma condição predefinida C₁₁. Na maneira de implantação mostrada na Figura 21, a pelo menos uma parte de dados em W_i5[k_t -173, k_t -4] não atende a condição predefinida C₅, 7 bytes são pulados a partir do ponto divisório potencial k_t ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente kj é obtido em uma posição de extremidade de um sétimo byte. Conforme mostrado na Figura 22, de acordo com a regra predefinida para o servidor para desduplicação 103, uma janela W_y1[ kj-169, kj ] é determinada para o ponto divisório potencial kj. Uma maneira de determinar se pelo menos uma parte de dados na janela W_y1[ kj-169, kj ] atende a condição predefinida C₁ é a mesma

Petição 870160008725, de 11/03/2016, pág. 457/698

186/200 maneira de determinar se pelo menos uma parte de dados na janela

169, ξ] atende a condição predefinida ^ci. Portanto, conforme mostrado na Figura 33, representa a janela W_jX[kj-169, e 5 bytes são selecionados para determinar se pelo menos uma parte de dados em W_fl[kj-169, k_}] atende a condição predefinida Q. Na Figura 33, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 na Figura 33 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 169, 127, 85, 43 e 1 são considerados como 40 bits sequenciais, que são representados como a_x , a₂, a₃', a₄ , e a A separadamente. Para qualquer a_t' de a_x , a₂, a₃ , a₄, e a₄₀', quando a_t'=0, U_flí'=-1, e quando a/=1, K_flí'=1. De acordo com uma correspondência entre a_t' e V_at', V_al', V_a2\ V_a3', V_a4', e V_a40' são gerados. A maneira de determinar se pelo menos uma parte de dados na janela W^kj-169, k^ atende a condição predefinida Q é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_n [ξ -169, ξ] atende a condição predefinida Q. Portanto, os mesmos números aleatórios são usados: h_x, h₂, k₃, h₄, θ Áo · ^'-^νΛ^Ι ^{+ ν}αΑΚ ^{+ ν}α3*^ ^{+ ν}αΑΚ⁺-⁺ν_Μ'*Κ· ^Uma vez que h_x, h₂, h₃, h₄, ..., e /?₄₀. seguem uma distribuição normal, S_a' também segue uma distribuição normal. Quando S_a' é um número positivo, a pelo menos uma parte de dados em JÇJ^-169, kj] atende a condição predefinida Cj quando S_a' é um número negativo ou 0, a pelo menos uma parte de dados em Wj^kj-169, kj] não atende a condição predefinida C_P A probabilidade de que S_a' seja um número positivo é de 1/2.

[0194] A maneira de determinar se pelo menos uma parte de dados em W_i2 [£,-170, ξ -l] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em W_j2[kj-170, kj1] atende a condição predefinida C₂. Portanto, conforme mostrado na Figura 33, & representa 1 byte selecionado quando é determinado se a pelo menos uma parte de dados na janela W_j2[kj-170, kj-1} atende a condição predefinida

Petição 870160008725, de 11/03/2016, pág. 458/698

187/200

C₂, e há 42 bytes entre dois bytes adjacentes selecionados. Na Figura 33, bytes selecionados são representados como números na sequência 170, 128, 86, 44 e 2 separadamente, e há 42 bytes entre dois bytes adjacentes selecionados. Os bytes cujos números na sequência são 170, 128, 86, 44 e 2 são considerados como 40 bits sequenciais, que são representados como

A, b₂ , b₃ , b₄', ..., e b₄₀' separadamente. Para qualquer b' de b/, b₂ , b₃ , b₄ , e b^',quando b/=0, 4,/=-1, e quando b/=1, V_bt' =1. De acordo com uma correspondência entre b/ e 4/, 4/, V_b2', V_b3\ 4,/, ..., e 4₄₀' são gerados. A maneira de determinar se pelo menos uma parte de dados em W_i2[4-170, 4-1] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em J4J4-174 4^-1] atende a condição predefinida C₂. Portanto, os mesmos números aleatórios são usados:

Uma vez que 4, b₂, h₃, h₄, ..., e b₄₀ segue uma distribuição normal, S_b' também segue uma distribuição normal. Quando S_b' é um número positivo, a pelo menos uma parte de dados em ^[4^-17^ 4-1J atende a condição predefinida C2;quando Sb' é um número negativo ou 0, a pelo menos uma parte de dados em ^[4^-17^ 4-1J não atende a condição predefinida C2. Uma probabilidade de que S_b' seja um número positivo é de 1/2.

[0195] Similarmente, uma maneira de determinar se pelo menos uma parte de dados em /4 [4-171, 4-2] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em 1444171, kj-2] atende a condição predefinida C₃. Similarmente, é determinado se pelo menos uma parte de dados em J4₄[4^_172’ 4-³] ^atende a condição predefinida C4, é determinado se pelo menos uma parte de dados em Wj5[kr 173, 4-4] atende a condição predefinida C5, é determinado se pelo menos uma parte de dados em J4J4-1⁷⁴, 4-⁵l ^{atende a} condição predefinida C6, é determinado se pelo menos uma parte de dados em ÍF/vt4^-175, 4-6] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados

Petição 870160008725, de 11/03/2016, pág. 459/698

188/200 em W_j8[ kj -176, kj -7] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em W_j9[ k_j-177, k_j-8] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em Wjio[ kj 178, k_j -9] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em W_j11 [ k_j-179, k_j-10] atende a condição predefinida C₁₁, que não são descritas novamente no presente documento.

[0196] Nessa modalidade, é determinado, usando-se uma função aleatória, se pelo menos uma parte de dados em uma janela W_iz [ k_t - A_z, k_t + B_z ] atende uma condição predefinida C _z. A maneira de implantação mostrada na Figura 21 é ainda usada como um exemplo. De acordo com uma regra predefinida em um servidor para desduplicação 103, para o ponto divisório potencial k_t, uma janela W_n[ k_t-169, k_t ] é determinada para um ponto divisório potencial k_t, e é determinado se pelo menos uma parte de dados em W_n[ k_t 169, k_t ] atende uma condição predefinida C₁. Conforme mostrado na Figura 32, W_n representa a janela W_n[ k_t-169, k_t ], e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W_n [k_t-169, k_t ], atende a condição predefinida C₁. Na Figura 32, cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados. Cada um dos bytes cujos números na sequência são 169, 127, 85, 43 e 1 é convertido em 1 número decimal, cuja faixa é 0-(2^Λ40-1). Um gerador para distribuição uniforme de número aleatório é usado para gerar 1 valor designado para cada número decimal em 0-(2Λ40-1), e uma correspondência R entre cada número decimal em 0-(2Λ40-1) e o valor designado é gravada. Uma vez designado, um valor designado que corresponde a um número decimal permanece inalterado, e o valor designado segue distribuição uniforme. Se o valor designado é um número par, a pelo menos uma parte de dados em W_n [k_t -169, k_t ] atende a condição predefinida C₁; se o valor designado é um número ímpar, a pelo menos uma parte de dados em W_n[ k_t-169, k_t ] não atende a condição

Petição 870160008725, de 11/03/2016, pág. 460/698

189/200 predefinida C₁. C₁ representa que o valor designado obtido de acordo com o supracitado método é um número par. Uma vez que uma probabilidade de que um número aleatório em distribuição uniforme seja um número par é de 1/2, uma probabilidade de que a pelo menos uma parte de dados em W[ k-169, k_t ] atende a condição predefinida C₁ é de 1/2. Na maneira de implantação mostrada na Figura 21, usando a mesma regra, separadamente, é determinado se pelo menos uma parte de dados em W_t2 [k_t-170, k_t-1] atende uma condição predefinida C₂, é determinado se pelo menos uma parte de dados em W[ k_t 171, k_t -2] atende uma condição predefinida C₃, é determinado se pelo menos uma parte de dados em W_{t 4} [ k_t-172, k_t -3] atende uma condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_i5[k_t-173, k_t -4] atende uma condição predefinida C₅, que não são descritas novamente no presente documento.

[0197] Quando a pelo menos uma parte de dados em W[ k_t-173, k_t -4] não atende a condição predefinida C₅, 7 bytes são pulados a partir do ponto divisório potencial k_i ao longo de uma direção de buscar um ponto divisório de corrente de dados, e um ponto divisório potencial corrente kj é obtido em uma posição de extremidade de um sétimo byte. Conforme mostrado na Figura 22, de acordo com a regra predefinida para o servidor para desduplicação 103, uma janela W_j1[ k_}-169, kj ] é determinada para o ponto divisório potencial kj. Uma maneira de determinar se pelo menos uma parte de dados na janela W_j1[k_}-169, kj ] atende a condição predefinida C_} é a mesma maneira de determinar se pelo menos uma parte de dados na janela W_n[ k_t 169, k_t ] atende a condição predefinida C_}. Portanto, a mesma correspondência R entre cada número decimal em 0-(2^Λ40-1) e um valor designado é usada. Conforme mostrado na Figura 33, representa a janela, e 5 bytes são selecionados para determinar se a pelo menos uma parte de dados em W1[ ^kj -169, kj ] atende a condição predefinida C₁. Na Figura 33, representa 1 byte selecionado, e há 42 bytes entre dois bytes adjacentes selecionados .

Petição 870160008725, de 11/03/2016, pág. 461/698

190/200

Cada um dos bytes cujos números na sequência 169, 127, 85, 43 e 1 é convertido em 1 número decimal, e é efetuada uma busca em R por um valor designado que corresponde ao número decimal. Se o valor designado é um número par, a pelo menos uma parte de dados em W_fl[k_j-169, k_j] atende a condição predefinida C₁; se o valor designado é um número ímpar, a pelo menos uma parte de dados em W_fl[ k_j-169, k_j ] não atende a condição predefinida C₁. Uma vez que uma probabilidade de que um número aleatório em distribuição uniforme seja um número par é de 1/2, uma probabilidade de que a pelo menos uma parte de dados em W_jX[k_j-169, k_j] atenda a condição predefinida C₁ é de 1/2. Similarmente, uma maneira de determinar se pelo menos uma parte de dados em W_t2 [k_t-170, k_t -1] atende a condição predefinida C₂ é a mesma maneira de determinar se pelo menos uma parte de dados em W_j2[k_j-170, k_j-1] atende a condição predefinida C₂, e uma maneira de determinar se pelo menos uma parte de dados em W_t3[k_t-171, k_t -2] atende a condição predefinida C₃ é a mesma maneira de determinar se pelo menos uma parte de dados em W_j3[k_j-171, k_j-2] atende a condição predefinida C₃. Similarmente, é determinado se pelo menos uma parte de dados em ^Wj 4Í ^kJ 172, k_j -3] atende a condição predefinida C₄, é determinado se pelo menos uma parte de dados em W_j5[ k_j-173, k_j -4] atende a condição predefinida C₅, é determinado se pelo menos uma parte de dados em W_{j 6}[ k_j-174, k_j-5] atende a condição predefinida C₆, é determinado se pelo menos uma parte de dados em W_{j 7}[ k_j-175, k_j -6] atende a condição predefinida C₇, é determinado se pelo menos uma parte de dados em W_j8[ k_j-176, k_j -7] atende a condição predefinida C₈, é determinado se pelo menos uma parte de dados em Wj 9[ kj 177, k_j-8] atende a condição predefinida C₉, é determinado se pelo menos uma parte de dados em W_j10[ k_j-178, k_j -9] atende a condição predefinida C₁₀, e é determinado se pelo menos uma parte de dados em Wj_U[kj-179, kj-10] atende a condição predefinida C₁₁ , que não são descritas novamente no presente documento.

Petição 870160008725, de 11/03/2016, pág. 462/698

191/200 [0198] O servidor para desduplicação 103 na modalidade da presente invenção mostrada na Figura 1 significa um aparelho que pode implantar uma solução técnica descrita em uma modalidade da presente invenção, e conforme mostrado na Figura 18, usualmente inclui uma unidade de processamento central, uma memória principal, e uma interface de entrada/saída. A unidade de processamento central, a memória principal, e a interface de entrada/saída se comunicam entre si. A memória principal armazena uma instrução executável, e a unidade de processamento central executa a instrução executável armazenada na memória principal para realizar uma função específica, de modo que o servidor para desduplicação 103 tem a função específica, por exemplo, buscar um ponto divisório de corrente de dados descrita na Figura 20 à Figura 33 nas modalidades da presente invenção. Portanto, conforme mostrado na Figura 19, de acordo com as modalidades da presente invenção mostradas na Figura 20 a Figura 33, para o servidor para desduplicação 103, uma regra é predefinida no servidor para desduplicação 103, onde a regra é: para um ponto divisório potencial k, determinar M janelas W_x [ k- A_x, k + B_x] e uma condição predefinida C_x que corresponde à janela W_x [ k- A_x, k + B_x ], onde x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_x são números inteiros.

[0199] O servidor para desduplicação 103 inclui uma unidade de determinação 1901 e uma unidade de julgamento e processamento 1902. A unidade de determinação 1901 é configurada para realizar a etapa (a):

(a) determinar uma janela correspondente ^Wz [ k -A, k + ^Bz ] para um ponto divisório potencial corrente k_l de acordo com a regra, onde i e z são números inteiros, e 1<z<M.

[0200] A unidade de julgamento e processamento 1902 é configurada para: determinar se pelo menos uma parte de dados na janela Wz [k_t - A_z, k_t + B_z ] atende uma condição predefinida C_z quando a pelo menos uma parte de dados na janela W_iz [ k_t - A_z, k_t +

Petição 870160008725, de 11/03/2016, pág. 463/698

192/200

B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k_t ao longo de uma direção de buscar um ponto divisório de corrente de dados, onde N*U não é maior que || B_z || + max_x(|| A_x ||), de modo a obter um novo ponto divisório potencial, onde unidade de determinação 1901 realiza a etapa (a) para o novo ponto divisório potencial; e quando pelo menos uma parte de dados em cada janela W_ix [k - A_x, k_t+B_x ] de M janelas do ponto divisório potencial corrente k_t atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_t como um ponto divisório de corrente de dados.

[0201] Além disso, a regra inclui adicionalmente que pelo menos duas janelas W_ie [ k_t - A_e, k_t + B_e ] e W_If [ k_t - A_f, k_t + B_f ] atendem as condições | A_e+B_e |=| A_f+B_f | e C_e=C_f. Além disso, a regra inclui adicionalmente que A_e e A_f números inteiros positivos. Além disso, a regra inclui adicionalmente A_e-1= Af e B_e +1=Bf.

[0202] Além disso, a unidade de julgamento e processamento 1902 é especificamente configurada para determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela Wz [ k - A_z, k + B_z ] atende a condição predefinida C_z. Mais ainda, a unidade de julgamento e processamento 1902 determina especificamente, usando uma função hash, se a pelo menos uma parte de dados na janela ^Wz [ k - A_z, k + B_z ] atende a condição predefinida C_z.

[0203] Além disso, a unidade de julgamento e processamento 1902 é configurada para: quando a pelo menos uma parte de dados na janela W_iz [k - A_z, k + B_z ] não atende a condição predefinida C_z, pular o mínimo N de unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e a unidade de determinação 1901 realiza a etapa (a) para o novo

Petição 870160008725, de 11/03/2016, pág. 464/698

193/200 ponto divisório potencial, onde de acordo com a regra, um limite à esquerda de uma janela W_lc [k_l - A_c, k_l + B_c ] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [ k_t - A_z, ki + B_z ] ou um limite à esquerda de uma janela W_lc [k_l - A_c, k_l + B_c] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_lz [k_t A_z, k_t + B_z ], onde a janela W_ic [k_l - A_c, k_l + B_c] determinada para o novo ponto divisório potencial é uma janela colocada como a primeira em uma sequência, que é obtida de acordo com a direção de busca de corrente de dados, de M janelas que são determinadas para o novo ponto divisório potencial de acordo com a regra.

[0204] Além disso, o fato de que a unidade de julgamento e processamento 1902 determina, usando uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [k_t - A_z, k_t + B_z ] atende a condição predefinida C_z inclui especificamente:

selecionar F bytes na janela W_lz [k_t - A_z, k_t + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, onde F >1, cada byte é formado por 8 bits, que são indicados como a_m1,..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que correspondem ^ai,1 ^a2,1 ^ai,2 ^a2,2 aos F*H bytes podem ser representados como: _a ) ^u1,8 ^a2,8 onde quando a =1, V =1, e quando a =0, ~ m,n ’ am,n ’ ~ m,n ’ ^aF*ff,1 ^aF*H,2 ··· ^aF*H,8 y

V_amn =-1, onde a_mn representa qualquer um dentre a_m>1,..., e a_m8, uma matriz V_a é obtida de acordo com uma relação de conversão entre a_mn e V_amn a partir dos bits que correspondem aos F*H bytes, a matriz V_a é representada

	' V_at1 V_a 2,1	h.1,2 · V _{2 2}a 2,2	- V»1,8 ^Va 2,8
como:	_k ^VaF*H ,1	^VaF*H ,2	^VaF *H ,8 y

*H*8 números aleatórios são

Petição 870160008725, de 11/03/2016, pág. 465/698

194/200 selecionados a partir de números aleatórios seguindo-se uma distribuição normal ' ^h1,1 ^h2,1 para ^h1,2 ^h2,2 formar uma matriz ^h1,8 ^h2,8 números

R, a matriz R é representada como: aleatórios em uma emésima linha da h

^,lF*H ,8 y matriz V_a e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado ^{como S}am = ^Vam,1 * ^hm,1 ^{+ V}am,2 * ^hm,2 ⁺--^{+ V}m 8 * ^hm,8

S

S_a1, S_a2e ^aF*^H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entre S_a1,

S_a2,..., e ^aF*^H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_zz [k - A_z, k_t + B_z ] atende a condição predefinida C_z.

[0205] De acordo com o método para buscar um ponto divisório de corrente de dados com base em um servidor nas modalidades da presente invenção mostradas na Figura 20 à Figura 33, uma janela W_1X [ k - A, k + B ]é determinada para um ponto divisório potencial k,, onde, x indica números naturais consecutivos de 1 a M separadamente, e M>2. Pode ser determinado em paralelo se pelo menos uma parte de dados em cada janela de M janelas atende uma condição predefinida C_x, ou pode ser determinado em sequência se pelo menos uma parte de dados nas janelas atende uma condição predefinida, ou pode ser primeiramente determinado que pelo menos uma parte de dados em uma janela W_ü [ p_n- a₁₅ p_n +b ₁] atende uma condição predefinida C₁, então é determinado que pelo menos uma parte de dados em W₂[ P_t2- a₂, p,₂+ b₂] atende uma condição predefinida C₂, até ser determinado que pelo menos uma parte de dados em W_im [ p_im - A_m, p_im + B_m ] atende uma condição predefinida C_m. Outras janelas nessa modalidade são determinadas da mesma maneira que acima, que não é descrita novamente.

[0206] Além disso, de acordo com as modalidades da presente invenção mostradas na Figura 20 à Figura 33, uma regra é predefinida no

Petição 870160008725, de 11/03/2016, pág. 466/698

195/200 servidor para desduplicação 103, onde a regra é: determinar M janelas W_x [kA_x, k+ B_x] para um ponto divisório potencial k e uma condição predefinida C_xque corresponde à janela W_x [k- A_x, k+ B_x], onde x indica números naturais consecutivos de 1 a M separadamente, e M>2. Na regra predefinida, A₁, A₂,

A₃, ..., e A_m podem não ser todos iguais, podem não ser todos iguais, e B₁, B₂,

B₃, ..., e B_m podem também não ser todos iguais. Na maneira de implantação mostrada na Figura 21, para W_n[ k.-169, k. ], W 2[ k-170, k.-1], W.₃[ k.-171, k.

2], W4Í k_t-172, k. -3], W_i5[ k. -173, k. -4], W.₆[k. -174, k. -5], W„[k.-175, k. -6], W₁₈ [ k. -176, k. -7], W9[ k.-177, k. -8], W^ [ k-178, ξ. -9], e W_ni[ k.-179, k.-10], as janelas são de tamanho igual, isto é, todas as janelas têm um tamanho de 169 bytes, e entretanto maneiras de determinar se pelo menos uma parte de dados em uma janela atende uma condição predefinida são também as mesmas. Quanto a detalhes, fazer referência à descrição supracitada de determinar se a pelo menos uma parte de dados em W_i.₁[k. -169, k. ] atende a condição predefinida C_}. Entretanto, na maneira de implantação mostrada na Figura 11, as janelas W_n[k.-169, k.], w.₂[k.-170, k.-1], wyk.-171, k.-2], wyk.-172, k.3], W5[k.-173, k. -4], W.6[ k. -174, k. -5], W.₇[k. -175, k. -6], Wy k.-176, k. -7], W.9 [ k. -177, k. -8], ^w.10^{[ k}.^{-168, k}. +1], ^e

W₁₁[ k.-179, k. +3] pode ser diferentes em tamanho, e entretanto as maneiras de determinar se pelo menos uma parte de dados em uma janela atende uma condição predefinida podem também ser diferentes. Em todas as modalidades, de acordo com a regra predefinida para o servidor para desduplicação 103, uma maneira de determinar se pelo menos uma parte de dados na janela Wi atende a condição predefinida C_} é certamente a mesma maneira de determinar se pelo menos uma parte de dados em uma janela W_p atende a condição predefinida C₁, uma maneira de determinar se pelo menos uma parte de dados em W.₂ atende a condição predefinida C₂ é certamente a mesma maneira de determinar se pelo menos uma parte de dados em W_j2 atende a condição predefinida C₂, ..., e uma maneira de determinar se pelo menos uma parte de dados em uma janela

Petição 870160008725, de 11/03/2016, pág. 467/698

196/200 atende uma condição predefinida C_M é certamente a mesma maneira de determinar se pelo menos uma parte de dados em uma janela W_jM atende a condição predefinida C_M, que não são descritas novamente no presente documento.

[0207] De acordo com as modalidades da presente invenção mostradas na Figura 20 à Figura 33, a regra é predefinida no servidor para desduplicação 103, k_a, k_t, k, k_t, e k_m são pontos divisórios potenciais obtidos ao se buscar um ponto divisório ao longo de uma direção de buscar um ponto divisório de corrente de dados, e k_a, k_t, k_}, k_t, e k_m todos seguem a regra. Nessa modalidade da presente invenção, a janela W_x [k- A_x, k+ B_x ] representa uma faixa específica, e dados são selecionados na faixa específica para determinar se os dados atendem a condição predefinida C_x. Especificamente, na faixa específica, a fatia de dados pode ser selecionada ou todos os dados podem ser selecionados para determinar se os dados atendem a condição predefinida C_x. Referência pode ser feita à janela W_x [k- A_x, k+ B_x ] quanto ao conceito de uma janela especificamente usada nessa modalidade da presente invenção, que não é descrita novamente no presente documento.

[0208] Na janela W_x [k- A_x, k+ B_x ], (k- A_x) e (k+ B_x) representam dois limites da janela Wx [k- Ax, k+ Bx ], onde (k- A_x) representa um limite, que está em uma direção oposta à direção de buscar um ponto divisório de corrente de dados com relação ao ponto divisório potencial k, da janela W_x [k- A_x, k+ B_x ], e (k+ B_x) representa um limite, que está na direção de buscar um ponto divisório de corrente de dados com relação ao ponto divisório potencial k, da janela W_x [k- A_x, k+ B_x ]. Especificamente, na modalidade da presente invenção, a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 20 à Figura 33 é da esquerda para a direita; portanto, (k- A_x) representa um limite (isto é, um limite à esquerda), que está em uma direção oposta à direção de buscar um ponto divisório de corrente de dados com relação ao ponto divisório potencial k, da janela W_x [k- A_x, k+ B_x ], e (k+ B_x) representa um

Petição 870160008725, de 11/03/2016, pág. 468/698

197/200 limite (isto é, um limite à direita), que está na direção de buscar um ponto divisório de corrente de dados com relação ao ponto divisório potencial k, da janela W_x [k- A_x, k+ B_x ]. Se a direção de buscar um ponto divisório de corrente de dados mostrada na Figura 20 à Figura 33 é da direita para a esquerda, (kA_x) representa um limite (isto é, um limite à direita), que está em uma direção oposta à direção de buscar um ponto divisório de corrente de dados com relação ao ponto divisório potencial k, da janela Wx [k- Αχ, k+ Βχ ], e (k+ Βχ) representa um limite (isto é, um limite à esquerda), que está na direção de buscar um ponto divisório de corrente de dados com relação ao ponto divisório potencial k, da janela ^Wx ^[k- Ax , ^{k+ B}x ^].

[0209] Uma pessoa de habilidade comum na técnica pode estar ciente de que, em conjunto com várias unidades exemplificativas e etapas de algoritmo descritas na Figura 20 à Figura 33 das modalidades da presente invenção, uma característica chave nas modalidades da presente invenção pode ser combinada com outras tecnologias e apresentada em uma forma mais complexa; entretanto, a característica chave da presente invenção ainda está incluída. Um ponto divisório alternativo pode ser usado em um ambiente real. Por exemplo, em uma maneira de implantação, de acordo com uma regra predefinida para um servidor para desduplicação 103, para um ponto divisório potencial k_t, 11 janelas W_x [k- A_x, k+ B_x ] e uma condição predefinida C_x que corresponde à janela W_x [k- A_x, k+ B_x ] são determinadas, onde x indica números naturais consecutivos de 1 a 11. Quando pelo menos uma parte de dados em cada janela W_x [k- A_x, k+ B_x ] das 11 janelas atende a condição predefinida C_x, o ponto divisório potencial k_t é um ponto divisório de corrente de dados. Quando nenhum ponto divisório é encontrado após uma fatia de dados máxima definida ser excedida, uma regra predefinida para o ponto alternativo pode ser usada. A regra predefinida para o ponto alternativo é similar à regra predefinida no servidor para desduplicação 103, e a regra predefinida para o ponto alternativo é: por exemplo, para um ponto divisório potencial k_t, determinar 10 janelas W_x

Petição 870160008725, de 11/03/2016, pág. 469/698

198/200 [k- A_x, k+ B_x ] e uma condição predefinida C_x que corresponde à janela W_x [k- A_x, k+ B_x ], onde x indica números naturais consecutivos de 1 a 10. Quando é determinado que pelo menos uma parte de dados em cada janela Wx [k- A , k + B_x ], das 10 janelas atende a condição predefinida C_x, o ponto divisório potencial k_t é um ponto divisório de corrente de dados. Quando nenhum ponto divisório de corrente de dados é encontrado após uma fatia de dados máxima definida ser excedida, uma posição de extremidade da fatia de dados máxima serve como um ponto divisório forçado.

[0210] De acordo com as modalidades da presente invenção mostradas na Figura 20 à Figura 33, uma regra é predefinida no servidor para desduplicação 103, e na regra, M janelas são determinadas para um ponto divisório potencial k. Não é necessariamente exigido que haja um ponto divisório potencial k antecipadamente, e o ponto divisório potencial k pode ser determinado usando as M janelas determinadas.

[0211] Uma pessoa de habilidade comum na técnica pode estar ciente de que, em combinação com os exemplos descritos nas modalidades revelados nesse relatório descritivo, unidade s e etapas de algoritmo podem ser implantadas por hardware eletrônico ou uma combinação de software de computador e hardware eletrônico. Se as funções são realizadas por hardware ou software depende das aplicações particulares e condições das restrições de projeto das soluções técnicas. Uma pessoa especialista na técnica pode usar diferentes métodos para implantar as funções descritas para cada aplicação particular, mas não deve ser considerado que a implantação vá além do escopo da presente invenção.

[0212] Pode ser claramente entendido por uma pessoa especialista na técnica que, com o propósito de uma descrição conveniente e breve, para um detalhado processo do funcionamento do sistema, aparelho, e unidade supracitados, pode ser feita referência a um processo correspondente nas supracitadas modalidades do método, e detalhes não são descritos

Petição 870160008725, de 11/03/2016, pág. 470/698

199/200 novamente no presente documento.

[0213] Nas diversas modalidades fornecidas, deve ser que o sistema e método revelados podem ser implantados em outras maneiras. Por exemplo, a modalidade de aparelho descrita é meramente exemplificativa. Por exemplo, a divisão por unidade é meramente uma divisão de função lógica e pode ser outra divisão em uma implantação real. Por exemplo, uma pluralidade de unidade s ou componentes pode ser combinada ou integrada em outro sistema, ou algumas características podem ser ignoradas ou não realizadas. Além disso, os acoplamentos mútuos ou acoplamentos diretos ou conexões de comunicação exibidos ou discutidos podem ser implantados através de algumas interfaces. Os acoplamentos indiretos ou conexões de comunicação entre os aparelhos ou unidades podem ser implantados em formas eletrônicas, mecânicas, ou outras formas.

[0214] As unidades descritas como partes separadas podem ou não ser fisicamente separadas, e partes exibidas como unidade s podem ou não ser unidades físicas, podem ser localizadas em uma posição, ou podem ser distribuídas em uma pluralidade de unidades de rede. Algumas das ou todas as unidades podem ser selecionadas de acordo com as necessidades reais precisa para alcançar os objetivos das soluções das modalidades.

[0215] Além disso, unidades funcionais nas modalidades da presente invenção podem ser integradas em uma unidade de processamento, ou cada uma das unidades podem existir fisicamente separadamente, ou duas ou mais unidades são integradas em uma unidade.

[0216] Quando as funções são implantadas na forma de uma unidade de software funcional e vendidas ou usadas como um produto independente, as funções podem ser armazenadas em um meio de armazenamento legível por computador não volátil. Com base nesse entendimento, as soluções técnicas da presente invenção essencialmente, ou a parte que contribui para a técnica anterior, ou algumas das soluções técnicas

Petição 870160008725, de 11/03/2016, pág. 471/698

200/200 pode ser implantadas em uma forma de um produto de software. O produto de software é armazenado em um meio de armazenamento não volátil, e inclui diversas instruções para instruir um dispositivo de computador (que pode ser um computador pessoal, um servidor, ou um dispositivo de rede) para realizar todas as ou algumas das etapas dos métodos descritos nas modalidades da presente invenção. O supracitado meio de armazenamento não volátil inclui: qualquer meio que pode armazenar código de programa, tal como um pen drive, um disco rígido removível, uma memória apenas para leitura (Memória Apenas para Leitura, ROM), um disco magnético, ou um disco óptico.

[0217] As descrições supracitadas são meramente maneiras de implantação específicas da presente invenção, mas não são destinadas a limitar o escopo de proteção da presente invenção. Qualquer variação ou substituição prontamente imaginada por uma pessoa especialista na técnica dentro do escopo técnico revelado na presente invenção estará abrangida dentro do escopo de proteção da presente invenção. Portanto, o escopo de proteção da presente invenção estará sujeito ao escopo de proteção das reivindicações.

Claims

REIVINDICAÇÕES

1. Método para buscar um ponto divisório de corrente de dados, realizado por um servidor de desduplicação e CARACTERIZADO pelo fato de que compreende:

uma regra predefinida no servidor de desduplicação é: para um ponto divisório potencial k , determinar M pontos p_x, uma janela ^Wx [ Px - ^Ax , Px +B_x ] que correspondem ao ponto p_x, e uma condição predefinida C_x que correspondem à janela W_x [p_x - A_x, p_x + B_x ], em que x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros; e o método compreendendo:

(a) determinar (401) um ponto p_iz e uma janela [ p_tz - ^Az, P,z + B_z ] que correspondem ao ponto p_iz para um ponto divisório potencial corrente k, de acordo com a regra, em que i e z são números inteiros, e 1<z<M;

(b) determinar (402) se pelo menos uma parte dos dados na janela W_iz [ p_iz- A_z, p_iz+B_z ] atende uma condição predefinida C_z; e quando a pelo menos uma parte de dados na janela W,z [ p,, - A,, p_iz+B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades

U para buscar um ponto divisório de corrente de dados a partir do ponto p_iz ao longo de uma direção de buscar um ponto divisório de corrente de dados, em que N*U não é maior que IIB_z 11+ max_x (|| A_x ||+||(k, -p,_x )H), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e

W (c) quando pelo menos uma parte de dados em cada janela ^ix[^p,x -A^x, P_a+B^x ] de M janelas do ponto divisório potencial corrente ^k atende a condição predefinida ^Cx selecionar o ponto divisório potencial corrente como um ponto divisório de corrente de dados.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições A = A_f, B_e = B_f, e C_e = C_f.
3. Método, de acordo com a reivindicação 2, CARACTERIZADO

Petição 870180164797, de 18/12/2018, pág. 16/35

2/20 pelo fato de que a regra compreende adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos pe e pf, estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.
4. Método, de acordo com a reivindicação 2 ou 3, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que uma distância entre os pelo menos dois pontos pe e pf é de 1 U.
5. Método, de acordo com qualquer uma das reivindicações 1 a 3, CARACTERIZADO pelo fato de que determinar se pelo menos uma parte de dados na janela W_iz [ p_iz - A₂, p_iz+B₂ ] atende uma condição predefinida Cz compreende especificamente:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ p_iz - A_z, p_iz+B_z ] atende a condição predefinida Cz.
6. Método, de acordo com a reivindicação 5, CARACTERIZADO pelo fato de que determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ p_iz - A₂, p_iz+B_z ] atende a condição predefinida C₂ é especificamente: determinar, usando uma função hash, se a pelo menos uma parte de dados na janela ^W [ p,z - ^Az, p>2+^Bz ] atende a condição predefinida C₂
7. Método, de acordo com qualquer uma das reivindicações 1 a 3, CARACTERIZADO pelo fato de que, quando a pelo menos uma parte de dados na janela W_iz [ p_iz - A₂, p_iz+B₂ ] não atende a condição predefinida Cz, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto piz ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W_ic[ p_lc -A_c, p_ic + B_c ] que correspondem a um ponto p_ic que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_iz [ p_iz-A₂, p_iz+B_z ] ou um limite à esquerda de uma janela W_ic [p_ic -A_c, p_ic + B_c ] que correspondem a um ponto pic que é determinado para que o novo ponto

Petição 870180164797, de 18/12/2018, pág. 17/35

3/20 divisório potencial caia dentro de uma faixa da janela W_iz [ p_iz - A_z, p_iz+B_z ], em que o ponto p_ic determinado para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com a direção de busca por um ponto divisório de corrente de dados, de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.
8. Método, de acordo com a reivindicação 5, CARACTERIZADO pelo fato de que determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ p_iz- A_z, p_iz + B_z ] atende a condição predefinida C_z compreende especificamente:

selecionar F bytes na janela W_iz [ p_iz- A_z, p_iz + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, em que F>1, cada byte é formado por 8 bits, que são indicados por a_mX, ..., e , representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que

correspondem aos F*H bytes podem ser representados como: ' ^ai,1 ^a1,2 ··· ^a1,8 ^a2,1 ^a2,2 ··· ^a2,8 , em que quando a_m,_n - 1, Vam,n -1, e quando ^amn =^0, Ç ^aF*H ,1 ^aF*H ,2 ··· ^aF*H ,8 y V = am,n -1, em que a representa qualquer um dentre ^a _m4, ..., e ^am , uma

matriz V„ é obtida de acordo com uma relação de conversão entre a e V a s m,n am, a partir dos bits que correspondem aos F*H bytes, a matriz V é representada como:

Va,A

Va>.2

Va 2,1

Va!., ]

F*H*8 números aleatórios são selecionados _ç ^VF*H,1 ^VaF*H.2 ’ ’ ’ ^VaF*H,8 _y a partir de números aleatórios seguindo-se uma distribuição normal para formar uma matriz R, a matriz R é representada como:

⁽ h1,1 ^h1,2 ^· h / · ^h1,8 ^h2,1 ^h2,2 ^· h · ^h2,8 h ç ^hF*H ,1 h ^hF*H,2 · h · ^hF*H ,8 y

números aleatórios em uma emésima linha da matriz V_a e em uma emésima

Petição 870180164797, de 18/12/2018, pág. 18/35

4/20 linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am,₁ * h_m1 + V_am2 * h_m2+...+ ₈*h_m8, S_aX, S_a2, ..., e S_aF*_H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entre S_fll , S_e2, ..., e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W [ p,_z- A_z, p,_z + B_z ] atende a condição predefinida C_z.
9. Método para buscar um ponto divisório de corrente de dados, realizado por um servidor de desduplicação e CARACTERIZADO pelo fato de que compreende:

uma regra predefinida no servidor de desduplicação é: para um ponto divisório potencial k, determinar M janelas W_x [k- A_x, k + B_x ], e uma condição predefinida C_x que corresponde à janela W_x [k- A_x, k + B_x ], em que x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_x são números inteiros e o método compreendendo:

(a) determinar (2001) uma janela correspondente W,z [ ki- Az, k, + B_z ] para um ponto divisório potencial corrente ki de acordo com a regra, em que i e z são números inteiros, e 1<z<M;

(b) determinar (2002) se pelo menos uma parte de dados na janela W,_z [k_t - A_z, k, + B_z ] atende uma condição predefinida C_z; e quando a pelo menos uma parte de dados na janela W,z[ki-Az, k, +B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k_i ao longo de uma direção de buscar um ponto divisório de corrente de dados, em que N*U não é maior que IIB_z 11+ max_x (|| A_x ||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela W,x [k, - A_x, k, + B_x ] de M janelas do ponto divisório potencial corrente k, atende a

Petição 870180164797, de 18/12/2018, pág. 19/35

5/20 condição predefinida C_x, selecionar o ponto divisório potencial corrente k_lcomo um ponto divisório de corrente de dados.
10. Método, de acordo com a reivindicação 9, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que pelo menos duas janelas W_le [k_l - A_e, k_l + B_e ] e W_f [k_l - A_f, k_l + B_f ] atendem as condições | A_e + B_e |=| A_f + Bf | e C_e = C_f.
11. Método, de acordo com a reivindicação 10, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que A_e e A são números inteiros positivos.
12. Método, de acordo com a reivindicação 10 ou 11, CARACTERIZADO pelo fato de que a regra compreende adicionalmente A_e 1 = A_f e B_e +1 = B_f.
13. Método, de acordo com qualquer uma das reivindicações 9 a 11, CARACTERIZADO pelo fato de que determinar se pelo menos uma parte de dados na janela W_iz [k_t - A_z, k_l + B_z ] atende a condição predefinida C₂compreende especificamente:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [k_t - A_z, k_l + B_z ] atende a condição predefinida Cz.
14. Método, de acordo com a reivindicação 13,

CARACTERIZADO pelo fato de que determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela ^Wiz [ ^ki - , K + ^Bz ] atende a condição predefinida C_z é especificamente: determinar, usando uma função hash, se a pelo menos uma parte de dados na janela W_iz [k_i - A_z, k_l + B_z ] atende a condição predefinida C_z.
15. Método, de acordo com qualquer uma das reivindicações 9 a 11, CARACTERIZADO pelo fato de que quando a pelo menos uma parte de dados na janela W_iz [k_i - A_z, k_l + B_z ] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados

Petição 870180164797, de 18/12/2018, pág. 20/35

6/20 são puladas a partir do ponto divisório potencial corrente k ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W_lc [ k -A_c, k_i + B_c ] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_lz [k_l -A_z, k_l + B_z ] ou um limite à esquerda de uma janela W_lc [k_l -A_c, k_l + B_c ] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_lz [k_t -A_z, k_l + B_z ], em que a janela W_lc [k_l -A_c, k_l + B_c ] determinada para o novo ponto divisório potencial é uma janela colocada como a primeira em uma sequência, que é obtida de acordo com a direção de busca por um ponto divisório de corrente de dados, de M janelas que são determinadas para o novo ponto divisório potencial de acordo com a regra.
16. Método, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela Wz [ k_t - A_z, k_t + Bz ] atende a condição predefinida C_z compreende especificamente:

selecionar F bytes na janela W_lz [k_l - A_z, k_l + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, em que F>1, cada byte é

formado por 8 bits, que são indicados como a_mX,... , e a representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que correspondem aos F *H bytes podem ser representados como: ' ^ai,1 ^ai,2 · · ^ai,8 ^a2,1 ^a2,2 · · ^a2,8 , em que quando a =1, pn ¹ ’ ^V =^{1, e} q^uando a_mn =^0, y ^aF*H ,1 ^aF*H ,2 · · ^aF*H,8

V_amn =-1, em que a_mn representa qualquer um dentre a_m1,..., e a_m8, uma matriz

V_a é obtida de acordo com uma relação de conversão entre a_mn e V_am„ a partir dos bits que correspondem aos F*H bytes, a matriz V é representada como:

Petição 870180164797, de 18/12/2018, pág. 21/35

7/20 ,1

1,2 ^Va 2,1 ^Va 2,2 ^Va2,8

F*H*8 números aleatórios são selecionados a ^P_a-F*H,1 ^VaF*H,2 ’ ’ ’ ^BaF*H,8 j partir de números aleatórios seguindo-se uma distribuição normal para formar

uma matriz R, a matriz R é representada como: ' ^h1,1 ^h2,1 ^h1,2 · ^h2,2 · h F · ^h1,8 h · ^h2,8 h / ^hF*H ,1 h· ^hF*H,2 · h · ^hF*H ,8 J

números aleatórios em uma emésima linha da matriz V e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am,₁ * h_m1 + V_am2 * h_m2

+...+ Vam,8*hm,8, S_M, Sa2, ..., e ^SaF*H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entre S_a1, S_a2, ..., e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_z [k

- A, k + B ] atende a condição predefinida C₂.
17. Servidor para buscar um ponto divisório de corrente de dados, CARACTERIZADO pelo fato de que o servidor compreende uma unidade de processamento central e uma memória principal, a unidade de processamento central se comunica com a memória principal, e uma regra predefinida no servidor é: para um ponto divisório potencial k, determinar M pontos p_x, uma janela W_x [ p_x - A_x, p_x + B_x ] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [ p_x - A_x, p_x + B_x ], em que x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_x são números inteiros;

e a memória principal é configurada para armazenar uma instrução executável, e a unidade de processamento central executa a instrução executável para realizar as seguintes etapas:

(a) determinar um ponto p_iz e uma janela W_iz [p_z- A₂, p_iz+B₂ ] que corresponde ao ponto piz para um ponto divisório potencial corrente ki de acordo com a regra, em que i e z são números inteiros, e 1<z<M;;

Petição 870180164797, de 18/12/2018, pág. 22/35

8/20 (b) determinar se pelo menos uma parte de dados na janela W_iz[ P_iz - A, P_iz+] atende uma condição predefinida C_z; e quando a pelo menos uma parte de dados na janela W,z [ Piz - Az , P_iz+B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto Piz ao longo de uma direção de buscar um ponto divisório de corrente de dados, em que N*U não é maior que IIB_z ||+max_x (|| A_x ||+||(k_i -p_ix )||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela Wix [ Px - A_x, p_ix+B_x ] de M janelas do ponto divisório potencial corrente k_i atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_icomo um ponto divisório de corrente de dados.
18. Servidor, de acordo com a reivindicação 17, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições ^Ae = Af , ^Be = B_f , e ^C _e = ^Cf .
19. Servidor, de acordo com a reivindicação 18, CARACTERIZADO pelo fato de que a regra compreende adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos p_e e p_f, estão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.
20. Servidor, de acordo com a reivindicação 18 ou 19, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que uma distância entre os pelo menos dois pontos p_e e p_f é de 1 U.
21. Servidor, de acordo com qualquer uma das reivindicações 17 a 19, CARACTERIZADO pelo fato de que a unidade de processamento central é especificamente configurada para determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ p_iz- A_z, p_iz+B_z ] atende a condição predefinida C_z.

Petição 870180164797, de 18/12/2018, pág. 23/35

9/20
22. Servidor, de acordo com a reivindicação 21, CARACTERIZADO pelo fato de que a unidade de processamento central é especificamente configurada para determinar, usando uma função hash, se a pelo menos uma parte de dados na janela ^W [ Piz - Az, Piz+^Bz ] atende a condição predefinida C_z.
23. Servidor, de acordo com qualquer uma das reivindicações 17 a 19, CARACTERIZADO pelo fato de que quando a pelo menos uma parte de dados na janela W_iz [ p_iz - A_z, p_iz+B_z ] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto p_iz ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W [ Pic -A_c, p_ic + B_c ] que corresponde a um ponto p_ic que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_iz [ p_iz-A₂, p_iz+B_z ] ou um limite à esquerda de uma janela W_ic [p_ic -A_c, p_ic + B_c ] que corresponde a um ponto p_ic que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_iz [ p_iz - A_z, p_iz + B_z ], em que o ponto p_ic determinado para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com a direção de busca por um ponto divisório de corrente de dados, de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.
24. Servidor, de acordo com a reivindicação 21, CARACTERIZADO pelo fato de que determinar, pela unidade de processamento central usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ p_iz- A_z, p_iz + B_z ] atende a condição predefinida C_z compreende especificamente:

selecionar F bytes na janela W_iz [ p_iz- A_z, p_iz + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, em que F>1, cada

Petição 870180164797, de 18/12/2018, pág. 24/35

10/20 byte é formado por 8 bits, que são indicados como a_ml, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que correspondem aos F*H bytes podem ser representados como:

f ^ai,1 ^ai,2 ··· ^ai,8 ^a2,i ^a2,2 ··· ^a2,8 ^aF*H ,1 ^aF*H ,2 ··· ^aF*H,8 _y V= am,n -1, em que am,n re

, em que quando a^ =1, V_am,_n =1, e quando a^ 0, qualquer um dentre a , ..., e a , uma matriz V„ é obtida de acordo com uma relação de conversão entre a e V a s m, n am, a partir dos bits que correspondem aos F*H bytes, a matriz V é representada como:

f Va1,1

Va 2,1

Va1,2

Va 2,2 ^VaF*H ,8 j

F*H*8 números aleatórios são selecionados ₈ ^VaF*H,1 ^VaF*H,2 a partir de números aleatórios seguindo-se uma distribuição normal para formar uma matriz R, a matriz R é representada como:

f ^hi,i ^h1,2 ^· h õ · ^h1,8 ^h2,1 ^h2,2 ^· h · ^h2,8 h ^hF*H ,1 h ^hF*H,2 · h · ^hF*H ,8 j

e em uma emésima números aleatórios em uma emésima linha da matriz ^Va linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am,₁ * h_m1 + V_am,₂ * h_m,₂+...+ Vam,8*hm,8, S_al, S_a2, ..., e ^S _aF*H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entre S_a1, S_a2, ..., e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela w [ p_z - A, p_iz + B_z ] atende a condição predefinida C_z.
25. Servidor para buscar um ponto divisório de corrente de dados, CARACTERIZADO pelo fato de que o servidor compreende uma unidade de processamento central e uma memória principal, a unidade de processamento central se comunica com a memória principal, e uma regra predefinida no servidor é: para um ponto divisório potencial k, determinar M janelas W [ k - A_x

Petição 870180164797, de 18/12/2018, pág. 25/35

11/20 , k + B_x ] e uma condição predefinida C_x que corresponde à janela W [ k - A_x, k + B_x ] em que x indica números naturais consecutivos de 1 a M, M>2, e A_x e B_x são números inteiros; e a memória principal é configurada para armazenar uma instrução executável, e a unidade de processamento central executa a instrução executável para realizar as seguintes etapas:

(a) determinar uma janela correspondente W,_z [k, - A₂, k, + B₂ ] para um ponto divisório potencial corrente k_i de acordo com a regra, em que i e z são números inteiros, e 1<z<M;;

(b) determinar se pelo menos uma parte dos dados na janela Wz [k, - A_z, k, + B_z ] atende uma condição predefinida C₂; e quando a pelo menos uma parte de dados na janela W,z [ k, - Az, k, +B_z ] não atende a condição predefinida C₂, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k ao longo de uma direção de buscar um ponto divisório de corrente de dados, em que N*U não é maior que IIB_z 11+ max_x (|| A_x ||), de modo a obter um novo ponto divisório potencial, e realizar a etapa (a); e (c) quando pelo menos uma parte de dados em cada janela W x [k, - A_x, k, + B_x ] de M janelas do ponto divisório potencial corrente k, atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k, como um ponto divisório de corrente de dados.
26. Servidor, de acordo com a reivindicação 25, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que pelo menos duas janelas W,_e [k_t - A_e, k, + B_e ] e w_if [k, - A_z, k, + B_f ] atendem as condições | A + B |=| A_f + B_f | e C = C_f.
27. Servidor, de acordo com a reivindicação 26, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que Ae e A são números inteiros positivos.
28. Servidor, de acordo com a reivindicação 26 ou 27,

Petição 870180164797, de 18/12/2018, pág. 26/35

12/20

CARACTERIZADO pelo fato de que a regra compreende adicionalmente A_e 1 = A_y e B_e +1 = b .
29. Servidor, de acordo com qualquer uma das reivindicações 25 a 27, CARACTERIZADO pelo fato de que a unidade de processamento central é especificamente configurada para determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_IZ [ k - A_z, ki + B_z ] atende a condição predefinida C_z.
30. Servidor, de acordo com a reivindicação 29,

CARACTERIZADO pelo fato de que a unidade de processamento central é especificamente configurada para determinar, usando uma função hash, se a pelo menos uma parte de dados na janela [ ^ki - A, ^k + ^Bz ] atende a condição predefinida C_z .
31. Servidor, de acordo com qualquer uma das reivindicações 25 a 27, CARACTERIZADO pelo fato de que quando a pelo menos uma parte de dados na janela W_iz [k_t - A_z, k_t + B_z ] não atende a condição predefinida C_z, o mínimo N de unidades U para buscar um ponto divisório de corrente de dados são puladas a partir do ponto divisório potencial corrente k_i ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial e, de acordo com a regra, um limite à esquerda de uma janela W_ic [k_i -A_c, k_i + B_c ] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_iz [k_t -A_z, k_t + B_z ], ou um limite à esquerda de uma janela W_ic [k_i -A_c, k_i + B_c ] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_iz [k_t -A_z, k_t + B_z ], em que a janela W_ic [k_i -A_c, k_i + B_c ] determinada para o novo ponto divisório potencial é a janela colocada como a primeira em uma sequência, que é obtida de acordo com a direção de busca por um ponto divisório de corrente de dados, de M janelas que são determinadas para o novo ponto divisório potencial de acordo com a regra.
32. Servidor, de acordo com a reivindicação 29, CARACTERIZADO pelo fato de que determinar, pela unidade de

Petição 870180164797, de 18/12/2018, pág. 27/35

13/20 processamento central usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [ k_l - A, k_t + B_z ] atende a condição predefinida C_zcompreende especificamente:

selecionar F bytes na janela W_iz [ k_l - A, k_t + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, em que F>1, cada byte é formado por 8 bits, que são indicados por a_ml, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que

correspondem aos F *H bytes podem ser representados como: ' ^ai,1 ^ai,2 ··· ^ai,8 ^a2,1 ^a2,2 ··· ^a2,8 , em que quando a,^ =1, =1, e quando a,^ =0, _< ^ap*H,1 ^aF*H,2 ··· ^aF*H ,8 y ^Vam,n =^{-1, em} que a representa qualquer um dentre a , ···, e a , uma

matriz V_a é obtida de acordo com uma relação de conversão entre a_m„ e V_am a partir dos bits que correspondem aos F*H bytes, a matriz V é representada como:

í

^V a1,1 ^V a1,2 ^V a1,8 V_a 2,1 Va₂,₂ · ·· V_a 2,8 _Ç ^VaF*H ,1 ^VaF*H ,2 ^VaF*H ,8 _y

, F*H*8 números aleatórios são selecionados a partir de números aleatórios seguindo-se uma distribuição normal para formar í b k . h. 3 uma matriz R, a matriz R é representada como:

^h1,1 ^h1,2 ^· · ^h1,8 ^h2,1 h ^h2,2 · h · ^h2,8 h Ç ^hF*H ,1 h ^hF*H,2 · h · ^hF*H ,8 y

J números aleatórios em uma emésima linha da matriz V e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am1 * h_m1 + V_am2 * h_m2

+...+ ₈*h_m8, , S_e2, ..., e S_aF*_H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entreS_aX, S_e2, ···. e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_lz [ p_lz- A_z, p_iz + B_z ] atende a condição predefinida C_z.

Petição 870180164797, de 18/12/2018, pág. 28/35

14/20
33. Servidor para buscar um ponto divisório de corrente de dados, CARACTERIZADO pelo fato de que uma regra predefinida no servidor é: para um ponto divisório potencial k , determinar M pontos p_x, uma janela W_x [ p_x - Αχ, p_x + B_x ] que corresponde ao ponto p_x, e uma condição predefinida C_x que corresponde à janela W_x [p_x - A_x, p_x + B_x ], em que x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros; e o servidor compreende: uma unidade de determinação (1901), configurada para realizar a etapa (a): (a) determinar um ponto p_iz e uma janela W_iz [ p_iz - A_z, p_iz+B_z ] que corresponde ao ponto p_iz para um ponto divisório potencial corrente k_i de acordo com a regra, em que i e z são números inteiros, e 1<z<M; e uma unidade de julgamento e processamento (1902), configurada para: determinar se pelo menos uma parte de dados na janela ^W [ Piz - ^A ₂ , Piz + B_z ] atende uma condição predefinida C_z;

quando a pelo menos uma parte de dados na janela W [ p.z - a, , p_iz+B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p_iz ao longo de uma direção de buscar um ponto divisório de corrente de dados, em que N*U não é maior que IIB_z 11+ max_x (|| A_x ||+||(k_t -p_ix )||), de modo a obter um novo ponto divisório potencial, em que a unidade de determinar realiza a etapa (a) para o novo ponto divisório potencial; e quando pelo menos uma parte de dados em cada janela Wx [ Px A_x, P_ix + B_x ] de M janelas do ponto divisório potencial corrente k_i atende a condição predefinida C_x, selecionar o ponto divisório potencial corrente k_i, como um ponto divisório de corrente de dados.
34. Servidor, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que pelo menos dois pontos p_e e p_f atendem as condições A, = A,, B, = B,, e C, =

Petição 870180164797, de 18/12/2018, pág. 29/35

15/20
35. Servidor, de acordo com a reivindicação 34, CARACTERIZADO pelo fato de que a regra compreende adicionalmente: com relação ao ponto divisório potencial k, os pelo menos dois pontos p_e e p_zestão em uma direção oposta à direção de buscar um ponto divisório de corrente de dados.
36. Servidor, de acordo com a reivindicação 34 ou 35, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que uma distância entre os pelo menos dois pontos p_e e p_z é de 1 U.
37. Servidor, de acordo com qualquer uma das reivindicações 33 a 35, CARACTERIZADO pelo fato de que a unidade de julgamento e processamento (1902) é especificamente configurada para determinar, usandose uma função aleatória, se a pelo menos uma parte de dados na janela W_Iz[ P_iz - A, P_iz+B_z ] atende a condição predefinida C_z.
38. Servidor, de acordo com a reivindicação 37, CARACTERIZADO pelo fato de que a unidade de julgamento e processamento (1902) é especificamente configurada para determinar, usando uma função hash, se a pelo menos uma parte de dados na janela ^W [ Piz - ^Az , Piz + ^Bz ] atende a condição predefinida C_z.
39. Servidor, de acordo com qualquer um dentre reivindicações 33 a 35, CARACTERIZADO pelo fato de que a unidade de julgamento e processamento (1902) é configurada para: quando a pelo menos uma parte de dados na janela W_iz [ p_iz - A_z, p_z + B_z ] não atende a condição predefinida C_z, pular o mínimo N de unidades U para buscar um ponto divisório de corrente de dados a partir do ponto p_z ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto divisório potencial, em que a unidade de determinação realiza a etapa (a) para o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W_ic[P_ic-A_c, p_ic + B_c ] que corresponde a um ponto p_ic que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela W_iz [ p_iz-A₂, p_iz+B_z ] ou um limite à esquerda de uma janela W_ic [p_ic -A_c, p_ic + B_c ] caia

Petição 870180164797, de 18/12/2018, pág. 30/35

16/20 dentro de uma faixa da janela W_i2 [ p_iz - A_z, p_iz+B_z ], em que o ponto ^BiCdeterminado para o novo ponto divisório potencial é um ponto colocado como o primeiro em uma sequência, que é obtida de acordo com a direção de busca por um ponto divisório de corrente de dados, de M pontos que são determinados para o novo ponto divisório potencial de acordo com a regra.
40. Servidor, de acordo com a reivindicação 37, CARACTERIZADO pelo fato de que a unidade de julgamento e processamento (1902) é especificamente configurada para determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iC [ p_ic - ^Ac , PiC + ^Bc ] atende a condição predefinida C₂ compreende especificamente:

selecionar F bytes na janela W_i2 [ p_i2- A₂, p_i2 + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, em que F>1, cada byte é formado por 8 bits, que são indicados como a_mX, ..., e a_m8, representando do primeiro bit ao oitavo bit de um emésimo byte nos F*H bytes, bits que correspondem aos F*H bytes podem ser representados como:

' ^ai, 1 ^a1,2 ^a1,8 ^a2,1 ^a2,2 ^a2,8 V ^aF*H, 1 ^aF*H, 2 ^aF*H,8 χ V= am.n -1, em que am,n re

, em que q^uando amn =^{1, V} =^{1, e} q^uando am,_n =^0, qualquer um dentre a_mX, ..., e a_m8, uma matriz V_a é obtida de acordo com uma relação de conversão entre a_mn e V_am a partir dos bits que correspondem aos F*H bytes, a matriz V é representada como:

Va,A

Va>.2

Va 2,1

Va!., Ι

F*H*8 números aleatórios são selecionados ,^VaF*//, 1 ^VaF*H, 2 ’ ’ ’ ^VaF*H, 8 χ a partir de números aleatórios seguindo-se uma distribuição normal para formar

' ^h1,1 ^h1,2 h / ^h1,8 uma matriz R, a matriz R é representada como: ^h2,1 ^h2,2 h ^h2,8 h / ^hF*H ,1 h ^hF*H,2 h ^hF*H ,8 X

números aleatórios em uma emésima linha da matriz V e em uma emésima

Petição 870180164797, de 18/12/2018, pág. 31/35

17/20 linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am,₁ * h_m1 + V_am2 * h_m2+...+ ₈*h_m8, S_aX, S_a2, ..., e S_aF*_H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entreS_aX, S_a2, ..., e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W [ p,_z- A_z, p_iz + B_z ] atende a condição predefinida C_z.
41. Servidor para buscar um ponto divisório de corrente de dados, CARACTERIZADO pelo fato de que uma regra predefinida no servidor é: para um ponto divisório potencial k , determinar M janelas W_x [k- A_x, k + B_x ] e uma condição predefinida C_x que corresponde à janela W_x [k- A_x, k + B_x ], em que x indica números naturais consecutivos de 1 a M, M>2, e Ax e Bx são números inteiros; e o servidor compreende: uma unidade de determinação (1901), configurada para realizar a etapa (a):

(a) determinar uma janela correspondente W_iz [k, - A_z, k, + B_z ] para um ponto divisório potencial corrente ki de acordo com a regra, em que i e z são números inteiros, e 1<z<M; e uma unidade de julgamento e processamento (1902), configurada para determinar se pelo menos uma parte de dados na janela Wz [ k, - Az, k, + B_z ] atende uma condição predefinida C_z;

quando a pelo menos uma parte de dados na janela W,z [ k,- A,, k, +B_z ] não atende a condição predefinida C_z, pular um mínimo de N unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k ao longo de uma direção de buscar um ponto divisório de corrente de dados, em que N*U não é maior que IIB_z ||+ max_x (|| A_x ||), de modo a obter um novo ponto divisório potencial, em que a unidade de determinação realiza a etapa (a) para o novo ponto divisório potencial; e quando pelo menos uma parte de dados em cada janela W, [ k< Ax , k + Bx ] de M janelas do ponto divisório potencial corrente k atende a

Petição 870180164797, de 18/12/2018, pág. 32/35

18/20 condição predefinida C_x, selecionar o ponto divisório potencial corrente k, como um ponto divisório de corrente de dados.
42. Servidor, de acordo com a reivindicação 41, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que pelo menos duas janelas W_ie [k_t - A_e, k_t + B_e ] e W_if [k, - A_f, k_i + B_f ] atendem as condições | A_e + B_e |=| a_z + B_z | e C_e = C_f.
43. Servidor, de acordo com a reivindicação 42, CARACTERIZADO pelo fato de que a regra compreende adicionalmente que Ae e A são números inteiros positivos.
44. Servidor, de acordo com a reivindicação 42 ou 43, CARACTERIZADO pelo fato de que a regra compreende adicionalmente A_e 1 = A_z e Be +1 = B_f.
45. Servidor, de acordo com qualquer uma dentre as reivindicações 41 a 43, CARACTERIZADO pelo fato de que a unidade de julgamento e processamento (1902) é especificamente configurada para:

determinar, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_iz [k_t - A_z, k, + B₂ ] atende a condição predefinida
46. Servidor, de acordo com a reivindicação 45, CARACTERIZADO pelo fato de que a unidade de julgamento e processamento (1902) determina especificamente, usando uma função hash, se a pelo menos uma parte de dados na janela W_iz [k, - A_z, k_t + B₂ ] atende a condição predefinida C₂.
47. Servidor, de acordo com qualquer uma das reivindicações 41 a 43, CARACTERIZADO pelo fato de que a unidade de julgamento e processamento (1902) é configurada para: quando a pelo menos uma parte de dados na janela W_iz [k_t - A_z, k_t + B_z ] não atende a condição predefinida C_z, pular o mínimo N de unidades U para buscar um ponto divisório de corrente de dados a partir do ponto divisório potencial corrente k_t ao longo da direção de buscar um ponto divisório de corrente de dados, de modo a obter o novo ponto

Petição 870180164797, de 18/12/2018, pág. 33/35

19/20 divisório potencial, a unidade de determinação realiza a etapa (a) para o novo ponto divisório potencial, e de acordo com a regra, um limite à esquerda de uma janela W_lc [k_l -A_c, k_l + B_c ] que é determinado para o novo ponto divisório potencial coincide com um limite à direita da janela ^Wiz [^ki -A, ^k B ] ou um limite à esquerda de uma janela Wic [ kl - Ac , k_i + Bc ] que é determinado para que o novo ponto divisório potencial caia dentro de uma faixa da janela W_lz [k_i A_z, k + B_z ], em que a janela W_lc [ k_l -A_c, k_l + B_c ] determinada para o novo ponto divisório potencial é uma janela colocada como a primeira em uma sequência, que é obtida de acordo com a direção de busca por um ponto divisório de corrente de dados, de M janelas que são determinadas para o novo ponto divisório potencial de acordo com a regra.
48. Servidor, de acordo com a reivindicação 46, CARACTERIZADO pelo fato de que a unidade de julgamento e processamento (1902) determina, usando-se uma função aleatória, se a pelo menos uma parte de dados na janela W_lz [k_l - A_z, k_t + B_z ] atende a condição predefinida C_z compreende especificamente:

selecionar F bytes na janela W_lz [k_l - A_z, k_{ + B_z ], e usar os F bytes repetidamente H vezes para obter F*H bytes no total, em que F>1, cada byte é formado por 8 bits, que são indicados como como a_mX,..., e a_m8 representando ao oitavo bit de um do primeiro bit

correspondem aos F ' ^ai, 1 ^ai,2 ·· ^ai,8 ^a2,1 ^a2,2 ^a2,8 ( ^a'F*H ,1 ^aF*H ,2 ^aF*H,8 y

*H bytes emésimo byte nos F*H bytes, bits que podem ser representados como:

, em que quando a_m,_n =1, V_am,_n =1, e quando a_m,_n =0,

V_amn =-1, em que a_mn representa qualquer um dentre a_m,₁,..., e a_m8, uma matriz

V é obtida de acordo com uma relação de conversão entre a e V a partir a s m, n am, n ~ dos bits que correspondem aos F*H bytes, a matriz V é representada como:

Petição 870180164797, de 18/12/2018, pág. 34/35

20/20 ,1

1,2 ^Va 2,1 ^Va 2,2 ^Va2,8

F*H*8 números aleatórios são selecionados a ^F_a-F*H,1 ^VaF*H,2 ’ ’ ’ ^VaF*H,8 y partir de números aleatórios seguindo-se uma distribuição normal para formar uma matriz R, a matriz R é representada como:

^h1,2 · h Ί · ^h1,8 ^h2,1 ^h2,2 · h · ^h2,8 h Ç ^hF*H ,1 h· ^hF*H,2 · h · ^hF*H ,8

números aleatórios em uma emésima linha da matriz V e em uma emésima linha da matriz R são multiplicados e os produtos são somados para se obter um valor, que é especificamente representado como S_am = V_am,₁ * h_m1 + V_am2 * h_m2

+...+ V_am,8*hm,8, S_a1, S_a2, ..., e ^SaF*H são obtidos de um mesmo modo, uma quantidade K de valores maiores que 0 entre S_a1, S_a2, ..., e S_aF*_H é contada, e quando K é um número par, a pelo menos uma parte de dados na janela W_iz [f

- A, f + B_z ] atende a condição predefinida C_z.

Petição 870180164797, de 18/12/2018, pág. 35/35