WO2008152277A2 - Procédé de traitement d'envois incluant une classification graphique des signatures associées aux envois - Google Patents

Procédé de traitement d'envois incluant une classification graphique des signatures associées aux envois Download PDF

Info

Publication number
WO2008152277A2
WO2008152277A2 PCT/FR2008/050885 FR2008050885W WO2008152277A2 WO 2008152277 A2 WO2008152277 A2 WO 2008152277A2 FR 2008050885 W FR2008050885 W FR 2008050885W WO 2008152277 A2 WO2008152277 A2 WO 2008152277A2
Authority
WO
WIPO (PCT)
Prior art keywords
signatures
image
signature
postal
sorting
Prior art date
Application number
PCT/FR2008/050885
Other languages
English (en)
Other versions
WO2008152277A3 (fr
Inventor
Olivier Desprez
Original Assignee
Solystic
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Solystic filed Critical Solystic
Priority to DK08805830.0T priority Critical patent/DK2155406T3/da
Priority to AT08805830T priority patent/ATE475492T1/de
Priority to US12/282,438 priority patent/US8126204B2/en
Priority to DE602008001985T priority patent/DE602008001985D1/de
Priority to JP2010509870A priority patent/JP4785986B2/ja
Priority to CN2008800181090A priority patent/CN101678404B/zh
Priority to CA2688163A priority patent/CA2688163C/fr
Priority to EP08805830A priority patent/EP2155406B1/fr
Publication of WO2008152277A2 publication Critical patent/WO2008152277A2/fr
Publication of WO2008152277A3 publication Critical patent/WO2008152277A3/fr

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/10Apparatus characterised by the means used for detection ofthe destination
    • B07C3/14Apparatus characterised by the means used for detection ofthe destination using light-responsive detecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/424Postal images, e.g. labels or addresses on parcels or postal envelopes

Definitions

  • Shipment processing method including a graphic classification of signatures associated with shipments
  • the invention relates to a method for processing postal items in which, during a first sorting pass of the items, a digital image is formed of the surface of each item comprising information blocks, and each image associated with the item is sending a digital signature to the image of a graphic imprint which is a logical identifier for sending, and storing in memory the signature associated with the sending in correspondence with sorting information and in which during a second sorting passes of the shipments, one again forms a digital image of said surface of each shipment to derive a current digital signature associated with the shipment and one of the signatures registered in the first sorting pass is searched for a match with this current signature in order to retrieve by association the sort information.
  • each digital signature comprises a first component called “image” representative of physical characteristics of the digital image of the corresponding sending and a second component called “postal” indicative at least of a spatial position of the blocks of information present in the image of the shipment.
  • the image component is formed by so-called “global” attributes that are representative of global physical characteristics taken on all the points of the digital image of the shipment.
  • the image component is formed of second so-called “local” attributes that are representative of local physical characteristics taken on distinct parts of a grid of the image of the shipment (or several different grids).
  • the object of the invention is therefore to propose a more robust method of processing mail which makes it possible to reduce the mismatches indicated above, more particularly in situations where the postal items to be sorted come from number senders and therefore have a very high graphical similarity.
  • the subject of the invention is a method for processing postal items in which, during a first sorting pass of the items, a digital image of the surface of each item containing information blocks is formed. derives from each image associated with a sending a digital signature which is a logical identifier for sending and stores in memory the signature associated with the sending in correspondence with sorting information and in which during a second sorting pass sendings, it again forms a digital image of said surface of each shipment to derive a current digital signature associated with the sending and searched among the signatures recorded in the first sorting pass a concordance with this current signature to recover by association the sorting information, characterized in that it comprises the following steps: - we group the signatures into categories of signatures or graphic classes according to a c ertain graphical similarity criterion for calculating an average signature value for each graphical class;
  • the idea underlying the invention is therefore to classify the successive signatures from consolidated real-time signature graphic models on the fly to reflect through each model the non-changing graphic appearance of the images of the items whose signatures relate to the model in question.
  • the activity analysis (or low frequency change) that is done at each consolidation or update of the model when grouping a new signature in the graphical class corresponding to this signature model, it is possible to display the position of the destination address block in the images of the items because this destination postal address block is probably the one with the most significant low frequency activity, unlike other blocks of information which are normally stable when considering the consignments of the same sender in number.
  • the process according to the invention may have the following particularities:
  • the signatures are grouped into graphic classes according to a certain criterion of graphic similarity of their image component to calculate an average value of the image components of the signatures belonging to the graphic class considered.
  • the activity of the average value of the image component is analyzed to detect a significant activity of an information block in the digital images; the results of said activity detection are used to compare the postal components of the signatures;
  • the global attributes and the local attributes of the signatures are used to establish a similarity of signatures; a thresholding of the normed vector distance is performed on the global attributes to establish the said similarity
  • the method according to the invention can be implemented with any type of postal items such as letters, flat objects of small or large format.
  • the method according to the invention can also be applied to the sorting of packets and other articles identified by a virtual identification code.
  • Figure 1 very schematically illustrates a mailing with several blocks of information.
  • FIG. 2 schematically shows a sorting machine for implementing the method according to the invention.
  • FIG. 3 illustrates in the form of a flow chart the sequence of the known sorting process during a first sorting pass.
  • Figure 4 illustrates very schematically the extraction of the image component of the signature of a postal item.
  • Figure 5 illustrates very schematically the extraction of the postal component of the signature of a postal item.
  • FIG. 6 illustrates in the form of a flowchart the progress of the method according to a first embodiment of the invention during a second sorting pass.
  • Figure 7 details the step of classification of signatures in the method according to the invention.
  • FIG. 8 represents the comparison of the image components during the classification of signatures in the method according to the invention.
  • FIG. 9 represents an example of updating the image components of the graphic classes in the method according to the invention.
  • Figure 10 details the step of modifying the postal component of the current mail from the image component of the corresponding graphics class.
  • Figure 11 details the step of modifying the postal component of the current mail from the postal component of the corresponding graphics class.
  • FIG. 12 illustrates in the form of a flowchart the flow of the method according to a second embodiment of the invention during a second sorting pass.
  • Figure 13 illustrates the principle of a reduction of exploration space by a prediction mechanism
  • postal items such as letters, flat objects of small or large size with a paper or plastic envelope, and other article to be sorted automatically by digital signatures which are derived from the image are identified. from the surface of shipments that usually has a destination postal address block.
  • This digital signature still called image signature is therefore used to uniquely identify a shipment in place of a barcode chronomarch in an automatic postal sorting machine.
  • the term machine refers broadly to postal sorting equipment installed on one or more postal sorting sites including video encoders where appropriate.
  • FIG. 1 illustrates a postal item referenced P whose surface comprises, for example, a first AD information block which corresponds to the postal delivery address or destination address, an AE information block which corresponds to a sender address and an information block L that can take the form of a graphic logo that corresponds to other additional textual information such as an advertising flame printed by the sender.
  • FIG. 2 very schematically illustrates a postal sorting machine 1 which conventionally comprises a feed inlet 2 with a magazine for loading mailpieces P and a unstacker for serially putting on the edge of shipments a digital camera 3 to form an image of the surface of each shipment comprising the various information blocks recalled above, and a bucket carousel 4 which directs the shipments to sorting outlets 5.
  • Each sorting outlet can be equipped with several bins (typically a front and a rear tray) sorting outlet or compartmentalized tray without departing from the scope of the invention.
  • a referenced data processing system 6 for the OCR postal address recognition which is associated with a video coding system 7 as is well known.
  • the system 6 is also arranged to derive from the digital image of a transmission formed by the camera 3 a digital signature.
  • system 9 similar to the system 6 but which is part of another sorting machine 10, this system 9 being connected in communication for example by a telecommunication network 8 to system 6 for an application of the method according to the invention to a sorting process in several sorting passes on several sorting machines.
  • FIG. 3 schematically illustrates the construction of the digital signatures during a first sorting pass in the machine 1.
  • postal items P are injected into the sorting machine 1 through the feed inlet. 2.
  • the postal items P are unstacked and conveyed serially on edge to the digital camera 3.
  • a digital image is formed of the surface of the current mail item that can comprise the various information blocks illustrated in FIG. 1, for example AE, AD and L.
  • step 13 the system 6 undertakes an automatic OCR distribution address recognition from the image and at the same time derives from this image a digital signature V-Id assigned to the transmission.
  • step 14 if the postal address has been uniquely recognized in step 13, the address data resulting from OCR recognition in correspondence with the signature V is stored in machine memory in step 16. Id of the sending.
  • step 15 the image of the sending is transmitted to the video coding system 7 for an extraction of the address information by a video coding operator, whereupon the address information obtained by video coding in 15 are recorded at 16 in correspondence with the signature obtained at step 13.
  • the block indicated by 17 represents a database called BDref in which the digital signature V-Id and sorting data (including the address information) of the sending are recorded in correspondence for each sending. recognized by OCR or video-coding during the first sort pass.
  • Step 18 corresponds to the process of conveying the shipment from the camera 3 to the sorting outlets of the machine.
  • FIG. 4 again shows the digital image of a postal item P, generally a digital image with several gray levels, with the information blocks AD, AE and L.
  • a first component of the signature according to the invention is called “image component” Ci which is representative of the physical characteristics of the image.
  • This image component is for example extracted by statistical analysis of the luminance of the points of the digital image which will have previously undergone a succession of filtering lowering the resolution level of the image in order to reduce the processing times for the statistical analysis and to have a low-frequency type of content which is insensitive to luminance fluctuations during multiple acquisitions.
  • the luminance of a point in the image corresponds to the gray level value of the image point.
  • the system 6 extracts by calculation, global attributes representative of global physical characteristics of the image such as the height and the width of the mailpiece, the average luminance value of the images. points of the digital image, standard deviation, entropy of luminance values.
  • FIG. 4 shows the digital image of the transmission P subdivided into several distinct parts B11, B'45 coming from different grids or meshes M1, M2, M3, M4, M5 in the digital image.
  • Grid M1 here defines 3x3 distinct parts.
  • the M5 grid defines 8x10 distinct parts.
  • the number of distinct parts in a grid and the number of grids may be a parameter of the statistical analysis applied to the digital image to extract the image component Ci from the signature.
  • each part such as B11 and B'45 of the digital image resulting from a grid such as M1 or M3 one can extract local attributes such as the average luminance value of the points of this part of the digital image, standard deviation, entropy of the luminance values in this part of the digital image.
  • These local attributes contain information all the more discriminating that postal items are heterogeneous.
  • the set of global and local attributes extracted for a digital image therefore constitute the image component Ci of the signature.
  • FIG. 5 there is illustrated a second component called "postal component" Cp of the signature which is indicative at least of the spatial position of the information blocks such as AD, AE and L in an image of a shipment.
  • An OCR optical character recognition system conventionally used in a postal sorting machine is capable of providing data indicative of the spatial position of the textual information blocks detected in the digital image. These indicative spatial position data may be the spatial and orientation coordinates of the rectangular area forming each information block.
  • An OCR system is also able to provide a textual description of each block of information detected in the digital image.
  • a textual description of a block of information such as AD may consist in indicating the number of lines of characters detected in the information block, the number of words detected in each line of characters, the number of characters detected in each word of each line of characters.
  • FIG. 5 illustrates an example of a textual description of the information block AD constituting the postal component Cp of the signature of a postal item:
  • BLOCK # 0/3 denoted by 33, references the information block O among the 3 blocks of information detected in the digital image;
  • HN denoted by 33 ', is a datum indicative of the orientation of the information block 0 in the digital image
  • NbLines 4" denoted by 33 ' indicates that the information block 0 has 4 lines of characters;
  • Line # 0 denoted by 34, references the first line of characters detected in information block 0;
  • NbMots 03 denoted by 35, is a datum indicating that 3 words have been detected in the first line of characters;
  • NbCarParMot 01 06 04 denoted by 36, are data indicating that the 3 words of the first line of characters comprise respectively 1, 6 and 4 characters;
  • Car # 0 (1,007 I 009 i 019) denoted by 37, are data indicating that for the first character of the first line of characters, the OCR has identified 3 candidate characters respectively 1, I and i with distances resemblance respectively 007, 009 and 019;
  • Car # 1 (L 008 E 009 D 057)" denoted by 38, are data indicating that for the second character of the first line of characters, the OCR has identified 3 candidate characters respectively L, E and D with distances resemblance respectively 008, 009 and 057;
  • a digital image of a postal item is an interpretable two-dimensional signal whose content can be apprehended both physically and symbolically.
  • the signature of a postal item is formed of two complementary components Ci and Cp which are not correlated with one another (independent of one another).
  • FIG. 6 shows the signature management process during a second sorting pass following the first sorting pass illustrated in FIG. 3.
  • the sorted items in the first pass are therefore entered again in the machine of FIG. sort 1 and pass serially on edge in front of the camera 3.
  • the current signature V-IdC includes an image component CiC and a postal component CpC.
  • step 46 comparing the image and postal components CiC and CpC of the current signature V-IdC with the image and postal components Ci, Cp of the signatures recorded in the BDRef database 17 to detect a match.
  • This comparison can begin with the comparison of the respective global attributes of the image components which includes a thresholding of the absolute values of the variations on each global attribute to make a first filtering among the signatures recorded in the base 17.
  • This filtering makes it possible to eliminate the signatures strongly. dissociating from the current signature and retaining only a small number of candidate signatures for further comparison.
  • a comparison of the local attributes of the image component is performed on these candidate signatures, which can further reduce the number of candidate signatures in the base 17.
  • This comparison can be based firstly on the calculation of a normalized sliding correlation coefficient. between the corresponding histograms in the current signature and the candidate signatures respectively, which makes it possible to overcome the luminance variations between the two compared digital images and then on the calculation of a normalized correlation coefficient, by attribute type, between the other local attributes in the current signature and in the candidate signatures respectively which makes it possible to overcome the problems of normalization due to the difference of variability of each local attribute.
  • the candidate signatures are then sorted in descending order of similarity based on the correlation coefficients and a fixed number of most similar candidate signatures are retained.
  • candidate signatures can then be sorted in descending order from a measure of similarity of the textual descriptions of the information blocks.
  • step 46 If in step 46, it is not possible to detect a match, then in step 47, the current send is sent to a reject output so that it can be sorted manually, for example. If in step 46, a match is detected, the sort and address data for the current mail is retrieved from the base 17 and the current mail is automatically directed to a corresponding sorting output in step 48. .
  • a reliability process is carried out on the one hand of the current signature and on the other hand of the signatures of the BDRef base using a classification of these signatures. This reliability makes it possible, during the concordance search, to adjust the postal component of the signatures to be compared so as to avoid mismatches.
  • the principle of this classification is to first create a kind of dictionary in which are listed categories or "graphic classes" CG signatures.
  • Each graphical class is modeled by a CiCG image component and a CpCG postal component similar to that of a signature as described above.
  • this dictionary is scalable in real time in the sense that the image and postal components of the graphic classes are updated on the fly, that is to say that as and when we assign a signature to a graphical class and this graphical class is therefore consolidated.
  • This update on the fly does not require treatment deferred, it is executed in real time.
  • it is not necessary to transmit the dictionary for subsequent sorting in a remote sorting center.
  • an average value of the image component (consolidation phase) is calculated at each updating of a graphic category and the low frequency activity of the image component is analyzed. This average value for evaluating the position of the destination address block, which makes it possible, during the concordance search at step 46, to use the appropriate information block when comparing the postal component of the signatures.
  • Low frequency analysis is an analysis of changes among low resolution images.
  • step 43 a classification process of the current signature VidC is thus performed, that is to say that the image component CiC of the current signature is compared with the image component CiCG of the graphic classes present in the dictionary 19 to determine the CGx graphical class of the dictionary that is most similar to the current signature. More particularly according to the method of the invention, the local and global attributes of the image components CiC and CiCG are compared to identify a graphical class of CGx membership at the output of step 43. If no graphical class of the dictionary corresponds to the current signature, there is creation of a new CGx graphical class.
  • FIGS. 7 and 8 illustrate more particularly the process of comparing the image components to achieve this classification. These are discussed below.
  • step 44 an analysis of the low frequency activity of the image component of the CGx graphic class is performed to detect a significant low frequency activity of an information block in the digital images. associated with the signatures in this graphical class.
  • This step 44 is described more particularly with reference to FIG. 9.
  • step 45 for the current signature, a reliability process is carried out on the basis of the results of the activity analysis in step 44 which is more detailed with reference to FIGS. 10 and 11.
  • the postal components of the current signature and the graphic class CGx can be adjusted. These adjustments make it possible to avoid mismatches in step 46 of matching with the signatures recorded in the base 17.
  • step 46 of concordance search one carries out in 50 a consolidation of the postal component of the graphical class CGx identified for the current sending that if in the preceding step 49 one is in a situation or a certain "postal criterion" loud "is checked.
  • CpC of the current signature and a matched signature identified in step 46 are similar (for example: same identification of the destination address block, same number of lines of characters in that block, same number of words per line in this block, etc.).
  • steps 41 to 50 in FIG. 6 is thus repeated for the successive current items processed in the second sorting pass.
  • step 43 of the classification of signatures has thus been illustrated in greater detail.
  • the dictionary or database 19 CG graphical classes is normally empty.
  • NbMaxCG may for example be conditioned by a "priori" information given by the machine operator indicative of the heterogeneity of the postal items to be processed. In general for a two-pass sorting of mail from several shippers in number, we can set the NbMaxCG value to about 100.
  • a value NbMaxCG equal to 100 corresponds to a batch of mail items weakly homogeneous, that is to say Say with a number of successive shipments belonging to the same sender which is relatively low.
  • the current image component is compared to step 51.
  • the comparison of the image components is carried out in the same manner as previously described for step 46. In particular, the comparison is first performed on the global attributes and then on the local attributes of the image components CiC and CiCG.
  • the global and local attributes are obtained from a low resolution digital image of the transmission, for example 0.25 pixels per mm.
  • FIG. 8 illustrates more particularly this step 51 for comparing the global (51a) and local (51b) attributes of the image components CiC and CiCG.
  • global attributes we have illustrated: the height H of the postal item, the width L, average luminance value I of the points of the digital image, the standard deviation E and the entropy S of the luminance values.
  • frame 52 On the left in FIG. 8, there is illustrated in frame 52 a first vector (one-column table) the values H, L, I, E, T for CiC and by some vectors the similar values for CiCGs associated with classes CG1 , CG2, ...., CGN
  • each global attribute of the image component CiC is first compared with the corresponding attribute of one of the image components CG1, CG2, ...., CGN.
  • the difference between the heights H of CiC and of CG1 is compared with a threshold ⁇ 1
  • the difference between the widths L of CiC and of CGI is compared with a threshold ⁇ 2.
  • the thresholds ⁇ 1, x2 ... can be different, and if for all the attributes, the difference is lower than the threshold then CG1 is candidate.
  • a distance calculation is then carried out (standard vector distance designated in FIG. 8 by DVN) between the HLIET vector for CiC and the HLIET vector of each candidate graphical class.
  • These normalized vector distances DVN are also compared to a threshold (which can be adjustable) in step 53 to determine the graphical class (es) CGi that are most similar to the current signature.
  • a threshold which can be adjustable
  • the local attributes of the image component CiCG of these graphic classes are compared with the local attributes of the image component CiC of the current signature.
  • the local attributes in the frame 54 are illustrated by triplets of 4x4 matrices (thus resulting from a 4x4 grid for the construction of the signature) assigned respectively to the average luminance value I of points image, the standard deviation E and the entropy S of the luminance values.
  • the local CiC attributes are correlated with the CiCG local attributes of each graphical class selected at 53 and the highest calculated DC correlation coefficient (-1 ⁇ CC ⁇ 1) is retained at the end of the step 51.
  • the highest calculated DC correlation coefficient (-1 ⁇ CC ⁇ 1) is retained at the end of the step 51.
  • a correlation coefficient CC is compared with a threshold (adjustable if necessary) to undertake an updating of the dictionary 19 of the graphic classes.
  • a threshold adjustable if necessary
  • a new graphic class CGx is added in step 56 in dictionary 19 and the number of graphic classes maintained in the dictionary is updated (if applicable deleting a graphical class if the NbMaxCG value is exceeded, the graphical class deleted from the dictionary being the one that is least used during a reference period, for example).
  • the CiCG and CpCG components of the new CGx graphical class are initialized with the CiC and CpC components of the current signature used in step 46.
  • step 55 the correlation coefficient CC is greater than or equal to the threshold, the utilization counter of the graphic class CGx is updated to 57 and this graphic class CGx is updated.
  • step 55 makes it possible to adjust the level of similarity required for categorization. In practice, it is necessary to find a threshold which makes it possible to gather the signatures of important graphic resemblance by avoiding that the sending of the same sender with the same graphic appearance can lead to the creation of several graphic classes. At the end of step 43, a graphic class CGx is therefore identified as similar to the current signature VidC.
  • FIG. 9 illustrates a set of local attributes of the image component of the graphic class CGx which are used for the analysis of low frequency activity in step 44 in FIG. 6.
  • These local attributes are values standard deviation on: average luminance I, standard deviation E and entropy T. These values relate to distinct zones of a certain grid of the image of a transmission as explained above. As an example, a grid of the 5 ⁇ 5 image is shown in the figure, which gives 3 matrices 60 with each 25 standard deviation values. To calculate each standard deviation value in a matrix I55, E55 and T55, a consolidated average is made with the corresponding value of the local attribute of the current signature. It can therefore be considered that by calculating this standard deviation an average signature value is calculated for the graphical class CGx.
  • the 3 matrices I55, E55 and T55 can be fused into a matrix G55, for example according to a standardized principal component analysis (PCA) well known to those skilled in the art.
  • This matrix G is a kind of "grid of changes" that exhibits the low-frequency changes, that is to say the changes that occur at each consolidation of the matrix G.
  • the "K-means” method makes it possible to isolate matrix elements in the matrix G according to 3 levels: Non-changing level - Little changing level - Very changing level, respectively illustrated by squares in white, gray and black.
  • Non-changing level Little changing level
  • Very changing level respectively illustrated by squares in white, gray and black.
  • the spatial position of an information block having the most significant low frequency activity has normally been detected.
  • FIG. 10 illustrates the taking into account of the result of the low frequency activity analysis in step 45.
  • a low frequency activity of a matrix element of G or matrix elements of several matrices G
  • it is checked at 64 if the position of this square in the matrix G coincides with the position of the information block in the postal component CpC the current signature that has been retained as the recipient address block.
  • the coincidence can be established by a spatial projection of the coordinates of the square and the information block to measure a spatial distance and then by a comparison of this distance measured at a threshold.
  • the process proceeds to step 70 in FIG.
  • step 70 is continued in FIG.
  • step 64 If at step 64, no spatial coincidence is detected between the information block identified in the postal component CpC of the current signature and the "block" of the matrix exhibiting the most significant low frequency activity, then at step 65, a spatial coincidence measurement is made between this "block" of higher low frequency activity and all the other information blocks identified in the postal component CpC of the current signature. If no spatial coincidence is detected with these other information blocks, the process is continued in step 70 of FIG.
  • step 65 If at step 65, a spatial coincidence is detected with one of these other information blocks, the postal component CpC of the current signature is modified in step 66 to identify this information block as probably the address block address, this block will be used in step 46 for the search for matching signatures.
  • step 70 a consolidated measurement is made on the dispersion of the spatial position of the information block identified as the address address block in the postal component of all the successive signatures forming the graphic class CGx. This dispersion measure is in the form of a standard deviation value. If it is detected that the distance measured is greater than a certain threshold, the process continues in step 46 of FIG. 6. We are in a situation where the postal component CpC of the graphic class CGx is not reliable enough fact that the postal component of the signatures used to build this graphical class is unstable.
  • step 70 the process continues in step 71 where the spatial concordance between the postal component of the CGx graphic class and the postal component CpC of the current signature is measured.
  • This measure consists, for example, in calculating the positional difference between the center of the information block identified as the destination address block in the postal component of the current signature and the average position of the center of the address address block of the class. corresponding graph. This measurement is compared with a low threshold and if the measurement is below this certain low threshold, the process is continued in step 46 of FIG. 6 for a signature matching search.
  • step 71 If at step 71, a spatial match is not detected, then the process continues at step 72 where it is searched whether there is an information block identified in the postal component CpC of the current signature for which the distance with the information block identified as the destination address block of the postal component of the CGx class is below the low threshold.
  • step 72 If yes in step 72, proceed to step 73 where this information block is now identified in the CpCG postal component of the CGx graphics class as likely to be the recipient address block.
  • step 74 the process is continued in step 74 where a measurement of the spatial distance between all the blocks of information identified in the postal component CpC of the current signature and the block is carried out. of information identified as a destination address block in the postal component of the CGx graphics class. If this distance is greater than a high threshold, the postal component of the CGx class is re-initialized (RAZ) in step 75 in the dictionary 19.
  • RZ re-initialized
  • FIG. 12 shows another embodiment of the method according to the invention which differs from that of FIG. 6 in step 42.
  • step 80 which follows step 42 of FIG. generating a current signature VidC
  • the current signature is classified using a dictionary 19 as explained above.
  • the postal component CpC of the current signature is modified from the image component CiCG of the graphic class CGx and, if appropriate, the postal component CpCG of the graphic class CGx is modified.
  • step 81 signatures from the signature database 17 are recovered from the candidate signatures according to a mechanism for predicting sequences known from the French patent FR-2883943.
  • Step 81 serves to limit the exploration space in the base 17 by taking advantage of the fact of taking into account a certain sequencing (order of passage) of the items in the first sorting pass which is repeated in the second sorting pass. .
  • This limited exploration space consists of candidate signatures.
  • step 82 a classification of each candidate signature in the graphics class dictionary 19 is performed according to the classification mechanism described above.
  • a graphical class CGy has been identified for each candidate signature.
  • step 83 If in step 83, it is detected that the graphical class CGx of the current signature is identical to the graphical class CGy of the candidate signature considered, then at step 84 the postal component Cp of the candidate signature is modified according to the mechanism described in connection with FIGS. 10 and 11 to correctly reposition the postal address block recipient in the postal component of the candidate signature. Then, in step 85, the postal component of the candidate signature is modified, as the case may be, according to the postal component of the graphic class CGx as described with reference to FIG. 11. The method then proceeds to step 46 of FIG. FIG. 6. It should be understood that the process is repeated between steps 82 to 85 for each candidate signature at the output of step 81.
  • step 83 if in step 83 a common graphical class has not been detected between the current signature and the candidate signatures, the process proceeds directly to step 46 of FIG.
  • the process of limiting the exploration space of step 81 starts from the idea of assigning in first sorting pass to each send a chronological order number NO which is stored in memory in correspondence with the signature of 17.
  • Each chronological order number NO can be constituted for example by the juxtaposition of a sorting center number assigned to the sorting center in which the sorting machine 1 is located, a number sorting machine assigned to the sorting machine in which the mailing is sorted, a sorting outlet tray number assigned to the sorting output bin in which the mailing is directed and a chronological index assigned to sending.
  • this index is for example the value of a counter associated with a sorting output bin and which is initialized when a first shipment is sent to the bin and which is incremented by one unit each time that a new shipment is sent to the ferry. In this way, each shipment is assigned a unique order number NO.
  • the signatures are grouped in sequence in the database 17. For example, the signatures are grouped and ordered sequentially by sorting center, by machine and by tray according to the order in which shipments are stored in each sort output bin. As detailed below, the contiguous signature sequences in database 17 constitute identifiable segments.
  • the V-IdC signature of the current item is assigned an IP crossing index.
  • the mode of implementation of the method according to the invention illustrated in FIG. 12 advantageously exploits the prediction mechanism described above during the consolidation step 50.
  • the postal component of the graphical class CGx identified for the current mail is consolidated if in step 49 one is in a situation of "strong postal criterion" as explained above and if in addition the chronological order number of the matching signature determined in step 46 corresponds at the estimated NO serial number.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Sorting Of Articles (AREA)
  • Packaging For Recording Disks (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Steroid Compounds (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

Dans un procédé de tri postal d'envois, des signatures sont dérivées (13) des images des envois et servent d'identificateurs pour les envois dans le processus de tri. On regroupe (43) les signatures en catégories de signatures ou classes graphiques (CG) selon un certain critère de similitude graphique pour calculer une valeur moyenne de signature pour chaque classe graphique. On analyse pour chaque classe graphique considérée une activité de la valeur moyenne de signature pour détecter une activité significative d'un bloc d'information dans les images numériques. On exploite les résultats de ladite détection d'activité pour la recherche de concordance en seconde passe de tri entre une signature courante et des signatures enregistrées en première passe de tri.

Description

Procédé de traitement d'envois incluant une classification graphique des signatures associées aux envois
L'invention concerne un procédé de traitement d'envois postaux dans lequel lors d'une première passe de tri des envois, on forme une image numérique de la surface de chaque envoi comportant des blocs d'information, on dérive de chaque image associée à un envoi une signature numérique à l'image d'une empreinte graphique qui est un identifiant logique pour l'envoi et on enregistre en mémoire la signature associée à l'envoi en correspondance avec des informations de tri et dans lequel lors d'une seconde passe de tri des envois, on forme de nouveau une image numérique de ladite surface de chaque envoi pour dériver une signature numérique courante associée à l'envoi et on recherche parmi les signatures enregistrées en première passe de tri une concordance avec cette signature courante afin de récupérer par association les informations de tri.
Un tel procédé est connu du document de brevet français FR-2841673. Avec ce procédé, il n'est plus nécessaire d'apposer sur la surface des envois des codes d'identification ou « chronomarques » appelé encore « IdTag ». L'identification des envois se fait avec un code « virtuel » ce qui présente l'avantage de pouvoir s'affranchir des imprimantes à codes barres et donc de réduire de façon très importante les coûts d'exploitation et de maintenance d'un équipement de tri postal.
Dans ce procédé connu, chaque signature numérique comprend une première composante dite « image » représentative de caractéristiques physiques de l'image numérique de l'envoi correspondant et une seconde composante dite « postale » indicative au moins d'une position spatiale des blocs d'information présents dans l'image de l'envoi. En particulier, la composante image est formée par des attributs dit « globaux » qui sont représentatifs de caractéristiques physiques globales prises sur l'ensemble des points de l'image numérique de l'envoi. La composante image est formée encore de seconds attributs dits « locaux » qui sont représentatifs de caractéristiques physiques locales prises sur des parties distinctes d'un quadrillage de l'image de l'envoi (ou de plusieurs quadrillages différents). En pratique, lors de la recherche de concordance entre une signature courante et une signature candidate enregistrée dans une base de signatures pour la récupération des informations de tri, on procède d'abord à une comparaison des composantes image respectives des signatures puis après à une comparaison des composantes postales respectives des signatures.
Lorsque des lots d'envois provenant d'expéditeurs en nombre (appelés aussi gros expéditeurs ou mailers) doivent être triés en exploitant ces signatures ou codes d'identification virtuels, on est confronté au problème que globalement la composante image (attributs globaux et locaux) des signatures associées aux envois d'un même expéditeur ne peut pas servir pour discriminer les signatures entre-elles. En effet, les envois postaux issus d'un même expéditeur en nombre sont généralement identiques graphiquement : même type d'enveloppe, même logo imprimé sur l'enveloppe, même bloc d'adresse émetteur, même position du bloc d'adresse destinataire, etc.... Il ressort donc que la différenciation entre deux signatures d'envois d'un même expéditeur en nombre ne peut se faire en pratique que par le contenu du bloc d'adresse destinataire.
Mais il n'est pas exclu que dans la formation des signatures, il existe des situations où le système de traitement de données identifie un bloc d'adresse émetteur à la place d'un bloc d'adresse destinataire. Il en résulte que lors du balayage des signatures candidates associées à des envois d'un même expéditeur, il existe des possibilités de trouver une concordance entre deux signatures ayant la même composante image et dont en plus les composantes postales sont identiques du fait qu'elles identifient toutes les deux par erreur un bloc d'adresse émetteur à la place d'un bloc d'adresse destinataire.
Dans un tel contexte, on peut constater une augmentation d'erreurs d'appariement des signatures lors de la recherche de concordance. Ces erreurs d'appariement conduisent évidemment à des erreurs d'aiguillage des envois vers les sorties de tri et donc à des coûts supplémentaires pour le traitement postal en vue de la distribution du courrier. Le but de l'invention est de donc proposer un procédé de traitement d'envois plus robuste qui permet de réduire les erreurs d'appariement indiquées plus haut, plus particulièrement dans des situations où les envois postaux à trier proviennent d'expéditeurs en nombre et présentent donc une très grande similitude graphique.
A cet effet, l'invention a pour objet un procédé de traitement d'envois postaux dans lequel lors d'une première passe de tri des envois, on forme une image numérique de la surface de chaque envoi comportant des blocs d'information, on dérive de chaque image associée à un envoi une signature numérique qui est un identifiant logique pour l'envoi et on enregistre en mémoire la signature associée à l'envoi en correspondance avec des informations de tri et dans lequel lors d'une seconde passe de tri des envois, on forme de nouveau une image numérique de ladite surface de chaque envoi pour dériver une signature numérique courante associée à l'envoi et on recherche parmi les signatures enregistrées en première passe de tri une concordance avec cette signature courante afin de récupérer par association les informations de tri, caractérisé en ce qu'il comprend les étapes suivantes : - on regroupe les signatures en catégories de signatures ou classes graphiques selon un certain critère de similitude graphique pour calculer une valeur moyenne de signature pour chaque classe graphique ;
- on analyse pour chaque classe graphique considérée une activité de la valeur moyenne de signature pour détecter une activité significative d'un bloc d'information dans les images numériques ;
- et on exploite les résultats de ladite détection d'activité pour la recherche de concordance.
L'idée à la base de l'invention est donc de classer les signatures successives à partir de modèles graphiques de signatures consolidés en temps réel à la volée pour refléter à travers chaque modèle l'apparence graphique non changeante des images des envois dont les signatures relèvent du modèle en question. L'analyse d'activité (ou changement basse fréquence) qui est faite à chaque consolidation ou mise à jour du modèle lors du regroupement d'une nouvelle signature dans la classe graphique correspondante à ce modèle de signature permet d'exhiber la position du bloc d'adresse de destination dans les images des envois car ce bloc d'adresse postal de destination est probablement celui qui présente l'activité basse fréquence la plus significative à la différence des autres blocs d'information qui sont normalement stables quand on considère les envois d'un même expéditeur en nombre.
Le procédé selon l'invention peut présenter les particularités suivantes :
- les signatures sont regroupées en classes graphiques selon un certain critère de similitude graphique de leur composante image pour calculer une valeur moyenne des composantes image des signatures relevant de la classe graphique considérée
- on analyse l'activité de la valeur moyenne de la composante image pour détecter une activité significative d'un bloc d'information dans les images numériques les résultats de ladite détection d'activité sont exploités pour comparer les composantes postales des signatures
- on exploite les attributs globaux et les attributs locaux des signatures pour établir une similarité de signatures - on réalise un seuillage de la distance vectorielle normée sur les attributs globaux pour établir ladite similarité
- on réalise un calcul de coefficient de corrélation sur les attributs locaux pour établir ladite similarité
- on utilise une méthode d'analyse topologique du type K-means pour analyser l'activité des attributs locaux de la composante image
- les classes graphiques sont construites à la volée en seconde passe de tri à partir des signatures courantes successives
Le procédé selon l'invention peut être mis en œuvre avec tout type d'envois postaux tels que lettres, objets plats de petit ou grand format. Le procédé selon l'invention peut également s'appliquer au tri des paquets et autres articles identifiés par un code d'identification virtuel.
Un exemple de mise en œuvre du procédé selon l'invention est décrit plus en détail ci-après et illustré par les dessins. Cette description n'est donnée qu'à titre d'exemple indicatif et nullement limitatif de l'invention. La figure 1 illustre de façon très schématique un envoi postal avec plusieurs blocs d'informations.
La figure 2 montre de façon schématique une machine de tri pour la mise en œuvre du procédé selon l'invention.
La figure 3 illustre sous la forme d'un organigramme le déroulement du procédé tri connu lors d'une première passe de tri.
La figure 4 illustre très schématiquement l'extraction de la composante image de la signature d'un envoi postal. La figure 5 illustre très schématiquement l'extraction de la composante postale de la signature d'un envoi postal.
La figure 6 illustre sous la forme d'un organigramme le déroulement du procédé selon un premier mode de réalisation de l'invention lors d'une seconde passe de tri. La figure 7 détaille l'étape de classification des signatures dans le procédé selon l'invention.
La figure 8 représente la comparaison des composantes image lors de la classification des signatures dans le procédé selon l'invention.
La figure 9 représente un exemple de mise à jour des composantes image des classes graphiques dans le procédé selon l'invention.
La figure 10 détaille l'étape de modification de la composante postale de l'envoi courant à partir de la composante image de la classe graphique correspondante.
La figure 11 détaille l'étape de modification de la composante postale de l'envoi courant à partir de la composante postale de la classe graphique correspondante.
La figure 12 illustre sous la forme d'un organigramme le déroulement du procédé selon un deuxième mode de réalisation de l'invention lors d'une seconde passe de tri. La figure 13 illustre le principe d'une réduction d'espace d'exploration par un mécanisme de prédiction
Selon le procédé de l'invention, on identifie donc des envois postaux, tels que lettres, objets plats de petit ou grand format à enveloppe papier ou matière plastique, et autre article à trier automatiquement par des signatures numériques qui sont dérivées de l'image de la surface des envois qui comporte généralement un bloc d'adresse postal de destination. Cette signature numérique appelée encore signature d'image sert donc à identifier de façon univoque un envoi à la place d'une chronomarque à code à barres dans une machine de tri postal automatique. Le terme machine désigne au sens large un équipement de tri postal installé sur un ou plusieurs sites de tri postal incluant le cas échéant des vidéo-codeurs.
Formation des signatures numériques
Sur la figure 1 , on a illustré un envoi postal référencé P dont la surface comporte par exemple un premier bloc d'information AD qui correspond à l'adresse de distribution postale ou adresse de destination, un bloc d'information AE qui correspond à une adresse d'expéditeur et un bloc d'information L pouvant revêtir la forme d'un logo graphique qui correspond à d'autres information textuelles supplémentaires telles qu'une flamme publicitaire imprimé par l'expéditeur.
Sur la figure 2, on a illustré très schématiquement une machine de tri postal 1 qui comprend classiquement une entrée d'alimentation 2 avec un magasin de chargement des envois P et un dépileur pour la mise en série sur chant des envois, une caméra numérique 3 pour former une image de la surface de chaque envoi comportant les différents blocs d'informations rappelés plus haut, et un carrousel à godets 4 qui dirige les envois vers des sorties de tri 5. Chaque sortie de tri peut être équipée de plusieurs bacs (typiquement un bac avant et un bac arrière) de sortie de tri ou d'un bac compartimenté sans sortir du cadre de l'invention.
On a également représenté un système de traitement de données référencé 6 pour la reconnaissance d'adresse postale par OCR qui est associé à un système de vidéo-codage 7 comme cela est bien connu. Selon l'invention, le système 6 est agencé également pour dériver de l'image numérique d'un envoi formée par la caméra 3 une signature numérique.
On a également représenté un système 9 analogue au système 6 mais qui fait partie d'une autre machine de tri 10, ce système 9 étant relié en communication par exemple par un réseau de télécommunication 8 au système 6 pour une application du procédé selon l'invention à un processus de tri en plusieurs passes de tri sur plusieurs machines de tri.
La figure 3 illustre de façon schématique la construction des signatures numériques lors d'une première passe de tri dans la machine 1. Dans une étape initiale 11 , on injecte dans la machine de tri 1 des envois postaux P par l'entrée d'alimentation 2. Les envois postaux P sont dépilés et convoyés en série sur chant jusqu'à la caméra numérique 3.
A l'étape 12, on forme une image numérique de la surface de l'envoi courant pouvant comporter les différents blocs d'information illustrés sur la figure 1 , par exemple AE, AD et L.
A l'étape 13, le système 6 entreprend une reconnaissance automatique d'adresse de distribution par OCR à partir de l'image et dérive en même temps de cette image une signature numérique V-Id attribuée à l'envoi.
Dans l'étape 14, si l'adresse postale a été reconnue de façon univoque à l'étape 13, on enregistre en mémoire machine dans l'étape 16 les données d'adresse résultant de la reconnaissance OCR en correspondance avec la signature V-Id de l'envoi.
Si à l'étape 13, l'adresse n'a pas été complètement reconnue par l'OCR, c'est-à-dire que l'on a obtenu une information d'adresse équivoque, ou encore aucun résultat, à l'étape 15 on transmet l'image de l'envoi au système de vidéo-codage 7 pour une extraction de l'information d'adresse par un opérateur de codage vidéo, suite à quoi les informations d'adresse obtenues par vidéo-codage en 15 sont enregistrées en 16 en correspondance avec la signature obtenue à l'étape 13.
Sur la figure 3, le bloc indiqué par 17 représente une base de données appelée BDref dans laquelle sont enregistrées en correspondance pour chaque envoi la signature numérique V-Id et des données de tri (incluant l'information d'adresse) de l'envoi reconnues par OCR ou par vidéo-codage lors de la première passe de tri. L'étape 18 correspond au processus de convoyage de l'envoi depuis la caméra 3 vers les sorties de tri de la machine.
Les figures 4 et 5 illustrent maintenant plus en détail les composantes d'une signature selon l'invention. Sur la figure 4 on a de nouveau représenté l'image numérique d'un envoi postal P, généralement une image numérique à plusieurs niveaux de gris, avec les blocs d'information AD, AE et L.
Une première composante de la signature selon l'invention est appelée « composante image » Ci qui est représentative des caractéristiques physiques de l'image. Cette composante image est par exemple extraite par analyse statistique de la luminance des points de l'image numérique qui aura subi préalablement une succession de filtrages abaissant le niveau de résolution de l'image afin de réduire les temps de traitement pour l'analyse statistique et de disposer d'un contenu de type basse-fréquence lequel est peu sensible aux fluctuations de luminance lors d'acquisitions multiples. La luminance d'un point de l'image correspond à la valeur de niveau de gris du point de l'image.
A partir de l'image numérique basse résolution d'un envoi postal, le système 6 extrait par calcul, des attributs globaux représentatifs de caractéristiques physiques globales de l'image tels que la hauteur et la largeur du pli postal, valeur de luminance moyenne des points de l'image numérique, écart-type, entropie des valeurs de luminance.
On peut également extraire par calcul, des attributs locaux représentatifs de caractéristiques physiques locales de l'image prises sur des parties distinctes de l'image numérique. La figure 4 montre l'image numérique de l'envoi P subdivisée en plusieurs parties distinctes B11 ,B'45 issues de différents quadrillages ou maillages M1 ,M2,M3,M4,M5 dans l'image numérique. Le quadrillage M1 définit ici 3x3 parties distinctes. Le quadrillage M5 définit 8x10 parties distinctes. Le nombre de parties distinctes dans un quadrillage et le nombre de quadrillages peut être un paramètre de l'analyse statistique appliquée à l'image numérique pour extraire la composante image Ci de la signature. A partir de chaque partie telle que B11 et B'45 de l'image numérique issue d'un quadrillage tel que M1 ou M3, on peut extraire des attributs locaux tels que la valeur de luminance moyenne des points de cette partie de l'image numérique, écart-type, entropie des valeurs de luminance dans cette partie de l'image numérique. Ces attributs locaux contiennent une information d'autant plus discriminante que les envois postaux sont hétérogènes. L'ensemble des attributs globaux et locaux extraits pour une image numérique constituent donc la composante image Ci de la signature.
Sur la figure 5, on a illustré une seconde composante dite « composante postale » Cp de la signature qui est indicative au moins de la position spatiale des blocs d'information tels que AD, AE et L dans une image d'un envoi. Un système de reconnaissance optique de caractères OCR classiquement utilisé dans une machine de tri postal est capable de fournir des données indicatives de la position spatiale des blocs d'informations textuels détectés dans l'image numérique. Ces données indicatives de position spatiale peuvent être les coordonnées spatiales et d'orientation de la zone rectangulaire formant chaque bloc d'information. Un système OCR est apte également à fournir une description textuelle de chaque bloc d'information détecté dans l'image numérique. Une description textuelle d'un bloc d'information tel que AD par exemple peut consister dans l'indication du nombre de lignes de caractères détectées dans le bloc d'information, le nombre de mot détecté dans chaque ligne de caractères, le nombre de caractères détectés dans chaque mot de chaque ligne de caractères. Sur la figure 5 on a illustré un exemple de description textuelle du bloc d'information AD constituant la composante postale Cp de la signature d'un envoi postal :
« BLOC#0/3 » désigné par 33, référence le bloc d'information O parmi les 3 blocs d'information détectés dans l'image numérique ;
« HN » désigné par 33', est une donnée indicative de l'orientation du bloc d'information 0 dans l'image numérique ;
« (0684 0626 0895 0756) » désigné par 33", sont des données représentatives des coordonnées spatiales du bloc d'information 0 dans l'image numérique ;
« NbLignes 4 » désigné par 33'", indique que le bloc d'information 0 comporte 4 lignes de caractères ; « Ligne #0 » désigné par 34, référence la première ligne de caractères détectée dans le bloc d'information 0 ;
« NbMots 03 » désigné par 35, est une donnée indiquant que 3 mots ont été détectés dans la première ligne de caractères ; « NbCarParMot 01 06 04 » désigné par 36, sont des données indiquant que les 3 mots de la première ligne de caractères comprennent respectivement 1 , 6 et 4 caractères ;
« car #0 (1 007 I 009 i 019) » désigné par 37, sont des données indiquant que pour le premier caractère de la première ligne de caractères, l'OCR a identifié 3 caractères candidats respectivement 1 , I et i avec des distances de ressemblance respectivement de 007, 009 et 019 ;
« car#1 (L 008 E 009 D 057) » désigné par 38, sont des données indiquant que pour le second caractère de la première ligne de caractères, L'OCR a identifié 3 caractères candidats respectivement L, E et D avec des distances de ressemblance respectivement de 008, 009 et 057 ;
... et ainsi de suite pour les autres caractères de la première ligne de caractères sachant qu'une valeur 0 pour la distance de ressemblance est la distance la plus faible, c'est-à-dire représente l'écart le plus faible par rapport au caractère idéal.
La construction d'une signature part donc de l'idée qu'une image numérique d'un envoi postal est un signal bidimensionnel interprétable dont le contenu peut être appréhendé tant au niveau physique qu'au niveau symbolique. De ce fait que la signature d'un envoi postal est formée de deux composantes Ci et Cp complémentaires qui ne sont pas corrélées entre elles (indépendantes l'une de l'autre).
Recherche de concordance des signatures en seconde passe de tri
Sur la figure 6 on a représenté le processus de gestion des signatures lors d'une seconde passe de tri faisant suite à la première passe de tri illustrée sur la figure 3. Les envois triés en première passe sont donc entrés de nouveau dans la machine de tri 1 et repassent en série sur chant devant la caméra 3. On forme dans l'étape 41 de nouveau une image numérique de la surface d'un envoi courant comportant des blocs d'information tels que le bloc d'adresse de destination AD et dans l'étape 42 on dérive de nouveau une signature courante V-IdC pour l'envoi courant comme indiqué plus haut. La signature courante V-IdC comprend une composante image CiC et une composante postale CpC.
Ensuite, à l'étape 46, on compare les composantes image et postale CiC et CpC de la signature courante V-IdC aux composantes image et postale Ci, Cp des signatures enregistrées dans la base BDRef 17 pour détecter une concordance.
Cette comparaison peut commencer par la comparaison des attributs globaux respectifs des composantes image qui inclut un seuillage des valeurs absolues des variations sur chaque attribut global pour faire un premier filtrage parmi les signatures enregistrées dans la base 17. Ce filtrage permet d'éliminer les signatures fortement dissemblantes de la signature courante et de ne retenir qu'un faible nombre de signatures candidates pour la poursuite de la comparaison.
Puis on effectue sur ces signatures candidates une comparaison des attributs locaux de la composante image ce qui peut encore réduire le nombre de signatures candidates dans la base 17. Cette comparaison peut être basée d'abord sur le calcul d'un coefficient de corrélation normalisé glissant entre les histogrammes correspondants dans la signature courante et les signatures candidates respectivement ce qui permet de s'affranchir des variations de luminance entre les deux images numériques comparées et ensuite sur le calcul d'un coefficient de corrélation normalisé, par type d'attribut, entre les autres attributs locaux dans la signature courante et dans les signatures candidates respectivement qui permet de s'affranchir des problèmes de normalisation dus à la différence de variabilité de chaque attribut local. Les signatures candidates sont ensuite triées par ordre de ressemblance décroissant sur la base des coefficients de corrélation et un nombre fixé de signatures candidates les plus ressemblantes sont retenues.
La comparaison des composantes postale Cp des signatures commence
: on mesure la ressemblance des données indicatives de position des blocs d'information. Cette seconde comparaison exploite avantageusement un second critère décorrélé du critère de comparaison des composantes image.
Ces signatures candidates peuvent ensuite être triées par ordre décroissant à partir d'une mesure de ressemblance des descriptions textuelles des blocs d'information.
Il est entendu que la comparaison des composantes postale peut être effectuée avant la comparaison des composantes image ou même que les comparaisons des composantes postale et image soient effectuées simultanément sans s'éloigner de la portée de l'invention.
Si à l'étape 46, on n'arrive pas à détecter une concordance, alors à l'étape 47 on dirige l'envoi courant vers une sortie de rejet pour pouvoir être par exemple trié manuellement. Si à l'étape 46, on détecte une concordance, les données de tri et d'adresse pour l'envoi courant sont récupérées dans la base 17 et l'envoi courant est dirigé automatiquement vers une sortie de tri correspondante à l'étape 48.
Catégorisation des signatures
Selon le procédé de l'invention, avant l'étape 46 sur la figure 6, on réalise un processus de fiabilisation d'une part de la signature courante et d'autre part des signatures de la base BDRef à l'aide d'une classification de ces signatures. Cette fiabilisation permet lors de la recherche de concordance d'ajuster la composante postale des signatures à comparer de façon à éviter des erreurs d'appariement.
Le principe de cette classification est de créer d'abord une sorte de dictionnaire dans lequel sont répertoriées des catégories ou « classes graphiques » CG de signatures.
Chaque classe graphique est modélisée par une composante image CiCG et une composante postale CpCG similaire à celle d'une signature comme décrit plus haut.
Selon l'invention, ce dictionnaire est évolutif en temps réel dans le sens que les composantes image et postale des classes graphiques sont mises à jour à la volée c'est-à-dire que au fur et à mesure on attribue une signature à une classe graphique et cette classe graphique est par conséquent consolidée. Cette mise à jour à la volée ne nécessite pas de traitement différé, elle est exécutée en temps réel. De plus, avec une telle mise à jour à la volée il n'est pas nécessaire de transmettre le dictionnaire pour un tri ultérieur dans un centre de tri distant.
Comme on pourra le comprendre, selon une caractéristique importante du procédé selon l'invention, on calcule à chaque mise à jour d'une catégorie graphique une valeur moyenne de la composante image (phase de consolidation) et on analyse l'activité basse fréquence de cette valeur moyenne pour évaluer la position du bloc d'adresse destinataire ce qui permet lors de la recherche de concordance à l'étape 46 d'utiliser le bloc d'information approprié lors de la comparaison de la composante postale des signatures. On entend par analyse basse fréquence, une analyse des changements parmi des images basse résolution.
A l'étape 43, on réalise donc un processus de classification de la signature courante VidC, c'est-à-dire que l'on compare la composante image CiC de la signature courante à la composante image CiCG des classes graphiques présentes dans le dictionnaire 19 pour déterminer la classe graphique CGx du dictionnaire qui est la plus semblable à la signature courante. Plus particulièrement selon le procédé de l'invention, on compare les attributs locaux et globaux des composantes image CiC et CiCG pour identifier une classe graphique d'appartenance CGx en sortie de l'étape 43. Si aucune classe graphique du dictionnaire ne correspond à la signature courante, il y a création d'une nouvelle classe graphique CGx.
Les figures 7 et 8 illustrent plus particulièrement le processus de comparaison des composantes images pour réaliser cette classification. Ces figurent sont commentées plus loin.
A l'étape 44 qui suit l'étape de classification, on réalise une analyse de l'activité basse fréquence de la composante image de la classe graphique CGx pour détecter une activité basse fréquence significative d'un bloc d'information dans les images numériques associées aux signatures relevant de cette classe graphique. Cette étape 44 est décrite plus particulièrement en référence à la figure 9. A l'étape 45, on réalise pour la signature courante un traitement de fiabilisation à partir des résultats de l'analyse d'activité à l'étape 44 qui est plus détaillé en référence aux figures 10 et 11. A l'issue de l'étape 45, les composantes postale de la signature courante et de la classe graphique CGx peuvent être ajustées. Ces ajustements permettent d'éviter les erreurs d'appariement dans l'étape 46 de recherche de concordance avec les signatures enregistrées dans la base 17.
Après l'étape 46 de recherche de concordance, on effectue en 50 une consolidation de la composante postale de la classe graphique CGx identifiée pour l'envoi courant que si à l'étape précédente 49 on est dans une situation ou un certain « critère postal fort » est vérifié. On entend par
« critère postal fort » une situation selon laquelle les composantes postales
CpC de la signature courante et d'une signature concordante identifiée à l'étape 46 sont semblables (par exemple : même identification du bloc d'adresse de destination, même nombre de lignes de caractères dans ce bloc, même nombre de mots par ligne dans ce bloc, etc.).
Le processus des étapes 41 à 50 sur la figure 6 se répète ainsi pour les envois courants successifs traités en seconde passe de tri.
Sur les figures 7 et 8, on a donc illustré plus en détail l'étape 43 de classification des signatures. A l'initialisation du processus, c'est-à-dire pour le premier envoi postal de la deuxième passe de tri, le dictionnaire ou base de données 19 des classes graphiques CG est normalement vide. Pour répondre à des contraintes de traitement temps-réel, on peut limiter le nombre classes graphiques CG maintenues dans le dictionnaire à une certaine valeur NbMaxCG qui peut être réglable. La valeur NbMaxCG peut par exemple être conditionnée par une information « a priori » donnée par l'opérateur machine indicative de l'hétérogénéité des envois postaux à traiter. En général pour un tri en deux passes d'envois provenant de plusieurs expéditeurs en nombre, on pourra régler la valeur NbMaxCG à environ 100. Une valeur NbMaxCG égale à 100 correspond à un lot d'envois postaux faiblement homogène, c'est-à-dire avec un nombre d'envois successifs appartenant au même expéditeur qui est relativement bas. Sur la figure 7, à l'étape 51 on compare la composante image courante
CiC de la signature courante V-IdC avec la composante image CiCG de chaque classe graphique enregistrée dans la base de données 19 pour détecter une certaine similarité. La comparaison des composantes image est réalisée de la même manière que décrite précédemment pour l'étape 46. En particulier, la comparaison est d'abord réalisée sur les attributs globaux et ensuite sur les attributs locaux des composantes image CiC et CiCG. Les attributs globaux et locaux sont obtenus à partir d'une image numérique basse résolution de l'envoi, par exemple de 0,25 pixel par mm.
La figure 8 illustre plus particulièrement cette étape 51 de comparaison des attributs globaux (51a) et locaux (51 b) des composantes image CiC et CiCG. Comme attributs globaux, on a illustré : la hauteur H de l'envoi postal, la largeur L, valeur de luminance moyenne I des points de l'image numérique, l'écart-type E et l'entropie S des valeurs de luminance. A gauche sur la figure 8, on a illustré dans le cadre 52 un premier vecteur (tableau à une colonne) les valeurs H, L, I, E, T pour CiC et par quelques vecteurs les valeurs semblables pour les CiCG associées aux classes CG1 ,CG2, ...., CGN
Pour présélectionner les classes graphiques CGi candidates, on compare d'abord chaque attribut global de la composante image CiC avec l'attribut correspondant d'une des composantes image CG1 ,CG2, ...., CGN. Par exemple, pour déterminer si la classe graphique CG1 est candidate, on compare la différence entre les hauteurs H de CiC et de CG1 avec un seuil τ1 , on compare la différence entre les largeurs L de CiC et de CGIavec un seuil τ2... les seuils τ1 , x2... pouvant être différents, et si pour tous les attributs, la différence est inférieure au seuil alors CG1 est candidate.
On effectue ensuite un calcul de distance (distance vectorielle normée désignée sur la figure 8 par DVN) entre le vecteur HLIET pour CiC et le vecteur HLIET de chaque classe graphique candidate. Ces distances vectorielles normées DVN sont également comparées à un seuil (qui peut être réglable) dans l'étape 53 pour déterminer la ou les classes graphiques CGi qui sont les plus similaires à la signature courante. Sur la base de la ou des classes graphiques CGi ainsi présélectionnées, on compare les attributs locaux de la composante image CiCG de ces classes graphiques avec les attributs locaux de la composante image CiC de la signature courante. Sur la figure 8, on a illustré les attributs locaux dans le cadre 54 par des triplets de matrices de 4x4 (résultant donc d'un quadrillage 4x4 pour la construction de la signature) affectées respectivement à la valeur de luminance moyenne I de points d'image, l'écart-type E et l'entropie S des valeurs de luminance.
On corrèle les attributs locaux de CiC avec les attributs locaux de CiCG de chaque classe graphique sélectionnée en 53 et le coefficient de corrélation CC calculé (-1<CC<1 ) qui est le plus élevé est retenu à l'issue de l'étape 51. Bien entendu il est possible d'utiliser plusieurs tailles de quadrillage dans le calcul des valeurs de corrélation.
Ensuite à l'étape 55, on compare à un seuil (réglable le cas échéant) ce coefficient de corrélation CC pour entreprendre une actualisation du dictionnaire 19 des classes graphiques. Ainsi, si à l'étape 55 le coefficient de corrélation CC est inférieure au seuil, on ajoute dans l'étape 56 une nouvelle classe graphique CGx dans le dictionnaire 19 et on actualise le nombre de classes graphiques maintenues dans le dictionnaire (le cas échéant suppression d'une classe graphique en cas de dépassement de la valeur NbMaxCG, la classe graphique supprimée du dictionnaire étant celle qui est la moins utilisée pendant une période de référence par exemple). Les composantes CiCG et CpCG de la nouvelle classe graphique CGx sont initialisées avec les composantes CiC et CpC de la signature courante utilisée dans l'étape 46.
Maintenant si, à l'étape 55 le coefficient de corrélation CC est supérieur ou égal au seuil, on actualise en 57 le compteur d'utilisation de la classe graphique CGx et on actualise cette classe graphique CGx.
Le réglage du seuil de l'étape 55 permet d'ajuster le niveau de similitude requis pour la catégorisation. En pratique, il faut trouver un seuil qui permette de rassembler les signatures d'envois qui présentent une ressemblance graphique importante en évitant que les envois d'un même expéditeur ayant la même apparence graphique puissent aboutir à la création de plusieurs classes graphiques. A l'issue de l'étape 43, une classe graphique CGx est donc identifiée comme similaire à la signature courante VidC.
Sur la figure 9, on a illustré un ensemble d'attributs locaux de la composante image de la classe graphique CGx qui servent à l'analyse d'activité basse fréquence dans l'étape 44 sur la figure 6. Ces attributs locaux sont des valeurs d'écart-type sur : luminance moyenne I, écart-type E et l'entropie T. Ces valeurs se rapportent à des zones distinctes d'un certain quadrillage de l'image d'un envoi comme expliqué plus haut. On a représenté sur la figure à titre d'exemple un quadrillage de l'image de 5x5 ce qui donne 3 matrices 60 avec chacune 25 valeurs d'écart-type. Pour calculer chaque valeur d'écart-type dans une matrice I55, E55 et T55, on fait une moyenne consolidée avec la valeur correspondante de l'attribut local de la signature courante. On peut donc considérer que par le calcul de cet écart- type on calcule une valeur moyenne de signature pour la classe graphique CGx. Les 3 matrices I55, E55 et T55 peuvent être fusionnées en une matrice G55, par exemple selon une analyse en composantes principales normée (ACPN) bien connue de l'homme de l'art. Cette matrice G est une sorte de « grille de changements » qui exhibe les changements basse fréquence, c'est-à-dire les changements qui interviennent à chaque consolidation de la matrice G.
En 62, on a représenté une synthèse de la matrice G selon laquelle les éléments matriciels sont répartis en 3 classes par une méthode topologique méthode telle qu'une méthode non supervisée de type "K-means" basée sur la mesure de proximité dans l'espace des observations. La méthode des "K- means" permet d'isoler dans la matrice G des éléments matriciels selon 3 niveaux : Niveau non changeant - Niveau peu changeant - Niveau très changeant, respectivement illustrés par des carrés en blanc, gris et noir. Pour s'affranchir des variations liées aux fluctuations mécaniques d'acquisition, on peut ne pas tenir compte des carrés détectés comme « changeants » qui sont sur les bords de la matrice G. On peut regrouper les carrés en fonction de leur connexité et de leur activité basse fréquence. On peut utiliser plusieurs matrices G ayant des quadrillages différents. A l'issue de l'étape 44, on a détecté normalement la position spatiale d'un bloc d'information qui présente l'activité basse fréquence la plus significative.
La figure 10 illustre la prise en compte du résultat de l'analyse d'activité basse fréquence dans l'étape 45. En 63, si on a détecté une activité basse fréquence d'un élément matriciel de G (ou des éléments matriciels de plusieurs matrices G) en détectant la présence par exemple d'un carré noir (bloc très changeant en 62), on vérifie en 64 si la position de ce carré dans la matrice G coïncide avec la position du bloc d'information dans la composante postale CpC de la signature courante qui a été retenu comme bloc d'adresse destinataire. La coïncidence peut s'établir par une projection spatiale des coordonnées du carré et du bloc d'information pour mesurer une distance spatiale et ensuite par une comparaison de cette distance mesurée à un seuil. Dans le cas où une coïncidence est détectée, le processus se poursuit à l'étape 70 sur la figure 11.
Si à l'étape 63, aucune activité basse fréquence n'a été détectée, on poursuit à l'étape 70 sur la figure 11.
Si à l'étape 64, on ne détecte pas de coïncidence spatiale entre le bloc d'information identifié dans la composante postale CpC de la signature courante et « le bloc » de la matrice présentant l'activité basse fréquence la plus significative, alors à l'étape 65, on réalise une mesure de la coïncidence spatiale entre ce « bloc » de plus forte activité basse fréquence et tous les autres blocs d'information identifiés dans la composante postale CpC de la signature courante. Si on ne détecte aucune coïncidence spatiale avec ces autres blocs d'information, on poursuit le processus à l'étape 70 de la figure 11.
Si à l'étape 65, on détecte une coïncidence spatiale avec l'un de ces autres blocs d'information, on modifie à l'étape 66 la composante postale CpC de la signature courante pour identifier ce bloc d'information comme étant probablement le bloc d'adresse destinataire, ce bloc sera donc utilisé dans l'étape 46 pour la recherche de concordance de signatures. Sur la figure 11 , à l'étape 70 on réalise une mesure consolidée sur la dispersion de la position spatiale du bloc d'information identifié comme bloc d'adresse destinataire dans la composante postale de toutes les signatures successives formant la classe graphique CGx. Cette mesure de dispersion se présente sous la forme d'une valeur d'écart-type. Si on détecte que la distance mesurée est supérieure à un certain seuil, le processus se poursuit à l'étape 46 de la figure 6. On est dans une situation où la composante postale CpC de la classe graphique CGx n'est pas assez fiable du fait que la composante postale des signatures ayant servi à construire cette classe graphique est instable.
Par contre, si à l'étape 70 la distance mesurée est inférieure audit seuil, le processus se poursuit à l'étape 71 où on mesure la concordance spatiale entre la composante postale de la classe graphique CGx et la composante postale CpC de la signature courante. Cette mesure consiste par exemple à calculer l'écart de position entre le centre du bloc d'information identifié comme bloc d'adresse destinataire dans la composante postale de la signature courante et la position moyenne du centre du bloc d'adresse destinataire de la classe graphique correspondante. On compare cette mesure à un seuil bas et si la mesure est inférieure à ce certain seuil bas on poursuite le processus à l'étape 46 de la figure 6 pour une recherche de concordance de signatures.
Si à l'étape 71 , on ne détecte pas de concordance spatiale, alors le processus se poursuit à l'étape 72 où on recherche s'il existe un bloc d'information identifié dans la composante postale CpC de la signature courante pour lequel la distance avec le bloc d'information identifié comme bloc d'adresse de destination de la composante postale de la classe CGx est inférieure au seuil bas.
Dans l'affirmative à l'étape 72, on passe à l'étape 73 où ce bloc d'information est maintenant identifié dans la composante postale CpCG de la classe graphique CGx comme étant probablement le bloc d'adresse destinataire. Par contre, dans la négative à l'étape 72, on poursuit le processus à l'étape 74 où on réalise une mesure de la distance spatiale entre tous les blocs d'information identifiés dans la composante postale CpC de la signature courante et le bloc d'information identifié comme bloc d'adresse destinataire dans la composante postale de la classe graphique CGx. Si cette distance est supérieure à un seuil haut, on ré-initialise (RAZ) la composante postale de la classe CGx à l'étape 75 dans le dictionnaire 19.
Sur la figure 12, on a représenté un autre mode de mise en œuvre du procédé selon l'invention qui se différencie de celui de la figure 6 au niveau de l'étape 42. A l'étape 80 qui suit l'étape 42 de génération d'une signature courante VidC, on effectue une classification de la signature courante à l'aide d'un dictionnaire 19 comme expliqué plus haut. On récupère une classe graphique semblable CGx. On modifie le cas échéant la composante postale CpC de la signature courante à partir de la composante image CiCG de la classe graphique CGx et on modifie le cas échéant la composante postale CpCG de la classe graphique CGx.
Maintenant, à l'étape 81 on récupère de la base de signatures 17 des signatures candidates selon un mécanisme de prédiction de séquences connu du brevet français FR-2883943. L'étape 81 sert à limiter l'espace d'exploration dans la base 17 en tirant profit de la prise en compte d'un certain séquencement (ordre de passage) des envois en première passe de tri qui se répète en seconde passe de tri. Cet espace d'exploration limité est constitué de signatures candidates.
A l'étape 82, on réalise une classification de chaque signature candidate dans le dictionnaire 19 de classes graphiques selon le mécanisme de classification décrit précédemment. A l'issue de l'étape 82, on a identifié pour chaque signature candidate une classe graphique CGy.
Si dans l'étape 83, on détecte que la classe graphique CGx de la signature courante est identique à la classe graphique CGy de la signature candidate considérée, alors à l'étape 84 on modifie la composante postale Cp de la signature candidate selon le mécanisme décrit en relation avec les figures 10 et 11 pour repositionner correctement le bloc d'adresse postale destinataire dans la composante postale de la signature candidate. Puis à l'étape 85, on modifie le cas échéant la composante postale de la signature candidate en fonction de la composante postale de la classe graphique CGx comme décrit en relation avec la figure 11. Le procédé se poursuit ensuite à l'étape 46 de la figure 6. Il faut comprendre qu'on répète le processus entre les étapes 82 à 85 pour chaque signature candidates en sortie de l'étape 81.
Maintenant si à l'étape 83, on n'a pas détecté de classe graphique commune entre la signature courante et les signatures candidates, le processus se poursuit directement à l'étape 46 de la figure 6.
Le processus de limitation de l'espace d'exploration de l'étape 81 part de l'idée d'attribuer en première passe de tri à chaque envoi un numéro d'ordre chronologique NO qui est enregistré en mémoire en correspondance avec la signature de l'envoi dans la base 17. Chaque numéro d'ordre chronologique NO peut être constitué par exemple par la juxtaposition d'un numéro de centre de tri affecté au centre de tri dans laquelle se trouve la machine de tri 1 , d'un numéro de machine de tri affecté à la machine de tri dans laquelle est trié l'envoi, d'un numéro de bac de sortie de tri affecté au bac de sortie de tri dans lequel est dirigé l'envoi et d'un indice chronologique affecté à l'envoi. En pratique, cet indice est par exemple la valeur d'un compteur associé à un bac de sortie de tri et qui est initialisé au moment où un premier envoi est dirigé vers le bac et qui est incrémenté d'une unité à chaque fois qu'un nouvel envoi est dirigé dans le bac. De cette manière, à chaque envoi est affecté un numéro d'ordre NO qui est unique.
A l'issue de la première passe de tri, les signatures sont regroupées en séquence dans la base de données 17. Par exemple, les signatures sont regroupées et ordonnées séquentiellement par centre de tri, par machine et par bac selon l'ordre dans lequel les envois sont stockés dans chaque bac de sortie de tri. Comme détaillé ci-après, les séquences de signatures contiguës en base de données 17 constituent des segments identifiables.
Lors de la seconde passe de tri, à la fin de l'étape 80 sur la figure 12 on affecte à la signature V-IdC de l'envoi courant un indice de passage IP
(allant de 1 à n...). Suite à quoi, on calcule un numéro d'ordre chronologique NO estimé pour la signature courante par une approximation linéaire comme décrit dans le brevet FR-2883943. Ce calcul est réalisé par approximation linéaire à partir d'une série de numéros d'ordre chronologique stockés en mémoire. Sur la figure 13, on a représenté sur un graphique, un axe des abscisses sur lequel sont portés des indices IP de passage d'envoi 374 à 405 qui correspondent respectivement au passage en seconde passe des 374eme à 405eme envois pour lesquels une signature numérique V-Id a été extraite dans l'étape 80. On a reporté sur l'axe des ordonnées, des exemples de numéros d'ordre chronologique NO attribués aux envois en première passe, ici des envois stockés dans les bacs numérotés « 76 » et « 86 ». Le calcul par approximation linéaire consiste, à partir d'une série de couples indice de passage d'envoi/numéro d'ordre chronologique (IP, NO) illustrés par une croix sur la figure 13, à déterminer par un système d'équation les coefficients a, b d'une droite (NO = a. IP + b) telle que D1 ou D2 pour pouvoir ensuite calculer un numéro d'ordre chronologique NO placé sur cette droite en fonction d'un indice de passage IP courant.
De plus, le mode de mise en œuvre du procédé selon l'invention illustré figure 12 exploite avantageusement le mécanisme de prédiction décrit ci- dessus lors de l'étape de consolidation 50. A l'étape 50, la composante postale de la classe graphique CGx identifiée pour l'envoi courant est consolidée si à l'étape 49 on est dans une situation de « critère postal fort » comme expliqué précédemment et si en plus le numéro d'ordre chronologique de la signature concordante déterminée à l'étape 46 correspond au numéro d'ordre chronologique NO estimé.

Claims

REVENDICATIONS
1/ Procédé de traitement d'envois postaux (P) dans lequel lors d'une première passe de tri des envois, on forme (12) une image numérique de la surface de chaque envoi comportant des blocs d'information (AD1AE1L), on dérive (13) de chaque image associée à un envoi une signature numérique (V-Id) qui est un identifiant logique pour l'envoi et on enregistre (16) en mémoire la signature (V-Id) en correspondance avec des informations de tri et dans lequel lors d'une seconde passe de tri des envois, on forme (41 ) de nouveau une image numérique de ladite surface de chaque envoi pour dériver (42) une signature numérique courante (V-IdC) associée à l'envoi et on recherche parmi les signatures enregistrées en première passe de tri une concordance avec cette signature courante afin de récupérer par association les informations de tri pour l'envoi, caractérisé en ce qu'il comprend les étapes suivantes :
- on regroupe (43) les signatures en catégories de signatures ou classes graphiques (CG) selon un certain critère de similitude graphique pour calculer (57) une valeur moyenne de signature pour chaque classe graphique ; - on analyse (60,61 ,62) pour chaque classe graphique considérée une activité de la valeur moyenne de signature pour détecter une activité significative d'un bloc d'information dans les images numériques ;
- et on exploite les résultats de ladite détection d'activité pour la recherche de concordance.
2/ Procédé selon la revendication 1 , dans lequel chaque signature numérique associée à un envoi comprend une composante image (CiC) représentative de caractéristiques physiques de l'image numérique de l'envoi et une composante postale (CpC) représentative au moins de la position spatiale des blocs d'information présents dans l'image de l'envoi, et dans lequel : les signatures sont regroupées en classes graphiques selon un certain critère de similitude graphique de leur composante image pour calculer une valeur moyenne (CiCG) des composantes image des signatures relevant de la classe graphique considérée ; - on analyse (60,61 ,62) l'activité de la valeur moyenne de la composante image pour détecter une activité significative d'un bloc d'information dans les images numériques ;
- et les résultats de ladite détection sont exploités pour comparer les composantes postales des signatures.
3/ Procédé selon la revendication 2, dans lequel la composante image des signatures comprend des premiers attributs dits « globaux » représentatifs de caractéristiques physiques globales prises sur l'ensemble des points de l'image d'un envoi et des seconds attributs dits « locaux » représentatifs de caractéristiques physiques locales prises sur des parties distinctes d'un quadrillage de l'image d'un envoi, et dans lequel on exploite lesdits attributs globaux et lesdits attributs locaux pour établir une similarité de signatures.
4/ Procédé selon la revendication 3, dans lequel on réalise un seuillage de la distance vectorielle normée sur les attributs globaux pour établir ladite similarité.
5/ Procédé selon la revendication 3 ou 4, dans lequel on réalise un calcul de coefficient de corrélation sur les attributs locaux pour établir ladite similarité.
6/ Procédé selon l'une des revendications 3 à 5, dans lequel on utilise une méthode d'analyse topologique du type K-means pour analyser l'activité des attributs locaux de la composante image.
Il Procédé selon l'une des revendications précédentes, dans lequel les classes graphiques sont construites à la volée en seconde passe de tri à partir des signatures courantes successives.
PCT/FR2008/050885 2007-05-30 2008-05-22 Procédé de traitement d'envois incluant une classification graphique des signatures associées aux envois WO2008152277A2 (fr)

Priority Applications (8)

Application Number Priority Date Filing Date Title
DK08805830.0T DK2155406T3 (da) 2007-05-30 2008-05-22 Fremgangsmåde til behandling af forsendelser inklusive en grafisk klassificering af signaturerne, der er associerede med forsendelserne
AT08805830T ATE475492T1 (de) 2007-05-30 2008-05-22 Verfahren zur handhabung von übertragungen einschliesslich einer grafischen klassifizierung der zu den übertragungen gehörenden signaturen
US12/282,438 US8126204B2 (en) 2007-05-30 2008-05-22 Method of processing mailpieces, the method including graphically classifying signatures associated with the mailpieces
DE602008001985T DE602008001985D1 (de) 2007-05-30 2008-05-22 Verfahren zur handhabung von übertragungen einschliesslich einer grafischen klassifizierung der zu den übertragungen gehörenden signaturen
JP2010509870A JP4785986B2 (ja) 2007-05-30 2008-05-22 搬送処理に関連したシグネチャのグラフィック分類を含む搬送処理の取扱方法
CN2008800181090A CN101678404B (zh) 2007-05-30 2008-05-22 包括对与邮寄件相关的签名进行图形分类的邮寄件处理方法
CA2688163A CA2688163C (fr) 2007-05-30 2008-05-22 Procede de traitement d'envois incluant une classification graphique des signatures associees aux envois
EP08805830A EP2155406B1 (fr) 2007-05-30 2008-05-22 Procédé de traitement d'envois incluant une classification graphique des signatures associées aux envois

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0755342A FR2916661B1 (fr) 2007-05-30 2007-05-30 Procede de traitement d'envois incluant une classification graphique des signatures associees aux envois
FR0755342 2007-05-30

Publications (2)

Publication Number Publication Date
WO2008152277A2 true WO2008152277A2 (fr) 2008-12-18
WO2008152277A3 WO2008152277A3 (fr) 2009-02-12

Family

ID=38951453

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2008/050885 WO2008152277A2 (fr) 2007-05-30 2008-05-22 Procédé de traitement d'envois incluant une classification graphique des signatures associées aux envois

Country Status (12)

Country Link
US (1) US8126204B2 (fr)
EP (1) EP2155406B1 (fr)
JP (1) JP4785986B2 (fr)
CN (1) CN101678404B (fr)
AT (1) ATE475492T1 (fr)
CA (1) CA2688163C (fr)
DE (1) DE602008001985D1 (fr)
DK (1) DK2155406T3 (fr)
ES (1) ES2348009T3 (fr)
FR (1) FR2916661B1 (fr)
PT (1) PT2155406E (fr)
WO (1) WO2008152277A2 (fr)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010013220A1 (de) * 2010-03-29 2011-09-29 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Transportieren eines zu bedruckenden Gegenstands
DE102012200580A1 (de) 2011-01-26 2012-07-26 Siemens Aktiengesellschaft Verfahren und Anordnung zum Identifizieren eines transportierten Gegenstands mit einem Etikett
US9144827B2 (en) 2010-09-23 2015-09-29 Solystic Postal sorting method with user processing information being recovered between sorting passes

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2918199B1 (fr) * 2007-06-26 2009-08-21 Solystic Sas Procede de traitement d'envois postaux exploitant l'identification virtuelle des envois avec le readressage
FR2920678B1 (fr) * 2007-09-07 2009-10-16 Solystic Sas Procede de traitement d'envois postaux avec des codes client associes a des empreintes numeriques.
AU2011200830B2 (en) * 2011-02-25 2014-09-25 Canon Kabushiki Kaisha Method, apparatus and system for modifying quality of an image
US8818023B2 (en) * 2011-03-25 2014-08-26 Siemens Industry, Inc. Bulk region of interest learning
US9147178B2 (en) * 2012-01-16 2015-09-29 International Business Machines Corporation De-identification in visual media data
EP2923775B1 (fr) * 2014-03-26 2020-07-08 NEC Corporation Système de Tri Postal
US10031925B2 (en) * 2014-10-15 2018-07-24 Thinkcx Technologies, Inc. Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph
KR101742637B1 (ko) * 2015-05-15 2017-06-01 주식회사 세중에스앤씨 반송 우편물 자동처리 시스템 및 방법
FR3037691B1 (fr) * 2015-06-16 2018-04-20 Solystic Appariement d'images d'articles postaux avec des descripteurs de singularites du champ de gradient

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19947259C1 (de) * 1999-09-30 2000-09-28 Siemens Ag Verfahren und Vorrichtung zum Sortieren von Sendungen
DE20218212U1 (de) * 2002-08-12 2003-12-24 Mit Management Intelligenter Technologien Gmbh Vorrichtung zur automatischen Adressblockmarkierung
FR2883493A1 (fr) * 2005-03-24 2006-09-29 Solystic Sas Procede de traitement d'envois incluant une gestion des empreintes numeriques des envois

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6360001B1 (en) * 2000-05-10 2002-03-19 International Business Machines Corporation Automatic location of address information on parcels sent by mass mailers
FR2866252B1 (fr) * 2004-02-18 2006-04-21 Solystic Procede pour trier des envois postaux en plusieurs passes de tri
ITTO20040299A1 (it) * 2004-05-07 2004-08-07 Elsag Spa Metodo di riconoscimento postale

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19947259C1 (de) * 1999-09-30 2000-09-28 Siemens Ag Verfahren und Vorrichtung zum Sortieren von Sendungen
DE20218212U1 (de) * 2002-08-12 2003-12-24 Mit Management Intelligenter Technologien Gmbh Vorrichtung zur automatischen Adressblockmarkierung
FR2883493A1 (fr) * 2005-03-24 2006-09-29 Solystic Sas Procede de traitement d'envois incluant une gestion des empreintes numeriques des envois

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010013220A1 (de) * 2010-03-29 2011-09-29 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Transportieren eines zu bedruckenden Gegenstands
EP2371461A1 (fr) 2010-03-29 2011-10-05 Siemens Aktiengesellschaft Procédé et dispositif de transport d'un objet devant être imprimé
US8467569B2 (en) 2010-03-29 2013-06-18 Siemens Aktiengesellschaft Method and apparatus for transporting an article to be printed
US9144827B2 (en) 2010-09-23 2015-09-29 Solystic Postal sorting method with user processing information being recovered between sorting passes
DE102012200580A1 (de) 2011-01-26 2012-07-26 Siemens Aktiengesellschaft Verfahren und Anordnung zum Identifizieren eines transportierten Gegenstands mit einem Etikett

Also Published As

Publication number Publication date
CA2688163C (fr) 2014-10-07
WO2008152277A3 (fr) 2009-02-12
CN101678404B (zh) 2013-10-30
DK2155406T3 (da) 2010-11-22
CN101678404A (zh) 2010-03-24
US20100232642A1 (en) 2010-09-16
DE602008001985D1 (de) 2010-09-09
EP2155406A2 (fr) 2010-02-24
FR2916661B1 (fr) 2009-07-03
EP2155406B1 (fr) 2010-07-28
PT2155406E (pt) 2010-10-14
JP2010528386A (ja) 2010-08-19
US8126204B2 (en) 2012-02-28
ES2348009T3 (es) 2010-11-26
FR2916661A1 (fr) 2008-12-05
JP4785986B2 (ja) 2011-10-05
ATE475492T1 (de) 2010-08-15
CA2688163A1 (fr) 2008-12-18

Similar Documents

Publication Publication Date Title
EP2155406B1 (fr) Procédé de traitement d&#39;envois incluant une classification graphique des signatures associées aux envois
EP1718423B1 (fr) Procede pour trier des envois postaux en plusieurs passes de tri
EP2190594B1 (fr) Procédé de traitement d&#39;envois postaux avec des codes client associés à des empreintes numériques
EP1519796B2 (fr) Chronomarquage d&#39;objets postaux par signature d&#39;image et machine de tri postal associee
EP1866105B1 (fr) Procédé de traitement d&#39;envois incluant une gestion des empreintes numériques des envois
EP1850973B1 (fr) Procede de traitement d&#39;envois postaux avec une detection des occurrences d&#39;attributs ocr
EP2791866B1 (fr) Procédé de traitement d&#39;envois postaux avec génération de modèles numériques de filantes sur borne interactive
EP2822709B1 (fr) Procédé de suivi d&#39;envois postaux pour mesurer des temps de parcours dans un système de tri postal multi réseaux
EP3903230B1 (fr) Appariement structurel d&#39;images par hachage de descripteurs de singularités du gradient
EP3205412B1 (fr) Methode pour trier des articles de courrier pre-tries

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200880018109.0

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 12282438

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08805830

Country of ref document: EP

Kind code of ref document: A2

WWE Wipo information: entry into national phase

Ref document number: 2008805830

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2688163

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2010509870

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE