RU2630373C2 - Method and device for clustering - Google Patents

Method and device for clustering Download PDF

Info

Publication number
RU2630373C2
RU2630373C2 RU2015129671A RU2015129671A RU2630373C2 RU 2630373 C2 RU2630373 C2 RU 2630373C2 RU 2015129671 A RU2015129671 A RU 2015129671A RU 2015129671 A RU2015129671 A RU 2015129671A RU 2630373 C2 RU2630373 C2 RU 2630373C2
Authority
RU
Russia
Prior art keywords
distance
class
classes
weighted
objects
Prior art date
Application number
RU2015129671A
Other languages
Russian (ru)
Other versions
RU2015129671A (en
Inventor
Чжицзюнь ЧЭНЬ
Бо ЧЗАН
Тао ЧЗАН
Линь ВАН
Original Assignee
Сяоми Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сяоми Инк. filed Critical Сяоми Инк.
Publication of RU2015129671A publication Critical patent/RU2015129671A/en
Application granted granted Critical
Publication of RU2630373C2 publication Critical patent/RU2630373C2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Abstract

FIELD: physics.
SUBSTANCE: in the clustering method, a weighted distance between classes is obtained according to the weight coefficients corresponding to the interobject distances. Herewith the weight coefficient is determined according to the similarity between the two objects, i.e. the interobjective distance is weighted. Classes are combined, weighted distances between them correspond to the unification condition. Herewith the execution of the method is not completed until the number of classes after the union is not the same as the number of classes before the union. Then the result of clustering is obtained. Since the weighted distance is related to the similarity between the two objects, the different interobject distances provide a different contribution. The more similar, the larger will be the corresponding contribution.
EFFECT: increasing the accuracy of the clustering result.
7 cl, 8 dwg

Description

Настоящая заявка ссылается на приоритет заявки на патент Китайской Народной Республики №201410096608.9, на которой она основана и которая была зарегистрирована 14 марта 2014 года. При этом содержимое упомянутой заявки полностью включено в настоящий документ путем ссылки.This application refers to the priority of the patent application of the People's Republic of China No. 20140096608.9, on which it is based and which was registered on March 14, 2014. Moreover, the contents of the mentioned application is fully incorporated into this document by reference.

Область техникиTechnical field

[0001] Настоящее изобретение относится, в общем, к области компьютерных технологий, а именно, к способу кластеризации и к соответствующему устройству.[0001] The present invention relates, in General, to the field of computer technology, namely, to a clustering method and to a corresponding device.

Предпосылки создания изобретенияBACKGROUND OF THE INVENTION

[0002] Кластеризацией называется процедура разделения набора физических или абстрактных объектов на множество классов, каждый из которых состоит из сходных объектов, то есть, процедура классификации объектов по различным классам (или кластерам) таким образом, чтобы объекты в одном классе имели значительное сходство, а объекты из различных классов имели значительное несходство. В методах иерархической кластеризации заданное множество объектов иерархически разделяют до тех пор, пока не будет выполнено некоторое условие завершения. Метод агломерационной иерархической кластеризации - это стратегия восходящей кластеризации, в нем каждый объект сначала считают отдельным классом, и затем объединяют эти классы во все более крупные классы то тех пор, пока не будет достигнуто некоторое условие завершения. Большинство методов иерархической кластеризации относятся к подобному типу, отличаются только определения сходства между классами.[0002] Clustering is a procedure for dividing a set of physical or abstract objects into many classes, each of which consists of similar objects, that is, a procedure for classifying objects into different classes (or clusters) so that objects in the same class have significant similarities, and objects from different classes had significant dissimilarity. In hierarchical clustering methods, a given set of objects is hierarchically divided until a certain termination condition is satisfied. The method of agglomerative hierarchical clustering is an upward clustering strategy, in which each object is first considered a separate class, and then these classes are combined into larger classes until a certain termination condition is reached. Most hierarchical clustering methods are of this type, only the definitions of similarity between classes differ.

[0003] Например, если метод кластеризации используют для классификации изображений, то изображения, относящиеся к одному человеку, относят к одному классу, при этом в соответствующем методе кластеризации для измерения сходства двух лиц используют только расстояния между классами. Однако расстояния между соответствующими объектами вносят практически столь же значительный вклад в измерение сходства, и поэтому точность результатов кластеризации в подобных методах кластеризации является сравнительно низкой.[0003] For example, if the clustering method is used to classify images, then images belonging to one person are assigned to the same class, while in the corresponding clustering method, only distances between classes are used to measure the similarity of two faces. However, the distances between the corresponding objects make an almost equally significant contribution to the measurement of similarity, and therefore the accuracy of the clustering results in such clustering methods is relatively low.

Сущность изобретенияSUMMARY OF THE INVENTION

[0004] С целью преодоления недостатков, имеющихся на существующем уровне техники, в настоящем изобретении предложены способ кластеризации и соответствующее устройство, которые позволяют повысить точность результатов кластеризации.[0004] In order to overcome the disadvantages of the prior art, the present invention provides a clustering method and a corresponding device that can improve the accuracy of the clustering results.

[0005] Для решения поставленной выше технической задачи в вариантах осуществления настоящего изобретения предложены технические решения, которые будут изложены ниже.[0005] To solve the above technical problem in the embodiments of the present invention proposed technical solutions, which will be described below.

[0006] В соответствии с первым аспектом вариантов осуществления настоящего изобретения предложен способ кластеризации, включающий:[0006] In accordance with a first aspect of embodiments of the present invention, a clustering method is provided, comprising:

[0007] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, при этом упомянутый коэффициент определяют в соответствии со сходством между двумя объектами согласно межобъектному расстоянию; определение, имеются ли классы, которые могут быть объединены, в соответствии с упомянутым взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; если классы, которые могут быть объединены, существуют, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния в отношении всех объединяемых классов до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов до объединения, и получение результата кластеризации.[0007] obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the interobjective distance with respect to all classes to be combined, said coefficient being determined in accordance with the similarity between the two objects according to the interobjective distance; determining whether there are classes that can be combined in accordance with said weighted distance between the two classes and a predetermined distance distance threshold; if classes that can be combined exist, a corresponding union of all classes that can be combined and a return to the step of obtaining a weighted distance for all classes to be merged until the number of classes after combining is the same as the number of classes before joining, and obtaining the result of clustering.

[0008] В сочетании с первым аспектом настоящего изобретения, в первой возможной реализации этого первого аспекта, способ дополнительно включает:[0008] In combination with the first aspect of the present invention, in a first possible implementation of this first aspect, the method further includes:

[0009] получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.[0009] obtaining a correspondence relationship between the inter-object distance and the probability that two objects are the same object, in accordance with statistics on exemplary objects; and determining a display relationship between the inter-object distance and said weight coefficient according to said correspondence relation, wherein said weight coefficient is determined in accordance with said probability.

[0010] В сочетании с первой возможной реализацией первого аспекта настоящего изобретения, во второй реализации этого первого аспекта, определение отношения отображения между упомянутым межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия выполняют следующим образом:[0010] In combination with the first possible implementation of the first aspect of the present invention, in the second implementation of this first aspect, determining a display relationship between said inter-object distance and said weighting coefficient according to said correspondence relation is performed as follows:

[0011] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.[0011] requesting said correspondence relationship to obtain the probability that two objects corresponding to the inter-object distance are the same object; and determining that this probability is a weighting coefficient corresponding to said interobjective distance.

[0012] В сочетании с первым аспектом настоящего изобретения или первой возможной реализацией этого первого аспекта, в третьей возможной реализации первого аспекта настоящего изобретения упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, выполняют следующим образом:[0012] In combination with the first aspect of the present invention or the first possible implementation of this first aspect, in a third possible implementation of the first aspect of the present invention, said weighted distance is a weighted distance between a first class and a second class; in this case, obtaining a weighted distance between two classes according to the weight coefficient corresponding to the interobjective distance in relation to all classes to be combined is performed as follows:

[0013] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.[0013] receive the first unidirectional weighted distance between the first class and the second class, according to the distances between all objects of the first class and all objects of the second class, and the corresponding weights; receive a second unidirectional weighted distance between the second class and the first class; and get a weighted distance between the first class and the second class in accordance with the aforementioned first unidirectional weighted distance and the second unidirectional weighted distance.

[0014] В сочетании с третьей возможной реализацией первого настоящего изобретения, в четвертой возможной реализации этого первого аспекта получение первого однонаправленного взвешенного расстояния между первым классом и вторым классом согласно расстояниям между всеми объектами упомянутого первого класса и всеми объектами упомянутого второго класса, и соответствующими весовыми коэффициентами, выполняют следующим образом:[0014] In combination with the third possible implementation of the first present invention, in the fourth possible implementation of this first aspect, obtaining a first unidirectional weighted distance between the first class and the second class according to the distances between all objects of said first class and all objects of said second class, and corresponding weighting factors perform as follows:

[0015] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства;[0015] obtain the largest similarity distance between any of the objects in said first class and all the objects of said second class, and a first weight coefficient corresponding to this largest similarity distance;

[0016] получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;[0016] obtaining a minimum weighted distance between an object in said first class and all objects of said second class, according to a product of said greatest similarity distance and said corresponding first weight coefficient;

[0017] получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;[0017] obtaining a weighted average distance over distances between an object in said first class and other objects, with the exception of an object that corresponds to said largest similarity distance in said second class;

[0018] получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутом вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и[0018] obtaining a weighted distance between an object in said first class and said second class, in accordance with said minimum weighted distance and said average weighted distance; and

[0019] получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.[0019] the first unidirectional weighted distance between said first class and said second class is obtained in accordance with the weighted distances between all objects in said first class and said second class, and weights corresponding to these weighted distances.

[0020] В соответствии со вторым аспектом вариантов осуществления настоящего изобретения предложено устройство для кластеризации, включающее:[0020] In accordance with a second aspect of embodiments of the present invention, an apparatus for clustering is provided, comprising:

[0021] блок получения, сконфигурированный для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;[0021] a receiving unit configured to obtain a weighted distance between the two classes according to a weight coefficient corresponding to interobject distances for all classes to be combined, said weight coefficient being determined in accordance with the similarity of two objects corresponding to the interobject distance;

[0022] блок определения, сконфигурированный для определения, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и[0022] a determination unit configured to determine if there are classes that can be combined in accordance with the weighted distance between the two classes and a predetermined distance threshold value; and

[0023] блок объединения, сконфигурированный для соответствующего объединения всех классов, которые могут быть объединены, если классы, которые могут быть объединены, существуют, при этом упомянутый блок получения выполняет шаг получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.[0023] a combining unit configured to appropriately combine all classes that can be combined if classes that can be combined exist, while said obtaining unit performs the step of obtaining a weighted distance between the two classes according to a weight coefficient corresponding to the inter-object distance with respect to all merged classes, until the number of classes after merging is the same as the number of classes before merging, and to obtain the result of the cluster ation.

[0024] В сочетании со вторым аспектом настоящего изобретения, в первой возможной реализации этого второго аспекта, устройство дополнительно включает:[0024] In combination with the second aspect of the present invention, in a first possible implementation of this second aspect, the device further includes:

[0025] блок статистики, сконфигурированный для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам;[0025] a statistics unit configured to obtain a correspondence relationship between the inter-object distance and the probability that two objects are the same object, according to statistics on exemplary objects;

[0026] блок определения, сконфигурированный для определения отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.[0026] a determination unit configured to determine a display relationship between the inter-object distance and said weighting coefficient according to said correspondence relation, wherein said weighting coefficient is determined in accordance with said probability.

[0027] В сочетании с первой возможной реализацией второго аспекта настоящего изобретения, во второй возможной реализации этого второго аспекта, упомянутый блок определения включает:[0027] In combination with a first possible implementation of the second aspect of the present invention, in a second possible implementation of this second aspect, said determining unit includes:

[0028] подблок запроса, сконфигурированный для запроса упомянутого отношения соответствия с целью получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же человеком;[0028] a request subunit configured to query said correspondence relationship in order to obtain a probability that two objects corresponding to a particular inter-object distance are the same person;

[0029] подблок определения, сконфигурированный для определения того, что упомянутая вероятность является упомянутым весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.[0029] a determination subunit configured to determine that said probability is said weighting coefficient corresponding to said interobjective distance.

[0030] В сочетании с первой возможной реализацией второго аспекта настоящего изобретения или второй возможной реализацией второго аспекта настоящего изобретения, в третьей возможной реализации этого третьего аспекта упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом, при этом упомянутый блок получения включает:[0030] In combination with the first possible implementation of the second aspect of the present invention or the second possible implementation of the second aspect of the present invention, in the third possible implementation of this third aspect, said weighted distance is a weighted distance between the first class and the second class, wherein said obtaining unit includes:

[0031] первый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;[0031] a first receiving subunit configured to obtain the largest similarity distance between any of the objects in said first class and all objects of said second class, and a first weight coefficient corresponding to this largest similarity distance;

[0032] второй подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом, согласно упомянутому наибольшему расстоянию сходства и соответствующему первому весовому коэффициенту, в отношении всех объектов упомянутого первого класса;[0032] a second receiving subunit configured to obtain a first unidirectional weighted distance between said first class and said second class, according to said largest similarity distance and corresponding first weight coefficient, with respect to all objects of said first class;

[0033] третий подблок получения, сконфигурированный для получения второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; и[0033] a third receiving subunit configured to obtain a second unidirectional distance between said second class and said first class; and

[0034] четвертый подблок получения, сконфигурированный для получения взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.[0034] a fourth receiving subunit configured to obtain a weighted distance between said first class and said second class according to said first unidirectional weighted distance and a second unidirectional weighted distance.

[0035] В сочетании с третьей возможной реализации второго аспекта настоящего изобретения, в четвертой возможной реализацией этого второго аспекта упомянутый второй подблок получения включает:[0035] In combination with a third possible implementation of the second aspect of the present invention, in a fourth possible implementation of this second aspect, said second receiving subunit includes:

[0036] пятый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;[0036] a fifth acquisition subunit, configured to obtain the largest similarity distance between any of the objects in said first class and all objects of said second class, and a first weight coefficient corresponding to this largest similarity distance;

[0037] шестой подблок получения, сконфигурированный для получения минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;A sixth receiving subunit, configured to obtain a minimum weighted distance between an object in said first class and all objects of said second class, according to a product of said largest similarity distance and said corresponding first weight coefficient;

[0038] седьмой подблок получения, сконфигурированный для получения среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;[0038] a seventh acquisition subunit configured to obtain a weighted average distance between the object in said first class and other objects, with the exception of the object that corresponds to the largest similarity distance in said second class;

[0039] восьмой подблок получения, сконфигурированный для получения взвешенного расстояния между объектом в упомянутом первом классе и упомянутом вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и[0039] an eighth receiving subunit configured to obtain a weighted distance between an object in said first class and said second class, in accordance with said minimum weighted distance and said average weighted distance; and

[0040] девятый подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.[0040] a ninth acquisition subunit, configured to obtain a first unidirectional weighted distance between said first class and said second class in accordance with weighted distances between all objects in said first class and said second class, and weights corresponding to these weighted distances.

[0041] В соответствии с третьим аспектом вариантов осуществления настоящего изобретения предложено оконечное устройство, включающее:[0041] In accordance with a third aspect of embodiments of the present invention, there is provided a terminal device including:

[0042] процессор; и память, сконфигурированную для хранения инструкций, исполняемых упомянутым процессором;[0042] a processor; and a memory configured to store instructions executed by said processor;

[0043] при этом упомянутый процессор сконфигурирован:[0043] wherein said processor is configured:

[0044] для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;[0044] to obtain a weighted distance between the two classes according to the weight coefficient corresponding to the inter-object distances in relation to all classes to be combined, said weight coefficient being determined in accordance with the similarity of the two objects corresponding to the inter-object distance;

[0045] для определения, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и[0045] to determine if there are classes that can be combined in accordance with the weighted distance between the two classes and a predetermined distance threshold value; and

[0046] если два класса могут быть объединены, для соответствующего объединения всех классов, которые могут быть объединены, и для возврата к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.[0046] if two classes can be combined, for the corresponding combination of all classes that can be combined, and to return to the step of obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the interobjective distance with respect to all combined classes, until until the number of classes after the union is the same as the number of classes before the union, and to obtain the result of clustering.

[0047] Технические решения, предложенные в вариантах осуществления настоящего изобретения, могут давать следующие полезные результаты: в способе кластеризации получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, и затем в способе кластеризации выполняют объединение классов, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, и затем получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между двумя объектами, различные межобъектные расстояния обеспечивают различный вклад, и чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.[0047] The technical solutions proposed in the embodiments of the present invention can give the following useful results: in the clustering method, weighted distances between classes are obtained according to weights corresponding to interobject distances, while the weight coefficient is determined according to the similarity between two objects, i.e. the interobjective distance is weighted, and then in the clustering method, classes are combined, the weighted distances between which meet the join condition, while the method is not completed until the number of classes after combining is the same as the number of classes after combining, and then get the result of clustering. Since the weighted distance is related to the similarity between the two objects, different interobjective distances provide a different contribution, and the greater the similarity, the greater the corresponding contribution. Thus, increasing the accuracy of the clustering result is provided.

[0048] Нужно понимать, что и предшествующее общее описание, и подробное описание, приведенное ниже, являются исключительно иллюстративными и пояснительными, и не ограничивают настоящее изобретение.[0048] It should be understood that both the foregoing general description and the detailed description below are solely illustrative and explanatory, and do not limit the present invention.

Краткое описание чертежейBrief Description of the Drawings

[0049] На приложенных чертежах, которые входят в состав настоящего описания и являются его неотъемлемой частью, проиллюстрированы варианты осуществления, соответствующие настоящему изобретению. Приложенные чертежи, вместе с описанием, служат для разъяснения замысла настоящего изобретения:[0049] In the attached drawings, which are part of the present description and are an integral part thereof, the embodiments corresponding to the present invention are illustrated. The accompanying drawings, together with a description, serve to explain the intent of the present invention:

[0050] фиг. 1 представляет собой блок-схему алгоритма, иллюстрирующую способ кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;[0050] FIG. 1 is a flowchart illustrating a clustering method in accordance with one embodiment of the present invention;

[0051] фиг. 2 представляет собой блок-схему алгоритма, иллюстрирующую шаг S110 на фиг. 1 в соответствии с одним из примеров осуществления настоящего изобретения;[0051] FIG. 2 is a flowchart illustrating step S110 in FIG. 1 in accordance with one embodiment of the present invention;

[0052] фиг. 3 представляет собой блок-схему алгоритма, иллюстрирующую шаг S111 на фиг. 2 в соответствии с одним из примеров осуществления настоящего изобретения;[0052] FIG. 3 is a flowchart illustrating step S111 in FIG. 2 in accordance with one embodiment of the present invention;

[0053] фиг. 4 представляет собой блок-схему алгоритма с иллюстрацией получения весового коэффициента в соответствии с одним из примеров осуществления настоящего изобретения;[0053] FIG. 4 is a flowchart illustrating weighting in accordance with one embodiment of the present invention;

[0054] фиг. 5 представляет собой блок-схему, иллюстрирующую устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;[0054] FIG. 5 is a block diagram illustrating an apparatus for clustering in accordance with one embodiment of the present invention;

[0055] фиг. 6 представляет собой блок-схему, иллюстрирующую другое устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;[0055] FIG. 6 is a block diagram illustrating another apparatus for clustering in accordance with one embodiment of the present invention;

[0056] фиг. 7 представляет собой блок-схему, иллюстрирующую оконечное устройство в соответствии с одним из примеров осуществления настоящего изобретения; и[0056] FIG. 7 is a block diagram illustrating a terminal device in accordance with one embodiment of the present invention; and

[0057] Фиг. 8 представляет собой блок-схему, иллюстрирующую сервер в соответствии с одним из примеров осуществления настоящего изобретения.[0057] FIG. 8 is a block diagram illustrating a server in accordance with one embodiment of the present invention.

[0058] Конкретные варианты осуществления изобретения в настоящем документе и на приложенных чертежах приведены исключительно для примера и будут боле подробно рассмотрены ниже. Чертежи не имеют целью сколь-либо ограничить объем настоящего изобретения. Напротив, они приведены для иллюстрации замысла изобретения специалистам в данной области техники на примерах конкретных вариантов осуществления изобретения.[0058] Specific embodiments of the invention herein and in the accompanying drawings are for illustrative purposes only and will be discussed in more detail below. The drawings are not intended to limit the scope of the present invention in any way. On the contrary, they are given to illustrate the concept of the invention to specialists in this field of technology on the examples of specific embodiments of the invention.

Подробное описание изобретенияDETAILED DESCRIPTION OF THE INVENTION

[0059] Фиг. 1 представляет собой блок-схему алгоритма, иллюстрирующую способ кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг.1 способ кластеризации может включать следующие шаги.[0059] FIG. 1 is a flowchart illustrating a clustering method in accordance with one embodiment of the present invention. In accordance with the illustration of FIG. 1, a clustering method may include the following steps.

[0060] На шаге S110 получают взвешенное расстояние между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют согласно сходству между объектами.[0060] In step S110, a weighted distance between the two classes is obtained according to the weight coefficient corresponding to the inter-object distances with respect to all the classes to be combined, and the weight coefficient is determined according to the similarity between the objects.

[0061] Если допустить, что объектами являются изображения человеческих лиц, то при помощи способа кластеризации, предложенного в настоящем изобретении, изображения одного и того же человека могут быть собраны вместе с формированием одного кластера. Характеристические признаки в изображении лица преобразуют в группу векторов, поэтому межобъектное расстояние представляет собой расстояние между векторами. При этом, помимо изображений, способ кластеризации, предложенный в настоящем изобретении, может также применяться и к другим данным.[0061] Assuming that the objects are images of human faces, using the clustering method proposed in the present invention, images of the same person can be assembled together with the formation of one cluster. Characteristic features in the face image are converted into a group of vectors, so the interobject distance is the distance between the vectors. Moreover, in addition to images, the clustering method proposed in the present invention can also be applied to other data.

[0062] Перед кластеризацией сначала выполняют инициализацию: каждый объект относят к одному классу и вычисляют расстояния между этими классами, т.е. расстояния между объектами, входящими в этим классы (например, близость косинусов, евклидово расстояние и т.п.)[0062] Before clustering, initialization is performed first: each object is assigned to one class and distances between these classes are calculated, that is, the distance between objects in these classes (for example, the proximity of cosines, Euclidean distance, etc.)

[0063] Чем больше сходство между объектами, тем большее значение имеет соответствующий весовой коэффициент; и наоборот, чем меньше сходство между объектами, тем соответствующий весовой коэффициент имеет меньшее значение. Например, весовой коэффициент может быть определен в соответствии с вероятностью того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом. Или, весовой коэффициент получают с использованием взвешенной кернфункции

Figure 00000001
, где w - весовой коэффициент, a d - межобъектное расстояние. Например,
Figure 00000002
; или весовой коэффициент может быть также получен с использованием заранее заданного порога, числовое значение которого в данном описании не уточняется.[0063] The greater the similarity between the objects, the more important is the corresponding weight coefficient; and vice versa, the smaller the similarity between the objects, the corresponding weight coefficient is less important. For example, a weighting coefficient may be determined in accordance with the probability that two objects corresponding to a particular inter-object distance are the same object. Or, a weight coefficient is obtained using a weighted core function
Figure 00000001
where w is the weight coefficient, ad is the interobjective distance. For example,
Figure 00000002
; or a weighting factor can also be obtained using a predetermined threshold, the numerical value of which is not specified in this description.

[0064] В одном из вариантов осуществления настоящего изобретения, в соответствии с иллюстрацией фиг. 2, шаг S110 может включать описанные ниже шаги S111-S113.[0064] In one embodiment of the present invention, in accordance with the illustration of FIG. 2, step S110 may include steps S111-S113 described below.

[0065] На шаге S111 получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и в втором классе, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.[0065] In step S111, a first unidirectional weighted distance between the first class and the second class is obtained in accordance with the weighted distances between all objects in the first class and the second class, and weights corresponding to these weighted distances.

[0066] В одном из вариантов осуществления настоящего изобретения, в соответствии с иллюстрацией фиг. 3, шаг S111 может включать следующие шаги S1111-S1113.[0066] In one embodiment of the present invention, in accordance with the illustration of FIG. 3, step S111 may include the following steps S1111-S1113.

[0067] На шаге S1111 получают наибольшее расстояние сходства между любым из объектов в первом классе и всеми объектами второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства.[0067] In step S1111, the largest similarity distance between any of the objects in the first class and all the objects of the second class is obtained, and the first weighting coefficient corresponding to this largest similarity distance.

[0068] Допустим, что первый класс обозначен за А, а второй класс обозначен за В. Вычисляют взвешенное расстояние между классом А и классом В. Сначала вычисляют расстояния d(Ai, В) между любым из объектов Аi в классе А и всеми объектами в классе В, и затем получают наибольшее расстояние сходства между объектом Ai и всеми объектами в классе В. В данном варианте осуществления настоящего изобретения используется близость косинусов. То есть, межобъектное сходство, соответствующее максимальной близости косинусов, dmax(Ai,В), является наибольшим.[0068] Assume that the first class is labeled A and the second class is labeled B. The weighted distance between class A and class B is calculated. First, the distances d (A i , B) between any of the objects A i in class A and all objects in class B, and then get the greatest similarity distance between object A i and all objects in class B. In this embodiment, the proximity of cosines is used. That is, the interobject similarity corresponding to the maximum proximity of cosines, d max (A i , B), is the greatest.

[0069] В одном из примеров осуществления настоящего изобретения получение весового коэффициента может выполняться в соответствии с вероятностью того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом. В соответствии с иллюстрацией фиг. 4 это может включать следующие шаги.[0069] In one embodiment of the present invention, weighting can be performed in accordance with the probability that two objects corresponding to a particular inter-object distance are the same object. In accordance with the illustration of FIG. 4 this may include the following steps.

[0070] На шаге S100 получают отношение соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам.[0070] In step S100, a correspondence relationship is obtained between the inter-object distance and the probability that two objects are the same object, according to statistics on exemplary objects.

[0071] Например, в случае распознавания лиц, диапазон близости косинусов cosθ для двух изображений лица может быть равен [0, 1] по признакам высокой размерности, и при этом согласно статистическим данным по большому количеству изображений лиц, делают вывод, что если близость косинусов лежит в диапазоне [0,45, 1], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 98%; если близость косинусов лежит в диапазоне [0.35, 0.45], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 70%; если близость косинусов лежит в диапазоне [0,25, 0,35], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 40%; если близость косинусов лежит в диапазоне [0,15, 0,25], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 10%; и если близость косинусов лежит в диапазоне [0, 0, 15], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 0,1%[0071] For example, in the case of face recognition, the range of proximity of cosines cosθ for two face images can be [0, 1] for signs of high dimensionality, and according to statistics for a large number of face images, it is concluded that if the proximity of cosines lies in the range [0.45, 1], the probability that two objects are the same person, in fact, is 98%; if the proximity of cosines lies in the range [0.35, 0.45], the probability that two objects are the same person, in fact, is 70%; if the proximity of cosines lies in the range [0.25, 0.35], the probability that two objects are the same person, in fact, is 40%; if the proximity of cosines lies in the range [0.15, 0.25], the probability that two objects are the same person, in fact, is 10%; and if the proximity of cosines lies in the range [0, 0, 15], the probability that two objects are the same person, in fact, is 0.1%

[0072] Согласно приведенным выше статистическим результатам соотношение между весовым коэффициентом и близостью косинусов может быть задано с помощью следующей формулы (1):[0072] According to the above statistical results, the relationship between the weight coefficient and the proximity of the cosines can be set using the following formula (1):

[0073]

Figure 00000003
[0073]
Figure 00000003

[0074] Формула (1) является отношением соответствия между близостью косинусов и вероятностью того, что два объекта являются одним и тем же человеком. Согласно соотношению между расстояниями и соответствующими вероятностями могут выводиться заключения и по другим типам расстояний, которые в настоящем документе перечислены не будут.[0074] Formula (1) is the ratio of the correspondence between the proximity of cosines and the probability that two objects are the same person. According to the relationship between distances and corresponding probabilities, conclusions can also be drawn on other types of distances that will not be listed in this document.

[0075] На шаге S200 определяют отношение отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия, при этом весовой коэффициент определяют в соответствии с упомянутой вероятностью.[0075] In step S200, a display relationship between the inter-object distance and the weight coefficient is determined according to the correspondence relation, and the weight coefficient is determined in accordance with the probability.

[0076] Получают межобъектное расстояние и затем определяют, в каком из диапазонов формулы (1) это межобъектное расстояние находится. Наконец, в соответствии с формулой (1) определяют отношение отображения между межобъектным расстоянием и весовым коэффициентом. Весовой коэффициент, полученный описанным выше методом на основе dmax(Ai,В) будет равен W(dmax(Ai,B))[0076] An inter-object distance is obtained and then it is determined in which of the ranges of the formula (1) this inter-object distance is. Finally, in accordance with the formula (1), a mapping relationship between the inter-object distance and the weight coefficient is determined. The weight coefficient obtained by the method described above based on d max (A i , B) will be equal to W (d max (A i , B))

[0077] На шаге S1112 получают минимальное взвешенное расстояние (максимальную близость косинусов) между объектом в первом классе и всеми объектами второго класса в соответствии с произведением наибольшего расстояния сходства и соответствующего первого весового коэффициента.[0077] In step S1112, a minimum weighted distance (maximum cosine proximity) between an object in the first class and all objects of the second class is obtained in accordance with the product of the largest similarity distance and the corresponding first weight coefficient.

[0078] Минимальное взвешенное расстояние ϕmax(Ai,В) между объектом Аi и классом В получают согласно формуле (2):[0078] The minimum weighted distance ϕ max (A i , B) between object A i and class B is obtained according to formula (2):

[0079]

Figure 00000004
[0079]
Figure 00000004

[0080] На шаге S1113 получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе.[0080] In step S1113, a weighted average distance is obtained from the distances between an object in said first class and other objects, with the exception of an object that corresponds to said largest similarity distance in said second class.

[0081] Допустим, что расстояние между объектом Ai в классе А и объектом b является наибольшим, тогда среднее взвешенное расстояние ϕavg(Ai,B) между объектом Ai и остальными объектами, за исключением объекта b в классе В, получают согласно формуле (3):[0081] Assume that the distance between object Ai in class A and object b is the largest, then the weighted average distance ϕ avg (A i , B) between object Ai and other objects, except object b in class B, is obtained according to the formula ( 3):

[0082]

Figure 00000005
[0082]
Figure 00000005

[0083] На шаге S1114 получают взвешенное расстояние между объектом в первом классе и вторым классом, в соответствии с минимальным взвешенным расстоянием и средним взвешенным расстоянием.[0083] In step S1114, a weighted distance between the object in the first class and the second class is obtained in accordance with the minimum weighted distance and the average weighted distance.

[0084] На основе минимального взвешенного расстояния ϕmax(Ai,В) и среднего взвешенного расстояния ϕavg(Ai,B) между объектом Ai и классом В, взвешенное расстояние ϕ (Ai,В) между объектом Ai и классом В получают согласно формуле (4):[0084] Based on the minimum weighted distance ϕ max (A i , B) and the average weighted distance ϕ avg (A i , B) between object A i and class B, the weighted distance ϕ (A i , B) between object A i and class B receive according to the formula (4):

[0085]

Figure 00000006
[0085]
Figure 00000006

[0086] На шаге S1115 получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовым коэффициентом, соответствующим наибольшему расстоянию сходства.[0086] In step S1115, a first unidirectional weighted distance between the first class and the second class is obtained in accordance with the weighted distances between all objects in the first class and the second class, and a weight coefficient corresponding to the largest similarity distance.

[0087] Первое однонаправленное взвешенное расстояние S(A, В) между классом А и классом D получают согласно формуле (5):[0087] The first unidirectional weighted distance S (A, B) between class A and class D is obtained according to formula (5):

[0088]

Figure 00000007
[0088]
Figure 00000007

[0089] В формуле (5) W(dmax(Ai,B)) обозначает весовой коэффициент, соответствующий максимальной близости косинусов (минимальному расстоянию) dmax(Ai,В) между объектом Ai в классе А и всеми объектами в классе В.[0089] In formula (5), W (d max (A i , B)) denotes a weight coefficient corresponding to the maximum proximity of cosines (minimum distance) d max (A i , B) between an object A i in class A and all objects in class B.

[0090] На шаге S112 получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом.[0090] In step S112, a second unidirectional weighted distance between the second class and the first class is obtained.

[0091] Вычисляют второе однонаправленное взвешенного расстояния S(B, А) между классом В и классом, что аналогично вычислению первого однонаправленного взвешенного расстояния между классом А и В и не будет описано повторно.[0091] The second unidirectional weighted distance S (B, A) between class B and class is calculated, which is similar to the calculation of the first unidirectional weighted distance between class A and B and will not be described again.

[0092] На шаге S113, получают взвешенное расстояние между первым классом и вторым классом согласно первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.[0092] In step S113, a weighted distance between the first class and the second class is obtained according to the first unidirectional weighted distance and the second unidirectional weighted distance.

[0093] Взвешенное расстояние Н(А, В) между классом А и классом В вычисляют согласно формуле (6):[0093] The weighted distance H (A, B) between class A and class B is calculated according to formula (6):

[0094]

Figure 00000008
[0094]
Figure 00000008

[0095] На шаге S120 определяют, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния. Если классы, которые могут быть объединены существуют выполняют шаг S130; а если классов, которые могут быть объединены не существуют, выполняют шаг S140.[0095] In step S120, it is determined whether there are classes that can be combined in accordance with the weighted distance between the two classes and a predetermined distance threshold value. If classes that can be combined exist, perform step S130; and if classes that can be combined do not exist, perform step S140.

[0096] Заранее заданное пороговое значение может быть выбрано в соответствии с типами данных различных объектов, или может быть выбрано в соответствии с типом вычисляемого межобъектного расстояния (например, близость косинусов, евклидово расстояние и т.п.) Например, объектами могут быть изображения лиц, и при этом межобъектным расстоянием может быть близость косинусов. В этом случае пороговое значение расстояния может быть выбрано равным 0,3-0,35.[0096] A predetermined threshold value may be selected according to the data types of various objects, or may be selected according to the type of calculated inter-object distance (for example, cosine proximity, Euclidean distance, etc.). For example, objects can be face images , and the interobjective distance may be the proximity of cosines. In this case, the threshold value of the distance can be selected equal to 0.3-0.35.

[0097] Для различных типов межклассовых расстояний, используемых при вычислении взвешенного расстояния, условия для определения возможности объединения двух классов также могут быть различными.[0097] For the various types of interclass distances used in calculating the weighted distance, the conditions for determining whether two classes can be combined can also be different.

[0098] Когда взвешенные межклассовые расстояния получают согласно близости косинусов между классами, то определяют, не меньше ли взвешенное расстояние между двумя классами заданного порогового значения, и если взвешенное расстояние не меньше заранее заданного порогового значения расстояния, это означает, что сходство между классами является большим, и классы могут быть объединены.[0098] When the weighted interclass distances are obtained according to the proximity of the cosines between the classes, it is determined whether the weighted distance between the two classes is not less than a predetermined threshold value, and if the weighted distance is not less than a predetermined distance threshold value, this means that the similarity between the classes is large , and classes can be combined.

[0099] Когда взвешенные межклассовые расстояния вычисляют на основе евклидового расстояния или других расстояний, то определяют, является ли взвешенное расстояние между двумя классами не большим заданного порогового значения, и если взвешенное расстояние не больше заранее заданного порогового значения расстояния, это означает, что сходство между классами является большим, и классы могут быть объединены.[0099] When the weighted interclass distances are calculated based on the Euclidean distance or other distances, it is determined whether the weighted distance between the two classes is not greater than a predetermined threshold value, and if the weighted distance is not greater than a predetermined distance threshold value, this means that the similarity between The classes are large and the classes can be combined.

[00100] Взвешенное расстояние, предложенное в вариантах осуществления настоящего изобретения, получают с использованием минимального взвешенного расстояния и среднего взвешенного расстояния между классами, таким образом, не происходит уклона в сторону классов, имеющих большое количество объектов, но классы, в том числе имеющие малое количество объектов, рассматриваются всесторонне, что хорошо подходит для применения к кластеризации человеческих лиц. Соответственно, кластеризация с помощью взвешенного расстояния позволяет повысить точность кластеризации.[00100] The weighted distance proposed in the embodiments of the present invention is obtained using the minimum weighted distance and the average weighted distance between classes, so there is no bias towards classes having a large number of objects, but classes, including those with a small number objects are considered comprehensively, which is well suited to apply to the clustering of human faces. Accordingly, clustering using a weighted distance improves the accuracy of clustering.

[00101] При объединении двух классов, на шаге S130, соответствующим образом объединяют все классы, которые могут быть объединены.[00101] When combining the two classes, in step S130, all classes that can be combined are appropriately combined.

[00102] На шаге S140 определяют, является количество классов после объединения меньшим, чем количество классов перед объединением, если да, возвращаются к выполнению шага S110; и если нет, переходят к шагу S150.[00102] In step S140, it is determined whether the number of classes after combining is less than the number of classes before combining, if so, returning to step S110; and if not, go to step S150.

[00103] Если количество классов после объединения меньше, чем количество классов до объединения, возвращаются к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получение результата кластеризации, т.е. пока не останется больше классов, которые могут быть объединены, и получают результат кластеризации.[00103] If the number of classes after combining is less than the number of classes before combining, they return to the step of obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the inter-object distance in relation to all merged classes until the number of classes after combining is the same as the number of classes before joining, and to obtain the result of clustering, i.e. until there are no more classes that can be combined and get the result of clustering.

[00104] На шаге S150 получают результат кластеризации.[00104] In step S150, a clustering result is obtained.

[00105] Сходство объектов, объединенных в одном классе, является высоким, а их несходство - низким. Если в качестве объектов выбраны изображения лиц, то изображения лица, помещенного в один класс, будут изображениями одного и того же человека.[00105] The similarity of objects combined in one class is high, and their dissimilarity is low. If images of faces are selected as objects, then images of a person placed in one class will be images of the same person.

[00106] В способе кластеризации, предложенном в вариантах осуществления настоящего изобретения, получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, и затем в способе кластеризации выполняют объединение классов, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, и затем получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между объектами, то если сходство между объектами различно, то соответствующий вклад в результат кластеризации также будет различным, причем чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.[00106] In the clustering method proposed in the embodiments of the present invention, weighted distances between classes are obtained according to weights corresponding to interobject distances, while the weight coefficient is determined according to the similarity between two objects, i.e. the interobjective distance is weighted, and then in the clustering method, classes are combined, the weighted distances between which meet the join condition, while the method is not completed until the number of classes after combining is the same as the number of classes after combining, and then get the result of clustering. Since the weighted distance is related to the similarity between the objects, if the similarity between the objects is different, then the corresponding contribution to the clustering result will also be different, and the greater the similarity, the greater the corresponding contribution. Thus, increasing the accuracy of the clustering result is provided.

[00107] Фиг. 5 представляет собой блок-схему, иллюстрирующую устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг. 5 устройство включает блок 100 получения, блок 200 определения и блок 300 объединения.[00107] FIG. 5 is a block diagram illustrating an apparatus for clustering in accordance with one embodiment of the present invention. In accordance with the illustration of FIG. 5, the device includes a receiving unit 100, a determining unit 200, and a combining unit 300.

[00108] Блок получения 100 сконфигурирован для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию.[00108] The obtaining unit 100 is configured to obtain a weighted distance between two classes according to a weight coefficient corresponding to interobject distances for all classes to be combined, said weight coefficient being determined in accordance with the similarity of the two objects corresponding to the interobject distance.

[00109] Блок 100 получения может включать первый подблок получения, второй подблок получения, третий подблок получения и четвертый подблок получения.[00109] The receiving unit 100 may include a first receiving subunit, a second receiving subunit, a third receiving subunit, and a fourth receiving subunit.

[00110] Первый подблок получения сконфигурирован для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства.[00110] The first acquisition subunit is configured to obtain the largest similarity distance between any of the objects in said first class and all the objects of said second class, and a first weight coefficient corresponding to this largest similarity distance.

[00111] Второй подблок получения сконфигурирован для получения первого однонаправленного взвешенного расстояния между первым классом и вторым классом, согласно наибольшему расстоянию сходства и первому весовому коэффициенту, в отношении всех объектов первого класса.[00111] The second acquisition subunit is configured to obtain a first unidirectional weighted distance between the first class and the second class, according to the largest similarity distance and the first weighting factor, for all objects of the first class.

[00112] В одном из вариантов осуществления настоящего изобретения второй подблок получения может включать пятый подблок получения, шестой подблок получения, седьмой подблок получения, восьмой подблок получения и девятый подблок получения.[00112] In one embodiment, the second receiving subunit may include a fifth receiving subunit, a sixth receiving subunit, a seventh receiving subunit, an eighth receiving subunit, and a ninth receiving subunit.

[00113] Пятый подблок получения сконфигурирован для получения наибольшего расстояния сходства между любым из объектов в первом классе и всеми объектами второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства.[00113] The fifth acquisition subunit is configured to obtain the largest similarity distance between any of the objects in the first class and all objects of the second class, and the first weight coefficient corresponding to this largest similarity distance.

[00114] Шестой подблок получения сконфигурирован для получения минимального взвешенного расстояния между объектом в первом классе и всеми объектами второго класса, согласно произведению наибольшего расстояния сходства и соответствующего первого весового коэффициента;[00114] The sixth receiving subunit is configured to obtain a minimum weighted distance between an object in the first class and all objects of the second class, according to the product of the largest similarity distance and the corresponding first weight coefficient;

[00115] Седьмой подблок получения сконфигурирован для получения среднего взвешенного расстояния по расстояниям между объектом в первом классе и другими объектами, за исключением объекта, который соответствует наибольшему расстоянию сходства во втором классе.[00115] The seventh acquisition subunit is configured to obtain a weighted average distance over distances between an object in the first class and other objects, with the exception of the object that corresponds to the largest similarity distance in the second class.

[00116] Восьмой подблок получения сконфигурирован для получения взвешенного расстояния между объектом в первом классе и вторым классом, в соответствии с минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием.[00116] The eighth receiving subunit is configured to obtain a weighted distance between an object in the first class and the second class, in accordance with the minimum weighted distance and said average weighted distance.

[00117] Девятый подблок получения сконфигурирован для получения первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.[00117] The ninth acquisition subunit is configured to obtain a first unidirectional weighted distance between the first class and the second class in accordance with the weighted distances between all objects in the first class and the second class, and weights corresponding to these weighted distances.

[00118] Третий подблок получения сконфигурирован для получения второго однонаправленного расстояния между вторым классом и первым классом.[00118] The third receiving subunit is configured to obtain a second unidirectional distance between the second class and the first class.

[00119] Четвертый подблок получения сконфигурирован для получения взвешенного расстояния между первым классом и вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.[00119] The fourth acquisition subunit is configured to obtain a weighted distance between the first class and the second class according to said first unidirectional weighted distance and a second unidirectional weighted distance.

[00120] Блок 200 определения сконфигурирован для определения, имеются ли два класса, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния.[00120] The determining unit 200 is configured to determine if there are two classes that can be combined in accordance with the weighted distance between the two classes and a predetermined distance threshold value.

[00121] Блок 300 объединения сконфигурирован для соответствующего объединения всех классов, которые могут быть объединены, если какие-либо два класса могут быть объединены, и для обеспечения выполнения, блоком получения, шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, т.е. пока классы, которые могут быть объединены, не перестанут существовать, и для получения результата кластеризации.[00121] The combining unit 300 is configured to appropriately combine all classes that can be combined if any two classes can be combined, and to ensure that the receiving unit performs the step of obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the interobjective distance in relation to all merged classes, until the number of classes after the union is the same as the number of classes before the union, i.e. until the classes that can be combined do not cease to exist, and to obtain the result of clustering.

[00122] В устройстве для кластеризации, предложенном в вариантах осуществления настоящего изобретения, при помощи блока получения получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, затем определяют, при помощи блока определения, имеются ли классы, которые могут быть объединены, согласно взвешенному расстоянию, и затем, с помощью блока объединения, объединяют классы, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, в результате чего получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между объектами, то если сходство между объектами различно, то соответствующий вклад в результат кластеризации также будет различным, причем чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.[00122] In the clustering device proposed in the embodiments of the present invention, the weighted distances between classes according to weighting factors corresponding to interobject distances are obtained using the acquisition unit, and the weighting coefficient is determined according to the similarity between two objects, i.e. the interobjective distance is weighted, then it is determined, using the determining unit, whether there are classes that can be combined according to the weighted distance, and then, using the combining unit, the classes are combined, the weighted distances between which meet the join condition, while the method does not complete until the number of classes after the union is the same as the number of classes after the union, resulting in a clustering result. Since the weighted distance is related to the similarity between the objects, if the similarity between the objects is different, then the corresponding contribution to the clustering result will also be different, and the greater the similarity, the greater the corresponding contribution. Thus, increasing the accuracy of the clustering result is provided.

[00123] Фиг. 6 представляет собой блок-схему, иллюстрирующую другое устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг. 6 устройство включает блок 400 статистики, блок 500 определения, блок 100 получения, блок 200 определения и блок 300 объединения. При этом блоки, наименования и числовые обозначения которых аналогичны варианту осуществления настоящего изобретения на фиг. 5, имеют те же самые функции и не будут описаны повторно.[00123] FIG. 6 is a block diagram illustrating another apparatus for clustering in accordance with one embodiment of the present invention. In accordance with the illustration of FIG. 6, the device includes a statistics unit 400, a determination unit 500, a receiving unit 100, a determining unit 200, and a combining unit 300. Moreover, the blocks, the names and numerical designations of which are similar to the embodiment of the present invention in FIG. 5 have the same functions and will not be described again.

[00124] Блок 400 статистики сконфигурирован для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам.[00124] The statistics block 400 is configured to obtain a correspondence relationship between the inter-object distance and the likelihood that two objects are the same object, according to statistics on exemplary objects.

[00125] Блок 500 определения сконфигурирован для определения отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия, при этом весовой коэффициент определяют в соответствии с упомянутой вероятностью.[00125] The determination unit 500 is configured to determine a display relationship between the inter-object distance and the weighting coefficient according to the correspondence relation, wherein the weighting coefficient is determined in accordance with said probability.

[00126] Блок определения может включать подблок запроса и подблок определения.[00126] The determination unit may include a request subunit and a determination subunit.

[00127] Подблок запроса сконфигурирован для запроса упомянутого отношения соответствия с целью получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же человеком.[00127] The request subunit is configured to query said correspondence relationship in order to obtain a probability that two objects corresponding to a particular inter-object distance are the same person.

[00128] Подблок определения сконфигурирован для определения того, что упомянутая вероятность является весовым коэффициентом, соответствующим упомянутому расстоянию.[00128] The determination subunit is configured to determine that said probability is a weight coefficient corresponding to said distance.

[00129] Блок 300 получения, имеющий соединение с блоком 500 определения сконфигурирован для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию.[00129] The obtaining unit 300 having a connection with the determining unit 500 is configured to obtain a weighted distance between the two classes according to a weight coefficient corresponding to the inter-object distance.

[00130] В устройстве для кластеризации, предложенном в вариантах осуществления настоящего изобретения, сначала получают отношение соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же человеком, в соответствии с большим количеством образцовых объектов с целью определения соответствующего весового коэффициента, и затем получают взвешенное расстояние между классами, затем определяют классы, которые могут быть объединены, согласно взвешенному расстоянию, и затем классы, которые могут быть объединены, объединяют до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов до объединения, и таким образом получают результат кластеризации. Поскольку взвешенное расстояние связано с вероятностью того, что два объекта являются одним и тем же объектом, оно позволяет учесть ситуации, в которых вероятность того, что два объекта являются одним и тем же объектом, меняется с изменением расстояния между двум объектами, в результате чего различные межобъектные расстояния обеспечивают различные вклады, причем чем больше значение вероятности, тем больше соответствующий вклад. Таким образом, предложенный результат кластеризации позволяет повысить точность результатов кластеризации.[00130] In the clustering device proposed in the embodiments of the present invention, a correspondence relationship between the inter-object distance and the probability that two objects are the same person is first obtained in accordance with a large number of exemplary objects in order to determine the corresponding weight coefficient, and then a weighted distance between classes is obtained, then classes that can be combined according to a weighted distance are determined, and then classes that can be are combined, are combined until the number of classes after the union is the same as the number of classes before the union, and thus the result of clustering is obtained. Since the weighted distance is related to the probability that two objects are the same object, it allows you to take into account situations in which the probability that two objects are the same object changes with the distance between the two objects, resulting in different interobjective distances provide various contributions, and the larger the probability value, the greater the corresponding contribution. Thus, the proposed clustering result improves the accuracy of the clustering results.

[00131] В отношении устройств, предложенных в рассмотренных выше вариантах осуществления настоящего изобретения, конкретные методы выполнения операций для индивидуальных модулей из их состава были подробно описаны в вариантах осуществления настоящего изобретения, относящихся к способам кластеризации, и не будут приведены повторно.[00131] In relation to the devices proposed in the above embodiments of the present invention, specific methods for performing operations for individual modules of their composition have been described in detail in embodiments of the present invention related to clustering methods, and will not be repeated.

[00132] Фиг. 7 представляет собой блок-схему, иллюстрирующую оконечное устройство 800 для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. Например, устройство 800 может представлять собой мобильный телефон, компьютер, терминал цифрового вещания, устройство обмена сообщениями, игровую приставку, планшетный компьютер, медицинское устройство, тренажерное оборудование, карманный персональный компьютер и т.п.[00132] FIG. 7 is a block diagram illustrating a terminal device 800 for clustering in accordance with one embodiment of the present invention. For example, device 800 may be a mobile phone, a computer, a digital broadcast terminal, a messaging device, a game console, a tablet computer, a medical device, exercise equipment, a personal digital assistant, or the like.

[00133] В соответствии с иллюстрацией фиг. 7 устройство 800 может включать один или более следующих компонентов: процессорный компонент 802, память 804, компонент 806 электропитания, мультимедийный компонент 808, аудиокомпонент 810, интерфейс 812 ввода-вывода (input/output, I/O), измерительный компонент 814 и компонент 816 связи.[00133] In accordance with the illustration of FIG. 7, device 800 may include one or more of the following components: processor component 802, memory 804, power component 806, multimedia component 808, audio component 810, input / output (I / O) interface 812, measurement component 814, and component 816 communication.

[00134] Процессорный компонент 802, как правило, осуществляет общее управление функционированием оконечного устройства 800, например, операциями, связанными с отображением, телефонными вызовами, обменом данными, работой с камерой и операциями записи. Процессорный компонент 802 может включать один или более процессоров 820, исполняющих инструкции с целью выполнения всех шагов описанных выше способов или части этих шагов. Также, процессорный компонент 802 может включать один или более модулей, обеспечивающих взаимодействие между процессорным компонентом 802 и другими компонентами. Например, процессорный компонент 802 может включать мультимедийный модуль, обеспечивающий взаимодействие между мультимедийным компонентом 808 и процессорным компонентом 802.[00134] The processor component 802 typically provides overall control over the operation of the terminal device 800, for example, operations related to display, telephone calls, data exchange, camera operations, and recording operations. The processor component 802 may include one or more processors 820 executing instructions to complete all of the steps of the above methods, or part of these steps. Also, the processor component 802 may include one or more modules that facilitate communication between the processor component 802 and other components. For example, the processor component 802 may include a multimedia module that enables communication between the multimedia component 808 and the processor component 802.

[00135] Память 804 сконфигурирована для хранения различных типов данных с целью поддержки функционирования устройства 800. Примерами подобных данных могут служить инструкции любых приложений или методов, исполняемых на устройстве 800, контактные данные, данные телефонной книги, сообщения, изображения, видеоданные и т.п. Память 804 может быть реализована с использованием энергозависимых или энергонезависимых устройств любого типа, а также их комбинаций, например, статической памятью с произвольным доступом (static random access memory, SRAM), электрически перепрограммируемой памяти «только для чтения» (erasable programmable read-only memory, EPROM), программируемой памяти «только для чтения» (programmable read-only memory, PROM), памяти «только для чтения», магнитной памяти, флэш-памяти, магнитного или оптического диска.[00135] The memory 804 is configured to store various types of data in order to support the operation of the device 800. Examples of such data include instructions of any applications or methods executed on the device 800, contact data, phone book data, messages, images, video data, etc. . Memory 804 can be implemented using volatile or non-volatile devices of any type, as well as combinations thereof, for example, static random access memory (SRAM), electrically programmable read-only memory (erasable programmable read-only memory) , EPROM), programmable read-only memory (PROM), read-only memory, magnetic memory, flash memory, magnetic or optical disk.

[00136] Компонент 806 электропитания обеспечивает электропитание различных компонентов оконечного устройства 800. Компонент 806 электропитания может включать систему управления электропитанием, один или более источников питания, а также любые другие компоненты, связанные с производством, управлением и распределением электрической энергии в оконечном устройстве 800.[00136] The power supply component 806 provides power to various components of the terminal device 800. The power component 806 may include a power management system, one or more power supplies, as well as any other components associated with the production, management, and distribution of electrical energy in the terminal device 800.

[00137] Мультимедийный компонент 808 включает экран, который обеспечивает интерфейс вывода между оконечным устройством 800 и пользователем. В некоторых из вариантов осуществления настоящего изобретения экран может включать дисплей на жидких кристаллах (liquid crystal display, LCD) и сенсорную панель (touch panel, TP). Если экран включает сенсорную панель, то в этом случае экран может быть реализован как сенсорный экран, принимающий сигналы ввода от пользователя. Сенсорная панель включает один или более датчиков касания, предназначенных для регистрации касаний, скольжений и других жестов на сенсорной панели. Датчики касания могут не только регистрировать границы операций касания или скольжения, но также измерять период времени и величину давления, связанные с этими операциями. В некоторых вариантах осуществления настоящего изобретения мультимедийный компонент 808 включает фронтальную камеру и/или тыловую камеру. Фронтальная камера и/или тыловая камера могут принимать внешние мультимедийные данные, когда оконечное устройство 800 находится в определенном режиме работы, например, в режиме фотографирования или в режиме видеосъемки. Как фронтальная камера, так и тыловая камера могут представлять собой фиксированные системы оптических линз или иметь функциональность фокусировки и оптического зуммирования.[00137] The multimedia component 808 includes a screen that provides an output interface between the terminal 800 and the user. In some of the embodiments of the present invention, the screen may include a liquid crystal display (LCD) and a touch panel (TP). If the screen includes a touch panel, then in this case the screen can be implemented as a touch screen, receiving input signals from the user. The touch panel includes one or more touch sensors for recording touches, slides and other gestures on the touch panel. Touch sensors can not only record the boundaries of touch or slip operations, but also measure the time period and the amount of pressure associated with these operations. In some embodiments of the present invention, the multimedia component 808 includes a front camera and / or rear camera. The front camera and / or rear camera can receive external multimedia data when the terminal device 800 is in a specific mode of operation, for example, in photographing mode or in video recording mode. Both the front camera and the rear camera can be fixed optical lens systems or have the functionality of focusing and optical zooming.

[00138] Аудиокомпонент 810 сконфигурирован для вывода и/или ввода аудиосигналов. Например, аудиокомпонент 810 включает микрофон ("MIC"), сконфигурированный для приема внешнего аудиосигнала, когда оконечное устройство 800 находится в определенном режиме работы, например, в режиме вызова, в режиме записи или в режиме распознавания голоса. Принятые аудиосигналы могут затем быть сохранены в памяти 804 или переданы при помощи компонента 816 связи. В некоторых из вариантов осуществления настоящего изобретения аудиокомпонент 810 включает также громкоговоритель для вывода аудиосигналов.[00138] The audio component 810 is configured to output and / or input audio signals. For example, audio component 810 includes a microphone (“MIC”) configured to receive an external audio signal when terminal device 800 is in a specific mode of operation, for example, in call mode, recording mode, or voice recognition mode. The received audio signals may then be stored in the memory 804 or transmitted using the communication component 816. In some of the embodiments of the present invention, the audio component 810 also includes a speaker for outputting audio signals.

[00139] Интерфейс 812 ввода/вывода обеспечивает интерфейс между процессорным компонентом 802 и модулями периферийных интерфейсов, например, клавиатуры, поворотного-нажимного переключателя («колеса»), кнопок и т.п. Кнопки могут включать, без ограничения перечисленным, «домашнюю» кнопку, кнопку громкости, кнопку «пуск» или кнопку блокировки.[00139] The I / O interface 812 provides an interface between the processor component 802 and the peripheral interface modules, for example, a keyboard, a rotary push switch (“wheel”), buttons, and the like. The buttons may include, but are not limited to, the home button, volume button, start button, or lock button.

[00140] Измерительный компонент 814 включает один или более датчиков, обеспечивающих оценку состояния различных элементов оконечного устройства 800. Например, измерительный компонент 814 может определять состояние устройства 800: «открыто» или «закрыто», относительное расположение компонентов, например, дисплея и клавиатуры оконечного устройства 800, изменение положения оконечного устройства 800 или одного из компонентов устройства 800, присутствие или отсутствие контакта пользователя с оконечным устройством 800, ориентацию или ускорение/замедление оконечного устройства 800 и изменение температуры оконечного устройства 800. Измерительный компонент 814 может включать датчик близости, сконфигурированный для обнаружения присутствия приближенных объектов без физического контакта с ними. Измерительный компонент 814 может также включать светочувствительный датчик, например, датчик изображений CMOS или CCD, для использования в приложениях формирования изображений. В некоторых из вариантов осуществления настоящего изобретения измерительный компонент 814 может также включать акселерометрический датчик, гироскопический датчик, магнитный датчик, датчик давления или датчик температуры.[00140] The measuring component 814 includes one or more sensors for assessing the state of various elements of the terminal device 800. For example, the measuring component 814 can determine the state of the device 800: “open” or “closed”, the relative location of components, such as a display and keyboard terminal device 800, changing the position of terminal device 800 or one of the components of device 800, the presence or absence of user contact with terminal device 800, orientation or acceleration / deceleration s terminal 800 and changing the temperature of the terminal device 800. The measurement component 814 may include a proximity sensor configured to detect the presence of approximate objects without physical contact with them. Measurement component 814 may also include a photosensitive sensor, such as a CMOS or CCD image sensor, for use in imaging applications. In some of the embodiments of the present invention, the measuring component 814 may also include an accelerometer sensor, a gyroscopic sensor, a magnetic sensor, a pressure sensor or a temperature sensor.

[00141] Компонент 816 связи сконфигурирован для обеспечения связи, проводной или беспроводной, между оконечным устройством 800 и другими устройствами. Оконечное устройство 800 может осуществлять доступ к беспроводной сети, основанной на таких стандартах связи, как WiFi, 2G или 3G, или их комбинации. В одном из примеров осуществления настоящего изобретения компонент 816 связи принимает широковещательный сигнал или соответствующую широковещательную информацию от внешней широковещательной системы управления по широковещательному каналу. В одном из примеров осуществления настоящего изобретения компонент 816 связи включает также модуль ближней бесконтактной связи (near field communication, NFC) для обеспечения связи в ближней зоне. Например, NFC-модуль может быть реализован на базе технологии радиочастотной идентификации (radio frequency identification, RFID), технологии ассоциации передачи данных в инфракрасном диапазоне (infrared data association, IrDA), технологии сверхширокой полосы пропускания (ultra-wideband, UWB), технологии Bluetooth (ВТ) или других технологий.[00141] The communication component 816 is configured to provide communication, wired or wireless, between the terminal device 800 and other devices. Terminal device 800 may access a wireless network based on communication standards such as WiFi, 2G, or 3G, or a combination thereof. In one embodiment of the present invention, the communication component 816 receives a broadcast signal or corresponding broadcast information from an external broadcast control system over a broadcast channel. In one embodiment of the present invention, the communication component 816 also includes a near field communication (NFC) module for providing near field communication. For example, the NFC module can be implemented on the basis of radio frequency identification (RFID) technology, infrared data association (IrDA) technology, ultra-wideband (UWB) technology, Bluetooth technology (BT) or other technologies.

[00142] В примерах осуществления настоящего изобретения оконечное устройство 800 может быть реализовано с использованием одной или более заказных интегральных схем (ASIC), цифровых сигнальных процессоров (DSP), цифровых устройств обработки сигналов (digital signal processing devices, DSPD), программируемых логических устройств (programmable logic devices, PLD), электрически программируемых вентильных матриц (field programmable gate arrays, FPGA), процессорах, контроллерах, микроконтроллерах, микропроцессорах или других электронных блоках, предназначенных для исполнения описанных выше способов.[00142] In embodiments of the present invention, terminal device 800 may be implemented using one or more custom integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices ( programmable logic devices (PLD), electrically programmable gate arrays (FPGAs), processors, controllers, microcontrollers, microprocessors or other electronic units designed to execute the method described above ov.

[00143] В примерах осуществления настоящего изобретения предложен также машиночитаемый носитель для хранения данных, включающий инструкции, например, содержащиеся в памяти 804 и исполняемые процессором 820 в оконечном устройстве 800 с целью выполнения описанных выше способов. К примеру, машиночитаемый носитель для хранения данных может представлять собой память ROM, память с произвольным доступом (random access memory, RAM), CD-ROM, магнитную ленту, гибкий диск, оптическое запоминающее устройство для хранения данных и т.п.[00143] In embodiments of the present invention, there is also provided a computer-readable medium for storing data, including instructions, for example, contained in the memory 804 and executed by the processor 820 in the terminal device 800 in order to perform the methods described above. For example, a computer-readable medium for storing data may be ROM, random access memory (RAM), CD-ROM, magnetic tape, floppy disk, optical storage device for data storage, etc.

[00144] Машиночитаемый носитель для хранения данных, при исполнении инструкций на этом носителе при помощи процессора терминального устройства, обеспечивает исполнение этим терминальным устройством способа кластеризации, включающего:[00144] A machine-readable medium for storing data, when executing instructions on this medium using a processor of a terminal device, enables the terminal device to execute a clustering method including:

[00145] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, при этом упомянутый коэффициент определяют в соответствии со сходством между двумя объектами согласно межобъектному расстоянию; определение, имеются ли классы, которые могут быть объединены, в соответствии с упомянутым взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; если классы, которые могут быть объединены, существуют, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния в отношении всех объединяемых классов до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов перед объединением, и получение результата кластеризации.[00145] obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the interobjective distance with respect to all classes to be combined, the said coefficient being determined in accordance with the similarity between the two objects according to the interobjective distance; determining whether there are classes that can be combined in accordance with said weighted distance between the two classes and a predetermined distance distance threshold; if classes that can be combined exist, a corresponding union of all classes that can be combined and a return to the step of obtaining a weighted distance for all classes to be merged until the number of classes after combining is the same as the number of classes before merging, and obtaining the result of clustering.

[00146] Альтернативно, способ дополнительно включает: получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.[00146] Alternatively, the method further includes: obtaining a correspondence relationship between the inter-object distance and the probability that two objects are the same object, in accordance with statistics on exemplary objects; and determining a display relationship between the inter-object distance and said weight coefficient according to said correspondence relation, wherein said weight coefficient is determined in accordance with said probability.

[00147] Альтернативно, определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому соответствующему соответствия выполняют следующим образом:[00147] Alternatively, the determination of said display relationship between the inter-object distance and the weighting coefficient according to the corresponding correspondence is performed as follows:

[00148] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.[00148] requesting said correspondence relationship to obtain the probability that two objects corresponding to a particular inter-object distance are the same object; and determining that this probability is a weighting coefficient corresponding to said interobjective distance.

[00149] Альтернативно, упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов выполняют следующим образом:[00149] Alternatively, said weighted distance is a weighted distance between a first class and a second class; while obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the interobjective distance in relation to all the combined classes is performed as follows:

[00150] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.[00150] receive the first unidirectional weighted distance between the first class and the second class, according to the distances between all objects of the first class and all objects of the second class, and the corresponding weights; receive a second unidirectional weighted distance between the second class and the first class; and get a weighted distance between the first class and the second class in accordance with the aforementioned first unidirectional weighted distance and the second unidirectional weighted distance.

[00151] Альтернативно, получение упомянутого первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям, выполняют следующим образом:[00151] Alternatively, obtaining said first unidirectional weighted distance between the first class and the second class in accordance with the weighted distances between all objects in the first class and the second class, and weights corresponding to these weighted distances, are performed as follows:

[00152] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства; получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента; получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе; получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутым вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.[00152] get the largest similarity distance between any of the objects in said first class and all the objects of said second class, and a first weight coefficient corresponding to this largest similarity distance; obtaining a minimum weighted distance between an object in said first class and all objects of said second class, according to a product of said greatest similarity distance and said corresponding first weight coefficient; obtaining a weighted average distance over the distances between an object in said first class and other objects, except for an object that corresponds to said largest similarity distance in said second class; obtaining a weighted distance between an object in said first class and said second class, in accordance with said minimum weighted distance and said average weighted distance; and the first unidirectional weighted distance between said first class and said second class is obtained in accordance with the weighted distances between all objects in said first class and said second class, and weights corresponding to these weighted distances.

[00153] Фиг. 13 представляет собой структурную блок-схему сервера в вариантах осуществления настоящего изобретения. К примеру, сервер 1900 может быть значительно отличающимся по конфигурации или характеристикам, и может включать один или более центральных процессорных блоков (central processing units, CPU) 1922 (например, один или более процессоров) и память 1932, один или боле носителей 1930 (например, одно или более запоминающих устройств большой емкости) для хранения прикладных программ 1942 или данных 1944. При этом память 1932 и носитель 1930 могут представлять собой устройство временного или постоянного хранения. Программы, хранимые на носителе 1930 могут включать один или более модулей (не показаны на чертежах), при этом каждый из модулей может включать набор инструкций для выполнения операций в оконечном устройстве. Также, CPU 1922 может быть выполнен с возможностью связи с носителем 1930 и исполнения, на сервере 1900, набора операционных инструкций, хранимых на носителе 1930.[00153] FIG. 13 is a structural block diagram of a server in embodiments of the present invention. For example, the server 1900 may be significantly different in configuration or characteristics, and may include one or more central processing units (CPUs) 1922 (for example, one or more processors) and a memory 1932, one or more media 1930 (for example , one or more mass storage devices) for storing application programs 1942 or data 1944. Moreover, the memory 1932 and the medium 1930 may be a temporary or permanent storage device. Programs stored on the medium 1930 may include one or more modules (not shown in the drawings), each of the modules may include a set of instructions for performing operations on the terminal device. Also, the CPU 1922 may be configured to communicate with the medium 1930 and execute, on the server 1900, a set of operational instructions stored on the medium 1930.

[00154] Сервер 1900 может также включать один или более источников 1926 питания, один или более проводных или беспроводных сетевых интерфейсов 1950, а также один или более интерфейсов 1958 ввода-вывода, одну или более клавиатур 1956 и/или одну или более операционных систем 1941, например, Windows Server™, Mac OS X™, Unix™, Linux™, FreeBSD™ или аналогичные операционные системы.[00154] Server 1900 may also include one or more power sources 1926, one or more wired or wireless network interfaces 1950, as well as one or more I / O interfaces 1958, one or more 1956 keyboards and / or one or more 1941 operating systems e.g. Windows Server ™, Mac OS X ™, Unix ™, Linux ™, FreeBSD ™, or similar operating systems.

[00155] В примерах осуществления настоящего изобретения предложен также машиночитаемый носитель для хранения данных, включающий инструкции, например, содержащиеся в памяти 1922 и исполняемые процессором 1922 в оконечном устройстве с целью выполнения описанных выше способов. К примеру, машиночитаемый носитель для хранения данных может представлять собой память ROM, память с произвольным доступом (random access memory, RAM), CD-ROM, магнитную ленту, гибкий диск, оптическое запоминающее устройство для хранения данных и т.п.[00155] In embodiments of the present invention, there is also provided a computer-readable medium for storing data, including instructions, for example, contained in a memory 1922 and executed by a processor 1922 in a terminal device in order to perform the methods described above. For example, a computer-readable medium for storing data may be ROM, random access memory (RAM), CD-ROM, magnetic tape, floppy disk, optical storage device for data storage, etc.

[00156] Машиночитаемый носитель для хранения данных, при исполнении инструкций на этом носителе при помощи процессора терминального устройства, обеспечивает исполнение этим терминальным устройством способа кластеризации, включающего:[00156] A computer-readable medium for storing data, when executing instructions on this medium using a processor of a terminal device, enables the terminal device to perform a clustering method including:

[00157] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;[00157] obtaining a weighted distance between the two classes according to the weighting coefficient corresponding to the interobjective distances in relation to all classes to be combined, said weighting factor being determined in accordance with the similarity of the two objects corresponding to the interobjective distance;

[00158] определение, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния;[00158] determining whether there are classes that can be combined in accordance with the weighted distance between the two classes and a predetermined distance threshold value;

[00159] если существуют какие-либо два класса, которые могут быть объединены, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и получение результата кластеризации.[00159] if there are any two classes that can be combined, the corresponding combination of all classes that can be combined, and return to the step of obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the inter-object distance in relation to all combined classes, until the number of classes after the union is the same as the number of classes before the union, and obtaining the result of clustering.

[00160] Альтернативно, способ дополнительно включает: получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.[00160] Alternatively, the method further includes: obtaining a correspondence relationship between the inter-object distance and the probability that two objects are the same object, in accordance with statistics on exemplary objects; and determining a display relationship between the inter-object distance and said weight coefficient according to said correspondence relation, wherein said weight coefficient is determined in accordance with said probability.

[00161] Альтернативно, определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому соответствующему соответствия выполняют следующим образом:[00161] Alternatively, the determination of said display relationship between the inter-object distance and the weight coefficient according to the corresponding correspondence is performed as follows:

[00162] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.[00162] requesting said correspondence relationship to obtain the probability that two objects corresponding to a particular inter-object distance are the same object; and determining that this probability is a weighting coefficient corresponding to said interobjective distance.

[00163] Альтернативно, упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов выполняют следующим образом:[00163] Alternatively, said weighted distance is a weighted distance between a first class and a second class; while obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the interobjective distance in relation to all the combined classes is performed as follows:

[00164] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.[00164] receive the first unidirectional weighted distance between the first class and the second class, according to the distances between all objects of the first class and all objects of the second class, and the corresponding weights; receive a second unidirectional weighted distance between the second class and the first class; and get a weighted distance between the first class and the second class in accordance with the aforementioned first unidirectional weighted distance and the second unidirectional weighted distance.

[00165] Альтернативно, получение упомянутого первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям, выполняют следующим образом:[00165] Alternatively, obtaining said first unidirectional weighted distance between the first class and the second class in accordance with the weighted distances between all objects in the first class and the second class, and weights corresponding to these weighted distances are performed as follows:

[00166] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства; получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента; получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе; получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутым вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.[00166] get the largest similarity distance between any of the objects in said first class and all the objects of said second class, and a first weight coefficient corresponding to this largest similarity distance; obtaining a minimum weighted distance between an object in said first class and all objects of said second class, according to a product of said greatest similarity distance and said corresponding first weight coefficient; obtaining a weighted average distance over the distances between an object in said first class and other objects, except for an object that corresponds to said largest similarity distance in said second class; obtaining a weighted distance between an object in said first class and said second class, in accordance with said minimum weighted distance and said average weighted distance; and the first unidirectional weighted distance between said first class and said second class is obtained in accordance with the weighted distances between all objects in said first class and said second class, and weights corresponding to these weighted distances.

[00167] Нужно понимать, что настоящее изобретение не ограничено конкретной структурой, описанной выше и проиллюстрированной на чертежах, и может быть подвержено модификациям и изменениям в пределах его объема. Предполагается, что объем настоящего изобретения ограничен только приложенной формулой изобретения.[00167] It should be understood that the present invention is not limited to the specific structure described above and illustrated in the drawings, and may be subject to modifications and changes within its scope. It is intended that the scope of the present invention be limited only by the appended claims.

[00168] Следует понимать, что в соответствующем контексте указывающие на отношения термины, такие как «первый» или «второй», применяются исключительно для отличения одного объекта или операции от другого объекта или другой операции, при этом они не обязательно подразумевают или требуют наличия реального порядка или отношения между этими объектами или операциями. При этом термины «включает», «содержит» или любые другие их варианты подразумевают неисключающее включение, то есть, процедура, способ, изделие или устройство, которые включают последовательность элементов, могут включать не только эти, но и другие элементы, не перечисленные явно, а также могут включать дополнительные элементы, изначально присущие процедуре, способу, изделию или устройству. Без дополнительного ограничения, элементы, определенные выражением «включает», не исключают факта включения процессом, способом, изделием или устройством других аналогичных элементов.[00168] It should be understood that, in an appropriate context, terms referring to relationships, such as “first” or “second”, are used solely to distinguish one object or operation from another object or another operation, while they do not necessarily imply or require real the order or relationship between these objects or operations. The terms “includes”, “contains” or any other variants thereof imply non-exclusive inclusion, that is, a procedure, method, product or device that includes a sequence of elements may include not only these, but also other elements not listed explicitly, and may also include additional elements that are inherent in the procedure, method, product or device. Without further limitation, the elements defined by the expression “include” do not exclude the fact that other similar elements are included in the process, method, product or device.

[00169] Приведенное выше является всего лишь подробным описанием вариантов осуществления настоящего изобретения, на основании которого специалисты в данной области техники должны понять замысел настоящего изобретения или быть способными реализовать настоящее изобретение на практике. Специалистам в данной области техники могут быть очевидными множество различных модификаций этих вариантов осуществления настоящего изобретения Общий замысел, заданный в контексте настоящего изобретения, может быть реализован и в других вариантах осуществления изобретения, в пределах сущности и объема настоящего изобретения. Таким образом, настоящее изобретение не ограничено вариантами его осуществления, проиллюстрированными в данном документе. Настоящее изобретение следует понимать как соответствующее максимально широкому объему, отвечающему замыслу и новым отличительным особенностям, описанным в данном документе.[00169] The foregoing is merely a detailed description of embodiments of the present invention, based on which those skilled in the art should understand the intent of the present invention or be able to put the present invention into practice. Many different modifications of these embodiments of the present invention may be apparent to those skilled in the art. The general concept defined in the context of the present invention can be implemented in other embodiments of the invention, within the spirit and scope of the present invention. Thus, the present invention is not limited to the embodiments illustrated in this document. The present invention should be understood as corresponding to the widest possible scope, consistent with the intent and the new distinctive features described in this document.

Claims (41)

1. Способ кластеризации, включающий:1. The clustering method, including: получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию, при этом упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение упомянутого взвешенного расстояния между двумя классами включает:obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the interobjective distances in relation to all classes to be combined, the said weighting coefficient being determined in accordance with the similarity of two objects corresponding to the interobjective distance, wherein the weighted distance is the weighted distance between the first class and the second class wherein the receipt of said weighted distance between the two classes includes: получение первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии с расстояниями между всеми объектами упомянутого первого класса и всеми объектами упомянутого второго класса и соответствующими весовыми коэффициентами, при этом получение первого однонаправленного взвешенного расстояния включает:obtaining a first unidirectional weighted distance between said first class and said second class in accordance with the distances between all objects of said first class and all objects of said second class and corresponding weighting factors, while obtaining the first unidirectional weighted distance includes: получение наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;obtaining the largest similarity distance between any of the objects in said first class and all the objects of said second class and a first weight coefficient corresponding to this largest similarity distance; получение минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;obtaining a minimum weighted distance between an object in said first class and all objects of said second class according to a product of said greatest similarity distance and said corresponding first weight coefficient; получение среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;obtaining a weighted average distance over distances between an object in said first class and other objects, except for an object that corresponds to said largest similarity distance in said second class; получение взвешенного расстояния между объектом в упомянутом первом классе и упомянутым вторым классом в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; иobtaining a weighted distance between the object in said first class and said second class in accordance with said minimum weighted distance and said average weighted distance; and получение первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом и весовыми коэффициентами, соответствующими этим взвешенным расстояниям;obtaining a first unidirectional weighted distance between said first class and said second class in accordance with weighted distances between all objects in said first class and said second class and weighting factors corresponding to these weighted distances; получение второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; иobtaining a second unidirectional distance between said second class and said first class; and получение взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию;obtaining a weighted distance between said first class and said second class according to said first unidirectional weighted distance and a second unidirectional weighted distance; определение, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; иdetermining whether there are classes that can be combined in accordance with the weighted distance between the two classes and a predetermined distance threshold value; and если существуют классы, которые могут быть объединены, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и получение результата кластеризации.if there are classes that can be combined, the corresponding combination of all classes that can be combined, and return to the step of obtaining a weighted distance between two classes according to the weight coefficient corresponding to the inter-object distance in relation to all combined classes, as long as the number of classes after merging, it will not be the same as the number of classes before merging, and obtaining the result of clustering. 2. Способ по п. 1, дополнительно включающий:2. The method according to p. 1, further comprising: получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом согласно статистике по образцовым объектам; иobtaining a correspondence relationship between the inter-object distance and the probability that two objects are the same object according to statistics on model objects; and определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.determining a display relationship between the inter-object distance and said weight coefficient according to said correspondence relation, wherein said weight coefficient is determined in accordance with said probability. 3. Способ по п. 2, отличающийся тем, что определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия выполняют следующим образом:3. The method according to p. 2, characterized in that the determination of the said display relationship between the inter-object distance and the weight coefficient according to the said correspondence relation is performed as follows: запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; иrequesting said correspondence relationship to obtain the probability that two objects corresponding to a particular inter-object distance are the same object; and определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.determine that this probability is a weight coefficient corresponding to the mentioned interobject distance. 4. Устройство для кластеризации, включающее:4. A device for clustering, including: блок получения, сконфигурированный для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию, при этом упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом, при этом упомянутый блок получения включает:a receiving unit configured to obtain a weighted distance between two classes according to a weight coefficient corresponding to interobject distances for all classes to be combined, said weight coefficient being determined in accordance with the similarity of two objects corresponding to interobject distance, said weighted distance being a weighted distance between the first class and the second class, wherein said receiving unit includes: первый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;a first receiving subunit configured to obtain the largest similarity distance between any of the objects in said first class and all objects of said second class and a first weight coefficient corresponding to this largest similarity distance; второй подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутому наибольшему расстоянию сходства и соответствующему первому весовому коэффициенту;a second receiving subunit configured to obtain a first unidirectional weighted distance between said first class and said second class according to said largest similarity distance and the corresponding first weight coefficient; третий подблок получения, сконфигурированный для получения второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; иa third receiving subunit configured to obtain a second unidirectional distance between said second class and said first class; and четвертый подблок получения, сконфигурированный для получения взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию;a fourth receiving subunit configured to obtain a weighted distance between said first class and said second class according to said first unidirectional weighted distance and a second unidirectional weighted distance; при этом упомянутый второй подблок получения включает:wherein said second receiving subunit includes: пятый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;a fifth receiving subunit configured to obtain the largest similarity distance between any of the objects in said first class and all objects of said second class and a first weight coefficient corresponding to this largest similarity distance; шестой подблок получения, сконфигурированный для получения минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;a sixth receiving subunit configured to obtain a minimum weighted distance between an object in said first class and all objects of said second class according to a product of said greatest similarity distance and said corresponding first weight coefficient; седьмой подблок получения, сконфигурированный для получения среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;a seventh acquisition subunit, configured to obtain a weighted average distance over distances between an object in said first class and other objects, with the exception of an object that corresponds to said largest similarity distance in said second class; восьмой подблок получения, сконфигурированный для получения взвешенного расстояния между объектом в упомянутом первом классе и упомянутым вторым классом в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; иan eighth receiving subunit configured to obtain a weighted distance between an object in said first class and said second class in accordance with said minimum weighted distance and said average weighted distance; and девятый подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом и весовыми коэффициентами, соответствующими этим взвешенным расстояниям;a ninth receiving subunit configured to obtain a first unidirectional weighted distance between said first class and said second class in accordance with weighted distances between all objects in said first class and said second class and weighting factors corresponding to these weighted distances; блок определения, сконфигурированный для определения, имеются ли классы, которые могут быть объединены в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; иa determining unit configured to determine if there are classes that can be combined according to a weighted distance between the two classes and a predetermined distance threshold value; and блок объединения, сконфигурированный для соответствующего объединения всех классов, которые могут быть объединены, если классы, которые могут быть объединены, существуют, и для управления упомянутым блоком получения для выполнения шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.a combining unit configured to appropriately combine all classes that can be combined if classes that can be combined exist and to control the obtaining unit to perform the step of obtaining a weighted distance between the two classes according to the weight coefficient corresponding to the inter-object distance with respect to all merged classes, until the number of classes after merging is the same as the number of classes before merging, and to obtain the result that clustering. 5. Устройство по п. 4, дополнительно включающее:5. The device according to claim 4, further comprising: блок статистики, сконфигурированный для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом согласно статистике по образцовым объектам;a statistics unit configured to obtain a correspondence relationship between the inter-object distance and the probability that two objects are the same object according to statistics on exemplary objects; блок определения, сконфигурированный для определения отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.a determining unit configured to determine a display relationship between the inter-object distance and said weighting coefficient according to said correspondence relation, wherein said weighting factor is determined in accordance with said probability. 6. Устройство по п. 5, отличающееся тем, что упомянутый блок определения включает:6. The device according to p. 5, characterized in that the said determination unit includes: подблок запроса, сконфигурированный для запроса упомянутого отношения соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; иa request subunit configured to query said correspondence relationship to obtain a probability that two objects corresponding to a particular inter-object distance are the same object; and подблок определения, сконфигурированный для определения того, что упомянутая вероятность является упомянутым весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.a determination subunit configured to determine that said probability is said weighting coefficient corresponding to said interobjective distance. 7. Оконечное устройство, включающее:7. The terminal device, including: процессор; иCPU; and память, сконфигурированную для хранения инструкций, исполняемых упомянутым процессором, для выполнения способа по п. 1.a memory configured to store instructions executed by said processor to execute the method of claim 1.
RU2015129671A 2014-03-14 2014-07-24 Method and device for clustering RU2630373C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410096608.9 2014-03-14
CN201410096608.9A CN103927545B (en) 2014-03-14 2014-03-14 Clustering method and relevant apparatus
PCT/CN2014/082884 WO2015135277A1 (en) 2014-03-14 2014-07-24 Clustering method and related device

Publications (2)

Publication Number Publication Date
RU2015129671A RU2015129671A (en) 2017-04-27
RU2630373C2 true RU2630373C2 (en) 2017-09-07

Family

ID=51145761

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015129671A RU2630373C2 (en) 2014-03-14 2014-07-24 Method and device for clustering

Country Status (7)

Country Link
EP (1) EP2919136A1 (en)
JP (1) JP6051336B2 (en)
KR (1) KR101639502B1 (en)
CN (1) CN103927545B (en)
MX (1) MX346698B (en)
RU (1) RU2630373C2 (en)
WO (1) WO2015135277A1 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927545B (en) * 2014-03-14 2017-10-17 小米科技有限责任公司 Clustering method and relevant apparatus
CN105488467B (en) * 2015-11-26 2019-07-23 小米科技有限责任公司 Picture classification method and device
CN107092618A (en) * 2016-10-27 2017-08-25 北京小度信息科技有限公司 A kind of information processing method and device
CN109469919B (en) * 2018-11-12 2020-07-28 南京工程学院 Power station air preheater ash blocking monitoring method based on weight clustering
CN111310834A (en) * 2020-02-19 2020-06-19 深圳市商汤科技有限公司 Data processing method and device, processor, electronic equipment and storage medium
CN111415151A (en) * 2020-03-10 2020-07-14 支付宝(杭州)信息技术有限公司 Identification method and device for chain commercial tenant, electronic equipment and storage medium
CN112132111A (en) * 2020-10-10 2020-12-25 安徽江淮汽车集团股份有限公司 Parking typical scene extraction method, device, storage medium and device

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060251292A1 (en) * 2005-05-09 2006-11-09 Salih Burak Gokturk System and method for recognizing objects from images and identifying relevancy amongst images and information
KR20080018631A (en) * 2006-08-25 2008-02-28 인하대학교 산학협력단 Region weighting mehtod based on spatial location informaiton for relevance feedback in image search engine
RU2345414C1 (en) * 2007-08-10 2009-01-27 Общество с ограниченной ответственностью "Рекогмишн" Method of creation of system of indexing for search of objects on digital images
US20120321193A1 (en) * 2010-12-30 2012-12-20 Nokia Corporation Method, apparatus, and computer program product for image clustering
US20130279816A1 (en) * 2010-06-01 2013-10-24 Wei Zhang Clustering images

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100302366B1 (en) * 1998-02-14 2001-11-30 이계철 Apparatus and method for searching layout base image
US7664735B2 (en) * 2004-04-30 2010-02-16 Microsoft Corporation Method and system for ranking documents of a search result to improve diversity and information richness
KR100804678B1 (en) * 2007-01-04 2008-02-20 삼성전자주식회사 Method for classifying scene by personal of video and system thereof
JP5526955B2 (en) * 2010-04-09 2014-06-18 ソニー株式会社 Face clustering device, face clustering method, and program
US20120294540A1 (en) * 2011-05-17 2012-11-22 Microsoft Corporation Rank order-based image clustering
CN102881032B (en) * 2012-09-14 2015-09-09 北京理工大学 A kind of picture joining method based on innovatory algorithm
CN103136355B (en) * 2013-03-05 2016-01-06 电子科技大学 A kind of Text Clustering Method based on automatic threshold fish-swarm algorithm
CN103544255B (en) * 2013-10-15 2017-01-11 常州大学 Text semantic relativity based network public opinion information analysis method
CN103927545B (en) * 2014-03-14 2017-10-17 小米科技有限责任公司 Clustering method and relevant apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060251292A1 (en) * 2005-05-09 2006-11-09 Salih Burak Gokturk System and method for recognizing objects from images and identifying relevancy amongst images and information
KR20080018631A (en) * 2006-08-25 2008-02-28 인하대학교 산학협력단 Region weighting mehtod based on spatial location informaiton for relevance feedback in image search engine
RU2345414C1 (en) * 2007-08-10 2009-01-27 Общество с ограниченной ответственностью "Рекогмишн" Method of creation of system of indexing for search of objects on digital images
US20130279816A1 (en) * 2010-06-01 2013-10-24 Wei Zhang Clustering images
US20120321193A1 (en) * 2010-12-30 2012-12-20 Nokia Corporation Method, apparatus, and computer program product for image clustering

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
US 2012/0294540 A1 (), 22.11.2012. *

Also Published As

Publication number Publication date
CN103927545A (en) 2014-07-16
RU2015129671A (en) 2017-04-27
JP2016517110A (en) 2016-06-09
MX346698B (en) 2017-03-28
MX2014011016A (en) 2016-02-19
KR101639502B1 (en) 2016-07-22
WO2015135277A1 (en) 2015-09-17
EP2919136A1 (en) 2015-09-16
CN103927545B (en) 2017-10-17
KR20150117201A (en) 2015-10-19
JP6051336B2 (en) 2016-12-27

Similar Documents

Publication Publication Date Title
RU2630373C2 (en) Method and device for clustering
US20210133563A1 (en) Method and apparatus for training neural network, and storage medium
CN110033851B (en) Information recommendation method and device, storage medium and server
RU2628167C2 (en) Method and device for clustering
CN103944804B (en) Contact recommending method and device
US11244228B2 (en) Method and device for recommending video, and computer readable storage medium
CN109918669B (en) Entity determining method, device and storage medium
RU2638154C2 (en) Methods and devices for number labeling
WO2022198853A1 (en) Task scheduling method and apparatus, electronic device, storage medium, and program product
CN110807325B (en) Predicate identification method, predicate identification device and storage medium
JP2016517110A5 (en)
RU2683979C2 (en) Method and device for detecting pressure
US11264027B2 (en) Method and apparatus for determining target audio data during application waking-up
WO2022160596A1 (en) Inquiry information processing method and apparatus, and medium
RU2651250C1 (en) Method and device for fingerprints recognition
CN110532345A (en) A kind of processing method of unlabeled data, device and storage medium
CN111160448A (en) Training method and device for image classification model
WO2017140108A1 (en) Pressure detection method and apparatus
CN112836058A (en) Medical knowledge map establishing method and device and medical knowledge map inquiring method and device
US20150262033A1 (en) Method and terminal device for clustering
CN107515853B (en) Cell word bank pushing method and device
KR102348783B1 (en) Apparatus, system and method for searching contents
CN112951405A (en) Method, device and equipment for realizing feature sorting
CN107992893B (en) Method and device for compressing image feature space
CN113312475B (en) Text similarity determination method and device