RU2630373C2 - Способ и устройство для кластеризации - Google Patents

Способ и устройство для кластеризации Download PDF

Info

Publication number
RU2630373C2
RU2630373C2 RU2015129671A RU2015129671A RU2630373C2 RU 2630373 C2 RU2630373 C2 RU 2630373C2 RU 2015129671 A RU2015129671 A RU 2015129671A RU 2015129671 A RU2015129671 A RU 2015129671A RU 2630373 C2 RU2630373 C2 RU 2630373C2
Authority
RU
Russia
Prior art keywords
distance
class
classes
weighted
objects
Prior art date
Application number
RU2015129671A
Other languages
English (en)
Other versions
RU2015129671A (ru
Inventor
Чжицзюнь ЧЭНЬ
Бо ЧЗАН
Тао ЧЗАН
Линь ВАН
Original Assignee
Сяоми Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сяоми Инк. filed Critical Сяоми Инк.
Publication of RU2015129671A publication Critical patent/RU2015129671A/ru
Application granted granted Critical
Publication of RU2630373C2 publication Critical patent/RU2630373C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Abstract

Изобретение относится, в общем, к кластеризации данных, в частности к кластеризации изображений. Техническим результатом является повышение точности результата кластеризации. В способе кластеризации получают взвешенное расстояние между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям. При этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным. Объединяют классы, взвешенные расстояния между которыми отвечают условию объединения. При этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения. После чего получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между двумя объектами, различные межобъектные расстояния обеспечивают различный вклад, при этом чем больше сходство, тем большим будет соответствующий вклад. 3 н. и 4 з.п. ф-лы, 8 ил.

Description

Настоящая заявка ссылается на приоритет заявки на патент Китайской Народной Республики №201410096608.9, на которой она основана и которая была зарегистрирована 14 марта 2014 года. При этом содержимое упомянутой заявки полностью включено в настоящий документ путем ссылки.
Область техники
[0001] Настоящее изобретение относится, в общем, к области компьютерных технологий, а именно, к способу кластеризации и к соответствующему устройству.
Предпосылки создания изобретения
[0002] Кластеризацией называется процедура разделения набора физических или абстрактных объектов на множество классов, каждый из которых состоит из сходных объектов, то есть, процедура классификации объектов по различным классам (или кластерам) таким образом, чтобы объекты в одном классе имели значительное сходство, а объекты из различных классов имели значительное несходство. В методах иерархической кластеризации заданное множество объектов иерархически разделяют до тех пор, пока не будет выполнено некоторое условие завершения. Метод агломерационной иерархической кластеризации - это стратегия восходящей кластеризации, в нем каждый объект сначала считают отдельным классом, и затем объединяют эти классы во все более крупные классы то тех пор, пока не будет достигнуто некоторое условие завершения. Большинство методов иерархической кластеризации относятся к подобному типу, отличаются только определения сходства между классами.
[0003] Например, если метод кластеризации используют для классификации изображений, то изображения, относящиеся к одному человеку, относят к одному классу, при этом в соответствующем методе кластеризации для измерения сходства двух лиц используют только расстояния между классами. Однако расстояния между соответствующими объектами вносят практически столь же значительный вклад в измерение сходства, и поэтому точность результатов кластеризации в подобных методах кластеризации является сравнительно низкой.
Сущность изобретения
[0004] С целью преодоления недостатков, имеющихся на существующем уровне техники, в настоящем изобретении предложены способ кластеризации и соответствующее устройство, которые позволяют повысить точность результатов кластеризации.
[0005] Для решения поставленной выше технической задачи в вариантах осуществления настоящего изобретения предложены технические решения, которые будут изложены ниже.
[0006] В соответствии с первым аспектом вариантов осуществления настоящего изобретения предложен способ кластеризации, включающий:
[0007] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, при этом упомянутый коэффициент определяют в соответствии со сходством между двумя объектами согласно межобъектному расстоянию; определение, имеются ли классы, которые могут быть объединены, в соответствии с упомянутым взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; если классы, которые могут быть объединены, существуют, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния в отношении всех объединяемых классов до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов до объединения, и получение результата кластеризации.
[0008] В сочетании с первым аспектом настоящего изобретения, в первой возможной реализации этого первого аспекта, способ дополнительно включает:
[0009] получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.
[0010] В сочетании с первой возможной реализацией первого аспекта настоящего изобретения, во второй реализации этого первого аспекта, определение отношения отображения между упомянутым межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия выполняют следующим образом:
[0011] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.
[0012] В сочетании с первым аспектом настоящего изобретения или первой возможной реализацией этого первого аспекта, в третьей возможной реализации первого аспекта настоящего изобретения упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, выполняют следующим образом:
[0013] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.
[0014] В сочетании с третьей возможной реализацией первого настоящего изобретения, в четвертой возможной реализации этого первого аспекта получение первого однонаправленного взвешенного расстояния между первым классом и вторым классом согласно расстояниям между всеми объектами упомянутого первого класса и всеми объектами упомянутого второго класса, и соответствующими весовыми коэффициентами, выполняют следующим образом:
[0015] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства;
[0016] получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;
[0017] получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;
[0018] получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутом вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и
[0019] получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.
[0020] В соответствии со вторым аспектом вариантов осуществления настоящего изобретения предложено устройство для кластеризации, включающее:
[0021] блок получения, сконфигурированный для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;
[0022] блок определения, сконфигурированный для определения, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и
[0023] блок объединения, сконфигурированный для соответствующего объединения всех классов, которые могут быть объединены, если классы, которые могут быть объединены, существуют, при этом упомянутый блок получения выполняет шаг получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.
[0024] В сочетании со вторым аспектом настоящего изобретения, в первой возможной реализации этого второго аспекта, устройство дополнительно включает:
[0025] блок статистики, сконфигурированный для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам;
[0026] блок определения, сконфигурированный для определения отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.
[0027] В сочетании с первой возможной реализацией второго аспекта настоящего изобретения, во второй возможной реализации этого второго аспекта, упомянутый блок определения включает:
[0028] подблок запроса, сконфигурированный для запроса упомянутого отношения соответствия с целью получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же человеком;
[0029] подблок определения, сконфигурированный для определения того, что упомянутая вероятность является упомянутым весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.
[0030] В сочетании с первой возможной реализацией второго аспекта настоящего изобретения или второй возможной реализацией второго аспекта настоящего изобретения, в третьей возможной реализации этого третьего аспекта упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом, при этом упомянутый блок получения включает:
[0031] первый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;
[0032] второй подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом, согласно упомянутому наибольшему расстоянию сходства и соответствующему первому весовому коэффициенту, в отношении всех объектов упомянутого первого класса;
[0033] третий подблок получения, сконфигурированный для получения второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; и
[0034] четвертый подблок получения, сконфигурированный для получения взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.
[0035] В сочетании с третьей возможной реализации второго аспекта настоящего изобретения, в четвертой возможной реализацией этого второго аспекта упомянутый второй подблок получения включает:
[0036] пятый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;
[0037] шестой подблок получения, сконфигурированный для получения минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;
[0038] седьмой подблок получения, сконфигурированный для получения среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;
[0039] восьмой подблок получения, сконфигурированный для получения взвешенного расстояния между объектом в упомянутом первом классе и упомянутом вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и
[0040] девятый подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.
[0041] В соответствии с третьим аспектом вариантов осуществления настоящего изобретения предложено оконечное устройство, включающее:
[0042] процессор; и память, сконфигурированную для хранения инструкций, исполняемых упомянутым процессором;
[0043] при этом упомянутый процессор сконфигурирован:
[0044] для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;
[0045] для определения, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и
[0046] если два класса могут быть объединены, для соответствующего объединения всех классов, которые могут быть объединены, и для возврата к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.
[0047] Технические решения, предложенные в вариантах осуществления настоящего изобретения, могут давать следующие полезные результаты: в способе кластеризации получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, и затем в способе кластеризации выполняют объединение классов, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, и затем получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между двумя объектами, различные межобъектные расстояния обеспечивают различный вклад, и чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.
[0048] Нужно понимать, что и предшествующее общее описание, и подробное описание, приведенное ниже, являются исключительно иллюстративными и пояснительными, и не ограничивают настоящее изобретение.
Краткое описание чертежей
[0049] На приложенных чертежах, которые входят в состав настоящего описания и являются его неотъемлемой частью, проиллюстрированы варианты осуществления, соответствующие настоящему изобретению. Приложенные чертежи, вместе с описанием, служат для разъяснения замысла настоящего изобретения:
[0050] фиг. 1 представляет собой блок-схему алгоритма, иллюстрирующую способ кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;
[0051] фиг. 2 представляет собой блок-схему алгоритма, иллюстрирующую шаг S110 на фиг. 1 в соответствии с одним из примеров осуществления настоящего изобретения;
[0052] фиг. 3 представляет собой блок-схему алгоритма, иллюстрирующую шаг S111 на фиг. 2 в соответствии с одним из примеров осуществления настоящего изобретения;
[0053] фиг. 4 представляет собой блок-схему алгоритма с иллюстрацией получения весового коэффициента в соответствии с одним из примеров осуществления настоящего изобретения;
[0054] фиг. 5 представляет собой блок-схему, иллюстрирующую устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;
[0055] фиг. 6 представляет собой блок-схему, иллюстрирующую другое устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения;
[0056] фиг. 7 представляет собой блок-схему, иллюстрирующую оконечное устройство в соответствии с одним из примеров осуществления настоящего изобретения; и
[0057] Фиг. 8 представляет собой блок-схему, иллюстрирующую сервер в соответствии с одним из примеров осуществления настоящего изобретения.
[0058] Конкретные варианты осуществления изобретения в настоящем документе и на приложенных чертежах приведены исключительно для примера и будут боле подробно рассмотрены ниже. Чертежи не имеют целью сколь-либо ограничить объем настоящего изобретения. Напротив, они приведены для иллюстрации замысла изобретения специалистам в данной области техники на примерах конкретных вариантов осуществления изобретения.
Подробное описание изобретения
[0059] Фиг. 1 представляет собой блок-схему алгоритма, иллюстрирующую способ кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг.1 способ кластеризации может включать следующие шаги.
[0060] На шаге S110 получают взвешенное расстояние между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют согласно сходству между объектами.
[0061] Если допустить, что объектами являются изображения человеческих лиц, то при помощи способа кластеризации, предложенного в настоящем изобретении, изображения одного и того же человека могут быть собраны вместе с формированием одного кластера. Характеристические признаки в изображении лица преобразуют в группу векторов, поэтому межобъектное расстояние представляет собой расстояние между векторами. При этом, помимо изображений, способ кластеризации, предложенный в настоящем изобретении, может также применяться и к другим данным.
[0062] Перед кластеризацией сначала выполняют инициализацию: каждый объект относят к одному классу и вычисляют расстояния между этими классами, т.е. расстояния между объектами, входящими в этим классы (например, близость косинусов, евклидово расстояние и т.п.)
[0063] Чем больше сходство между объектами, тем большее значение имеет соответствующий весовой коэффициент; и наоборот, чем меньше сходство между объектами, тем соответствующий весовой коэффициент имеет меньшее значение. Например, весовой коэффициент может быть определен в соответствии с вероятностью того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом. Или, весовой коэффициент получают с использованием взвешенной кернфункции
Figure 00000001
, где w - весовой коэффициент, a d - межобъектное расстояние. Например,
Figure 00000002
; или весовой коэффициент может быть также получен с использованием заранее заданного порога, числовое значение которого в данном описании не уточняется.
[0064] В одном из вариантов осуществления настоящего изобретения, в соответствии с иллюстрацией фиг. 2, шаг S110 может включать описанные ниже шаги S111-S113.
[0065] На шаге S111 получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и в втором классе, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.
[0066] В одном из вариантов осуществления настоящего изобретения, в соответствии с иллюстрацией фиг. 3, шаг S111 может включать следующие шаги S1111-S1113.
[0067] На шаге S1111 получают наибольшее расстояние сходства между любым из объектов в первом классе и всеми объектами второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства.
[0068] Допустим, что первый класс обозначен за А, а второй класс обозначен за В. Вычисляют взвешенное расстояние между классом А и классом В. Сначала вычисляют расстояния d(Ai, В) между любым из объектов Аi в классе А и всеми объектами в классе В, и затем получают наибольшее расстояние сходства между объектом Ai и всеми объектами в классе В. В данном варианте осуществления настоящего изобретения используется близость косинусов. То есть, межобъектное сходство, соответствующее максимальной близости косинусов, dmax(Ai,В), является наибольшим.
[0069] В одном из примеров осуществления настоящего изобретения получение весового коэффициента может выполняться в соответствии с вероятностью того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом. В соответствии с иллюстрацией фиг. 4 это может включать следующие шаги.
[0070] На шаге S100 получают отношение соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам.
[0071] Например, в случае распознавания лиц, диапазон близости косинусов cosθ для двух изображений лица может быть равен [0, 1] по признакам высокой размерности, и при этом согласно статистическим данным по большому количеству изображений лиц, делают вывод, что если близость косинусов лежит в диапазоне [0,45, 1], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 98%; если близость косинусов лежит в диапазоне [0.35, 0.45], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 70%; если близость косинусов лежит в диапазоне [0,25, 0,35], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 40%; если близость косинусов лежит в диапазоне [0,15, 0,25], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 10%; и если близость косинусов лежит в диапазоне [0, 0, 15], вероятность того, что два объекта являются одним и тем же человеком, собственно, составляет 0,1%
[0072] Согласно приведенным выше статистическим результатам соотношение между весовым коэффициентом и близостью косинусов может быть задано с помощью следующей формулы (1):
[0073]
Figure 00000003
[0074] Формула (1) является отношением соответствия между близостью косинусов и вероятностью того, что два объекта являются одним и тем же человеком. Согласно соотношению между расстояниями и соответствующими вероятностями могут выводиться заключения и по другим типам расстояний, которые в настоящем документе перечислены не будут.
[0075] На шаге S200 определяют отношение отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия, при этом весовой коэффициент определяют в соответствии с упомянутой вероятностью.
[0076] Получают межобъектное расстояние и затем определяют, в каком из диапазонов формулы (1) это межобъектное расстояние находится. Наконец, в соответствии с формулой (1) определяют отношение отображения между межобъектным расстоянием и весовым коэффициентом. Весовой коэффициент, полученный описанным выше методом на основе dmax(Ai,В) будет равен W(dmax(Ai,B))
[0077] На шаге S1112 получают минимальное взвешенное расстояние (максимальную близость косинусов) между объектом в первом классе и всеми объектами второго класса в соответствии с произведением наибольшего расстояния сходства и соответствующего первого весового коэффициента.
[0078] Минимальное взвешенное расстояние ϕmax(Ai,В) между объектом Аi и классом В получают согласно формуле (2):
[0079]
Figure 00000004
[0080] На шаге S1113 получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе.
[0081] Допустим, что расстояние между объектом Ai в классе А и объектом b является наибольшим, тогда среднее взвешенное расстояние ϕavg(Ai,B) между объектом Ai и остальными объектами, за исключением объекта b в классе В, получают согласно формуле (3):
[0082]
Figure 00000005
[0083] На шаге S1114 получают взвешенное расстояние между объектом в первом классе и вторым классом, в соответствии с минимальным взвешенным расстоянием и средним взвешенным расстоянием.
[0084] На основе минимального взвешенного расстояния ϕmax(Ai,В) и среднего взвешенного расстояния ϕavg(Ai,B) между объектом Ai и классом В, взвешенное расстояние ϕ (Ai,В) между объектом Ai и классом В получают согласно формуле (4):
[0085]
Figure 00000006
[0086] На шаге S1115 получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовым коэффициентом, соответствующим наибольшему расстоянию сходства.
[0087] Первое однонаправленное взвешенное расстояние S(A, В) между классом А и классом D получают согласно формуле (5):
[0088]
Figure 00000007
[0089] В формуле (5) W(dmax(Ai,B)) обозначает весовой коэффициент, соответствующий максимальной близости косинусов (минимальному расстоянию) dmax(Ai,В) между объектом Ai в классе А и всеми объектами в классе В.
[0090] На шаге S112 получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом.
[0091] Вычисляют второе однонаправленное взвешенного расстояния S(B, А) между классом В и классом, что аналогично вычислению первого однонаправленного взвешенного расстояния между классом А и В и не будет описано повторно.
[0092] На шаге S113, получают взвешенное расстояние между первым классом и вторым классом согласно первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.
[0093] Взвешенное расстояние Н(А, В) между классом А и классом В вычисляют согласно формуле (6):
[0094]
Figure 00000008
[0095] На шаге S120 определяют, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния. Если классы, которые могут быть объединены существуют выполняют шаг S130; а если классов, которые могут быть объединены не существуют, выполняют шаг S140.
[0096] Заранее заданное пороговое значение может быть выбрано в соответствии с типами данных различных объектов, или может быть выбрано в соответствии с типом вычисляемого межобъектного расстояния (например, близость косинусов, евклидово расстояние и т.п.) Например, объектами могут быть изображения лиц, и при этом межобъектным расстоянием может быть близость косинусов. В этом случае пороговое значение расстояния может быть выбрано равным 0,3-0,35.
[0097] Для различных типов межклассовых расстояний, используемых при вычислении взвешенного расстояния, условия для определения возможности объединения двух классов также могут быть различными.
[0098] Когда взвешенные межклассовые расстояния получают согласно близости косинусов между классами, то определяют, не меньше ли взвешенное расстояние между двумя классами заданного порогового значения, и если взвешенное расстояние не меньше заранее заданного порогового значения расстояния, это означает, что сходство между классами является большим, и классы могут быть объединены.
[0099] Когда взвешенные межклассовые расстояния вычисляют на основе евклидового расстояния или других расстояний, то определяют, является ли взвешенное расстояние между двумя классами не большим заданного порогового значения, и если взвешенное расстояние не больше заранее заданного порогового значения расстояния, это означает, что сходство между классами является большим, и классы могут быть объединены.
[00100] Взвешенное расстояние, предложенное в вариантах осуществления настоящего изобретения, получают с использованием минимального взвешенного расстояния и среднего взвешенного расстояния между классами, таким образом, не происходит уклона в сторону классов, имеющих большое количество объектов, но классы, в том числе имеющие малое количество объектов, рассматриваются всесторонне, что хорошо подходит для применения к кластеризации человеческих лиц. Соответственно, кластеризация с помощью взвешенного расстояния позволяет повысить точность кластеризации.
[00101] При объединении двух классов, на шаге S130, соответствующим образом объединяют все классы, которые могут быть объединены.
[00102] На шаге S140 определяют, является количество классов после объединения меньшим, чем количество классов перед объединением, если да, возвращаются к выполнению шага S110; и если нет, переходят к шагу S150.
[00103] Если количество классов после объединения меньше, чем количество классов до объединения, возвращаются к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получение результата кластеризации, т.е. пока не останется больше классов, которые могут быть объединены, и получают результат кластеризации.
[00104] На шаге S150 получают результат кластеризации.
[00105] Сходство объектов, объединенных в одном классе, является высоким, а их несходство - низким. Если в качестве объектов выбраны изображения лиц, то изображения лица, помещенного в один класс, будут изображениями одного и того же человека.
[00106] В способе кластеризации, предложенном в вариантах осуществления настоящего изобретения, получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, и затем в способе кластеризации выполняют объединение классов, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, и затем получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между объектами, то если сходство между объектами различно, то соответствующий вклад в результат кластеризации также будет различным, причем чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.
[00107] Фиг. 5 представляет собой блок-схему, иллюстрирующую устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг. 5 устройство включает блок 100 получения, блок 200 определения и блок 300 объединения.
[00108] Блок получения 100 сконфигурирован для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию.
[00109] Блок 100 получения может включать первый подблок получения, второй подблок получения, третий подблок получения и четвертый подблок получения.
[00110] Первый подблок получения сконфигурирован для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства.
[00111] Второй подблок получения сконфигурирован для получения первого однонаправленного взвешенного расстояния между первым классом и вторым классом, согласно наибольшему расстоянию сходства и первому весовому коэффициенту, в отношении всех объектов первого класса.
[00112] В одном из вариантов осуществления настоящего изобретения второй подблок получения может включать пятый подблок получения, шестой подблок получения, седьмой подблок получения, восьмой подблок получения и девятый подблок получения.
[00113] Пятый подблок получения сконфигурирован для получения наибольшего расстояния сходства между любым из объектов в первом классе и всеми объектами второго класса, и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства.
[00114] Шестой подблок получения сконфигурирован для получения минимального взвешенного расстояния между объектом в первом классе и всеми объектами второго класса, согласно произведению наибольшего расстояния сходства и соответствующего первого весового коэффициента;
[00115] Седьмой подблок получения сконфигурирован для получения среднего взвешенного расстояния по расстояниям между объектом в первом классе и другими объектами, за исключением объекта, который соответствует наибольшему расстоянию сходства во втором классе.
[00116] Восьмой подблок получения сконфигурирован для получения взвешенного расстояния между объектом в первом классе и вторым классом, в соответствии с минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием.
[00117] Девятый подблок получения сконфигурирован для получения первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.
[00118] Третий подблок получения сконфигурирован для получения второго однонаправленного расстояния между вторым классом и первым классом.
[00119] Четвертый подблок получения сконфигурирован для получения взвешенного расстояния между первым классом и вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию.
[00120] Блок 200 определения сконфигурирован для определения, имеются ли два класса, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния.
[00121] Блок 300 объединения сконфигурирован для соответствующего объединения всех классов, которые могут быть объединены, если какие-либо два класса могут быть объединены, и для обеспечения выполнения, блоком получения, шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, т.е. пока классы, которые могут быть объединены, не перестанут существовать, и для получения результата кластеризации.
[00122] В устройстве для кластеризации, предложенном в вариантах осуществления настоящего изобретения, при помощи блока получения получают взвешенные расстояния между классами согласно весовым коэффициентам, соответствующим межобъектным расстояниям, при этом весовой коэффициент определяют согласно сходству между двумя объектами, т.е. межобъектное расстояние является взвешенным, затем определяют, при помощи блока определения, имеются ли классы, которые могут быть объединены, согласно взвешенному расстоянию, и затем, с помощью блока объединения, объединяют классы, взвешенные расстояния между которыми отвечают условию объединения, при этом выполнение способа не завершают до тех пор, пока количество классов после объединения не будет тем же, что и количество классов после объединения, в результате чего получают результат кластеризации. Поскольку взвешенное расстояние связано со сходством между объектами, то если сходство между объектами различно, то соответствующий вклад в результат кластеризации также будет различным, причем чем больше сходство, тем большим будет соответствующий вклад. Таким образом, обеспечивается повышение точности результата кластеризации.
[00123] Фиг. 6 представляет собой блок-схему, иллюстрирующую другое устройство для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. В соответствии с иллюстрацией фиг. 6 устройство включает блок 400 статистики, блок 500 определения, блок 100 получения, блок 200 определения и блок 300 объединения. При этом блоки, наименования и числовые обозначения которых аналогичны варианту осуществления настоящего изобретения на фиг. 5, имеют те же самые функции и не будут описаны повторно.
[00124] Блок 400 статистики сконфигурирован для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, согласно статистике по образцовым объектам.
[00125] Блок 500 определения сконфигурирован для определения отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия, при этом весовой коэффициент определяют в соответствии с упомянутой вероятностью.
[00126] Блок определения может включать подблок запроса и подблок определения.
[00127] Подблок запроса сконфигурирован для запроса упомянутого отношения соответствия с целью получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же человеком.
[00128] Подблок определения сконфигурирован для определения того, что упомянутая вероятность является весовым коэффициентом, соответствующим упомянутому расстоянию.
[00129] Блок 300 получения, имеющий соединение с блоком 500 определения сконфигурирован для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию.
[00130] В устройстве для кластеризации, предложенном в вариантах осуществления настоящего изобретения, сначала получают отношение соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же человеком, в соответствии с большим количеством образцовых объектов с целью определения соответствующего весового коэффициента, и затем получают взвешенное расстояние между классами, затем определяют классы, которые могут быть объединены, согласно взвешенному расстоянию, и затем классы, которые могут быть объединены, объединяют до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов до объединения, и таким образом получают результат кластеризации. Поскольку взвешенное расстояние связано с вероятностью того, что два объекта являются одним и тем же объектом, оно позволяет учесть ситуации, в которых вероятность того, что два объекта являются одним и тем же объектом, меняется с изменением расстояния между двум объектами, в результате чего различные межобъектные расстояния обеспечивают различные вклады, причем чем больше значение вероятности, тем больше соответствующий вклад. Таким образом, предложенный результат кластеризации позволяет повысить точность результатов кластеризации.
[00131] В отношении устройств, предложенных в рассмотренных выше вариантах осуществления настоящего изобретения, конкретные методы выполнения операций для индивидуальных модулей из их состава были подробно описаны в вариантах осуществления настоящего изобретения, относящихся к способам кластеризации, и не будут приведены повторно.
[00132] Фиг. 7 представляет собой блок-схему, иллюстрирующую оконечное устройство 800 для кластеризации в соответствии с одним из примеров осуществления настоящего изобретения. Например, устройство 800 может представлять собой мобильный телефон, компьютер, терминал цифрового вещания, устройство обмена сообщениями, игровую приставку, планшетный компьютер, медицинское устройство, тренажерное оборудование, карманный персональный компьютер и т.п.
[00133] В соответствии с иллюстрацией фиг. 7 устройство 800 может включать один или более следующих компонентов: процессорный компонент 802, память 804, компонент 806 электропитания, мультимедийный компонент 808, аудиокомпонент 810, интерфейс 812 ввода-вывода (input/output, I/O), измерительный компонент 814 и компонент 816 связи.
[00134] Процессорный компонент 802, как правило, осуществляет общее управление функционированием оконечного устройства 800, например, операциями, связанными с отображением, телефонными вызовами, обменом данными, работой с камерой и операциями записи. Процессорный компонент 802 может включать один или более процессоров 820, исполняющих инструкции с целью выполнения всех шагов описанных выше способов или части этих шагов. Также, процессорный компонент 802 может включать один или более модулей, обеспечивающих взаимодействие между процессорным компонентом 802 и другими компонентами. Например, процессорный компонент 802 может включать мультимедийный модуль, обеспечивающий взаимодействие между мультимедийным компонентом 808 и процессорным компонентом 802.
[00135] Память 804 сконфигурирована для хранения различных типов данных с целью поддержки функционирования устройства 800. Примерами подобных данных могут служить инструкции любых приложений или методов, исполняемых на устройстве 800, контактные данные, данные телефонной книги, сообщения, изображения, видеоданные и т.п. Память 804 может быть реализована с использованием энергозависимых или энергонезависимых устройств любого типа, а также их комбинаций, например, статической памятью с произвольным доступом (static random access memory, SRAM), электрически перепрограммируемой памяти «только для чтения» (erasable programmable read-only memory, EPROM), программируемой памяти «только для чтения» (programmable read-only memory, PROM), памяти «только для чтения», магнитной памяти, флэш-памяти, магнитного или оптического диска.
[00136] Компонент 806 электропитания обеспечивает электропитание различных компонентов оконечного устройства 800. Компонент 806 электропитания может включать систему управления электропитанием, один или более источников питания, а также любые другие компоненты, связанные с производством, управлением и распределением электрической энергии в оконечном устройстве 800.
[00137] Мультимедийный компонент 808 включает экран, который обеспечивает интерфейс вывода между оконечным устройством 800 и пользователем. В некоторых из вариантов осуществления настоящего изобретения экран может включать дисплей на жидких кристаллах (liquid crystal display, LCD) и сенсорную панель (touch panel, TP). Если экран включает сенсорную панель, то в этом случае экран может быть реализован как сенсорный экран, принимающий сигналы ввода от пользователя. Сенсорная панель включает один или более датчиков касания, предназначенных для регистрации касаний, скольжений и других жестов на сенсорной панели. Датчики касания могут не только регистрировать границы операций касания или скольжения, но также измерять период времени и величину давления, связанные с этими операциями. В некоторых вариантах осуществления настоящего изобретения мультимедийный компонент 808 включает фронтальную камеру и/или тыловую камеру. Фронтальная камера и/или тыловая камера могут принимать внешние мультимедийные данные, когда оконечное устройство 800 находится в определенном режиме работы, например, в режиме фотографирования или в режиме видеосъемки. Как фронтальная камера, так и тыловая камера могут представлять собой фиксированные системы оптических линз или иметь функциональность фокусировки и оптического зуммирования.
[00138] Аудиокомпонент 810 сконфигурирован для вывода и/или ввода аудиосигналов. Например, аудиокомпонент 810 включает микрофон ("MIC"), сконфигурированный для приема внешнего аудиосигнала, когда оконечное устройство 800 находится в определенном режиме работы, например, в режиме вызова, в режиме записи или в режиме распознавания голоса. Принятые аудиосигналы могут затем быть сохранены в памяти 804 или переданы при помощи компонента 816 связи. В некоторых из вариантов осуществления настоящего изобретения аудиокомпонент 810 включает также громкоговоритель для вывода аудиосигналов.
[00139] Интерфейс 812 ввода/вывода обеспечивает интерфейс между процессорным компонентом 802 и модулями периферийных интерфейсов, например, клавиатуры, поворотного-нажимного переключателя («колеса»), кнопок и т.п. Кнопки могут включать, без ограничения перечисленным, «домашнюю» кнопку, кнопку громкости, кнопку «пуск» или кнопку блокировки.
[00140] Измерительный компонент 814 включает один или более датчиков, обеспечивающих оценку состояния различных элементов оконечного устройства 800. Например, измерительный компонент 814 может определять состояние устройства 800: «открыто» или «закрыто», относительное расположение компонентов, например, дисплея и клавиатуры оконечного устройства 800, изменение положения оконечного устройства 800 или одного из компонентов устройства 800, присутствие или отсутствие контакта пользователя с оконечным устройством 800, ориентацию или ускорение/замедление оконечного устройства 800 и изменение температуры оконечного устройства 800. Измерительный компонент 814 может включать датчик близости, сконфигурированный для обнаружения присутствия приближенных объектов без физического контакта с ними. Измерительный компонент 814 может также включать светочувствительный датчик, например, датчик изображений CMOS или CCD, для использования в приложениях формирования изображений. В некоторых из вариантов осуществления настоящего изобретения измерительный компонент 814 может также включать акселерометрический датчик, гироскопический датчик, магнитный датчик, датчик давления или датчик температуры.
[00141] Компонент 816 связи сконфигурирован для обеспечения связи, проводной или беспроводной, между оконечным устройством 800 и другими устройствами. Оконечное устройство 800 может осуществлять доступ к беспроводной сети, основанной на таких стандартах связи, как WiFi, 2G или 3G, или их комбинации. В одном из примеров осуществления настоящего изобретения компонент 816 связи принимает широковещательный сигнал или соответствующую широковещательную информацию от внешней широковещательной системы управления по широковещательному каналу. В одном из примеров осуществления настоящего изобретения компонент 816 связи включает также модуль ближней бесконтактной связи (near field communication, NFC) для обеспечения связи в ближней зоне. Например, NFC-модуль может быть реализован на базе технологии радиочастотной идентификации (radio frequency identification, RFID), технологии ассоциации передачи данных в инфракрасном диапазоне (infrared data association, IrDA), технологии сверхширокой полосы пропускания (ultra-wideband, UWB), технологии Bluetooth (ВТ) или других технологий.
[00142] В примерах осуществления настоящего изобретения оконечное устройство 800 может быть реализовано с использованием одной или более заказных интегральных схем (ASIC), цифровых сигнальных процессоров (DSP), цифровых устройств обработки сигналов (digital signal processing devices, DSPD), программируемых логических устройств (programmable logic devices, PLD), электрически программируемых вентильных матриц (field programmable gate arrays, FPGA), процессорах, контроллерах, микроконтроллерах, микропроцессорах или других электронных блоках, предназначенных для исполнения описанных выше способов.
[00143] В примерах осуществления настоящего изобретения предложен также машиночитаемый носитель для хранения данных, включающий инструкции, например, содержащиеся в памяти 804 и исполняемые процессором 820 в оконечном устройстве 800 с целью выполнения описанных выше способов. К примеру, машиночитаемый носитель для хранения данных может представлять собой память ROM, память с произвольным доступом (random access memory, RAM), CD-ROM, магнитную ленту, гибкий диск, оптическое запоминающее устройство для хранения данных и т.п.
[00144] Машиночитаемый носитель для хранения данных, при исполнении инструкций на этом носителе при помощи процессора терминального устройства, обеспечивает исполнение этим терминальным устройством способа кластеризации, включающего:
[00145] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, при этом упомянутый коэффициент определяют в соответствии со сходством между двумя объектами согласно межобъектному расстоянию; определение, имеются ли классы, которые могут быть объединены, в соответствии с упомянутым взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; если классы, которые могут быть объединены, существуют, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния в отношении всех объединяемых классов до тех пор, пока количество классов после объединения не будет тем же самым, что и количество классов перед объединением, и получение результата кластеризации.
[00146] Альтернативно, способ дополнительно включает: получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.
[00147] Альтернативно, определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому соответствующему соответствия выполняют следующим образом:
[00148] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.
[00149] Альтернативно, упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов выполняют следующим образом:
[00150] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.
[00151] Альтернативно, получение упомянутого первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям, выполняют следующим образом:
[00152] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства; получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента; получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе; получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутым вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.
[00153] Фиг. 13 представляет собой структурную блок-схему сервера в вариантах осуществления настоящего изобретения. К примеру, сервер 1900 может быть значительно отличающимся по конфигурации или характеристикам, и может включать один или более центральных процессорных блоков (central processing units, CPU) 1922 (например, один или более процессоров) и память 1932, один или боле носителей 1930 (например, одно или более запоминающих устройств большой емкости) для хранения прикладных программ 1942 или данных 1944. При этом память 1932 и носитель 1930 могут представлять собой устройство временного или постоянного хранения. Программы, хранимые на носителе 1930 могут включать один или более модулей (не показаны на чертежах), при этом каждый из модулей может включать набор инструкций для выполнения операций в оконечном устройстве. Также, CPU 1922 может быть выполнен с возможностью связи с носителем 1930 и исполнения, на сервере 1900, набора операционных инструкций, хранимых на носителе 1930.
[00154] Сервер 1900 может также включать один или более источников 1926 питания, один или более проводных или беспроводных сетевых интерфейсов 1950, а также один или более интерфейсов 1958 ввода-вывода, одну или более клавиатур 1956 и/или одну или более операционных систем 1941, например, Windows Server™, Mac OS X™, Unix™, Linux™, FreeBSD™ или аналогичные операционные системы.
[00155] В примерах осуществления настоящего изобретения предложен также машиночитаемый носитель для хранения данных, включающий инструкции, например, содержащиеся в памяти 1922 и исполняемые процессором 1922 в оконечном устройстве с целью выполнения описанных выше способов. К примеру, машиночитаемый носитель для хранения данных может представлять собой память ROM, память с произвольным доступом (random access memory, RAM), CD-ROM, магнитную ленту, гибкий диск, оптическое запоминающее устройство для хранения данных и т.п.
[00156] Машиночитаемый носитель для хранения данных, при исполнении инструкций на этом носителе при помощи процессора терминального устройства, обеспечивает исполнение этим терминальным устройством способа кластеризации, включающего:
[00157] получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию;
[00158] определение, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния;
[00159] если существуют какие-либо два класса, которые могут быть объединены, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и получение результата кластеризации.
[00160] Альтернативно, способ дополнительно включает: получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом, в соответствии со статистикой по образцовым объектам; и определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.
[00161] Альтернативно, определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому соответствующему соответствия выполняют следующим образом:
[00162] запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.
[00163] Альтернативно, упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов выполняют следующим образом:
[00164] получают первое однонаправленное взвешенное расстояние между первым классом и вторым классом, согласно расстояниям между всеми объектами первого класса и всеми объектами второго класса, и соответствующими весовыми коэффициентами; получают второе однонаправленное взвешенное расстояние между вторым классом и первым классом; и получают взвешенное расстояние между первым классом и вторым классом в соответствии с упомянутыми первым однонаправленным взвешенным расстоянием и вторым однонаправленным взвешенным расстоянием.
[00165] Альтернативно, получение упомянутого первого однонаправленного взвешенного расстояния между первым классом и вторым классом в соответствии со взвешенными расстояниями между всеми объектами в первом классе и вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям, выполняют следующим образом:
[00166] получают наибольшее расстояние сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса, и первый весовой коэффициент, соответствующий этому наибольшему расстоянию сходства; получают минимальное взвешенное расстояние между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса, согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента; получают среднее взвешенное расстояние по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе; получают взвешенное расстояние между объектом в упомянутом первом классе и упомянутым вторым классом, в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и получают первое однонаправленное взвешенное расстояние между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом, и весовыми коэффициентами, соответствующими этим взвешенным расстояниям.
[00167] Нужно понимать, что настоящее изобретение не ограничено конкретной структурой, описанной выше и проиллюстрированной на чертежах, и может быть подвержено модификациям и изменениям в пределах его объема. Предполагается, что объем настоящего изобретения ограничен только приложенной формулой изобретения.
[00168] Следует понимать, что в соответствующем контексте указывающие на отношения термины, такие как «первый» или «второй», применяются исключительно для отличения одного объекта или операции от другого объекта или другой операции, при этом они не обязательно подразумевают или требуют наличия реального порядка или отношения между этими объектами или операциями. При этом термины «включает», «содержит» или любые другие их варианты подразумевают неисключающее включение, то есть, процедура, способ, изделие или устройство, которые включают последовательность элементов, могут включать не только эти, но и другие элементы, не перечисленные явно, а также могут включать дополнительные элементы, изначально присущие процедуре, способу, изделию или устройству. Без дополнительного ограничения, элементы, определенные выражением «включает», не исключают факта включения процессом, способом, изделием или устройством других аналогичных элементов.
[00169] Приведенное выше является всего лишь подробным описанием вариантов осуществления настоящего изобретения, на основании которого специалисты в данной области техники должны понять замысел настоящего изобретения или быть способными реализовать настоящее изобретение на практике. Специалистам в данной области техники могут быть очевидными множество различных модификаций этих вариантов осуществления настоящего изобретения Общий замысел, заданный в контексте настоящего изобретения, может быть реализован и в других вариантах осуществления изобретения, в пределах сущности и объема настоящего изобретения. Таким образом, настоящее изобретение не ограничено вариантами его осуществления, проиллюстрированными в данном документе. Настоящее изобретение следует понимать как соответствующее максимально широкому объему, отвечающему замыслу и новым отличительным особенностям, описанным в данном документе.

Claims (41)

1. Способ кластеризации, включающий:
получение взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию, при этом упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом; при этом получение упомянутого взвешенного расстояния между двумя классами включает:
получение первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии с расстояниями между всеми объектами упомянутого первого класса и всеми объектами упомянутого второго класса и соответствующими весовыми коэффициентами, при этом получение первого однонаправленного взвешенного расстояния включает:
получение наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;
получение минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;
получение среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;
получение взвешенного расстояния между объектом в упомянутом первом классе и упомянутым вторым классом в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и
получение первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом и весовыми коэффициентами, соответствующими этим взвешенным расстояниям;
получение второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; и
получение взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию;
определение, имеются ли классы, которые могут быть объединены, в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и
если существуют классы, которые могут быть объединены, соответствующее объединение всех классов, которые могут быть объединены, и возврат к выполнению шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и получение результата кластеризации.
2. Способ по п. 1, дополнительно включающий:
получение отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом согласно статистике по образцовым объектам; и
определение отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.
3. Способ по п. 2, отличающийся тем, что определение упомянутого отношения отображения между межобъектным расстоянием и весовым коэффициентом согласно упомянутому отношению соответствия выполняют следующим образом:
запрашивают упомянутое отношение соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и
определяют, что эта вероятность является весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.
4. Устройство для кластеризации, включающее:
блок получения, сконфигурированный для получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектным расстояниям в отношении всех объединяемых классов, при этом упомянутый весовой коэффициент определяют в соответствии со сходством двух объектов, соответствующих межобъектному расстоянию, при этом упомянутое взвешенное расстояние представляет собой взвешенное расстояние между первым классом и вторым классом, при этом упомянутый блок получения включает:
первый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;
второй подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутому наибольшему расстоянию сходства и соответствующему первому весовому коэффициенту;
третий подблок получения, сконфигурированный для получения второго однонаправленного расстояния между упомянутым вторым классом и упомянутым первым классом; и
четвертый подблок получения, сконфигурированный для получения взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом согласно упомянутым первому однонаправленному взвешенному расстоянию и второму однонаправленному взвешенному расстоянию;
при этом упомянутый второй подблок получения включает:
пятый подблок получения, сконфигурированный для получения наибольшего расстояния сходства между любым из объектов в упомянутом первом классе и всеми объектами упомянутого второго класса и первого весового коэффициента, соответствующего этому наибольшему расстоянию сходства;
шестой подблок получения, сконфигурированный для получения минимального взвешенного расстояния между объектом в упомянутом первом классе и всеми объектами упомянутого второго класса согласно произведению упомянутого наибольшего расстояния сходства и упомянутого соответствующего первого весового коэффициента;
седьмой подблок получения, сконфигурированный для получения среднего взвешенного расстояния по расстояниям между объектом в упомянутом первом классе и другими объектами, за исключением объекта, который соответствует упомянутому наибольшему расстоянию сходства в упомянутом втором классе;
восьмой подблок получения, сконфигурированный для получения взвешенного расстояния между объектом в упомянутом первом классе и упомянутым вторым классом в соответствии с упомянутым минимальным взвешенным расстоянием и упомянутым средним взвешенным расстоянием; и
девятый подблок получения, сконфигурированный для получения первого однонаправленного взвешенного расстояния между упомянутым первым классом и упомянутым вторым классом в соответствии со взвешенными расстояниями между всеми объектами в упомянутом первом классе и упомянутым вторым классом и весовыми коэффициентами, соответствующими этим взвешенным расстояниям;
блок определения, сконфигурированный для определения, имеются ли классы, которые могут быть объединены в соответствии со взвешенным расстоянием между двумя классами и заранее заданным пороговым значением расстояния; и
блок объединения, сконфигурированный для соответствующего объединения всех классов, которые могут быть объединены, если классы, которые могут быть объединены, существуют, и для управления упомянутым блоком получения для выполнения шага получения взвешенного расстояния между двумя классами согласно весовому коэффициенту, соответствующему межобъектному расстоянию в отношении всех объединяемых классов, до тех пор, пока количество классов после объединения не будет тем же, что и количество классов до объединения, и для получения результата кластеризации.
5. Устройство по п. 4, дополнительно включающее:
блок статистики, сконфигурированный для получения отношения соответствия между межобъектным расстоянием и вероятностью того, что два объекта являются одним и тем же объектом согласно статистике по образцовым объектам;
блок определения, сконфигурированный для определения отношения отображения между межобъектным расстоянием и упомянутым весовым коэффициентом согласно упомянутому отношению соответствия, при этом упомянутый весовой коэффициент определяют в соответствии с упомянутой вероятностью.
6. Устройство по п. 5, отличающееся тем, что упомянутый блок определения включает:
подблок запроса, сконфигурированный для запроса упомянутого отношения соответствия для получения вероятности того, что два объекта, соответствующие конкретному межобъектному расстоянию, являются одним и тем же объектом; и
подблок определения, сконфигурированный для определения того, что упомянутая вероятность является упомянутым весовым коэффициентом, соответствующим упомянутому межобъектному расстоянию.
7. Оконечное устройство, включающее:
процессор; и
память, сконфигурированную для хранения инструкций, исполняемых упомянутым процессором, для выполнения способа по п. 1.
RU2015129671A 2014-03-14 2014-07-24 Способ и устройство для кластеризации RU2630373C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410096608.9 2014-03-14
CN201410096608.9A CN103927545B (zh) 2014-03-14 2014-03-14 聚类方法及相关装置
PCT/CN2014/082884 WO2015135277A1 (zh) 2014-03-14 2014-07-24 聚类方法及相关装置

Publications (2)

Publication Number Publication Date
RU2015129671A RU2015129671A (ru) 2017-04-27
RU2630373C2 true RU2630373C2 (ru) 2017-09-07

Family

ID=51145761

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015129671A RU2630373C2 (ru) 2014-03-14 2014-07-24 Способ и устройство для кластеризации

Country Status (7)

Country Link
EP (1) EP2919136A1 (ru)
JP (1) JP6051336B2 (ru)
KR (1) KR101639502B1 (ru)
CN (1) CN103927545B (ru)
MX (1) MX346698B (ru)
RU (1) RU2630373C2 (ru)
WO (1) WO2015135277A1 (ru)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927545B (zh) * 2014-03-14 2017-10-17 小米科技有限责任公司 聚类方法及相关装置
CN105488467B (zh) * 2015-11-26 2019-07-23 小米科技有限责任公司 图片分类方法及装置
CN107092618A (zh) * 2016-10-27 2017-08-25 北京小度信息科技有限公司 一种信息处理方法及装置
CN109469919B (zh) * 2018-11-12 2020-07-28 南京工程学院 一种基于权重聚类的电站空预器堵灰监测方法
CN111310834A (zh) * 2020-02-19 2020-06-19 深圳市商汤科技有限公司 数据处理方法及装置、处理器、电子设备、存储介质
CN111415151A (zh) * 2020-03-10 2020-07-14 支付宝(杭州)信息技术有限公司 连锁商户的识别方法、装置、电子设备及存储介质
CN112132111A (zh) * 2020-10-10 2020-12-25 安徽江淮汽车集团股份有限公司 泊车典型场景的提取方法、设备、存储介质及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060251292A1 (en) * 2005-05-09 2006-11-09 Salih Burak Gokturk System and method for recognizing objects from images and identifying relevancy amongst images and information
KR20080018631A (ko) * 2006-08-25 2008-02-28 인하대학교 산학협력단 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반영역 가중치 방법
RU2345414C1 (ru) * 2007-08-10 2009-01-27 Общество с ограниченной ответственностью "Рекогмишн" Способ построения системы индексирования для поиска объектов на цифровых изображениях
US20120321193A1 (en) * 2010-12-30 2012-12-20 Nokia Corporation Method, apparatus, and computer program product for image clustering
US20130279816A1 (en) * 2010-06-01 2013-10-24 Wei Zhang Clustering images

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100318512B1 (ko) * 1998-02-14 2002-04-22 이계철 두그룹간의유사도계산방법
US7664735B2 (en) * 2004-04-30 2010-02-16 Microsoft Corporation Method and system for ranking documents of a search result to improve diversity and information richness
KR100804678B1 (ko) * 2007-01-04 2008-02-20 삼성전자주식회사 비디오 인물별 신 분류 방법 및 그 시스템
JP5526955B2 (ja) * 2010-04-09 2014-06-18 ソニー株式会社 顔クラスタリング装置、顔クラスタリング方法、及びプログラム
US20120294540A1 (en) * 2011-05-17 2012-11-22 Microsoft Corporation Rank order-based image clustering
CN102881032B (zh) * 2012-09-14 2015-09-09 北京理工大学 一种基于改进算法的图片拼接方法
CN103136355B (zh) * 2013-03-05 2016-01-06 电子科技大学 一种基于自动阈值鱼群算法的文本聚类方法
CN103544255B (zh) * 2013-10-15 2017-01-11 常州大学 基于文本语义相关的网络舆情信息分析方法
CN103927545B (zh) * 2014-03-14 2017-10-17 小米科技有限责任公司 聚类方法及相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060251292A1 (en) * 2005-05-09 2006-11-09 Salih Burak Gokturk System and method for recognizing objects from images and identifying relevancy amongst images and information
KR20080018631A (ko) * 2006-08-25 2008-02-28 인하대학교 산학협력단 이미지 검색기의 적합성 피드백을 위한 공간 위치정보 기반영역 가중치 방법
RU2345414C1 (ru) * 2007-08-10 2009-01-27 Общество с ограниченной ответственностью "Рекогмишн" Способ построения системы индексирования для поиска объектов на цифровых изображениях
US20130279816A1 (en) * 2010-06-01 2013-10-24 Wei Zhang Clustering images
US20120321193A1 (en) * 2010-12-30 2012-12-20 Nokia Corporation Method, apparatus, and computer program product for image clustering

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
US 2012/0294540 A1 (), 22.11.2012. *

Also Published As

Publication number Publication date
WO2015135277A1 (zh) 2015-09-17
JP2016517110A (ja) 2016-06-09
CN103927545B (zh) 2017-10-17
KR20150117201A (ko) 2015-10-19
EP2919136A1 (en) 2015-09-16
JP6051336B2 (ja) 2016-12-27
MX346698B (es) 2017-03-28
MX2014011016A (es) 2016-02-19
KR101639502B1 (ko) 2016-07-22
RU2015129671A (ru) 2017-04-27
CN103927545A (zh) 2014-07-16

Similar Documents

Publication Publication Date Title
RU2630373C2 (ru) Способ и устройство для кластеризации
US11663468B2 (en) Method and apparatus for training neural network, and storage medium
CN110033851B (zh) 信息推荐方法、装置、存储介质及服务器
RU2628167C2 (ru) Способ и устройство для кластеризации
CN103944804B (zh) 推荐联系人的方法及装置
US11244228B2 (en) Method and device for recommending video, and computer readable storage medium
CN109918669B (zh) 实体确定方法、装置及存储介质
RU2638154C2 (ru) Способы и устройства для присваивания метки номеру
WO2022198853A1 (zh) 任务调度方法及装置、电子设备、存储介质和程序产品
CN110807325B (zh) 谓词识别方法、装置及存储介质
JP2016517110A5 (ru)
RU2683979C2 (ru) Способ и устройство для обнаружения давления
US11264027B2 (en) Method and apparatus for determining target audio data during application waking-up
WO2022160596A1 (zh) 一种问诊信息处理方法、装置和介质
CN110532345A (zh) 一种未标注数据的处理方法、装置及存储介质
CN111968635A (zh) 语音识别的方法、装置及存储介质
CN111160448A (zh) 一种图像分类模型的训练方法及装置
WO2017140108A1 (zh) 压力检测方法和装置
RU2651250C1 (ru) Способ и устройство для распознавания отпечатков пальцев
CN112836058A (zh) 医疗知识图谱建立方法及装置、医疗知识图谱查询方法及装置
US20150262033A1 (en) Method and terminal device for clustering
CN107515853B (zh) 一种细胞词库推送方法及装置
KR102348783B1 (ko) 콘텐츠 검색 장치, 시스템 및 방법
CN112951405A (zh) 一种实现特征排序的方法、装置及设备
CN113312475B (zh) 一种文本相似度确定方法及装置