RU2014130519A - Способ автоматической кластеризации объектов - Google Patents

Способ автоматической кластеризации объектов Download PDF

Info

Publication number
RU2014130519A
RU2014130519A RU2014130519A RU2014130519A RU2014130519A RU 2014130519 A RU2014130519 A RU 2014130519A RU 2014130519 A RU2014130519 A RU 2014130519A RU 2014130519 A RU2014130519 A RU 2014130519A RU 2014130519 A RU2014130519 A RU 2014130519A
Authority
RU
Russia
Prior art keywords
cluster
coordinate
model
classified
general sample
Prior art date
Application number
RU2014130519A
Other languages
English (en)
Other versions
RU2586025C2 (ru
Inventor
Анатолий Александрович Михайлов
Светлана Анатольевна Михайлова
Original Assignee
федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова" filed Critical федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова"
Priority to RU2014130519/08A priority Critical patent/RU2586025C2/ru
Publication of RU2014130519A publication Critical patent/RU2014130519A/ru
Application granted granted Critical
Publication of RU2586025C2 publication Critical patent/RU2586025C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/02Computing arrangements based on specific mathematical models using fuzzy logic
    • G06N7/06Simulation on general purpose computers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Automation & Control Theory (AREA)
  • Biomedical Technology (AREA)
  • Fuzzy Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Complex Calculations (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Способ автоматической кластеризации объектов, сводящийся к формированию из исходного множества классифицируемых объектов выборок в виде начальных кластеров, отличающийся тем, что исходное множество формируется путем идентификации каждого классифицируемого объекта его параметром, задающим координату классифицируемого объекта в исходном множестве, и рассматривается как выборка обучения, которую формируют по показательному закону распределения, а данные о кластерах, полученные на этапе обучения, заносятся в соответствующие элементы блока памяти, которые используются при дальнейшем последовательном накоплении в них измерительной информации, на этапе обучения определяют также модель кластера Kс количеством элементов N, удовлетворяющую минимуму риска R(α) формирования модели кластера для коэффициента регуляризации α, которая определяется центром множества объектов кластерагде z- координата классифицируемого объекта кластера K, полученная на этапе обучения,для каждого кластера Kс радиусом rзадают вероятность допустимого отклонения b<<rклассифицируемого объекта по его параметру в виде координаты z′ из генеральной выборки от модели М(α) кластера Kи определяют верхний предел устойчивости кластера при введении в него объекта генеральной выборки с координатой z′, какна этапе последовательной классификации измеряют координату z′ классифицируемого объекта в исходном множестве, определяют отклонение Δмодели кластера Kс учетом нового объекта с координатой z′ из генеральной выборки от модели М(α), каки если при коэффициенте регуляризации α=0 Δ≤b, то объект генеральной выборки с координатой z′ включается в кластер K, а если при α≠0

Claims (1)

  1. Способ автоматической кластеризации объектов, сводящийся к формированию из исходного множества классифицируемых объектов выборок в виде начальных кластеров, отличающийся тем, что исходное множество формируется путем идентификации каждого классифицируемого объекта его параметром, задающим координату классифицируемого объекта в исходном множестве, и рассматривается как выборка обучения, которую формируют по показательному закону распределения, а данные о кластерах, полученные на этапе обучения, заносятся в соответствующие элементы блока памяти, которые используются при дальнейшем последовательном накоплении в них измерительной информации, на этапе обучения определяют также модель кластера Ki с количеством элементов Ni, удовлетворяющую минимуму риска RMi(α) формирования модели кластера для коэффициента регуляризации α, которая определяется центром множества объектов кластера
    Figure 00000001
    где zобучi - координата классифицируемого объекта кластера Ki, полученная на этапе обучения,
    для каждого кластера Ki с радиусом ri задают вероятность допустимого отклонения b<<ri классифицируемого объекта по его параметру в виде координаты z′ из генеральной выборки от модели Мобучi(α) кластера Ki, и определяют верхний предел устойчивости кластера при введении в него объекта генеральной выборки с координатой z′, как
    Figure 00000002
    на этапе последовательной классификации измеряют координату z′ классифицируемого объекта в исходном множестве, определяют отклонение ΔMi модели кластера Ki с учетом нового объекта с координатой z′ из генеральной выборки от модели Мобучi(α), как
    Figure 00000003
    и если при коэффициенте регуляризации α=0 ΔM≤b, то объект генеральной выборки с координатой z′ включается в кластер Ki, а если при α≠0 ΔMi>b, то объект генеральной выборки с координатой z′ анализируется на предмет принадлежности к соседним кластерам, для чего по выражению для P(|z′-Мобучi(α)|<b) определяют коэффициент регуляризации αi для соседних сравниваемых кластеров Ki, чтобы он обеспечивал требуемые значения вероятности P(|z′-Мобучi(α)|<b) при заданных значениях риска Rобучi и отклонения b
    Figure 00000004
    сравнивают коэффициенты регуляризации для данного кластеров Ki и включают объект генеральной выборки с координатой z′ в кластер Ki, для которого риск RMii0)=Rобучi при максимальном коэффициенте регуляризации αi0, а сама регуляризованная координата объекта кластера Ki определяется как
    Figure 00000005
RU2014130519/08A 2014-07-23 2014-07-23 Способ автоматической кластеризации объектов RU2586025C2 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2014130519/08A RU2586025C2 (ru) 2014-07-23 2014-07-23 Способ автоматической кластеризации объектов

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014130519/08A RU2586025C2 (ru) 2014-07-23 2014-07-23 Способ автоматической кластеризации объектов

Publications (2)

Publication Number Publication Date
RU2014130519A true RU2014130519A (ru) 2016-02-10
RU2586025C2 RU2586025C2 (ru) 2016-06-10

Family

ID=55313215

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014130519/08A RU2586025C2 (ru) 2014-07-23 2014-07-23 Способ автоматической кластеризации объектов

Country Status (1)

Country Link
RU (1) RU2586025C2 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709092A (zh) * 2021-03-03 2021-11-26 腾讯科技(深圳)有限公司 数据检测方法、装置、计算机设备以及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2706578C1 (ru) * 2019-04-02 2019-11-19 Ложкин Андрей Григорьевич Способ фильтрации и кластеризации режимов сложной ректификационной колонны

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5317741A (en) * 1991-05-10 1994-05-31 Siemens Corporate Research, Inc. Computer method for identifying a misclassified software object in a cluster of internally similar software objects
US6751621B1 (en) * 2000-01-27 2004-06-15 Manning & Napier Information Services, Llc. Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors
RU2003136467A (ru) * 2003-12-16 2005-05-27 Открытое акционерное общество "Научно-производственное предпри тие "Радар ммс" (RU) Способ автоматической кластеризации объектов
US7676518B2 (en) * 2006-08-16 2010-03-09 Sap Ag Clustering for structured data
RU2007132411A (ru) * 2007-08-27 2009-03-10 Государственное образовательное учреждение высшего профессионального образовани "Южно-Российский государственный технический университет (Новочеркасский политехнический институт)" (RU) Способ автоматической кластеризации объектов

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709092A (zh) * 2021-03-03 2021-11-26 腾讯科技(深圳)有限公司 数据检测方法、装置、计算机设备以及存储介质
CN113709092B (zh) * 2021-03-03 2023-04-25 腾讯科技(深圳)有限公司 数据检测方法、装置、计算机设备以及存储介质

Also Published As

Publication number Publication date
RU2586025C2 (ru) 2016-06-10

Similar Documents

Publication Publication Date Title
WO2019050966A3 (en) AUTOMATED SAMPLE WORKFLOW PORTALING AND DATA ANALYSIS
JP2016526380A5 (ru)
EP3101599A3 (en) Advanced analytical infrastructure for machine learning
PH12014502650A1 (en) Method for predicting quality or manufacturing condition of cement
MX2018008104A (es) Identificacion de entidades utilizando un modelo de aprendizaje profundo.
JP2016507759A5 (ru)
CN109983482A (zh) 已学习模型生成方法、已学习模型生成装置、信号数据判别方法、信号数据判别装置以及信号数据判别程序
Tsai et al. Multiscale crack fundamental element model for real-world pavement crack classification
MX2017001472A (es) Metodo y sistema para obtener informacion geoquimica de pirolisis mediante espectroscopia de descomposicion inducida por laser.
RU2015143313A (ru) Системы и способы для автоматического принятия решений на основе данных об участниках рынка
JP2018026122A5 (ru)
MX2022005667A (es) Identificacion de falsos positivos reducidos para cuantificacion espectroscopica.
CN102855490A (zh) 高分辨率遥感影像面向对象神经网络分类方法
CN202946195U (zh) 一种图像型隧道围岩变形智能检测仪
EP3156973A3 (en) Systems and methods for evaluating suitability of an article for an individual
CN103886332A (zh) 一种检测与识别金属网栅缺陷的方法
CN106935038B (zh) 一种停车检测系统及检测方法
JP2016031367A5 (ru)
RU2014130519A (ru) Способ автоматической кластеризации объектов
JP2012226607A5 (ja) 情報処理方法及び装置、パターン識別方法及び装置
RU2013119641A (ru) Моделирование геологического процесса
WO2015166353A3 (en) Early detection of preeclampsia
CN104715160A (zh) 基于kmdb的软测量建模数据异常点检测方法
EP2762928A3 (en) Recognizing method of flaky or blocky prohibited articles, explosives or drugs
CN106651803A (zh) 户型数据的识别方法及装置

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20170724