CN110490216A - 一种自学式数据分类系统和方法 - Google Patents
一种自学式数据分类系统和方法 Download PDFInfo
- Publication number
- CN110490216A CN110490216A CN201910263690.2A CN201910263690A CN110490216A CN 110490216 A CN110490216 A CN 110490216A CN 201910263690 A CN201910263690 A CN 201910263690A CN 110490216 A CN110490216 A CN 110490216A
- Authority
- CN
- China
- Prior art keywords
- base
- data
- group
- index
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012360 testing method Methods 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 43
- 239000011159 matrix material Substances 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 13
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 230000008447 perception Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 description 14
- 238000002203 pretreatment Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 238000012356 Product development Methods 0.000 description 1
- 230000035508 accumulation Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Abstract
本申请公开了一种自学式数据分类系统和方法,该系统具有一数据库,储存有一群的训练数据,训练数据的数据信号和待测数据信号具有相同属性;一基生成单元,和数据库电性连接,用以依据训练数据生成一第一组代表训练数据的数据信号的主成分的基;一指数生成单元,用以依据第一组基及待测数据信号生成相对应的指数;及一指数分类计算单元,和指数生成单元电性连接,用以依据生成的指数计算出待测数据信号的分类结果;基生成单元依据生成的指数生成不同于该第一组基的一第二组基。
Description
技术领域
本申请属于数据分类领域,具体地说,涉及一种在数据分类过程中能够自我提升分类能力的数据分类系统及方法。
背景技术
现今计算机的普及和互联网的发达,造就了各种不同类型数据的大量累积及相应数据库的建立。在大数据的时代下,这些数据对于企业来说是宝贵的资产,也是产品开发及应用过程中不可或缺的利器。众所周知,这些数据的建立仰赖于承载这些数据的信号的各种处理,而信号分类是其中最为关键的。藉由准确的信号分类,可建立已知特定事件对应已知特定结果的数据,并进而利用这些数据来分析或预测待测事件的发生结果,这类的数据分类系统产品也已陆续被开发出来。举例而言,我们可以对大量已从人体检测得到的生理信号进行分类,并依据分类结果来诊断人体的健康情况。
进行信号分类时,所处理的数据信号往往是高维度的信号而有着高数据复杂度,如果直接以这些高维度的信号进行分类,势必增加分类系统建置上的困难度。为了降低分类系统的建置难度及成本,需要先对这些高维度的信号进行信号前处理而降维(dimensionreduction)成低维度的信号,之后再对这些低维度的信号进行分类。已知的信号前处理方式例如是二维卷积神经网络分析法、一维卷积神经网络分析法或递归神经网络分析法。然而,采用这些分析法时所需的数据量及花费时间相当大,对于讲求效率和成果的数据分类系统而言并不划算。其他的信号前处理方式又例如将数据信号降维成特定基(basis)和其对应指数(index)的组合的主成分分析法(Principal Component Analysis;PCA)。所谓的特定基是一群和欲降维的信息信号有着相同数据属性的数据信号的共同部分,而对应指数是这些基在欲降维的数据信号中的成分比例。如图7所示,藉由A、B及C三个共同基的转化,可将五个数据信号分别表示成这些共同基和三个对应指数的组合。然而,以这种方式建置的数据分类系统准确度取决于降维后的数据信号准确度,而降维后的数据信号准确度和基的决定息息相关,若基的决定仅仅是透过人为方式达成,则容易产生偏差而不易得到最佳的基,且人为方式的决定无法标准化作业以产生量化指针,无法让分类系统的准确度得到控制。
因此,如何在降低分类系统的建置难度及成本的同时,降低数据信号复杂度且提升信号分类的准确度,确保源于此信号分类所建置的数据分类系统产品在应用上能够更准确地分析或预测待测事件的发生结果,是本申请欲解决的技术课题。
发明内容
有鉴于上述问题,本申请提供一种自学式数据分类系统及方法,其透过计算机自动学习的方式生成基,消除了人为方式选取所可能产生的偏差,提升了信号分类的准确度,确保源于此信号分类方式建置的数据分类系统具有高度分类辨识率及有效的分类效果(classification result)。
一实施态样中,本申请提供一种自学式数据分类系统,用于对一待测数据信号(也可称待分类数据信号)进行分类。所提供的自学式数据分类系统包括一第一子系统及一第二子系统。第一子系统具有一数据库,储存有一群的训练数据(training data),训练数据的数据信号和待测数据信号具有相同属性;一基生成单元,和数据库电性连接,用以依据训练数据生成一第一组代表训练数据的数据信号的主成分(principal component)的基,第一组基的基个数至少为一;及一回传指数接收单元,和基生成单元电性连接。第二子系统和第一子系统电性连接或网络连接,具有一数据信号量测单元,用以量测待测数据信号;一指数生成单元,和数据信号量测单元电性连接,用以依据第一组基及待测数据信号生成对应于第一组基的指数(index);一指数回传单元,和指数生成单元电性连接,用以将生成的指数回传至第一子系统;及一指数分类计算单元,和指数生成单元电性连接,用以依据生成的指数计算出待测数据信号的分类结果。其中,回传指数接收单元接收了指数回传单元回传的指数,且基生成单元依据回传的指数及训练数据的数据信号生成不同于第一组基的一第二组基,第二组基的基个数至少为一。
一实施例中,基生成单元具有一矩阵化处理单元,和数据库电性连接,其将训练数据中的至少部分数据信号转化成一矩阵(matrix);一特征分解单元,和矩阵化处理单元电性连接,其对矩阵实施一奇异值分解(Singular Value Decomposition;SVD)后获得一奇异值(singular value)及一对应的奇异向量(singular vector);一矩阵低秩近似(low rankapproximation)处理单元,和特征分解单元电性连接,其依据奇异值及奇异向量计算出矩阵的最近似低秩矩阵;及一多层感知单元,和矩阵低秩近似处理单元电性连接,其接收最近似低秩矩阵对应的数据信号并输出第一组基及第二组基其中之一。
一实施例中,第一子系统更具有一回传指数评价单元,和基生成单元及回传指数接收单元电性连接,用以对回传的指数进行分次评价以判断回传的指数是否高于一设定阈值。
一实施例中,第一子系统更具有一基输出单元,和基生成单元电性连接,用以将基生成单元生成的第一组基及第二组基通过网络传送至第二子系统。
一实施例中,第二子系统更具有一基输入单元,和数据信号量测单元电性连接,用以接收基输出单元传送来的第一组基及第二组基。
一实施例中,待测数据信号包含生命征象(vital sign)。
另一实施样态中,本申请提供一种自学式数据分类方法,用于对一待测数据信号进行分类,包括下列步骤:依据一群的训练数据生成代表训练数据的数据信号的主成分的一第一组基,训练数据的数据信号和待测数据信号的属性相同,第一组基的基个数至少为一;依据一第一组待测数据信号及第一组基生成对应于第一组基的一第一组指数;依据第一组指数及训练数据的数据信号生成一第二组基,第二组基的基个数至少为一;及依据第一组指数计算出第一组待测数据信号的分类结果。
一实施例中,第一组基及第二组基的生成步骤是在一第一子系统上执行,而第一组指数的生成及第一组待测数据信号的分类结果的计算是在一第二子系统上执行,第二子系统远离第一子系统且受第一子系统控制。
一实施例中,所提供的自学式数据分类方法更包含下列步骤:判断第一组指数是否高于一设定阈值。
一实施例中,所提供的自学式数据分类方法更包含下列步骤:依据第二组基及一第二组待测数据信号生成对应于第二组基的一第二组指数;及依据第二组指数计算出第二组待测数据信号的分类结果。
在本申请所提出的自学式数据分类系统及方法中,由于第二子系统对于量测得的数据信号进行信号前处理时所需的基是由第一子系统生成的,因而完全消除了人为方式选取所可能产生的偏差,不仅提升了信号前处理的效率也提升了信号分类的准确度,并确保了分类结果具有高度且有效的分类辨识率。此外,第一子系统采用了多层感知架构来生成基,因而基生成的过程完全是自学式的,而透过在生成基的推论过程中使用矩阵低秩近似法可以有效地将高维度的信号进行了降维,并有效地减少了多层感知架构所需的输入层(input layer)神经元(neuron)数量及隐藏层(hidden layer)的数量,藉此降低了分类系统的建置难度及成本。再者,透过将第二子系统用于分类算法的指数同步回传给第一子系统,更强化了第一子系统的基生成单元在生成基的推论(inference)过程,让第一子系统的多层感知单元可以生成最佳基,进而提升第二子系统对于量测得的数据信号进行信号前处理的效能。此外,由于第二子系统的分类演算可独立于信号前处理之外来进行,因而让分类算法的运算机制的调整更为灵活有弹性。
为让本申请的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
附图说明
图1是依据本申请一实施例的一种自学式数据分类系统的系统架构示意图;
图2是依据本申请一实施例的一种自学式数据分类系统的第一子系统的基生成单元的功能结构示意图;
图3是依据本申请一实施例的一种自学式数据分类系统的第一子系统的基生成单元依据训练数据中的已知数据信号生成基的推论过程示意图;
图4是依据本申请一实施例的一种自学式数据分类系统的第一子系统于整个自学式数据分类系统进行数据分类时的实施步骤流程图;
图5是依据本申请一实施例的一种自学式数据分类系统的第二子系统于整个自学式数据分类系统进行数据分类时的实施步骤流程图;
图6是依据本申请另一实施例的一种自学式数据分类方法的实施步骤流程图;
图7是已知将高维度信号降维成特定基和其对应指数的组合的示意图。
具体实施方式
本申请揭示一种自学式数据分类系统及方法,所涉及的数据信号前处理及类神经网络架构中的多层感知器的基本原理,已为本领域普通技术人员所能明了,故以下文中的说明,不再作完整描述。同时,以下文中所对照的附图,意在表达和本申请特征有关的含义,并未依据实际尺寸完整绘制,在先声明。
图1是依据本申请一实施例所提供的自学式数据分类系统10的系统架构示意图。本实施例中,自学式数据分类系统10具有一第一子系统100及一第二子系统200,第二子系统200用于量测待测数据信号或称待分类数据信号并利用分类算法(classificationalgorithm)得出待测数据信号的分类结果,而第一子系统100则用于生成第二子系统200对于量测得的待测数据信号进行信号前处理时所需的基,让第二子系统200藉此得到该基的对应指数,并将指数用于后续的分类演算。第一子系统100通常远离第二子系统200设置,但第一子系统100及第二子系统200间可透过网络彼此链接而能够进行第一子系统100所生成基及第二子系统200所生成指数的传送及接收。第一系统100例如是一服务器端(server)系统,而第二系统200例如是一客户端(client)系统。其他实施例中,第一子系统100和第二子系统200可以电性连接在一起而不是通过网络沟通,让基及指数的生成在同一个硬件架构下实现。
如图1所示,一实施例中,第一子系统100具有彼此电性连接的一数据库101、一基生成单元102、一基输出单元103、一回传指数接收单元104及一回传指数评价单元105。数据库101是一个储存有一群的训练数据的数据库,储存例如以内存来实现,所储存的训练数据的数据信号和第二子系统200所量测的待测数据信号具有相同属性,例如都是载有生命征象的生理信号。在第一子系统100的运作过程中,基生成单元102用以依据数据库的训练数据生成一组代表这些训练数据的数据信号的主成分的基,并透过基输出单元103以在线更新的方式将生成的基传送至第二子系统200。每一组基的基个数至少为一。
图2是依据本申请一实施例所提供的自学式数据分类系统10的第一子系统100的基生成单元102的功能结构示意图。图3是基生成单元102依据训练数据中的已知数据信号q生成一组基的推论过程示意图。如图2所示,一实施例中,基生成单元102具有彼此电性连接的一矩阵化处理单元1021、一特征分解单元1022、一矩阵低秩近似处理单元1023及一多层感知单元1024。矩阵化处理单元1021用以将训练数据中的至少部份数据信号例如是高维度数据信号q转化成矩阵A。特征分解单元1021用以对矩阵A实施一奇异值分解(SVD)后获得奇异值Σ和奇异向量VT,其中A≒UΣVT,U及V均为正交归一矩阵(orthonormal matrix),即矩阵中包含的各向量在高维空间中互相垂直且长度为1。如此一来,矩阵A可被视为数据信号q在V坐标系上的投影,且各坐标值依据Σ的对角在线的数值做倍数缩放后,于U的坐标系上重组。如图2及3所示,矩阵低秩近似处理单元1023用以选取依大小顺序排列后的前几个奇异值Σ'以及对应的奇异向量V'T,并据以计算出矩阵A的最近似低秩矩阵A',进而计算出最近似低秩矩阵A'对应的降维数据信号q'。如图2及3所示,多层感知单元1024接收每个经过降维的数据信号q',依据类神经网络架构中的多层感知器(multilayer perceptrons)原理,输出一组代表这些数据信号q的主成分的基。由于投影后的坐标系已代表已知数据信号q中各自线性独立且依照特征值大小排序的主成分,亦即原数据信号中较为相关的信息均已群聚于各坐标轴,因此可以有效降低多层感知单元1024所需的输入层10241神经元数量及隐藏层10242的数量。
请再度参阅图1,回传指数接收单元104用以接收第二子系统200生成并回传的指数,回传指数评价单元105用以对回传的指数进行分次评价以判断回传的指数是否高于一设定阈值。所谓的分次评价是指每经过一设定时间段,例如10秒,才对回传的指数进行评价而不是时时刻刻对回传指数进行评价。当回传的指数经分次评价后的判断结果为低于设定阈值时继续分次评价,而当回传的指数经分次评价后的判断结果为高于设定阈值时则基生成单元102依据回传的指数及数据库中的训练数据的数据信号生成不同于原基的新的一组代表这些数据信号的主成分的基,基的个数至少为一。在第一子系统100的运作过程中,当第二子系统200所生成的指数回传时,第一子系统100可视情况以在线更新的方式修正第二子系统200运作过程中所使用的基,让第二子系统200能以新的一组基进行量测得的待测信号的分类。
另一方面,如图1所示,一实施例中,第二子系统200具有彼此电性连接的数据信号量测单元201、基输入单元202、指数生成单元203、指数回传单元204及指数分类计算单元205。数据信号量测单元201用以量测并接收经由第二子系统200的输入端211输入第二子系统200的待测数据信号210并据以储存,例如以暂存内存来实现,待测数据信号210和第一子系统100的数据库101中所储存的训练数据的数据信号具有相同属性,例如是生理信号。基输入单元202用以接收第一子系统100的基输出单元103传送来的基。指数生成单元203依据基输入单元202所接收到的基对数据信号量测单元201所接收到的待测数据信号210进行指数计算,进而生成对应于这些基的指数。指数回传单元204将生成的指数回传给第一子系统100,并由回传指数接收单元104接收。指数分类计算单元205用以透过一分类算法依据生成的指数计算出待测数据信号210的分类结果220,分类算法通常以计算机程序的执行来实现。分类结果220最后经由第二子系统200的输出端212输出。在第二子系统200从量测得待测数据信号210至进行分类算法的过程中,生成的指数可回传给第一子系统100,让第一子系统100可以依据回传的指数强化其生成最佳基的能力。
图4是依据本申请一实施例所提供的自学式数据分类系统10的第一子系统100于整个自学式数据分类系统10进行数据分类时的实施步骤流程图。本实施例中,自学式数据分类系统10的数据分类方法具有下列步骤:
步骤601:接收回传指数。如图1所示,自学式数据分类系统10的第一子系统100的回传指数接收单元104接收来自第二子系统200的指数回传单元204所回传的指数。
步骤602:判断是否有回传指数。如图1所示,自学式数据分类系统10的第一子系统100的回传指数评价单元105判断是否有来自第二子系统200的回传指数。否的话,执行步骤603;是的话,执行步骤604。
步骤603:依据数据库中的训练数据的数据信号生成一第一组代表训练数据的数据信号的主成份的基。如图1至3所示,第一子系统100的基生成单元102依据数据库101中的训练数据生成一第一组代表训练数据的数据信号的主成份的基。接着,执行步骤607。
步骤604:分次评价回传指数。如图1所示,第一子系统100的回传指数评价单元105每经过一设定时间段,例如10秒,对回传的指数进行评价,接着执行步骤605。
步骤605:判断回传的指数是否高于设定阈值。如图1所示,第一子系统100的回传指数评价单元105判断回传的指数是否高于一设定阈值。否的话,回到步骤604,是的话,则执行步骤606。
步骤606:依据回传的指数及数据库中的训练数据的数据信号生成一第二组代表训练数据的数据信号的主成份的基。第二组基不同于第一组基,第二组基的基个数至少为一。如图1至3所示,第一子系统100的基生成单元102依据回传的指数及数据库101中的训练数据的数据信号生成新的一组代表训练数据的数据信号的主成份的基。接着,执行步骤607。
步骤607:输出基。如图1所示,在基生成单元102生成基后,由基输出单元103输出基至第二子系统200。
图5是依据本申请一实施例所提供的自学式数据分类系统10的第二子系统200于整个自学式数据分类系统10进行数据分类时的实施步骤流程图。本实施例中,自学式数据分类系统10的数据分类方法具有下列步骤:
步骤701:量测得待测数据信号。如图1所示,自学式数据分类系统10的第二子系统200的数据信号量测单元201量测并接收经由第二子系统200的输入端211输入第二子系统200的待测数据信号210。接着,执行步骤702。
步骤702:以输入基生成指数。如图1所示,自学式数据分类系统10的第二子系统200的基输入单元202接收了第一子系统100传送过来的第一组基及第二组基,并由指数生成单元203依据基输入单元202所接收到的第一组基及第二组基其中之一对所接收到的待测数据信号210进行指数计算,进而生成对应于第一组基或第二组基的指数。接着,执行步骤703及步骤705。
步骤703:依据生成的指数计算出待测数据信号的分类结果。如图1所示,指数分类计算单元205依据生成的指数透过一分类算法计算出待测数据信号210的分类结果220。接着,执行步骤704。
步骤704:输出分类结果。如图1所示,分类结果220最后经由第二子系统200的输出端212输出。
步骤705:回传指数。如图1所示,第二子系统200的指数回传单元204将生成的指数回传给第一子系统100的基生成单元102参考。
图6是依据本申请另一实施例所提供的自学式数据分类方法的实施步骤流程图。本实施例中,自学式数据分类方法具有下列步骤:
步骤801:依据一群的训练资料生成代表该些训练数据的数据信号的主成分的一第一组基,训练数据的数据信号和待测数据信号的属性相同,第一组基的基个数至少为一。接着,执行步骤802。
步骤802:依据一第一组待测数据信号及第一组基生成对应于第一组基的第一组指数。接着,执行步骤803及步骤806。
步骤803:判断第一组指数是否高于一设定阈值。接着,执行步骤804。
步骤804:当第一组指数高于一设定阈值时,依据第一组指数及该些训练数据的数据信号生成一第二组基,第二组基的基个数至少为一。接着,执行步骤805。
步骤805:依据第二组基及一第二组待测数据信号生成对应于第二组基的第二组指数。接着,执行步骤806。
步骤806:依据第一组指数计算出第一组待测数据信号的分类结果或依据第二组指数计算出第二组待测数据信号的分类结果。
一实施例中,上述步骤801、803、804可以是在如图1所示的一第一子系统100上执行,而上述步骤802、805及806可以是在如图1所示的一第二子系统200上执行,第二子系统200远离第一子系统100且受第一子系统100控制。
在本申请所提出的自学式数据分类系统及方法中,由于第二子系统200对于量测得的数据信号进行信号前处理时所需的基是由第一子系统100生成的,因而完全消除了人为方式选取所可能产生的偏差,不仅提升了信号前处理的效率也提升了信号分类的准确度,并确保了分类结果具有高度且有效的分类辨识率。此外,第一子系统100采用了多层感知架构来生成基,因而基生成的过程完全是自学式的,而透过在生成基的推论过程中使用矩阵低秩近似法有效地将高维度的信号进行了降维,并有效地减少了多层感知架构所需的输入层神经元数量及隐藏层的数量,藉此降低了分类系统的建置难度及成本。再者,透过将第二子系统200用于分类算法的指数同步回传给第一子系统100,更强化了第一子系统100的基生成单元102在生成基的推论过程,让第一子系统100的多层感知单元1024可以生成最佳基,进而提升第二子系统200对于量测得的数据信号进行信号前处理的效能。此外,由于第二子系统的分类演算可独立于信号前处理之外来进行,因而让分类算法的运算机制的调整更为灵活有弹性。
在应用上,当所提出的自学式数据分类系统10的第二子系统200所量测的待测数据信号是包含生命征象(vital sign)的生理信号时,数据信号量测单元201可以是一个生命征象量测单元,用以量测人体的体温、脉博、呼吸及血压。此时,第二子系统200可以是一个手持的生理信号检测器,而第一子系统100可以是一个远程控制手持生理信号量测器的云端服务器,手持的生理信号检测器和云端服务器间以有线或无线的网络连接。由于各种生理信号的数据有其范围,因而经降维后所获得的基和指数之间的关系可被确定下来,更适于应用本案所提出的自学式数据分类系统。换句话说,任何经降维后所获得的基和指数间的关系具有可确定性的数据信号,都适于应用本申请所提出的自学式数据分类系统及方法进行分类。
上列详细说明系针对本申请的一可行实施例的具体说明,惟该实施例并非用以限制本申请的专利范围,凡未脱离本申请技艺精神所为的等效实施或变更,均应包含于本申请的专利范围中。例如将第一子系统及第二子系统整合在一起。故本申请的保护范围当视权利要求所界定者为准。
Claims (10)
1.一种自学式数据分类系统,用于对一待测数据信号进行分类,其特征在于,包括:
一第一子系统,具有:
一数据库,储存有一群的训练数据,所述训练数据的数据信号和所述待测数据信号具有相同属性;
一基生成单元,和所述数据库电性连接,用以依据所述训练数据生成一第一组代表所述训练数据的数据信号的主成分的基,所述第一组基的基个数至少为一;和
一回传指数接收单元,和所述基生成单元电性连接;以及
一第二子系统,和所述第一子系统电性连接或网络连接,具有:
一数据信号量测单元,用以量测所述待测数据信号;
一指数生成单元,和所述数据信号量测单元电性连接,用以依据所述第一组基和所述待测数据信号生成对应于所述第一组基的指数;
一指数回传单元,和所述指数生成单元电性连接,用以将所述指数回传至所述第一子系统;和
一指数分类计算单元,和所述指数生成单元电性连接,用以依据所述指数计算出所述待测数据信号的分类结果;
其中,所述回传指数接收单元接收所述指数回传单元回传的所述指数,且所述基生成单元依据回传的所述指数和所述训练数据的数据信号生成不同于所述第一组基的一第二组基,所述第二组基的基个数至少为一。
2.根据权利要求1所述的自学式数据分类系统,其特征在于,所述基生成单元具有:
一矩阵化处理单元,和所述数据库电性连接,其将所述训练数据的至少部分数据信号转化成一矩阵;
一特征分解单元,和所述矩阵化处理单元电性连接,其对所述矩阵实施一奇异值分解后获得一奇异值和一对应的奇异向量;
一矩阵低秩近似处理单元,和所述特征分解单元电性连接,其依据所述奇异值和所述奇异向量计算出所述矩阵的最近似低秩矩阵;和
一多层感知单元,和所述矩阵低秩近似处理单元电性连接,其接收所述最近似低秩矩阵对应的数据信号并输出所述第一组基和所述第二组基其中之一。
3.根据权利要求1所述的自学式数据分类系统,其特征在于,所述第一子系统还具有:
一回传指数评价单元,和所述基生成单元和所述回传指数接收单元电性连接,用以对回传的所述指数进行分次评价以判断回传的所述指数是否高于一设定阈值。
4.根据权利要求3所述的自学式数据分类系统,其特征在于,所述第一子系统还具有:
一基输出单元,和所述基生成单元电性连接,用以将所述基生成单元生成的所述第一组基和所述第二组基通过网络传送至所述第二子系统。
5.根据权利要求4所述的自学式数据分类系统,其特征在于,所述第二子系统还具有:
一基输入单元,和所述数据信号量测单元电性连接,用以接收所述基输出单元传送来的所述第一组基和所述第二组基。
6.根据权利要求1至5中任一项所述的自学式数据分类系统,其特征在于,所述待测数据信号包含生命征象。
7.一种自学式数据分类方法,用于对一待测数据信号进行分类,其特征在于,包括下列步骤:
依据一群的训练资料生成代表所述训练数据的数据信号的主成分的一第一组基,所述训练数据的数据信号和所述待测数据信号的属性相同,所述第一组基的基个数至少为一;
依据一第一组所述待测数据信号和所述第一组基生成对应于所述第一组基的一第一组指数;
依据所述第一组指数和所述训练数据的数据信号生成一第二组基,所述第二组基的基个数至少为一;和
依据所述第一组指数计算出所述第一组所述待测数据信号的分类结果。
8.根据权利要求7所述的自学式数据分类方法,其特征在于,所述第一组基和所述第二组基的生成步骤是在一第一子系统上执行,所述第一组指数的生成和所述第一组所述待测数据信号的分类结果的计算是在一第二子系统上执行,所述第二子系统远离所述第一子系统且受所述第一子系统控制。
9.根据权利要求7所述的自学式数据分类方法,其特征在于,还包括下列步骤:
判断所述第一组指数是否高于一设定阈值。
10.根据权利要求7所述的自学式数据分类方法,其特征在于,还包括下列步骤:
依据所述第二组基和一第二组所述待测数据信号生成对应于所述第二组基的一第二组指数;和
依据所述第二组指数计算出所述第二组所述待测数据信号的分类结果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107116402A TWI682330B (zh) | 2018-05-15 | 2018-05-15 | 自學式資料分類系統及方法 |
TW107116402 | 2018-05-15 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110490216A true CN110490216A (zh) | 2019-11-22 |
Family
ID=68545811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910263690.2A Pending CN110490216A (zh) | 2018-05-15 | 2019-04-03 | 一种自学式数据分类系统和方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110490216A (zh) |
TW (1) | TWI682330B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI808785B (zh) * | 2022-06-10 | 2023-07-11 | 英業達股份有限公司 | 驗證機器學習的資料拆分系統及其方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102317786A (zh) * | 2007-04-18 | 2012-01-11 | 特提斯生物科学公司 | 糖尿病相关性生物学标记物及其使用方法 |
WO2012138004A1 (ko) * | 2011-04-06 | 2012-10-11 | 조선대학교산학협력단 | 피씨에이를 이용한 지문인증 장치 및 그 방법 |
CN103646252A (zh) * | 2013-12-05 | 2014-03-19 | 江苏大学 | 一种基于优化的模糊学习矢量量化的苹果分类方法 |
CN107506787A (zh) * | 2017-07-27 | 2017-12-22 | 陕西师范大学 | 一种基于迁移自学习的混凝土桥梁裂缝分类方法 |
CN107851194A (zh) * | 2015-08-04 | 2018-03-27 | 西门子公司 | 用于脑肿瘤分类的视觉表示学习 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6993193B2 (en) * | 2002-03-26 | 2006-01-31 | Agilent Technologies, Inc. | Method and system of object classification employing dimension reduction |
CA2542937A1 (en) * | 2003-07-01 | 2005-01-13 | Cardiomag Imaging, Inc. (Cmi) | Machine learning for classification of magneto cardiograms |
WO2011156080A1 (en) * | 2010-06-09 | 2011-12-15 | Siemens Corporation | Systems and methods for learning of normal sensor signatures, condition monitoring and diagnosis |
CN104408476A (zh) * | 2014-12-08 | 2015-03-11 | 西安电子科技大学 | 基于深度稀疏主分量分析的极化sar图像分类方法 |
CN105528516A (zh) * | 2015-12-01 | 2016-04-27 | 三门县人民医院 | 基于主元分析与超限学习机相结合的临床病理数据分类方法 |
-
2018
- 2018-05-15 TW TW107116402A patent/TWI682330B/zh active
-
2019
- 2019-04-03 CN CN201910263690.2A patent/CN110490216A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102317786A (zh) * | 2007-04-18 | 2012-01-11 | 特提斯生物科学公司 | 糖尿病相关性生物学标记物及其使用方法 |
WO2012138004A1 (ko) * | 2011-04-06 | 2012-10-11 | 조선대학교산학협력단 | 피씨에이를 이용한 지문인증 장치 및 그 방법 |
CN103646252A (zh) * | 2013-12-05 | 2014-03-19 | 江苏大学 | 一种基于优化的模糊学习矢量量化的苹果分类方法 |
CN107851194A (zh) * | 2015-08-04 | 2018-03-27 | 西门子公司 | 用于脑肿瘤分类的视觉表示学习 |
CN107506787A (zh) * | 2017-07-27 | 2017-12-22 | 陕西师范大学 | 一种基于迁移自学习的混凝土桥梁裂缝分类方法 |
Also Published As
Publication number | Publication date |
---|---|
TW201947465A (zh) | 2019-12-16 |
TWI682330B (zh) | 2020-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sanborn et al. | Uncovering mental representations with Markov chain Monte Carlo | |
Sunil Kumar et al. | Bio-signals Compression Using Auto Encoder | |
CN108664690A (zh) | 基于深度信念网络的多应力下长寿命电子器件可靠性寿命评估方法 | |
CN112215696A (zh) | 基于时序归因分析的个人信用评估与解释方法、装置、设备及存储介质 | |
Tariq et al. | Why are deep representations good perceptual quality features? | |
Brenner et al. | Tractable dendritic RNNs for reconstructing nonlinear dynamical systems | |
Ni et al. | Neurally-inspired hyperdimensional classification for efficient and robust biosignal processing | |
CN102697491B (zh) | 心电图特征波形识别方法和系统 | |
CN110490216A (zh) | 一种自学式数据分类系统和方法 | |
CN110908919B (zh) | 一种基于人工智能的应答测试系统及其应用 | |
Kumbhar et al. | Anytime prediction as a model of human reaction time | |
CN109743200B (zh) | 基于资源特征的云计算平台计算任务成本预测方法及系统 | |
CN116861358A (zh) | 基于bp神经网络与多源数据融合的计算思维评测方法 | |
CN113705092B (zh) | 基于机器学习的疾病预测方法及装置 | |
Perales-González et al. | Negative correlation hidden layer for the extreme learning machine | |
Jiang et al. | Applying AdaBoost to improve diagnostic accuracy | |
Lu et al. | Application of neighborhood components analysis to process and survey data to predict student learning of statistics | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN111985826A (zh) | 一种多指标工业产品的可视化质量分级方法和系统 | |
Obaidat et al. | Methodologies for characterizing ultrasonic transducers using neural network and pattern recognition techniques | |
Chen | Research on classification of watermelon ripeness based on neural network pattern recognition | |
Lückmann | Simulation-Based Inference for Neuroscience and Beyond | |
Supriyadi et al. | Performance comparison of machine learning algorithms for student personality classification | |
CN115902814B (zh) | 基于信息空间度量的目标识别模型性能评估方法和装置 | |
Pu et al. | Kernel Principal Component Analysis Pseudoinverse Learning Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20221206 |