CN112513891A - 信息处理装置、信息处理方法及程序 - Google Patents

信息处理装置、信息处理方法及程序 Download PDF

Info

Publication number
CN112513891A
CN112513891A CN201980049686.4A CN201980049686A CN112513891A CN 112513891 A CN112513891 A CN 112513891A CN 201980049686 A CN201980049686 A CN 201980049686A CN 112513891 A CN112513891 A CN 112513891A
Authority
CN
China
Prior art keywords
classification
threshold
unit
classes
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980049686.4A
Other languages
English (en)
Inventor
藤村亮太
中田洋平
筑泽宗太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN112513891A publication Critical patent/CN112513891A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

信息处理装置(100a)是具备处理器的信息处理装置,处理器取得用来将数据分类为多个类别的至少1个类别的第1分类阈值;输出基于已训练的分类模型的输出和第1分类阈值将数据分类为多个类别的至少1个类别的分类结果;第1分类阈值通过第2分类阈值的第2变换而得到,该第2变换是对于第1变换的逆变换;第1变换是从已训练的分类模型的输出向构成多个类别的多个单体类别的分类概率值的变换;第2分类阈值基于多个单体类别的分类概率值而设定。

Description

信息处理装置、信息处理方法及程序
技术领域
本发明涉及信息处理装置、信息处理方法及程序。
背景技术
在图像识别等的领域中,作为识别图像中的物体的识别模型(以下,也称作分类模型)而使用多层神经网络(Deep Neural Network:DNN)。DNN例如以图像为输入,输出该图像中包含的物体的类别分类的概率值(也称作对于物体类别的似然度)。此时,在DNN的输出层中,使用Softmax函数(例如,参照专利文献1)。
现有技术文献
专利文献
专利文献1:国际公开第2017/149722号
发明内容
发明要解决的课题
但是,由于Softmax函数包含指数运算,所以在将分类模型安装到计算资源受限的编入装置中的情况下,计算资源有可能紧迫。
所以,本发明提供一种能够降低用于物体的类别分类的运算量的信息处理装置、信息处理方法及程序。
用来解决课题的手段
为了解决上述课题,有关本发明的一技术方案的信息处理装置是具备处理器的信息处理装置,上述处理器取得用来将数据分类为多个类别的至少1个类别的第1分类阈值;输出基于已训练的分类模型的输出和上述第1分类阈值将上述数据分类为上述多个类别的至少1个类别的分类结果;上述第1分类阈值通过第2分类阈值的第2变换而得到,该第2变换是对于第1变换的逆变换;上述第1变换是从上述已训练的分类模型的输出向构成上述多个类别的多个单体类别的分类概率值的变换;上述第2分类阈值基于上述多个单体类别的分类概率值而设定。
此外,有关本发明的一技术方案的信息处理方法,是由计算机执行的信息处理方法,执行从已训练的分类模型的输出向多个单体类别的分类概率值的第1变换;基于上述多个单体类别的上述分类概率值,设定第2分类阈值;执行第2变换,所述第2变换是从上述第2分类阈值向用来将数据分类为多个类别的至少1个类别的第1分类阈值的变换,是对于第1变换的逆变换;输出上述第1分类阈值。
此外,有关本发明的一技术方案的程序,使计算机执行以下的信息处理方法:取得用来将数据分类为多个类别的至少1个类别的第1分类阈值;输出基于已训练的分类模型的输出和上述第1分类阈值将上述数据分类为上述多个类别的至少1个类别的分类结果;上述第1分类阈值通过第2分类阈值的第2变换而得到,该第2变换是对于第1变换的逆变换;上述第1变换是从上述已训练的分类模型的输出向构成上述多个类别的多个单体类别的分类概率值的变换;上述第2分类阈值基于上述多个单体类别的分类概率值而设定。或者,本发明的一技术方案也能够作为保存有该程序的计算机可读取的非暂时性的记录介质实现。
发明效果
根据本发明,能够降低用于物体的类别分类的运算量。
附图说明
图1是表示实施方式1的信息处理系统的结构的一例的框图。
图2是表示实施方式1的阈值计算装置的动作的一例的流程图。
图3是表示有关实施方式1的信息处理装置的动作的一例的流程图。
图4是表示有关实施方式1的变形例的信息处理装置的结构的一例的框图。
图5是表示实施方式1的变形例的阈值计算部的动作的一例的流程图。
图6是表示实施方式1的变形例的信息处理部的动作的一例的流程图。
图7是表示实施方式2的信息处理系统的结构的一例的框图。
图8是表示实施方式2的阈值计算装置的动作的一例的流程图。
图9是表示有关实施方式2的变形例的信息处理装置的结构的一例的框图。
图10是表示实施方式2的变形例的阈值计算部的动作的一例的流程图。
具体实施方式
(达成了本发明的认识)
以往,在被搭载到编入设备那样的计算资源有限制的运算装置中的多层神经网络(Deep Neural Network:DNN)中,由于不能增加隐藏层的单元数,所以有样式识别性能下降的课题。对于该课题,专利文献1所记载的以往技术按照各DNN的层进行是否实施标量量化(scalar quantization)的判断,在实施了标量量化的层的下一层中,进行被标量量化的向量与权重向量的相乘。由此,与进行没有被标量量化的向量与权重向量的相乘的情况相比,由于能够减少运算量,所以能够增加隐藏层的单元数。但是,由于使用被标量量化的输出向量计算似然度向量,所以与使用不被标量量化的输出向量计算似然度向量的情况相比,值变得粗疏。因此,识别精度有可能下降。
此外,在专利文献1所记载的以往技术中,在DNN的输出层的前1个层中没有被实施标量量化的情况下,在输出层中应用Softmax函数,计算对于多个类别的似然度向量(以下设为分类概率值)。Softmax函数由于包含指数函数的运算,所以在向编入系统的安装时,指数函数的运算量成为问题。进而,Softmax函数由于对于输入进行调整以使总和成为1,所以即使逆变换也不会复原为原来的值。换言之,由于Softmax函数对输入进行不非可逆的运算,所以不能将输入到Softmax函数中而得到的输出值逆变换而得到没有被标准化的值。因此,在专利文献1所记载的以往技术中,例如为了识别输入图像中的物体,需要计算对于输入图像中的物体的多个类别各自的分类概率值。计算这样的输入图像中的物体的分类概率值的处理由于使编入设备那样的计算资源有限制的运算装置的运算量增加,所以有使搭载在运算装置中的DNN的识别精度下降的情况。因而,专利文献1所记载的以往技术难以说能够降低用于物体的类别分类的运算量。
所以,本申请的发明者鉴于上述课题而进行了专门研究,结果发现,在决定多个类别各自的阈值的处理中,通过在DNN的输出层进行可逆的变换,能将计算出的阈值逆变换而得到没有被标准化的阈值。由此,例如在输入图像中的物体的类别分类处理中能够使用没有被标准化的阈值,所以想到了能够降低用于物体的类别分类的运算量的信息处理装置。
本发明的一技术方案的概要是以下这样的。
有关本发明的一技术方案的信息处理装置是具备处理器的信息处理装置,上述处理器取得用来将数据分类为多个类别的至少1个类别的第1分类阈值;输出基于已训练的分类模型的输出和上述第1分类阈值将上述数据分类为上述多个类别的至少1个类别的分类结果;上述第1分类阈值通过第2分类阈值的第2变换而得到,该第2变换是对于第1变换的逆变换;上述第1变换是从上述已训练的分类模型的输出向构成上述多个类别的多个单体类别的分类概率值的变换;上述第2分类阈值基于上述多个单体类别的分类概率值而设定。
根据上述结构,在从分类模型的输出向多个单体类别的分类概率值变换的第1变换中,使用可逆变换的函数。因此,如果在物体的类别分类的处理中使用通过对第2分类阈值执行作为对于第1变换的逆变换的第2变换而得到的第1分类阈值,则不再需要例如将以图像为输入的分类模型的输出变换为多个单体类别的分类概率值。因而,根据有关本发明的一技术方案的信息处理装置,能够降低用于物体的类别分类的运算量。
具体而言,在有关本发明的一技术方案的信息处理装置中,上述已训练的分类模型的输出也可以是与上述多个类别对应的多个标量。
此外,有关本发明的一技术方案的信息处理方法,是由计算机执行的信息处理方法,执行从已训练的分类模型的输出向多个单体类别的分类概率值的第1变换;基于上述多个单体类别的上述分类概率值,设定第2分类阈值;执行第2变换,所述第2变换是从上述第2分类阈值向用来将数据分类为多个类别的至少1个类别的第1分类阈值的变换,是对于第1变换的逆变换;输出上述第1分类阈值。
根据上述方法,在从分类模型的输出向多个单体类别的分类概率值变换的第1变换中,使用可逆变换的函数。因此,通过对第2分类阈值执行作为对于第1变换的逆变换的第2变换,得到作为对没有被标准化的阈值的第1分类阈值。例如,如果在物体的类别分类的处理中使用第1分类阈值,则不再需要将分类模型的输出变换为多个单体类别的分类概率值。因而,根据有关本发明的一技术方案的信息处理方法,由于能得到作为没有被标准化的阈值的第1分类阈值,所以能够减少用于物体的类别分类的运算量。
例如,有关本发明的一技术方案的信息处理方法也可以是,上述第1变换是基于能够逆变换的概率函数的运算;上述第2变换是基于上述概率函数的逆函数的运算。
由此,通过将多个单体类别的分类概率值逆变换,能够导出变换前的值,即已训练的分类模型的输出。
例如,在有关本发明的一技术方案的信息处理方法中,也可以是,上述第1变换是使用与基于能够逆变换的概率函数的运算对应的数据库的变换;上述第2变换是使用与基于上述概率函数的逆函数的运算对应的数据库的变换。
由此,与函数运算相比能够进一步减少计算量。
例如,在有关本发明的一技术方案的信息处理方法中,也可以是,取得数据集;将上述数据集向上述已训练的分类模型输入,对于上述数据集中包含的各个数据取得上述多个单体类别的分类概率值;基于分别对所取得的上述多个单体类别的分类概率值使用上述第2分类阈值的分类结果,决定上述第2分类阈值。
由此,参照评价用数据集中包含的正解数据,将对于多个单体类别的分类概率值的分类概率值的阈值、即第2分类阈值的值变动,通过选择满足目标精度的第2分类阈值来决定第2分类阈值。因而,根据有关本发明的一技术方案的信息处理方法,能够决定能得到希望的分类精度的阈值。
此外,有关本发明的一技术方案的程序,使计算机执行以下的信息处理方法:取得用来将数据分类为多个类别的至少1个类别的第1分类阈值;输出基于已训练的分类模型的输出和上述第1分类阈值将上述数据分类为上述多个类别的至少1个类别的分类结果;上述第1分类阈值通过第2分类阈值的第2变换而得到,该第2变换是对于第1变换的逆变换;上述第1变换是从上述已训练的分类模型的输出向构成上述多个类别的多个单体类别的分类概率值的变换;上述第2分类阈值基于上述多个单体类别的分类概率值而设定。
根据上述程序,在从分类模型的输出向多个单体类别的分类概率值变换的第1变换中,使用可逆变换的函数。因此,如果在物体的类别分类的处理中使用通过对第2分类阈值执行作为对于第1变换的逆变换的第2变换而得到的第1分类阈值,则不再需要例如将以图像为输入的分类模型的输出变换为多个单体类别的分类概率值。因而,根据有关本发明的一技术方案的程序,能够降低用于物体的类别分类的运算量。
以下,一边参照附图一边对实施方式具体地进行说明。
另外,以下说明的实施方式都是表示包含性或具体的例子。因而,在以下的实施方式中表示的数值、形状、构成要素、构成要素的配置位置及连接形态、步骤、步骤的顺序等是一例,不是限定本发明的意思。此外,关于以下的实施方式的构成要素中的、在独立权利要求中没有记载的构成要素,设为任意的构成要素进行说明。
此外,各图是示意图,并不一定是严密地图示的。因而,例如在各图中比例尺等并不一定一致。此外,在各图中,对于实质上相同的结构赋予相同的标号,将重复的说明省略或简略化。
此外,在本说明书中,表示水平或垂直等的要素间的关系性的用语及数值范围不是仅表示严格的意义的词语,而是意味着包含实质上同等的范围、例如几个百分点左右的差异的词语。
(实施方式1)
[信息处理系统的概要]
首先,一边参照附图对具备有关实施方式1的信息处理装置的信息处理系统的概要进行说明。图1是表示实施方式1的信息处理系统300a的结构的一例的框图。
信息处理系统300a是将传感器取得的数据分类为多个类别的至少1个类别、将分类结果输出的系统。信息处理系统300a具备:阈值计算装置200a,计算用来将数据分类为多个类别的至少1个类别的第1分类阈值;以及信息处理装置100a,基于已训练的分类模型的输出和第1分类阈值,输出将数据分类为多个类别的至少1个类别的分类结果。
传感器例如是麦克风等的声音传感器、图像传感器、距离传感器、陀螺仪传感器或压力传感器等。也可以使用例如SfM(运动恢复结构,Structure from Motion)等的三维再构成技术取得使用多个传感器取得的数据。传感器取得的数据例如是声音、图像、运动图像、三维点群(three-Dimensional point cloud)数据或向量数据。
在信息处理系统300a中,也可以根据数据的种类及数据的用途等而设定将数据分类的多个类别。例如,在数据是声音的情况下,也可以设定特定的人物的声音、特定的机械的动作音或特定的动物的鸣叫声等的类别。此外,在数据是图像的情况下,例如在监视照相机系统等中,也可以设定特定的人物等的类别,在车载照相机系统等中,也可以设定步行者、汽车、摩托车、自行车及背景等的类别。此外,在数据是三维点群数据的情况下,例如也可以根据构造物或地形等的三维形状,设定构造物或地形的凹凸、龟裂或特定的构造等的类别。此外,在数据是向量数据的情况下,例如也可以设定桥桁或隔音壁等的构造物的多个部位的运动向量等的类别。
以下,对信息处理系统300a的各结构进行说明。
[阈值计算装置]
阈值计算装置200a是计算用来将数据分类为多个类别的至少1个类别的第1分类阈值的装置。
如图1所示,阈值计算装置200a具备存储部201、第1运算部202、分类概率运算部203、分类阈值决定部204、阈值变换部205和第1输出部206。
存储部201保存有第2分类阈值的评价用数据集。评价用数据集包括向第1运算部202输入的输入数据和与输入数据对应的正解数据的集合。正解数据是对于输入数据的多个类别各自的分类概率值。以下,将对于多个类别各自的分类概率值也称作多个单体类别的分类概率值。另外,单体类别是指构成多个类别的各类别。多个单体类别的分类概率值是通过在分类概率运算部203中将第1运算部202的输出进行第1变换而得到的被标准化的概率值。第2分类阈值基于多个单体类别的分类概率值而设定。
第1运算部202是提取数据的特征量的特征量提取器,例如是机械学习模型。例如,第1运算部202是已训练的分类模型。该分类模型是多层神经网络(DNN)。第1运算部202取得评价用数据集。例如,第1运算部202从存储部201将评价用数据集读出。评价用数据集的输入数据被向第1运算部202输入。第1运算部202输出该输入数据的与多个类别对应的多个标量。各标量是输入数据的与各类别对应的特征量。第1运算部202的输出是没有被标准化的值。
另外,第1运算部202并不限于DNN。例如,第1运算部202也可以是使用边缘提取法、主成分分析法、块匹配法、抽样莫尔法等的方法的DNN以外的其他的特征量提取器。
另外,第1运算部202也可以经由通信从其他装置取得评价用数据集。例如,也可以经由因特网从服务器或存储装置取得评价用数据集。
分类概率运算部203执行作为从第1运算部202的输出向多个单体类别的分类概率值的变换的第1变换。更具体地讲,分类概率运算部203在第1变换中,使用可逆的变换,根据第1运算部202的输出计算多个单体类别的分类概率值。例如,分类概率运算部203通过将输入数据的与多个类别对应的多个标量(特征量)使用可逆变换的概率函数进行标准化,导出输入数据的与多个类别对应的分类概率值。这样,通过用可逆的变换进行标准化,能够在基于评价用数据集决定适当的阈值(后述的第2分类阈值)后,将适当的阈值逆变换而导出没有被标准化的阈值。
分类概率运算部203例如由多个单体类别的概率运算部构成。与多个类别对应的多个标量分别被向与多个类别的各类别对应的单体类别的概率运算部输入。多个单体类别的概率运算部分别是可逆变换的函数。这些函数既可以分别不同,也可以相同。可逆变换的函数也可以是可微分的函数,例如是S形函数或双曲正切函数(Tanh:Tangent HyperbolicFunction)等。另外,第1变换既可以是由可逆变换的概率函数进行的运算,也可以是使用与由可逆变换的概率函数进行的运算对应的数据库的变换。数据库例如也可以是如查找表即Lookup表那样将输入与输出(变换后的值)建立了对应的表。
分类阈值决定部204基于由分类概率运算部203计算的多个单体类别的分类概率值,决定第2分类阈值。更具体地讲,分类阈值决定部204取得多个单体类别的分类概率值,基于分别对于所取得的多个单体类别的分类概率值使用第2分类阈值的分类结果来决定第2分类阈值。例如,分类阈值决定部204从存储部201将评价用数据集读出,基于评价用数据集的正解数据和由分类概率运算部203计算出的多个单体类别的分类概率值,决定第2分类阈值。即,在分类阈值决定部204中,基于评价用数据集决定最优的第2分类阈值。例如,分类阈值决定部204对于多个单体类别的分类概率值,分别根据对于评价用数据集的FP(假阳性,False Positive)/FN(假阴性,False Negative)的比例来决定第2分类阈值。
另外,第2分类阈值既可以设定预先决定的值,也可以根据用户设定的目标精度来决定。在第2分类阈值被根据目标精度决定的情况下,分类阈值决定部204也可以决定第2分类阈值,以使通过对多个单体类别的分类概率值应用第2分类阈值得到的结果满足目标阈值。另外,目标精度既可以按照各个类别设定,也可以全类别共通地设定。关于该方法的详细情况,在阈值计算装置的动作的项中后述。
另外,第2分类阈值既可以是在多个单体类别各自中不同的值,也可以是在多个单体类别的全部中相同的值。
阈值变换部205执行第2变换,所述第2变换是从第2分类阈值向用来将数据分类为多个类别的至少1个类别的第1分类阈值的变换,是相对于第1变换的逆变换。换言之,阈值变换部205通过将第2分类阈值逆变换,变换为没有被标准化的阈值(即,第1分类阈值)。阈值变换部205既可以是构成分类概率运算部203的函数(例如,可逆变换的概率函数)的逆函数,也可以是与基于可逆变换的概率函数的逆函数的运算对应的数据库。数据库例如也可以如Lookup表那样,是将输入与输出(逆变换后的值)建立了对应的表。
第1分类阈值在信息处理装置100a中被用于将数据分类为多个类别的至少1个类别。信息处理装置100a能够使用没有被标准化的阈值(第1分类阈值)执行数据的类别分类处理。因此,在信息处理装置100a中,由于能够基于从数据中提取出的特征量执行分类处理,所以不需要标准化的处理,能够减少运算量。
另外,第1分类阈值既可以在多个类别的各自中被设定为不同的值,也可以设定对多个类别的全部的类别共通的值。
第1输出部206输出第1分类阈值。更具体地讲,第1输出部206经由通信将第1分类阈值向信息处理装置100a的第1取得部103输出。通信既可以是例如Wi-Fi(注册商标)或蓝牙即Bluetooth(注册商标)等的无线通信,也可以是以太网即Ethernet(注册商标)等的有线通信。
另外,阈值计算装置200a也可以具备用来将机械学习模型训练的训练部(未图示)。训练部也可以具备保持训练用数据集的存储部(未图示)。训练用数据集包括预先被保存的输入数据和正解数据的集合。训练部也可以从被配置在经由因特网等的通信网络连接的服务器上的数据库取得新的训练用数据而将训练用数据集更新。此外,训练部也可以具备保持与第1运算部202相同的分类模型的保持部(未图示),保持部也可以还保持与分类概率运算部203相同的N个单类别的分类概率运算部。训练部使用训练用数据集,训练与第1运算部202相同的分类模型。进而,训练部也可以训练具有分类概率运算部203具备的N个单类别的分类概率运算部的网络。训练部也可以如果该分类模型及该网络的训练结束,则将已训练的分类模型向第1运算部202输出,将第1运算部202更新为已训练的分类模型。同样,训练部也可以将具有已训练的N个单类别的分类概率运算部的网络向分类概率运算部203输出,将分类概率运算部203更新为已训练的网络。
[信息处理装置]
接着,对信息处理装置100a进行说明。信息处理装置100a是将例如传感器取得的数据分类为多个类别的至少1个类别、将分类结果输出的装置。以下,对数据是图像的例子进行说明。另外,关于数据及取得数据的传感器,在信息处理系统300a的概要中进行了说明,所以省略这里的说明。
如图1所示,信息处理装置100a具备第1取得部103、第2取得部101、第2运算部102、阈值处理部104和第2输出部105。
第1取得部103经由通信,取得被从阈值计算装置200a的第1输出部206输出的第1分类阈值,将所取得的第1分类阈值向阈值处理部104输出。由于关于通信在前面进行了记述,所以省略这里的说明。另外,第1分类阈值也可以被预先存储在信息处理装置100a具备的存储部中。
第2取得部101从传感器经由通信取得数据。这里,传感器是图像传感器,数据是图像。第2取得部101将所取得的数据向第2运算部102输出。另外,通信既可以是无线通信,也可以是有线通信。另外,传感器并不限于1个,例如也可以使两个以上的传感器同步取得数据。此外,第2取得部101也可以经由可拆装的存储器取得数据。可拆装的存储器例如是USB(通用串行总线,Universal Serial Bus)存储器。
第2运算部102是提取数据的特征量的特征量提取器,例如是机械学习模型。例如,第2运算部102是已训练的分类模型。该分类模型是多层神经网络(DNN)。第1取得部103取得的数据被向第2运算部102输入。第2运算部102输出该数据的与多个类别对应的多个标量。各标量是与数据的各类别对应的特征量。第2运算部102的输出是没有被标准化的值。
另外,第2运算部102并不限于DNN。例如,第2运算部102也可以是使用特征点提取法(例如边缘提取)、主成分分析法、块匹配法、抽样莫尔法等的方法的DNN以外的其他的特征量提取器。
阈值处理部104取得从第1取得部103输出的第1分类阈值,基于第2运算部102的输出和第1分类阈值,将数据分类为多个类别的至少1个类别。更具体地讲,阈值处理部104通过判定对于从第2运算部102输出的多个类别各自的概率值是否是第1分类阈值以上,将数据分类为多个类别的至少1个类别。第1分类阈值既可以在多个类别各自中设定为不同的值,也可以设定为对于多个类别的全部共通的值。另外,关于阈值处理部104的更具体的动作在后面叙述。
第2输出部105输出数据的分类结果。第2输出部105也可以将数据的分类结果向提示部(未图示)输出,也可以向信息处理装置100a以外的其他的装置输出。例如,第2输出部105基于被输入到输入部(未图示)中的用户的操作,使提示部提示基于分类结果的信息。输入部例如是键盘、鼠标、触控面板、按钮或麦克风等。提示部例如是显示器或扬声器等。另外,信息处理装置100a既可以具备也可以不具备输入部及提示部。输入部及提示部例如也可以由信息处理装置100a以外的其他装置具备。信息处理装置100a以外的其他装置例如也可以是智能电话、平板电脑或计算机等的信息终端。此外,信息处理装置100a举计算机为例,但也可以被设置在经由因特网等的通信网络连接的服务器上。
另外,信息处理装置100a与阈值计算装置200a同样,也可以具备用来训练机械学习模型的训练部(未图示)。关于训练部的详细情况,在以阈值计算装置200a说明的训练部的说明中,也可以不包含分类概率运算部203的网络的训练,并且将第1运算部202改称作第2运算部102。
另外,信息处理系统300a也可以具备与阈值计算装置200a和信息处理装置100a共通的训练部(未图示),该训练部训练第1运算部202的分类模型、分类概率运算部203的网络、第2运算部102的分类模型。
[阈值计算装置的动作]
接着,一边参照图2一边对阈值计算装置200a的动作进行说明。图2是表示实施方式1的阈值计算装置200a的动作的一例的流程图。
第1运算部202从存储部201将评价用数据集的输入数据读出,输出该输入数据的与多个类别对应的多个标量(步骤S1001)。输入数据的与多个类别对应的多个标量,是输入数据的对于多个类别各自的特征量。例如,假设输入数据是图像,在该图像中拍摄有汽车及摩托车。假设多个类别例如是步行者、汽车、摩托车、自行车及背景。此时,第1运算部202例如输出具有输入数据的与多个类别对应的多个标量的向量(步行者,汽车,摩托车,自行车,背景)=(0.1,90,60,0.01,0.001)。
接着,分类概率运算部203执行作为从第1运算部202的输出向多个单体类别的分类概率值的变换的第1变换(步骤S1002)。如上述那样,分类概率运算部203具备多个单体类别的分类概率运算部。各单体类别的分类概率运算部是可逆变换的概率函数。各单体类别的分类概率运算部既可以是分别不同的函数,也可以是相同的函数。此外,各单体类别的分类概率运算部也可以分别是与由可逆变换的概率函数进行的运算对应的数据库。各单体类别的阈值运算部将对于多个类别的各类别的标量通过可逆的变换变换为0~1的范围的值(即,标准化)。例如,如果作为第1运算部202的输出的(步行者,汽车,摩托车,自行车,背景)=(0.1,90,60,0.01,0.001)的各标量被输入到与各类别对应的单体类别的分类概率运算部中,则在各单体类别的分类概率运算部中,各标量被变换为0~1的范围的值。分类概率运算部203输出作为多个单体类别的分类概率值的(步行者,汽车,摩托车,自行车,背景)=(0.3,1.0,1.0,0.1,0)。这里,所述的标准化,不是进行调整以使得将多个标量值相加而成为1,而是根据各标量值的大小将各标量值变换为0~1的范围的值。此时,变换系数也可以根据各类别的分类精度来调整。
接着,分类阈值决定部204基于在步骤S1002中被导出的多个单体类别的分类概率值设定第2分类阈值(步骤S1003)。更具体地讲,分类阈值决定部204取得多个单体类别的分类概率值,基于分别对所取得的多个单体类别的分类概率值使用第2分类阈值的分类结果,来决定第2分类阈值。例如,分类阈值决定部204从存储部201将评价用数据集读出,基于评价用数据集的正解数据和多个单体类别的分类概率值,决定第2分类阈值。例如,分类阈值决定部204也可以对于多个单体类别的分类概率值的各自,根据对于评价用数据集的FP(False Positive)/FN(False Negative)的比例来决定第2分类阈值。此外,例如也可以决定第2分类阈值,以使得通过对多个单体类别的输出(即,分类概率值)应用第2分类阈值而得到的结果满足目标精度。更具体地讲,也可以设置目标精度,计算将多个单体类别的分类概率值的阈值(第2分类阈值)变动的情况下的分类精度,选择计算出的分类精度最接近于目标精度的阈值,将该阈值决定为第2分类阈值。此外,例如也可以不是将计算出的分类精度最接近于目标精度的阈值、而是将计算出的分类精度最先超过目标精度的阈值决定为第2分类阈值。目标精度例如既可以按照各类别设定,也可以全类别共通地设定。另外,第2分类阈值既可以在多个单体类别各自中是不同的值,也可以在多个单体类别的全部的类别中是相同的值。
接着,阈值变换部205执行第2变换,所述第2变换是用来从由分类阈值决定部204设定的第2分类阈值向将数据分类为多个类别的至少1个类别的第1分类阈值的变换,是对于第1变换的逆变换(步骤S1004)。由此,能够从被标准化的阈值(这里是第2分类阈值)得到没有被标准化的阈值(这里是第1分类阈值)。第1分类阈值是用来将数据分类为多个类别的至少1个类别的阈值。第1分类阈值既可以按照各类别而设定为不同的值,也可以设定为对多个类别整体共通的值。例如,在阈值变换部205是构成分类概率运算部203的函数(例如,可逆变换的概率函数)的逆函数的情况下,阈值变换部205以在步骤S1003中被导出的第2分类阈值为输入,计算第2分类阈值被逆变换为的第1分类阈值。此外,在阈值变换部205是与由构成分类概率运算部203的函数的逆函数进行的运算对应的数据库(例如,如Lookup表那样将输入与输出建立了对应的表)的情况下,如果第2分类阈值被输入到阈值变换部205中,则输出与输入建立了对应的第1分类阈值。
接着,第1输出部206将在步骤S1004中被导出的第1分类阈值向信息处理装置100a输出(步骤S1005)。此时,第1输出部206也可以与信息处理装置100a可通信地连接。由于关于通信方式在前面进行了记述,所以省略这里的说明。
[信息处理装置的动作]
接着,一边参照图3一边对信息处理装置100a的动作进行说明。图3是表示有关实施方式1的信息处理装置100a的动作的一例的流程图。
第2取得部101从例如图像传感器等的传感器(未图示)取得数据(步骤S2001)。这里,对数据是图像的例子进行说明。图像既可以是运动图像,也可以是静止图像(也单称作图像)。第2取得部101既可以与传感器可通信地连接,也可以经由可拆装的存储器例如USB(Universal Serial Bus)存储器从传感器取得多个图像。由于关于通信方式在前面进行了记述,所以省略这里的说明。
第2运算部102输出在步骤S2001中取得的数据的与多个类别对应的多个标量(步骤S2002)。数据例如既可以是由车载照相机摄像的运动图像,也可以是图像。在是运动图像的情况下,对于构成运动图像的多个图像分别执行以下的动作。与阈值计算装置200a的第1运算部202的动作同样,第2运算部102根据所取得的数据,输出多个标量(特征量)。以下,对第2运算部102的输出是(步行者,汽车,摩托车,自行车,背景)=(70,90,0.5,60,0.001)的情况进行说明。
第1取得部103取得从阈值计算装置200a输出的第1分类阈值(步骤S2003)。此时,第1取得部103经由通信从阈值计算装置200a取得第1分类阈值。由于关于第1分类阈值及通信方式在前面进行了记述,所以省略这里的说明。这里,假设第1分类阈值是(步行者,汽车,摩托车,自行车,背景)=(60,60,60,60,60)。
阈值处理部104基于第2运算部102的输出和第1取得部103取得的第1分类阈值,将第2取得部101取得的数据分类为多个类别的至少1个类别(步骤S2004)。更具体地讲,在步骤S2004中,阈值处理部104通过判定数据的与多个类别对应的多个标量分别是否是第1分类阈值以上,将数据分类为多个类别的至少1个类别。
例如,在第2运算部102的输出是(步行者,汽车,摩托车,自行车,背景)=(70,90,0.5,60,0.001),各类别的第1分类阈值是(步行者,汽车,摩托车,自行车,背景)=(60,60,60,60,60)的情况下,对于3个类别的标量值是第1分类阈值以上。此时,阈值处理部104既可以将该图像分类为步行者、汽车、自行车的3个类别,也可以分类为1个类别。在后者的情况下,阈值处理部104也可以选择表示该图像的对于3个类别的概率值中的最大的标量值的类别,将该图像分类为1个类别。在此情况下,由于上述的对于3个类别的标量值中的对于汽车类别的概率值最大,所以阈值处理部104将该图像分类为汽车类别。另外,阈值处理部104也可以表示对于3个类别的标量值中的与第1分类阈值的差较大的标量值的类别,将该图像分类为1个类别。在此情况下,阈值处理部104也可以将该图像分类为汽车类别。如以上这样,关于数据的分类方法,也可以根据数据的种类及分类目的等而适当设定。
第2输出部105输出在步骤S2004中得到的分类结果(步骤S2005)。第2输出部105既可以将分类结果向提示部(未图示)输出,也可以向信息处理装置100a以外的其他装置输出。例如,第2输出部105基于被输入到输入部(未图示)中的用户的操作,使提示部提示基于分类结果的信息。由于关于输入部、提示部及其他装置等在前面进行了记述,所以省略这里的说明。
基于分类结果的信息也可以基于被输入到输入部中的设定而提示各种各样的形式的分类结果。例如,在数据是由车载照相机摄像的图像的情况下,基于分类结果的信息也可以是由信息处理装置100a检测到的物体类别的种类及检测次数、各个物体类别的识别精度、关于各物体类别的由天气或时间带带来的识别精度的变化、识别精度较低的图像的趋向、或用来避免危险的建议等。信息处理装置100a例如也可以向被配置在经由因特网连接的服务器上的数据库发送分析结果,取得基于分析结果的信息。
(变形例)
接着,对有关实施方式1的变形例的信息处理装置进行说明。以下,以与实施方式1的不同点为中心进行说明,将共通点的说明省略或简略化。
[信息处理装置的概要]
图4是表示有关实施方式1的变形例的信息处理装置100b的结构的一例的框图。信息处理装置100b具备阈值计算部20a、存储部201a和信息处理部10。
在实施方式1中,对信息处理装置100a从阈值计算装置200a取得第1分类阈值、使用所取得的第1分类阈值将数据分类为多个类别的至少1个类别的例子进行了说明。信息处理装置100b与有关实施方式1的信息处理装置100a之间的主要的不同点是具备阈值计算部20a这一点。另外,在图1及图4中,对于实质上相同的结构赋予相同的标号。
在实施方式1中,如图1所示,阈值计算装置200a将由阈值变换部205导出的第1分类阈值向第1输出部206输出,经由第1输出部206将第1分类阈值向信息处理装置100a输出。在本变形例中,如图4所示,阈值计算部20a将由阈值变换部205导出的第1分类阈值向存储部201a保存。并且,信息处理部10将保存在存储部201a中的第1分类阈值读出。
如图1及图4所示,图4的取得部101a与图1的第2取得部101对应,图4的输出部105a与图1的第2输出部105对应。即,取得部101a与第2取得部101同样,从图像传感器等的传感器取得数据。此外,输出部105a与第2输出部105同样,输出将取得部101a所取得的数据分类为多个类别的至少1个类别的分类结果。
[阈值计算部的动作]
图5是表示实施方式1的变形例的阈值计算部20a的动作的一例的流程图。由于图5的步骤S3001~步骤S3004分别与图2的步骤1001~步骤S1004对应,所以将这里的说明简略化。另外,有关变形例的阈值计算部20a的动作与有关实施方式1的阈值计算装置200a的动作相比,在将第1分类阈值保存到存储部201a中这一点上不同。
第1运算部202从存储部201将评价用数据集的输入数据读出,输出该输入数据的与多个类别对应的多个标量(步骤S3001)。
接着,分类概率运算部203执行作为从第1运算部202的输出向多个单体类别的分类概率值的变换的第1变换(步骤S3002)。
接着,分类阈值决定部204基于在步骤S3002中导出的多个单体类别的分类概率值,设定第2分类阈值(步骤S3003)。
接着,阈值变换部205对于由分类阈值决定部204设定的第2分类阈值执行第2变换,所述第2变换是从第2分类阈值向用来将数据分类为多个类别的至少1个类别的第1分类阈值的变换,是对于第1变换的逆变换(步骤S3004)。
接着,阈值变换部205将第1分类阈值向存储部201a保存(步骤S3005)。
[信息处理部的动作]
图6是表示实施方式1的变形例的信息处理部10的动作的一例的流程图。由于图6的步骤S4001和步骤S4002与图3的步骤S2001和步骤S2002对应,所以将这里的说明简略化。
取得部101a从例如图像传感器等的传感器取得数据(步骤S4001)。接着,第2运算部102输出在步骤S4001中取得的数据的与多个类别对应的多个标量(概率值)(步骤S4002)。
接着,对于数据的多个类别各自开始每个类别的组处理。
阈值处理部104将保存在存储部201a中的第1分类阈值读出(步骤S4003)。这里,说明阈值处理部104将多个类别各自的第1分类阈值按照各类别的分类处理而各自读出的例子,但阈值处理部104也可以将多个类别的全部的第1分类阈值暂时读出。另外,第1分类阈值既可以对于多个类别的各自是不同的值,也可以是相同的值。
阈值处理部104基于第2运算部102的输出和从存储部201a读出的第1分类阈值,将第2取得部101取得的数据分类为多个类别的至少1个类别。首先,从存储部201a读出多个类别中的1个类别(例如,步行者的类别)的第1分类阈值(步骤S4003),判定该类别的标量值是否是从存储部201a读出的第1分类阈值以上(步骤S4004)。在该类别的标量值是第1分类阈值以上的情况下(步骤S4004中Yes),阈值处理部104将该类别的标量值与表示该类别的号码建立关联而向存储部201a保存(步骤S4005)。
另一方面,在该类别的标量值比第1分类阈值小的情况下(步骤S4004中No),阈值处理部104从存储部201a读出多个类别中的其他的1个类别(例如,汽车的类别)的第1分类阈值(步骤S4003)。阈值处理部104判定该类别的标量值是否是从存储部201a读出的第1分类阈值以上(步骤S4004)。在该类别的标量值是第1分类阈值以上的情况下(步骤S4004中Yes),阈值处理部104将该类别的标量值与表示该类别的号码建立关联而向存储部201a保存(步骤S4005)。
另一方面,在该类别的标量值比第1分类阈值小的情况下(步骤S4004中No),阈值处理部104从存储部201a读出多个类别中的其他的1个类别(例如,摩托车的类别)(步骤S4003),执行步骤S4004的判定处理。这样,通过反复进行同样的处理,对于数据的与多个类别对应的多个标量,执行按照各类别的分类处理。如果按照类别的组处理结束,则阈值处理部104判定保存在存储部201a中的类别的数量是否是1以上(步骤S4006)。在保存在存储部201a中的类别的数量是1以上的情况下(步骤S4006中Yes),阈值处理部104向输出部105a输出标量值为最大的类别号码(步骤S4007)。由此,输出部105a输出基于该类别号码将数据分类为多个类别的至少1个类别的分类结果(例如,数据是汽车)(未图示)。
另一方面,在保存在存储部201a中的类别的数量是零的情况下(步骤S4006中No),阈值处理部104向输出部105a输出表示其他的号码(步骤S4008)。所述的其他,表示没有符合的类别。此时,从输出部105a输出的分类结果例如也可以数据是其他的类别,或者数据是背景类别。
(实施方式2)
接着,对实施方式2的信息处理系统进行说明。以下,以与实施方式1的不同点为中心进行说明,将共通点的说明省略或简略化。
[信息处理系统的概要]
图7是表示实施方式2的信息处理系统300b的结构的一例的框图。信息处理系统300b具备阈值计算装置200b和信息处理装置100a。有关实施方式2的阈值计算装置200b与有关实施方式1的阈值计算装置200a之间的主要的不同点,是从用户设定的第2分类阈值导出第1分类阈值这一点。
[阈值计算装置的结构]
接着,对阈值计算装置200b的结构进行说明。
如图7所示,阈值计算装置200b具备输入部207、阈值变换部205和第1输出部206。这里,对阈值计算装置200b具备输入部207的例子进行说明,但并不限于此。例如,输入部也可以装备在阈值计算装置200b以外的其他的装置中。其他的装置例如是平板电脑终端、智能电话或计算机等。
输入部207将来自用户的操作信号向阈值变换部205输入。输入部207例如是触控面板、键盘、鼠标、按钮或扬声器等。操作信号例如是表示多个类别各自的第2分类阈值的信号。用户经由输入部207将第2分类阈值向阈值变换部205输入。另外,第2分类阈值也可以是预先设定的值。
阈值变换部205对于所取得的第2分类阈值,执行作为对于第1变换的逆变换的第2变换,导出第1分类阈值。第1输出部206将第1分类阈值向信息处理装置100a输出。
另外,关于信息处理装置100a,与有关实施方式1的信息处理装置100a是同样的,所以省略这里的说明。
[阈值计算装置的动作]
接着,对阈值计算装置200b的动作进行说明。图8是表示实施方式2的阈值计算装置200b的动作的一例的流程图。
虽然没有图示,但用户经由输入部207向阈值变换部205输入多个类别各自的第2分类阈值。
如图8所示,阈值变换部205取得经由输入部207被输入的多个类别的第2分类阈值(步骤S5001)。接着,阈值变换部205对于所取得的第2分类阈值执行第2变换,所述的第2变换,是从第2分类阈值向用来将数据分类为多个类别的至少1个类别的第1分类阈值的变换,是对于第1变换的逆变换(步骤S5002)。
第1输出部206将第1分类阈值向信息处理装置100a输出(步骤S5003)。
另外,关于信息处理装置100a的动作,由于与在实施方式1中说明的例子是同样的,所以省略这里的说明。
(变形例)
接着,对有关实施方式2的变形例的信息处理装置进行说明。以下,以与实施方式2的不同点为中心进行说明,将共通点的说明省略或简略化。
[信息处理装置的概要]
图9是表示有关实施方式2的变形例的信息处理装置100c的结构的一例的框图。信息处理装置100b具备阈值计算部20b、存储部201b和信息处理部10。
在实施方式2中,对于信息处理装置100a从阈值计算装置200b取得第1分类阈值、使用所取得的第1分类阈值将数据分类为多个类别的至少1个类别的例子进行了说明。有关本变形例的信息处理装置100c与有关实施方式2的信息处理装置100a之间的主要的不同点,是信息处理装置100c具备阈值计算部20b这一点。此外,有关本变形例的阈值计算部20b与有关实施方式2的阈值计算装置200b之间的主要的不同点,是阈值计算部20b具备分类阈值决定部204这一点。另外,在图7及图9中,对于实质上相同的结构赋予相同的标号。
在实施方式2中,如图7所示,阈值计算装置200b将用户经由输入部207输入到阈值变换部205中的第2分类阈值用阈值变换部205逆变换,导出第1分类阈值。并且,阈值计算装置200b将所导出的第1分类阈值从第1输出部206向信息处理装置100输出。在本变形例中,如图9所示,阈值计算部20b将由阈值变换部205导出的第1分类阈值向存储部201b保存。并且,信息处理部10将保存在存储部201b中的第1分类阈值读出,而将数据分类为多个类别的至少1个类别。
如图7及图9所示,图9的取得部101a与图7的第2取得部101对应,图9的输出部105a与图7的第2输出部105对应。即,取得部101a与第2取得部101同样,从图像传感器等的传感器取得数据。此外,输出部105a与第2输出部105同样,输出将取得部101a取得的数据分类为多个类别的至少1个类别的分类结果。
此外,如图1及图9所示,图9的分类阈值决定部204与图1的分类阈值决定部204对应。分类阈值决定部204例如参照保存在存储部201或存储部201b中的评价用数据集,决定适当的第2分类阈值。
在有关实施方式2的阈值计算装置200b中,从用户输入的第2分类阈值导出第1分类阈值,但在有关本变形例的阈值计算部20b中,基于用户输入的第2分类阈值和保存在存储部201b中的评价用数据,决定第2分类阈值。关于决定处理的详细情况,在动作的项中进行说明。
另外,关于信息处理部10,与有关实施方式1的变形例的信息处理部10是同样的,所以省略这里的说明。
[阈值计算部的动作]
图10是表示实施方式2的变形例的阈值计算部20b的动作的一例的流程图。
虽然没有图示,但用户经由输入部207向分类阈值决定部204输入多个类别各自的第2分类阈值。由此,如图10所示,分类阈值决定部204取得被输入的第2分类阈值(步骤S6001)。
接着,分类阈值决定部204从存储部201b将评价用数据读出(步骤S6002)。分类阈值决定部204基于评价用数据集,判定在步骤S6001中取得的第2分类阈值是否适当,更具体地讲,判定通过对评价用数据集的多个单体类别的分类概率值应用第2分类阈值得到的结果是否满足目标精度(步骤S6003)。在判定为第2分类阈值适当的情况下(步骤S6003中Yes),分类阈值决定部204将该第2分类阈值向阈值变换部205输出。阈值变换部205对所取得的第2分类阈值执行第2变换,所述的第2变换,是从第2分类阈值向用来将数据分类为多个类别的至少1个类别的第1分类阈值的变换,是对于第1变换的逆变换(步骤S6004)。阈值变换部205将所导出的第1分类阈值向存储部201b保存(步骤S6005)。
另一方面,在判定为第2分类阈值不适当的情况下(步骤S6003中No),分类阈值决定部204使提示部(未图示)提示第2分类阈值不适当的消息(步骤S6006)。此时,分类阈值决定部204也可以向提示部提示通过对评价用数据集的多个单体类别的分类概率值应用第2分类阈值而得到的结果满足目标精度的第2分类阈值。
另外,关于信息处理部10的动作,与实施方式1的变形例的信息处理部10是同样的,所以省略这里的说明。
(其他实施方式)
以上,基于实施方式对有关1个或多个技术方案的信息处理装置及信息处理方法进行了说明,但本发明并不限定于这些实施方式。只要不脱离本发明的主旨,对实施方式施以本领域技术人员想到的各种变形后的形态、或将不同的实施方式的构成要素组合而构建的形态也包含在本发明的范围中。
例如,在上述的实施方式中说明的处理既可以通过使用单一的装置(系统)集中处理来实现,或者也可以通过使用多个装置分散处理来实现。此外,执行上述程序的处理器既可以是单个,也可以是多个。即,既可以进行集中处理,或者也可以进行分散处理。
此外,上述的各实施方式可以在权利要求书或其等价的范围内进行各种变更、替换、附加及省略等。
产业上的可利用性
本发明作为能够降低用于物体的类别分类的运算量的信息处理装置、信息处理方法及程序等是有用的。
标号说明
10 信息处理部
20a、20b 阈值计算部
100a、100b、100c 信息处理装置
101 第2取得部
101a 取得部
102 第2运算部
103 第1取得部
104 阈值处理部
105 第2输出部
105a 输出部
200a、200b 阈值计算装置
201、201a、201b 存储部
202 第1运算部
203 分类概率运算部
204 分类阈值决定部
205 阈值变换部
206 第1输出部
207 输入部
300a、300b 信息处理系统

Claims (7)

1.一种信息处理装置,具备处理器,
上述处理器进行如下处理:
取得用来将数据分类为多个类别的至少1个类别的第1分类阈值;
输出基于已训练的分类模型的输出和上述第1分类阈值将上述数据分类为上述多个类别的至少1个类别的分类结果;
上述第1分类阈值通过第2分类阈值的第2变换而得到,该第2变换是对于第1变换的逆变换;
上述第1变换是从上述已训练的分类模型的输出向构成上述多个类别的多个单体类别的分类概率值的变换;
上述第2分类阈值基于上述多个单体类别的分类概率值而设定。
2.如权利要求1所述的信息处理装置,
上述已训练的分类模型的输出是与上述多个类别对应的多个标量。
3.一种信息处理方法,由计算机执行,
执行从已训练的分类模型的输出向多个单体类别的分类概率值的第1变换;
基于上述多个单体类别的上述分类概率值,设定第2分类阈值;
执行第2变换,上述第2变换是从上述第2分类阈值向用来将数据分类为多个类别的至少1个类别的第1分类阈值的变换,是对于第1变换的逆变换;
输出上述第1分类阈值。
4.如权利要求3所述的信息处理方法,
上述第1变换是基于能够逆变换的概率函数的运算;
上述第2变换是基于上述概率函数的逆函数的运算。
5.如权利要求3所述的信息处理方法,
上述第1变换是使用与基于能够逆变换的概率函数的运算对应的数据库的变换;
上述第2变换是使用与基于上述概率函数的逆函数的运算对应的数据库的变换。
6.如权利要求3所述的信息处理方法,
取得数据集;
将上述数据集向上述已训练的分类模型输入,对于上述数据集中包含的各个数据取得上述多个单体类别的分类概率值;
基于分别对所取得的上述多个单体类别的分类概率值使用上述第2分类阈值的分类结果,决定上述第2分类阈值。
7.一种程序,
用来使计算机执行以下的信息处理方法:
取得用来将数据分类为多个类别的至少1个类别的第1分类阈值;
输出基于已训练的分类模型的输出和上述第1分类阈值将上述数据分类为上述多个类别的至少1个类别的分类结果;
上述第1分类阈值通过第2分类阈值的第2变换而得到,该第2变换是对于第1变换的逆变换;
上述第1变换是从上述已训练的分类模型的输出向多个单体类别的分类概率值的变换;
上述第2分类阈值基于上述多个单体类别的分类概率值而设定。
CN201980049686.4A 2019-01-02 2019-12-10 信息处理装置、信息处理方法及程序 Pending CN112513891A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962787576P 2019-01-02 2019-01-02
US62/787,576 2019-01-02
JP2019107878 2019-06-10
JP2019-107878 2019-06-10
PCT/JP2019/048321 WO2020141587A1 (ja) 2019-01-02 2019-12-10 情報処理装置、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
CN112513891A true CN112513891A (zh) 2021-03-16

Family

ID=71406879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980049686.4A Pending CN112513891A (zh) 2019-01-02 2019-12-10 信息处理装置、信息处理方法及程序

Country Status (5)

Country Link
US (1) US20210166139A1 (zh)
EP (1) EP3907670A4 (zh)
JP (1) JP7483631B2 (zh)
CN (1) CN112513891A (zh)
WO (1) WO2020141587A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7156195B2 (ja) * 2019-07-17 2022-10-19 トヨタ自動車株式会社 物体認識装置
EP3882823A1 (en) * 2020-03-17 2021-09-22 Samsung Electronics Co., Ltd. Method and apparatus with softmax approximation
WO2021240707A1 (ja) * 2020-05-28 2021-12-02 日本電気株式会社 データ分類システム、データ分類方法および記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004212598A (ja) * 2002-12-27 2004-07-29 Sharp Corp 変換装置、補正回路、駆動装置、表示装置、検査装置および表示方法
US8687893B2 (en) * 2011-03-31 2014-04-01 Microsoft Corporation Classification algorithm optimization
CA2875710C (en) * 2012-06-22 2021-06-29 John Wayne Cancer Institute Molecular malignancy in melanocytic lesions
JP5994515B2 (ja) * 2012-09-20 2016-09-21 富士通株式会社 最適値計算装置、最適値計算システム、最適値計算方法及びプログラム
CN107045506A (zh) * 2016-02-05 2017-08-15 阿里巴巴集团控股有限公司 评估指标获取方法及装置
WO2017149722A1 (ja) 2016-03-03 2017-09-08 三菱電機株式会社 演算装置および演算方法
JP6924571B2 (ja) * 2016-11-11 2021-08-25 ヤフー株式会社 情報処理装置、情報処理方法、および情報処理プログラム
US11086918B2 (en) 2016-12-07 2021-08-10 Mitsubishi Electric Research Laboratories, Inc. Method and system for multi-label classification

Also Published As

Publication number Publication date
JP7483631B2 (ja) 2024-05-15
WO2020141587A1 (ja) 2020-07-09
JPWO2020141587A1 (ja) 2021-11-11
US20210166139A1 (en) 2021-06-03
EP3907670A4 (en) 2022-03-02
EP3907670A1 (en) 2021-11-10

Similar Documents

Publication Publication Date Title
EP3520045B1 (en) Image-based vehicle loss assessment method, apparatus, and system, and electronic device
CN112513891A (zh) 信息处理装置、信息处理方法及程序
US20210081698A1 (en) Systems and methods for physical object analysis
JP5214760B2 (ja) 学習装置、方法及びプログラム
US10706502B2 (en) Monitoring system
CN111126396A (zh) 图像识别方法、装置、计算机设备以及存储介质
US11410327B2 (en) Location determination apparatus, location determination method and computer program
KR102286571B1 (ko) 영상에서 다수의 객체를 인식하는 방법
CN107066980B (zh) 一种图像变形检测方法及装置
US9058748B2 (en) Classifying training method and apparatus using training samples selected at random and categories
CN111242119A (zh) 车辆图像的处理方法、装置、电子设备和计算机可读介质
CN114708578A (zh) 唇部动作检测方法、装置、可读存储介质和电子设备
CN110717407A (zh) 基于唇语密码的人脸识别方法、装置及存储介质
CN110235177B (zh) 图像处理装置、图像识别装置、以及存储介质
US20180285643A1 (en) Object recognition device and object recognition method
CN117033956A (zh) 基于数据驱动的数据处理方法、系统、电子设备及介质
KR102058393B1 (ko) 스케치 기반의 영상표절 검사 방법 및 장치
CN110249366B (zh) 图像特征量输出装置、图像识别装置、以及存储介质
US20230306273A1 (en) Information processing device, information processing method, and recording medium
CN114140025A (zh) 面向多模态数据的车险欺诈行为预测系统、方法和装置
CN112906676A (zh) 人脸图像来源的识别方法、装置、存储介质及电子设备
KR20210127448A (ko) 딥러닝을 이용하여 유사한 이미지를 필터링할 수 있는 상품 분류 시스템 및 방법
CN113646800A (zh) 物体状况判断系统、物体状况判断方法以及程序
KR102079123B1 (ko) 화물 차량 번호 인식 방법
EP4246460A2 (en) Vehicle identification system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination