JP2014063494A - Classification device, classification method, and electronic facility - Google Patents

Classification device, classification method, and electronic facility Download PDF

Info

Publication number
JP2014063494A
JP2014063494A JP2013193252A JP2013193252A JP2014063494A JP 2014063494 A JP2014063494 A JP 2014063494A JP 2013193252 A JP2013193252 A JP 2013193252A JP 2013193252 A JP2013193252 A JP 2013193252A JP 2014063494 A JP2014063494 A JP 2014063494A
Authority
JP
Japan
Prior art keywords
sample
type value
training sample
training
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013193252A
Other languages
Japanese (ja)
Other versions
JP6179305B2 (en
Inventor
Bi Yi
斐 李
Rujie Liu
リィウ・ルゥジエ
Masahiko Sugimura
昌彦 杉村
Takayuki Baba
孝之 馬場
Yusuke Uehara
祐介 上原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2014063494A publication Critical patent/JP2014063494A/en
Application granted granted Critical
Publication of JP6179305B2 publication Critical patent/JP6179305B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a classification device capable of solving the problem that a kind value of a measurement sample obtained by the conventional learning method by means of an image is not accurate, a classification method, and an electronic facility.SOLUTION: The classification device of this invention includes a classification unit for classifying a target sample, a determination unit for respectively determining training samples correlating to each aggregation of the target sample, a deletion unit for deleting a kind value of the training sample whose kind value is not accurate, and a calculation unit for acquiring, with regarding the target sample as a measurement sample, the kind value of the measurement sample according to similarity between each measurement sample and each training sample, and similarity between two measurement samples. The classification method executes each step for achieving a function of the classification device. The electronic facility includes the classification device. A technology of this invention is applied to an information processing area.

Description

本発明は、情報処理技術に関し、特に分類装置、分類方法及び電子設備に関する。   The present invention relates to information processing technology, and more particularly to a classification device, a classification method, and electronic equipment.

情報の間の関係を有効に示すことができる一種の説明方法として、図による説明方法は、現在様々な分野に幅広く使用されている。例えば、ウェブページ分類、イメージ検索、ビデオ概念検索などに幅広く使用されている。前記ウェブページ分類、図面検索、イメージ検索、ビデオ概念検索などは、広義的には一種の分類方法だと見なすことができる。本発明において説明する図は、データの間の関係を示す重み付きグラフであり、一般的に使用している図面ではない。   As a kind of explanation method that can effectively show the relationship between information, the explanation method according to the drawings is widely used in various fields at present. For example, it is widely used for web page classification, image search, video concept search and the like. The web page classification, drawing search, image search, video concept search, and the like can be regarded as a kind of classification method in a broad sense. The diagram described in the present invention is a weighted graph showing the relationship between data, and is not a drawing generally used.

従来のイメージによる学習方法は、通常理想的な条件下において、訓練標本の間の類似性を利用し、且つ理想的な解析表現方式又はイテレーション方式により、問題を解決すると共に、各訓練標本が所属する種類を有効に反映することができる種類バリューを算出する。勉強結果を測定標本まで普及させるため、柔軟な限定により制限条件に基づいて、理想化するコスト函数を形成しなければならない。   The conventional learning method using images usually uses the similarity between training samples under ideal conditions, solves the problem by an ideal analytical expression method or iteration method, and each training sample belongs. The type value that can effectively reflect the type to be calculated is calculated. In order to spread the study results to the measurement specimens, an ideal cost function must be formed based on the limiting conditions by flexible limitation.

しかし、従来のイメージによる学習方法において、勉強結果を測定標本まで普及させる過程において、訓練標本の種類バリューがほとんど変わらないので、種類バリューが正しくない訓練標本が測定標本の種類バリューの計算に影響を与えることができる。即ち、これにより、計算して得た測定標本の種類バリューが不正確になることができる。また、勉強結果を測定標本まで普及させるための従来のイメージによる学習方法は、各測定標本を順位に処理するが、測定標本の間の関係を全然考慮しないので、これにより計算して得た測定標本の種類バリューが不正確になることができる。   However, in the learning method based on the conventional image, the type value of the training sample hardly changes in the process of disseminating the study results to the measurement sample, so that the training sample with the incorrect type value affects the calculation of the type value of the measurement sample. Can be given. That is, this can make the type value of the measurement sample obtained by calculation inaccurate. In addition, the conventional learning method based on the image to spread the study results to the measurement samples processes each measurement sample in order, but does not consider the relationship between the measurement samples at all. Specimen type value can be inaccurate.

以下、本発明の概要を簡単に説明して、技術者が本発明の概要を理解するようにする。後述する本発明の概要により、本発明のすべての内容を示すことができない。本発明の概要は、本発明の重点又は重要な部分を提出する意図であるか、又は本発明の技術的範囲を限定する意図はない。本発明の概要の目的は、総括した内容を提出し、後述する詳細な説明の前書きを作成することにある。   Hereinafter, the outline of the present invention will be briefly described so that engineers can understand the outline of the present invention. The outline of the present invention to be described later cannot show all the contents of the present invention. This summary is not intended to present an emphasis or critical part of the invention or to limit the scope of the invention. The purpose of the summary of the present invention is to submit a summary and to prepare a foreword for detailed description to be described later.

本発明の目的は、従来のイメージによる学習方法により得た測定標本の種類バリューが不正確である問題を解決することができる分類装置、分類方法及び電子設備を提供することにある。   An object of the present invention is to provide a classification device, a classification method, and electronic equipment that can solve the problem that the type value of a measurement sample obtained by a conventional image learning method is inaccurate.

本発明の実施例において、一種の分類装置を提供する。前記分類装置は、目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するように配置されている分類ユニットと、目標標本の各集合に相関する訓練標本をそれぞれ確定するように配置され、且つ前記訓練標本中の各訓練標本は、種類バリューを有している確定ユニットと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するように配置されている削除ユニットと、前記目標標本を測定標本とし、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するように配置されている計算ユニットと、を含む。   In an embodiment of the present invention, a kind of classification device is provided. The classifier classifies target samples and arranges a classification unit arranged to form at least one set of the target samples and a training sample correlated with each set of target samples, respectively. And each training sample in the training sample has a maximum unit value and a minimum value among the training sample type values correlated with the set by a definite unit having a type value and each set of the target samples. If the difference between the type value is obtained and the difference is greater than a first predetermined threshold, a deletion unit arranged to delete the type value of the training sample correlated with the set, and the target sample A measurement sample, based on the similarity between each measurement sample and each remaining training sample and the similarity between the two measurement samples, and using the type value of the remaining training sample To, by a method for optimizing seek solutions, including a calculation unit arranged to acquire the type value of the measurement specimen.

本発明の他の実施例において、一種の分類方法を提供する。前記分類方法は、目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するステップと、前記目標標本の各集合に相関する各訓練標本を確定し、且つ前記訓練標本中の各訓練標本は、いずれも種類バリューを有しているステップと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するステップと、前記目標標本を測定標本とし、各測定標本と残った訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するステップと、を含む。   In another embodiment of the present invention, a kind of classification method is provided. The classification method includes classifying target samples to form at least one set of target samples, determining each training sample correlated with each set of target samples, and each training in the training samples. Each sample has a type value, and each set of the target samples obtains the difference between the maximum type value and the minimum type value among the type values of the training sample correlated with the set. And when the difference is greater than a first predetermined threshold, the step of deleting the type value of the training sample correlated with the set, the target sample as a measurement sample, and between each measurement sample and the remaining training sample Based on the similarity and the similarity between the two measurement samples, and using the remaining training sample type value, the solution sample type value is calculated and optimized. Including the steps to win.

本発明の他の実施例において、一種の電子設備をさらに提供する。前記電子設備は、前述した分類装置を含む。   In another embodiment of the present invention, a kind of electronic equipment is further provided. The electronic equipment includes the classification device described above.

前述した本発明の分類装置、分類方法及び電子設備により、以下のような発明の効果を奏することができる。即ち、種類バリューが正しくない訓練標本を選択するとともに、このような訓練標本の種類バリューを削除することにより、訓練標本がデータの実際の分布状況をより正確に示し、且つ測定標本の種類バリューを計算する過程に使用する訓練標本の種類バリューの正確性を確保することができる。また、計算する過程において測定標本の間の類似性関係を追加することにより、獲得した測定標本の種類バリューの正確度を向上させることができる。   The following effects of the invention can be achieved by the above-described classification device, classification method, and electronic equipment of the present invention. That is, by selecting a training sample with an incorrect type value and deleting the type value of such a training sample, the training sample shows the actual distribution status of the data more accurately, and the type value of the measurement sample is displayed. The accuracy of the kind value of the training sample used in the calculation process can be ensured. In addition, the accuracy of the type value of the acquired measurement sample can be improved by adding the similarity relationship between the measurement samples in the calculation process.

以下、図面を参照しながら本発明の最良の実施例を詳細に説明する。これにより、本発明の実施例の発明の効果をより詳細に理解することができる。   DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the best embodiment of the present invention will be described in detail with reference to the drawings. Thereby, the effect of the invention of the embodiment of the present invention can be understood in more detail.

本発明の後述する図面に記載されている内容により、本発明の内容をより詳細に理解することができる。本発明の図面において、同様或いは類似する図面符号により、同様或いは類似する部品を示す。述する図面と図面の簡単な説明は、本明細書に含まれ、且つ本明細書の一部分になって、本発明の最良な実施例をより詳細に説明し、本発明の原理及び発明の効果をより詳細に釈明する。
本発明の一実施例に係る分類装置を示すフレーム図である。 従来の分類技術により測定標本を処理する基本的な原理を示す簡略図である。 従来の分類技術により測定標本を処理する基本的な原理を示す簡略図である。 従来の分類技術により測定標本を処理する基本的な原理を示す簡略図である。 本発明の実施例に係る分類装置により測定標本を処理する基本的な原理を示す簡略図である。 図1に記載されている計算ユニットの構造を示す簡略図である。 本発明の他の実施例に係る分類装置を示すフレーム図である。 本発明の他の実施例に係る分類方法を示すフレーム図である。 本発明の他の実施例に係る分類装置及び分類方法の機能を実現するための情報処理設備のハードウェアの構造配置図である。 ここで説明したいことは、本発明の図面中の部品は、部品を簡単/明確に示すために描いたものであるが、部品のサイズの比率により描いたものではない。例えば、本発明の実施例をより詳細に説明するため、図面のある部品のサイズを他の部品のサイズより大きく示す可能性がある。
The contents of the present invention can be understood in more detail from the contents described in the drawings of the present invention. In the drawings of the present invention, similar or similar parts are indicated by similar or similar reference numerals. The drawings described and the brief description thereof are included in and constitute a part of this specification to more fully describe the best embodiments of the invention, and to illustrate the principles and advantages of the invention. Will be explained in more detail.
It is a frame diagram which shows the classification device based on one Example of this invention. It is a simplified diagram showing the basic principle of processing a measurement specimen by a conventional classification technique. It is a simplified diagram showing the basic principle of processing a measurement specimen by a conventional classification technique. It is a simplified diagram showing the basic principle of processing a measurement specimen by a conventional classification technique. It is a simplified diagram showing the basic principle of processing a measurement sample by the classification device according to an embodiment of the present invention. FIG. 2 is a simplified diagram illustrating a structure of a calculation unit described in FIG. 1. It is a frame diagram which shows the classification device based on the other Example of this invention. It is a frame diagram which shows the classification method based on the other Example of this invention. It is a hardware layout drawing of information processing equipment for realizing the function of the classification device and the classification method concerning other examples of the present invention. What is desired to be described here is that the parts in the drawings of the present invention are drawn to show the parts simply / clearly, but are not drawn based on the ratio of the sizes of the parts. For example, in order to describe embodiments of the present invention in more detail, the size of a part in the drawing may be shown larger than the size of other parts.

以下、添付した図面を参照しながら本発明の事例的な実施例を説明する。本発明の技術を詳細/理解しやすく説明するため、本明細書において本発明の実際実施例のすべての特徴を説明しないが、いずれか1つの実施例を実施する時、この実施例の実施に必ず需要するすべての特徴を示さなければならない。これにより、当業者が本発明の具体的な目的を実現することができる。例えば、システム又は方法に適用する制限条件と、異なる実施例により前記制限条件が変わることを示さなければならない。周知の通り、本発明の分類装置又は分類方法を創造することは、非常に複雑で、時間が掛かるが、本技術領域の技術者が後述する本発明の実施例により本発明の分類装置又は分類方法を容易に想到することができる。   Hereinafter, exemplary embodiments of the present invention will be described with reference to the accompanying drawings. In order to explain the technology of the present invention in detail / understandability, not all features of the actual embodiment of the present invention are described in this specification, but when implementing any one embodiment, You must show all the features you need. Thereby, a person skilled in the art can realize the specific object of the present invention. For example, it must be shown that the limiting conditions apply to the system or method and that the limiting conditions vary with different embodiments. As is well known, creating the classification device or classification method of the present invention is very complex and time consuming, but the technicians in this technical field can implement the classification device or classification of the present invention according to the embodiments of the present invention described later. The method can be easily conceived.

また、重要でない細部により本発明の明細書が長くなることを防ぐため、本発明の図面において、本発明の技術的方案に緊密に関連する装置の構造と/処理のステップだけを示した。即ち、本発明の技術的方案との関連性が大きくない細部の記載は省略する。   Also, to avoid lengthening the specification of the invention due to insignificant details, only the device structure and / or processing steps closely related to the technical solution of the invention are shown in the drawings of the invention. That is, description of details that are not highly relevant to the technical solution of the present invention is omitted.

本発明の実施例において、一種の分類装置を提供する。前記分類装置は、目標標本を分類して、目標標本の少なくとも一種の集合を形成するように配置されている分類ユニットと、目標標本の各集合に相関する訓練標本をそれぞれ確定するように配置され、且つ前記訓練標本中の各訓練標本は、種類バリューを有している確定ユニットと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するように配置されている削除ユニットと、前記目標標本を測定標本とし、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するように配置されている計算ユニットと、を含む。   In an embodiment of the present invention, a kind of classification device is provided. The classifier is arranged to classify target samples and determine a training unit correlated to each set of target samples and a classification unit arranged to form at least one set of target samples. And each training sample in the training sample has a maximum unit value and a minimum type in the training sample type value correlated with the set by a definite unit having a type value and each set of the target samples. A deletion unit arranged to delete a training sample type value correlating to the set if the difference between the value is obtained and the difference is greater than a first predetermined threshold, and measuring the target sample A sample, based on the similarity between each measurement sample and each remaining training sample and the similarity between the two measurement samples, and using the type value of the remaining training sample , By a method for optimizing seek solutions, including a calculation unit arranged to acquire the type value of the measurement specimen.

以下、図1を参照しながら本発明の一種の実施例に係る分類装置を詳細に説明する。   Hereinafter, a classification apparatus according to an embodiment of the present invention will be described in detail with reference to FIG.

図1に示す通り、本発明の実施例に係る分類装置100は、分類ユニット110と、確定ユニット120と、削除ユニット130と、計算ユニット140とを含む。   As shown in FIG. 1, the classification device 100 according to the embodiment of the present invention includes a classification unit 110, a determination unit 120, a deletion unit 130, and a calculation unit 140.

分類装置100において、分類ユニット110は、各目標標本を分類して、目標標本の少なくとも一種の集合を形成する。本実施例の目標標本は、イメージ、動画、本文、又はウェブページであることができる。   In the classification device 100, the classification unit 110 classifies each target sample to form at least one set of target samples. The target sample of the present embodiment can be an image, a moving image, a text, or a web page.

本発明の具体的な実施例に係る分類装置において、分類ユニット110は、目標標本を分類して、一種の集合中の各目標標本と、この集合中の他の少なくとも1つの目標標本との間の類似性が第四所定閾値より大きくなるようにする。   In the classification device according to a specific embodiment of the present invention, the classification unit 110 classifies the target samples, and between each target sample in a kind of set and at least one other target sample in the set. Is made larger than the fourth predetermined threshold.

例えば、分級的な分類方法により、前述した分類方法を実現ことができる。具体的なステップは、以下の通りである。(a1)最初の時、複数の集合を形成して、各集合が1つの目標標本のみを含むようにする。(a2)2つの集合の間の類似性を計算する。2つの集合の間の類似性は、2つの集合の間の類似性の最大値を超えないことを意味する。即ち、

Figure 2014063494
For example, the classification method described above can be realized by a classification method. Specific steps are as follows. (A1) At first, a plurality of sets are formed so that each set includes only one target sample. (A2) Calculate the similarity between the two sets. Similarity between two sets means that the maximum similarity between the two sets is not exceeded. That is,
Figure 2014063494

数1において、A及びBは、いずれか2つの集合を示し、a及びbは、前記2つの集合中のいずれかの目標標本を示し、Sim(A、B)は、集合Aと集合Bとの間の類似性を示す。(a3)前記2つの集合中の目標標本の類似性を計算して、類似性が第四所定閾値より大きいかどうかを判断する。第四所定閾値より大きい場合、最大の類似性を有している2つの集合(即ち、複数の集合中において、類似性が最大である2つの集合)を1つの集合に合併した後、ステップ(a2)を行う。複数の集合中において、いずれか2つの集合の間の類似性が第四所定閾値より小さくなるまで前記ステップを繰り返す。   In Equation 1, A and B denote any two sets, a and b denote any target sample in the two sets, and Sim (A, B) denotes set A and set B, The similarity between is shown. (A3) The similarity of the target samples in the two sets is calculated to determine whether the similarity is greater than a fourth predetermined threshold. If greater than the fourth predetermined threshold, after merging the two sets having the maximum similarity (that is, the two sets having the maximum similarity among a plurality of sets) into one set, the step ( Perform a2). In the plurality of sets, the above steps are repeated until the similarity between any two sets is smaller than a fourth predetermined threshold.

本実施例において、前記第四所定閾値は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。   In the present embodiment, the fourth predetermined threshold can be set by experience or by a test method, but will not be described again here.

図1に示す通り、確定ユニット120は、目標標本の各集合に相関する訓練標本をそれぞれ確定する。前記訓練標本は、目標標本の種類と同じである対象である。例えば、訓練標本と目標標本は、以下の対象中の一種である。即ち、イメージ、動画、本文、及びウェブページなど中の一種である。   As shown in FIG. 1, the determination unit 120 determines each training sample correlated to each set of target samples. The training sample is an object that is the same as the target sample type. For example, the training sample and the target sample are one of the following subjects. That is, it is a kind of image, video, text, web page, and the like.

本発明の具体的な実施例に係る分類装置において、前記「目標標本の各集合に相関する訓練標本」は、色々な確定方法により確定することができる。   In the classification apparatus according to the specific embodiment of the present invention, the “training samples correlated with each set of target samples” can be determined by various determination methods.

一種の実現方法において、目標標本の各集合により、確定ユニット120は、前記集合の少なくとも1つの目標標本の間において、類似性が第二所定閾値より大きい訓練標本を前記集合に相関する訓練標本とする。   In one type of realization, for each set of target samples, the deterministic unit 120 includes training samples that correlate training samples with similarity greater than a second predetermined threshold between at least one target sample of the set. To do.

前記実現方法中の一例において、目標標本の集合Mは、分類ユニット110が目標標本を分類して得たいずれか1つの集合であると仮定する場合、前記集合Mにおいて、確定ユニット120は、まず各訓練標本と集合Mの各目標標本との間の類似性を獲得する。次に、集合M中の少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本たちを前記集合Mに相関する訓練標本とする。   In an example in the implementation method, if it is assumed that the target sample set M is any one set obtained by classifying the target samples by the classification unit 110, in the set M, the deterministic unit 120 includes: A similarity between each training sample and each target sample of set M is obtained. Next, training samples whose similarity to at least one target sample in the set M is larger than a second predetermined threshold are set as training samples correlated with the set M.

前記実現方法中の他の一例において、各訓練標本について、確定ユニット120は、前記訓練標本と集合M中の各訓練標本との間の類似性を計算しなくてもよい。訓練標本Sを例とし、確定ユニット120が計算して得た集合M中のいずれかの目標標本Sと訓練標本Sとの間の類似性が第二所定閾値より大きいと時、確定ユニット120は、集合M中の他の剰余目標標本と訓練標本Sとの間の類似性を計算せず、訓練標本Sを直接に集合Mに相関する1つの訓練標本だと確定してもよい。 In another example in the implementation method, for each training sample, the determination unit 120 may not calculate the similarity between the training sample and each training sample in the set M. Taking the training sample S B as an example, when the similarity between any target sample S A and the training sample S B in the set M obtained by the determination unit 120 is greater than a second predetermined threshold, the determination is made Unit 120 does not calculate the similarity between the other remainder target samples in set M and training sample S B, and determines that training sample S B is one training sample that is directly correlated to set M. Also good.

訓練標本と目標標本との間の類似性は、具体的な状況により適用する計算方法を選択して計算することができる。例えば、イメージの類似性、本文の類似性などを計算する従来の計算方法を採用することができる。即ち、訓練標本と目標標本がイメージ、本文及び他の種類の対象である場合、各種類の対象により、訓練標本と目標標本との間の類似性をそれぞれ計算することができる。   The similarity between the training sample and the target sample can be calculated by selecting a calculation method to be applied according to a specific situation. For example, a conventional calculation method for calculating image similarity, text similarity, and the like can be employed. That is, when the training sample and the target sample are images, texts, and other types of objects, the similarity between the training sample and the target sample can be calculated for each type of object.

本実施例において、前記第二所定閾値は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。本実施例において、第二所定閾値は、第四所定閾値と同値に設定することができる。   In the present embodiment, the second predetermined threshold value can be set by experience or by a test method, but will not be described again here. In the present embodiment, the second predetermined threshold value can be set to the same value as the fourth predetermined threshold value.

他の実施方法において、目標標本の各集合について、確定ユニット120は、前記集合中で少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本を前記集合に相関する訓練標本とするか、或いは「前記集合中で少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本」との類似性が第三所定閾値より大きい訓練標本たちを前記集合に相関する訓練標本とする。   In another implementation, for each set of target samples, the deterministic unit 120 sets training samples whose similarity to at least one target sample in the set is greater than a second predetermined threshold as correlation training samples. Or “a training sample whose similarity to at least one target sample in the set is greater than a second predetermined threshold” and a training sample that correlates training samples that are greater than a third predetermined threshold to the set; To do.

前記目標標本のいずれかの1つの集合Mを例とし、且つ前述した方法と類似する方法により、確定ユニット120は、集合M中の少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本たちを前記集合Mに相関する訓練標本とする。説明を簡単にするため、下文において、「集合M中の少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本」を第一訓練標本と略称する。前記第一訓練標本だけではなく、確定ユニット120は、第一訓練標本中のいずれか1つの訓練標本との類似性が第三所定閾値より大きい訓練標本たちを前記集合Mに相関する訓練標本とすることができる。同様に、説明を簡単にするため、下文において、「第一訓練標本中のいずれか1つの訓練標本との類似性が第三所定閾値より大きい訓練標本」を第二訓練標本と略称する。従って、前述した実施例の「集合Mに相関する訓練標本」は、第一訓練標本及び第二訓練標本を含む。本実施例において、前記第三所定閾値は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。   Taking a set M of any one of the target samples as an example and in a manner similar to that described above, the deterministic unit 120 has a similarity with at least one target sample in the set M greater than a second predetermined threshold. Let the training samples be training samples correlated to the set M. In order to simplify the explanation, in the following, “a training sample whose similarity to at least one target sample in the set M is larger than a second predetermined threshold value” is abbreviated as a first training sample. In addition to the first training sample, the determination unit 120 includes training samples that correlate training samples that have a similarity with any one of the training samples in the first training sample that is greater than a third predetermined threshold; can do. Similarly, in order to simplify the explanation, “a training sample whose similarity to any one training sample in the first training sample is larger than a third predetermined threshold value” is abbreviated as a second training sample in the following text. Accordingly, the “training sample correlated with the set M” in the above-described embodiment includes the first training sample and the second training sample. In the present embodiment, the third predetermined threshold can be set by experience or by a test method, but will not be described again here.

前述した第一訓練標本中のいずれかの訓練標本も種類バリューを有している。前記種類バリューは、所属する標本の種類と所定する種類との間の整合程度を示す一種の度量である。即ち、前記種類バリューは、所属する標本の種類が所定する種類に符合する程度を示すバリューである。一般的には、種類バリューが大きければ大きいほど、種類バリューに所属する標本が所定する種類に符合する可能性が大きいことを説明し、種類バリューが小さければ小さいほど、種類バリューに所属する標本が所定する種類に符合する可能性が低いことを説明する。例えば、種類バリューは、通常−1〜1との間に置かれる。   Any training sample in the first training sample described above also has a kind value. The type value is a kind of measure indicating the degree of matching between the type of the sample to which it belongs and a predetermined type. That is, the type value is a value indicating the degree to which the type of the sample to which it belongs matches a predetermined type. In general, explain that the larger the type value, the more likely the sample belonging to the type value matches the specified type. The smaller the type value, the more samples that belong to the type value. Explain that there is a low possibility of matching a predetermined type. For example, the type value is usually placed between −1 and 1.

本実施例において、前記訓練標本の種類バリューの獲得方法の相違により、訓練標本の以下の二種に分類することができる。   In the present embodiment, the training samples can be classified into the following two types of training samples according to the difference in the method of acquiring the type value.

一種の訓練標本は、一般の標注標本である。このような標注標本は、通常所定の種類バリューを有している。前記種類バリューは、例えば人工的に予め標注することができる。しかし、人力に限度があるので、通常所定の種類バリューを有しているこのような標注標本の数量も一定の限度がある。   A kind of training sample is a general standard sample. Such a standard sample usually has a predetermined type value. The kind value can be pre-ordered artificially, for example. However, since there is a limit to human power, the number of such standard samples that usually have a predetermined kind of value also has a certain limit.

他の一種の訓練標本は、機器標注標本である。このような機器標注標本の種類バリューは、例えば、訓練過程(一般的な分類装置は、使用する前に訓練標本により訓練を行う過程である)において前記標注標本の種類バリューによって得ることができる。   Another type of training specimen is an instrument standard specimen. The type value of the instrument standard sample can be obtained from the type value of the standard sample in a training process (a general classification device is a process in which training is performed using a training sample before use).

従って、本発明の実施例に係る分類装置の訓練標本は、前述した二種の標本を含むことができる。即ち、前述した標注標本と機器標注標本を含むことができる。前述した二種の訓練標本の種類バリューは、前述した方法と類似する方法によりそれぞれ得ることができるので、ここでは再び説明しない。この場合、前記確定ユニット120が確定した「目標標本の各集合に相関する訓練標本」は、すべてが機器標注標本であることができる。   Therefore, the training sample of the classification device according to the embodiment of the present invention can include the two types of samples described above. That is, the above-mentioned standard sample and instrument standard sample can be included. Since the kind values of the two kinds of training samples described above can be obtained by a method similar to the method described above, they will not be described again here. In this case, all of the “training samples correlated with each set of target samples” determined by the determination unit 120 may be instrument standard samples.

前述した通り、確定ユニット120の処理により、目標標本の各集合に相関する訓練標本をそれぞれ確定することができる。   As described above, the training unit correlated with each set of target samples can be determined by the processing of the determination unit 120.

一般的な推定により推定することができるとおり、類似する標本の種類バリューの差が大きいはずはない。従って、いずれか2つの訓練標本(特に、前記2つの訓練標本が機器標注標本である場合)がそれぞれ、いずれか2つの目標標本に類似し、且つ前記2つの目標標本も互いに類似する(例えば、前述したいずれか1つの集合に所属する)場合、前記2つの訓練標本の種類バリューの差が大きいはずはない。でない場合、例えば、いずれか1つの集合中の2つの目標標本にそれぞれ類似する2つの訓練標本の種類バリューの間の差が第一所定閾値より大きい場合、前記2つの訓練標本の種類バリューが正しくないことを説明する。従って、このような種類バリューを除去する推定算法によりより正確な結果を得ることができる。   As can be estimated by general estimation, the difference in the type value of similar samples cannot be large. Thus, any two training samples (especially where the two training samples are instrumental sample samples) are each similar to any two target samples, and the two target samples are also similar to each other (eg, In the case of belonging to any one set described above), the difference in the type value of the two training samples cannot be large. Otherwise, for example, if the difference between two training sample type values that are respectively similar to two target samples in any one set is greater than a first predetermined threshold, the two training sample type values are correct. Explain that there is no. Therefore, a more accurate result can be obtained by such an estimation calculation method that removes the kind value.

目標標本の各集合について、削除ユニット130は、まず「前記集合に相関する訓練標本」の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を計算する。次は、計算して得た差が第一所定閾値より大きい場合、このような「前記集合に相関する訓練標本」の種類バリューを削除する。   For each set of target samples, the deletion unit 130 first calculates the difference between the maximum type value and the minimum type value in the type value of “training sample correlated to the set”. Next, when the calculated difference is larger than the first predetermined threshold, the type value of such “training sample correlated with the set” is deleted.

例えば、前述した通り、目標標本のいずれかの1つの集合Mにおいて、確定ユニット120により、集合Mに相関する訓練標本を確定する。次は、削除ユニット130が集合Mに相関するすべての訓練標本の種類バリュー中において最大種類バリューと最小種類バリューを選び出すとともに、最大種類バリューと最小種類バリューとの間の差を計算する(前記差が0より大きいか或いは等しい)。前記差が第一所定閾値より大きい場合、これらの集合Mに相関するすべての訓練標本の種類バリューを削除する。   For example, as described above, in one set M of target samples, a training sample correlated with the set M is determined by the determination unit 120. Next, the deletion unit 130 selects the largest kind value and the smallest kind value among the kind values of all the training samples correlated with the set M, and calculates the difference between the largest kind value and the smallest kind value (said difference). Is greater than or equal to 0). If the difference is greater than the first predetermined threshold, the type values of all training samples correlated with these sets M are deleted.

特に、1つの優先例において、確定ユニット120が確定した「前記集合に相関する訓練標本」のすべてが機器標注標本である場合、削除ユニット130は、これらの機器標注標本の種類バリューを削除する。   In particular, in one priority example, when all of the “training samples correlated with the set” determined by the determination unit 120 are device standard samples, the deletion unit 130 deletes the type values of these device standard samples.

本実施例において、前記第一所定閾値は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。   In the present embodiment, the first predetermined threshold value can be set by experience or by a test method, but will not be described again here.

計算ユニット140は、残った訓練標本(即ち、種類バリューが削除された訓練標本を除く他の訓練標本)の種類バリューを利用して、解を求めて最適化する方法により、前記目標標本の種類バリューを獲得し、且つ計算して得た前記種類バリューにより目標標本の種類を確定する。   The calculation unit 140 uses the type value of the remaining training sample (that is, other training samples excluding the training sample from which the type value has been deleted) to obtain a solution and optimize the type of the target sample. The type of the target sample is determined based on the type value obtained by acquiring and calculating the value.

本発明の実施例に係る分類装置において、計算ユニット140は、目標標本を測定標本とすることができる。次に、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得する。   In the classification device according to the embodiment of the present invention, the calculation unit 140 can set the target sample as the measurement sample. Next, find a solution based on the similarity between each measurement sample and each remaining training sample and the similarity between the two measurement samples and using the type value of the remaining training sample. The type value of the measurement specimen is obtained by an optimization method.

従来のイメージに基づく学習方法は、通常各測定標本を順位に処理し、且つ各測定標本と訓練標本との間の関係のみを考慮し、測定標本と訓練標本との間の関係は完全に使わない。図2A〜2Cは、従来のイメージに基づく学習方法が測定標本を処理する時に採用する基本的な原理を示す簡略図である。図2A〜2Cと後述する図2Dにおいて、「○」は訓練標本(即ち、S1〜S5)を示し、「△」は測定標本(即ち、S1〜S3)を示し、図面中の連結線は連結する対象の間の類似性を示す。 Traditional image-based learning methods usually process each measurement sample in order and consider only the relationship between each measurement sample and the training sample, and use the relationship between the measurement sample and the training sample completely. Absent. 2A to 2C are simplified diagrams showing the basic principle adopted when a conventional image-based learning method processes a measurement sample. 2A to 2C and FIG. 2D described later, “◯” indicates a training sample (ie, S B 1 to S B 5), and “Δ” indicates a measurement sample (ie, S A 1 to S A 3). The connecting lines in the drawings show the similarity between objects to be connected.

図2A〜2Cに示す通り、従来の方法は、測定標本を処理する時、測定標本と訓練標本との間の類似性のみを考慮する。即ち、各測定標本をそれぞれ処理することにより、測定標本を分類する。図2A〜2Cにおいて、測定標本と各訓練標本との間の連結線を示さず、類似性が高い前の複数の訓練標本と測定標本との間の連結線のみを示した。   As shown in FIGS. 2A-2C, the conventional method only considers the similarity between the measurement sample and the training sample when processing the measurement sample. That is, the measurement samples are classified by processing each measurement sample. In FIG. 2A-2C, the connection line between a measurement sample and each training sample was not shown, but only the connection line between the some training sample and measurement sample before high similarity was shown.

図2Dは、計算ユニット140が測定標本を処理する原理を示す簡略図である。図2Dと前述した図2A〜2Cを比較して見ると、図2Dにおいて、計算ユニット140が測定標本を処理する時、測定標本と訓練標本との間の類似性を考慮するとともに、測定標本と測定標本との間の類似性(即ち、図2Dにおいて、S1とS2との間、S2とS3との間の連結線である)も考慮することを分かることができる。 FIG. 2D is a simplified diagram illustrating the principle by which the calculation unit 140 processes the measurement specimen. Comparing FIG. 2D with FIGS. 2A to 2C described above, in FIG. 2D, when the calculation unit 140 processes the measurement sample, the similarity between the measurement sample and the training sample is considered, and the measurement sample and It can be seen that the similarity between the measurement specimens (that is, the connecting line between S A 1 and S A 2 and between S A 2 and S A 3 in FIG. 2D) is also considered. it can.

図2A〜2Dに示す各訓練標本の間の連結線(訓練標本の間の類似性)は、測定標本の種類バリューを計算する時に用いるものではなく、いずれかの実施例の訓練過程において、前述した機器標注標本の種類バリューを獲得する時に用いるものである。   The connection lines (similarities between training samples) between the training samples shown in FIGS. 2A to 2D are not used when calculating the type value of the measurement sample. This is used when acquiring the type value of the instrument standard sample.

以下、図3を参照しながら、計算ユニット140の様々な配置例を説明する。   Hereinafter, various arrangement examples of the calculation unit 140 will be described with reference to FIG.

図3に示す通り、本実施例の計算ユニット140は、コスト函数生成モジュール310と、コスト函数算出モジュール320とを含むことができる。   As shown in FIG. 3, the calculation unit 140 of the present embodiment may include a cost function generation module 310 and a cost function calculation module 320.

コスト函数生成モジュール310は、所定の制限条件を反映することができるコスト函数を生成する。コスト函数算出モジュール320は、前記コスト函数の最小化の問題を検出することにより測定標本の種類バリューを獲得する。   The cost function generation module 310 generates a cost function that can reflect a predetermined restriction condition. The cost function calculation module 320 acquires the type value of the measurement sample by detecting the problem of minimizing the cost function.

前記所定の制限条件は、以下のような2つの条件を含むことができる。即ち、測定標本と訓練標本との間の類似性が高ければ高いほど、測定標本と訓練標本の種類バリューが接近することと、2つの測定標本間の類似性が高ければ高いほど、2つの測定標本の種類バリューが接近することである。   The predetermined restriction condition can include the following two conditions. That is, the higher the similarity between the measurement sample and the training sample, the closer the type value of the measurement sample and the training sample, and the higher the similarity between the two measurement samples, the two measurements The specimen type value is approaching.

前述した所定の制限条件により、本発明の実施例に係る分類装置のコスト函数生成モジュール310が生成するコスト函数は、以下のような函数、又は変形例を含むことができる。

Figure 2014063494
The cost function generated by the cost function generation module 310 of the classification device according to the embodiment of the present invention according to the predetermined restriction condition described above may include the following functions or modifications.
Figure 2014063494

前記函数において、Mは、測定標本の数量であり、Nは、残った訓練標本の数量であり、

Figure 2014063494
は、M個の測定標本中で第i個目の測定標本の種類バリューであり、
Figure 2014063494
は、前記N個の訓練標本中で第j個目の訓練標本の種類バリューであり、
Figure 2014063494
は、第i個目の測定標本と第j個目の訓練標本との間の類似性であり、
Figure 2014063494
は、第k個目の測定標本と第l個目の測定標本との間の類似性である。 In the function, M is the number of measurement samples, N is the number of remaining training samples,
Figure 2014063494
Is the type value of the i-th measurement sample among the M measurement samples,
Figure 2014063494
Is the type value of the jth training sample in the N training samples,
Figure 2014063494
Is the similarity between the i th measurement sample and the j th training sample,
Figure 2014063494
Is the similarity between the kth measurement sample and the lth measurement sample.

前記実施例において、

Figure 2014063494
は、測定標本と訓練標本との間の類似性を示し、
Figure 2014063494
は、測定標本と測定標本との間の類似性を示す。 In the above embodiment,
Figure 2014063494
Indicates the similarity between the measurement sample and the training sample,
Figure 2014063494
Indicates the similarity between the measurement sample and the measurement sample.

例えば、

Figure 2014063494

Figure 2014063494
のような2つの函数を含むコスト函数は、以下のような
Figure 2014063494

の形式により示すことができる。 For example,
Figure 2014063494
When
Figure 2014063494
The cost function including two functions such as
Figure 2014063494

It can be indicated by the form.

前記函数において、

Figure 2014063494
は、線形組合係数であり、
Figure 2014063494
は、すべての測定標本の種類バリューで構成されるベクトルである。
Figure 2014063494
は、経験により設定するか、或いは試験方法により設定することができるが、ここでは再び説明しない。 In the function,
Figure 2014063494
Is the linear combination coefficient,
Figure 2014063494
Is a vector composed of all measurement sample type values.
Figure 2014063494
Can be set by experience or by test method, but will not be described again here.

次に、解を求めて最適化方法

Figure 2014063494
により、すべての測定標本の種類バリューを算出することができる。前記最適化方法
Figure 2014063494
は、一種の簡単な二回最適化方法である。本技術領域の技術者は、周知する常識と公開されている資料により、最適化の方法を選び出すことができるので、ここでは再び説明しない。 Next, find the solution and optimize
Figure 2014063494
Thus, it is possible to calculate the type value of all the measurement samples. The optimization method
Figure 2014063494
Is a kind of simple two-time optimization method. An engineer in this technical field can select an optimization method based on common knowledge and publicly available materials, and will not be described again here.

本発明の実施例において、計算ユニット140は、種類バリューが削除された訓練標本と目標標本を一緒に測定標本とすることもでき、且つ前述した方法により測定標本の種類バリューを獲得するとともに、目標標本の種類バリューにより分類結果を確定する。この場合、算出する過程で形成される変量は、目標標本の種類バリューを含むだけではなく、種類バリューが削除された訓練標本たちの新しい種類バリューも含んでいる。すべての測定標本の新しい種類バリューを獲得した後、このような目標標本の種類バリューにより最終の分類結果を確定することができる(分類の目的は、目標標本の種類を獲得することにある)。例えば、種類バリューが−1〜1の間に置かれると仮定する場合、計算により獲得した各目標標本の第一、第二及び第三種類バリューがそれぞれ1、0.8、−1である時、1つ目の目標標本と所定の種類が完全に符合することを示し、2つ目の第二回目の目標標本と所定の種類が比較的に符合することを示し、3つ目の目標標本と所定の種類が完全に符合しないことを示す。前記所定の種類は、例えば、前記訓練標本中で種類バリューが1である訓練標本の種類であることができる。   In the embodiment of the present invention, the calculation unit 140 can also use the training sample and the target sample from which the type value is deleted as the measurement sample, and obtain the type value of the measurement sample by the above-described method, The classification result is determined by the sample type value. In this case, the variable formed in the calculation process not only includes the type value of the target sample, but also includes the new type value of the training samples from which the type value has been deleted. After obtaining a new type value for all measurement samples, such a target sample type value can determine the final classification result (the purpose of the classification is to acquire the target sample type). For example, assuming that the type value is between −1 and 1, when the first, second and third type values of each target sample obtained by calculation are 1, 0.8 and −1, respectively Indicates that the first target sample and the predetermined type are perfectly matched, indicates that the second second target sample and the predetermined type are relatively consistent, and indicates the third target sample. And that the given type does not match exactly. The predetermined type may be, for example, a type of training sample whose type value is 1 in the training sample.

実際の応用において、測定標本は通常大量に獲得するが、従来の方法において、大量に獲得した測定標本の間の類似性を考慮せず、各測定標本と訓練標本との間の類似性のみを考慮する。本発明の実施例において、測定標本と測定標本との間の類似性をさらに検出することにより、より高い分類精度と分類結果を獲得することができる。   In actual applications, the measurement specimens are usually acquired in large quantities, but in the conventional method, the similarity between each measurement specimen and the training specimen is considered without considering the similarity between the measurement specimens acquired in large quantities. Consider. In the embodiment of the present invention, by further detecting the similarity between the measurement specimen and the measurement specimen, higher classification accuracy and classification result can be obtained.

以下、図4を参照しながら、本発明の他の実施例に係る分類装置を詳細に説明する。   Hereinafter, a classification device according to another embodiment of the present invention will be described in detail with reference to FIG.

図4に示す通り、分類装置400は、分類ユニット410と、確定ユニット420と、削除ユニット430と、計算ユニット440とを含むだけではなく、標本更新ユニット450をさらに含む。図4に示す分類装置400の分類ユニット410、確定ユニット420、削除ユニット430、計算ユニット440は、前記図1と/又は図3に記載されている装置100中の各ユニットと同様な構造及び機能を有し、且つ類似する技術効果を奏することができるので、ここでは再び説明しない。   As shown in FIG. 4, the classification apparatus 400 not only includes a classification unit 410, a determination unit 420, a deletion unit 430, and a calculation unit 440, but further includes a sample update unit 450. The classification unit 410, the determination unit 420, the deletion unit 430, and the calculation unit 440 of the classification device 400 shown in FIG. 4 have the same structure and function as each unit in the device 100 described in FIG. 1 and / or FIG. And a similar technical effect can be achieved, and will not be described again here.

本実施例の訓練標本は、前述した標注標本と機器標注標本を含む。図4に示す通り、分類装置400において、標本更新ユニット450は、新しい種類バリューを獲得した測定標本を、次の分類過程中の機器標注標本とする。前記測定標本は、次の分類過程で使用する一部分の機器標注標本になり、元存在する機器標注標本は、依然として機器標注標本として使用する。   The training sample of the present embodiment includes the above-mentioned standard sample and instrument standard sample. As shown in FIG. 4, in the classification device 400, the sample update unit 450 sets the measurement sample that has acquired a new type value as a device standard sample in the next classification process. The measurement sample becomes a part of the instrument standard sample to be used in the next classification process, and the original instrument standard sample is still used as the instrument standard sample.

前述した通り、本発明の実施例に係る分類装置は、種類バリューが正しくない訓練標本を選択するとともに、このような訓練標本の種類バリューを削除することにより、訓練標本がデータの実際の分布状況をより正確に示し、測定標本の種類バリューを計算する過程に使用する訓練標本の種類バリューの正確性を確保することができる。また、本発明の実施例に係る分類装置は、計算する過程において測定標本の間の類似性関係を追加することにより、獲得した測定標本の種類バリューの正確度を向上させることができる。   As described above, the classification device according to the embodiment of the present invention selects a training sample whose type value is not correct, and deletes the type value of the training sample so that the training sample has an actual distribution state of data. And the accuracy of the type value of the training sample used in the process of calculating the type value of the measurement sample can be ensured. In addition, the classification apparatus according to the embodiment of the present invention can improve the accuracy of the type value of the acquired measurement sample by adding the similarity relationship between the measurement samples in the calculation process.

本発明の実施例において、一種の分類方法をさらに提供する。以下、図5を参照しながら本実施例に係る分類方法を説明する。   In an embodiment of the present invention, a kind of classification method is further provided. Hereinafter, the classification method according to the present embodiment will be described with reference to FIG.

図5に示す通り、本発明の実施例に係る分類方法の処理流れ500は、ステップS510から始まり、まずはステップS520を行う。   As shown in FIG. 5, the processing flow 500 of the classification method according to the embodiment of the present invention starts from step S510 and first performs step S520.

ステップS520において、目標標本を分類して、目標標本の少なくとも一種の集合を形成する。次に、ステップS530を行う。ステップS520で行う処理は、前記図1で説明した分類ユニット110が行う処理と同様であり、且つ類似する技術効果を得ることができるので、ここでは再び説明しない。   In step S520, the target samples are classified to form at least one set of target samples. Next, step S530 is performed. The processing performed in step S520 is the same as the processing performed by the classification unit 110 described with reference to FIG. 1, and a similar technical effect can be obtained, and therefore will not be described again here.

ステップS530において、目標標本の各集合に相関する各訓練標本を確定する。訓練標本中の各訓練標本は、いずれも種類バリューを有している。次に、ステップS540を行う。ステップS530で行う処理は、前記図1で説明した確定ユニット120が行う処理と同様であり、且つ類似する技術効果を得ることができるので、ここでは再び説明しない。   In step S530, each training sample that correlates to each set of target samples is determined. Each training sample in the training sample has a kind value. Next, step S540 is performed. The process performed in step S530 is the same as the process performed by the confirmation unit 120 described with reference to FIG. 1, and a similar technical effect can be obtained, and therefore will not be described again here.

ステップS540において、目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得する。且つ、前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除する。次に、ステップS550を行う。ステップS540で行う処理は、前記図1で説明した削除ユニット130が行う処理と同様であり、且つ類似する技術効果を得ることができるので、ここでは再び説明しない。   In step S540, the difference between the maximum type value and the minimum type value is acquired from the set of target samples in the type value of the training sample correlated with the set. If the difference is larger than the first predetermined threshold, the training sample type value correlated with the set is deleted. Next, step S550 is performed. The processing performed in step S540 is similar to the processing performed by the deletion unit 130 described with reference to FIG. 1, and similar technical effects can be obtained.

ステップS550において、目標標本を測定標本とし、各測定標本と残った訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得する。次にステップS560を行う。ステップS550で行う処理は、前記図1と/又は図3で説明した計算ユニット140が行う処理と同様であり、且つ類似する技術効果を得ることができるので、ここでは再び説明しない。   In step S550, the target sample is a measurement sample, and the type value of the remaining training sample is used based on the similarity between each measurement sample and the remaining training sample and the similarity between the two measurement samples. Then, the type value of the measurement sample is obtained by a method of obtaining and optimizing the solution. Next, step S560 is performed. The processing performed in step S550 is the same as the processing performed by the calculation unit 140 described with reference to FIG. 1 and / or FIG. 3, and a similar technical effect can be obtained.

本実施例の処理流れ500は、ステップS560により終わる。   The processing flow 500 of the present embodiment ends with step S560.

本発明の優先的な実施例に係るステップS550において、種類バリューが削除された訓練標本と目標標本とを一緒に測定標本とし、且つ得た目標標本の種類バリューにより分類結果を得ることもできる。   In step S550 according to the preferred embodiment of the present invention, the training sample from which the type value is deleted and the target sample can be used as a measurement sample, and the classification result can be obtained from the type value of the obtained target sample.

前述した通り、本発明の実施例に係る分類方法は、種類バリューが正しくない訓練標本を選択するとともに、このような訓練標本の種類バリューを削除することにより、訓練標本がデータの実際の分布状況をより正確に示し、測定標本の種類バリューを計算する過程に使用する訓練標本の種類バリューの正確性を確保することができる。また、本発明の実施例に係る分類方法は、計算する過程において測定標本の間の類似性関係を追加することにより、獲得した測定標本の種類バリューの正確度を向上させることができる。   As described above, the classification method according to the embodiment of the present invention selects a training sample whose type value is not correct, and deletes the type value of the training sample so that the training sample has an actual distribution state of data. And the accuracy of the type value of the training sample used in the process of calculating the type value of the measurement sample can be ensured. In addition, the classification method according to the embodiment of the present invention can improve the accuracy of the type value of the acquired measurement sample by adding the similarity relationship between the measurement samples in the calculation process.

本発明の実施例において、一種の電子設備をさらに提供する。前記電子設備は、前述した分類装置を含む。   In an embodiment of the present invention, a kind of electronic equipment is further provided. The electronic equipment includes the classification device described above.

本発明の実施例に係る電子装置は、後述する設備中のいずれかの一種の設備である。即ち、携帯電話、コンピュータ、ダブレットパソコン、携帯情報端末、メディアプレーヤーなど中の一種の設備である。前記電子設備は、前述した分類装置の各種の機能と技術効果を有しているが、ここでは再び説明しない。   The electronic device according to the embodiment of the present invention is any one kind of equipment in the equipment described later. That is, it is a kind of equipment in a mobile phone, a computer, a doublet personal computer, a portable information terminal, a media player, and the like. The electronic equipment has the various functions and technical effects of the classification device described above, but will not be described again here.

前述した本発明の実施例に係る分類装置が含んでいる各構成ユニット、子ユニット、モジュールなどの機能は、ソフトウェア、ファームウエア、ハードウェア、又はこれらの任意の組合せにより実現することができる。ソフトウェア又はファームウエアにより前記機能を実現する場合、記憶媒介又ネットワークから前記ソフトウェア又はファームウエアを構成するプログラムを、専用ハードウェア構造を有している機器(例えば、図6に示す通用機器600)に入力してインストールすることができる。前記各種のプログラムがインストールされている前記機器は、前記各構成ユニット、子ユニットの各機能を実現することができる。   The functions of each component unit, child unit, module, and the like included in the classification device according to the embodiment of the present invention described above can be realized by software, firmware, hardware, or any combination thereof. When the function is realized by software or firmware, a program that configures the software or firmware from a storage medium or network is transferred to a device having a dedicated hardware structure (for example, the common device 600 shown in FIG. 6). You can enter and install. The device in which the various programs are installed can realize the functions of the constituent units and the child units.

図6は、本発明の実施例に係る分類装置及び分類方法の機能を実現するための、一種の情報処理設備のハードウェア配置構造図を示す簡略図である。   FIG. 6 is a simplified diagram showing a hardware arrangement structure diagram of a kind of information processing equipment for realizing the functions of the classification device and the classification method according to the embodiment of the present invention.

図6において、中央処理ユニット(CPU)601は、リードオンリーメモリ(ROM)602に記憶されているプログラム、又はメモリ装置608からランダムアクセスメモリ(RAM)603に読み込むプログラムにより各種の処理を行う。RAM603には、CPU601が各種の処理を行う時に需要するデータも記憶されている。CPU601、ROM602及びRAM603は、バス604により互いに連結されている。入力/出力インタフェース605もバス604に連結されている。   In FIG. 6, a central processing unit (CPU) 601 performs various processes by a program stored in a read-only memory (ROM) 602 or a program read from a memory device 608 to a random access memory (RAM) 603. The RAM 603 also stores data demanded when the CPU 601 performs various processes. The CPU 601, ROM 602, and RAM 603 are connected to each other via a bus 604. An input / output interface 605 is also coupled to the bus 604.

以下の部品は、入力/出力インタフェース605に連結されている。例えば、入力装置606(キーボード、マウス等を含む)、出力装置607(表示装置(例えば、陰極線管表示装置(CRT)、液晶表示装置(LCD)など)、スピーカなどを含む)、メモリ装置608(ハードディスクなどを含む)、通信装置609(ネットワークインタフェースカード(例えば、LANカード、変調復調装置など)などを含む)である。通信装置609は、ネットワーク、例えばインターネットにより通信を行う。需要により、ドライブ装置610を入力/出力インタフェース605に連結することもできる。着脱可能なメモリ媒介611、例えば磁気ディスク、ライトディスク、光磁気ディスク、半導体メモリ装置などを前記ドライブ装置610に装着することができる。従って、需要により、前記メモリ媒介611に記憶されているプログラムを前記メモリ装置608に読み込むことができる。   The following components are coupled to the input / output interface 605. For example, an input device 606 (including a keyboard, a mouse, etc.), an output device 607 (including a display device (eg, a cathode ray tube display device (CRT), a liquid crystal display device (LCD)), a speaker, etc.), a memory device 608 ( A communication device 609 (including a network interface card (for example, a LAN card, a modulation / demodulation device, etc.)). The communication device 609 performs communication via a network such as the Internet. Depending on demand, the drive device 610 can also be coupled to the input / output interface 605. A removable memory medium 611, for example, a magnetic disk, a write disk, a magneto-optical disk, a semiconductor memory device, etc. can be mounted on the drive device 610. Therefore, the program stored in the memory medium 611 can be read into the memory device 608 according to demand.

ソフトウェアにより前述した処理を行う場合、ネットワーク、例えばインターネット、又はメモリ媒介、例えば着脱可能なメモリ媒介611から所定のソフトウェアを読取ることができる。   When the above-described processing is performed by software, predetermined software can be read from a network, for example, the Internet, or a memory medium, for example, a removable memory medium 611.

本技術領域の技術者が周知する通り、前記メモリ媒介は、プログラムが記憶されているか、或いは設備と離れてユーザーにプログラムを伝送する図6に示す着脱可能なメモリ媒介611に限定されるものではない。着脱可能なメモリ媒介611は、例えば、磁気ディスク(フロッピー(登録商標)ディスクを含む)、ライトディスク(コンパクトディスクリードオンリーメモリー(CD−ROM)及びディジタルヴァーサタイルディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標))、半導体メモリである。前記メモリ媒介は、ROM602、メモリ装置608が含むハードディスクなどであることができる。メモリ媒介には、プログラムが記憶されており、ユーザーは、メモリ媒介とその中に記憶されているプログラムを使用することができる。   As known to those skilled in the art, the memory media is not limited to the removable memory media 611 shown in FIG. 6 where the program is stored or transmits the program to the user away from the facility. Absent. The removable memory medium 611 includes, for example, a magnetic disk (including a floppy (registered trademark) disk), a write disk (including a compact disk read-only memory (CD-ROM) and a digital versatile disk (DVD)), and a magneto-optical disk. A disk (mini disk (MD) (registered trademark)) or a semiconductor memory. The memory medium may be a ROM 602, a hard disk included in the memory device 608, or the like. A program is stored in the memory medium, and a user can use the memory medium and the program stored therein.

本発明の実施例において、装置読取可能なインストラクションコードが記憶されているプログラムを提供する。装置が前記インストラクションコードを読取って実行する場合、本発明の実施例に係る前記分類方法が実施される。前記プログラムを記憶する装置、例えば、磁気ディスク、ライトディスク、光磁気ディスク、半導体メモリ装置などのようなメモリ媒介も本発明の明細書に公開されている。   In an embodiment of the present invention, a program in which an apparatus-readable instruction code is stored is provided. When the apparatus reads and executes the instruction code, the classification method according to an embodiment of the present invention is performed. A memory medium such as a device for storing the program, for example, a magnetic disk, a write disk, a magneto-optical disk, a semiconductor memory device, etc. is also disclosed in the specification of the present invention.

前述した本発明の具体的な実施例において、一種の実施方式に記載と/又は公開されている特徴は、同様又は類似する方式により、他の1つ又は複数の実施例に使用するか、或いは他の実施例の特徴と組み合わせて使用するか、或いは他の実施例の特徴の代わりに使用することができる。   In particular embodiments of the present invention described above, features described and / or disclosed in one type of implementation may be used in one or more other implementations in a similar or similar manner, or It can be used in combination with features of other embodiments, or can be used in place of features of other embodiments.

本発明の実施例に係る方法は、明細書に記載されている時間順位、又は図面に示されている時間順位に沿って実施せず、他の時間順位に沿って実施するか、或いは共に実施するか、或いは別々に実施することができる。即ち、本発明の技術的範囲は、本明細書に記載されている実施順位に限定されるものではない。   The method according to the embodiment of the present invention is not performed in accordance with the time order described in the specification or the time order shown in the drawings, and is performed in accordance with another time order, or is performed together. Or can be implemented separately. That is, the technical scope of the present invention is not limited to the order of implementation described in this specification.

本発明の前記方法の各ステップは、装置読取可能なメモリ媒介に記憶されているコンピュータ実施可能なプログラムにより実施することができる。   Each step of the method of the present invention can be implemented by a computer-executable program stored in a device-readable memory medium.

本発明の目的は、後述する方式により実現することもできる。即ち、メモリ媒介が記憶している前記実施可能なプログラムコードをシステム又は設備に直接又は間接に提供して、前記システム又は設備中のコンピュータ又は中央処理ユニット(CPU)が前記プログラムコードを読取って実行する方法である。   The object of the present invention can also be realized by a method described later. That is, the executable program code stored in a memory medium is directly or indirectly provided to a system or facility, and a computer or a central processing unit (CPU) in the system or facility reads and executes the program code. It is a method to do.

この場合、前記システム又は設備が前記プログラムコードを実行する機能を有しなければならない。本発明の実施方式は、前述したプログラムに限定されるものではない。且つ前記プログラムの形式もいずれかの形式であることができる。例えば、目標プログラム、インタプリタ実行可能なプログラム、又はオペレーティングシステムに提供するスクリプトなどである。   In this case, the system or equipment must have the function of executing the program code. The implementation method of the present invention is not limited to the above-described program. The format of the program may be any format. For example, a target program, an interpreter executable program, or a script provided to the operating system.

前述した装置読取可能なメモリ媒介は、以下の装置を含むが、以下の装置に限定されるものではない。例えば、メモリ装置及びメモリユニット、半導体設備、ディスクユニット(例えば、磁気ディスク、ライトディスク、光磁気ディスク)、情報を記憶することができる他の媒介などである。   The above-described device-readable memory media includes the following devices, but is not limited to the following devices. For example, memory devices and memory units, semiconductor equipment, disk units (eg, magnetic disks, write disks, magneto-optical disks), other media capable of storing information, and the like.

また、ユーザーのコンピュータをインターネットの所定のウェブサイトに繋げて、本発明のコンピュータ用プログラムコードをタウンロードした後、コンピュータにおいて前記プログラムを実行することにより、本発明の技術を実現することもできる。   The technology of the present invention can also be realized by connecting a user's computer to a predetermined website on the Internet, downloading the computer program code of the present invention, and executing the program on the computer.

本明細書に記載されている用語、例えば、左、右、第一、第二などのような関係用語は、1つの装置又はステップと他の1つの装置又はステップを分けるためのものであり、前記装置又はステップの間に存在するいずれかの関係又は順位を限定するか、或いは提示するためのものではない。また、「含む」、「具備する」などのような他のものをさらに含むことを制限しない様々な用語は、いずれの要素を含む過程、方法、装置、又は設備が前記要素を含むだけではなく、記載されていない他の要素をさらに含むか、或いは前述した過程、方法、装置、又は設備が固有する要素をさらに含むことができることを意味する。即ち、他の制限用語がない場合、「……1つを含む」などのような用語は、過程、方法、装置、又は設備が記載されている要素を含むだけではなく、他の要素も含むことができることを意味する。   Terms described herein, for example, related terms such as left, right, first, second, etc., are for separating one device or step from another device or step, It is not intended to limit or present any relationship or order that exists between the devices or steps. In addition, various terms that do not limit the inclusion of other things such as “include”, “comprise”, and the like are not limited to the process, method, apparatus, or facility that includes any element. , Which may further include other elements not described, or may further include elements inherent in the process, method, apparatus, or facility described above. That is, in the absence of other restrictive terms, terms such as “... include one” include not only the element in which the process, method, apparatus, or facility is described, but also other elements. Means that you can.

前述した本発明の実施例により、本発明は、以下のような方案を提供する。しかし、本発明が後述する方案にのみ限定されるものではない。   According to the embodiment of the present invention described above, the present invention provides the following solutions. However, the present invention is not limited to the method described later.

(付記1)
分類装置において、前記分類装置は、目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するように配置されている分類ユニットと、目標標本の各集合に相関する訓練標本をそれぞれ確定するように配置され、且つ前記訓練標本中の各訓練標本は、種類バリューを有している確定ユニットと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するように配置されている削除ユニットと、前記目標標本を測定標本とし、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するように配置されている計算ユニットと、を含む。
(Appendix 1)
In the classifier, the classifier classifies the target samples and determines a classification unit arranged to form at least one set of the target samples and a training sample correlated with each set of target samples. And each training sample in the training sample is a maximum in the type value of the training sample correlated to the set by a deterministic unit having a type value and each set of target samples. A deletion unit arranged to acquire a difference between the type value and the minimum type value and, if the difference is greater than a first predetermined threshold, to delete the type value of the training sample correlated with the set; Based on the similarity between each measurement sample and each remaining training sample and the similarity between the two measurement samples, with the target sample as a measurement sample, and the remaining training sample Using a type value, a method of optimizing seeking solutions, including a calculation unit arranged to acquire the type value of the measurement specimen.

(付記2)
前記計算ユニットは、所定の制限条件、即ち、測定標本と訓練標本との間の類似性が高ければ高いほど、測定標本と訓練標本の種類バリューが接近することと、2つの測定標本間の類似性が高ければ高いほど、2つの測定標本の種類バリューが接近することと、を反映することができるコスト函数を生成するように配置されているコスト函数生成モジュールと、前記コスト函数の最小化の問題を検出することにより測定標本の種類バリューを獲得するコスト函数算出モジュールと、を含む付記1に記載の分類装置。
(Appendix 2)
The calculation unit determines that the higher the similarity between the measurement sample and the training sample, the closer the kind value of the measurement sample and the training sample is, and the similarity between the two measurement samples. The higher the performance, the closer the two sample types are closer to each other, the cost function generation module arranged to generate a cost function that can reflect that, and the minimization of the cost function. The classification apparatus according to appendix 1, further comprising: a cost function calculation module that acquires a type value of a measurement sample by detecting a problem.

(付記3)
前記コスト函数は、以下のような函数、又は変形例、

Figure 2014063494

Figure 2014063494
を含み、
前記函数において、Mは、測定標本の数量であり、Nは、残った訓練標本の数量であり、
Figure 2014063494
は、M個の測定標本中で第i個目の測定標本の種類バリューであり、
Figure 2014063494
は、前記N個の訓練標本中で第j個目の訓練標本の種類バリューであり、
Figure 2014063494

は、第i個目の測定標本と第j個目の訓練標本との間の類似性であり、
Figure 2014063494
は、第k個目の測定標本と第l個目の測定標本との間の類似性である付記2に記載の分類装置。 (Appendix 3)
The cost function is a function as shown below, or a modified example,
Figure 2014063494
When
Figure 2014063494
Including
In the function, M is the number of measurement samples, N is the number of remaining training samples,
Figure 2014063494
Is the type value of the i-th measurement sample among the M measurement samples,
Figure 2014063494
Is the type value of the jth training sample in the N training samples,
Figure 2014063494

Is the similarity between the i th measurement sample and the j th training sample,
Figure 2014063494
Is the classification device according to attachment 2, which is a similarity between the k-th measurement sample and the l-th measurement sample.

(付記4)
前記訓練標本は、所定の種類バリューを有している標注標本と、訓練過程において前記標注標本の種類バリューにより種類バリューを得る機器標注標本とを含む付記1乃至付記3のいずれか1項に記載の分類装置。
(Appendix 4)
4. The training sample according to any one of appendix 1 to appendix 3, including a standard sample having a predetermined type value and a device standard sample that obtains a type value from the type value of the standard sample in a training process. Sorter.

(付記5)
前記確定ユニットが確定した目標標本の各集合に相関する訓練標本が前記機器標注標本である付記4に記載の分類装置。
(Appendix 5)
The classification device according to appendix 4, wherein a training sample correlated with each set of target samples determined by the determination unit is the device standard sample.

(付記6)
前記計算ユニットは、種類バリューが削除された訓練標本と目標標本を一緒に前記測定標本とし、且つ得た前記目標標本の種類バリューにより分類結果を確定する付記1乃至付記3のいずれか1項に記載の分類装置。
(Appendix 6)
In any one of appendix 1 to appendix 3, the calculation unit uses the training sample and the target sample from which the type value has been deleted as the measurement sample, and determines the classification result based on the obtained type value of the target sample. The classification device described.

(付記7)
前記計算ユニットは、種類バリューが削除された訓練標本と目標標本を一緒に前記測定標本とし、且つ得た前記目標標本の種類バリューにより分類結果を確定する付記4又は付記5に記載の分類装置。
(Appendix 7)
The classification apparatus according to appendix 4 or appendix 5, wherein the calculation unit uses the training sample and the target sample from which the type value has been deleted as the measurement sample, and determines the classification result based on the obtained type value of the target sample.

(付記8)
新しい種類バリューを獲得した測定標本を次の分類過程中の機器標注標本とする標本更新ユニットをさらに含む付記3、5及び7のいずれか1項に記載の分類装置。
(Appendix 8)
8. The classification device according to any one of appendices 3, 5, and 7, further including a sample update unit that uses a measurement sample that has acquired a new type value as an instrument standard sample in the next classification process.

(付記9)
前記確定ユニットは、前記目標標本の各集合により、前記集合の少なくとも1つの目標標本の間において、類似性が第二所定閾値より大きい訓練標本を前記集合に相関する訓練標本とするように配置される付記1乃至付記8のいずれか1項に記載の分類装置。
(Appendix 9)
The deterministic unit is arranged such that, with each set of target samples, a training sample whose similarity is greater than a second predetermined threshold among at least one target sample of the set is a training sample that correlates to the set. The classification device according to any one of appendix 1 to appendix 8.

(付記10)
前記確定ユニットは、前記目標標本の各集合により、前記集合中で少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本との類似性が第三所定閾値より大きい訓練標本たちを前記集合に相関する訓練標本とするように配置される付記9に記載の分類装置。
(Appendix 10)
The deterministic unit determines, for each set of target samples, training samples whose similarity to at least one target sample in the set is greater than a second predetermined threshold and whose similarity is greater than a third predetermined threshold. The classification device according to appendix 9, which is arranged so as to be a training sample correlated with the set.

(付記11)
前記分類ユニットは、前記目標標本の各種類により、前記集合中の各目標標本と、前記集合中の他の少なくとも1つの目標標本との間の類似性が第四所定閾値より大きくなるように配置されている付記1乃至付記10のいずれか1項に記載の分類装置。
(Appendix 11)
The classification unit is arranged so that the similarity between each target sample in the set and at least one other target sample in the set is greater than a fourth predetermined threshold according to each type of the target sample. The classification device according to any one of appendix 1 to appendix 10, wherein:

(付記12)
前記目標標本と前記訓練標本は、イメージ、動画、本文、又はウェブページ中の一種である付記1乃至付記11のいずれか1項に記載の分類装置。
(Appendix 12)
The classification device according to any one of Supplementary Note 1 to Supplementary Note 11, wherein the target specimen and the training specimen are a kind of an image, a moving image, a text, or a web page.

(付記13)
分類方法において、目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するステップと、前記目標標本の各集合に相関する各訓練標本を確定し、且つ前記訓練標本中の各訓練標本は、いずれも種類バリューを有しているステップと、前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するステップと、前記目標標本を測定標本とし、各測定標本と残った訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するステップと、を含む。
(Appendix 13)
In the classification method, a target sample is classified to form at least one set of the target samples, and each training sample correlated with each set of the target samples is determined, and each training sample in the training sample is determined. Each of which has a kind value and each set of the target samples obtains a difference between the largest kind value and the smallest kind value among the kind values of the training sample correlated with the set. And if the difference is greater than a first predetermined threshold, deleting the training sample type value correlated with the set, and using the target sample as a measurement sample, the similarity between each measurement sample and the remaining training sample The measurement sample type variable by a method of finding and optimizing the solution based on the similarity between the two measurement samples and using the type value of the remaining training sample. Including a step to win over, the.

(付記14)
解を求めて最適化する方法により前記測定標本の種類バリューを獲得するステップは、所定の制限条件、即ち、測定標本と訓練標本との間の類似性が高ければ高いほど、測定標本と訓練標本の種類バリューが接近することと、2つの測定標本間の類似性が高ければ高いほど、2つの測定標本の種類バリューが接近することと、を反映することができるコスト函数を生成するステップと、前記コスト函数の最小化の問題を検出することにより前記測定標本の種類バリューを獲得するステップとを含む付記13に記載の分類方法。
(Appendix 14)
The step of obtaining the type value of the measurement sample by a method of obtaining and optimizing a solution is performed by measuring the measurement sample and the training sample as the similarity between the measurement sample and the training sample increases. Generating a cost function that can reflect that the type value of the two is closer and the higher the similarity between the two measured samples, the closer the type value of the two measured samples are; and The classification method according to claim 13, further comprising: obtaining a type value of the measurement sample by detecting a problem of minimizing the cost function.

(付記15)
前記訓練標本は、所定の種類バリューを有している標注標本と、訓練過程において前記標注標本の種類バリューにより種類バリューを得る機器標注標本とを含む付記13又は付記14に記載の分類方法。
(Appendix 15)
15. The classification method according to appendix 13 or appendix 14, wherein the training sample includes a standard sample having a predetermined type value and an equipment standard sample that obtains a type value from the type value of the standard sample in a training process.

(付記16)
種類バリューが削除された訓練標本と目標標本を一緒に測定標本とし、且つ得た前記目標標本の種類バリューにより分類結果を確定するステップをさらに含む付記13乃至付記15のいずれか1項に記載の分類方法。
(Appendix 16)
The training sample and the target sample from which the type value has been deleted are used as a measurement sample together, and the classification result is determined based on the obtained type value of the target sample, further including the step of any one of the supplementary notes 13 to 15 Classification method.

(付記17)
電子設備において、付記1乃至付記12のいずれか1項に記載の分類装置を含む電子設備。
(Appendix 17)
Electronic equipment, comprising the classification device according to any one of appendix 1 to appendix 12.

(付記18)
前記電子設備は、以下のような設備、即ち、携帯電話、コンピュータ、ダブレットパソコン、携帯情報端末、メディアプレーヤーなど中のいずれかの一種である付記17に記載の電子設備。
(Appendix 18)
The electronic equipment according to supplementary note 17, wherein the electronic equipment is one of the following equipments: a mobile phone, a computer, a doublet personal computer, a portable information terminal, a media player, and the like.

(付記19)
装置読取可能なインストラクションコードが記憶されているプログラムにおいて、前記プルグラムを実行することにより、付記13〜付記16のいずれか1項に記載の分類方法を実施する。
(Appendix 19)
In the program in which the device-readable instruction code is stored, the classification method according to any one of Supplementary Note 13 to Supplementary Note 16 is performed by executing the program.

(付記20)
コンピュータ読取可能なメモリ媒介において、前記メモリ媒介に付記19に記載されているプログラムが記憶されている。
(Appendix 20)
In the computer-readable memory medium, the program described in Appendix 19 is stored in the memory medium.

100 分類装置
110 分類ユニット
120 確定ユニット
130 削除ユニット
140 計算ユニット
310 コスト函数生成モジュール
320 コスト函数算出モジュール
400 分類装置
410 分類ユニット
420 確定ユニット
430 削除ユニット
440 計算ユニット
450 標本更新ユニット
600 通用機器
601 中央処理ユニット(CPU)
602 リードオンリーメモリ(ROM)
603 ランダムアクセスメモリ(RAM)
604 バス
605 入力/出力インタフェース
606 入力装置
607 出力装置
608 メモリ装置
609 通信装置
610 ドライブ装置
611 着脱可能なメモリ媒介
DESCRIPTION OF SYMBOLS 100 Classification apparatus 110 Classification unit 120 Determination unit 130 Deletion unit 140 Calculation unit 310 Cost function generation module 320 Cost function calculation module 400 Classification apparatus 410 Classification unit 420 Determination unit 430 Deletion unit 440 Calculation unit 450 Specimen update unit 600 Common device 601 Central processing Unit (CPU)
602 Read only memory (ROM)
603 Random access memory (RAM)
604 bus 605 input / output interface 606 input device 607 output device 608 memory device 609 communication device 610 drive device 611 removable memory medium

Claims (10)

分類装置において、
目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するように配置されている分類ユニットと、
前記目標標本の各集合に相関する訓練標本をそれぞれ確定するように配置され、且つ前記訓練標本中の各訓練標本は、種類バリューを有している確定ユニットと、
前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するように配置されている削除ユニットと、
前記目標標本を測定標本とし、各測定標本と残った各訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するように配置されている計算ユニットと、を含む分類装置。
In the classification device,
A classification unit arranged to classify target samples and form at least one set of target samples;
A training unit arranged to determine each training sample correlated to each set of target samples, and each training sample in the training sample has a determination unit having a kind value;
With each set of target samples, in the type value of the training sample correlated with the set, if the difference between the maximum type value and the minimum type value is obtained and the difference is greater than a first predetermined threshold, A deletion unit arranged to delete the type value of the training sample correlated to the set; and
Using the target sample as a measurement sample, based on the similarity between each measurement sample and each remaining training sample and the similarity between two measurement samples, and using the type value of the remaining training sample And a calculation unit arranged to obtain the type value of the measurement sample by a method for obtaining and optimizing a solution.
前記計算ユニットは、
所定の制限条件、即ち、測定標本と訓練標本との間の類似性が高ければ高いほど、測定標本と訓練標本の種類バリューが接近することと、2つの測定標本間の類似性が高ければ高いほど、2つの測定標本の種類バリューが接近することと、を反映することができるコスト函数を生成するように配置されているコスト函数生成モジュールと、
前記コスト函数の最小化の問題を検出することにより前記測定標本の種類バリューを獲得するコスト函数算出モジュールと、を含む請求項1に記載の分類装置。
The calculation unit is
The higher the similarity between the measurement sample and the training sample, the higher the similarity between the measurement sample and the training sample and the higher the similarity between the two measurement samples. A cost function generation module arranged to generate a cost function that can reflect the fact that the two sample type values are close to each other, and
The classification apparatus according to claim 1, further comprising: a cost function calculation module that acquires a type value of the measurement sample by detecting a problem of minimization of the cost function.
前記訓練標本は、所定の種類バリューを有している標注標本と、訓練過程において前記標注標本の種類バリューにより種類バリューを得る機器標注標本とを含む請求項1又は2に記載の分類装置。   The classification apparatus according to claim 1, wherein the training sample includes a standard sample having a predetermined type value and a device standard sample that obtains a type value from the type value of the standard sample in a training process. 前記確定ユニットが確定した目標標本の各集合に相関する訓練標本が前記機器標注標本である請求項3に記載の分類装置。   4. The classification apparatus according to claim 3, wherein a training sample correlated with each set of target samples determined by the determination unit is the instrument standard sample. 前記計算ユニットは、種類バリューが削除された訓練標本と目標標本を一緒に測定標本とし、且つ得た前記目標標本の種類バリューにより分類結果を確定する請求項3又は4に記載の分類装置。   The classification device according to claim 3 or 4, wherein the calculation unit uses the training sample and the target sample from which the type value is deleted as a measurement sample, and determines the classification result based on the obtained type value of the target sample. 新しい種類バリューを獲得した測定標本を次の分類過程中の機器標注標本とする標本更新ユニットをさらに含む請求項3乃至請求項5のいずれか1項に記載の分類装置。   6. The classification apparatus according to claim 3, further comprising a sample update unit that uses a measurement sample that has acquired a new type value as an instrument standard sample in the next classification process. 前記確定ユニットは、前記目標標本の各集合により、前記集合の少なくとも1つの目標標本の間において、類似性が第二所定閾値より大きい訓練標本を前記集合に相関する訓練標本とするように配置される請求項1乃至請求項6のいずれか1項に記載の分類装置。   The deterministic unit is arranged such that, with each set of target samples, a training sample whose similarity is greater than a second predetermined threshold among at least one target sample of the set is a training sample that correlates to the set. The classification device according to any one of claims 1 to 6. 前記確定ユニットは、前記目標標本の各集合により、前記集合中で少なくとも1つの目標標本との類似性が第二所定閾値より大きい訓練標本との類似性が第三所定閾値より大きい訓練標本たちを前記集合に相関する訓練標本とするように配置される請求項3に記載の分類装置。   The deterministic unit determines, for each set of target samples, training samples whose similarity to at least one target sample in the set is greater than a second predetermined threshold and whose similarity is greater than a third predetermined threshold. The classification device according to claim 3, wherein the classification device is arranged so as to be a training sample correlated with the set. 分類方法において、
目標標本を分類して、前記目標標本の少なくとも一種の集合を形成するステップと、
前記目標標本の各集合に相関する各訓練標本を確定し、且つ前記訓練標本中の各訓練標本は、いずれも種類バリューを有しているステップと、
前記目標標本の各集合により、前記集合に相関する訓練標本の種類バリュー中において、最大種類バリューと最小種類バリューとの間の差を獲得し、且つ前記差が第一所定閾値より大きい場合、前記集合に相関する訓練標本の種類バリューを削除するステップと、
前記目標標本を測定標本とし、各測定標本と残った訓練標本との間の類似性と、2つの測定標本の間の類似性とに基づき、且つ残った訓練標本の種類バリューを利用して、解を求めて最適化する方法により、前記測定標本の種類バリューを獲得するステップと、を含む分類方法。
In the classification method,
Classifying target samples to form at least one set of target samples;
Determining each training sample correlated to each set of target samples, and each training sample in the training sample all having a type value;
With each set of target samples, in the type value of the training sample correlated with the set, if the difference between the maximum type value and the minimum type value is obtained and the difference is greater than a first predetermined threshold, Deleting the training sample type value correlated to the set; and
Using the target sample as a measurement sample, based on the similarity between each measurement sample and the remaining training sample, and the similarity between the two measurement samples, and using the type value of the remaining training sample, Obtaining a type value of the measurement sample by a method for obtaining and optimizing a solution.
電子設備において、
請求項1乃至請求項8のいずれか1項に記載の分類装置を含む電子設備。
In electronic equipment,
Electronic equipment including the classification device according to any one of claims 1 to 8.
JP2013193252A 2012-09-20 2013-09-18 Classification device, classification method, and electronic equipment Active JP6179305B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210352239.6A CN103679190B (en) 2012-09-20 2012-09-20 Sorter, classification method and electronic equipment
CN201210352239.6 2012-09-20

Publications (2)

Publication Number Publication Date
JP2014063494A true JP2014063494A (en) 2014-04-10
JP6179305B2 JP6179305B2 (en) 2017-08-16

Family

ID=50316678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013193252A Active JP6179305B2 (en) 2012-09-20 2013-09-18 Classification device, classification method, and electronic equipment

Country Status (2)

Country Link
JP (1) JP6179305B2 (en)
CN (1) CN103679190B (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472274A (en) * 2017-09-07 2019-03-15 富士通株式会社 The training device and method of deep learning disaggregated model
CN109840588A (en) * 2019-01-04 2019-06-04 平安科技(深圳)有限公司 Neural network model training method, device, computer equipment and storage medium
CN112819020A (en) * 2019-11-15 2021-05-18 富士通株式会社 Method and device for training classification model and classification method
CN113590812A (en) * 2020-04-30 2021-11-02 阿里巴巴集团控股有限公司 Screening method and device of junk text training samples and electronic equipment

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105118332B (en) * 2015-09-30 2018-01-23 中国民用航空总局第二研究所 A kind of air traffic control analog simulation method for detecting abnormality and device based on clustering methodology
CN105916032A (en) * 2015-12-08 2016-08-31 乐视网信息技术(北京)股份有限公司 Video recommendation method and video recommendation terminal equipment
JP6366852B2 (en) * 2016-02-29 2018-08-01 三菱電機株式会社 Equipment classification device
RU2742824C2 (en) * 2016-03-31 2021-02-11 БИТДЕФЕНДЕР АйПиАр МЕНЕДЖМЕНТ ЛТД Systems and methods of devices automatic detection
CN106228188B (en) 2016-07-22 2020-09-08 北京市商汤科技开发有限公司 Clustering method and device and electronic equipment
CN109478228A (en) * 2016-09-30 2019-03-15 富士通株式会社 Fusion method, device and the electronic equipment of classification results
CN108133224B (en) * 2016-12-01 2021-11-16 富士通株式会社 Method for evaluating complexity of classification task
CN110866533B (en) * 2018-08-27 2023-09-15 富士通株式会社 Apparatus and method for training classification model, and classification apparatus and method
CN112906434A (en) * 2019-12-03 2021-06-04 富士通株式会社 Information processing apparatus, information processing method, and computer program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110064A (en) * 2007-10-26 2009-05-21 Toshiba Corp Sorting model learning apparatus and sorting model learning method
JP2009282686A (en) * 2008-05-21 2009-12-03 Toshiba Corp Apparatus and method for learning classification model
WO2010016109A1 (en) * 2008-08-05 2010-02-11 富士通株式会社 Sample attribution class estimation method, sample attribution class estimation program, and attribution class estimation apparatus

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444796A (en) * 1993-10-18 1995-08-22 Bayer Corporation Method for unsupervised neural network classification with back propagation
US7076473B2 (en) * 2002-04-19 2006-07-11 Mitsubishi Electric Research Labs, Inc. Classification with boosted dyadic kernel discriminants
CN102637433B (en) * 2011-02-09 2015-11-25 富士通株式会社 The method and system of the affective state carried in recognition of speech signals
CN102147866B (en) * 2011-04-20 2012-11-28 上海交通大学 Target identification method based on training Adaboost and support vector machine
CN102364498B (en) * 2011-10-17 2013-11-20 江苏大学 Multi-label-based image recognition method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110064A (en) * 2007-10-26 2009-05-21 Toshiba Corp Sorting model learning apparatus and sorting model learning method
JP2009282686A (en) * 2008-05-21 2009-12-03 Toshiba Corp Apparatus and method for learning classification model
WO2010016109A1 (en) * 2008-08-05 2010-02-11 富士通株式会社 Sample attribution class estimation method, sample attribution class estimation program, and attribution class estimation apparatus

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472274A (en) * 2017-09-07 2019-03-15 富士通株式会社 The training device and method of deep learning disaggregated model
CN109472274B (en) * 2017-09-07 2022-06-28 富士通株式会社 Training device and method for deep learning classification model
CN109840588A (en) * 2019-01-04 2019-06-04 平安科技(深圳)有限公司 Neural network model training method, device, computer equipment and storage medium
CN109840588B (en) * 2019-01-04 2023-09-08 平安科技(深圳)有限公司 Neural network model training method, device, computer equipment and storage medium
CN112819020A (en) * 2019-11-15 2021-05-18 富士通株式会社 Method and device for training classification model and classification method
CN113590812A (en) * 2020-04-30 2021-11-02 阿里巴巴集团控股有限公司 Screening method and device of junk text training samples and electronic equipment
CN113590812B (en) * 2020-04-30 2024-03-05 阿里巴巴集团控股有限公司 Junk text training sample screening method and device and electronic equipment

Also Published As

Publication number Publication date
JP6179305B2 (en) 2017-08-16
CN103679190B (en) 2019-03-01
CN103679190A (en) 2014-03-26

Similar Documents

Publication Publication Date Title
JP6179305B2 (en) Classification device, classification method, and electronic equipment
CN109117831B (en) Training method and device of object detection network
CN109376267B (en) Method and apparatus for generating a model
CN109447156B (en) Method and apparatus for generating a model
CN107133202A (en) Text method of calibration and device based on artificial intelligence
CN109145299A (en) Text similarity determination method, device, equipment and storage medium
US20210158211A1 (en) Linear time algorithms for privacy preserving convex optimization
CN111414987A (en) Training method and training device for neural network and electronic equipment
CN108121699B (en) Method and apparatus for outputting information
US10528649B2 (en) Recognizing unseen fonts based on visual similarity
CN115861462B (en) Training method and device for image generation model, electronic equipment and storage medium
CN113409284B (en) Circuit board fault detection method, device, equipment and storage medium
CN107291774B (en) Error sample identification method and device
CN116596916A (en) Training of defect detection model and defect detection method and device
CN105895089A (en) Speech recognition method and device
US11270065B2 (en) Extracting attributes from embedded table structures
CN107644101B (en) Information classification method and device, information classification equipment and computer readable medium
CN113902687A (en) Methods, devices and media for determining the positivity and positivity of antibodies
Arcaini et al. ROBY: a tool for robustness analysis of neural network classifiers
CN117312140A (en) Method and device for generating test case, electronic equipment and storage medium
CN116468479A (en) Method for determining page quality evaluation dimension, and page quality evaluation method and device
US10631050B2 (en) Determining and correlating visual context on a user device with user behavior using digital content on the user device
CN112561569B (en) Dual-model-based store arrival prediction method, system, electronic equipment and storage medium
CN111859985B (en) AI customer service model test method and device, electronic equipment and storage medium
WO2022105120A1 (en) Text detection method and apparatus from image, computer device and storage medium

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170703

R150 Certificate of patent or registration of utility model

Ref document number: 6179305

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150