WO2022095356A1 - 用于图像分类的迁移学习方法、相关装置及存储介质 - Google Patents

用于图像分类的迁移学习方法、相关装置及存储介质 Download PDF

Info

Publication number
WO2022095356A1
WO2022095356A1 PCT/CN2021/090571 CN2021090571W WO2022095356A1 WO 2022095356 A1 WO2022095356 A1 WO 2022095356A1 CN 2021090571 W CN2021090571 W CN 2021090571W WO 2022095356 A1 WO2022095356 A1 WO 2022095356A1
Authority
WO
WIPO (PCT)
Prior art keywords
image data
domain image
target domain
aligned
target
Prior art date
Application number
PCT/CN2021/090571
Other languages
English (en)
French (fr)
Inventor
罗闯
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2022095356A1 publication Critical patent/WO2022095356A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • the present application relates to the technical field of machine learning, and in particular, to a transfer learning method for image classification, a related device, and a storage medium.
  • the present application provides a transfer learning method, a related device, and a storage medium for image classification, which are beneficial to improve the effect of transfer learning, thereby improving the accuracy of image classification.
  • a first aspect of the embodiments of the present application provides a transfer learning method for image classification, the method comprising:
  • the target domain image data is classified based on the predicted label to obtain a classification result.
  • a second aspect of the embodiments of the present application provides a transfer learning device for image classification, the device comprising:
  • a pseudo-label generation module used to map the source domain image data and the target domain image data to the manifold space, and obtain the pseudo-label of the target domain image data according to the source domain image data in the manifold space;
  • a data alignment module for aligning the source domain image data with the target domain image data with pseudo-labels, to obtain the aligned source domain image data and the aligned target domain image data;
  • the label prediction module is used for constructing a classifier by using the aligned source domain image data, and using the constructed classifier to classify the aligned target domain image data to obtain the predicted label of the target domain image data;
  • a data classification module configured to classify the target domain image data based on the predicted label to obtain a classification result.
  • a third aspect of the embodiments of the present application provides an electronic device, the electronic device includes an input device and an output device, and further includes a processor, adapted to implement one or more instructions; and, a computer storage medium, the computer storage medium storing There are one or more instructions adapted to be loaded by the processor and execute the following methods:
  • the target domain image data is classified based on the predicted label to obtain a classification result.
  • a fourth aspect of the embodiments of the present application provides a computer storage medium, where the computer storage medium stores one or more instructions, and the one or more instructions are suitable for being loaded by a processor and executing the following method:
  • the target domain image data is classified based on the predicted label to obtain a classification result.
  • the embodiment of the present application is conducive to improving the effect of transfer learning, thereby improving the accuracy of image classification.
  • FIG. 1 is a system block diagram of a transfer learning method for image classification provided by an embodiment of the present application
  • FIG. 2 is a schematic flowchart of a transfer learning method for image classification provided by an embodiment of the present application
  • FIG. 3 is an example diagram of obtaining spectral neighbor points according to an embodiment of the present application.
  • FIG. 4 is an example diagram of aligning source domain image data and target domain image data according to an embodiment of the present application
  • FIG. 5 is a schematic flowchart of another transfer learning method for image classification provided by an embodiment of the present application.
  • FIG. 6 is a schematic structural diagram of a transfer learning apparatus for image classification according to an embodiment of the present application.
  • FIG. 7 is a schematic structural diagram of an electronic device according to an embodiment of the present application.
  • the technical solution of the present application relates to the field of artificial intelligence technology, such as machine learning technology, to realize image classification, thereby promoting the construction of smart cities.
  • the data involved in this application such as image data and/or classification results, may be stored in a database, or may be stored in a blockchain, which is not limited in this application.
  • FIG. 1 is a system block diagram of a transfer learning method for image classification provided by an embodiment of the present application.
  • the system includes terminals 11, 12, 13, a server 15, terminals 11, 12, 13 communicate with the server 15 through the network 14, in some examples, the terminals 11, 12, 13 may send a transfer learning request for image classification to the server 15, and the server 15 may provide the terminals 11, 12, 13 in response to the request.
  • Background services such as: obtaining source domain image data and target domain image data from a database through a data protocol interface, mapping them to the popular space, and using spatial filtering to obtain pseudo-labels of the target domain image data; in some examples, the server 15 may Align each category of source domain image data and target domain image data through the data processing interface, use the aligned source domain image data to train a classifier or a classification model, and save or send the constructed classifier to the terminal 11, 12, 13; in some examples, the server 15 may call the constructed classifier through the data classification interface to predict the labels of the aligned target domain image data, classify the target domain image data based on the predicted labels, and classify the target domain image data according to the predicted labels.
  • the classification results are stored or returned to the terminals 11, 12, 13, and so on.
  • the above-mentioned server 15 may be an independent physical server, a server cluster or a distributed system, or may provide cloud services, cloud databases, cloud computing, cloud functions, cloud storage, network services, cloud communications, and middleware services , domain name services, security services, CDN, and cloud servers for basic cloud computing services such as big data and artificial intelligence platforms.
  • FIG. 2 is a schematic flowchart of a transfer learning method for image classification provided by an embodiment of the present application. It can be understood that the method is executed by an electronic device, and the electronic device includes but is not limited to a terminal and a server, such as As shown in Figure 2, the method includes steps S21-S24:
  • the source domain image data refers to images with real labels
  • the target domain image data refers to images without labels
  • the source domain image data can be images in an open source database, or can be The image after labeling the locally stored image, where the locally stored image can be the image collected in any scene such as gate passage, residential area, highway, etc., and the target domain image data can also be the image collected in the above-mentioned scenes. in that there is no label information. Since the feature data in the popular space usually has good geometric properties, the source domain image data and the target domain image data in the original space can be mapped to the manifold space, and the data of the two domains can be processed in the manifold space. Align.
  • the obtaining the pseudo-label of the target domain image data according to the source domain image data includes:
  • the true labels corresponding to the k spectral neighbors are consistent, the true labels of the k spectral neighbors are determined as the pseudo labels of the target data point.
  • the target data point refers to each data point mapped by the target domain image data in the popular space.
  • the k spectral neighbors can be calculated by Euclidean distance or calculated by spectral angular distance, for example: in the popular space Calculate the Euclidean distance between the target data point and the data point in the source domain image data, and determine the k data points with the nearest Euclidean distance as the k spectral neighbors. As shown in Figure 3, for the target data point Xi, its k spectral neighbors X1, X2, X3...Xk can be found in the source domain image data through the calculation of the Euclidean distance.
  • the true labels corresponding to the k spectral neighbors consistently indicate that they belong to the same category, and the spectral characteristics of the target data point are only similar to the spectral characteristics of one category of data in the source domain image data, so the target data point will be classified. to the category to which the k spectral neighbors belong, therefore, the real labels of the k spectral neighbors can be used as the pseudo labels of the target data point. Conversely, if the true labels corresponding to the k spectral neighbors are inconsistent, it means that the spectral features of the target data point are similar to the spectral features of multiple categories of data in the source domain image data. If the k spectral neighbors are also corresponding to A real label of the target data point is used as the pseudo-label of the target data point, and the target data point has a great probability that it will be classified into the wrong category by the classifier.
  • S22 Align the source domain image data with the target domain image data with pseudo labels to obtain the aligned source domain image data and the aligned target domain image data.
  • the alignment operation of the source domain image data with real labels and the target domain image data with pseudo labels is performed, in order to make the target domain image data
  • the data is more separable, and the popular space needs to meet three constraints: the relative relationship between the data points in the manifold space is maintained in the original space; the distance between the data points with the same label in the manifold space is closer; the manifold space The distances between data points with different labels are further apart.
  • the source domain image data and the target domain image data with pseudo labels are aligned to obtain the aligned source domain image data and alignment
  • the latter image data of the target domain includes steps S41-S43:
  • the first objective function includes a mapping matrix to be solved;
  • the first objective function adopts manifold regularization to constrain the data in the respective domains of the source domain image data and the target domain image data Local geometry so that the data points maintain their relative relationship in the original space;
  • the first objective function is expressed as:
  • F represents the mapping matrix to be solved
  • W s and W t represent the graph adjacency matrix of the source domain image data and the target domain image data, respectively, which represent the similarity between the data in the source domain image data and the target domain image data, respectively.
  • the joint Laplacian matrix is obtained from L s and L t
  • X i and X j are any two data in X;
  • ns and nt represent the source domain image data and the target domain image respectively The number of data points for each category in the data.
  • the first matrix refers to the inter-class similarity matrix
  • the minimization of the distance between the data points with the same label in the manifold space through the first matrix and the mapping matrix is realized by a third objective function, and the third objective function is expressed as:
  • S43 Construct a second matrix, and maximize the distance between data points with different labels in the manifold space through the second matrix and the mapping matrix, so as to complete the source domain image data and the pseudo-labeled data points
  • the alignment of the target domain image data obtains the aligned source domain image data and the aligned target domain image data.
  • the second matrix refers to the dissimilarity matrix between classes
  • the maximization of the distance between data points with different labels in the manifold space through the second matrix and the mapping matrix is realized by a fourth objective function, and the fourth objective function is expressed as:
  • the use of the aligned source domain image data to construct a classifier includes:
  • the second objective function is constructed by using the first objective function, the third objective function and the fourth objective function, and the second objective function is expressed as:
  • L is the Laplace matrix, which is expressed as:
  • ⁇ and ⁇ represent the trade-off parameters, which represent the weight of the Laplacian matrix L w in the source domain image data and the target domain image data, respectively. Since the labels of the source domain image data are all true and reliable, while the pseudo labels of the target domain image data There may be bugs, so the two will be weighted differently.
  • the classifier is trained by using the mapped source domain image data to obtain a constructed classifier.
  • the classifier may be a Support Vector Machine (SVM).
  • SVM Support Vector Machine
  • the classifier constructed by this application may also be stored in a blockchain node.
  • the constructed classifier is used to classify the aligned target domain image data to obtain the predicted label of the target domain image data, including:
  • Input Z t into the constructed classifier for classification prediction, and the output is the predicted label of the target domain image data, for example: the predicted label of a certain target domain image data is a vehicle, and the predicted label of a certain target domain image data is a face.
  • the constructed classifier is used to classify the mapped target domain image data to obtain the predicted label of the target domain image data.
  • S24 Classify the target domain image data based on the predicted label to obtain a classification result.
  • the average spectrum of each category of the target domain image data is obtained by using the predicted label of the target domain image data, that is, the centroid of each category of the target domain image data is obtained, so as to realize the source domain image data and the target domain image data.
  • the alignment of each category centroid, the target domain image data is classified into various centroids based on the centroids of the target domain image data, and the final classification result of the target domain image data can be obtained.
  • the pseudo-label of the target domain image data is obtained in the manifold space according to the source domain image data;
  • the source domain image data is aligned with the target domain image data with the pseudo-label, and the aligned source domain image data and the aligned target domain image data are obtained; using the aligned source domain image data constructing a classifier, using the constructed classifier to classify the aligned target domain image data to obtain a predicted label of the target domain image data; classifying the target domain image data based on the predicted label to obtain a classification result.
  • a more accurate pseudo-label of the target domain image data is obtained through spatial filtering, and then the image data of the two domains are aligned, so that the corresponding information between the source domain image data and the target domain image data is richer, and the constructed classifier obtains
  • the predicted labels of the target domain image data are also more representative, which is conducive to improving the effect of transfer learning and thus improving the accuracy of image classification.
  • Fig. 5 is a schematic flowchart of another transfer learning method for image classification provided by the embodiment of the application, as shown in Fig. 5, including steps S51-S56:
  • S56 Classify the target domain image data based on the predicted label to obtain a classification result.
  • an embodiment of the present application further provides a transfer learning device for image classification. Please refer to FIG. 6 .
  • the pseudo-label generation module 61 is used to map the source domain image data and the target domain image data to the manifold space, and obtain the pseudo-label of the target domain image data according to the source domain image data in the manifold space;
  • a data alignment module 62 for aligning the source domain image data with the target domain image data with pseudo-labels, to obtain the aligned source domain image data and the aligned target domain image data;
  • the label prediction module 63 is configured to use the aligned source domain image data to construct a classifier, use the constructed classifier to classify the aligned target domain image data, and obtain the predicted label of the target domain image data ;
  • the data classification module 64 is configured to classify the target domain image data based on the predicted label to obtain a classification result.
  • the pseudo-label generating module 61 is specifically configured to:
  • the true labels corresponding to the k spectral neighbors are consistent, the true labels of the k spectral neighbors are determined as the pseudo labels of the target data point.
  • the aligned source domain image data and the aligned target domain image are obtained.
  • the data alignment module 62 is specifically used for:
  • the first objective function includes a mapping matrix to be solved
  • the label prediction module 63 is specifically configured to:
  • the classifier is trained by using the mapped source domain image data to obtain a constructed classifier.
  • the label prediction module 63 is specifically configured to :
  • the constructed classifier is used to classify the mapped target domain image data to obtain the predicted label of the target domain image data.
  • the first objective function constructed by the data alignment module 62 adopts manifold regularization to constrain the local geometric structures of the data in the respective domains of the source domain image data and the target domain image data, so that the data Points maintain their relative relationship in the original space.
  • the minimizing the distance between data points with the same label in the manifold space by the first matrix and the mapping matrix is implemented by a third objective function;
  • the second matrix and the mapping matrix maximize the distance between data points with different labels in the manifold space using the fourth objective function; in terms of constructing the second objective function, the label prediction module 63 is specifically used for: using the The first objective function, the third objective function, and the fourth objective function construct the second objective function.
  • each unit in the transfer learning apparatus for image classification shown in FIG. 6 may be respectively or all merged into one or several other units to form, or some unit(s) among them. It can also be divided into multiple units with smaller functions, which can realize the same operation without affecting the realization of the technical effects of the embodiments of the present application.
  • the above-mentioned units are divided based on logical functions.
  • the function of one unit may also be implemented by multiple units, or the functions of multiple units may be implemented by one unit.
  • the transfer learning device for image classification may also include other units. In practical applications, these functions may also be implemented with the assistance of other units, and may be implemented by multiple units in cooperation.
  • a general-purpose computing device such as a computer
  • a general-purpose computing device may be implemented on a general-purpose computing device including a central processing unit (CPU), a random access storage medium (RAM), a read-only storage medium (ROM), and other processing elements and storage elements.
  • CPU central processing unit
  • RAM random access storage medium
  • ROM read-only storage medium
  • Running a computer program (including program code) capable of performing the steps involved in the corresponding method as shown in FIG. 1 or FIG. 5, to construct the transfer learning apparatus for image classification as shown in FIG. 6, and to The transfer learning method for image classification according to the embodiment of the present application is implemented.
  • the computer program can be recorded on, for example, a computer-readable recording medium, and loaded in the above-mentioned computing device through the computer-readable recording medium, and executed therein.
  • the embodiments of the present application further provide an electronic device.
  • the electronic device includes at least a processor 71 , an input device 72 , an output device 73 and a computer storage medium 74 .
  • the processor 71 , the input device 72 , the output device 73 and the computer storage medium 74 in the electronic device may be connected by a bus or other means.
  • the computer storage medium 74 can be stored in the memory of the electronic device, the computer storage medium 74 is used for storing a computer program, the computer program includes program instructions, and the processor 71 is used for executing the program stored in the computer storage medium 74 instruction.
  • the processor 71 (or called CPU (Central Processing Unit, central processing unit)) is the computing core and the control core of the electronic device, which is suitable for implementing one or more instructions, and is specifically suitable for loading and executing one or more instructions to achieve Corresponding method flow or corresponding function.
  • CPU Central Processing Unit, central processing unit
  • the processor 71 of the electronic device provided by this embodiment of the present application may be configured to perform a series of processes for transfer learning for image classification:
  • the target domain image data is classified based on the predicted label to obtain a classification result.
  • the processor 71 executes the obtaining of the pseudo-label of the target domain image data according to the source domain image data, including:
  • the true labels corresponding to the k spectral neighbors are consistent, the true labels of the k spectral neighbors are determined as the pseudo labels of the target data point.
  • the processor 71 executes the process of aligning the source domain image data with the target domain image data with pseudo labels to obtain the aligned source domain image data and the aligned target domain image data.
  • Domain image data including:
  • the first objective function includes a mapping matrix to be solved
  • the processor 71 executes the constructing a classifier using the aligned source domain image data, including:
  • the classifier is trained by using the mapped source domain image data to obtain a constructed classifier.
  • the processor 71 performs the classification of the aligned target domain image data using the constructed classifier to obtain the predicted label of the target domain image data, including:
  • the constructed classifier is used to classify the mapped target domain image data to obtain the predicted label of the target domain image data.
  • the first objective function adopts manifold regularization to constrain the local geometric structure of the data in the respective domains of the source domain image data and the target domain image data, so that the data points maintain the relative relationship in the original space.
  • the minimizing the distance between data points with the same label in the manifold space by the first matrix and the mapping matrix is achieved by using a third objective function; the second matrix and The mapping matrix maximizes the distance between data points with different labels in the manifold space using a fourth objective function; the processor 71 executes the construction of the second objective function, including: using the first objective function, the The third objective function and the fourth objective function construct the second objective function.
  • the above electronic device may be a mobile phone, a mobile internet device (MID, mobile internet device), a desktop computer, a tablet computer, a computer host, a server, a cloud server, a server cluster, etc.
  • the electronic device may include but is not limited to a processor. 71.
  • the input device 72 can be a keyboard, a touch screen, etc.
  • the output device 73 can be a speaker, a display, a radio frequency transmitter, and the like.
  • the schematic diagram is only an example of an electronic device, and does not constitute a limitation on the electronic device, and may include more or less components than the one shown, or combine some components, or different components.
  • the processor 71 of the electronic device implements the steps in the above-mentioned transfer learning method for image classification when executing the computer program, the above-mentioned embodiments of the transfer learning method for image classification are all applicable to the electronic device , and can achieve the same or similar beneficial effects.
  • Embodiments of the present application further provide a computer storage medium (Memory), where the computer storage medium is a memory device in an electronic device and is used to store programs and data.
  • the computer storage medium here may include both a built-in storage medium in the terminal, and certainly also an extended storage medium supported by the terminal.
  • the computer storage medium provides storage space, and the storage space stores the operating system of the terminal.
  • one or more instructions suitable for being loaded and executed by the processor 71 are also stored in the storage space, and these instructions may be one or more computer programs (including program codes).
  • the computer storage medium here can be a high-speed RAM memory, or a non-volatile memory (non-volatile memory), such as at least one disk memory; optionally, it can also be at least one memory located far away from the aforementioned processing
  • the computer storage medium of the device 71 can be a high-speed RAM memory, or a non-volatile memory (non-volatile memory), such as at least one disk memory; optionally, it can also be at least one memory located far away from the aforementioned processing
  • the computer storage medium of the device 71 .
  • one or more instructions stored in a computer storage medium may be loaded and executed by the processor 71 to implement the above-mentioned corresponding steps of the transfer learning method for image classification.
  • one or more instructions in the computer storage medium are loaded by the processor 71 and execute the following steps:
  • the target domain image data is classified based on the predicted label to obtain a classification result.
  • the true labels corresponding to the k spectral neighbors are consistent, the true labels of the k spectral neighbors are determined as the pseudo labels of the target data point.
  • the first objective function includes a mapping matrix to be solved
  • the classifier is trained by using the mapped source domain image data to obtain a constructed classifier.
  • the target domain image data after mapping is obtained based on the mapping matrix and the aligned target domain image data;
  • the constructed classifier is used to classify the mapped target domain image data to obtain the predicted label of the target domain image data.
  • the storage medium involved in this application may be a readable storage medium.
  • the storage medium involved in the present application such as a computer storage medium, may be non-volatile or volatile.
  • the computer program of the computer storage medium includes computer program code, which may be in source code form, object code form, executable file or some intermediate form, and the like.
  • the computer-readable medium may include: any entity or device capable of carrying the computer program code, recording medium, U disk, removable hard disk, magnetic disk, optical disk, computer memory, read-only memory (ROM, Read-Only Memory) , Random Access Memory (RAM, Random Access Memory), electric carrier signal, telecommunication signal and software distribution medium, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种用于图像分类的迁移学习方法,涉及人工智能技术领域,其中该方法包括:将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据源域图像数据得到目标域图像数据的伪标签(S21);将源域图像数据与带有伪标签的目标域图像数据对齐,得到对齐后的源域图像数据和对齐后的目标域图像数据(S22);利用对齐后的源域图像数据构建分类器,采用构建好的分类器对对齐后的目标域图像数据进行分类,得到目标域图像数据的预测标签(S23);基于预测标签对目标域图像数据分类,得到分类结果(S24)。所述方法有利于提高迁移学习的效果,进而提高图像分类的准确性。此外,还涉及区块链技术,构建的分类器可存储于区块链节点中。

Description

用于图像分类的迁移学习方法、相关装置及存储介质
本申请要求于2020年11月5日提交中国专利局、申请号为202011228529.0,发明名称为“用于图像分类的迁移学习方法、相关装置及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及机器学习技术领域,尤其涉及一种用于图像分类的迁移学习方法、相关装置及存储介质。
背景技术
随着人工智能和机器学习的发展,迁移学习被广泛应用于图像、文本等各种分类问题中。传统的迁移学习算法通常在源域和目标域数据服从同一分布的假设上,用大量源域数据训练出用于对目标域数据进行分类的分类器,然而实际场景中该假设很难被满足。基于此,发明人发现,现有技术中也提出了减小两个域之间的数据分布差异的方法,认为源域和目标域之间存在着一个公共流形,在公共子空间中对齐源域和目标域的流行以减小二者的分布差异。但是,发明人意识到,实际应用中源域和目标域之间并不存在对应点对来实现两个域流形的对齐,这样的方式并不具有代表性,迁移效果仍然不理想。
发明内容
针对上述问题,本申请提供了一种用于图像分类的迁移学习方法、相关装置及存储介质,有利于提高迁移学习的效果,进而提高图像分类的准确性。
为实现上述目的,本申请实施例第一方面提供了一种用于图像分类的迁移学习方法,该方法包括:
将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
基于所述预测标签对所述目标域图像数据分类,得到分类结果。
本申请实施例第二方面提供了一种用于图像分类的迁移学习装置,该装置包括:
伪标签生成模块,用于将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
数据对齐模块,用于将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
标签预测模块,用于利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
数据分类模块,用于基于所述预测标签对所述目标域图像数据分类,得到分类结果。
本申请实施例第三方面提供了一种电子设备,该电子设备包括输入设备和输出设备,还包括处理器,适于实现一条或多条指令;以及,计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行以下方法:
将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
基于所述预测标签对所述目标域图像数据分类,得到分类结果。
本申请实施例第四方面提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行以下方法:
将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
基于所述预测标签对所述目标域图像数据分类,得到分类结果。
可以看出,本申请实施例有利于提高迁移学习的效果,进而提高图像分类的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种用于图像分类的迁移学习方法的系统框图;
图2为本申请实施例提供的一种用于图像分类的迁移学习方法的流程示意图;
图3为本申请实施例提供的一种获取光谱近邻点的示例图;
图4为本申请实施例提供的一种将源域图像数据和目标域图像数据对齐的示例图;
图5为本申请实施例提供的另一种用于图像分类的迁移学习方法的流程示意图;
图6为本申请实施例提供的一种用于图像分类的迁移学习装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。
本申请的技术方案涉及人工智能技术领域,如可具体涉及机器学习技术,以实现图像分类,从而可推动智慧城市的建设。可选的,本申请涉及的数据如图像数据和/或分类结果等可存储于数据库中,或者可以存储于区块链中,本申请不做限定。
以下结合相关附图对本申请实施例提供的用于图像分类的迁移学习方法进行详细阐述。
请参见图1,图1为本申请实施例提供的一种用于图像分类的迁移学习方法的系统框图,如图1所示,该系统包括终端11、12、13,服务器15,终端11、12、13通过网络14与服务器15通信,在一些示例中,终端11、12、13可以向服务器15发送用于图像分类的迁移学习请求,服务器15可以响应该请求为终端11、12、13提供后台服务,例如:通过数据协议接口从数据库获取源域图像数据和目标域图像数据,并将其映射到流行空间,采用空间滤波获取目标域图像数据的伪标签;在一些示例中,服务器15可通过数据处理接口将源域图像数据和目标域图像数据各个类别进行对齐,并利用对齐后的源域图像数据训练分类器或分类 模型,并可对构建好的分类器进行保存或下发至终端11、12、13;在一些示例中,服务器15可通过数据分类接口调用构建好的分类器预测对齐后的目标域图像数据的标签,基于预测出的标签对目标域图像数据进行分类,并对分类结果进行存储或将分类结果返回到终端11、12、13,等等。其中,上述服务器15可以是独立的物理服务器,也可以是服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
请参见图2,图2为本申请实施例提供的一种用于图像分类的迁移学习方法的流程示意图,可以理解的,该方法由电子设备执行,电子设备包括但不限于终端、服务器,如图2所示,该方法包括步骤S21-S24:
S21,将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签。
本申请具体实施例中,源域图像数据是指带有真实标签的图像,目标域图像数据是指未带有标签的图像,例如:源域图像数据可以是开源数据库中的图像,也可以是对本地存储的图像进行标注后的图像,其中,本地存储的图像可以是闸机通道、小区、高速路等任何场景下采集的图像,目标域图像数据也可以是上述场景下采集的图像,区别在于未带有标签信息。由于在流行空间中的特征数据通常有着很好的几何性质,因此可将原始空间中的源域图像数据和目标域图像数据映射到流形空间,在流形空间中将两个域的数据进行对齐。
在一种可能的实施方式中,所述根据所述源域图像数据得到所述目标域图像数据的伪标签,包括:
针对所述目标域图像数据中的目标数据点,在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点;
判断所述k个光谱近邻点对应的真实标签是否一致;
在所述k个光谱近邻点对应的真实标签一致的情况下,将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
具体的,目标数据点是指目标域图像数据映射在流行空间中的每个数据点,k个光谱近邻点可以通过欧氏距离计算得到,也可以通过光谱角距离计算得到,例如:在流行空间中计算所述目标数据点与源域图像数据中数据点之间的欧氏距离,将欧氏距离最近的k个数据点确定为所述k个光谱近邻点。如图3所示,对于目标数据点Xi,通过欧氏距离的计算在源域图像数据可以找到其k个光谱近邻点X1、X2、X3…Xk。k个光谱近邻点对应的真实标签一致说明其属于同一个类别,而该目标数据点的光谱特征也只与源域图像数据中一个类别的数据的光谱特征相似,该目标数据点就会被分类到k个光谱近邻点所属的类别,因此,可以将所述k个光谱近邻点的真实标签作为该目标数据点的伪标签。相反地,若k个光谱近邻点对应的真实标签不一致,则说明该目标数据点的光谱特征与源域图像数据中多个类别的数据的光谱特征相似,若还将这k个光谱近邻点对应的某个真实标签作为该目标数据点的伪标签,则该目标数据点有极大的概率会被分类器分错类别。
S22,将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
本申请具体实施例中,在得到带有伪标签的目标域图像数据后,执行将带有真实标签的源域图像数据与带有伪标签的目标域图像数据的对齐操作,为了使目标域图像数据更具备可分性,流行空间需要满足三个约束条件:流形空间中数据点保持在原始空间中的相对关系;流形空间中标签相同的数据点之间的距离更近;流形空间中标签不同的数据点之间的距离更远。通过这三个约束条件,使源域和目标域之间各个类别的数据对齐,分布一致, 也充分增大了不同类别数据之间的可分性。
在一种可能的实施方式中,如图4所示,所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据,包括步骤S41-S43:
S41,构建第一目标函数;所述第一目标函数包括待求解的映射矩阵;所述第一目标函数采用流形正则化约束所述源域图像数据和所述目标域图像数据各自域内数据的局部几何结构,使得数据点保持在原始空间中的相对关系;
具体的,第一目标函数表示为:
Figure PCTCN2021090571-appb-000001
其中,F表示待求解的映射矩阵;W s和W t分别表示源域图像数据和目标域图像数据的图邻接矩阵,分别表示了源域图像数据和目标域图像数据域内数据之间的相似性关系;L s=D s-W s和L t=D t-W t,分别表示源域图像数据和目标域图像数据的图拉普拉斯矩阵,D s=∑ jW s和D t=∑ jW t分别表示源域图像数据和目标域图像数据的对角矩阵;由L s和L t得到联合拉普拉斯矩阵
Figure PCTCN2021090571-appb-000002
由D s和D t得到联合对角矩阵
Figure PCTCN2021090571-appb-000003
X=[X s;X t]包含了源域图像数据和目标域图像数据;X i和X j为X中的任意两个数据;n s和n t分别表示源域图像数据和目标域图像数据中各类别的数据点数目。
S42,构建第一矩阵,通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离;
具体的,第一矩阵是指类间相似矩阵
Figure PCTCN2021090571-appb-000004
其中,针对流形空间中类别相同的数据点,W w(i,j)=1;针对流形空间中类别不同的数据点,W w(i,j)=0。所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现,第三目标函数表示为:
Figure PCTCN2021090571-appb-000005
其中,
Figure PCTCN2021090571-appb-000006
表示W w的拉图拉斯矩阵;D w=∑ jW w,表示W w的对角矩阵;通过最小化该第一公式使流形空间中标签相同的数据点对齐,分布变得一致。
S43,构建第二矩阵,通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离,以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
具体的,第二矩阵是指类间不相似矩阵
Figure PCTCN2021090571-appb-000007
其中,针对流形空间中类别相同的数据点,W b(i,j)=1;针对流形空间中类别相同的数据点,W b(i,j)=0。所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现,第四目标函数表示为:
Figure PCTCN2021090571-appb-000008
其中,
Figure PCTCN2021090571-appb-000009
表示W b的拉图拉斯矩阵;D b=∑ jW b,表示W b的对角矩阵;通过最大化该第二公式使流形空间中标签不同的数据点更具可分性。
S23,利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签。
本申请具体实施例中,在一种可能的实施方式中,所述利用对齐后的所述源域图像数据构建分类器,包括:
构建第二目标函数。具体的,利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数,第二目标函数表示为:
min tr(F TXLX TF)s.t.F TXL bX TF=I
其中,L为拉普拉斯矩阵,表示为:
Figure PCTCN2021090571-appb-000010
μ和η表示权衡参数,分别表示拉普拉斯矩阵L w在源域图像数据和目标域图像数据的权重,由于源域图像数据的标签都是真实可靠的,而目标域图像数据的伪标签可能存在错误,因此两者的权重会不一样。
求解所述第二目标函数,得到所述映射矩阵F。
基于所述映射矩阵F以及对齐后的所述源域图像数据得到映射后的所述源域图像数据。即按照映射矩阵F将对齐后的所述源域图像数据映射为新的源域图像数据,得到映射后的源域图像数据,表示为:Z s=F TX s,Z s表示映射后的源域图像数据。
利用映射后的所述源域图像数据对分类器进行训练,得到构建好的分类器。可选的,该分类器可以是支持向量机(Support Vector Machine,SVM)。在一些实施例中,本申请构建好的分类器还可以存储于区块链节点中。
在一种可能的实施方式中,所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签,包括:
基于所述映射矩阵F以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据。即按照映射矩阵F将对齐后的所述目标域图像数据映射为新的目标域图像数据,得到映射后的目标域图像数据,表示为:Z t=F TX t,Z t表示映射后的目标域图像数据。即将Z t输入构建好的分类器进行分类预测,其输出为目标域图像数据的预测标签,例如:某个目标域图像数据的预测标签为车辆,某个目标域图像数据的预测标签为人脸。
利用构建好的分类器对映射后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签。
S24,基于所述预测标签对所述目标域图像数据分类,得到分类结果。
本申请具体实施例中,用目标域图像数据的预测标签求取目标域图像数据各个类别的平均光谱,即得到目标域图像数据各个类别的类心,从而实现源域图像数据和目标域图像数据各个类别类心的对齐,基于目标域图像数据各类别的类心将目标域图像数据分类到各类心下,即可得到目标域图像数据最终的分类结果。
可以看出,本申请实施例通过将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;基于所述预测标签对所述目标域图像数据分类,得到分类结果。这样通过空间滤波得到目标域图像数据更精确的伪标签,然后再将两个域的图像数据进行对齐,使得源域图像数据和目标域图像数据之间对应的信息更加丰富,构建的分类器得到的目标域图像数据的预测标签也更加具有代表性,从而有利于提高迁移学习的效果,进而提高图像分类的准确性。
请参见图5,图5为本申请实施例提供的另一种用于图像分类的迁移学习方法的流程示 意图,如图5所示,包括步骤S51-S56:
S51,将源域图像数据和目标域图像数据映射到流形空间,在流形空间中,针对所述目标域图像数据中的目标数据点,在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点;
S52,判断所述k个光谱近邻点对应的真实标签是否一致;
S53,在所述k个光谱近邻点对应的真实标签一致的情况下,将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签;
S54,将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
S55,利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
S56,基于所述预测标签对所述目标域图像数据分类,得到分类结果。
其中,上述步骤S51-S56的具体实施方式,在图2所示的实施例中已有相关说明,且能达到相同或相似的有益效果,此处不再赘述。
基于图1或图5所示方法实施例的描述,本申请实施例还提供一种用于图像分类的迁移学习装置,请参见图6,图6为本申请实施例提供的一种用于图像分类的迁移学习装置的结构示意图,如图6所示,该装置包括:
伪标签生成模块61,用于将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
数据对齐模块62,用于将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
标签预测模块63,用于利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
数据分类模块64,用于基于所述预测标签对所述目标域图像数据分类,得到分类结果。
在一种可能的实施方式中,在根据所述源域图像数据得到所述目标域图像数据的伪标签方面,所述伪标签生成模块61具体用于:
针对所述目标域图像数据中的目标数据点,在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点;
判断所述k个光谱近邻点对应的真实标签是否一致;
在所述k个光谱近邻点对应的真实标签一致的情况下,将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
在一种可能的实施方式中,在将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据方面,所述数据对齐模块62具体用于:
构建第一目标函数;所述第一目标函数包括待求解的映射矩阵;
构建第一矩阵,通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离;
构建第二矩阵,通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离,以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
在一种可能的实施方式中,在利用对齐后的所述源域图像数据构建分类器方面,所述标签预测模块63具体用于:
构建第二目标函数;
求解所述第二目标函数,得到所述映射矩阵;
基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据;
利用映射后的所述源域图像数据对分类器进行训练,得到构建好的分类器。
在一种可能的实施方式中,在采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签方面,所述标签预测模块63具体用于:
基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据;
利用构建好的分类器对映射后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签。
在一种可能的实施方式中,所述数据对齐模块62构建的第一目标函数采用流形正则化约束所述源域图像数据和所述目标域图像数据各自域内数据的局部几何结构,使得数据点保持在原始空间中的相对关系。
在一种可能的实施方式中,所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现;所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现;在构建第二目标函数方面,所述标签预测模块63具体用于:利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。
根据本申请的一个实施例,图6所示的用于图像分类的迁移学习装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其它实施例中,基于用于图像分类的迁移学习装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的另一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图1或图5中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图6中所示的用于图像分类的迁移学习装置设备,以及来实现本申请实施例的用于图像分类的迁移学习方法。所述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
基于上述方法实施例和装置实施例的描述,本申请实施例还提供一种电子设备。请参见图7,该电子设备至少包括处理器71、输入设备72、输出设备73以及计算机存储介质74。其中,电子设备内的处理器71、输入设备72、输出设备73以及计算机存储介质74可通过总线或其他方式连接。
计算机存储介质74可以存储在电子设备的存储器中,所述计算机存储介质74用于存储计算机程序,所述计算机程序包括程序指令,所述处理器71用于执行所述计算机存储介质74存储的程序指令。处理器71(或称CPU(Central Processing Unit,中央处理器))是电子设备的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能。
在一个实施例中,本申请实施例提供的电子设备的处理器71可以用于进行一系列用于图像分类的迁移学习的处理:
将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
基于所述预测标签对所述目标域图像数据分类,得到分类结果。
再一个实施例中,处理器71执行所述根据所述源域图像数据得到所述目标域图像数据的伪标签,包括:
针对所述目标域图像数据中的目标数据点,在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点;
判断所述k个光谱近邻点对应的真实标签是否一致;
在所述k个光谱近邻点对应的真实标签一致的情况下,将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
再一个实施例中,处理器71执行所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据,包括:
构建第一目标函数;所述第一目标函数包括待求解的映射矩阵;
构建第一矩阵,通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离;
构建第二矩阵,通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离,以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
再一个实施例中,处理器71执行所述利用对齐后的所述源域图像数据构建分类器,包括:
构建第二目标函数;
求解所述第二目标函数,得到所述映射矩阵;
基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据;
利用映射后的所述源域图像数据对分类器进行训练,得到构建好的分类器。
再一个实施例中,处理器71执行所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签,包括:
基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据;
利用构建好的分类器对映射后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签。
再一个实施例中,所述第一目标函数采用流形正则化约束所述源域图像数据和所述目标域图像数据各自域内数据的局部几何结构,使得数据点保持在原始空间中的相对关系。
再一个实施例中,所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现;所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现;处理器71执行所述构建第二目标函数,包括:利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。
示例性的,上述电子设备可以是手机、移动互联网设备(MID,mobile internet device)、桌上电脑、平板电脑、电脑主机、服务器、云服务器、服务器集群等,电子设备可包括但不仅限于处理器71、输入设备72、输出设备73以及计算机存储介质74,输入设备72可以是键盘、触摸屏等,输出设备73可以是扬声器、显示器、射频发送器等。本领域技术人员可以理解,所述示意图仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
需要说明的是,由于电子设备的处理器71执行计算机程序时实现上述的用于图像分类 的迁移学习方法中的步骤,因此上述用于图像分类的迁移学习方法的实施例均适用于该电子设备,且均能达到相同或相似的有益效果。
本申请实施例还提供了一种计算机存储介质(Memory),所述计算机存储介质是电子设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括终端中的内置存储介质,当然也可以包括终端所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器71加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的,还可以是至少一个位于远离前述处理器71的计算机存储介质。在一个实施例中,可由处理器71加载并执行计算机存储介质中存放的一条或多条指令,以实现上述有关用于图像分类的迁移学习方法的相应步骤。具体实现中,计算机存储介质中的一条或多条指令由处理器71加载并执行如下步骤:
将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
基于所述预测标签对所述目标域图像数据分类,得到分类结果。
再一种示例中,计算机存储介质中的一条或多条指令由处理器71加载时还执行如下步骤:
针对所述目标域图像数据中的目标数据点,在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点;
判断所述k个光谱近邻点对应的真实标签是否一致;
在所述k个光谱近邻点对应的真实标签一致的情况下,将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
再一种示例中,计算机存储介质中的一条或多条指令由处理器71加载时还执行如下步骤:
构建第一目标函数;所述第一目标函数包括待求解的映射矩阵;
构建第一矩阵,通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离;
构建第二矩阵,通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离,以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
再一种示例中,计算机存储介质中的一条或多条指令由处理器71加载时还执行如下步骤:
构建第二目标函数;
求解所述第二目标函数,得到所述映射矩阵;
基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据;
利用映射后的所述源域图像数据对分类器进行训练,得到构建好的分类器。
再一种示例中,计算机存储介质中的一条或多条指令由处理器71加载时还执行如下步骤:
基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数 据;
利用构建好的分类器对映射后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签。
再一种示例中,计算机存储介质中的一条或多条指令由处理器71加载时还执行如下步骤:利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。
可选的,本申请涉及的存储介质可以是可读存储介质。进一步可选的,本申请涉及的存储介质如计算机存储介质可以是非易失性的,也可以是易失性的。
示例性的,计算机存储介质的计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,由于计算机存储介质的计算机程序被处理器执行时实现上述的用于图像分类的迁移学习方法中的步骤,因此上述用于图像分类的迁移学习方法的所有实施例均适用于该计算机存储介质,且均能达到相同或相似的有益效果。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (20)

  1. 一种用于图像分类的迁移学习方法,其中,所述方法包括:
    将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
    将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
    利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
    基于所述预测标签对所述目标域图像数据分类,得到分类结果。
  2. 根据权利要求1所述的方法,其中,所述根据所述源域图像数据得到所述目标域图像数据的伪标签,包括:
    针对所述目标域图像数据中的目标数据点,在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点;
    判断所述k个光谱近邻点对应的真实标签是否一致;
    在所述k个光谱近邻点对应的真实标签一致的情况下,将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
  3. 根据权利要求1所述的方法,其中,所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据,包括:
    构建第一目标函数;所述第一目标函数包括待求解的映射矩阵;
    构建第一矩阵,通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离;
    构建第二矩阵,通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离,以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
  4. 根据权利要求3所述的方法,其中,所述利用对齐后的所述源域图像数据构建分类器,包括:
    构建第二目标函数;
    求解所述第二目标函数,得到所述映射矩阵;
    基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据;
    利用映射后的所述源域图像数据对分类器进行训练,得到构建好的分类器。
  5. 根据权利要求3所述的方法,其中,所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签,包括:
    基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据;
    利用构建好的分类器对映射后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签。
  6. 根据权利要求3所述的方法,其中,所述第一目标函数采用流形正则化约束所述源域图像数据和所述目标域图像数据各自域内数据的局部几何结构,使得数据点保持在原始空间中的相对关系。
  7. 根据权利要求4所述的方法,其中,所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现;所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现;
    所述构建第二目标函数,包括:利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。
  8. 一种用于图像分类的迁移学习装置,其中,所述装置包括:
    伪标签生成模块,用于将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
    数据对齐模块,用于将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
    标签预测模块,用于利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
    数据分类模块,用于基于所述预测标签对所述目标域图像数据分类,得到分类结果。
  9. 一种电子设备,包括输入设备和输出设备,其中,还包括:
    处理器,适于实现一条或多条指令;以及,
    计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行以下方法:
    将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
    将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
    利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
    基于所述预测标签对所述目标域图像数据分类,得到分类结果。
  10. 根据权利要求9所述的电子设备,其中,执行所述根据所述源域图像数据得到所述目标域图像数据的伪标签,包括:
    针对所述目标域图像数据中的目标数据点,在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点;
    判断所述k个光谱近邻点对应的真实标签是否一致;
    在所述k个光谱近邻点对应的真实标签一致的情况下,将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
  11. 根据权利要求9所述的电子设备,其中,执行所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据,包括:
    构建第一目标函数;所述第一目标函数包括待求解的映射矩阵;
    构建第一矩阵,通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离;
    构建第二矩阵,通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离,以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
  12. 根据权利要求11所述的电子设备,其中,执行所述利用对齐后的所述源域图像数据构建分类器,包括:
    构建第二目标函数;
    求解所述第二目标函数,得到所述映射矩阵;
    基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据;
    利用映射后的所述源域图像数据对分类器进行训练,得到构建好的分类器。
  13. 根据权利要求11所述的电子设备,其中,执行所述采用构建好的分类器对对齐后 的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签,包括:
    基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据;
    利用构建好的分类器对映射后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签。
  14. 根据权利要求12所述的电子设备,其中,所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现;所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现;
    执行所述构建第二目标函数,包括:利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。
  15. 一种计算机存储介质,其中,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行以下方法:
    将源域图像数据和目标域图像数据映射到流形空间,在流形空间中根据所述源域图像数据得到所述目标域图像数据的伪标签;
    将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据;
    利用对齐后的所述源域图像数据构建分类器,采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签;
    基于所述预测标签对所述目标域图像数据分类,得到分类结果。
  16. 根据权利要求15所述的计算机存储介质,其中,执行所述根据所述源域图像数据得到所述目标域图像数据的伪标签,包括:
    针对所述目标域图像数据中的目标数据点,在所述源域图像数据中确定出所述目标数据点的k个光谱近邻点;
    判断所述k个光谱近邻点对应的真实标签是否一致;
    在所述k个光谱近邻点对应的真实标签一致的情况下,将所述k个光谱近邻点的真实标签确定为所述目标数据点的伪标签。
  17. 根据权利要求15所述的计算机存储介质,其中,执行所述将所述源域图像数据与带有伪标签的所述目标域图像数据对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据,包括:
    构建第一目标函数;所述第一目标函数包括待求解的映射矩阵;
    构建第一矩阵,通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离;
    构建第二矩阵,通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离,以完成所述源域图像数据与带有伪标签的所述目标域图像数据的对齐,得到对齐后的所述源域图像数据和对齐后的所述目标域图像数据。
  18. 根据权利要求17所述的计算机存储介质,其中,执行所述利用对齐后的所述源域图像数据构建分类器,包括:
    构建第二目标函数;
    求解所述第二目标函数,得到所述映射矩阵;
    基于所述映射矩阵以及对齐后的所述源域图像数据得到映射后的所述源域图像数据;
    利用映射后的所述源域图像数据对分类器进行训练,得到构建好的分类器。
  19. 根据权利要求17所述的计算机存储介质,其中,执行所述采用构建好的分类器对对齐后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签,包括:
    基于所述映射矩阵以及对齐后的所述目标域图像数据得到映射后的所述目标域图像数据;
    利用构建好的分类器对映射后的所述目标域图像数据进行分类,得到所述目标域图像数据的预测标签。
  20. 根据权利要求18所述的计算机存储介质,其中,所述通过所述第一矩阵和所述映射矩阵最小化流形空间中标签相同的数据点之间的距离采用第三目标函数实现;所述通过所述第二矩阵和所述映射矩阵最大化流形空间中标签不同的数据点之间的距离采用第四目标函数实现;
    执行所述构建第二目标函数,包括:利用所述第一目标函数、所述第三目标函数以及所述第四目标函数构建所述第二目标函数。
PCT/CN2021/090571 2020-11-05 2021-04-28 用于图像分类的迁移学习方法、相关装置及存储介质 WO2022095356A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011228529.0 2020-11-05
CN202011228529.0A CN112348081B (zh) 2020-11-05 2020-11-05 用于图像分类的迁移学习方法、相关装置及存储介质

Publications (1)

Publication Number Publication Date
WO2022095356A1 true WO2022095356A1 (zh) 2022-05-12

Family

ID=74428862

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/090571 WO2022095356A1 (zh) 2020-11-05 2021-04-28 用于图像分类的迁移学习方法、相关装置及存储介质

Country Status (2)

Country Link
CN (1) CN112348081B (zh)
WO (1) WO2022095356A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115019084A (zh) * 2022-05-16 2022-09-06 电子科技大学 一种基于张量多属性特征迁移的分类方法
CN117096070A (zh) * 2023-10-19 2023-11-21 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于领域自适应的半导体加工工艺异常检测方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348081B (zh) * 2020-11-05 2024-04-02 平安科技(深圳)有限公司 用于图像分类的迁移学习方法、相关装置及存储介质
CN112733970B (zh) * 2021-03-31 2021-06-18 腾讯科技(深圳)有限公司 图像分类模型处理方法、图像分类方法及装置
CN113269352B (zh) * 2021-04-29 2023-09-22 哈工智慧(武汉)科技有限公司 基于移动互联网的城市内涝监测预警方法、系统及介质
CN113837133A (zh) * 2021-09-29 2021-12-24 维沃移动通信有限公司 摄像头数据迁移方法及其装置
CN113920382B (zh) * 2021-12-15 2022-03-15 深圳大学 基于类一致性结构化学习的跨域图像分类方法和相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635951A (zh) * 2018-12-18 2019-04-16 哈尔滨工业大学 基于加权分布对齐和几何特征对齐的无监督跨领域自适应数据标定方法及系统
CN110210545A (zh) * 2019-05-27 2019-09-06 河海大学 基于迁移学习的红外遥感水体分类器构建方法
CN110503134A (zh) * 2019-07-29 2019-11-26 沈阳大学 一种基于流行距离核的迁移谱聚处理方法
CN111444859A (zh) * 2020-03-30 2020-07-24 哈尔滨工程大学 一种无监督跨域人脸表情识别方法
CN112348081A (zh) * 2020-11-05 2021-02-09 平安科技(深圳)有限公司 用于图像分类的迁移学习方法、相关装置及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11693392B2 (en) * 2019-01-30 2023-07-04 Hitachi, Ltd. System for manufacturing dispatching using deep reinforcement and transfer learning
CN111723661B (zh) * 2020-05-18 2023-06-16 广州光达创新科技有限公司 一种基于流形嵌入分布对齐的脑机接口迁移学习方法
CN111695456B (zh) * 2020-05-28 2023-12-19 钟晓璇 一种基于主动判别性跨域对齐的低分辨人脸识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635951A (zh) * 2018-12-18 2019-04-16 哈尔滨工业大学 基于加权分布对齐和几何特征对齐的无监督跨领域自适应数据标定方法及系统
CN110210545A (zh) * 2019-05-27 2019-09-06 河海大学 基于迁移学习的红外遥感水体分类器构建方法
CN110503134A (zh) * 2019-07-29 2019-11-26 沈阳大学 一种基于流行距离核的迁移谱聚处理方法
CN111444859A (zh) * 2020-03-30 2020-07-24 哈尔滨工程大学 一种无监督跨域人脸表情识别方法
CN112348081A (zh) * 2020-11-05 2021-02-09 平安科技(深圳)有限公司 用于图像分类的迁移学习方法、相关装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG CHANG, MAHADEVAN SRIDHAR: "Heterogeneous Domain Adaptation Using Manifold Alignment", IJCAI 2011, PROCEEDINGS OF THE 22ND INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE, 31 December 2011 (2011-12-31), pages 1541 - 1546, XP055927971 *
WANG JINDONG WANGJINDONG@ICT.AC.CN; FENG WENJIE FENGWENJIE@SOFTWARE.ICT.AC.CN; CHEN YIQIANG YQCHEN@ICT.AC.CN; YU HAN HAN.YU@NTU.ED: "Visual Domain Adaptation with Manifold Embedded Distribution Alignment", MULTIMEDIA, ACM, 2 PENN PLAZA, SUITE 701NEW YORKNY10121-0701USA, 15 October 2018 (2018-10-15) - 26 October 2018 (2018-10-26), 2 Penn Plaza, Suite 701New YorkNY10121-0701USA , pages 402 - 410, XP058544311, ISBN: 978-1-4503-5665-7, DOI: 10.1145/3240508.3240512 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115019084A (zh) * 2022-05-16 2022-09-06 电子科技大学 一种基于张量多属性特征迁移的分类方法
CN115019084B (zh) * 2022-05-16 2024-05-28 电子科技大学 一种基于张量多属性特征迁移的分类方法
CN117096070A (zh) * 2023-10-19 2023-11-21 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于领域自适应的半导体加工工艺异常检测方法
CN117096070B (zh) * 2023-10-19 2024-01-05 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于领域自适应的半导体加工工艺异常检测方法

Also Published As

Publication number Publication date
CN112348081B (zh) 2024-04-02
CN112348081A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
WO2022095356A1 (zh) 用于图像分类的迁移学习方法、相关装置及存储介质
Chen et al. An edge traffic flow detection scheme based on deep learning in an intelligent transportation system
CN111027563A (zh) 一种文本检测方法、装置及识别系统
WO2021143267A1 (zh) 基于图像检测的细粒度分类模型处理方法、及其相关设备
CN112651438A (zh) 多类别图像的分类方法、装置、终端设备和存储介质
WO2018212711A1 (en) Predictive analysis methods and systems
Sahbi Imageclef annotation with explicit context-aware kernel maps
CN113011568B (zh) 一种模型的训练方法、数据处理方法及设备
WO2023142551A1 (zh) 模型训练及图像识别方法和装置、设备、存储介质和计算机程序产品
WO2022088390A1 (zh) 图像的增量聚类方法、装置、电子设备、存储介质及程序产品
CN112614110B (zh) 评估图像质量的方法、装置及终端设备
WO2022121447A1 (zh) 背景音频构建方法及装置
CN110874618A (zh) 基于小样本的ocr模板学习方法、装置、电子设备及介质
WO2023024413A1 (zh) 信息的匹配方法、装置、计算机设备及可读存储介质
CN110689046A (zh) 图像识别方法、装置、计算机装置及存储介质
CN112668482A (zh) 人脸识别训练方法、装置、计算机设备及存储介质
WO2023020214A1 (zh) 检索模型的训练和检索方法、装置、设备及介质
CN110717405B (zh) 人脸特征点定位方法、装置、介质及电子设备
WO2022001233A1 (zh) 基于层次化迁移学习的预标注方法及其相关设备
CN113361384A (zh) 人脸识别模型压缩方法、设备、介质及计算机程序产品
Jin et al. Text2poster: Laying out stylized texts on retrieved images
CN114819138A (zh) 图数据处理方法、装置、电子设备及存储介质
Oh et al. Deep feature learning for person re-identification in a large-scale crowdsourced environment
CN110826726B (zh) 目标处理方法、目标处理装置、目标处理设备及介质
Huang et al. A Hybrid Clustering Approach for Bag‐of‐Words Image Categorization

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21888060

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21888060

Country of ref document: EP

Kind code of ref document: A1