WO2022156067A1 - 商标相似性检测方法、装置、电子设备和存储介质 - Google Patents
商标相似性检测方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- WO2022156067A1 WO2022156067A1 PCT/CN2021/083877 CN2021083877W WO2022156067A1 WO 2022156067 A1 WO2022156067 A1 WO 2022156067A1 CN 2021083877 W CN2021083877 W CN 2021083877W WO 2022156067 A1 WO2022156067 A1 WO 2022156067A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- trademark
- image
- vector
- word
- detected
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000013598 vector Substances 0.000 claims abstract description 202
- 238000000605 extraction Methods 0.000 claims abstract description 68
- 238000013434 data augmentation Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims description 74
- 238000001514 detection method Methods 0.000 claims description 42
- 238000004590 computer program Methods 0.000 claims description 15
- 238000003708 edge detection Methods 0.000 claims description 8
- 238000003709 image segmentation Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 235000002566 Capsicum Nutrition 0.000 claims description 6
- 239000006002 Pepper Substances 0.000 claims description 6
- 241000722363 Piper Species 0.000 claims description 6
- 235000016761 Piper aduncum Nutrition 0.000 claims description 6
- 235000017804 Piper guineense Nutrition 0.000 claims description 6
- 235000008184 Piper nigrum Nutrition 0.000 claims description 6
- 239000000654 additive Substances 0.000 claims description 6
- 230000000996 additive effect Effects 0.000 claims description 6
- 150000003839 salts Chemical class 0.000 claims description 6
- 238000013519 translation Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Definitions
- the present application relates to the technical field of artificial intelligence, and in particular, to a method, device, electronic device and storage medium for detecting similarity of trademarks.
- a trademark as a distinctive sign of the goods or services provided by an operator, represents to a certain extent the operator and the reputation it has accumulated in the field in which it operates, and symbolizes the credibility and reliability of the operator.
- the reputation of the operator represented by the trademark because of the reputation of the operator represented by the trademark, the nature and quality of the product or service that the trademark can describe is consistent. This can help consumers identify and purchase certain products or services.
- a trademark can be said to be an intangible asset of an enterprise, and its importance is self-evident. Therefore, the trademark must be unique enough to avoid confusion or conflict with other trademarks.
- the market is flooded with counterfeit trademarks of various large or well-known companies, which not only disrupts the market order, but also seriously affects the reputation of large or well-known companies.
- Similarity of trademarks refers to the similarity in the shape, pronunciation, meaning or the composition, coloring and appearance of the words of the two trademarks, or the overall arrangement and combination of the words and graphics after the combination is similar to the appearance, or the shape and appearance of the three-dimensional signs thereof are similar, or Its colors or color combinations are similar, and the use of the same or similar goods or services is likely to cause the relevant public to misunderstand the source of the goods or services.
- these methods are slow to calculate, and the accuracy of trademark similarity is easily affected by factors such as noise interference, resulting in low accuracy of similarity calculation.
- the embodiments of the present application provide a method, device, electronic device and storage medium for detecting similarity of trademarks, which can improve the efficiency of obtaining similarity of trademarks and ensure the accuracy of similarity. Spend.
- embodiments of the present application provide a method for detecting similarity of trademarks, including:
- embodiments of the present application provide a trademark similarity detection device, including:
- the preprocessing module is used to perform data augmentation on the first trademark sample to obtain the second trademark sample;
- a training module used for model training according to the second trademark sample to obtain a feature extraction model
- an extraction module for inputting the first trademark image to be detected into the feature extraction model to obtain a first feature vector, and inputting the second trademark image to be detected into the feature extraction model to obtain a second feature vector;
- a processing module configured to determine the similarity between the first trademark image to be detected and the second trademark image to be detected according to the first feature vector and the second feature vector;
- embodiments of the present application provide an electronic device, including: a processor, where the processor is connected to a memory, the memory is used for storing a computer program, and the processor is used for executing the computer program stored in the memory, so that the electronic device executes the following method :
- embodiments of the present application provide a computer-readable storage medium, where the computer-readable storage medium stores a computer program, and the computer program causes a computer to execute the following method:
- the embodiment of the present application by performing data augmentation on the trademark samples used for training, the data of the training samples in various situations is fully expanded, so that the trained model can be used in various scales and scales of the trademark image. It has good robustness under the viewing angle and various interference conditions. At the same time, the accuracy of the subsequent calculation of the similarity of the trademark is not easily affected by factors such as image deformation, light intensity, noise interference, and the like. In addition, compared with the traditional method of manually extracting features, the embodiment of the present application realizes the automatic execution of trademark similarity detection, and has the advantages of rapidity, high efficiency, and low missed detection rate.
- FIG. 1 is a schematic flowchart of a method for detecting similarity of trademarks provided by an embodiment of the present application
- FIG. 2 is a schematic diagram of an operation flow of another feature extraction model provided by an embodiment of the present application.
- FIG. 3 is a schematic flowchart of obtaining a text vector according to an embodiment of the present application.
- FIG. 4 is a block diagram of functional modules of a trademark similarity detection apparatus provided by an embodiment of the present application.
- FIG. 5 is a schematic structural diagram of an electronic device according to an embodiment of the present application.
- an embodiment means that a particular feature, result, or characteristic described in connection with the embodiment can be included in at least one embodiment of the present application.
- the appearances of the phrase in various places in the specification are not necessarily all referring to the same embodiment, nor a separate or alternative embodiment that is mutually exclusive with other embodiments. It is explicitly and implicitly understood by those skilled in the art that the embodiments described herein may be combined with other embodiments.
- the technical solution of the present application may relate to the field of artificial intelligence technology, for example, it may be applied to scenarios such as similarity matching to promote the construction of a smart city.
- the data involved in this application such as samples, trademark images and/or similarity information, may be stored in a database, or may be stored in a blockchain, which is not limited in this application.
- FIG. 1 is a schematic flowchart of a trademark similarity detection method provided by an embodiment of the present application.
- the trademark similarity detection method includes the following steps:
- a disturbance image is obtained by performing disturbance processing on the first trademark sample, and then a preset noise is added to the disturbance image to realize data augmentation of the first trademark sample.
- the disturbance processing is mainly used for simulating the scene that causes the image information to change.
- the perturbation processing may include at least one of the following: translation processing, scaling processing, rotation processing, and flipping processing.
- the preset noise may include at least one of the following Gaussian noise, additive noise, random noise, and salt and pepper noise.
- the perturbation process can also be used to simulate a scenario that causes loss of image information. Therefore, the perturbation processing may further include at least one of the following: image compression processing, image cropping processing, image overlay processing, replacement processing of at least part of an area in the image, and color transformation processing.
- the color transformation processing may include at least one of the following: contrast transformation processing, brightness transformation processing, saturation transformation processing, and hue transformation processing.
- the data of the training samples in various situations is fully expanded, so that the trained model can have good robustness under various scales and perspectives of trademark images, as well as in various interference situations.
- the accuracy of the subsequent calculation of the similarity of the trademark is not easily affected by factors such as image deformation, light intensity, noise interference, and the like.
- image subject extraction may also be performed on the trademark image to remove elements in the first trademark sample unrelated to the trademark itself, such as background, etc.
- edge detection may be performed on the first trademark sample to obtain a first detection result.
- the first trademark sample is cropped to obtain a first trademark body image, and the first trademark body image is used as a new first trademark sample, and subsequent operations are performed. In this way, elements that do not belong to the trademark part in the trademark sample are removed, which facilitates the execution of subsequent operations and improves the efficiency of trademark similarity detection.
- the second detection result can also be obtained by performing a distinctiveness test on the first trademark sample.
- the first trademark sample is cropped to obtain a second trademark body image, and then the second trademark body image is used as a new first trademark sample.
- a deep convolutional AlexNet network model is used as the basic model for model training.
- the network model includes: 5 convolution layers, 3 pooling layers and 4 fully connected layers, and the excitation function of the model selects the ReLU function , which makes training more efficient while introducing nonlinear effects of the data.
- data augmentation may be performed on the plurality of first trademark samples, respectively, to obtain a plurality of second trademark samples.
- model training is performed according to multiple second trademark samples to improve the applicability of the model.
- the first trademark image to be detected is input into the feature extraction model, and the return value of the penultimate layer of the model is selected as the first image corresponding to the first trademark image to be detected.
- Feature vector the first feature vector can be made to contain enough image features, so as to more comprehensively reflect each feature of the trademark, so as to improve the accuracy of subsequent similarity calculation.
- another feature extraction model is also provided.
- the feature extraction model divides the trademark image into a text area and an image area by segmenting the trademark image. Then, the text vector corresponding to the text area and the image vector corresponding to the image area are obtained respectively, and the text vector and the image vector are spliced to obtain the feature vector.
- the feature extraction model will be described below by taking the first trademark image to be detected as an example.
- FIG. 2 is a schematic diagram of an operation flow of another feature extraction model provided by an embodiment of the present application.
- the operation process of the feature extraction model includes:
- threshold segmentation is performed on the first trademark image to be detected according to the adaptive threshold to obtain the text area and the image area.
- the first trademark image to be detected may also be segmented by means such as semantic segmentation of the image with a fully convolutional network, and the present application does not limit the manner of image segmentation.
- the present application provides a method for obtaining a text vector, as shown in FIG. 3 , the method includes:
- the entity tag library maintains the mapping relationship between most of the commonly used words and the predefined entity tags. Therefore, by searching for the words, the entity tags corresponding to the words can be quickly determined.
- the entity vector of the word vector corresponding to each word is spliced horizontally, the word feature vector of the word is determined, and then semantic understanding is performed according to the word feature vector. Then, the text vector of the text in the text region is determined according to the word feature vectors of all words segmented by the text in the text region and the semantic understanding result.
- the field of words is pre-classified by entity tags, which improves the efficiency and accuracy of semantic understanding, and then improves the accuracy of the obtained text vector.
- the splicing is preferably transverse splicing. Therefore, the text information and image information in the first trademark image to be detected are integrated, so that the obtained first feature vector is more accurate.
- feature information of the first trademark image to be detected may also be acquired, for example, field information identifying the field in which the first trademark image to be detected is applied.
- the specific processing process is similar to the above-mentioned method for performing word embedding processing on the text in the text area, and details are not repeated here.
- the text vector, the field vector and the image vector are spliced to obtain the first feature vector.
- the obtained first feature vector includes the features of the application field of the trademark, so as to improve the accuracy of subsequent similarity calculation.
- the similarity result obtained by subsequent calculation can be directly applied to the determination of trademark infringement.
- the extraction of the second feature vector of the second trademark image to be detected is similar to the above-mentioned method of extracting the first feature vector of the first trademark image to be detected, and details are not described herein again.
- the cosine value of the included angle between the first feature vector corresponding to the first trademark image to be detected and the second feature vector corresponding to the second trademark image to be detected is calculated, and the cosine value of the included angle is used as the first The similarity between the first brand image to be detected and the second brand image to be detected.
- a first feature vector A [a1, a2, ..., ai, ..., an] with equal lengths
- a ⁇ B represents the inner product of the first eigenvector A and the second eigenvector B; mold.
- modulus of the first eigenvector A can be expressed by formula 3:
- the cosine value of the included angle is used as the similarity between the first trademark image to be detected and the second trademark image to be detected.
- the similarity between the first trademark image to be detected and the second trademark image to be detected can be expressed by formula 4:
- the value range of the cosine value is [-1, 1], this makes the cosine value still have the properties of 1 when it is the same, 0 when it is orthogonal, and -1 when it is opposite. That is, the closer the cosine value is to 1, the closer the directions of the two vectors are; the closer the cosine value is to -1, the more opposite their directions are; closer to 0, it means that the two vectors are nearly orthogonal, and the two vectors can be extracted. relative difference in direction.
- using the cosine value as the similarity between the first to-be-detected trademark image and the second to-be-detected trademark image can accurately represent the similarity between the first to-be-detected trademark image and the second to-be-detected trademark image.
- the value range of the cosine value is [-1, 1], and the closer the cosine value is to 1, the closer the directions of the two vectors are. Therefore, a threshold can be set, and when the similarity is greater than the threshold, it can be considered that the first to-be-detected trademark image and the second to-be-detected trademark image are similar.
- the trademark similarity detection method provided in this application fully expands the data of the training samples in various situations by augmenting the data of the trademark samples used for training, so that the trained model can be used in trademarks. It has good robustness under various scales and viewing angles of the image, as well as under various interference conditions, so that the accuracy of subsequent calculation of trademark similarity is not easily affected by factors such as image deformation, light intensity, noise interference, etc. .
- the cosine value of the angle between the two vectors is used as the similarity between the two vectors, so that even in a high-dimensional space, the relationship between the first trademark image to be detected and the second trademark image to be detected can still be accurately represented.
- the degree of similarity improves the accuracy of the trademark similarity detection method.
- the embodiment of the present application realizes the automatic execution of trademark similarity detection, and has the advantages of rapidity, high efficiency, and low missed detection rate.
- FIG. 4 is a block diagram of functional modules of a trademark similarity detection apparatus provided in an embodiment of the present application.
- the trademark similarity detection device 4 includes:
- the preprocessing module 41 is configured to perform data augmentation on the first trademark sample to obtain a second trademark sample.
- the training module 42 is configured to perform model training according to the second trademark sample to obtain a feature extraction model.
- the extraction module 43 is configured to input the first trademark image to be detected into the feature extraction model to obtain the first feature vector, and input the second trademark image to be detected into the feature extraction model to obtain the second feature vector.
- the processing module 44 is configured to determine the similarity between the first trademark and the second trademark according to the first feature vector and the second feature vector. When the similarity is greater than the threshold, it is determined that the first trademark and the second trademark are similar.
- the preprocessing module 41 is specifically used for:
- first perturbation processing on the first trademark sample to obtain a first perturbed image
- first processing includes at least one of the following: translation processing, scaling processing, rotation processing and flipping processing
- a preset noise is added to the first disturbed image to obtain a second trademark sample, wherein the preset noise includes at least one of the following: Gaussian noise, additive noise, random noise and salt and pepper noise.
- the preprocessing module 41 is further used for:
- the first trademark body image is used as the first trademark sample.
- the extraction module 43 is specifically used for:
- the text vector and the image vector are spliced to obtain the first feature vector.
- the extraction module 43 is specifically used for:
- a first word vector is determined according to the at least one entity vector and the at least one word vector.
- the extraction module 43 is further used for:
- Splicing the text vector and the image vector to obtain the first feature vector including:
- the text vector, the field vector and the image vector are spliced to obtain the first feature vector.
- the processing module 44 in determining the similarity between the first trademark and the second trademark according to the first feature vector and the second feature vector, is specifically used for:
- the second eigenvector is modulo obtained to obtain the second modulo
- FIG. 5 is a schematic structural diagram of an electronic device according to an embodiment of the present application.
- the electronic device may include a processor and memory.
- the electronic device may further include a communication interface, and the communication interface may be a transceiver or an input/output device.
- the memory may store one or more programs that may be configured by the processor to perform some or all of the steps in the above-described methods.
- the electronic device 500 includes a transceiver 501 , a processor 502 and a memory 503 . They are connected by bus 504 .
- the memory 503 is used to store computer programs and data, and can transmit the data stored in the memory 503 to the processor 502 .
- the processor 502 is used to read the computer program in the memory 503 to perform the following operations:
- Data augmentation is performed on the first trademark sample to obtain a second trademark sample.
- the first trademark image to be detected is input into the feature extraction model to obtain a first feature vector
- the second trademark image to be detected is input into the feature extraction model to obtain a second feature vector
- the similarity between the first trademark and the second trademark is determined.
- the similarity is greater than the threshold, it is determined that the first trademark and the second trademark are similar.
- the processor 502 in terms of performing data augmentation on the first trademark sample to obtain the second trademark sample, the processor 502 is specifically configured to perform the following operations:
- first perturbation processing on the first trademark sample to obtain a first perturbed image
- first processing includes at least one of the following: translation processing, scaling processing, rotation processing and flipping processing
- a preset noise is added to the first disturbed image to obtain a second trademark sample, wherein the preset noise includes at least one of the following: Gaussian noise, additive noise, random noise and salt and pepper noise.
- the processor 502 is specifically configured to perform the following operations:
- the first trademark body image is used as the first trademark sample.
- the processor 502 in terms of inputting the first trademark image to be detected into the feature extraction model to obtain the first feature vector, is specifically configured to perform the following operations:
- the text vector and the image vector are spliced to obtain the first feature vector.
- the processor 502 in terms of performing word embedding processing on the text in the text area to obtain a text vector, is specifically configured to perform the following operations:
- a first word vector is determined according to the at least one entity vector and the at least one word vector.
- the processor 502 is specifically configured to perform the following operations:
- Splicing the text vector and the image vector to obtain the first feature vector including:
- the text vector, the field vector and the image vector are spliced to obtain the first feature vector.
- the processor 502 in determining the similarity between the first trademark and the second trademark according to the first feature vector and the second feature vector, is specifically configured to perform the following operations:
- the second eigenvector is modulo obtained to obtain the second modulo
- trademark similarity detection device in this application may include smart phones (such as Android mobile phones, iOS mobile phones, Windows Phone mobile phones, etc.), tablet computers, handheld computers, notebook computers, and MID (Mobile Internet Devices, referred to as: MID for short). ), robots or wearable devices, etc.
- smart phones such as Android mobile phones, iOS mobile phones, Windows Phone mobile phones, etc.
- tablet computers such as Samsung mobile phones, iOS mobile phones, Windows Phone mobile phones, etc.
- handheld computers handheld computers
- notebook computers and MID (Mobile Internet Devices, referred to as: MID for short).
- MID Mobile Internet Devices, referred to as: MID for short).
- robots or wearable devices etc.
- the above-mentioned trademark similarity detection device is only an example, rather than an exhaustive list, including but not limited to the above-mentioned trademark similarity detection device.
- the above-mentioned trademark similarity detection apparatus may further include: an intelligent vehicle-mounted terminal, a computer device, and the like.
- the embodiments of the present application also provide a computer-readable storage medium, where the computer-readable storage medium stores a computer program, and the computer program is executed by a processor to realize any one of the trademarks described in the above method embodiments Some or all of the steps of the similarity detection method.
- the storage medium may include a hard disk, a floppy disk, an optical disk, a magnetic tape, a magnetic disk, a USB flash drive, a flash memory, and the like.
- the storage medium involved in this application such as a computer-readable storage medium, may be non-volatile or volatile.
- Embodiments of the present application also provide a computer program product, the computer program product comprising a non-transitory computer-readable storage medium storing a computer program, the computer program being operable to cause a computer to execute the method described in the foregoing method embodiments Some or all of the steps in any method of trademark similarity detection.
- the disclosed apparatus may be implemented in other manners.
- the device implementations described above are only illustrative, for example, the division of the units is only a logical function division, and other divisions may be used in actual implementation, for example, multiple units or components may be combined or Integration into another system, or some features can be ignored, or not implemented.
- the shown or discussed mutual coupling or direct coupling or communication connection may be through some interfaces, indirect coupling or communication connection of devices or units, and may be in electrical or other forms.
- the units described as separate components may or may not be physically separated, and components displayed as units may or may not be physical units, that is, may be located in one place, or may be distributed to multiple network units. Some or all of the units may be selected according to actual needs to achieve the purpose of the solution in this implementation manner.
- each functional unit in each embodiment of the present application may be integrated into one processing unit, or each unit may exist physically alone, or two or more units may be integrated into one unit.
- the above-mentioned integrated units can be implemented in the form of hardware, and can also be implemented in the form of software program modules.
- the integrated unit if implemented in the form of a software program module and sold or used as a stand-alone product, may be stored in a computer readable memory.
- the technical solution of the present application can be embodied in the form of a software product in essence, or the part that contributes to the prior art, or all or part of the technical solution, and the computer software product is stored in a memory.
- a computer device which may be a personal computer, a server, or a network device, etc.
- the aforementioned memory includes: U disk, read-only memory (ROM, Read-Only Memory), random access memory (RAM, Random Access Memory), mobile hard disk, magnetic disk or optical disk and other media that can store program codes.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种商标相似性检测方法、装置、电子设备和存储介质,涉及人工智能技术领域,其中,商标相似性检测方法包括:对第一商标样本进行数据增广,得到第二商标样本(101);根据第二商标样本进行模型训练,得到特征提取模型(102);将第一待检测商标图像输入到特征提取模型,得到第一特征向量(103);将第二待检测商标图像输入到特征提取模型,得到第二特征向量(104);根据第一特征向量和第二特征向量,确定第一待检测商标图像和第二待检测商标图像之间的相似度(105);若相似度大于阈值,则确定第一待检测商标图像和第二待检测商标图像相似(106)。
Description
本申请要求于2021年1月21日提交中国专利局、申请号为202110080634.2,发明名称为“商标相似性检测方法、装置、电子设备和存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及人工智能技术领域,具体涉及一种商标相似性检测方法、装置、电子设备和存储介质。
商标,作为经营者提供的商品或服务的显著标志,在一定程度上代表了该经营者,以及其在其所经营的领域中所累积的声誉,象征着经营者的信誉和可靠度的,是企业日益激烈的市场竞争活动中的重要组成部分。并且,由于商标所代表的经营者的声誉,使商标可以说明的拥有该商标的产品或服务的性质和质量符合。由此,可以帮助消费者识别和购买某些产品或服务。基于此,商标可以说是企业的无形资产,其重要性不言而喻。因此,商标必须具有足够的独特性以避免与其他商标发生混淆或冲突。目前,市面上充斥着各种大型或知名企业的仿冒商标,在扰乱市场秩序的同时,也严重影响了大型或知名企业的声誉。
商标的近似是指两商标文字的字形、读音、含义或者图形的构图、着色、外观近似,或者文字和图形组合后的整体排列组合方式和外观近似,或者其三维标志的形状和外观近似,或者其颜色或者颜色组合近似,使用在同一种或者类似商品或者服务上易使相关公众对商品或者服务的来源产生误认。
发明人意识到,传统的商标相似性度量方法往往是通过计算商标图像的结构相似性或直方图计算商标图像的相似度,或者通过人工提取商标特征并利用模式识别的方式计算商标的相似度。然而,这些方法计算速度慢,商标相似度的准确率容易受到噪声干扰等因素的影响,导致相似度计算的准确率低。
发明内容
为了解决现有技术中存在的上述问题,本申请实施方式提供了一种商标相似性检测方法、装置、电子设备和存储介质,可以在提高商标的相似度获取效率的同时,保证相似度的精准度。
第一方面,本申请的实施方式提供了一种商标相似性检测方法,包括:
对第一商标样本进行数据增广,得到第二商标样本;
根据第二商标样本进行模型训练,得到特征提取模型;
将第一待检测商标图像输入到特征提取模型,得到第一特征向量;
将第二待检测商标图像输入到特征提取模型,得到第二特征向量;
根据第一特征向量和第二特征向量,确定第一待检测商标图像和第二待检测商标图像之间的相似度;
若相似度大于阈值,则确定第一待检测商标图像和第二待检测商标图像相似。
第二方面,本申请的实施方式提供了一种商标相似性检测装置,包括:
预处理模块,用于对第一商标样本进行数据增广,得到第二商标样本;
训练模块,用于根据第二商标样本进行模型训练,得到特征提取模型;
提取模块,用于将第一待检测商标图像输入到特征提取模型,得到第一特征向量,以及将第二待检测商标图像输入到特征提取模型,得到第二特征向量;
处理模块,用于根据第一特征向量和第二特征向量,确定第一待检测商标图像和第二待检测商标图像之间的相似度;
若相似度大于阈值,则确定第一待检测商标图像和第二待检测商标图像相似。
第三方面,本申请实施方式提供一种电子设备,包括:处理器,处理器与存储器相连, 存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序,以使得电子设备执行以下方法:
对第一商标样本进行数据增广,得到第二商标样本;
根据第二商标样本进行模型训练,得到特征提取模型;
将第一待检测商标图像输入到特征提取模型,得到第一特征向量;
将第二待检测商标图像输入到特征提取模型,得到第二特征向量;
根据第一特征向量和第二特征向量,确定第一待检测商标图像和第二待检测商标图像之间的相似度;
若相似度大于阈值,则确定第一待检测商标图像和第二待检测商标图像相似。
第四方面,本申请实施方式提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序使得计算机执行以下方法:
对第一商标样本进行数据增广,得到第二商标样本;
根据第二商标样本进行模型训练,得到特征提取模型;
将第一待检测商标图像输入到特征提取模型,得到第一特征向量;
将第二待检测商标图像输入到特征提取模型,得到第二特征向量;
根据第一特征向量和第二特征向量,确定第一待检测商标图像和第二待检测商标图像之间的相似度;
若相似度大于阈值,则确定第一待检测商标图像和第二待检测商标图像相似。
可以看出,在本申请实施方式中,通过对训练用的商标样本进行数据增广,充分扩增了训练样本在各种情况下的数据,使得训练后的模型可以在商标图像的各个尺度和视角下,以及多种干扰等情况下,任具有良好的鲁棒性。同时,使后续对商标相似度的计算的准确率不容易受到图像形变、光照强度、噪声干扰等因素的影响。此外,相比于传统的人工提取特征的方法,本申请实施方式实现了商标相似度检测的自动化执行,具有快速、高效、漏检率低等优点。
为了更清楚地说明本申请实施方式中的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施方式提供的一种商标相似性检测方法的流程示意图;
图2为本申请实施方式提供的另一种特征提取模型的运作流程示意图;
图3为本申请实施方式提供的一种获取文本向量的流程示意图;
图4为本申请实施方式提供的一种商标相似性检测装置的功能模块组成框图;
图5为本申请实施方式提供的一种电子设备的结构示意图。
下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单 元。
在本文中提及“实施方式”意味着,结合实施方式描述的特定特征、结果或特性可以包含在本申请的至少一个实施方式中。在说明书中的各个位置出现该短语并不一定均是指相同的实施方式,也不是与其它实施方式互斥的独立的或备选的实施方式。本领域技术人员显式地和隐式地理解的是,本文所描述的实施方式可以与其它实施方式相结合。
本申请的技术方案可涉及人工智能技术领域,如可应用于相似度匹配等场景中,以推动智慧城市的建设。可选的,本申请涉及的数据如样本、商标图像和/或相似度信息等可存储于数据库中,或者可以存储于区块链中,本申请不做限定。
参阅图1,图1为本申请实施方式提供的一种商标相似性检测方法的流程示意图。该商标相似性检测方法包括以下步骤:
101:对第一商标样本进行数据增广,得到第二商标样本。
在本实施方式中,通过对第一商标样本进行扰动处理,得到扰动图像,再对扰动图像添加预设的噪声,实现对第一商标样本的数据增广。其中,该扰动处理主要用于模拟造成图像信息变动的场景。该扰动处理可以包括以下至少一种:平移处理、缩放处理、旋转处理以及翻转处理。该预设噪声可以包括以下至少一种高斯噪声、加性噪声、随机噪声以及椒盐噪声。
在可选的实施方式中,该扰动处理还可以用于模拟造成图像信息丢失的场景。因此,该扰动处理还可以包括以下至少一种:图像压缩处理、图像剪切处理、图像覆盖处理、图像中至少部分区域的替换处理以及色彩变换处理。其中,该色彩变换处理可以包括以下至少一种:对比度变换处理、亮度变换处理、饱和度变换处理以及色调变换处理。
由此,充分扩增了训练样本在各种情况下的数据,使得训练后的模型可以在商标图像的各个尺度和视角下,以及多种干扰等情况下,任具有良好的鲁棒性。同时,使后续对商标相似度的计算的准确率不容易受到图像形变、光照强度、噪声干扰等因素的影响。
此外,在本实施方式中,在对第一商标样本进行数据增广之前,还可以对商标图像进行图像主体提取,以去除第一商标样本中与商标本身无关的元素,例如:背景等。示例性的,可以对第一商标样本进行边缘检测,得到第一检测结果。根据第一检测结果,对第一商标样本进行裁剪,得到第一商标主体图像,再将第一商标主体图像作为新的第一商标样本,执行后续操作。由此,除去商标样本中不属于商标部分的元素,便于后续操作的执行,提高了商标相似性检测的效率。
在可选的实施方式中,还可以通过对第一商标样本进行显著性检测,得到第二检测结果。根据第二检测结果,对第一商标样本进行裁剪,得到第二商标主体图像,再将第二商标主体图像作为新的第一商标样本。
或者,同时对第一商标样本进行边缘检测和显著性检测,得到第一检测结果和第二检测结果,再根据第一检测结果和第二检测结果,对第一商标样本进行裁剪,得到第三商标主体图像,将第三商标主体图像作为新的第一商标样本。由此,通过边缘检测和显著性检测相互应征,使对商标图像的图像主体提取更加精准。
102:根据第二商标样本进行模型训练,得到特征提取模型。
在本实施方式中,采用深度卷积AlexNet网络模型作为模型训练的基础模型,该网络模型包括:5个卷积层、3个池化层和4个全连接层,模型的激励函数选择ReLU函数,在引入数据的非线性效果的同时,使训练效率更快。
此外,在本实施方式中,可以对多个第一商标样本分别进行数据增广,以获取多个第二商标样本。从而根据多个第二商标样本进行模型训练,以提升模型的适用性。
103:将第一待检测商标图像输入到特征提取模型,得到第一特征向量。
在本实施方式中,特征提取模型训练好后,将第一待检测商标图像输入到特征提取模 型,选取该模型的倒数第二层的返回值,作为该第一待检测商标图像对应的第一特征向量。由此,可以使第一特征向量包含足够多的图像特征,从而更加全面的反映商标的各个特征,以提升后续相似度计算的精准度。
在可选的实施方式中,还提供了另一种特征提取模型,该特征提取模型通过对商标图像进行分割,将商标图像分割为文本区域和图像区域。再分别获取对应文本区域的文本向量,以及对应图像区域的图像向量,将文本向量和图像向量进行拼接,从而获取特征向量。
基于此,以下将以第一待检测商标图像为例,对该特征提取模型进行说明。
参见图2,图2为本申请实施方式提供的另一种特征提取模型的运作流程示意图。如图2所示,该特征提取模型的运作流程包括:
201:对第一待检测商标图像进行图像分割,得到文本区域和图像区域。
示例性的,可以通过确定第一待检测商标图像中每一个像素的自适应阈值,从而根据该自适应阈值对第一待检测商标图像进行阈值分割,从而得到文本区域和图像区域。此外,还可以采用例如全卷积网络对图像进行语义分割等方式分割第一待检测商标图像,本申请对图像分割的方式不进行限定。
202:对文本区域中的文本进行词嵌入处理,得到文本向量。
示例性的,本申请给出一种获取文本向量的方法,如图3所示,该方法包括:
301:对文本区域中的文本进行语义切分,得到至少一个词语。
302:对于至少一个词语中的每个词语,分别根据每个词语查询实体标签库,确定每个词语对应的实体标签。
在本实施方式中,该实体标签库中维护了大部分日常常用词语和预先定义的实体标签的映射关系,因此,通过对词语进行搜索,即可快速确定该词语对应的实体标签。
303:对每个词语进行词嵌入处理,得到词向量,以及对每个词语对应的实体标签进行编码,得到实体向量。
在本实施方式中,实体向量和词向量之间是一一对应的关系。
304:根据至少一个实体向量和至少一个词向量,确定文本向量。
示例性的,将每个词语对应的词向量的实体向量进行横向拼接,确定该词语的词特征向量,继而根据该词特征向量进行语义理解。然后,根据文本区域中的文本所切分出的所有词语的词特征向量和语义理解结果,确定文本区域中的文本的文本向量。由此,通过实体标签对词语的领域进行预先分类,提升语义理解的效率和精度,继而提升获取的文本向量的精度。
203:对图像区域中的图像进行特征提取,得到图像向量。
204:将文本向量和图像向量进行拼接,得到第一特征向量。
示例性的,该拼接优选为横向拼接。由此,综合第一待检测商标图像中的文本信息和图像信息,使获取到的第一特征向量更加精准。
在可选的实施方式中,还可以获取第一待检测商标图像的特征信息,例如,标识第一待检测商标图像应用的领域的领域信息。对该领域信息进行词嵌入处理,获取领域向量。具体处理过程与上述对文本区域中的文本进行词嵌入处理的方法类似,在此不再赘述。
然后,将文本向量、领域向量和图像向量进行拼接,得到第一特征向量。由此,使获得的第一特征向量中包含了商标的应用领域特征,以提升后续相似度计算的精准度。同时,也使得后续计算得出的相似度结果可以直接应用于商标的侵权判定。
104:将第二待检测商标图像输入到特征提取模型,得到第二特征向量。
在本实施方式中,对第二待检测商标图像的第二特征向量的提取,与上述对第一待检测商标图像的第一特征向量的提取的方法类似,在此不再赘述。
105:根据第一特征向量和第二特征向量,确定第一待检测商标图像和第二待检测商标 图像之间的相似度。
在本实施方式中,通过计算第一待检测商标图像对应的第一特征向量,和第二待检测商标图像对应的第二特征向量之间的夹角余弦值,并用该夹角余弦值作为第一待检测商标图像和第二待检测商标图像之间的相似度。
示例性的,通过特征提取模型,可以得到长度相等的第一特征向量A=[a1,a2,…,ai,…,an],和第二特征向量B=[b1,b2,…,bi,…,bn],其中,i=1,2,…,n。
基于此,夹角余弦值可以通过公式①表示:
其中,A·B表示第一特征向量A与第二特征向量B的内积,丨丨为取模符号,丨A丨表示第一特征向量A的模,丨B丨表示第二特征向量B的模。
进一步的,第一特征向量A与第二特征向量B的内积可以通过公式②表示:
进一步的,第一特征向量A的模可以通过公式③表示:
最后,将该夹角余弦值作为第一待检测商标图像和第二待检测商标图像之间的相似度。示例性的,第一待检测商标图像和第二待检测商标图像之间的相似度可以通过公式④表示:
d=cosθ…………④
由于余弦值的取值范围为【-1,1】,这使得余弦值在高维的情况下依然拥有相同时为1、正交时为0、相反时为-1的性质。即,余弦值越趋近于1,代表两个向量的方向越接近;越趋近于-1,他们的方向越相反;接近于0,表示两个向量近乎于正交,可以提现两个向量方向上的相对差异。由此,采用余弦值作为第一待检测商标图像和第二待检测商标图像之间的相似度,可以精确的表示第一待检测商标图像和第二待检测商标图像之间的相似程度。
106:若相似度大于阈值,则所述第一待检测商标图像和第二待检测商标图像相似。
由上述可知,余弦值的取值范围为【-1,1】,且余弦值越趋近于1,代表两个向量的方向越接近。因此,可以设定一个阈值,当相似度大于该阈值时即可认为第一待检测商标图像和第二待检测商标图像相似。
综上所述,本申请所提供的商标相似性检测方法,通过对训练用的商标样本进行数据增广,充分扩增了训练样本在各种情况下的数据,使得训练后的模型可以在商标图像的各个尺度和视角下,以及多种干扰等情况下,任具有良好的鲁棒性,使后续对商标相似度的计算的准确率不容易受到图像形变、光照强度、噪声干扰等因素的影响。同时,采用两个向量的夹角余弦值作为两个向量之间的相似度,使即使在高维空间下,依旧可以精确的表示第一待检测商标图像和第二待检测商标图像之间的相似程度,提高了商标相似性检测方法的精准度。此外,相比于传统的人工提取特征的方法,本申请实施方式实现了商标相似度检测的自动化执行,具有快速、高效、漏检率低等优点。
参阅图4,图4为本申请实施方式提供的一种商标相似性检测装置的功能模块组成框图。如图4所示,该商标相似性检测装置4包括:
预处理模块41,用于对第一商标样本进行数据增广,得到第二商标样本。
训练模块42,用于根据第二商标样本进行模型训练,得到特征提取模型。
提取模块43,用于将第一待检测商标图像输入到特征提取模型,得到第一特征向量,以及将第二待检测商标图像输入到特征提取模型,得到第二特征向量。
处理模块44,用于根据第一特征向量和第二特征向量,确定第一商标和第二商标之间的相似度。当相似度大于阈值时,确定第一商标和第二商标相似。
在本申请的实施方式中,在对第一商标样本进行数据增广,得到第二商标样本方面,预处理模块41,具体用于:
对第一商标样本进行第一扰动处理,得到第一扰动图像,其中,第一处理包括以下至少一种:平移处理、缩放处理、旋转处理和翻转处理;
对第一扰动图像添加预设噪声,得到第二商标样本,其中,预设噪声包括以下至少一种:高斯噪声、加性噪声、随机噪声以及椒盐噪声。
在本申请的实施方式中,在对第一商标样本进行数据增广,得到第二商标样本之前,预处理模块41,还用于:
对第一商标样本进行边缘检测,得到第一检测结果;
根据第一检测结果,对第一商标样本进行裁剪,得到第一商标主体图像;
将第一商标主体图像作为第一商标样本。
在本申请的实施方式中,在将第一待检测商标图像输入到特征提取模型,得到第一特征向量方面,提取模块43,具体用于:
对第一待检测商标图像进行图像分割,得到文本区域和图像区域;
对文本区域中的文本进行词嵌入处理,得到文本向量;
对图像区域中的图像进行特征提取,得到图像向量;
将文本向量和图像向量进行拼接,得到第一特征向量。
在本申请的实施方式中,在对文本区域中的文本进行词嵌入处理,得到文本向量方面,提取模块43,具体用于:
对文本区域中的文本进行语义切分,得到至少一个词语;
对于至少一个词语中的每个词语,分别根据每个词语查询实体标签库,确定每个词语对应的实体标签;
对每个词语进行词嵌入处理,得到词向量,以及对每个词语对应的实体标签进行编码,得到实体向量,其中,实体向量和词向量一一对应;
根据至少一个实体向量和至少一个词向量,确定第一文字向量。
在本申请的实施方式中,在对图像区域中的图像进行特征提取,得到图像向量之后,提取模块43,还用于:
确定第一待检测商标图像的领域信息,领域信息用于标识第一待检测商标图像应用的领域;
对领域信息进行词嵌入处理,得到领域向量;
将文本向量和图像向量进行拼接,得到第一特征向量,包括:
将文本向量、领域向量和图像向量进行拼接,得到第一特征向量。
在本申请的实施方式中,在根据第一特征向量和第二特征向量,确定第一商标和第二商标之间的相似度方面,处理模块44,具体用于:
对第一特征向量进行取模,得到第一模;
对第二特征向量进行取模,得到第二模;
确定第一模与第二模的乘积值;
确定第一特征向量和第二特征向量的内积;
将内积与乘积值的商,作为相似度。
参阅图5,图5为本申请实施方式提供的一种电子设备的结构示意图。该电子设备可以 包括处理器和存储器。可选的,该电子设备还可包括通信接口,该通信接口可以是收发器,也可以是输入输出设备。该存储器可存储有一个或多个程序,所述一个或多个程序可被配置由处理器执行上述方法中的部分或全部步骤。例如,如图5所示,电子设备500包括收发器501、处理器502和存储器503。它们之间通过总线504连接。存储器503用于存储计算机程序和数据,并可以将存储器503存储的数据传输给处理器502。
处理器502用于读取存储器503中的计算机程序执行以下操作:
对第一商标样本进行数据增广,得到第二商标样本。
根据第二商标样本进行模型训练,得到特征提取模型。
将第一待检测商标图像输入到特征提取模型,得到第一特征向量,以及将第二待检测商标图像输入到特征提取模型,得到第二特征向量。
根据第一特征向量和第二特征向量,确定第一商标和第二商标之间的相似度。当相似度大于阈值时,确定第一商标和第二商标相似。
在本申请的实施方式中,在对第一商标样本进行数据增广,得到第二商标样本方面,处理器502,具体用于执行以下操作:
对第一商标样本进行第一扰动处理,得到第一扰动图像,其中,第一处理包括以下至少一种:平移处理、缩放处理、旋转处理和翻转处理;
对第一扰动图像添加预设噪声,得到第二商标样本,其中,预设噪声包括以下至少一种:高斯噪声、加性噪声、随机噪声以及椒盐噪声。
在本申请的实施方式中,在对第一商标样本进行数据增广,得到第二商标样本之前,处理器502,具体用于执行以下操作:
对第一商标样本进行边缘检测,得到第一检测结果;
根据第一检测结果,对第一商标样本进行裁剪,得到第一商标主体图像;
将第一商标主体图像作为第一商标样本。
在本申请的实施方式中,在将第一待检测商标图像输入到特征提取模型,得到第一特征向量方面,处理器502,具体用于执行以下操作:
对第一待检测商标图像进行图像分割,得到文本区域和图像区域;
对文本区域中的文本进行词嵌入处理,得到文本向量;
对图像区域中的图像进行特征提取,得到图像向量;
将文本向量和图像向量进行拼接,得到第一特征向量。
在本申请的实施方式中,在对文本区域中的文本进行词嵌入处理,得到文本向量方面,处理器502,具体用于执行以下操作:
对文本区域中的文本进行语义切分,得到至少一个词语;
对于至少一个词语中的每个词语,分别根据每个词语查询实体标签库,确定每个词语对应的实体标签;
对每个词语进行词嵌入处理,得到词向量,以及对每个词语对应的实体标签进行编码,得到实体向量,其中,实体向量和词向量一一对应;
根据至少一个实体向量和至少一个词向量,确定第一文字向量。
在本申请的实施方式中,在对图像区域中的图像进行特征提取,得到图像向量之后,处理器502,具体用于执行以下操作:
确定第一待检测商标图像的领域信息,领域信息用于标识第一待检测商标图像应用的领域;
对领域信息进行词嵌入处理,得到领域向量;
将文本向量和图像向量进行拼接,得到第一特征向量,包括:
将文本向量、领域向量和图像向量进行拼接,得到第一特征向量。
在本申请的实施方式中,在根据第一特征向量和第二特征向量,确定第一商标和第二商标之间的相似度方面,处理器502,具体用于执行以下操作:
对第一特征向量进行取模,得到第一模;
对第二特征向量进行取模,得到第二模;
确定第一模与第二模的乘积值;
确定第一特征向量和第二特征向量的内积;
将内积与乘积值的商,作为相似度。
应理解,本申请中商标相似性检测装置可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(Mobile Internet Devices,简称:MID)、机器人或穿戴式设备等。上述商标相似性检测装置仅是举例,而非穷举,包含但不限于上述商标相似性检测装置。在实际应用中,上述商标相似性检测装置还可以包括:智能车载终端、计算机设备等等。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可借助软件结合硬件平台的方式来实现。基于这样的理解,本申请的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
因此,本申请实施方式还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施方式中记载的任何一种商标相似性检测方法的部分或全部步骤。例如,所述存储介质可以包括硬盘、软盘、光盘、磁带、磁盘、优盘、闪存等。
可选的,本申请涉及的存储介质如计算机可读存储介质可以是非易失性的,也可以是易失性的。
本申请实施方式还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施方式中记载的任何一种商标相似性检测方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施方式,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施方式均属于可选实施方式,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施方式中,对各个实施方式的描述都各有侧重,某个实施方式中没有详述的部分,可以参见其他实施方式的相关描述。
在本申请所提供的几个实施方式中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是 各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施方式的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施方式进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施方式的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (20)
- 一种商标相似性检测方法,其中,所述方法包括:对第一商标样本进行数据增广,得到第二商标样本;根据所述第二商标样本进行模型训练,得到特征提取模型;将第一待检测商标图像输入到所述特征提取模型,得到第一特征向量;将第二待检测商标图像输入到所述特征提取模型,得到第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述第一待检测商标图像和所述第二待检测商标图像之间的相似度;若所述相似度大于阈值,则确定所述第一待检测商标图像和所述第二待检测商标图像相似。
- 根据权利要求1所述的方法,其中,所述对第一商标样本进行数据增广,得到第二商标样本,包括:对所述第一商标样本进行扰动处理,得到扰动图像,其中,所述扰动处理包括以下至少一种:平移处理、缩放处理、旋转处理以及翻转处理;对所述扰动图像添加预设噪声,得到所述第二商标样本,其中,所述预设噪声包括以下至少一种:高斯噪声、加性噪声、随机噪声以及椒盐噪声。
- 根据权利要求1或2所述的方法,其中,在所述对第一商标样本进行数据增广,得到第二商标样本之前,所述方法还包括:对所述第一商标样本进行边缘检测,得到第一检测结果;根据所述第一检测结果,对所述第一商标样本进行裁剪,得到第一商标主体图像;将所述第一商标主体图像作为所述第一商标样本。
- 根据权利要求1所述的方法,其中,所述将第一待检测商标图像输入到所述特征提取模型,得到第一特征向量,包括:对所述第一待检测商标图像进行图像分割,得到文本区域和图像区域;对所述文本区域中的文本进行词嵌入处理,得到文本向量;对所述图像区域中的图像进行特征提取,得到图像向量;将所述文本向量和所述图像向量进行拼接,得到所述第一特征向量。
- 根据权利要求4所述的方法,其中,所述对所述文本区域中的文本进行词嵌入处理,得到文本向量,包括:对所述文本区域中的文本进行语义切分,得到至少一个词语;对于所述至少一个词语中的每个词语,分别根据所述每个词语查询实体标签库,确定所述每个词语对应的实体标签;对所述每个词语进行词嵌入处理,得到词向量,以及对所述每个词语对应的实体标签进行编码,得到实体向量,其中,所述实体向量和所述词向量一一对应;根据至少一个所述实体向量和至少一个所述词向量,确定所述文本向量。
- 根据权利要求4所述的方法,其中,在所述对所述图像区域中的图像进行特征提取,得到图像向量之后,所述方法还包括:确定所述第一待检测商标图像的领域信息,所述领域信息用于标识所述第一待检测商标图像应用的领域;对所述领域信息进行词嵌入处理,得到领域向量;所述将所述文本向量和所述图像向量进行拼接,得到所述第一特征向量,包括:将所述文本向量、所述领域向量和所述图像向量进行拼接,得到所述第一特征向量。
- 根据权利要求1所述的方法,其中,所述根据所述第一特征向量和所述第二特征向量,确定所述第一商标和所述第二商标之间的相似度,包括:对所述第一特征向量进行取模,得到第一模;对所述第二特征向量进行取模,得到第二模;确定所述第一模与所述第二模的乘积值;确定所述第一特征向量和所述第二特征向量的内积;将所述内积与所述乘积值的商,作为所述相似度。
- 一种商标相似性检测装置,其中,所述装置包括:预处理模块,用于对第一商标样本进行数据增广,得到第二商标样本;训练模块,用于根据所述第二商标样本进行模型训练,得到特征提取模型;提取模块,用于将第一待检测商标图像输入到所述特征提取模型,得到第一特征向量,以及将第二待检测商标图像输入到所述特征提取模型,得到第二特征向量;处理模块,用于根据所述第一特征向量和所述第二特征向量,确定所述第一待检测商标图像和所述第二待检测商标图像之间的相似度;若所述相似度大于阈值,则确定所述第一待检测商标图像和所述第二待检测商标图像相似。
- 一种电子设备,其中,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行以实现以下方法:对第一商标样本进行数据增广,得到第二商标样本;根据所述第二商标样本进行模型训练,得到特征提取模型;将第一待检测商标图像输入到所述特征提取模型,得到第一特征向量;将第二待检测商标图像输入到所述特征提取模型,得到第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述第一待检测商标图像和所述第二待检测商标图像之间的相似度;若所述相似度大于阈值,则确定所述第一待检测商标图像和所述第二待检测商标图像相似。
- 根据权利要求9所述的电子设备,其中,执行所述对第一商标样本进行数据增广,得到第二商标样本,包括:对所述第一商标样本进行扰动处理,得到扰动图像,其中,所述扰动处理包括以下至少一种:平移处理、缩放处理、旋转处理以及翻转处理;对所述扰动图像添加预设噪声,得到所述第二商标样本,其中,所述预设噪声包括以下至少一种:高斯噪声、加性噪声、随机噪声以及椒盐噪声。
- 根据权利要求9或10所述的电子设备,其中,在所述对第一商标样本进行数据增广,得到第二商标样本之前,所述处理器还用于执行:对所述第一商标样本进行边缘检测,得到第一检测结果;根据所述第一检测结果,对所述第一商标样本进行裁剪,得到第一商标主体图像;将所述第一商标主体图像作为所述第一商标样本。
- 根据权利要求9所述的电子设备,其中,执行所述将第一待检测商标图像输入到所述特征提取模型,得到第一特征向量,包括:对所述第一待检测商标图像进行图像分割,得到文本区域和图像区域;对所述文本区域中的文本进行词嵌入处理,得到文本向量;对所述图像区域中的图像进行特征提取,得到图像向量;将所述文本向量和所述图像向量进行拼接,得到所述第一特征向量。
- 根据权利要求12所述的电子设备,其中,执行所述对所述文本区域中的文本进行词嵌入处理,得到文本向量,包括:对所述文本区域中的文本进行语义切分,得到至少一个词语;对于所述至少一个词语中的每个词语,分别根据所述每个词语查询实体标签库,确定所述每个词语对应的实体标签;对所述每个词语进行词嵌入处理,得到词向量,以及对所述每个词语对应的实体标签进行编码,得到实体向量,其中,所述实体向量和所述词向量一一对应;根据至少一个所述实体向量和至少一个所述词向量,确定所述文本向量。
- 根据权利要求9所述的电子设备,其中,执行所述根据所述第一特征向量和所述第二特征向量,确定所述第一商标和所述第二商标之间的相似度,包括:对所述第一特征向量进行取模,得到第一模;对所述第二特征向量进行取模,得到第二模;确定所述第一模与所述第二模的乘积值;确定所述第一特征向量和所述第二特征向量的内积;将所述内积与所述乘积值的商,作为所述相似度。
- 一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现以下方法:对第一商标样本进行数据增广,得到第二商标样本;根据所述第二商标样本进行模型训练,得到特征提取模型;将第一待检测商标图像输入到所述特征提取模型,得到第一特征向量;将第二待检测商标图像输入到所述特征提取模型,得到第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述第一待检测商标图像和所述第二待检测商标图像之间的相似度;若所述相似度大于阈值,则确定所述第一待检测商标图像和所述第二待检测商标图像相似。
- 根据权利要求15所述的计算机可读存储介质,其中,执行所述对第一商标样本进行数据增广,得到第二商标样本,包括:对所述第一商标样本进行扰动处理,得到扰动图像,其中,所述扰动处理包括以下至少一种:平移处理、缩放处理、旋转处理以及翻转处理;对所述扰动图像添加预设噪声,得到所述第二商标样本,其中,所述预设噪声包括以下至少一种:高斯噪声、加性噪声、随机噪声以及椒盐噪声。
- 根据权利要求15或16所述的计算机可读存储介质,其中,在所述对第一商标样本进行数据增广,得到第二商标样本之前,所述计算机程序被处理器执行时还用于实现:对所述第一商标样本进行边缘检测,得到第一检测结果;根据所述第一检测结果,对所述第一商标样本进行裁剪,得到第一商标主体图像;将所述第一商标主体图像作为所述第一商标样本。
- 根据权利要求15所述的计算机可读存储介质,其中,执行所述将第一待检测商标图像输入到所述特征提取模型,得到第一特征向量,包括:对所述第一待检测商标图像进行图像分割,得到文本区域和图像区域;对所述文本区域中的文本进行词嵌入处理,得到文本向量;对所述图像区域中的图像进行特征提取,得到图像向量;将所述文本向量和所述图像向量进行拼接,得到所述第一特征向量。
- 根据权利要求18所述的计算机可读存储介质,其中,执行所述对所述文本区域中的文本进行词嵌入处理,得到文本向量,包括:对所述文本区域中的文本进行语义切分,得到至少一个词语;对于所述至少一个词语中的每个词语,分别根据所述每个词语查询实体标签库,确定 所述每个词语对应的实体标签;对所述每个词语进行词嵌入处理,得到词向量,以及对所述每个词语对应的实体标签进行编码,得到实体向量,其中,所述实体向量和所述词向量一一对应;根据至少一个所述实体向量和至少一个所述词向量,确定所述文本向量。
- 根据权利要求15所述的计算机可读存储介质,其中,执行所述根据所述第一特征向量和所述第二特征向量,确定所述第一商标和所述第二商标之间的相似度,包括:对所述第一特征向量进行取模,得到第一模;对所述第二特征向量进行取模,得到第二模;确定所述第一模与所述第二模的乘积值;确定所述第一特征向量和所述第二特征向量的内积;将所述内积与所述乘积值的商,作为所述相似度。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110080634.2 | 2021-01-21 | ||
CN202110080634.2A CN112861656B (zh) | 2021-01-21 | 2021-01-21 | 商标相似性检测方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022156067A1 true WO2022156067A1 (zh) | 2022-07-28 |
Family
ID=76008645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2021/083877 WO2022156067A1 (zh) | 2021-01-21 | 2021-03-30 | 商标相似性检测方法、装置、电子设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112861656B (zh) |
WO (1) | WO2022156067A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115311477A (zh) * | 2022-08-09 | 2022-11-08 | 北京惠朗时代科技有限公司 | 一种基于超分辨率重建的模仿式商标精准检测方法及系统 |
CN115481370A (zh) * | 2022-10-14 | 2022-12-16 | 中国传媒大学 | 一种动漫卡通形象侵权的监控方法及装置 |
CN118053018A (zh) * | 2024-01-23 | 2024-05-17 | 北京透彻未来科技有限公司 | 一种基于病理大模型的语义分割模型构建方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569070B (zh) * | 2021-07-24 | 2024-07-02 | 平安科技(深圳)有限公司 | 图像检测方法和装置、电子设备、存储介质 |
CN114187488B (zh) * | 2021-12-10 | 2023-11-17 | 北京百度网讯科技有限公司 | 图像处理方法、装置、设备、介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832765A (zh) * | 2017-09-13 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 对包括文字内容和图像内容的图片识别 |
US20180114091A1 (en) * | 2015-12-15 | 2018-04-26 | Qing Xu | Trademark retrieval method, apparatus and system, and computer storage medium |
CN108846441A (zh) * | 2018-06-21 | 2018-11-20 | 厦门集微科技有限公司 | 一种图像相似检测方法和装置、计算机可读存储介质 |
CN109034218A (zh) * | 2018-07-11 | 2018-12-18 | 东软集团股份有限公司 | 模型训练方法、装置、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263202A (zh) * | 2013-12-20 | 2019-09-20 | 西-奥特有限公司 | 图像搜索方法及设备 |
CN108764245B (zh) * | 2018-04-03 | 2022-04-29 | 南昌奇眸科技有限公司 | 一种提高商标图形相似度判定准确性的方法 |
CN108875727B (zh) * | 2018-06-29 | 2019-08-30 | 龙马智芯(珠海横琴)科技有限公司 | 图文标识的检测方法及装置、存储介质、处理器 |
CN110674881B (zh) * | 2019-09-27 | 2022-02-11 | 长城计算机软件与系统有限公司 | 商标图像检索模型训练方法、系统、存储介质及计算机设备 |
-
2021
- 2021-01-21 CN CN202110080634.2A patent/CN112861656B/zh active Active
- 2021-03-30 WO PCT/CN2021/083877 patent/WO2022156067A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180114091A1 (en) * | 2015-12-15 | 2018-04-26 | Qing Xu | Trademark retrieval method, apparatus and system, and computer storage medium |
CN107832765A (zh) * | 2017-09-13 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 对包括文字内容和图像内容的图片识别 |
CN108846441A (zh) * | 2018-06-21 | 2018-11-20 | 厦门集微科技有限公司 | 一种图像相似检测方法和装置、计算机可读存储介质 |
CN109034218A (zh) * | 2018-07-11 | 2018-12-18 | 东软集团股份有限公司 | 模型训练方法、装置、设备及存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115311477A (zh) * | 2022-08-09 | 2022-11-08 | 北京惠朗时代科技有限公司 | 一种基于超分辨率重建的模仿式商标精准检测方法及系统 |
CN115311477B (zh) * | 2022-08-09 | 2024-01-16 | 北京惠朗时代科技有限公司 | 一种基于超分辨率重建的模仿式商标精准检测方法及系统 |
CN115481370A (zh) * | 2022-10-14 | 2022-12-16 | 中国传媒大学 | 一种动漫卡通形象侵权的监控方法及装置 |
CN115481370B (zh) * | 2022-10-14 | 2024-05-07 | 中国传媒大学 | 一种动漫卡通形象侵权的监控方法及装置 |
CN118053018A (zh) * | 2024-01-23 | 2024-05-17 | 北京透彻未来科技有限公司 | 一种基于病理大模型的语义分割模型构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112861656B (zh) | 2024-05-14 |
CN112861656A (zh) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022156067A1 (zh) | 商标相似性检测方法、装置、电子设备和存储介质 | |
CN109582880B (zh) | 兴趣点信息处理方法、装置、终端及存储介质 | |
EP3772036A1 (en) | Detection of near-duplicate image | |
US20230376527A1 (en) | Generating congruous metadata for multimedia | |
CN108920580A (zh) | 图像匹配方法、装置、存储介质及终端 | |
CN113160257A (zh) | 图像数据标注方法、装置、电子设备及存储介质 | |
US20210141826A1 (en) | Shape-based graphics search | |
CN113221918B (zh) | 目标检测方法、目标检测模型的训练方法及装置 | |
CN113762303B (zh) | 图像分类方法、装置、电子设备及存储介质 | |
CN110209858B (zh) | 展示图片确定、对象搜索、展示方法、装置、设备和介质 | |
CN112200031A (zh) | 一种用于生成图像对应文字说明的网络模型训练方法与设备 | |
CN115496820A (zh) | 图像文案的生成方法、设备及计算机存储介质 | |
CN114494751A (zh) | 证照信息识别方法、装置、设备及介质 | |
CN114565768A (zh) | 图像分割方法及装置 | |
CN113065559B (zh) | 图像比对方法、装置、电子设备及存储介质 | |
CN111783786B (zh) | 图片的识别方法、系统、电子设备及存储介质 | |
CN117593420A (zh) | 基于图像处理的平面图纸标注方法、装置、介质及设备 | |
CN111914850B (zh) | 图片特征提取方法、装置、服务器和介质 | |
CN114386156B (zh) | 基于bim的隐蔽构件显示方法、装置、设备及可读存储介质 | |
CN111914863A (zh) | 目标检测方法、装置、终端设备及计算机可读存储介质 | |
CN116109864A (zh) | 服装的检测识别方法、装置、终端及计算机可读存储介质 | |
CN112381162B (zh) | 信息点识别方法、装置及电子设备 | |
Zhang et al. | Research on Workpiece Intelligent Detection Method Based on SSD Algorithm and Transfer Learning | |
CN112418321A (zh) | 标志图像的识别方法和装置 | |
CN115205555B (zh) | 确定相似图像的方法、训练方法、信息确定方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21920455 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21920455 Country of ref document: EP Kind code of ref document: A1 |