CN110674294A - 一种相似度确定方法及电子设备 - Google Patents

一种相似度确定方法及电子设备 Download PDF

Info

Publication number
CN110674294A
CN110674294A CN201910820757.8A CN201910820757A CN110674294A CN 110674294 A CN110674294 A CN 110674294A CN 201910820757 A CN201910820757 A CN 201910820757A CN 110674294 A CN110674294 A CN 110674294A
Authority
CN
China
Prior art keywords
file
feature
model
original
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910820757.8A
Other languages
English (en)
Inventor
曹新英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201910820757.8A priority Critical patent/CN110674294A/zh
Publication of CN110674294A publication Critical patent/CN110674294A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种相似度确定方法及电子设备。所述方法包括:接收用户对原始文件的第一输入;响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;获取所述特征提取模型输出的原始特征向量;根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;其中,所述特征处理模型为通过训练文件进行深度学习得到的;所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。本发明实施例解决了现有技术中,对于不同形式的两个文件之间,难以计算相似度的问题。

Description

一种相似度确定方法及电子设备
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种相似度确定方法及电子设备。
背景技术
在互联网技术领域,检索和匹配是两个较为常见的操作;以检索为例,检索指从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出相关信息的过程;不论是检索或是匹配,其中都涉及到相似度的问题;相似度即综合评定两个事物之间相近程度的一种度量,两个事物越接近,它们的相似性度也就越大,而两个事物越疏远,它们的相似性度也就越小。
目前,对于同一种类型的文件的相似度计算方法种类较多,且精度已经达到一个较高的范围;而文件内容的形式多种多样,包含但不限于文本、图像、音频等;虽然它们是不同的内容形式,但是同样是传达信息的载体。而不同内容形式的文件,比如图像文件和音频文件,图像文件和文本文件之间,在不同的内容形式之间,只能进行人工筛选或对比。因此,对于不同形式的两个文件之间,难以计算相似度。
发明内容
本发明实施例提供一种相似度确定方法及电子设备,以解决现有技术中,对于不同形式的两个文件之间,难以计算相似度的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种相似度确定方法,所述方法包括:
接收用户对原始文件的第一输入;
响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;
获取所述特征提取模型输出的原始特征向量;
根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;
其中,所述特征处理模型为通过训练文件进行深度学习得到的;所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。
第二方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
输入接收模块,用于接收用户对原始文件的第一输入;
输入响应模块,用于响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;
向量获取模块,用于获取所述特征提取模型输出的原始特征向量;
相似度确定模块,用于根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;其中,所述特征处理模型为通过训练文件进行深度学习得到的;所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的相似度确定方法中的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的相似度确定方法中的步骤。
在本发明实施例中,接收用户对原始文件的第一输入;响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;获取所述特征提取模型输出的原始特征向量,并根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度,以实现内容格式不同的文件之间的相似度计算,以便根据相似度确定执行其他相关操作;其中,特征处理模型为通过深度学习得到的,通过特征处理模型形成一种映射关系,将不同内容形式的文件映射至同一个特征空间中,实现不同形式的文件之间的比较等操作。
附图说明
图1表示本发明实施例提供的相似度确定方法的流程图之一;
图2表示本发明实施例提供的相似度确定方法的流程图之二;
图3表示本发明实施例的示例的示意图之一;
图4表示本发明实施例的示例的示意图之二;
图5表示本发明实施例的示例的示意图之三;
图6表示本发明的实施例提供的电子设备的框图之一;
图7表示本发明的实施例提供的电子设备的框图之二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
参见图1,本发明一实施例提供了一种相似度确定方法,所述方法包括:
步骤101,接收用户对原始文件的第一输入。
其中,原始文件的内容形式可以是图像文件、文本文件或音频文件,第一输入为检索操作或匹配操作,且检索操作、匹配操作的范围不仅是图像文件,还可时是文本文件以及音频文件;比如对于图像,其展示的内容可能包括但不限于景色、人物、情境以及情感等信息,而文本、音频也可以是以上信息的载体;因此,可以为原始文件检索或匹配不同内容形式的文件。
步骤102,响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型。
其中,特征处理模型为经过深度学习得到的,特征处理模型中包括特征提取模型,特征提取模型用于提取文件的特征向量,相当于存在一个多维的特征空间,通过特征提取模型将不同内容形式的文件映射至同一个特征空间中,在该多维空间中通过特征向量表征一个文件。
步骤103,获取所述特征提取模型输出的原始特征向量。
其中,获取经特征提模型输出的原始特征向量,原始特征向量将原始文件在多维空间中通过向量表示。
步骤104,根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;
其中,所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。
此外,特征转换模型用于将特征向量转换成与所属的原文件格式不同的转换文件;比如,向特征提取模块中输入图像文件,得到图像文件的特性向量,再将该特征向量输入至特征转换模型,得到音频或文本格式的转换文件;而特征提取模型与特征转换模型联立形成特征处理模型,也就是说,在模型训练(包括优化)的过程中,二者是一起训练的;通过特征转换模型来影响特征提取模型的训练,以提高特征提取模型的提取精度。
在模型训练完成后,即在后续应用该模型计算相似度时,仅需应用特征提取模型即可;特征提取模型的输入为原始文件,输出为原始文件的原始特征向量;具体地,若输入一张图像,通过特征处理模型,可以获取N维特征空间的一个特征向量a;该特征向量能够表示输入图像包含的信息,如:感情、意境、人物、景色等内容。
经过特征提取模型的映射,将原始文件映射到一多维空间,并得到该空间下的原始特征向量;对于不同内容格式的文件,均可映射到该多维空间,得到特征向量;基于同一个特征提取模型形成的多维空间,在该空间内的特征向量,计算不同内容格式的文件的相似度。
比如,特征提取模型提取5维特征向量,将图像文件输入至该提取模型得到5维的原始特征向量a,且预设样本库中存在10个文本形式的样本文件,该10个样本文件的样本特征向量b1-b10分别如下:
b1=[13.12,432.45,-0.22,5.73,-12435.90];
b2=[45.81,-768.85,4.22,75.83,-912.53];
b3=[-41.45,-13.35,5.74,35.13,67.23];
b4=[35.83,-3.78,6574.89,135.43,6512.28];
b5=[832.25,132.45,825.01,785.12,-45.65];
b6=[46.56,-1.35,-5.22,-565.13,873.17];
b7=[82435.68,8.76,975.37,313.92,872.43];
b8=[1.03,2.50,400.42,2998.63,-10.56];
b9=[03.41,3.35,355.42,3105.45,-11.83];
b10=[-0.01,451.35,5.45,-35.13,176.63];
原始特征向量a如下:
a=[0.03,1.35,435.43,3045.13,-12.23];
以相似度通过欧式距离计算为例,分别计算a与b1、b2、…、b10之间的欧式距离,得:
d(a,b1)=1.28e+04;
d(a,b2)=3.23e+03;
d(a,b3)=3.04e+03;
d(a,b4)=9.42e+03;
d(a,b5)=2.44e+03;
d(a,b6)=3.74e+03;
d(a,b7)=8.25e+04;
d(a,b8)=58.25;
d(a,b9)=100.28;
d(a,b10)=3.15e+03;
根据上述距离结果可知,特征向量a与特征向量b8之间的欧式距离最小,其次是b9;因此,可确定该图像文件与文本文件中的样本文件8最为接近。
本发明上述实施例中,接收用户对原始文件的第一输入;响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;获取所述特征提取模型输出的原始特征向量,并根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度,以实现内容格式不同的文件之间的相似度计算,以便根据相似度确定执行其他相关操作;其中,特征处理模型为通过深度学习得到的,通过特征处理模型形成一种映射关系,将不同内容形式的文件映射至同一个特征空间中,实现不同形式的文件之间的比较等操作;本发明实施例解决了现有技术中,对于不同形式的两个文件之间,难以计算相似度的问题。
可选地,本发明实施例中,所述根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度的步骤,包括:
获取所述预设样本库中的样本文件的样本特征向量,其中,所述样本特征向量为将所述样本文件输入至所述特征提取模型得到的;
确定所述样本特征向量与所述原始特征向量之间的相似度,所述相似度为所述样本文件与所述原始文件的相似度。
其中,样本文件可以在预设样本库中以其内容格式的形式存在,比如图像文件、音频文件、文本文件;在计算相似度时,可通过特征提取模型提取样本文件的样本特征向量;再将其与原始特征向量比较,确定相似度。
可选地,本发明实施例中,所述第一输入为检索操作或匹配操作,
所述根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度的步骤之后,所述方法还包括:
从所述样本文件的样本特征向量中,筛选与所述原始特征向量的相似度大于预设相似度阈值的目标特征向量;
将所述目标特征向量所属的样本文件作为所述第一输入的目标文件。
其中,通过特征提取模型将不同内容格式的文件映射到同一个特征空间中,之后计算相似度,并可基于相似度在不同格式的文件之间执行检索或匹配操作;比如,通过图像文件检索文本文件,通过文本文件检索音频文件。然后从所述样本文件的样本特征向量中,筛选与所述原始特征向量的相似度大于预设相似度阈值的目标特征向量,将所述目标特征向量所属的样本文件作为所述第一输入的目标文件。
以检索操作为例,通过图像文件去检索对应的文本文件时,首先将图像输入与图像对应的特征提取模型,获得对应的特征向量p;然后将预设样本库中的文本文件分别输入至与文本对应的特征提取模型,并分别保存对应的特征向量{q1,q2,…,qn}。将p与q1,q2,…,qn之间分别进行欧式距离计算,确定对应的相似度,那么此时的n组相似度就是图像与文本库中每条文本之间的匹配程度。
此外,预设相似度要求可以通过一个相似度阈值P来界定,欧式距离越小,则代表相似度越大。当不同内容格式的文件对应的特征向量之间的距离低于P时,则表示内容相似,便将相似的内容返回,并根据相似度大小排序反馈出检索结果。P值具体大小可以在实际情况中确定,也可以设定的返回结果的数量,只反馈部分相似度高的结果。
通过图像检索音频、文本检索图像或音频、音频检索图像或文本的过程与图像检索文本的过程类似,本发明实施例在此不再赘述。
参见图2,本发明又一实施例提供了一种相似度确定方法,所述方法包括:
步骤201,获取预设训练库中的训练文件。
其中,预设训练库中包括预设数目的训练文件,且训练文件涵盖各种内容形式。以图像为例,当采用有监督的机器学习方法训练模型时,需要预先获知图像的预设优化文件(即该图像对应的文本、音频);同理,当训练文本时,准备的预设优化文件为该文本对应的图像和音频;当训练音频时,对应的预设优化文件则是图像和文本。
下面以图像映射至特征空间为例进行说明。对于图像,其展示的内容可能包括但不限于景色、人物、情境以及情感等信息,而文本、音频也可以是以上信息的载体;因此,输入一张图像,其预设优化文件是蕴含信息一致、包含内容相符的对应的文本和音频。于是,对于训练图像映射到特征空间的神经网络,一组训练数据就是一张图像以及对应的预设优化文件(文本和音频)。
步骤202,根据所述训练文件,训练特征处理模型;其中,所述特征处理模型包括所述特征提取模型以及特征转换模型;所述特征转换模型用于对特征向量进行特征转换,得到与所述训练文件的内容格式不同的转换文件。
其中,特征处理模型包括所述特征提取模型以及特征转换模型,特征提取模型用于提取文件中的特征向量,特征转换模型用于根据特征向量对训练文件进行格式转换。
作为示例,如图3所示,输入一张图像文件时,特征提取模型提取其特征向量,将特征向量输入至文本对应的特征转换模型生成文本,得到图像对应的文本;将特征向量输入至音频对应的特征转换模型生成文本,得到图像对应的音频。
可选地,特征提取模型可以是编码器,特征转换模型可以是解码器。特征提取模型与特征转换模型联立形成特征处理模型,也就是说,在模型训练(包括优化)的过程中,二者是一起训练的;通过特征转换模型来影响特征提取模型的训练,以提高特征提取模型的提取精度。
相当于存在一个多维的特征空间,通过特征处理模型中的特征提取模型将不同内容形式的文件映射至同一个特征空间中,在该多维空间中通过特征向量表征一个文件;特征转换模型用于将特征向量转换成与所属的原文件格式不同的转换文件,比如,向特征提取模块中输入图像文件,得到图像文件的特性向量,再将该特征向量输入至特征转换模型,得到音频或文本格式的转换文件。
在模型训练完成后,即在后续应用该模型计算相似度时,仅需应用特征提取模型即可;特征提取模型的输入为原始文件,输出为原始文件的原始特征向量;具体地,若输入一张图像,通过特征处理模型,可以获取N维特征空间的一个特征向量a;该特征向量能够表示输入图像包含的信息,如:感情、意境、人物、景色等内容。
步骤203,接收用户对原始文件的第一输入。
其中,原始文件的内容形式可以是图像文件、文本文件或音频文件,第一输入为检索操作或匹配操作,且检索操作、匹配操作的范围不仅是图像文件,还可时是文本文件以及音频文件;比如对于图像,其展示的内容可能包括但不限于景色、人物、情境以及情感等信息,而文本、音频也可以是以上信息的载体;因此,可以为原始文件检索或匹配不同内容形式的文件。
步骤204,响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型。
步骤205,获取所述特征提取模型输出的原始特征向量。
步骤206,根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;其中,所述样本文件与所述原始文件的内容格式不同。
其中,经过特征提取模型的映射,将原始文件映射到一多维空间,并得到该空间下的原始特征向量;对于不同内容格式的文件,均可映射到该多维空间,得到特征向量;基于同一个特征提取模型形成的多维空间,在该空间内的特征向量,计算不同内容格式的文件的相似度。
可选地,本发明上述实施例中,步骤202包括:
第一步,将所述训练文件输入至初始特征提取模型,得到初始特征向量;
第二步,将所述初始特征向量输入至初始特征转换模型,得到转换文件;
第三步,通过所述转换文件和预设优化文件,对初始特征处理模型进行反向优化,得到特征处理模型;其中,所述反向优化用于使所述初始特征处理模型的损失函数的损失值降低至预设损失阈值;所述初始特征提取模型为与所述训练文件的内容格式对应的模型;所述初始特征转换模型为与转换文件的内容格式对应的模型;所述预设优化文件为所述训练文件在所述转换文件的内容格式下的文件。
其中,第一步中,将训练文件输入至初始特征提取模型,得到一个初始特征向量;且初始特征提取模型为与所述训练文件的内容格式对应的模型;第二步,将所述初始特征向量输入至初始特征转换模型,得到转换文件,转换文件即经过特征转换模型进行格式转换后的文件;
具体地,在内容格式为图像的情况下,与所述内容格式对应的特征提取模型和特征转换模型为卷积神经网络(Convolutional Neural Networks,CNN)模型;在所述内容格式为音频或文本的情况下,与所述内容格式对应的特征提取模型和特征转换模型为循环神经网络(Recurrent Neural Network,RNN)模型。
第三步中,通过所述转换文件以及预设优化文件之间的差异,如图3至图5所示,根据差异大小来构造损失函数对初始特征处理模型(包括初始特征提取模型以及初始特征转换模型)进行反向优化,降低上述差异,至损失函数的损失值降低至预设损失阈值,此时的特征处理模型即为最终的处理模型;其中,所述预设优化文件为所述训练文件在所述转换文件的内容格式下的文件。
作为示例,图3示出了输入为图像的特征处理模型,以下简称为图像模型,将图像文件首先输入(初始)特征提取模型,得到(初始)特征向量;将特征向量分别输入与文本、音频对应的(初始)特征转换模型,得到转换文件;再通过所述转换文件以及预设优化文件之间的差异反向优化初始模型;至损失函数的损失值降低至预设损失阈值,此时的特征处理模型即为最终的处理模型。
同理,还可以构造文本模型(如图4所示),音频模型(如图5所示)。
本发明上述实施例中,获取预设训练库中的训练文件,根据所述训练文件,训练特征处理模型,训练特征处理模型;后续接收用户对原始文件的第一输入,响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;获取所述特征提取模型输出的原始特征向量;根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度,以实现内容格式不同的文件之间的相似度计算,以便根据相似度确定执行其他相关操作;其中的特征处理模型为通过深度学习得到的,通过特征处理模型形成一种映射关系,将不同内容形式的文件映射至同一个特征空间中,实现不同形式的文件之间的比较等操作;本发明实施例解决了现有技术中,对于不同形式的两个文件之间,难以计算相似度的问题。
以上介绍了本发明实施例提供的相似度确定方法,下面将结合附图介绍本发明实施例提供的电子设备。
参见图6,本发明实施例还提供了一种电子设备600,包括:
输入接收模块601,用于接收用户对原始文件的第一输入。
其中,原始文件的内容形式可以是图像文件、文本文件或音频文件,第一输入为检索操作或匹配操作,且检索操作、匹配操作的范围不仅是图像文件,还可时是文本文件以及音频文件;比如对于图像,其展示的内容可能包括但不限于景色、人物、情境以及情感等信息,而文本、音频也可以是以上信息的载体;因此,可以为原始文件检索或匹配不同内容形式的文件。
输入响应模块602,用于响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型。
其中,特征处理模型为经过深度学习得到的,特征处理模型中包括特征提取模型,特征提取模型用于提取文件的特征向量,相当于存在一个多维的特征空间,通过特征提取模型将不同内容形式的文件映射至同一个特征空间中,在该多维空间中通过特征向量表征一个文件。
向量获取模块603,用于获取所述特征提取模型输出的原始特征向量。
其中,获取经特征提模型输出的原始特征向量,原始特征向量将原始文件在多维空间中通过向量表示。
相似度确定模块604,用于根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;其中,所述特征处理模型为通过训练文件进行深度学习得到的;所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。
其中,所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。
此外,特征转换模型用于将特征向量转换成与所属的原文件格式不同的转换文件;比如,向特征提取模块中输入图像文件,得到图像文件的特性向量,再将该特征向量输入至特征转换模型,得到音频或文本格式的转换文件;而特征提取模型与特征转换模型联立形成特征处理模型,也就是说,在模型训练(包括优化)的过程中,二者是一起训练的;通过特征转换模型来影响特征提取模型的训练,以提高特征提取模型的提取精度。
在模型训练完成后,即在后续应用该模型计算相似度时,仅需应用特征提取模型即可;特征提取模型的输入为原始文件,输出为原始文件的原始特征向量;具体地,若输入一张图像,通过特征处理模型,可以获取N维特征空间的一个特征向量a;该特征向量能够表示输入图像包含的信息,如:感情、意境、人物、景色等内容。
经过特征提取模型的映射,将原始文件映射到一多维空间,并得到该空间下的原始特征向量;对于不同内容格式的文件,均可映射到该多维空间,得到特征向量;基于同一个特征提取模型形成的多维空间,在该空间内的特征向量,计算不同内容格式的文件的相似度。
可选地,本发明实施例中,所述电子设备600还包括:
文件获取模块,用于获取预设训练库中的训练文件;
模型训练模块,用于根据所述训练文件,训练特征处理模型;
其中,所述特征处理模型包括所述特征提取模型以及特征转换模型;所述特征转换模型用于对特征向量进行特征转换,得到与所述训练文件的内容格式不同的转换文件。
可选地,本发明实施例中,所述模型训练模块包括:
第一输入子模块,用于将所述训练文件输入至初始特征提取模型,得到初始特征向量;
第二输入子模块,用于将所述初始特征向量输入至初始特征转换模型,得到转换文件;
优化子模块,用于通过所述转换文件和预设优化文件,对初始特征处理模型进行反向优化,得到特征处理模型;
其中,所述反向优化用于使所述初始特征处理模型的损失函数的损失值降低至预设损失阈值;所述初始特征提取模型为与所述训练文件的内容格式对应的模型;所述初始特征转换模型为与转换文件的内容格式对应的模型;所述预设优化文件为所述训练文件在所述转换文件的内容格式下的文件。
可选地,本发明实施例中,在所述内容格式为图像的情况下,与所述内容格式对应的初始特征提取模型和特征处理模型为卷积神经网络模型;
在所述内容格式为音频或文本的情况下,与所述内容格式对应的初始特征提取模型和特征处理模型为循环神经网络模型。
可选地,本发明实施例中,所述相似度确定模块604包括:
向量获取子模块,用于获取所述预设样本库中的样本文件的样本特征向量,其中,所述样本特征向量为将所述样本文件输入至所述特征提取模型得到的;
确定子模块,用于确定所述样本特征向量与所述原始特征向量之间的相似度,所述相似度为所述样本文件与所述原始文件的相似度。
可选地,本发明实施例中,所述电子设备600还包括:
筛选模块,用于所述第一输入为检索操作或匹配操作时,
从所述样本文件的样本特征向量中,筛选与所述原始特征向量的相似度大于预设相似度阈值的目标特征向量;
将所述目标特征向量所属的样本文件作为所述第一输入的目标文件。
本发明实施例提供的电子设备600能够实现图1至图5的方法实施例中电子设备600实现的各个过程,为避免重复,这里不再赘述。
本发明的实施例中,输入接收模块601接收用户对原始文件的第一输入时,响应于所述第一输入,输入响应模块602将所述原始文件输入至特征处理模型中的特征提取模型;向量获取模块603获取所述特征提取模型输出的原始特征向量;相似度确定模块604根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度,以实现内容格式不同的文件之间的相似度计算,以便根据相似度确定执行其他相关操作;其中的特征处理模型为通过深度学习得到的,通过特征处理模型形成一种映射关系,将不同内容形式的文件映射至同一个特征空间中,实现不同形式的文件之间的比较等操作;本发明实施例解决了现有技术中,对于不同形式的两个文件之间,难以计算相似度的问题。
图7为实现本发明各个实施例的一种电子设备的硬件结构示意图;
该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,射频单元701,用于接收用户对原始文件的第一输入;
处理器710,用于响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;
获取所述特征提取模型输出的原始特征向量;
根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;
其中,所述特征处理模型为通过训练文件进行深度学习得到的;所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。
本发明的实施例中,接收用户对原始文件的第一输入;响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;获取所述特征提取模型输出的原始特征向量,并根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度,以实现内容格式不同的文件之间的相似度计算,以便根据相似度确定执行其他相关操作;其中,特征处理模型为通过深度学习得到的,通过特征处理模型形成一种映射关系,将不同内容形式的文件映射至同一个特征空间中,实现不同形式的文件之间的比较等操作。
需要说明的是,本实施例中上述电子设备700可以实现本发明实施例中方法实施例中的各个过程,以及达到相同的有益效果,为避免重复,此处不再赘述。
应理解的是,本发明实施例中,射频单元701可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器710处理;另外,将上行的数据发送给基站。通常,射频单元701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元701还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块702为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元703可以将射频单元701或网络模块702接收的或者在存储器709中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元703还可以提供与电子设备700执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元703包括扬声器、蜂鸣器以及受话器等。
输入单元704用于接收音频或视频信号。输入单元704可以包括图形处理器(Graphics Processing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元706上。经图形处理器7041处理后的图像帧可以存储在存储器709(或其它存储介质)中或者经由射频单元701或网络模块702进行发送。麦克风7042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元701发送到移动通信基站的格式输出。
电子设备700还包括至少一种传感器705,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板7061的亮度,接近传感器可在电子设备700移动到耳边时,关闭显示面板7061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器705还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元706用于显示由用户输入的信息或提供给用户的信息。显示单元706可包括显示面板7061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板7061。
用户输入单元707可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7071上或在触控面板7071附近的操作)。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器710,接收处理器710发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7071。除了触控面板7071,用户输入单元707还可以包括其他输入设备7072。具体地,其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板7071可覆盖在显示面板7061上,当触控面板7071检测到在其上或附近的触摸操作后,传送给处理器710以确定触摸事件的类型,随后处理器710根据触摸事件的类型在显示面板7061上提供相应的视觉输出。虽然在图7中,触控面板7071与显示面板7061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板7071与显示面板7061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元708为外部装置与电子设备700连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元708可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备700内的一个或多个元件或者可以用于在电子设备700和外部装置之间传输数据。
存储器709可用于存储软件程序以及各种数据。存储器709可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器709可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器710是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器709内的软件程序和/或模块,以及调用存储在存储器709内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器710可包括一个或多个处理单元;优选的,处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
电子设备700还可以包括给各个部件供电的电源711(比如电池),优选的,电源711可以通过电源管理系统与处理器710逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备700包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器710,存储器709,存储在存储器709上并可在所述处理器710上运行的计算机程序,该计算机程序被处理器710执行时实现上述相似度确定方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述相似度确定方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (10)

1.一种相似度确定方法,其特征在于,所述方法包括:
接收用户对原始文件的第一输入;
响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;
获取所述特征提取模型输出的原始特征向量;
根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;
其中,所述特征处理模型为通过训练文件进行深度学习得到的;所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。
2.根据权利要求1所述的相似度确定方法,其特征在于,所述接收用户对原始文件的第一输入之前,所述方法还包括:
获取预设训练库中的训练文件;
根据所述训练文件,训练特征处理模型。
3.根据权利要求2所述的相似度确定方法,其特征在于,所述根据所述训练文件,训练特征处理模型,包括:
将所述训练文件输入至初始特征提取模型,得到初始特征向量;
将所述初始特征向量输入至初始特征转换模型,得到转换文件;
通过所述转换文件和预设优化文件,对初始特征处理模型进行反向优化,得到特征处理模型;
其中,所述反向优化用于使所述初始特征处理模型的损失函数的损失值降低至预设损失阈值;所述初始特征提取模型为与所述训练文件的内容格式对应的模型;所述初始特征转换模型为与转换文件的内容格式对应的模型;所述预设优化文件为所述训练文件在所述转换文件的内容格式下的文件。
4.根据权利要求3所述的相似度确定方法,其特征在于,
在所述内容格式为图像的情况下,与所述内容格式对应的初始特征提取模型和特征处理模型为卷积神经网络模型;
在所述内容格式为音频或文本的情况下,与所述内容格式对应的初始特征提取模型和特征处理模型为循环神经网络模型。
5.根据权利要求1所述的相似度确定方法,其特征在于,所述根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度,包括:
获取所述预设样本库中的样本文件的样本特征向量,其中,所述样本特征向量为将所述样本文件输入至所述特征提取模型得到的;
确定所述样本特征向量与所述原始特征向量之间的相似度,所述相似度为所述样本文件与所述原始文件的相似度。
6.根据权利要求1所述的相似度确定方法,其特征在于,所述第一输入为检索操作或匹配操作;
所述根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度之后,所述方法还包括:
从所述样本文件的样本特征向量中,筛选与所述原始特征向量的相似度大于预设相似度阈值的目标特征向量;
将所述目标特征向量所属的样本文件作为所述第一输入的目标文件。
7.一种电子设备,其特征在于,所述电子设备包括:
输入接收模块,用于接收用户对原始文件的第一输入;
输入响应模块,用于响应于所述第一输入,将所述原始文件输入至特征处理模型中的特征提取模型;
向量获取模块,用于获取所述特征提取模型输出的原始特征向量;
相似度确定模块,用于根据所述原始特征向量,确定预设样本库中的样本文件与所述原始文件的相似度;其中,所述特征处理模型为通过训练文件进行深度学习得到的;所述特征处理模型还包括特征转换模型,所述特征转换模型用于将特征向量转换成转换文件;所述样本文件与所述原始文件的内容格式不同。
8.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
文件获取模块,用于获取预设训练库中的训练文件;
模型训练模块,用于根据所述训练文件,训练特征处理模型;
其中,所述特征处理模型包括所述特征提取模型以及特征转换模型;所述特征转换模型用于对特征向量进行特征转换,得到与所述训练文件的内容格式不同的转换文件。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的相似度确定方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的相似度确定方法的步骤。
CN201910820757.8A 2019-08-29 2019-08-29 一种相似度确定方法及电子设备 Pending CN110674294A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910820757.8A CN110674294A (zh) 2019-08-29 2019-08-29 一种相似度确定方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910820757.8A CN110674294A (zh) 2019-08-29 2019-08-29 一种相似度确定方法及电子设备

Publications (1)

Publication Number Publication Date
CN110674294A true CN110674294A (zh) 2020-01-10

Family

ID=69076251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910820757.8A Pending CN110674294A (zh) 2019-08-29 2019-08-29 一种相似度确定方法及电子设备

Country Status (1)

Country Link
CN (1) CN110674294A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861253A (zh) * 2020-07-29 2020-10-30 北京车薄荷科技有限公司 一种人员能力的确定方法及确定系统
WO2021168815A1 (zh) * 2020-02-28 2021-09-02 华为技术有限公司 图像检索方法和图像检索装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574133A (zh) * 2015-12-15 2016-05-11 苏州贝多环保技术有限公司 一种多模态的智能问答系统及方法
CN106919652A (zh) * 2017-01-20 2017-07-04 东北石油大学 基于多源多视角直推式学习的短视频自动标注方法与系统
CN109783655A (zh) * 2018-12-07 2019-05-21 西安电子科技大学 一种跨模态检索方法、装置、计算机设备和存储介质
CN109840287A (zh) * 2019-01-31 2019-06-04 中科人工智能创新技术研究院(青岛)有限公司 一种基于神经网络的跨模态信息检索方法和装置
CN110019889A (zh) * 2017-12-01 2019-07-16 北京搜狗科技发展有限公司 训练特征提取模型及计算图片与查询词相关性系数的方法和相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574133A (zh) * 2015-12-15 2016-05-11 苏州贝多环保技术有限公司 一种多模态的智能问答系统及方法
CN106919652A (zh) * 2017-01-20 2017-07-04 东北石油大学 基于多源多视角直推式学习的短视频自动标注方法与系统
CN110019889A (zh) * 2017-12-01 2019-07-16 北京搜狗科技发展有限公司 训练特征提取模型及计算图片与查询词相关性系数的方法和相关装置
CN109783655A (zh) * 2018-12-07 2019-05-21 西安电子科技大学 一种跨模态检索方法、装置、计算机设备和存储介质
CN109840287A (zh) * 2019-01-31 2019-06-04 中科人工智能创新技术研究院(青岛)有限公司 一种基于神经网络的跨模态信息检索方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021168815A1 (zh) * 2020-02-28 2021-09-02 华为技术有限公司 图像检索方法和图像检索装置
CN111861253A (zh) * 2020-07-29 2020-10-30 北京车薄荷科技有限公司 一种人员能力的确定方法及确定系统

Similar Documents

Publication Publication Date Title
CN109558512B (zh) 一种基于音频的个性化推荐方法、装置和移动终端
CN108520058B (zh) 一种商家信息推荐方法及移动终端
CN110096580B (zh) 一种faq对话方法、装置及电子设备
CN108668024B (zh) 一种语音处理方法及终端
CN109005336B (zh) 一种图像拍摄方法及终端设备
CN108334196B (zh) 一种文件处理方法及移动终端
CN112820299B (zh) 声纹识别模型训练方法、装置及相关设备
CN111402866A (zh) 语义识别方法、装置及电子设备
CN110544287B (zh) 一种配图处理方法及电子设备
WO2021190387A1 (zh) 检测结果输出的方法、电子设备及介质
CN112735388B (zh) 网络模型训练方法、语音识别处理方法及相关设备
CN112689201A (zh) 弹幕信息识别方法、显示方法、服务器及电子设备
CN108765522B (zh) 一种动态图像生成方法及移动终端
CN111159338A (zh) 一种恶意文本的检测方法、装置、电子设备及存储介质
CN111143614A (zh) 视频显示方法及电子设备
CN109063076B (zh) 一种图片生成方法及移动终端
CN110674294A (zh) 一种相似度确定方法及电子设备
CN107809515B (zh) 一种显示控制方法及移动终端
CN111405361B (zh) 一种视频获取方法、电子设备及计算机可读存储介质
CN113314126A (zh) 知识蒸馏方法、语音识别处理方法及相关设备
CN111292727B (zh) 一种语音识别方法及电子设备
CN112188115A (zh) 一种图像处理方法、电子设备及存储介质
CN112464831B (zh) 视频分类方法、视频分类模型的训练方法及相关设备
CN113870862A (zh) 声纹识别模型训练方法、声纹识别方法及相关设备
CN117541770A (zh) 数据增强方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200110

RJ01 Rejection of invention patent application after publication