CN106844738B - 基于神经网络的食材之间容克关系的分类方法 - Google Patents

基于神经网络的食材之间容克关系的分类方法 Download PDF

Info

Publication number
CN106844738B
CN106844738B CN201710077241.XA CN201710077241A CN106844738B CN 106844738 B CN106844738 B CN 106844738B CN 201710077241 A CN201710077241 A CN 201710077241A CN 106844738 B CN106844738 B CN 106844738B
Authority
CN
China
Prior art keywords
food materials
relationship
term vector
neural network
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710077241.XA
Other languages
English (en)
Other versions
CN106844738A (zh
Inventor
文贵华
胡钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201710077241.XA priority Critical patent/CN106844738B/zh
Publication of CN106844738A publication Critical patent/CN106844738A/zh
Application granted granted Critical
Publication of CN106844738B publication Critical patent/CN106844738B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于神经网络的食材之间容克关系的分类方法,所述方法包括:采集中医体质学方面的资料作为文本语料;对采集的文本语料进行整体建模生成词向量,使文本语料中每个非停用词都对应一个固定长度的词向量;使用两个词向量之间的余弦相似度作为两个词向量所对应实体之间的相似度;对于给定的两种食材,将两种食材之间关系的特征表示为食材之间关系的表征词的词向量组成的矩阵;使用循环卷积神经网络,以食材之间关系的特征作为循环卷积神经网络的输入,训练人工标注的食材之间容克关系的数据。本发明方法能够准确、快速的判定食材之间的相容或相克关系,进而辅助食疗推荐系统,丰富食疗推荐系统的推荐的食品种类。

Description

基于神经网络的食材之间容克关系的分类方法
技术领域
本发明涉及一种食材间容克关系的分类方法,尤其是一种基于神经网络的食材之间容克关系的分类方法,属于计算机科学在中医食疗学方面的应用领域。
背景技术
众所周知,中医是我国的传统医学,而体质食疗学是中医理论的重要组成部分。但它的判定指标具有离散性和模糊性的特点,这就使得中医体质食疗学难以整合和系统化。
随着社会的发展和工业化进程,一方面我国的大气资源和水资源都受到了相当程度的污染,另一方面城市工作的年轻人生活压力也比以往更大。这使得许多人都处于亚健康状态,而亚健康在西医的指标中被视为健康。而传统中医的体质食疗法是专家根据知识和经验,并综合考察病人的状况并给出合适的饮食建议。这种方法有两点不足,一是专家数量有限,难以覆盖日益增长的需求;二是人工诊断具有很强的不确定性,不同的专家的经验和理解往往不同,容易造成错误的饮食建议。
目前,中医领域已经有了一些能以中医理论作为基础的健康指导知识库的构建方法。然而在国际上,美国和欧洲的一些研究机构和公司已经利用图谱式的结构对关联知识进行了有效的组织和挖掘。因此,运用新的方法使得中医食疗学和养生能够自动化的推荐具有重要意义。
发明内容
本发明的目的是为了解决上述现有技术的缺陷,提供了一种基于神经网络的食材之间容克关系的分类方法,该方法能够准确、快速的判定食材之间的相容或相克关系,进而辅助食疗推荐系统,丰富食疗推荐系统的推荐的食品种类,并尽力排除食疗推荐系统推荐相克食物的隐患。
本发明的目的可以通过采取如下技术方案达到:
基于神经网络的食材之间容克关系的分类方法,所述方法包括:
采集中医体质学方面的资料作为文本语料;
对采集的文本语料进行整体建模生成词向量,使文本语料中每个非停用词都对应一个固定长度的词向量;
使用两个词向量之间的余弦相似度作为两个词向量所对应实体之间的相似度;
对于给定的两种食材,将两种食材之间关系的特征表示为食材之间关系的表征词的词向量组成的矩阵;
使用循环卷积神经网络,以食材之间关系的特征作为循环卷积神经网络的输入,训练人工标注的食材之间容克关系的数据。
进一步的,所述对采集的文本语料进行整体建模生成词向量,使文本语料中每个非停用词都对应一个固定长度的词向量,具体为:
使用词向量工具word2vec对采集的文本语料进行整体建模,将文本语料的所有非停用词映射到一个维度固定的词向量空间中,使每个非停用词都对应一个固定长度的词向量;其中,设非停用词的数量为n,词向量的空间维度为m,对于所有的非停用词{w1,w2,…,wn},其对应的词向量为{v1,v2,…,vn}。
进一步的,所述向量空间的维度为150~200维度。
进一步的,所述使用两个词向量之间的余弦相似度作为两个词向量所对应实体之间的相似度,具体为:
设两个词向量为s=(s0,s1,…,sm),t=(t0,t1,…,tm),利用下式计算两个词向量之间的余弦相似度:
其中,0≤i≤m。
进一步的,所述对于给定的两种食材,将两种食材之间关系的特征表示为食材之间关系的表征词的词向量组成的矩阵,具体为:
设两种食材的词向量分别为a和b,以及选取两个参数k0,k1
有k0+1个辅助向量:
对于每个辅助向量vecki,在词向量空间中取最接近的k1个向量组成矩阵matki,则两种食材之间的特征表示为矩阵matk0,matk1…,matkk1的拼接,即k1(k0+1)个词向量的拼接;
每个辅助向量vecki最相近的k1个词向量可随意排序,通过打乱顺序若干次来扩大训练样本。
进一步的,所述使用循环卷积神经网络,以食材之间关系的特征作为循环卷积神经网络的输入,训练人工标注的食材之间容克关系的数据,具体为:
循环卷积神经网络分为四个部分:
第一部分由两个LSTM组成,输入是食材之间关系的表征词的词向量组成的矩阵,从两个方向分别记录上文和下文的记忆,输出是食材之间关系的所有表征词及其上下文记忆的拼接;
第二部分是循环卷积层,对每个表征词及其上下文拼接,使用同一个卷积映射到更小的维度;
第三部分是池化层,对于所有表征词及其上下文拼接的映射,池化后在每个维度都选取所有映射在此维度的最大值;
第四部分为sigmoid层,得到一个概率,越接近1说明越倾向于相克,越接近0说明越倾向于相容。
进一步的,所述方法还包括:
在训练后,通过对食材之间关系的表征词的词向量组成的矩阵中的词向量顺序打乱若干次,得到若干个表征词的词向量序列,输入循环卷积神经网络,并对结果进行集成投票,取出现最多的结果作为最终答案。
进一步的,所述采集中医体质学方面的资料作为文本语料,具体包括:
使用爬虫爬取网络上的中医体质学方面的资料作为文本语料;其中,所述中医体质学方面的资料包括健康博文和食材百科。
本发明相对于现有技术具有如下的有益效果:
1、本发明方法将任意两种食材之间关系的特征表示为一系列表证词的词向量组成的矩阵,这些词向量组成的矩阵在两种食材在词向量空间的夹角之间有一定的顺序性,从而可以使用RNN(循环神经网络)来达到更好的效果。
2、本发明方法采用了LSTM代替了一般的RNN(循环神经网络),从而达到更好效果,由于这种食材关系特征表示的词向量并不是全序的,比如同一个词向量序列中的词向量可以打乱顺序,因此可以打乱顺序若干次获得更多的样本以及在训练中通过打乱顺序对结果集成投票来提升准确率。
附图说明
图1为本发明实施例整个解决方案各部分的基本结构图。
图2为本发明实施例生成食材之间关系的特征词向量组的一个二维实例。
图3为本发明实施例循环卷积神经网络的结构图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1:
如图1所示,本实施例的食材之间容克关系的分类方法包括以下步骤:
(一)采集健康博文和食材百科等资料作为文本语料
使用爬虫爬取网络上健康博文和食材百科等中医体质学方面的资料作为文本语料。
(二)对采集的文本语料进行整体建模生成词向量,使文本语料中每个非停用词都对应一个固定长度的词向量
本实施例的“词向量”是指2013年Google提出的基于神经网络词嵌入建模算法和它的建模工具word2vec,词向量模型是一种将词转化成词向量的模型,最简单的词向量模型是one-hot模型,它将每一个词对应一个不同的维度,每一个词对应的词向量则是该词对应的维度位置为1,其余维度为0的向量,而近年兴起的word2vec工具训练出来的词向量不但压缩了维度还使得相关相近的实体在词向量空间中的余弦相似度也比较高,这使得该模型在NLP(Neuro-Linguistic Programming,神经语言程序学)领域的词特征表示中得到广泛应用。
本实施例使用python库gensim提供的词向量工具word2vec对采集的文本语料进行整体建模(建立的模型为model),将文本语料的所有非停用词映射到维度为160的词向量空间中,使每个非停用词都对应一个固定长度的词向量。
设非停用词的数量为n,对于所有的非停用词{w1,w2,…,wn},其对应的词向量为{v1,v2,…,vn}。
(三)使用两个词向量之间的余弦相似度作为两个词向量所对应实体之间的相似度
设两个词向量为s=(s0,s1,…,s160),t=(t0,t1,…,t160),利用下式计算两个词向量之间的余弦相似度:
其中,0≤i≤160,该余弦值最大说明相似度最高。
在查找与某个词向量相似度最高的词向量时,可以使用gensim中的model.most_similar这个API查找最相似的若干个词向量。
(四)对于给定的两种食材,将两种食材之间关系的特征表示为食材之间关系的表征词的词向量组成的矩阵
设两种食材的词向量分别为a和b,以及选取两个参数k0,k1
有k0+1个辅助向量:
对于每个辅助向量vecki,在词向量空间中取最接近的k1个向量组成矩阵matki,则两种食材之间的特征表示为矩阵matk0,matk1…,matkk1的拼接,即k1(k0+1)个词向量的拼接。例如,k0=5,k1=5时,生成了veck0,veck1,veck2,veck3,veck4,veck5这6个辅助向量,如图2所示,每个辅助向量可以在词向量空间中取5个最接近的词向量,拼接起来时形成了30个词向量构成的矩阵的特征表示。
对于matki中的k1个词向量可以任意排列顺序拼接起来生成更多特征向量,从而生成更多的样本,比如通过打乱顺序15次,可以使得训练样本变为原来的15倍,从而提高算法准确率。
(五)使用循环卷积神经网络,以食材之间关系的特征作为循环卷积神经网络的输入,训练人工标注的食材之间容克关系的数据
使用python库keras构建循环卷积神经网络模型,循环卷积神经网络的结构如图3所示,分为四个部分:
第一部分由两个LSTM(Long Short-Term Memory,时间递归神经网络)组成,LSTM是一种特殊的RNN(Recurrent Neural Networks,循环神经网络),它比普通RNN好的地方在于它有一个忘记门可以控制忘记率,这就使得它可以选择性的记住很久之前它认为重要的信息,而普通的RNN则是保证了越近期的信息越清晰,越远的信息越模糊,这就使得普通的RNN总是把远的信息忘掉而不会分辨是否重要;LSTM目前有很多变种,近年来的研究都表明LSTM比普通的RNN效果要好,可以学习长期依赖信息,以下是LSTM的相关公式:
ft=σ(Wf[ht-1,xt]+bf)
it=σ(Wi[ht-1,xt]+bi)
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
ht=LSTM(xt,ht-1)
CLt=LSTM(dt-1,CLy-1)
CRt=LSTM(dy+1,CRt+1)
根据步骤(四),可知1≤t≤30,CL是一个从左到右的LSTM,CR是一个从右到左的LSTM,CL和CR的输出层维度都为160维;
两个LSTM的输入是食材之间关系的表征词的词向量组成的矩阵,从两个方向分别记录上文和下文的记忆,输出是食材之间关系的所有表征词及其上下文记忆的拼接,如下式:
xt=[CLt,dt,CRt]
即每个表征词与自己左边的上下文和右边的上下文构成x(1),x(2),…,x(t),…x(30),,每项的维度为480维;
第二部分是循环卷积层,对每个表征词及其上下文拼接,使用同一个卷积映射到更小的维度,如下式:
yt=tanh(W1xi+b1)
即降维映射到y(1),y(2),…,y(t),…,y(30),此时每项的维度为160维;
第三部分是池化层,对于所有表征词及其上下文拼接的映射,池化后在每个维度都选取所有映射在此维度的最大值,如下式:
z=maxyi
z的维度为160维;
第四部分为sigmoid层,得到一个概率,如下式:
zp=W2z+b2
越接近1说明越倾向于相克,越接近0说明越倾向于相容。
通过对有序的文档的词向量放入LSTM得到上下文再使用卷积和池化,解决的问题是文档分类。
(六)在训练后,通过对食材之间关系的表征词的词向量组成的矩阵中的词向量顺序打乱15次,得到15个表征词的词向量序列,输入循环卷积神经网络,并对结果进行集成投票,取出现最多的结果作为最终答案。
综上所述,本发明方法能够准确、快速的判定食材之间的相容或相克关系,进而辅助食疗推荐系统,丰富食疗推荐系统的推荐的食品种类,并尽力排除食疗推荐系统推荐相克食物的隐患。
以上所述,仅为本发明专利优选的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (7)

1.基于神经网络的食材之间容克关系的分类方法,其特征在于:所述方法包括:
采集中医体质学方面的资料作为文本语料;
对采集的文本语料进行整体建模生成词向量,使文本语料中每个非停用词都对应一个固定长度的词向量;
使用两个词向量之间的余弦相似度作为两个词向量所对应实体之间的相似度;
对于给定的两种食材,将两种食材之间关系的特征表示为食材之间关系的表征词的词向量组成的矩阵;
使用循环卷积神经网络,以食材之间关系的特征作为循环卷积神经网络的输入,训练人工标注的食材之间容克关系的数据;
所述对于给定的两种食材,将两种食材之间关系的特征表示为食材之间关系的表征词的词向量组成的矩阵,具体为:
设两种食材的词向量分别为a和b,以及选取两个参数k0,k1
有k0+1个辅助向量:
对于每个辅助向量vecki,在词向量空间中取最接近的k1个向量组成矩阵matki,则两种食材之间的特征表示为矩阵matk0,matk1…,matkk1的拼接,即k1(k0+1)个词向量的拼接;
每个辅助向量vecki最相近的k1个词向量可随意排序,通过打乱顺序若干次来扩大训练样本。
2.根据权利要求1所述的基于神经网络的食材之间容克关系的分类方法,其特征在于:所述对采集的文本语料进行整体建模生成词向量,使文本语料中每个非停用词都对应一个固定长度的词向量,具体为:
使用词向量工具word2vec对采集的文本语料进行整体建模,将文本语料的所有非停用词映射到一个维度固定的词向量空间中,使每个非停用词都对应一个固定长度的词向量;其中,设非停用词的数量为n,词向量的空间维度为m,对于所有的非停用词{w1,w2,…,wn},其对应的词向量为{v1,v2,…,vn}。
3.根据权利要求2所述的基于神经网络的食材之间容克关系的分类方法,其特征在于:所述向量空间的维度为150~200维度。
4.根据权利要求2所述的基于神经网络的食材之间容克关系的分类方法,其特征在于:所述使用两个词向量之间的余弦相似度作为两个词向量所对应实体之间的相似度,具体为:
设两个词向量为s=(s0,s1,…,sm),t=(t0,t1,…,tm),利用下式计算两个词向量之间的余弦相似度:
其中,0≤i≤m。
5.根据权利要求1所述的基于神经网络的食材之间容克关系的分类方法,其特征在于:所述使用循环卷积神经网络,以食材之间关系的特征作为循环卷积神经网络的输入,训练人工标注的食材之间容克关系的数据,具体为:
循环卷积神经网络分为四个部分:
第一部分由两个LSTM组成,输入是食材之间关系的表征词的词向量组成的矩阵,从两个方向分别记录上文和下文的记忆,输出是食材之间关系的所有表征词及其上下文记忆的拼接;
第二部分是循环卷积层,对每个表征词及其上下文拼接,使用同一个卷积映射到更小的维度;
第三部分是池化层,对于所有表征词及其上下文拼接的映射,池化后在每个维度都选取所有映射在此维度的最大值;
第四部分为sigmoid层,得到一个概率,越接近1说明越倾向于相克,越接近0说明越倾向于相容。
6.根据权利要求1所述的基于神经网络的食材之间容克关系的分类方法,其特征在于:所述方法还包括:
在训练后,通过对食材之间关系的表征词的词向量组成的矩阵中的词向量顺序打乱若干次,得到若干个表征词的词向量序列,输入循环卷积神经网络,并对结果进行集成投票,取出现最多的结果作为最终答案。
7.根据权利要求1-6任一项所述的基于神经网络的食材之间容克关系的分类方法,其特征在于:所述采集中医体质学方面的资料作为文本语料,具体包括:
使用爬虫爬取网络上的中医体质学方面的资料作为文本语料;其中,所述中医体质学方面的资料包括健康博文和食材百科。
CN201710077241.XA 2017-02-14 2017-02-14 基于神经网络的食材之间容克关系的分类方法 Active CN106844738B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710077241.XA CN106844738B (zh) 2017-02-14 2017-02-14 基于神经网络的食材之间容克关系的分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710077241.XA CN106844738B (zh) 2017-02-14 2017-02-14 基于神经网络的食材之间容克关系的分类方法

Publications (2)

Publication Number Publication Date
CN106844738A CN106844738A (zh) 2017-06-13
CN106844738B true CN106844738B (zh) 2019-07-16

Family

ID=59128703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710077241.XA Active CN106844738B (zh) 2017-02-14 2017-02-14 基于神经网络的食材之间容克关系的分类方法

Country Status (1)

Country Link
CN (1) CN106844738B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391906B (zh) * 2017-06-19 2020-04-28 华南理工大学 基于神经网络和图谱结构的健康饮食知识网络构建方法
CN107301246A (zh) * 2017-07-14 2017-10-27 河北工业大学 基于超深卷积神经网络结构模型的中文文本分类方法
CN109062897A (zh) * 2018-07-26 2018-12-21 苏州大学 基于深度神经网络的句子对齐方法
CN109697288B (zh) * 2018-12-25 2020-09-15 北京理工大学 一种基于深度学习的实例对齐方法
US11164478B2 (en) * 2019-05-17 2021-11-02 NotCo Delaware, LLC Systems and methods to mimic target food items using artificial intelligence
CN110334110A (zh) * 2019-05-28 2019-10-15 平安科技(深圳)有限公司 自然语言分类方法、装置、计算机设备以及存储介质
CN111159409B (zh) * 2019-12-31 2023-06-02 腾讯科技(深圳)有限公司 基于人工智能的文本分类方法、装置、设备、介质
US11982661B1 (en) 2023-05-30 2024-05-14 NotCo Delaware, LLC Sensory transformer method of generating ingredients and formulas

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572892A (zh) * 2014-12-24 2015-04-29 中国科学院自动化研究所 一种基于循环卷积网络的文本分类方法
CN106202054A (zh) * 2016-07-25 2016-12-07 哈尔滨工业大学 一种面向医疗领域基于深度学习的命名实体识别方法
CN106354710A (zh) * 2016-08-18 2017-01-25 清华大学 一种神经网络关系抽取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572892A (zh) * 2014-12-24 2015-04-29 中国科学院自动化研究所 一种基于循环卷积网络的文本分类方法
CN106202054A (zh) * 2016-07-25 2016-12-07 哈尔滨工业大学 一种面向医疗领域基于深度学习的命名实体识别方法
CN106354710A (zh) * 2016-08-18 2017-01-25 清华大学 一种神经网络关系抽取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于Web数据的农业网络信息自动采集与分类系统》;段青玲 等;《农业工程学报》;20160630;第32卷(第12期);第172-176页

Also Published As

Publication number Publication date
CN106844738A (zh) 2017-06-13

Similar Documents

Publication Publication Date Title
CN106844738B (zh) 基于神经网络的食材之间容克关系的分类方法
CN111444726B (zh) 基于双向格子结构的长短时记忆网络的中文语义信息提取方法和装置
CN111159223B (zh) 一种基于结构化嵌入的交互式代码搜索方法及装置
CN107239446B (zh) 一种基于神经网络与注意力机制的情报关系提取方法
CN107391906B (zh) 基于神经网络和图谱结构的健康饮食知识网络构建方法
CN108804677B (zh) 结合多层级注意力机制的深度学习问题分类方法及系统
CN111191002B (zh) 一种基于分层嵌入的神经代码搜索方法及装置
Gibbons et al. Nonparametric statistical inference: revised and expanded
CN104598611B (zh) 对搜索条目进行排序的方法及系统
CN111966883B (zh) 结合自动编码器和生成对抗网络的零样本跨模态检索方法
CN110502627A (zh) 一种基于多层Transformer聚合编码器的答案生成方法
CN107918782A (zh) 一种生成描述图像内容的自然语言的方法与系统
CN109635083B (zh) 一种用于搜索ted演讲中话题式查询的文档检索方法
CN109492157A (zh) 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN111967495B (zh) 一种分类识别模型构建方法
CN103488713B (zh) 一种可直接度量不同模态数据间相似性的跨模态检索方法
CN111858940B (zh) 一种基于多头注意力的法律案例相似度计算方法及系统
CN105512209A (zh) 一种基于特征自动学习的生物医学事件触发词识别方法
CN111143672B (zh) 基于知识图谱的专业特长学者推荐方法
Malinowski et al. A pooling approach to modelling spatial relations for image retrieval and annotation
CN112115253B (zh) 基于多视角注意力机制的深度文本排序方法
CN110569982A (zh) 一种基于元学习的主动采样方法
CN109935337A (zh) 一种基于相似性度量的病案查找方法及系统
ElBedwehy et al. A computational knowledge representation model for cognitive computers
CN117573815B (zh) 一种基于向量相似度匹配优化的检索增强生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant