CN115357785A - 一种基于语义交互和局部激活的企业资讯推荐方法 - Google Patents

一种基于语义交互和局部激活的企业资讯推荐方法 Download PDF

Info

Publication number
CN115357785A
CN115357785A CN202210936398.4A CN202210936398A CN115357785A CN 115357785 A CN115357785 A CN 115357785A CN 202210936398 A CN202210936398 A CN 202210936398A CN 115357785 A CN115357785 A CN 115357785A
Authority
CN
China
Prior art keywords
information
sequence
word
ith
historical click
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210936398.4A
Other languages
English (en)
Other versions
CN115357785B (zh
Inventor
王英龙
张洪彪
舒明雷
孔祥龙
单珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Shandong Computer Science Center National Super Computing Center in Jinan
Shandong Institute of Artificial Intelligence
Original Assignee
Qilu University of Technology
Shandong Computer Science Center National Super Computing Center in Jinan
Shandong Institute of Artificial Intelligence
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology, Shandong Computer Science Center National Super Computing Center in Jinan, Shandong Institute of Artificial Intelligence filed Critical Qilu University of Technology
Priority to CN202210936398.4A priority Critical patent/CN115357785B/zh
Publication of CN115357785A publication Critical patent/CN115357785A/zh
Application granted granted Critical
Publication of CN115357785B publication Critical patent/CN115357785B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

一种基于语义交互和局部激活的企业资讯推荐方法,通过SIN企业资讯编码器可以在标题和内容之间进行单词级语义交互,缓解了独立编码标题和内容时的语义偏差,有效增强了企业资讯表示。通过LAU用户编码器更加符合用户的真实的行为习惯,可以分区域处理用户点击历史,以细粒度的方式有效捕获用户的各种潜在兴趣。提出的LAU用户编码器可以利用候选企业资讯激活相关的关键性潜在兴趣,并结合注意力机制使其保留到了最终交互阶段,这有效增强了用户兴趣表示;上述三点的成功使得我们的方法有效提高了企业资讯推荐的准确性。

Description

一种基于语义交互和局部激活的企业资讯推荐方法
技术领域
本发明涉及个性化咨询推荐技术领域,具体涉及一种基于语义交互和局部激活的企业资讯推荐方法。
背景技术
个性化企业资讯推荐对于帮助用户找到感兴趣的企业资讯和改善阅读体验非常重要。基于深度学习的企业资讯推荐技术解决了传统推荐需要大量特征工程和专家知识的问题,其关键在于两个方面。一方面是为用户学习一个嵌入表示以准确描述用户兴趣,另一方面是为企业资讯学习一个嵌入表示以准确描述资讯语义信息。
对于企业资讯表示学习,现有工作主要集中在设计一个企业资讯编码器从其标题、内容及类别等信息中提取语义特征。对于用户表示学习,现有的工作主要集中在设计一个用户编码器从其点击的历史资讯中推断用户兴趣。现阶段常用的企业资讯编码器和用户编码器主要面临以下几个问题:
(1)将标题和内容视为两个独立的视图分别进行编码,没有在标题和内容之间进行充分的语义交互,这种方式造成对企业资讯理解不够充分;
(2)通常将用户的点击历史视为一个整体进行表示学习,这无法捕获用户点击历史中细粒度的潜在兴趣;
(3)大都没有考虑候选资讯对用户兴趣表达的影响,这可能导致用户表示学习过程中的重要信息不能“幸存”到最终交互阶段。
发明内容
本发明为了克服以上技术的不足,提供了一种在获得良好嵌入表示的基础上有效提高了企业资讯推荐准确性的方法。
本发明克服其技术问题所采用的技术方案是:
一种基于语义交互和局部激活的企业资讯推荐方法,包括如下步骤:
a)获取用户按时间降序的历史点击资讯序列数据V=[v1,v2,...,vi,...,vF]和候选企业资讯
Figure BDA0003783253950000011
其中vi为第i个历史点击的资讯,i∈{1,...F},F为历史点击的资讯数量,
Figure BDA0003783253950000021
为第i个候选企业资讯,i∈{1,...O},O为候选企业资讯数量;
b)将用户的历史点击资讯序列数据V和候选企业资讯Vcd分别输入到SIN企业咨询编码器中,分别得到历史点击资讯嵌入表示序列R=[r1,r2,...,ri,...,rF]和候选企业资讯嵌入表示
Figure BDA0003783253950000022
其中ri为第i个历史点击资讯嵌入表示,i∈{1,...F},ri cd为第i个候选企业资讯嵌入表示,i∈{1,...O};
c)将历史点击资讯嵌入表示序列R和候选企业资讯嵌入表示Rcd输入到LAU用户编码器,得到最终的用户嵌入表示u;
d)通过公式
Figure BDA0003783253950000023
计算得到用户对第i个候选企业资讯的点击概率得分
Figure BDA0003783253950000024
选取概率最大的5个候选快讯推荐给用户。
优选的,步骤a)中F取值为50。
进一步的,步骤b)包括如下步骤:
b-1)使用Snownlp分词工具将每一条历史点击资讯的标题和内容分别转换成分词序列,得到截取最大长度为N的历史点击资讯的标题分词序列[xt,1,xt,2,...,xt,i,...,xt,N]和截取最大长度为M的历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M],其中xt,i为第i个历史点击资讯的标题分词,i∈{1,...N},xc,i为第i个历史点击资讯的内容分词,i∈{1,...M},使用预训练的300维Glove中文词将历史点击资讯的标题分词序列[xt,1,xt,2,...,xt,i,...,xt,N]映射为历史点击资讯的标题分词向量序列[et,1,et,2,…,et,i,…,et,N],将历史点击资讯的内容分词序列[xc,1,xc,2,…,xc,i,…,xc,M]映射为历史点击资讯的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M];
b-2)使用Snownlp分词工具将每一条候选企业资讯的标题和内容分别转换成分词序列,得到截取最大长度为N的候选企业资讯的标题分词序列
Figure BDA0003783253950000031
和截取最大长度为M的候选企业资讯的内容分词序列
Figure BDA0003783253950000032
其中
Figure BDA0003783253950000033
为第i个候选企业资讯的标题分词,i∈{1,…N},
Figure BDA0003783253950000034
为第i个候选企业资讯的内容分词,i∈{1,…M},使用预训练的300维Glove中文词将候选企业资讯的标题分词序列
Figure BDA0003783253950000035
映射为候选企业资讯的标题分词向量序列
Figure BDA0003783253950000036
将候选企业资讯的内容分词序列
Figure BDA0003783253950000037
映射为候选企业资讯的内容分词向量序列
Figure BDA0003783253950000038
b-3)将历史点击资讯的标题分词向量序列[et,1,et,2,...,et,i,...,et,N]和历史点击资讯的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M]分别输入到SE-NET模型中,得到历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,...,e′t,N]和历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,...,e′c,i,...,e′c,M],将候选企业资讯的标题分词向量序列
Figure BDA0003783253950000039
和候选企业资讯的内容分词向量序列
Figure BDA00037832539500000310
分别输入到SE-NET模型中,得到候选企业资讯的缩放后标题词序列
Figure BDA00037832539500000311
和候选企业资讯的缩放后内容词序列
Figure BDA00037832539500000312
b-4)将历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,...,e′t,N]与历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,...,e′c,i,...,e′c,M]拼接后得到历史点击资讯的分词向量序列[e′1,e′2,...,e′i,...,e′N+M],e′i为第i个拼接后得到历史点击资讯的分词向量,i∈{1,...,N+M},将候选企业资讯的缩放后标题词序列
Figure BDA0003783253950000041
和候选企业资讯的缩放后内容词序列
Figure BDA0003783253950000042
拼接后得到候选企业资讯的分词向量序列
Figure BDA0003783253950000043
Figure BDA00037832539500000418
为第i个拼接后得到候选企业资讯的分词向量;
b-5)通过多头自注意力网络分别建模历史点击资讯的分词向量序列[e′1,e′2,...,e′i,...,e′N+M]和候选企业资讯的分词向量序列
Figure BDA0003783253950000044
的相互作用关系,得到语义交互增强后的历史点击资讯的分词向量序列
Figure BDA0003783253950000045
及语义交互增强后的候选企业资讯的分词向量序列
Figure BDA0003783253950000046
其中
Figure BDA0003783253950000047
为第i个语义交互增强后的历史点击资讯的分词向量,i∈{1,…,N+M},
Figure BDA0003783253950000048
为第i个语义交互增强后的候选企业资讯的分词向量,i∈{1,...,N+M};
b-6)通过公式
Figure BDA0003783253950000049
计算得到第i个语义交互增强后的历史点击资讯的分词的注意力融合权重βword,i,式中aword,i为第i个语义交互增强后的历史点击资讯的分词的权重,
Figure BDA00037832539500000410
Wword和bword均为词注意力网络中的投影参数,qword为分词的查询向量,T为转置,通过公式
Figure BDA00037832539500000411
计算得到第i个语义交互增强后的候选企业资讯的分词的注意力融合权重
Figure BDA00037832539500000412
式中
Figure BDA00037832539500000413
为第i个语义交互增强后的候选企业资讯的分词的权重,
Figure BDA00037832539500000414
Figure BDA00037832539500000415
Figure BDA00037832539500000416
均为词注意力网络中的投影参数,
Figure BDA00037832539500000417
为分词的查询向量;
b-7)通过公式
Figure BDA0003783253950000051
计算得到第i个历史点击资讯嵌入表示,通过公式
Figure BDA0003783253950000052
计算得到第i个候选企业资讯嵌入表示。
优选的,步骤b-1)及步骤b-2)中N取值为32,M取值为128。
进一步的,步骤b-3)SE-NET模型中历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,...,e′t,N]及候选企业资讯的缩放后标题词序列
Figure BDA0003783253950000053
的降维超参数为zt,zt=4,SE-NET模型中历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,...,e′c,i,...,e′c,M]及候选企业资讯的缩放后内容词序列
Figure BDA0003783253950000054
的降维参数为zc,zc=16。进一步的,步骤b-5)包括如下步骤:
b-5.1)通过公式
Figure BDA0003783253950000055
计算得到历史点击资讯的第h个自注意力头中第i个分词表示
Figure BDA0003783253950000056
式中
Figure BDA0003783253950000057
为历史点击资讯的第h个自注意力头中第i个分词和第j个分词之间的注意力分数,
Figure BDA0003783253950000058
为第h个自注意力头中的线性映射矩阵,e′j为第j个拼接后得到历史点击资讯的分词向量,j∈{1,...,N+M},
Figure BDA0003783253950000059
式中
Figure BDA00037832539500000510
Figure BDA00037832539500000511
均为第h个自注意力头中的线性映射矩阵,e′n为第n个拼接后得到历史点击资讯的分词向量,n∈{1,...,N+M};
b-5.2)
Figure BDA00037832539500000512
为第i个分词的表示为所有子空间分词特征的串联,
Figure BDA0003783253950000061
[:]为向量串联,h∈{1,...,H},H为注意力头的总数,H=20;
b-5.3)通过公式
Figure BDA0003783253950000062
计算得到候选企业资讯的第h个自注意力头中第i个分词表示
Figure BDA0003783253950000063
式中
Figure BDA0003783253950000064
为候选企业资讯的第h个自注意力头中第i个分词和第j个分词之间的注意力分数,
Figure BDA0003783253950000065
为第h个自注意力头中的线性映射矩阵,
Figure BDA0003783253950000066
为第j个拼接后得到候选企业资讯的分词向量,j∈{1,...,N+M},
Figure BDA0003783253950000067
式中
Figure BDA0003783253950000068
Figure BDA0003783253950000069
均为第h个自注意力头中的线性映射矩阵,
Figure BDA00037832539500000610
为第n个拼接后得到候选企业资讯的分词向量,n∈{1,...,N+M};
b-5.4)
Figure BDA00037832539500000611
为第i个分词的表示为所有子空间分词特征的串联,
Figure BDA00037832539500000612
[:]为向量串联,h∈{1,...,H},H为注意力头的总数,H=20。
进一步的,步骤c)包括如下步骤:
c-1)将历史点击资讯嵌入表示序列R输入到SE-NET模型中,输出得到缩放后的历史点击资讯嵌入表示序列R′=[r′1,r′2,...,r′i,...,r′F],r′i为第i个缩放后的历史点击资讯嵌入表示,i∈{1,...F};
c-2)使用CNN网络在缩放后的历史点击资讯嵌入表示序列R′中提取用户点击历史点击资讯的最终局部兴趣表示序列
Figure BDA00037832539500000613
为第i个历史点击资讯的最终局部兴趣表示,i∈{1,...F};
c-3)通过公式
Figure BDA0003783253950000071
计算得到第i个候选企业资讯的最终局部兴趣表示
Figure BDA0003783253950000072
和第i个历史点击资讯的最终局部兴趣表示
Figure BDA0003783253950000073
的相关系数βcd,i,式中acd,i为第i个候选企业资讯嵌入表ri cd和第i个历史点击资讯的最终局部兴趣表示
Figure BDA0003783253950000074
的相关系数权重,
Figure BDA0003783253950000075
式中Wcd,1、bcd,1、Wcd,2及bcd,2均为双线性注意力的投影参数,Dq为查询向量长度,Dq=200;
c-4)通过公式
Figure BDA0003783253950000076
计算得到最终的用户嵌入表示u。
进一步的,步骤c-1)中SE-NET模型中得到缩放后的历史点击资讯嵌入表示序列R′=[r′1,r′2,...,r′i,...,r′F]的降维超参数为zu,zu=5。
步骤c-2)中通过公式
Figure BDA0003783253950000077
计算得到第i个历史点击资讯的最终局部兴趣表示
Figure BDA0003783253950000078
σft(·)为RELU非线性激活函数,Wft及bft均为CNN网络中过滤器中的可学习参数,
Figure BDA0003783253950000079
为缩放后的历史点击资讯嵌入表示序列R′中第i-k个缩放后的历史点击资讯嵌入表示到第i+k个缩放后的历史点击资讯嵌入表示的连接,k为CNN网络中滑动窗口的步长,k=1。本发明的有益效果是:通过SIN企业资讯编码器可以在标题和内容之间进行单词级语义交互,缓解了独立编码标题和内容时的语义偏差,有效增强了企业资讯表示。通过LAU用户编码器更加符合用户的真实的行为习惯,可以分区域处理用户点击历史,以细粒度的方式有效捕获用户的各种潜在兴趣。提出的LAU用户编码器可以利用候选企业资讯激活相关的关键性潜在兴趣,并结合注意力机制使其保留到了最终交互阶段,这有效增强了用户兴趣表示;上述三点的成功使得我们的方法有效提高了企业资讯推荐的准确性。
附图说明
图1为本发明的模型架构图。
具体实施方式
下面结合附图1对本发明做进一步说明。
一种基于语义交互和局部激活的企业资讯推荐方法,该方法的关键包括SIN企业资讯编码器和LAU用户编码器。SIN使用自注意力网络建模企业资讯标题和内容间单词级别语义交互以提高企业资讯嵌入表示质量。LAU在充分考虑用户兴趣变化模式的前提下,对用户点击历史序列进行切片处理以感知细粒度局部兴趣,并利用候选企业资讯和局部兴趣之间的相关性激活局部兴趣,进一步提高用户嵌入表示质量。在获得良好嵌入表示的基础上有效提高了企业资讯推荐的准确性。具体的包括如下步骤:
a)获取用户按时间降序的历史点击资讯序列数据V=[v1,v2,...,vi,...,vF]和候选企业资讯
Figure BDA0003783253950000081
其中vi为第i个历史点击的资讯,i∈{1,...F},F为历史点击的资讯数量,
Figure BDA0003783253950000082
为第i个候选企业资讯,i∈{1,...O},O为候选企业资讯数量。
b)将用户的历史点击资讯序列数据V和候选企业资讯Vcd分别输入到SIN企业咨询编码器中,分别得到历史点击资讯嵌入表示序列R=[r1,r2,...,ri,...,rF]和候选企业资讯嵌入表示
Figure BDA0003783253950000083
其中ri为第i个历史点击资讯嵌入表示,i∈{1,...F},ri cd为第i个候选企业资讯嵌入表示,i∈{1,...O}。SIN企业咨询编码器旨在从资讯标题和资讯内容中学习企业资讯嵌入表示。
c)将历史点击资讯嵌入表示序列R和候选企业资讯嵌入表示Rcd输入到LAU用户编码器,得到最终的用户嵌入表示u。LAU用户编码器旨在从用户的点击历史中学习细粒度局部兴趣,并利用候选企业资讯和局部兴趣之间的相关性知道最终用户兴趣表达。
d)通过公式
Figure BDA0003783253950000091
计算得到用户对第i个候选企业资讯的点击概率得分
Figure BDA0003783253950000092
选取概率最大的5个候选快讯推荐给用户。
通过SIN企业资讯编码器可以在标题和内容之间进行单词级语义交互,缓解了独立编码标题和内容时的语义偏差,有效增强了企业资讯表示。通过LAU用户编码器更加符合用户的真实的行为习惯,可以分区域处理用户点击历史,以细粒度的方式有效捕获用户的各种潜在兴趣。提出的LAU用户编码器可以利用候选企业资讯激活相关的关键性潜在兴趣,并结合注意力机制使其保留到了最终交互阶段,这有效增强了用户兴趣表示;上述三点的成功使得我们的方法有效提高了企业资讯推荐的准确性。
实施例1:
步骤a)中F取值为50。
实施例2:
步骤b)包括如下步骤:
b-1)使用Snownlp分词工具将每一条历史点击资讯的标题和内容分别转换成分词序列,得到截取最大长度为N的历史点击资讯的标题分词序列[xt,1,xt,2,...,xt,i,...,xt,N]和截取最大长度为M的历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M],其中xt,i为第i个历史点击资讯的标题分词,i∈{1,...N},xc,i为第i个历史点击资讯的内容分词,i∈{1,...M},使用预训练的300维Glove中文词将历史点击资讯的标题分词序列[xt,1,xt,2,...,xt,i,...,xt,N]映射为历史点击资讯的标题分词向量序列[et,1,et,2,...,et,i,...,et,N],将历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M]映射为历史点击资讯的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M]。
b-2)使用Snownlp分词工具将每一条候选企业资讯的标题和内容分别转换成分词序列,得到截取最大长度为N的候选企业资讯的标题分词序列
Figure BDA0003783253950000101
和截取最大长度为M的候选企业资讯的内容分词序列
Figure BDA0003783253950000102
其中
Figure BDA0003783253950000103
为第i个候选企业资讯的标题分词,i∈{1,…N},
Figure BDA0003783253950000104
为第i个候选企业资讯的内容分词,i∈{1,…M},使用预训练的300维Glove中文词将候选企业资讯的标题分词序列
Figure BDA0003783253950000105
映射为候选企业资讯的标题分词向量序列
Figure BDA0003783253950000106
将候选企业资讯的内容分词序列
Figure BDA0003783253950000107
映射为候选企业资讯的内容分词向量序列
Figure BDA0003783253950000108
b-3)为了增强重要分词权重,降低噪声分词权重,将历史点击资讯的标题分词向量序列[et,1,et,2,…,et,i,…,et,N]和历史点击资讯的内容分词向量序列[ec,1,ec,2,…,ec,i,…,ec,M]分别输入到SE-NET模型中,得到历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,...,e′t,N]和历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,…,e′c,i,...,e′c,M],将候选企业资讯的标题分词向量序列
Figure BDA0003783253950000109
和候选企业资讯的内容分词向量序列
Figure BDA00037832539500001010
分别输入到SE-NET模型中,得到候选企业资讯的缩放后标题词序列
Figure BDA00037832539500001011
和候选企业资讯的缩放后内容词序列
Figure BDA00037832539500001012
b-4)为了增强资讯标题和资讯内容之间的语义交互,将历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,h,e′t,N]与历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,...,e′c,i,h,e′c,M]拼接后得到历史点击资讯的分词向量序列[e′1,e′2,h,e′i,h,e′N+M],e′i为第i个拼接后得到历史点击资讯的分词向量,i∈{1,h,N+M},将候选企业资讯的缩放后标题词序列
Figure BDA0003783253950000111
和候选企业资讯的缩放后内容词序列
Figure BDA0003783253950000112
拼接后得到候选企业资讯的分词向量序列
Figure BDA0003783253950000113
Figure BDA00037832539500001112
为第i个拼接后得到候选企业资讯的分词向量。
b-5)通过多头自注意力网络分别建模历史点击资讯的分词向量序列[e′1,e′2,...,e′i,...,e′N+M]和候选企业资讯的分词向量序列
Figure BDA0003783253950000114
的相互作用关系,得到语义交互增强后的历史点击资讯的分词向量序列
Figure BDA0003783253950000115
及语义交互增强后的候选企业资讯的分词向量序列
Figure BDA0003783253950000116
其中
Figure BDA0003783253950000117
为第i个语义交互增强后的历史点击资讯的分词向量,i∈{1,...,N+M},
Figure BDA0003783253950000118
为第i个语义交互增强后的候选企业资讯的分词向量,i∈{1,...,N+M}。
b-6)最后使用词级注意力网络为不同的分词学习一个注意力融合权重,具体的,通过公式
Figure BDA0003783253950000119
计算得到第i个语义交互增强后的历史点击资讯的分词的注意力融合权重βword,i,式中aword,i为第i个语义交互增强后的历史点击资讯的分词的权重,
Figure BDA00037832539500001110
Wword和bword均为词注意力网络中的投影参数,qword为分词的查询向量,T为转置,通过公式
Figure BDA00037832539500001111
计算得到第i个语义交互增强后的候选企业资讯的分词的注意力融合权重
Figure BDA0003783253950000121
式中
Figure BDA0003783253950000122
为第i个语义交互增强后的候选企业资讯的分词的权重,
Figure BDA0003783253950000123
Figure BDA0003783253950000124
均为词注意力网络中的投影参数,
Figure BDA0003783253950000125
为分词的查询向量。
b-7)通过公式
Figure BDA0003783253950000126
计算得到第i个历史点击资讯嵌入表示,通过公式
Figure BDA0003783253950000127
计算得到第i个候选企业资讯嵌入表示。
实施例3:
步骤b-1)及步骤b-2)中N取值为32,M取值为128。
实施例4:
步骤b-3)SE-NET模型中历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,...,e′t,N]及候选企业资讯的缩放后标题词序列
Figure BDA0003783253950000128
的降维超参数为zt,zt=4,SE-NET模型中历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,...,e′c,i,...,e′c,M]及候选企业资讯的缩放后内容词序列
Figure BDA0003783253950000129
的降维参数为zc,zc=16。
实施例5:
步骤b-5)包括如下步骤:
b-5.1)通过公式
Figure BDA00037832539500001210
计算得到历史点击资讯的第h个自注意力头中第i个分词表示
Figure BDA00037832539500001211
式中
Figure BDA00037832539500001212
为历史点击资讯的第h个自注意力头中第i个分词和第j个分词之间的注意力分数,
Figure BDA00037832539500001213
为第h个自注意力头中的线性映射矩阵,e′j为第j个拼接后得到历史点击资讯的分词向量,j∈{1,...,N+M},
Figure BDA0003783253950000131
式中
Figure BDA0003783253950000132
Figure BDA0003783253950000133
均为第h个自注意力头中的线性映射矩阵,e′n为第n个拼接后得到历史点击资讯的分词向量,n∈{1,...,N+M}。
b-5.2)多个自注意力头分别学习不同子空间下的分词的交互模式,最终第
Figure BDA0003783253950000134
为第i个分词的表示为所有子空间分词特征的串联,
Figure BDA0003783253950000135
[:]为向量串联,h∈{1,...,H},H为注意力头的总数,H=20。
b-5.3)通过公式
Figure BDA0003783253950000136
计算得到候选企业资讯的第h个自注意力头中第i个分词表示
Figure BDA0003783253950000137
式中
Figure BDA0003783253950000138
为候选企业资讯的第h个自注意力头中第i个分词和第j个分词之间的注意力分数,
Figure BDA0003783253950000139
为第h个自注意力头中的线性映射矩阵,
Figure BDA00037832539500001310
为第j个拼接后得到候选企业资讯的分词向量,j∈{1,...,N+M},
Figure BDA00037832539500001311
式中
Figure BDA00037832539500001312
Figure BDA00037832539500001313
均为第h个自注意力头中的线性映射矩阵,
Figure BDA00037832539500001314
为第n个拼接后得到候选企业资讯的分词向量,n∈{1,...,N+M}。
b-5.4)多个自注意力头分别学习不同子空间下的分词的交互模式,最终
Figure BDA00037832539500001315
为第i个分词的表示为所有子空间分词特征的串联,
Figure BDA0003783253950000141
[:]为向量串联,h∈{1,...,H},H为注意力头的总数,H=20。
实施例6:
步骤c)包括如下步骤:
c-1)将历史点击资讯嵌入表示序列R输入到SE-NET模型中,输出得到缩放后的历史点击资讯嵌入表示序列R′=[r′1,r′2,...,r′i,...,r′F],r′i为第i个缩放后的历史点击资讯嵌入表示,i∈{1,...F}。
c-2)使用CNN网络在缩放后的历史点击资讯嵌入表示序列R′中提取用户点击历史点击资讯的最终局部兴趣表示序列
Figure BDA0003783253950000142
为第i个历史点击资讯的最终局部兴趣表示,i∈{1,...F}。将历史点击资讯嵌入表示序列R或缩放后的历史点击资讯嵌入表示序列R′输入到SE-NET模型时,应用200个过滤器构建局部兴趣的多种模式,为了捕获更加细粒度局部兴趣,将滑动步幅设置为1。滑动窗口中心的企业资讯嵌入表示对局部兴趣表示学习十分重要,它被理解为用户在该区间时刻用户正在执行的点击操作。
c-3)最后使用双线性注意力网络来激活局部兴趣,区分不同局部兴趣的重要程度。具体的,通过公式
Figure BDA0003783253950000143
计算得到第i个候选企业资讯的最终局部兴趣表示
Figure BDA0003783253950000144
和第i个历史点击资讯的最终局部兴趣表示
Figure BDA0003783253950000145
的相关系数βcd,i,式中acd,i为第i个候选企业资讯嵌入表ri cd和第i个历史点击资讯的最终局部兴趣表示
Figure BDA0003783253950000146
的相关系数权重,
Figure BDA0003783253950000147
式中Wcd,1、bcd,1、Wcd,2及bcd,2均为双线性注意力的投影参数,Dq为查询向量长度,Dq=200。
c-4)通过公式
Figure BDA0003783253950000151
计算得到最终的用户嵌入表示u。
实施例7:
步骤c-1)中SE-NET模型中得到缩放后的历史点击资讯嵌入表示序列R′=[r′1,r′2,...,r′i,...,r′F]的降维超参数为zu,zu=5。
实施例8:
步骤c-2)中通过公式
Figure BDA0003783253950000152
计算得到第i个历史点击资讯的最终局部兴趣表示
Figure BDA0003783253950000153
σft(·)为RELU非线性激活函数,Wft及bft均为CNN网络中过滤器中的可学习参数,
Figure BDA0003783253950000154
为缩放后的历史点击资讯嵌入表示序列R′中第i-k个缩放后的历史点击资讯嵌入表示到第i+k个缩放后的历史点击资讯嵌入表示的连接,k为CNN网络中滑动窗口的步长,k=1。最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于语义交互和局部激活的企业资讯推荐方法,其特征在于,包括如下步骤:
a)获取用户按时间降序的历史点击资讯序列数据V=[v1,v2,...,vi,...,vF]和候选企业资讯
Figure FDA0003783253940000011
其中vi为第i个历史点击的资讯,i∈{1,...F},F为历史点击的资讯数量,
Figure FDA0003783253940000012
为第i个候选企业资讯,i∈{1,...O},O为候选企业资讯数量;
b)将用户的历史点击资讯序列数据V和候选企业资讯Vcd分别输入到SIN企业咨询编码器中,分别得到历史点击资讯嵌入表示序列R=[r1,r2,...,ri,...,rF]和候选企业资讯嵌入表示
Figure FDA0003783253940000013
其中ri为第i个历史点击资讯嵌入表示,i∈{1,...F},ri cd为第i个候选企业资讯嵌入表示,i∈{1,…O};
c)将历史点击资讯嵌入表示序列R和候选企业资讯嵌入表示Rcd输入到LAU用户编码器,得到最终的用户嵌入表示u;
d)通过公式
Figure FDA0003783253940000014
计算得到用户对第i个候选企业资讯的点击概率得分
Figure FDA0003783253940000015
选取概率最大的5个候选快讯推荐给用户。
2.根据权利要求1所述的基于语义交互和局部激活的企业资讯推荐方法,其特征在于:步骤a)中F取值为50。
3.根据权利要求1所述的基于语义交互和局部激活的企业资讯推荐方法,其特征在于,步骤b)包括如下步骤:
b-1)使用Snownlp分词工具将每一条历史点击资讯的标题和内容分别转换成分词序列,得到截取最大长度为N的历史点击资讯的标题分词序列[xt,1,xt,2,...,xt,i,...,xt,N]和截取最大长度为M的历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M],其中xt,i为第i个历史点击资讯的标题分词,i∈{1,...N},xc,i为第i个历史点击资讯的内容分词,i∈{1,...M},使用预训练的300维Glove中文词将历史点击资讯的标题分词序列[xt,1,xt,2,...,xt,i,...,xt,N]映射为历史点击资讯的标题分词向量序列[et,1,et,2,...,et,i,...,et,N],将历史点击资讯的内容分词序列[xc,1,xc,2,...,xc,i,...,xc,M]映射为历史点击资讯的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M];
b-2)使用Snownlp分词工具将每一条候选企业资讯的标题和内容分别转换成分词序列,得到截取最大长度为N的候选企业资讯的标题分词序列
Figure FDA0003783253940000021
和截取最大长度为M的候选企业资讯的内容分词序列
Figure FDA0003783253940000022
其中
Figure FDA0003783253940000023
为第i个候选企业资讯的标题分词,i∈{1,…N},
Figure FDA0003783253940000024
为第i个候选企业资讯的内容分词,i∈{1,…M},使用预训练的300维Glove中文词将候选企业资讯的标题分词序列
Figure FDA0003783253940000025
映射为候选企业资讯的标题分词向量序列
Figure FDA0003783253940000026
将候选企业资讯的内容分词序列
Figure FDA0003783253940000027
映射为候选企业资讯的内容分词向量序列
Figure FDA0003783253940000028
b-3)将历史点击资讯的标题分词向量序列[et,1,et,2,…,et,i,…,et,N]和历史点击资讯的内容分词向量序列[ec,1,ec,2,...,ec,i,...,ec,M]分别输入到SE-NET模型中,得到历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,...,e′t,N]和历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,...,e′c,i,...,e′c,M],将候选企业资讯的标题分词向量序列
Figure FDA0003783253940000029
和候选企业资讯的内容分词向量序列
Figure FDA00037832539400000210
分别输入到SE-NET模型中,得到候选企业资讯的缩放后标题词序列
Figure FDA00037832539400000211
和候选企业资讯的缩放后内容词序列
Figure FDA0003783253940000031
b-4)将历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,...,e′t,N]与历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,...,e′c,i,...,e′c,M]拼接后得到历史点击资讯的分词向量序列[e′1,e′2,...,e′i,...,e′N+M],e′i为第i个拼接后得到历史点击资讯的分词向量,i∈{1,...,N+M},将候选企业资讯的缩放后标题词序列
Figure FDA0003783253940000032
和候选企业资讯的缩放后内容词序列
Figure FDA0003783253940000033
拼接后得到候选企业资讯的分词向量序列
Figure FDA0003783253940000034
e′i cd为第i个拼接后得到候选企业资讯的分词向量;
b-5)通过多头自注意力网络分别建模历史点击资讯的分词向量序列[e′1,e′2,...,e′i,...,e′N+M]和候选企业资讯的分词向量序列
Figure FDA0003783253940000035
的相互作用关系,得到语义交互增强后的历史点击资讯的分词向量序列
Figure FDA0003783253940000036
及语义交互增强后的候选企业资讯的分词向量序列
Figure FDA0003783253940000037
其中
Figure FDA0003783253940000038
为第i个语义交互增强后的历史点击资讯的分词向量,i∈{1,...,N+M},
Figure FDA0003783253940000039
为第i个语义交互增强后的候选企业资讯的分词向量,i∈{1,...,N+M};
b-6)通过公式
Figure FDA00037832539400000310
计算得到第i个语义交互增强后的历史点击资讯的分词的注意力融合权重βword,i,式中aword,i为第i个语义交互增强后的历史点击资讯的分词的权重,
Figure FDA00037832539400000311
Wword和bword均为词注意力网络中的投影参数,qword为分词的查询向量,T为转置,通过公式
Figure FDA0003783253940000041
计算得到第i个语义交互增强后的候选企业资讯的分词的注意力融合权重
Figure FDA0003783253940000042
式中
Figure FDA0003783253940000043
为第i个语义交互增强后的候选企业资讯的分词的权重,
Figure FDA0003783253940000044
Figure FDA0003783253940000045
Figure FDA0003783253940000046
均为词注意力网络中的投影参数,
Figure FDA0003783253940000047
为分词的查询向量;
b-7)通过公式
Figure FDA0003783253940000048
计算得到第i个历史点击资讯嵌入表示,通过公式
Figure FDA0003783253940000049
计算得到第i个候选企业资讯嵌入表示。
4.根据权利要求3所述的基于语义交互和局部激活的企业资讯推荐方法,其特征在于:步骤b-1)及步骤b-2)中N取值为32,M取值为128。
5.根据权利要求3所述的基于语义交互和局部激活的企业资讯推荐方法,其特征在于:步骤b-3)SE-NET模型中历史点击资讯的缩放后标题词序列[e′t,1,e′t,2,...,e′t,i,...,e′t,N]及候选企业资讯的缩放后标题词序列
Figure FDA00037832539400000410
的降维超参数为zt,zt=4,SE-NET模型中历史点击资讯的缩放后内容词序列[e′c,1,e′c,2,...,e′c,i,...,e′c,M}及候选企业资讯的缩放后内容词序列
Figure FDA00037832539400000411
的降维参数为zc,zc=16。
6.根据权利要求3所述的基于语义交互和局部激活的企业资讯推荐方法,其特征在于,步骤b-5)包括如下步骤:
b-5.1)通过公式
Figure FDA00037832539400000412
计算得到历史点击资讯的第h个自注意力头中第i个分词表示
Figure FDA00037832539400000413
式中
Figure FDA00037832539400000414
为历史点击资讯的第h个自注意力头中第i个分词和第j个分词之间的注意力分数,
Figure FDA0003783253940000051
为第h个自注意力头中的线性映射矩阵,e′j为第j个拼接后得到历史点击资讯的分词向量,j∈{1,...,N+M},
Figure FDA0003783253940000052
式中
Figure FDA0003783253940000053
Figure FDA0003783253940000054
均为第h个自注意力头中的线性映射矩阵,e′n为第n个拼接后得到历史点击资讯的分词向量,n∈{1,...,N+M};
b-5.2)
Figure FDA0003783253940000055
为第i个分词的表示为所有子空间分词特征的串联,
Figure FDA0003783253940000056
[:]为向量串联,h∈{1,...,H},H为注意力头的总数,H=20;
b-5.3)通过公式
Figure FDA0003783253940000057
计算得到候选企业资讯的第h个自注意力头中第i个分词表示
Figure FDA0003783253940000058
式中
Figure FDA0003783253940000059
为候选企业资讯的第h个自注意力头中第i个分词和第j个分词之间的注意力分数,
Figure FDA00037832539400000510
为第h个自注意力头中的线性映射矩阵,e′j cd为第j个拼接后得到候选企业资讯的分词向量,j∈{1,...,N+M},
Figure FDA00037832539400000511
式中
Figure FDA00037832539400000512
Figure FDA00037832539400000513
均为第h个自注意力头中的线性映射矩阵,e′n cd为第n个拼接后得到候选企业资讯的分词向量,n∈{1,...,N+M};
b-5.4)
Figure FDA0003783253940000061
为第i个分词的表示为所有子空间分词特征的串联,
Figure FDA0003783253940000062
:]为向量串联,h∈{1,...,H},H为注意力头的总数,H=20。
7.根据权利要求1所述的基于语义交互和局部激活的企业资讯推荐方法,其特征在于,步骤c)包括如下步骤:
c-1)将历史点击资讯嵌入表示序列R输入到SE-NET模型中,输出得到缩放后的历史点击资讯嵌入表示序列R′=[r1′,r′2,...,ri′,...,r′F],ri′为第i个缩放后的历史点击资讯嵌入表示,i∈{1,...F};
c-2)使用CNN网络在缩放后的历史点击资讯嵌入表示序列R′中提取用户点击历史点击资讯的最终局部兴趣表示序列
Figure FDA0003783253940000063
Figure FDA0003783253940000064
为第i个历史点击资讯的最终局部兴趣表示,i∈{1,...F};
c-3)通过公式
Figure FDA0003783253940000065
计算得到第i个候选企业资讯的最终局部兴趣表示
Figure FDA0003783253940000066
和第i个历史点击资讯的最终局部兴趣表示
Figure FDA0003783253940000067
的相关系数βcd,i,式中acd,i为第i个候选企业资讯嵌入表ri cd和第i个历史点击资讯的最终局部兴趣表示
Figure FDA0003783253940000068
的相关系数权重,
Figure FDA0003783253940000069
式中Wcd,1、bcd,1、Wcd,2及bcd,2均为双线性注意力的投影参数,Dq为查询向量长度,Dq=200;
c-4)通过公式
Figure FDA0003783253940000071
计算得到最终的用户嵌入表示u。
8.根据权利要求7所述的基于语义交互和局部激活的企业资讯推荐方法,其特征在于:步骤c-1)中SE-NET模型中得到缩放后的历史点击资讯嵌入表示序列R′=[r1′,r′2,...,ri′,...,r′F]的降维超参数为zu,zu=5。
9.根据权利要求7所述的基于语义交互和局部激活的企业资讯推荐方法,其特征在于:步骤c-2)中通过公式
Figure FDA0003783253940000072
计算得到第i个历史点击资讯的最终局部兴趣表示
Figure FDA0003783253940000073
σft(·)为RELU非线性激活函数,Wft及bft均为CNN网络中过滤器中的可学习参数,
Figure FDA0003783253940000074
为缩放后的历史点击资讯嵌入表示序列R′中第i-k个缩放后的历史点击资讯嵌入表示到第i+k个缩放后的历史点击资讯嵌入表示的连接,k为CNN网络中滑动窗口的步长,k=1。
CN202210936398.4A 2022-08-05 2022-08-05 一种基于语义交互和局部激活的企业资讯推荐方法 Active CN115357785B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210936398.4A CN115357785B (zh) 2022-08-05 2022-08-05 一种基于语义交互和局部激活的企业资讯推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210936398.4A CN115357785B (zh) 2022-08-05 2022-08-05 一种基于语义交互和局部激活的企业资讯推荐方法

Publications (2)

Publication Number Publication Date
CN115357785A true CN115357785A (zh) 2022-11-18
CN115357785B CN115357785B (zh) 2023-06-30

Family

ID=84033763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210936398.4A Active CN115357785B (zh) 2022-08-05 2022-08-05 一种基于语义交互和局部激活的企业资讯推荐方法

Country Status (1)

Country Link
CN (1) CN115357785B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101705810B1 (ko) * 2015-11-18 2017-02-10 고려대학교 산학협력단 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법
CN112231485A (zh) * 2020-12-14 2021-01-15 平安科技(深圳)有限公司 文本推荐方法、装置、计算机设备及存储介质
US20210150549A1 (en) * 2013-06-26 2021-05-20 Edatanetworks Inc. System and methods for loyalty programs
CN113326425A (zh) * 2021-04-20 2021-08-31 中国电子科技集团公司第五十四研究所 一种基于结构和语义注意力堆叠的会话推荐方法及系统
CN113590908A (zh) * 2020-04-30 2021-11-02 中国石油化工股份有限公司 基于注意力机制的资讯推荐方法
US20220043975A1 (en) * 2020-08-05 2022-02-10 Baidu Usa Llc Disentangle syntax and semantics in sentence representation with decomposable variational autoencoder
CN114201683A (zh) * 2021-12-15 2022-03-18 齐鲁工业大学 一种基于多级匹配的兴趣激活新闻推荐方法及系统
CN114741599A (zh) * 2022-04-21 2022-07-12 齐鲁工业大学 基于知识增强和注意力机制的新闻推荐方法及系统
CN114764479A (zh) * 2022-03-24 2022-07-19 中山大学 一种基于新闻场景下用户行为的个性化新闻推荐方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210150549A1 (en) * 2013-06-26 2021-05-20 Edatanetworks Inc. System and methods for loyalty programs
KR101705810B1 (ko) * 2015-11-18 2017-02-10 고려대학교 산학협력단 뉴스를 추천하는 서버, 스마트 단말 및 이를 이용한 뉴스 추천 방법
CN113590908A (zh) * 2020-04-30 2021-11-02 中国石油化工股份有限公司 基于注意力机制的资讯推荐方法
US20220043975A1 (en) * 2020-08-05 2022-02-10 Baidu Usa Llc Disentangle syntax and semantics in sentence representation with decomposable variational autoencoder
CN112231485A (zh) * 2020-12-14 2021-01-15 平安科技(深圳)有限公司 文本推荐方法、装置、计算机设备及存储介质
CN113326425A (zh) * 2021-04-20 2021-08-31 中国电子科技集团公司第五十四研究所 一种基于结构和语义注意力堆叠的会话推荐方法及系统
CN114201683A (zh) * 2021-12-15 2022-03-18 齐鲁工业大学 一种基于多级匹配的兴趣激活新闻推荐方法及系统
CN114764479A (zh) * 2022-03-24 2022-07-19 中山大学 一种基于新闻场景下用户行为的个性化新闻推荐方法
CN114741599A (zh) * 2022-04-21 2022-07-12 齐鲁工业大学 基于知识增强和注意力机制的新闻推荐方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TONGCUN LIU: "A Geographical-Temporal Awareness Hierarchical Attention Network for Next Point-of-Interest Recommendation", 《ICMR \'19: PROCEEDINGS OF THE 2019 ON INTERNATIONAL CONFERENCE ON MULTIMEDIA RETRIEVAL》, pages 7 - 15 *
全聪: "基于文本的可解释性推荐系统研究", 《中国博士学位论文全文数据库信息科技辑》, no. 3, pages 138 - 55 *

Also Published As

Publication number Publication date
CN115357785B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
Chen et al. Semantically conditioned dialog response generation via hierarchical disentangled self-attention
CN113435203B (zh) 多模态命名实体识别方法、装置以及电子设备
CN105051721B (zh) 为电子表格将自然语言描述转换为因因域而异而异的语言的程序
CN111444367B (zh) 一种基于全局与局部注意力机制的图像标题生成方法
CN113590970B (zh) 一种基于读者偏好的个性化数字图书推荐系统、方法、计算机及存储介质
CN111476023A (zh) 识别实体关系的方法及装置
CN112016002A (zh) 融合评论文本层级注意力和时间因素的混合推荐方法
CN111581474A (zh) 基于多头注意力机制的涉案微博评论的评价对象抽取方法
CN114386417A (zh) 一种融入词边界信息的中文嵌套命名实体识别方法
CN113064995A (zh) 一种基于图深度学习的文本多标签分类方法和系统
CN113239690A (zh) 基于Bert与全连接神经网络融合的中文文本意图识别方法
CN115630145A (zh) 一种基于多粒度情感的对话推荐方法及系统
CN114647715A (zh) 一种基于预训练语言模型的实体识别方法
CN116150361A (zh) 一种财务报表附注的事件抽取方法、系统及存储介质
CN112182156A (zh) 基于文本处理的方面级可解释深度网络评分预测推荐方法
CN112287687A (zh) 基于案件属性感知的案件倾向性抽取式摘要方法
CN113076425B (zh) 一种用于微博评论的事件相关观点句分类方法
CN117217807B (zh) 一种基于多模态高维特征的不良资产估值方法
CN116578734B (zh) 一种基于clip的概率嵌入组合检索方法
CN117390289A (zh) 基于用户画像的房屋建造方案推荐方法、装置、设备
CN117033558A (zh) 一种融合bert-wwm与多特征的影评情感分析方法
Tang et al. Stay in grid: Improving video captioning via fully grid-level representation
CN117033804A (zh) 一种主客观视角引导下的点击诱导检测方法
CN115357785A (zh) 一种基于语义交互和局部激活的企业资讯推荐方法
CN112364666B (zh) 文本表征方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant