CN115600945A - 基于多粒度的冷链配载用户画像构建方法及装置 - Google Patents

基于多粒度的冷链配载用户画像构建方法及装置 Download PDF

Info

Publication number
CN115600945A
CN115600945A CN202211092866.0A CN202211092866A CN115600945A CN 115600945 A CN115600945 A CN 115600945A CN 202211092866 A CN202211092866 A CN 202211092866A CN 115600945 A CN115600945 A CN 115600945A
Authority
CN
China
Prior art keywords
model
cold chain
data
len
user portrait
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211092866.0A
Other languages
English (en)
Other versions
CN115600945B (zh
Inventor
李翔
张宁
任柯
孙纪舟
肖绍章
朱全银
周泓
谢乾
陈帅
徐伟
杨秋实
洪玉昆
费晶茹
张曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaiyin Institute of Technology
Original Assignee
Huaiyin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaiyin Institute of Technology filed Critical Huaiyin Institute of Technology
Priority to CN202211092866.0A priority Critical patent/CN115600945B/zh
Publication of CN115600945A publication Critical patent/CN115600945A/zh
Application granted granted Critical
Publication of CN115600945B publication Critical patent/CN115600945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0832Special goods or special handling procedures, e.g. handling of hazardous or fragile goods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种基于多粒度的冷链配载用户画像构建方法及装置,先对原始的冷链配载数据集预处理;将预处理后的冷链配载数据集输入到FNet模型中,提取冷链配载数据特征;使用DTM模型、TMKGE模型提取冷链配载数据集中的主题词;对FNet模型提取的结果及DTM模型、TMKGE模型提取到的主题词使用WordNet进行标签相似度计算,根据相似度计算结果扩展补充FNet模型提取结果,完成冷链配载用户画像的标签提取;依据最终标签提取结果,获得模型的标签提取,进而构建冷链配载用户画像。本发明能够有效地提取数据的动态主题及共享信息,有效地扩展冷链配载数据的标签,解决冷链配载用户画像建模中标签特征不全面的问题。

Description

基于多粒度的冷链配载用户画像构建方法及装置
技术领域
本发明属于冷链配载用户画像和多粒度标签扩展技术领域,特别涉及一种基于多粒度的冷链配载用户画像构建方法及装置。
背景技术
近年来,画像已成为世界各国研究的特点,正日益引起业界、学术界的广泛关注,更重要的是,它还是众多应用的关键技术之一。
在现有的画像建模技术中,对如何构建基于多粒度的用户画像的研究相当有限,并且存在如下不足:1、随着冷链配载数据特征的复杂性激增,传统用户画像构建方法难以全面地刻画其特征;2、由于冷链数据的复杂多样性,仅仅依靠现有的词向量表征方法,很难对冷链领域中的专业术语以及其他冷链领域内相关字词的语义进行充分表征,并且存在较大噪声干扰;3、传统用户画像构建方法大部分为静态,忽略了数据为动态变化的特点,导致用户画像没有时效性。
针对这些问题,本发明中的多粒度用户画像构建方法对传统的用户画像构建方法有重要的作用和意义。
发明内容
发明目的:针对上述问题,本发明提供了一种基于多粒度的冷链配载用户画像构建方法及装置,能够有效地构建多粒度用户画像,解决用户画像建模中用户特征不全面的问题。
技术方案:本发明提出一种基于多粒度的冷链配载用户画像构建方法,包括如下步骤:
步骤1:输入原始的冷链配载数据集D1,对数据集进行去重、去空,清洗后得到样本集D2;
步骤2:使用FNet模型,将样本集D2作为模型的输入,提取冷链配载数据特征;
步骤3:使用DTM模型、TMKGE模型对样本集D2提取主题词;
步骤4:首先对FNet模型提取的结果及DTM模型、TMKGE模型提取到的主题词使用WordNet进行标签相似度计算;
步骤5:根据相似度计算结果扩展补充FNet模型提取结果,最后完成冷链配载用户画像的标签提取,获得模型的标签提取,进而构建冷链配载用户画像。
进一步地,所述步骤1的具体方法为:
步骤1.1:定义Data为单个待清洗数据,定义id,content分别为数据的序号和内容,并且满足关系Data={id,content};
步骤1.2:定义D1为待清洗数据集,D1={Data1,Data2,...,Dataa,...,Datalen(D1)},Dataa为D1中第a个待清洗信息数据,其中,len(D1)为D1中数据数量,变量a∈[1,len(D1)];
步骤1.3:数据集D1中的数据进行去重和去空操作;
步骤1.4:得到清洗后的数据集D2={D1,D2,...,Db,...,Dlen(D2)},Db为D2中第b个待处理信息数据,其中,len(D2)为D2中数量,变量b∈[1,len(D2)]。
进一步地,所述步骤2的具体方法为:
步骤2.1:样本集D2={D1,D2,...,Db,...,Dlen(D2)},将待处理文本内容Db固定为统一长度Lmax
步骤2.2:定义循环变量i,且i赋初值为1;
步骤2.3:如果i≤len(D2)则跳转到步骤2.4,否则跳转到步骤2.10;
步骤2.4:定义len(Di)为文本中第i个文本信息的长度,如果len(Di)+2≤Lmax则补0后跳转下一步,否则截取文本前Lmax个单位,跳转下一步;
步骤2.5:建立预训练模型FNet,将样本集传入FNet模型中,该模型每层都由一个傅立叶混合子层和一个前馈子层组成;
步骤2.6:对输入的原有样本序列的全部信息进行傅里叶变换;
步骤2.7:将变换结果输入到前馈子层;
步骤2.8:获取文本的特征向量T1;
步骤2.9:i=i+1,跳转到步骤2.3;
步骤2.10:结束循环,输出全部特征向量序列T1={T1,T2,...,Tc,...,Tlen(T1)}。
进一步地,所述步骤3的具体方法为:
步骤3.1:样本集D2={D1,D2,...,Db,...,Dlen(D2)},其中,Db包含单词w和实体e,满足关系Db={w,e};
步骤3.2:对样本集D2中的冷链配载数据进行分词处理,得到样本集D3;
步骤3.3:使用DTM模型提取冷链配载样本集D3中的主题词,得到提取的主题词K1;
步骤3.4:使用TMKGE模型提取冷链配载样本集D3中的主题词,得到提取的主题词K2;
步骤3.5:融合DTM模型及TMKGE模型提取到的主题词K1、K2,得到主题词集合K3。
进一步地,所述步骤4的具体方法为:
步骤4.1:FNet模型提取到的特征向量序列T1={T1,T2,...,Tc,...,Tlen(T1)};
步骤4.2:DTM模型和TMKGE模型融合后的主题词集合K3={K1,K2,,...,Kd,...,Klen(K3)};
步骤4.3:定义循环变量k,且k赋初值为0;
步骤4.4:如果k<len(T1),则跳转到下一步,否则跳转到步骤4.11;
步骤4.5:定义循环变量j,且j赋初值为0;
步骤4.6:如果j<len(K3),则跳转到下一步,否则跳转到步骤4.10;
步骤4.7:将主题词集合Kj与FNet模型提取到的特征向量序列Tk使用WordNet进行标签相似度计算;
步骤4.8:保留相似度最低的计算结果为R,依据此结果扩展标签集合,增加用户画像的粒度;
步骤4.9:j=j+1,跳转到步骤4.6;
步骤4.10:k=k+1,跳转到步骤4.4;
步骤4.11结束循环,最终依据标签相似度计算结果,得到R={R1,R2,...,Re,...,Rlen(R)}。
进一步地,所述步骤5的具体方法为:
步骤5.1:将标签相似度计算结果序列R补充到FNet模型提取到的特征向量序列T1中;
步骤5.2:得到最终补充过的冷链配载标签集S={S1,S2,...,Sf,...,Slen(S)};
步骤5.3:依据最终获得的冷链配载标签集构建基于多粒度的冷链配载用户画像;
步骤5.4:使用词云图将构建出的冷链配载用户画像可视化;
步骤5.5:将模型保存封装,作为多粒度画像的构建方法。
本发明还公开一种基于多粒度的冷链配载用户画像构建装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时执行上述基于多粒度的冷链配载用户画像构建方法的步骤。。
有益效果:
1、本发明对于冷链配载用户画像,更关注于补充扩展冷链配载用户画像的标签,并且对新的数据具有良好的泛化能力。冷链配载数据集的特征具有多样性和复杂性,不同粒度的信息对其构建用户画像的结果也不完全相同,对提取到的特征进行标签扩展有助于多粒度化冷链配载用户画像。
2、本发明利用FNet模型提取冷链配载数据的特征,特别对于长文本的冷链配载数据,FNet模型不仅在确保了精度的前提下提高了训练速度,内存占有还小。对于固定的速度和精度预算,FNet模型更优。
3、本发明利用TMKGE允许在知识图和文档之间灵活地共享信息,这是一个重要的优势,因为在实践中只有部分关系信息可用,因此严格强制主题和实体混合共享组件可能会降低模型正确恢复数据潜在结构的能力。
4、本发明利用DTM模型提取冷链配载数据的动态主题,DTM模型引入了时间维度,不同主题会随着时间变动而变动,可以更好的建模主题在时间序列上的发展和演变。
5、本发明利用DTM模型和TMKGE模型提取冷链配载数据主题词,在实际应用中,包含的信息更丰富,尤其像冷链配载用户画像多粒度大型语料文本上,可以提取冷链配载领域见的动态信息和共享信息等,大大扩展了数据的标签。
附图说明
图1为本发明整体流程图;
图2为数据清洗流程图;
图3为使用FNet模型提取冷链配载数据特征向量流程图;
图4为使用DTM模型和TMKGE模型提取冷链配载数据主题词流程图;
图5为使用WordNet计算两种结果的相似度流程图;
图6为经过标签扩展后冷链配载用户画像构建流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明公开了一种基于多粒度的冷链配载用户画像构建方法及装置。适用于冷链配载用户画像构建问题。这种模型算法主要是先对原始的冷链配载数据集预处理;将预处理后的冷链配载数据集输入到FNet模型中,提取冷链配载数据特征;然后,使用DTM模型、TMKGE模型提取冷链配载数据集中的主题词;接着,对FNet模型提取的结果及DTM模型、TMKGE模型提取到的主题词使用WordNet进行标签相似度计算,根据相似度计算结果扩展补充FNet模型提取结果,完成冷链配载用户画像的标签提取;最后,依据最终标签提取结果,获得模型的标签提取,进而构建冷链配载用户画像。能够有效地提取数据的动态主题及共享信息,有效地扩展冷链配载数据的标签,解决冷链配载用户画像建模中标签特征不全面的问题。具体包括如下步骤:
步骤1:输入原始的冷链配载数据集D1,对数据集进行去重、去空,清洗后得到样本集D2,具体的如图2所示:
步骤1.1:定义Data为单个待清洗数据,定义id,content分别为数据的序号和内容,并且满足关系Data={id,content}。
步骤1.2:定义D1为待清洗数据集,D1={Data1,Data2,...,Dataa,...,Datalen(D1)},Dataa为D1中第a个待清洗信息数据,其中,len(D1)为D1中数据数量,变量a∈[1,len(D1)]。
步骤1.3:数据集D1中的数据进行去重和去空操作。
步骤1.4:得到清洗后的数据集D2={D1,D2,...,Db,...,Dlen(D2)},Db为D2中第b个待处理信息数据,其中,len(D2)为D2中数量,变量b∈[1,len(D2)]。
步骤2:使用FNet模型,将样本集D2作为模型的输入,提取冷链配载数据特征,具体的如图3所示:
步骤2.1:定义样本集D2={D1,D2,...,Db,...,Dlen(D2)},将待处理文本内容Db固定为统一长度Lmax
步骤2.2:定义循环变量i,且i赋初值为1。
步骤2.3:如果i≤len(D2)则跳转到步骤2.4,否则跳转到步骤2.10。
步骤2.4:定义len(Di)为文本中第i个文本信息的长度,如果len(Di)+2≤Lmax则补0后跳转下一步,否则截取文本前Lmax个单位,跳转下一步。
步骤2.5:建立预训练模型FNet,将样本集传入FNet模型中,该模型每层都由一个傅立叶混合子层和一个前馈子层组成。
步骤2.6:对输入的原有样本序列的全部信息进行傅里叶变换。
步骤2.7:将变换结果输入到前馈子层。
步骤2.8:获取文本的特征向量T1。
步骤2.9:i=i+1,跳转到步骤2.3。
步骤2.10:结束循环,输出全部特征向量序列T1={T1,T2,...,Tc,...,Tlen(T1)}。
步骤3:使用DTM模型、TMKGE模型对样本集D2提取主题词,具体的如图4所示:
步骤3.1:定义样本集D2={D1,D2,...,Db,...,Dlen(D2)},其中,Db包含单词w和实体e,满足关系Db={w,e}。
步骤3.2:对样本集D2中的冷链配载数据进行分词处理,得到样本集D3。
步骤3.3:使用DTM模型提取冷链配载样本集D3中的主题词。
步骤3.4:使用TMKGE模型提取冷链配载样本集D3中的主题词。
步骤3.5:DTM模型得到提取的主题词K1。
步骤3.6:TMKGE模型得到提取的主题词K2。
步骤3.7:融合DTM模型及TMKGE模型提取到的主题词K1、K2,得到主题词集合K3。
步骤4:首先对FNet模型提取的结果及DTM模型、TMKGE模型提取到的主题词使用WordNet进行标签相似度计算,然后根据相似度计算结果扩展补充FNet模型提取结果,最后完成冷链配载用户画像的标签提取,具体的如图5所示:
步骤4.1:定义FNet模型提取到的特征向量序列T1={T1,T2,...,Tc,...,Tlen(TI)}。
步骤4.2:定义DTM模型和TMKGE模型融合后的主题词集合K3={K1,K2,...,Kd,...,Klen(K3)}。
步骤4.3:定义循环变量k,且k赋初值为0。
步骤4.4:如果k<len(T1),则跳转到下一步,否则跳转到步骤4.11。
步骤4.5:定义循环变量j,且j赋初值为0。
步骤4.6:如果j<len(K3),则跳转到下一步,否则跳转到步骤4.10。
步骤4.7:将主题词集合Kj与FNet模型提取到的特征向量序列Tk使用WordNet进行标签相似度计算。
步骤4.8:相似度越高,代表标签语义越相似,相似度越低,代表标签语义越不同,保留相似度最低的计算结果为R,依据此结果扩展标签集合,增加用户画像的粒度。
步骤4.9:j=j+1,跳转到步骤4.6。
步骤4.10:k=k+1,跳转到步骤4.4。
步骤4.11结束循环,最终依据标签相似度计算结果,得到R={R1,R2,...,Re,...,Rlen(R)}。
步骤5:依据最终标签提取结果,获得模型的标签提取,进而构建冷链配载用户画像,具体的如图6所示:
步骤5.1:将标签相似度计算结果序列R补充到FNet模型提取到的特征向量序列T1中。
步骤5.2:得到最终补充过的冷链配载标签集S={S1,S2,...,Sf,...,S1en(S)}。
步骤5.3:依据最终获得的冷链配载标签集构建基于多粒度的冷链配载用户画像。
步骤5.4:使用词云图将构建出的冷链配载用户画像可视化。
步骤5.5:将模型保存封装,作为多粒度画像的构建方法。
下表为本申请中的相关变量说明:
Figure BDA0003837085170000071
Figure BDA0003837085170000081
本发明可与计算机系统结合成为基于多粒度的冷链配载用户画像构建装置,装置包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被加载至处理器时实现上述基于多粒度的冷链配载用户画像构建方法。
上述实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种基于多粒度的冷链配载用户画像构建方法,其特征在于,包括如下步骤:
步骤1:输入原始的冷链配载数据集D1,对数据集进行去重、去空,清洗后得到样本集D2;
步骤2:使用FNet模型,将样本集D2作为模型的输入,提取冷链配载数据特征;
步骤3:使用DTM模型、TMKGE模型对样本集D2提取主题词;
步骤4:首先对FNet模型提取的结果及DTM模型、TMKGE模型提取到的主题词使用WordNet进行标签相似度计算;
步骤5:根据相似度计算结果扩展补充FNet模型提取结果,最后完成冷链配载用户画像的标签提取,获得模型的标签提取,进而构建冷链配载用户画像。
2.根据权利要求1所述的基于多粒度的冷链配载用户画像构建方法,其特征在于,所述步骤1的具体方法为:
步骤1.1:定义Data为单个待清洗数据,定义id,content分别为数据的序号和内容,并且满足关系Data={id,content};
步骤1.2:定义D1为待清洗数据集,D1={Data1,Data2,...,Dataa,...,Datalen(D1)},Dataa为D1中第a个待清洗信息数据,其中,len(D1)为D1中数据数量,变量a∈[1,len(D1)];
步骤1.3:数据集D1中的数据进行去重和去空操作;
步骤1.4:得到清洗后的数据集D2={D1,D2,...,Db,...,Dlen(D2)},Db为D2中第b个待处理信息数据,其中,len(D2)为D2中数量,变量b∈[1,len(D2)]。
3.根据权利要求1所述的基于多粒度的冷链配载用户画像构建方法,其特征在于,所述步骤2的具体方法为:
步骤2.1:样本集D2={D1,D2,...,Db,...,Dlen(D2)},将待处理文本内容Db固定为统一长度Lmax
步骤2.2:定义循环变量i,且i赋初值为1;
步骤2.3:如果i≤len(D2)则跳转到步骤2.4,否则跳转到步骤2.10;
步骤2.4:定义len(Di)为文本中第i个文本信息的长度,如果len(Di)+2≤Lmax则补0后跳转下一步,否则截取文本前Lmax个单位,跳转下一步;
步骤2.5:建立预训练模型FNet,将样本集传入FNet模型中,该模型每层都由一个傅立叶混合子层和一个前馈子层组成;
步骤2.6:对输入的原有样本序列的全部信息进行傅里叶变换;
步骤2.7:将变换结果输入到前馈子层;
步骤2.8:获取文本的特征向量T1;
步骤2.9:i=i+1,跳转到步骤2.3;
步骤2.10:结束循环,输出全部特征向量序列T1={T1,T2,...,Tc,...,Tlen(T1)}。
4.根据权利要求1所述的基于多粒度的冷链配载用户画像构建方法,其特征在于,所述步骤3的具体方法为:
步骤3.1:样本集D2={D1,D2,...,Db,...,Dlen(D2)},其中,Db包含单词w和实体e,满足关系Db={w,e};
步骤3.2:对样本集D2中的冷链配载数据进行分词处理,得到样本集D3;
步骤3.3:使用DTM模型提取冷链配载样本集D3中的主题词,得到提取的主题词K1;
步骤3.4:使用TMKGE模型提取冷链配载样本集D3中的主题词,得到提取的主题词K2;
步骤3.5:融合DTM模型及TMKGE模型提取到的主题词K1、K2,得到主题词集合K3。
5.根据权利要求1所述的基于多粒度的冷链配载用户画像构建方法,其特征在于,所述步骤4的具体方法为:
步骤4.1:FNet模型提取到的特征向量序列T1={T1,T2,...,Tc,...,Tlen(T1)};
步骤4.2:DTM模型和TMKGE模型融合后的主题词集合K3={K1,K2,...,Kd,...,Klen(x3)};
步骤4.3:定义循环变量k,且k赋初值为0;
步骤4.4:如果k<len(T1),则跳转到下一步,否则跳转到步骤4.11;
步骤4.5:定义循环变量j,且j赋初值为0;
步骤4.6:如果j<len(K3),则跳转到下一步,否则跳转到步骤4.10;
步骤4.7:将主题词集合Kj与FNet模型提取到的特征向量序列Tk使用WordNet进行标签相似度计算;
步骤4.8:保留相似度最低的计算结果为R,依据此结果扩展标签集合,增加用户画像的粒度;
步骤4.9:j=j+1,跳转到步骤4.6;
步骤4.10:k=k+1,跳转到步骤4.4;
步骤4.11结束循环,最终依据标签相似度计算结果,得到R={R1,R2,...,Re,...,Rlen(R)}。
6.根据权利要求1所述的基于多粒度的冷链配载用户画像构建方法,其特征在于,所述步骤5的具体方法为:
步骤5.1:将标签相似度计算结果序列R补充到FNet模型提取到的特征向量序列T1中;
步骤5.2:得到最终补充过的冷链配载标签集S={S1,S2,...,Sf,...,Slen(S)};
步骤5.3:依据最终获得的冷链配载标签集构建基于多粒度的冷链配载用户画像;
步骤5.4:使用词云图将构建出的冷链配载用户画像可视化;
步骤5.5:将模型保存封装,作为多粒度画像的构建方法。
7.一种基于多粒度的冷链配载用户画像构建装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被加载至处理器时执行权利要求1-6任一项所述的基于多粒度的冷链配载用户画像构建方法的步骤。
CN202211092866.0A 2022-09-07 2022-09-07 基于多粒度的冷链配载用户画像构建方法及装置 Active CN115600945B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211092866.0A CN115600945B (zh) 2022-09-07 2022-09-07 基于多粒度的冷链配载用户画像构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211092866.0A CN115600945B (zh) 2022-09-07 2022-09-07 基于多粒度的冷链配载用户画像构建方法及装置

Publications (2)

Publication Number Publication Date
CN115600945A true CN115600945A (zh) 2023-01-13
CN115600945B CN115600945B (zh) 2023-06-30

Family

ID=84843770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211092866.0A Active CN115600945B (zh) 2022-09-07 2022-09-07 基于多粒度的冷链配载用户画像构建方法及装置

Country Status (1)

Country Link
CN (1) CN115600945B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512245A (zh) * 2015-11-30 2016-04-20 青岛智能产业技术研究院 一种基于回归模型建立企业画像的方法
WO2018033052A1 (zh) * 2016-08-18 2018-02-22 腾讯科技(深圳)有限公司 一种评估用户画像数据的方法及系统
CN107862089A (zh) * 2017-12-02 2018-03-30 北京工业大学 一种基于感知数据的标签提取方法
CN108288229A (zh) * 2018-03-02 2018-07-17 北京邮电大学 一种用户画像构建方法
US20200226502A1 (en) * 2019-01-16 2020-07-16 Baidu Online Network Technology (Beijing) Co., Ltd. Travel plan recommendation method, apparatus, device and computer readable storage medium
CN111985247A (zh) * 2020-08-31 2020-11-24 华侨大学 一种基于多粒度文本特征表示的微博用户兴趣识别方法和系统
CN113051914A (zh) * 2021-04-09 2021-06-29 淮阴工学院 一种基于多特征动态画像的企业隐藏标签抽取方法及装置
WO2021164199A1 (zh) * 2020-02-20 2021-08-26 齐鲁工业大学 基于多粒度融合模型的中文句子语义智能匹配方法及装置
WO2022028249A1 (zh) * 2020-08-05 2022-02-10 华中师范大学 一种面向在线学习社区的学习兴趣发现方法
CN114218380A (zh) * 2021-12-03 2022-03-22 淮阴工学院 基于多模态的冷链配载用户画像标签抽取方法及装置
CN114398485A (zh) * 2021-12-29 2022-04-26 淮阴工学院 基于多视角融合的专家画像构建方法及装置
CN114817516A (zh) * 2022-04-26 2022-07-29 国家计算机网络与信息安全管理中心 零样本条件下基于逆向匹配的画像映射方法、装置和介质
CN114840766A (zh) * 2022-05-26 2022-08-02 西安建筑科技大学 一种用户画像构建方法、系统、设备及存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512245A (zh) * 2015-11-30 2016-04-20 青岛智能产业技术研究院 一种基于回归模型建立企业画像的方法
WO2018033052A1 (zh) * 2016-08-18 2018-02-22 腾讯科技(深圳)有限公司 一种评估用户画像数据的方法及系统
CN107862089A (zh) * 2017-12-02 2018-03-30 北京工业大学 一种基于感知数据的标签提取方法
CN108288229A (zh) * 2018-03-02 2018-07-17 北京邮电大学 一种用户画像构建方法
US20200226502A1 (en) * 2019-01-16 2020-07-16 Baidu Online Network Technology (Beijing) Co., Ltd. Travel plan recommendation method, apparatus, device and computer readable storage medium
WO2021164199A1 (zh) * 2020-02-20 2021-08-26 齐鲁工业大学 基于多粒度融合模型的中文句子语义智能匹配方法及装置
WO2022028249A1 (zh) * 2020-08-05 2022-02-10 华中师范大学 一种面向在线学习社区的学习兴趣发现方法
CN111985247A (zh) * 2020-08-31 2020-11-24 华侨大学 一种基于多粒度文本特征表示的微博用户兴趣识别方法和系统
CN113051914A (zh) * 2021-04-09 2021-06-29 淮阴工学院 一种基于多特征动态画像的企业隐藏标签抽取方法及装置
CN114218380A (zh) * 2021-12-03 2022-03-22 淮阴工学院 基于多模态的冷链配载用户画像标签抽取方法及装置
CN114398485A (zh) * 2021-12-29 2022-04-26 淮阴工学院 基于多视角融合的专家画像构建方法及装置
CN114817516A (zh) * 2022-04-26 2022-07-29 国家计算机网络与信息安全管理中心 零样本条件下基于逆向匹配的画像映射方法、装置和介质
CN114840766A (zh) * 2022-05-26 2022-08-02 西安建筑科技大学 一种用户画像构建方法、系统、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
QINGYUN LIU 等: "Sketch to portrait generation with generative adversarial networks and edge constraint", 《COMPUTERS AND ELECTRICAL ENGINEERING》, pages 1 - 9 *
毕崇武;叶光辉;李明倩;曾杰妍;: "基于标签语义挖掘的城市画像感知研究", 数据分析与知识发现, no. 12, pages 45 - 55 *
陈泽宇;黄勃;: "基于LDA特征扩展的用户画像", 软件导刊, no. 06, pages 198 - 201 *

Also Published As

Publication number Publication date
CN115600945B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
Chen et al. Scalable graph neural networks via bidirectional propagation
US7958068B2 (en) Method and apparatus for model-shared subspace boosting for multi-label classification
CN111950596A (zh) 一种用于神经网络的训练方法以及相关设备
CN107301170A (zh) 基于人工智能的切分语句的方法和装置
JP7178513B2 (ja) ディープラーニングに基づく中国語単語分割方法、装置、記憶媒体及びコンピュータ機器
CN111782797A (zh) 一种科技项目评审专家自动匹配方法及存储介质
CN108959474B (zh) 实体关系提取方法
CN110580489B (zh) 一种数据对象的分类系统、方法以及设备
CN113051914A (zh) 一种基于多特征动态画像的企业隐藏标签抽取方法及装置
CN108197656A (zh) 一种基于cuda的属性约简方法
CN114547307A (zh) 文本向量模型训练方法、文本匹配方法、装置及设备
CN110222737A (zh) 一种基于长短时记忆网络的搜索引擎用户满意度评估方法
Meng et al. The classification of traditional Chinese painting based on CNN
CN115600945A (zh) 基于多粒度的冷链配载用户画像构建方法及装置
CN113626614B (zh) 资讯文本生成模型的构造方法、装置、设备及存储介质
CN112069322B (zh) 文本多标签分析方法、装置、电子设备及存储介质
CN113076475B (zh) 信息推荐方法、模型训练方法及相关设备
CN113987170A (zh) 基于卷积神经网络的多标签文本分类方法
CN114118443A (zh) 基于Optane DIMM的大规模图嵌入训练方法及系统
CN112269877A (zh) 数据标注方法及装置
CN109885687A (zh) 一种文本的情感分析方法、装置、电子设备及存储介质
Yu et al. Interpretative topic categorization via deep multiple instance learning
CN110222693A (zh) 构建字符识别模型与识别字符的方法和装置
Jiang et al. Automatic image annotation based on decision tree machine learning
CN111310459B (zh) 机器学习组件的训练方法及装置、中文分词方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant