CN113298179A - 一种海关商品异常价格检测方法和装置 - Google Patents

一种海关商品异常价格检测方法和装置 Download PDF

Info

Publication number
CN113298179A
CN113298179A CN202110658278.8A CN202110658278A CN113298179A CN 113298179 A CN113298179 A CN 113298179A CN 202110658278 A CN202110658278 A CN 202110658278A CN 113298179 A CN113298179 A CN 113298179A
Authority
CN
China
Prior art keywords
price
word
abnormal
customs
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110658278.8A
Other languages
English (en)
Other versions
CN113298179B (zh
Inventor
路通
王文卓
邓照飞
朱立平
易欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202110658278.8A priority Critical patent/CN113298179B/zh
Publication of CN113298179A publication Critical patent/CN113298179A/zh
Application granted granted Critical
Publication of CN113298179B publication Critical patent/CN113298179B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种海关商品异常价格检测方法及装置,其中方法包括:把数据集分割成训练集和验证集;将数据集文本的不同信息分割成不同的词序列;对于每个数据,将分割成的词序列输入语言表示层,得到关于词向量的二维矩阵;将得到的二维矩阵输入文本双向多尺度神经网络中,从中提取相应的特征向量;将得到的特征向量输入用指数函数激活的单层感知机网络中,得到价格预测值;通过平均绝对对数误差损失函数计算网络的预测损失,然后使用随机梯度下降算法更新网络参数;结合得到的预测的价格,计算价格相似度;根据价格相似度,判断价格数据是否异常。本发明检测方法能较好地检测出异常价格,为海关部门异常报关价格数据的检测提供了参考依据。

Description

一种海关商品异常价格检测方法和装置
技术领域
本发明属于价格异常检测分类领域,尤其涉及一种基于文本回归的海关商品异常价格检测方法和模型。
背景技术
报关单审核主要涉及对现有商品价格数据的拟合、以及对未知商品的价格预测。在此背景下,许多学者设计了解决实际应用中的异常数据检测方法:一是,利用统计规律的异常检测方法,二是,基于时间序列的异常检测方法。前者因缺乏历史数据,无法根据数据的历史规律修正得到的统计规律,从而降低了异常数据检测的准确率。后者往往只能预测单一价格的变动规律,是针对单个及少量商品的价格时间序列特征进行建模,规模性不足。故已有方法很难较好地解决大规模数据集的异常检测任务,特别是对于商品种类繁多且价格多变的海关报关单的商品数据。此外,这些方法仅利用了商品的历史价格,并没有挖掘非结构化的商品描述信息中隐含的特征,这也造成了构建的异常检测模型无法得到令人满意的精度。
目前,海关采用报关单的形式获取商品信息。报关单由商家填写,提供包括企业名称、商品品名、商品品牌、规格型号、原产国等文本信息,以及申报时间、原产国(编号)、申报数量、申报价格等其他数字信息,海关审核人员主要根据商品的文本信息推测商家所报价格是否存在异常。因此,将海关报关单中的文本特征及提取方法用于海关异常数据检测任务中是十分有价值的。在现有的相关工作中,基于文本的预测方法多应用于文本分类任务,在更具难度而实际需求更大的数据预测、异常数据检测等回归任务,还没有得到很好地应用。
通过商品文本信息来进行价格预测,往往面临着以下两类困难:(1)同一类商品,由于品牌、规格、产地、功效等描述不同,以及商铺性质(如旗舰、代购、直营、海外购等)和商铺自行推出的折扣活动,往往导致同一商品的价格有很大差异,仅依靠商品文本数据很难正确预测价格,即商品文本数据存在“同质异构”现象;(2)不同类型商品可能有非常相似的商品文本数据,故很难通过商品文本数据预测出各自的真正价格,即存在“异质同构”的描述信息。以海关化妆品类商品的报关单数据为例,以“护肤品”为关键词搜索到的商品价格,可以发现,规格、品牌、原产地等因素的影响使得“护肤品”的申报单价从几十元到上百元不等,直接利用这类商品文本数据进行准确的价格预测是比较困难的。其中含“玻尿酸”的商品种类繁多,如具有不同功能的面部精华、乳液、喷雾、卸妆液等,这些商品在化妆品中分属不同类别,但由于非常相似的商品描述,提高了相应商品价格预测的难度。因此,通过现有的商品文本数据训练价格预测模型、利用价格预测模型进行异常检测,以及评估价格检测模型的性能是提高海关部门对报关商品异常价格检测效率的三个关键环节。
发明内容
本发明所要解决的技术问题是针对上述现有技术存在的不足,而提供一种能够较为准确地将价格异常的商品检测出来的方法和装置。
为解决上述技术问题,本发明采用的技术方案是:
一种海关商品异常价格检测方法,其特征在于,包括如下步骤:
步骤1:把数据集分割成训练集和验证集;
步骤2:对数据集文本信息中的不同信息分割成不同的词序列,其中不同信息包括品牌、型号,品名以及产地;
步骤3:对于每个数据,将步骤2中分割成的词序列输入语言表示层,使离散的词的文字表示编码为词向量,得到关于词向量的二维矩阵;
步骤4:将步骤3得到的二维矩阵输入文本双向多尺度神经网络中,从中提取特征向量;
步骤5:将步骤4得到的特征向量输入指数函数激活的单层感知机网络中,得到价格预测值
Figure BDA0003114177530000021
步骤6:通过平均对数误差损失函数计算网络的预测损失,然后使用随机梯度下降算法更新步骤3至步骤5中网络参数;
步骤7:结合真实的海关报关数据,对于当前预测的商品,给定申报价格Y,结合步骤6得到的预测的价格
Figure BDA0003114177530000022
计算价格相似度α;
步骤8:设定风险控制阈值用于判断异常,如果价格相似度不满足设定的风险控制阈值条件,则该价格数据判定为异常。
一种海关商品异常价格检测装置,包括处理器和存储器;所述存储器中存储有程序或指令,所述程序或指令由所述处理器加载并执行以实现上述海关商品异常价格检测方法的步骤。
有益效果:本发明提出了一种新的基于价格预测的海关异常检测方法和模型,在对商品文本数据进行文本特征提取的基础上,构建了价格回归模型,利用文本特征与价格之间的联系对海关的报关价格数据进行异常检测。此外,针对海关异常价格数据在数据集中占比小的特点,本发明还提供了一种有效的评价方案来衡量模型的性能。在海关真实报关数据的检测实验中,本发明提出的价格预测模型和评价方案能较好地检测出异常价格,为海关部门异常报关价格数据的检测提供了参考依据。
海关数据不同于普通的文本数据,其中存在大量的低频词汇和短特征词汇,且异常商品数量很少,导致数据存在不平衡问题。针对价格异常检测的问题,本发明提供了一种基于文本回归的海关商品异常价格检测方法和装置,检测方法中使用了双向多尺度神经网络,提取文本特征,并设计其中的卷积核结构以提取多尺度的局部特征。文本双向多尺度神经网络,结合多尺度卷积和BiGRU的优势,针对海关数据能提取出更有用的特征。现有方案只用Text CNN,只能提取出词袋特征,即关注了词出现的频率而忽略了词出现的位置,而这容易丢失位置信息带来的一些信息。本发明在Text CNN的基础上添加了BiGRU模块,BiGRU层通过训练序列向前和向后的两个循环神经网络,能有效利用前文和后文的信息。因此我们采用BiGRU层来弥补卷积层丢失掉的位置信息。通过结合卷积层和BiGRU层,相对于常规的TextCNN,能更好地学习序列依赖,更好地学习上下文的关系。针对海关数据的特点,本发明结合卷积层和BiGRU层,即结合了它们关注词频和上下文信息的优势,能提取出更好的特征以实现价格的预测,是更可行的方案,弥补了现有技术的不足。
针对海关数据,用文本回归的方法提取出了文本特征,这是首次用文本回归的方法进行海关价格预测与异常检测。以往的异常检测多用分类的方法,将其直接归类为正常或异常。本发明用预测的方法先预测出商品价格,再利用监督信息进行异常检测,从另一个角度实现了异常检测,为海关部门异常报关价格数据的检测方案提供了参考。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1为本发明的流程图;
图2为本发明的整体模型框架。
具体实施方式
下面结合实施例对本发明做进一步说明。
实施例1
本发明海关产品异常价格检测方法,如图1所示,包括以下步骤:
步骤1:把数据集分割成训练集和验证集。从实际的海关报关单中获取60000条护肤品类的文本数据,包括“电商平台名称”、“电商企业名称”、“企业商品品名”和“商品描述信息”,将其中的54000条文本数据作为训练集,其余6000条作为验证集。在此数据集中,异常价格数据占比大约为1%,异常模式表现为虚报价格,通常虚报价格约为真实价格的1/10。
步骤2:对数据集中文本进行预处理,将品牌、型号,品名、产地等不同信息分开,分割成词序列。对于样本(雅漾Avene舒护活泉水喷雾300ml),分割后的词序列为雅漾/Avene/舒护/活泉水/喷雾/300/ml)。步骤2包括:对文字部分的文本进行分词处理,把句子分割成词序列。通过分词,文本表示的基本单元由句子变成细粒度水平更精细的词或字。具体包括如下步骤:
步骤2-1,分割标点符号,对各种标点符号进行字符级分割;
步骤2-2,分割英文单词,将连续的英文字母视为一个单词,对英文进行单词级分割;
步骤2-3,分割数字;
步骤2-4,分割中文,使用结巴分词工具分割中文。
步骤3:步骤2中分割成的词序列N1,N2...,Nn分别对应某件商品的报关关键词信息,将其输入语言表示层,将文本中的每一个单词映射到固定维度的向量,拼接每个单词的向量,得到关于词向量的二维矩阵。上述过程可用以下公式来表明:
Figure BDA0003114177530000041
其中,FE是生成的词向量组成的矩阵,大小为n×d,n是单词的个数,d是词向量维度。Embedding表示用嵌入层对文本进行词嵌入。(xi1...xid)表明Ni编码后的词向量。
步骤4:将步骤3得到的二维矩阵输入我们设计的双向多尺度神经网络中,从中提取相应的特征向量。步骤4包括如下步骤:
步骤4-1:将步骤3获得的词向量矩阵FE输入卷积层提取特征,得到激活后的特征向量,这个过程可以形式化表示为:
FH=Re LU(Conv(FE;W))
其中,FH表示生成的特征向量。ReLU表示激活层,Conv表示卷积层,W是卷积核。本文采用的三种不同大小的卷积核W1,W2,W3,大小分别为3×d×f,4×d×f,5×d×f,其中d是词向量维度,f为滤波器个数。
步骤4-2:拼接卷积核W1,W2,W3作用后的特征,再经双向循环单元进行融合。融合后的特征向量为FM,表达式如下:
FM=BiGRU(Concate([FH1,FH2,FH3]))
其中,FH1,FH2,FH3分别为卷积核W1,W2,W3生成的特征,长度为f,Concate表示特征拼接操作,BiGRU表示双向门控循环单元。
步骤5:将步骤4得到的特征向量FM输入一个单层感知机网络,其中单层感知机网络由一个全连接层和一个指数函数构成。.具体步骤如下:
步骤5-1:将步骤4得到的特征向量FM输入全连接层,得到输出z。其中全连层表达式如下:
z=Linear(FM;W,b)=WFM+b
其中,FM为步骤4得到的特征向量,W为全连接层的权重系数,b为偏置系数,z为全连接层的输出。
步骤5-2:将步骤5-1的输出z输入激活函数中,得到价格预测
Figure BDA0003114177530000051
激活函数使用指数函数,从而是对数空间的回归,这样做与一般的线性空间回归相比,更有利于价格这种变量。激活函数实现公式如下:
Figure BDA0003114177530000061
其中,activate为激活操作,z为步骤5-1的输出,
Figure BDA0003114177530000062
为价格预测值。
步骤6:通过平均绝对对数误差损失函数计算网络的预测损失,然后使用随机梯度下降算法更新步骤3至步骤5中网络参数。将价格预测误差置于对数空间,通过预测价格的损失函数计算网络的预测损失,然后使用随机梯度下降算法更新步骤3至步骤5中网络参数。其中损失函数为:
Figure BDA0003114177530000063
其中,
Figure BDA0003114177530000064
为步骤5-2的预测价格,Y为价格真实值,ε为保持数值稳定的小正常数,本实施例中,ε=0.0001。
步骤7:结合真实的海关报关数据,对于当前预测的商品,给定申报价格Y,结合
步骤5得到的预测的价格
Figure BDA0003114177530000065
计算价格相似度α,其中α的计算方法为:
Figure BDA0003114177530000066
步骤8:设定风险控制阈值用于判断异常,满足下面的条件,则该价格数据判定为异常:
α<α0
其中,α0=0.2。异常检测的结果按实际情况和预测情况将样本分为四类:
Figure BDA0003114177530000067
表1
图2展现了本发明整个模型。其中假设有进行分词后的文本数据N1,N2,...,Nn分别对应某件商品的报关关键词信息,对其中的每个词进行词嵌入(Embedding),生成词向量,得到词向量矩阵。图中conv卷积层,将Embedding后得到的二维矩阵输入卷积层,再输入BiGRU层,从中提取相应的特征向量。再将抽取的特征向量输入单层感知机,得到预测的价格
Figure BDA0003114177530000071
Figure BDA0003114177530000072
结合给定申报价格Y,计算出价格相似度α。通过判定α<α0来判定价格是否异常。
下面表2中的实例展现了检测出的商品价格。
表2
Figure BDA0003114177530000073
例如,对于第一行商品名称为婴儿面霜的商品,某电商平台的申报单价是15.67元,而用本发明方法预测到的单价是153.91元,求出价格相似度α为0.116,对于我们设定的α0=0.2,显然有α<α0,因此将其判定为价格异常。

Claims (8)

1.一种海关商品异常价格检测方法,其特征在于,包括如下步骤:
步骤1:把数据集分割成训练集和验证集;
步骤2:对数据集文本信息中的不同信息分割成不同的词序列,其中不同信息包括品牌、型号,品名以及产地;
步骤3:对于每个数据,将步骤2中分割成的词序列输入语言表示层,使离散的词的文字表示编码为词向量,得到关于词向量的二维矩阵;
步骤4:将步骤3得到的二维矩阵输入文本双向多尺度神经网络中,从中提取特征向量;
步骤5:将步骤4得到的特征向量输入指数函数激活的单层感知机网络中,得到价格预测值
Figure FDA0003114177520000011
步骤6:通过平均对数误差损失函数计算网络的预测损失,然后使用随机梯度下降算法更新步骤3至步骤5中网络参数;
步骤7:结合真实的海关报关数据,对于当前预测的商品,给定申报价格Y,结合步骤6得到的预测的价格
Figure FDA0003114177520000012
计算价格相似度α;
步骤8:设定风险控制阈值用于判断异常,如果价格相似度不满足设定的风险控制阈值条件,则该价格数据判定为异常。
2.根据权利要求1所述的方法,其特征在于,步骤3中,得到关于词向量的二维矩阵为:
Figure FDA0003114177520000013
其中,FE是生成的词向量组成的二维矩阵,大小为n×d,n是单词的个数,d是词向量维度;Embedding表示用嵌入层对文本进行词嵌入;N1,N2...,Nn是步骤2中分割成的词序列;(xi1...xid)表明Ni编码后的词向量。
3.根据权利要求2所述的方法,其特征在于,步骤4中,提取的特征向量包括如下步骤:
步骤4-1:将步骤3获得的词向量矩阵FE输入多尺度卷积层提取特征,得到激活后的特征向量:
FH=Re LU(Conv(FE;W))
其中,FH表示生成的特征向量;ReLU表示激活层,Conv表示卷积层,W是卷积核;卷积核包括W1,W2,W3三个卷积核,大小分别为3×d×f,4×d×f,5×d×f,其中d是词向量维度,f为滤波器个数;
步骤4-2:拼接卷积核W1,W2,W3作用后的特征,再经双向循环单元进行融合;融合后的特征向量为FM,表达式如下:
Figure FDA0003114177520000021
其中,
Figure FDA0003114177520000022
分别为卷积核W1,W2,W3生成的特征,长度为f,Concate表示特征拼接操作,BiGRU表示双向门控循环单元。
4.根据权利要求3所述的方法,其特征在于,步骤5中,所述单层感知机网络由一个全连接层和一个指数函数构成;由单层感知机网络中得到价格预测值
Figure FDA0003114177520000023
的方法包括:
步骤5-1:将步骤4得到的特征向量FM输入全连接层,得到输出z;其中全连接层表达式如下:
z=Linear(FM;W,b)=WFM+b
其中,FM为步骤4得到的特征向量,W为全连接层的权重系数,b为偏置系数,z为全连接层的输出;
步骤5-2:将步骤5-1的输出z输入激活函数中,得到价格预测
Figure FDA0003114177520000024
激活函数实现公式如下:
Figure FDA0003114177520000025
其中,activate为激活操作,z为步骤5-1的输出,
Figure FDA0003114177520000026
为价格预测值。
5.根据权利要求1所述的方法,其特征在于,步骤6中,损失函数表示为:
Figure FDA0003114177520000027
其中,
Figure FDA0003114177520000028
为步骤5-2的预测价格,Y为价格真实值,ε为保持数值稳定的小正常数。
6.根据权利要求1所述的方法,其特征在于,步骤7中,相似度α的计算方法为:
Figure FDA0003114177520000031
其中,α为价格相似度;Y为申报价格;
Figure FDA0003114177520000032
为预测价格;c是偏差敏感系数,0<c<1。
7.根据权利要求1所述的方法,其特征在于,步骤2中,对数据集文本信息中的不同信息分割成不同的词序列,包括如下步骤:
步骤2-1,分割标点符号,对各种标点符号进行字符级分割;
步骤2-2,分割英文单词,将连续的英文字母视为一个单词,对英文进行单词级分割;
步骤2-3,分割数字;
步骤2-4,分割中文,使用结巴分词工具分割中文和去停用词;保留训练异常文本去停用词前的文本,以增强异常数据。
8.一种海关商品异常价格检测装置,其特征在于:包括处理器和存储器;所述存储器中存储有程序或指令,所述程序或指令由所述处理器加载并执行以实现如权利要求1至7任一所述海关商品异常价格检测方法的步骤。
CN202110658278.8A 2021-06-15 2021-06-15 一种海关商品异常价格检测方法和装置 Active CN113298179B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110658278.8A CN113298179B (zh) 2021-06-15 2021-06-15 一种海关商品异常价格检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110658278.8A CN113298179B (zh) 2021-06-15 2021-06-15 一种海关商品异常价格检测方法和装置

Publications (2)

Publication Number Publication Date
CN113298179A true CN113298179A (zh) 2021-08-24
CN113298179B CN113298179B (zh) 2024-05-28

Family

ID=77328354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110658278.8A Active CN113298179B (zh) 2021-06-15 2021-06-15 一种海关商品异常价格检测方法和装置

Country Status (1)

Country Link
CN (1) CN113298179B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116109364A (zh) * 2023-02-16 2023-05-12 北京青萌数海科技有限公司 一种价格评估方法和装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694476A (zh) * 2018-06-29 2018-10-23 山东财经大学 一种结合财经新闻的卷积神经网络股票价格波动预测方法
US20180365560A1 (en) * 2017-06-19 2018-12-20 International Business Machines Corporation Context aware sensitive information detection
CN109145112A (zh) * 2018-08-06 2019-01-04 北京航空航天大学 一种基于全局信息注意力机制的商品评论分类方法
CN110363568A (zh) * 2019-06-06 2019-10-22 上海交通大学 融合文本多主题信息的股票价格预测方法、系统及介质
CN110717334A (zh) * 2019-09-10 2020-01-21 上海理工大学 基于bert模型和双通道注意力的文本情感分析方法
US20200074274A1 (en) * 2018-08-28 2020-03-05 Beijing Jingdong Shangke Information Technology Co., Ltd. System and method for multi-horizon time series forecasting with dynamic temporal context learning
US20200104369A1 (en) * 2018-09-27 2020-04-02 Apple Inc. Sentiment prediction from textual data
RU2721190C1 (ru) * 2018-12-25 2020-05-18 Общество с ограниченной ответственностью "Аби Продакшн" Обучение нейронных сетей с использованием функций потерь, отражающих зависимости между соседними токенами
WO2020261234A1 (en) * 2019-06-28 2020-12-30 Tata Consultancy Services Limited System and method for sequence labeling using hierarchical capsule based neural network
US20210005195A1 (en) * 2019-07-01 2021-01-07 Koninklijke Philips N.V. Hierarchical self-attention for machine comprehension
CN112307760A (zh) * 2020-11-13 2021-02-02 成都知原点科技有限公司 基于深度学习的财务报告情感分析方法、装置及终端
WO2021052137A1 (zh) * 2019-09-20 2021-03-25 平安科技(深圳)有限公司 情绪向量的生成方法及装置
CN112749274A (zh) * 2019-10-30 2021-05-04 中南大学 基于注意力机制和干扰词删除的中文文本分类方法
CN112818951A (zh) * 2021-03-11 2021-05-18 南京大学 一种票证识别的方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180365560A1 (en) * 2017-06-19 2018-12-20 International Business Machines Corporation Context aware sensitive information detection
CN108694476A (zh) * 2018-06-29 2018-10-23 山东财经大学 一种结合财经新闻的卷积神经网络股票价格波动预测方法
CN109145112A (zh) * 2018-08-06 2019-01-04 北京航空航天大学 一种基于全局信息注意力机制的商品评论分类方法
US20200074274A1 (en) * 2018-08-28 2020-03-05 Beijing Jingdong Shangke Information Technology Co., Ltd. System and method for multi-horizon time series forecasting with dynamic temporal context learning
US20200104369A1 (en) * 2018-09-27 2020-04-02 Apple Inc. Sentiment prediction from textual data
RU2721190C1 (ru) * 2018-12-25 2020-05-18 Общество с ограниченной ответственностью "Аби Продакшн" Обучение нейронных сетей с использованием функций потерь, отражающих зависимости между соседними токенами
CN110363568A (zh) * 2019-06-06 2019-10-22 上海交通大学 融合文本多主题信息的股票价格预测方法、系统及介质
WO2020261234A1 (en) * 2019-06-28 2020-12-30 Tata Consultancy Services Limited System and method for sequence labeling using hierarchical capsule based neural network
US20210005195A1 (en) * 2019-07-01 2021-01-07 Koninklijke Philips N.V. Hierarchical self-attention for machine comprehension
CN110717334A (zh) * 2019-09-10 2020-01-21 上海理工大学 基于bert模型和双通道注意力的文本情感分析方法
WO2021052137A1 (zh) * 2019-09-20 2021-03-25 平安科技(深圳)有限公司 情绪向量的生成方法及装置
CN112749274A (zh) * 2019-10-30 2021-05-04 中南大学 基于注意力机制和干扰词删除的中文文本分类方法
CN112307760A (zh) * 2020-11-13 2021-02-02 成都知原点科技有限公司 基于深度学习的财务报告情感分析方法、装置及终端
CN112818951A (zh) * 2021-03-11 2021-05-18 南京大学 一种票证识别的方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
JIN DAI 等: "Text classification system of academic papers based on hybrid Bert-BiGRU model", 《2020 12TH INTERNATIONAL CONFERENCE ON INTELLIGENT HUMAN-MACHINE SYSTEMS AND CYBERNETICS (IHMSC)》, 31 August 2020 (2020-08-31), pages 40 - 44, XP033830224, DOI: 10.1109/IHMSC49165.2020.10088 *
SANGHEETA ROY 等: "Fractional poisson enhancement model for text detection and recognition in video images", 《PATTERN RECOGNITION》, vol. 1, no. 1, 31 January 2016 (2016-01-31), pages 1 - 16 *
SU, F 等: "Ensemble Symbol Recognition with Hough Forest", 《 2012 21ST INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR 2012)》, 1 January 2012 (2012-01-01), pages 1659 - 1662 *
刘思琴 等: "基于BERT的文本情感分析", 《信息安全研究》, vol. 6, no. 03, 31 March 2020 (2020-03-31), pages 220 - 227 *
张翠肖 等: "基于CNN-BiLSTM的中文微博立场分析研究", 《计算机技术与发展》, vol. 30, no. 07, 31 July 2020 (2020-07-31), pages 154 - 159 *
李梦梦: "基于深度学习和评论挖掘的动态混合推荐算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2021, 15 March 2021 (2021-03-15), pages 138 - 874 *
王昊 等: "大数据环境下政务数据的情报价值及其利用研究——以海关报关商品归类风险规避为例", 《科技情报研究》, vol. 2, no. 04, 31 October 2020 (2020-10-31), pages 74 - 89 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116109364A (zh) * 2023-02-16 2023-05-12 北京青萌数海科技有限公司 一种价格评估方法和装置

Also Published As

Publication number Publication date
CN113298179B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN111639516B (zh) 基于机器学习的分析平台
CN105913296B (zh) 一种基于图的个性化推荐方法
Jahanbakhshi et al. Waste management using an automatic sorting system for carrot fruit based on image processing technique and improved deep neural networks
EP4322031A1 (en) Recommendation method, recommendation model training method, and related product
CN107683469A (zh) 一种基于深度学习的产品分类方法及装置
CN104778186B (zh) 将商品对象挂载到标准产品单元的方法及系统
CN111881671B (zh) 一种属性词提取方法
WO2019233077A1 (zh) 业务对象的排序
CN111259140A (zh) 一种基于lstm多实体特征融合的虚假评论检测方法
CN114022176A (zh) 一种电商平台上的商品销量预测的方法及电子设备
CN116015837A (zh) 用于计算机网络信息安全的入侵检测方法及系统
CN110909125A (zh) 推文级社会媒体谣言检测方法
CN112990973A (zh) 线上店铺画像构建方法及系统
CN114547307A (zh) 文本向量模型训练方法、文本匹配方法、装置及设备
WO2023159756A1 (zh) 价格数据的处理方法和装置、电子设备、存储介质
CN109063418A (zh) 疾病预测分类器的确定方法、装置、设备及可读存储介质
CN111241271B (zh) 文本情感分类方法、装置及电子设备
Huang et al. LADIS: Language disentanglement for 3D shape editing
CN113298179A (zh) 一种海关商品异常价格检测方法和装置
CN108959293A (zh) 一种文本数据分类方法及服务器
KR20220151453A (ko) 상품의 가격 예측 방법
US20140244240A1 (en) Determining Explanatoriness of a Segment
CN111723206A (zh) 文本分类方法、装置、计算机设备和存储介质
CN111046786A (zh) 年龄估计神经网络的生成方法、装置以及电子设备
CN116089605A (zh) 基于迁移学习和改进词袋模型的文本情感分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant