CN116977021A - 基于大数据的系统对接自动推单方法 - Google Patents

基于大数据的系统对接自动推单方法 Download PDF

Info

Publication number
CN116977021A
CN116977021A CN202310904310.5A CN202310904310A CN116977021A CN 116977021 A CN116977021 A CN 116977021A CN 202310904310 A CN202310904310 A CN 202310904310A CN 116977021 A CN116977021 A CN 116977021A
Authority
CN
China
Prior art keywords
order
feature vector
pushed
semantic
provider
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310904310.5A
Other languages
English (en)
Other versions
CN116977021B (zh
Inventor
李保荣
高佳
王富国
陈凤林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zeyi Supply Chain Management Co ltd
Original Assignee
Shanghai Zeyi Supply Chain Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zeyi Supply Chain Management Co ltd filed Critical Shanghai Zeyi Supply Chain Management Co ltd
Priority to CN202310904310.5A priority Critical patent/CN116977021B/zh
Publication of CN116977021A publication Critical patent/CN116977021A/zh
Application granted granted Critical
Publication of CN116977021B publication Critical patent/CN116977021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种基于大数据的系统对接自动推单方法。其首先从电商平台的订单数据库中获取待推送订单信息,其中,所述待推送订单信息包括订单号、商品信息和收货信息,接着,获取备选供应商的文本描述,然后,对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息。这样,可以对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配,以替换现有的预定规则的匹配方案,这样通过语义理解和匹配的方式,来提高自动推单的精准度和适配度。

Description

基于大数据的系统对接自动推单方法
技术领域
本申请涉及自动推单领域,且更为具体地,涉及一种基于大数据的系统对接自动推单方法。
背景技术
在电商平台的订单推单系统中,电商平台通常有大量的订单需要分配给不同的供应商或仓库进行处理和配送。传统的订单推单系统通常基于预定规则来进行分配决策,其中预定规则可以考虑多个因素,如供应商或仓库的库存情况、距离、配送能力、历史表现等。系统会根据这些因素来评估每个供应商或仓库的适合程度,并将订单分配给最合适的候选者。虽然上述订单推单系统可以减少人工干预和错误的可能性,但基于预定规则的推单系统会因为订单信息表达不符合规范或者供应商或仓库信息的表达不规范而导致推单匹配度降低甚至无法进行推单。
因此,期待一种更为优化的系统对接自动推单方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于大数据的系统对接自动推单方法。其可以对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配,以替换现有的预定规则的匹配方案,这样通过语义理解和匹配的方式,来提高自动推单的精准度和适配度。
根据本申请的一个方面,提供了一种基于大数据的系统对接自动推单方法,其包括:
从电商平台的订单数据库中获取待推送订单信息,其中,所述待推送订单信息包括订单号、商品信息和收货信息;
获取备选供应商的文本描述;以及
对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息。
与现有技术相比,本申请提供的基于大数据的系统对接自动推单方法,其首先从电商平台的订单数据库中获取待推送订单信息,其中,所述待推送订单信息包括订单号、商品信息和收货信息,接着,获取备选供应商的文本描述,然后,对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息。这样,可以对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配,以替换现有的预定规则的匹配方案,这样通过语义理解和匹配的方式,来提高自动推单的精准度和适配度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,以下附图并未刻意按实际尺寸等比例缩放绘制,重点在于示出本申请的主旨。
图1为根据本申请实施例的基于大数据的系统对接自动推单方法的流程图。
图2为根据本申请实施例的基于大数据的系统对接自动推单方法的架构示意图。
图3为根据本申请实施例的基于大数据的系统对接自动推单方法的子步骤S130的流程图。
图4为根据本申请实施例的基于大数据的系统对接自动推单方法的子步骤S131的流程图。
图5为根据本申请实施例的基于大数据的系统对接自动推单方法的子步骤S1312的流程图。
图6为根据本申请实施例的基于大数据的系统对接自动推单方法的子步骤S132的流程图。
图7为根据本申请实施例的基于大数据的系统对接自动推单方法的子步骤S1322的流程图。
图8为根据本申请实施例的基于大数据的系统对接自动推单方法的子步骤S134的流程图。
图9为根据本申请实施例的基于大数据的系统对接自动推单系统的框图。
图10为根据本申请实施例的基于大数据的系统对接自动推单方法的应用场景图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本申请的部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本申请保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
针对上述技术问题,本申请的技术构思为对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配,以替换现有的预定规则的匹配方案,这样通过语义理解和匹配的方式,来提高自动推单的精准度和适配度。
图1为根据本申请实施例的基于大数据的系统对接自动推单方法的流程图。图2为根据本申请实施例的基于大数据的系统对接自动推单方法的架构示意图。如图1和图2所示,根据本申请实施例的基于大数据的系统对接自动推单方法,包括步骤:S110,从电商平台的订单数据库中获取待推送订单信息,其中,所述待推送订单信息包括订单号、商品信息和收货信息;S120,获取备选供应商的文本描述;以及,S130,对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息。
具体地,在本申请的技术方案中,首先从电商平台的订单数据库中获取待推送订单信息,其中,所述待推送订单信息包括订单号、商品信息和收货信息。同时,获取备选供应商的文本描述。在本申请一个具体的示例中,所述备选供应商的文本描述,包括:公司信息,供应商的公司名称、注册地点、成立时间等基本信息;产品范围,供应商所提供的产品或服务的范围,包括具体的商品或服务类别;质量保证,供应商对产品或服务质量的保证措施,如质量认证、检测标准、质量控制流程等;价格竞争力,供应商的价格策略和竞争力,包括是否有批发价、折扣政策等;供货能力,供应商的供货能力和产能,包括库存量、生产能力、配送能力等;交货时间,供应商的交货时间承诺,包括订单处理时间、发货时间、运输时间等;历史表现,供应商的历史表现和客户评价,包括交货准时率、客户满意度等指标;售后服务,供应商提供的售后服务和支持,包括退换货政策、技术支持等;合作经验,供应商与其他电商平台或客户的合作经验,包括合作案例、合作时长等;其他附加条件,供应商可能提出的其他附加条件,如最小订购量、支付方式、合同条款等。
接着,对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息。具体地,在本申请的技术方案中,首先对所述待推送订单信息进行语义理解以得到待推送订单语义编码特征向量以及对所述备选供应商的文本描述进行语义理解以得到备选供应商语义编码特征向量。
相应地,在一个具体示例中,如图3所示,对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息,包括:S131,对所述待推送订单信息进行语义理解以得到待推送订单语义编码特征向量;S132,对所述备选供应商的文本描述进行语义理解以得到备选供应商语义编码特征向量;S133,对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行语义匹配以得到订单-供应商匹配语义表达特征向量;以及,S134,基于所述订单-供应商匹配语义表达特征向量,确定是否向所述备选供应商推送所述待推送订单信息。
在本申请一个具体的示例中,如图4所示,对所述待推送订单信息进行语义理解以得到待推送订单语义编码特征向量的过程,包括:S1311,对所述待推送订单信息进行数据清洗、格式转化和分词处理以得到待推送订单描述词的序列;以及,S1312,将所述待推送订单描述词的序列通过包含ALBert模型和文本卷积神经网络模型的语义编码器以得到所述待推送订单语义编码特征向量。值得一提的是,数据清洗、格式转化和分词处理是对待推送订单信息进行预处理的步骤,以便于后续的语义编码和分析。在本申请的一个示例中,数据清洗是指对待推送订单信息进行去除噪声、纠正错误和处理缺失值等操作,以确保数据的质量和准确性,例如,可以去除特殊字符、删除重复数据、处理缺失字段等;格式转化是指将待推送订单信息从原始格式转换为适合处理和分析的格式,这可能涉及将订单信息从不同的数据源中提取出来,并将其转换为统一的数据结构,如表格或JSON格式;分词处理是将待推送订单描述转化为一个个有意义的词语或词组的过程,这可以通过使用自然语言处理技术中的分词工具或算法来实现,分词将订单描述句子切分成一个个词语,这样可以更好地理解和处理订单的语义信息。在上述步骤完成后,可以将清洗、转化和分词后的待推送订单描述词序列输入到语义编码器中,如ALBert模型和文本卷积神经网络模型,以获取待推送订单的语义编码特征向量。这些特征向量可以用于后续的订单-供应商匹配和语义分析任务。
应可以理解,ALBert模型是一种预训练语言模型,通过在大规模文本数据上进行训练,可以学习到丰富的语义表示。通过使用ALBert模型能够将文本编码为高维的语义特征向量,其中每个维度代表了文本中的某种语义信息。因此通过ALBert模型的编码,可以将文本描述转化为一个表示其语义含义的向量。并且,文本卷积神经网络模型是一种能够捕捉文本中局部特征的模型,文本卷积神经网络模型通过卷积操作对文本进行特征提取,可以捕捉到文本中不同位置的语义信息。通过文本卷积神经网络模型的编码,可以进一步丰富文本的语义表示。因此,在本公开的技术方案中,将所述待推送订单描述词的序列通过ALBert模型和文本卷积神经网络模型的语义编码器进行编码,可以提取出所述待推送订单描述词的序列中分别关于待推送订单的丰富语义理解特征信息,从而得到它们对应的语义特征向量。这里,这些所述语义特征向量将具有较高的语义相似性,可以用于后续的融合和生成过程,以提高文本描述的准确性和一致性。
应可以理解,文本卷积神经网络(Text Convolutional Neural Network,TextCNN)是一种用于处理文本数据的深度学习模型,其借鉴了传统图像处理中的卷积神经网络(Convolutional Neural Network,CNN)的思想,通过卷积操作来提取文本数据中的局部特征。文本卷积神经网络模型的输入通常是一个文本序列,例如一句话或一个文档,其中每个单词可以表示为一个向量。模型首先将文本中的每个单词表示为词向量,然后通过一个或多个卷积层来提取不同尺寸的特征。卷积层使用一组可学习的卷积核对输入进行卷积操作,得到一系列特征图。每个特征图对应一个卷积核,可以捕捉不同的局部特征。接下来,模型使用池化操作(通常是最大池化)对每个特征图进行降维,提取出最显著的特征。然后,将池化后的特征连接起来,并通过全连接层进行分类或其他任务的处理。文本卷积神经网络模型的优势在于它能够捕捉到文本中的局部特征,并且可以通过多个卷积核和池化操作来提取不同尺度的特征。需要注意的是,文本卷积神经网络并不考虑文本的顺序信息,因此在处理一些需要考虑上下文关系的任务时,可能需要结合其他模型或技术进行改进。
更具体地,在步骤S1312中,如图5所示,将所述待推送订单描述词的序列通过包含ALBert模型和文本卷积神经网络模型的语义编码器以得到所述待推送订单语义编码特征向量,包括:S13121,使用所述ALBert模型将所述待推送订单描述词的序列转化为待推送订单描述词特征向量的序列;以及,S13122,将所述待推送订单描述词特征向量的序列排列为词特征矩阵后通过所述文本卷积神经网络模型以得到所述待推送订单语义编码特征向量。值得一提的是,在本申请的一个实施例中,将待推送订单描述词特征向量的序列排列为词特征矩阵,可以按照以下步骤进行操作:将待推送订单描述词特征向量的序列表示为一个矩阵;确定矩阵的维度,假设待推送订单描述词特征向量的序列长度为N,每个特征向量的维度为D,则矩阵的维度为N×D;将待推送订单描述词特征向量按照顺序排列在矩阵的行或列上,如果按行排列,将每个特征向量作为矩阵的一行,矩阵的行数为N,列数为D,如果按列排列,将每个特征向量作为矩阵的一列,矩阵的行数为D,列数为N。完成上述步骤后,可以得到一个词特征矩阵,该矩阵可以作为输入传递给文本卷积神经网络模型进行进一步处理。
在本申请一个具体的示例中,如图6所示,对所述备选供应商的文本描述进行语义理解以得到备选供应商语义编码特征向量的过程,包括:S1321,对所述备选供应商的文本描述进行数据清洗、格式转化和分词处理以得到备选供应商描述词的序列;以及,S1322,将所述备选供应商描述词的序列通过包含word2vec模型和BiLSTM模型的语义编码器以得到所述备选供应商语义编码特征向量。
应可以理解,Word2Vec模型是一种用于将文本中的单词映射到连续向量空间的模型,Word2Vec模型基于分布假设,即将具有相似上下文的单词映射到相近的向量空间位置。Word2Vec模型可以通过两种算法来训练:连续词袋模型(Continuous Bag of Words,CBOW)和Skip-gram模型。这些模型可以将单词表示为稠密的向量,其中向量的维度可以根据需求进行设定。Word2Vec模型能够捕捉到单词之间的语义和语法关系,从而在文本理解和语义推理任务中发挥重要作用。BiLSTM(双向长短时记忆网络)模型是一种循环神经网络(Recurrent Neural Network,RNN)的变体。与传统的循环神经网络只考虑上下文的时序关系不同,BiLSTM模型还考虑了上下文的双向关系,BiLSTM模型通过同时处理正向和反向的输入序列,从而能够更好地捕捉到序列中的语义信息。BiLSTM模型中的每个时间步都有一个隐藏状态,可以将输入序列编码为一个固定长度的向量表示。在所述备选供应商的文本描述进行语义理解的过程中,Word2Vec模型和BiLSTM模型被用作语义编码器,用于将备选供应商的描述词序列转化为备选供应商的语义编码特征向量。具体而言,Word2Vec模型用于将备选供应商描述词映射为向量表示,而BiLSTM模型则进一步对这些向量进行处理,提取更丰富的语义信息,最终得到备选供应商的语义编码特征向量,这些特征向量可以用于后续的任务。
更具体地,在步骤S1322中,如图7所示,将所述备选供应商描述词的序列通过包含word2vec模型和BiLSTM模型的语义编码器以得到所述备选供应商语义编码特征向量,包括:S13221,使用所述word2vec模型将所述备选供应商描述词的序列转化为备选供应商描述词嵌入向量的序列;以及,S13222,将所述备选供应商描述词嵌入向量的序列通过所述BiLSTM模型进行基于全局的上下文语义编码以得到所述备选供应商语义编码特征向量。
在得到所述待推送订单信息和所述备选供应商的文本描述的语义理解结果后,对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行语义匹配以得到订单-供应商匹配语义表达特征向量。例如,在本申请一个具体的示例中,使用级联函数对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行特征交互式理解以得到所述订单-供应商匹配语义表达特征向量,具体地,对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行语义匹配以得到订单-供应商匹配语义表达特征向量,包括:使用级联函数对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行特征交互式理解以得到所述订单-供应商匹配语义表达特征向量;其中,所述级联函数为:
f(Xi,Xj)=Relu(Wf[θ(Xi),φ(Xj)])
其中,Wf,θ(Xi)和φ(Xj)均表示对输入进行点卷积、Relu为激活函数,[]表示拼接操作,Xi为所述待推送订单语义编码特征向量中各个位置的特征值,Xj为所述备选供应商语义编码特征向量中各个位置的特征值。
特别地,使用所述级联函数能够利用点卷积和非线性激活运算来对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行基于推理地逐特征元素式语义交互和编码以得到包含两者语义匹配信息的所述订单-供应商匹配语义表达特征向量。
进而,基于所述订单-供应商匹配语义表达特征向量,确定是否向所述备选供应商推送所述待推送订单信息。在本申请一个具体的示例中,基于所述订单-供应商匹配语义表达特征向量,确定是否向所述备选供应商推送所述待推送订单信息的过程,包括:将所述订单-供应商匹配语义表达特征向量通过分类器以得到分类结果,所述分类结果用于表示是否向所述备选供应商推送所述待推送订单信息。也就是说,在本申请的技术方案中,待推送订单和备选供应商之间的匹配问题被转化为语义理解+语义特征交互+分类判断的三阶段模型,这样利用所述分类器来确定最终是否向所述备选供应商推送所述待推送订单信息。通过这样的方式,对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配,以替换现有的预定规则的匹配方案,这样通过语义理解和匹配的方式,来提高自动推单的精准度和适配度。
相应地,在一个具体示例中,如图8所示,基于所述订单-供应商匹配语义表达特征向量,确定是否向所述备选供应商推送所述待推送订单信息,包括:S1341,对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行前向传播信息保留融合以得到校正特征向量;S1342,基于所述校正特征向量对所述订单-供应商匹配语义表达特征向量进行特征分布校正以得到优化订单-供应商匹配语义表达特征向量;以及,S1343,将所述优化订单-供应商匹配语义表达特征向量通过分类器以得到分类结果,所述分类结果用于表示是否向所述备选供应商推送所述待推送订单信息。
应可以理解,分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题,对于多分类问题(multi-class classification),同样也可以用逻辑回归或SVM,只是需要多个二分类来组成多分类,但这样容易出错且效率不高,常用的多分类方法有Softmax分类函数。
更具体地,在步骤S1342中,基于所述校正特征向量对所述订单-供应商匹配语义表达特征向量进行特征分布校正以得到优化订单-供应商匹配语义表达特征向量,包括:计算所述校正特征向量和所述订单-供应商匹配语义表达特征向量之间的按位置点乘以得到所述优化订单-供应商匹配语义表达特征向量。应可以理解,按位置点乘是一种逐元素相乘的操作,按位置点乘将两个向量的对应位置的元素相乘,得到一个新的向量,新向量的每个元素都是原始向量对应位置元素的乘积。具体来说,如果有两个向量A和B,两个向量A和B的长度相同,分别为n,按位置点乘的结果向量C的每个元素Ci可以通过以下计算得到:
Ci=Ai*Bi
其中,Ai是向量A的第i个元素,Bi是向量B的第i个元素,Ci是结果向量C的第i个元素。按位置点乘操作可以用于在向量空间中对两个向量的特征进行逐元素的相乘,从而得到一个新的向量,用于优化订单-供应商匹配语义表达特征向量。
特别地,在本申请的技术方案中,所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量分别表达所述待推送订单的文本语义特征表达和备选供应商的文本语义特征表达,因所述待推送订单和所述备选供应商的文本描述来自于不同的文本数据源且两者在文本描述和表达层面存在诸多特异性,因此,所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量在高维语义特征空间中的特征表达上也会存在较为显著的差异,导致所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量的语义关联特征分布存在不对齐。
这样,在融合所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量得到所述订单-供应商匹配语义表达特征向量,并将所述订单-供应商匹配语义表达特征向量通过分类器进行分类回归时,所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量的各自不对齐的语义关联特征分布在模型的前向传播时会产生信息损失,影响所述订单-供应商匹配语义表达特征向量的分类结果的准确性。
基于此,本申请的申请人对所述待推送订单语义编码特征向量,例如记为V1和所述备选供应商语义编码特征向量,例如记为V2进行前向传播信息保留融合,以得到校正特征向量V
在本申请一个具体的示例中,对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行前向传播信息保留融合以得到校正特征向量,包括:以如下融合优化公式对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行前向传播信息保留融合以得到所述校正特征向量;其中,所述融合优化公式为:
其中,V1是所述待推送订单语义编码特征向量,V2是所述备选供应商语义编码特征向量,<<s和>>s分别表示将特征向量左移s位和右移s位,round为取整函数,是所述待推送订单语义编码特征向量V1和所述备选供应商语义编码特征向量V2的所有特征值的均值,||·||1表示特征向量的一范数,d(V1,V2)是所述待推送订单语义编码特征向量V1和所述备选供应商语义编码特征向量V2之间的距离,且log为以2为底的对数函数,⊕和θ分别表示按位置加法和按位置减法,α和β为加权超参数,V是所述校正特征向量。
这里,针对所述待推送订单语义编码特征向量V1和所述备选供应商语义编码特征向量V2在网络模型中的前向传播过程中,由于融合和回归操作产生的在向量尺度上的浮点分布误差和信息损失,通过从均一化信息角度来引入向量的逐位位移操作,来平衡和标准化前向传播过程中的量化误差和信息损失,并通过在融合之前重塑特征参数的分布来引入分布多样性,由此以扩大信息熵的方式进行信息保留(retention)。这样,通过对所述校正特征向量V′对所述订单-供应商匹配语义表达特征向量进行点乘加权,就可以减少所述订单-供应商匹配语义表达特征向量的信息损失,从而提升其通过分类器得到的分类结果的准确性。
应可以理解,前向传播信息保留融合是一种将待推送订单语义编码特征向量和备选供应商语义编码特征向量进行融合的方法,以得到校正特征向量。这种融合方法可以帮助捕捉订单和供应商之间的语义关系,从而提高订单-供应商匹配的准确性和效果。融合优化公式的具体形式可能因具体问题而异,但通常会考虑将待推送订单语义编码特征向量和备选供应商语义编码特征向量进行加权融合,以保留两者之间的重要信息。这样可以综合考虑订单和供应商的特征,并生成一个更全面的校正特征向量。校正特征向量的作用是对订单-供应商匹配的语义表达特征向量进行特征分布校正,从而优化匹配的结果。通过融合订单和供应商的语义编码特征向量,校正特征向量可以更好地捕捉订单和供应商之间的语义关系,提高匹配的准确性和效果。
综上,基于本申请实施例的基于大数据的系统对接自动推单方法被阐明,其可以对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配,以替换现有的预定规则的匹配方案,这样通过语义理解和匹配的方式,来提高自动推单的精准度和适配度。
图9为根据本申请实施例的基于大数据的系统对接自动推单系统100的框图。如图9所示,根据本申请实施例的基于大数据的系统对接自动推单系统100,包括:待推送订单信息采集模块110,用于从电商平台的订单数据库中获取待推送订单信息,其中,所述待推送订单信息包括订单号、商品信息和收货信息;备选供应商的文本描述采集模块120,用于获取备选供应商的文本描述;以及,语义分析匹配模块130,用于对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息。
这里,本领域技术人员可以理解,上述基于大数据的系统对接自动推单系统100中的各个模块的具体功能和操作已经在上面参考图1到图8的基于大数据的系统对接自动推单方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的基于大数据的系统对接自动推单系统100可以实现在各种无线终端中,例如具有基于大数据的系统对接自动推单算法的服务器等。在一个示例中,根据本申请实施例的基于大数据的系统对接自动推单系统100可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该基于大数据的系统对接自动推单系统100可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该基于大数据的系统对接自动推单系统100同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该基于大数据的系统对接自动推单系统100与该无线终端也可以是分立的设备,并且该基于大数据的系统对接自动推单系统100可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
图10为根据本申请实施例的基于大数据的系统对接自动推单方法的应用场景图。如图10所示,在该应用场景中,首先,从电商平台的订单数据库中获取待推送订单信息(例如,图10中所示意的D1),以及,备选供应商的文本描述(例如,图10中所示意的D2),其中,所述待推送订单信息包括订单号、商品信息和收货信息,然后,将所述待推送订单信息和所述备选供应商的文本描述输入至部署有基于大数据的系统对接自动推单算法的服务器中(例如,图10中所示意的S),其中,所述服务器能够使用所述基于大数据的系统对接自动推单算法对所述待推送订单信息和所述备选供应商的文本描述进行处理以得到用于表示是否向所述备选供应商推送所述待推送订单信息的分类结果。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
上面是对本发明的说明,而不应被认为是对其的限制。尽管描述了本发明的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本发明的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本发明范围内。应当理解,上面是对本发明的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本发明由权利要求书及其等效物限定。

Claims (10)

1.一种基于大数据的系统对接自动推单方法,其特征在于,包括:
从电商平台的订单数据库中获取待推送订单信息,其中,所述待推送订单信息包括订单号、商品信息和收货信息;
获取备选供应商的文本描述;以及
对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息。
2.根据权利要求1所述的基于大数据的系统对接自动推单方法,其特征在于,对所述待推送订单信息和所述备选供应商的文本描述进行语义分析和匹配以确定是否向所述备选供应商推送所述待推送订单信息,包括:
对所述待推送订单信息进行语义理解以得到待推送订单语义编码特征向量;
对所述备选供应商的文本描述进行语义理解以得到备选供应商语义编码特征向量;
对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行语义匹配以得到订单-供应商匹配语义表达特征向量;以及
基于所述订单-供应商匹配语义表达特征向量,确定是否向所述备选供应商推送所述待推送订单信息。
3.根据权利要求2所述的基于大数据的系统对接自动推单方法,其特征在于,对所述待推送订单信息进行语义理解以得到待推送订单语义编码特征向量,包括:
对所述待推送订单信息进行数据清洗、格式转化和分词处理以得到待推送订单描述词的序列;以及
将所述待推送订单描述词的序列通过包含ALBert模型和文本卷积神经网络模型的语义编码器以得到所述待推送订单语义编码特征向量。
4.根据权利要求3所述的基于大数据的系统对接自动推单方法,其特征在于,将所述待推送订单描述词的序列通过包含ALBert模型和文本卷积神经网络模型的语义编码器以得到所述待推送订单语义编码特征向量,包括:
使用所述ALBert模型将所述待推送订单描述词的序列转化为待推送订单描述词特征向量的序列;以及
将所述待推送订单描述词特征向量的序列排列为词特征矩阵后通过所述文本卷积神经网络模型以得到所述待推送订单语义编码特征向量。
5.根据权利要求4所述的基于大数据的系统对接自动推单方法,其特征在于,对所述备选供应商的文本描述进行语义理解以得到备选供应商语义编码特征向量,包括:
对所述备选供应商的文本描述进行数据清洗、格式转化和分词处理以得到备选供应商描述词的序列;以及
将所述备选供应商描述词的序列通过包含word2vec模型和BiLSTM模型的语义编码器以得到所述备选供应商语义编码特征向量。
6.根据权利要求5所述的基于大数据的系统对接自动推单方法,其特征在于,将所述备选供应商描述词的序列通过包含word2vec模型和BiLSTM模型的语义编码器以得到所述备选供应商语义编码特征向量,包括:
使用所述word2vec模型将所述备选供应商描述词的序列转化为备选供应商描述词嵌入向量的序列;以及
将所述备选供应商描述词嵌入向量的序列通过所述BiLSTM模型进行基于全局的上下文语义编码以得到所述备选供应商语义编码特征向量。
7.根据权利要求6所述的基于大数据的系统对接自动推单方法,其特征在于,对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行语义匹配以得到订单-供应商匹配语义表达特征向量,包括:
使用级联函数对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行特征交互式理解以得到所述订单-供应商匹配语义表达特征向量;
其中,所述级联函数为:
f(Xi,Xj)=Relu(Wf[θ(Xi),φ(Xj)])
其中,Wf,θ(Xi)和φ(Xj)均表示对输入进行点卷积、Relu为激活函数,[]表示拼接操作,Xi为所述待推送订单语义编码特征向量中各个位置的特征值,Xj为所述备选供应商语义编码特征向量中各个位置的特征值。
8.根据权利要求7所述的基于大数据的系统对接自动推单方法,其特征在于,基于所述订单-供应商匹配语义表达特征向量,确定是否向所述备选供应商推送所述待推送订单信息,包括:
对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行前向传播信息保留融合以得到校正特征向量;
基于所述校正特征向量对所述订单-供应商匹配语义表达特征向量进行特征分布校正以得到优化订单-供应商匹配语义表达特征向量;以及
将所述优化订单-供应商匹配语义表达特征向量通过分类器以得到分类结果,所述分类结果用于表示是否向所述备选供应商推送所述待推送订单信息。
9.根据权利要求8所述的基于大数据的系统对接自动推单方法,其特征在于,对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行前向传播信息保留融合以得到校正特征向量,包括:
以如下融合优化公式对所述待推送订单语义编码特征向量和所述备选供应商语义编码特征向量进行前向传播信息保留融合以得到所述校正特征向量;
其中,所述融合优化公式为:
其中,V1是所述待推送订单语义编码特征向量,V2是所述备选供应商语义编码特征向量,<<s和>>s分别表示将特征向量左移s位和右移s位,round为取整函数,是所述待推送订单语义编码特征向量V1和所述备选供应商语义编码特征向量V2的所有特征值的均值,‖·‖1表示特征向量的一范数,d(V1,V2)是所述待推送订单语义编码特征向量V1和所述备选供应商语义编码特征向量V2之间的距离,且log为以2为底的对数函数,/>和/>分别表示按位置加法和按位置减法,α和β为加权超参数,V′是所述校正特征向量。
10.根据权利要求9所述的基于大数据的系统对接自动推单方法,其特征在于,基于所述校正特征向量对所述订单-供应商匹配语义表达特征向量进行特征分布校正以得到优化订单-供应商匹配语义表达特征向量,包括:
计算所述校正特征向量和所述订单-供应商匹配语义表达特征向量之间的按位置点乘以得到所述优化订单-供应商匹配语义表达特征向量。
CN202310904310.5A 2023-07-21 2023-07-21 基于大数据的系统对接自动推单方法 Active CN116977021B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310904310.5A CN116977021B (zh) 2023-07-21 2023-07-21 基于大数据的系统对接自动推单方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310904310.5A CN116977021B (zh) 2023-07-21 2023-07-21 基于大数据的系统对接自动推单方法

Publications (2)

Publication Number Publication Date
CN116977021A true CN116977021A (zh) 2023-10-31
CN116977021B CN116977021B (zh) 2024-04-30

Family

ID=88470703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310904310.5A Active CN116977021B (zh) 2023-07-21 2023-07-21 基于大数据的系统对接自动推单方法

Country Status (1)

Country Link
CN (1) CN116977021B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190114691A1 (en) * 2017-10-16 2019-04-18 Anthony Zakula Systems and methods for document to order conversion
CN109902215A (zh) * 2019-02-28 2019-06-18 深圳市天宗元科技有限公司 一种交易匹配的方法及系统
US20200160258A1 (en) * 2018-11-16 2020-05-21 Texas State University Automatically build a manufacturing supply chain for handling a production work order
CN111597820A (zh) * 2020-05-11 2020-08-28 北京理工大学 Ict供应链招投标项目与企业产品实体匹配方法
CN111861178A (zh) * 2020-07-13 2020-10-30 北京嘀嘀无限科技发展有限公司 服务匹配模型的训练方法、服务匹配方法、设备及介质
CN113283525A (zh) * 2021-06-07 2021-08-20 郑健青 一种基于深度学习的图像匹配方法
CN113487629A (zh) * 2021-07-07 2021-10-08 电子科技大学 一种基于结构化场景和文本描述的图像属性编辑方法
CN114565429A (zh) * 2022-02-22 2022-05-31 哈尔滨工程大学 一种基于语义图模型的智能供应商匹配方法
CN114693215A (zh) * 2022-04-06 2022-07-01 平安普惠企业管理有限公司 采购请求处理方法、装置、计算机设备及存储介质
CN115049461A (zh) * 2022-06-29 2022-09-13 杭州卓壹网络技术有限公司 基于多平台全域信息的电子商务信用评估方法及其系统
CN116010713A (zh) * 2023-03-27 2023-04-25 日照职业技术学院 基于云计算的创新创业平台服务数据处理方法及系统
CN116150535A (zh) * 2023-02-20 2023-05-23 南京泛娱科技有限公司 一种企业网站建设推广平台及方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190114691A1 (en) * 2017-10-16 2019-04-18 Anthony Zakula Systems and methods for document to order conversion
US20200160258A1 (en) * 2018-11-16 2020-05-21 Texas State University Automatically build a manufacturing supply chain for handling a production work order
CN109902215A (zh) * 2019-02-28 2019-06-18 深圳市天宗元科技有限公司 一种交易匹配的方法及系统
CN111597820A (zh) * 2020-05-11 2020-08-28 北京理工大学 Ict供应链招投标项目与企业产品实体匹配方法
CN111861178A (zh) * 2020-07-13 2020-10-30 北京嘀嘀无限科技发展有限公司 服务匹配模型的训练方法、服务匹配方法、设备及介质
CN113283525A (zh) * 2021-06-07 2021-08-20 郑健青 一种基于深度学习的图像匹配方法
CN113487629A (zh) * 2021-07-07 2021-10-08 电子科技大学 一种基于结构化场景和文本描述的图像属性编辑方法
CN114565429A (zh) * 2022-02-22 2022-05-31 哈尔滨工程大学 一种基于语义图模型的智能供应商匹配方法
CN114693215A (zh) * 2022-04-06 2022-07-01 平安普惠企业管理有限公司 采购请求处理方法、装置、计算机设备及存储介质
CN115049461A (zh) * 2022-06-29 2022-09-13 杭州卓壹网络技术有限公司 基于多平台全域信息的电子商务信用评估方法及其系统
CN116150535A (zh) * 2023-02-20 2023-05-23 南京泛娱科技有限公司 一种企业网站建设推广平台及方法
CN116010713A (zh) * 2023-03-27 2023-04-25 日照职业技术学院 基于云计算的创新创业平台服务数据处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘帅: "中文文本类智能问答系统的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》, 15 May 2021 (2021-05-15), pages 138 - 1574 *

Also Published As

Publication number Publication date
CN116977021B (zh) 2024-04-30

Similar Documents

Publication Publication Date Title
CN110472090B (zh) 基于语义标签的图像检索方法以及相关装置、存储介质
CN112100387B (zh) 用于文本分类的神经网络系统的训练方法及装置
CN111553759A (zh) 一种产品信息推送方法、装置、设备及存储介质
CN110009430B (zh) 作弊用户检测方法、电子设备及计算机可读存储介质
CN110413786B (zh) 基于网页文本分类的数据处理方法、智能终端及存储介质
CN109598517B (zh) 商品通关处理、对象的处理及其类别预测方法和装置
CN102193936A (zh) 一种数据分类的方法及装置
CN109948735B (zh) 一种多标签分类方法、系统、装置及存储介质
CN112199536A (zh) 一种基于跨模态的快速多标签图像分类方法和系统
CN113837308B (zh) 基于知识蒸馏的模型训练方法、装置、电子设备
CN111461164B (zh) 样本数据集的扩容方法及模型的训练方法
CN113591866B (zh) 基于db与crnn的特种作业证件检测方法及系统
CN107239532B (zh) 数据挖掘方法及装置
CN116911929B (zh) 基于大数据的广告服务终端及方法
CN114612921B (zh) 表单识别方法、装置、电子设备和计算机可读介质
CN111523421A (zh) 基于深度学习融合各种交互信息的多人行为检测方法及系统
CN114780831A (zh) 基于Transformer的序列推荐方法及系统
CN111522979B (zh) 图片排序推荐方法、装置、电子设备、存储介质
CN110751191A (zh) 一种图像的分类方法及系统
CN110929764A (zh) 图片审核方法和装置,电子设备及存储介质
CN107169830B (zh) 一种基于聚类pu矩阵分解的个性化推荐方法
CN110991247B (zh) 一种基于深度学习与nca融合的电子元器件识别方法
CN115294397A (zh) 一种分类任务的后处理方法、装置、设备及存储介质
CN110321565B (zh) 基于深度学习的实时文本情感分析方法、装置及设备
CN117078007A (zh) 一种融合尺度标签的多尺度风控系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant