CN110826318A - 物流信息识别的方法、设备、计算机设备和存储介质 - Google Patents

物流信息识别的方法、设备、计算机设备和存储介质 Download PDF

Info

Publication number
CN110826318A
CN110826318A CN201910972036.9A CN201910972036A CN110826318A CN 110826318 A CN110826318 A CN 110826318A CN 201910972036 A CN201910972036 A CN 201910972036A CN 110826318 A CN110826318 A CN 110826318A
Authority
CN
China
Prior art keywords
information
waybill
algorithm
waybill information
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910972036.9A
Other languages
English (en)
Inventor
何丽
李仙果
蒋播
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Number Chain Technology Co Ltd
Original Assignee
Zhejiang Number Chain Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Number Chain Technology Co Ltd filed Critical Zhejiang Number Chain Technology Co Ltd
Priority to CN201910972036.9A priority Critical patent/CN110826318A/zh
Publication of CN110826318A publication Critical patent/CN110826318A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了物流信息识别的方法、设备、计算机设备和存储介质,其中,获取物流的运单信息,根据标准分词算法和条件随机场词法分词算法将该运单信息进行双重切分,得到该运单信息的切分位置,根据条件随机场词法分词算法,对该运单信息进行词性标注,得到该运单信息的词性分系列,根据逻辑判断算法,得到该运单信息相对于预设模板的逻辑判断值,根据该切分位置、该词性分析列和该逻辑判断值对该运单信息进行解析,得到与预设模板匹配的第一匹配信息,解决了物流信息识别准确度低的问题,提高了物流的运单信息识别度,提高了货物配送和回单审核的效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。

Description

物流信息识别的方法、设备、计算机设备和存储介质
技术领域
本申请涉及图像处理技术领域,特别是涉及物流信息识别的方法、设备、计算机设备和存储介质。
背景技术
随着电子商务的发展,越来越多的用户选择通过互联网进行网上购物,从而产生了大量的物流信息,在物流运输的过程中,存在物流发货信息录入和物流单据的回单审核两个步骤。在物流发货信息录入的过程中,用户需要通过多次复制粘贴来填写收件人地址、电话等关键信息,在填写时,操作繁琐,花费的时间较长;在物流单据的回单审核过程中,运营人员需要对司机上传的回单图片进行人工审核,查看回单时间及车牌号,人力成本较高,处理效率较低,且随着物流技术的快速发展,单纯的人工审核无法满足业务快速发展的需求。
在相关技术中,已有物流公司通过使用jieba分词算法提供了物流信息自动识别的功能,但对于没有分隔符、所有的信息连在一起的非结构化的物流文本信息,该算法的识别准确度较低,影响货物配送和回单审核的效率。
针对相关技术中,物流信息识别准确度低的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中,物流信息识别准确度低的问题,本发明提供了物流信息识别的方法、设备、计算机设备和存储介质,以至少解决上述问题。
根据本发明的一个方面,提供了一种物流信息识别的方法,所述方法包括:
获取物流的运单信息;
根据标准分词算法和条件随机场词法分词算法将所述运单信息进行双重切分,得到所述运单信息的切分位置,根据条件随机场词法分词算法,对所述运单信息进行词性标注,得到所述运单信息的词性分系列,根据逻辑判断算法,得到所述运单信息相对于预设模板的逻辑判断值;
根据所述切分位置、所述词性分析列和所述逻辑判断值对所述运单信息进行解析,得到与所述预设模板匹配的第一匹配信息。
在其中一个实施例中,在根据所述切分位置、所述词性分析列和所述逻辑判断值对所述运单信息进行解析之前,所述方法还包括:
在地址解析算法检测到所述运单信息存在地址信息的情况下,通过所述地址解析算法提取所述运单信息中的省、市、区和街道信息;
根据所述词性标注的相对位置信息,得到所述地址信息的切分断点;
根据所述词性分析列、所述切分断点和所述逻辑判断值对所述运单信息进行解析,得到与所述预设模板匹配的第二匹配信息。
在其中一个实施例中,所述通过地址解析算法提取运单信息中的省、市、区和街道信息包括:
在所述地址解析算法检测所述地址信息缺失省、市或者区信息中至少一个的情况下,通过地址解析算法根据地址数据库,将所述地址信息补全。
在其中一个实施例中,在所述获取运单信息之后,所述方法还包括:
根据所述运单信息的分隔符对所述运单信息进行切分,得到第一切分文本;
在所述第一切分文本的数量与所述预设模板中目标文本数量不一致的情况下,通过标准分词算法和条件随机场词法分词算法将所述第一切分文本重新进行切分,得到第二切分文本;
将所述第二切分文本与所述预设模板进行匹配,得到与所述预设模板匹配的第三匹配信息。
在其中一个实施例中,在所述根据标准分词算法和条件随机场词法分词算法将所述运单信息进行双重切分之前,所述方法包括:
在所述运单信息为图片格式的情况下,根据光子字符识别算法,识别所述运单信息中的文字,将所述运单信息转化为文本格式。
在其中一个实施例中,
接收设定信息,根据所述设定信息配置所述预设模板的目标文本类型和目标文本数量。
根据本发明的另一个方面,提供了一种物流信息识别的设备,所述设备包括获取模块、处理模块和解析模块:
所述获取模块,用于获取物流的运单信息;
所述处理模块,用于根据标准分词算法和条件随机场词法分词算法将所述运单信息进行双重切分,得到所述运单信息的切分位置,根据条件随机场词法分词算法,对所述运单信息进行词性标注,得到所述运单信息的词性分系列,根据逻辑判断算法,得到所述运单信息相对于预设模板的逻辑判断值;
所述解析模块,用于根据所述切分位置、所述词性分析列和所述逻辑判断值对所述运单信息进行解析,得到与所述预设模板匹配的第一匹配信息。
在其中一个实施例中,所述处理模块包括提取单元、切分单元和匹配单元:
所述提取单元,用于在地址解析算法检测到所述运单信息存在地址信息的情况下,通过所述地址解析算法提取所述运单信息中的省、市、区和街道信息;
所述切分单元,用于根据所述词性标注的相对位置信息,得到所述地址信息的切分断点;
所述匹配单元,用于根据所述词性分析列、所述切分断点和所述逻辑判断值对所述运单信息进行解析,得到与所述预设模板匹配的第二匹配信息。
根据本发明的另一个方面,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一所述方法。
根据本发明的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一所述方法。
通过本发明,获取物流的运单信息,根据标准分词算法和条件随机场词法分词算法将该运单信息进行双重切分,得到该运单信息的切分位置,根据条件随机场词法分词算法,对该运单信息进行词性标注,得到该运单信息的词性分系列,根据逻辑判断算法,得到该运单信息相对于预设模板的逻辑判断值,根据该切分位置、该词性分析列和该逻辑判断值对该运单信息进行解析,得到与预设模板匹配的第一匹配信息,解决了物流信息识别准确度低的问题,提高了物流的运单信息识别度,提高了货物配送和回单审核的效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
附图说明
图1是根据本发明实施例的物流信息识别的方法的应用环境图;
图2是根据本发明实施例的物流信息识别的方法的流程图一;
图3是根据本发明实施例的地址信息识别的方法的流程图;
图4是根据本发明实施例的物流信息识别的方法的流程图二;
图5是根据本发明实施例的物流信息识别的设备的结构框图一;
图6是根据本发明实施例的物流信息识别的设备的结构框图二;
图7是根据本发明实施例的物流信息识别的方法的流程图三;
图8是根据本发明实施例的物流信息识别的方法的流程图四;
图9是根据本发明实施例的预设模板的界面的示意图;
图10是根据本发明实施例的获取运单信息的界面的示意图一;
图11是根据本发明实施例的物流信息识别的界面的示意图一;
图12是根据本发明实施例的获取运单信息的界面的示意图二;
图13是根据本发明实施例的物流信息识别的界面的示意图二;
图14是根据本发明实施例的物流信息识别的方法的流程图五;
图15是根据本发明实施例的物流信息识别的方法的流程图六。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的物流信息识别的方法,可以应用于如图1所示的应用环境中,图1是根据本发明实施例的物流信息识别的方法的应用环境图,如图1所示。其中,终端102通过网络与服务器104进行通信,服务器104可以获取来自于终端102的物流的运单信息,终端102或者服务器104根据标准分词算法和条件随机场词法分词算法将该运单信息进行双重切分,得到该运单信息的切分位置,终端102或者服务器104根据条件随机场词法分词算法,对该运单信息进行词性标注,得到该运单信息的词性分系列,终端102或者服务器104根据逻辑判断算法,得到该运单信息的逻辑判断值,终端102或者服务器104根据该切分位置、该词性分析列和该逻辑判断值对该运单信息进行解析,得到与终端102预设模板匹配的匹配信息。其中,终端102可以是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,提供了一种物流信息识别的方法,图2是根据本发明实施例的物流信息识别的方法的流程图一,如图2所示,该方法包括如下步骤:
步骤S202,获取物流的运单信息,其中,服务器可以主动获取来自终端的运单信息,也可以接受终端上传的运单信息,运单信息包括物流运输时需要的收件人地址、联系方式等信息,也包括司机在物流运输结束之后,上传至服务器的回单信息,例如回单时间、车牌号等。
步骤S204,根据标准分词算法和条件随机场词法分词算法将该运单信息进行双重切分,得到该运单信息的切分位置,根据条件随机场词法分词算法,对该运单信息进行词性标注,得到该运单信息的词性分系列,根据逻辑判断算法,得到运单信息相对于预设模板的逻辑判断值,其中,标准分词算法可以为HanLP标准分词算法,条件随机场词法分词算法可以为HanLP条件随机场(HanLP Conditional Random Field,简称为HanLP CRF),该HanLP标准分词算法和HanLP CRF算法对运单信息进行切分,将运单信息中没有分隔符的文字以词语为依据进行分割,同时标注该分割的位置;词性标注为根据词语含义与上下文内容,对词语的类别进行标注,在自然语言处理中,词语的类别包括体词、谓词、虚词、代词和感叹词等;逻辑判断算法判断切分后的运单信息与预设模板中的目标文本类型是否一致,并生成逻辑判断值,逻辑判断值为1或者0,1为运单信息与预设模板中的目标文本类型一致,0为不一致。
步骤S206,根据该切分位置、该词性分析列和该逻辑判断值对该运单信息进行解析,得到与预设模板匹配的第一匹配信息,在通过标准分词算法和条件随机场词法分词算法对运单信息进行双重切分之后,对切分之后的运单信息进行解析,例如,可以将切分后的文本“2019年9月18日,15942456261,王山”与预设模板[1,2,3]进行匹配,其中1为姓名,2为联系方式,3为日期,则第一匹配信息为[1.王山,2.15942456261,3.2019年9月18日]。
通过上述步骤,通过标准分词算法和条件随机场词法分词算法将该运单信息进行双重切分,再将切分后的运单信息与预设模板进行匹配,相关技术中使用单一算法对运单信息进行分词,出现分词错误的几率较高,识别的准确度较低,本实施例采用该双重切分解决了物流运单信息识别度较低的问题,提高了货物订单和回单中运单信息的识别准确度,提高了货物配送和回单审核的效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
在一个实施例中,图3是根据本发明实施例的地址信息识别的方法的流程图,如图3所示,该方法包括如下步骤:
步骤S302,在地址解析算法检测该运单信息存在地址信息的情况下,通过该地址解析算法提取该运单信息中的省、市、区和街道信息,其中,地址解析可以通过地址解析算法CPCA实现。
步骤S304,根据该词性标注的相对位置信息,得到该地址信息的切分断点,其中,条件随机场词法分词算法会对切分后的运单信息进行词性标注,根据地址信息词性标注相对于其他词语的位置信息,得到地址信息的切分断点。
步骤S306,根据该词性分析列、该切分断点和该逻辑判断值对该运单信息进行解析,得到与该预设模板匹配的第二匹配信息。
通过上述步骤,根据地址解析算法对运单中的地址信息进行提取,得到切分后的、详细的地址信息,有利于物流运输过程中,对货物订单和回单中地址信息的快速识别,提高运输效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
在一个实施例中,在地址解析算法检测该地址信息缺失省、市或者区信息中至少一个的情况下,通过地址解析算法根据地址数据库,将该地址信息补全,其中,地址数据库为包含了全国省、市、区名称等信息的数据库,例如,在地址解析算法检测到地址为“杭州市萧山区宁围街道民和路945号”时,会将该地址补全为“浙江省杭州市萧山区宁围街道民和路945号”;在地址解析算法检测到地址为“浙江省萧山区宁围街道民和路945号”时,会将该地址补全为“浙江省杭州市萧山区宁围街道民和路945号”;在地址解析算法检测到地址为“浙江省杭州市宁围街道民和路945号”时,会将该地址补全为“浙江省杭州市萧山区宁围街道民和路945号”,本实施例中的地址补全也有利于物流运输时对货物订单和回单中地址信息的快速识别,提高运输效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
在一个实施例中,图4是根据本发明实施例的物流信息识别的方法的流程图二,如图4所示,该方法包括如下步骤:
步骤S402,根据运单信息的分隔符对该运单信息进行切分,得到第一切分文本,在运单信息含有分隔符的情况下,可以根据该分隔符,将该运单信息切分,并存储为列表与预设模板进行匹配,其中,分隔符可以为运单信息中的空格、逗号、分号等。
步骤S404,在该第一切分文本的数量与预设模板中目标文本数量不一致的情况下,通过标准分词算法和条件随机场词法分词算法将该第一切分文本重新进行切分,得到第二切分文本,在物流信息的分隔符缺失时,切分后的文本数量与预设模板中目标文本数量会出现不一致的情况,此时,即需要标准分词算法和条件随机场词法分词算法对该物流信息进行重新切分。
步骤S406,将该第二切分文本与该预设模板进行匹配,得到与该预设模板匹配的第三匹配信息。
通过上述步骤,在物流信息存在分隔符的情况下,可以根据分隔符将物流信息进行分词,在分词数量有误的情况下,再通过标准分词算法和条件随机场词法分词算法对该物流信息进行重新切分,简化了算法逻辑,提高了运单信息的识别效率。
在一个实施例中,在运单信息为图片格式的情况下,根据光子字符识别算法,识别该运单信息中的文字,将运单信息转化为文本格式,再通过标准分词算法和条件随机场词法分词算法对该物流信息进行解析,本实施例提供的方法可以有效处理图片格式的运单信息,增加了可以识别的运单信息格式,提高了运单信息的处理效率。
在一个实施例中,可以根据接收到的设定信息,设定模板中的目标文本类型和目标文本数量,其中,目标文本类型为预设模板包含的信息种类,例如,可以包含姓名、联系方式、地址、日期、车牌号等信息,目标文本数量为预设模板中信息种类的个数,例如,在预设模板包含姓名、联系方式和地址的情况下,目标文本个数为3。预设模板可以根据设定信息改变,使得预设模板可以适用于不同的场景,满足不同的用户需求。
应该理解的是,虽然图2至图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
对应于上述物流信息识别的方法,在本实施例中,还提供了一种物流信息识别的设备,该设备用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的设备较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
在一个实施例中,提供了一种物流信息识别的设备,图5是根据本发明实施例的物流信息识别的设备的结构框图一,如图5所示,包括:获取模块52、处理模块54和解析模块56,其中:
获取模块52,用于获取物流的运单信息;
处理模块54,用于根据标准分词算法和条件随机场词法分词算法将该运单信息进行双重切分,得到该运单信息的切分位置,根据条件随机场词法分词算法,对该运单信息进行词性标注,得到该运单信息的词性分系列,根据逻辑判断算法,得到该运单信息相对于预设模板的逻辑判断值;
解析模块56,用于根据该切分位置、该词性分析列和该逻辑判断值对该运单信息进行解析,得到与该预设模板匹配的第一匹配信息。
通过上述设备,处理模块54通过标准分词算法和条件随机场词法分词算法将该运单信息进行双重切分,解析模块56将切分后的运单信息与预设模板进行匹配,相关技术中使用单一算法对运单信息进行分词,出现分词错误的几率较高,识别的准确度较低,而采用该双重切分解决了物流运单信息识别度较低的问题,提高了货物订单和回单中运单信息的识别准确度,提高了货物配送和回单审核的效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
在一个实施例中,图6是根据本发明实施例的物流信息识别的设备的结构框图二,如图6所示,本发明的处理模块54包括:提取单元62、切分单元64和匹配单元66。
提取单元62,用于在地址解析算法检测到该运单信息存在地址信息的情况下,通过该地址解析算法提取该运单信息中的省、市、区和街道信息;
切分单元64,用于根据该词性标注的相对位置信息,得到该地址信息的切分断点;
匹配单元66,用于根据该词性分析列、该切分断点和该逻辑判断值对该运单信息进行解析,得到与该预设模板匹配的第二匹配信息。
通过上述设备,根据提取单元62中地址解析算法对运单中的地址信息进行提取,得到切分后的、详细的地址信息,有利于物流运输过程中,对货物订单和回单中地址信息的快速识别,提高运输效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
下面结合实际应用场景对本发明的实施例进行详细说明,在接收到的物流运单为结构化文本信息的情况下,图7是根据本发明实施例的物流信息识别的方法的流程图三,如图7所示,其中,结构化文本信息是指运单信息中含有分隔符,该方法包括如下步骤:
步骤S702,配置预设模板;
步骤S704,根据该运单信息中的分隔符将运单信息进行切分,存储在一个列表中;
步骤S706,将列表中的运单信息与预设模板进行匹配;
步骤S708,在运单信息中存在地址信息的情况下,通过CPCA算法提取省、市、区和街道信息,如果地址信息中的省、市、区信息有缺失,通过该CPCA算法进行补全;
步骤S710,在切分后的运单信息数量和预设模板中目标文本数量不一致的情况下,通过HanLP标准分词算法和HanLP CRF算法对运单信息重新切分。
通过上述步骤,在物流信息存在分隔符的情况下,可以根据分隔符将物流信息进行分词,在分词数量有误的情况下,再通过标准分词算法和条件随机场词法分词算法对该物流信息进行重新切分,简化了算法逻辑,提高了运单信息的识别效率,地址补全也有利于物流运输时对货物订单和回单中地址信息的快速识别,提高运输效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
在接收到的物流运单为非结构化文本信息的情况下,图8是根据本发明实施例的物流信息识别的方法的流程图四,非结构化文本信息是指运单信息中不含有分隔符,如图8所示,该方法包括如下步骤:
步骤S802,配置预设模板;
步骤S804,通过HanLP标准分词算法和HanLP CRF算法对运单信息双重切分和词性标注;
步骤S806,在运单信息中存在地址信息的情况下,通过CPCA算法提取省、市、区和街道信息;
步骤S808,通过词性标注的相对位置信息,得到地址信息的切分断点;
步骤S810,根据词性标注结果、地址信息的切分断点和数据格式的逻辑判断进行运单信息的解析。
通过上述步骤,标准分词算法和条件随机场词法分词算法将该运单信息进行双重切分,再将切分后的运单信息与预设模板进行匹配,相关技术中使用单一算法对运单信息进行分词,出现分词错误的几率较高,识别的准确度较低,而采用该双重切分解决了物流运单信息识别度较低的问题,提高了货物订单和回单中运单信息的识别准确度,提高了货物配送和回单审核的效率,对地址的解析有利于物流运输时对货物订单和回单中地址信息的快速识别,提高运输效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
通过终端或者服务器进行运单信息识别时,图9是根据本发明实施例的预设模板的界面的示意图,如图9所示,预设模板包括姓名、电话、单位、省市区和详细地址信息,图10是根据本发明实施例的获取运单信息的界面的示意图一,如图10所示,其中,运单信息为“王山杭州市萧山区传化大厦15942456261”,图11是根据本发明实施例的物流信息识别的界面的示意图一,如图11所示,在获取到运单信息为“王山杭州市萧山区传化大厦15942456261”的情况下,终端或者服务器通过标准分词算法和条件随机场词法分词算法,预设模板匹配到姓名、电话、省市区和详细地址的信息,并将运单信息中缺失的省信息补全。
通过终端或者服务器进行识别时,图12是根据本发明实施例的获取运单信息的界面的示意图二,如图12所示,其中,该运单信息为图片格式,包含地址、姓名、手机和其它无关信息,图13是根据本发明实施例的物流信息识别的界面的示意图二,如图13所示,在获取到图片格式的运单信息后,终端或者服务器通过OCR算法先提取图片中的文字,再通过标准分词算法和条件随机场词法分词算法,与预设模板进行匹配,得到图13中的匹配信息。
终端或者服务器进行运单信息识别时,在运单信息为图片格式的情况下,图14是根据本发明实施例的物流信息识别的方法的流程图五,如图14所示,该方法包括如下步骤:
步骤S1402,用户或者运营端配置预设模板;
步骤S1404,智能解析后端接收并存储预设模板,将预设模板对应的业务表单返回至业务系统后端;
步骤S1406,业务系统前端接收用户上传的图片格式的运单信息,并将运单信息发送至业务系统后端;
步骤S1408,业务系统后端调用算法平台的解析算法和解析参数;
步骤S1410,算法平台将图片格式的运单信息识别为文字,将识别后的运单信息和参数值返回至智能解析后端;
步骤S1412,智能解析后端将识别后的文字与业务表单中的字段进行匹配,将匹配后的业务表单内容返回至业务系统前端进行展示。
通过上述步骤,可以有效处理图片格式的运单信息,增加了可以识别的运单信息格式,提高了运单信息的处理效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
终端或者服务器进行运单信息识别时,在运单信息为文字格式的情况下,图15是根据本发明实施例的物流信息识别的方法的流程图六,如图15所示,该方法包括如下步骤:
步骤S1502,用户或者运营端配置预设模板;
步骤S1504,智能解析后端接收并存储预设模板,将预设模板对应的业务表单返回至业务系统后端;
步骤S1506,业务系统前端接收用户上传的文字格式的运单信息,并将运单信息发送至业务系统后端;
步骤S1508,业务系统后端调用解析算法和解析参数;
步骤S1510,算法平台解析运单信息,将识别后的运单信息和参数值返回至智能解析后端;
步骤S1512,智能解析后端将识别后的运单信息与业务表单中的字段进行匹配,将匹配后的业务表单内容返回至业务系统前端进行展示。
通过上述步骤,提高了货物订单和回单中运单信息的识别准确度,提高了货物配送和回单审核的效率,同时可以为后期的物流服务、业务发展规划,提供数据支撑。
在一个实施例中,提供了一种计算机设备。该计算机设备可以是服务器。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储物流信息数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种物流信息识别方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种物流信息识别的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述各实施例提供的物流信息识别的方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各个实施例提供的物流信息识别的方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种物流信息识别的方法,其特征在于,所述方法包括:
获取物流的运单信息;
根据标准分词算法和条件随机场词法分词算法将所述运单信息进行双重切分,得到所述运单信息的切分位置,根据条件随机场词法分词算法,对所述运单信息进行词性标注,得到所述运单信息的词性分系列,根据逻辑判断算法,得到所述运单信息相对于预设模板的逻辑判断值;
根据所述切分位置、所述词性分析列和所述逻辑判断值对所述运单信息进行解析,得到与所述预设模板匹配的第一匹配信息。
2.根据权利要求1所述的方法,其特征在于,在根据所述切分位置、所述词性分析列和所述逻辑判断值对所述运单信息进行解析之前,所述方法还包括:
在地址解析算法检测到所述运单信息存在地址信息的情况下,通过所述地址解析算法提取所述运单信息中的省、市、区和街道信息;
根据所述词性标注的相对位置信息,得到所述地址信息的切分断点;
根据所述词性分析列、所述切分断点和所述逻辑判断值对所述运单信息进行解析,得到与所述预设模板匹配的第二匹配信息。
3.根据权利要求2所述的方法,其特征在于,所述通过地址解析算法提取运单信息中的省、市、区和街道信息包括:
在所述地址解析算法检测所述地址信息缺失省、市或者区信息中至少一个的情况下,通过地址解析算法根据地址数据库,将所述地址信息补全。
4.根据权利要求1所述的方法,其特征在于,在所述获取运单信息之后,所述方法还包括:
根据所述运单信息的分隔符对所述运单信息进行切分,得到第一切分文本;
在所述第一切分文本的数量与所述预设模板中目标文本数量不一致的情况下,通过标准分词算法和条件随机场词法分词算法将所述第一切分文本重新进行切分,得到第二切分文本;
将所述第二切分文本与所述预设模板进行匹配,得到与所述预设模板匹配的第三匹配信息。
5.根据权利要求1所述的方法,其特征在于,在所述根据标准分词算法和条件随机场词法分词算法将所述运单信息进行双重切分之前,所述方法包括:
在所述运单信息为图片格式的情况下,根据光子字符识别算法,识别所述运单信息中的文字,将所述运单信息转化为文本格式。
6.根据权利要求1至5任一项所述的方法,其特征在于,
接收设定信息,根据所述设定信息配置所述预设模板的目标文本类型和目标文本数量。
7.一种物流信息识别的设备,其特征在于,所述设备包括获取模块、处理模块和解析模块:
所述获取模块,用于获取物流的运单信息;
所述处理模块,用于根据标准分词算法和条件随机场词法分词算法将所述运单信息进行双重切分,得到所述运单信息的切分位置,根据条件随机场词法分词算法,对所述运单信息进行词性标注,得到所述运单信息的词性分系列,根据逻辑判断算法,得到所述运单信息相对于预设模板的逻辑判断值;
所述解析模块,用于根据所述切分位置、所述词性分析列和所述逻辑判断值对所述运单信息进行解析,得到与所述预设模板匹配的第一匹配信息。
8.根据权利要求7所述的设备,其特征在于,所述处理模块包括提取单元、切分单元和匹配单元:
所述提取单元,用于在地址解析算法检测到所述运单信息存在地址信息的情况下,通过所述地址解析算法提取所述运单信息中的省、市、区和街道信息;
所述切分单元,用于根据所述词性标注的相对位置信息,得到所述地址信息的切分断点;
所述匹配单元,用于根据所述词性分析列、所述切分断点和所述逻辑判断值对所述运单信息进行解析,得到与所述预设模板匹配的第二匹配信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201910972036.9A 2019-10-14 2019-10-14 物流信息识别的方法、设备、计算机设备和存储介质 Pending CN110826318A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910972036.9A CN110826318A (zh) 2019-10-14 2019-10-14 物流信息识别的方法、设备、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910972036.9A CN110826318A (zh) 2019-10-14 2019-10-14 物流信息识别的方法、设备、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110826318A true CN110826318A (zh) 2020-02-21

Family

ID=69549149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910972036.9A Pending CN110826318A (zh) 2019-10-14 2019-10-14 物流信息识别的方法、设备、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110826318A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348442A (zh) * 2020-11-10 2021-02-09 东方航空物流股份有限公司 一种物流服务方法及平台
CN114298631A (zh) * 2021-12-27 2022-04-08 北京来也网络科技有限公司 基于rpa及ai的物流信息处理方法、装置、设备及介质
CN112883728B (zh) * 2021-03-02 2024-04-09 岭东核电有限公司 基于核电试验的试验工序信息展示方法和装置

Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477518A (zh) * 2009-01-09 2009-07-08 昆明理工大学 基于条件随机场的旅游领域命名实体识别方法
CN102279875A (zh) * 2011-06-24 2011-12-14 成都市华为赛门铁克科技有限公司 钓鱼网站的识别方法和装置
CN103473289A (zh) * 2013-08-30 2013-12-25 深圳市华傲数据技术有限公司 一种通信地址补全的装置及方法
CN104484790A (zh) * 2014-12-26 2015-04-01 清华大学深圳研究生院 一种物流业务的地址匹配方法及装置
CN104537062A (zh) * 2014-12-29 2015-04-22 北京牡丹电子集团有限责任公司数字电视技术中心 一种地址信息抽取方法及系统
CN104850538A (zh) * 2015-05-08 2015-08-19 裴克铭管理咨询(上海)有限公司 基于规则和统计模型的中文地址复合分词技术
US20160283583A1 (en) * 2014-03-14 2016-09-29 Tencent Technology (Shenzhen) Company Limited Method, apparatus, and storage medium for text information processing
CN106909611A (zh) * 2017-01-11 2017-06-30 北京众荟信息技术股份有限公司 一种基于文本信息抽取的酒店自动匹配方法
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN107577674A (zh) * 2017-10-09 2018-01-12 北京神州泰岳软件股份有限公司 识别企业名称的方法及装置
CN108121700A (zh) * 2017-12-21 2018-06-05 北京奇艺世纪科技有限公司 一种关键词提取方法、装置及电子设备
CN108305050A (zh) * 2018-02-08 2018-07-20 贵州小爱机器人科技有限公司 报案信息及服务需求信息的提取方法、装置、设备及介质
CN108764803A (zh) * 2018-06-06 2018-11-06 珠海格力电器股份有限公司 物流信息的显示方法、装置和存储介质
CN109145169A (zh) * 2018-07-26 2019-01-04 浙江省测绘科学技术研究院 一种基于统计分词的地址匹配方法
CN109213990A (zh) * 2017-07-05 2019-01-15 菜鸟智能物流控股有限公司 一种特征提取方法、装置和服务器
CN109255564A (zh) * 2017-07-13 2019-01-22 菜鸟智能物流控股有限公司 一种取件点地址推荐方法及装置
CN109284948A (zh) * 2017-07-20 2019-01-29 菜鸟智能物流控股有限公司 物流对象选择方法、物流对象选择装置和电子装置
CN109670843A (zh) * 2018-11-12 2019-04-23 平安科技(深圳)有限公司 投诉业务的数据处理方法、装置、计算机设备及存储介质
CN109740150A (zh) * 2018-12-20 2019-05-10 出门问问信息科技有限公司 地址解析方法、装置、计算机设备及计算机可读存储介质
CN109784235A (zh) * 2018-12-29 2019-05-21 广东益萃网络科技有限公司 纸质表单的自动录入方法、装置、计算机设备和存储介质
CN109933797A (zh) * 2019-03-21 2019-06-25 东南大学 基于Jieba分词及地址词库的地理编码方法和系统
CN110058838A (zh) * 2019-04-28 2019-07-26 腾讯科技(深圳)有限公司 语音控制方法、装置、计算机可读存储介质和计算机设备

Patent Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477518A (zh) * 2009-01-09 2009-07-08 昆明理工大学 基于条件随机场的旅游领域命名实体识别方法
CN102279875A (zh) * 2011-06-24 2011-12-14 成都市华为赛门铁克科技有限公司 钓鱼网站的识别方法和装置
CN103473289A (zh) * 2013-08-30 2013-12-25 深圳市华傲数据技术有限公司 一种通信地址补全的装置及方法
US20160283583A1 (en) * 2014-03-14 2016-09-29 Tencent Technology (Shenzhen) Company Limited Method, apparatus, and storage medium for text information processing
CN104484790A (zh) * 2014-12-26 2015-04-01 清华大学深圳研究生院 一种物流业务的地址匹配方法及装置
CN104537062A (zh) * 2014-12-29 2015-04-22 北京牡丹电子集团有限责任公司数字电视技术中心 一种地址信息抽取方法及系统
CN104850538A (zh) * 2015-05-08 2015-08-19 裴克铭管理咨询(上海)有限公司 基于规则和统计模型的中文地址复合分词技术
CN106909611A (zh) * 2017-01-11 2017-06-30 北京众荟信息技术股份有限公司 一种基于文本信息抽取的酒店自动匹配方法
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN109213990A (zh) * 2017-07-05 2019-01-15 菜鸟智能物流控股有限公司 一种特征提取方法、装置和服务器
CN109255564A (zh) * 2017-07-13 2019-01-22 菜鸟智能物流控股有限公司 一种取件点地址推荐方法及装置
CN109284948A (zh) * 2017-07-20 2019-01-29 菜鸟智能物流控股有限公司 物流对象选择方法、物流对象选择装置和电子装置
CN107577674A (zh) * 2017-10-09 2018-01-12 北京神州泰岳软件股份有限公司 识别企业名称的方法及装置
CN108121700A (zh) * 2017-12-21 2018-06-05 北京奇艺世纪科技有限公司 一种关键词提取方法、装置及电子设备
CN108305050A (zh) * 2018-02-08 2018-07-20 贵州小爱机器人科技有限公司 报案信息及服务需求信息的提取方法、装置、设备及介质
CN108764803A (zh) * 2018-06-06 2018-11-06 珠海格力电器股份有限公司 物流信息的显示方法、装置和存储介质
CN109145169A (zh) * 2018-07-26 2019-01-04 浙江省测绘科学技术研究院 一种基于统计分词的地址匹配方法
CN109670843A (zh) * 2018-11-12 2019-04-23 平安科技(深圳)有限公司 投诉业务的数据处理方法、装置、计算机设备及存储介质
CN109740150A (zh) * 2018-12-20 2019-05-10 出门问问信息科技有限公司 地址解析方法、装置、计算机设备及计算机可读存储介质
CN109784235A (zh) * 2018-12-29 2019-05-21 广东益萃网络科技有限公司 纸质表单的自动录入方法、装置、计算机设备和存储介质
CN109933797A (zh) * 2019-03-21 2019-06-25 东南大学 基于Jieba分词及地址词库的地理编码方法和系统
CN110058838A (zh) * 2019-04-28 2019-07-26 腾讯科技(深圳)有限公司 语音控制方法、装置、计算机可读存储介质和计算机设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
夏圆;张征;: "基于条件随机场的评价对象抽取", 计算机系统应用, no. 11, pages 254 - 259 *
潘华山;严馨;周枫;余正涛;郭剑毅;: "基于层叠条件随机场的高棉语分词及词性标注方法" *
潘华山;严馨;周枫;余正涛;郭剑毅;: "基于层叠条件随机场的高棉语分词及词性标注方法", 中文信息学报, no. 04, pages 110 - 116 *
赵卫锋;张勤;: "非结构化中文自然语言地址描述的自动识别", 计算机工程与应用, vol. 1, no. 23, pages 123 - 125 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348442A (zh) * 2020-11-10 2021-02-09 东方航空物流股份有限公司 一种物流服务方法及平台
CN112883728B (zh) * 2021-03-02 2024-04-09 岭东核电有限公司 基于核电试验的试验工序信息展示方法和装置
CN114298631A (zh) * 2021-12-27 2022-04-08 北京来也网络科技有限公司 基于rpa及ai的物流信息处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN110795919B (zh) 一种pdf文档中的表格抽取方法、装置、设备及介质
EP3855324A1 (en) Associative recommendation method and apparatus, computer device, and storage medium
CA3174601C (en) Text intent identifying method, device, computer equipment and storage medium
CN108595695B (zh) 数据处理方法、装置、计算机设备和存储介质
CN110826318A (zh) 物流信息识别的方法、设备、计算机设备和存储介质
CN109766072B (zh) 信息校验输入方法、装置、计算机设备和存储介质
CN111352907A (zh) 流水文件解析方法、装置、计算机设备和存储介质
CN112651236B (zh) 提取文本信息的方法、装置、计算机设备和存储介质
US11397756B2 (en) Data archiving method and computing device implementing same
CN110472219A (zh) 电子文件生成方法、装置、计算机设备和存储介质
CN111831920A (zh) 用户需求分析方法、装置、计算机设备及存储介质
CN109033427B (zh) 股票的筛选方法及装置、计算机设备及可读存储介质
CN114120299A (zh) 信息获取方法、装置、存储介质及设备
CN115438740A (zh) 一种多源数据的汇聚融合方法和系统
CN112988997A (zh) 智能客服的应答方法、系统、计算机设备及存储介质
CN112418813A (zh) 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质
CN111191153A (zh) 一种信息技术咨询服务展示装置
CN112749639B (zh) 模型训练方法、装置、计算机设备和存储介质
CN113268588A (zh) 文本摘要提取方法、装置、设备、存储介质及程序产品
CN109960752B (zh) 应用程序内的查询方法、装置、计算机设备和存储介质
CN114169331A (zh) 地址解析方法、装置、计算机设备和存储介质
CN115545976A (zh) 跨境商标注册方法、系统、装置及计算机可读存储介质
CN115455143A (zh) 一种文献处理方法及装置
CN113065360B (zh) 词语语义模型的构建方法、装置、计算机设备及存储介质
CN114328837A (zh) 序列标注方法、装置、计算机设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination