CN112507215A - 资源列表的形成方法 - Google Patents
资源列表的形成方法 Download PDFInfo
- Publication number
- CN112507215A CN112507215A CN202011387015.XA CN202011387015A CN112507215A CN 112507215 A CN112507215 A CN 112507215A CN 202011387015 A CN202011387015 A CN 202011387015A CN 112507215 A CN112507215 A CN 112507215A
- Authority
- CN
- China
- Prior art keywords
- resource
- name
- list
- exchange value
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000005516 engineering process Methods 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims description 35
- 238000010586 diagram Methods 0.000 description 10
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 8
- 244000046052 Phaseolus vulgaris Species 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 235000015277 pork Nutrition 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 235000015278 beef Nutrition 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种资源列表的形成方法,该方法包括:获取原始资源列表,所述原始资源列表包含资源名称、资源交换值、资源宣传图片、资源介绍信息、备注信息;采用文字识别技术识别所述原始资源列表中的文字信息,提取所述文字信息中的资源名称以及资源交换值;根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联;根据目标排列方式将关联结果形成资源列表输出至显示界面。本申请旨在通过采用文字识别的方法提高获取资源列表的效率以及准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种资源列表的形成方法。
背景技术
随着互联网的发展,很多场景都需要用到资源列表,这就需要将原来纸质版的资源列表转换成电子版的。但在对资源列表中信息的录入往往是使用人工的方式进行。例如,线上商户通过收银或者自动化管理软件录入菜单信息时,使用人为操作的方式将菜单信息录入到菜单系统中。但是当存在大量的菜品需要录入时,采用人工录入菜单信息的方式不仅会耗费人力资源、效率低下,而且还极易出错。
发明内容
本申请实施例通过提供一种资源列表的形成方法,旨在提高菜单的录入效率以及降低录入的错误率。
为实现上述目的,本申请一方面提供一种资源列表的形成方法,所述资源列表的形成方法包括以下步骤:
获取原始资源列表,所述原始资源列表包含资源名称、资源交换值、资源宣传图片、资源介绍信息、备注信息;
采用文字识别技术识别所述原始资源列表中的文字信息,提取所述文字信息中的资源名称以及资源交换值;
根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联;
根据目标排列方式将关联结果形成资源列表输出至显示界面。
可选地,所述根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联的步骤,包括:
获取所述资源名称的数量值;
当所述资源名称的数量值为一时,则将所述资源名称以及所述资源名称对应的资源交换值进行关联;
当所述资源名称的数量值大于一时,则根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联。
可选地,当所述资源名称的数量值大于一时,则根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联的步骤,包括:
获取每一所述资源名称在所述资源列表中的第一位置,以及每一所述资源交换值在所述资源列表的第二位置;
根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值;
将所述资源名称与所述资源名称对应的所述资源交换值进行关联。
可选地,所述根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值的步骤,包括:
获取所述第一位置与所述第二位置之间的连接字符;
当所述第一位置与所述第二位置之间的连接字符为一对一连接时,则确定每一与所述资源名称对应连接的资源交换值为所述资源名称对应的所述资源交换值;
可选地,所述根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值的步骤,包括:
若不存在所述连接字符,则获取所述每一所述第一位置之间的垂直距离、每一所述第一位置与每一所述第二位置之间的水平偏移信息以及所述第一位置与所述第二位置的整体位置关系;
根据所述垂直距离、所述水平偏移信息以及所述整体位置关系确定所述第一位置与所述第二位置的位置绑定关系,根据所述位置绑定关系确定每一与所述资源名称对应的资源交换值为所述资源名称对应的所述资源交换值。
可选地,所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤之前,包括:
判断所述资源名称是否正确;
若所述资源名称正确,则执行所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤。
可选地,所述判断所述资源名称是否正确的步骤,包括:
划分所述资源名称,得到子资源名称;
获取所述子资源名称的向量;
当所述资源名称存在多个子资源名称时,连接各所述子资源名称的向量,形成总向量;
获取词库向量,若所述词库向量存在向量与所述总向量长度一致并且向量之间的余弦值在预设余弦值范围,则判断所述资源名称正确。
可选地,所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤,包括:
获取目标排列方式;
根据所述目标排列方式对所述资源名称以及所述资源交换值进行排列;
剔除排列结果中不符合所述目标排列方式的资源名称以及资源交换值,以形成资源列表;
将所述资源列表输出至显示界面。
可选地,所述采用文字识别技术识别所述原始资源列表中的文字信息,提取所述文字信息中的资源名称以及资源交换值的步骤,包括:
获取所述文字信息中的关键字;
根据所述关键字提取所述原始资源列表的资源名称以及资源交换值。
可选地,所述根据所述关键字提取所述原始菜单的资源名称以及资源交换值的步骤之后,包括:
区分所述原始资源列表的资源名称以及所述资源交换值。
本申请提出了一种资源列表的形成方法,该方法通过获取原始资源列表,进而识别所述原始资源列表中的文字信息,对所述文字信息进行筛选,提取所述文字信息中包含的资源名称以及资源交换值,将所述资源名称与资源交换值进行关联,得到了原始资源列表中资源名称以及所述资源名称对应的资源交换值信息。由此,即可获得原始菜单中的资源名称以及资源交换值信息,不需要再通过人工的方式进行一一录入,减少了人力资源的损耗,提高了资源列表形成的效率以及准确率。
附图说明
图1是本申请实施例方案涉及的资源列表形成系统的终端结构示意图;
图2为本申请资源列表的形成方法一实施例的流程示意图;
图3为本申请资源列表的形成方法又一实施例的流程示意图;
图4为本申请资源列表的形成方法另一实施例的流程示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例的主要解决方案是:获取原始资源列表,所述原始资源列表包含资源名称、资源交换值、资源宣传图片、资源介绍信息、备注信息;采用文字识别技术识别所述原始资源列表中的文字信息,提取所述文字信息中的资源名称以及资源交换值;根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联;根据目标排列方式将关联结果形成资源列表输出至显示界面。
由于现有技术中,在把纸质版的资源列表转换成电子版本时,往往采用的是人工录入的方式实现纸质版到电子版的转换。但是对于某些行业来说,其销售的资源是需要定期更换的,例如餐饮行业需要定期更换纸质菜单吸引顾客,服装行业随着季节的变化需要购进当季的衣服,因此常常需要更换资源名称以及资源交换值。当需要录入大量的资源名称以及资源交换值信息时,使用人工的方法进行录入,不仅录入的效率低且容易出错,耗费大量人力资源。
本申请提供了一种资源列表形成装置,所述资源列表形成装置包括:摄像头、显示界面、文字识别系统等。所述摄像头用于拍摄所述原始菜单(纸质版菜单),将其生成图片。如图1所示,图1是本申请实施例方案涉及的资源列表形成装置的终端结构示意图。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。可选的网络接口1004可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、遥控器、音频电路、WiFi模块、检测器等等。当然,所述终端还可配置陀螺仪、气压计、湿度计、温度传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及资源列表形成程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的资源列表形成程序,并执行以下操作:
获取原始菜单;
识别所述原始菜单的文字信息,基于所述文字信息提取所述原始菜单的资源名称以及资源交换值;
将所述资源名称以及所述资源交换值进行匹配,形成电子菜单。
本申请实施例还提供一种资源列表的形成方法。
参照图2,图2为本申请的一实施例,在本实施例中,所述资源列表的形成方法包括:
步骤S10,获取原始资源列表,所述原始资源列表包含资源名称、资源交换值、资源宣传图片、资源介绍信息、备注信息;
所述原始资源列表包含资源名称、资源交换值、资源宣传图片、资源介绍信息、备注信息等形成的列表,其格式具体可为纸质版本。在各个行业中,原始资源列表的形式有多种,例如在餐饮行业,原始资源列表可以为原始菜单(纸质菜单),则原始资源列表中包含的资源名称、资源交换值、资源宣传图片、资源介绍信息、备注信息对于餐饮行业来说则相当菜品名称、价格、以及菜品图片、菜品介绍、备注信息,其中,所述备注信息可以为店名、当前的优惠活动等信息;对于服装行业,则所述原始资源列表可以为进货清单,则所述资源名称、资源交换值、资源宣传图片、资源介绍信息、备注信息则可以为衣物名称、进货价格、衣物图片、衣物材质信息、制造商。在本申请的实施例中,以餐饮行业中的原始菜单作为原始资源列表进行说明。
步骤S20,采用文字识别技术识别所述原始资源列表中的文字信息,提取所述文字信息中的资源名称以及资源交换值;
在本申请中,可使用光学字符识别(OCR)对所述原始菜单中文字信息进行识别,获得所述原始菜单中的文字信息。所述文字信息既包括在所述原始菜单中以文字形式呈现的文字信息,也包括在原始菜单图片中的文字信息,例如在展示店铺环境的图片的右下方添加了店铺的地址时,同样地,将对所述文字信息进行识别。其中所述原始菜单还包括菜品名称所对应的宣传图片,在所述宣传图片中还可包括所述对应菜品的介绍,例如使用的食材、亨饪时间等。在获取原始菜单的文字信息时,会跳过对所述原始菜单中的宣传图片的扫描。因为菜品的宣传图片往往出现在对应的菜品名称以及价格附近,当所述宣传图片包含的信息中存在与所述菜品名称相近的解释信息时,存在无法识别是所述菜品名称的备注信息还是菜品名称的情况,对识别原始菜单中菜品名称的准确性造成影响。
在完成所述原始菜单的文字信息识别后,需要提取所述文字信息中的菜品名称以及价格。即将所述原始菜单中除菜品名称以及价格外的其它信息进行过滤,只保留原始菜单中的菜品名称以及价格。
所述采用文字识别技术识别所述原始资源列表中的文字信息,提取所述文字信息中的资源名称以及资源交换值的步骤,包括:
步骤S21,获取所述文字信息中的关键字;
步骤S22,根据所述关键字提取所述原始资源列表的资源名称以及资源交换值的内容及位置。
所述关键字为预先设置需要在所述原始菜单中进行识别的文字,例如“店铺地址”“联系电话”“优惠活动”“今日特色”等文字信息。在使用文字识别技术识别所述文字信息后,提取文字信息中的关键字,对文字信息中包含关键字的内容进行剔除。例如在原始菜单中若识别到所述关键字包含“店铺地址”时,则将所述“店铺地址”执行删除操作。进一步地,识别所述关键词之后包含的内容信息,将所述内容信息一并进行剔除。例如,在识别到关键字包含“店铺地址:深圳市宝安区翻身路22号”时,进一步地将所述店铺地址之后的内容进行删除,以从所述原始菜单中排除干扰信息。
所述根据所述关键字提取所述原始菜单的资源名称以及资源交换值的步骤之后,包括:
步骤S23,区分所述原始资源列表的资源名称以及所述资源交换值。
在完成所述原始菜单中的菜品名称以及价格的提取后,还需区分所述菜品名称以及价格。其区分的手段可为:分别获取提取的菜品名称以及价格的ASCII码,根据ASCII码区分所述菜品名称以及价格。
步骤S30,根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联。
在使用文字识别技术识别所述原始菜单后,根据从原始菜单中筛选的菜品名称以及价格,对所述菜品名称以及价格进行一一匹配。可以理解的是,在原始菜单中,所述菜品名称与价格之间的关联关系呈现一定的规律特征,例如,每个菜品名称对应一个价格,所述菜品名称与价格在所述原始菜单中的位置可为左右分布或上下排列。则可以根据所述原始菜单中的位置关系找到所述菜品名称的价格并将其与菜品名称进行关联。
步骤S40,根据目标排列方式将关联结果形成资源列表输出至显示界面。
在提取出所述菜品名称以及价格后,对所述菜品名称以及与所述菜品名称关联的价格按照目标排序方式进行剔除,并将剔除结果显示于界面。所述目标排序方式可为左右分布或上下排列。即对已经进行关联的菜品名称以及价格按照预设的排序方式进一步地进行筛选,剔除不满足目标排序方式的菜品名称以及价格。
本申请提出了一种资源列表的形成方法,该方法通过获取原始菜单信息,进而识别所述原始菜单中的文字信息,对所述文字信息进行筛选,进而获取所述文字信息中包含的资源名称以及与资源名称对应的资源交换值信息,将资源名称与资源交换值信息一一进行匹配,得到了原始菜单中资源名称以及所述资源名称对应的资源交换值信息。由此,即可获得原始菜单中的资源名称以及资源交换值信息,不需要再通过人工的方式进行一一录入,减少了人力资源的损耗,提高了资源列表形成的效率以及准确率。
参照图3,图3为本申请的又一实施例流程示意图,所述将所述资源名称以及所述资源交换值进行匹配,形成电子菜单的步骤,包括:
步骤S31,获取所述资源名称的数量值;
步骤S32,当所述资源名称的数量值为一时,则将所述资源名称以及所述资源名称对应的资源交换值进行关联;
步骤S33,当所述资源名称的数量值大于一时,则根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联。
使用文字识别技术识别原始菜单中包含的菜品名称后,获取所述原始菜单中包含的菜品名称的个数(数量值),当所述菜品名称的数量值为1时,即原始菜单中只有一个菜品名称,则将识别到的价格与所述菜品名称进行关联;若识别到所述菜品名称存在多个,即在原始菜单中存在多种菜品,则需根据获取到的菜品名称以及价格在原始菜单中的位置,来实现菜品名称和价格的一一对应。
当所述资源名称的数量值大于一时,则根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联的步骤,包括:
步骤S331,获取每一所述资源名称在所述资源列表中的第一位置,以及每一所述资源交换值在所述资源列表的第二位置;
步骤S332,根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值;
步骤S333,将所述资源名称与所述资源名称对应的所述资源交换值进行关联。
在原始菜单中菜品名称存在多个,原始菜单中与菜品名称对应的价格也存在多个时,可通过获取每一所述菜品名称所在的第一位置以及每一价格所在的第二位置,得到所述第一位置与第二位置之间的对应关系,进而将获取的菜品名称与价格进行一一对应。
所述根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值的步骤,包括:
步骤S3321,获取所述第一位置与所述第二位置之间的连接字符;
步骤S3322,当所述第一位置与所述第二位置之间的连接字符为一对一连接时,则确定每一与所述资源名称对应连接的资源交换值为所述资源名称对应的所述资源交换值。
在本申请中对所述原始菜单进行扫描时,将所述菜品名称所在模块的区域称其为第一位置,将所述价格所在模块的区域称为第二位置。所述第一位置与第二位置的连接可通过连接字符的方式进行,即在第一位置中包含的菜品名称与第二位置中所包含的菜品价格之间可通过连接字符的方式进行匹配。所述连接字符包括“*****”“………”等字符。在识别原始菜单中菜品名称所在的第一位置以及所述价格所在的第二位置后,进一步地获取第一位置以及所述第二位置之间的连接符号,根据所述连接符号确定菜品名称与价格之间的匹配规则,进而确定所述在原始菜单中所有菜品名称所对应的价格。
所述根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值的步骤,包括:
步骤S3323,若不存在所述连接字符,则获取所述每一所述第一位置之间的垂直距离、每一所述第一位置与每一所述第二位置之间的水平偏移信息以及所述第一位置与所述第二位置的整体位置关系;
步骤S3324,根据所述垂直距离、所述水平偏移信息以及所述整体位置关系确定所述第一位置与所述第二位置的位置绑定关系,根据所述位置绑定关系确定每一与所述资源名称对应的资源交换值为所述资源名称对应的所述资源交换值。
当所述第一位置与第二位置间不包含连接字符时,根据第一位置之间的垂直距离、第一位置与第二位置之间的水平偏移信息以及第一位置与第二位置的整体区域信息进行资源绑定。
本实施例的具体实施过程可举例如下:在原始菜单中菜品名称和菜品价格之间的对应关系如下表1所示:
热菜 | |
上汤豆苗 | 15元 |
卤猪肉 | 30元 |
小炒肉 | 18元 |
表1
在通过文字识别技术进行识别时,菜品的类别—热菜,也一并识别出来。参照表1可以看出所述菜品名称之间的距离包括热菜与上汤豆苗之间垂直距离、上汤豆苗与卤猪肉之间的垂直距离、卤猪肉与小炒肉之间的垂直距离,可以理解的是,在菜单中通常菜品的类别与菜品名称之间的距离大于菜品名称与菜品名称之间的距离,即热菜与上汤豆苗之间垂直距离大于上汤豆苗与卤猪肉之间的垂直距离,则可根据所述垂直距离初步区分菜品名称与菜名的类别,避免了热菜直接与上汤豆苗的价格进行匹配,导致最后识别的价格全部匹配错误的问题。
进一步地,获取所述第一位置与第二位置之间的水平偏移信息则可确定处于第一位置的菜品名称水平位置存在对应的处于第二位置的价格。例如,当热菜与价格之间进行匹配时,由于热菜与价格之间的偏移值(垂直距离/水平距离)大于预设偏移值,则确定第一个价格不是热菜所对应的价格,所述预设偏移值的计算如下:预设偏移值=垂直距离/水平距离*系数,所述垂直距离为在原始菜单中菜品名称之间的垂直距离,所述水平距离为在原始菜单中菜品名称与价格之间的水平距离,预设偏移值的取值范围可为0~0.4,其中处于0时则代表菜品名称和价格之间的关系为水平对齐,所述系数根据原始菜单中菜品名称与价格之间的位置关系而确定。则进一步地获取上汤豆苗与第一个价格之间的水平偏移信息,确定第一个价格对应的菜品名称为上汤豆苗,依次类推,即可确定各个菜品名称与其对应的价格信息。降低菜品名称与价格之间匹配错误的概率。
所述在显示所述菜品名称时,同时对应显示菜品名称的价格。可理解的是,在原始菜单中获取排序第一的菜品名称及位置信息,对应价格区域内同一水平或者垂直区域内的第一价格及位置信息,即可确定第一位置区域的各菜品名称与第二位置区域的各价格之间的对应规则,则按照所述规则将菜品名称与价格一一显示。
例如,在原始菜单中的菜品名称与价格的关系为左右排版(菜品名称在原始菜单的左边、价格在原始菜单的右边),则在进行文字识别时,首先获取所有菜品名称区域的位置以及价格区域的位置信息,进而获取排序第一的菜品名称以及其对应的价格之间的位置关系,根据获取的位置关系即可确定所有菜品名称与其对应的价格之间的位置关系,以此进行菜品名称与价格之间的匹配。
进一步地,所述原始菜单中菜品名称与价格之间的匹配规则为多对一时,即多个菜品名称对应着同一个价格时,通常在这种情况下,将根据菜单价格的第二位置,确定某一条价格对应的菜单名称的第一位置的区域。属于对应区域内的所有菜品名称均为该第二位置的价格。这种情况下,在原始菜单中各个菜品名称与价格之间的匹配规则为多对一,识别所述各个第二位置的价格以及该价格下的菜品名称(一个价格对应多个菜品名称),即可得到原始菜单中的各个菜品名称与价格之间的对应关系。
在本实施例中,通过获取原始菜单中菜品名称与价格的区域位置,通过菜品名称所在的第一位置与价格所在的第二位置区域之间的连接字符或者位置关系确定菜品名称与价格之间的匹配规则,进而将菜品名称与价格之间一一对应,不需要再使用人员将所述菜品名称与价格进行对照录入,提高了将原始菜单生成电子菜单时录入的效率。
基于上述实施例,提出本申请的又一实施例,所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤之前,包括:
步骤S50,判断所述资源名称是否正确;
步骤S60,若所述资源名称正确,则执行所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤。
获取菜品名称以及价格后,需检测通过文字识别技术识别的菜品名称是否存在错误。其识别方式是通过将所述菜品名称与存储器中语料库中存储的菜品名称进行比对,所述语料库存储有各种菜品名称,当识别到语料库中存在从原始菜单中提取出来的菜品名称时,则判断所述菜品名称识别正确,将所述菜品名称与价格以一一对应的方式输出至显示界面。
所述判断所述资源名称是否正确的步骤,包括:
步骤S51,划分所述资源名称,得到子资源名称;
步骤S52,获取所述子资源名称的向量;
步骤S53,当所述资源名称存在多个子资源名称时,连接各所述子资源的向量,形成总向量;
步骤S54,获取词库向量,若所述词库向量存在向量与所述总向量长度一致并且向量之间的余弦值在预设余弦值范围,则判断所述资源名称正确。
在本申请中,所述子资源名称即为划分的资源名称的分词,即当识别出来的菜品名称的字符串长度超出预设阈值时,可将所述菜品名称进行划分,得到菜品名称的多个分词,进而获取每个分词的向量,再对其进行连接形成总向量,通过与词库中存在的向量进行比较,判断词库的向量中是否存在与所述总向量长度一致并且向量之间的余弦值在预设余弦值范围内的向量,若存在,则确定通过所述文字识别的菜品名称正确。例如,识别出一个菜品是由两个词向量拼接起来的:红烧牛肉,将其发送至内置的分词软件进行分词,得到红烧牛肉的分词为【红烧】、【牛肉】,假设每个分词的向量v1=【0,1,0,2,0.23】,v2=【0,23,0.01,0.11】连接两个分词的向量形成【0.1,0.2,0.23,0.23,0.01,0.11】,与菜名库中的已经提取了特征的向量进行比较,判断识别的菜品名称是否正确,【v1,v2】*【v3,v4】(语料库)=norm(v1*v3+v2*v4),其中norm表示对所述向量进行归一化,若余弦值为0.9,满足预设余弦值范围[0.8,1],则证明所述菜品名称识别正确。
在本实施例中,将使用文字识别技术识别的菜品名称与语料库中存储的菜品名称进行比对,判断识别的菜品名称是否正确,提高了菜品名称识别的准确性。
参照图4,图4为本申请另一实施例流程示意图。所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤,包括:
步骤S41,获取目标排列方式;
步骤S42,根据所述目标排列方式对所述资源名称以及所述资源交换值进行排列;
步骤S43,剔除排列结果中不符合所述目标排列方式的资源名称以及资源交换值,以形成资源列表;
步骤S44,将所述资源列表输出至显示界面。
在对所述菜品名称与价格进行关联后,按照目标排列方式显示提取的菜品名称以及与菜品名称对应的价格。所述目标排列方式具体可为识别出来的菜品名称以及对应的价格的排列方式,例如左右分布或上下排列,通过将所述菜品名称与价格按照目标排列方式进行排列,进一步筛选原始菜单中菜品名称对应的价格信息,以实现提取原始菜单中的菜品名称以及其对应的价格。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照本申请实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器指令系统,使得通过计算机或其他可编程数据处理设备的处理器执行的上述指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本申请的可选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求解释为包括可选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种资源列表的形成方法,其特征在于,所述资源列表的形成方法包括:
获取原始资源列表,所述原始资源列表包含资源名称、资源交换值、资源宣传图片、资源介绍信息、备注信息;
采用文字识别技术识别所述原始资源列表中的文字信息,提取所述文字信息中的资源名称以及资源交换值;
根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联;
根据目标排列方式将关联结果形成资源列表输出至显示界面。
2.如权利要求1所述的资源列表的形成方法,其特征在于,所述根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联的步骤,包括:
获取所述资源名称的数量值;
当所述资源名称的数量值为一时,则将所述资源名称以及所述资源名称对应的资源交换值进行关联;
当所述资源名称的数量值大于一时,则根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联。
3.如权利要求2所述的资源列表的形成方法,其特征在于,当所述资源名称的数量值大于一时,则根据所述资源名称以及所述资源交换值在所述原始资源列表中的位置对所述资源名称以及所述资源交换值进行关联的步骤,包括:
获取每一所述资源名称在所述资源列表中的第一位置,以及每一所述资源交换值在所述资源列表的第二位置;
根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值;
将所述资源名称与所述资源名称对应的所述资源交换值进行关联。
4.如权利要求3所述的资源列表的形成方法,其特征在于,所述根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值的步骤,包括:
获取所述第一位置与所述第二位置之间的连接字符;
当所述第一位置与所述第二位置之间的连接字符为一对一连接时,则确定每一与所述资源名称对应连接的资源交换值为所述资源名称对应的所述资源交换值。
5.如权利要求4所述的资源列表的形成方法,其特征在于,所述根据所述第一位置与所述第二位置之间的匹配规则,确定每一所述资源名称对应的所述资源交换值的步骤,包括:
若不存在所述连接字符,则获取所述每一所述第一位置之间的垂直距离、每一所述第一位置与每一所述第二位置之间的水平偏移信息以及所述第一位置与所述第二位置的整体位置关系;
根据所述垂直距离、所述水平偏移信息以及所述整体位置关系确定所述第一位置与所述第二位置的位置绑定关系,根据所述位置绑定关系确定每一与所述资源名称对应的资源交换值为所述资源名称对应的所述资源交换值。
6.如权利要求1所述的资源列表的形成方法,其特征在于,所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤之前,包括:
判断所述资源名称是否正确;
若所述资源名称正确,则执行所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤。
7.如权利要求6所述的资源列表的形成方法,其特征在于,所述判断所述资源名称是否正确的步骤,包括:
划分所述资源名称,得到子资源名称;
获取所述子资源名称的向量;
当所述资源名称存在多个子资源名称时,连接各所述子资源名称的向量,形成总向量;
获取词库向量,若所述词库向量存在向量与所述总向量长度一致并且向量之间的余弦值在预设余弦值范围,则判断所述资源名称正确。
8.如权利要求1所述的资源列表的形成方法,其特征在于,所述根据目标排列方式将匹配结果形成资源列表输出至显示界面的步骤,包括:
获取目标排列方式;
根据所述目标排列方式对所述资源名称以及所述资源交换值进行排列;
剔除排列结果中不符合所述目标排列方式的资源名称以及资源交换值,以形成资源列表;
将所述资源列表输出至显示界面。
9.如权利要求1所述的资源列表的形成方法,其特征在于,所述采用文字识别技术识别所述原始资源列表中的文字信息,提取所述文字信息中的资源名称以及资源交换值的步骤,包括:
获取所述文字信息中的关键字;
根据所述关键字提取所述原始资源列表的资源名称以及资源交换值。
10.如权利要求8所述的资源列表的形成方法,其特征在于,所述根据所述关键字提取所述原始菜单的资源名称以及资源交换值的步骤之后,包括:
区分所述原始资源列表的资源名称以及所述资源交换值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011387015.XA CN112507215A (zh) | 2020-12-01 | 2020-12-01 | 资源列表的形成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011387015.XA CN112507215A (zh) | 2020-12-01 | 2020-12-01 | 资源列表的形成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112507215A true CN112507215A (zh) | 2021-03-16 |
Family
ID=74969083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011387015.XA Pending CN112507215A (zh) | 2020-12-01 | 2020-12-01 | 资源列表的形成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507215A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005122288A (ja) * | 2003-10-14 | 2005-05-12 | Nec Fielding Ltd | 料理展示装置及び料理展示方法 |
WO2017168243A1 (en) * | 2016-03-29 | 2017-10-05 | Gurunavi, Inc. | Food menu generation and translation |
CN108038559A (zh) * | 2017-12-11 | 2018-05-15 | 张馨月 | 点菜系统 |
CN108614811A (zh) * | 2016-12-09 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 一种数据分析方法及装置 |
CN110110577A (zh) * | 2019-01-22 | 2019-08-09 | 口碑(上海)信息技术有限公司 | 识别菜名的方法及装置、存储介质、电子装置 |
CN111192346A (zh) * | 2019-12-26 | 2020-05-22 | 科大讯飞股份有限公司 | 电子菜单生成方法、装置和设备 |
CN111666418A (zh) * | 2020-04-23 | 2020-09-15 | 北京三快在线科技有限公司 | 文本重生成方法、装置、电子设备和计算机可读介质 |
-
2020
- 2020-12-01 CN CN202011387015.XA patent/CN112507215A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005122288A (ja) * | 2003-10-14 | 2005-05-12 | Nec Fielding Ltd | 料理展示装置及び料理展示方法 |
WO2017168243A1 (en) * | 2016-03-29 | 2017-10-05 | Gurunavi, Inc. | Food menu generation and translation |
CN108614811A (zh) * | 2016-12-09 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 一种数据分析方法及装置 |
CN108038559A (zh) * | 2017-12-11 | 2018-05-15 | 张馨月 | 点菜系统 |
CN110110577A (zh) * | 2019-01-22 | 2019-08-09 | 口碑(上海)信息技术有限公司 | 识别菜名的方法及装置、存储介质、电子装置 |
CN111192346A (zh) * | 2019-12-26 | 2020-05-22 | 科大讯飞股份有限公司 | 电子菜单生成方法、装置和设备 |
CN111666418A (zh) * | 2020-04-23 | 2020-09-15 | 北京三快在线科技有限公司 | 文本重生成方法、装置、电子设备和计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107798571B (zh) | 恶意地址/恶意订单的识别系统、方法及装置 | |
US20220405321A1 (en) | Product auditing in point-of-sale images | |
US9311339B2 (en) | Terminal apparatus, information processing system, and information processing method | |
CN105574089B (zh) | 知识图谱的生成方法及装置、对象对比方法及装置 | |
US11328504B2 (en) | Image-processing device for document image, image-processing method for document image, and storage medium on which program is stored | |
US20150199777A1 (en) | System and method for restaurant menuing | |
CN112598434B (zh) | 一种数据采集方法、装置及商品发布方法 | |
CN110751498A (zh) | 一种物品推荐方法和系统 | |
CN106547808A (zh) | 图片更新方法、类目排序方法及装置 | |
WO2018092333A1 (ja) | 購買情報活用システム及び購買情報活用方法、及びプログラム | |
CN111292153B (zh) | 信息推荐方法、装置、系统和存储介质 | |
US20140046760A1 (en) | Methods, systems, and computer readable media for identifying qualifying consumer offers | |
US20080170792A1 (en) | Apparatus and Method for Identifying Marker | |
US20150348100A1 (en) | Search engine server that searches data based on criteria included in an electronic record received from a computing device | |
CN109255290B (zh) | 菜单识别方法、装置、电子设备及存储介质 | |
CN112613367A (zh) | 票据信息文本框获取方法、系统、设备及存储介质 | |
CN112507215A (zh) | 资源列表的形成方法 | |
KR20120109265A (ko) | 방송연계 큐알코드를 이용한 식품정보 제공시스템 및 제공방법 | |
JPWO2019181441A1 (ja) | 情報処理装置、及び制御方法 | |
CN115937341A (zh) | 一种基于ai技术的电商海报生成系统及其生成方法 | |
CN111860263B (zh) | 信息录入方法、装置及计算机可读存储介质 | |
CN113570427A (zh) | 一种提取识别线上或系统商品特征信息的系统 | |
CN112950167A (zh) | 设计服务匹配方法、装置、设备及存储介质 | |
CN115080686A (zh) | 直播平台的商品指代消解方法及装置、计算设备 | |
JP2001318941A (ja) | 情報処理装置および情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |