CN107169013A - 一种菜品信息的处理方法及装置 - Google Patents
一种菜品信息的处理方法及装置 Download PDFInfo
- Publication number
- CN107169013A CN107169013A CN201710209665.7A CN201710209665A CN107169013A CN 107169013 A CN107169013 A CN 107169013A CN 201710209665 A CN201710209665 A CN 201710209665A CN 107169013 A CN107169013 A CN 107169013A
- Authority
- CN
- China
- Prior art keywords
- dish
- library
- path
- dependency syntax
- dish element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 30
- 238000003672 processing method Methods 0.000 title abstract 2
- 238000000034 method Methods 0.000 claims abstract description 71
- 230000011218 segmentation Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 230000003190 augmentative effect Effects 0.000 claims 1
- 235000013311 vegetables Nutrition 0.000 abstract 7
- 235000013305 food Nutrition 0.000 description 32
- 239000000463 material Substances 0.000 description 20
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 16
- 240000003768 Solanum lycopersicum Species 0.000 description 16
- 244000046052 Phaseolus vulgaris Species 0.000 description 15
- 239000004615 ingredient Substances 0.000 description 13
- 235000019640 taste Nutrition 0.000 description 12
- 238000010411 cooking Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 235000013547 stew Nutrition 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 235000014347 soups Nutrition 0.000 description 3
- 235000002566 Capsicum Nutrition 0.000 description 2
- 239000006002 Pepper Substances 0.000 description 2
- 241000722363 Piper Species 0.000 description 2
- 235000016761 Piper aduncum Nutrition 0.000 description 2
- 235000017804 Piper guineense Nutrition 0.000 description 2
- 235000008184 Piper nigrum Nutrition 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 235000021332 kidney beans Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 235000012149 noodles Nutrition 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 235000002568 Capsicum frutescens Nutrition 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- -1 cooking methods Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供了一种菜品信息的处理方法及装置,其中的方法具体包括:确定待识别菜品的依存句法路径;利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。本申请实施例能够实现对于新菜品的菜品元素识别,进而提高菜品元素识别的成功率。
Description
技术领域
本申请涉及信息处理技术领域,特别是涉及一种菜品信息的处理方法及装置。
背景技术
随着信息技术的发展,菜品元素的识别得到了越来越多的应用。菜品元素的识别不仅可以对错综复杂的菜品名称进行结构化的解析识别,而且,经过解析识别后的菜品元素可以进行进一步的挖掘,对于构建用户画像等任务都有重要的意义。
现有一种菜品元素的识别方案,通常构建菜品元素的词库,这样,当有一个菜品需要被解析时,通过该菜品的名称所包含词汇与词库中各个词条的匹配,来识别该菜品中的各菜品元素。
发明人在实施本申请实施例的过程中发现,现有方案中菜品元素识别的成功率依赖于词库的容量,当有新菜品出现时,若词库中不含有该新菜品的名称所包含词汇,则识别不成功;因此,现有方案中菜品元素识别的成功率较低。
发明内容
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的菜品信息的处理方法及装置,能够实现对于新菜品的菜品元素识别,进而提高菜品元素识别的成功率。
为了解决上述问题,本申请实施例公开了一种菜品信息的处理方法,所述方法包括:
确定待识别菜品的依存句法路径;
利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
可选地,所述对所述依存句法路径对应的菜品元素进行识别,包括:
在基于菜品元素搭配的路径模板库中确定与所述依存句法路径相匹配的目标依存句法路径模板;
依据所述目标依存句法路径模板对应的菜品元素搭配关系,确定所述依存句法路径对应的菜品元素。
可选地,所述确定所述待识别菜品的依存句法路径,包括:
对所述待识别菜品名称进行分词和词性标注;
分别针对所述待识别菜品名称所包含的两个词汇,构建以所述两个词汇为首尾节点的依存句法路径。
可选地,通过如下步骤建立所述路径模板库:
针对菜品元素搭配库中各元素词汇搭配关系,获取预置菜品包含的、与所述元素词汇搭配关系相匹配的两个目标词汇;其中,所述元素词汇搭配关系用于表示属于不同菜品元素类别的两个词汇;
分别针对所述预置菜品所包含的两个目标词汇,构建以所述两个目标词汇为首尾节点的依存句法路径模板;
将所述依存句法路径模板保存至路径模板库;其中,所述路径模板库的菜品元素搭配关系与所述元素词汇搭配关系相匹配。
可选地,通过如下步骤获取所述元素词汇搭配关系:
获取多个菜品元素类别对应的菜品元素库;
将对应于不同菜品元素类别的菜品元素库中两个词汇进行搭配,以得到对应的元素词汇搭配关系。
可选地,通过如下步骤构建所述菜品元素库:
对预置菜品集合中预置菜品的名称进行分词和词性标注;
依据所述预置菜品的分词结果中各分词的词频,构建词频集合;
依据所述词频集合中各词汇所属的菜品元素类别,构建对应的菜品元素库。
可选地,所述方法还包括:
利用所述路径模板库,对所述预置菜品的依存句法路径对应的菜品元素进行识别;
依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
可选地,所述路径模板库用于存储依据菜品元素搭配关系得到的依存句法路径模板。
另一方面,本申请实施例公开了一种菜品信息的处理方法,所述方法包括:
获取待识别菜品;
利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库为依据路径模板库扩充得到。
可选地,所述路径模板库用于存储依据菜品元素搭配关系得到的依存句法路径模板。
可选地,通过如下步骤扩充得到所述菜品元素库:
利用所述路径模板库,对预置菜品集合中预置菜品的依存句法路径对应的菜品元素进行识别;
依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
可选地,所述方法还包括:
利用词向量模型,获取所述菜品元素库中词条的相似词条;
将所述相似词条扩充至所述菜品元素库中。
再一方面,本申请实施例公开了一种菜品信息的处理装置,所述装置包括:
路径确定模块,用于确定待识别菜品的依存句法路径;
菜品元素识别模块,用于利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
可选地,所述菜品元素识别模块包括:
模板确定子模块,用于在基于菜品元素搭配的路径模板库中确定与所述依存句法路径相匹配的目标依存句法路径模板;以及
菜品元素确定子模块,用于依据所述目标依存句法路径模板对应的菜品元素搭配关系,确定所述依存句法路径对应的菜品元素。
可选地,所述装置还包括:用于建立所述路径模板库的模板库建立模块;
所述模板库建立模块包括:
目标词汇获取子模块,用于针对菜品元素搭配库中各元素词汇搭配关系,获取预置菜品包含的、与所述元素词汇搭配关系相匹配的两个目标词汇;其中,所述元素词汇搭配关系用于表示属于不同菜品元素类别的两个词汇;
模板构建子模块,用于分别针对所述预置菜品所包含的两个目标词汇,构建以所述两个目标词汇为首尾节点的依存句法路径模板;以及
模板保存子模块,用于将所述依存句法路径模板保存至路径模板库;其中,所述路径模板库的菜品元素搭配关系与所述元素词汇搭配关系相匹配。
又一方面,本申请实施例公开了一种菜品信息的处理装置,所述装置包括:
菜品获取模块,用于获取待识别菜品;
菜品元素识别模块,用于利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;。
可选地,所述装置还包括:
预置菜品元素识别模块,用于利用所述路径模板库,对预置菜品集合中预置菜品的依存句法路径对应的菜品元素进行识别;
第一菜品元素库扩充模块,用于依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
可选地,所述装置还包括:
相似词条获取模块,用于利用词向量模型,获取所述菜品元素库中词条的相似词条;
第二菜品元素库扩充模块,用于将所述相似词条扩充至所述菜品元素库中。
再一方面,本申请实施例公开了一种计算设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
确定待识别菜品的依存句法路径;
利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
又一方面,本申请实施例公开了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现以下步骤:
确定待识别菜品的依存句法路径;
利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
再一方面,本申请实施例公开了一种计算设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
获取待识别菜品;
利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库为依据路径模板库扩充得到。
又一方面,本申请实施例公开了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现以下步骤:
获取待识别菜品;
利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库为依据路径模板库扩充得到。
本申请实施例包括以下优点:
本申请实施例利用路径模板库对待识别菜品的依存句法路径对应的菜品元素进行识别,其中,该路径模板库所存储的依存句法路径模板是依据菜品元素搭配关系得到的,其具备识别菜品元素搭配关系对应的两个菜品元素的能力;由于本申请实施例中依存句法路径表示为:从一个词汇到达另一个词汇的路径上所有词汇的词性和该路径上相邻两个词汇之间的依存关系组成的链条,也即本申请实施例是利用词性及词汇之间的依存关系进行菜品元素识别的,而可以不受词库容量的限制,故本申请实施例可以实现对于新菜品的菜品元素识别,进而提高菜品元素识别的成功率。
附图说明
图1是本申请其中一个实施例的一种菜品信息的处理方法的步骤流程图;
图2是本申请其中一个实施例的一种建立路径模板库的方法的步骤流程图;
图3是本申请另一实施例的一种菜品信息的处理方法的步骤流程图;
图4本申请其中一个实施例的一种菜品信息的处理装置的结构框图;
图5是本申请另一实施例的一种菜品信息的处理装置的结构框图;及
图6是本申请的一种计算设备1500的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请其中一个实施例的一种菜品信息的处理方法的步骤流程图,所述方法具体可以包括如下步骤:
步骤101、确定待识别菜品的依存句法路径;
步骤102、利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
本申请实施例中,菜品可以为采用各种技术手段和相应的技术设备,对原料加工得到的可供直接食用的菜肴。菜品元素可用于表示影响菜品的元素,可选地,上述菜品元素对应的菜品元素类别可以包括:食材、做法、配料、酱料和口味等。本申请实施例的菜品元素识别可以识别得到待识别菜品各词汇对应的目标菜品元素类别,其中,某目标菜品元素类别对应的词汇可以为该待识别菜品对应的菜品元素名称或者菜品元素。
针对现有方案不能识别词库中不存在的菜品的问题,本申请实施例依据菜品元素搭配关系得到依存句法路径模板,并利用路径模板库对待识别菜品的依存句法路径对应的菜品元素进行识别;由于本申请实施例中依存句法路径表示为:从一个词汇到达另一个词汇的路径上所有词汇的词性和该路径上相邻两个词汇之间的依存关系组成的链条,也即本申请实施例是利用词性及词汇之间的依存关系进行菜品元素识别的,而可以不受词库容量的限制,故本申请实施例可以实现对于新菜品的菜品元素识别,进而提高菜品元素识别的成功率。
在本申请的一种应用示例中,假设预置菜品集合中存在已知菜品“番茄炒鸡蛋”,该已知菜品“番茄炒鸡蛋”所包含的3个词汇“番茄”、“炒”和“鸡蛋”分别被存储在食材、做法和配料等菜品元素类别的词库(以下简称菜品元素库)中;且“番茄(名词)”与“炒(动词)”之间的依存关系为主谓关系,“炒(动词)”与“鸡蛋(名词)”之间的依存关系为动宾关系,且已知菜品“番茄炒鸡蛋”的依存句法路径作为依存句法路径模板被存储在路径模板库中;则在待识别菜品“豆角焖面”对应的词汇未被菜品元素库存储时,由于待识别菜品“豆角焖面”所包含的3个词汇“豆角”、“焖”和“面”中,“豆角(名词)”与“焖(动词)”之间的依存关系为主谓关系,“焖(动词)”与“面(名词)”之间的依存关系为动宾关系,也即,待识别菜品“豆角焖面”的依存句法路径是与已知菜品“番茄炒鸡蛋”的依存句法路径模板相匹配的,故可以按照已知菜品“番茄炒鸡蛋”的依存句法路径模板对应的菜品元素搭配关系,得到待识别菜品“豆角焖面”的各词汇对应的菜品元素识别结果:豆角(食材)、焖(做法)、以及面(配料)。
本申请实施例可以应用于任意的需要进行菜品元素识别的应用场景中。例如,本申请实施例可以应用于APP(应用程序,Application)的应用场景中,具体地,可以通过预置接口接收用户输入的待识别菜品,并在对该待识别菜品进行菜品元素识别后,向用户输出对应的菜品元素识别结果。又如,本申请实施例可以应用于网站查询的应用场景中,以便于用户查询待识别菜品对应的菜品元素识别结果。或者,本申请实施例可以应用于大数据分析的应用场景中,具体地,第一设备可以接收第二设备发送的待识别菜品,并在对该待识别菜品进行菜品元素识别后,向该第二设备输出对应的菜品元素识别结果。可以理解,本申请实施例对于具体的应用场景不加以限制。
在实际应用中,接收的待识别菜品的数目可以为一个或者多个。并且,可以接收待识别菜品的信息,该待识别菜品的信息可以为名称,也可以为访问地址、ID(标识,Identity)等信息,以根据该访问地址或者ID获得该待识别菜品的名称。本申请实施例主要以待识别菜品的信息为名称为例进行说明。
本申请实施例在获得待识别菜品名称后,可以对该待识别菜品名称对应的语句进行分析,以确定该待识别菜品的依存句法路径。可选地,可通过依存句法工具来确定该待识别菜品的依存句法路径。该依存句法工具使用LTP(语言技术平台,Language TechnologyPlantform)技术,不仅可以实现分词、词性标注等功能,而且可以完成分析语言单位内成分之间的依存关系,揭示其句法结构,直观来讲,可以分析识别语句中的“主谓宾”、“定状补”等语法成分,并分析各语法成分之间的关系,如“主谓关系”、“动宾关系”、“定中关系”等。
在本申请的一种可选实施例中,上述确定所述待识别菜品的依存句法路径的步骤101,具体可以包括:对待识别菜品名称进行分词和词性标注;分别针对所述待识别菜品名称所包含的两个词汇,构建以所述两个词汇为首尾节点的依存句法路径。
以待识别菜品“豆角焖面”为例,可以对其包含的分词进行两两组合,以得到任意两个词汇之间的依存关系,其中,任意两个词汇之间的依存关系中,该两个词汇可以为对应依存句法路径的首尾节点(首节点和尾节点)。以“豆角”和“焖”两个词汇为例,假设其词性分别为A’和C’,则其依存句法路径可以表示为:“A’→x’→C’”,其中,x’表示A’与C’之间的依存关系。以“豆角”和“面”两个词汇为例,假设其词性分别为A’和B’,则其依存句法路径可以表示为:“A’→x’→C’→y’→B”,其中,y’表示C’与B’之间的依存关系。
在本申请的另一种可选实施例中,上述对所述依存句法路径对应的菜品元素进行识别的步骤102,具体可以包括:在基于菜品元素搭配的路径模板库中确定与所述依存句法路径相匹配的目标依存句法路径模板;依据所述目标依存句法路径模板对应的菜品元素搭配关系,确定所述依存句法路径对应的菜品元素。例如,可以依据所述依存句法路径,在基于菜品元素搭配的路径模板库中进行查找,以得到与所述依存句法路径相匹配的目标依存句法路径模板。可选地,可以对路径模板库中的依存句法路径模板进行遍历,并将依存句法路径与路径模板库中的当前依存句法路径模板进行匹配,若匹配成功,则可以结束遍历,若匹配失败,则可以将路径模板库中的下一依存句法路径模板作为当前依存句法路径模板。
在匹配过程中,可以将依存句法路径与当前依存句法路径模板所包含的各节点的词性和节点之间的依存关系进行比对,若一致,则可以认为匹配成功。例如,假设依存句法路径为:“A’→x’→C’”,当前依存句法路径模板为:“A→x→C”,若A’与A的词性相同、C’与C的词性相同、且A’与C’之间的依存关系x’与A与C之间的依存关系x相同,则可以认为二者匹配成功。同理,对于“A’→x’→C’→y’→B”与“A→x→C→y→B”两个路径,若A’与A的词性相同、B’与B的词性相同、C’与C的词性相同、且A’与C’之间的依存关系x’与A与C之间的依存关系x相同、以及C’与B’之间的依存关系y’与C与B之间的依存关系y相同,则可以认为二者匹配成功。可以理解,本领域技术人员可以根据实际应用需求,采用所需的匹配过程,本申请实施例对于依存句法路径与路径模板库中的依存句法路径模板之间的具体匹配过程不加以限制。
本申请实施例中,所述路径模板库可用于存储依据菜品元素搭配关系得到的依存句法路径模板,其中,该路径模板库所存储的依存句法路径模板是依据菜品元素搭配关系得到的,故其首尾节点可以分别对应不同的菜品元素,这样,本申请实施例可以依据目标依存句法路径模板对应的菜品元素搭配关系,确定所述依存句法路径对应的菜品元素。假设菜品元素搭配关系为“食材-做法”,则其依存句法路径模板的首节点和尾节点可以分别对应食材和做法,故可以认为依存句法路径的首节点对应的菜品元素为食材,尾节点对应的菜品元素为做法。同理,假设菜品元素搭配关系为“食材-配料”,则其依存句法路径模板的首节点和尾节点分别对应食材和配料,故可以认为依存句法路径的首节点对应的菜品元素为食材,尾节点对应的菜品元素为配料。同理,假设菜品元素搭配关系为“食材-口味”,则其依存句法路径模板的首节点和尾节点分别对应食材和口味,故可以认为依存句法路径的首节点对应的菜品元素为食材,尾节点对应的菜品元素为口味。
同样以待识别菜品“豆角焖面”为例,假设“豆角”和“焖”对应的依存句法路径为:“A’→x’→C’”,“A’→x’→C’”与“食材-做法”的依存句法路径模板“A→x→C”匹配成功,则得到的菜品元素识别结果可以包括:“豆角”对应的菜品元素为食材,“焖”对应的菜品元素为做法。
在实际应用中,本领域技术人员可以采用多种方式建立上述路径模板库。例如,可以在对预置菜品进行分析的基础上,得到预置菜品的具有菜品元素搭配关系的两个词汇,然后依据该两个词汇得到该菜品元素搭配关系对应的依存句法路径模板。
在本申请的一种可选实施例中,可以利用菜品元素搭配库中元素词汇搭配关系对预置菜品的依存句法路径模板进行挖掘,相应地,建立所述路径模板库的过程具体可以包括:
针对菜品元素搭配库中各元素词汇搭配关系,获取预置菜品包含的、与所述元素词汇搭配关系相匹配的两个目标词汇;其中,所述元素词汇搭配关系用于表示属于不同菜品元素类别的两个词汇;
分别针对所述预置菜品所包含的两个目标词汇,构建以所述两个目标词汇为首尾节点的依存句法路径模板;
将所述依存句法路径模板保存至路径模板库;其中,所述路径模板库的菜品元素搭配关系与所述元素词汇搭配关系相匹配。
在实际应用中,预置菜品的来源可以有多种。例如,可以在收集所有餐饮类别商户的菜品,并将收集的菜品保存至预置菜品集合F。可选地,在将收集的菜品保存至预置菜品集合F之前,可以对收集的菜品进行数据清理。例如,上述数据清理具体可以包括:对于收集的菜品进行过滤清理,即删除字符长度过短或过长的菜品名称、删除重复的菜品名称、修正菜品名称中的错别字等。
菜品元素搭配库可用于存储元素词汇搭配关系。例如,“食材-做法”菜品元素搭配库用于记录菜品元素类别为食材与菜品元素类别为做法的词汇之间的搭配关系;“食材-配料”菜品元素搭配库用于记录菜品元素类别为食材与菜品元素类别为配料的词汇之间的搭配关系。
在本申请的一种可选实施例中,通过如下步骤获取所述元素词汇搭配关系:获取多个菜品元素类别对应的菜品元素库;将对应于不同菜品元素类别的菜品元素搭配库中两个词汇进行搭配,以得到对应的元素词汇搭配关系。例如,“食材-做法”、“食材-口味”、“食材-配料”的菜品元素搭配库,分别表示为:Z={(s1z1),(s2z2)…(snzn)},K={(s1k1),(s2k2)…(snkn)},P={(s1p1),(s2p2)…(snpn)},其中,s表示食材词汇,z表示做法词汇,k表示口味词汇,p表示配料词汇。
在实际应用中,可以遍历预置菜品集合F中所有预置菜品,将各预置菜品与菜品元素搭配库中各元素词汇关系进行匹配,若某预置菜品包含某元素词汇搭配关系,则解析出该预置菜品对应的依存句法路径,并将解析结果作为依存句法路径模板进行保存。例如,预置菜品集合F中某元素f为“abcde”,Z集合中某元素为“ad”,经判断得知“abcde”包含了“ad”,则针对“abcde”对“ad”的路径进行解析。假设从“a”到“d”,将依次经过词汇“e”和“b”,则可以得到依存句法路径“A”→x”→E→y”→B”→z→D”,其中A”为词汇a的词性,E为词汇e的词性,B”为词汇b的词性,D为词汇d的词性,x”为词汇a与词汇e之间的依存关系(如主谓、动宾等),y”为词汇e与词汇b之间的依存关系,z为词汇b与词汇d之间的依存关系。
在本申请的一种可选实施例中,可以依据各依存句法路径模板的频率,对挖掘得到的依存句法路径模板进行处理,以提高路径模板库的质量。例如,可以统计各依存句法路径模板的频率,按照频率从大到小的顺序对各依存句法路径模板进行排列,分别得到“食材-做法”对应的依存句法频率集合Tz、“食材-口味”对应的依存句法频率集合Tk、“食材-配料”对应的依存句法频率集合Tp,集合形式可以为:{(t1r1),(t2r2)…(tnrn)},其中,t为依存句法路径,r为该路径出现的频率,r1>r2>…>rn。对于Tz、Tk、Tp中所有元素,若r大于某一阈值h,则保留该元素,反之,若r小于等于阈值h,则丢弃该元素;并将保留下的依存句法路径目标加入到路径模板库中。例如,本申请实施例的路径模板库可以包括但不限于:“食材-做法”对应的路径模板库Msz、“食材-口味”对应的路径模板库Msk、以及“食材-配料”对应的路径模板库Msp,路径模板库的形式均可以为:{t1,t2…tn},t为依存句法路径目标,按照频率从大到小排列。
在本申请的一种可选实施例中,可以通过如下步骤获取上述菜品元素库:对预置菜品集合中预置菜品的名称进行分词和词性标注;依据所述预置菜品的分词结果中各分词的词频,构建词频集合;依据所述词频集合中各词汇所属的菜品元素类别,构建对应的菜品元素库。上述依据词频集合构建得到的菜品元素库,能够通过菜品元素库存储一些高频率的词汇,而可以不存储低频率的词汇,因此能够节省存储空间。
在本申请的一种应用示例中,假设预置菜品集合F={f1,f2…fn},分词和词性标注后的集合为W={(w11p11),(w12p12)…(w21p21),(w22p22)…(wnm pnm)},其中,w为分词结果,即单个词汇,p为各词汇的词性,菜品名称f1被分解为(w11p11)、(w12p12)...若干词汇及词性,菜品名称f2被分解为(w21p21)、(w22p22)...若干词汇及词性,以此类推。如“番茄炒鸡蛋”被分解为(番茄名词)、(炒动词)、(鸡蛋名词)。
进一步,可以将分词结果中的词汇和词性集合进行词频统计,并按照词频从大到小排列,构成词频集合Q={(w1p1q1),(w2p2q2)…(wnpnqn)},其中,q表示(wp)的频率,且q1>=q2>=…>=qn。对于Q中所有元素,若q大于某一阈值m,则保留该元素,反之,若q小于等于阈值m,则丢弃该元素。
对于保留的Q中元素,可以通过人工判别、用户投票等方式确定其菜品元素类别,也即可以确定所保留的词汇属于“食材”、“做法”、“口味”、“配料”等菜品元素类别中的哪一类,并依据确定结果加入对应类别的菜品元素库,形成“食材”菜品元素库Ws、“做法”菜品元素库Wz、“口味”菜品元素库Wk、“配料”菜品元素库Wp,Wz、Wk、Wp均可以为:{w1p1,w2p2…wnpn}。
在本申请的一种可选实施例中,可以按照如下方式确m的取值:
1)通过y=argmin f(x),计算y;
其中,且f(x)≥0;argmin表示的是函数f(x)取值最小时的自变量x取值;n为Q中元素数目,λ为手动设置(0<λ<1),如0.9。
2)m=qy,其中,y为上一步求得的结果,作为Q中q的下角标序号,得到m。
上述构建的菜品元素库存储了一些高频词汇,例如,“番茄”、“辣椒”在“食材”菜品元素库中,“炒”、“烧”在“做法”菜品元素库中,则“食材-做法”的菜品元素搭配库可以存储“番茄-炒”、“番茄-烧”、“辣椒-炒”、“辣椒-烧”等高频的元素词汇搭配关系,进一步,可以依据高频的元素词汇搭配关系对预置菜品进行挖掘,以得到高频的依存句法路径模板。例如,“A→x→B→→y→C”为挖掘得到的高频的依存句法路径模板,其中A是“食材”a的词性,C是“做法”c的词性,B是a到达c之间的那个词汇的词性,x为a词汇和b词汇之间的依存关系(如主谓、动宾等),y为b词汇和c词汇之间的依存关系。
为了提高菜品元素库的覆盖率,本申请实施例还可以利用所述路径模板库对当前的菜品元素库进行扩充。相应地,本申请实施例的方法还可以包括:利用所述路径模板库,对所述预置菜品的依存句法路径对应的菜品元素进行识别;依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
在本申请的一种应用示例中,可以利用“A→x→B→→y→C”来重新匹配预置菜品集合F中的所有预置菜品,具体地,可以将集合F中的预置菜品进行分词和词性标注,若某预置菜品的名称中某两个词汇之间满足“A→x→B→→y→C”这个依存句法路径模板,则可以认为预置菜品中A所对应的词汇为“食材”,预置菜品中C所对应的词汇为“做法”,由此可以识别出除高频词汇之外的词汇。例如,除了识别出“番茄”、“辣椒”、“炒”、“烧”之外,还识别出“香菇”、“炖”之类的词汇,因为“香菇”、“炖”不是高频词汇,在构建菜品元素库的过程中并没有被加入到菜品元素库中,但是却满足“A→x→B→→y→C”这样的依存句法路径模板(“香菇”的词性为A,“炖”的词性为C,“香菇”和“炖”之间还存在词汇b,b的词性为B,“香菇”和b之间的依存关系为x,b和“炖”之间的依存关系为y),这样可以实现菜品元素库的扩充。
在本申请的一种可选实施例中,可以在通过扩充得到最新的菜品元素库后,可以利用该最新的菜品元素库得到最新的菜品元素搭配库,并利用最新的菜品元素搭配库对预置菜品的依存句法路径模板进行挖掘,也即,可以通过迭代完成路径模板库的扩充,进而提高路径模板库的覆盖率。
为使本领域技术人员更好地理解本申请实施例,参照图2,示出了本申请其中一个实施例的一种建立路径模板库的方法的步骤流程图,所述方法具体可以包括如下步骤:
步骤201、收集餐饮类别商户的菜品,对收集的菜品进行数据清理,并将数据清理后的菜品作为预置菜品保存至预置菜品集合F;
步骤202、对预置菜品集合F中各预置菜品进行分词和词性标注,得到集合W={(w11p11),(w12p12)…(w21p21),(w22p22)…(wnm pnm)};
步骤203、对集合W进行词频统计,并按照词频从大到小排列,构成词频集合Q={(w1p1q1),(w2p2q2)…(wnpnqn)};
步骤204、按照词频对词频集合Q中词汇进行筛选,确定筛选后各词汇所属的菜品元素类别,并依据该菜品元素类别,构建对应的菜品元素库;
步骤205、获取多个菜品元素类别对应的菜品元素库,将对应于不同菜品元素类别的菜品元素库中两个词汇进行搭配,以得到对应的元素词汇搭配关系,并将该元素词汇搭配关系存储至菜品元素搭配库;
步骤206、针对菜品元素搭配库中各元素词汇搭配关系,获取集合F中预置菜品包含的、与所述元素词汇搭配关系相匹配的两个目标词汇;
步骤207、分别针对所述预置菜品所包含的两个目标词汇,构建以所述两个目标词汇为首尾节点的依存句法路径模板;
步骤208、将所述依存句法路径模板保存至路径模板库;其中,所述路径模板库的菜品元素搭配关系与所述元素词汇搭配关系相匹配;
步骤209、利用所述路径模板库,对集合F中预置菜品的依存句法路径对应的菜品元素进行识别,依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充,并将扩充后的菜品元素库输出至步骤205。也即步骤205-步骤209可以为迭代执行的步骤。
在本申请的另一种可选实施例中,为了提高菜品元素库的覆盖率,本申请实施例的方法还可以包括:利用词向量模型,获取所述菜品元素库中词条的相似词条;将所述相似词条扩充至所述菜品元素库中。词向量模型可以实现词汇的向量化表示,其不仅仅能够标识药物的名称,而且能够表达更丰富的信息,例如,两个词汇之间的关系信息。例如,在采用名称匹配的情况下,“番茄”与“西红柿”之间是没有关系,“口味”与“汤味”、“味道”、“口感”等词汇之间可以是没有关系的,而通过词向量模型可以挖掘出这两个词汇之间的关系,进而获得覆盖率更高的相似词条。
在本申请的一种应用示例中,可以使用词向量模型,获得与词汇w近似的词汇集合S={s1,s2…sn},若满足similar(w,si)>θ,则将该si加入到相应菜品元素库中,其中,similar表示w和si之间的相似度,θ为手动设置值,范围0<θ<1。可选地,可以采用欧氏距离、余弦距离等相似度度量计算w和si之间的相似度。例如,在w为“味道”时,将输出“口味:0.687054;口感:0.650905;汤味:0.528859...”等相似词条,其中的数字表示该词汇距离目标词汇的余弦距离,距离越接近1表示越相似。
综上,本申请实施例的菜品信息的处理方法,利用路径模板库对待识别菜品的依存句法路径对应的菜品元素进行识别,其中,该路径模板库所存储的依存句法路径模板是依据菜品元素搭配关系得到的,其具备识别菜品元素搭配关系对应的两个菜品元素的能力;由于本申请实施例中依存句法路径表示为:从一个词汇到达另一个词汇的路径上所有词汇的词性和该路径上相邻两个词汇之间的依存关系组成的链条,也即本申请实施例是利用词性及词汇之间的依存关系进行菜品元素识别的,而可以不受词库容量的限制,故本申请实施例可以实现对于新菜品的菜品元素识别,进而提高菜品元素识别的成功率。
并且,本申请实施例可以利用所述路径模板库对当前的菜品元素库进行扩充,并依据扩充得到的最新菜品元素库得到最新的菜品元素搭配库,进而利用最新的菜品元素搭配库中元素词汇搭配关系对预置菜品的依存句法路径模板进行挖掘,以得到最新的路径模板库,因此能够提高路径模板库的覆盖率。
参照图3,示出了本申请另一实施例的一种菜品信息的处理方法的步骤流程图,所述方法具体可以包括如下步骤:
步骤301、获取待识别菜品;
步骤302、利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库可以为依据路径模板库扩充得到。
本申请实施例可以利用依据路径模板库对菜品元素库进行扩充,由于所述路径模板库可用于存储依据菜品元素搭配关系得到的依存句法路径模板,故可以提高菜品元素库的覆盖率,进而提高菜品元素识别的成功率。
在实际应用中,扩充前的菜品元素库可以为现有方案中的词库,也可以为本申请实施例构建的菜品元素库,本申请实施例对扩充前的菜品元素库不加以限制。
在本申请的一种应用示例中,假设扩充前的菜品元素库为本申请构建的菜品元素库,假设该菜品元素库可用于存储词汇与词频之间的映射关系,所存储的词汇按照词频从大到小的顺序排列,且菜品元素库中词汇的词频均大于阈值m,则扩充前的菜品元素库仅仅能够存储一些高频词汇。
而本申请实施例可以利用路径模板库对当前的菜品元素库进行扩充,以得到符合路径模板库中依存句法路径模板的低频词汇。例如,利用路径模板库,除了识别出“番茄”、“辣椒”、“炒”、“烧”等高频词汇之外,还识别出“香菇”、“炖”之类的低频词汇。
在本申请的一种可选实施例中,利用路径模板库对当前的菜品元素库进行扩充的过程可以包括:利用所述路径模板库,对所述预置菜品的依存句法路径对应的菜品元素进行识别;依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
例如,可以利用依存句法路径模板“A→x→B→→y→C”来匹配预置菜品集合F中的所有预置菜品,其中A是“食材”a的词性,C是“做法”c的词性;具体地,可以将集合F中的预置菜品进行分词和词性标注,只要某预置菜品的名称中某两个词汇之间满足“A→x→B→→y→C”这个依存句法路径模板,都可以认为预置菜品中A所对应的词汇为“食材”,预置菜品中C所对应的词汇为“做法”,由此可以识别出除高频词汇之外的低频词汇。
在本申请的另一种可选实施例中,为了提高菜品元素库的覆盖率,本申请实施例的方法还可以包括:利用词向量模型,获取所述菜品元素库中词条的相似词条;将所述相似词条扩充至所述菜品元素库中。词向量模型可以实现词汇的向量化表示,其不仅仅能够标识药物的名称,而且能够表达更丰富的信息,例如,两个词汇之间的关系信息。例如,在采用名称匹配的情况下,“番茄”与“西红柿”之间是没有关系,“口味”与“汤味”、“味道”、“口感”等词汇之间是没有关系的,而通过词向量模型可以挖掘出这两个词汇之间的关系,进而获得覆盖率更高的相似词条。
综上,本申请实施例的菜品信息的处理方法,可以利用依据路径模板库对菜品元素库进行扩充,故可以提高菜品元素库的覆盖率,这样,利用扩充后的菜品元素库进行待识别菜品的识别,能够提高菜品元素识别的成功率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图4,示出了本申请其中一个实施例的一种菜品信息的处理装置的结构框图,该装置具体可以包括:
路径确定模块401,用于确定待识别菜品的依存句法路径;
菜品元素识别模块402,用于利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
可选地,上述路径模板库可用于存储依据菜品元素搭配关系得到的依存句法路径模板。
可选地,上述菜品元素识别模块402可以包括:
模板确定子模块,用于在基于菜品元素搭配的路径模板库中确定与所述依存句法路径相匹配的目标依存句法路径模板;以及
菜品元素确定子模块,用于依据所述目标依存句法路径模板对应的菜品元素搭配关系,确定所述依存句法路径对应的菜品元素。
可选地,上述路径确定模块可以包括:
第一分词标注子模块,用于对待识别菜品名称进行分词和词性标注;以及
路径构建子模块,用于分别针对所述待识别菜品名称所包含的两个词汇,构建以所述两个词汇为首尾节点的依存句法路径。
可选地,上述装置还可以包括:用于建立所述路径模板库的模板库建立模块;
所述模板库建立模块可以包括:
目标词汇获取子模块,用于针对菜品元素搭配库中各元素词汇搭配关系,获取预置菜品包含的、与所述元素词汇搭配关系相匹配的两个目标词汇;其中,所述元素词汇搭配关系用于表示属于不同菜品元素类别的两个词汇;
模板构建子模块,用于分别针对所述预置菜品所包含的两个目标词汇,构建以所述两个目标词汇为首尾节点的依存句法路径模板;以及
模板保存子模块,用于将所述依存句法路径模板保存至路径模板库;其中,所述路径模板库的菜品元素搭配关系与所述元素词汇搭配关系相匹配。
可选地,上述装置还可以包括:用于获取所述元素词汇搭配关系的搭配关系获取模块;
所述搭配关系获取模块可以包括:
菜品元素库获取子模块,用于获取多个菜品元素类别对应的菜品元素库;以及
词汇搭配子模块,用于将对应于不同菜品元素类别的菜品元素库中两个词汇进行搭配,以得到对应的元素词汇搭配关系。
可选地,上述装置还可以包括:用于构建所述菜品元素库的菜品元素库构建模块;
所述菜品元素库构建模块可以包括:
第二分词标注子模块,用于对预置菜品集合中预置菜品的名称进行分词和词性标注;
词频集合构建子模块,用于依据所述预置菜品的分词结果中各分词的词频,构建词频集合;以及
菜品元素库构建子模块,用于依据所述词频集合中各词汇所属的菜品元素类别,构建对应的菜品元素库。
可选地,上述装置还可以包括:
预置菜品元素识别模块,用于利用所述路径模板库,对所述预置菜品的依存句法路径对应的菜品元素进行识别;
菜品元素库扩充模块,用于依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
对于装置实施例而言,由于其与方法实施例基本相似,故描述的比较简单,相似的地方请相互参照即可。
参照图5,示出了本申请另一实施例的一种菜品信息的处理装置的结构框图,该装置具体可以包括:
菜品接收模块501,用于获取待识别菜品;
菜品元素识别模块502,用于利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库可以为依据路径模板库扩充得到。
可选地,所述路径模板库用于存储依据菜品元素搭配关系得到的依存句法路径模板。
可选地,上述装置还可以包括:
预置菜品元素识别模块,用于利用所述路径模板库,对预置菜品集合中预置菜品的依存句法路径对应的菜品元素进行识别;
第一菜品元素库扩充模块,用于依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
可选地,上述装置还可以包括:
相似词条获取模块,用于利用词向量模型,获取所述菜品元素库中词条的相似词条;
第二菜品元素库扩充模块,用于将所述相似词条扩充至所述菜品元素库中。
对于装置实施例而言,由于其与方法实施例基本相似,故描述的比较简单,相似的地方请相互参照即可。
参照图6,示出了本申请的一种计算设备1500的结构示意图,具体可以包括:至少一个处理器1501、存储器1502、至少一个网络接口1504和用户接口1503。计算设备1500中的各个组件通过总线系统1505耦合在一起。可理解,总线系统1505用于实现这些组件之间的连接通信。总线系统1505除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图6中将各种总线都标为总线系统1505,计算设备1500还包括拍照组件1506,拍照组件1506包括摄像头。本申请实施例的计算设备的例子具体可以包括但不限:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
其中,用户接口1503可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本申请实施例中的存储器1502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-OnlyMemory,ROM)、可编程只读存储器(ProgrammableROM,PROM)、可擦除可编程只读存储器(ErasablePROM,EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccessMemory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(StaticRAM,SRAM)、动态随机存取存储器(DynamicRAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(SynchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambusRAM,DRRAM)。本申请实施例描述的系统和方法的存储器1502旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器1502存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统15021和应用程序15022。
其中,操作系统15021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序15022,包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本申请实施例方法的程序可以包含在应用程序15022中。
在本申请实施例中,通过调用存储器1502存储的程序或指令,具体的,可以是应用程序15022中存储的程序或指令,处理器1501用于确定待识别菜品的依存句法路径;利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果;或者,处理器1501用于获取待识别菜品;利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库为依据路径模板库扩充得到。
上述本申请实施例揭示的方法可以应用于处理器1501中,或者由处理器1501实现。处理器1501可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1501可以是通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(FieldProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1502,处理器1501读取存储器1502中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本申请实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecificIntegratedCircuits,ASIC)、数字信号处理器(DigitalSignalProcessing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(ProgrammableLogicDevice,PLD)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本申请实施例中所述功能的模块(例如过程、函数等)来实现本申请实施例中所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
可选地,所述处理器1501,还用于在基于菜品元素搭配的路径模板库中确定与所述依存句法路径相匹配的目标依存句法路径模板;依据所述目标依存句法路径模板对应的菜品元素搭配关系,确定所述依存句法路径对应的菜品元素。
可选地,所述处理器1501,还用于对所述待识别菜品名称进行分词和词性标注;分别针对所述待识别菜品名称所包含的两个词汇,构建以所述两个词汇为首尾节点的依存句法路径。
可选地,所述处理器1501,还用于针对菜品元素搭配库中各元素词汇搭配关系,获取预置菜品包含的、与所述元素词汇搭配关系相匹配的两个目标词汇;其中,所述元素词汇搭配关系用于表示属于不同菜品元素类别的两个词汇;分别针对所述预置菜品所包含的两个目标词汇,构建以所述两个目标词汇为首尾节点的依存句法路径模板;将所述依存句法路径模板保存至路径模板库;其中,所述路径模板库的菜品元素搭配关系与所述元素词汇搭配关系相匹配。
可选地,所述处理器1501,还用于获取多个菜品元素类别对应的菜品元素库;将对应于不同菜品元素类别的菜品元素库中两个词汇进行搭配,以得到对应的元素词汇搭配关系。
可选地,所述处理器1501,还用于对预置菜品集合中预置菜品的名称进行分词和词性标注;依据所述预置菜品的分词结果中各分词的词频,构建词频集合;依据所述词频集合中各词汇所属的菜品元素类别,构建对应的菜品元素库。
可选地,所述处理器1501,还用于利用所述路径模板库,对所述预置菜品的依存句法路径对应的菜品元素进行识别;依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
可选地,所述路径模板库用于存储依据菜品元素搭配关系得到的依存句法路径模板。
可选地,所述处理器1501,还用于利用所述路径模板库,对预置菜品集合中预置菜品的依存句法路径对应的菜品元素进行识别;依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
可选地,所述处理器1501,还用于利用词向量模型,获取所述菜品元素库中词条的相似词条;将所述相似词条扩充至所述菜品元素库中。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
以上对本申请所提供的一种菜品信息的处理方法、以及一种菜品信息的处理装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (22)
1.一种菜品信息的处理方法,其特征在于,所述方法包括:
确定待识别菜品的依存句法路径;
利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述依存句法路径对应的菜品元素进行识别,包括:
在基于菜品元素搭配的路径模板库中确定与所述依存句法路径相匹配的目标依存句法路径模板;
依据所述目标依存句法路径模板对应的菜品元素搭配关系,确定所述依存句法路径对应的菜品元素。
3.根据权利要求1所述的方法,其特征在于,所述确定所述待识别菜品的依存句法路径,包括:
对所述待识别菜品名称进行分词和词性标注;
分别针对所述待识别菜品名称所包含的两个词汇,构建以所述两个词汇为首尾节点的依存句法路径。
4.根据权利要求1至3中任一所述的方法,其特征在于,通过如下步骤建立所述路径模板库:
针对菜品元素搭配库中各元素词汇搭配关系,获取预置菜品包含的、与所述元素词汇搭配关系相匹配的两个目标词汇;其中,所述元素词汇搭配关系用于表示属于不同菜品元素类别的两个词汇;
分别针对所述预置菜品所包含的两个目标词汇,构建以所述两个目标词汇为首尾节点的依存句法路径模板;
将所述依存句法路径模板保存至路径模板库;其中,所述路径模板库的菜品元素搭配关系与所述元素词汇搭配关系相匹配。
5.根据权利要求4所述的方法,其特征在于,通过如下步骤获取所述元素词汇搭配关系:
获取多个菜品元素类别对应的菜品元素库;
将对应于不同菜品元素类别的菜品元素库中两个词汇进行搭配,以得到对应的元素词汇搭配关系。
6.根据权利要求5所述的方法,其特征在于,通过如下步骤构建所述菜品元素库:
对预置菜品集合中预置菜品的名称进行分词和词性标注;
依据所述预置菜品的分词结果中各分词的词频,构建词频集合;
依据所述词频集合中各词汇所属的菜品元素类别,构建对应的菜品元素库。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
利用所述路径模板库,对所述预置菜品的依存句法路径对应的菜品元素进行识别;
依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
8.根据权利要求1至3中任一所述的方法,其特征在于,所述路径模板库用于存储依据菜品元素搭配关系得到的依存句法路径模板。
9.一种菜品信息的处理方法,其特征在于,所述方法包括:
获取待识别菜品;
利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库为依据路径模板库扩充得到。
10.根据权利要求9所述的方法,其特征在于,所述路径模板库用于存储依据菜品元素搭配关系得到的依存句法路径模板。
11.根据权利要求9或10所述的方法,其特征在于,通过如下步骤扩充得到所述菜品元素库:
利用所述路径模板库,对预置菜品集合中预置菜品的依存句法路径对应的菜品元素进行识别;
依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
12.根据权利要求9或10所述的方法,其特征在于,所述方法还包括:
利用词向量模型,获取所述菜品元素库中词条的相似词条;
将所述相似词条扩充至所述菜品元素库中。
13.一种菜品信息的处理装置,其特征在于,所述装置包括:
路径确定模块,用于确定待识别菜品的依存句法路径;
菜品元素识别模块,用于利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
14.根据权利要求13所述的装置,其特征在于,所述菜品元素识别模块包括:
模板确定子模块,用于在基于菜品元素搭配的路径模板库中确定与所述依存句法路径相匹配的目标依存句法路径模板;以及
菜品元素确定子模块,用于依据所述目标依存句法路径模板对应的菜品元素搭配关系,确定所述依存句法路径对应的菜品元素。
15.根据权利要求13或14所述的装置,其特征在于,所述装置还包括:用于建立所述路径模板库的模板库建立模块;
所述模板库建立模块包括:
目标词汇获取子模块,用于针对菜品元素搭配库中各元素词汇搭配关系,获取预置菜品包含的、与所述元素词汇搭配关系相匹配的两个目标词汇;其中,所述元素词汇搭配关系用于表示属于不同菜品元素类别的两个词汇;
模板构建子模块,用于分别针对所述预置菜品所包含的两个目标词汇,构建以所述两个目标词汇为首尾节点的依存句法路径模板;以及
模板保存子模块,用于将所述依存句法路径模板保存至路径模板库;其中,所述路径模板库的菜品元素搭配关系与所述元素词汇搭配关系相匹配。
16.一种菜品信息的处理装置,其特征在于,所述装置包括:
菜品获取模块,用于获取待识别菜品;
菜品元素识别模块,用于利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;。
17.根据权利要求16所述的装置,其特征在于,所述装置还包括:
预置菜品元素识别模块,用于利用所述路径模板库,对预置菜品集合中预置菜品的依存句法路径对应的菜品元素进行识别;
第一菜品元素库扩充模块,用于依据所述预置菜品的菜品元素识别结果,对所述菜品元素库进行扩充。
18.根据权利要求16或17所述的装置,其特征在于,所述装置还包括:
相似词条获取模块,用于利用词向量模型,获取所述菜品元素库中词条的相似词条;
第二菜品元素库扩充模块,用于将所述相似词条扩充至所述菜品元素库中。
19.一种计算设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
确定待识别菜品的依存句法路径;
利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现以下步骤:
确定待识别菜品的依存句法路径;
利用基于菜品元素搭配的路径模板库,对所述依存句法路径对应的菜品元素进行识别,以得到对应的菜品元素识别结果。
21.一种计算设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
获取待识别菜品;
利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库为依据路径模板库扩充得到。
22.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现以下步骤:
获取待识别菜品;
利用多个菜品元素类别对应的菜品元素库,对所述待识别菜品的菜品元素进行识别,以得到对应的菜品元素识别结果;其中,所述菜品元素库为依据路径模板库扩充得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710209665.7A CN107169013B (zh) | 2017-03-31 | 2017-03-31 | 一种菜品信息的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710209665.7A CN107169013B (zh) | 2017-03-31 | 2017-03-31 | 一种菜品信息的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107169013A true CN107169013A (zh) | 2017-09-15 |
CN107169013B CN107169013B (zh) | 2018-01-19 |
Family
ID=59849114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710209665.7A Active CN107169013B (zh) | 2017-03-31 | 2017-03-31 | 一种菜品信息的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107169013B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596789A (zh) * | 2018-03-29 | 2018-09-28 | 客如云科技(成都)有限责任公司 | 一种菜品标准化的方法 |
CN109325779A (zh) * | 2018-08-20 | 2019-02-12 | 北京数美时代科技有限公司 | 一种用于反欺诈的读写画像方法、系统和画像处理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7680690B1 (en) * | 2005-05-09 | 2010-03-16 | Catalano Anthony B | Intelligent menu ordering system |
CN104794211A (zh) * | 2015-04-24 | 2015-07-22 | 清华大学 | 基于微博文本的情绪诱因提取和诱因成分分析方法及系统 |
CN105701253A (zh) * | 2016-03-04 | 2016-06-22 | 南京大学 | 中文自然语言问句语义化的知识库自动问答方法 |
CN105938495A (zh) * | 2016-04-29 | 2016-09-14 | 乐视控股(北京)有限公司 | 实体关系识别方法及装置 |
-
2017
- 2017-03-31 CN CN201710209665.7A patent/CN107169013B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7680690B1 (en) * | 2005-05-09 | 2010-03-16 | Catalano Anthony B | Intelligent menu ordering system |
CN104794211A (zh) * | 2015-04-24 | 2015-07-22 | 清华大学 | 基于微博文本的情绪诱因提取和诱因成分分析方法及系统 |
CN105701253A (zh) * | 2016-03-04 | 2016-06-22 | 南京大学 | 中文自然语言问句语义化的知识库自动问答方法 |
CN105938495A (zh) * | 2016-04-29 | 2016-09-14 | 乐视控股(北京)有限公司 | 实体关系识别方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596789A (zh) * | 2018-03-29 | 2018-09-28 | 客如云科技(成都)有限责任公司 | 一种菜品标准化的方法 |
CN109325779A (zh) * | 2018-08-20 | 2019-02-12 | 北京数美时代科技有限公司 | 一种用于反欺诈的读写画像方法、系统和画像处理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107169013B (zh) | 2018-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108694160B (zh) | 文章生成方法、设备及存储介质 | |
WO2017045443A1 (zh) | 一种图像检索方法及系统 | |
JP2020027649A (ja) | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 | |
CN111753198A (zh) | 信息推荐方法和装置、以及电子设备和可读存储介质 | |
US20120290293A1 (en) | Exploiting Query Click Logs for Domain Detection in Spoken Language Understanding | |
CN110413738B (zh) | 一种信息处理方法、装置、服务器及存储介质 | |
US20170337260A1 (en) | Method and device for storing data | |
US11907659B2 (en) | Item recall method and system, electronic device and readable storage medium | |
CN108664595B (zh) | 领域知识库构建方法、装置、计算机设备和存储介质 | |
JP6693582B2 (ja) | 文書要約の生成方法、装置、電子機器、コンピュータ読み取り可能な記憶媒体 | |
US10031714B2 (en) | Method and device for processing audio files | |
CN110991187A (zh) | 一种实体链接的方法、装置、电子设备及介质 | |
US20170116521A1 (en) | Tag processing method and device | |
US20220414131A1 (en) | Text search method, device, server, and storage medium | |
EP2707808A2 (en) | Exploiting query click logs for domain detection in spoken language understanding | |
CN110209780B (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
US20240348846A1 (en) | Video generating method and apparatus, electronic device, and readable storage medium | |
CN109960721A (zh) | 基于源内容的多重压缩构造内容 | |
CN110032734B (zh) | 近义词扩展及生成对抗网络模型训练方法和装置 | |
CN107169013B (zh) | 一种菜品信息的处理方法及装置 | |
WO2021114634A1 (zh) | 文本标注方法、设备及存储介质 | |
CN109597873B (zh) | 语料数据的处理方法、装置、计算机可读介质及电子设备 | |
CN111881681A (zh) | 实体样本获取方法、装置及电子设备 | |
KR20220005243A (ko) | 수기로 작성된 스캔본 전자파일의 인식과 공유 방법 및 그 장치 | |
CN108491423B (zh) | 一种排序方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |