CN107247736A - 一种基于知识图谱的厨房领域问答方法及系统 - Google Patents
一种基于知识图谱的厨房领域问答方法及系统 Download PDFInfo
- Publication number
- CN107247736A CN107247736A CN201710318042.3A CN201710318042A CN107247736A CN 107247736 A CN107247736 A CN 107247736A CN 201710318042 A CN201710318042 A CN 201710318042A CN 107247736 A CN107247736 A CN 107247736A
- Authority
- CN
- China
- Prior art keywords
- illustrative plates
- kitchen
- question sentence
- word
- word segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000011218 segmentation Effects 0.000 claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 8
- 239000000463 material Substances 0.000 description 33
- 244000061456 Solanum tuberosum Species 0.000 description 23
- 235000002595 Solanum tuberosum Nutrition 0.000 description 23
- 235000013305 food Nutrition 0.000 description 23
- 244000046052 Phaseolus vulgaris Species 0.000 description 12
- 235000021332 kidney beans Nutrition 0.000 description 11
- 238000013507 mapping Methods 0.000 description 7
- 238000010411 cooking Methods 0.000 description 6
- 241000234282 Allium Species 0.000 description 5
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 5
- 235000015277 pork Nutrition 0.000 description 5
- 235000013555 soy sauce Nutrition 0.000 description 5
- 235000013547 stew Nutrition 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 239000000571 coke Substances 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000013312 flour Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 235000015067 sauces Nutrition 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于知识图谱的厨房领域问答方法及系统,该方法包括以下步骤:获取问句并对问句进行分词处理得到分词结果;根据上下文特征对分词结果进行实体及属性抽取,并生成问句对应的语义逻辑表达式;根据语义逻辑表达式生成SPARQL查询语句;根据SPARQL查询语句在厨房领域知识图谱中查询得到结果并根据结果得到问句对应的答案。本发明实现了厨房领域内的问答系统,并提高了厨房领域内问答系统的准确率和效率。
Description
技术领域
本发明涉及问答系统,尤其涉及一种厨房领域问答方法及系统。
背景技术
随着自然语言理解这一门技术的普及,出现了很多智能的问答系统、智能考试系统、智能出题系统等,通过建立大量的知识库,然后对自然语言的句子进行分词、标注,然后将其与应通过大量的语料库训练好的知识库进行对比,从而让机器理解自然语言。但是,不同领域其句子、词语的含义、划分均不同,而市面上大多数的分词器都是通用的,而语料库也会有很多的划分标准。目前,对于厨房领域,现如今都将视频、图文等的菜谱上传至网上,供人们查看,这样就会使得很多人通过网络来查询对应的菜谱或菜名,但是如今并没有很好的涉及到厨房领域问答系统,不能够为人们提供快速准确的查找。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种基于知识图谱的厨房领域问答方法,其能够实现快速、准确的查找。
为了克服现有技术的不足,本发明的目的之二在于提供一种基于知识图谱的厨房领域问答系统,其能够实现快速、准确的查找。
本发明的目的之一采用以下技术方案实现:
一种基于知识图谱的厨房领域问答方法,包括:
分词步骤,获取问句并对问句进行分词处理得到分词结果;
表达式生成步骤,用于根据上下文特征对分词结果进行实体及属性抽取,并生成问句所对应的语义逻辑表达式;
查询语句生成步骤,根据语义逻辑表达式生成SPARQL查询语句;
查询步骤,根据SPARQL查询语句在厨房领域知识图谱中查询得到结果并根据结果得到问句对应的答案。
优选地,所述分词步骤具体包括:首先获取问句并对问句进行预处理得到字序列,然后通过HMM模型以及Vitebi解码方法对字序列进行解码并将解码后的字序列与语料库中的字标签进行类比,最终得到准确的分词结果。
优选地,所述表达式生成步骤中,对分词结果进行实体及属性抽取时还根据概率模型对实体及属性的可信度进行评价,并根据可信度来选取实体及属性。
优选地,所述概率模型为CRF模型或HMM模型。
本发明的目的之二采用以下技术方案实现:
一种基于知识图谱的厨房领域问答系统,包括:
分词模块,用于获取问句并对问句进行分词处理得到分词结果;
表达式生成模块,用于根据上下文特征对分词结果进行实体及属性抽取,并生成问句所对应的语义逻辑表达式;
查询语句生成模块,用于根据语义逻辑表达式生成SPARQL查询语句;
查询模块,用于根据SPARQL查询语句在厨房领域知识图谱中查询得到结果并根据结果得到问句对应的答案。
优选地,所述分词模块还用于首先获取问句并对问句进行预处理得到字序列,然后通过HMM模型以及Vitebi解码方法对字序列进行解码并将解码后的字序列与语料库中的字标签进行类比,最终得到准确的分词结果。
优选地,所述表达式生成模块,在对分词结果进行实体及属性抽取时还用于根据概率模型对实体及属性的可信度进行评价,并根据可信度来选取实体及属性。
优选地,所述概率模型为CRF模型或HMM模型。
相比现有技术,本发明的有益效果在于:
本发明实现了针对厨房领域内的问答系统,使得问答系统能够快速、准确地给出问句答案。
附图说明
图1为本发明提供的一种基于知识图谱的厨房领域问答方法的方法流程图;
图2为本发明提供的厨房领域知识图谱中的菜谱父类与子类的关系图谱;
图3为本发明提供的厨房领域知识图谱中的菜谱父类与子类的互逆关系图谱;
图4为本发明提供的一种基于知识图谱的厨房领域问答系统的系统模块图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例
一种基于知识图谱的厨房领域问答方法,如图1所示,包括以下步骤:
S1:获取问句并对问句进分词处理得到分词结果。
本发明中对于问句进行分词所采用的是一种专门针对厨房领域的分词器,该分词器是基于隐马尔可夫模型(HMM,Hidden Markov Model)和N-gram模型(汉语语言模型)构造的厨房领域分词器,其能够很好地对厨房领域内的词进行划分。
一般来说,对于一个词,其在不同领域内所表达的意义也不同或词语的组合不同,比如“洋葱”,在歌曲领域内表示歌曲名;而在烹饪或厨房领域内表示为一个食材。而通用分词器在分词的过程中,并没有考虑词语的领域特征,与常见的词典比较类似,其分词结果很大程度不符合厨房领域。比如“土豆炖排骨的做法”,采用通用分词器来划分为“土豆炖、排骨的做法”,然后实际上在厨房领域内,“土豆炖排骨”是一个菜名,在分词时其不应该分开。
因此,本发明的厨房领域分词器所采用的分词方法是基于字标注的HMM模型和N-gram模型的分词方法,具体包括以下步骤:
首先通过对输入问句进行预处理得到字序列,然后通过HMM模型和Vitebi解码方法对字序列进行解码,并将解码后的字序列与语料库中的字标签进行类比,从而得到准确的分词结果。而语料库是通过对厨房领域的语料进行预处理得到子序列,然后在通过N-gram模型根据字序列进行提取上下文特征,然后采用HMM模型对语料进行训练得到。
另外,本发明提供的厨房领域分词器在实际应用中具有较好的学习能力。比如:“我想吃红烧苹果”,通过本发明提供的厨房领域分词方法得到的分词结果为“我想吃红烧苹果”,其中“红烧苹果”尽管不在实际的语料库中,但是其与“红烧肉”类似,属于菜名,因此将红烧苹果划分到一起,而不是划分为“红烧苹果”。
S2:对分词结果根据上下文特征进行实体及属性的抽取,并生成对应的语义逻辑表达式。
其中,实体具有上下文特征及领域特征,比如“洋葱”,其中“洋葱”在厨房领域内表示食材,在歌曲领域内表示歌名;而“洋葱可以做什么菜”通过上下文特征可以判断出,这里的“洋葱”为与菜相关的食材。而属性是指实体所具备的属性,比如口味、做法等。
基于此,本发明根据上下文特征对厨房领域的实体以及属性进行抽取。本发明中假设厨房实体的类型为菜名(ndish)、食材(nfood)、菜型(nfty)、菜系(ncuisine)四种,比如“土豆或豆角可以做什么菜”,从上下文可以得到土豆、豆角均食材(nfood),经过实体抽取后得到“土豆(nfood)或豆角(nfood)可以做什么菜”。在实体及属性识别抽取的过程中还采用了概率模型对其进行概率统计来判断实体及属性的可信度评价,然后选取可信度较高的实体及个作为最终识别提取到的实体与属性,这样可以来提高实体及属性识别的正确性。概率模型可以是CRF(全称为conditional random field algorithm)模型、HMM模型。通过将上下文特征以及模型的结合来实现对实体及属性的识别抽取,可提高实体及属性的识别准确性。
另外,在实体及属性抽取的过程中还设定窗口的大小,该窗口指的是该实体或属性的上下文中与其具有关联关系的特征词的查找个数。该窗口大小的设置是预设的,其具体数据是通过大量的经验得出的,比如将窗口设为3。对问句进行实体及属性进行抽取后生成对应的语义逻辑表达式为“+material:土豆material:豆角”。
S3:根据语义逻辑表达式生成SPARQL查询语句。SPARQL是为RDF开发的一种查询语言和数据获取协议,它是为W3C所开发的RDF数据模型所定义,但是可以用于任何可以用RDF来表示的信息资源。通过查询接口对语义逻辑表达式进行解析,首先将语义逻辑表达式拆分为MUST、MUST_NOT、SHOULD子查询语句,再经过重新组合成SPARQL查询语句。该SPARQL查询语句是专门针对图谱的查询,也即是说将问句进行分词然后生成语义逻辑表达,再将该语义逻辑表达式转换为SPARQL查询语句。
例如:“土豆或豆角可以做什么不辣的菜”经过实体及属性的抽取得到的逻辑表达式为“+material:土豆material:豆角-taste:辣”。
A、“+material:土豆”转换为MUST查询语句为:
?dish fa:hasNameIngredient fa:土豆。
B、“material:豆角”转换为SHOULD语句为:
UNION{?dish fa:hasNameIngredient fa:豆角}。
C、“-taste:辣”转换为MUST_NOT语句为:
FILTER(!regex(str(?taste),"辣"))。
最终组合成SPARQL查询语句为:
SELECT?heat?taste?id?dish WHERE{{?dish fa:hasNameIngredient fa:土豆.}UNION{?dish fa:hasNameIngredient fa:豆角}.{?dish fa:hasTaste?taste.FILTER(!regex(str(?taste),"辣")).}?dish fa:hasId?id.?dish fa:hasHeat?heat}ORDER BYDESC(?heat)LIMIT 100。
另外,在对语义逻辑表达解析时,还需要对实体进行映射做同义词处理。比如“土豆”与“马铃薯”是属于同义词。这样通过对同义词进行映射能够提高查询的准确性。
S4:根据SPARQL查询语句在厨房领域知识图谱中查询得到查询结果,并根据查询结果得到问句答案。
厨房领域知识图谱是基于本体知识图谱自动构建的,是预先已经构建完成的知识图谱。比如,该厨房领域知识图谱利用了菜谱来构建知识图谱,根据菜谱的属性选用了19个子类以及19个属性对菜谱进行标识,其中菜谱为父类,然后根据该菜谱对其子类进行展开,从而生成了如图2所示的菜谱父类和子类之间的关系图谱。
其中,菜谱父类recipe的子类有description(描述)、hardLevel(难易度)、materialsAmount(食材量)、material(食材)、selfMaterialsName(字面食材名)、stepsText(做菜步骤)、cookingTime(烹饪时间)、function(功效)、id(菜名id)、heat(热度)、dishStyle(菜系)、dishType(菜型)、cookingMethod(烹饪方式)、taste(味道)、scene(场景)、peopleRange(人群)、playAmount(播放次数)、agreementAmount(点赞次数)、coreDishName(核心菜名)等。其中子类selfMaterialsName采用食材知识库抽取字面上的食材,如“土豆炖排骨”字面上的食材为“土豆”、“排骨”,食材“土豆”、“排骨”与菜名“土豆炖排骨”的相关性较大。除此以外,核心菜名coreDishName,根据菜名的子串进行枚举,如菜名中有“家常荷包蛋”,根据菜名的子串和提取“荷包蛋”为核心菜名。
每一个菜谱均形成如图2所示的图谱,最终将所有的菜谱父类以及其对应的子类形成一个大的图谱,也即是厨房领域知识图谱。
另外,父类与子类之间、子类与子类之间还定义了其他属性,比如互逆属性、并列属性等,如图3所示的互逆属性。其中互逆属性主要描述recipe和matrial之间的关系,hasMaterial表示recipe(菜谱)拥有matrial(食材)、而isMaterialOf表示material(食材)属于recipe(菜谱)。
另外,本发明中还根据类与属性的图谱来构造厨房领域的本体模板、根据实例数据生成本体模型,从而将本体模板与本体模型结合构成出厨房领域知识本体模型。厨房领域知识本体模型的构造主要使用了OWL文件进行存储,根据存储的菜名进行实例抽取,并根据设定好的菜谱本体模板对实例数据进行填充,最后将OWL头文件与OWL实例数据进行组合,形成OWL字符串,并转换成OWL输入流,以参数的形式组成本体模型。
根据SPARQL查询语句在厨房领域知识图谱中查询得到查询结果,然后根据查询结果得到问句的答案。
在通过SPARQL查询语句在厨房领域知识图谱中查询时,可能涉及到以下查询方式:
1)菜名查询,对于逻辑表达式中有菜名的查询,根据查明属性和菜名SPARQL查询语句直接在厨房领域知识图谱中查询,如果有结果直接返回结果;如果没有,则返回空。比如,可乐鸡翅,其可通过知识图谱中直接查到可乐鸡翅的相关属性。
2)食材查询
如果逻辑表达式中有食材,则先根据菜名的字面食材进行查询,如果没有结果,则根据菜名本身的食材进行查询,然后再根据热度值对结果进行排序。热度值的计算根据点赞数和播放次数建立热度值打分模型,其模型函数为:
其中m为点赞数,n为播放次数,α为常量,f(x)为模型的打分值。
例如“土豆和豆角可以做什么菜”,根据转换后的语义逻辑表达式可生成两条SPARQL查询语句:
SPARQL_1:SELECT?heat?id?dish WHERE{?dish fa:hasNameIngredient fa:土豆.?dish fa:hasNameIngredient fa:豆角.?dish fa:hasId?id.?dish fa:hasHeat?heat}ORDER BY DESC(?heat)LIMIT 100;
SPARQL_2:SELECT?heat?id?dish WHERE{?dish fa:hasIngredient fa:土豆.?dish fa:hasIngredient fa:豆角.?dish fa:hasId?id.?dish fa:hasHeat?heat}ORDERBY DESC(?heat)LIMIT 100;
SPARQL_1根据菜名的字面食材(比如土豆炖排骨,其中土豆、排骨就是该菜名的字面食材)进行查询,如果返回空,则根据菜名本身的食材(家常荷包蛋,其菜名本身的食材是鸡蛋)进行查询,执行SPARQL_2查询语句。
3)其他属性查询
比如,针对菜型、菜系和功效三个属性,根据不同的数据源收集其属性值所对应的菜名,然后根据不同数据源的菜名排序值获取推荐的菜名,根据菜名从数据库中获取对应的id,以此构建属性推荐知识库。
也即是说,数据源的收集采用网络爬虫的技术从各种不同的网站进行数据的采集,根据不同的属性从采集的数据中获取对应的菜名以及浏览次数、点击次数等参数,再根据浏览次数和点击次数将菜名进行降序排序,并获取排名较高的前10个菜名,然后从已爬取的菜谱数据库获取对应菜名的id,最后由菜名id、菜名及属性构建菜谱属性推荐知识库。
在属性查询过程中,如果属性查询结果有存在于推荐知识库中的属性值,将对应的推荐知识库的菜名id排在最前面,采用热度(浏览次数)或者点赞数(点击次数)查询并排序后的结果排在后面,以此来推荐相关属性的菜名。如“推荐一下湖南菜”,生成的SPARQL查询语句为:
SELECT?agreementAmount?id?dish WHERE{?dish fa:hasDishStyle fa:湖南菜.?dish fa:hasId?id.?dish fa:hasAgreementAmount?agreementAmount}ORDER BYDESC(?agreementAmount)LIMIT 100;
查询结果中有“毛家红烧肉”,而推荐知识库中有“粉蒸肉”,则将“粉蒸肉”排在“毛家红烧肉”的前面。
4)组合查询
1)、2)、3)的查询方式是针对单属性、单属性值或多属性值的逻辑表达式查询,对于不同属性及属性值的组合,本系统设置了组合查询方式。组合查询语句采用本体库进行映射。其中,本体库是指表示属性及其属性关系的知识库,主要由类、属性构成,类可以表示概念之间的关系,如“食材”是“菜谱”的一个子类,属性用来描述类所具有的关系。例如口味的属性“taste”在本体库中对应的属性映射是“hasTaste”。
组合查询将逻辑表达式映射成SPARQL查询语句,最后根据SPARQL在知识图谱中进行查询。如“土豆和西红柿或豆角可以做什么不辣的菜”转换成SPARQL查询语句为:
SELECT?heat?id?dish WHERE{{?dish fa:hasNameIngredient fa:土豆.}{?dishfa:hasNameIngredient fa:西红柿.}UNION{?dish fa:hasNameIngredient fa:豆角.}?dish fa:hasId?id.?dish fa:hasHeat?heat}ORDER BY DESC(?heat)LIMIT 100。
本发明首先通过使用厨房领域的分词器对其进行准确分词,然后再根据将问句转换为语义逻辑表达式,并将语义逻辑表达式转换为SPARQL查询语句来在建立的厨房领域知识图谱中查询其相对应的结果,最终对结果进行组合或排序而得到答案,实现了厨房领域内的问答系统。另外,以上涉及到的查询方式均是在图谱知识库中进行SPARQL查询所常见的。
如图4所示,本发明还提供了一种基于知识图谱的厨房领域问题系统,其包括:分词模块,用于获取问句并对问句进行分词处理得到分词结果;
表达式生成模块,用于根据上下文特征对分词结果进行实体及属性抽取,并生成问句所对应的语义逻辑表达式;
查询语句生成模块,用于根据语义逻辑表达式生成SPARQL查询语句;
查询模块,用于根据SPARQL查询语句在厨房领域知识图谱中查询得到结果并根据结果得到问句对应的答案。
优选地,所述分词模块还用于首先获取问句并对问句进行预处理得到字序列,然后通过HMM模型以及Vitebi解码方法对字序列进行解码并将解码后的字序列与语料库中的字标签进行类比,最终得到准确的分词结果。
优选地,所述表达式生成模块,在对分词结果进行实体及属性抽取时还用于根据概率模型对实体及属性的可信度进行评价,并根据可信度来选取实体及属性。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。
Claims (8)
1.一种基于知识图谱的厨房领域问答方法,其特征在于包括以下步骤:
分词步骤,获取问句并对问句进行分词处理得到分词结果;
表达式生成步骤,用于根据上下文特征对分词结果进行实体及属性抽取,并生成问句所对应的语义逻辑表达式;
查询语句生成步骤,根据语义逻辑表达式生成SPARQL查询语句;
查询步骤,根据SPARQL查询语句在厨房领域知识图谱中查询得到查询结果并根据查询结果得到问句对应的答案。
2.如权利要求1所述基于知识图谱的厨房领域问答方法,其特征在于:所述分词步骤具体包括:首先获取问句并对问句进行预处理得到字序列,然后通过HMM模型以及Vitebi解码方法对字序列进行解码并将解码后的字序列与语料库中的字标签进行类比,最终得到准确的分词结果。
3.如权利要求1所述基于知识图谱的厨房领域问答方法,其特征在于:所述表达式生成步骤中,对分词结果进行实体及属性抽取时还根据概率模型对实体及属性的可信度进行评价,并根据可信度来选取实体及属性。
4.如权利要求3所述基于知识图谱的厨房领域问答方法,其特征在于:所述概率模型为CRF模型或HMM模型。
5.一种基于知识图谱的厨房领域问答系统,其特征在于包括:
分词模块,用于获取问句并对问句进行分词处理得到分词结果;
表达式生成模块,用于根据上下文特征对分词结果进行实体及属性抽取,并生成问句所对应的语义逻辑表达式;
查询语句生成模块,用于根据语义逻辑表达式生成SPARQL查询语句;
查询模块,用于根据SPARQL查询语句在厨房领域知识图谱中查询得到查询结果并根据查询结果得到问句对应的答案。
6.如权利要求5所述基于知识图谱的厨房领域问答系统,其特征在于:所述分词模块还用于首先获取问句并对问句进行预处理得到字序列,然后通过HMM模型以及Vitebi解码方法对字序列进行解码并将解码后的字序列与语料库中的字标签进行类比,最终得到准确的分词结果。
7.如权利要求5所述基于知识图谱的厨房领域问答系统,其特征在于:所述表达式生成模块,在对分词结果进行实体及属性抽取时还用于根据概率模型对实体及属性的可信度进行评价,并根据可信度来选取实体及属性。
8.如权利要求7所述基于知识图谱的厨房领域问答系统,其特征在于:所述概率模型为CRF模型或HMM模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710318042.3A CN107247736B (zh) | 2017-05-08 | 2017-05-08 | 一种基于知识图谱的厨房领域问答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710318042.3A CN107247736B (zh) | 2017-05-08 | 2017-05-08 | 一种基于知识图谱的厨房领域问答方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107247736A true CN107247736A (zh) | 2017-10-13 |
CN107247736B CN107247736B (zh) | 2020-07-14 |
Family
ID=60016507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710318042.3A Active CN107247736B (zh) | 2017-05-08 | 2017-05-08 | 一种基于知识图谱的厨房领域问答方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107247736B (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959613A (zh) * | 2018-07-17 | 2018-12-07 | 杭州电子科技大学 | 一种面向rdf知识图谱的语义近似查询方法 |
CN109271504A (zh) * | 2018-11-07 | 2019-01-25 | 爱因互动科技发展(北京)有限公司 | 基于知识图谱的推理对话的方法 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN109670024A (zh) * | 2018-12-17 | 2019-04-23 | 北京百度网讯科技有限公司 | 逻辑表达式确定方法、装置、设备和介质 |
CN109753658A (zh) * | 2018-12-29 | 2019-05-14 | 百度在线网络技术(北京)有限公司 | 交互方法和装置 |
CN109766453A (zh) * | 2019-01-18 | 2019-05-17 | 广东小天才科技有限公司 | 一种用户语料语义理解的方法及系统 |
CN109902161A (zh) * | 2019-02-01 | 2019-06-18 | 出门问问信息科技有限公司 | 问答系统的答案处理方法、装置、设备及存储介质 |
CN109933772A (zh) * | 2017-12-15 | 2019-06-25 | Tcl集团股份有限公司 | 语义分析方法及终端设备 |
CN110019710A (zh) * | 2017-11-27 | 2019-07-16 | 厦门快商通信息技术有限公司 | 一种主题森林式人机对话方法及系统 |
CN110019844A (zh) * | 2019-02-20 | 2019-07-16 | 众安信息技术服务有限公司 | 一种保险行业知识图谱问答系统构建方法及装置 |
CN110287306A (zh) * | 2019-06-26 | 2019-09-27 | 珠海格力电器股份有限公司 | 一种食谱推荐方法及设备 |
CN110298770A (zh) * | 2019-06-25 | 2019-10-01 | 四川长虹电器股份有限公司 | 一种食谱推荐系统 |
CN110472153A (zh) * | 2019-08-21 | 2019-11-19 | 宁波方太厨具有限公司 | 菜谱的推荐方法、系统、设备及存储介质 |
CN110990526A (zh) * | 2019-11-21 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 一种查询语句展示方法及相关设备 |
CN111241252A (zh) * | 2020-04-17 | 2020-06-05 | 成都数联铭品科技有限公司 | 一种问答方法及问答装置、电子设备、存储介质 |
CN111274373A (zh) * | 2020-01-16 | 2020-06-12 | 山东大学 | 一种基于知识图谱的电子病历问答方法及系统 |
CN111428018A (zh) * | 2020-03-26 | 2020-07-17 | 中国建设银行股份有限公司 | 智能问答方法及装置 |
CN111753218A (zh) * | 2020-06-28 | 2020-10-09 | 中国银行股份有限公司 | 一种热点知识确定方法和相关装置 |
CN111767381A (zh) * | 2020-06-30 | 2020-10-13 | 北京百度网讯科技有限公司 | 自动问答方法和装置 |
WO2021000555A1 (zh) * | 2019-07-03 | 2021-01-07 | 深圳追一科技有限公司 | 基于知识图谱的问答方法、装置、计算机设备和存储介质 |
CN112823332A (zh) * | 2018-10-10 | 2021-05-18 | N3有限责任公司 | 语义行业术语 |
CN113255374A (zh) * | 2021-06-02 | 2021-08-13 | 竹间智能科技(上海)有限公司 | 问答管理方法及系统 |
CN113255374B (zh) * | 2021-06-02 | 2024-06-07 | 竹间智能科技(上海)有限公司 | 问答管理方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104866593A (zh) * | 2015-05-29 | 2015-08-26 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的数据库搜索方法 |
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
CN106250393A (zh) * | 2016-07-13 | 2016-12-21 | 广州安望信息科技有限公司 | 一种基于知识图谱的短文本理解方法及装置 |
-
2017
- 2017-05-08 CN CN201710318042.3A patent/CN107247736B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104866593A (zh) * | 2015-05-29 | 2015-08-26 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的数据库搜索方法 |
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
CN106250393A (zh) * | 2016-07-13 | 2016-12-21 | 广州安望信息科技有限公司 | 一种基于知识图谱的短文本理解方法及装置 |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019710A (zh) * | 2017-11-27 | 2019-07-16 | 厦门快商通信息技术有限公司 | 一种主题森林式人机对话方法及系统 |
CN109933772A (zh) * | 2017-12-15 | 2019-06-25 | Tcl集团股份有限公司 | 语义分析方法及终端设备 |
CN109933772B (zh) * | 2017-12-15 | 2020-11-13 | Tcl科技集团股份有限公司 | 语义分析方法及终端设备 |
CN108959613B (zh) * | 2018-07-17 | 2021-09-03 | 杭州电子科技大学 | 一种面向rdf知识图谱的语义近似查询方法 |
CN108959613A (zh) * | 2018-07-17 | 2018-12-07 | 杭州电子科技大学 | 一种面向rdf知识图谱的语义近似查询方法 |
CN112823332A (zh) * | 2018-10-10 | 2021-05-18 | N3有限责任公司 | 语义行业术语 |
CN109271504B (zh) * | 2018-11-07 | 2021-06-25 | 爱因互动科技发展(北京)有限公司 | 基于知识图谱的推理对话的方法 |
CN109271504A (zh) * | 2018-11-07 | 2019-01-25 | 爱因互动科技发展(北京)有限公司 | 基于知识图谱的推理对话的方法 |
CN109670024A (zh) * | 2018-12-17 | 2019-04-23 | 北京百度网讯科技有限公司 | 逻辑表达式确定方法、装置、设备和介质 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN109753658A (zh) * | 2018-12-29 | 2019-05-14 | 百度在线网络技术(北京)有限公司 | 交互方法和装置 |
CN109753658B (zh) * | 2018-12-29 | 2023-09-19 | 百度在线网络技术(北京)有限公司 | 交互方法和装置 |
CN109766453A (zh) * | 2019-01-18 | 2019-05-17 | 广东小天才科技有限公司 | 一种用户语料语义理解的方法及系统 |
CN109902161A (zh) * | 2019-02-01 | 2019-06-18 | 出门问问信息科技有限公司 | 问答系统的答案处理方法、装置、设备及存储介质 |
CN109902161B (zh) * | 2019-02-01 | 2023-10-20 | 出门问问创新科技有限公司 | 问答系统的答案处理方法、装置、设备及存储介质 |
CN110019844A (zh) * | 2019-02-20 | 2019-07-16 | 众安信息技术服务有限公司 | 一种保险行业知识图谱问答系统构建方法及装置 |
CN110298770A (zh) * | 2019-06-25 | 2019-10-01 | 四川长虹电器股份有限公司 | 一种食谱推荐系统 |
CN110287306B (zh) * | 2019-06-26 | 2021-07-13 | 珠海格力电器股份有限公司 | 一种食谱推荐方法及设备 |
CN110287306A (zh) * | 2019-06-26 | 2019-09-27 | 珠海格力电器股份有限公司 | 一种食谱推荐方法及设备 |
WO2021000555A1 (zh) * | 2019-07-03 | 2021-01-07 | 深圳追一科技有限公司 | 基于知识图谱的问答方法、装置、计算机设备和存储介质 |
CN110472153B (zh) * | 2019-08-21 | 2024-01-19 | 宁波方太厨具有限公司 | 菜谱的推荐方法、系统、设备及存储介质 |
CN110472153A (zh) * | 2019-08-21 | 2019-11-19 | 宁波方太厨具有限公司 | 菜谱的推荐方法、系统、设备及存储介质 |
CN110990526A (zh) * | 2019-11-21 | 2020-04-10 | 腾讯科技(深圳)有限公司 | 一种查询语句展示方法及相关设备 |
CN110990526B (zh) * | 2019-11-21 | 2024-01-30 | 腾讯科技(深圳)有限公司 | 一种查询语句展示方法及相关设备 |
CN111274373B (zh) * | 2020-01-16 | 2021-06-11 | 山东大学 | 一种基于知识图谱的电子病历问答方法及系统 |
CN111274373A (zh) * | 2020-01-16 | 2020-06-12 | 山东大学 | 一种基于知识图谱的电子病历问答方法及系统 |
CN111428018A (zh) * | 2020-03-26 | 2020-07-17 | 中国建设银行股份有限公司 | 智能问答方法及装置 |
CN111428018B (zh) * | 2020-03-26 | 2024-02-06 | 中国建设银行股份有限公司 | 智能问答方法及装置 |
CN111241252B (zh) * | 2020-04-17 | 2020-08-14 | 成都数联铭品科技有限公司 | 一种问答方法及问答装置、电子设备、存储介质 |
CN111241252A (zh) * | 2020-04-17 | 2020-06-05 | 成都数联铭品科技有限公司 | 一种问答方法及问答装置、电子设备、存储介质 |
CN111753218A (zh) * | 2020-06-28 | 2020-10-09 | 中国银行股份有限公司 | 一种热点知识确定方法和相关装置 |
CN111767381A (zh) * | 2020-06-30 | 2020-10-13 | 北京百度网讯科技有限公司 | 自动问答方法和装置 |
CN113255374A (zh) * | 2021-06-02 | 2021-08-13 | 竹间智能科技(上海)有限公司 | 问答管理方法及系统 |
CN113255374B (zh) * | 2021-06-02 | 2024-06-07 | 竹间智能科技(上海)有限公司 | 问答管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107247736B (zh) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107247736A (zh) | 一种基于知识图谱的厨房领域问答方法及系统 | |
Wang et al. | Substructure similarity measurement in chinese recipes | |
CN103309886B (zh) | 一种基于交易平台的结构化信息搜索方法和装置 | |
KR101634020B1 (ko) | 서프-쇼핑을 위한 연관성 추출 시스템 및 방법 | |
CN103646032B (zh) | 一种基于本体和受限自然语言处理的数据库查询方法 | |
CN105045875B (zh) | 个性化信息检索方法及装置 | |
US20100205198A1 (en) | Search query disambiguation | |
CN102955848B (zh) | 一种基于语义的三维模型检索系统和方法 | |
TWI695277B (zh) | 自動化網站資料蒐集方法 | |
CN106709040A (zh) | 一种应用搜索方法和服务器 | |
Yamakata et al. | Feature extraction and summarization of recipes using flow graph | |
EP2224360A1 (en) | Generating a dictionary and determining a co-occurrence context for an automated ontology | |
CN104281565B (zh) | 语义词典构建方法和装置 | |
CN104899231A (zh) | 基于细粒度属性分类的感情分析引擎 | |
CN104063497A (zh) | 观点处理方法和装置以及搜索方法和装置 | |
Salameh et al. | SVG-to-RDF image semantization | |
Amano et al. | Food category representatives: Extracting categories from meal names in food recordings and recipe data | |
US8112707B2 (en) | Capturing reading styles | |
CN110750988A (zh) | 基于人工智能的起名方法 | |
Silberer et al. | Understanding visual scenes | |
Novák et al. | Cross-lingual generation and evaluation of a wide-coverage lexical semantic resource | |
Yin et al. | CDQA: An ontology-based question answering system for Chinese delicacy | |
Cunningham et al. | FOODGPT: AMachine LEARNING APPROACH TO INGREDIENT SUBSTITUTION AND RECIPE RECOMMENDATION | |
Mensa et al. | TTCSℰ: a Vectorial Resource for Computing Conceptual Similarity | |
Xing et al. | Distributed Representation of Dish Names in Food Related Web Services for Associative Search and Nutrition Estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20171013 Assignee: Jiaxing Xiaoda Intelligent Technology Co.,Ltd. Assignor: GUANGZHOU SUMMBA INFORMATION TECHNOLOGY Co.,Ltd. Contract record no.: X2023980051160 Denomination of invention: A Kitchen Domain Q&A Method and System Based on Knowledge Graph Granted publication date: 20200714 License type: Common License Record date: 20231208 |