CN110442735B - 一种成语近义词推荐方法及装置 - Google Patents
一种成语近义词推荐方法及装置 Download PDFInfo
- Publication number
- CN110442735B CN110442735B CN201910745568.9A CN201910745568A CN110442735B CN 110442735 B CN110442735 B CN 110442735B CN 201910745568 A CN201910745568 A CN 201910745568A CN 110442735 B CN110442735 B CN 110442735B
- Authority
- CN
- China
- Prior art keywords
- idiom
- target
- recommendation
- entity
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书提供一种成语近义词推荐方法及装置,其中所述方法包括:从目标文档中获取目标成语以及所述目标成语对应的至少一个特征标签;基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索;在获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,形成成语推荐列表;根据所述成语推荐列表构建所述目标成语的近义词词典,并将所述近义词词典进行展示。
Description
技术领域
本说明书涉及计算机技术领域,特别涉及一种成语近义词推荐方法、装置、计算设备及计算机可读存储介质。
背景技术
现有的网络成语词典主要提供了成语的拼音、释义、出处、近义词以及反义词等信息,通常采用关系型数据库组织和存储,在此基础上可为用户提供的有关近义词的使用方式为:首先搜索特定成语,进而查看成语的相关信息,然后通过打开返回信息提供的近义词链接,对相关近义词成语进行了解和选择。
然而,在用户进行文本撰写时往往需要查找更多类似成语用于对现有的成语进行排比或替换,此时用户必须切换到第三方的搜索平台或字典等工具进行检索,这些工具目前主要支持的是针对输入的成语返回相关成语信息,即只能提供与查找信息有关的成语近义词链接,并未提供与用户写作相关的近义词推荐,导致用户需要打开这些成语信息中部分包含近义词的链接并进行一一辨别,使得用户对第三方的搜索或字典等工具返回的成语进行较多的甄别以及筛选,破坏了用户关于文本写作思路的连续性。
发明内容
有鉴于此,本说明书实施例提供了一种成语近义词推荐方法、装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种成语近义词推荐方法,包括:
从目标文档中获取目标成语以及所述目标成语对应的至少一个特征标签;
基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索;
在获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,形成成语推荐列表;
根据所述成语推荐列表构建所述目标成语的近义词词典,并将所述近义词词典进行展示。
根据本说明书实施例的第二方面,提供了一种成语近义词推荐装置,包括:
文档识别模块,被配置为从目标文档中获取目标成语以及所述目标成语对应的至少一个特征标签;
成语推荐模块,被配置为基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索;
推荐列表模块,被配置为在获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,形成成语推荐列表;
词典构建模块,被配置为根据所述成语推荐列表构建所述目标成语的近义词词典,并将所述近义词词典进行展示。
根据本说明书实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述成语近义词推荐方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述成语近义词推荐方法的步骤。
针对用户在写作过程中已经输入有用于描述特定属性特征标签的目标成语的情况下,为满足用户查找与所述目标成语的近义词成语的需求,通过对目标文档中出现的目标成语以及所述目标成语对应的至少一个特征标签在预设的成语知识图谱中按照推荐条件进行检索,并返回目标成语的成语推荐列表实现近义词成语推荐,方便用户在写作工具中直接获取到推荐的成语近义词并选择使用,无需切换到第三方工具、也无需对推荐成语可行性进行判断,使用户选用成语的路径缩短并保证了成语选择的准确性,而且基于标签的成语知识图谱支持用户可以从多个维度获取成语的信息。
附图说明
图1是本申请实施例提供的计算设备的结构框图;
图2是本申请实施例提供的成语近义词推荐方法的流程图;
图3是是本申请实施例提供的成语近义词推荐方法的另一流程图;
图4是是本申请实施例提供的成语知识图谱结构示意图;
图5是是本申请实施例提供的成语近义词推荐方法的另一流程图;
图6是是本申请实施例提供的成语近义词推荐方法的逻辑推导程图;
图7是是本申请实施例提供的成语近义词推荐方法的另一流程图;
图8是是本申请实施例提供的成语近义词推荐方法的另一流程图;
图9是是本申请实施例提供的成语近义词推荐方法的另一流程图;
图10是本申请实施例提供的成语近义词推荐装置的结构示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施例涉及的名词术语进行解释。
知识图谱:知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。
实体:实体指的是具有可区别性且独立存在的某种事物,例如人名、城市名称、植物名称、商品名称等,实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。
属性:从一个实体指向它的属性值,不同的属性类型对应于不同类型属性的边,属性主要指对象的特征信息,例如“面积”、“人口”、“首都”是几种不同的属性,属性值主要指属性的值,例如960万平方公里等。
关系:在知识图谱上,关系则是一个把若干个图节点(实体、语义类、属性值)映射到布尔值的函数。
三元组:三元组是知识图谱的一种通用表示方式,三元组的基本形式主要包括(头实体-关系-尾实体)和(实体-属性-属性值)等。
多模式匹配算法:模式匹配的对象一般包括文本、图像等,对文本的模式匹配一般是指在文本数据中搜索预定义的关键字,模式匹配一般通过模式匹配算法来实现,模式匹配算法按照匹配模式的数目可分为单模式匹配算法和多模式匹配算法,多模式匹配算法时可以同时对多个模式进行匹配的算法。
在本申请中,提供了一种成语近义词推荐方法、装置、计算设备及计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一实施例的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。
计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备100还可以是移动式或静止式的服务器。
其中,处理器120可以执行图2所示方法中的步骤。图2是示出了根据本申请一实施例的成语近义词推荐方法的示意性流程图,包括步骤202至步骤208。
步骤202:从目标文档中获取目标成语以及所述目标成语对应的至少一个特征标签。
在本申请的实施例中,在用户通过终端设备进行文字输入并生成目标文档的过程中,系统可以对所述目标文档的语料进行实时监控,在从所述目标文档中识别出某一特定的成语语料,且该成语语料是描述某一特定的主语实体对应的至少一个特征标签的情况下,系统触发推荐机制从目标文档中获取该成语语料作为目标成语,并同时获取所述目标成语对应的至少一个特征标签即所述目标成语的属性或描述信息,例如,在用户输入的目标文档“小芳的容貌可谓是沉鱼落雁”的过程中,在所述目标文档中出现了某一特定的成语语料“沉鱼落雁”,且该成语语料是描述主语实体“小芳”的一个特征标签“容貌”的情况下,则系统可以识别出成语语料“沉鱼落雁”,并将成语语料“沉鱼落雁”作为目标成语进行信息推荐。当然,在仅找到所述目标成语但未能找到所述目标成语对应的至少一个特征标签的情况下,视为不需要进行成语推荐并返回空值。
步骤204:基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索。
在本申请的实施例中,系统采用基于特征标签的成语知识图谱构建方法,构建得到一个包含有近义词关系的成语知识图谱,系统在获取所述目标成语以及所述目标成语对应的至少一个特征标签之后,根据预设的推荐条件在所述成语知识图谱中进行检索,以获取推荐成语,例如,对于目标成语“沉鱼落雁”和其对应的特征标签“容貌”,系统根据预设的推荐条件在所述成语知识图谱中进行检索,以获取目标成语“沉鱼落雁”对应的近义词成语作为推荐成语。
步骤206:在获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,形成成语推荐列表。
在本申请的实施例中,在从所述成语知识图谱中获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,构建包含有所述推荐成语的成语推荐列表并返回,例如,对于目标成语“沉鱼落雁”和其对应的特征标签“容貌”,系统根据预设的推荐条件在所述成语知识图谱中进行检索,获取到了满足推荐条件的推荐成语“闭月羞花”、“花容月貌”和“国色天香”,则系统构建包含有所述推荐成语“闭月羞花”、“花容月貌”和“国色天香”的成语推荐列表并返回。当然,在没有获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,则返回为空。
步骤208:根据所述成语推荐列表构建所述目标成语的近义词词典,并将所述近义词词典进行展示。
在本申请的实施例中,系统根据所述成语推荐列表中的每个推荐成语,以及每个推荐成语对应的属性信息包括拼音、释义和出处等,构建所述目标成语的近义词词典,并将近义词词典展示给用户。
本申请针对用户在写作过程中已经输入有用于描述特定属性特征标签的目标成语的情况下,为满足用户查找与所述目标成语的近义词成语的需求,通过对目标文档中出现的目标成语以及所述目标成语对应的至少一个特征标签在预设的成语知识图谱中按照推荐条件进行检索,并返回目标成语的成语推荐列表实现近义词成语推荐,方便用户在写作工具中直接获取到推荐的成语近义词并选择使用,无需切换到第三方工具、也无需对推荐成语可行性进行判断,使用户选用成语的路径缩短并保证了成语选择的准确性,而且基于标签的成语知识图谱支持用户可以从多个维度获取成语的信息。
在本申请的一个实施例中,如图3所示,在从目标文档中获取目标成语以及所述目标成语对应的至少一个特征标签之前,还包括步骤302至步骤304:
步骤302:从预设的语料数据库中获取结构化数据。
在本申请的实施例中,系统可以从现有的语料数据库例如网络百科、网络词典或专门数据库中获取结构化数据,所述结构化数据包括的多个成语实体、多个特征标签、成语属性信息、多个成语实体之间的近义词关系信息以及成语实体与特征标签之间的标签关系信息。
步骤304:根据所述结构化数据构建成语知识图谱,以使所述成语知识图谱中包含有互为近义词关系的成语实体以及每个所述成语实体对应的属性和至少一个特征标签。
在本申请的实施例中,如图4所示,在构建的所述成语知识图谱中存在近义词关系,假设目标成语B和成语实体C是所述成语知识图谱中的成语实体,并且目标成语B和成语实体C之间的关系为“近义词S”则可以表示为三元组(B,S,C)的联结关系,即在满足所述推荐条件下目标成语B和成语实体C在目标文档中可以进行替换,例如,将目标文档为“小芳的容貌可谓是沉鱼落雁”中的“沉鱼落雁”替换为近义词“闭月羞花”,并不影响所述目标文档的整体表达;此外,在目标成语B与成语实体C互为近义词的情况下,目标成语B与成语实体C之间拥有至少一个相同的所述特征标签r,则同样可以以特征标签r为关系表示为近义词三元组(B,r,C)的联结关系,例如,成语实体“沉鱼落雁”与成语实体“闭月羞花”都是用于形容特征标签“容貌”的成语,则成语实体“沉鱼落雁”、成语实体“闭月羞花”与特征标签“容貌”之间可以表示为三元组(沉鱼落雁,容貌,闭月羞花)的联结关系。
本申请通过结构化数据构建成语知识图谱,以使所述成语知识图谱中包含有互为近义词关系的成语实体以及每个所述成语实体对应的属性和至少一个特征标签,使得系统能够基于关系型数据库快速准确的找到目标成语的近义词。
在本申请的另一个实施例中,如图5所示,所述从目标文档中获取目标成语以及所述目标成语对应的至少一个特征标签包括步骤502至步骤506:
步骤502:获取用户输入的目标文档对应的文本数据。
在本申请的实施例中,系统在用户进行目标文档输入的过程中对所述目标文档进行自然语言处理,得到所述目标文档对应的文本数据。
步骤504:基于多模式匹配算法以包含在所述成语知识图谱中的成语实体为关键词,在所述文本数据中查找包含在所述成语知识图谱中的成语语料。
在本申请的实施例中,系统基于多模式匹配算法,以包含在所述成语知识图谱中的成语实体为关键词,在用户进行目标文档输入的过程中对所述目标文档对应的文本数据中进行监控和检测,确定所述文本数据中是否包含有存在与所述成语知识图谱中的成语语料。
步骤506:在搜索到包含在所述成语知识图谱中的成语语料的情况下,基于多模式匹配算法以包含在所述成语知识图谱中的特征标签为关键词,在所述成语语料的上下文中搜索所述成语语料对应的至少一个特征标签。
在本申请的实施例中,如图6所示,系统在检测到所述包含在所述成语知识图谱中的成语语料的情况下将触发推荐机制,即基于多模式匹配算法以包含在所述成语知识图谱中的特征标签为关键词,在所述成语语料的上下文位置处搜索所述成语语料对应的至少一个特征标签R,在搜索到所述成语语料对应的至少一个特征标签R的情况下,系统确定所述成语语料为所述目标成语B并开始针对目标成语B进行推荐,即以所述目标文档的主语实体A、每个特征标签R和目标成语B分别为头实体、关系和尾实体构建至少一个目标三元组(A,R,B),例如,对于目标文档“小芳的容貌可谓是沉鱼落雁”,其中,经过多模式匹配算法可以确定主语实体为“小芳”,目标成语的特征标签为“容貌”,目标成语为“沉鱼落雁”,则系统可以构建一个目标三元组(小芳,容貌,沉鱼落雁)。
本申请通过构建至少一个目标三元组(A,R,B),将搜索条件映射为具体的规则与形式,使得系统能够在成语知识图谱中准确高效的找到目标成语的推荐成语。
在本申请的另一个实施例中,如图7所示,所述基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索包括步骤702至步骤706:
步骤702:从所述成语知识图谱中检索出具有全部所述目标成语对应的至少一个特征标签的至少一个所述成语实体。
在本申请的实施例中,如图6所示,系统基于所述至少一个目标三元组(A,R,B),通过多模式匹配算法返回所述成语知识图谱中具有全部所述特征标签R的至少一个所述成语实体C。
步骤704:根据所述至少一个所述成语实体构建预推荐列表。
在本申请的实施例中,系统根据至少一个所述成语实体C构建预推荐列表L。
步骤706:基于所述成语知识图谱,在所述预推荐列表中检索出与所述目标成语存在近义词关系的至少一个所述成语实体作为至少一个推荐成语。
在本申请的实施例中,如图6所示,已知当目标成语B与成语实体C拥有近义词关系时存在近义词三元组(B,r,C)的联结关系,若所述目标成语B与成语实体C同时拥有至少一个特征标签R,即r=R时满足近义词三元组(B,r,C),则根据假言三段论可以推理出:目标三元组(A,R,B)∧近义词三元组(B,r,C)推荐三元组(A,R,C),即成语实体C满足形容主语实体A的至少一个特征标签R的推荐条件,因此,在成语实体C既存在于预推荐列表L中又是目标成语B的近义词的情况下,所述成语实体C为满足所述推荐条件的推荐成语。
在本申请的另一个实施例中,如图8所示,所述基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索包括步骤802至步骤806:
步骤802:从所述成语知识图谱中检索出与所述目标成语存在近义词关系的至少一个成语实体。
在本申请的实施例中,如图6所示,系统基于所述至少一个目标三元组(A,R,B),通过多模式匹配算法返回所述成语知识图谱中检索出与所述目标成语存在近义词关系的至少一个成语实体C。
步骤804:根据所述至少一个所述成语实体构建预推荐列表。
在本申请的实施例中,系统根据至少一个所述成语实体C构建预推荐列表L。
步骤806:基于所述成语知识图谱,在所述预推荐列表中检索出具有全部所述目标成语对应的至少一个特征标签的至少一个所述成语实体作为至少一个推荐成语。
在本申请的实施例中,如图6所示,已知当目标成语B与成语实体C拥有近义词关系时存在近义词三元组(B,r,C)的联结关系,若所述目标成语B与成语实体C同时拥有至少一个特征标签R,即r=R时满足近义词三元组(B,r,C),则根据假言三段论可以推理出:目标三元组(A,R,B)∧近义词三元组(B,r,C)推荐三元组(A,R,C),即成语实体C满足形容主语实体A的至少一个特征标签R的推荐条件,因此,在成语实体C既是目标成语B的近义词又存在于预推荐列表L中的情况下,所述成语实体C为满足所述推荐条件的推荐成语。
本申请通过至少一个目标三元组(A,R,B)和近义词三元组(B,r,C)之间的逻辑推导,将推荐条件映射为具体的规则与形式,即要求成语实体C既是目标成语B的近义词又具有相同的特征标签R,通过利用成语知识图谱中节点之间的关系确定满足所述推荐条件的推荐成语,方便用户在写作工具中直接获取到推荐的成语近义词并选择使用。
在本申请的另一个实施例中,如图9所示,所述根据所述成语推荐列表构建所述目标成语的近义词词典包括步骤902至步骤904:
步骤902:从所述成语知识图谱中获取所述成语推荐列表中每个所述推荐成语对应的成语属性信息。
在本申请的实施例中,如图4所示,所述每个所述推荐成语对应的成语属性信息包括所述推荐成语的拼音、释义、出处、成语故事和词频等等。
步骤904:以每个所述推荐成语为索引,将每个所述推荐成语对应的成语属性信息添加至所述近义词词典内,形成所述目标成语的近义词词典。
在本申请的实施例中,系统以每个所述推荐成语为键(key),以该推荐成语的成语属性信息列表为值(value),添加到所述近义词词典中,当然,如果没有满足推荐条件的推荐成语,则返回为空。
本申请通过构建所述目标成语的近义词词典,使得用户在写作过程中无需切换到第三方工具、也无需对推荐成语可行性进行判断,使用户选用成语的路径缩短并保证了成语选择的准确性,而且基于标签的成语知识图谱支持用户可以从多个维度获取成语的信息。
与上述方法实施例相对应,本说明书还提供了成语近义词推荐装置实施例,图10示出了本说明书一个实施例的成语近义词推荐装置的结构示意图。如图10所示,该装置包括:
文档识别模块101,被配置为从目标文档中获取目标成语以及所述目标成语对应的至少一个特征标签;
成语推荐模块102,被配置为基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索;
推荐列表模块103,被配置为在获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,形成成语推荐列表;
词典构建模块104,被配置为根据所述成语推荐列表构建所述目标成语的近义词词典,并将所述近义词词典进行展示。
可选的,所述装置还包括:
数据获取模块105,被配置为从预设的语料数据库中获取结构化数据,所述结构化数据包括的多个成语实体、多个特征标签、成语属性信息、多个成语实体之间的近义词关系信息以及成语实体与特征标签之间的标签关系信息;
图谱构建模块106,被配置为根据所述结构化数据构建成语知识图谱,以使所述成语知识图谱中包含有互为近义词关系的成语实体以及每个所述成语实体对应的属性和至少一个特征标签。
可选的,所述文档识别模块101包括:
文本获取单元,被配置为获取用户输入的目标文档对应的文本数据;
第一模式匹配单元,被配置为基于多模式匹配算法以包含在所述成语知识图谱中的成语实体为关键词,在所述文本数据中查找所述目标成语;
第二模式匹配单元,被配置为在搜索到所述目标成语的情况下,基于多模式匹配算法以包含在所述成语知识图谱中的特征标签为关键词,在所述目标成语的上下文中搜索所述目标成语对应的至少一个特征标签。
可选的,所述成语推荐模块102包括:
标签检索单元,被配置为从所述成语知识图谱中检索出具有全部所述目标成语对应的至少一个特征标签的至少一个所述成语实体;
列表构建单元,被配置为根据所述至少一个所述成语实体构建预推荐列表;
成语检索单元,被配置为基于所述成语知识图谱,在所述预推荐列表中检索出与所述目标成语存在近义词关系的至少一个所述成语实体作为至少一个推荐成语。
可选的,所述成语推荐模块102包括:
成语检索单元,被配置为从所述成语知识图谱中检索出与所述目标成语存在近义词关系的至少一个成语实体;
列表构建单元,被配置为根据所述至少一个所述成语实体构建预推荐列表;
标签检索单元,被配置为基于所述成语知识图谱,在所述预推荐列表中检索出具有全部所述目标成语对应的至少一个特征标签的至少一个所述成语实体作为至少一个推荐成语。
可选的,所述词典构建模块104包括:
属性获取单元,被配置为从所述成语知识图谱中获取所述成语推荐列表中每个所述推荐成语对应的成语属性信息;
词典构建单元,被配置为以每个所述推荐成语为索引,将每个所述推荐成语对应的成语属性信息添加至所述近义词词典内,形成所述目标成语的近义词词典。
本申请针对用户在写作过程中已经输入有用于描述特定属性特征标签的目标成语的情况下,为满足用户查找与所述目标成语的近义词成语的需求,通过对目标文档中出现的目标成语以及所述目标成语对应的至少一个特征标签在预设的成语知识图谱中按照推荐条件进行检索,并返回目标成语的成语推荐列表实现近义词成语推荐,方便用户在写作工具中直接获取到推荐的成语近义词并选择使用,无需切换到第三方工具、也无需对推荐成语可行性进行判断,使用户选用成语的路径缩短并保证了成语选择的准确性,而且基于标签的成语知识图谱支持用户可以从多个维度获取成语的信息。
本申请一实施例还提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现以下步骤:
从目标文档中获取目标成语以及所述目标成语对应的至少一个特征标签;
基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索;
在获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,形成成语推荐列表;
根据所述成语推荐列表构建所述目标成语的近义词词典,并将所述近义词词典进行展示。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述成语近义词推荐方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该计算机可读存储介质的技术方案与上述的成语近义词推荐方法的技术方案属于同一构思,计算机可读存储介质的技术方案未详细描述的细节内容,均可以参见上述成语近义词推荐方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。
Claims (14)
1.一种成语近义词推荐方法,其特征在于,包括:
从目标文档中获取目标成语,基于多模式匹配算法以包含在成语知识图谱中的特征标签为关键词,在所述目标成语的上下文中搜索所述目标成语对应的至少一个特征标签;
基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索;
在获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,形成成语推荐列表;
根据所述成语推荐列表构建所述目标成语的近义词词典,并将所述近义词词典进行展示。
2.根据权利要求1所述的方法,其特征在于,在从目标文档中获取目标成语,基于多模式匹配算法以包含在成语知识图谱中的特征标签为关键词,在所述目标成语的上下文中搜索所述目标成语对应的至少一个特征标签之前,还包括:
从预设的语料数据库中获取结构化数据,所述结构化数据包括的多个成语实体、多个特征标签、成语属性信息、多个成语实体之间的近义词关系信息以及成语实体与特征标签之间的标签关系信息;
根据所述结构化数据构建成语知识图谱,以使所述成语知识图谱中包含有互为近义词关系的成语实体以及每个所述成语实体对应的属性和至少一个特征标签。
3.根据权利要求2所述的方法,其特征在于,所述从目标文档中获取目标成语,基于多模式匹配算法以包含在成语知识图谱中的特征标签为关键词,在所述目标成语的上下文中搜索所述目标成语对应的至少一个特征标签包括:
获取用户输入的目标文档对应的文本数据;
基于多模式匹配算法以包含在所述成语知识图谱中的成语实体为关键词,在所述文本数据中查找所述目标成语;
在搜索到所述目标成语的情况下,基于多模式匹配算法以包含在所述成语知识图谱中的特征标签为关键词,在所述目标成语的上下文中搜索所述目标成语对应的至少一个特征标签。
4.根据权利要求3所述的方法,其特征在于,所述基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索,包括:
从所述成语知识图谱中检索出具有全部所述目标成语对应的至少一个特征标签的至少一个所述成语实体;
根据所述至少一个所述成语实体构建预推荐列表;
基于所述成语知识图谱,在所述预推荐列表中检索出与所述目标成语存在近义词关系的至少一个所述成语实体作为至少一个推荐成语。
5.根据权利要求3所述的方法,其特征在于,所述基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索,包括:
从所述成语知识图谱中检索出与所述目标成语存在近义词关系的至少一个成语实体;
根据所述至少一个所述成语实体构建预推荐列表;
基于所述成语知识图谱,在所述预推荐列表中检索出具有全部所述目标成语对应的至少一个特征标签的至少一个所述成语实体作为至少一个推荐成语。
6.根据权利要求1所述的方法,其特征在于,所述根据所述成语推荐列表构建所述目标成语的近义词词典包括:
从所述成语知识图谱中获取所述成语推荐列表中每个所述推荐成语对应的成语属性信息;
以每个所述推荐成语为索引,将每个所述推荐成语对应的成语属性信息添加至所述近义词词典内,形成所述目标成语的近义词词典。
7.一种成语近义词推荐装置,其特征在于,包括:
文档识别模块,被配置为从目标文档中获取目标成语,基于多模式匹配算法以包含在成语知识图谱中的特征标签为关键词,在所述目标成语的上下文中搜索所述目标成语对应的至少一个特征标签;
成语推荐模块,被配置为基于所述目标成语以及所述目标成语对应的至少一个特征标签,在预设的成语知识图谱中按照推荐条件进行检索;
推荐列表模块,被配置为在获取到满足所述推荐条件的至少一个所述目标成语对应的推荐成语的情况下,形成成语推荐列表;
词典构建模块,被配置为根据所述成语推荐列表构建所述目标成语的近义词词典,并将所述近义词词典进行展示。
8.根据权利要求7所述的装置,其特征在于,还包括:
数据获取模块,被配置为从预设的语料数据库中获取结构化数据,所述结构化数据包括的多个成语实体、多个特征标签、成语属性信息、多个成语实体之间的近义词关系信息以及成语实体与特征标签之间的标签关系信息;
图谱构建模块,被配置为根据所述结构化数据构建成语知识图谱,以使所述成语知识图谱中包含有互为近义词关系的成语实体以及每个所述成语实体对应的属性和至少一个特征标签。
9.根据权利要求8所述的装置,其特征在于,所述文档识别模块包括:
文本获取单元,被配置为获取用户输入的目标文档对应的文本数据;
第一模式匹配单元,被配置为基于多模式匹配算法以包含在所述成语知识图谱中的成语实体为关键词,在所述文本数据中查找所述目标成语;
第二模式匹配单元,被配置为在搜索到所述目标成语的情况下,基于多模式匹配算法以包含在所述成语知识图谱中的特征标签为关键词,在所述目标成语的上下文中搜索所述目标成语对应的至少一个特征标签。
10.根据权利要求9所述的装置,其特征在于,所述成语推荐模块包括:
标签检索单元,被配置为从所述成语知识图谱中检索出具有全部所述目标成语对应的至少一个特征标签的至少一个所述成语实体;
列表构建单元,被配置为根据所述至少一个所述成语实体构建预推荐列表;
成语检索单元,被配置为基于所述成语知识图谱,在所述预推荐列表中检索出与所述目标成语存在近义词关系的至少一个所述成语实体作为至少一个推荐成语。
11.根据权利要求9所述的装置,其特征在于,所述成语推荐模块包括:
成语检索单元,被配置为从所述成语知识图谱中检索出与所述目标成语存在近义词关系的至少一个成语实体;
列表构建单元,被配置为根据所述至少一个所述成语实体构建预推荐列表;
标签检索单元,被配置为基于所述成语知识图谱,在所述预推荐列表中检索出具有全部所述目标成语对应的至少一个特征标签的至少一个所述成语实体作为至少一个推荐成语。
12.根据权利要求7所述的装置,其特征在于,所述词典构建模块包括:
属性获取单元,被配置为从所述成语知识图谱中获取所述成语推荐列表中每个所述推荐成语对应的成语属性信息;
词典构建单元,被配置为以每个所述推荐成语为索引,将每个所述推荐成语对应的成语属性信息添加至所述近义词词典内,形成所述目标成语的近义词词典。
13.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-6任意一项所述方法的步骤。
14.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-6任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910745568.9A CN110442735B (zh) | 2019-08-13 | 2019-08-13 | 一种成语近义词推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910745568.9A CN110442735B (zh) | 2019-08-13 | 2019-08-13 | 一种成语近义词推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110442735A CN110442735A (zh) | 2019-11-12 |
CN110442735B true CN110442735B (zh) | 2022-05-13 |
Family
ID=68435113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910745568.9A Active CN110442735B (zh) | 2019-08-13 | 2019-08-13 | 一种成语近义词推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110442735B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110990556B (zh) * | 2019-12-06 | 2023-07-25 | 北京金山数字娱乐科技有限公司 | 成语推荐方法及装置、成语推荐模型的训练方法及装置 |
CN111008702A (zh) * | 2019-12-06 | 2020-04-14 | 北京金山数字娱乐科技有限公司 | 一种成语推荐模型的训练方法及装置 |
CN112364180A (zh) * | 2020-11-26 | 2021-02-12 | 上海天旦网络科技发展有限公司 | 基于知识图谱的标签定义和计算的方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108984656A (zh) * | 2018-06-28 | 2018-12-11 | 北京春雨天下软件有限公司 | 医学标签推荐方法及装置 |
CN110110205A (zh) * | 2018-01-16 | 2019-08-09 | 北京京东金融科技控股有限公司 | 推荐信息生成方法与装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7185001B1 (en) * | 2000-10-04 | 2007-02-27 | Torch Concepts | Systems and methods for document searching and organizing |
JP5338835B2 (ja) * | 2011-03-24 | 2013-11-13 | カシオ計算機株式会社 | 類義語リストの生成方法および生成装置、当該類義語リストを用いた検索方法および検索装置、ならびに、コンピュータプログラム |
CN105718071A (zh) * | 2016-01-19 | 2016-06-29 | 努比亚技术有限公司 | 输入法中推荐联想词汇的终端及方法 |
US11086883B2 (en) * | 2016-04-15 | 2021-08-10 | Google Llc | Systems and methods for suggesting content to a writer based on contents of a document |
CN109840321B (zh) * | 2017-11-29 | 2022-02-01 | 腾讯科技(深圳)有限公司 | 文本推荐方法、装置及电子设备 |
CN109766431A (zh) * | 2018-12-24 | 2019-05-17 | 同济大学 | 一种基于词义主题模型的社交网络短文本推荐方法 |
CN109977233B (zh) * | 2019-03-15 | 2021-02-23 | 北京金山数字娱乐科技有限公司 | 一种成语知识图谱构建方法及装置 |
CN109947903B (zh) * | 2019-03-15 | 2023-02-07 | 北京金山数字娱乐科技有限公司 | 一种成语查询方法及装置 |
CN109933803B (zh) * | 2019-03-25 | 2023-06-02 | 北京金山数字娱乐科技有限公司 | 一种成语信息展示方法、展示装置、电子设备及存储介质 |
-
2019
- 2019-08-13 CN CN201910745568.9A patent/CN110442735B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110205A (zh) * | 2018-01-16 | 2019-08-09 | 北京京东金融科技控股有限公司 | 推荐信息生成方法与装置 |
CN108984656A (zh) * | 2018-06-28 | 2018-12-11 | 北京春雨天下软件有限公司 | 医学标签推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110442735A (zh) | 2019-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11222167B2 (en) | Generating structured text summaries of digital documents using interactive collaboration | |
CN110147437B (zh) | 一种基于知识图谱的搜索方法及装置 | |
CN109670163B (zh) | 信息识别方法、信息推荐方法、模板构建方法及计算设备 | |
CN110442735B (zh) | 一种成语近义词推荐方法及装置 | |
US20220254507A1 (en) | Knowledge graph-based question answering method, computer device, and medium | |
CN113268569B (zh) | 基于语义的关联词查找方法及装置、电子设备、存储介质 | |
CN110633577A (zh) | 文本脱敏方法以及装置 | |
CN107783976B (zh) | 用户信息挖掘方法及装置 | |
CN111414763A (zh) | 一种针对手语计算的语义消歧方法、装置、设备及存储装置 | |
CN112633000B (zh) | 一种文本中实体的关联方法、装置、电子设备及存储介质 | |
WO2023010427A1 (en) | Systems and methods generating internet-of-things-specific knowledge graphs, and search systems and methods using such graphs | |
US20230030086A1 (en) | System and method for generating ontologies and retrieving information using the same | |
US9501559B2 (en) | User-guided search query expansion | |
CN112528681A (zh) | 跨语言检索及模型训练方法、装置、设备和存储介质 | |
CN112579733A (zh) | 规则匹配方法、规则匹配装置、存储介质及电子设备 | |
CN111325018A (zh) | 一种基于web检索和新词发现的领域词典构建方法 | |
US20190303437A1 (en) | Status reporting with natural language processing risk assessment | |
CN113342944B (zh) | 一种语料泛化方法、装置、设备及存储介质 | |
CN114138969A (zh) | 文本处理方法及装置 | |
CN110990556A (zh) | 成语推荐方法及装置、成语推荐模型的训练方法及装置 | |
CN110688838B (zh) | 一种成语同义词列表的生成方法及装置 | |
CN111930891B (zh) | 基于知识图谱的检索文本扩展方法及相关装置 | |
CN117435685A (zh) | 文档检索方法、装置、计算机设备、存储介质和产品 | |
CN110750989B (zh) | 一种语句分析的方法及装置 | |
CN114296561A (zh) | 用户词库的获取方法、候选词的生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |