CN106997341B - 一种创新方案匹配方法、装置、服务器及系统 - Google Patents

一种创新方案匹配方法、装置、服务器及系统 Download PDF

Info

Publication number
CN106997341B
CN106997341B CN201710173098.4A CN201710173098A CN106997341B CN 106997341 B CN106997341 B CN 106997341B CN 201710173098 A CN201710173098 A CN 201710173098A CN 106997341 B CN106997341 B CN 106997341B
Authority
CN
China
Prior art keywords
engineering parameter
parameter
inventive principle
dictionary
standard engineering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710173098.4A
Other languages
English (en)
Other versions
CN106997341A (zh
Inventor
郭伟
宋伟凤
鹿旭东
崔立真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nugget (Jinan) Education Technology Co.,Ltd.
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201710173098.4A priority Critical patent/CN106997341B/zh
Publication of CN106997341A publication Critical patent/CN106997341A/zh
Application granted granted Critical
Publication of CN106997341B publication Critical patent/CN106997341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本发明公开了一种创新方案匹配方法、装置、服务器及系统,该方法包括根据标准工程参数建立语义本体,建立发明原理分别与专利和历史解决方案之间的对应关系,最后形成TRIZ矛盾矩阵法知识网络;获取发明创意需求描述,并从发明创意需求描述中提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明原理及与其相关的专利及历史解决方案,并将专利及历史解决方案分别与发明原理的相关度进行计算并排序;将得到的历史解决方案作为训练样本,根据训练样本中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自动输入至语言模型,自动生成初始解决方案并输出。

Description

一种创新方案匹配方法、装置、服务器及系统
技术领域
本发明涉及一种创新方案匹配方法、装置、服务器及系统。
背景技术
大数据环境下,企业在进行创新活动时,通过数据分析和众智得到新的创意。如何充分利用现有资源和技术解决创新中的难题,由创意得到可实施的创新方案,是当前创新的难点。
目前较为成熟的方法是TRIZ矛盾解决原理。对应TRIZ中的技术矛盾和物理矛盾,矛盾解决原理分为技术矛盾解决原理和物理矛盾解决原理。技术矛盾解决原理:TRIZ提出描述技术矛盾的39个通用工程参数,如温度、速度、强度等,同时,为了解决技术矛盾,TRIZ理论提出了40项发明原理,如分割、分离、不对称等。TRIZ中利用矛盾矩阵将描述技术矛盾的39个工程参数与40条发明原理建立了对应关系,通过矛盾中的两个参数可以得到相应的发明原理。物理矛盾解决原理:TRIZ提出采用分离原理解决物理矛盾的方法,包括空间分离和时间分离、基于条件的分离、整体与部分的分离。另外,解决物理矛盾的分离原理与解决技术矛盾的发明原理之间也存在关系,一条分离原理可以与多条发明原理存在对应关系。
TRIZ矛盾解决原理目前广泛应用到企业解决创新问题过程中,但从寻找矛盾参数到将对应的发明原理应用到实际问题中,均需要依赖专业研究人员的知识水平和经验,具有一定局限性,实施效果因人而异。
发明内容
为了解决现有技术的不足,本发明的第一目的是提供一种创新方案匹配方法。
本发明的一种创新方案匹配方法,包括:
根据标准工程参数建立语义本体,以及发明原理分别与专利和历史解决方案之间的对应关系,进而利用TRIZ矛盾矩阵将标准工程参数、发明原理、专利和历史解决方案四者相关联,最后形成TRIZ矛盾矩阵法知识网络;
获取发明创意需求描述,并从发明创意需求描述中提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明原理及与其相关的专利及历史解决方案,并将专利及历史解决方案分别与发明原理的相关度进行计算并排序;
将得到的历史解决方案作为训练样本,根据训练样本中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自动输入至语言模型,自动生成初始解决方案并输出。
进一步的,根据标准工程参数建立语义本体的具体过程为:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词库中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词汇库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数库的参数映射到标准工程参数库中,进而建立标准工程参数词典,最终得到语义本体。
本发明通过建立标准工程参数词典,来构建语义本体,提高了后续从发明创意需求描述中提取非标准工程参数的准确性和效率。
进一步的,建立发明原理与专利之间的对应关系的具体过程包括:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一个向量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量进行降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间的对应关系,不需要依赖专业研究人员的知识水平和经验,为准确获取与发明创意需求描述相匹配的初始方案奠定了基础。
进一步的,建立发明原理与历史解决方案之间的对应关系的具体过程包括:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数库,提取发明创意需求描述中的欲改善和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数和将恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进而得到与推荐的发明原理相对应的专利和历史解决方案。
利用TRIZ矛盾矩阵法知识网络,得到发明原理与专利之间的对应关系,不需要依赖专业研究人员的知识水平和经验,为准确获取与发明创意需求描述相匹配的初始方案奠定了基础。
本发明的第二目的是提供一种创新方案匹配装置。
本发明的一种创新方案匹配装置,包括:
TRIZ矛盾矩阵法知识网络构建模块,其用于根据标准工程参数建立语义本体,以及发明原理分别与专利和历史解决方案之间的对应关系,进而利用TRIZ矛盾矩阵将标准工程参数、发明原理、专利和历史解决方案四者相关联,最后形成TRIZ矛盾矩阵法知识网络;
创新方案匹配模块,其用于获取发明创意需求描述,并从发明创意需求描述中提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明原理及与其相关的专利及历史解决方案,并将专利及历史解决方案分别与发明原理的相关度进行计算并排序;
初始解决方案生成模块,其用于将得到的历史解决方案作为训练样本,根据训练样本中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自动输入至语言模型,自动生成初始解决方案并输出。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还包括语义本体建立模块,其用于:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词库中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词汇库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数库的参数映射到标准工程参数库中,进而建立标准工程参数词典,最终得到语义本体。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还包括发明原理与专利关系建立模块,其用于:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一个向量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量进行降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间的对应关系。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还发明原理与历史解决方案关系建立模块,其用于:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数库,提取发明创意需求描述中的欲改善和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数和将恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进而得到与推荐的发明原理相对应的专利和历史解决方案。
本发明的第三目的是提供一种创新方案匹配服务器。
本发明的一种创新方案匹配服务器,包括上述所述的一种创新方案匹配装置。
本发明的第四目的是提供一种创新方案匹配系统。
本发明的一种创新方案匹配系统,包括如所述的一种创新方案匹配服务器。
与现有技术相比,本发明的有益效果是:
本发明采用大数据处理技术手段在非标准工程参数、标准工程参数、发明原理、专利和历史解决方案之间建立联系,形成知识网络,获得从创意直接得到相关发明原理、专利和历史解决方案的效果;这样从寻找矛盾参数到将对应的发明原理应用到实际问题中,不需要依赖专业研究人员的知识水平和经验,采用机器学习技术手段,建立语言模型,能够自动准确地获取初始解决方案。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是创新方案匹配方法流程图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明中的“标准工程参数”指的是:TRIZ的39标准工程参数:
例如:
(1)运动物体的重量是指在重力场中运动物体多受到;
(2)静止物体的重量是指在重力场中静止物体所受到;
(3)运动物体的长度是指运动物体的任意线性尺寸;
(4)静止物体的长度是指静止物体的任意线性尺寸。
“语义本体”:指的是将实际产品创新中工程参数的不同词汇表达映射到标准工程参数。
“发明原理”:TRIZ发明创造40原理,比如:
(1)分割原理
1)火车车厢之间是单独的个体,可调整车厢的数量;
2)圆珠笔的笔心与笔套是两个可分的部分,笔心可以换;
3)电风扇的三片叶片是三个独立的个体,可拆卸;
4)田地里的浇水水管系统,每一段用一个接头连接;
5)自行车、摩托车等的链条是一环一环相接的,每环都是可以取下来的。
(2)分离原理
1)石油加工中,将一些油渣或其他有害物质提炼分离,已获得精度较高的汽油或柴油;
2)子弹发出后,弹芯与弹壳分离;
3)电脑键盘与鼠标分开,为的是方便人们跟好的操作;
4)火箭在冲出大气层的过程中将已经燃完燃料的部分解体分离。
5)现在用在建筑中的隔音材料将噪音吸收或隔离,从而使噪音被分离出我们所处的环境“专利”:是发明创造人或其权利受让人对特定的发明创造在一定期限内依法享有的独占实施权,是知识产权的一种,例如:发明专利和实用新专利。
“历史解决方案”:针对某些已经体现出的,或者可以预期的问题、不足、缺陷、需求,目前已经存在的所提出的一个解决整体问题的方案(建议书、计划表),同时能够确保加以有效的执行。
本发明的创新方案匹配方法包括:
对创意进行矛盾智能识别——从创意需求描述中抽取改善和恶化的工程参数,将抽取的工程参数对应到标准工程参数,智能匹配矛盾对,利用TRIZ矛盾矩阵确定发明原理;
发明原理到相关专利和历史方案的智能匹配——对现有发明专利和历史创新方案按发明原理分类,通过确定的发明原理找到与其对应的相关发明专利和历史创新方案,与创意进行相关度计算,并根据优先级排序输出;
自动生成初始解决方案——根据已标记的关键词及创意需求描述本身,利用建立好的语言模型,自动生成与创意匹配的创新初始方案。
采用本发明,创新方案的提出不再依赖于创新者的知识水平和经验,而是在相关历史和专利等数据基础上科学系统地给出。
本发明通过以下技术方案来解决创意到创新方案的智能匹配问题,具体包括:
(1)TRIZ矛盾矩阵法知识网络构建:主要是对现有TRIZ矛盾数据和专利数据进行融合。对标准工程参数进行语义本体建立,即将实际产品创新中工程参数的不同词汇表达映射到标准工程参数上;建立发明原理与专利之间的对应关系,即对每一个专利标注其对应的发明原理;整理利用本方法产生的历史解决方案和其采用的发明原理之间的对应关系。最终形成工程参数-发明原理-专利/历史解决方案的知识网络,为后续从需求描述中提取工程参数,确定发明原理,进而得到发明原理相关的专利和历史解决方案提供技术支持。
(2)创新方案匹配:描述发明创意需求;从发明创意需求的文本描述中自动提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络,确定标准工程参数矛盾对,利用TRIZ现有的矛盾矩阵工具,确定发明原理;利用TRIZ矛盾矩阵法知识网络,得到与发明原理相关的发明专利及历史解决方案,并计算相关度进行排序输出,供用户参考、标记。
(3)初始解决方案生成:通过现有大量权威解决方案数据训练,建立一种语言模型,根据用户标记出来的关键词和创意需求描述本身,自动生成初始解决方案并输出。
具体的,TRIZ矛盾矩阵法知识网络构建模块包括以下实现步骤:
1.对TRIZ中已总结出的39个标准工程参数进行语义本体建立——提取出每个标准工程参数在实际产品创新当中的不同词汇表达,通过计算语义相似度对标准工程参数进行补充描述,将所有可能的表达词汇映射到每个标准工程参数上,形成标准工程参数词典。具体步骤如下:
(1)建立改善和恶化参数提取词汇库。TRIZ中的矛盾矩阵工具是由一个欲改善参数和一个将恶化参数来确定发明原理,参数改善和恶化的情况通常有一些特定的词汇表示,如“可以”、“改善”、“提高”等关键词前后的词汇可能为改善参数,而“破坏”、“导致”、“丧失”等关键词前后的词汇可能为恶化参数。通过对一定数量有代表性的专利文本进行人工分析整理,得到初始的改善参数提取词汇集合Wi={"可以",改善","提高",……}、恶化参数相关词汇集合Wd={"破坏","导致","丧失",……},由此,建立改善和恶化参数提取词汇库W。
(2)提取非标准工程参数。对于已经进行分词、去停用词等预处理后的专利文本集合D,当D中存在词汇ti∈W时,ti前后名词即可能为工程参数,将其加入到非标准工程参数词汇库P中。
(3)利用改善和恶化参数提取词汇库W和非标准工程参数词库P互相更新改进。从专利文本集合D中提取词汇tj(tj∈P)的前后动词,判断其是否在Wi和Wd中,若不在,判断其为改善参数提取词还是恶化参数提取词,并加入到Wi或Wd中。继续执行步骤(2),利用更新后的词汇库W,从D中提取新的工程参数加入到词汇库P中。如此循环,不断更新改进W和P。
(4)将非标准工程参数pi映射到标准工程参数建立标准工程参数词典PD。将上一步提取出的非标准工程参数词汇库P中的词与标准工程参数词汇库中的词,利用HowNet或同义词词林进行语义相似度计算,将多个pi映射到一个对标准工程参数进行补充。
2.利用文本挖掘技术对专利按发明原理进行自动分类,建立专利与发明原理之间的对应关系,即对每一个专利标注其对应的发明原理。具体步骤如下:
(1)对专利数据进行预处理。从TRIZ中的40个发明原理的权威中文定义、描述和参考专利案例中提取出其中大部分的实意词组成发明原理专有词汇库IP,辅助ICTCLAS等汉语分词系统进行中文分词。停用词库可选择中科院统计的中文停用词库,同时,考虑专利文献特殊性,可建立专利数据专有停用词库PS,除了一些语气词和形容词等非实意词,也应包含“该发明、该专利、实用、新型、公开、领域、权利、要求、特征、上述、涉及”等对提取发明原理信息无关的实意词。
(2)将处理后的专利文本用向量空间模型VSM表示。每个专利文本都被表示为一个向量,向量由一组与给定专利文本有关的词组成,即每个专利文本可以表示为d=(t1,t2,……tn),ti为特征项,即组成专利文本的字、词或短语,对含有n个特征项的文本而言,通常会给每个特征项赋予一定的权重表示其重要程度,则d=(w1,w2,……wn),wi为ti的权重,被称为专利文本d的向量表示或向量空间模型。通过TF-IDF计算词语权重,自动提取关键词。TF-IDF的计算公式为:TF-IDF=词频(TF)×逆文档频率(IDF),其中,TF词频(TermFrequency)指的是某一个给定的词语在该文件中出现的次数,计算公式为:词频(TF)=某个词在文章中出现的次数/文章的总词数;IDF逆向文件频率(Inverse DocumentFrequency)是一个语句普遍重要性的度量,计算公式为:逆向文档频率(IDF)=log(专利文档的总数/(包含该词的文档数+1))。TF-IDF与一个词在文档中的出现次数成正比,与该词在整个语言中的出现次数成反比。所以,提取关键词就是计算出文档的每个词的TF-IDF值,然后按降序排列,取最前面的几个词。之后,采用信息增益等特征选择算法对提取的特征进行降维处理,信息增益用于文本数据的特征选择时衡量的是某个词的出现与否对判断一个文本是否属于某个类所提供的信息量,定义如下: 其中,P(ci)表示类别ci出现的概率;P(t)表示词t出现的概率;表示词t不出现的概率;P(ci|t)表示词t出现的情况下文本属于ci类的概率;表示词t不出现的情况下文本属于类的概率。
(3)利用多标签分类方法将专利按发明原理进行分类。每个专利通常采用多个发明原理,即一个专利对应多个发明原理。先使用多标签的问题转换方法,如PPT(PrunedProblem Transformation)等对数据集先进行转换,PPT方法相对优于其他多标签分类算法,其将每个对象所属的标签集合作为一个新的标签,分类一个新的样本,PPT方法的单标签分类器输出一个标签集合。之后,用常用的监督学习算法,如支持向量机SVM对数据集进行训练学习,将专利按发明原理进行分类。
3.整理利用本方法产生的历史解决方案与其最终采用的发明原理之间的对应关系。
具体的,创新方案匹配模块包括以下实现步骤:
1.描述发明创意需求。发明创意需求分为创意名称、创意背景、期望结果、潜在困难四部分内容,便于提取工程参数。创新者根据要求输入相应的创意描述。
2.利用TRIZ矛盾矩阵法知识网络中改善和恶化参数提取词汇库,从步骤1中输入的创意描述中分别提取出欲改善和将恶化的非标准工程参数,一般情况下,期望结果部分内容可提取欲改善参数,潜在困难部分可提取将恶化参数。
3.利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数和将恶化的非标准工程参数映射为标准工程参数。若存在多个欲改善或将恶化的工程参数,无法将其一一对应,则将两类工程参数分别进行组合,经过人工判定筛选确定最终矛盾对。
4.利用TRIZ矛盾矩阵,得到推荐的发明原理。
5.利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,得到与推荐的发明原理相对应的专利和历史解决方案,计算得到的专利或历史解决方案与创意需求描述的相关度,按优先级排序显示。在向量空间模型中,两个文本di和dj之间的内容相关度Sim(di,dj)常用向量之间夹角的余弦值表示,计算公式为:
其中,wik、wjk分别表示文本di和dj第k个特征项的权重,1<=k<=n。
具体的,初始解决方案生成模块包括以下实现步骤:
1.将爬取到的大量创新方案数据作为训练语言模型的数据集(分为训练集和测试集),对语句进行分词,并对得到的词语进行预处理后,语句e可表示为e=(<t1,g1><t2,g2>…<tk,gk>),其中ti(i=1,2,3…,k)为创新方案数据分词后得到的词,gi(i=1,2,3…,k)为词语的语法语义标识项,如一般名词词语NOTH,应用动词词语VAPP,介词、副词词语ATOH,数量词语UOTH等,这些词语的标识项构成的集合记为G:G=(g1,g2,…,gk),gi∈G,i=1,2,3…,k。目标是生成一组语言模型:语言模型=(rule1,rule2,…,rulek),每一个规则rulei可表示为:rule=R1×R2×R3×…,其中Ri有三种取值:通配符$(可以为任意词语,或为空Null),词语标识项g以及词语t,即:Ri∈{$}+G+{t1,t2,t3…}。通过对训练集中的创新方案进行逐一学习,得到一组能覆盖训练集的语言模型,然后用测试集进行测试并调整模型信息,进而得到一个自动生成创新方案的语言模型。
2.按优先级查看相关专利和历史解决方案,标记出其中与创意问题有关的关键词或句子。
3.标记的信息自动输入到训练好的语言模型,生成创初始解决方案并输出。
如图1所示,本发明创意到创新方案的智能匹配方法流程如下:
步骤101,构建TRIZ矛盾矩阵法知识网络:对现有TRIZ矛盾数据和专利数据进行融合。对标准工程参数进行语义本体建立1011,建立发明原理与专利之间的对应关系1012,建立发明原理与和历史解决方案之间的对应关系1013,建立TRIZ矛盾矩阵法知识网络。
具体地,步骤101还包括以下步骤:
分步骤1011:提取出每个工程参数在实际产品创新当中的一般词汇表达,通过计算语义相似度对TRIZ中39个标准工程参数进行补充描述,将所有可能的表达词汇映射到每个标准工程参数上,形成标准工程参数词典,建立标准工程参数语义本体。
分步骤1012:对专利数据进行预处理,将处理后的专利文本用向量空间模型VSM表示,利用多标签分类方法将专利按发明原理进行分类,建立专利与发明原理之间的对应关系,即对每一个专利标注其对应的发明原理。
分步骤1013:整理利用本方法产生的历史解决方案与其最终采用的发明原理之间的对应关系。
步骤102,创新方案匹配:从发明创意需求描述中提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络,确定标准工程参数矛盾对,利用矛盾矩阵,确定发明原理,利用TRIZ矛盾矩阵法知识网络,得到与发明原理相关的发明专利及历史解决方案,并计算其与创意需求描述的相关度排序显示。
具体地,步骤102还包括以下步骤:
分步骤1021:描述发明创意需求。发明创意需求分为创意名称、创意背景、期望结果、潜在困难四部分内容,便于提取工程参数。创新者根据要求输入相应的创意描述。
分步骤1022:利用TRIZ矛盾矩阵法知识网络中改善和恶化参数提取词汇库,从输入的创意描述中分别提取出欲改善和将恶化的非标准工程参数,一般情况下,期望结果部分内容可提取欲改善参数,潜在困难部分可提取将恶化参数。
分步骤1023:利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将分步骤2中得到非标准工程参数的映射为标准工程参数。若存在多个欲改善或将恶化的标准工程参数,无法将其一一对应,则将两类工程参数分别进行组合,可经过人工判定筛选确定最终矛盾对。
分步骤1024:通过TRIZ矛盾矩阵,得到推荐的发明原理集合。
分步骤1025:利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,得到与推荐的发明原理相对应的专利和历史解决方案,通过计算两个文本向量之间夹角的余弦值,得到的专利或历史解决方案与创意需求描述的相关度,并按优先级排序显示。
步骤103,初始解决方案生成:通过大量权威解决方案数据训练,建立一种语言模型,根据用户标记出来的关键词以及专利信息自动生成初始解决方案并输出。
具体地,步骤103还包括以下步骤:
分步骤1031:将爬取到的大量创新方案数据作为训练语言模型的数据集(分为训练集和测试集),通过对训练集中的创新方案进行逐一学习,得到一组能覆盖训练集的语言模型,然后用测试集进行测试并调整模型信息,进而得到一个自动生成创新方案的语言模型。
分步骤1032:按优先级查看相关专利和历史解决方案,标记出与发明创意需求相关的信息。
分步骤1033:标记的信息自动输入到训练好的语言模型,生成初始创新方案并输出。
本发明的一种创新方案匹配装置,包括:
(1)TRIZ矛盾矩阵法知识网络构建模块,其用于根据标准工程参数建立语义本体,以及发明原理分别与专利和历史解决方案之间的对应关系,进而利用TRIZ矛盾矩阵将标准工程参数、发明原理、专利和历史解决方案四者相关联,最后形成TRIZ矛盾矩阵法知识网络;
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还包括语义本体建立模块,其用于:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词库中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词汇库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数库的参数映射到标准工程参数库中,进而建立标准工程参数词典,最终得到语义本体。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还包括发明原理与专利关系建立模块,其用于:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一个向量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量进行降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间的对应关系。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还发明原理与历史解决方案关系建立模块,其用于:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数库,提取发明创意需求描述中的欲改善和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数和将恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进而得到与推荐的发明原理相对应的专利和历史解决方案。
(2)创新方案匹配模块,其用于获取发明创意需求描述,并从发明创意需求描述中提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明原理及与其相关的专利及历史解决方案,并将专利及历史解决方案分别与发明原理的相关度进行计算并排序;
(3)初始解决方案生成模块,其用于将得到的历史解决方案作为训练样本,根据训练样本中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自动输入至语言模型,自动生成初始解决方案并输出。
本发明采用大数据处理技术手段在非标准工程参数、标准工程参数、发明原理、专利和历史解决方案之间建立联系,形成知识网络,获得从创意直接得到相关发明原理、专利和历史解决方案的效果;这样从寻找矛盾参数到将对应的发明原理应用到实际问题中,不需要依赖专业研究人员的知识水平和经验,采用机器学习技术手段,建立语言模型,能够自动准确地获取初始解决方案。
本发明还提供一种创新方案匹配服务器,该服务器包括创新方案匹配装置。
本发明的创新方案匹配服务器,采用大数据处理技术手段在非标准工程参数、标准工程参数、发明原理、专利和历史解决方案之间建立联系,形成知识网络,获得从创意直接得到相关发明原理、专利和历史解决方案的效果;这样从寻找矛盾参数到将对应的发明原理应用到实际问题中,不需要依赖专业研究人员的知识水平和经验,采用机器学习技术手段,建立语言模型,能够自动准确地获取初始解决方案。
本发明还提供一种创新方案匹配系统,该系统包括上述创新方案匹配服务器。
本发明的创新方案匹配系统,采用大数据处理技术手段在非标准工程参数、标准工程参数、发明原理、专利和历史解决方案之间建立联系,形成知识网络,获得从创意直接得到相关发明原理、专利和历史解决方案的效果;这样从寻找矛盾参数到将对应的发明原理应用到实际问题中,不需要依赖专业研究人员的知识水平和经验,采用机器学习技术手段,建立语言模型,能够自动准确地获取初始解决方案。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (7)

1.一种创新方案匹配方法,其特征在于,包括:
根据标准工程参数建立语义本体,以及建立发明原理分别与专利和历史解决方案之间的对应关系,进而利用TRIZ矛盾矩阵将标准工程参数、发明原理、专利和历史解决方案四者相关联,最后形成TRIZ矛盾矩阵法知识网络;
获取发明创意需求描述,并从发明创意需求描述中提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明原理及与其相关的专利和历史解决方案,并将专利和历史解决方案分别与发明原理的相关度进行计算并排序;
将得到的历史解决方案作为训练样本,根据训练样本中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自动输入至语言模型,自动生成初始解决方案并输出;
根据标准工程参数建立语义本体的具体过程为:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词库中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数词库的参数映射到标准工程参数词库中,进而建立标准工程参数词典,最终得到语义本体。
2.如权利要求1所述的一种创新方案匹配方法,其特征在于,建立发明原理与专利之间的对应关系的具体过程包括:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一个向量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量进行降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间的对应关系。
3.如权利要求1所述的一种创新方案匹配方法,其特征在于,建立发明原理与历史解决方案之间的对应关系的具体过程包括:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数相关词库,提取发明创意需求描述中的欲改善的工程参数和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数和将恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进而得到与推荐的发明原理相对应的专利和历史解决方案。
4.一种创新方案匹配装置,其特征在于,包括:
TRIZ矛盾矩阵法知识网络构建模块,其用于根据标准工程参数建立语义本体,以及建立发明原理分别与专利和历史解决方案之间的对应关系,进而利用TRIZ矛盾矩阵将标准工程参数、发明原理、专利和历史解决方案四者相关联,最后形成TRIZ矛盾矩阵法知识网络;
创新方案匹配模块,其用于获取发明创意需求描述,并从发明创意需求描述中提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明原理及与其相关的专利和历史解决方案,并将专利和历史解决方案分别与发明原理的相关度进行计算并排序;
初始解决方案生成模块,其用于将得到的历史解决方案作为训练样本,根据训练样本中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自动输入至语言模型,自动生成初始解决方案并输出;
所述TRIZ矛盾矩阵法知识网络构建模块还包括语义本体建立模块,其用于:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词库中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数词库的参数映射到标准工程参数词库中,进而建立标准工程参数词典,最终得到语义本体。
5.如权利要求4所述的一种创新方案匹配装置,其特征在于,所述TRIZ矛盾矩阵法知识网络构建模块还包括发明原理与专利关系建立模块,其用于:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一个向量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量进行降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间的对应关系。
6.如权利要求4所述的一种创新方案匹配装置,其特征在于,所述TRIZ矛盾矩阵法知识网络构建模块还包括发明原理与历史解决方案关系建立模块,其用于:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数相关词库,提取发明创意需求描述中的欲改善的工程参数和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数和将恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进而得到与推荐的发明原理相对应的专利和历史解决方案。
7.一种创新方案匹配服务器,其特征在于,包括如权利要求4-6中任一所述的一种创新方案匹配装置。
CN201710173098.4A 2017-03-22 2017-03-22 一种创新方案匹配方法、装置、服务器及系统 Active CN106997341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710173098.4A CN106997341B (zh) 2017-03-22 2017-03-22 一种创新方案匹配方法、装置、服务器及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710173098.4A CN106997341B (zh) 2017-03-22 2017-03-22 一种创新方案匹配方法、装置、服务器及系统

Publications (2)

Publication Number Publication Date
CN106997341A CN106997341A (zh) 2017-08-01
CN106997341B true CN106997341B (zh) 2019-08-13

Family

ID=59431706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710173098.4A Active CN106997341B (zh) 2017-03-22 2017-03-22 一种创新方案匹配方法、装置、服务器及系统

Country Status (1)

Country Link
CN (1) CN106997341B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108484B (zh) * 2018-01-09 2022-02-11 阿凡提信息科技(湖南)股份有限公司 基于技术需求的新知识生成系统、方法及存储介质
CN110134798B (zh) * 2019-05-15 2021-07-27 八戒科技服务有限公司 一种创新需求挖掘方法、系统、终端及介质
CN110162631A (zh) * 2019-05-17 2019-08-23 中山大学 面向triz发明原理的中文专利分类方法、系统及储存介质
CN111552870A (zh) * 2020-04-01 2020-08-18 深圳壹账通智能科技有限公司 对象推荐方法、电子装置及存储介质
CN112288177A (zh) * 2020-11-03 2021-01-29 云南电网有限责任公司信息中心 基于triz创新理论的智能推荐方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744972A (zh) * 2014-01-10 2014-04-23 上海交通大学 基于服务triz的服务设计冲突解决方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160004973A1 (en) * 2013-07-07 2016-01-07 Hristo Trenkov Business triz problem extractor and solver system and method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744972A (zh) * 2014-01-10 2014-04-23 上海交通大学 基于服务triz的服务设计冲突解决方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Matching TRIZ engineering parameters to human factors issues in manufacturing;Denis A. Coelho;《WSEAS TRANSACTIONS on BUSINESS and ECONOMICS》;20091130;第6卷(第11期);第547-556页
基于TRIZ理论的计算机辅助创新设计及应用研究;徐起贺 等;《河南机电高等专科学校学报》;20130531;第21卷(第3期);第1-4页
基于TRIZ的计算机辅助创新技术应用研究;兰芳 等;《计算机应用与软件》;20090831;第26卷(第8期);第171-173页
基于知识粒度的TRIZ在创新设计中的应用;刘龙繁 等;《机械工程学报》;20160315;第52卷(第5期);第22-32页

Also Published As

Publication number Publication date
CN106997341A (zh) 2017-08-01

Similar Documents

Publication Publication Date Title
CN106997341B (zh) 一种创新方案匹配方法、装置、服务器及系统
CN107590133A (zh) 基于语义的招聘职位与求职简历匹配的方法及系统
CN101470732B (zh) 一种辅助词库的生成方法和装置
CN104573028A (zh) 实现智能问答的方法和系统
CN108073568A (zh) 关键词提取方法和装置
Bakhtin et al. Real or fake? learning to discriminate machine from human generated text
CN108038725A (zh) 一种基于机器学习的电商产品客户满意度分析方法
CN108108468A (zh) 一种基于概念和文本情感的短文本情感分析方法和装置
Chang et al. Research on detection methods based on Doc2vec abnormal comments
CN104778157A (zh) 一种多文档摘要句的生成方法
CN106649250A (zh) 一种情感新词的识别方法及装置
CN111026842A (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN112686025A (zh) 一种基于自由文本的中文选择题干扰项生成方法
CN107679110A (zh) 结合文本分类与图片属性提取完善知识图谱的方法及装置
CN104537280A (zh) 基于文本关系相似性的蛋白质交互关系识别方法
Quan et al. Combine sentiment lexicon and dependency parsing for sentiment classification
CN109002473A (zh) 一种基于词向量与词性的情感分析方法
CN112613321A (zh) 一种抽取文本中实体属性信息的方法及系统
CN112632228A (zh) 一种基于文本挖掘的辅助评标方法及系统
JP2018005690A (ja) 情報処理装置及びプログラム
Zhang et al. Research on answer selection based on LSTM
CN111274399A (zh) 一种基于自然语言预处理的公共数据分级方法
CN110427463A (zh) 搜索语句响应方法、装置及服务器和存储介质
CN109960798A (zh) 维吾尔语文本突发事件要素识别方法
Brajković et al. Application of data mining in e-Leaming systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210906

Address after: 250101 j2-1903, high tech Wanda office building, No. 57, Gongye South Road, high tech Zone, Jinan City, Shandong Province

Patentee after: Nugget (Jinan) Education Technology Co.,Ltd.

Address before: 250061 Ji'nan City, Shandong Province, No. ten, No. 17923

Patentee before: SHANDONG University