CN103678435B - 一种药品规格数据相似度匹配方法 - Google Patents

一种药品规格数据相似度匹配方法 Download PDF

Info

Publication number
CN103678435B
CN103678435B CN201310286121.2A CN201310286121A CN103678435B CN 103678435 B CN103678435 B CN 103678435B CN 201310286121 A CN201310286121 A CN 201310286121A CN 103678435 B CN103678435 B CN 103678435B
Authority
CN
China
Prior art keywords
data
collection
drug specifications
drug
descriptor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310286121.2A
Other languages
English (en)
Other versions
CN103678435A (zh
Inventor
王妍
张矩
黄运高
向林泓
赵学良
杨涌
王湘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing pharmaceutical exchange Limited by Share Ltd
Chongqing Institute of Green and Intelligent Technology of CAS
Original Assignee
Chongqing Pharmaceutical Exchange Ltd By Share Ltd
Chongqing Institute of Green and Intelligent Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Pharmaceutical Exchange Ltd By Share Ltd, Chongqing Institute of Green and Intelligent Technology of CAS filed Critical Chongqing Pharmaceutical Exchange Ltd By Share Ltd
Priority to CN201310286121.2A priority Critical patent/CN103678435B/zh
Publication of CN103678435A publication Critical patent/CN103678435A/zh
Application granted granted Critical
Publication of CN103678435B publication Critical patent/CN103678435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供一种药品规格数据相似度匹配方法,用于将采集的药品规格数据与标准库中的药品规格数据相匹配,首先生成语料库主题词信息量文件和前置词信息量文件,该方法还包括如下步骤:(1)将药品规格数据转化为分层链表形式的数据结构;(2)在标准库中找到与采集的药品规格数据有效成分含量相同的标准药品规格数据集S;(3)找到采集的药品规格数据和标准药品规格数据集S的前置词和主题词的信息量;(4)计算采集的药品规格数据和标准药品规格数据集S的相似度;(5)选取相似度最大的标准药品规格数据作为采集的药品规格数据的匹配数据。相对于现有技术,本发明提高了药品规格数据相似度计算的准确度。

Description

一种药品规格数据相似度匹配方法
技术领域
本发明涉及自然语言处理领域,特别涉及药品规格数据的相似度计算以及匹配方法。
背景技术
当前,在自然语言处理领域,文本相似度在很多方面中有着广泛的应用,如信息检索、信息抽取、文本分类、词义排歧、机器翻译等等。文本相似度是表示两个或多个文本数据匹配程度的一个度量参数,相似度值越大,说明文本相似度越高,反之文本相似度越低。
虽然国内外对于文本相似度的计算方法已经有了大量的研究,且均在特定领域取得了良好的效果,但由于药品规格数据的特殊性,直接套用其他领域的相似度计算方法并不能取到很好的匹配效果;另外,有些方法复杂度太大,影响匹配效率。
发明内容
针对现有技术存在的问题,本发明的主要目的在于提供针对药品规格数据,匹配准确度高的数据相似度匹配方法。
为实现上述目的,本发明提供一种药品规格数据相似度匹配方法的实施例,用于将采集的药品规格数据与标准库中的药品规格数据相匹配,该药品规格数据包含药品的有效成分和有效成分含量,首先进行数据准备工作:在语料库中找出所有主题词和前置词,分别计算主题词和前置词的信息量,生成语料库主题词信息量文件和前置词信息量文件,该方法还包括如下步骤:
(1)将采集的药品规格数据和标准库的药品规格数据转化为分层链表形式的数据结构;
(2)在标准库中找到与采集的药品规格数据有效成分含量相同的标准药品规格数据集S;
(3)在语料库主题词信息量文件和前置词信息量文件中分别找到采集的药品规格数据和标准药品规格数据集S的前置词和主题词的信息量;
(4)利用采集的药品规格数据和标准药品规格数据集S的前置词和主题词的信息量,计算采集的药品规格数据和标准药品规格数据集S中的标准药品规格数据的相似度;
(5)在标准药品规格数据集S中选取相似度最大的标准药品规格数据作为采集的药品规格数据的匹配数据。
进一步地,步骤在语料库中找出所有主题词和前置词具体包含如下步骤:
(1)导入语料库,以药品名词典对导入的语料库进行中文分词处理,保存分词结果,可利用中文分词引擎对导入的语料库进行中文分词处理。
(2)遍历分词结果,将分词结果中的药品名词作为主题词,药品名词前面的中文词汇作为前置词。
进一步地,步骤分别计算主题词和前置词的信息量具体包含如下步骤:
(1)统计主题词的TF值,统计前置词的RIDF值,主题词的TF值TFCWkey)=COUnt(Wkey)/Σw∈SMNCOUnt(W),前置词的RIDF值
RIDF(Wpre)=Σw∈SMNCout(Wpre+W)/Σw∈SMNCount(W),其中Wkey代表主题词,Count(Wkey)代表主题词出现的次数,SMN代表药品名词典中的药品名称集合,W代表药品名称集合中的词,Count(W)代表词出现的次数,Wpre代表前置词,Count(Wpre)代表前置词出现的次数;
(2)计算主题词和前置词的信息量,主题词的信息量I(Wkey)=TF(Wkey),前置词的信息量
进一步地,步骤将采集的药品规格数据和标准库的药品规格数据转化为分层链表形式的数据结构具体包含如下步骤:
(1)统一采集的药品规格数据和标准库的药品规格数据中有效成分含量的单位;
(2)针对采集的药品规格数据和标准库的药品规格数据进行BNF语法规则定义;
(3)采用语法分析生成器对采集的药品规格数据和标准库的药品规格数据进行语法分析,生成分层链表形式的数据结构。该语法分析生成器为JAVACC。
更进一步地,采集的药品规格数据和标准药品规格数据的相似度具体为:
Sim(Item_processing,Item_stand)=
I ( wpre 1 ) * I ( wpre 2 ) + I ( wkey ) 2 I ( wpre 1 ) 2 + I ( wkey ) 2 * I ( wpre 2 ) 2 + I ( wkey ) 2 , 其中Item_processing为采集的药品规格数据,Item_stand为标准药品规格数据集S中的标准药品规格数据,I(Wpre1)为Item_processing的前置词的信息量,I(Wpre2)为Item_stand的前置词的信息量,I(Wkey)为Item_processing和Item_stand共同的主题词的信息量。
本发明相对于现有技术,在计算主题词的TF值和前置词的RIDF值的基础上进行药品规格数据的相似度计算,提高了药品规格数据相似度计算的准确度。
附图说明
图1是药品规格数据相似度匹配方法实施例的流程图
图2是药品规格数据转化为分层链表形式的数据结构示意图
具体实施方式
下面结合附图,详细说明本发明的具体实施方式。
本发明提供一种将采集的非标准的药品规格数据与标准数据库中的药品规格数据进行匹配的处理方法。如表1所示,一般药品数据主要由药品名称、生产企业、药品规格、剂型、转换系数五个参数确定,而药品规格的形式最为复杂。药品规格包含如下信息:药品有效成分、药品各成分的含量、总含量等,通过标点符号以及介词短语来进行连接,如表1中广东逸舒制药有限公司生产的化痰消咳片其中一种参数规格为“300mg:3mg(亚硫酸氢钾苯丙酮)-20mg(鱼腥草素钠)”,那么对于双括号“()”就可以理解为对300mg:3mg的补充说明,而“-”则可以理解为并列符号,前面一段和后面一段的权重相等。人工生成的药品规格数据格式千差万别,难以通过计算机进行有效的匹配和识别,本发明正是要解决这一问题。
表1标准数据库中的和非标准的药品数据示意图
如图1所示,为药品规格数据相似度匹配方法实施例的流程图。用于将采集的药品规格数据与标准库中的药品规格数据相匹配,该药品规格数据相似度匹配方法具体包含如下步骤A~步骤D:
步骤A:将采集的药品规格数据和标准库的药品规格数据进行结构化处理,并将药品规格数据转化为分层链表形式的数据结构;
步骤B:数据准备:将中文词汇分为主题词和前置词两种,在语料库中找出所有主题词和前置词,分别计算主题词和前置词的信息量,生成语料库主题词信息量文件和前置词信息量文件,步骤B可以在步骤A之前单独预先进行,将结果保存在文件中,以供使用,也可以在步骤A之后进行;
步骤C:数据相似度计算:利用二维向量夹角的余弦来计算采集的药品规格数据和标准药品规格数据的相似度;
步骤D:数据配对:选取相似度最大的标准药品规格数据作为采集的药品规格数据的匹配数据。
步骤A将药品规格数据转化为分层链表形式的数据结构包括以下步骤A1~A3:
步骤A1:统一数据单位:将采集的药品规格数据和标准库的药品规格数据进行标准化处理,即利用各种单位之间的转算关系,自动进行单位的换算,将药品规格数据中的单位(如有效成分含量的单位)进行统一,可统一为毫克(mg);
步骤A2:定义语法规则:针对采集的药品规格数据和标准库的药品规格数据进行BNF语法规则定义,语法定义规则如下(针对所有的药品规格数据,均采用如下的BNF语法规则定义):
expr::=LPAREN term RPAREN SUBSET*term*|term SUBSET*(LPAREN termRPAREN)*
term::=numterm(<mul>numterm)*|chiterm(numterm)*(chiterm)*(numterm)*|chitermengternnumterm
numterm::=<number><unit>*
chiterm::=<Chinese>
engtern::=<English>
步骤A3:采用语法分析生成器JAVACC,以步骤A2定义的语法规则对采集的药品规格数据和标准库的药品规格数据逐条进行语法分析,生成分层链表形式的数据结构(如图2所示)。
步骤B数据准备包括以下步骤B1~B8:
步骤B1:导入准备好的语料库,选择的语料库可以是和药品相关的网页文本的语料数据,用以处理药品名称。利用中文分词引擎以药品名词典对导入的语料库进行中文分词处理,分词是对文本进行切割,生成“词-词性”的元组的序列。保存分词结果,用于指导药品规格数据的匹配;
步骤B2:遍历分词结果;
步骤B3:判断是否遍历完成,若遍历完成,表明所有的分词结果已处理完毕,则进入步骤B7,否则,进入步骤B4;
步骤B4:判断分词结果是否为药品名词,若是,则进入步骤B5,否则,返回步骤B2;
步骤B5:将分词结果中的药品名词认定为主题词,统计该主题词的TF值TF(Wkey),TF(Wkey)=Count(Wkey)/Σw∈SMNCount(W),用该值来估计Wkey作为主题词的概率P(Wkey),其中Wkey代表主题词,Count(Wkey)代表主题词出现的次数,SMN代表药品名词典中的药品名称集合,W代表药品名称集合中的词,Count(W)代表词出现的次数;
步骤B6:将药品名词前面的一个中文词汇认定为前置词,统计该前置词的RIDF值RIDF(Wpre),用该值来估计Wpre被用来作为药品成分前置词的概率P(Wpre),RIDF(Wpre)=ΣW∈SMNCount(Wpre+W)/Σw∈SNNCOUIIt(W),其中Wpre代表前置词,Count(Wpre)代表前置词出现的次数,SMN代表药品名词典中的药品名称集合,W代表药品名称集合中的词,Count(W)代表词出现的次数,并返回步骤B2;
步骤B7:计算主题词的信息量I(Wkey),I(Wkey)=TF(Wkey),输出到文件medicine_name.i;
文件medicine_name.i的形式如下所示,即按一个主题词对应一个主题词的信息量来保存:
Wkey1 I(Wkey1)
Wkey2 I(Wkey2)
……
WkeyM I(WkeyM)
步骤B8:计算前置词的信息量I(Wpre),输出到文件preposition_word.i。
文件preposition_word.i的形式如下所示,即按一个前置词对应一个前置词的信息量来保存:
Wpre1 I(Wpre1)
Wpre2 I(Wpre2)
……
WpreN I(WpreN)
步骤C数据相似度计算包括以下步骤C1~C5:
步骤C1:读取步骤B生成的前置词信息量文件preposition_word.i以及主题词信息量文件medicine_name.i到内存中;
步骤C2:遍历采集的药品规格数据集合,将采集的药品规格数据保存至Item_processing;
步骤C3:判断是否遍历完成,如是,表明所有的药品规格数据已匹配完成,则结束流程,否则,进入步骤C4;
步骤C4:遍历标准库,在标准库中找到与采集的药品规格数据Item_processing相似的标准药品规格数据集S,标准药品规格数据集S包含若干标准药品规格数据Item_stand,方法为:首先在标准库中找到与采集的药品规格数据Item_processing的药品名称、生产企业等属性相同的数据,然后将这些数据的药品规格数据与采集的药品规格数据进行分层链表结构的对比,找到有效成分含量相同的标准药品规格数据集S;
步骤C5:计算Item_processing与标准药品规格数据集S中各标准药品规格数据Item_stand的相似度,包括如下步骤C51~C53:
步骤C51:针对每一个采集的药品规格数据Item_processing,在语料库主题词信息量文件medicine_name.i和前置词信息量文件preposition_word.i中找到采集的药品规格数据Item_processing前置词和主题词的信息量;
步骤C52:在语料库主题词信息量文件medicine_name.i和前置词信息量文件preposition_word.i中找到标准药品规格数据集S中所有标准药品规格数据Item_stand的前置词和主题词的信息量;
步骤C53:针对每一个药品规格数据,利用采集的药品规格数据Item_processing和标准药品规格数据Item_stand前置词和主题词的信息量,计算采集的药品规格数据Item_processing和标准药品规格数据Item_stand的相似度;Sim(Item_processing,Item_stand)=
I ( wpre 1 ) * I ( wpre 2 ) + I ( wkey ) 2 I ( wpre 1 ) 2 + I ( wkey ) 2 * I ( wpre 2 ) 2 + I ( wkey ) 2 , 其中Item_processing为采集的药品规格数据,Item_stand为标准药品规格数据集S中的标准药品规格数据,I(Wpre1)为Item_processing的前置词的信息量,I(Wpre2)为Item_stand的前置词的信息量,I(Wkey)为Item_processing和Item_stand共同的主题词的信息量。
步骤D数据配对包括以下步骤D1:
步骤D1:在标准药品规格数据集S中选取相似度最大的标准药品规格数据Item_stand作为采集的药品规格数据Item_processing的匹配数据。
以上介绍了一种药品规格数据相似度匹配方法,本发明还可有其他多种实施例。本发明并不限定于以上实施例,任何未脱离本发明技术方案,即仅仅对其进行本领域普通技术人员所知悉的改进或变更,均属于本发明的保护范围之内。

Claims (7)

1.一种药品规格数据相似度匹配方法,用于将采集的药品规格数据与标准库中的药品规格数据相匹配,所述药品规格数据包含药品的有效成分和有效成分含量,其特征在于:在语料库中找出所有主题词和前置词,分别计算主题词和前置词的信息量,生成语料库主题词信息量文件和前置词信息量文件,所述药品规格数据相似度匹配方法还包括如下步骤:
(1)将采集的药品规格数据和标准库的药品规格数据转化为分层链表形式的数据结构;
(2)在标准库中找到与采集的药品规格数据有效成分含量相同的标准药品规格数据集S;
(3)在语料库主题词信息量文件和前置词信息量文件中分别找到所述采集的药品规格数据和标准药品规格数据集S的前置词和主题词的信息量;
(4)利用采集的药品规格数据和标准药品规格数据集S的前置词和主题词的信息量,计算采集的药品规格数据和标准药品规格数据集S中的标准药品规格数据的相似度;
(5)在标准药品规格数据集S中选取相似度最大的标准药品规格数据作为采集的药品规格数据的匹配数据。
2.如权利要求1所述的药品规格数据相似度匹配方法,其特征在于:所述步骤在语料库中找出所有主题词和前置词包含如下步骤:
(1)导入语料库,以药品名词典对导入的语料库进行中文分词处理,保存分词结果;
(2)遍历分词结果,将分词结果中的药品名词作为主题词,药品名词前面的中文词汇作为前置词。
3.如权利要求2所述的药品规格数据相似度匹配方法,其特征在于:利用中文分词引擎对导入的语料库进行中文分词处理。
4.如权利要求3所述的药品规格数据相似度匹配方法,其特征在于:所述步骤分别计算主题词和前置词的信息量包含如下步骤:
(1)统计主题词的TF值,统计前置词的RIDF值,所述主题词的TF值TF(Wkey)=Count(Wkey)/Σw∈SMNCount(W),所述前置词的RIDF值RIDF(Wpre)=ΣW∈SMNCount(Wpre+W)/Σw∈ SMNCount(W),其中Wkey代表主题词,Count(Wkey)代表主题词出现的次数,SMN代表药品名词典中的药品名称集合,W代表药品名称集合中的词,Count(W)代表词出现的次数,Wpre代表前置词,Count(Wpre)代表前置词出现的次数;
(2)计算主题词和前置词的信息量,所述主题词的信息量I(Wkey)=TF(Wkey),所述前置词的信息量
5.如权利要求1-4任一所述的药品规格数据相似度匹配方法,其特征在于:所述步骤将采集的药品规格数据和标准库的药品规格数据转化为分层链表形式的数据结构包含如下步骤:
(1)统一采集的药品规格数据和标准库的药品规格数据中有效成分含量的单位;
(2)针对采集的药品规格数据和标准库的药品规格数据进行BNF语法规则定义;
(3)采用语法分析生成器对采集的药品规格数据和标准库的药品规格数据进行语法分析,生成分层链表形式的数据结构。
6.如权利要求5所述的药品规格数据相似度匹配方法,其特征在于:所述语法分析生成器为JAVACC。
7.如权利要求5所述的药品规格数据相似度匹配方法,其特征在于:采集的药品规格数据和标准药品规格数据的相似度具体为:
Sim(Item_processing,Item_stand)=
I ( wpre 1 ) * I ( wpre 2 ) + I ( wkey ) 2 I ( wpre 1 ) 2 + I ( wkey ) 2 * I ( wpre 2 ) 2 + I ( wkey ) 2 , 其中Item_processing为采集的药品规格数据,Item_stand为标准药品规格数据集S中的标准药品规格数据,I(Wpre1)为Item_processing的前置词的信息量,I(Wpre2)为Item_stand的前置词的信息量,I(Wkey)为Item_processing和Item_stand共同的主题词的信息量。
CN201310286121.2A 2013-07-08 2013-07-08 一种药品规格数据相似度匹配方法 Active CN103678435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310286121.2A CN103678435B (zh) 2013-07-08 2013-07-08 一种药品规格数据相似度匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310286121.2A CN103678435B (zh) 2013-07-08 2013-07-08 一种药品规格数据相似度匹配方法

Publications (2)

Publication Number Publication Date
CN103678435A CN103678435A (zh) 2014-03-26
CN103678435B true CN103678435B (zh) 2017-02-08

Family

ID=50316015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310286121.2A Active CN103678435B (zh) 2013-07-08 2013-07-08 一种药品规格数据相似度匹配方法

Country Status (1)

Country Link
CN (1) CN103678435B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239500B (zh) * 2014-09-10 2017-10-27 百度在线网络技术(北京)有限公司 保健食品关联知识库构建方法和装置
CN105068994B (zh) * 2015-08-13 2018-04-17 易保互联医疗信息科技(北京)有限公司 一种药品信息的自然语言处理方法及系统
CN107590146A (zh) * 2016-07-06 2018-01-16 北京搜狗科技发展有限公司 一种药方匹配方法和装置、一种用于药方匹配的装置
CN106446525B (zh) * 2016-08-31 2019-05-10 杭州逸曜信息技术有限公司 用药规则信息相似度的处理方法
CN107818124B (zh) * 2017-03-03 2020-07-14 平安医疗健康管理股份有限公司 数据匹配方法及装置
CN107766395B (zh) * 2017-03-03 2020-12-25 平安医疗健康管理股份有限公司 数据匹配方法和装置
CN109410005A (zh) * 2018-10-30 2019-03-01 北京筑龙信息技术有限责任公司 一种查价方法以及查价装置
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置
CN110245217B (zh) * 2019-06-17 2022-07-22 京东方科技集团股份有限公司 一种药品推荐方法、装置及电子设备
CN111695016A (zh) * 2020-06-05 2020-09-22 苏州瑞云信息技术有限公司 一种新的医药行业智能流向数据匹配的技术方案
CN111931074A (zh) * 2020-10-15 2020-11-13 耀方信息技术(上海)有限公司 一种识别推荐系统
CN113130038A (zh) * 2021-04-30 2021-07-16 康键信息技术(深圳)有限公司 药品数据匹配方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567306A (zh) * 2011-11-07 2012-07-11 苏州大学 一种不同语言间词汇相似度的获取方法及系统
CN103177087A (zh) * 2013-03-08 2013-06-26 浙江大学 一种基于概率主题模型的相似中药检索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567306A (zh) * 2011-11-07 2012-07-11 苏州大学 一种不同语言间词汇相似度的获取方法及系统
CN103177087A (zh) * 2013-03-08 2013-06-26 浙江大学 一种基于概率主题模型的相似中药检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于词语相似度计算的本体映射方法;徐健等;《现代图书情报技术》;20130225(第2期);参见第36页第2栏第3段 *
语义相似度计算及其应用研究;宋玲;《中国博士学位论文全文数据库》;20101215(第12期);参见第14页第2.2.4.2节第1段 *

Also Published As

Publication number Publication date
CN103678435A (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
CN103678435B (zh) 一种药品规格数据相似度匹配方法
CN105468605B (zh) 一种实体信息图谱生成方法及装置
CN103514213B (zh) 词语提取方法及装置
CN107608949A (zh) 一种基于语义模型的文本信息抽取方法及装置
Kanerva et al. Syntactic n-gram collection from a large-scale corpus of internet finnish
CN104484374B (zh) 一种创建网络百科词条的方法及装置
CN110175325A (zh) 基于词向量和句法特征的评论分析方法及可视化交互界面
CN103246644B (zh) 一种网络舆情信息处理方法和装置
CN103678336B (zh) 实体词识别方法及装置
CN106610951A (zh) 改进的基于语义分析的文本相似度求解算法
CN105138864B (zh) 基于生物医学文献的蛋白质交互关系数据库构建方法
CN107273474A (zh) 基于潜在语义分析的自动摘要抽取方法及系统
Piperski et al. Big and diverse is beautiful: A large corpus of Russian to study linguistic variation
Panchenko et al. A semantic similarity measure based on lexico-syntactic patterns.
Hassanali et al. Automatic generation of the index of productive syntax for child language transcripts
CN107967290A (zh) 一种基于海量科研资料的知识图谱网络构建方法及系统、介质
CN105095091B (zh) 一种基于倒排索引技术的软件缺陷代码文件定位方法
Schadd et al. Maasmatch results for oaei 2011
Yıldız et al. Acquisition of Turkish meronym based on classification of patterns
TWI446191B (zh) Word matching and information query method and device
Tanev Unsupervised learning of social networks from a multiple-source news corpus
CN107291700A (zh) 实体词识别方法及装置
El-Kahlout et al. Turkish constituent chunking with morphological and contextual features
Tesema et al. Towards the sense disambiguation of Afan Oromo words using hybrid approach (unsupervised machine learning and rule based)
Zhang et al. Sentiment classification based on syntax tree pruning and tree kernel

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: CHONGQING MEDICINE EXCHANGE CO., LTD.

Free format text: FORMER OWNER: CHONGQING INSTITUTE OF GREEN AND INTELLIGENT TECHNOLOGY

Effective date: 20150720

Owner name: CHONGQING INSTITUTE OF GREEN AND INTELLIGENT TECHN

Effective date: 20150720

C41 Transfer of patent application or patent right or utility model
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Wang Yan

Inventor after: Zhang Ju

Inventor after: Huang Yungao

Inventor after: Xiang Linhong

Inventor after: Zhao Xueliang

Inventor after: Yang Yong

Inventor after: Wang Xiang

Inventor before: Zhang Ju

Inventor before: Xiang Linhong

Inventor before: Zhao Xueliang

Inventor before: Yang Yong

Inventor before: Wang Xiang

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: ZHANG JU XIANG LINHONG ZHAO XUELIANG YANG YONG WANG XIANG TO: WANG YAN ZHANG JU HUANG YUNGAO XIANG LINHONG ZHAO XUELIANG YANG YONG WANG XIANG

TA01 Transfer of patent application right

Effective date of registration: 20150720

Address after: 400010, two floor, No. 101, National Road, Yuzhong District, Chongqing

Applicant after: Chongqing pharmaceutical exchange Limited by Share Ltd

Applicant after: Chongqing Institute of Green and Intelligent Technology, Chinese Academy of Sciences

Address before: 401122, B block, Han Chinese Center, 85 Jin Yu Road, Chongqing, Yubei District

Applicant before: Chongqing Institute of Green and Intelligent Technology, Chinese Academy of Sciences

C14 Grant of patent or utility model
GR01 Patent grant