CN110837735A - 一种数据智能分析识别方法及系统 - Google Patents

一种数据智能分析识别方法及系统 Download PDF

Info

Publication number
CN110837735A
CN110837735A CN201911123554.XA CN201911123554A CN110837735A CN 110837735 A CN110837735 A CN 110837735A CN 201911123554 A CN201911123554 A CN 201911123554A CN 110837735 A CN110837735 A CN 110837735A
Authority
CN
China
Prior art keywords
data
intelligent
identification
phrase
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911123554.XA
Other languages
English (en)
Other versions
CN110837735B (zh
Inventor
张乔木
李雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia China Media Interactive Technology Co ltd
Original Assignee
Taiyuan Blue Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan Blue Technology Co Ltd filed Critical Taiyuan Blue Technology Co Ltd
Priority to CN201911123554.XA priority Critical patent/CN110837735B/zh
Publication of CN110837735A publication Critical patent/CN110837735A/zh
Application granted granted Critical
Publication of CN110837735B publication Critical patent/CN110837735B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种数据智能分析识别方法及系统,尤其适用于短文本数据的智能分析和语义匹配识别。数据智能分析识别方法,包括以下步骤:S1.通过数据采集工具采集原始文本数据,利用预设分类器将原始文本数据分条分类后,存入数据库;S2.采集公共用户或管理员对数据库中数据的操作,并分别对相应数据标注标签;S3.对标注不同标签的数据分别分词操作,获得不同标签的数据识别词组;S4.对新存入数据库的数据分词,然后根据数据识别词组自动进行智能标签标注。本方法及系统,尤其适用于短文本数据的智能分析识别,能够对分类器分类后的数据进行更细的分析识别,最终能区分极其相似的单个短句,识别关键词高相关的不同语义语句,提升识别准确率。

Description

一种数据智能分析识别方法及系统
技术领域
本发明涉及大数据和人工智能技术领域,特别是涉及一种数据智能分析识别方法及系统。
背景技术
大数据是决策的基础,但是单纯的数据量的积累不会对任何益处,只有建立适当的分析模型,并运用相应的技术手段,对大量的数据进行有效地深加工,发现隐含在大量数据中的信息并加以利用,进而指导做出相关决策,才能将大数据的真正效用发挥到极致。通过智能语义识别技术对大数据中的海量数据进行识别提取分类,能够有效提取出隐含的、准确的、有用的信息,给用户提供有价值的信息。
语义识别方法和语义识别系统201610228402.6提供了一种语义识别方法和语义识别系统,其中,语义识别方法包括:确定与关键词相关的多个参考词汇,以及与关键词相邻的局部文本;计算参考词汇属于局部文本的概率,并记作第一概率;在检测到第一参考词汇的第一概率大于或等于预设概率时,确定第一参考词汇相关的语义作为关键词的语义,其中,第一参考词汇属于多种参考词汇。综合关键词的局部搭配和全局语境判断关键词的语义,提高了语义识别的准确率。
短文本问题语义匹配方法和系统201811472838.5通过意图要素对确定句子的关键信息点,从而准确识别出句子表达的真实意图;使得本发明能够准确识别出句子微小的变化引起的巨大的意图差异,从而提升短文本问题语义匹配结果的准确性。
发明内容
本发明的目的是提供一种数据智能分析识别方法及系统,尤其适用于短文本数据的智能分析和语义匹配识别。
数据智能分析识别方法,包括以下步骤:
S1.通过数据采集工具采集原始文本数据,利用预设分类器将原始文本数据分条分类后,存入数据库;
S2.采集公共用户或管理员对数据库中数据的操作,并分别对相应数据标注标签;
S3.对标注不同标签的数据分别分词操作,获得不同标签的数据识别词组;
S4.对新存入数据库的数据分词,然后根据数据识别词组自动进行智能标签标注。
作为优化,数据智能分析识别方法,采集用户或管理员对数据库中数据的操作;包括采集被用户查看的信息数据,采集被管理员删除或者更改分类的信息数据。
作为优化,数据智能分析识别方法,数据识别词组,通过以下方法确定:
βa=∑βi, (i=1..n) n≥2,且βa≠0;那么β为第a个标签的数据识别词组;
β是一个词组,可以是一条数据中的一个词也可以是多个词的组合,
n为标签的个数,
βi为第i个标签的数据中含有词组β的数据条数。
作为优化,数据智能分析识别方法,根据数据识别词组自动进行智能标签标注,通过以下步骤完成:
S41.检查新存入数据库的数据,是否含有数据识别词组;
S42.如果只含有某个标签的数据识别词组,则将该条数据标注该标签;如果含有多个标签的数据识别词组,则根据数据识别词组将该条数据切分成多个短文本数据,然后再分别标注标签;
S43.如果不含有数据识别词组则不进行标注标签。
作为优化,数据智能分析识别方法,一条数据中含有多个不同长度的数据识别词组Ρ={ρ1…ρn},n≥2;如果一数据识别词组ρA包含另一数据识别词组ρB,则删除该数据识别词组ρA。
作为优化,数据智能分析识别方法,对存入数据库的一条数据C,如果不含数据识别词组,但是只同标注某一标签的数据中的某条数据D相似度大于预设阈值,则对该条数据C标注该标签。
作为优化,定期对数据库里的未标注数据或自动分类的数据,重新进行数据智能标签标注。
一种数据智能分析识别系统,包括:
数据采集模块,用于采集原始文本数据;
预设分类器,处理原始文本数据,分条分类后,存入数据库;
数据库,用于保存数据;
用户数据采集模块,用于采集用户对数据的操作,并标注相应用户操作数据;
机器学习模块,用于根据标注的相应用户操作数据,不断更新数据识别词组;
智能标注模块,用于自动进行智能标签标注。
数据智能分析识别系统,智能标注模块,自动进行智能标签标注,包括:根据数据识别词组或者相似度自动进行智能标签标注;定期对数据库里的未标注数据,重新进行数据智能标签标注。
数据智能分析识别系统,数据采集模块,包括合法采用网络爬虫、聊天机器人采集原始文本数据。
本发明数据智能分析识别方法及系统,采集和学习用户对语句的操作,不断地更新标签的数据识别词组,通过机器学习用户对语句的操作,实现对文本数据智能分析识别,并标注标签。本方法及系统,尤其适用于短文本数据的智能分析识别,能够对分类器分类后的数据进行更细的分析识别,最终能区分极其相似的单个短句,识别关键词高相关的不同语义语句,提升识别准确率。
附图说明
下面结合附图和具体实施方式来详细说明本发明;
图1为本发明实施例1涉及的流程示意图;
图2为本发明实施例2涉及的流程示意图;
图3为本发明实施例3涉及的结构示意图。
具体实施方式
下面给出的实施例拟对本发明作进一步说明,但不能理解为是对本发明保护范围的限制,本领域技术人员根据本发明内容对本发明的一些非本质的改进和调整,仍属于本发明的保护范围。
实施例1:如图1所示,数据智能分析识别方法,包括以下步骤:
S1.通过数据采集工具,比如网络爬虫、聊天机器人、数据接口;采集原始文本数据,利用预设分类器将原始文本数据分条分类后,存入数据库;预设分类器可以是关键词过滤分类器;
S2.采集公共用户或管理员对数据库中数据的操作,包括采集被用户查看的信息数据,采集被管理员删除或者更改分类的信息数据,并分别对相应数据标注标签;
S3.对标注不同标签的数据分别分词操作,获得不同标签的数据识别词组;可以采用机械分词算法、基于n元语法的分词算法、基于隐马尔可夫模型的分词算法;
S4.对新存入数据库的数据分词;检查新存入数据库的数据,是否含有数据识别词组;
S5.如果只含有某个标签的数据识别词组,则将该条数据标注该标签;如果含有N个标签的数据识别词组,则根据数据识别词组将该条数据切分成N个短文本数据,然后再分别标注标签;
例如:“本店出售苹果手机,同时本店收购废旧电脑,本条信息由软件发送,哈哈。”分别有卖方、卖方、垃圾数据三个标签的数据识别词组,“本店出售”,“收购废旧”“由软件发送”;则将本段话切分成三段“本店出售苹果手机”标注卖方数据;“同时本店收购废旧电脑” 标注买方数据“本条信息由软件发送” 标注垃圾数据;
S6.如果不含有数据识别词组则不进行标注标签。
数据识别词组,通过以下方法确定:
βa=∑βi, (i=1..n) n≥2,且βa≠0;那么β为第a个标签的数据识别词组;
β是一个词组,可以是一条数据中的一个词也可以是多个词的组合,
n为标签的个数,
βi为第i个标签的数据中含有词组β的数据条数。
一条数据中含有多个不同长度的数据识别词组Ρ={ρ1…ρn},n≥2;如果一数据识别词组ρA包含另一数据识别词组ρB,则删除该数据识别词组ρA。
可以根据被用户查看的信息数据的查看次数,或者某个标签数据中某个数据识别词组的出现次数,确定数据识别词组的权重。通过权重确定一条数据识别的可靠度。例如:计算每一条数据中数据识别词组的最大权重θ;θ越大,数据识别的可靠度越高。
例如:一条数据中的数据识别词组有四个:ρA:“息由软件”:ρB:“由软件、发送”,ρC:“消息、由软件”,ρD:“本消息由”;权重分别为122、95、101、99,那么最大权重θ为122。
定期对数据库里的未标注数据或自动分类的可靠度低的数据,重新进行数据智能标签标注。
实施例2:如图2所示,数据智能分析识别方法,包括以下步骤:
S1.通过数据采集工具采集原始文本数据,利用预设分类器将原始文本数据分条分类后,存入数据库;
S2.采集公共用户或管理员对数据库中数据的操作,并分别对相应数据标注标签;
S3.对标注不同标签的数据分别分词操作,获得不同标签的数据识别词组;
S4.对新存入数据库的数据分词;检查新存入数据库的数据,是否含有数据识别词组;
S5.如果只含有某个标签的数据识别词组,则将该条数据标注该标签;如果含有多个标签的数据识别词组,则根据数据识别词组将该条数据切分成多个短文本数据,然后再分别标注标签;
S6.对存入数据库的一条数据C,如果不含数据识别词组,但是只同标注某一标签的数据中的某条数据D相似度大于预设阈值,比如90%,则对该条数据C标注该标签。否则不进行标注标签。
相似度可以采用但不限于余弦相似性算法,简单共有词算法,Jaccard距离算法、编辑距离算法等算法计算。
采集用户或管理员对数据库中数据的操作;包括采集被用户查看的信息数据,采集被管理员删除或者更改分类的信息数据。
数据识别词组,通过以下方法确定:
βa=∑βi, (i=1..n) n≥2,且βa≠0;那么β为第a个标签的数据识别词组;
β是一个词组,可以是一条数据中的一个词也可以是多个词的组合,
n为标签的个数,
βi为第i个标签的数据中含有词组β的数据条数。
一条数据中含有多个不同长度的数据识别词组Ρ={ρ1…ρn},n≥2;如果一数据识别词组ρA包含另一数据识别词组ρB,则删除该数据识别词组ρA。例如:ρA:“本消息、由软件、发送”,ρB:“由软件、发送”,ρC:“消息、由软件”;则删除ρA。
定期对数据库里的未标注数据或自动分类的数据,重新进行数据智能标签标注。
实施例3:如图3所示,数据智能分析识别系统,包括:
数据采集模块,用于采集原始文本数据;
预设分类器,处理原始文本数据,分条分类后,存入数据库;
数据库,用于保存数据;
用户数据采集模块,用于采集用户对数据的操作,并标注相应用户操作数据;
机器学习模块,用于根据标注的相应用户操作数据,不断更新数据识别词组;
智能标注模块,用于自动进行智能标签标注。
智能标注模块,自动进行智能标签标注,包括:根据数据识别词组或者相似度自动进行智能标签标注;定期对数据库里的未标注数据或自动分类的数据,重新进行数据智能标签标注。
数据采集模块,包括合法采用网络爬虫、聊天机器人采集原始文本数据。
以上的所述乃是本发明的具体实施例及所运用的技术原理,若依本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的保护范围。

Claims (10)

1.一种数据智能分析识别方法,其特征在于包括以下步骤:
S1.通过数据采集工具采集原始文本数据,利用预设分类器将所述原始文本数据分条分类后,存入数据库;
S2.采集公共用户或管理员对数据库中数据的操作,并分别对相应数据标注标签;
S3.对标注不同标签的数据分别分词操作,获得不同标签的数据识别词组;
S4.对新存入数据库的数据分词,然后根据数据识别词组自动进行智能标签标注。
2.根据权利要求1所述的数据智能分析识别方法,其特征在于所述采集用户或管理员对数据库中数据的操作;包括采集被用户查看的信息数据,采集被管理员删除或者更改分类的信息数据。
3.根据权利要求1所述的数据智能分析识别方法,其特征在于所述数据识别词组,通过以下方法确定:
βa=∑βi, (i=1..n) n≥2,且βa≠0;那么β为第a个标签的数据识别词组;
β是一个词组,可以是一条数据中的一个词也可以是多个词的组合,
n为标签的个数,
βi为第i个标签的数据中含有词组β的数据条数。
4.根据权利要求1所述的数据智能分析识别方法,其特征在于所述根据数据识别词组自动进行智能标签标注,通过以下步骤完成:
S41.检查新存入数据库的数据,是否含有数据识别词组;
S42.如果只含有某个标签的数据识别词组,则将该条数据标注该标签;如果含有多个标签的数据识别词组,则根据数据识别词组将该条数据切分成多个短文本数据,然后再分别标注标签;
S43.如果不含有数据识别词组则不进行标注标签。
5.根据权利要求3所述的数据智能分析识别方法,其特征在于一条数据中含有多个不同长度的数据识别词组Ρ={ρ1…ρn},n≥2;如果一数据识别词组ρA包含另一数据识别词组ρB,则删除该数据识别词组ρA。
6.根据权利要求4所述的数据智能分析识别方法,其特征在于对存入数据库的一条数据C,如果不含数据识别词组,但是只同标注某一标签的数据中的某条数据D相似度大于预设阈值,则对该条数据C标注该标签。
7.根据权利要求6所述的数据智能分析识别方法,其特征在于,定期对数据库里的未标注数据,重新进行数据智能标签标注。
8.一种数据智能分析识别系统,其特征在于包括:
数据采集模块,用于采集原始文本数据;
预设分类器,处理原始文本数据,分条分类后,存入数据库;
数据库,用于保存数据;
用户数据采集模块,用于采集用户对数据的操作,并标注相应用户操作数据;
机器学习模块,用于根据标注的相应用户操作数据,不断更新数据识别词组;
智能标注模块,用于自动进行智能标签标注。
9.根据权利要求8所述的数据智能分析识别系统,其特征在于,智能标注模块,自动进行智能标签标注,包括:根据数据识别词组或者相似度自动进行智能标签标注;定期对数据库里的未标注数据或自动分类的数据,重新进行数据智能标签标注。
10.根据权利要求9所述的数据智能分析识别系统,其特征在于,所述数据采集模块,包括合法采用网络爬虫、聊天机器人采集原始文本数据。
CN201911123554.XA 2019-11-17 2019-11-17 一种数据智能分析识别方法及系统 Active CN110837735B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911123554.XA CN110837735B (zh) 2019-11-17 2019-11-17 一种数据智能分析识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911123554.XA CN110837735B (zh) 2019-11-17 2019-11-17 一种数据智能分析识别方法及系统

Publications (2)

Publication Number Publication Date
CN110837735A true CN110837735A (zh) 2020-02-25
CN110837735B CN110837735B (zh) 2023-11-03

Family

ID=69576570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911123554.XA Active CN110837735B (zh) 2019-11-17 2019-11-17 一种数据智能分析识别方法及系统

Country Status (1)

Country Link
CN (1) CN110837735B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796526A (zh) * 2019-11-11 2020-02-14 太原蓝知科技有限公司 知识产权交易数据系统及处理方法

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060288029A1 (en) * 2005-06-21 2006-12-21 Yamatake Corporation Sentence classification device and method
WO2011044659A1 (en) * 2009-10-15 2011-04-21 2167959 Ontario Inc. System and method for phrase identification
CN102194013A (zh) * 2011-06-23 2011-09-21 上海毕佳数据有限公司 一种基于领域知识的短文本分类方法及文本分类系统
US20120023103A1 (en) * 2009-01-21 2012-01-26 Telefonaktiebolaget Lm Ericsson (Publ) Generation of Annotation Tags Based on Multimodal Metadata and Structured Semantic Descriptors
CN103077164A (zh) * 2012-12-27 2013-05-01 新浪网技术(中国)有限公司 文本分析方法及文本分析器
CN106919673A (zh) * 2017-02-21 2017-07-04 浙江工商大学 基于深度学习的文本情绪分析系统
CN107085581A (zh) * 2016-02-16 2017-08-22 腾讯科技(深圳)有限公司 短文本分类方法和装置
WO2017167067A1 (zh) * 2016-03-30 2017-10-05 阿里巴巴集团控股有限公司 网页文本分类的方法和装置,网页文本识别的方法和装置
CN107291685A (zh) * 2016-04-13 2017-10-24 北京大学 语义识别方法和语义识别系统
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN107577785A (zh) * 2017-09-15 2018-01-12 南京大学 一种适用于法律识别的层次多标签分类方法
CN107622050A (zh) * 2017-09-14 2018-01-23 武汉烽火普天信息技术有限公司 基于Bi‑LSTM和CRF的文本序列标注系统及方法
US20180032497A1 (en) * 2016-07-15 2018-02-01 Intuit Inc. Lean parsing: a natural language processing system and method for parsing domain-specific languages
WO2018028077A1 (zh) * 2016-08-11 2018-02-15 中兴通讯股份有限公司 一种基于深度学习的中文语义分析的方法及装置
CN108280064A (zh) * 2018-02-28 2018-07-13 北京理工大学 分词、词性标注、实体识别及句法分析的联合处理方法
CN109597994A (zh) * 2018-12-04 2019-04-09 挖财网络技术有限公司 短文本问题语义匹配方法和系统
CN110059181A (zh) * 2019-03-18 2019-07-26 中国科学院自动化研究所 面向大规模分类体系的短文本标签方法、系统、装置

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060288029A1 (en) * 2005-06-21 2006-12-21 Yamatake Corporation Sentence classification device and method
US20120023103A1 (en) * 2009-01-21 2012-01-26 Telefonaktiebolaget Lm Ericsson (Publ) Generation of Annotation Tags Based on Multimodal Metadata and Structured Semantic Descriptors
WO2011044659A1 (en) * 2009-10-15 2011-04-21 2167959 Ontario Inc. System and method for phrase identification
CN102194013A (zh) * 2011-06-23 2011-09-21 上海毕佳数据有限公司 一种基于领域知识的短文本分类方法及文本分类系统
CN103077164A (zh) * 2012-12-27 2013-05-01 新浪网技术(中国)有限公司 文本分析方法及文本分析器
CN107085581A (zh) * 2016-02-16 2017-08-22 腾讯科技(深圳)有限公司 短文本分类方法和装置
WO2017167067A1 (zh) * 2016-03-30 2017-10-05 阿里巴巴集团控股有限公司 网页文本分类的方法和装置,网页文本识别的方法和装置
CN107291685A (zh) * 2016-04-13 2017-10-24 北京大学 语义识别方法和语义识别系统
US20180032497A1 (en) * 2016-07-15 2018-02-01 Intuit Inc. Lean parsing: a natural language processing system and method for parsing domain-specific languages
WO2018028077A1 (zh) * 2016-08-11 2018-02-15 中兴通讯股份有限公司 一种基于深度学习的中文语义分析的方法及装置
CN106919673A (zh) * 2017-02-21 2017-07-04 浙江工商大学 基于深度学习的文本情绪分析系统
CN107315737A (zh) * 2017-07-04 2017-11-03 北京奇艺世纪科技有限公司 一种语义逻辑处理方法及系统
CN107622050A (zh) * 2017-09-14 2018-01-23 武汉烽火普天信息技术有限公司 基于Bi‑LSTM和CRF的文本序列标注系统及方法
CN107577785A (zh) * 2017-09-15 2018-01-12 南京大学 一种适用于法律识别的层次多标签分类方法
CN108280064A (zh) * 2018-02-28 2018-07-13 北京理工大学 分词、词性标注、实体识别及句法分析的联合处理方法
CN109597994A (zh) * 2018-12-04 2019-04-09 挖财网络技术有限公司 短文本问题语义匹配方法和系统
CN110059181A (zh) * 2019-03-18 2019-07-26 中国科学院自动化研究所 面向大规模分类体系的短文本标签方法、系统、装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
丁军平等: "面向元信息分类的支持向量机改进技术", 《西安交通大学学报》 *
丁军平等: "面向元信息分类的支持向量机改进技术", 《西安交通大学学报》, no. 08, 10 May 2011 (2011-05-10) *
吕愿愿等: "利用实体与依存句法结构特征的病历短文本分类方法", 《中国医疗器械杂志》 *
吕愿愿等: "利用实体与依存句法结构特征的病历短文本分类方法", 《中国医疗器械杂志》, no. 04, 30 July 2016 (2016-07-30) *
杨明芬;吴旭;阚瑷珂;常康;: "基于大数据分析的文本智能识别系统的研究", 西藏科技, no. 09 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796526A (zh) * 2019-11-11 2020-02-14 太原蓝知科技有限公司 知识产权交易数据系统及处理方法

Also Published As

Publication number Publication date
CN110837735B (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
CN107085585B (zh) 用于图像搜索的准确的标签相关性预测
CN111966917B (zh) 一种基于预训练语言模型的事件检测与摘要方法
Carvalho et al. Learning to extract signature and reply lines from email
CN111198948A (zh) 文本分类校正方法、装置、设备及计算机可读存储介质
CN110175334B (zh) 基于自定义的知识槽结构的文本知识抽取系统和方法
WO2022110637A1 (zh) 问答对话评测方法、装置、设备及存储介质
CN112163424A (zh) 数据的标注方法、装置、设备和介质
CN111597328B (zh) 一种新事件主题提取方法
CN110717041A (zh) 一种案件检索方法及系统
CN107357765B (zh) Word文档碎片化方法及装置
CN112395421B (zh) 课程标签的生成方法、装置、计算机设备及介质
CN111930933A (zh) 一种基于人工智能的检务案件处理方法及装置
CN108763192B (zh) 用于文本处理的实体关系抽取方法及装置
CN114416979A (zh) 一种文本查询方法、设备和存储介质
CN113946657A (zh) 一种基于知识推理的电力业务意图自动识别方法
CN114491034B (zh) 一种文本分类方法及智能设备
CN110837735B (zh) 一种数据智能分析识别方法及系统
CN111737498A (zh) 一种应用于离散制造业生产过程的领域知识库建立方法
CN111708870A (zh) 基于深度神经网络的问答方法、装置及存储介质
CN116431746A (zh) 基于编码库的地址映射方法、装置、电子设备及存储介质
CN110941713A (zh) 基于主题模型的自优化金融资讯版块分类方法
CN114780601A (zh) 一种数据查询方法、装置、电子设备和存储介质
KR101126186B1 (ko) 형태적 중의성 동사 분석 장치, 방법 및 그 기록 매체
CN115563311B (zh) 一种文档标注和知识库管理方法及知识库管理系统
CN109344254A (zh) 一种地址信息分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room 44, floor 19, building 1, No. 18, Jialingjiang East Street, Jianye District, Nanjing, Jiangsu 210000

Applicant after: Lanzhi Technology (Nanjing) Co.,Ltd.

Address before: 030000 Shanxi Taiyuan Shanxi comprehensive reform demonstration zone Taiyuan Education Park Industrial Road 38 high tech real estate 608 room

Applicant before: TAIYUAN LANZHI TECHNOLOGY CO.,LTD.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220615

Address after: 030000 room 801, 8 / F, building a, smart port, No. 163, Jinyang street, Taiyuan City, Shanxi Province

Applicant after: Youyou (Shanxi) Technology Co.,Ltd.

Address before: Room 44, floor 19, building 1, No. 18, Jialingjiang East Street, Jianye District, Nanjing, Jiangsu 210000

Applicant before: Lanzhi Technology (Nanjing) Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230925

Address after: 010000 Room 1701, Block C, Hengsheng Plaza, Xilingol South Road, Zhaojun Road Street, Yuquan District, Hohhot City, Inner Mongolia Autonomous Region

Applicant after: Inner Mongolia China Media Interactive Technology Co.,Ltd.

Address before: 030000 room 801, 8 / F, building a, smart port, No. 163, Jinyang street, Taiyuan City, Shanxi Province

Applicant before: Youyou (Shanxi) Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant