CN110162790A - 一种基于神经网络的犯罪行为识别方法 - Google Patents

一种基于神经网络的犯罪行为识别方法 Download PDF

Info

Publication number
CN110162790A
CN110162790A CN201910437728.3A CN201910437728A CN110162790A CN 110162790 A CN110162790 A CN 110162790A CN 201910437728 A CN201910437728 A CN 201910437728A CN 110162790 A CN110162790 A CN 110162790A
Authority
CN
China
Prior art keywords
criminal
behavior
neural network
criminal offence
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910437728.3A
Other languages
English (en)
Inventor
秦永彬
李婷
陈艳平
黄瑞章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Cloud Pioneer Tech Co ltd
Guizhou University
Original Assignee
Guizhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou University filed Critical Guizhou University
Priority to CN201910437728.3A priority Critical patent/CN110162790A/zh
Publication of CN110162790A publication Critical patent/CN110162790A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Technology Law (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于神经网络的犯罪行为识别方法,所述方法包括以下步骤:一、介绍犯罪行为的概念,制定犯罪行为的标注规范,并构建犯罪行为数据集;二、面向步骤一中所得的数据集,以Attentional‑BiLSTM‑CRF神经网络结构模型为依托,进行犯罪行为识别。该方法通过介绍犯罪行为的概念,制定犯罪行为识别规范,并构建了犯罪行为数据集。我们面向法律裁判文书,研究针对案情要素的行为序列关键词提取方法,围绕“犯罪行为词”提取关键案情要素特征。提出基于Attentional‑BiLSTM‑CRF神经网络结构的犯罪行为识别方法,该方法可以有效地提高犯罪行为识别的性能,取得了很好的效果。

Description

一种基于神经网络的犯罪行为识别方法
技术领域
本发明涉及一种犯罪行为识别方法,尤其涉及一种基于神经网络的犯罪行为 识别方法,属于自然语言处理和机器学习技术领域。
背景技术
大数据和人工智能的信息科技迅速发展,为司法数据信息化建设提供了强 有力的支撑。近些年来,“智慧法院”也成为了引人关注的重点计划。然而,面 对海量的司法文本数据,如何高速有效利用信息抽取技术,从而准确抽取出文 本中的犯罪行为,构建出完整的犯罪行为链,有效地提高司法质效,仍是一个 亟待解决的问题。而在本发明中,即对于中文裁判文书的案情部分的“犯罪行 为”进行深度挖掘分析。
现有的中文法律文本挖掘,主要涉及的是案件文本的分类和案件信息的抽 取,大多更关注于对裁判文书进行关键词(主题词)的抽取,进而对裁判文书进 行分类,其更多地属于针对文本的浅层分析和应用,未能充分考虑案件文本中以 “犯罪行为”为核心的案情特征要素,并不能有效支撑法条推荐、类案推送、辅助 量刑等辅助审判工作。在具体的司法实践中,我们还需要研究能够有效分析案件 案情特征的方法。
由于中文信息处理缺少句子分词信息和词的形态变化,加上中文动词使用灵 活、形式多变、结构复杂,识别犯罪行为是一项具有挑战性的任务。目前,信息 抽取的研究更多地关注于人名、地名、组织、时间、日期等命名实体的抽取,以 及实体间关系的抽取,涉及到犯罪行为词的抽取的研究还比较少,没有形成系统 化、深入化的研究。在中文信息处理领域,也缺少针对犯罪行为的标注规范和标 注数据集。与“犯罪行为”抽取最为贴近的是实体抽取、词性标注和语义角色标注。
发明内容
本发明要解决的技术问题是:提供一种基于神经网络的犯罪行为识别方法, 该方法通过介绍犯罪行为的概念,制定犯罪行为识别规范,并构建了犯罪行为数 据集。此外,我们面向法律裁判文书,研究针对案情要素的行为关键词提取方法, 围绕“犯罪行为词”提取关键案情要素特征。提出基于Attentional-BiLSTM-CRF 神经网络结构的犯罪行为识别方法,该方法可以有效地提高犯罪行为识别的性 能,有效的解决了上述存在的问题。
本发明的技术方案为:一种基于神经网络的犯罪行为识别方法,所述方法 包括以下步骤:一、定义犯罪行为概念并制定犯罪行为标注规范,并构建犯罪 行为数据集;二、面向步骤一中所得的数据集,以Attentional-BiLSTM-CRF神 经网络结构模型为依托,进行犯罪行为识别。
所述步骤一中,犯罪行为指的是在案情文本中,句子中可以单独作谓语的 动词,犯罪行为包括五种模式:单犯罪行为、复合结构犯罪行为、同义并列犯罪 行为、带修饰或带补语的犯罪行为和其他特殊犯罪行为。
所述单犯罪行为为仅包含单个动词的犯罪行为;复合结构犯罪行为为使用 重复的表达式来生成复合词的犯罪行为;同义并列犯罪行为为同时使用同义动词 作为动词表达式的犯罪行为;带修饰或带补语的犯罪行为为动词带有时态标记、 补语或修饰符的犯罪行为,其它特殊犯罪行为表达为使用名词化、形容词化、谚 语、成语或典故的犯罪行为。
所述步骤二中,识别步骤为:给定一个输入序列句子,通过双向递归神经 网络获取句子内部的依赖关系;然后,用注意力机制建模句子的焦点角色;最后 通过CRF层返回一条最大化的标注路径。
本发明的有益效果是:本发明针对案件裁判文书数据中文本结构规则性较 强、专业术语多、关键词专业性强、主题词较为明确、逻辑关系严谨、人员间关 联程度高、犯罪行为词时序关系明显等特点,致力于解决针对裁判文书的犯罪行 为特征要素抽取,实现对案情信息的有效描述。如此,在后续工作中,我们可以 借助犯罪行为,建立对应的“犯罪行为链”,以实现对于案情语义的深层分析, 助力法院审判流程的信息化、智能化和服务化,继而提供更加优质的诉讼服务, 提高审判工作的效率和严谨性。审判人员期望能够通过这些问题的解决,推动法 院的智能化应用,提升司法辅助工作的智能化水平,继而推进案件审判工作的公 平性和严谨性,取得了很好的使用效果。
附图说明
图1为本发明的犯罪行为识别模型。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将参照本说明书附图对 本发明作进一步的详细描述。
实施例1:如附图1所示,一种基于神经网络的犯罪行为识别方法,所述 方法包括以下步骤:一、介绍犯罪行为的概念,制定犯罪行为的标注规范,并 构建犯罪行为数据集;二、面向步骤一中所得的数据集,以 Attentional-BiLSTM-CRF神经网络结构模型为依托,进行犯罪行为识别。
所述步骤一中,犯罪行为包括五种模式:单犯罪行为、复合结构犯罪行为、 同义并列犯罪行为、带修饰或带补语的犯罪行为和特殊犯罪行为。
犯罪行为指的是在案情文本中,句子中可以单独作谓语的动词。目前,犯罪 行为还没有公开的标注数据集。由于犯罪行为使用灵活、形式多变、结构复杂, 结合犯罪行为的表达方式、语法功能和统计特性,根据发明的需要,把犯罪行为 分为五种模式:
模式1:单犯罪行为
仅包含单个动词的犯罪行为,如:不带修饰语、补语的及物动词和不及物动 词。
由于中文单词之间没有分隔符,在词的划分上存在歧义。这里的单个动词, 以词典的收录为准。因此,该模式涉及以下三个问题:1)许多登录动词里包含 表示时态的字符。如,“王某取得一把尖刀”和“王某取出一把尖刀”,其中“得”和 “出”可表示:刀已经“获得”或“取出”。“取得”在词典中能被查到,但“取出”不能。 因此,只有“取得”属于该模式,被标记为单个犯罪行为。2)若某个由连续动词 组成的复合动词已在词典中收录。则,该复合动词标记为单犯罪行为。如,“反 叛者们正在打砸抢”,尽管“打砸抢”可以被分割为“打/砸/抢”,但它在词典中已收 录。因此,标注为单犯罪行为。3)不及物动词。它们常由动词和名词组成。如, “下雨”和“下冰雹”,前者在词典中已收录,但后者没有。所以,“下雨”标记为单犯罪行为。在“下冰雹”中,只有“下”被标记为犯罪行为。
模式2:复合结构犯罪行为
中文语言中经常使用重复的表达式来生成复合词。如,AA,AAB,ABB, AABB,A里AB,A不AB,ABAB如,“走走”,“跑一跑”,“洗洗澡”,“勾勾 搭搭”等。
模式3:同义并列犯罪行为
同义动词通常同时使用作为动词表达式。如,“驱车/行驶”,“开发/建设”和“抓捕/归案”。我们将其标注为一个犯罪行为,如,[ACT-3驱车行驶](下标表示模式 3)。除此以外,连续的动词表达相反的语义,但属于偏正关系的,如“进进出出”, 也被标为一个犯罪行为。
如果两个连续的动词,代表一系列行动。如,“我去扭开水龙头”,“去扭开” 可以被分割为“去/扭开”。在这种情况下,我们将最后一个动词被标记为犯罪行 为。例如:“我去[ACT-3(扭)开]水龙头”,其中下标表示模式3,括号里的表 示中心词。
模式4:带修饰或带补语的犯罪行为
当动词带有时态标记、补语或修饰符时,我们将犯罪行为作为中心词标注在 括号里。例如,“王某取出一把尖刀”,标记为“王某[ACT-4(取)出]一把尖刀”。
模式5:其它特殊的犯罪行为表达
例如,名词化的动词,形容词化的动词,谚语,成语或典故等。
许多名词和形容词都可以用作动词,尤其是古典或文学风格的作品。如,“左 右[ACT-5欲(刃)]相如”,“[ACT-5(红)透]半边天”。在例句“马某某[ACT-5心生不 满]”中,成语“心生不满”如果切分,则会引起很多歧义,所以单独标注谓语犯罪 行为。该定义还可用于处理主语-谓语从句,其形式为:名词(代词)+动词(形 容词)。例如,“我[ACT-5开心]”,“我[ACT-5幸福]”等。
采用以上标注规范,可以标注实例。如:“被告人陈某某因家庭矛盾[ACT-1迁 怒]岳父滕某某。2015年6月29日凌晨,陈某某[ACT-4谎(称)]购买房屋,将其[ACT-1骗]至其新房南侧桥上。”
所述步骤二中,识别步骤为:给定一个输入序列句子,通过双向递归神经 网络获取句子内部的依赖关系;然后,用注意力机制建模句子的焦点角色;最后 通过CRF层返回一条最大化的标注路径。
犯罪行为识别建模成一个序列标注问题:给定一个输入序列(句子),返回 一条最大化标注路径。本发明通过双向递归神经网络获取句子内部的依赖关系。 然后,用注意力机制建模句子的焦点角色。最后通过CRF层返回一条最大化的 标注路径。具体步骤如下:
模型中的第一层是输入层,该层接受的输入数据shape的参数。模型中的Embedding层设置了字典的长度,并会在该层上使用一个全连接层。Embedding 层通过使用随机初始化的Embedding矩阵对预处理好的法院裁判文书案情文本 中句子里的字通过one-hot向量映射成为低维稠密的字向量,然后再通过词向量 来表示裁判文书中的文本内容。接下来是模型里能够进行自动提取句子特征的双 向LSTM层,在实际模型中,字序列经过词嵌入技术处理后,作为双向LSTM 的输入。对于包含n个单词的给定句子,将处理成前向LSTM的输出隐藏状态 序列以及反向的在相应的位置输出的 隐状态,并通过位置拼接得到完整的隐状态序列 (h1,h2,…,hn)∈Rn×m
BiLSTM输出的数据为每一个标签的预测分值,该分值将作为attention层的 输入。
本文中的attention机制思路是将上层LSTM中的输出向量作为Q、K、V (query,key,value)输入attention层中。首先计算一组query的attention函数, 并将它们组合成一个矩阵Q。key和value映射成矩阵K和V。我们计算输出 矩阵表示为:
其中,在此,暂不考虑激活函数,为 n*dk,m*dk,m*dv三个矩阵相乘,得n*dv的矩阵。
经过点积计算的query、key和value,再并行执行attention函数,产生dV维 输出值。把这个过程重复做h次,最后把结果拼接在一起输入下一层,产生最终 值,即完成Multi-Head Attention。具体来说,可以用以下公式表达,
其中,之后进行多头操作,可 得,Multihead(Q,K,V)=Concat(head1,,...,headh)
从上式中得到的序列。
模型中的最后一层是能够对句子级序列进行相应标注的CRF层,最后把输 入输出赋给模型并进行打印。
针对现有犯罪行为识别算法不足和识别困难的问题,本发明基于深度神经网 络技术的最新进展,开展犯罪行为识别的研究。在本发明中,采用BiLSTM-CRF 模型与attention机制相结合的方法进行犯罪行为识别。在序列化标注过程中,重 点考虑犯罪行为作为句子中心的问题。
基于神经网络的犯罪行为识别方法的实现可以包含两个部分。
第一部分是介绍犯罪行为的概念及规范,并构建犯罪行为数据集。
司法数据中的案情包含大量复杂的事件以及人物关系,多种行为的发生。而 本发明的中心即介绍犯罪行为这一概念,犯罪行为指的是在案情文本中,句子中 可以单独作谓语的动词。犯罪行为作为句子的核心,是关联全句中各个语言要素 的重要语法单元,因此识别犯罪行为是理解句子的关键。通过犯罪行为识别可以 解析句子结构,获取句子的语义信息。“犯罪行为”在整句中的重要性是可见的, 它可以直接展现事件发展的态势。对于本发明来说,犯罪行为识别可以形成一系 列的犯罪行为链,通过数据分析达到监控预测的效果。
根据司法数据案情的特征,制定一系列具有广泛应用性的标注规范。本标注 规范将包括犯罪行为的类别定义,不同的行为类别将以不同的数字以区分,使得 该标注规范即适用于所需标注数据,又能有效地消除中文语言之间的混乱与歧 义。从而得到可供实验的数据集。
第二部分是提出基于Attentional-BiLSTM-CRF神经网络结构的犯罪行为识 别方法。犯罪行为是句子中心,其识别存在高阶依赖,需要综合句子的整体结构 和语义特征进行判断,还需要对输出标注路径的结构进行调整。本发明拟采用神 经网络技术抽取句子的抽象语义特征和结构特征,并加入全局约束条件,优化训 练过程。在本发明中面向已有的标注语料库,以Attentional-BiLSTM-CRF神经 网络结构模型为依托,获得了较为优良的实验结果。
本发明提供了基于Attentional-BiLSTM-CRF神经网络结构的犯罪行为识别 方法。犯罪行为是句子的中心,是关联句子各个语言要素的重要语法单元,把握 句子之间的犯罪行为可以帮助理解案情事件的轮廓及全局。通过分析犯罪行为的 表达方式和上下文特征,制定标注规范,有助于揭示中文的句法结构特点和语言 表达规律,丰富中文自然语言处理的相关理论。
犯罪行为是句子的中心,其识别需要依赖句子的整体结构和语义。现有犯罪 行为识别主要采用基于规则和统计机器学习的方法,难以建模犯罪行为识别中的 高阶依赖信息。通过本发明,可以拓展中文信息处理的相关技术。
本发明未详述之处,均为本技术领域技术人员的公知技术。最后说明的是, 以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发 明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案 进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在 本发明的权利要求范围当中。

Claims (4)

1.一种基于神经网络的犯罪行为识别方法,其特征在于:所述方法包括以下步骤:一、定义犯罪行为概念并制定犯罪行为标注规范,并构建犯罪行为数据集;二、面向步骤一中所得的数据集,以Attentional-BiLSTM-CRF神经网络结构模型为依托,进行犯罪行为识别。
2.根据权利要求1所述的基于神经网络的犯罪行为识别方法,其特征在于:所述步骤一中,犯罪行为指的是在案情文本中,句子中可以单独作谓语的动词,犯罪行为包括五种模式:单犯罪行为、复合结构犯罪行为、同义并列犯罪行为、带修饰或带补语的犯罪行为和其他特殊犯罪行为。
3.根据权利要求2所述的基于神经网络的犯罪行为识别方法,其特征在于:所述单犯罪行为为仅包含单个动词的犯罪行为;复合结构犯罪行为为使用重复的表达式来生成复合词的犯罪行为;同义并列犯罪行为为同时使用同义动词作为动词表达式的犯罪行为;带修饰或带补语的犯罪行为为动词带有时态标记、补语或修饰符的犯罪行为,其它特殊犯罪行为表达为使用名词化、形容词化、谚语、成语或典故的犯罪行为。
4.根据权利要求1所述的基于神经网络的犯罪行为识别方法,其特征在于:所述步骤二中,识别步骤为:给定一个输入序列句子,通过双向递归神经网络获取句子内部的依赖关系;然后,用注意力机制建模句子的焦点角色;最后通过CRF层返回一条最大化的标注路径。
CN201910437728.3A 2019-05-24 2019-05-24 一种基于神经网络的犯罪行为识别方法 Pending CN110162790A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910437728.3A CN110162790A (zh) 2019-05-24 2019-05-24 一种基于神经网络的犯罪行为识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910437728.3A CN110162790A (zh) 2019-05-24 2019-05-24 一种基于神经网络的犯罪行为识别方法

Publications (1)

Publication Number Publication Date
CN110162790A true CN110162790A (zh) 2019-08-23

Family

ID=67632355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910437728.3A Pending CN110162790A (zh) 2019-05-24 2019-05-24 一种基于神经网络的犯罪行为识别方法

Country Status (1)

Country Link
CN (1) CN110162790A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062210A (zh) * 2019-12-25 2020-04-24 贵州大学 一种基于神经网络的谓语中心词识别方法
CN111160008A (zh) * 2019-12-18 2020-05-15 华南理工大学 一种实体关系联合抽取方法及系统
CN111370084A (zh) * 2020-02-07 2020-07-03 山东师范大学 基于BiLSTM的电子健康记录表示学习方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110178936A1 (en) * 2008-07-18 2011-07-21 Dewan Mohan Electronic Justice System
CN106294315A (zh) * 2016-07-27 2017-01-04 昆明理工大学 基于句法特性与统计融合的自然语言谓语动词识别方法
CN108133436A (zh) * 2017-11-23 2018-06-08 科大讯飞股份有限公司 自动判案方法及系统
CN109033351A (zh) * 2018-07-25 2018-12-18 北京神州泰岳软件股份有限公司 案情数据的归并方法及装置
CN109684628A (zh) * 2018-11-23 2019-04-26 武汉烽火众智数字技术有限责任公司 基于案情语义分析的案件智能推送方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110178936A1 (en) * 2008-07-18 2011-07-21 Dewan Mohan Electronic Justice System
CN106294315A (zh) * 2016-07-27 2017-01-04 昆明理工大学 基于句法特性与统计融合的自然语言谓语动词识别方法
CN108133436A (zh) * 2017-11-23 2018-06-08 科大讯飞股份有限公司 自动判案方法及系统
CN109033351A (zh) * 2018-07-25 2018-12-18 北京神州泰岳软件股份有限公司 案情数据的归并方法及装置
CN109684628A (zh) * 2018-11-23 2019-04-26 武汉烽火众智数字技术有限责任公司 基于案情语义分析的案件智能推送方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ASHISH VASWANI ET.AL: "Attention Is All You Need", 《ARXIV:1706.03762V5 [CS.CL]》 *
刘晓俊等: "基于Bi-LSTM和注意力机制的命名实体识别", 《洛阳理工学院学报(自然科学版)》 *
朱频频等: "《智能客户服务技术与应用》", 31 January 2019, 中国铁道出版社 *
王良萸: "面向碳交易领域的知识图谱构建方法", 《计算机与现代化》 *
韩宝育等: "《现代汉语(下)》", 30 June 2018, 陕西师范大学出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160008A (zh) * 2019-12-18 2020-05-15 华南理工大学 一种实体关系联合抽取方法及系统
CN111062210A (zh) * 2019-12-25 2020-04-24 贵州大学 一种基于神经网络的谓语中心词识别方法
CN111370084A (zh) * 2020-02-07 2020-07-03 山东师范大学 基于BiLSTM的电子健康记录表示学习方法及系统
CN111370084B (zh) * 2020-02-07 2023-10-03 山东师范大学 基于BiLSTM的电子健康记录表示学习方法及系统

Similar Documents

Publication Publication Date Title
CN110765257B (zh) 一种知识图谱驱动型的法律智能咨询系统
CN104636465B (zh) 网页摘要生成方法、展示方法及相应装置
CN109871538A (zh) 一种中文电子病历命名实体识别方法
CN104484411B (zh) 一种基于词典的语义知识库的构建方法
US20150081277A1 (en) System and Method for Automatically Classifying Text using Discourse Analysis
CN109344187B (zh) 一种司法判决书案情信息结构化处理系统
CN109558492A (zh) 一种适于事件归因的上市公司知识图谱构建方法及装置
CN110889786A (zh) 一种基于lstm技术的法律诉讼被告人保全用审判服务方法
CN112101028A (zh) 一种多特征双向门控领域专家实体抽取方法及系统
CN110162790A (zh) 一种基于神经网络的犯罪行为识别方法
CN108681574A (zh) 一种基于文本摘要的非事实类问答答案选择方法及系统
CN106126619A (zh) 一种基于视频内容的视频检索方法及系统
CN108509409A (zh) 一种自动生成语义相近句子样本的方法
CN102567509A (zh) 视觉信息辅助的即时通信方法及系统
CN112989208B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN112036178A (zh) 一种配网实体相关的语义搜索方法
CN115759092A (zh) 一种基于albert的网络威胁情报命名实体识别方法
CN112733547A (zh) 一种利用语义依存分析的中文问句语义理解方法
CN110297986A (zh) 一种微博热点话题的情感倾向分析方法
CN117574898A (zh) 基于电网设备的领域知识图谱更新方法及系统
CN115640462A (zh) 一种基于知识库增强的跨域新闻推荐方法
CN106777080A (zh) 短摘要生成方法、数据库建立方法及人机对话方法
CN111813906A (zh) 一种基于犯罪行为链的相似案件计算方法
CN113761128A (zh) 领域同义词典与模式匹配相结合的事件关键信息抽取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: 550025 Huaxi North Campus science and Technology Department of Huaxi District, Huaxi District, Guiyang, Guizhou

Applicant after: Guizhou University

Applicant after: Higher people's Court of Guizhou Province

Applicant after: GUIZHOU CLOUD PIONEER TECH Co.,Ltd.

Address before: 550025 Huaxi North Campus science and Technology Department of Huaxi District, Huaxi District, Guiyang, Guizhou

Applicant before: Guizhou University

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190823

RJ01 Rejection of invention patent application after publication