CN107608949A - 一种基于语义模型的文本信息抽取方法及装置 - Google Patents
一种基于语义模型的文本信息抽取方法及装置 Download PDFInfo
- Publication number
- CN107608949A CN107608949A CN201710959738.4A CN201710959738A CN107608949A CN 107608949 A CN107608949 A CN 107608949A CN 201710959738 A CN201710959738 A CN 201710959738A CN 107608949 A CN107608949 A CN 107608949A
- Authority
- CN
- China
- Prior art keywords
- expression formula
- extraction
- expression
- text
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710959738.4A CN107608949B (zh) | 2017-10-16 | 2017-10-16 | 一种基于语义模型的文本信息抽取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710959738.4A CN107608949B (zh) | 2017-10-16 | 2017-10-16 | 一种基于语义模型的文本信息抽取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107608949A true CN107608949A (zh) | 2018-01-19 |
CN107608949B CN107608949B (zh) | 2019-04-16 |
Family
ID=61078490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710959738.4A Active CN107608949B (zh) | 2017-10-16 | 2017-10-16 | 一种基于语义模型的文本信息抽取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107608949B (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108549694A (zh) * | 2018-04-16 | 2018-09-18 | 南京云问网络技术有限公司 | 一种文本中时间信息的处理方法 |
CN108647194A (zh) * | 2018-04-28 | 2018-10-12 | 北京神州泰岳软件股份有限公司 | 信息抽取方法及装置 |
CN109542845A (zh) * | 2018-11-14 | 2019-03-29 | 广州瞬速信息科技有限公司 | 一种基于关键词表达式的文本元数据提取方法 |
CN109657121A (zh) * | 2018-12-09 | 2019-04-19 | 佛山市金穗数据服务有限公司 | 一种基于网络爬虫的Web页面信息采集方法及装置 |
CN109684631A (zh) * | 2018-12-12 | 2019-04-26 | 北京神州泰岳软件股份有限公司 | 命名实体抽取方法、装置及介质 |
CN109740159A (zh) * | 2018-12-29 | 2019-05-10 | 北京泰迪熊移动科技有限公司 | 用于命名实体识别的处理方法及装置 |
CN109783819A (zh) * | 2019-01-18 | 2019-05-21 | 广东小天才科技有限公司 | 一种正则表达式的生成方法及系统 |
CN109885659A (zh) * | 2019-02-20 | 2019-06-14 | 安徽省泰岳祥升软件有限公司 | 一种对文本内时间信息归一化的方法及装置 |
CN109918490A (zh) * | 2019-03-01 | 2019-06-21 | 安徽省泰岳祥升软件有限公司 | 一种内容抽取方法及装置 |
CN110348003A (zh) * | 2019-05-22 | 2019-10-18 | 安徽省泰岳祥升软件有限公司 | 文本有效信息的抽取方法及装置 |
CN110442868A (zh) * | 2019-08-01 | 2019-11-12 | 第四范式(北京)技术有限公司 | 文本处理方法、装置及电子设备 |
CN110597959A (zh) * | 2019-09-17 | 2019-12-20 | 北京百度网讯科技有限公司 | 文本信息抽取方法、装置以及电子设备 |
CN110795932A (zh) * | 2019-09-30 | 2020-02-14 | 中国地质大学(武汉) | 基于地质本体的地质报告文本信息提取方法 |
CN111008523A (zh) * | 2019-11-21 | 2020-04-14 | 中科鼎富(北京)科技发展有限公司 | 一种信息提取方法、装置及服务器 |
CN111222326A (zh) * | 2020-01-15 | 2020-06-02 | 中科鼎富(北京)科技发展有限公司 | 裁判文书的信息抽取方法及装置 |
CN111400449A (zh) * | 2020-03-12 | 2020-07-10 | 广州大学 | 一种正则表达式抽取方法及装置 |
CN111400451A (zh) * | 2020-03-16 | 2020-07-10 | 北京百度网讯科技有限公司 | 信息抽取方法、信息抽取装置和电子设备 |
CN111881664A (zh) * | 2020-06-30 | 2020-11-03 | 北京来也网络科技有限公司 | 一种结合rpa和ai的信息抽取方法、装置、设备及介质 |
CN111898381A (zh) * | 2020-06-30 | 2020-11-06 | 北京来也网络科技有限公司 | 一种结合rpa与ai的文本信息提取方法、装置、设备及介质 |
CN112632991A (zh) * | 2020-12-30 | 2021-04-09 | 北京久其软件股份有限公司 | 一种中文语言的特征信息提取方法及装置 |
CN114861677A (zh) * | 2022-05-30 | 2022-08-05 | 北京百度网讯科技有限公司 | 信息抽取方法、装置、电子设备以及存储介质 |
CN116881582A (zh) * | 2023-07-18 | 2023-10-13 | 北京粉笔蓝天科技有限公司 | 基于模式匹配和词性标注的报名时间提取方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101101600A (zh) * | 2007-07-10 | 2008-01-09 | 北京大学 | 网络搜索中基于多种规则的元数据自动抽取方法 |
CN102063493A (zh) * | 2010-12-30 | 2011-05-18 | 北京大学 | 基于正则表达式组和控制逻辑的内容抽取方法 |
CN102360368A (zh) * | 2011-10-09 | 2012-02-22 | 山东大学 | 基于抽取模板可视化定制的Web数据抽取方法 |
CN103246641A (zh) * | 2013-05-16 | 2013-08-14 | 李营 | 一种文本语义信息分析系统和方法 |
CN104376108A (zh) * | 2014-11-26 | 2015-02-25 | 克拉玛依红有软件有限责任公司 | 一种基于6w语义标识的非结构化自然语言信息抽取方法 |
CN104462268A (zh) * | 2014-11-24 | 2015-03-25 | 深圳市比一比网络科技有限公司 | 一种html文档信息抽取表达式的方法及系统 |
CN105224520A (zh) * | 2015-09-28 | 2016-01-06 | 北京信息科技大学 | 一种中文专利文献术语自动识别方法 |
CN105975475A (zh) * | 2016-03-31 | 2016-09-28 | 华南理工大学 | 基于中文短语串的细粒度主题信息抽取方法 |
CN106095745A (zh) * | 2016-05-27 | 2016-11-09 | 厦门市美亚柏科信息股份有限公司 | 基于通讯记录的交易记录提取方法及其系统 |
CN107229698A (zh) * | 2017-05-24 | 2017-10-03 | 北京神州泰岳软件股份有限公司 | 一种信息处理的方法及装置 |
CN107247707A (zh) * | 2017-06-27 | 2017-10-13 | 北京神州泰岳软件股份有限公司 | 基于补全策略的企业关联关系信息提取方法和装置 |
-
2017
- 2017-10-16 CN CN201710959738.4A patent/CN107608949B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101101600A (zh) * | 2007-07-10 | 2008-01-09 | 北京大学 | 网络搜索中基于多种规则的元数据自动抽取方法 |
CN102063493A (zh) * | 2010-12-30 | 2011-05-18 | 北京大学 | 基于正则表达式组和控制逻辑的内容抽取方法 |
CN102360368A (zh) * | 2011-10-09 | 2012-02-22 | 山东大学 | 基于抽取模板可视化定制的Web数据抽取方法 |
CN103246641A (zh) * | 2013-05-16 | 2013-08-14 | 李营 | 一种文本语义信息分析系统和方法 |
CN104462268A (zh) * | 2014-11-24 | 2015-03-25 | 深圳市比一比网络科技有限公司 | 一种html文档信息抽取表达式的方法及系统 |
CN104376108A (zh) * | 2014-11-26 | 2015-02-25 | 克拉玛依红有软件有限责任公司 | 一种基于6w语义标识的非结构化自然语言信息抽取方法 |
CN105224520A (zh) * | 2015-09-28 | 2016-01-06 | 北京信息科技大学 | 一种中文专利文献术语自动识别方法 |
CN105975475A (zh) * | 2016-03-31 | 2016-09-28 | 华南理工大学 | 基于中文短语串的细粒度主题信息抽取方法 |
CN106095745A (zh) * | 2016-05-27 | 2016-11-09 | 厦门市美亚柏科信息股份有限公司 | 基于通讯记录的交易记录提取方法及其系统 |
CN107229698A (zh) * | 2017-05-24 | 2017-10-03 | 北京神州泰岳软件股份有限公司 | 一种信息处理的方法及装置 |
CN107247707A (zh) * | 2017-06-27 | 2017-10-13 | 北京神州泰岳软件股份有限公司 | 基于补全策略的企业关联关系信息提取方法和装置 |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108549694A (zh) * | 2018-04-16 | 2018-09-18 | 南京云问网络技术有限公司 | 一种文本中时间信息的处理方法 |
CN108549694B (zh) * | 2018-04-16 | 2021-11-23 | 南京云问网络技术有限公司 | 一种文本中时间信息的处理方法 |
CN108647194A (zh) * | 2018-04-28 | 2018-10-12 | 北京神州泰岳软件股份有限公司 | 信息抽取方法及装置 |
CN108647194B (zh) * | 2018-04-28 | 2022-04-19 | 北京神州泰岳软件股份有限公司 | 信息抽取方法及装置 |
CN109542845B (zh) * | 2018-11-14 | 2022-12-30 | 广州瞬速信息科技有限公司 | 一种基于关键词表达式的文本元数据提取方法 |
CN109542845A (zh) * | 2018-11-14 | 2019-03-29 | 广州瞬速信息科技有限公司 | 一种基于关键词表达式的文本元数据提取方法 |
CN109657121A (zh) * | 2018-12-09 | 2019-04-19 | 佛山市金穗数据服务有限公司 | 一种基于网络爬虫的Web页面信息采集方法及装置 |
CN109684631A (zh) * | 2018-12-12 | 2019-04-26 | 北京神州泰岳软件股份有限公司 | 命名实体抽取方法、装置及介质 |
CN109740159B (zh) * | 2018-12-29 | 2022-04-26 | 北京泰迪熊移动科技有限公司 | 用于命名实体识别的处理方法及装置 |
CN109740159A (zh) * | 2018-12-29 | 2019-05-10 | 北京泰迪熊移动科技有限公司 | 用于命名实体识别的处理方法及装置 |
CN109783819A (zh) * | 2019-01-18 | 2019-05-21 | 广东小天才科技有限公司 | 一种正则表达式的生成方法及系统 |
CN109783819B (zh) * | 2019-01-18 | 2023-10-20 | 广东小天才科技有限公司 | 一种正则表达式的生成方法及系统 |
CN109885659B (zh) * | 2019-02-20 | 2022-12-16 | 安徽省泰岳祥升软件有限公司 | 一种对文本内时间信息归一化的方法及装置 |
CN109885659A (zh) * | 2019-02-20 | 2019-06-14 | 安徽省泰岳祥升软件有限公司 | 一种对文本内时间信息归一化的方法及装置 |
CN109918490A (zh) * | 2019-03-01 | 2019-06-21 | 安徽省泰岳祥升软件有限公司 | 一种内容抽取方法及装置 |
CN109918490B (zh) * | 2019-03-01 | 2022-12-16 | 安徽省泰岳祥升软件有限公司 | 一种内容抽取方法及装置 |
CN110348003B (zh) * | 2019-05-22 | 2023-10-17 | 安徽省泰岳祥升软件有限公司 | 文本有效信息的抽取方法及装置 |
CN110348003A (zh) * | 2019-05-22 | 2019-10-18 | 安徽省泰岳祥升软件有限公司 | 文本有效信息的抽取方法及装置 |
CN110442868A (zh) * | 2019-08-01 | 2019-11-12 | 第四范式(北京)技术有限公司 | 文本处理方法、装置及电子设备 |
CN110597959A (zh) * | 2019-09-17 | 2019-12-20 | 北京百度网讯科技有限公司 | 文本信息抽取方法、装置以及电子设备 |
CN110795932B (zh) * | 2019-09-30 | 2021-03-30 | 中国地质大学(武汉) | 基于地质本体的地质报告文本信息提取方法 |
CN110795932A (zh) * | 2019-09-30 | 2020-02-14 | 中国地质大学(武汉) | 基于地质本体的地质报告文本信息提取方法 |
CN111008523A (zh) * | 2019-11-21 | 2020-04-14 | 中科鼎富(北京)科技发展有限公司 | 一种信息提取方法、装置及服务器 |
CN111222326A (zh) * | 2020-01-15 | 2020-06-02 | 中科鼎富(北京)科技发展有限公司 | 裁判文书的信息抽取方法及装置 |
CN111400449A (zh) * | 2020-03-12 | 2020-07-10 | 广州大学 | 一种正则表达式抽取方法及装置 |
CN111400449B (zh) * | 2020-03-12 | 2023-05-02 | 广州大学 | 一种正则表达式抽取方法及装置 |
CN111400451A (zh) * | 2020-03-16 | 2020-07-10 | 北京百度网讯科技有限公司 | 信息抽取方法、信息抽取装置和电子设备 |
CN111898381A (zh) * | 2020-06-30 | 2020-11-06 | 北京来也网络科技有限公司 | 一种结合rpa与ai的文本信息提取方法、装置、设备及介质 |
CN111881664A (zh) * | 2020-06-30 | 2020-11-03 | 北京来也网络科技有限公司 | 一种结合rpa和ai的信息抽取方法、装置、设备及介质 |
CN112632991A (zh) * | 2020-12-30 | 2021-04-09 | 北京久其软件股份有限公司 | 一种中文语言的特征信息提取方法及装置 |
CN112632991B (zh) * | 2020-12-30 | 2024-05-14 | 北京久其软件股份有限公司 | 一种中文语言的特征信息提取方法及装置 |
CN114861677A (zh) * | 2022-05-30 | 2022-08-05 | 北京百度网讯科技有限公司 | 信息抽取方法、装置、电子设备以及存储介质 |
CN116881582A (zh) * | 2023-07-18 | 2023-10-13 | 北京粉笔蓝天科技有限公司 | 基于模式匹配和词性标注的报名时间提取方法 |
CN116881582B (zh) * | 2023-07-18 | 2024-02-13 | 北京粉笔蓝天科技有限公司 | 基于模式匹配和词性标注的报名时间提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107608949B (zh) | 2019-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107608949B (zh) | 一种基于语义模型的文本信息抽取方法及装置 | |
Tellez et al. | A simple approach to multilingual polarity classification in Twitter | |
CN103123618B (zh) | 文本相似度获取方法和装置 | |
CN106096664B (zh) | 一种基于社交网络数据的情感分析方法 | |
CN102214166B (zh) | 基于句法分析和层次模型的机器翻译系统和方法 | |
CN102693279B (zh) | 一种快速计算评论相似度的方法、装置及系统 | |
CN106066866A (zh) | 一种英文文献关键短语自动抽取方法与系统 | |
CN107357777B (zh) | 提取标签信息的方法和装置 | |
Saloot et al. | An architecture for Malay Tweet normalization | |
CN107688630B (zh) | 一种基于语义的弱监督微博多情感词典扩充方法 | |
Chengcheng | Automatic text summarization based on rhetorical structure theory | |
CN106383814A (zh) | 一种英文社交媒体短文本分词方法 | |
CN106610937A (zh) | 一种基于信息论的中文自动分词算法 | |
CN104346382B (zh) | 使用语言查询的文本分析系统和方法 | |
CN112328735A (zh) | 热点话题确定方法、装置及终端设备 | |
CN110334362B (zh) | 一种基于医学神经机器翻译的解决产生未翻译单词的方法 | |
CN115269834A (zh) | 一种基于bert的高精度文本分类方法及装置 | |
Hassel | Evaluation of automatic text summarization | |
Sagcan et al. | Toponym recognition in social media for estimating the location of events | |
CN104699662B (zh) | 识别整体符号串的方法和装置 | |
CN112101007A (zh) | 一种从非结构化文本数据中提取结构化数据的方法及系统 | |
Patil et al. | Inflectional and derivational hybrid stemmer for sentiment analysis: a case study with Marathi tweets | |
CN107818078B (zh) | 汉语自然语言对话的语义关联与匹配方法 | |
Nghiem et al. | Using MathML parallel markup corpora for semantic enrichment of mathematical expressions | |
CN109960720B (zh) | 针对半结构化文本的信息抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20180119 Assignee: Zhongke Dingfu (Beijing) Science and Technology Development Co., Ltd. Assignor: Beijing Shenzhou Taiyue Software Co., Ltd. Contract record no.: X2019990000215 Denomination of invention: Semantic model based text message extraction method and device Granted publication date: 20190416 License type: Exclusive License Record date: 20191127 |
|
EE01 | Entry into force of recordation of patent licensing contract | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200629 Address after: 230000 zone B, 19th floor, building A1, 3333 Xiyou Road, hi tech Zone, Hefei City, Anhui Province Patentee after: Dingfu Intelligent Technology Co., Ltd Address before: 100089 Beijing city Haidian District wanquanzhuang Road No. 28 Wanliu new building block A Room 601 Patentee before: BEIJING ULTRAPOWER SOFTWARE Co.,Ltd. |
|
TR01 | Transfer of patent right |