CN103365934A - 复杂命名实体抽取方法及装置 - Google Patents
复杂命名实体抽取方法及装置 Download PDFInfo
- Publication number
- CN103365934A CN103365934A CN 201210104504 CN201210104504A CN103365934A CN 103365934 A CN103365934 A CN 103365934A CN 201210104504 CN201210104504 CN 201210104504 CN 201210104504 A CN201210104504 A CN 201210104504A CN 103365934 A CN103365934 A CN 103365934A
- Authority
- CN
- China
- Prior art keywords
- repeated strings
- text
- frequency
- named entities
- strings
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (15)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210104504 CN103365934A (zh) | 2012-04-11 | 2012-04-11 | 复杂命名实体抽取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210104504 CN103365934A (zh) | 2012-04-11 | 2012-04-11 | 复杂命名实体抽取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103365934A true CN103365934A (zh) | 2013-10-23 |
Family
ID=49367295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201210104504 Pending CN103365934A (zh) | 2012-04-11 | 2012-04-11 | 复杂命名实体抽取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103365934A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015172529A1 (zh) * | 2014-05-13 | 2015-11-19 | 华为技术有限公司 | 一种挖掘最大重复序列的方法及装置 |
CN105550168A (zh) * | 2015-12-10 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 一种确定对象的概念词的方法和装置 |
CN106919433A (zh) * | 2016-06-01 | 2017-07-04 | 阿里巴巴集团控股有限公司 | 重复代码片段查询方法和装置 |
CN111241832A (zh) * | 2020-01-15 | 2020-06-05 | 北京百度网讯科技有限公司 | 核心实体标注方法、装置及电子设备 |
CN112307251A (zh) * | 2019-06-24 | 2021-02-02 | 上海松鼠课堂人工智能科技有限公司 | 英语词汇知识点图谱自适应识别关联系统和方法 |
CN113268988A (zh) * | 2021-07-19 | 2021-08-17 | 中国平安人寿保险股份有限公司 | 文本实体分析方法、装置、终端设备及存储介质 |
-
2012
- 2012-04-11 CN CN 201210104504 patent/CN103365934A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015172529A1 (zh) * | 2014-05-13 | 2015-11-19 | 华为技术有限公司 | 一种挖掘最大重复序列的方法及装置 |
CN105550168A (zh) * | 2015-12-10 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 一种确定对象的概念词的方法和装置 |
CN105550168B (zh) * | 2015-12-10 | 2019-01-15 | 百度在线网络技术(北京)有限公司 | 一种确定对象的概念词的方法和装置 |
CN106919433A (zh) * | 2016-06-01 | 2017-07-04 | 阿里巴巴集团控股有限公司 | 重复代码片段查询方法和装置 |
CN112307251A (zh) * | 2019-06-24 | 2021-02-02 | 上海松鼠课堂人工智能科技有限公司 | 英语词汇知识点图谱自适应识别关联系统和方法 |
CN112307251B (zh) * | 2019-06-24 | 2021-08-20 | 上海松鼠课堂人工智能科技有限公司 | 英语词汇知识点图谱自适应识别关联系统和方法 |
CN111241832A (zh) * | 2020-01-15 | 2020-06-05 | 北京百度网讯科技有限公司 | 核心实体标注方法、装置及电子设备 |
CN111241832B (zh) * | 2020-01-15 | 2023-08-15 | 北京百度网讯科技有限公司 | 核心实体标注方法、装置及电子设备 |
CN113268988A (zh) * | 2021-07-19 | 2021-08-17 | 中国平安人寿保险股份有限公司 | 文本实体分析方法、装置、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106709345B (zh) | 基于深度学习方法推断恶意代码规则的方法、系统及设备 | |
TWI729472B (zh) | 特徵詞的確定方法、裝置和伺服器 | |
CN100405371C (zh) | 一种提取新词的方法和系统 | |
US7424421B2 (en) | Word collection method and system for use in word-breaking | |
US10474642B2 (en) | Multibyte heterogeneous log preprocessing | |
US20060206306A1 (en) | Text mining apparatus and associated methods | |
CN103365934A (zh) | 复杂命名实体抽取方法及装置 | |
CN102053991B (zh) | 用于多语言文档检索的方法及系统 | |
CN102801859B (zh) | 垃圾短信的识别方法、装置和具有该装置的移动通信终端 | |
CN104598577B (zh) | 一种网页正文的提取方法 | |
CN107491477B (zh) | 一种表情符号搜索方法及装置 | |
CN102270206A (zh) | 一种有效网页内容的抓取方法及装置 | |
CN101593200A (zh) | 基于关键词频度分析的中文网页分类方法 | |
CN102279890A (zh) | 基于微博的情感词提取收集方法 | |
CN103123618A (zh) | 文本相似度获取方法和装置 | |
CN105787095A (zh) | 互联网新闻的自动生成方法和装置 | |
Wang et al. | A coverless plain text steganography based on character features | |
CN103778200A (zh) | 一种报文信息源抽取方法及其系统 | |
CN111881094B (zh) | 日志中关键信息提取方法、装置、终端及存储介质 | |
US20160283582A1 (en) | Device and method for detecting similar text, and application | |
WO2013177849A1 (zh) | 一种新建联系人的方法及终端 | |
CN111507090A (zh) | 摘要提取方法、装置、设备及计算机可读存储介质 | |
CN102550049A (zh) | 通过动态学习提取规则来获取词表外的翻译 | |
CN114021556A (zh) | 基于自然语言处理技术的日志敏感数据检测方法及系统 | |
CN108875050B (zh) | 面向文本的数字取证分析方法、装置和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
ASS | Succession or assignment of patent right |
Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD. Effective date: 20131023 |
|
C41 | Transfer of patent application or patent right or utility model | ||
COR | Change of bibliographic data |
Free format text: CORRECT: ADDRESS; FROM: 518044 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE |
|
TA01 | Transfer of patent application right |
Effective date of registration: 20131023 Address after: A Tencent Building in Shenzhen Nanshan District City, Guangdong streets in Guangdong province science and technology 518057 16 Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd. Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403 Applicant before: Tencent Technology (Shenzhen) Co., Ltd. |
|
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131023 |