CN101118556A - 一种短文本的新词发现方法和系统 - Google Patents
一种短文本的新词发现方法和系统 Download PDFInfo
- Publication number
- CN101118556A CN101118556A CNA2007101218776A CN200710121877A CN101118556A CN 101118556 A CN101118556 A CN 101118556A CN A2007101218776 A CNA2007101218776 A CN A2007101218776A CN 200710121877 A CN200710121877 A CN 200710121877A CN 101118556 A CN101118556 A CN 101118556A
- Authority
- CN
- China
- Prior art keywords
- neologisms
- search
- candidate
- short text
- precise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007101218776A CN100478961C (zh) | 2007-09-17 | 2007-09-17 | 一种短文本的新词发现方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007101218776A CN100478961C (zh) | 2007-09-17 | 2007-09-17 | 一种短文本的新词发现方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101118556A true CN101118556A (zh) | 2008-02-06 |
CN100478961C CN100478961C (zh) | 2009-04-15 |
Family
ID=39054672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007101218776A Active CN100478961C (zh) | 2007-09-17 | 2007-09-17 | 一种短文本的新词发现方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100478961C (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853284A (zh) * | 2010-05-24 | 2010-10-06 | 哈尔滨工程大学 | 面向互联网的有意义串的提取方法及装置 |
CN102043843A (zh) * | 2010-12-08 | 2011-05-04 | 百度在线网络技术(北京)有限公司 | 一种用于基于目标应用获取目标词条的方法与获取设备 |
CN102231153A (zh) * | 2011-05-25 | 2011-11-02 | 盛乐信息技术(上海)有限公司 | 一种新词发现方法和系统 |
CN102929873A (zh) * | 2011-08-08 | 2013-02-13 | 腾讯科技(深圳)有限公司 | 一种基于情境搜索提取搜索价值词的方法及装置 |
CN103092826A (zh) * | 2012-12-31 | 2013-05-08 | 百度在线网络技术(北京)有限公司 | 一种根据用户的输入信息构建输入词条的方法与设备 |
CN103186618A (zh) * | 2011-12-30 | 2013-07-03 | 北京新媒传信科技有限公司 | 正确数据的获取方法和装置 |
CN104572624A (zh) * | 2015-01-20 | 2015-04-29 | 浙江大学 | 一种基于词向量发现单味药与疾病之间的治疗关系的方法 |
WO2016127459A1 (zh) * | 2015-02-12 | 2016-08-18 | 深圳市前海安测信息技术有限公司 | 智能交互系统中未登录词的识别方法和装置 |
CN106033462A (zh) * | 2015-03-19 | 2016-10-19 | 科大讯飞股份有限公司 | 一种新词发现方法及系统 |
CN106649250A (zh) * | 2015-10-29 | 2017-05-10 | 北京国双科技有限公司 | 一种情感新词的识别方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1226717C (zh) * | 2000-08-30 | 2005-11-09 | 国际商业机器公司 | 自动新词提取方法和系统 |
TW548600B (en) * | 2000-10-04 | 2003-08-21 | Microsoft Corp | Method and system for identifying attributes of new words in non-segmented text |
US20070214199A1 (en) * | 2006-03-09 | 2007-09-13 | Williams Frank J | Method for registering information for searching |
CN100405371C (zh) * | 2006-07-25 | 2008-07-23 | 北京搜狗科技发展有限公司 | 一种提取新词的方法和系统 |
-
2007
- 2007-09-17 CN CNB2007101218776A patent/CN100478961C/zh active Active
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853284A (zh) * | 2010-05-24 | 2010-10-06 | 哈尔滨工程大学 | 面向互联网的有意义串的提取方法及装置 |
CN101853284B (zh) * | 2010-05-24 | 2012-02-01 | 哈尔滨工程大学 | 面向互联网的有意义串的提取方法及装置 |
CN102043843A (zh) * | 2010-12-08 | 2011-05-04 | 百度在线网络技术(北京)有限公司 | 一种用于基于目标应用获取目标词条的方法与获取设备 |
CN102231153A (zh) * | 2011-05-25 | 2011-11-02 | 盛乐信息技术(上海)有限公司 | 一种新词发现方法和系统 |
CN102929873A (zh) * | 2011-08-08 | 2013-02-13 | 腾讯科技(深圳)有限公司 | 一种基于情境搜索提取搜索价值词的方法及装置 |
CN102929873B (zh) * | 2011-08-08 | 2017-03-22 | 腾讯科技(深圳)有限公司 | 一种基于情境搜索提取搜索价值词的方法及装置 |
CN103186618B (zh) * | 2011-12-30 | 2016-06-29 | 北京新媒传信科技有限公司 | 正确数据的获取方法和装置 |
CN103186618A (zh) * | 2011-12-30 | 2013-07-03 | 北京新媒传信科技有限公司 | 正确数据的获取方法和装置 |
CN103092826A (zh) * | 2012-12-31 | 2013-05-08 | 百度在线网络技术(北京)有限公司 | 一种根据用户的输入信息构建输入词条的方法与设备 |
CN104572624A (zh) * | 2015-01-20 | 2015-04-29 | 浙江大学 | 一种基于词向量发现单味药与疾病之间的治疗关系的方法 |
CN104572624B (zh) * | 2015-01-20 | 2017-12-29 | 浙江大学 | 一种基于词向量发现单味药与疾病之间的治疗关系的方法 |
WO2016127459A1 (zh) * | 2015-02-12 | 2016-08-18 | 深圳市前海安测信息技术有限公司 | 智能交互系统中未登录词的识别方法和装置 |
CN106033462A (zh) * | 2015-03-19 | 2016-10-19 | 科大讯飞股份有限公司 | 一种新词发现方法及系统 |
CN106033462B (zh) * | 2015-03-19 | 2019-11-15 | 科大讯飞股份有限公司 | 一种新词发现方法及系统 |
CN106649250A (zh) * | 2015-10-29 | 2017-05-10 | 北京国双科技有限公司 | 一种情感新词的识别方法及装置 |
CN106649250B (zh) * | 2015-10-29 | 2019-08-02 | 北京国双科技有限公司 | 一种情感新词的识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN100478961C (zh) | 2009-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100478961C (zh) | 一种短文本的新词发现方法和系统 | |
CN100489863C (zh) | 一种新词发现方法和系统 | |
CN103914548B (zh) | 信息搜索方法和装置 | |
CN102184256A (zh) | 一种针对海量相似短文本的聚类方法和系统 | |
CN102693279B (zh) | 一种快速计算评论相似度的方法、装置及系统 | |
CN107153658A (zh) | 一种基于关键字加权算法的舆情热词发现方法 | |
CN101901249A (zh) | 一种图像检索中基于文本的查询扩展与排序方法 | |
CN108681574A (zh) | 一种基于文本摘要的非事实类问答答案选择方法及系统 | |
CN108920482B (zh) | 基于词汇链特征扩展和lda模型的微博短文本分类方法 | |
CN104268230B (zh) | 一种基于异质图随机游走的中文微博客观点探测方法 | |
CN110362678A (zh) | 一种自动提取中文文本关键词的方法与装置 | |
CN111460158B (zh) | 一种基于情感分析的微博话题公众情感预测方法 | |
Minkov et al. | Graph based similarity measures for synonym extraction from parsed text | |
Rudrapal et al. | A Survey on Automatic Twitter Event Summarization. | |
Yang et al. | Ontology generation for large email collections. | |
CN111444713B (zh) | 新闻事件内实体关系抽取方法及装置 | |
CN102722526B (zh) | 基于词性分类统计的重复网页和近似网页的识别方法 | |
CN102929864A (zh) | 一种音字转换方法及装置 | |
Minkov et al. | Learning graph walk based similarity measures for parsed text | |
CN103984731B (zh) | 微博环境下自适应话题追踪方法和装置 | |
CN108595515A (zh) | 一种结合微博弱关系的微博情感分析方法 | |
CN112528640A (zh) | 一种基于异常子图检测的领域术语自动抽取方法 | |
KR101351555B1 (ko) | 대용량 데이터의 텍스트마이닝을 위한 의미기반 분류 추출시스템 | |
Li et al. | Complex query recognition based on dynamic learning mechanism | |
CN111767730B (zh) | 一种事件类型识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C53 | Correction of patent for invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Gong Caichun Inventor after: Huang Yulan Inventor after: Cheng Xueqi Inventor before: Gong Caichun Inventor before: Huang Yulan |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: GONG CAICHUN HUANG YULAN TO: GONG CAICHUN HUANG YULAN CHENG XUEQI |
|
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20080206 Assignee: Branch DNT data Polytron Technologies Inc Assignor: Institute of Computing Technology, Chinese Academy of Sciences Contract record no.: 2018110000033 Denomination of invention: New word of short-text discovering method and system Granted publication date: 20090415 License type: Common License Record date: 20180807 |
|
EE01 | Entry into force of recordation of patent licensing contract |