CN103365992A - 一种基于一维线性空间实现Trie树的词典检索方法 - Google Patents
一种基于一维线性空间实现Trie树的词典检索方法 Download PDFInfo
- Publication number
- CN103365992A CN103365992A CN2013102888215A CN201310288821A CN103365992A CN 103365992 A CN103365992 A CN 103365992A CN 2013102888215 A CN2013102888215 A CN 2013102888215A CN 201310288821 A CN201310288821 A CN 201310288821A CN 103365992 A CN103365992 A CN 103365992A
- Authority
- CN
- China
- Prior art keywords
- node
- trie tree
- dictionary
- dimensional linear
- linear space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9027—Trees
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (6)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310288821.5A CN103365992B (zh) | 2013-07-03 | 2013-07-03 | 一种基于一维线性空间实现Trie树的词典检索方法 |
PCT/CN2014/080179 WO2015010509A1 (zh) | 2013-07-03 | 2014-06-18 | 一种基于一维线性空间实现Trie树的词典检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310288821.5A CN103365992B (zh) | 2013-07-03 | 2013-07-03 | 一种基于一维线性空间实现Trie树的词典检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103365992A true CN103365992A (zh) | 2013-10-23 |
CN103365992B CN103365992B (zh) | 2017-02-15 |
Family
ID=49367333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310288821.5A Active CN103365992B (zh) | 2013-07-03 | 2013-07-03 | 一种基于一维线性空间实现Trie树的词典检索方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103365992B (zh) |
WO (1) | WO2015010509A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015010509A1 (zh) * | 2013-07-03 | 2015-01-29 | 深圳市华傲数据技术有限公司 | 一种基于一维线性空间实现Trie树的词典检索方法 |
WO2015010508A1 (zh) * | 2013-07-03 | 2015-01-29 | 深圳市华傲数据技术有限公司 | 一种基于一维线性空间实现Trie树的词典存储管理方法 |
CN107239549A (zh) * | 2017-06-07 | 2017-10-10 | 传神语联网网络科技股份有限公司 | 数据库术语检索的方法、装置及终端 |
CN107273360A (zh) * | 2017-06-21 | 2017-10-20 | 成都布林特信息技术有限公司 | 基于语义理解的中文实词提取算法 |
CN107680588A (zh) * | 2017-05-10 | 2018-02-09 | 平安科技(深圳)有限公司 | 智能语音导航方法、装置及存储介质 |
CN108153907A (zh) * | 2018-01-18 | 2018-06-12 | 中国计量大学 | 通过16位Trie树实现空间优化的存储管理方法 |
CN108197313A (zh) * | 2018-02-01 | 2018-06-22 | 中国计量大学 | 通过16位Trie树实现空间优化的词典索引方法 |
CN108509419A (zh) * | 2018-03-21 | 2018-09-07 | 山东中医药大学 | 中医药古籍文献分词和词性标引方法及系统 |
CN109684439A (zh) * | 2018-12-28 | 2019-04-26 | 语联网(武汉)信息技术有限公司 | 分词过程中进行前缀索引的方法及装置 |
CN109739948A (zh) * | 2018-12-28 | 2019-05-10 | 北京金山安全软件有限公司 | 词表的存储管理方法、装置、电子设备及存储介质 |
CN110688483A (zh) * | 2019-09-16 | 2020-01-14 | 重庆邮电大学 | 文景转换中基于词典的名词可视性标注方法、介质及系统 |
CN112100132A (zh) * | 2020-09-24 | 2020-12-18 | 深圳软牛科技有限公司 | 一种已删除文件类型识别方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1606741A2 (en) * | 2003-03-27 | 2005-12-21 | Sand Technology Systems International, Inc. | A computer implemented compact 0-complete tree dynamic storage structure and method of processing stored data |
CN1786962A (zh) * | 2005-12-21 | 2006-06-14 | 中国科学院计算技术研究所 | 完美双数组trie树词典管理与检索方法 |
EP1702275A1 (fr) * | 2003-08-11 | 2006-09-20 | France Telecom | Dispositif de memoire trie a mecanisme de pipeline circulaire |
CN101499094A (zh) * | 2009-03-10 | 2009-08-05 | 焦点科技股份有限公司 | 一种数据压缩存储并检索的方法及系统 |
CN101788990A (zh) * | 2009-01-23 | 2010-07-28 | 北京金远见电脑技术有限公司 | Trie树双数组的全局优化构造方法及系统 |
US20100235385A1 (en) * | 2009-03-10 | 2010-09-16 | Fujitsu Limited | Semi-structured data retrieval method, and structured data retrieval device |
WO2011150425A1 (en) * | 2010-05-28 | 2011-12-01 | Securitymetrics, Inc. | Systems and methods for determining whether data includes strings that correspond to sensitive information |
CN102651026A (zh) * | 2012-04-01 | 2012-08-29 | 百度在线网络技术(北京)有限公司 | 通过预计算优化搜索引擎分词的方法及搜索引擎分词装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2509496A1 (en) * | 2005-06-06 | 2006-12-06 | 3618633 Canada Inc. | Search-enhanced trie-based syntactic pattern recognition of sequences |
CN101398830B (zh) * | 2007-09-27 | 2012-06-27 | 阿里巴巴集团控股有限公司 | 词库模糊查询方法及词库模糊查询系统 |
CN103365992B (zh) * | 2013-07-03 | 2017-02-15 | 深圳市华傲数据技术有限公司 | 一种基于一维线性空间实现Trie树的词典检索方法 |
-
2013
- 2013-07-03 CN CN201310288821.5A patent/CN103365992B/zh active Active
-
2014
- 2014-06-18 WO PCT/CN2014/080179 patent/WO2015010509A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1606741A2 (en) * | 2003-03-27 | 2005-12-21 | Sand Technology Systems International, Inc. | A computer implemented compact 0-complete tree dynamic storage structure and method of processing stored data |
EP1702275A1 (fr) * | 2003-08-11 | 2006-09-20 | France Telecom | Dispositif de memoire trie a mecanisme de pipeline circulaire |
CN1786962A (zh) * | 2005-12-21 | 2006-06-14 | 中国科学院计算技术研究所 | 完美双数组trie树词典管理与检索方法 |
CN101788990A (zh) * | 2009-01-23 | 2010-07-28 | 北京金远见电脑技术有限公司 | Trie树双数组的全局优化构造方法及系统 |
CN101499094A (zh) * | 2009-03-10 | 2009-08-05 | 焦点科技股份有限公司 | 一种数据压缩存储并检索的方法及系统 |
US20100235385A1 (en) * | 2009-03-10 | 2010-09-16 | Fujitsu Limited | Semi-structured data retrieval method, and structured data retrieval device |
WO2011150425A1 (en) * | 2010-05-28 | 2011-12-01 | Securitymetrics, Inc. | Systems and methods for determining whether data includes strings that correspond to sensitive information |
CN102651026A (zh) * | 2012-04-01 | 2012-08-29 | 百度在线网络技术(北京)有限公司 | 通过预计算优化搜索引擎分词的方法及搜索引擎分词装置 |
Non-Patent Citations (2)
Title |
---|
戴耿毅等: "基于双数组丁rie树算法的字典改进和实现", 《软件导刊》 * |
魏进等: "单数组全映射分词词典", 《计算机工程与应用》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015010508A1 (zh) * | 2013-07-03 | 2015-01-29 | 深圳市华傲数据技术有限公司 | 一种基于一维线性空间实现Trie树的词典存储管理方法 |
WO2015010509A1 (zh) * | 2013-07-03 | 2015-01-29 | 深圳市华傲数据技术有限公司 | 一种基于一维线性空间实现Trie树的词典检索方法 |
CN107680588B (zh) * | 2017-05-10 | 2020-10-20 | 平安科技(深圳)有限公司 | 智能语音导航方法、装置及存储介质 |
CN107680588A (zh) * | 2017-05-10 | 2018-02-09 | 平安科技(深圳)有限公司 | 智能语音导航方法、装置及存储介质 |
CN107239549A (zh) * | 2017-06-07 | 2017-10-10 | 传神语联网网络科技股份有限公司 | 数据库术语检索的方法、装置及终端 |
CN107273360A (zh) * | 2017-06-21 | 2017-10-20 | 成都布林特信息技术有限公司 | 基于语义理解的中文实词提取算法 |
CN108153907A (zh) * | 2018-01-18 | 2018-06-12 | 中国计量大学 | 通过16位Trie树实现空间优化的存储管理方法 |
CN108153907B (zh) * | 2018-01-18 | 2021-01-22 | 中国计量大学 | 通过16位Trie树实现空间优化的词典存储管理方法 |
CN108197313A (zh) * | 2018-02-01 | 2018-06-22 | 中国计量大学 | 通过16位Trie树实现空间优化的词典索引方法 |
CN108509419A (zh) * | 2018-03-21 | 2018-09-07 | 山东中医药大学 | 中医药古籍文献分词和词性标引方法及系统 |
CN109684439A (zh) * | 2018-12-28 | 2019-04-26 | 语联网(武汉)信息技术有限公司 | 分词过程中进行前缀索引的方法及装置 |
CN109739948A (zh) * | 2018-12-28 | 2019-05-10 | 北京金山安全软件有限公司 | 词表的存储管理方法、装置、电子设备及存储介质 |
CN109739948B (zh) * | 2018-12-28 | 2021-08-03 | 北京金山安全软件有限公司 | 词表的存储管理方法、装置、电子设备及存储介质 |
CN110688483A (zh) * | 2019-09-16 | 2020-01-14 | 重庆邮电大学 | 文景转换中基于词典的名词可视性标注方法、介质及系统 |
CN110688483B (zh) * | 2019-09-16 | 2022-10-18 | 重庆邮电大学 | 文景转换中基于词典的名词可视性标注方法、介质及系统 |
CN112100132A (zh) * | 2020-09-24 | 2020-12-18 | 深圳软牛科技有限公司 | 一种已删除文件类型识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2015010509A1 (zh) | 2015-01-29 |
CN103365992B (zh) | 2017-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103365992A (zh) | 一种基于一维线性空间实现Trie树的词典检索方法 | |
US11573996B2 (en) | System and method for hierarchically organizing documents based on document portions | |
US9424294B2 (en) | Method for facet searching and search suggestions | |
CN102479191B (zh) | 提供多粒度分词结果的方法及其装置 | |
US20190147000A1 (en) | Systems and methods for performing search and retrieval of electronic documents using a big index | |
US10289717B2 (en) | Semantic search apparatus and method using mobile terminal | |
CN107038207A (zh) | 一种数据查询方法、数据处理方法及装置 | |
CN105045852A (zh) | 一种教学资源的全文搜索引擎系统 | |
US8825665B2 (en) | Database index and database for indexing text documents | |
EP2370911A1 (en) | System and method for matching entities | |
CN110795526B (zh) | 一种用于检索系统的数学公式索引创建方法与系统 | |
CN105404677B (zh) | 一种基于树形结构的检索方法 | |
CN103123650A (zh) | 一种基于整数映射的xml数据库全文索引方法 | |
WO2015010508A1 (zh) | 一种基于一维线性空间实现Trie树的词典存储管理方法 | |
CN109885641B (zh) | 一种数据库中文全文检索的方法及系统 | |
CN108763202A (zh) | 识别敏感文本的方法、装置、设备及可读存储介质 | |
CN101398830A (zh) | 词库模糊查询方法及词库模糊查询系统 | |
US9547701B2 (en) | Method of discovering and exploring feature knowledge | |
CN103500222A (zh) | 通信软件聊天对象的搜索方法及装置 | |
CN109933787A (zh) | 文本关键信息的提取方法、装置及介质 | |
CN105426490B (zh) | 一种基于树形结构的索引方法 | |
CN114817498A (zh) | 用户意图识别方法、装置、设备及存储介质 | |
Ilić et al. | Comparison of data mining algorithms, inverted index search and suffix tree clustering search | |
Bast | Efficient and Effective Search on Wikidata Using the QLever Engine | |
JP2002297603A (ja) | 情報抽出方法および構造化文書管理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent of invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Wang Guoyin Inventor after: Jia Xibei Inventor before: Wang Guoyin |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: WANG GUOYIN TO: WANG GUOYIN JIA XIBEI |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: 518000 2203/2204, Building 1, Huide Building, Beizhan Community, Minzhi Street, Longhua District, Shenzhen, Guangdong Patentee after: SHENZHEN AUDAQUE DATA TECHNOLOGY Ltd. Address before: 518057 Rooms 713, 715 and 716, 7/F, Software Building, No. 9, High-tech Middle Road, High-tech Zone, Nanshan District, Shenzhen, Guangdong Province Patentee before: SHENZHEN AUDAQUE DATA TECHNOLOGY Ltd. |