CN1598814A - 同义词分类检索系统及方法 - Google Patents
同义词分类检索系统及方法 Download PDFInfo
- Publication number
- CN1598814A CN1598814A CN 03146917 CN03146917A CN1598814A CN 1598814 A CN1598814 A CN 1598814A CN 03146917 CN03146917 CN 03146917 CN 03146917 A CN03146917 A CN 03146917A CN 1598814 A CN1598814 A CN 1598814A
- Authority
- CN
- China
- Prior art keywords
- synonym
- thesaurus
- phrase
- classification
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种同义词分类检索系统及方法。同义词分类检索系统包括多个客户端计算机,一应用服务器及一数据库服务器。使用者通过客户端计算机设置同义词组及其所属技术领域和语言种类,应用服务器通过网络接收该同义词组及其相关信息并将该同义词组导入至数据库服务器。使用者通过客户端计算机对数据库中之同义词组进行浏览、查询、添加、修改、删除操作。本发明之同义词分类检索系统及方法提供给使用者便利的同义词典导入方式,并能对同义词典进行编辑。
Description
【技术领域】
本发明是关于一种数据库检索系统及方法,特别是关于一种同义词分类检索系统及方法。
【背景技术】
随着信息时代的来临,人们将大量的信息存储在大容量的存储设备并利用数据库管理系统进行信息整合与管理,通过查询数据库从而获得所需信息。然而,数据库检索是一项比较费时、费力的工作。而存在有一些所需信息中往往并不包含用户输入的关键词的情况,因此如何能从多而杂的数据库中找到对用户有用的资料,即成为数据管理的一大难题。
现有的数据库查询方法,通过建立索引提高查询效率。数据库管理系统按照数据库中的某一列属性值或多列属性值的组合建立索引文件,用户输入查询关键词后,系统会通过索引文件快速查找包含该关键词的相关资料。甚至系统可以建立多级索引达到更高的查询效率。但是这些查询方法,大都只针对所输入的关键词进行相关数据的精确查询而很少有涉及同义词分类检索功能。所述的同义词系一组意思相近或相互关联的词汇,同一词汇的同义词可以属于不同领域。
如中华民国于1990年12月21日公告的公告号为469383号专利,其名称为“数据库检索装置与方法”。通过该专利所揭露的方法,用户输入查询关键词后,系统会通过索引文件快速查找包含该关键词的相关资料,用户在多数情况下需要多次输入关键词才能检索到所需有用的资料。然而,该类方法只能针对所输入的关键词进行检索,如果所检索的关键词在数据库中不存在,那么用户需再次输入与其相同或相近意思的关键词,这样才能检索到所需资料。这种检索方法检索效率很低,而且,往往当用户不知道相关联的关键词时,无法检索。因此需要提供一种同义词分类检索方法,其可列出与用户输入的关键词相同或相近的关键词,提供给使用者便利的资料检索方式。
【发明内容】
因此,针对先前技术所存在的不足,本发明的主要目的在于提供一种同义词分类检索系统及方法,其可设置同义词组并可根据同义词组进行同义词典的导入导出、浏览、查询、编辑操作。
为达成上述发明目的,本发明提供一种同义词分类检索系统。该同义词分类检索系统包括一应用服务器及通过网络连接该应用服务器的多个客户端计算机及一数据库服务器,其中该应用服务器包括有:一条件设置模块,其用于选择一技术领域名称、索引语言并根据用户需要设置同义词组的语言种类;一同义词典导入模块,其用于把一定格式的Excel文档导入到同义词典中,所述一定格式的Excel文档用于存储同义词及同义词组,且Excel文档的每一列均为同一种语言的同义词汇,若一词汇的同一语言的同义词不止一个,其相邻词汇之间用斜线(/)分开,所述同义词典是指多领域多语种同义词的集合,同一词汇可以属于多个领域和有多个同义词组,所述同义词组是指同一词汇的多种语言的同义词集合;一同义词典导出模块,其用于把同义词典的同义词组导出到一定格式的Excel文档中;一同义词典浏览模块,其用于显示选定单词的同义词组及其所属领技术领域;一同义词典查询模块,其用于查询并显示选定词汇的同义词组及其所属技术领域;及一同义词典管理模块,其用于合并、添加、删除、修改同义词。其中的数据库服务器用于存储同义词组及其同义词组的技术领域、索引语言及语言种类信息。其多个客户端计算机用于为使用者提供一交互式用户接口,便于使用者执行同义词典的导入、导出、添加、修改查询操作。
本发明还提供一种同义词分类检索方法,其包括如下步骤:设置同义词组的语言种类,选择导入的技术领域并导入同义词组;合并含有相同词汇的同义词组;导出同义词典;选择浏览的技术领域和索引语言并显示所属技术领域及其同义词组;接收查询关键词并显示所属技术领域及其同义词组;及添加、修改、删除同义词。
利用本发明,可以快速、灵活地完成同义词典的导入、导出和编辑同义词,为快速准确、全面地检索资料提供了保障。
【附图说明】
图1是本发明同义词分类检索系统的硬件架构图。
图2是本发明同义词分类检索系统的应用服务器的功能模块图。
图3是本发明同义词分类检索系统的信息流程图。
图4是本发明同义词分类检索方法的同义词典导入导出流程图。
图5是本发明同义词分类检索方法的同义词典管理流程图。
【具体实施方式】
如图1所示,是本发明同义词分类检索系统的硬件架构图。该同义词分类检索系统包括一数据库服务器1、一应用服务器2、一网络3及多个客户端计算机4。数据库服务器1,是用于存储同义词典及其相关资料。所述相关资料包括同义词组的技术领域、索引语言及语言种类信息。在本发明具体实施方式中,所述技术领域是根据用户自定义分类(UserDefinition Classification,UDC)预设的技术领域,例如机械领域、电子领域、化学领域等;同义词是指一组意思相近或相互关联的词汇,如计算器是计算机的同义词,同一词汇可以有多个同一语言的同义词;同义词组是指同一词汇的多种语言的同义词集合;同义词典是指多领域多语种同义词的集合,同一词汇可以属于多个领域和有多个同义词组。上述同义词及其同义词组均存储在数据库服务器1中的一定格式之Excel文档,所述一定格式的Excel文档是指Excel文档的每一列均为同一种语言的同义词汇,若同一词汇的同一语言的同义词不止一个,其相邻词汇之间用斜线(/)分开。
应用服务器2,用于进行同义词典的导入、导出和同义词的编辑操作。所述同义词典导入是把一定格式的Excel文档导入至同义词典中;同义词典导出是把同义词典导出至一定格式的Excel文档。网络3可为一企业内部网(Intranet)、互联网(Internet)或其它类型的通讯网路,用于连接上述设备。多个客户端计算机4,分散于不同地域,通过网络3与应用服务器2连接,为使用者提供一交互式用户接口,便于使用者执行同义词典的导入导出、编辑、查询操作。
如图2所示,是本发明同义词分类检索系统的应用服务器的功能模块图。该应用服务器2包括一条件设置模块21、一同义词典导入模块22、一同义词典导出模块23、一同义词典浏览模块24、一同义词典查询模块25及一同义词典管理模块26。其中条件设置模块21用于选择一导入的技术领域、根据用户需要设置同义词组的语言种类;同义词典导入模块22用于把一定格式的Excel文档导入到同义词典中;同义词典导出模块23用于把同义词典的同义词组导出到一定格式之Excel文档中;同义词典浏览模块24用于显示选定单词的同义词组及其所属技术领域;同义词典查询模块25用于查询并显示选定词汇的同义词组及其所属技术领域;同义词典管理模块26用于合并、添加、删除、修改同义词。
如图3所示,是本发明同义词分类检索系统的信息流程图。同义词典导入模块22接收客户端计算机4上传的同义词汇31及由条件设置模块设置的技术领域和语言信息33,并把同义词组导入至数据库服务器1,所述技术领域和语言信息33包括同义词组的技术领域、索引语言及语言种类信息。同义词典导出模块23可以把数据库服务器1中的同义词组32导出至选定Excel文档。同义词典查询模块25接收客户端计算机4上传的查询关键词35和条件设置模块21设置的技术领域和语言信息33,并显示查询关键词35的同义词组及其所属技术领域36;同义词典浏览模块24接收客户端计算机4上传的待浏览词汇34和条件设置模块21设置的技术领域和语言信息33,并显示待浏览词汇的同义词组及其所属技术领域36。在完成浏览后,同义词典管理模块26对上述浏览的词汇的同义词组进行编辑,如添加、删除、修改同义词并把更新后的同义词组37传送至数据库服务器1。
如图4所示,是本发明同义词分类检索方法的同义词导入导出流程图。条件设置模块21开启同义词典,选择须导入的Excel文档名称及其所属技术领域名称;根据用户需要设置同义词组的语言种类,如设置为简体中文、繁体中文、英文及其它语言种类(步骤S401)。同义词典导入模块22接收同义词组,并把该同义词组导入至数据库服务器1(步骤S402)。同义词典查询模块25查询数据库中是否包括含有相同词汇的同义词组(步骤S403)。若数据库服务器1中不存在相同词汇的同义词组,则同义词典管理模块26添加该同义词组为一新同义词组(步骤S405)。若数据库服务器1中已存在相同词汇的同义词组,同义词典查询模块25显示该相同词汇的其它同义词组列表;使用者通过客户端计算机4使用同义词典导入模块22判断是否合并存在相同词汇的同义词组(步骤S404)。若可以合并,同义词典管理模块26合并存在相同词汇的同义词组(步骤S406)。若不可以合并,则同义词典管理模块26添加该同义词组为一新同义词组(步骤S405)。完成上述步骤后,使用者通过客户端计算机4利用应用服务器2判断是否还有其它同义词组须导入至数据库服务器1(步骤S407)。若还有其它同义词组须导入数据库服务器1,同义词典导入模块22重新接收同义词组并导入下一同义词组至数据库服务器1(步骤S402),否则同义词典导出模块23更新索引,选择导出领域和导出的Excel文档名称并把同义词典导出至选定的Excel文档(步骤S408)。
如图5所示,是本发明同义词分类检索方法的同义词典管理操作流程图。条件设置模块21开启同义词典,选择须浏览的技术领域名称和索引语言种类,所述领域名称可以是一个技术领域如机械,也可以是全部技术领域,所述索引语言可根据使用者习惯任选一种,若未选择语言种类,则其索引将显示选定领域所有语言的索引(步骤S501);同义词典浏览模块24显示选定技术领域的索引并接收用户选定的待浏览词汇(步骤S502)。同义词典浏览模块24显示选定词汇的同义词组及其所属技术领域,同一词汇可以属于不同技术领域,如计算机可以属于信息类,也可以属于计算机类(步骤S503)。完成上述之步骤后,同义词典管理模块26可以对同义词组进行编辑,如添加、修改同义词,添加修改完成后须选择添加或修改的技术领域和语言种类;若需要删除同义词汇,则同义词典管理模块26删除选定词汇的同义词组(步骤S504)。在完成上述查询、添加、删除及修改操作后,更新索引后结束流程(步骤S505)。
Claims (8)
1.一种同义词分类检索系统,其包括:一应用服务器、多个客户端计算机及一数据库服务器,其特征在于,其中该应用服务器包括有:
一条件设置模块,其用于选择一技术领域、索引语言并根据用户需要设置同义词组的语言种类;
一同义词典导入模块,其用于把一定格式的Excel文档导入到同义词典中;
一同义词典导出模块,其用于把同义词典的同义词组导出到一定格式的Excel文档中;
一同义词典浏览模块,其用于显示选定单词的同义词组及其所属技术领域;及
一同义词典管理模块,其用于合并、添加、删除、修改同义词。
2.如权利要求1所述的同义词分类检索系统,其特征在于,所述的一定格式的Excel文档是指Excel文档用于存储不同词汇的多语种的同义词及同义词组。
3.如权利要求1所述的同义词分类检索系统,其特征在于,其中的数据库服务器用于存储同义词组及其同义词组的领域类别、索引语言及语言种类信息。
4.如权利要求1所述的同义词分类检索系统,其特征在于,其中得多个客户端计算机用于为使用者提供一交互式用户接口,便于使用者执行同义词典的导入导出、添加、修改查询等操作。
5.一种同义词分类检索方法,其可用于进行设置和管理同义词及其同义词组,其特征在于,该方法包括有如下步骤:
导入同义词组;
导出同义词典至选定Excel文档;
显示索引中待浏览词汇的同义词组和所属技术领域;及
编辑同义词。
6.如权利要求5所述的同义词分类检索方法,其特征在于,其中的导入同义词典步骤还包括判断数据库服务器中是否包括含有相同词汇的同义词组的步骤。
7.如权利要求1所述的同义词分类检索方法,其特征在于,其中导入同义词典步骤还包括合并含有相同词汇的同义词组的步骤。
8.如权利要求1所述的同义词分类检索方法,其特征在于,其中编辑同义词步骤还包括添加、删除、修改同义词的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03146917 CN1598814A (zh) | 2003-09-19 | 2003-09-19 | 同义词分类检索系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03146917 CN1598814A (zh) | 2003-09-19 | 2003-09-19 | 同义词分类检索系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1598814A true CN1598814A (zh) | 2005-03-23 |
Family
ID=34659720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 03146917 Pending CN1598814A (zh) | 2003-09-19 | 2003-09-19 | 同义词分类检索系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1598814A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100421110C (zh) * | 2005-08-31 | 2008-09-24 | 北京金山软件有限公司 | 一种词典类数据的检索方法 |
CN100456291C (zh) * | 2005-11-25 | 2009-01-28 | 英业达股份有限公司 | 词汇共享系统及方法 |
CN100507915C (zh) * | 2006-11-09 | 2009-07-01 | 华为技术有限公司 | 网络搜索方法、网络搜索设备和用户终端 |
CN101408876B (zh) * | 2007-10-09 | 2011-03-16 | 中兴通讯股份有限公司 | 一种电子文档全文检索的方法及系统 |
CN101739435B (zh) * | 2008-11-07 | 2012-05-09 | 中国移动通信集团公司 | 数据库访问方法、控制装置 |
CN102024026B (zh) * | 2006-04-19 | 2013-03-27 | 谷歌公司 | 用于处理查询词语的方法和系统 |
CN104424362A (zh) * | 2013-09-03 | 2015-03-18 | 思科技术公司 | 额外丰富内容元数据生成器 |
CN110929503A (zh) * | 2019-11-27 | 2020-03-27 | 上海交通大学 | 基于医学同义词在线编辑检索系统 |
-
2003
- 2003-09-19 CN CN 03146917 patent/CN1598814A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100421110C (zh) * | 2005-08-31 | 2008-09-24 | 北京金山软件有限公司 | 一种词典类数据的检索方法 |
CN100456291C (zh) * | 2005-11-25 | 2009-01-28 | 英业达股份有限公司 | 词汇共享系统及方法 |
CN102024026B (zh) * | 2006-04-19 | 2013-03-27 | 谷歌公司 | 用于处理查询词语的方法和系统 |
CN100507915C (zh) * | 2006-11-09 | 2009-07-01 | 华为技术有限公司 | 网络搜索方法、网络搜索设备和用户终端 |
CN101408876B (zh) * | 2007-10-09 | 2011-03-16 | 中兴通讯股份有限公司 | 一种电子文档全文检索的方法及系统 |
CN101739435B (zh) * | 2008-11-07 | 2012-05-09 | 中国移动通信集团公司 | 数据库访问方法、控制装置 |
CN104424362A (zh) * | 2013-09-03 | 2015-03-18 | 思科技术公司 | 额外丰富内容元数据生成器 |
CN104424362B (zh) * | 2013-09-03 | 2019-06-07 | 西娜媒体有限公司 | 额外丰富内容元数据生成器 |
CN110929503A (zh) * | 2019-11-27 | 2020-03-27 | 上海交通大学 | 基于医学同义词在线编辑检索系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10261954B2 (en) | Optimizing search result snippet selection | |
AU2005209586B2 (en) | Systems, methods, and interfaces for providing personalized search and information access | |
CN101876981B (zh) | 一种构建知识库的方法及装置 | |
US7509306B2 (en) | Index for data retrieval and data structuring | |
US6519586B2 (en) | Method and apparatus for automatic construction of faceted terminological feedback for document retrieval | |
US7809716B2 (en) | Method and apparatus for establishing relationship between documents | |
US7599950B2 (en) | Systems and methods for collecting user annotations | |
CN103339623B (zh) | 涉及因特网搜索的方法和设备 | |
CN100507915C (zh) | 网络搜索方法、网络搜索设备和用户终端 | |
US20080065632A1 (en) | Server, method and system for providing information search service by using web page segmented into several inforamtion blocks | |
WO2002039320A1 (en) | Method for structuring and searching information | |
CN113190687B (zh) | 知识图谱的确定方法、装置、计算机设备及存储介质 | |
US20200175081A1 (en) | Server, method and system for providing information search service by using sheaf of pages | |
CN104035993A (zh) | 电子书的存储检索方法、电子书管理系统、阅读系统 | |
TWI290687B (en) | System and method for search information based on classifications of synonymous words | |
KR20110133909A (ko) | 모든 자연어 표현의 각각의 의미마다 별도의 용어를 동적으로 생성하는 방법 및 이를 기반으로 하는 사전 관리기,문서작성기, 용어 주석기, 검색 시스템 및 문서정보체계 구축장치 | |
CN1598814A (zh) | 同义词分类检索系统及方法 | |
JP4469432B2 (ja) | インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US20050060353A1 (en) | Method and system for personalized information management | |
US20030046276A1 (en) | System and method for modular data search with database text extenders | |
JP4649036B2 (ja) | 検索サーバーによるカテゴリの報告方法、レコードの報告方法、検索サービス装置 | |
JP4094844B2 (ja) | 特定用途向けの文書収集装置、その方法及びコンピュータに実行させるためのプログラム | |
CN114417179A (zh) | 一种面向大规模知识库群的元搜索引擎处理方法和装置 | |
KR101347123B1 (ko) | 정보검색장치 및 정보검색방법, 컴퓨터 판독가능 기록매체 | |
KR20010107810A (ko) | 웹 검색시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |