CN101661469A - 学术文献关键词标引和检索系统及方法 - Google Patents
学术文献关键词标引和检索系统及方法 Download PDFInfo
- Publication number
- CN101661469A CN101661469A CN200810139774A CN200810139774A CN101661469A CN 101661469 A CN101661469 A CN 101661469A CN 200810139774 A CN200810139774 A CN 200810139774A CN 200810139774 A CN200810139774 A CN 200810139774A CN 101661469 A CN101661469 A CN 101661469A
- Authority
- CN
- China
- Prior art keywords
- keyword
- academic
- retrieval
- data item
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种学术文献关键词标引和检索系统及方法。本系统基于将学术论文网络投稿编辑系统与学术文献数据库检索系统。其网络投稿编辑系统入口关键词按照研究对象、条件、方法、过程、属性、结果等定性描述文献完整主题内容的语义框架构造输入界面。由论文作者直接对学术期刊论文进行标引,由计算机自动生成词表,实现关键词的同义、近义和跨语言自动标引集成和检索集成。其检索系统按照相同的关键词必备数据项及顺序建立可选检索入口,由词的位置关系确定词的限定关系,提高专指性。
Description
技术领域
本发明涉及一种学术文献关键词标引和检索系统及方法。
背景技术
关键词法采用不受词表控制的原文本语言标引和检索文献,其最大的优越性在于其在检索时不受控制,符合人们日常表达的习惯,简单易用,而且标引简便高效,同时也可以避免由于文献分析标引的误差和情报检索语言的粗化所造成的标志表达文献主题的失真。正由于其自由度大,也存在两个难题.一是如何从原文中抽出最能准确、充分地表达文献主题的关键词,以及这些关键词与检索课题有效匹配的问题;二是自然语言对同义词、近义词、多义词及与其相关的一些词没有进行规范与统一,不能反映概念间的一一对应关系而对检索不利的难题。关键词法的这些缺点也同样增加了检索者的负担。解决的途径就需要对关键词进行规范,增强其匹配的准确性。
对关键词实施规范控制有两种方法:一种是前控方法,在标引前就设置了一个受控词表(如叙词表),在标引阶段对词汇进行控制。但在检索阶段不予控制,由计算机通过与受控词表相联的自然语言接口自动进行转换。但叙词语言并不适应情报检索语言计算机化和网络化发展的要求,标引速度慢、成本高、跟不上新词汇的发展,损失关键词法原本存在的优势;而且由于标引人员的专业限制,对复杂主题的分析易产生偏差。再就是后控方法,是指仅在检索阶段对关键词实施不严格的控制,但自然语言中的同义词、多义词现象不能得到有效解决,受控词表作用微弱。标引的一致性差,相同主题的文献就会分散,大大影响检索的命中率和查准率。这是关键词语言在标引和检索中存在的缺陷。
现今学术期刊中标引关键词已很普遍.但如何正确标引关键词,各学术期刊没有统一标准;关键词的排列次序反映词与词之间的逻辑关系,但绝大多数学术论文作者对关键词的有序组合概念模糊,排序没有可循的规律。学术期刊文献是学术期刊数据库主要信息源,文献标引的质量直接妨碍最终用户的检索行为和结果。
发明内容
鉴于此,本发明的目的在于提供一种学术文献关键词标引和检索系统及方法,将学术期刊网络投稿编辑系统与学术期刊数据库及数据库检索系统构成统一的数据平台,由学术期刊论文作者直接对学术期刊论文进行标引,而且对关键词采用统一的标引方法和检索方法,减少学术文献标引与检索之间对文献主题理解和判断方面产生的差异。
本发明的另一目的在于提供一种学术文献关键词标引和检索系统及方法,设置关键词必备数据项标引,把关键词按检索的目标内容合成特定逻辑关系,来限定检索的内容和范围,增强其专指性,使检索更有效。
为了达到以上目的,本发明将学术期刊网络投稿编辑系统与学术期刊数据库及数据库检索系统集成为统一的数据平台,包括统一的关键词必备数据项及其顺序,为学术期刊论文责任者(同时也是标引者),和检索用户在选择关键词进行标引和检索时构成语义一致的提问;统一的用于存储包括关键词必备数据项及其顺序和标引信息的存储装置和统一的关键词必备数据项的数据接口装置,用于学术期刊网络投稿编辑系统与学术期刊数据库系统之间的数据交换。学术期刊数据库及数据库检索系统还包括用于检索者根据所述关键词必备数据项形成查询的检索装置。
在此前提下,学术期刊论文作者即是学术期刊论文的直接标引者,由学术期刊论文作者在向学术期刊网络投稿时即按照关键词必备数据项、关键词必备数据项属性提示和关键词必备数据项顺序选择关键词和包含能满足表达的最小自然语言组进行标引输入,并由系统自动生成关键词表。关键词必备数据项包括:研究对象、研究条件、研究对象属性、研究过程、研究结果等。关键词必备数据项之间有一定的顺序,由词的位置关系确定词的限定关系。学术期刊论文作者选择关键词进行标引还包括关键词的同义、近义、外文、外文缩写等表示方式的标引输入的步骤。并由系统将不同学术期刊论文责任者选择输入的不同语言、不同形式的关键词的同义词、近义词、外文、外文缩写等表示方式基于词间转换链接到表示对应的统一的概念中间语标识符号上,实现关键词的同义、近义和跨语言自动标引集成和检索集成。
通过学术期刊网络投稿编辑系统与学术期刊数据库及数据库检索系统之间统一的关键词必备数据项的接口装置进行数据交换,学术期刊数据库检索系统按照与所述学术期刊网络投稿编辑系统入口关键词相同的关键词必备数据项及顺序建立可选检索入口,关键词必备数据项之间可以构成布尔逻辑组配。而且作为对检索者输入提交关键词构成的检索提问的响应,显示的检索结果同时包括对该关键词的同义、近义、外文、外文缩写等表示方式形成的检索结果。
附图说明
图1是本发明系统功能示意图;
图2是应用本发明的学术文献关键词必备数据项标引界面的实施例;
图3显示本发明的学术文献关键词的检索界面实施例。
具体实施方式
下面结合附图及具体实施例做进一步描述。
图1是一系统功能示意图,将学术期刊网络投稿编辑系统与学术期刊数据库及数据库检索系统构成统一的数据平台,对关键词采用统一的标引方法和检索方法,减少二者之间产生的差异。
图2是学术文献标引界面的实施例。所述界面包括:关键词必备数据项标引入口201,用于学术文献作者输入关键词进行标引;关键词必备数据项属性提示202,用于文献作者标引时选择关键词的语义范围限定;关键词必备数据项顺序结构203,表示各关键词必备数据项之间的语义关系;关键词的同义、近义、外文、外文缩写等表示方式的添加按钮204,提示学术文献作者标引关键词的同义、近义、外文、外文缩写等表示方式,并由系统将不同学术期刊论文责任者选择输入的不同语言、不同形式的关键词的同义词、近义词、外文、外文缩写等表示方式基于词间转换链接到表示对应的统一的概念中间语标识符号上,实现关键词的同义、近义和跨语言自动标引集成;提交按钮205,用于支持标引操作。
图3是学术文献检索界面的实施例。所述界面包括:关键词检索输入口301;区域302用于指明关键词的语义限定范围,所述关键词的语义限定范围中的选项与学术文献标引时的关键词必备数据项一致,并可通过单击相关的核选项进行选择。词的位置关系确定词的限定关系,提高专指性。检索者也可在关键词的语义限定范围之间进行组配,可选项之间用逻辑运算符表征,收缩检索结果;303为逻辑算符;304为检索检索提交按钮。检索者输入的关键词如有同义、近义、外文、外文缩写等其他表示方式,输入其中之一,可以一起检索所述关键词的其他表示方式。
本发明所述的方法并不限于具体实施方式中所述的实施例,本领域技术人员根据本发明的技术方案得出其他实施例也是可能的。
Claims (10)
1.一种学术文献关键词标引和检索系统,其特征在于:由学术期刊网络投稿编辑系统与学术期刊数据库及数据库检索系统构成统一的数据平台,包括:
统一的关键词必备数据项及其顺序,为学术期刊论文责任者(同时也是标引者),和检索用户在选择关键词进行标引和检索时构成语义一致的提问;
统一的用于存储包括关键词必备数据项及其顺序和标引信息的存储装置;
将不同学术期刊论文责任者选择输入的不同语言、不同形式的关键词的同义词、近义词、外文、外文缩写等表示方式基于词间转换链接到表示对应的统一的概念中间语标识符号上,实现关键词的同义、近义和跨语言自动标引集成和检索集成;
统一的关键词必备数据项的数据接口装置。
2.如权利要求1所述的学术文献关键词标引和检索系统,其特征在于所述学术期刊网络投稿编辑系统包括用于对所述关键词必备数据项进行输入和完成提交的装置。
3.如权利要求1所述的学术文献关键词标引和检索系统,其特征在于所述关键词必备数据项的数据接口装置用于学术期刊网络投稿编辑系统与学术期刊数据库系统之间的数据交换。
4.如权利要求1所述的学术文献关键词标引和检索系统,其特征在于所述学术期刊数据库及数据库检索系统包括用于检索者根据所述关键词必备数据项形成查询的检索装置。
5.一种学术文献关键词标引方法,其特征在于:学术期刊论文责任者是学术期刊论文的直接标引者。
6.如权利要求5所述的学术文献关键词标引方法,其特征在于,所述方法还包括以下步骤:
显示关键词必备数据项标引入口;
显示关键词必备数据项属性,如:研究对象、研究条件、研究对象属性、研究过程、研究结果等;
显示关键词必备数据项顺序;
由学术期刊论文责任者在向学术期刊网络投稿时即按照所述关键词必备数据项、关键词必备数据项属性提示和关键词必备数据项顺序选择关键词和包含能满足表达的最小自然语言组进行标引输入;
以关键词必备数据项及其顺序由系统自动生成关键词表。
7.如权利要求6所述的学术文献关键词标引方法,其特征在于,学术期刊论文责任者选择关键词进行标引还包括关键词的同义、近义、外文、外文缩写等表示方式的标引输入的步骤。
8.一种学术文献关键词检索方法,其特征在于所述方法包括以下步骤:
显示检索者可选关键词必备数据项属性及其顺序;
检索者可选关键词必备数据项属性之间可以构成布尔逻辑组配;
检索者通过对关键词必备数据项属性及其组配关系的选择,输入提交关键词或能满足表达的最小自然语言组构成检索提问;
作为对检索者的检索提问的响应显示检索结果。
9.如权利要求8所述的学术文献关键词检索方法,其特征在于,所述可选关键词必备数据项属性及其顺序用以在数据集合中定位关键词必备数据项中的一个。
10.如权利要求8所述的学术文献关键词检索方法,其特征在于,所述对检索者输入提交关键词构成的检索提问的响应,显示的检索结果同时包括对该关键词的同义、近义、外文、外文缩写等表示方式形成的检索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810139774A CN101661469A (zh) | 2008-09-09 | 2008-09-09 | 学术文献关键词标引和检索系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810139774A CN101661469A (zh) | 2008-09-09 | 2008-09-09 | 学术文献关键词标引和检索系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101661469A true CN101661469A (zh) | 2010-03-03 |
Family
ID=41789502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810139774A Pending CN101661469A (zh) | 2008-09-09 | 2008-09-09 | 学术文献关键词标引和检索系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101661469A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102207973A (zh) * | 2011-06-22 | 2011-10-05 | 上海互联网软件有限公司 | 一种模糊检索系统及其检索方法 |
CN102279846A (zh) * | 2010-06-10 | 2011-12-14 | 英业达股份有限公司 | 文章辅助写作系统及其方法 |
CN102467563A (zh) * | 2010-11-19 | 2012-05-23 | 金蝶软件(中国)有限公司 | 数据检索方法和系统 |
CN102999487A (zh) * | 2012-12-24 | 2013-03-27 | 中国科学院自动化研究所 | 一种数字出版资源语义增强描述系统及其方法 |
CN103455623A (zh) * | 2013-09-12 | 2013-12-18 | 广东电子工业研究院有限公司 | 一种融合多种语言文献的聚类机制 |
CN104170316A (zh) * | 2012-01-05 | 2014-11-26 | 国际商业机器公司 | 社交网络环境中的面向目标的用户匹配 |
CN106777103A (zh) * | 2016-12-15 | 2017-05-31 | 北京科华万象科技有限公司 | 一种专利文件标引方法和装置 |
CN111061863A (zh) * | 2019-12-16 | 2020-04-24 | 北大方正集团有限公司 | 期刊目录展示方法、装置及设备 |
CN112528102A (zh) * | 2020-12-15 | 2021-03-19 | 深圳供电局有限公司 | 一种基于布尔逻辑判断的规范词条匹配方法 |
-
2008
- 2008-09-09 CN CN200810139774A patent/CN101661469A/zh active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102279846A (zh) * | 2010-06-10 | 2011-12-14 | 英业达股份有限公司 | 文章辅助写作系统及其方法 |
CN102467563A (zh) * | 2010-11-19 | 2012-05-23 | 金蝶软件(中国)有限公司 | 数据检索方法和系统 |
CN102207973A (zh) * | 2011-06-22 | 2011-10-05 | 上海互联网软件有限公司 | 一种模糊检索系统及其检索方法 |
CN104170316A (zh) * | 2012-01-05 | 2014-11-26 | 国际商业机器公司 | 社交网络环境中的面向目标的用户匹配 |
US10268653B2 (en) | 2012-01-05 | 2019-04-23 | International Business Machines Corporation | Goal-oriented user matching among social networking environments |
CN102999487A (zh) * | 2012-12-24 | 2013-03-27 | 中国科学院自动化研究所 | 一种数字出版资源语义增强描述系统及其方法 |
CN102999487B (zh) * | 2012-12-24 | 2015-06-24 | 中国科学院自动化研究所 | 一种数字出版资源语义增强描述系统及其方法 |
CN103455623B (zh) * | 2013-09-12 | 2017-02-15 | 广东电子工业研究院有限公司 | 一种融合多种语言文献的聚类机制 |
CN103455623A (zh) * | 2013-09-12 | 2013-12-18 | 广东电子工业研究院有限公司 | 一种融合多种语言文献的聚类机制 |
CN106777103A (zh) * | 2016-12-15 | 2017-05-31 | 北京科华万象科技有限公司 | 一种专利文件标引方法和装置 |
CN111061863A (zh) * | 2019-12-16 | 2020-04-24 | 北大方正集团有限公司 | 期刊目录展示方法、装置及设备 |
CN111061863B (zh) * | 2019-12-16 | 2023-09-15 | 新方正控股发展有限责任公司 | 期刊目录展示方法、装置及设备 |
CN112528102A (zh) * | 2020-12-15 | 2021-03-19 | 深圳供电局有限公司 | 一种基于布尔逻辑判断的规范词条匹配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101661469A (zh) | 学术文献关键词标引和检索系统及方法 | |
CN104216913B (zh) | 问题回答方法、系统和计算机可读介质 | |
Qian et al. | Sample-driven schema mapping | |
Guo et al. | Improving multilingual semantic interoperation in cross-organizational enterprise systems through concept disambiguation | |
CN102087669B (zh) | 基于语义关联的智能搜索引擎系统 | |
KR101732342B1 (ko) | 신뢰 질의 시스템 및 방법 | |
CN104537116B (zh) | 一种基于标签的图书搜索方法 | |
US20130013616A1 (en) | Systems and Methods for Natural Language Searching of Structured Data | |
KR101661198B1 (ko) | 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 | |
CN103886099B (zh) | 一种模糊概念的语义检索系统及方法 | |
Van Hooland et al. | Evaluating the success of vocabulary reconciliation for cultural heritage collections | |
CN102609512A (zh) | 异构信息知识挖掘与可视化分析系统及方法 | |
Remi et al. | Domain ontology driven fuzzy semantic information retrieval | |
US20240211517A1 (en) | Knowledge insight capturing system | |
Mass et al. | IQ: The Case for Iterative Querying for Knowledge. | |
CN107748748A (zh) | 水利水电技术标准全文检索系统 | |
Noruzi | Folks Thesauri or Search Thesauri: Why Semantic Search Engines Need Folks Thesauri? | |
Zhou et al. | Research on mechanism of the information retrieval based on ontology label | |
KR101072147B1 (ko) | 블로그 포스트를 온톨로지 기반 정보로 변환하는 방법 및 그 시스템 | |
Iqbal et al. | Negation query handling engine for natural language interfaces to ontologies | |
Naz et al. | Fully automatic OWL generator from RDB schema | |
Sun et al. | Research on e-commerce data management based on semantic web | |
Li et al. | Characterizing Emerging Technologies of Global Digital Humanities Using Scientific Method Entities. | |
Savary et al. | ProlexFeeder–Populating a Multilingual Ontology of Proper Names from Open Sources | |
Tran | Process-oriented Semantic Web Search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100303 |