CN206411669U - 一种SaaS古籍知识服务云平台 - Google Patents

一种SaaS古籍知识服务云平台 Download PDF

Info

Publication number
CN206411669U
CN206411669U CN201621020211.2U CN201621020211U CN206411669U CN 206411669 U CN206411669 U CN 206411669U CN 201621020211 U CN201621020211 U CN 201621020211U CN 206411669 U CN206411669 U CN 206411669U
Authority
CN
China
Prior art keywords
database
module
ancient books
digital
saas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201621020211.2U
Other languages
English (en)
Inventor
杨存耿
谢术清
杨晓强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Saiyinzhe Information Technology Co ltd
Original Assignee
Tianjin Saiyinzhe Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Saiyinzhe Information Technology Co ltd filed Critical Tianjin Saiyinzhe Information Technology Co ltd
Priority to CN201621020211.2U priority Critical patent/CN206411669U/zh
Application granted granted Critical
Publication of CN206411669U publication Critical patent/CN206411669U/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本实用新型涉及一种SaaS古籍知识服务云平台,文本数据库分别与网络资源数据库、自主收集数据库相连接,文本数据库通过分别与专家知识库相连接的自动分词模块、自动分类模块、自动标引模块与数字古籍档案库相连接,数字古籍档案库连接Web检索模块,数字古籍档案库包括三个层次,分别为原始数据文献库、关系索引文献库、逻辑学习文献库,数字古籍档案库通过聚类模块将信息存储于原始数据文献库,数字古籍档案库依次通过特征识别模块、特征提取模块、相关性计算模块、聚类模块将信息存储于关系索引文献库,逻辑学习文献库通过智能分析模块与记录模块相连接,是一种充分利用SaaS运营模式的专有名词自动标引、全文检索、智能提取的SaaS古籍知识服务云平台。

Description

一种SaaS古籍知识服务云平台
技术领域
本实用新型涉及信息共享技术领域,具体涉及一种SaaS古籍知识服务云平台。
背景技术
传统的古籍文献管理方法或是对文献的外部特征进行标引,或是按文献的学科性质进行分类,或是按照文献的主要内容选取主题词,以提供检索,但对用户需要解决的问题来说,并不能全面准确提供知识信息。因此,如何为用户提供准确的、精简的知识,已成为当前的热点研究之一,其核心是如何实现传统的信息资源服务向智能化知识服务发展。“知识服务”是指以知识资源为对象,以信息知识的组织、关联、挖掘、重构等为手段,为用户提供个性化的智能服务。“知识服务”明确提出了现代信息服务业的任务和目标,成为当今知识信息资源共享模式设计的核心指导思想。在这种共享模式下,人们从信息资源中获取的不仅仅是一条一条的信息,而是一个一个针对特定问题的解决方案,即“知识”。由于知识的多粒度、内在关联等特性,以传统古籍文献检索和传递为核心的知识资源服务难以满足人们对知识服务的需求。
实用新型内容
本实用新型的目的在于克服现有技术的不足,提供一种充分利用SaaS的运营模式的基于互联网应用的专有名词自动化标引、全文检索、智能提取的为传统文化爱好者提供全方位的个性化知识发现方面服务的SaaS古籍知识服务云平台。
本实用新型解决其技术问题是采取以下技术方案实现的:
一种SaaS古籍知识服务云平台,包括文本数据库和数字古籍档案库,所述文本数据库分别与网络资源数据库、自主收集数据库相连接,古籍依次通过扫描装置、图像处理模块、古籍图像库、文字识别装置和文字校对装置存储于所述自主收集数据库中,所述文本数据库通过分别与专家知识库相连接的自动分词模块、自动分类模块、自动标引模块与所述数字古籍档案库相连接,所述数字古籍档案库连接Web检索模块,所述数字古籍档案库包括三个层次,分别为原始数据文献库、关系索引文献库、逻辑学习文献库,所述数字古籍档案库通过聚类模块将信息存储于所述原始数据文献库,所述数字古籍档案库依次通过特征识别模块、特征提取模块、相关性计算模块、聚类模块将信息存储于所述关系索引文献库,所述逻辑学习文献库通过智能分析模块与记录模块相连接,所述逻辑学习文献库包括阅读热度数据库和日常检索数据库。
在上述SaaS古籍知识服务云平台中,进一步的,所述文本数据库包括年代信息数据库、标题信息数据库、作者信息数据库、长度信息数据库、来源信息数据库、简介信息数据库、版本信息数据库、章节信息数据库和页码信息数据库,所述原始数据文献库包括年号数据库、人名数据库、书名数据库、地名数据库、官名数据库和事件数据库,所述关系索引文献库包括年号相关数据库、人名相关数据库、书名相关数据库、地名相关数据库、官名相关数据库和事件相关数据库。
在上述SaaS古籍知识服务云平台中,进一步的,所述Web检索模块包括普通检索模块和高级检索模块,普通检索模块基于所述原始数据文献库检索,高级检索模块基于所述关系索引文献库检索。
在上述SaaS古籍知识服务云平台中,进一步的,所述自动分词模块采用逆向最大匹配法(RMM法)、基于词频度统计、基于知识理解的分词方法。
在上述SaaS古籍知识服务云平台中,进一步的,所述扫描装置是一种数字化的扫描仪。
在上述SaaS古籍知识服务云平台中,进一步的,所述网络资源数据库、所述自主收集数据库、所述文本数据库、所述数字古籍档案库之间通过局域网连接,所述数字古籍档案库和所述Web检索模块通过广域网连接。
本实用新型的优点和积极效果是:
1、本实用新型采用SaaS架构运营模式,提供全方位的个性化知识发现方面的服务,用户无需购置软硬件,降低了估计信息化应用的门槛与风险,同时整合古籍数据库在云端服务器,提供的强大的资源整合能力,提高知识服务的整体能力,避免了重复建设和遗弃的现象,另外通过专家信息平台,规范了古籍数字化的统一性。
2、本实用新型综合采用逆向最大匹配法、基于词的频度统计的分词方法和基于知识理解的分词方法三种方式,实现快速对古籍文本的分词,错误率低。
3、本实用新型通过用户的日常检索和阅读发现文献的热度及其他信息,提供决策支持,便于用户的知识供需的实现。
附图说明
以下将结合附图和实施例来对本实用新型的技术方案作进一步的详细描述,但是应当知道,这些附图仅是为解释目的而设计的,因此不作为本实用新型范围的限定。此外,除非特别指出,这些附图仅意在概念性地说明此处描述的结构构造,而不必要依比例进行绘制。
图1是实施例的系统结构示意图。
具体实施方式
首先,需要说明的是,以下将以示例方式来具体说明本实用新型的SaaS古籍知识服务云平台的具体结构、特点和优点等,然而所有的描述仅是用来进行说明的,而不应将其理解为对本实用新型形成任何限制。此外,在本文所提及各实施例中予以描述或隐含的任意单个技术特征,或者被显示或隐含在各附图中的任意单个技术特征,仍然可在这些技术特征(或其等同物)之间继续进行任意组合或删减,从而获得可能未在本文中直接提及的本实用新型的更多其他实施例。另外,为了简化图面起见,相同或相类似的技术特征在同一附图中可能仅在一处进行标示。
如图1所示,一种SaaS古籍知识服务云平台,包括文本数据库和数字古籍档案库,文本数据库分别与网络资源数据库、自主收集数据库相连接,古籍依次通过扫描装置、图像处理模块、古籍图像库、文字识别装置和文字校对装置存储于自主收集数据库中,文本数据库通过分别与专家知识库相连接的自动分词模块、自动分类模块、自动标引模块与数字古籍档案库相连接,数字古籍档案库连接Web检索模块,数字古籍档案库包括三个层次,分别为原始数据文献库、关系索引文献库、逻辑学习文献库,数字古籍档案库通过聚类模块将信息存储于原始数据文献库,数字古籍档案库依次通过特征识别模块、特征提取模块、相关性计算模块、聚类模块将信息存储于关系索引文献库,逻辑学习文献库通过智能分析模块与记录模块相连接,逻辑学习文献库包括阅读热度数据库和日常检索数据库。
文本数据库包括年代信息数据库、标题信息数据库、作者信息数据库、长度信息数据库、来源信息数据库、简介信息数据库、版本信息数据库、章节信息数据库和页码信息数据库,原始数据文献库包括年号数据库、人名数据库、书名数据库、地名数据库、官名数据库和事件数据库,关系索引文献库包括年号相关数据库、人名相关数据库、书名相关数据库、地名相关数据库、官名相关数据库和事件相关数据库。
Web检索模块包括普通检索模块和高级检索模块,普通检索模块基于原始数据文献库检索,高级检索模块基于关系索引文献库检索,自动分词模块采用逆向最大匹配法(RMM法)、基于词频度统计、基于知识理解的分词方法,扫描装置是一种数字化的扫描仪,网络资源数据库、自主收集数据库、文本数据库、数字古籍档案库之间通过局域网连接,数字古籍档案库和Web检索模块通过广域网连接。
具体工作过程为:文本数据库作为平台的基础通过两种途径获取古籍文献,一种为直接通过网络资源数据库获取,另一种为纸质版古籍,通过扫描、图像处理、文字识别、文字校对一系列步骤存储于自主收集数据库,由自主收集数据库传送至文本数据库,文本数据库内包括多个子数据库,例如年代信息数据库,标题信息数据库,所有录入文本数据库内的古籍文献的基本信息均存储于不同的子数据库内,通过对文本数据库内的古籍文献进行自动分词、自动分类和自动标引,将文本数据库内的古籍文献以词为单位存储于数字古籍档案库,通过聚类过程,将词单位相同的古籍文献存储于原始数据文献库的各个子数据库内,例如年号数据库、人名数据库,通过特征识别、特征提取、相关性计算和聚类过程,将以特定词为特征识别单位的相关古籍文献存储于关系索引文献库的各个子数据库内,例如年号相关数据库、人名相关数据库,经过分类后的古籍文献,在各类之间的相似程度很小,在某一类内部,相似度很大,专家知识库进行自动标引、检索、增删、修改和扩充等功能,即时建立全文检索数据索引,提高检索效率,对系统自动标注的专有名词通过专家确认后加入数字古籍档案库,记录模块记录用户检索内容,通过用户的日常检索和阅读发现文献的热度及其他信息,提供决策支持,便于用户的知识供需的实现。
本实施例本实用新型采用SaaS架构运营模式,提供全方位的个性化知识发现方面的服务,用户无需购置软硬件,降低了估计信息化应用的门槛与风险,同时整合古籍数据库在云端服务器,提供的强大的资源整合能力,提高知识服务的整体能力,避免了重复建设和遗弃的现象。
以上实施例对本实用新型进行了详细说明,但所述内容仅为本实用新型的较佳实施例,不能被认为用于限定本实用新型的实施范围。凡依本实用新型申请范围所作的均等变化与改进等,均应仍归属于本实用新型的专利涵盖范围之内。

Claims (6)

1.一种SaaS古籍知识服务云平台,包括文本数据库和数字古籍档案库,所述文本数据库分别与网络资源数据库、自主收集数据库相连接,古籍依次通过扫描装置、图像处理模块、古籍图像库、文字识别装置和文字校对装置存储于所述自主收集数据库中,其特征在于:所述文本数据库通过分别与专家知识库相连接的自动分词模块、自动分类模块、自动标引模块与所述数字古籍档案库相连接,所述数字古籍档案库连接Web检索模块,所述数字古籍档案库包括三个层次,分别为原始数据文献库、关系索引文献库、逻辑学习文献库,所述数字古籍档案库通过聚类模块将信息存储于所述原始数据文献库,所述数字古籍档案库依次通过特征识别模块、特征提取模块、相关性计算模块、聚类模块将信息存储于所述关系索引文献库,所述逻辑学习文献库通过智能分析模块与记录模块相连接,所述逻辑学习文献库包括阅读热度数据库和日常检索数据库。
2.根据权利要求1所述的SaaS古籍知识服务云平台,其特征在于:所述文本数据库包括年代信息数据库、标题信息数据库、作者信息数据库、长度信息数据库、来源信息数据库、简介信息数据库、版本信息数据库、章节信息数据库和页码信息数据库,所述原始数据文献库包括年号数据库、人名数据库、书名数据库、地名数据库、官名数据库和事件数据库,所述关系索引文献库包括年号相关数据库、人名相关数据库、书名相关数据库、地名相关数据库、官名相关数据库和事件相关数据库。
3.根据权利要求1所述的SaaS古籍知识服务云平台,其特征在于:所述Web检索模块包括普通检索模块和高级检索模块,普通检索模块基于所述原始数据文献库检索,高级检索模块基于所述关系索引文献库检索。
4.根据权利要求1所述的SaaS古籍知识服务云平台,其特征在于:所述自动分词模块采用逆向最大匹配法(RMM法)、基于词频度统计、基于知识理解的分词方法。
5.根据权利要求1所述的SaaS古籍知识服务云平台,其特征在于:所述扫描装置是一种数字化的扫描仪。
6.根据权利要求1所述的SaaS古籍知识服务云平台,其特征在于:所述网络资源数据库、所述自主收集数据库、所述文本数据库、所述数字古籍档案库之间通过局域网连接,所述数字古籍档案库和所述Web检索模块通过广域网连接。
CN201621020211.2U 2016-08-31 2016-08-31 一种SaaS古籍知识服务云平台 Expired - Fee Related CN206411669U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201621020211.2U CN206411669U (zh) 2016-08-31 2016-08-31 一种SaaS古籍知识服务云平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201621020211.2U CN206411669U (zh) 2016-08-31 2016-08-31 一种SaaS古籍知识服务云平台

Publications (1)

Publication Number Publication Date
CN206411669U true CN206411669U (zh) 2017-08-15

Family

ID=59548927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201621020211.2U Expired - Fee Related CN206411669U (zh) 2016-08-31 2016-08-31 一种SaaS古籍知识服务云平台

Country Status (1)

Country Link
CN (1) CN206411669U (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704454A (zh) * 2017-10-25 2018-02-16 古联(北京)数字传媒科技有限公司 古籍专名识别方法以及装置
CN107832303A (zh) * 2017-11-22 2018-03-23 古联(北京)数字传媒科技有限公司 古籍书名识别方法以及装置
CN110223045A (zh) * 2019-06-13 2019-09-10 谢昱 一种多功能信息化古籍书影管理平台及方法
CN110222221A (zh) * 2019-06-13 2019-09-10 谢昱 一种用于古籍书影查询管理平台及方法
CN113609365A (zh) * 2021-08-11 2021-11-05 陕西中医药大学 一种中医古籍数据收集整理系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704454A (zh) * 2017-10-25 2018-02-16 古联(北京)数字传媒科技有限公司 古籍专名识别方法以及装置
CN107832303A (zh) * 2017-11-22 2018-03-23 古联(北京)数字传媒科技有限公司 古籍书名识别方法以及装置
CN110223045A (zh) * 2019-06-13 2019-09-10 谢昱 一种多功能信息化古籍书影管理平台及方法
CN110222221A (zh) * 2019-06-13 2019-09-10 谢昱 一种用于古籍书影查询管理平台及方法
CN113609365A (zh) * 2021-08-11 2021-11-05 陕西中医药大学 一种中医古籍数据收集整理系统

Similar Documents

Publication Publication Date Title
CN206411669U (zh) 一种SaaS古籍知识服务云平台
CN104991905B (zh) 一种基于层次索引的数学表达式检索方法
CN106250412B (zh) 基于多源实体融合的知识图谱构建方法
CN103559191B (zh) 基于隐空间学习和双向排序学习的跨媒体排序方法
CN107463658B (zh) 文本分类方法及装置
CN109271477A (zh) 一种借助互联网构建分类语料库的方法及系统
CN104834693A (zh) 基于深度搜索的视觉图像检索方法及系统
CN101369279A (zh) 一种基于计算机检索系统的学术论文相似度的检测方法
CN103049575A (zh) 一种主题自适应的学术会议搜索系统
CN104317834A (zh) 一种基于深度神经网络的跨媒体排序方法
US8090720B2 (en) Method for merging document clusters
CN105426529A (zh) 基于用户搜索意图定位的图像检索方法及系统
CN112507109A (zh) 一种基于语义分析与关键词识别的检索方法和装置
CN107291949A (zh) 信息搜索方法及装置
CN106776827A (zh) 用于自动化扩展层次化本体知识库的方法
CN112182148A (zh) 一种基于全文检索的标准辅助编写方法
Chen et al. Fine-grained product categorization in e-commerce
CN113254634A (zh) 一种基于相空间的档案分类方法及系统
WO2017193472A1 (zh) 一种东巴经典古籍数字化释读库的建立方法
CN114997288A (zh) 一种设计资源关联方法
CN103064907A (zh) 基于无监督的实体关系抽取的主题元搜索系统及方法
KR101019627B1 (ko) 패턴 기반 참고문헌 자동 구축 시스템 및 방법과 이를 위한기록매체
CN110795520B (zh) 一种数字化地质资料包目录与文件关联关系自动识别方法
CN104111942B (zh) 维吾尔医药古籍资源网络检索平台
CN107423294A (zh) 一种社群图像检索方法及系统

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170815

Termination date: 20180831