CN104317897A - 一种数字图书馆中基于可视化标签主题图的导航方法 - Google Patents

一种数字图书馆中基于可视化标签主题图的导航方法 Download PDF

Info

Publication number
CN104317897A
CN104317897A CN201410574554.2A CN201410574554A CN104317897A CN 104317897 A CN104317897 A CN 104317897A CN 201410574554 A CN201410574554 A CN 201410574554A CN 104317897 A CN104317897 A CN 104317897A
Authority
CN
China
Prior art keywords
label
thematic map
theme
visual
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410574554.2A
Other languages
English (en)
Inventor
陈海汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201410574554.2A priority Critical patent/CN104317897A/zh
Publication of CN104317897A publication Critical patent/CN104317897A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Abstract

本发明涉及一种数字图书馆中基于可视化标签主题图的导航方法,包括以下步骤:步骤1:定义不同的主题类别,在每个主题类别下再定义子类,即标签主题,然后确定子类的实例;步骤2:定义标签主题之间的关联类型;步骤3:定义信息资源实体,即标签主题图的底层;步骤4:创建标签主题图;步骤5:构建语义网络,体现语义关联,实现标签主题图可视化。该方法可以提高信息检索的查全率和查准率,有利于实现跨学科的知识共享和资源定位。

Description

一种数字图书馆中基于可视化标签主题图的导航方法
技术领域
本发明涉及数字图书馆信息技术领域,特别涉及一种数字图书馆中基于可视化标签主题图的导航方法。
背景技术
社会化标签是基于用户标签而发展起来的一组基于自定义标签的信息分类方法,在用户的协同标注过程中,标签是其中的核心要素,标签聚集形成标签云,标签云在一定程度上揭示了信息结构。社会化标签正发展成为数字图书馆中的一种特色应用,由此形成的自由分类方法会更加切合用户的信息需求和检索习惯。但标签存在显著的局限性:首先,用户对标签的选择基于对事物的看法、知识背景和个人喜好,不同的用户对同一资源的描述(标签定义)可能会基于不同的粒度水平;其次,用户定义资源时可能使用多义词,标签的语义模糊导致了标签与资源的描述不一致;再次,具有相同含义(同义词)或意思相近的不同标签造成了标签空间的数据冗余且标签之间缺少联系的描述,整个标签分类结构是一个扁平化的平面结构 。由于标签固有的不受控、无等级结构等缺点造成用户自定义标签及标签云尚未在国内图书馆得到深入研究与广泛应用。
而主题图作为一种可实现无序异构资源有效组织的知识组织方法,能够通过图形化的形式将主题间、主题与资源间的联系呈现出来,使用户直观感受到知识之间的关联。因此基于主题图的语义标签可以解决上述标签的局限性问题,其主要思路是将标签转换为主题图中的一类主题用于资源的描述和组织。然而目前将主题图技术应用到数字图书馆领域实现资源有效组织与整合的研究寥寥无几。
发明内容
本发明的目的在于提供一种数字图书馆中基于可视化标签主题图的导航方法,该方法可以提高信息检索的查全率和查准率,有利于实现跨学科的知识共享和资源定位。
为实现上述目的,本发明的技术方案是:一种数字图书馆中基于可视化标签主题图的导航方法,包括以下步骤:
步骤1:定义不同的主题类别,在每个主题类别下再定义子类,即标签主题,然后确定子类的实例;
步骤2:定义标签主题之间的关联类型;
步骤3:定义信息资源实体,即标签主题图的底层;
步骤4:创建标签主题图;
步骤5:构建语义网络,体现语义关联,实现标签主题图可视化。
进一步的,在步骤1中,根据电子图书的信息特点和结构,定义包括“作者”、“标题”、“类型”、“学科”、“出版社”、“出版年”、“国家”等主题类别,然后在每个主题类别下再定义子类,所述子类作为第2层的标签主题,最后确定子类的实例,即代表主题名称的对象。
进一步的,在步骤2中,定义包括“属于”、“相关”、“揭示”、“出版”、“包含”等标签主题之间的关联类型。
进一步的,在步骤4中,创建标签主题图的方法为:利用OKS中的Ontopoly编辑器,根据定义的标签主题及其之间的关联,建立标签主题图本体,然后使用Omnigator以Web页浏览标签主题图。
进一步的,在步骤5中,利用OKS中的Vizigator以图形形式实现标签主题图的可视化。
本发明的有益效果是可以为用户提供一种数字图书馆中有效的知识导航,有助于发现相关资源集合,能够提高信息检索的查全率和查准率,有利于实现跨学科的知识共享和资源定位,克服了现有的数字图书馆导航方法存在的关联性不高、漏检性、定位失准性等问题,具有很强的实用性和广阔的应用前景。
附图说明
图1是本发明实施例的实现流程图。
图2是本发明实施例中“朗斯特罗姆诗歌全集”的关联关系图。
图3是本发明实施例中标签主题图本体的示意图。
图4是本发明实施例中以Web页形式显示的标签主题图的示意图。
图5是本发明实施例中一小部分标签主题图可视化的示意图。
图6是本发明实施例中“文学”标签主题可视化的示意图。
图7是本发明实施例中“朗斯特罗姆诗歌全集”资源实例可视化的示意图。
图8是本发明实施例中“游记”的关系展示图。
图9是本发明实施例中“游记”的知识网络图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下将通过具体实施例和相关附图,对本发明作进一步说明。
本发明提供一种数字图书馆中基于可视化标签主题图的导航方法,如图1所示,包括以下步骤:
步骤1:定义不同的主题类别,在每个主题类别下再定义子类,即标签主题,然后确定子类的实例。
在本实施例中,步骤1的具体实现方法为:根据电子图书的信息特点和结构,定义包括“作者”、“标题”、“类型”、“学科”、“出版社”、“出版年”、“国家”等主题类别,然后在每个主题类别下再定义子类,所述子类作为第2层的标签主题,最后确定子类的实例,即代表主题名称的对象。
①“作者”主题面
作者作为电子图书的重要属性之一,用户在标注电子文献时,会根据文献作者来创建标签,例如在“作者”主题面下定义“泰戈尔”、“鲁迅”、“莫言”、“冰心”等标签主题。
②“类型”主题面
读者一般会根据电子书籍的内容及体裁、题材定义书籍的类型,常见的标识书籍类型的标签如散文集、传记、纪实和书信集等,书籍类型是其信息及知识揭示的形式,是标识文献的基本属性,书籍类型主题是读者进行图书检索时常用的检索条件,将其定义为一种主题面,是构建数字图书馆知识导航的关键。在该主题面下可根据书籍的信息内容和组织形式(即体裁和题材)定义专题、传记、剧本、文集、访谈录等标签。
③“标题”主题面
标题是区分不同书籍的主要标识,用户标识文献时,“标题”是最常见的主题标签。
④“学科”主题面
根据信息所反映的学科知识内容进行分类是信息分类的基本原则,信息所体现的学科知识内容是信息的本质属性,学科主题面是书籍的内容所属的学科领域,大多数用户习惯根据自己的理解定义书籍所反映的学科内容,具有很强的主观性,同时这有利于用户发现新知识与其他知识之间的关联,对进一步做好文献检索工作将有很大的帮助。常见的标签主题包括“经济学”、“历史学”、“旅游类”、“地方志”、“情报学”等。
⑤“出版社”主题面
出版社是文献的重要属性之一,将其作为标注文献的主要属性之一符合用户的标注习惯。
⑥“出版年”主题面
文献都有确切的出版时间,出版时间在一定程度上根据文献的出版时间能够分析所属学科领域的发展态势。可定义“2009年”、“2010年”、“2011年”等。
⑦“国家”主题面
作者生活的地域在一定程度上反映了文献的文化特征和该国的社会现实。“国家”主题实例化的子类包括“中国”、“美国”、“日本”等。
在本实施例中,根据步骤1从超星个人数字图书馆的“好书推荐排行榜”中抽取排名前35的电子书籍,在每本电子书籍中提取5个读者使用频率较高的标签,得到一个容量为175的标签数据集样本,部分标签样本数据,见表1。然后对标签进行去重处理,将其映射到对应的主题类型,见表2。
表1 标签数据集样本
表2 处理后的标签主题类型集合
步骤2:定义标签主题之间的关联类型。
在本实施例中,步骤2的具体实现方法为:定义包括“属于”、“相关”、“揭示”、“出版”、“包含”等标签主题之间的关联类型。以电子图书为例,阐述该主题所涉及的实例和关联关系。
①“属于”关系
电子图书与“类型”,“作者”与“国家”是属于关系。
②“出版”关系
电子图书与“出版社”、“出版年”是“出版”关系。
③“反映”关系
“图书的标题”在一定程度上反映了电子图书的学科范围,二者是“反映”关系。
④“相关”关系
多数跨学科的电子图书并不能严格划分到某一学科,通常一个特定的电子图书实体会用多个学科标签去标识。因此,“学科”与“学科”之间的关联定义为“相关”更符合实际。
⑤“包含”关系
通常情况下,用户会根据作者去标注文献资源,作者与电子图书之间存在着包含关系。
如资源实例“朗斯特罗姆诗歌全集”的关联关系,如图2所示。
步骤3:定义信息资源实体,即标签主题图的底层。
信息资源实体是主题图的底层,是对某一主题进行具体描述的资源实体,如数据、音频、视频、文本等电子资源。一个主题可以映射多个资源实体,如电子文献主题下可以包含电子期刊、电子专著等多种数字资源实体。标签主题图通过元数据描述资源实体的属性。
步骤4:创建标签主题图。
在本实施例中,步骤4的具体实现方法为:利用OKS中的Ontopoly编辑器,根据定义的标签主题及其之间的关联,建立标签主题图本体(为保证图形美观,选取了部分标签),然后使用Omnigator以Web页浏览标签主题图,结果如图3、4所示。
步骤5:构建语义网络,体现语义关联,实现标签主题图可视化。
在本实施例中,步骤5的具体实现方法为:利用OKS中的Vizigator以图形形式实现标签主题图的可视化。主题图可视化的过程是将主题图用图形表示,目的是帮助用户快速定位资源。可视化的主题图,是描述知识结构的一种模型,描述的是已定义的主题图本体所具有的一些信息,主题以及与它相关的其他主题之间通过主题图进行关联,从而构成一定程度上的语义网络。与文本形式相比,图形化的语义关系描述更符合用户的检索习惯。
图5是本实施例中一小部分主题图可视化的模型,以“标题”为中心展示了电子图书中“作者”、“学科”、“国家”等标签主题的关系导航图,用户可以沿着标签主题间关联和主题图本体展示的路径进行关联查询,为用户提供一种基于链接关系的知识导航可以使用户直观感受信息资源的知识结构,方便用户对整个信息资源的主题结构进行浏览,这有利于用户发现相应的资源实体和相关联的主题,实现对知识节点的定位,提高检索系统的易用性和交互性。
图5中不同的颜色和形状对应主题图的各个部分,节点代表主题,节点与节点之间的连线代表主题之间的联系。每一个主题刻画了知识的一个维度,标签主题上的数字表示主题的维度,用户可以根据自己的信息需求选择一个或多个维度的主题进行跟踪查询,在为用户提供导向性的同时拓宽了其信息面。
由于每个用户的知识背景和关注点的不同,同一资源可以拥有多个不同的标签,同一标签也可以用来描述不同的资源,标签的意义不仅仅在于分类,更体现了用户个人的兴趣与关注点,通过标签可以实现不同的资源和用户之间的联系。以下通过分析主题图中标签主题与标签主题之间及主题与资源之间的关联说明标签主题图可视化功能。
(1)资源与资源之间的关联
由于用户对同一资源使用同一标签进行标注,实现了不同资源之间的联系。图6是在可视化的标签主题图中选择标签主题“文学”后形成的标签主题图。
通过使用同一标签“文学”标注的资源间形成了一个较完整的语义网络,刻画了不同资源之间的关系,主题图选取的中心为“文学”标签,围绕该标签展开了所有使用这一标签标注的相关书籍及其出版社、出版时间、作者及其国家等知识维度,用户以“文学”标签出发,找到相关的书籍,同时也可以找到与该书籍相关的其他所有书籍,并可以直观解读它们之间的联系,进而较大程度地满足其信息需求,扩大了学习和资源检索的范围。
(2)标签之间的关联
用户可能使用不同的标签描述同一资源,因此若干个标签之间也就产生了语义关联。如针对资源实例“朗斯特罗姆诗歌全集”,在显示的标签主题图中出现了多个标签主题并显示了这些标签主题下的其他资源,如图7所示。如用户想了解“诗歌”这一标签标注的书籍,可以点击该类别下的标签主题,将出现与“诗歌”主题相关的主题与资源。标签主题图通过构建标签主题间完整的语义网络,为用户提供了一种有效的基于标签的知识导航,通过浏览导航用户可以获得丰富完整的知识。图8是选择标签主题 “游记”通过“相关”和“相近”关系聚合在一起的标签主题。
若想进一步挖掘关于“游记”完整的知识网络,可通过与其相连的标签主题进行追踪检索。与“游记”相关的主题与实体资源形成的完整的知识网络,如图9所示。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (5)

1.一种数字图书馆中基于可视化标签主题图的导航方法,其特征在于,包括以下步骤:
步骤1:定义不同的主题类别,在每个主题类别下再定义子类,即标签主题,然后确定子类的实例;
步骤2:定义标签主题之间的关联类型;
步骤3:定义信息资源实体,即标签主题图的底层;
步骤4:创建标签主题图;
步骤5:构建语义网络,体现语义关联,实现标签主题图可视化。
2.根据权利要求1所述的一种数字图书馆中基于可视化标签主题图的导航方法,其特征在于,在步骤1中,根据电子图书的信息特点和结构,定义包括“作者”、“标题”、“类型”、“学科”、“出版社”、“出版年”、“国家”等主题类别,然后在每个主题类别下再定义子类,所述子类作为第2层的标签主题,最后确定子类的实例,即代表主题名称的对象。
3.根据权利要求1所述的一种数字图书馆中基于可视化标签主题图的导航方法,其特征在于,在步骤2中,定义包括“属于”、“相关”、“揭示”、“出版”、“包含”等标签主题之间的关联类型。
4.根据权利要求1所述的一种数字图书馆中基于可视化标签主题图的导航方法,其特征在于,在步骤4中,创建标签主题图的方法为:利用OKS中的Ontopoly编辑器,根据定义的标签主题及其之间的关联,建立标签主题图本体,然后使用Omnigator以Web页浏览标签主题图。
5.根据权利要求1所述的一种数字图书馆中基于可视化标签主题图的导航方法,其特征在于,在步骤5中,利用OKS中的Vizigator以图形形式实现标签主题图的可视化。
CN201410574554.2A 2014-10-24 2014-10-24 一种数字图书馆中基于可视化标签主题图的导航方法 Pending CN104317897A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410574554.2A CN104317897A (zh) 2014-10-24 2014-10-24 一种数字图书馆中基于可视化标签主题图的导航方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410574554.2A CN104317897A (zh) 2014-10-24 2014-10-24 一种数字图书馆中基于可视化标签主题图的导航方法

Publications (1)

Publication Number Publication Date
CN104317897A true CN104317897A (zh) 2015-01-28

Family

ID=52373129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410574554.2A Pending CN104317897A (zh) 2014-10-24 2014-10-24 一种数字图书馆中基于可视化标签主题图的导航方法

Country Status (1)

Country Link
CN (1) CN104317897A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956144A (zh) * 2016-05-13 2016-09-21 安徽教育网络出版有限公司 一种多标签学习资源关联度定量计算方法
CN106021228A (zh) * 2016-05-18 2016-10-12 德稻全球创新网络(北京)有限公司 一种利用知识地形图进行文本分析的方法及系统
CN106227801A (zh) * 2016-07-21 2016-12-14 深圳市辣妈帮科技有限公司 主题树生成方法和装置
CN106250420A (zh) * 2016-07-21 2016-12-21 深圳市辣妈帮科技有限公司 标签关联方法和装置
CN107424109A (zh) * 2017-07-28 2017-12-01 安徽华博胜讯信息科技股份有限公司 基于知识管理的云图书馆信息服务系统
CN107506612A (zh) * 2017-10-18 2017-12-22 安吉县新星文化培训学校 一种动态数字出版系统
CN107797975A (zh) * 2017-10-17 2018-03-13 云南财经大学 一种非语言图形符号交流系统
CN110489673A (zh) * 2019-09-17 2019-11-22 潘如鑫 基于数据库的多需求图书馆导航系统及方法
CN112334904A (zh) * 2018-05-18 2021-02-05 电子湾有限公司 处理交易反馈

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080071213A (ko) * 2006-12-20 2008-08-04 한국과학기술정보연구원 시맨틱 웹 기반 연구정보 서비스 시스템 및 그 방법
CN102135997A (zh) * 2011-03-23 2011-07-27 华中科技大学 一种基于本体的数字化学习资源的管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080071213A (ko) * 2006-12-20 2008-08-04 한국과학기술정보연구원 시맨틱 웹 기반 연구정보 서비스 시스템 및 그 방법
CN102135997A (zh) * 2011-03-23 2011-07-27 华中科技大学 一种基于本体的数字化学习资源的管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
夏立新 等: "基于主题图构建知识专家学术社区研究", 《图书情报工作》 *
熊回香 等: "标签主题图的构建与实现研究", 《图书情报工作》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956144A (zh) * 2016-05-13 2016-09-21 安徽教育网络出版有限公司 一种多标签学习资源关联度定量计算方法
CN106021228A (zh) * 2016-05-18 2016-10-12 德稻全球创新网络(北京)有限公司 一种利用知识地形图进行文本分析的方法及系统
CN106021228B (zh) * 2016-05-18 2019-08-20 德稻全球创新网络(北京)有限公司 一种利用知识地形图进行文本分析的方法及系统
CN106227801A (zh) * 2016-07-21 2016-12-14 深圳市辣妈帮科技有限公司 主题树生成方法和装置
CN106250420A (zh) * 2016-07-21 2016-12-21 深圳市辣妈帮科技有限公司 标签关联方法和装置
CN107424109A (zh) * 2017-07-28 2017-12-01 安徽华博胜讯信息科技股份有限公司 基于知识管理的云图书馆信息服务系统
CN107797975A (zh) * 2017-10-17 2018-03-13 云南财经大学 一种非语言图形符号交流系统
CN107797975B (zh) * 2017-10-17 2020-03-17 云南财经大学 一种非语言图形符号交流系统
CN107506612A (zh) * 2017-10-18 2017-12-22 安吉县新星文化培训学校 一种动态数字出版系统
CN112334904A (zh) * 2018-05-18 2021-02-05 电子湾有限公司 处理交易反馈
CN110489673A (zh) * 2019-09-17 2019-11-22 潘如鑫 基于数据库的多需求图书馆导航系统及方法
CN110489673B (zh) * 2019-09-17 2020-07-14 乐清市川嘉电气科技有限公司 基于数据库的多需求图书馆导航系统及方法

Similar Documents

Publication Publication Date Title
CN104317897A (zh) 一种数字图书馆中基于可视化标签主题图的导航方法
Ingwersen et al. Smart city research 1990–2016
Alegre et al. Organized chaos: mapping the definitions of social entrepreneurship
US8135669B2 (en) Information access with usage-driven metadata feedback
US20090119572A1 (en) Systems and methods for finding information resources
CN112486917A (zh) 从多个微博自动生成信息丰富的内容的方法以及系统
Klavans et al. Subject matter categorization of tags applied to digital images from art museums
CN108874722A (zh) 一种电子书阅读系统
US9208150B2 (en) Automatic association of informational entities
Dunlop et al. Focussed palmtop information access combining starfield displays with profile-based recommendations
GB2592884A (en) System and method for enabling a search platform to users
US20080294626A1 (en) Method and apparatus for leveraged search and discovery - leveraging properties of trails and resources within
Zeng et al. Navigating the intersection of library bibliographic data and linked music information sources: a study of the identification of useful metadata elements for interlinking
Posea et al. Bringing the social semantic web to the personal learning environment
Lucarelli et al. Florence–Washington Round Trip: Ways and Intersections between Semantic Indexing Tools in Different Languages
De Maeyer et al. Methods for mapping hyperlink networks
Kinsella et al. Applications of Semantic Web methodologies and techniques to social networks and social websites
Jäschke et al. Analysis of the publication sharing behaviour in BibSonomy
Naaman Leveraging geo-referenced digital photographs
Rástočný et al. Web search results exploration via cluster-based views and zoom-based navigation
Brüggemann Collaboration and the Semantic Web: Social Networks, Knowledge Networks, and Knowledge Resources: Social Networks, Knowledge Networks, and Knowledge Resources
Le et al. An event-based framework for the semantic annotation of locations
Shiri Semantic access and exploration in cultural heritage digital libraries
Papadopoulos et al. Tourism knowledge discovery in social multimedia
Gao et al. Towards on the MOOCs Knowledge Discovery Based on Concept Lattice

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150128

RJ01 Rejection of invention patent application after publication