CN102567423A - 一种诗词关联搜索方法和系统 - Google Patents
一种诗词关联搜索方法和系统 Download PDFInfo
- Publication number
- CN102567423A CN102567423A CN2010106221565A CN201010622156A CN102567423A CN 102567423 A CN102567423 A CN 102567423A CN 2010106221565 A CN2010106221565 A CN 2010106221565A CN 201010622156 A CN201010622156 A CN 201010622156A CN 102567423 A CN102567423 A CN 102567423A
- Authority
- CN
- China
- Prior art keywords
- poem
- text
- content
- module
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种诗词关联搜索方法和系统,该方法以诗词资源库模块(7)为基础,包括:接收待搜索的输入关键字;在所述诗词资源库模块(7)中搜索所述输入关键字,获取与所述输入关键字相匹配的诗词属性名称对应的诗词条数和各首诗词的序号;调取所述各首诗词的属性名称及相关内容并显示在结果列表上;将所述各首诗词中的某一首诗词对象置为中心知识对象,获取所述中心知识对象的完整信息作为发散知识对象,以所述中心知识对象为中心词、所述发散知识对象为周边词构建动态关系网络图,显示所述动态关系网络图中的各对象对应的诗词相关内容。通过本发明用户可学习诗词内容及其相关的发散知识内容,实现了诗词关联学习、发散学习,可提高学习效果。
Description
技术领域
本发明涉及一种搜索引擎和搜索方法,具体涉及一种诗词关联搜索方法和系统,本发明的诗词关联搜索系统可应用在电子学习设备上,例如学习机、电子词典、早教机、学习笔等。
背景技术
传统的手持式电子学习设备中一般存储有诗词检索模块和诗词资源库模块,其搜索诗词的方法主要有如下两种形式:其一、为精确搜索,即接受用户输入的诗词作者和/或诗词名称和/或诗词内容,将输入的诗词作者/诗词名称/诗词内容分别与诗词资源库模块中的诗词作者/诗词名称/诗词内容相匹配,将匹配成功的所有诗词显示出来供用户学习;其二、为模糊搜索,即接受用户输入的关键词,将输入的关键词与诗词资源库模块中的诗词作者、诗词名称和诗词内容分别匹配,将匹配成功的所有诗词显示出来供用户学习。所述供用户学习的内容包括:该诗词的作者、诗词原文、诗词说明、名师导读、注释、诗词大意和诗词赏析等。
传统的手持式电子学习设备虽然实现了诗词搜索功能,但是其存在以下缺陷:诗词之间相互独立,各首诗词之间没有建立关联关系,导致诗词搜索结果较为单一,当用户输入某关键字时,其只能搜索与该关键字直接匹配的一首诗词所对应的资源,无法搜索与该关键字相关联的其他诗词,因而用户从一首诗词切换至另外一首诗词学习时需要逐级退出或输入新的关键词重新搜索,无法通过其属性漫游至该诗词资源库模块中的其它所有诗词,例如,当用户输入“望天门山”这一关键字进行搜索时,现有技术只能将与该关键字直接匹配的诗词“望天门山”所对应的资源反馈给用户,若用户想学习与“望天门山”同属“七言绝句”的其他关联诗词时,则不得不重新输入关联的关键字进行搜索,降低了学习效率;又如用户输入作者“李白”时,通过精确搜索和模糊搜索均可得到包含“李白”的所有诗词,但若要找到作者“杜甫”所写的诗词则需重新搜索。
发明内容
本发明要解决的技术问题是,针对现有的电子学习设备搜索诗词时搜索结果单一、无法关联相关诗词的问题,提供一种诗词关联搜索方法和系统,使得用户在输入一个关键词进行搜索时,不仅可学习与该关键字直接匹配的诗词内容,还可自主选择与该关键字关联的其他发散学习内容进行关联学习、对比学习、发散学习,提高了学习效率和学习效果。
为解决上述技术问题,本发明公开一种诗词关联搜索方法,该方法以诗词资源库模块为基础,包括如下步骤:
步骤A:接收待搜索的输入关键字;
步骤B:在所述诗词资源库模块中搜索所述输入关键字,获取与所述输入关键字相匹配的诗词属性名称对应的诗词条数和各首诗词的序号;
步骤C:在所述诗词资源库模块中调取所述各首诗词的属性名称及相关内容,并显示在结果列表上;
步骤D:将所述各首诗词中的某一首诗词对象置为中心知识对象,获取所述中心知识对象的完整信息作为发散知识对象,构建由中心知识对象为中心词和发散知识对象为周边词组成的可随意变换的动态关系网络图,点击并显示所述动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容。
所述的诗词关联搜索方法,还包括:
步骤E:当所述动态关系网络图中的发散知识对象进入以所述中心知识对象为中心的一个辐射区域内时,以新的中心知识对象为中心词,与该新的中心知识对象相关联的发散知识对象为周边词构建新的动态关系网络图;
步骤F:调取所述新的动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容并在屏幕上显示。
所述步骤B搜索所述输入关键字至少采用以下方法的一种:
方法一为诗词属性查询模块精确搜索:在诗词属性查询模块中搜索与所述输入关键字相匹配的诗词属性名称,获取该诗词属性名称对应的各首诗词的序号以及各首诗词的相关内容索引地址;
方法二为诗词属性关键字位置模块模糊搜索:在诗词属性关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的诗词属性名称以及该诗词属性名称对应的各首诗词的序号、各首诗词的相关内容索引地址;
方法三为文本关键字位置模块模糊搜索:在文本关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的文本内容以及该文本内容对应的诗词属性名称、诗词属性名称对应的各首诗词的序号和诗词的相关内容索引地址。
所述各首诗词的序号用于获取所述各首诗词的各项属性名称以及各项相关内容索引地址;所述内容索引地址包括作者简介文本地址、诗词原文文本地址、诗词说明文本地址、名师导读文本地址、诗词注释文本地址、诗词大意文本地址和诗词赏析文本地址,用于从文本内容模块中调取所述各首诗词的相关内容包括各首诗词的作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析。
所述步骤C包括:
步骤C1:显示根据所述方法一和方法二匹配到的诗词属性名称对应的各首诗词的相关内容;
步骤C11:所述方法一的过程包括如下步骤:将输入关键字与所述诗词属性查询模块的各类别诗词属性查询内容区模块中的内容进行完全匹配,得到输入关键字在诗词主库模块中对应的诗词数目和序号,根据所述输入关键字在所述诗词主库模块中对应的诗词数目和序号,在所述诗词主库模块中得到与输入关键字相关的各属性名称和指向文本内容模块中相关内容的索引地址,再根据所述指向文本内容模块中相关内容的索引地址得到与输入关键字相关的各项文本内容;
步骤C12:所述方法二的过程包括如下步骤:将输入关键词中的每个关键字符与所述诗词属性关键字位置模块的各类别诗词属性关键字位置内容区模块中的每一个属性关键字位置库内容中包含的GBK字符集中的字符相匹配,得到匹配成功的GBK字符集中的若干字符及指向该字符的位置信息的索引地址,从而由索引地址找到该字符对应的位置信息,由所述位置信息得知每个关键字符在相应的属性查询子库内容中出现的总次数,及在相应的属性查询子库内容中的相对位置号,将该相对位置号与诗词属性起始位置模块中存储的相对起始位置号相比较,得到输入关键字对应属性内容的相对起始位置号即输入关键字对应属性内容的相对位置号区间,从而找到该相对位置号区间对应的属性记录内容,再根据该相对位置号区间对应属性记录内容所对应的存储序号在所述诗词属性查询模块中找到该条记录在诗词主库模块中对应的诗词数目和序号,根据在诗词主库模块中对应的诗词数目和序号,在所述诗词主库模块中得到与输入关键字相关的各属性名称和指向文本内容模块中相关内容的索引地址,再根据所述指向文本内容模块中相关内容的索引地址得到与输入关键字相关的各项文本内容;
步骤C2:显示根据所述方法三匹配到的文本内容对应的各首诗词的相关内容;
步骤C21:所述方法三的过程包括如下步骤:将输入关键字中的每个关键字符分别与所述文本关键字位置模块中包含的GBK字符集中的字符相匹配,得到匹配成功的GBK字符集中的若干字符及指向该字符的位置信息的索引地址,从而由索引地址找到该字符对应的位置信息,由所述位置信息得知每个关键字符在文本内容模块中出现的总次数及在文本内容模块中的相对位置号,将该相对位置号与文本内容起始位置模块中存储的相对起始位置号相比较,得到输入关键字对应某一文本内容的相对起始位置号即输入关键字对应某一文本内容的相对位置号区间,从而找到该相对位置号区间对应的文本内容,再根据该相对位置号区间对应文本内容所对应的存储序号在文本对应属性索引模块中找到该文本内容在诗词主库模块中对应的诗词条数、内容标记和各条诗词的序号,接着根据找到的诗词条数和诗词序号在所述诗词属性查询模块中找到相应的属性记录,再根据在诗词主库模块中对应的诗词数目和序号,在所述诗词主库模块中得到与输入关键字相关的各属性名称和指向文本内容模块中相关内容的索引地址,最后根据所述指向文本内容模块中相关内容的索引地址得到与输入关键字相关的各项文本内容。
所述步骤D包括:
步骤D1:创建表示中心知识对象和发散知识对象的图片或链接,用于存储被置为中心知识对象的诗词及其完整信息的内容索引地址;
步骤D2:将所述表示中心知识对象的图片或链接作为中心词设置在动态关系网络图的中心,将所述表示发散知识对象的图片或链接作为周边词散布在动态关系网络图中的中心知识对象的周围。
所述步骤E包括:
步骤E1:判断位于所述动态关系网络图中的发散知识对象是否进入以所述中心知识对象为中心的一个辐射区域内,若是则将该发散知识对象设置为新的中心知识对象,并构建以该新的中心知识对象为中心词,与该新的中心知识对象相关联的发散知识对象为周边词对应的动态关系网络图;
步骤E2:若位于所述动态关系网络图中的发散知识对象没有进入以所述中心知识对象为中心的一个辐射区域内,则通过二分位移方法将该发散知识对象置为其原来所处的原始位置。
本发明还公开一种诗词关联搜索系统,包括:
诗词资源库模块,存储经过加工并形成内容关联的诗词资料学习内容;
接收模块,用于接收待搜索的输入关键字;
搜索模块,用于在诗词资源库模块中搜索所述关键字,获取与所述输入关键字相匹配的诗词属性名称对应的诗词条数和各首诗词的序号;
显示模块,用于在所述诗词资源库模块中调取所述各首诗词的属性名称及相关内容,并显示在结果列表上;
关系网构建模块,用于将所述各首诗词中的某一首诗词对象置为中心知识对象,获取所述中心知识对象的完整信息作为发散知识对象,构建由中心知识对象为中心词和发散知识对象为周边词组成的可随意变换的动态关系网络图;
关系网变换模块,用于当所述动态关系网络图中的发散知识对象进入以中心知识对象为中心的一个辐射区域内时,构建新的动态关系网络图。
所述的诗词关联搜索系统,还包括:
关系网学习模块,用于调取所述动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容并在屏幕上显示。
所述搜索模块包括第一搜索模块、第二搜索模块和第三搜索模块,
所述第一搜索模块用于在诗词属性查询模块中搜索与所述关键字相匹配的诗词属性名称,获取该诗词属性名称对应的各首诗词的序号以及各首诗词的相关内容索引地址;
所述第二搜索模块用于在诗词属性关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的诗词属性名称以及该诗词属性名称对应的各首诗词的序号、各首诗词的相关内容索引地址;
所述第三搜索模块用于在文本关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的文本内容以及该文本内容对应的诗词属性序号、诗词属性名称对应的各首诗词的名称和诗词的相关内容索引地址。
所述诗词资源库模块包括诗词属性查询模块、诗词主库模块、文本内容模块、诗词属性关键字位置模块、诗词属性起始位置模块、文本关键字位置模块、文本内容起始位置模块、文本对应属性索引模块,以及一用于解压上述各个子模块的HFM解压模块。
所述诗词属性查询模块包括诗词属性类别总个数、各类别诗词属性查询索引区模块和各类别诗词属性查询内容区模块;
所述各类别诗词属性查询索引区模块存储了各类别诗词属性查询内容区模块的起始地址,用于指向所述各类别诗词属性查询内容区模块;
所述各类别诗词属性查询内容区模块包括各类别诗词属性内容个数、该类别诗词属性内容索引地址和该类别诗词属性内容,所述该类别诗词属性内容索引地址指向该类别诗词属性内容,所述该类别诗词属性内容包括诗词属性名称、该诗词属性名称对应的诗词条数和该诗词属性名称对应的各首诗词的序号,所述该诗词属性名称对应的诗词条数和该诗词属性名称对应的各首诗词的序号指该诗词属性名称在所述诗词主库模块中对应的诗词数目和序号。
所述诗词主库模块包括诗词主库索引区模块和诗词主库内容区模块;
所述诗词主库索引区模块存储了各首诗词属性的完整信息索引地址,用于指向诗词主库内容区模块中的各首诗词属性的完整信息;所述诗词主库内容区模块存储了各首诗词对应的资源,包括各首诗词属性的完整信息和相关内容索引地址;
所述相关内容索引地址包括作者简介文本地址、诗词原文文本地址、诗词说明文本地址、名师导读文本地址、诗词注释文本地址、诗词大意文本地址和诗词赏析文本地址,用于从文本内容模块中调取各首诗词对应的文本类别所包含的内容,所述文本类别包括但不限于作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析;所述完整信息存储诗词的各项属性名称,包括但不限于诗词的作者、词牌、文体、主题、景物、物品、人物、事物、朝代的名称。
所述文本内容模块包括文本内容索引区模块和文本具体内容区模块;
所述文本具体内容区模块存储小文本块总数、各文本块索引地址及各个文本块压缩内容,所述各文本块索引地址指向文本具体内容区中的文本块压缩内容;所述文本内容索引区模块存储每个小文本的起始块序号、每个小文本所占的块数。
所述诗词属性关键字位置模块包括各类别诗词属性关键字位置索引区模块和各类别诗词属性关键字位置内容区模块;
所述各类别诗词属性关键字位置索引区模块存储了各类别诗词属性关键字位置内容区模块的索引地址,用于指向各类别诗词属性关键字位置内容区模块;
所述各类别诗词属性关键字位置内容区模块存储了GBK字符集中字符总个数、GBK字符集中每个字符指向该字符的位置信息的索引地址和每个字符的位置信息,所述GBK字符集中字符总个数指英文、数字、汉字及标点符号的个数之和;所述GBK字符集中每个字符指向该字符的位置信息的索引地址为0000或指向对应字符的位置信息;所述每个字符的位置信息包括GBK字符集中每个字符分别在所述诗词属性查询模块的各属性查询子库中出现的总次数、每个字符分别在各属性查询子库中的相对位置号。
所述诗词属性起始位置模块包括各类别诗词属性起始位置索引区模块和各类别诗词属性起始位置内容区模块;
所述各类别诗词属性起始位置索引区模块存储了各类别诗词属性起始位置内容区模块的索引地址,用于指向所述各类别诗词属性起始位置内容区模块;
所述各类别诗词属性起始位置内容区模块存储各类别诗词属性中内容的总条数、各类别诗词属性中各属性内容的相对起始位置号、以及各类别诗词属性中最后一条内容在该类别诗词属性中的结束位置号。
所述文本关键字位置模块包括GBK字符集中字符总个数、GBK字符集中每个字符指向该字符的位置信息的索引地址和每个字符的位置信息,所述GBK字符集中字符总个数指英文、数字、汉字及标点符号的个数之和;所述GBK字符集中每个字符指向该字符的位置信息的索引地址为0000或指向对应字符的位置信息;所述每个字符的位置信息包括每个字符在文本内容模块的文本块压缩内容中出现的总次数、每个字符在文本块压缩内容中的相对位置号。
所述文本内容起始位置模块包括小文本的总个数、每个小文本内容的相对起始位置号、最后一个小文本内容的结尾在文本内容模块中的位置号;所述小文本的总个数指作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本中所有小文本的个数之和。
所述文本对应属性索引模块包括小文本的总个数、每一小文本内容的信息地址和每一小文本对应属性的索引;
所述每一小文本对应属性的索引包括每一小文本对应的诗词的条数和每一小文本对应每一诗词的信息,所述每一小文本对应每一诗词的信息包括每一小文本在诗词中的内容标记和每一小文本对应诗词的序号;
所述每一小文本内容的信息地址指向该小文本对应属性名称的索引;
所述小文本的总个数指作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本中所有小文本的个数之和,且所述每一个小文本均对应一唯一的存储序号。
同现有技术相比较,本发明具有如下有益技术效果:1)本发明的诗词关联搜索方法不仅可以搜索与用户输入的关键字相匹配的诗词内容,还可以将与该诗词内容相关联的发散知识搜索出来,并由用户自主选择是否显示发散知识;2)当用户点击结果列表中的某一首诗词内容时,本发明会构建由该诗词内容及其多个发散知识构成的动态关系网络图,从而用户可感知并学习每个查询的诗词内容所关联的发散知识,加强学习印象;3)用户通过点击动态关系网络图中的各个对象还可学习对象所对应的诗词具体内容,提高学习效率,通过拖动发散知识对象还可进一步方便地学习新的动态关系网络图中的相关内容;4)实现了方便用户进行诗词的关联学习、对比学习、发散学习,提高学习效率和学习效果。
附图说明
图1是本发明实施例的诗词关联搜索系统的模块方框图;
图2是本发明实施例的诗词关联搜索方法的流程图;
图3是本发明实施例通过结果列表显示搜索结果的示意图;
图4是本发明实施例通过动态关系网络图显示搜索结果的示意图;
图5是通过二分位移方法移动对象时,对象移动轨迹的示意图;
图6是本发明实施例中中心知识对象的诗词属性为“诗词标题”时动态关系网络图和文本显示区的显示情况示意图;
图7是本发明实施例中中心知识对象的诗词属性为“诗词作者”时动态关系网络图和文本显示区的显示情况示意图;
图8是本发明实施例中中心知识对象的诗词属性为景物属性时动态关系网络图和文本显示区的显示情况示意图;
图9a是本发明实施例的诗词资源库模块7的结构示意图;
图9b是本发明实施例的诗词属性查询模块的结构示意图;
图9c是本发明实施例的诗词主库模块的结构示意图;
图9d是本发明实施例的文本内容模块的结构示意图;
图9e是本发明实施例的诗词属性关键字位置模块的结构示意图;
图9f是本发明实施例的诗词属性起始位置模块的结构示意图;
图9g是本发明实施例的文本对应属性索引模块的结构示意图;
图9h是本发明实施例的文本关键字位置模块的结构示意图;
图9i是本发明实施例的文本内容起始位置模块的结构示意图;
图10是本发明实施例通过二分法在诗词属性查询模块中匹配诗词属性名称的方法流程图;
图11是本发明实施例利用三种搜索方法综合搜索用户键入的关键字的方法流程图。
具体实施方式
为便于更好理解本发明所述技术方案,先对相关名称进行解释和对搜索及显示的原则进行说明。
完全匹配:指输入关键字的字数和字符顺序与搜索结果完全一致;
不完全匹配:指输入关键字包含于搜索结果中,即输入关键字与搜索结果的字符顺序完全一致,而字数少于搜索结果。
搜索原则及显示原则的说明:
当输入关键字为单词条时:首先将输入关键字在诗词属性查询模块中进行完全匹配,接着将输入关键字在诗词属性关键字位置模块中不完全匹配,再将输入关键字在文本关键字位置模块中不完全匹配,最后将输入关键字在诗词属性查询模块中完全匹配的结果优先显示,接着显示输入关键字在诗词属性关键字位置模块中不完全匹配的结果,再将输入关键字在文本关键字位置模块中不完全匹配的结果显示出来。应该注意在显示上述完全匹配和不完全匹配的结果时应进行去重处理。
当输入关键字包括空格(即“A空格B”)时:首先将输入关键字按照空格拆分成多个关键字比如拆分成A和B,将关键字A在诗词属性查询库中进行完全匹配,接着将A在诗词属性关键字位置模块中不完全匹配,再将A在文本关键字位置模块中不完全匹配,进而将关键字B进行与A相同过程的处理,最后将同时包含A和B的搜索结果优先显示,接着显示仅包含A或者仅包含B的完全匹配的结果,然后显示仅包含A或者仅包含B的不完全匹配的结果。
精确搜索:指搜索结果与输入关键字完全匹配;
模糊搜索:分为针对输入关键字为单词条的模糊搜索和针对输入关键字包含空格的模糊搜索,所述输入关键字为单词条的模糊搜索指搜索结果与输入关键字不完全匹配;所述输入关键字包含空格的模糊搜索指搜索结果同时包含空格前后的关键字的搜索和搜索结果仅包含空格前或仅包含空格后的关键字的搜索。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的诗词关联搜索系统包括接收模块1、搜索模块2、显示模块3、关系网构建模块4、关系网变换模块5、关系网学习模块6和诗词资源库模块7。
所述接收模块1,用于接收待搜索的输入关键字。
所述搜索模块2,用于在诗词资源库模块中搜索所述关键字,获取与所述输入关键字相匹配的诗词属性名称对应的诗词条数和各首诗词的序号。
所述搜索模块2包括第一搜索模块21、第二搜索模块22和第三搜索模块23。
所述第一搜索模块21用于在诗词属性查询模块中搜索与所述关键字相匹配的诗词属性名称,获取该诗词属性名称对应的各首诗词的序号以及各首诗词的相关内容索引地址。
所述第二搜索模块22用于在诗词属性关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的诗词属性名称以及该诗词属性名称对应的各首诗词的序号、各首诗词的相关内容索引地址。
所述第三搜索模块23用于在文本关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的文本内容以及该文本内容对应的诗词属性序号、诗词属性名称对应的各首诗词的名称和诗词的相关内容索引地址。
所述显示模块3用于在所述诗词资源库模块中调取所述各首诗词的属性名称及相关内容,并显示在结果列表上。
所述关系网构建模块4用于将所述各首诗词中的某一首诗词对象置为中心知识对象,获取所述中心知识对象的完整信息作为发散知识对象,构建由中心知识对象为中心词和发散知识对象为周边词组成的可随意变换的动态关系网络图。
所述关系网变换模块5用于当所述动态关系网络图中的发散知识对象进入了以中心知识对象为中心的一个辐射区域内时,以新的中心知识对象为中心词,与其相关的发散知识对象为周边词构建新的动态关系网络图。
所述关系网学习模块6用于调取所述动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容并在屏幕上显示。
所述诗词资源库模块7用于存储经过加工并形成内容关联的诗词资料学习内容。所述诗词资源库模块7是在PC机上利用C语言等工具将原始诗词数据库加工处理、压缩、加密后形成目标数据库,所述原始诗词数据库可由一张由EXCEL软件制作的“诗词信息表”和若干文本的集合所构成,所述诗词信息表可由每首诗词对象的若干属性以及该诗词对象指向对应的若干文本的路径,本发明实施例中,所述每首诗词对象的若干属性可包括该诗词对象对应的作者、标题、词牌、文体、主题、景物、物品、人物、事物、朝代等中的任意一种或多种,所述若干文本的集合可包括该诗词对象对应的作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本中的任意一种或多种,所述诗词对象指向对应的若干文本的路径指该诗词对象对应的作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本等文本的存储路径。优选地,所述“诗词信息表”中的信息和若干文本可来源于大、中、小学古诗词教材中各首诗词对应的相关内容。
所述诗词资源库模块7的结构示意图如图9a所示,包括一索引模块和一内容模块,所述内容模块包括诗词属性查询模块、诗词主库模块、文本内容模块、文本对应属性索引模块、诗词属性关键字位置模块、诗词属性起始位置模块、文本关键字位置模块、文本内容起始位置模块、其它模块(图片库模块、试题库模块、声音库模块等)、以及一用于解压上述各个子模块的HFM解压模块;所述索引模块包括诗词属性查询模块索引、诗词主库模块索引、文本内容模块索引、文本对应属性索引模块索引、诗词属性关键字位置模块索引、诗词属性起始位置模块索引、文本关键字位置模块索引、文本内容起始位置模块索引、其它模块(图片库模块、试题库模块、声音库模块等)索引、HFM解压模块索引;所述诗词资源库模块的索引模块中每一索引分别指向内容模块中相应模块内容的起始地址。由图9a可知,所述诗词属性关键字位置库模块与所述诗词属性起始位置库模块相关联;所述诗词属性起始位置库模块与所述诗词属性查询模块相关联;所述诗词属性查询模块与所述诗词主库模块相关联;所述诗词主库模块与所述文本内容模块相关联;所述文本关键字位置模块与所述文本内容起始位置模块相关联;所述文本内容起始位置模块与所述文本对应属性索引模块相关联;所述文本对应属性索引模块与所述诗词属性查询模块相关联。
以下对所述诗词资源库7的各个子模块的具体结构进行详细说明。
所述诗词属性查询模块的基本结构如表1所示,更为详细的结构请参考图9b,包括诗词属性类别总个数n、各类别诗词属性查询索引区模块和各类别诗词属性查询内容区模块。所述各类别诗词属性查询索引区模块存储了各类别诗词属性查询内容区模块的起始地址(如作者属性查询子库起始地址、标题属性查询子库起始地址、词牌属性查询子库起始地址、文体属性查询子库起始地址、主题属性查询子库起始地址、景物属性查询子库起始地址、物品属性查询子库起始地址、人物属性查询子库起始地址、事物属性查询子库起始地址和朝代属性查询子库起始地址),用于指向所述各类别诗词属性查询内容区模块中相应属性的查询子库内容。所述各类别诗词属性查询内容区模块包括作者属性查询子库内容、标题属性查询子库内容、词牌属性查询子库内容、文体属性查询子库内容、主题属性查询子库内容、景物属性查询子库内容、物品属性查询子库内容、人物属性查询子库内容、事物属性查询子库内容和朝代属性查询子库内容等,其中每一个属性查询子库内容包括:该类别属性内容个数m、该类别诗词属性内容索引地址和该类别诗词属性内容。所述该类别诗词属性内容索引地址指向该类别诗词属性内容,所述该类别诗词属性内容包括该诗词属性名称、该诗词属性名称对应的诗词条数k、和该诗词属性名称对应的各首诗词的序号,所述该诗词属性名称对应的诗词条数和该诗词属性名称对应的各首诗词的序号指该诗词属性名称在所述诗词主库模块中对应的诗词数目和序号,所述序号为一阿拉伯数字,在所述诗词主库模块中每一条诗词对应的记录对应一唯一的序号。另外应当理解,所述诗词属性查询模块中每一条属性内容均对应一唯一的、隐性的存储序号,该存储序号用以表示该条属性内容在诗词属性查询模块中的存储顺序。
所述诗词属性查询模块通过各类别诗词属性查询内容区模块的每个属性查询子库内容中存储的诗词属性名称对应的诗词条数和各首诗词的序号,与所述诗词主库模块相关联。
前已说明,诗词属性一般具有作者、标题、词牌、文体、主题、景物、物品、人物、事物以及朝代共10个类别,因此所述诗词属性类别总个数n=10。所述诗词属性名称指某个诗词属性的文字内容,例如诗词标题“春夜喜雨”、诗词作者“杜甫”等。由于一条诗词属性可能对应有多首诗词,例如“杜甫”作为诗词的“作者”属性就对应有多首古诗,因此表1中还给出了“该诗词属性名称对应的诗词条数k”这一结构。当用户输入关键字进行搜索时,可以在诗词属性查询模块中搜索到与用户输入的关键字匹配的诗词属性名称,以及该诗词属性对应的诗词条数k,然而此时还不能获取诗词相关内容,需要通过诗词属性查询模块中所述各首诗词的序号指向诗词主库模块,获取存储于诗词主库模块的各首诗词的各项属性名称,以及相关文本内容的索引地址,然后通过各首诗词的内容索引地址从文本内容模块中调取各首诗词的相关文本内容,例如调取各首诗词的作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析。
表1
所述诗词主库模块的基本结构如表2所示,更为详细的结构请参考图9c,包括诗词主库索引区模块和诗词主库内容区模块。所述诗词主库索引区模块存储了各首诗词属性的完整信息索引地址(每一诗词对应的作者地址、标题地址、词牌地址、文体地址、主题地址、景物地址、物品地址、人物地址、事物地址、朝代地址),用于指向诗词主库内容区模块中的各首诗词属性的完整信息。所述诗词主库内容区模块存储了各首诗词对应的资源,包括各首诗词的完整信息和相关内容索引地址,即所述诗词主库内容区模块包括每一诗词对应的每一个属性名称和每一诗词对应的每一个文本的地址,所述每一诗词对应的每一个文本的地址指向文本内容模块中该诗词对应的文本内容。所述相关内容索引地址包括作者简介文本地址、诗词原文文本地址、诗词说明文本地址、名师导读文本地址、诗词注释文本地址、诗词大意文本地址和诗词赏析文本地址,用于从文本内容模块中调取各首诗词对应的文本类别所包含的内容,所述文本类别包括但不限于作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析。所述完整信息包括诗词的各项属性名称,例如某一诗词的作者、词牌、文体、主题、景物、物品、人物、事物、朝代等。因此当用户输入某关键字如“望天门山”时,系统可获取“望天门山”这首诗词属性名称对应的诗词的序号,根据诗词的序号获取“望天门山”的完整信息,如“望天门山”的作者、词牌、文体、主题、景物、物品、人物、事物、朝代,这些完整信息作为发散知识对象可供用户选择学习。本发明实施例中,为了方便用户有针对性地进行诗词关联学习,对各首诗词的完整信息(发散知识对象)以及文本显示区的内容进行了设置,具体可以采取以下设置方式:
当诗词属性类别为标题时,各首诗词的完整信息为:该诗词标题的作者、词牌、文体、主题、景物、物品、人物、事物、朝代,文本显示区显示诗词标题、诗词作者、诗词原文、诗词说明、名师导读、诗词注释、诗词大意以及诗词赏析等文本;
当诗词属性类别为作者时,各首诗词的完整信息为:该诗词作者对应的各首诗词的标题,本本显示区显示相应的作者简介文本;
当诗词属性类别为词牌、文体、主题、景物、物品、人物、事物时,各首诗词的完整信息为:该诗词属性对应的诗词标题,本本显示区显示该诗词属性对应的诗词标题、诗词作者、诗词原文。
应当理解,所述诗词主库模块中每一条记录均对应一个唯一的序号,此处所述的记录指所述诗词主库索引区模块中的各条记录,所述序号即为该条记录隐形的存储序号。
所述诗词主库模块通过存储的每一诗词对应的每一个文本的地址(即相关内容索引地址)与文本内容模块相关联。
表2
所述文本内容模块存储有各首诗词的相关文本内容,包括但不限于各首诗词的诗词原文、诗词说明、名师导读、诗词注释、诗词大意以及诗词赏析。当用户键入关键字进行搜索后,可以在诗词属性查询模块中搜索到与用户输入的关键字匹配的诗词属性名称以及该诗词属性对应的诗词条数k、及各首诗词的序号,通过各首诗词的序号可到诗词主库模块中获取各首诗词的完整信息和内容索引地址,然后再通过各首诗词的相关内容索引地址便可从文本内容模块中调取各首诗词的具体内容,如各首诗词的作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析。
所述文本内容模块的基本结构如表3所示,更为详细的结构请参考图9d。具体实施过程中,所述文本内容模块指作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本的集合,所述作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本分别包括多个小文本,如作者简介文本包含多个作者的简介,每个作者的简介称之为一个小文本。将所有文本内容进行压缩后,以2KB为单位对压缩后的每一个小文本进行分块,每个小文本最后一块不足2KB时以空白填满2KB,即每个小文本被划分成了整数块的内容,从而可以统计出以下信息:每个小文本的起始块序号、每个小文本所占的块数、以及小文本块总数n,故所述文本内容模块包括文本内容索引区模块和文本具体内容区模块。所述文本具体内容区模块存储小文本块总数、各文本块索引地址及各个文本块压缩内容,所述小文本块总数指所有文本内容经过压缩和以2KB为单位分块后形成的块数,即所有小文本所占的块数之和,所述各文本块索引地址指从每2KB空间存储的文本内容中提取出来的索引地址,该索引地址指向相应文本块压缩内容,所述各个文本块压缩内容指压缩后的每2KB空间内存储的文本内容;所述文本内容索引区模块存储每个小文本的起始块序号、每个小文本所占的块数,所述每个小文本的起始块序号指向所述文本具体内容区模块中相应文本块压缩内容,每个小文本所占块数指该小文本占用了多少个2KB空间。以上仅为举例,并不用于限制该方案。
表3
所述诗词属性关键字位置模块的基本结构如表4所示,更为详细的结构请参考图9e,包括各类别诗词属性关键字位置索引区模块和各类别诗词属性关键字位置内容区模块。
所述各类别诗词属性关键字位置内容区模块包括但不限于包括作者关键字位置库内容、标题关键字位置库内容、词牌关键字位置库内容、文体关键字位置库内容、主题关键字位置库内容、景物关键字位置库内容、物品关键字位置库内容、人物关键字位置库内容、事物关键字位置库内容、朝代关键字位置库内容,其中每个关键字位置库内容存储了GBK字符集中字符总个数、GBK字符集中每个字符指向该字符的位置信息的索引地址和每个字符的位置信息,所述每个字符的位置信息包括该字符在该类别属性查询子库内容中出现的总次数、该字符在该类别属性查询子库内容中的相对位置号。下面以作者关键字位置库内容进行详细说明,所述作者关键字位置库内容包括GBK字符集中字符总个数、GBK字符集中每个字符指向该字符的位置信息的索引地址和每个字符的位置信息,所述GBK字符集中字符总个数指英文、数字、汉字及标点符号的总个数,所述GBK字符集中每个字符指向该字符的位置信息的索引地址为0000或指向对应字符的位置信息,当GBK字符集中的字符不能在作者属性查询子库内容中找到时该索引地址为0000,反之若GBK字符集中的字符能在作者属性查询子库内容中找到,则该索引地址指向该字符的位置信息;所述每个字符的位置信息包括GBK字符集中每个字符在作者属性查询子库内容中出现的总次数、每个字符在作者属性查询子库内容中的相对位置号,所述相对位置号用于比较不同的字符之间是否按顺序相邻,从而判断用户输入的关键词是否与作者属性查询子库内容中的内容匹配,即用户输入的作者姓名是否存在于作者属性查询子库中,所述相对位置号的计算方法如下:将所述作者属性查询子库内容中每个作者的姓名中的字符顺序集合,不同的作者姓名之间用分隔符隔开,按顺序给每个姓名中的每个字符及每个分隔符分配一个序号,该序号可为顺序的阿拉伯数字,则每个不同位置上的字符和每个分隔符分别对应唯一的一个序号,该序号即为对应的字符或者分隔符在作者属性查询子库内容中的相对位置号,由于作者属性查询子库内容中多个作者的姓名中可能存在相同的字,故字符出现的次数可能等于或大于1次,相对位置号可为一个或者多个,如作者属性查询子库内容中包括作者李白和白居易,假设李白中的“李”字、“白”字和白居易中的“白”字、“居”字和“易”字在作者属性查询子库内容中的相对位置号分别为2、3、5、6和7(其中相对位置号1和4均存放分隔符,用以区分李白和白居易这两条记录),则“李”字在作者属性查询子库内容中出现的次数为1,其相对位置号为2,“白”字在作者属性查询子库内容中出现的次数为2,其相对位置号分别为3、5,“居”字在作者属性查询子库内容中出现的次数为1,其相对位置号分别为6,“易”字在作者属性查询子库内容中出现的次数为1,其相对位置号分别为7;所述标题关键字位置库内容、词牌关键字位置库内容、文体关键字位置库内容、主题关键字位置库内容、景物关键字位置库内容、物品关键字位置库内容、人物关键字位置库内容、事物关键字位置库内容和朝代关键字位置库内容均与所述作者关键字位置库内容结构相同,此处不再赘述。
所述各类别诗词属性关键字位置索引区模块存储了各类别诗词属性关键字位置内容区模块的索引地址,用于指向各类别诗词属性关键字位置内容区模块,如图9e中作者关键字位置库地址指向作者关键字位置库内容。
所述诗词属性关键字位置模块通过各类别诗词属性关键字位置内容区模块中的每个字符在相应属性查询子库内容中的相对位置号与所述诗词属性起始位置模块相关联。
表4
以下详细说明所述诗词属性关键字位置模块的作用和结构实现方式。
当用户输入待搜索关键字后,系统会在诗词属性查询模块中用字符串匹配的方法,与各诗词属性名称进行完全匹配进行精确搜索。因各诗词属性名称已分别按名称内码顺序排列,所以匹配的过程可采用二分法在诗词属性查询模块中查找与用户输入完全匹配的诗词属性名称,若查找到完全匹配的诗词属性名称,则将该诗词属性名称所对应的诗词优先显示。所述通过二分法在诗词属性查询模块中查找与用户输入完全匹配的诗词属性名称的具体过程如图10所示,由于二分法为现有技术,此处省略对其的进一步说明。
通过二分法在诗词属性查询模块中只能找到与用户输入完全匹配的情况,然而实际中还存在用户输入内容与诗词属性名称不完全匹配的情况,例如用户输入的内容是“白居”,此时需要将诗词属性名称为“白居易”的内容作为搜索结果反馈给用户,而利用上述在所述诗词属性查询库中进行完全匹配的方法却查不到“白居易”,这时需要利用诗词属性关键字位置模块来进行不完全匹配的模糊查找。利用诗词属性关键字位置模块进行查找的方法是:针对用户输入内容所包含的每个字符,在诗词属性关键字位置模块中查找其出现的位置信息,然后比较这些位置信息,如果找到出现顺序与用户输入内容对应并且相邻的位置信息,则将该些位置信息对应的字符组合起来作为一个关键词,该关键词可能与某个诗词属性名称完全匹配,也可能某个诗词属性名称包含了该关键词。需要说明的是,前已述及,系统会在诗词属性查询模块中将用户输入的内容与各诗词属性名称进行完全匹配,故通过诗词属性关键字位置模块查到的与所述关键词完全匹配的诗词属性名称会是重复结果,系统会删除该重复结果。
下面举例说明在诗词属性关键字位置模块中匹配用户输入内容的方法:
示例:诗词属性类别均是“作者”的诗词属性名称“白居易”、“李白”、“李商隐”可按照顺序排列为文本内容“#白居易#李白#李商隐#”,然后存储于系统中,其中“#”代表分隔符,用以区分作者属性中的每一条记录,此时可以得到每个名称单字(即字符)对应的出现位置信息,对应如下:
文本内容:#1 白2 居3 易4 #5 李6 白7 #8 李9 商10 隐11 #12
对应位置信息:P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12
统计各名称单字每次出现的位置信息,并将各名称单字按GBK字符集中的字符顺序对应排列,则“诗词属性关键字位置模块”的结构可用如下的表5来表示:
表5
名称单字 | 名称单字出现总次数 | 名称单字每次出现的位置信息 |
白 | 2 | P2,P7 |
居 | 1 | P3 |
李 | 2 | P6,P9 |
商 | 1 | P10 |
易 | 1 | P4 |
隐 | 1 | P11 |
当用户输入“李白”进行搜索时,系统在“诗词属性关键字位置模块”中找到“李”的位置信息(P6,P9),以及“白”的位置信息(P2,P7),将两个字的各个位置信息进行比较,发现“李”字的(P6)位置与“白”字的(P7)位置顺序相邻,则表示(P6)位置的“李”与(P7)位置的“白”组合成的关键词“李白”就是本次搜索结果。
当用户输入“白居”进行搜索时,系统在“诗词属性关键字位置模块”中找到“白”的位置信息(P2,P7),以及“居”的出现位置信息(P3),将两个字的各个位置信息进行比较,发现“白”字的(P2)位置与“居”字的(P3)位置顺序相邻,则表示(P2)位置的“白”与(P3)位置的“居”组合成的关键词“白居”就是本次搜索结果。
所述诗词属性起始位置模块的基本结构如表6所示,更为详细的结构请参考图9f,包括各类别诗词属性起始位置索引区模块和各类别诗词属性起始位置内容区模块。所述各类别诗词属性起始位置内容区模块存储各类别诗词属性中内容的总条数、各类别诗词属性中各属性内容的相对起始位置号、以及各类别诗词属性中最后一条内容在该类别诗词属性中的结束位置号。应当理解,所述各类别诗词属性起始位置内容区模块包括作者起始位置库内容、标题起始位置库内容、词牌起始位置库内容、文体起始位置库内容、主题起始位置库内容、景物起始位置库内容、物品起始位置库内容、人物起始位置库内容、事物起始位置库内容和朝代起始位置库内容等。所述作者起始位置库内容包括作者的总个数、每个作者姓名的相对起始位置号、最后一个作者姓名的结束位置号,所述作者的总个数指作者属性查询子库内容中作者的总个数,每一个作者为其中的一条记录,每一条记录均对应一唯一的存储序号;所述每个作者姓名的相对起始位置号指该作者的姓名中的姓在作者属性查询子库内容中的相对位置号,最后一个作者姓名的结束位置号指作者属性查询子库内容中最后一个作者的姓名中的最后一个字符在作者属性查询子库内容中的位置号,如作者属性查询子库内容中包括作者李白和白居易,假设李白中的“李”字和“白”字在作者属性查询子库内容中的相对位置号分别为2、3,白居易中的“白”字、“居”字和“易”字在作者属性查询子库内容中的相对位置号分别为5、6、7(其中相对位置号1和4均存放分隔符,用以区分李白和白居易这两条记录),则作者“李白”和作者“白居易”在作者属性查询子库内容中的相对起始位置号分别为2、5,由此可知,每个属性内容均对应一个相对位置号区间,如作者属性中的记录“李白”的相对位置号区间为(2-3),“白居易”的相对位置号区间为(5-7),又由于每一属性内容均对应一唯一的存储序号,故每一存储序号均唯一对应一相对位置号区间。所述标题起始位置库内容、词牌起始位置库内容、文体起始位置库内容、主题起始位置库内容、景物起始位置库内容、物品起始位置库内容、人物起始位置库内容、事物起始位置库内容、朝代起始位置库内容的结构均与作者起始位置库内容的结构相同,此处不再赘述。
所述各类别诗词属性起始位置索引区模块存储了各类别诗词属性起始位置内容区模块的索引地址,用于指向所述各类别诗词属性起始位置内容区模块,如作者起始位置库地址指向作者起始位置库内容。
所述诗词属性起始位置模块通过其存储的各条内容的相对起始位置号所在的相对位置号区间所映射的存储序号与所述诗词属性查询模块相关联。
表6
所述文本对应属性索引模块的具体结构请参考图9g,所述文本对应属性索引模块包括小文本的总个数、每一小文本内容的信息地址和每一小文本对应属性的索引,所述作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本分别由相应的若干小文本所组成,如李白简介和白居易简介分别为作者简介文本中的两个小文本、“静夜思”原文和“如梦令”原文分别为诗词原文文本中的两个小文本。所述每一小文本对应属性名称的索引包括作者简介中每一小文本对应属性的索引、诗词原文中每一小文本对应属性的索引、诗词说明中每一小文本对应属性的索引、名师导读中每一小文本对应属性的索引、注释中每一小文本对应属性的索引、诗词大意中每一小文本对应属性的索引以及诗词赏析中每一小文本对应属性的索引;所述每一小文本对应属性名称的索引中其对应的属性名称包括但不限于诗词对象的作者、标题、词牌、文体、主题、景物、物品、人物、事物和朝代中的各个名称;所述作者简介中每一小文本对应属性的索引包括每一小文本对应的诗词条数、每一小文本对应每一诗词的信息,所述每一小文本对应每一诗词的信息包括每一小文本在诗词中的内容标记和每一小文本对应诗词的序号,所述内容标记用于标识该小文本的类别,所述类别包括作者简介、诗词原文、诗词说明、名师导读、注释、诗词大意以及诗词赏析;所述每一小文本对应诗词的序号指该小文本对应的诗词在诗词属性查询模块中的存储序号,所述每一小文本对应的诗词条数指该小文本对应于诗词主库索引区模块中的内容条数;所述诗词原文中每一小文本对应属性的索引、诗词说明中每一小文本对应属性的索引、名师导读中每一小文本对应属性的索引、注释中每一小文本对应属性的索引、诗词大意中每一小文本对应属性的索引以及诗词赏析中每一小文本对应属性的索引的结构均与所述作者简介中每一小文本对应属性的索引的结构相同,此处不再赘述;所述每一小文本内容的信息地址指向该小文本对应属性的索引;所述小文本的总个数指作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本中所有小文本的个数之和,且所述每一个小文本均对应一唯一的存储序号。
所述文本对应属性索引模块通过其存储的每一小文本对应诗词的序号与所述诗词属性查询模块相关联。
所述文本关键字位置模块的基本结构如表9所示,更为详细的结构请参考图9h,包括GBK字符集中字符总个数、GBK字符集中每个字符指向该字符的位置信息的索引地址和每个字符的位置信息。所述GBK字符集中字符总个数指英文、数字、汉字及标点符号的个数之和;所述GBK字符集中每个字符指向该字符的位置信息的索引地址为0000或指向对应字符的位置信息,当GBK字符集中的字符不能在所述文本内容模块中找到时该索引地址为0000,反之若GBK字符集中的字符能在所述文本内容模块中找到,则该索引地址指向该字符的位置信息;所述每个字符的位置信息包括每个字符在文本内容模块的文本块压缩内容中出现的总次数、每个字符在文本内容模块的文本块压缩内容中的相对位置号。所述文本关键字位置模块的结构与所述诗词属性关键字位置模块中每一个属性关键字位置库内容的结构基本相同,故此处对相同部分不再展开说明,只对两者中不同部分进行说明。前已述及,所述文本内容模块指作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本的集合,将每个类别中的所有小文本内容顺序集合,每个小文本之间用分隔符隔开,按顺序给每个小文本内容中的每个字符及每个分隔符分配一个序号,该序号可为顺序的阿拉伯数字,则每个不同位置上的字符和每个分隔符分别对应唯一的一个序号,该序号即为对应的字符或者分隔符在文本内容模块中的相对位置号,由于文本内容模块中每个小文本中可能存在相同的字,故相同字符在文本内容模块中出现的次数可能等于或大于1次,且相对位置号可为一个或者多个,如文本内容模块中包含顺序相邻的李白的简介和白居易的简介,所述李白的简介内容为“李白,字太白,号青莲居士。”,所述白居易的简介内容为“白居易,字乐天,号香山居士。”,假设“李白,字太白,号青莲居士。”中每个不同位置上的字符的相对位置号分别为:2、3、4、5、6、7、8、9、10、11、12、13、14,其中4、8和18分别该内容中的逗号、逗号和句号的相对位置号;则“白居易,字乐天,号香山居士。”的相对位置号分别为:16、17、18、19、20、21、22、23、24、25、26、27、28、29,其中19、23、29分别为该内容中的逗号、逗号和句号,而15为上述两条作者简介内容之间的分隔符所对应的相对位置号,由上述可知,字符李字在文本内容模块中出现的次数为1次,其相对位置号为2;字符白字在文本内容模块中出现的次数为3次,其相对位置号分别为3、7、16。值得注意的是,所述诗词属性关键字位置模块针对作者、标题、词牌、文体、主题、景物、物品、人物、事物、朝代等属性内容,而所述文本关键字位置模块针对作者简介、诗词原文、诗词说明、名师导读、注释、诗词大意以及诗词赏析等文本内容。
所述文本关键字位置模块通过其存储的每个字符在文本内容模块的内容中的相对位置号与所述文本内容起始位置模块相关联。
表9
所述文本内容起始位置模块的具体结构如表10所示,更为详细的结构请参考图9i,所述文本内容起始位置模块包括小文本的总个数、每个小文本内容的相对起始位置号和最后一个小文本内容的结尾在文本内容模块中的位置号。由上述对文本关键字位置模块的描述可知,每个小文本内容均对应一个相对位置号区间,如李白简介内容的相对位置号区间为(2-14),白居易简介内容的相对位置号区间为(16-29),又由于每一小文本内容均对应一存储序号,故每一存储序号均唯一对应一相对位置号区间。所述文本内容起始位置模块的结构与所述诗词属性内容起始位置模块中的每一个属性内容起始位置库内容基本相同,不同之处在于所述文本内容起始位置模块针对诗词资源库模块中的文本内容,即针对作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本,因此,对文本内容起始位置模块此处不再赘述。
所述文本内容起始位置模块通过其存储的每个小文本内容的相对起始位置号所属的相对位置号区间所映射的存储序号与所述文本对应属性索引模块相关联。
表10
小文本的总个数 |
每个小文本内容的相对起始位置号 |
最后一个小文本内容的结尾在文本内容模块中的位置号 |
当用户输入待搜索内容后,系统除了按前述方式在诗词属性关键字位置模块和诗词属性起始位置模块中查找诗词属性名称外,也在文本关键字位置模块和文本内容起始位置模块中搜索文本内容。
所述HFM解压模块(哈夫曼解压表模块)便于搜索引擎对诗词资源库模块进行解压处理,为现有技术,此处不再赘述。
以上详细说明了本发明的诗词关联搜索系统的各个模块,并且重点介绍了诗词资源库模块7,本发明的诗词关联搜索方法基于诗词资源库模块7,通过一系列的处理过程实现诗词及其发散学习内容的查询和显示。下面将对本发明的诗词关联搜索方法进行详细说明。
图2是本发明的诗词关联搜索方法的流程图。为了便于描述,这里只示出了与本发明相关的部分。
步骤S1:接收待搜索的输入关键字。
步骤S2:在所述诗词资源库模块7中搜索所述输入关键字,获取与所述输入关键字相匹配的诗词属性名称对应的诗词条数和各首诗词的序号;
所述步骤S2中搜索所述输入关键字包括以下三种方法,其中方法一为为诗词属性查询模块精确搜索,方法二为诗词属性关键字位置模块模糊搜索,方法三采用文本关键字位置模块模糊搜索。
方法一:所述诗词属性查询模块精确搜索即对输入关键字进行完全匹配,通过对诗词属性查询模块进行搜索从而找到与输入关键字匹配的属性名称和文本内容,其相关流程如下:将输入关键词与所述诗词属性查询模块的各类别诗词属性查询内容区模块中的内容相匹配,得到输入关键字在诗词主库模块中对应的诗词数目和序号,根据输入关键字在诗词主库模块中对应的诗词数目和序号(前已述及,诗词主库索引区模块中每条记录均对应一唯一的存储序号),在所述诗词主库模块中得到与输入关键字相关的各属性名称和指向文本内容模块中相关内容的索引地址,再根据所述指向文本内容模块中相关内容的索引地址得到与输入关键字相关的各项文本内容。
方法二:所述诗词属性关键字位置模块模糊搜索即对输入关键字进行不完全匹配,通过对诗词属性关键字位置模块进行搜索从而找到包含输入关键字的属性名称和文本内容,相关内容的流程如下:当用户输入某一属性关键字(即输入作者、标题、词牌、文体、主题、景物、物品、人物、事物、朝代中任意一种)时,搜索引擎将输入的每个关键字符分别与所述诗词属性关键字位置模块的各类别诗词属性关键字位置内容区模块中的每一个属性关键字位置库内容中包含的GBK字符集中的字符相匹配,得到匹配成功的GBK字符集中的若干字符及指向该字符的位置信息的索引地址,从而找到该字符对应的位置信息,由于所述位置信息包括每个字符在相应的属性查询子库内容中出现的总次数、每个字符在相应的属性查询子库内容中的相对位置号,故将该相对位置号与所述诗词属性内容起始位置模块中存储的相对起始位置号相比较,若该相对位置号与所述诗词属性内容起始位置模块中的A记录的相对起始位置号相同或者在顺序相邻的A记录和B记录的相对起始位置号之间,则该相对位置号对应的属性记录为A记录,由此找到输入关键字对应记录的相对起始位置号,意即找到了输入关键字对应属性内容的相对位置号区间,从而找到该相对位置号区间对应的属性记录内容,由于每条属性记录内容在所述诗词属性查询模中唯一对应一个存储序号,进而找到该记录内容对应的存储序号,通过该存储序号在所述诗词属性查询模块中找到该条记录在诗词主库模块中对应的诗词数目和序号,再根据该条记录在诗词主库模块中对应的诗词数目和序号,在所述诗词主库模块中查询相应的内容,从而得到用户输入关键字在所述文本内容模块中对应的索引地址,最后根据此索引地址在所述文本内容模块中查找对应的文本内容并显示给用户,所述对应的文本内容包括但不限于作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本。
方法三:所述文本关键字位置模块模糊搜索即对输入关键字进行不完全匹配,通过对文本关键字位置模块进行搜索从而找到包含输入关键字的属性名称和文本内容,相关流程如下:诗词对象对应的文本内容(即包括但不限于如下文本内容:作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本中任意一种)查询相关内容的流程如下(即通过文本关键字位置模块查询):当用户输入某一文本内容关键字(即作者简介、诗词原文、诗词说明、名师导读、注释、诗词大意以及诗词赏析中任意一种)时,搜索引擎将输入的每个关键字符分别与所述文本关键字位置模块内容中包含的GBK字符集中的字符相匹配,得到匹配成功的GBK字符集中的若干字符及指向该字符的位置信息的索引地址,从而找到该字符对应的位置信息,由于所述位置信息包括每个字符在文本内容模块中出现的总次数、每个字符在文本内容模块中的相对位置号,故将该相对位置号与所述文本内容起始位置模块中存储的相对起始位置号相比较,若该相对位置号与所述文本内容起始位置模块中的A记录的相对起始位置号相同或者在顺序相邻的A记录和B记录的相对起始位置号之间,则该相对位置号对应的属性记录为A记录,由此找到输入关键字对应小文本内容的相对位置号区间,由于每一相对位置号区间均唯一对应于每一存储序号,再根据该小文本对应的存储序号在所述文本对应属性索引模块中找到该小文本在所述诗词主库模块中对应的诗词条数、内容标记和各条诗词的序号,接着根据找到的诗词条数和诗词序号在所述诗词属性查询模块中找到相应的属性内容,接下来由所述诗词属性查询模块至所述诗词主库模块再至所述文本内容模块中的查询过程同上述通过诗词对象的某一属性查询过程中相应的流程一致,此处不再赘述。
通过上述三种搜索方法的任一种均可以搜索用户输入的关键字,根据搜索结果可以调取诗词相应的资源。图11示出了利用三种搜索方法进行综合搜索所述关键字的方法流程图,首先可按照空格拆分用户输入的关键词,然后将各个关键词放入待搜索关键词列表中,之后利用上述的三种搜索方法进行搜索,并将搜索结果合并放入结果队列中,存在重复的搜索结果时删除重复的记录。
步骤S3:在所述诗词资源库模块7中调取与输入关键字相匹配的各首诗词的属性名称及相关内容,并显示在结果列表上。所述步骤S3包括:
步骤S301:显示通过方法一和方法二匹配到的诗词属性名称所对应的各首诗词的相关内容。
步骤S302:显示通过方法三匹配到的文本内容所对应的各首诗词的相关内容。
所述结果列表的内容显示顺序可以根据需要进行设置,本发明实施例中,结果列表的第一行用于显示诗词标题,第二行用于显示诗词相应的诗词属性例如作者、词牌、文体、主题、景物、物品、人物、事物、朝代等,第三行用于显示带有搜索关键字的文本内容。图3示出了以“张志和”作为搜索关键字时结果列表的显示情况,其中,结果列表的第一条显示了在诗词属性类别为“作者”的属性内容中匹配到“张志和”时,“张志和”对应的诗词“渔歌子”;第二条显示了在文本关键字位置模块中匹配到文本内容“张志和”时,其对应的诗词“渔家傲”。图3中,每条显示结果的第一行均显示了诗词标题,第二行显示了诗词作者,第三行显示了带有所述关键字的文本内容。以上仅为举例,并不用于限制该方案。
步骤S4:将所述各首诗词中的某一首诗词置为中心知识对象,获取所述中心知识对象的完整信息作为发散知识对象,构建由中心知识对象作为中心词和发散知识对象作为周边词所组成的可随意变换的动态关系网络图,点击并显示所述动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容。
当用户点击结果列表中的某一首诗词时,系统可以根据该诗词属性在诗词主库模块中对应的诗词数目和序号从诗词资源库模块中获取该诗词的完整信息并将其置为发散知识对象。所述完整信息存储了诗词的各项属性名称,包括某一诗词的作者、词牌、文体、主题、景物、物品、人物、事物、朝代等发散学习内容。例如当用户输入“望天门山”时,系统可获取“望天门山”这首诗词属性在诗词主库模块中对应的诗词数目和序号,然后根据诗词序号获取“望天门山”的完整信息,如“望天门山”的作者、词牌、文体、主题、景物、物品、人物、事物、朝代,这些完整信息作为发散知识对象可供用户选择学习。
如图4所示,所述步骤S4获取了发散知识对象以后,为了使用户可以方便生动的进行学习,构建了动态关系网络图。所述动态关系网络图包括一个位于中心的中心知识对象和若干个位于四周通过线条与中心知识对象连接的发散知识对象。每一对象可以被操控,例如用户通过点击中心知识对象和/或发散知识对象即可直接学习诗词的作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析等内容;通过拖动发散知识对象可以使其位于动态关系网络图的中心成为新的中心知识对象,并形成以新的中心知识对象为中心词以其发散知识对象为周边词的新的动态关系网络图,该新的动态关系网络图反应了新的中心知识对象与其对应的发散知识对象之间的关系,供用户进一步选择学习。
下面对构建动态关系网络图的具体步骤进行详细说明。所述步骤S4中构建动态关系网络图包括以下步骤:
步骤S401:创建表示中心知识对象和发散知识对象的图片或链接,用于存储被置为中心知识对象的诗词及其完整信息的内容索引地址。
如图4所示,动态关系网络图的中心知识对象和发散知识对象可以通过带有文字的图片或链接来实现,图片或链接中可以存储被置为中心知识对象的诗词及其完整信息的内容索引地址,当用户点击中心知识对象或发散知识对象时,可以根据表示对象的图片或链接中存储的相关内容索引地址,调取并显示对象对应的学习资源,例如诗词的作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析等内容。
步骤S402:将所述表示中心知识对象的图片或链接设置在动态关系网络图的中心,将所述表示发散知识对象的图片或链接散布在动态关系网络图中中心词的周围。
在步骤S402中,可以采用多种方式使发散知识对象的图片或链接散布在动态关系网络图中心词的周围,实际操作中可根据发散知识对象的个数来确定最佳方案。例如假设一个动态关系网络图最多可显示1个中心知识对象和8个发散知识对象,该动态关系网络图包括一个中心坐标,用于排布中心知识对象,还包括1到8号共8个均匀顺序排列在中心坐标四周的发散坐标,用于排布8个发散知识对象,假设每页需要显示的发散知识对象个数为N,则
1)当N=1时,随机取一个发散坐标位置用于显示该发散知识对象;
2)当N=2时,先随机取一个发散坐标位置,然后间隔3个数取另一个发散坐标位置,例如取2、6号或4、8号发散坐标位置来显示发散知识对象;
3)当N=3时,先随机取一个发散坐标位置,然后顺时针间隔2个数取一个发散坐标位置,逆时针间隔2个数取一个发散坐标位置,例如取3、6、8号或5、8、2号发散坐标位置来显示发散知识对象;
4)当N=4时,先随机取一个发散坐标位置,然后顺时针每间隔一个数取一个发散坐标位置,例如取2、4、6、8号发散坐标位置来显示发散知识对象;
5)当N=5时,先随机取一个发散坐标位置,然后顺时针间隔一个数取两个连续的发散坐标位置,之后再间隔一个数取两个连续的发散坐标位置,例如取3、5、6、8、1号或5、7、8、2、3号发散坐标位置来显示发散知识对象;
6)当N=6时,先随机取三个连续的发散坐标位置,然后间隔一个数后再取3个连续的发散坐标位置,比如取3、4、5、7、8、1号发散坐标位置来显示发散知识对象;
7)当N=7时,随机取7个发散坐标位置来显示发散知识对象;
8)当N=8时,取1-8号即取全部发散坐标位置来显示发散知识对象。
当需要显示的发散知识对象的个数超过一个动态关系网络图可以显示的个数时,可以利用分页技术,在下一页的动态关系网络图中继续显示其余未显示完毕的发散知识对象。所述分页技术为现有技术,此处省略对其的进一步说明。
本发明的历史知识关联搜索方法还进一步包括以下步骤:
步骤S5:当所述动态关系网络图中的发散知识对象进入了以中心知识对象为中心的一个辐射区域内时,以新的中心知识对象为中心词,其发散知识对象为周边词构建新的动态关系网络图。
所述步骤S5包括步骤S501和步骤S502,说明如下:
步骤S501:判断位于所述动态关系网络图周围的发散知识对象是否进入了以所述中心知识对象为中心的一个辐射区域内,若是则将该发散知识对象设置为新的中心知识对象,并构建该新的中心知识对象对应的动态关系网络图。
前已述及,发散知识对象以图片或链接形式实现,可以被用户拖动,当拖动事件发生时,可以触发步骤S5的判断过程。本发明以中心知识对象为中心划定了一个具有一定距离半径的圆形辐射区域,因此当某一周围的发散知识对象被拖动时,可以判断该发散知识对象与中心知识对象的距离A,当距离A小于或等于圆形辐射区域的半径时,就可以得出有发散知识对象进入了辐射区域内的判断,进而可进一步到诗词属性查询模块中根据该发散知识对象对应的诗词属性名称查询其对应的资源,并构建新的动态关系网络图显示给用户(构建方法同上所述)。
步骤S502:若位于所述动态关系网络图中的发散知识对象没有进入以所述中心知识对象为中心的一个辐射区域内,则通过二分位移方法将该发散知识对象置回其原来所处的位置(简称原位)。
下面对二分位移方法进行说明:当发散知识对象被拖动离开它被固定的发散坐标位置(简称原始位置)而到达新的发散坐标位置后,它将以v的速度回到其原始位置,V=发散知识对象当前所在位置区域的中心坐标与原始位置区域的中心坐标位置之间的距离/2,由于原始位置区域的中心坐标不变,因此v是根据发散知识对象当前位置的变化而不断变化的,发散知识对象当前位置距离原始位置位置越远,v值越大,即发散知识对象移动的速度越快;发散词知识对象当前位置距离原始坐标位置越近,v值越小,即发散知识对象移动的速度越慢。最终,发散知识对象回到其原始位置。通过二分位移方法进行移位时,对象移动轨迹的情况可参考图5。
步骤S6:调取所述新的动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容并在屏幕上显示。
在步骤S6中,当用户点击新的动态关系网络图中的某个对象时,调取该对象对应的诗词相关内容,例如诗词的作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析等内容,并且显示在文本显示区或者弹出方框中(如图6和图7),供用户系统学习中心知识和发散知识的具体内容。
在本发明实施例中,文本显示区可以根据实际需要设置显示的具体内容。例如,如图6所示,当中心知识对象的诗词属性为“诗词标题”时,文本显示区可以显示该诗词的作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、诗词注释文本、诗词大意文本以及诗词赏析文本;
如图7所示,当中心知识对象的诗词属性为“诗词作者”时,文本显示区可以显示对应的作者简介文本;
如图8所示,当中心知识对象的诗词属性为诗词的词牌、文体、主题、景物、物品、人物、事物、朝代时,文本显示区可以显示该诗词属性所对应的诗词原文文本。当某周边的发散知识对象被拖动为新的中心知识对象时,文本显示区的内容随之切换为新的中心知识对象所对应的诗词文本内容。
综上所述,本发明的诗词关联搜索方法不仅可以搜索与用户输入的关键字相匹配的诗词内容,还可以将与该诗词内容相关联的发散知识搜索出来,并由用户自主选择是否学习发散知识。当用户点击结果列表中的某一首诗词内容时,本发明会构建由该诗词内容及其多个发散知识构成的动态关系网络图,从而用户可感知并学习每个查询的诗词内容所关联的发散知识,加强学习印象。用户通过点击动态关系网络图中的各个对象还可学习对象所对应的诗词具体内容,提高学习效率,通过拖动发散知识还可进一步方便地学习新的动态关系网络图。实现了方便用户进行诗词的关联学习、对比学习、发散学习,提高学习效率和学习效果。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (19)
1.一种诗词关联搜索方法,该方法以诗词资源库模块(7)为基础,包括如下步骤:
步骤A:接收待搜索的输入关键字;
其特征在于还包括如下步骤:
步骤B:在所述诗词资源库模块(7)中搜索所述输入关键字,获取与所述输入关键字相匹配的诗词属性名称对应的诗词条数和各首诗词的序号;
步骤C:在所述诗词资源库模块(7)中调取所述各首诗词的属性名称及相关内容,并显示在结果列表上;
步骤D:将所述各首诗词中的某一首诗词对象置为中心知识对象,获取所述中心知识对象的完整信息作为发散知识对象,构建由中心知识对象为中心词和发散知识对象为周边词组成的可随意变换的动态关系网络图,点击并显示所述动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容。
2.根据权利要求1所述的诗词关联搜索方法,其特征在于还包括:
步骤E:当所述动态关系网络图中的发散知识对象进入以所述中心知识对象为中心的一个辐射区域内时,以新的中心知识对象为中心词,与该新的中心知识对象相关联的发散知识对象为周边词构建新的动态关系网络图;
步骤F:调取所述新的动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容并在屏幕上显示。
3.根据权利要求2所述的诗词关联搜索方法,其特征在于,所述步骤B搜索所述输入关键字至少采用以下方法的一种:
方法一为诗词属性查询模块精确搜索:在诗词属性查询模块中搜索与所述输入关键字相匹配的诗词属性名称,获取该诗词属性名称对应的各首诗词的序号以及各首诗词的相关内容索引地址;
方法二为诗词属性关键字位置模块模糊搜索:在诗词属性关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的诗词属性名称以及该诗词属性名称对应的各首诗词的序号、各首诗词的相关内容索引地址;
方法三为文本关键字位置模块模糊搜索:在文本关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的文本内容以及该文本内容对应的诗词属性名称、诗词属性名称对应的各首诗词的序号和诗词的相关内容索引地址。
4.根据权利要求3所述的诗词关联搜索方法,其特征在于:所述各首诗词的序号用于获取所述各首诗词的各项属性名称以及各项相关内容索引地址;所述内容索引地址包括作者简介文本地址、诗词原文文本地址、诗词说明文本地址、名师导读文本地址、诗词注释文本地址、诗词大意文本地址和诗词赏析文本地址,用于从文本内容模块中调取所述各首诗词的相关内容包括各首诗词的作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析。
5.根据权利要求4所述的诗词关联搜索方法,其特征在于,所述步骤C包括:
步骤C1:显示根据所述方法一和方法二匹配到的诗词属性名称对应的各首诗词的相关内容;
步骤C11:所述方法一的过程包括如下步骤:将输入关键字与所述诗词属性查询模块的各类别诗词属性查询内容区模块中的内容进行完全匹配,得到输入关键字在诗词主库模块中对应的诗词数目和序号,根据所述输入关键字在所述诗词主库模块中对应的诗词数目和序号,在所述诗词主库模块中得到与输入关键字相关的各属性名称和指向文本内容模块中相关内容的索引地址,再根据所述指向文本内容模块中相关内容的索引地址得到与输入关键字相关的各项文本内容;
步骤C12:所述方法二的过程包括如下步骤:将输入关键词中的每个关键字符与所述诗词属性关键字位置模块的各类别诗词属性关键字位置内容区模块中的每一个属性关键字位置库内容中包含的GBK字符集中的字符相匹配,得到匹配成功的GBK字符集中的若干字符及指向该字符的位置信息的索引地址,从而由索引地址找到该字符对应的位置信息,由所述位置信息得知每个关键字符在相应的属性查询子库内容中出现的总次数,及在相应的属性查询子库内容中的相对位置号,将该相对位置号与诗词属性起始位置模块中存储的相对起始位置号相比较,得到输入关键字对应属性内容的相对起始位置号即输入关键字对应属性内容的相对位置号区间,从而找到该相对位置号区间对应的属性记录内容,再根据该相对位置号区间对应属性记录内容所对应的存储序号在所述诗词属性查询模块中找到该条记录在诗词主库模块中对应的诗词数目和序号,根据在诗词主库模块中对应的诗词数目和序号,在所述诗词主库模块中得到与输入关键字相关的各属性名称和指向文本内容模块中相关内容的索引地址,再根据所述指向文本内容模块中相关内容的索引地址得到与输入关键字相关的各项文本内容;
步骤C2:显示根据所述方法三匹配到的文本内容对应的各首诗词的相关内容;
步骤C21:所述方法三的过程包括如下步骤:将输入关键字中的每个关键字符分别与所述文本关键字位置模块中包含的GBK字符集中的字符相匹配,得到匹配成功的GBK字符集中的若干字符及指向该字符的位置信息的索引地址,从而由索引地址找到该字符对应的位置信息,由所述位置信息得知每个关键字符在文本内容模块中出现的总次数及在文本内容模块中的相对位置号,将该相对位置号与文本内容起始位置模块中存储的相对起始位置号相比较,得到输入关键字对应某一文本内容的相对起始位置号即输入关键字对应某一文本内容的相对位置号区间,从而找到该相对位置号区间对应的文本内容,再根据该相对位置号区间对应文本内容所对应的存储序号在文本对应属性索引模块中找到该文本内容在诗词主库模块中对应的诗词条数、内容标记和各条诗词的序号,接着根据找到的诗词条数和诗词序号在所述诗词属性查询模块中找到相应的属性记录,再根据在诗词主库模块中对应的诗词数目和序号,在所述诗词主库模块中得到与输入关键字相关的各属性名称和指向文本内容模块中相关内容的索引地址,最后根据所述指向文本内容模块中相关内容的索引地址得到与输入关键字相关的各项文本内容。
6.根据权利要求5所述的诗词关联搜索方法,其特征在于,所述步骤D包括:
步骤D1:创建表示中心知识对象和发散知识对象的图片或链接,用于存储被置为中心知识对象的诗词及其完整信息的内容索引地址;
步骤D2:将所述表示中心知识对象的图片或链接作为中心词设置在动态关系网络图的中心,将所述表示发散知识对象的图片或链接作为周边词散布在动态关系网络图中的中心知识对象的周围。
7.根据权利要求6所述的诗词关联搜索方法,其特征在于,所述步骤E包括:
步骤E1:判断位于所述动态关系网络图中的发散知识对象是否进入以所述中心知识对象为中心的一个辐射区域内,若是则将该发散知识对象设置为新的中心知识对象,并构建以该新的中心知识对象为中心词,与该新的中心知识对象相关联的发散知识对象为周边词对应的动态关系网络图;
步骤E2:若位于所述动态关系网络图中的发散知识对象没有进入以所述中心知识对象为中心的一个辐射区域内,则通过二分位移方法将该发散知识对象置为其原来所处的原始位置。
8.一种诗词关联搜索系统,包括:
诗词资源库模块(7),存储经过加工并形成内容关联的诗词资料学习内容;
接收模块(1),用于接收待搜索的输入关键字;
其特征在于所述系统还包括:
搜索模块(2),用于在诗词资源库模块(7)中搜索所述关键字,获取与所述输入关键字相匹配的诗词属性名称对应的诗词条数和各首诗词的序号;
显示模块(3),用于在所述诗词资源库模块(7)中调取所述各首诗词的属性名称及相关内容,并显示在结果列表上;
关系网构建模块(4),用于将所述各首诗词中的某一首诗词对象置为中心知识对象,获取所述中心知识对象的完整信息作为发散知识对象,构建由中心知识对象为中心词和发散知识对象为周边词组成的可随意变换的动态关系网络图;
关系网变换模块(5),用于当所述动态关系网络图中的发散知识对象进入以中心知识对象为中心的一个辐射区域内时,构建新的动态关系网络图。
9.根据权利要求8所述的诗词关联搜索系统,其特征在于所述系统还包括:
关系网学习模块(6),用于调取所述动态关系网络图中的中心知识对象或发散知识对象对应的诗词相关内容并在屏幕上显示。
10.根据权利要求9所述的诗词关联搜索系统,其特征在于:
所述搜索模块(2)包括第一搜索模块(21)、第二搜索模块(22)和第三搜索模块(23),
所述第一搜索模块(21)用于在诗词属性查询模块中搜索与所述关键字相匹配的诗词属性名称,获取该诗词属性名称对应的各首诗词的序号以及各首诗词的相关内容索引地址;
所述第二搜索模块(22)用于在诗词属性关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的诗词属性名称以及该诗词属性名称对应的各首诗词的序号、各首诗词的相关内容索引地址;
所述第三搜索模块(23)用于在文本关键字位置模块中搜索所述输入关键字的位置信息,根据位置信息获取与所述输入关键字相匹配的文本内容以及该文本内容对应的诗词属性序号、诗词属性名称对应的各首诗词的名称和诗词的相关内容索引地址。
11.根据权利要求10所述的诗词关联搜索系统,其特征在于:
所述诗词资源库模块(7)包括诗词属性查询模块、诗词主库模块、文本内容模块、诗词属性关键字位置模块、诗词属性起始位置模块、文本关键字位置模块、文本内容起始位置模块、文本对应属性索引模块,以及一用于解压上述各个子模块的HFM解压模块。
12.根据权利要求11所述的诗词关联搜索系统,其特征在于:
所述诗词属性查询模块包括诗词属性类别总个数、各类别诗词属性查询索引区模块和各类别诗词属性查询内容区模块;
所述各类别诗词属性查询索引区模块存储了各类别诗词属性查询内容区模块的起始地址,用于指向所述各类别诗词属性查询内容区模块;
所述各类别诗词属性查询内容区模块包括各类别诗词属性内容个数、该类别诗词属性内容索引地址和该类别诗词属性内容,所述该类别诗词属性内容索引地址指向该类别诗词属性内容,所述该类别诗词属性内容包括诗词属性名称、该诗词属性名称对应的诗词条数和该诗词属性名称对应的各首诗词的序号,所述该诗词属性名称对应的诗词条数和该诗词属性名称对应的各首诗词的序号指该诗词属性名称在所述诗词主库模块中对应的诗词数目和序号。
13.根据权利要求12所述的诗词关联搜索系统,其特征在于:
所述诗词主库模块包括诗词主库索引区模块和诗词主库内容区模块;
所述诗词主库索引区模块存储了各首诗词属性的完整信息索引地址,用于指向诗词主库内容区模块中的各首诗词属性的完整信息;所述诗词主库内容区模块存储了各首诗词对应的资源,包括各首诗词属性的完整信息和相关内容索引地址;
所述相关内容索引地址包括作者简介文本地址、诗词原文文本地址、诗词说明文本地址、名师导读文本地址、诗词注释文本地址、诗词大意文本地址和诗词赏析文本地址,用于从文本内容模块中调取各首诗词对应的文本类别所包含的内容,所述文本类别包括但不限于作者简介、诗词原文、诗词说明、名师导读、诗词注释、诗词大意和诗词赏析;所述完整信息存储诗词的各项属性名称,包括但不限于诗词的作者、词牌、文体、主题、景物、物品、人物、事物、朝代的名称。
14.根据权利要求13所述的诗词关联搜索系统,其特征在于:
所述文本内容模块包括文本内容索引区模块和文本具体内容区模块;
所述文本具体内容区模块存储小文本块总数、各文本块索引地址及各个文本块压缩内容,所述各文本块索引地址指向文本具体内容区中的文本块压缩内容;所述文本内容索引区模块存储每个小文本的起始块序号、每个小文本所占的块数。
15.根据权利要求14所述的诗词关联搜索系统,其特征在于:
所述诗词属性关键字位置模块包括各类别诗词属性关键字位置索引区模块和各类别诗词属性关键字位置内容区模块;
所述各类别诗词属性关键字位置索引区模块存储了各类别诗词属性关键字位置内容区模块的索引地址,用于指向各类别诗词属性关键字位置内容区模块;
所述各类别诗词属性关键字位置内容区模块存储了GBK字符集中字符总个数、GBK字符集中每个字符指向该字符的位置信息的索引地址和每个字符的位置信息,所述GBK字符集中字符总个数指英文、数字、汉字及标点符号的个数之和;所述GBK字符集中每个字符指向该字符的位置信息的索引地址为0000或指向对应字符的位置信息;所述每个字符的位置信息包括GBK字符集中每个字符分别在所述诗词属性查询模块的各属性查询子库中出现的总次数、每个字符分别在各属性查询子库中的相对位置号。
16.根据权利要求15所述的诗词关联搜索系统,其特征在于:
所述诗词属性起始位置模块包括各类别诗词属性起始位置索引区模块和各类别诗词属性起始位置内容区模块;
所述各类别诗词属性起始位置索引区模块存储了各类别诗词属性起始位置内容区模块的索引地址,用于指向所述各类别诗词属性起始位置内容区模块;
所述各类别诗词属性起始位置内容区模块存储各类别诗词属性中内容的总条数、各类别诗词属性中各属性内容的相对起始位置号、以及各类别诗词属性中最后一条内容在该类别诗词属性中的结束位置号。
17.根据权利要求16所述的诗词关联搜索系统,其特征在于:
所述文本关键字位置模块包括GBK字符集中字符总个数、GBK字符集中每个字符指向该字符的位置信息的索引地址和每个字符的位置信息,所述GBK字符集中字符总个数指英文、数字、汉字及标点符号的个数之和;所述GBK字符集中每个字符指向该字符的位置信息的索引地址为0000或指向对应字符的位置信息;所述每个字符的位置信息包括每个字符在文本内容模块的文本块压缩内容中出现的总次数、每个字符在文本块压缩内容中的相对位置号。
18.根据权利要求17所述的诗词关联搜索系统,其特征在于:
所述文本内容起始位置模块包括小文本的总个数、每个小文本内容的相对起始位置号、最后一个小文本内容的结尾在文本内容模块中的位置号;所述小文本的总个数指作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本中所有小文本的个数之和。
19.根据权利要求18所述的诗词关联搜索系统,其特征在于:
所述文本对应属性索引模块包括小文本的总个数、每一小文本内容的信息地址和每一小文本对应属性的索引;
所述每一小文本对应属性的索引包括每一小文本对应的诗词的条数和每一小文本对应每一诗词的信息,所述每一小文本对应每一诗词的信息包括每一小文本在诗词中的内容标记和每一小文本对应诗词的序号;
所述每一小文本内容的信息地址指向该小文本对应属性名称的索引;所述小文本的总个数指作者简介文本、诗词原文文本、诗词说明文本、名师导读文本、注释文本、诗词大意文本以及诗词赏析文本中所有小文本的个数之和,且所述每一个小文本均对应一唯一的存储序号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010622156.5A CN102567423B (zh) | 2010-12-31 | 2010-12-31 | 一种诗词关联搜索方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010622156.5A CN102567423B (zh) | 2010-12-31 | 2010-12-31 | 一种诗词关联搜索方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102567423A true CN102567423A (zh) | 2012-07-11 |
CN102567423B CN102567423B (zh) | 2014-12-03 |
Family
ID=46412852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010622156.5A Active CN102567423B (zh) | 2010-12-31 | 2010-12-31 | 一种诗词关联搜索方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102567423B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951554A (zh) * | 2015-06-29 | 2015-09-30 | 浙江大学 | 为风景照配上符合其意境的诗句的方法 |
CN105426551A (zh) * | 2015-12-31 | 2016-03-23 | 百度在线网络技术(北京)有限公司 | 文言文搜索方法和装置 |
CN106156111A (zh) * | 2015-04-03 | 2016-11-23 | 北京中知智慧科技有限公司 | 专利文件检索方法、装置和系统 |
CN106445923A (zh) * | 2016-10-18 | 2017-02-22 | 上海众恒信息产业股份有限公司 | 基于层叠架构的查询系统及查询方法 |
CN109086285A (zh) * | 2017-06-14 | 2018-12-25 | 佛山辞荟源信息科技有限公司 | 基于语素的汉语智能处理方法和系统及装置 |
CN109635295A (zh) * | 2018-06-01 | 2019-04-16 | 安徽省泰岳祥升软件有限公司 | 一种基于语义分析的诗词检索方法及系统 |
CN109948157A (zh) * | 2019-03-13 | 2019-06-28 | 日照职业技术学院 | 一种诗词收集和数据分析方法 |
CN113901330A (zh) * | 2021-12-09 | 2022-01-07 | 北京达佳互联信息技术有限公司 | 视频搜索方法、装置、电子设备以及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1930567A (zh) * | 2005-01-07 | 2007-03-14 | 松下电器产业株式会社 | 联想辞典制作装置 |
CN101004751A (zh) * | 2006-12-22 | 2007-07-25 | 新诺亚舟科技(深圳)有限公司 | 用于手持学习终端的跨词典查询方法 |
CN101203856A (zh) * | 2005-06-20 | 2008-06-18 | 电子湾有限公司 | 用于生成相关搜索查询的系统 |
-
2010
- 2010-12-31 CN CN201010622156.5A patent/CN102567423B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1930567A (zh) * | 2005-01-07 | 2007-03-14 | 松下电器产业株式会社 | 联想辞典制作装置 |
CN101203856A (zh) * | 2005-06-20 | 2008-06-18 | 电子湾有限公司 | 用于生成相关搜索查询的系统 |
CN101004751A (zh) * | 2006-12-22 | 2007-07-25 | 新诺亚舟科技(深圳)有限公司 | 用于手持学习终端的跨词典查询方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156111A (zh) * | 2015-04-03 | 2016-11-23 | 北京中知智慧科技有限公司 | 专利文件检索方法、装置和系统 |
CN104951554A (zh) * | 2015-06-29 | 2015-09-30 | 浙江大学 | 为风景照配上符合其意境的诗句的方法 |
CN104951554B (zh) * | 2015-06-29 | 2018-03-06 | 浙江大学 | 为风景照配上符合其意境的诗句的方法 |
CN105426551A (zh) * | 2015-12-31 | 2016-03-23 | 百度在线网络技术(北京)有限公司 | 文言文搜索方法和装置 |
CN106445923A (zh) * | 2016-10-18 | 2017-02-22 | 上海众恒信息产业股份有限公司 | 基于层叠架构的查询系统及查询方法 |
CN109086285A (zh) * | 2017-06-14 | 2018-12-25 | 佛山辞荟源信息科技有限公司 | 基于语素的汉语智能处理方法和系统及装置 |
CN109086285B (zh) * | 2017-06-14 | 2021-10-15 | 佛山辞荟源信息科技有限公司 | 基于语素的汉语智能处理方法和系统及装置 |
CN109635295A (zh) * | 2018-06-01 | 2019-04-16 | 安徽省泰岳祥升软件有限公司 | 一种基于语义分析的诗词检索方法及系统 |
CN109635295B (zh) * | 2018-06-01 | 2022-12-16 | 安徽省泰岳祥升软件有限公司 | 一种基于语义分析的诗词检索方法及系统 |
CN109948157A (zh) * | 2019-03-13 | 2019-06-28 | 日照职业技术学院 | 一种诗词收集和数据分析方法 |
CN113901330A (zh) * | 2021-12-09 | 2022-01-07 | 北京达佳互联信息技术有限公司 | 视频搜索方法、装置、电子设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102567423B (zh) | 2014-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102567423B (zh) | 一种诗词关联搜索方法和系统 | |
CN102063476B (zh) | 视频搜索方法及系统 | |
US9449271B2 (en) | Classifying resources using a deep network | |
US11899681B2 (en) | Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium | |
CN100541496C (zh) | 在个人手持学习终端上实现的针对试题的搜索与学习相结合的方法 | |
CN102625937B (zh) | 用于对视觉查询作出响应的体系结构 | |
US8949264B2 (en) | Disambiguating associations | |
CN103914513B (zh) | 一种实体输入方法和装置 | |
WO2015176525A1 (zh) | 基于时间序列化的文档的标识、关联、搜索及展现的系统 | |
CN105095320A (zh) | 基于关系叠加组合的文档的标识、关联、搜索及展现的系统 | |
CN102122286A (zh) | 在手持学习终端上实现的聚合式搜索的方法 | |
CN102622371B (zh) | 一种历史关联库系统及其实现方法和电子学习设备 | |
CN102368255A (zh) | 信息存储与检索 | |
CN104021150A (zh) | 带有社交网络辅助的面部识别 | |
CN102262670A (zh) | 一种基于移动可视设备的跨媒体信息检索系统及方法 | |
Lalmas | Aggregated search | |
CN101561725B (zh) | 一种手写快速输入的方法和系统 | |
WO2015018247A1 (zh) | 事件多维度信息显示装置和方法 | |
CN102750366A (zh) | 基于自然交互输入的视频搜索系统及方法和视频搜索服务器 | |
CN103914488A (zh) | 文档的采集、标识、关联、搜索及展现的系统 | |
CN105956098B (zh) | 一种纸质印刷品与电子资源的关联方法及系统 | |
CN108806355A (zh) | 一种书画艺术互动教育系统 | |
CN103914486B (zh) | 文档的搜索及展现的系统 | |
KR20180096341A (ko) | 소셜 플랫폼상에서 mooc와 플립드러닝을 지원하는 온톨로지 기반 교육 콘텐츠 소셜 큐레이터 구현 시스템 및 그 방법 | |
Giannini et al. | Computational Culture: Transforming archives practice and education for a post-Covid world |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20151130 Address after: 518048 Guangdong city of Shenzhen province Futian District Che Kung Temple Industrial Zone, Sha Tau Street Tian Book Building F3.8-8B4 Patentee after: SHENZHEN YOUXUETIANXIA EDUCATION DEVELOPMENT CO., LTD. Address before: 610041, 4 North Zone, 2 North Zone C, 81 Xin Dong Street, Chengdu hi tech Zone, Sichuan Patentee before: Chengdu Zhiyuan Nuoyazhou Education Technology Co., Ltd. |