CN107391624A - 一种阅读辅助系统及处理方法 - Google Patents
一种阅读辅助系统及处理方法 Download PDFInfo
- Publication number
- CN107391624A CN107391624A CN201710550246.XA CN201710550246A CN107391624A CN 107391624 A CN107391624 A CN 107391624A CN 201710550246 A CN201710550246 A CN 201710550246A CN 107391624 A CN107391624 A CN 107391624A
- Authority
- CN
- China
- Prior art keywords
- vocabulary
- text
- user
- individual subscriber
- reading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种阅读辅助系统及处理方法,其中系统包括,用户数据获取单元,用于接收用户按照预设的词汇输入方式输入的用户词汇信息,并根据用户词汇信息确定出用户的已知词表;用户个人词表确定单元,用于根据预先构建的总词汇表,以及根据已知词表确定出用户个人词表;文本推荐单元,用于根据用户个人词表,从预先构建的文本库中筛选出最适合的文本推荐给用户。本发明提供的阅读辅助系统及处理方法,通过提前接收用户词汇信息,确定出用户所具有的词汇水平,继而从预先构建的文本库中筛选出最适合的文本推荐给用户,可根据阅读者的实际情况进行读物推荐,且可对所推荐的读物的内容进行注释,有助于提高阅读者的阅读兴趣和阅读效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种阅读辅助系统及处理方法。
背景技术
进行外语阅读的最大问题是生词问题。目前,已经有了不少的阅读辅助工具用以辅助阅读者更好地进行阅读,但是,现有的阅读辅助工具的缺点是,针对所有的阅读者,所提供的阅读辅助的形式都一样,不能根据阅读者的个体实际情况进行个性化的阅读辅助。
发明内容
本发明要解决的技术问题是提供一种阅读辅助系统及处理方法,通过提前接收用户词汇信息,确定出用户所具有的词汇水平,继而从预先构建的文本库中筛选出最适合的文本推荐给用户,可根据阅读者的实际情况进行读物推荐,且可对所推荐的读物的内容进行注释,有助于提高阅读者的阅读兴趣和阅读效率。
为解决上述技术问题,本发明提供的技术方案是:
一方面,本发明提供一种阅读辅助系统,包括,
用户数据获取单元,用于接收用户按照预设的词汇输入方式输入的用户词汇信息,并根据用户词汇信息确定出用户的已知词表;
用户个人词表确定单元,用于根据预先构建的总词汇表,以及根据已知词表确定出用户个人词表;
文本推荐单元,用于根据用户个人词表,从预先构建的文本库中筛选出最适合的文本推荐给用户。
进一步地,用户个人词表确定单元,具体用于,将总词汇表中与已知词表重叠的词汇删除,以获得未知词表,继而获得用户个人词表,其中,用户个人词表为已知词表与未知词表的集合。
进一步地,文本推荐单元,具体用于,
根据用户个人词表对文本库中的每一个文本进行比对处理,并针对每一个文本生成一个单篇词表;
对每一个单篇词表进行统计处理,以获得统计数据信息;
根据统计数据信息从文本库中筛选出最适合的文本推荐给用户。
进一步地,统计数据信息包括,生词总量和生词占比率。
进一步地,对于任一个文本,单篇词表的具体生成方式为,
读取文本中的所有词汇,以获得单篇词汇总表;
将单篇词汇总表与用户个人词表中的已知词表进行比对,并将单篇词汇总表中与已知词表重叠的词汇构建为重叠词表;
将单篇词汇总表与重叠词表进行比对,并将单篇词汇总表中与重叠词表相异的词汇构建为生词表;
根据重叠词表和生词表构建单篇词表,其中,单篇词表为重叠词表与生词表的集合。
进一步地,还包括,文本阅读辅助单元,且文本阅读辅助单元包括突出显示模块,注释模块,同义词提示模块,查询模块,笔记模块中的一个或多个的组合;其中,
突出显示模块,用于对重叠词表和/或生词表中的词汇进行突出显示,以及对统计数据信息进行突出显示;
注释模块,用于对生词表中的词汇进行注释;
同义词提示模块,用于根据预先构建的同义词表对生词表中的词汇进行同义词提示;
查询模块,用于对重叠词表和/或生词表中的词汇进行相关信息查询;
笔记模块,用于接收并保存用户针对文本内容输入的笔记信息。
进一步地,文本阅读辅助单元还包括标注模块,用于将生词表中的词汇标注为已知词汇,并将已知词汇添加至已知词表中以对用户个人词表进行更新。
进一步地,还包括文本库更新单元,用于接收用户输入的指定格式的文本以对文本库进行更新。
进一步地,词汇输入方式包括,测试输入方式,直接录入方式,和系统默认录入方式。
另一方面,本发明还提供一种阅读辅助处理方法,包括,
接收用户按照预设的词汇输入方式输入的用户词汇信息,并根据用户词汇信息确定出用户的已知词表;
根据预先构建的总词汇表,以及根据已知词表确定出用户个人词表;
根据用户个人词表,从预先构建的文本库中筛选出最适合的文本推荐给用户。
本发明提供的阅读辅助系统及处理方法,通过提前接收用户词汇信息,确定出用户所具有的词汇水平,继而从预先构建的文本库中筛选出最适合的文本推荐给用户,可根据阅读者的实际情况进行读物推荐,有助于提高阅读者的阅读兴趣。
附图说明
图1是本发明实施例提供的阅读辅助系统的框图;
图2是本发明实施例提供的阅读辅助系统的又一框图;
图3是本发明实施例提供的阅读辅助处理方法的流程。
具体实施方式
下面通过具体的实施例进一步说明本发明,但是,应当理解为,这些实施例仅仅是用于更详细具体地说明之用,而不应理解为用于以任何形式限制本发明。
实施例一
结合图1,本实施例提供的阅读辅助系统,包括,
用户数据获取单元1,用于接收用户按照预设的词汇输入方式输入的用户词汇信息,并根据用户词汇信息确定出用户的已知词表;
用户个人词表确定单元2,用于根据预先构建的总词汇表,以及根据已知词表确定出用户个人词表;
文本推荐单元3,用于根据用户个人词表,从预先构建的文本库中筛选出最适合的文本推荐给用户。
本发明实施例提供的阅读辅助系统,通过提前接收用户词汇信息,确定出用户所具有的词汇水平,继而从预先构建的文本库中筛选出最适合的文本推荐给用户,可根据阅读者的实际情况进行读物推荐,有助于提高阅读者的阅读兴趣。
需要说明的是,本实施例中,总词汇表的构建方法为,先获取词典中的词语及网络词语;再采用预先设定的排序方式(例如,采用词汇的首字母顺序进行排序)对所述词典中的词语和所述网络词语进行排序,并生成总词汇表。需要说明的是,本实施例的词典为较为权威的被大众认可且认可度高的词典。
此外,本实施例中,针对总词汇表中的词汇,增加其同义词,以构建同义词表。
优选地,词汇输入方式包括但不限于,测试输入方式,直接录入方式,和系统默认录入方式。本实施例中的系统可以通过测试的方式(例如,选择题,填空题)来获取用户词汇信息,还可以通过用户直接输入已知词汇的方式来获取用户词汇信息,还可以通过用户选定现有水平(例如,已过英语四级)的方式来默认用户掌握了某一程度(例如,用于四级)的所有词汇信息。
需要说明的是,本实施例对词汇输入方式不作具体限定,可以结合实际需求进行设定。
此外,需要说明的是,本实施例的用户个人词表为一个动态词表,且随着用户不断地进行测试以及数据录入,用户个人词表也将进行不断更新,继而针对每一个文本的单篇词表也将随着发生变化,从而可以实现更加个性化地给用户推荐合适的文本读物。
优选地,用户个人词表确定单元2,具体用于,将总词汇表中与已知词表重叠的词汇删除,以获得未知词表,继而获得用户个人词表,其中,用户个人词表为已知词表与未知词表的集合。本实施例中,用户个人词表的建立,有助于用户对自己的词汇量进行了解,可有助于提高阅读者的阅读自信。
进一步优选地,文本推荐单元3,具体用于,根据用户个人词表对文本库中的每一个文本进行比对处理,并针对每一个文本生成一个单篇词表;对每一个单篇词表进行统计处理,以获得统计数据信息;根据统计数据信息从文本库中筛选出最适合的文本推荐给用户。
进一步优选地,统计数据信息包括,生词总量和生词占比率。具体地,本实施例的系统可以根据用户的实际词汇水平,从文本库中选出最适合的文本进行推荐。更加具体地,可以结合生词总量和生词占比率来从文本库中进行文本的筛选,例如,可以选择生词占比率最小的文本推荐给用户,从而提高用户的阅读兴趣以及阅读自信。需要说明的是,本实施例对统计数据信息不作具体限定,可以结合实际需求进行选取。
具体地,对于任一个文本,单篇词表的具体生成方式为,
读取文本中的所有词汇,以获得单篇词汇总表;
将单篇词汇总表与用户个人词表中的已知词表进行比对,并将单篇词汇总表中与已知词表重叠的词汇构建为重叠词表;
将单篇词汇总表与重叠词表进行比对,并将单篇词汇总表中与重叠词表相异的词汇构建为生词表;
根据重叠词表和生词表构建单篇词表,其中,单篇词表为重叠词表与生词表的集合。
本实施例中,对于文本库中的任选的一个文本,先读取出该文本中的所有词汇,并将该文本中的所有词汇构建为单篇词汇总表;再将该单篇词汇总表与已知词表进行比较,得到两个表中的重叠词汇(即,相同的词汇),并将所有重叠的词汇构建出一个重叠词表;之后,再将单篇词汇总表与重叠词表进行比较,得到两个表中的不一致的词汇,并将所有这些不一致的词汇构建出一个生词表;最后,重叠词表与生词表的集合,即为单篇词表。继而,通过对文本库中的每一个文本所对应的单篇词表进行数据统计,以获得数据统计信息,以实现将适合的文本读物推荐给用户。
进一步优选地,如图2所示地,还包括文本阅读辅助单元4,且所述文本阅读辅助单元4包括突出显示模块401,注释模块402,同义词提示模块403,查询模块404,笔记模块405中的一个或多个的组合;其中,
突出显示模块401,用于对重叠词表和/或生词表中的词汇进行突出显示,以及对统计数据信息进行突出显示;
注释模块402,用于对生词表中的词汇进行注释;
同义词提示模块403,用于根据预先构建的同义词表对生词表中的词汇进行同义词提示;
查询模块404,用于对重叠词表和/或生词表中的词汇进行相关信息查询;
笔记模块405,用于接收并保存用户针对文本内容输入的笔记信息。
本实施例中,文本阅读辅助单元4的作用在于辅助用户进行文本的阅读,以提高阅读效率。具体地,突出显示模块401对重叠词表和/或生词表中的词汇进行突出显示的方式包括但不限于,下划线,字体颜色变化,字体粗细变化,数字标识。此外,本实施例对统计数据信息进行突出显示时,对统计数据信息的显示位置不做具体限定。此外,注释模块402对生词表中的词汇进行注释时,具体注释位置包括但不限于,词汇的上方,下方,左侧,右侧,以及文章的前部,后部,且注释内容包括但不限于释义。此外,查询模块404可以查询到的相关信息包括但不限于,例句,双语/多语释义,拼音/音标。
需要说明的是,本实施例提供的辅助阅读系统不必须同时具备以上所有功能,可以只包括突出显示模块401,注释模块402,同义词提示模块403,查询模块404,笔记模块405中的一个或多个的组合,本实施例不做具体限定。
进一步优选地,文本阅读辅助单元4还包括标注模块406,用于将生词表中的词汇标注为已知词汇,并将已知词汇添加至已知词表中以对用户个人词表进行更新。本实施例中,用户可以在进行文本阅读时直接将某个词汇标注为已知词汇,继而系统将自动对用户个人词表进行更新。
进一步优选地,还包括文本库更新单元5,用于接收用户输入的指定格式的文本以对文本库进行更新。本实施例中的文本库中的文本的数量以及类型可以根据实际情况进行设定,本实施例不作具体限定。
实施例二
结合图3,本实施例提供一种阅读辅助处理方法,包括,
步骤S1:接收用户按照预设的词汇输入方式输入的用户词汇信息,并根据用户词汇信息确定出用户的已知词表;
步骤S2:根据预先构建的总词汇表,以及根据已知词表确定出用户个人词表;
步骤S3:根据用户个人词表,从预先构建的文本库中筛选出最适合的文本推荐给用户。
本发明实施例提供的阅读辅助处理方法,通过提前接收用户词汇信息,确定出用户所具有的词汇水平,继而从预先构建的文本库中筛选出最适合的文本推荐给用户,可根据阅读者的实际情况进行读物推荐,有助于提高阅读者的阅读兴趣。
尽管本发明已进行了一定程度的描述,明显地,在不脱离本发明的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本发明不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。
Claims (10)
1.一种阅读辅助系统,其特征在于,包括:
用户数据获取单元,用于接收用户按照预设的词汇输入方式输入的用户词汇信息,并根据所述用户词汇信息确定出用户的已知词表;
用户个人词表确定单元,用于根据预先构建的总词汇表,以及根据所述已知词表确定出用户个人词表;
文本推荐单元,用于根据所述用户个人词表,从预先构建的文本库中筛选出最适合的文本推荐给用户。
2.根据权利要求1所述的阅读辅助系统,其特征在于,所述用户个人词表确定单元,具体用于,将所述总词汇表中与所述已知词表重叠的词汇删除,以获得未知词表,继而获得用户个人词表,其中,所述用户个人词表为所述已知词表与所述未知词表的集合。
3.根据权利要求2所述的阅读辅助系统,其特征在于,所述文本推荐单元,具体用于,根据所述用户个人词表对所述文本库中的每一个文本进行比对处理,并针对每一个文本生成一个单篇词表;
对所述每一个单篇词表进行统计处理,以获得统计数据信息;
根据所述统计数据信息从所述文本库中筛选出最适合的文本推荐给用户。
4.根据权利要求3所述的阅读辅助系统,其特征在于,所述统计数据信息包括,生词总量和生词占比率。
5.根据权利要求4所述的阅读辅助系统,其特征在于,对于任一个文本,所述单篇词表的具体生成方式为,
读取文本中的所有词汇,以获得单篇词汇总表;
将所述单篇词汇总表与所述用户个人词表中的所述已知词表进行比对,并将所述单篇词汇总表中与所述已知词表重叠的词汇构建为重叠词表;
将所述单篇词汇总表与所述重叠词表进行比对,并将所述单篇词汇总表中与所述重叠词表相异的词汇构建为生词表;
根据所述重叠词表和所述生词表构建单篇词表,其中,所述单篇词表为所述重叠词表与所述生词表的集合。
6.根据权利要求5所述的阅读辅助系统,其特征在于,还包括文本阅读辅助单元,且所述文本阅读辅助单元包括突出显示模块,注释模块,同义词提示模块,查询模块,笔记模块中的一个或多个的组合;其中,
所述突出显示模块,用于对所述重叠词表和/或生词表中的词汇进行突出显示,以及对所述统计数据信息进行突出显示;
所述注释模块,用于对所述生词表中的词汇进行注释;
所述同义词提示模块,用于根据预先构建的同义词表对所述生词表中的词汇进行同义词提示;
所述查询模块,用于对所述重叠词表和/或生词表中的词汇进行相关信息查询;
所述笔记模块,用于接收并保存用户针对文本内容输入的笔记信息。
7.根据权利要求6所述的阅读辅助系统,其特征在于,所述文本阅读辅助单元还包括标注模块,用于将所述生词表中的词汇标注为已知词汇,并将所述已知词汇添加至所述已知词表中以对所述用户个人词表进行更新。
8.根据权利要求1所述的阅读辅助系统,其特征在于,还包括文本库更新单元,用于接收用户输入的指定格式的文本以对所述文本库进行更新。
9.根据权利要求1所述的阅读辅助系统,其特征在于,所述词汇输入方式包括,测试输入方式,直接录入方式,和系统默认录入方式。
10.一种阅读辅助处理方法,其特征在于,包括:
接收用户按照预设的词汇输入方式输入的用户词汇信息,并根据所述用户词汇信息确定出用户的已知词表;
根据预先构建的总词汇表,以及根据所述已知词表确定出用户个人词表;
根据所述用户个人词表,从预先构建的文本库中筛选出最适合的文本推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710550246.XA CN107391624A (zh) | 2017-07-07 | 2017-07-07 | 一种阅读辅助系统及处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710550246.XA CN107391624A (zh) | 2017-07-07 | 2017-07-07 | 一种阅读辅助系统及处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107391624A true CN107391624A (zh) | 2017-11-24 |
Family
ID=60334359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710550246.XA Pending CN107391624A (zh) | 2017-07-07 | 2017-07-07 | 一种阅读辅助系统及处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107391624A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109086420A (zh) * | 2018-08-07 | 2018-12-25 | 何杰成 | 选择阅读材料的方法、装置以及存储介质 |
CN111541904A (zh) * | 2020-04-15 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 直播过程中的信息提示方法、装置、设备及存储介质 |
CN113034995A (zh) * | 2021-04-26 | 2021-06-25 | 读书郎教育科技有限公司 | 一种学生平板生成听写内容的方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902700B (zh) * | 2012-04-05 | 2015-02-25 | 中国人民解放军国防科学技术大学 | 基于在线增量演化主题模型的软件自动分类方法 |
CN102982072B (zh) * | 2012-10-29 | 2016-05-04 | 北京工商大学 | 一种可视化概念检测器及构造语义场的方法 |
CN105654785A (zh) * | 2016-03-18 | 2016-06-08 | 上海语知义信息技术有限公司 | 个性化外语口语学习系统及方法 |
CN106897950A (zh) * | 2017-01-16 | 2017-06-27 | 北京师范大学 | 一种基于单词认知状态模型适应性学习系统及方法 |
-
2017
- 2017-07-07 CN CN201710550246.XA patent/CN107391624A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902700B (zh) * | 2012-04-05 | 2015-02-25 | 中国人民解放军国防科学技术大学 | 基于在线增量演化主题模型的软件自动分类方法 |
CN102982072B (zh) * | 2012-10-29 | 2016-05-04 | 北京工商大学 | 一种可视化概念检测器及构造语义场的方法 |
CN105654785A (zh) * | 2016-03-18 | 2016-06-08 | 上海语知义信息技术有限公司 | 个性化外语口语学习系统及方法 |
CN106897950A (zh) * | 2017-01-16 | 2017-06-27 | 北京师范大学 | 一种基于单词认知状态模型适应性学习系统及方法 |
Non-Patent Citations (1)
Title |
---|
王光华: "阅读材料生词比例与词汇习得效率关系研究", 《高等财经教育研究》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109086420A (zh) * | 2018-08-07 | 2018-12-25 | 何杰成 | 选择阅读材料的方法、装置以及存储介质 |
CN109086420B (zh) * | 2018-08-07 | 2022-04-15 | 深圳市知育科技有限公司 | 选择阅读材料的方法、装置以及存储介质 |
CN111541904A (zh) * | 2020-04-15 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 直播过程中的信息提示方法、装置、设备及存储介质 |
CN111541904B (zh) * | 2020-04-15 | 2024-03-22 | 腾讯科技(深圳)有限公司 | 直播过程中的信息提示方法、装置、设备及存储介质 |
CN113034995A (zh) * | 2021-04-26 | 2021-06-25 | 读书郎教育科技有限公司 | 一种学生平板生成听写内容的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Habash et al. | MADA+ TOKAN: A toolkit for Arabic tokenization, diacritization, morphological disambiguation, POS tagging, stemming and lemmatization | |
JP3981734B2 (ja) | 質問応答システムおよび質問応答処理方法 | |
CN101539907B (zh) | 词性标注模型训练装置、词性标注系统及其方法 | |
CN111897967A (zh) | 一种基于知识图谱和社交媒体的医疗问诊推荐方法 | |
US9594742B2 (en) | Method and apparatus for matching misspellings caused by phonetic variations | |
CN104239289B (zh) | 音节划分方法和音节划分设备 | |
D’Arcy | Contextualizing St. John’s youth English within the Canadian quotative system | |
Masrai et al. | How many words do you need to speak Arabic? An Arabic vocabulary size test | |
CN107391624A (zh) | 一种阅读辅助系统及处理方法 | |
CN107402933A (zh) | 实体多音字消歧方法和实体多音字消歧设备 | |
Mustafa et al. | Kurdish stemmer pre-processing steps for improving information retrieval | |
JP6626917B2 (ja) | 英語の音節計算法に基づいた可読性評価方法及びシステム | |
CN110827938A (zh) | 一种自动生成病历文书模板的方法和系统 | |
CN103608805B (zh) | 辞典产生装置及方法 | |
Willoughby et al. | Quantifying scientific jargon | |
Al-Khalil et al. | A large-scale leveled readability lexicon for Standard Arabic | |
Deutsch et al. | Formal and semantic effects of morphological families on word recognition in Hebrew | |
KR20210000146A (ko) | 문장 데이터베이스를 이용한 작문 보조 시스템 | |
Gimenes et al. | Spelling error patterns in Brazilian Portuguese | |
CN107894977A (zh) | 结合兼类词词性消歧模型和字典的越南语词性标记方法 | |
Azmi et al. | Modern information retrieval in Arabic–catering to standard and colloquial Arabic users | |
Lee | Defining correctness: the tale of the Contemporary Chinese Dictionary | |
KR20100028222A (ko) | 도서지수 부여 시스템의 도서지수 산출방법 | |
Aksan et al. | Building a national corpus of Turkish: Design and implementation | |
Wang et al. | Word intuition agreement among Chinese speakers: a Mechanical Turk-based study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171124 |
|
RJ01 | Rejection of invention patent application after publication |