CN101196874B - 一种机器辅助阅读的方法和装置 - Google Patents
一种机器辅助阅读的方法和装置 Download PDFInfo
- Publication number
- CN101196874B CN101196874B CN2007101256104A CN200710125610A CN101196874B CN 101196874 B CN101196874 B CN 101196874B CN 2007101256104 A CN2007101256104 A CN 2007101256104A CN 200710125610 A CN200710125610 A CN 200710125610A CN 101196874 B CN101196874 B CN 101196874B
- Authority
- CN
- China
- Prior art keywords
- speech
- phrase
- word
- module
- mark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明实施例公开了一种机器辅助阅读方法和装置。该方法包括:在正在阅读的文本中选择字、词或短语;获取该字、词或短语的注释内容,所述注释内容包括翻译和/或注解;根据获得的注释内容标注该字、词或短语;将所述注释内容保存于正在阅读的文本中,同时对正在阅读的文本的全文进行搜索,若发现文档中的其他位置存在同样的字、词或短语,则进行标注;当用户再次遇到已经标注过的字、词或短语时,如果光标停留在该字、词或短语上,则自动显示之前保存的注释内容。采用本发明实施例的机器辅助阅读方法,将生词的标注信息自动保存、固化于文档中,避免用户手工标注、或反复选中某一生词,方便阅读。
Description
技术领域
本发明涉及一种机器辅助阅读的方法和装置。
背景技术
随着因特网的快速发展,遍布全世界的计算机用户正在越来越多地面对非母语写成的文字材料,或者其他原先难以理解的书面材料。许多用户对非母语或者相关材料完全不懂。即使用户进行了一些相关或类似的培训,该用户也拄往难以阅读和理解这些材料的确切含义。考虑到某些用户访问以外语或专业术语写成的网页或其它电子文档的情况。这些用户可能曾经接受过某些正规的培训,但是这种培训往往不足以使他完全地阅读和理解以外语或专业术语写成的、特定的单词、短语或者语句。这种情况仅仅是用于说明这一点的一个例子而已。这个问题在跨越其它语言边界或行业边界时也是存在的。
目前的一种情况是,人们在电子设备中阅读其他语言的时,经常遇到不认识的词语,或借助其他工具进行查找后,再手工将释义标识在不认识词的左右或者上下;或通过选中生词,利用工具软件进行自动释义,但该释义不能固化在文档中,用户每次遇到该生词时都需选中该生词才可获得其释义(如金山词霸),这些方案对用户来说,实际上都不太很方便。
发明内容
本发明实施例的目的在于提供一种机器辅助阅读方法和装置,可以解决现有技术方案操作上的烦琐的问题,以方便用户阅读。
本发明实施例提供的一种机器辅助阅读方法,包括:在正在阅读的文本中选择字、词或短语;获取该字、词或短语的注释内容,所述注释内容包括翻译和/或注解;根据获得的注释内容标注该字、词或短语;将所述注释内容保存于正在阅读的文本中,同时对正在阅读的文本的全文进行搜索,若发现文档中的其他位置存在同样的字、词或短语,则进行标注;当用户再次遇到已经标注过的字、词或短语时,如果光标停留在该字、词或短语上,则自动显示之前保存的注释内容。
本发明实施例提供的一种机器辅助阅读装置,包括取词模块、注释获取模块、标注模块、存储模块、搜索模块、注释显示模块,其中,
取词模块,用于引导用户在正在阅读的文本中选择想要注释的字、词或短语;
注释获取模块,根据所述取词模块选定的字、词或短语,获取对该字、词或短语的注释内容,所述注释内容包括翻译和/或注解;
标注模块,用于将所述注释获取模块获取的注释内容,标注在所述取词模块选择的字、词或短语附近;
存储模块,用于保存所述注释获取模块获取的与取词模块所选定的字、词或短语对应的注释内容;
搜索模块,用于搜索正在阅读的文本的全文中相同的字、词或短语,并与所述标注模块关联,或者并使得所述标注模块对这些相同的字、词或短语标注注释内容,并调用所述存储模块对这些相同的字、词或短语的注释内容进行存储;
注释显示模块,用于当用户光标选中某个字、词或短语时,将保存的对应注释内容显示在该字、词或短语附近,呈现给用户。
采用本发明实施例的机器辅助阅读方法和装置,将生词的标注信息自动保存、固化于文档中,避免用户手工标注、或反复选中某一生词,方便阅读。
附图说明
图1是本发明实施例的机器辅助阅读方法流程示意图。
图2是本发明实施例的机器辅助阅读方法的语言选择示例。
图3是本发明实施例的机器辅助阅读装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的机器辅助阅读方法的一个实施方式如图1所示。该方法包括如下步骤:
S1、选择字、词或短语
用户在阅读非母语的文本时,可能会遇到不认识的字、词或短语,当第一次遇到这些字、词或短语时,用户可以选中不认识的字、词或短语,可以考虑借助工具,比如系统工具或金山词霸之类的翻译工具,来完成第一次注解和翻译。当然也可以采用传统的字典、辞典等工具手工完成第一次注解和翻译。另外,用户也可能是在阅读不熟悉的领域的文本,比如电气工程师在阅读化学方面的论文时,可能会遇到不少化学领域的专业术语,即使用母语写出,该电气工程师来说可能仍然难以理解,而需要对其意义进行详细注解,也可以称为翻译,这时,也可以采用上述方法,用户选中该字、词或短语,利用系统工具、金山词霸或者外部的字典、辞典来完成第一次注解和翻译。上述选择可以是用于选中,也可以是将光标直接放置在这些字、词或短语上,由系统确定是否用户选中的字、词或短语,并调用工具来注释。
S2、获取该字、词或短语的注释内容
获取该字、词或短语的注释内容的过程,可以通过系统自带的翻译工具或者库完成,也可以借助金山词霸等工具完成,也可以由用户手工从字典、辞典甚至在线检索完成。
S3、根据获得的注解和翻译内容标注该字、词或短语
根据系统提示标注拼音、标注音标、标注英文、标注法文等提示进行有选择的标注;该提示可能是系统自带的翻译工具或者金山词霸之类的翻译工具提供的翻译、注解,也可以是用户自己查字典、辞典,甚至网络获取的相关注解和翻译内容,将该内容标注在该字、词或短语上或该字、词或短语附近的方式也是可选的,比如可以由用户手工输入,也可以由软件来自动完成。
当获得该字、词或短语的注解或翻译后,用户可以选择标注类型。该标注类型包括:显式标注、隐式标注。
当用户选择一种标注类型后,系统将根据用户选择的标注类型确定如何标注。如果选择显示标注,系统将选择标注的放置位置,该放置位置也可以由用户设定或者选择,或重组文档的格式,或将标注放置在页面的空白处;所述重组文档的格式包括在生词后空若干字符或空一行以放置标注。
若选择隐式标注,则可以将获得的注解或解释放置在正在阅读的文本的某个特定位置,并以隐藏的方式存放,即,对用户来说,是不可见的,但是,一旦用户将光标放置在该注解对应的字、词、短语上时,则会以注解的方式显示给用户。如果自动执行,没有用户手工参与,则标注语言类型的多少以及用户可以选择的内容与系统是否有该类型的词典相关。
另外,用户也可以选择标注的语言类型,比如对于英文文本,用户可以选择显示的注释为汉语、俄语、法语等等,如图2所示。对于词的意义注解,也可以选择领域,比如某些词在不同领域的意义可能有所差异,用户就可以根据正在阅读的文本所在的领域选择特定的领域的注释,比如选择通信领域、电气领域或其他领域等。
S4、将所述标注保存于正在阅读的文本中
同时,系统还可对整篇文档进行搜索,查找该生词是否存在于文档中的其它位置,若存在,则对其进行标注或直接引用之前保存的注释。
S5、再次显示注释
当用户第二次遇到已经注解过的字、词或短语时,如果光标停留在该字、词或短语上,自动显示之前的注释,可以通过重新注释,也可以是直接调用之前保存的注释。
采用本发明实施例的机器辅助阅读方法,将生词的标注信息自动保存、固化于文档中,避免用户手工标注、或反复选中某一生词,方便阅读。
另外,在本实施例中,还可包括步骤:对全文进行搜索,若发现文档中的其他位置也存在同样的生词,则同时进行标注。
如图3所示,是本发明实施例的机器辅助阅读装置的结构示意图。如图3所示,该机器辅助阅读装置包括:取词模块、注释获取模块、标注模块、存储模块、搜索模块、注释重现模块,其中,
取词模块,可以是目前较为常见的光标指示器,通过在显示装置上显示光标从而引导用户选择想要注释的字、词或短语,通过光标的移动,从而确定想要的字、词或短语,即完成取词的过程;
注释获取模块,根据取词模块取词过程中选定的字、词或短语,也即用户选中的字、词或短语,去获取对该字、词或短语的注释内容,获取该字、词或短语的注释内容的过程,可以通过系统自带的翻译工具或者库完成,也可以借助金山词霸等工具完成,也可以由用户手工从字典、辞典甚至在线检索完成;
标注模块,用于将注释获取模块获取的注释内容,标注在取词模块选择的字、词或短语附近;
存储模块,用于将注释获取模块获取的与取词模块所选定的字、词或短语对应的注释内容保存起来,可以保存在文档内,也可以保存在系统的某个存储装置内;
搜索模块,用于在前述标注完成以后,搜索全文中相同的字、词或短语,并与标注模块关联,或使得标注模块对这些相同的字、词或短语注释,并调用存储模块对其存储。当然,此处也可以不保存,仅仅关联该注释和字、词或短语,待用户选中的时候对其联想,根据关联获取注释;
注释显示模块,用于当用户光标选中某个字、词或短语时,将前述获取或者保存的对应注释内容显示在该字、词或短语附近,呈现给用户。
本实施例的机器辅助阅读装置,除了包括上述模块以外,还可以包括标注模式选择模块和显示模式选择模块,
当获得该字、词或短语的注解或翻译后,用户可以通过标注模式选择模块选择标注类型,即标注模式。该标注类型包括:显式标注、隐式标注。
当用户选择一种标注类型后,系统将根据用户选择的标注类型确定如何标注。如果选择显示标注,系统将选择标注的放置位置,该放置位置也可以由用户设定或者选择,或重组文档的格式,或将标注放置在页面的空白处;所述重组文档的格式包括在生词后空若干字符或空一行以放置标注。
若选择隐式标注,则可以将获得的注解或解释放置在正在阅读的文本的某个特定位置,并以隐藏的方式存放,即,对用户来说,是不可见的,但是,一旦用户将光标放置在该注解对应的字、词、短语上时,则会以注解的方式显示给用户。如果自动执行,没有用户手工参与,则标注语言类型的多少以及用户可以选择的内容与系统是否有该类型的词典相关。
另外,用户也可以选择标注的语言类型,比如对于英文文本,用户可以选择显示的注释为汉语、俄语、法语等等,如图2所示。对于词的意义注解,也可以选择领域,比如某些词在不同领域的意义可能有所差异,用户就可以根据正在阅读的文本所在的领域选择特定的领域的注释,比如选择通信领域、电气领域或其他领域等。
显示模式选择模块,用于为用户提供显示模式选择菜单,比如同一个字、词可能有多种注释,尤其是名词在不同技术领域可能有不同的注释内容,显示选择模块提供了注释内容的领域选择或者语种的选择菜单,为用户提供方便,后续还可以将用户的选择的使用习惯存储在存储模块中,以便后续自动为用户提供想要的注释内容。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种机器辅助阅读方法,其特征在于,包括:
在正在阅读的文本中选择字、词或短语;
获取该字、词或短语的注释内容,所述注释内容包括翻译和/或注解;
根据获得的注释内容标注该字、词或短语;
将所述注释内容保存于正在阅读的文本中,同时对正在阅读的文本的全文进行搜索,若发现文档中的其他位置存在同样的字、词或短语,则进行标注;
当用户再次遇到已经标注过的字、词或短语时,如果光标停留在该字、词或短语上,则自动显示之前保存的注释内容。
2.如权利要求1所述的方法,其特征在于,所述选择字、词或短语的方法是:将光标停留在要求注释的字、词或短语上。
3.如权利要求1所述的方法,其特征在于,所述根据获得的注释内容标注该字、词或短语的方式包括显式标注和隐式标注。
4.如权利要求3所述的方法,其特征在于,所述标注的步骤包括:根据选择的标注方式确定标注的位置。
5.如权利要求4所述的方法,其特征在于,所述标注的位置包括:在生词后空若干字符或空一行以放置标注,或将标注放置在页面的空白处。
6.如权利要求1所述的方法,其特征在于,所述注释内容是语言翻译,在获取该字、词或短语的注释内容的步骤之前,还包括选择语言类型的步骤。
7.一种机器辅助阅读装置,其特征在于,包括:取词模块、注释获取模块、标注模块、存储模块、搜索模块、注释显示模块,其中,
取词模块,用于引导用户在正在阅读的文本中选择想要注释的字、词或短语;
注释获取模块,根据所述取词模块选定的字、词或短语,获取对该字、词或短语的注释内容,所述注释内容包括翻译和/或注解;
标注模块,用于将所述注释获取模块获取的注释内容,标注在所述取词模块选择的字、词或短语附近;
存储模块,用于保存所述注释获取模块获取的与取词模块所选定的字、词或短语对应的注释内容;
搜索模块,用于搜索正在阅读的文本的全文中相同的字、词或短语,并与所述标注模块关联,或者并使得所述标注模块对这些相同的字、词或短语标注注释内容,并调用所述存储模块对这些相同的字、词或短语的注释内容进行存储;
注释显示模块,用于当用户光标选中某个字、词或短语时,将保存的对应注释内容显示在该字、词或短语附近,呈现给用户。
8.根据权利要求7所述的机器辅助阅读装置,其特征在于:还包括标注模式选择模块和显示模式选择模块,
所述标注模式选择模块,用于为用户提供标注模式的选择;
所述显示模式选择模块,用于为用户提供显示模式选择菜单。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101256104A CN101196874B (zh) | 2007-12-28 | 2007-12-28 | 一种机器辅助阅读的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101256104A CN101196874B (zh) | 2007-12-28 | 2007-12-28 | 一种机器辅助阅读的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101196874A CN101196874A (zh) | 2008-06-11 |
CN101196874B true CN101196874B (zh) | 2010-06-23 |
Family
ID=39547301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101256104A Active CN101196874B (zh) | 2007-12-28 | 2007-12-28 | 一种机器辅助阅读的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101196874B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346731B (zh) | 2010-08-02 | 2014-09-03 | 联想(北京)有限公司 | 一种文件处理方法及文件处理装置 |
CN102779117A (zh) * | 2011-05-10 | 2012-11-14 | 北京大学 | 一种电子文档处理方法和装置 |
CN102508699A (zh) * | 2011-09-30 | 2012-06-20 | 宇龙计算机通信科技(深圳)有限公司 | 终端和数据处理方法 |
CN102929859B (zh) * | 2012-09-27 | 2015-07-08 | 东莞宇龙通信科技有限公司 | 辅助阅读的方法及装置 |
JP2014186379A (ja) * | 2013-03-21 | 2014-10-02 | Toshiba Corp | アノテーション検索装置、方法、及びプログラム |
CN107357768A (zh) * | 2017-07-26 | 2017-11-17 | 王�华 | 一种进行生词标注的方法及系统 |
CN108630032A (zh) * | 2017-08-21 | 2018-10-09 | 淄博职业学院 | 一种英语教学辅助阅读装置及其使用方法 |
CN109683773B (zh) * | 2017-10-19 | 2021-01-22 | 北京国双科技有限公司 | 语料标注方法和装置 |
CN108595445A (zh) * | 2018-04-23 | 2018-09-28 | Oppo广东移动通信有限公司 | 翻译方法、装置及终端 |
CN110231907A (zh) * | 2019-06-19 | 2019-09-13 | 京东方科技集团股份有限公司 | 电子阅读的显示方法、电子设备、计算机设备及介质 |
CN110347978B (zh) * | 2019-07-02 | 2022-09-16 | 深圳市数字星河科技有限公司 | 一种电子书辅助阅读的方法 |
CN112800781A (zh) * | 2021-01-26 | 2021-05-14 | 浙江香侬慧语科技有限责任公司 | 一种文言文翻译的方法、装置及存储介质 |
CN113657113B (zh) * | 2021-08-24 | 2024-08-02 | 北京字跳网络技术有限公司 | 文本处理方法、装置和电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1609835A (zh) * | 2003-10-21 | 2005-04-27 | 国际商业机器公司 | 电子文档的注释方法、装置和系统 |
-
2007
- 2007-12-28 CN CN2007101256104A patent/CN101196874B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1609835A (zh) * | 2003-10-21 | 2005-04-27 | 国际商业机器公司 | 电子文档的注释方法、装置和系统 |
Non-Patent Citations (2)
Title |
---|
童旭霞,王兰富.文本替换全攻略.电脑爱好者 5.2004,(5),46. |
童旭霞,王兰富.文本替换全攻略.电脑爱好者 5.2004,(5),46. * |
Also Published As
Publication number | Publication date |
---|---|
CN101196874A (zh) | 2008-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101196874B (zh) | 一种机器辅助阅读的方法和装置 | |
US8887044B1 (en) | Visually distinguishing portions of content | |
Kjeldsen | Rhetorical audience studies and reception of rhetoric: Exploring audiences empirically | |
CN103026318A (zh) | 输入法编辑器 | |
JP2008516297A5 (zh) | ||
US9449526B1 (en) | Generating a game related to a digital work | |
US9639518B1 (en) | Identifying entities in a digital work | |
US20150024351A1 (en) | System and Method for the Relevance-Based Categorizing and Near-Time Learning of Words | |
Müller et al. | Multi-level annotation in MMAX | |
Borodin et al. | The HearSay non-visual web browser | |
KR20080042877A (ko) | 전자 문서를 읽기 모드로 디스플레이하는 방법 | |
US9196251B2 (en) | Contextual conversion platform for generating prioritized replacement text for spoken content output | |
Smith et al. | Corpus tools and methods, today and tomorrow: Incorporating linguists’ manual annotations | |
US9141867B1 (en) | Determining word segment boundaries | |
Leporini et al. | Designing search engine user interfaces for the visually impaired | |
JPH05324702A (ja) | 情報処理装置 | |
CN107077515A (zh) | 显示控制装置、显示控制方法及显示控制程序 | |
Borgia et al. | Towards improving the e-learning experience for deaf students: e-LUX | |
US8275620B2 (en) | Context-relevant images | |
JP2018155808A (ja) | 学習支援装置、学習支援方法及びプログラム | |
KR101151886B1 (ko) | 어학 학습용 전자책 시스템 및 그 제공 방법 | |
Toyoda | Usage and efficacy of electronic dictionaries for a language without word boundaries | |
Bradford et al. | HTML5 mastery: Semantics, standards, and styling | |
CN113535017B (zh) | 一种绘本文件的处理、同步显示方法、装置及存储介质 | |
Imoto et al. | A multi modal supporting tool for multi lingual communication by inducing partner's reply |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190118 Address after: 518057 Desai Science and Technology Building, 9789 Shennan Avenue, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, 17th Floor (15th Floor of Natural Floor) 1702-1703 Patentee after: Shenzhen acoustic Cmi Holdings Ltd Address before: 518057 High-tech Industrial Park, Nanshan District, Shenzhen City, Guangdong Province, No. 2 Cool Information Port, Mengxi Road (Building 1) Patentee before: Yulong Computer and Communication Sci. & Tech. (Shenzhen) Co., Ltd. |
|
TR01 | Transfer of patent right |