CN111985189A - 适用于深度学习及思考的模块化笔记系统及电子转换方法 - Google Patents
适用于深度学习及思考的模块化笔记系统及电子转换方法 Download PDFInfo
- Publication number
- CN111985189A CN111985189A CN202010844893.3A CN202010844893A CN111985189A CN 111985189 A CN111985189 A CN 111985189A CN 202010844893 A CN202010844893 A CN 202010844893A CN 111985189 A CN111985189 A CN 111985189A
- Authority
- CN
- China
- Prior art keywords
- area
- note
- text
- electronic
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013135 deep learning Methods 0.000 title claims abstract description 23
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 20
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了适用于深度学习及思考的模块化笔记系统及电子转换方法,涉及笔记记录技术领域,因现有技术中纸质版笔记的电子化通常只能通过扫描转换为电子版,且扫描件只能展现原貌,无法对其内部逻辑进行分析提炼。本申请设计了适用于深度学习及思考的模块化笔记系统及电子转换方法,结合ocr技术快速提炼信息,对于笔记内容进行电子化。通过标识线及辅助线,加强计算机系统对于逻辑框架的识别能力。
Description
技术领域
本发明涉及笔记记录技术领域,特别涉及适用于深度学习及思考的模块化笔记系统及电子转换方法。
背景技术
现阶段对于深度学习及思考的笔记记录方法过于片面与单一,对于广大学生及脑力工作这来说,笔记记载效率低,笔记回顾频率低、笔记记录凌乱、逻辑不够突出。
同时,纸质版笔记的电子化通常只能通过扫描转换为电子版,且扫描件只能展现原貌,无法对其内部逻辑进行分析提炼。因此本申请设计了适用于深度学习及思考的模块化笔记系统及电子转换方法,结合ocr技术快速提炼信息,对于笔记内容进行电子化。通过标识线及辅助线,加强计算机系统对于逻辑框架的识别能力。
发明内容
本发明的目的在于提供适用于深度学习及思考的模块化笔记系统及电子转换方法,结合ocr技术快速提炼信息,对于笔记内容进行电子化。通过标识线及辅助线,加强计算机系统对于逻辑框架的识别能力。
本发明提供了适用于深度学习及思考的模块化笔记系统,包括:
纸质模块化笔记:将纸质笔记进行模块化区域的划分,并设置主坐标轴、标识线和识别标;
采集模块:采集纸质模块化笔记表面的书写内容;
处理模块:获取采集模块采集到的内容,并根据主坐标轴、标识线和识别标进行内容区域的识别;
转换模块:根据识别结果进行电子版格式的转换;
显示模块:用于展示转换后的电子笔记。
较佳的,所述纸质模块化笔记包括:
时间记录区域:用于记载记录时间、变更时间和批注时间;
标题记录区域:用于记载标题、副标题和关键词;
时间、标题辅助线:用于分隔开时间记录区域和标题记录区域;
正文区:用于书写正文,并在正文区设置网格线;
正文区域标题辅助线:设置在正文区内宽度依次递减的竖线,用于对应转换为大纲中的多级标题;
识别角标:包括时间识别标、标题识别标和PPT识别标,选中所述时间识别标用于确定时间位置和时间文本,选中所述标题识别标用于确定标题位置和标题文本,选中所述PPT识别标用于标识是否转换为PPT格式。
较佳的,所述纸质模块化笔记还包括费曼区和线索区,采用费曼区分割线将所述费曼区与正文区划分,采用费曼区识别线标识费曼区的位置,所述费曼区用于书写提示词作为单独的题词板或记录背诵讲义,所述线索区用于书写批注。
较佳的,所述纸质模块化笔记采用Markdown的标记语言。
较佳的,多个所述正文区域标题辅助线用于区分多级标题,并对应转换为电子大纲。
较佳的,适用于深度学习及思考的模块化笔记系统的电子转换方法,其步骤为:
S1:设置纸质的模块化笔记模板;
S2:采集纸质模块化笔记表面的书写内容,并根据纸质模块化笔记内设置坐标轴进行文本模块的定位和识别;
S3:利用OCR技术自动识别并判断标题识别线下方的文本正文区,并识别是否存在多级标题,若存在,则进行电子大纲的转换;
S4:判断是否存在PPT标识,若存在则将纸质模块化笔记转换为电子PPT格式,然后判断是否存在附属挂件标识,若存在附属挂件标识则确定挂件位置,提取挂件内容转换至电子PPT的相应位置,若不存在附属挂件标识,则将正文填转换为电子PPT的文稿,将备注区转换为电子PPT的备注,将费曼区转换为电子PPT的注释文稿;
S5:若不存在PPT标识,则进行标准格式的识别与转换,然后判断是否存在附属挂件标识,若存在附属挂件标识则确定挂件位置,提取挂件内容转换至电子模板的相应位置,若不存在附属挂件标识,则依次提取正文、线索区和费曼区,将其转换至电子模板的相应位置。
与现有技术相比,本发明具有如下显著优点:
本发明提供的适用于深度学习及思考的模块化笔记系统及电子转换方法,提供了纸质版笔记记录方法,根据纸质版笔记可快速生成电子版笔记,用户可在规范化掌握使用纸质版笔记记录方法后,计算机识别对应的功能区后可快速将其生成思维导图、电子表格、PPT、文稿等电子文档。其大纲视图的结构对于深度学习及思考具有不可比拟的优势,其主要体现为逻辑清晰,格式工整。基于标题辅助线,可快速定位至适当级别标题,每级标题递增缩进,内容位置与标题等级保持一致,其最终效果则排列为大纲视图。在顶格使用“markdown语法”书写且“markdown专用字符”的情况下,使用加粗笔迹书写则计算机经识别后直接输出为markdown文稿或预经设置的大纲文稿。
附图说明
图1为本发明实施例提供的适用于深度学习及思考的模块化笔记系统及电子转换方法的纸质笔记区域图;
图2为本发明实施例提供的适用于深度学习及思考的模块化笔记系统及电子转换方法的纸质笔记结构图;
图3为本发明实施例提供的适用于深度学习及思考的模块化笔记系统及电子转换方法的流程图。
具体实施方式
下面结合本发明中的附图,对本发明实施例的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
参照图1-3,本发明提供了适用于深度学习及思考的模块化笔记系统,包括:
纸质模块化笔记:将纸质笔记进行模块化区域的划分,并设置主坐标轴、标识线和识别标;
采集模块:用于采集纸质模块化笔记表面的内容,将模块化笔记的内容扫描采集至系统内;
处理模块:获取采集模块采集到的内容,并根据主坐标轴、标识线和识别标进行内容区域的识别,识别各内容属于什么区域、什么格式;
转换模块:根据识别结果进行电子版格式的转换,分区域分格式的一对一转换;
显示模块:用于展示转换后的电子笔记,完成纸质版与电子版之间的转换。
实施例1
所述纸质模块化笔记包括:
时间记录区域:用于记载记录时间、变更时间和批注时间;
标题记录区域:用于记载标题、副标题和关键词;
时间、标题辅助线:用于分隔开时间记录区域和标题记录区域,对于不需要记录时间及标题的情形下,可直接于此区域记录正文内容,本线做虚化处理,以减少对于正文记录的影响;
正文区:用于书写正文,并在正文区设置网格线;
正文区域标题辅助线:设置在正文区内宽度依次递减的竖线,用于对应转换为大纲中的多级标题;
识别角标:包括时间识别标、标题识别标和PPT识别标,选中所述时间识别标用于确定时间位置和时间文本,选中所述标题识别标用于确定标题位置和标题文本,选中所述PPT识别标用于标识是否转换为PPT格式,填写PPT区域识别后,计算机自动将正文区输出为PPT文稿。
其中,纸质笔记的模块设置中,所述网格线能够辅助使用者添加引用文献、表格、思维导图、分割线等工具。多样化的工具使学习及思考内容更加具有逻辑及说服力。笔者可以在此笔记系统上进行文案的书写。
多个所述正文区域标题辅助线用于区分多级标题,并对应转换为电子大纲。
实施例2
所述纸质模块化笔记还包括费曼区和线索区,采用费曼区分割线将所述费曼区与正文区划分,采用费曼区识别线标识费曼区的位置,所述费曼区用于书写提示词作为单独的题词板或记录背诵讲义,所述线索区用于书写批注。
实施例3
所述纸质模块化笔记采用Markdown的标记语言。基于markdown标记语言,对纸质版进行微调,在正文前加双竖线或加粗单竖线表示引用,在正文上方加双横线表示分割线,在正文文本周围加单划线表示表格边框,在正文文本周围加波浪型边框或圆形框表示思维导图节点,思维导图线条使用加粗笔迹书写,计算机将识别输出思维导图文件。
Markdown是纯文本格式的标记语言。通过简单的标记语法,它可以使普通文本内容具有一定的格式。
Markdown具备的优点:
1、为纯文本格式,支持Markdown的平台均能进行编辑,让作者摆脱排版的困扰,专心写作。
2、操作简单。只需要在标题内容前加#即可进行几级标题的设置。
实施例3
应用适用于深度学习及思考的模块化笔记系统的电子转换方法,其步骤为:
S1:设置纸质的模块化笔记模板;
S2:采集纸质模块化笔记表面的书写内容,并根据纸质模块化笔记内设置坐标轴进行文本模块的定位和识别;
S3:利用OCR技术自动识别并判断标题识别线下方的文本正文区,并识别是否存在多级标题,若存在,则进行电子大纲的转换;
S4:判断是否存在PPT标识,若存在则将纸质模块化笔记转换为电子PPT格式,然后判断是否存在附属挂件标识,若存在附属挂件标识则确定挂件位置,提取挂件内容转换至电子PPT的相应位置,若不存在附属挂件标识,则将正文填转换为电子PPT的文稿,将备注区转换为电子PPT的备注,将费曼区转换为电子PPT的注释文稿;
S5:若不存在PPT标识,则进行标准格式的识别与转换,然后判断是否存在附属挂件标识,若存在附属挂件标识则确定挂件位置,提取挂件内容转换至电子模板的相应位置,若不存在附属挂件标识,则依次提取正文、线索区和费曼区,将其转换至电子模板的相应位置。
其中,所述步骤S2中计算机首先通过“主坐标纵轴”和“主坐标横轴”进行全文稿的定位,判断出纸张的正方向。默认主坐标横轴为红色单横线,默认主坐标纵轴为黑色单纵线,也可通过计算机系统修改此设置的默认值。其中,所述纸质模块化笔记中“主坐标横轴”与“费曼区分割线”之间的空隙设计有易撕口。
所述步骤S3中计算机通过ocr技术自动识别并判断标题识别线之后的文本,并提示是否为多级标题。
如若需要填写时间及标题,须预先将所述纸质模块化笔记中“时间/标题标识标”涂黑或选中,便于所述处理模块识别。
所述步骤S4中正文区配置网格线,所述网格线具有帮助所述处理模块识别元素功能。基于markdown标记语言,在正文前加双竖线或明显加粗单竖线表示引用。
基于markdown标记语言,在正文上方加双横线表示分割线。
基于markdown标记语言,在正文文本周围加单划线表示表格边框。
文本周围加波浪型边框或明显圆形框表示思维导图节点。思维导图线条使用明显加粗笔迹书写,所述处理模块将识别输出思维导图文件。
实施例4
在所述纸质模块化笔记中所述标题辅助线内设置附属配件的标识码,所述附属配件包括便利贴、功能贴纸、拍纸簿和代办清单。
在所述纸质模块化笔记中所述附属配件应附属在正文区的“标题识别线”之下,每种附属配件均具有独立的识别码,具体识别以附属配件识别码为准,识别原理等同“PPT识别区”。
所述处理模块的具体识别所述附属配件的流程为:
①所述采集模块扫描配件识别码;
②所述处理模块基于系统识别码进行正方向定位并进行扫描;提取附属配件文字并自动填充至电子版模板的对应位置。
实施例5
所述正文区与线索区的逻辑关系对照如下所示:
①寻找所述线索区文本;
②根据所述线索区文本确定线索内容,并与之建立对应关系;
③若所述线索区文本与等级标题同行,则认定该线索为该级别标题下所有文本通用线索或关键词;
④若所述线索区文本纵坐标同所述附属配件的挂载相同,则认定该线索为所述附属配件的线索或关键词。
实施例6
所述处理模块将所述纸质模块化笔记识别为电子版的PPT格式时,需要在所述纸质模块化笔记中将PPT识别区涂黑,否则系统默认转换为常规格式。
识别过程中,所述处理模块将所述纸质模块化笔记内的纸张内容自动旋转,将其横置,便于提取。
所述处理模块提取所述正文区的内容为PPT主要内容,PPT正文中的项目标题由所述转换模块转换至PPT标题层级辅助线右侧,以提高识别效率。
所述处理模块提取所述费曼区和线索区的内容为PPT备注区。
以上公开的仅为本发明的几个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (6)
1.适用于深度学习及思考的模块化笔记系统,其特征在于,包括:
纸质模块化笔记:将纸质笔记进行模块化区域的划分,并设置主坐标轴、标识线和识别标;
采集模块:采集纸质模块化笔记表面的书写内容;
处理模块:获取采集模块采集到的内容,并根据主坐标轴、标识线和识别标进行内容区域的识别;
转换模块:根据识别结果进行电子版格式的转换;
显示模块:用于展示转换后的电子笔记。
2.如权利要求1所述的适用于深度学习及思考的模块化笔记系统,其特征在于,所述纸质模块化笔记包括:
时间记录区域:用于记载记录时间、变更时间和批注时间;
标题记录区域:用于记载标题、副标题和关键词;
时间、标题辅助线:用于分隔开时间记录区域和标题记录区域;
正文区:用于书写正文,并在正文区设置网格线;
正文区域标题辅助线:设置在正文区内宽度依次递减的竖线;
识别角标:包括时间识别标、标题识别标和PPT识别标,选中所述时间识别标用于确定时间位置和时间文本,选中所述标题识别标用于确定标题位置和标题文本,选中所述PPT识别标用于标识是否转换为PPT格式。
3.如权利要求2所述的适用于深度学习及思考的模块化笔记系统,其特征在于,所述纸质模块化笔记还包括费曼区和线索区,采用费曼区分割线将所述费曼区与正文区划分,采用费曼区识别线标识费曼区的位置,所述费曼区用于书写提示词或记录背诵讲义,所述线索区用于书写批注。
4.如权利要求1所述的适用于深度学习及思考的模块化笔记系统,其特征在于,所述纸质模块化笔记采用Markdown的标记语言。
5.如权利要求1所述的适用于深度学习及思考的模块化笔记系统,其特征在于,多个所述正文区域标题辅助线用于区分多级标题,并对应转换为电子大纲。
6.适用于深度学习及思考的模块化笔记系统的电子转换方法,其特征在于,其步骤为:
S1:设置纸质的模块化笔记模板;
S2:采集纸质模块化笔记表面的书写内容,并根据纸质模块化笔记内设置坐标轴进行文本模块的定位和识别;
S3:利用OCR技术自动识别并判断标题识别线下方的文本正文区,并识别是否存在多级标题,若存在,则进行电子大纲的转换;
S4:判断是否存在PPT标识,若存在则将纸质模块化笔记转换为电子PPT格式,然后判断是否存在附属挂件标识,若存在附属挂件标识则确定挂件位置,提取挂件内容转换至电子PPT的相应位置,若不存在附属挂件标识,则将正文填转换为电子PPT的文稿,将备注区转换为电子PPT的备注,将费曼区转换为电子PPT的注释文稿;
S5:若不存在PPT标识,则进行标准格式的识别与转换,然后判断是否存在附属挂件标识,若存在附属挂件标识则确定挂件位置,提取挂件内容转换至电子模板的相应位置,若不存在附属挂件标识,则依次提取正文、线索区和费曼区,将其转换至电子模板的相应位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010844893.3A CN111985189B (zh) | 2020-08-20 | 2020-08-20 | 适用于深度学习及思考的模块化笔记系统及电子转换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010844893.3A CN111985189B (zh) | 2020-08-20 | 2020-08-20 | 适用于深度学习及思考的模块化笔记系统及电子转换方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985189A true CN111985189A (zh) | 2020-11-24 |
CN111985189B CN111985189B (zh) | 2024-04-12 |
Family
ID=73442843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010844893.3A Active CN111985189B (zh) | 2020-08-20 | 2020-08-20 | 适用于深度学习及思考的模块化笔记系统及电子转换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111985189B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750541A (zh) * | 2011-04-22 | 2012-10-24 | 北京文通科技有限公司 | 一种文档图像分类识别方法及装置 |
CN102903136A (zh) * | 2012-09-28 | 2013-01-30 | 王平 | 一种手写笔迹电子化方法和系统 |
US20130111335A1 (en) * | 2011-11-01 | 2013-05-02 | Xerox Corporation | Systems and methods for appearance-intent-directed document format conversion for mobile printing |
CN105243130A (zh) * | 2015-09-29 | 2016-01-13 | 中国电子科技集团公司第三十二研究所 | 面向数据挖掘的文本处理系统及方法 |
CN106296120A (zh) * | 2016-08-05 | 2017-01-04 | 安徽和信科技发展有限责任公司 | 一种政企一体化内容管理平台 |
CN106776504A (zh) * | 2016-12-27 | 2017-05-31 | 北京致远互联软件股份有限公司 | 一种文档格式在线转换方法及系统 |
CN108805519A (zh) * | 2018-05-18 | 2018-11-13 | 赵崇标 | 纸质日程表电子化生成方法、装置及电子日程表生成方法 |
CN109242856A (zh) * | 2017-07-10 | 2019-01-18 | 杭州亿教亿学网络科技有限公司 | 一种纸质作业电子化批阅方法及装置 |
CN109840519A (zh) * | 2019-01-25 | 2019-06-04 | 青岛盈智科技有限公司 | 一种自适应的智能单据识别录入装置及其使用方法 |
CN110262784A (zh) * | 2019-06-06 | 2019-09-20 | 秒针信息技术有限公司 | 一种云笔记实现方法及装置 |
CN110462612A (zh) * | 2017-02-17 | 2019-11-15 | 凯恩迪股份有限公司 | 使用在网络节点处具有软件代理的网络进行机器学习并然后对网络节点进行排名的方法和装置 |
CN111241801A (zh) * | 2018-11-29 | 2020-06-05 | 北京京东尚科信息技术有限公司 | 文件生成方法、装置、设备及计算机可读存储介质 |
CN111310747A (zh) * | 2020-02-12 | 2020-06-19 | 北京小米移动软件有限公司 | 信息处理方法、信息处理装置及存储介质 |
CN111401010A (zh) * | 2020-03-25 | 2020-07-10 | 苏州机数芯微科技有限公司 | 一种基于机器学习的表格抽取方法 |
-
2020
- 2020-08-20 CN CN202010844893.3A patent/CN111985189B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750541A (zh) * | 2011-04-22 | 2012-10-24 | 北京文通科技有限公司 | 一种文档图像分类识别方法及装置 |
US20130111335A1 (en) * | 2011-11-01 | 2013-05-02 | Xerox Corporation | Systems and methods for appearance-intent-directed document format conversion for mobile printing |
CN102903136A (zh) * | 2012-09-28 | 2013-01-30 | 王平 | 一种手写笔迹电子化方法和系统 |
CN105243130A (zh) * | 2015-09-29 | 2016-01-13 | 中国电子科技集团公司第三十二研究所 | 面向数据挖掘的文本处理系统及方法 |
CN106296120A (zh) * | 2016-08-05 | 2017-01-04 | 安徽和信科技发展有限责任公司 | 一种政企一体化内容管理平台 |
CN106776504A (zh) * | 2016-12-27 | 2017-05-31 | 北京致远互联软件股份有限公司 | 一种文档格式在线转换方法及系统 |
CN110462612A (zh) * | 2017-02-17 | 2019-11-15 | 凯恩迪股份有限公司 | 使用在网络节点处具有软件代理的网络进行机器学习并然后对网络节点进行排名的方法和装置 |
CN109242856A (zh) * | 2017-07-10 | 2019-01-18 | 杭州亿教亿学网络科技有限公司 | 一种纸质作业电子化批阅方法及装置 |
CN108805519A (zh) * | 2018-05-18 | 2018-11-13 | 赵崇标 | 纸质日程表电子化生成方法、装置及电子日程表生成方法 |
CN111241801A (zh) * | 2018-11-29 | 2020-06-05 | 北京京东尚科信息技术有限公司 | 文件生成方法、装置、设备及计算机可读存储介质 |
CN109840519A (zh) * | 2019-01-25 | 2019-06-04 | 青岛盈智科技有限公司 | 一种自适应的智能单据识别录入装置及其使用方法 |
CN110262784A (zh) * | 2019-06-06 | 2019-09-20 | 秒针信息技术有限公司 | 一种云笔记实现方法及装置 |
CN111310747A (zh) * | 2020-02-12 | 2020-06-19 | 北京小米移动软件有限公司 | 信息处理方法、信息处理装置及存储介质 |
CN111401010A (zh) * | 2020-03-25 | 2020-07-10 | 苏州机数芯微科技有限公司 | 一种基于机器学习的表格抽取方法 |
Non-Patent Citations (4)
Title |
---|
SARGUR N. SRIHARI 等: "Online and off-line handwriting recognition: a comprehensive survey", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》, vol. 22, no. 1, 31 January 2000 (2000-01-31), pages 63 - 84, XP055094583, DOI: 10.1109/34.824821 * |
SUGISAKI KYOKO 等: "Building a corpus from handwritten picture postcards: Transcription, annotation and part-of-speech tagging", 《PROCEEDINGS OF THE ELEVENTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION (LREC 2018)》, 31 March 2018 (2018-03-31), pages 255 - 259 * |
夏天: "基于扩展标记树的网页正文抽取", 《广西师范大学学报(自然科学版)》, no. 01, 15 March 2011 (2011-03-15), pages 133 - 137 * |
龙秋月: "SMART CLASS教育软件在高中生物学教学中的应用研究", 《中国优秀硕士学位论文全文数据库社会科学Ⅱ辑》, no. 07, 15 July 2018 (2018-07-15), pages 130 - 1014 * |
Also Published As
Publication number | Publication date |
---|---|
CN111985189B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2078423C (en) | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information | |
CA2116600C (en) | Methods and apparatus for inferring orientation of lines of text | |
US20030004991A1 (en) | Correlating handwritten annotations to a document | |
JP3282860B2 (ja) | 文書上のテキストのデジタル画像を処理する装置 | |
US8452132B2 (en) | Automatic file name generation in OCR systems | |
US8565474B2 (en) | Paragraph recognition in an optical character recognition (OCR) process | |
EP0543598B1 (en) | Method and apparatus for document image processing | |
US7712028B2 (en) | Using annotations for summarizing a document image and itemizing the summary based on similar annotations | |
CN103093252B (zh) | 信息输出装置以及信息输出方法 | |
US5556282A (en) | Method for the geographical processsing of graphic language texts | |
WO1995019616A9 (en) | Method for the geographical processing of graphic language texts | |
WO2024015320A1 (en) | Visual structure of documents in question answering | |
US20240119218A1 (en) | Device dependent rendering of pdf content | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US20240104290A1 (en) | Device dependent rendering of pdf content including multiple articles and a table of contents | |
JPH1166196A (ja) | 文書画像認識装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
CN116822634A (zh) | 一种基于布局感知提示的文档视觉语言推理方法 | |
CN111985189A (zh) | 适用于深度学习及思考的模块化笔记系统及电子转换方法 | |
JPH09319747A (ja) | 文書画像の構造化方法 | |
CN111523307A (zh) | 一种基于符号标记的在线翻译生词笔记生成系统 | |
CN104516941A (zh) | 相关文档检索装置、方法及程序 | |
JP3091278B2 (ja) | 文書認識方式 | |
JPH03142694A (ja) | 文書読取装置 | |
Biggs | What characterizes pictures and text? | |
JP2020144754A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |