CN112580653A - 一种自动解题的方法和装置 - Google Patents
一种自动解题的方法和装置 Download PDFInfo
- Publication number
- CN112580653A CN112580653A CN202011554021.XA CN202011554021A CN112580653A CN 112580653 A CN112580653 A CN 112580653A CN 202011554021 A CN202011554021 A CN 202011554021A CN 112580653 A CN112580653 A CN 112580653A
- Authority
- CN
- China
- Prior art keywords
- picture
- analysis
- sequence
- character
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims description 26
- 238000007781 pre-processing Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 8
- 238000012916 structural analysis Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/322—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开的一种自动解题的方法和装置,通过OCR识别,得到精确的字符、数字,并通过数字、符号语义解析程序和题目模型,自动解析识别到的题目。所述方法可作为初高中的学习助手,让孩子独立自主学习,可解答的题目,涵盖范围广,效率高,准确度高,正确率高,简单方便。
Description
技术领域
本发明涉及文字,数字图形识别处理计算领域,尤其涉及一种自动解题的方法和装置。
背景技术
随着各类教育产品和科技产品的不断出现,父母工作的忙碌,对于子女,特别是初中,高中的学习,基本无暇光顾,虽然有网上题库解析,可以参照,但由于各类数学符号,通过手机和计算机很难准确输入检索关键词,通过互联网检索。
虽然已经有一些技术,可以通过拍照识别题目的关键词,然后通过关键词检索互联网,找寻一模一样的题目,复制粘贴,展示互联网上的解题步骤和答案,但该技术方案有局限性,互联网上检索的答案是最新的,正确的,仅仅依靠复制粘贴的方式,为中小学提供解析思路和答案,依靠错误的答案会导致学生在错误的知识上越走越远。
发明内容
为解决上述家长和学生的烦恼问题,本发明提供一种自动解题的方法和装置,用户可以通过拍照,分析识别照片,自动解析题目;可以解答线性代数、四则运算、积分以及求导等,在初高中生遇到的数学计算问题,可以详细到每一个解题步骤。
本发明所述技术方案包含OCR部分和解题部分。
一方面,本发明包含一种可以识别高初中数字、符号的方法和装置,通过预设训练的卷积神经网络,识别各类复杂,疑难,印刷版等文字,数字,符号,熟练学习高初中数字符号,可以精准识别。
另一方面,本发明解题部分包含一种数学语义解析的方法和装置,可以解析数字、符号表达式,并转换成一种可组织查询的数据接口,例如二叉树;解题部分还包括一种定义不同类型解题模型的方法和装置,例如,四则运算的解题模型,一元一次方程解题模型,二元一次方程解题模型等。
本发明公开一种自动解题的方法,所述方法包括以下步骤:
步骤S1:解析识别拍照或者截图所得的印书版图片,进行预处理,所述预处理包括灰度化、二值化、字符切割等常规图片处理技术。
步骤S2:通过预设训练好的卷积神经网络分类器,对图片各数字元素、符号元素进行识别,并保证字符序列顺序,得到计算机可识别、分析、计算的字符序列。
步骤S3:针对所述字符序列,进行语法分析,得到数学元素节点序列。
步骤S4:通过字符空间关系判定、结构分析和文法分析,解析题目,生成计算机可识别计算的内容。
步骤S5:通过预设不同模型的题目解析树,自动求解。
步骤S6:利用语法制导翻译,得到最终包含计算过程和解析结果的图片。
进一步的,本发明公开一种自动解题的装置,所述装置包括以下模块:
预处理模块:解析识别拍照或者截图所得的印书版图片,进行预处理,所述预处理包括灰度化、二值化、字符切割等常规图片处理技术。
识别模块:通过预设训练好的卷积神经网络分类器,对图片各数字元素、符号元素进行识别,并保证字符序列顺序,得到计算机可识别、分析、计算的字符序列。
分析模块:针对所述字符序列,进行语法分析,得到数学元素节点序列。
解析模块:通过字符空间关系判定、结构分析和文法分析,解析题目,生成计算机可识别计算的内容。
解题模块:通过预设不同模型的题目解析树,自动求解。
输出模块:利用语法制导翻译,得到最终包含计算过程和解析结果的图片。
本发明公开的一种自动解题的方法和装置,通过OCR识别,得到精确的字符、数字,并通过数字、符号语义解析程序和题目模型,自动解析识别到的题目。所述方法可作为初高中的学习助手,让孩子独立自主学习,可解答的题目,涵盖范围广,效率高,准确度高,正确率高,简单方便。
附图说明
图1示出了本发明的一种自动解题的方法流程图;
图2示出了本发明的一种自动解题的装置流程图。
具体实施方式
为详细阐述本发明的内容,通过以下实施例做进一步说明,参照图1,公开了本发明一种自动解题的方法,所述方法包括:
步骤S1:解析识别拍照或者截图所得的印书版图片,进行预处理,所述预处理包括灰度化、二值化、字符切割等常规图片处理技术。
步骤S2:通过预设训练好的卷积神经网络分类器,对图片各数字元素、符号元素进行识别,并保证字符序列顺序,得到计算机可识别、分析、计算的字符序列。
步骤S3:针对所述字符序列,进行语法分析,得到数学元素节点序列。
步骤S4:通过字符空间关系判定、结构分析和文法分析,解析题目,生成计算机可识别计算的内容。
步骤S5:通过预设不同模型的题目解析树,自动求解。
步骤S6:利用语法制导翻译,得到最终包含计算过程和解析结果的图片。
另一方面,本发明公开一种自动解题的装置,所述装置包括:
预处理模块:解析识别拍照或者截图所得的印书版图片,进行预处理,所述预处理包括灰度化、二值化、字符切割等常规图片处理技术。
识别模块:通过预设训练好的卷积神经网络分类器,对图片各数字元素、符号元素进行识别,并保证字符序列顺序,得到计算机可识别、分析、计算的字符序列。
分析模块:针对所述字符序列,进行语法分析,得到数学元素节点序列。
解析模块:通过字符空间关系判定、结构分析和文法分析,解析题目,生成计算机可识别计算的内容。
解题模块:通过预设不同模型的题目解析树,自动求解。
输出模块:利用语法制导翻译,得到最终包含计算过程和解析结果的图片。
本发明所述卷积神经网络训练模型,通过深度学习技术,利用海量数据,训练识别模型,可以识别到阿拉伯数字以及初高中常见的符号,字母,包括手写以及印刷。
另一方面,本发明解题部分包含一种数学语义解析的方法和装置,可以解析数字、符号表达式,并转换成一种可组织查询的数据接口,例如二叉树;解题部分还包括一种定义不同类型解题模型的方法和装置,例如,四则运算的解题模型,一元一次方程解题模型,二元一次方程解题模型等。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种解题辅助方法及解题辅助客户端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (2)
1.一种自动解题的方法,所述方法包括:
步骤S1:解析识别拍照或者截图所得的印书版图片,进行预处理,所述预处理包括灰度化、二值化、字符切割等常规图片处理技术;
步骤S2:通过预设训练好的卷积神经网络分类器,对图片各数字元素、符号元素进行识别,并保证字符序列顺序,得到计算机可识别、分析、计算的字符序列;
步骤S3:针对所述字符序列,进行语法分析,得到数学元素节点序列;
步骤S4:通过字符空间关系判定、结构分析和文法分析,解析题目,生成计算机可识别计算的内容;
步骤S5:通过预设不同模型的题目解析树,自动求解;
步骤S6:利用语法制导翻译,得到最终包含计算过程和解析结果的图片。
2.一种自动解题的装置,所述装置包括:
预处理模块:解析识别拍照或者截图所得的印书版图片,进行预处理,所述预处理包括灰度化、二值化、字符切割等常规图片处理技术;
识别模块:通过预设训练好的卷积神经网络分类器,对图片各数字元素、符号元素进行识别,并保证字符序列顺序,得到计算机可识别、分析、计算的字符序列;
分析模块:针对所述字符序列,进行语法分析,得到数学元素节点序列;
解析模块:通过字符空间关系判定、结构分析和文法分析,解析题目,生成计算机可识别计算的内容;
解题模块:通过预设不同模型的题目解析树,自动求解;
输出模块:利用语法制导翻译,得到最终包含计算过程和解析结果的图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011554021.XA CN112580653A (zh) | 2020-12-24 | 2020-12-24 | 一种自动解题的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011554021.XA CN112580653A (zh) | 2020-12-24 | 2020-12-24 | 一种自动解题的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112580653A true CN112580653A (zh) | 2021-03-30 |
Family
ID=75139629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011554021.XA Pending CN112580653A (zh) | 2020-12-24 | 2020-12-24 | 一种自动解题的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112580653A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423286A (zh) * | 2017-07-05 | 2017-12-01 | 华中师范大学 | 初等数学代数型题自动解答的方法与系统 |
CN109446315A (zh) * | 2018-12-20 | 2019-03-08 | 广东小天才科技有限公司 | 一种解题辅助方法及解题辅助客户端 |
CN109918514A (zh) * | 2019-03-21 | 2019-06-21 | 江西风向标教育科技有限公司 | 一种数学题目知识点和解题方法的自动提取方法、装置、平台 |
CN110751137A (zh) * | 2019-09-04 | 2020-02-04 | 中山大学 | 一种自动求解数学题的方法和系统 |
CN111666924A (zh) * | 2020-07-02 | 2020-09-15 | 暗物智能科技(广州)有限公司 | 一种平面几何自动解题方法及系统 |
-
2020
- 2020-12-24 CN CN202011554021.XA patent/CN112580653A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423286A (zh) * | 2017-07-05 | 2017-12-01 | 华中师范大学 | 初等数学代数型题自动解答的方法与系统 |
CN109446315A (zh) * | 2018-12-20 | 2019-03-08 | 广东小天才科技有限公司 | 一种解题辅助方法及解题辅助客户端 |
CN109918514A (zh) * | 2019-03-21 | 2019-06-21 | 江西风向标教育科技有限公司 | 一种数学题目知识点和解题方法的自动提取方法、装置、平台 |
CN110751137A (zh) * | 2019-09-04 | 2020-02-04 | 中山大学 | 一种自动求解数学题的方法和系统 |
CN111666924A (zh) * | 2020-07-02 | 2020-09-15 | 暗物智能科技(广州)有限公司 | 一种平面几何自动解题方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368049B (zh) | 信息获取方法、装置、电子设备及计算机可读存储介质 | |
CN110795543A (zh) | 基于深度学习的非结构化数据抽取方法、装置及存储介质 | |
CN111144079B (zh) | 一种智能获取学习资源的方法、装置、打印机和存储介质 | |
CN110750624A (zh) | 信息输出方法及装置 | |
CN107301164B (zh) | 数学公式的语义解析方法及装置 | |
CN111610901B (zh) | 一种基于ai视觉下的英语课文辅助教学方法及系统 | |
CN110837793A (zh) | 一种智能识别手写数学公式批阅系统 | |
CN111767307A (zh) | 对象处理方法及系统、数学题目批改方法及系统 | |
CN112347997A (zh) | 一种试题检测识别方法、装置、电子设备及介质 | |
Agarwal et al. | Autoeval: A nlp approach for automatic test evaluation system | |
CN113505786A (zh) | 试题拍照评判方法、装置及电子设备 | |
CN117312509A (zh) | 一种海量信息下基于大语言模型的知识库问答方法及装置 | |
Tashu et al. | Deep Learning Architecture for Automatic Essay Scoring | |
JP6942759B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
US20200294410A1 (en) | Methods, systems, apparatuses and devices for facilitating grading of handwritten sheets | |
CN110598642A (zh) | 一种计算题在线练习方法、装置、设备和存储介质 | |
CN115757723A (zh) | 文本处理方法及装置 | |
CN112580653A (zh) | 一种自动解题的方法和装置 | |
CN115269812A (zh) | 题目推荐方法、装置、设备及存储介质 | |
CN114358579A (zh) | 评阅方法、评阅装置、电子设备以及计算机可读存储介质 | |
KR20220118579A (ko) | 인공지능을 이용하여 튜터링 서비스를 제공하기 위한 시스템 및 그에 관한 방법 | |
CN210348859U (zh) | 一种试卷批改一体机 | |
CN113569112A (zh) | 基于题目的辅导策略提供方法、系统、装置及介质 | |
Soares et al. | A Neural Question Answering System for Supporting Software Engineering Students | |
CN112015920A (zh) | 一种基于知识图谱和边缘计算智能辅助学习系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |