CN107944028A - 一种基于数学公式线性检索的方法 - Google Patents

一种基于数学公式线性检索的方法 Download PDF

Info

Publication number
CN107944028A
CN107944028A CN201711321399.3A CN201711321399A CN107944028A CN 107944028 A CN107944028 A CN 107944028A CN 201711321399 A CN201711321399 A CN 201711321399A CN 107944028 A CN107944028 A CN 107944028A
Authority
CN
China
Prior art keywords
mathematical formulae
data
linear
dictionary
transformation rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711321399.3A
Other languages
English (en)
Inventor
左黎明
陈兰兰
夏萍萍
胡凯雨
康文洋
张婷婷
王露
陈祚松
周庆
张梦丽
艾美珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Jiaotong University
Original Assignee
East China Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Jiaotong University filed Critical East China Jiaotong University
Priority to CN201711321399.3A priority Critical patent/CN107944028A/zh
Publication of CN107944028A publication Critical patent/CN107944028A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于数学公式的线性检索方法,该方法包括:预先创建语法字典,自定义构建数学符号与转义字符集的对应关系;定义从左至右从上至下的线性转换规则;利用所述语法字典和线性转换规则对包含数学公式的资料解析,得到解析结果并进行检索。利用本发明,可以快速检索包含数学公式的资料,并且提高对数学公式检索的精确度。

Description

一种基于数学公式线性检索的方法
技术领域
本发明涉及计算机数据检索领域,涉及一种先从左至右再从上至下的数学公式线性检索方法。
背景技术
随着互联网的飞速发展,面对海量而又不断更新的信息库,如何快速准确地找到自己需要的信息已经变得越来越重要了。在当前以考试为主要评价形式的教育体制下,试题是学习上不可或缺的资源。因此创建试题检索资源库显得尤为重要,而针对包含数学公式的试题进行解析与检索具有重要意义。
目前对包含数学公式的数据检索一般采用图像处理进行解析再检索,研究人员从20世纪60年代开始研究公式处理,已经取得很多进展。然而许多情况下,公式的识别结果是一些毫无意义的符号,不仅受照片分辨率影响,而且一些不常见的公式符号难以准确识别。因此图像处理算法复杂且效果不佳,检索准确度较低。
发明内容
本发明的主要目的是提供一种数学公式线性检索的方法,解决上述背景技术中提出的数学公式解析与检索困难问题。
为此,本发明提供如下技术方案:一种基于数学公式的线性检索方法,包括:
建立语法字典,为每个数学符号创建字典,建立数学符号与转义字符集的对应关系;
定义待存储资料中数学公式的转换规则;
录入数据,转换包含数学公式的数据资料并存入资料库,支持图片存储;
定义查询方式,匹配资料库中的信息,查找时需按转换规则输入关键字;
显示查询结果,支持分页。
优选地,所述语法字典需自定义对应关系,且数学符号与转义字符集的对应关系必须唯一,具体的规则如下:
1)基本字符集和罗马字符集:对应字符串为原字符集;
2)希腊字符集、基础数学符号集、求反关系运算符、箭头类符号、三角符号、特殊符号集:自定义对应字符串。
优选地,所述转换规则按照从左至右从上至下的线性转换方式。
优选地,所述录入数据可以按照语法字典和转换规则直接在输入框输入包含数学公式的数据,或者先以图片的形式上传包含数学公式的资料,保存于资料库,之后再按转换规则输入,可以由其他人录入。
优选地,所述查询方式支持模糊查询和精确查询。
优选地,所述查询结果分条展示,显示部分摘要信息,点击“详情”按钮或相关链接查看具体详情,并且支持在线下载。
通过本发明提供的技术方案,用户检索包含数学公式的资料时,按照语法字典找到与数学符号对应的转义字符集,再按从左至右从上至下的线性转换规则输入要查询的数据,大大提高了检索精确度和查询效率。
附图说明
下面结合附图对本实施例或技术方案进一步说明。
图1是本发明一种数学公式线性检索的流程图。
具体实施方式
为了更好的解释本发明实施例的方案,下面结合附图作进一步说明。
一种基于数学公式的线性检索方法,主要组成部分是:包括数学公式存储和查询模块,所述存储包括建立语法字典和资料库,语法字典可自定义建立数学符号和转义字符集的对应关系,资料库数据基于数学公式从左至右从上至下线性转换规则,依赖语法字典的对应关系,并且资料库中可以存储包含数学公式的相关图片;所述查询模块包括但不限于各种模糊查询以及精确查询方法。
如图1所示,本发明数学公式检索步骤如下:
步骤S101:建立语法字典,为每个数学符号创建字典,建立数学符号与转义字符集的对应关系。
所述的语法字典需自定义对应关系,且数学符号与转义字符集的对应关系必须唯一,具体的规则如下:
1)基本字符集和罗马字符集:转义字符集和原字符集相同;
2)希腊字符集、基础数学符号集、求反关系运算符、箭头类符号、三角符号、特殊符号集:自定义对应字符串。
如表1为自定义的部分对应关系,其中第一列为数学符号类型编号,表示第i类数学符号,分别为普通字符集、罗马字符集、希腊字符集、基础数学符号集、求反关系运算符、箭头类符号、三角符号和特殊符号集8种类型;第二列为待转义数学符号;第三列为对应的转义字符集。这里定义“[”、“]”、“{”、“}”或“,”作为分割符,并且分隔符对应的字符串需要转义,不可以是原字符集。
表1
步骤S102:定义待存储资料中数学公式的转换规则。
所述转换规则为从左至右从上至下的线性转换方式。
步骤S103:录入数据,转换包含数学公式的数据资料并存入资料库,支持图片存储。
所述录入数据可以按照语法字典和转换规则直接在输入框输入包含数学公式的数据,或者先以图片的形式上传包含数学公式的资料,保存于资料库,之后再按转换规则输入,可以由其他人录入。
步骤S104:定义查询方式,匹配资料库中的信息,查找时需按转换规则输入关键字。
所述查询方式支持模糊查询和精确查询。
步骤S105:显示查询结果,支持分页。
所述查询结果分条展示,显示部分摘要信息,点击“详情”按钮或相关链接查看具体详情,并且支持在线下载。
实施例1:
假设需要录入试题的具体解答,按照上述步骤S103中两种录入方式,可以直接在输入框按转换规则输入解答,或者以图片形式存储,之后再按转换规则录入,可以由其他人录入。
以上数学公式按从左至右从上至下转换规则转换后为[J]{2,1}(x{2,}+1)dx。转换规则为:将“{”、“}”、“,”作为上下限和上下标的分隔符,即表示公式右上角和右下角元素的规则,按照从左至右从上至下的规则,先转换语法字典中“”对应的字符串,转换为“[J]”,再转换上下限,用{2,1}表示上限为2,下限为1,最后依次输入后面的表达式,其中有上标,用{2,}表示上标为2,无下标,即用{2,}表示某个数的平方。
实施例2:
在实施例1的基础上,现在要快速查找的解答。
按转换规则输入关键字[J]{2,1}(x{2,}+1)dx,通过模糊查询方式,将结果按匹配程度由高到低在前台分页显示,点击链接即可查看,并且支持在线下载。

Claims (7)

1.一种基于数学公式线性检索的方法,其特征在于,包括:
预先创建语法字典,自定义构建数学符号与转义字符集的对应关系;
定义从左至右从上至下的线性转换规则;
利用所述语法字典和所述从左至右从上至下的线性转换规则对包含数学公式的资料解析,得到解析结果并进行检索。
2.根据权利要求1所述数学公式线性检索的方法,其特征包括数学公式存储和查询模块,所述存储包括建立语法字典和资料库,所述语法字典可自定义建立数学符号和转义字符集的对应关系,所述资料库数据基于数学公式所述从左至右从上至下的线性转换规则,依赖所述语法字典的对应关系,并且所述资料库中可以存储包含数学公式的相关图片;所述查询模块包括但不限于各种模糊查询以及精确查询方法。
3.根据权利要求2所述数学公式线性检索的方法,其特征包括:
建立所述语法字典,为每个数学符号创建字典,自定义建立数学符号与所述转义字符集的对应关系,且数学符号与所述转义字符集的对应关系必须唯一,具体的规则如下:
1)基本字符集和罗马字符集:所述转义字符集和原数学符号相同;
2)希腊字符集、基础数学符号集、求反关系运算符、箭头类符号、三角符号、特殊符号集:自定义所述转义字符集。
4.根据权利要求3所述数学公式线性检索的方法,其特征包括:
定义待存储资料中数学公式的转换规则,所述转换规则为从左至右从上至下的线性转换方式,并按照定义的所述语法字典将包含数学公式的数据转换后存储于资料库中,支持图片存储。
5.根据权利要求4所述数学公式线性检索的方法,其特征包括:
录入数据,转换包含数学公式的数据资料并存入所述资料库,两种录入方式:
1)按照所述语法字典和所述转换规则直接在输入框输入包含数学公式的数据;
2)先以图片的形式上传包含数学公式的资料,保存于所述资料库,之后再按所述转换规则输入,可以由其他人录入。
6.根据权利要求5所述数学公式线性检索的方法,其特征包括:
定义查询方式,匹配所述资料库中的信息,查找时需按转换规则输入关键字,所述查询方式支持模糊查询和精确查询。
7.根据权利要求6所述数学公式线性检索的方法,其特征包括:
显示查询结果,支持分页,所述查询结果分条展示,显示部分摘要信息,点击“详情”按钮或相关链接查看具体详情。
CN201711321399.3A 2017-12-12 2017-12-12 一种基于数学公式线性检索的方法 Pending CN107944028A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711321399.3A CN107944028A (zh) 2017-12-12 2017-12-12 一种基于数学公式线性检索的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711321399.3A CN107944028A (zh) 2017-12-12 2017-12-12 一种基于数学公式线性检索的方法

Publications (1)

Publication Number Publication Date
CN107944028A true CN107944028A (zh) 2018-04-20

Family

ID=61942819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711321399.3A Pending CN107944028A (zh) 2017-12-12 2017-12-12 一种基于数学公式线性检索的方法

Country Status (1)

Country Link
CN (1) CN107944028A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110648262A (zh) * 2019-09-16 2020-01-03 怀化学院 一种用于数学思维训练的教学系统及数据处理方法
CN111078724A (zh) * 2019-12-11 2020-04-28 中国建设银行股份有限公司 学习系统中的测试题检索方法、装置、设备及存储介质
CN116483943A (zh) * 2023-06-21 2023-07-25 山东网安安全技术有限公司 一种全文检索方法及其检索系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149790A (zh) * 2007-11-14 2008-03-26 哈尔滨工程大学 中文印刷体公式识别方法
CN102841884A (zh) * 2011-06-23 2012-12-26 卡西欧计算机株式会社 公式输入装置、公式显示装置、公式输入方法、公式显示方法
CN106126660A (zh) * 2016-06-24 2016-11-16 浙江万朋教育科技股份有限公司 一种基于数学公式的资源文件存储和资源检索方法
CN106708775A (zh) * 2017-01-19 2017-05-24 河南工程学院 一种数学公式搜索方法及装置
CN107145510A (zh) * 2017-03-31 2017-09-08 西安科技大学 一种数学公式搜索方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149790A (zh) * 2007-11-14 2008-03-26 哈尔滨工程大学 中文印刷体公式识别方法
CN102841884A (zh) * 2011-06-23 2012-12-26 卡西欧计算机株式会社 公式输入装置、公式显示装置、公式输入方法、公式显示方法
CN106126660A (zh) * 2016-06-24 2016-11-16 浙江万朋教育科技股份有限公司 一种基于数学公式的资源文件存储和资源检索方法
CN106708775A (zh) * 2017-01-19 2017-05-24 河南工程学院 一种数学公式搜索方法及装置
CN107145510A (zh) * 2017-03-31 2017-09-08 西安科技大学 一种数学公式搜索方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110648262A (zh) * 2019-09-16 2020-01-03 怀化学院 一种用于数学思维训练的教学系统及数据处理方法
CN111078724A (zh) * 2019-12-11 2020-04-28 中国建设银行股份有限公司 学习系统中的测试题检索方法、装置、设备及存储介质
CN116483943A (zh) * 2023-06-21 2023-07-25 山东网安安全技术有限公司 一种全文检索方法及其检索系统

Similar Documents

Publication Publication Date Title
US20210081611A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
US11868386B2 (en) Method and system for sentiment analysis of information
Twigg The math emporium: Higher education's silver bullet
Pivk et al. Transforming arbitrary tables into logical form with TARTAR
CN100437573C (zh) 标识相关姓名的系统及方法
CN102122286A (zh) 在手持学习终端上实现的聚合式搜索的方法
WO2015165381A1 (zh) 一种通用型互联网信息数据挖掘方法
US20140006408A1 (en) Identifying points of interest via social media
JP6693582B2 (ja) 文書要約の生成方法、装置、電子機器、コンピュータ読み取り可能な記憶媒体
CN107944028A (zh) 一种基于数学公式线性检索的方法
US10810181B2 (en) Refining structured data indexes
CN111552704A (zh) 一种数据报表生成方法、装置、计算机设备及存储介质
Hahnel et al. How to (easily) extend the FAIRness of existing repositories
CN106021532A (zh) 关键词的显示方法和装置
JP2016134124A (ja) タグ付与方法、タグ付与装置、プログラム及び質問回答検索方法
CN111460173B (zh) 一种甲状腺癌的疾病本体模型的构建方法
CN110851629A (zh) 一种图像检索的方法
Lafia et al. Spatial discovery of linked research datasets and documents at a spatially enabled research library
JP2006023968A (ja) 固有表現抽出方法および装置並びにそれらに用いるプログラム
US10755594B2 (en) Method and system for analyzing a piece of text
JP2006155275A (ja) 情報抽出方法及び情報抽出装置
Liu AB/S‐Based Computer‐Aided Translation Teaching Method
Yu et al. Data service generation framework from heterogeneous printed forms using semantic link discovery
KR20190072883A (ko) 매개 텍스트 자료 토픽을 이용한 전문 텍스트 자료 추출 방법
Afrakhteh Transformation of Geography as an Interdisciplinary Science

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180420

WD01 Invention patent application deemed withdrawn after publication