CN105468673A - 一种数学公式搜索方法及系统 - Google Patents

一种数学公式搜索方法及系统 Download PDF

Info

Publication number
CN105468673A
CN105468673A CN201510776434.5A CN201510776434A CN105468673A CN 105468673 A CN105468673 A CN 105468673A CN 201510776434 A CN201510776434 A CN 201510776434A CN 105468673 A CN105468673 A CN 105468673A
Authority
CN
China
Prior art keywords
data
module
formula
input
mathematical formulae
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510776434.5A
Other languages
English (en)
Inventor
左飞
王红卫
申俊丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Normal University
Original Assignee
Henan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Normal University filed Critical Henan Normal University
Priority to CN201510776434.5A priority Critical patent/CN105468673A/zh
Publication of CN105468673A publication Critical patent/CN105468673A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数学公式搜索方法及系统,包括公式数据库,内设定时模块的网络爬虫模块,输入模块,由键盘输入模块、手写输入模块、语音输入模块以及图片输入模块构成的专家模块,数据处理模块,中央处理器,液晶显示屏,语音单元,语言单元,数据共享模块。本发明可以根据不同的公式选择不同的输入模式,检索过程简单快速,在得到检索结果时,可以得到该公式的原理介绍以及应用案例等数据,减省了用户的时间,使用方便,同时还可以通过专家讲解模块,进行公式的讲解解释,且自带数据更新功能。

Description

一种数学公式搜索方法及系统
技术领域
本发明涉及搜索引擎领域,具体涉及一种数学公式搜索方法及系统。
背景技术
利用文本信息检索系统对数学关键词搜索是一种基于数学术语元数据搜索,可以实现对数学内容进行粗粒度搜索,这种方法无需考虑数学搜索与通用搜索的区别。这种方法通常可以同时支持文本搜索和数学公式搜索。但是不支持更高级别的数学搜索,比如要搜索a2+c=2a,其中a可以是任意相同的表达式,这种查询就不能执行。这种方法最大的优势在于依赖一种已存在的成熟技术,但是它没有完全支持面向数学公式的查询。另一种相似的思想是依靠基于XML的XQuery搜索引擎。这两种方法的优势在于都依靠一种已存在的技术,但是它们都没有提供完全面向数学的搜索方法。
现有技术中所使用的两种数学公式搜索方法的局限性主要表现在以下两个方面:
1.输入障碍
对于一些简单的如数学公式y=3x+5之类的公式化数据,用户可以通过键盘直接输入;而对于诸如这类结构性并不算复杂的公式如何准确进行输入,则缺乏统一的标准。具有一定数学和计算机语言知识背景的专业人士可能会输入1/sqrt(x)、1/sqrt{x}或一种出版行业通用的编辑排版的LaTeX语言的标准表达式\frac{1}{\sqrt{x}},甚至不规则的近似输入1/√x以√代替根号。但对于结构更为复杂的微积分表达式,例如则令用户捉襟见肘、根本无法输入,即使近似输入来表达积分区间也几乎不可能。
2.搜索结果的准确度和相关性
现有基于文本的搜索引擎都只能单一的搜到公式,其原理介绍以及应用案例等,都需要重新去查询,这无疑增加了用户的工作量。
3.不具备讲解功能,及时查询到了公式,也很难彻底的理解。
4.数据库内的内容不会自动更新,常常会导致查询结果错误。
发明内容
为解决上述问题,本发明提供了一种数学公式搜索方法及系统。
为实现上述目的,本发明采取的技术方案为:
一种数学公式搜索系统,包括
公式数据库,用于储存各类公式数据以及每个公式对应的解释和应用案例数据;
网络爬虫模块,内设定时模块,用于定时在网络中查找与公式相关的网页或文档,并将这些相关数据发送到专家模块;
专家模块,用于储存各类公式审核要求,并根据这些审核要求对网络爬虫模块发送来的数据进行评估,并将评估合格的数据发送到公式数据库内予以储存;
输入模块,包括键盘输入模块、手写输入模块、语音输入模块以及图片输入模块,用于输入需要查询的数学公式或与需要查询公式相关的数据,并将数据发送到数据处理器;
数据处理模块,用于将接收的输入模块输入的数据,并将其转换为文本数据,发送到中央处理器;
中央处理器,用于对输入的数学公式或相关数据按规则建立索引,并将建立的索引与公式数据库中的公式数据进行类似度对比,并将比对结果按照相似度进行升序或降序排序后,发送给液晶显示屏;用于根据信息调用命令,从公式数据库中调用人们所需的数据信息,并用于添加用户、删除用户、密码修改、权限管理;
液晶显示屏,用于输入信息调用命令,并显示输入模块的输入数据和检索模块的检索结果;
语音单元,用于语音播放检索模块的检索结果;
语言单元,用于选择不同的语种进行检索结果的播放或者检索结果的显示;
数据共享模块,用于通过下载的形式进行检索结果的共享。
优选地,所述语音输入模块采用麦克风,所述图片输入模块采用摄像头或扫描仪进行图片数据采集,然后通过图片上传模式进行图片数据的输入。
优选地,还包括一专家讲解模块,用于储存相关公式的各类经典讲解数据,并根据液晶显示输入的调用命令进行相关公式的讲解。
优选地,所述各类公式数据包括但不限于数学公式、物理公式、化学结构式、化学反应式、函数图形、五线谱、棋谱。
本发明还提供了一种数学公式搜索方法,包括如下步骤:
S1、通过输入模块输入需要查询的数学公式或与需要查询公式相关的数据;并将数据发送到数据处理模块;
S2、数据处理模块接收输入的数据,并将其转换为文本数据,发送到中央处理器;
S3、中央处理器接收数据后,进行相似度对比,将对比结果进行排序后发送到液晶显示屏;
S4、输出查询结果。
本发明具有以下有益效果:
可以根据不同的公式选择不同的输入模式,检索过程简单快速,在得到检索结果时,可以得到该公式的原理介绍以及应用案例等数据,减省了用户的时间,使用方便,同时还可以通过专家讲解模块,进行公式的讲解解释,且自带数据更新功能。
附图说明
图1为本发明实施例一种数学公式搜索系统的结构示意图。
具体实施方式
为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明实施例提供了一种数学公式搜索系统,包括
公式数据库,用于储存各类公式数据以及每个公式对应的解释和应用案例数据;
网络爬虫模块,内设定时模块,用于定时在网络中查找与公式相关的网页或文档,并将这些相关数据发送到专家模块;
专家模块,用于储存各类公式审核要求,并根据这些审核要求对网络爬虫模块发送来的数据进行评估,并将评估合格的数据发送到公式数据库内予以储存;
输入模块,包括键盘输入模块、手写输入模块、语音输入模块以及图片输入模块,用于输入需要查询的数学公式或与需要查询公式相关的数据,并将数据发送到数据处理器;
数据处理模块,用于将接收的输入模块输入的数据,并将其转换为文本数据,发送到中央处理器;
中央处理器,用于对输入的数学公式或相关数据按规则建立索引,并将建立的索引与公式数据库中的公式数据进行类似度对比,并将比对结果按照相似度进行升序或降序排序后,发送给液晶显示屏;用于根据信息调用命令,从公式数据库中调用人们所需的数据信息,并用于添加用户、删除用户、密码修改、权限管理;
液晶显示屏,用于输入信息调用命令,并显示输入模块的输入数据和检索模块的检索结果;
语音单元,用于语音播放检索模块的检索结果;
语言单元,用于选择不同的语种进行检索结果的播放或者检索结果的显示;
数据共享模块,用于通过下载的形式进行检索结果的共享。
所述语音输入模块采用麦克风,所述图片输入模块采用摄像头或扫描仪进行图片数据采集,然后通过图片上传模式进行图片数据的输入。
还包括一专家讲解模块,用于储存相关公式的各类经典讲解数据,并根据液晶显示输入的调用命令进行相关公式的讲解。
所述各类公式数据包括但不限于数学公式、物理公式、化学结构式、化学反应式、函数图形、五线谱、棋谱。
本发明实施例还提供了一种数学公式搜索方法,包括如下步骤:
S1、通过输入模块输入需要查询的数学公式或与需要查询公式相关的数据,并将数据发送到数据处理模块;
S2、数据处理模块接收输入的数据,并将其转换为文本数据,发送到中央处理器;
S3、中央处理器接收数据后,进行相似度对比,将对比结果进行排序后发送到液晶显示屏;
S4、输出查询结果。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种数学公式搜索系统,其特征在于,包括
公式数据库,用于储存各类公式数据以及每个公式对应的解释和应用案例数据;
网络爬虫模块,内设定时模块,用于定时在网络中查找与公式相关的网页或文档,并将这些相关数据发送到专家模块;
专家模块,用于储存各类公式审核要求,并根据这些审核要求对网络爬虫模块发送来的数据进行评估,并将评估合格的数据发送到公式数据库内予以储存;
输入模块,包括键盘输入模块、手写输入模块、语音输入模块以及图片输入模块,用于输入需要查询的数学公式或与需要查询公式相关的数据,并将数据发送到数据处理器;
数据处理模块,用于将接收的输入模块输入的数据,并将其转换为文本数据,发送到中央处理器;
中央处理器,用于对输入的数学公式或相关数据按规则建立索引,并将建立的索引与公式数据库中的公式数据进行类似度对比,并将比对结果按照相似度进行升序或降序排序后,发送给液晶显示屏;用于根据信息调用命令,从公式数据库中调用人们所需的数据信息,并用于添加用户、删除用户、密码修改、权限管理;
液晶显示屏,用于输入信息调用命令,并显示输入模块的输入数据和检索模块的检索结果;
语音单元,用于语音播放检索模块的检索结果;
语言单元,用于选择不同的语种进行检索结果的播放或者检索结果的显示;
数据共享模块,用于通过下载的形式进行检索结果的共享。
2.根据权利要求1所述的一种数学公式搜索系统,其特征在于,所述语音输入模块采用麦克风,所述图片输入模块采用摄像头或扫描仪进行图片数据采集,然后通过图片上传模式进行图片数据的输入。
3.根据权利要求1所述的一种数学公式搜索系统,其特征在于,还包括一专家讲解模块,用于储存相关公式的各类经典讲解数据,并根据液晶显示输入的调用命令进行相关公式的讲解。
4.根据权利要求1所述的一种数学公式搜索系统,其特征在于,所述各类公式数据包括但不限于数学公式、物理公式、化学结构式、化学反应式、函数图形、五线谱、棋谱。
5.一种数学公式搜索方法,其特征在于,包括如下步骤:
S1、通过输入模块输入需要查询的数学公式或与需要查询公式相关的数据,并将数据发送到数据处理模块;
S2、数据处理模块接收输入的数据,并将其转换为文本数据,发送到中央处理器;
S3、中央处理器接收数据后,进行相似度对比,将对比结果进行排序后发送到液晶显示屏;
S4、输出查询结果。
CN201510776434.5A 2015-11-10 2015-11-10 一种数学公式搜索方法及系统 Pending CN105468673A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510776434.5A CN105468673A (zh) 2015-11-10 2015-11-10 一种数学公式搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510776434.5A CN105468673A (zh) 2015-11-10 2015-11-10 一种数学公式搜索方法及系统

Publications (1)

Publication Number Publication Date
CN105468673A true CN105468673A (zh) 2016-04-06

Family

ID=55606374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510776434.5A Pending CN105468673A (zh) 2015-11-10 2015-11-10 一种数学公式搜索方法及系统

Country Status (1)

Country Link
CN (1) CN105468673A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930337A (zh) * 2016-03-28 2016-09-07 安阳师范学院 一种环境法学法条查询系统
CN106372381A (zh) * 2016-08-12 2017-02-01 牡丹江医学院 一种医学信息管理系统
CN106571144A (zh) * 2016-11-08 2017-04-19 广东小天才科技有限公司 一种基于语音识别的搜索方法及装置
CN106708775A (zh) * 2017-01-19 2017-05-24 河南工程学院 一种数学公式搜索方法及装置
CN106777319A (zh) * 2017-01-05 2017-05-31 黑河学院 一种环境法学证据储存查询系统
CN106960061A (zh) * 2017-04-11 2017-07-18 山东交通学院 一种数学公式搜索方法及系统
CN109410665A (zh) * 2018-12-17 2019-03-01 广东小天才科技有限公司 一种公式输入方法及学习设备
CN109992121A (zh) * 2017-12-29 2019-07-09 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN111144125A (zh) * 2019-12-04 2020-05-12 深圳追一科技有限公司 文本信息处理方法、装置、终端设备及存储介质
CN111597393A (zh) * 2020-04-14 2020-08-28 北京金山云网络技术有限公司 定理检索方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050138018A1 (en) * 2003-12-17 2005-06-23 International Business Machines Corporation Information retrieval system, search result processing system, information retrieval method, and computer program product therefor
CN104836792A (zh) * 2015-03-28 2015-08-12 南阳理工学院 一种企业管理数据处理系统
CN104933181A (zh) * 2015-07-01 2015-09-23 周口师范学院 一种数学公式搜索方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050138018A1 (en) * 2003-12-17 2005-06-23 International Business Machines Corporation Information retrieval system, search result processing system, information retrieval method, and computer program product therefor
CN104836792A (zh) * 2015-03-28 2015-08-12 南阳理工学院 一种企业管理数据处理系统
CN104933181A (zh) * 2015-07-01 2015-09-23 周口师范学院 一种数学公式搜索方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930337A (zh) * 2016-03-28 2016-09-07 安阳师范学院 一种环境法学法条查询系统
CN106372381A (zh) * 2016-08-12 2017-02-01 牡丹江医学院 一种医学信息管理系统
CN106571144A (zh) * 2016-11-08 2017-04-19 广东小天才科技有限公司 一种基于语音识别的搜索方法及装置
CN106777319A (zh) * 2017-01-05 2017-05-31 黑河学院 一种环境法学证据储存查询系统
CN106708775A (zh) * 2017-01-19 2017-05-24 河南工程学院 一种数学公式搜索方法及装置
CN106960061A (zh) * 2017-04-11 2017-07-18 山东交通学院 一种数学公式搜索方法及系统
CN109992121A (zh) * 2017-12-29 2019-07-09 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN109410665A (zh) * 2018-12-17 2019-03-01 广东小天才科技有限公司 一种公式输入方法及学习设备
CN109410665B (zh) * 2018-12-17 2020-12-25 广东小天才科技有限公司 一种公式输入方法及学习设备
CN111144125A (zh) * 2019-12-04 2020-05-12 深圳追一科技有限公司 文本信息处理方法、装置、终端设备及存储介质
CN111144125B (zh) * 2019-12-04 2021-08-10 深圳追一科技有限公司 文本信息处理方法、装置、终端设备及存储介质
CN111597393A (zh) * 2020-04-14 2020-08-28 北京金山云网络技术有限公司 定理检索方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN105468673A (zh) 一种数学公式搜索方法及系统
CN104933181A (zh) 一种数学公式搜索方法及装置
US11899681B2 (en) Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium
CN107145496A (zh) 基于关键词将图像与内容项目匹配的方法
CN107683471A (zh) 索引具有深度链接的网页
CN105183802A (zh) 一种用于法律咨询服务的智能法律知识库及其查询系统
CN114153795B (zh) 智能调取电子档案的方法、装置、电子设备和存储介质
CN109977291B (zh) 基于物理知识图谱的检索方法、装置、设备及存储介质
Alexander et al. Natural language web interface for database (NLWIDB)
CN105868177A (zh) 一种通用公式搜索方法
CN103399862B (zh) 确定目标查询序列所对应的搜索引导信息的方法与设备
Tao et al. Eventcube: multi-dimensional search and mining of structured and text data
CN111061828B (zh) 一种数字图书馆知识检索方法及装置
CN109684402A (zh) 一种基于大数据平台元数据血缘关系实现方法
CN111028952B (zh) 一种中文医学蕴含知识图谱构建方法及装置
CN107145497A (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
CN115757689A (zh) 一种信息查询系统、方法及设备
CN113627797A (zh) 入职员工画像生成方法、装置、计算机设备及存储介质
CN115510249A (zh) 一种知识图谱的构建方法及装置、电子设备、存储介质
CN114020892A (zh) 基于人工智能的答案选取方法、装置、电子设备及介质
CN117591738A (zh) 一种基于云服务的信息检索系统及方法
CN111553163A (zh) 文本相关度的确定方法、装置、存储介质及电子设备
Goyal et al. A Review on Different Content Based Image Retrieval Techniques Using High Level Semantic Feature
CN116010662A (zh) 一种能源消费-碳排放查询系统的构建方法、装置及介质
Carmel et al. Entity oriented search and exploration for cultural heritage collections: the EU cultura project

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160406