CN101986309A - 查询题库的方法及装置 - Google Patents
查询题库的方法及装置 Download PDFInfo
- Publication number
- CN101986309A CN101986309A CN2010105458639A CN201010545863A CN101986309A CN 101986309 A CN101986309 A CN 101986309A CN 2010105458639 A CN2010105458639 A CN 2010105458639A CN 201010545863 A CN201010545863 A CN 201010545863A CN 101986309 A CN101986309 A CN 101986309A
- Authority
- CN
- China
- Prior art keywords
- keyword
- exam pool
- inquire
- literal
- inquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种查询题库的方法及装置,其应用于具有题库的电子装置中,包括接收输入模块输入的所需查询数据,由辨识模块使用文字分词库分析欲查询数据,利用关联模块交集比对已被分析的欲查询数据及关键词文字库,用来产生关键词集合,根据关键词集合在分类题库中查询出试题数据组,并组成题库。便于使用者在分类题库中做直接简明的查询,且根据欲查询数据与关键词文字库的关联度提供相应程度的试题。
Description
技术领域
本发明涉及一种查询题库的方法及装置,尤其是一种以欲查询数据对题库进行查询的方法及装置。
背景技术
目前,试题数据库的电子化程度已日渐普及,许多电子装置设置了试题数据库,而利用电子装置进行相关测验的技术也早已令大众所熟知,目前市面所流通的教育学习装置或计算机辅助教学(Computer Aided Instruction;CAI)软件等。其中,上述装置及软件大多配置一套试题数据库,且该试题数据库中储存有不同难易程度、科目、级别及类型的试题,针对不同程度的使用者,可以自主选择要测验学习的级别,据此,可供使用者通过实作试题达到学习的效果,且使用者得以通过各式电子装置,如PDA、电子辞典或个人计算机等使用试题数据库。
上述试题数据库通常只有配置简单的关键词查询,有时使用者无法想到或选择适当的关键词,或输入关键词时得到的查询结果只与该关键词相关而过于狭隘,无法立即获得使用者欲查询的试题,如此,不但会花费使用者大量时间进行查询与查阅,而且,此种关键词查询也可能因关键词判断错误,导致使用者无法找到适合自己程度的试题,对使用者而言,则会花费过多精神于此,则可能会令使用者失去使用此试题数据库的兴趣,因此,上述试题数据库的一般查询方式显然无法让使用者快速寻找到准确的试题数据组。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出查询题库的方法及装置。
本发明的技术解决方案是本发明为一种查询题库的方法,其特殊之处在于:该方法包含以下步骤:
1)建立文字分词库,由多个文字分词集合而成,用来辨识分析欲查询数据的关键词;
2)建立分类题库,储存试题数据组;
3)建立关键词文字库,储存分类题库的第一关键词及第一关键词在分类题库中个别的出现次数;
4)经过输入模块输入欲查询数据;
5)辨识模块根据欲查询数据,并使用文字分词库分析,取得第二关键词;
6)关联查询模块根据第二关键词交集比对关键词文字库的第一关键词,提取出交集比对结果;并根据交集比对结果至分类题库查询出与交集比对查询相关的试题数据组;
7)试题数据组根据交集比对结果内的第一关键词出现次数高低排序出一题库。
上述文字分词为经过提取单一词汇方法分析而成。
上述提取单一词汇方法为过滤词性并保留有意义词汇、忽略连接词及标点符号以提取出单一词汇。
一种查询题库的装置,其特殊之处在于:该装置包括:记忆单元,包括:文字分词库,储存单一中文词汇;分类题库,储存试题数据组;关键词文字库,储存分类题库的第一关键词及第一关键词在分类题库的出现次数;输入单元,接收欲查询数据;处理单元,利用经过输入单元输入的欲查询数据与记忆单元的文字分词库比对分析出第二关键词,且利用第二关键词至记忆单元的关键词文字库中交集比对出出现次数最高的第一关键词,以交集比对的结果在记忆单元的分类题库进行查询得出试题数据组,并以第一关键词的出现次数为索引排序试题数据组生成题库;输出单元,输出题库至输出装置,处理单元分别与记忆单元、输入单元和输出单元连接。
上述装置为电子字典、个人计算机、手持装置或个人行动助理机。
上述输入单元为键盘或手写装置。
上述输出装置为屏幕或打印机。
本发明提供的查询题库的方法及装置,其应用于具有题库的电子装置中,包括接收输入模块输入的所需查询数据,由辨识模块使用文字分词库分析欲查询数据,利用关联模块交集比对已被分析的欲查询数据及关键词文字库,用来产生关键词集合,根据关键词集合在分类题库中查询出试题数据组,并组成题库。便于使用者在分类题库中做直接简明的查询,且根据欲查询数据与关键词文字库的关联度提供相应程度的试题。
附图说明
图1为本发明查询题库的方法流程图;
图2为本发明查询题库的装置示意图;
图3为本发明第一实施例状态示意图;
图4为本发明第二实施例状态示意图。
其中,10-记忆单元,100-文字分词库,101-分类题库,102-关键词文字库,11-输入单元,110-输入模块,12-处理单元,120-关联查询模块,121-辨识模块,13-输出单元;
具体实施方式
参见图1,本方法包括:
(S10)使用者在输入模块输入欲查询数据;
(S20)根据预先建立的文字分词库,其包括多个文字分词,利用欲查询数据经过辨识模块根据文字分词库提取欲查询数据的第二关键词;
(S30)根据第二关键词,经过关联查询模块通过关键词文字库的第一关键词与第二关键词相同者,产生关键词集合,若有,则进行至步骤(S40),否则进行至(S70);
(S40)利用上述步骤的关键词集合至分类题库查询出试题数据组,并得到试题数据组;
(S50)将分类题库查询出试题数据组,根据关键词集合在关键词文字库中所记录的个别出现次数高低排序出一套题库;
(S60)查询过程结束,清空输入模块,供使用者再次输入。
参见图2,本装置包含记忆单元10、输入单元11、处理单元12及输出单元13,其中,记忆单元10包括储存单一中文词汇集合的文字分词库100,储存试题数据组的分类题库101,储存由分类题库101分析提取而出的第一关键词及第一关键词的出现次数的关键词文字库102,输入单元11接收欲查询数据,处理单元12利用被输入的欲查询数据,经过文字分词库100比对分析出第二关键词,并利用第二关键词至关键词文字库102选出符合第一关键词的关键词集合,利用此关键词集合至分类题库101查询得出试题数据组,并以第一关键词在关键词文字库的出现次数排序试题数据组产出一题库,后由输出单元13输出此题库至输出装置。
据上所述,本发明的查询题库的方法在分析欲查询数据时,辨识模块121主要利用文字分词库100的文字分词进行辨识比对,此文字分词经过提取单一词汇方法分析之后所产生的独立词汇,提取单一词汇方法为过滤词性并保留有意义词汇、忽略连接词及标点符号的方法,如下例所示:
已知有一点位于第四象限,且距离x轴3个单位长,距离y轴0.6个单位长,请问这点的坐标为何?
经过文字分词后
已知/有/一点/位于/第四/象限/,且/距离/x/轴/3/个/单位长/,距离/y/轴/0.6/个/单位长/,请问/这/点/的/坐标/为何/?
提取出的第二关键词
/一点/第四/象限/距离/x/轴/单位长/距离/y/轴/坐标/
通过此分词方法,使用者可有较大的弹性在输入模块110输入欲查询数据,其欲查询数据可为关键词,也可为完整题目,当欲查询数据经由此分词方法提取出第二关键词后,此第二关键词通过关联查询模块120根据关键词文字库102的第一关键词选出相同的关键词集合,并将此关键词集合送至分类题库进行查询得出试题数据组,此试题数据组以关键词集合中的关键词出现次数排序成题库,达到使用者可自由弹性输入欲查询数据的条件,并可精确查询出最符合条件的题库。
参见图3,电子装置为电子辞典,记忆单元10为安装在电子辞典上的记忆卡,输入单元11为电子辞典的键盘,处理单元12为电子辞典的中央处理器,输出单元13为电子辞典的液晶屏幕,其中,记忆单元10包括文字分词库100、分类题库101及关键词文字库102,文字分词库100、分类题库101及关键词文字库102为关联性数据库,文字分词库100预先存入可做单一词汇提取的文字分词,分类题库101为储存试题数据组,关键词文字库102为预先储存由分类题库101提取的第一关键词及第一关键词的出现次数,处理单元12包含关联查询模块120及辨识模块121,关联查询模块120及辨识模块121为预先编写好的程序。
当使用者在电子辞典的键盘或手写笔输入欲查询数据,设定相关查询条件后执行开始搜寻指令,辨识模块12通过比对文字分词库100内的文字分词与输入的欲查询数据得到一组第二关键词,并以此第二关键词与关键词文字库102的第一关键词,利用关联查询模块选出第二关键词中与第一关键词相同的关键词集合,并以此关键词集合为索引查找分类题库101并得到试题数据组,且利用关键词文字库的第一关键词的出现次数由高到低排序,由于电子辞典显示有限,可根据使用者需要,仅列出第一关键词排行较前的部分笔数,更增加了查询的弹性。
参见图4,电子装置为个人计算机,记忆单元10为安装在个人计算机上的硬盘,输入单元11为个人计算机的键盘与鼠标,处理单元12为个人计算机的CPU,输出单元13为个人计算机的液晶屏幕或打印机,其中,记忆单元10需包括文字分词库100、分类题库101及关键词文字库102,文字分词库100、分类题库101及关键词文字库102为关联性数据库,处理单元12包含关联查询模块120及辨识模块121,关联查询模块120及辨识模块121为预先编写好的程序。
当使用者在输入单元11输入欲查询数据,设定相关查询条件后执行开始搜寻指令,通过比对文字分词库100内的文字分词与输入的欲查询数据得到一组第二关键词,并以此第二关键词与关键词文字库102的第一关键词,利用关联查询模块选出第二关键词中与第一关键词相同的关键词集合,并以此关键词集合为索引查找分类题库101并得到试题数据组,由于个人计算机可加装如打印机的输出装置,可根据使用者需要,直接打印产生题库,更增加了使用的便利。
Claims (7)
1.一种查询题库的方法,其特征在于:该方法包含以下步骤:
1)建立文字分词库,由多个文字分词集合而成,用来辨识分析欲查询数据的关键词;
2)建立分类题库,储存试题数据组;
3)建立关键词文字库,储存分类题库的第一关键词及第一关键词在分类题库中个别的出现次数;
4)输入欲查询数据;
5)根据欲查询数据,并使用文字分词库分析,取得第二关键词;
6)关联查询模块根据第二关键词交集比对关键词文字库的第一关键词,提取出交集比对结果;并根据交集比对结果至分类题库查询出与交集比对查询相关的试题数据组;
7)试题数据组根据交集比对结果内的第一关键词出现次数高低排序出一题库。
2.根据权利要求1所述的一种查询题库的方法,其特征在于:所述文字分词为经过提取单一词汇方法分析而成。
3.根据权利要求2所述的一种查询题库的方法,其特征在于:所述提取单一词汇方法为过滤词性并保留有意义词汇、忽略连接词及标点符号以提取出单一词汇。
4.一种查询题库的装置,其特征在于:该装置包括:记忆单元,包括:文字分词库,储存单一中文词汇;分类题库,储存试题数据组;关键词文字库,储存分类题库的第一关键词及第一关键词在分类题库的出现次数;输入单元,接收欲查询数据;处理单元,利用经过输入单元输入的欲查询数据与记忆单元的文字分词库比对分析出第二关键词,且利用第二关键词至记忆单元的关键词文字库中交集比对出出现次数最高的第一关键词,以交集比对的结果在记忆单元的分类题库进行查询得出试题数据组,并以第一关键词的出现次数为索引排序试题数据组生成题库;输出单元,输出题库至输出装置,所述处理单元分别与记忆单元、输入单元和输出单元连接。
5.根据权利要求4所述的一种查询题库的装置,其特征在于:所述装置为电子字典、个人计算机、手持装置或个人行动助理机。
6.根据权利要求4所述的一种查询题库的装置,其特征在于:所述输入单元为键盘或手写装置。
7.根据权利要求4所述的一种查询题库的装置,其特征在于:所述输出装置为屏幕或打印机。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105458639A CN101986309A (zh) | 2010-11-16 | 2010-11-16 | 查询题库的方法及装置 |
PCT/CN2010/079983 WO2012065332A1 (zh) | 2010-11-16 | 2010-12-20 | 查询题库的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105458639A CN101986309A (zh) | 2010-11-16 | 2010-11-16 | 查询题库的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101986309A true CN101986309A (zh) | 2011-03-16 |
Family
ID=43710655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105458639A Pending CN101986309A (zh) | 2010-11-16 | 2010-11-16 | 查询题库的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN101986309A (zh) |
WO (1) | WO2012065332A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136302A (zh) * | 2011-12-05 | 2013-06-05 | 北大方正集团有限公司 | 试题重复输出的方法和装置 |
CN103309991A (zh) * | 2013-06-19 | 2013-09-18 | 南京邮电大学 | 一种基于高校危险品仓库管理程序中的查询方法 |
CN104699831A (zh) * | 2015-03-31 | 2015-06-10 | 佛山市金蓝领教育科技有限公司 | 原子词知识管理系统 |
CN105243909A (zh) * | 2015-10-29 | 2016-01-13 | 高大伟 | 一种知识体系三维测评系统 |
CN105354290A (zh) * | 2015-10-30 | 2016-02-24 | 山东合天智汇信息技术有限公司 | 一种基于移动终端mac地址查找特定人员的方法及系统 |
CN109255019A (zh) * | 2018-09-07 | 2019-01-22 | 广州爱易学智能信息科技有限公司 | 一种基于人工智能的在线题库及其应用方法 |
CN113688262A (zh) * | 2021-09-01 | 2021-11-23 | 北京云蝶智学科技有限公司 | 数据归类方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009715A (zh) * | 2017-11-28 | 2018-05-08 | 邢加和 | 一种自动分析指标波动根因的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079056A (zh) * | 2007-02-06 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 一种搜索方法和系统 |
CN101162146A (zh) * | 2007-02-01 | 2008-04-16 | 厦门雅迅网络股份有限公司 | 一种联网车载导航设备中兴趣点按拼音首字母检索的方法 |
CN101187928A (zh) * | 2007-08-14 | 2008-05-28 | 新诺亚舟科技(深圳)有限公司 | 在个人手持学习终端上实现的针对试题的搜索与学习相结合的方法 |
US20080312910A1 (en) * | 2007-06-14 | 2008-12-18 | Po Zhang | Dictionary word and phrase determination |
CN101369278A (zh) * | 2008-09-27 | 2009-02-18 | 成都市华为赛门铁克科技有限公司 | 一种近似匹配方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1335574A (zh) * | 2001-09-05 | 2002-02-13 | 罗笑南 | 智能语义搜索方法 |
CN101814080B (zh) * | 2006-09-05 | 2013-02-13 | 阿里巴巴集团控股有限公司 | 一种实现信息搜索的方法及系统 |
-
2010
- 2010-11-16 CN CN2010105458639A patent/CN101986309A/zh active Pending
- 2010-12-20 WO PCT/CN2010/079983 patent/WO2012065332A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101162146A (zh) * | 2007-02-01 | 2008-04-16 | 厦门雅迅网络股份有限公司 | 一种联网车载导航设备中兴趣点按拼音首字母检索的方法 |
CN101079056A (zh) * | 2007-02-06 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 一种搜索方法和系统 |
US20080312910A1 (en) * | 2007-06-14 | 2008-12-18 | Po Zhang | Dictionary word and phrase determination |
CN101187928A (zh) * | 2007-08-14 | 2008-05-28 | 新诺亚舟科技(深圳)有限公司 | 在个人手持学习终端上实现的针对试题的搜索与学习相结合的方法 |
CN101369278A (zh) * | 2008-09-27 | 2009-02-18 | 成都市华为赛门铁克科技有限公司 | 一种近似匹配方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136302A (zh) * | 2011-12-05 | 2013-06-05 | 北大方正集团有限公司 | 试题重复输出的方法和装置 |
CN103309991A (zh) * | 2013-06-19 | 2013-09-18 | 南京邮电大学 | 一种基于高校危险品仓库管理程序中的查询方法 |
CN104699831A (zh) * | 2015-03-31 | 2015-06-10 | 佛山市金蓝领教育科技有限公司 | 原子词知识管理系统 |
CN105243909A (zh) * | 2015-10-29 | 2016-01-13 | 高大伟 | 一种知识体系三维测评系统 |
CN105354290A (zh) * | 2015-10-30 | 2016-02-24 | 山东合天智汇信息技术有限公司 | 一种基于移动终端mac地址查找特定人员的方法及系统 |
CN109255019A (zh) * | 2018-09-07 | 2019-01-22 | 广州爱易学智能信息科技有限公司 | 一种基于人工智能的在线题库及其应用方法 |
CN109255019B (zh) * | 2018-09-07 | 2021-06-08 | 广州爱易学智能信息科技有限公司 | 一种在线查询题库及其应用方法 |
CN113688262A (zh) * | 2021-09-01 | 2021-11-23 | 北京云蝶智学科技有限公司 | 数据归类方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2012065332A1 (zh) | 2012-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108717406B (zh) | 文本情绪分析方法、装置及存储介质 | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
CN108629043B (zh) | 网页目标信息的提取方法、装置及存储介质 | |
CN101986309A (zh) | 查询题库的方法及装置 | |
RU2661750C1 (ru) | Распознавание символов с использованием искусственного интеллекта | |
Parthiban et al. | Optical character recognition for English handwritten text using recurrent neural network | |
CN109766438A (zh) | 简历信息提取方法、装置、计算机设备和存储介质 | |
CN104809142A (zh) | 商标查询系统和方法 | |
CN110674271A (zh) | 一种问答处理方法及装置 | |
CN108038099B (zh) | 基于词聚类的低频关键词识别方法 | |
Lancia | T-LAB pathways to thematic analysis | |
CN105653547B (zh) | 一种提取文本关键词的方法和装置 | |
CN110046264A (zh) | 一种面向手机文档的自动分类方法 | |
CN106294786A (zh) | 一种代码搜索方法和系统 | |
KR20220134695A (ko) | 인공지능 학습 모델을 이용한 저자 식별 시스템 및 그 방법 | |
Patel et al. | Dynamic lexicon generation for natural scene images | |
CN102243708B (zh) | 一种手写识别方法、系统及手写识别终端 | |
CN113918686A (zh) | 智能问答模型构建方法、装置、计算机设备及存储介质 | |
Abuzaraida et al. | Online handwriting Arabic recognition system using k-nearest neighbors classifier and DCT features | |
CN102221976A (zh) | 基于非完整识别的词语快速输入方法 | |
Celikyilmaz et al. | Leveraging web query logs to learn user intent via bayesian latent variable model | |
Roy et al. | CNN based recognition of handwritten multilingual city names | |
CN112307314A (zh) | 搜索引擎精选摘要的生成方法和装置 | |
CN109325096B (zh) | 一种基于知识资源分类的知识资源搜索系统 | |
CN101901348A (zh) | 一种基于归一化的手写识别方法和识别装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110316 |