KR20180073440A - 시험지 인식을 통한 유사 문제 추출 장치 및 그 방법 - Google Patents

시험지 인식을 통한 유사 문제 추출 장치 및 그 방법 Download PDF

Info

Publication number
KR20180073440A
KR20180073440A KR1020170152320A KR20170152320A KR20180073440A KR 20180073440 A KR20180073440 A KR 20180073440A KR 1020170152320 A KR1020170152320 A KR 1020170152320A KR 20170152320 A KR20170152320 A KR 20170152320A KR 20180073440 A KR20180073440 A KR 20180073440A
Authority
KR
South Korea
Prior art keywords
question
test paper
test
unit
text
Prior art date
Application number
KR1020170152320A
Other languages
English (en)
Other versions
KR102004180B1 (ko
Inventor
김학현
Original Assignee
주식회사 에스비앤컴퍼니
김학현
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에스비앤컴퍼니, 김학현 filed Critical 주식회사 에스비앤컴퍼니
Publication of KR20180073440A publication Critical patent/KR20180073440A/ko
Application granted granted Critical
Publication of KR102004180B1 publication Critical patent/KR102004180B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F17/30634
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/06Electrically-operated teaching apparatus or devices working with questions and answers of the multiple-choice answer-type, i.e. where a given question is provided with a series of answers and a choice has to be made from the answers

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 기 저장된 문제들에서 문제별 텍스트만을 추출하여 생성한 문제별 텍스트 정보와, 시험지를 인식한 후 생성한 시험지의 문제별 텍스트 정보를 비교해서 유사도를 측정하여 저장함으로써, 문제별로 유사한 문제들을 검색하여 추출할 수 있도록 하는 시험지 인식을 통한 유사 문제 추출 장치 및 그 방법에 관한 것이다.
상기 유사 문제 추출 장치는, 시험문제DB부(110); 문제별 텍스트 정보를 추출하여 상기 시험문제DB부(110)에 저장하는 문제별텍스트추출부(120); 스캐닝된 시험지 이미지를 상기 시험문제DB부(110)에 저장하는 관리자스캔부(130); 상기 시험지 이미지를 이미지 처리하여 문제별 이미지 정보인 시험지문제를 분리한 후 상기 시험문제DB부(110)에 저장하는 시험지문제분리부(140); 상기 시험지문제들로부터 시험지문제별텍스트를 추출하여 상기 시험문제DB부(110)에 저장하는 문제OCR부(150); 상기 시험지문제별텍스트와 상기 문제별 텍스트 정보를 비교하여 문제 유사도를 추출한 후 각각의 비교된 문제를 유사문제로 추출하여 상기 시험문제DB부(110)에 저장하는 문제유사도측정부(160); 및 상기 시험지문제별 유사도를 가지는 유사문제들을 조회할 수 있도록 하고, 유사문제들을 선택하여 문제출제를 위해 추출할 수 있도록 하는 측정결과 조회 및 선정부(170);를 포함하여 구성된다.

Description

시험지 인식을 통한 유사 문제 추출 장치 및 그 방법{APPARATUS AND METHOD FOR EXTRACTING SIMILAR TEST PROBLEM USING RECOGNITION OF TEST PAPER}
본 발명은 유사한 문제를 추출하는 것에 관한 것으로서, 더욱 상세하게는, 기 저장된 문제들에서 문제별 텍스트만을 추출하여 생성한 문제별 텍스트 정보와, 시험지를 인식한 후 생성한 시험지의 문제별 텍스트 정보를 비교해서 유사도를 측정하여 저장함으로써, 문제별로 유사한 문제들을 검색하여 추출할 수 있도록 하는 시험지 인식을 통한 유사 문제 추출 장치 및 그 방법에 관한 것이다.
인터넷 기술의 발달에 의해 다양한 시험을 온라인을 통해 치를 수 있는 시스템이 제공되고 있다.
이에 따라, 대한민국 공개특허 2004-0015786호에는 문제들을 유사한 문제별로 분류하여 문제폴더를 생성한 후, 해당 문제폴더 내의 문제를 무작위로 추출하여 출제를 수행하는 인터넷 상에서의 시험문제 자동 출제 방법을 개시한다.
그러나 상술한 종래기술은 시험문제를 무작위로 추출하여 출제할 수 있도록 하는 기능은 가지나, 기존의 시험문제와 유사한 문제들을 자동으로 추출해 주지 못하는 문제점을 가진다.
대한민국 공개특허 2004-0015786호
따라서 본 발명은 상술한 종래기술의 문제점을 해결하기 위한 것으로서, 기출된 시험지를 스캔하여 입력하는 경우, 문제별로 유사한 문제들을 추출하여 줌으로써, 기출된 문제와 유사한 문제들에 대한 시험 출제 또는 자율학습을 수행할 수 있도록 하는 시험지 인식을 통한 유사 문제 추출 장치 및 그 방법을 제공하는 것을 목적으로 한다.
상술한 목적을 달성하기 위한 본 발명의 유사 문제 추출 장치는,
문제들의 문제별 텍스트정보, 시험지의 스캐닝 이미지로서의 시험지이미지, 시험지이미지로부터 분리된 문제 이미지인 시험지문제, 시험지문제로부터 추출된 시험지문제별텍스트, 시험지문제별텍스트와 문제별 텍스트정보를 비교하여 생성된 유사도를 가지는 유사문제들 정보인 시험지문제별 측정결과를 데이터베이스화 하여 저장하는 시험문제DB부(110);
문제별 텍스트 정보를 추출하여 상기 시험문제DB부(110)에 저장하는 문제별텍스트추출부(120);
스캐닝된 시험지 이미지를 상기 시험문제DB부(110)에 저장하는 관리자스캔부(130);
상기 시험지 이미지를 이미지 처리하여 문제별 이미지 정보인 시험지문제를 분리한 후 상기 시험문제DB부(110)에 저장하는 시험지문제분리부(140);
상기 시험지문제들로부터 시험지문제별텍스트를 추출하여 상기 시험문제DB부(110)에 저장하는 문제OCR부(150);
상기 시험지문제별텍스트와 상기 문제별 텍스트 정보를 비교하여 문제 유사도를 추출한 후 각각의 비교된 문제를 유사문제로 추출하여 상기 시험문제DB부(110)에 저장하는 문제유사도측정부(160); 및
상기 시험지문제별 유사도를 가지는 유사문제들을 조회할 수 있도록 하고, 유사문제들을 선택하여 문제출제를 위해 추출할 수 있도록 하는 측정결과 조회 및 선정부(170);를 포함하여 구성되고,
상기 문제OCR부(150)는,
수학 기호와 수학 구성식을 주요 구성 요소로 지정하고 숫자를 변수로 지정하여 시험지문제별텍스트를 추출하고,
상기 문제유사도측정부(160)는,
사용자로부터 특정한 수학 기호, 수학 구성식, 수학 용어 및 문제의 원리와 내용 중 적어도 하나의 비교대상을 지정 받고, 지정된 비교대상을 우선 순위로 하여 문제 유사도를 추출하고,
상기 문제의 원리와 내용에 대한 비교대상은 머신러닝 엔진을 이용하여 문제 유사도를 추출한다.
상기 시험문제DB부(110)는,
문제별텍스트추출부(120)가 추출한 문제별 텍스트 정보를 저장하는 문제별텍스트DB(111);
관리자스캔부(130)가 출력하는 스캐닝된 시험지 이미지를 저장하는 시험지DB(113);
시험지문제분리부(140)가 상기 시험지 이미지를 이미지 처리하여 생성한 문제별 이미지 정보인 시험지문제를 시험지별 문제번호별로 저장하는 시험지문제DB(115);
문제OCR부(150)가 상기 시험지문제DB(115)에 저장된 시험지문제들로부터 추출한 시험지문제별텍스트를 저장하는 시험지문제별텍스트DB(117); 및
상기 문제유사도측정부(160)가 상기 시험지문제별텍스트와 상기 문제별텍스트를 비교하여 생성한 유사도와 상기 문제별 텍스트를 시험지문제별측정결과 정보로 저장하는 시험지문제별측정결과DB(119);를 포함하여 구성될 수 있다.
상기 문제별 텍스트 정보는 문제은행의 문제들로부터 기 추출되어 저장되고,상기 문제은행의 문제들을 수학문제 DB부가 소유한 문제들을 포함할 수 있다.
상기 시험지DB(113)에 저장되는 시험지 이미지는 학교/년도/학년/학기/중간 또는 기말 정보를 가지고 저장될 수 있다.
상기 시험지문제분리부(140)는,
시험지 이미지를 세로선, 여백, 문제번호를 기준으로 이미지를 분리하여 문제별 이미지를 시험지문제들로 추출하도록 구성될 수 있다.
상술한 목적을 달성하기 위한 본 발명의 유사 문제 추출 방법은, 문제별텍스트DB(111)와 시험지DB(113)와 시험지문제DB(115)와 시험지문제별텍스트DB(117)와 시험지문제별측정결과DB(119)를 포함하는 시험문제DB부(110), 문제별텍스트추출부(120), 관리자스캔부(130), 시험지문제분리부(140), 문제OCR부(150), 문제유사도측정부(160) 및 측정결과 조회 및 선정부(170)를 포함하는 유사 문제 추출 장치(100)에 의한 유사 문제 추출 방법에 있어서,
문제별텍스트추출부(120)가 기 저장되어 등록된 문제들로부터 추출한 문제별 텍스트 정보를 문제별텍스트DB(111)에 저장하는 문제별덱스트DB생성과정(S100);
관리자스캔부(130)가 스캐닝된 시험지 이미지를 분류하여 시험지DB(113)에 저장하는 시험지DB생성과정(S200);
시험지문제분리부(140)가 상기 시험지 이미지를 이미지 처리하여 문제별 이미지 정보인 시험지문제를 생성한 후 시험지별 문제번호별로 시험지문제DB(115)에 저장하는 시험지문제DB생성과정(S300);
문제OCR부(150)가 상기 시험지문제DB(115)에 저장된 시험지문제들로부터 시험지문제별텍스트를 추출하여 시험지문제별텍스트DB(117)에 저장하는 시험지문제별텍스트DB생성과정(S400);
문제유사도측정부(160)가 상기 시험지문제별텍스트와 상기 문제별텍스트를 비교하여 유사도를 측정하고, 문제별 텍스트를 가지는 문제들과 측정된 유사도를 시험지문제별측정결과 정보로 시험지문제별측정결과DB(119)에 저장하는 시험지문제별측정결과DB생성과정(S500); 및
측정결과 조회 및 선정부(180)가 입력된 명령에 따라 상기 시험지문제별로 측정된 유사도와 유사도 대응 문제를 검색하여 출력하고, 입력된 선택 신호에 대응하는 문제를 출제 문제로 출력하는 측정결과 조회 및 선정과정(S600)을 포함하고,
상기 시험지문제별텍스트DB생성과정(S400)은,
상기 문제OCR부(150)를 통해 수학 기호와 수학 구성식을 주요 구성 요소로 지정하고 숫자를 변수로 지정하여 시험지문제별텍스트를 추출하고,
상기 시험지문제별측정결과DB생성과정(S500)은,
사용자로부터 특정한 수학 기호, 수학 구성식, 단어, 문구 표현 패턴 및, 문제의 원리와 내용 중 적어도 하나의 비교대상을 지정 받고, 지정된 비교대상을 우선 순위로 하여 문제 유사도를 추출하고,
상기 문제의 원리와 내용에 대한 비교대상은 머신러닝 엔진을 이용하여 문제 유사도를 추출한다.
상기 시험지DB(113)에 저장되는 시험지 이미지는 학교/년도/학년/학기/중간 또는 기말 정보를 가지고 저장될 수 있다.
상기 시험지문제DB생성과정(S300)에서 상기 시험지문제분리부(140)가 추출한 시험지문제는,
시험지 이미지를 세로선, 여백, 문제번호를 기준으로 이미지를 분리하여 추출된 문제별 이미지인 것을 특징으로 한다.
상술한 구성을 가지는 본 발명의 유사 문제 추출 장치 및 그 방법은, 기 저장된 문제들에서 문제별 텍스트만을 추출하여 생성한 문제별 텍스트 정보와, 시험지를 인식한 후 생성한 시험지의 문제별 텍스트 정보를 비교해서, 유사도를 측정하여 저장함으로써, 문제별로 유사한 문제들을 검색하여 추출할 수 있도록 하는 것에 의해, 특정 시험지에 포함된 문제들과 유사한 문제들에 대한 학습을 수행할 수 있도록 함으로써, 학습 효과를 현저히 향상시킬 수 있도록 하는 효과를 제공한다.
도 1은 본 발명의 실시예에 따르는 유사 문제 추출 장치(100)의 구성도.
도 2는 본 발명의 유사 문제 추출 방법의 처리과정을 나타내는 순서도.
도 3은 본 발명의 구성별 유사 문제 추출 방법의 순차적 처리과정을 나타내는 도면.
도 4는 시험지문제분리부(140)에 의한 시험지문제분리 기준을 나타내는 도면.
도 5는 유사 문제 추출 장치(1)가 탑재된 유사 문제 추출 서버(1)의 기능 블록 구성도.
도 6은 유사 문제 추출 서버(1)를 이용한 인터넷을 통한 유사 문제 추출 서비스를 제공하는 유사 문제 추출 서비스 제공 시스템의 구성도.
도 7은 본 발명의 실시예에 따른 문제와 연결된 원리 데이터베이스 사례를 나타낸 도면.
도 8은 본 발명의 실시예에 따른 문제와 연결된 용어 데이터베이스 사례를 나타낸 도면.
하기에서 본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
본 발명의 개념에 따른 실시 예는 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있으므로, 특정 실시 예들을 도면에 예시하고 본 명세서 또는 출원서에 상세하게 설명하고자 한다. 그러나 이는 본 발명의 개념에 따른 실시 예를 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명은 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 본 발명의 실시예를 나타내는 첨부 도면을 참조하여 본 발명을 더욱 상세히 설명한다.
도 1은 본 발명의 실시예에 따르는 유사 문제 추출 장치(100)의 구성도이다.
도 1과 같이 상기 유사 문제 추출 장치(100)는 시험문제DB부(110), 문제별텍스트추출부(120), 관리자스캔부(130), 시험지문제분리부(140), 문제OCR부(150), 문제유사도측정부(160) 및 측정결과 조회 및 선정부(170)를 포함하여 구성된다.
상기 시험문제DB부(110)는, 문제들이 문제별 텍스트정보, 시험지의 스캐닝 이미지로서의 시험지이미지, 시험지이미지로부터 분리된 문제 이미지인 시험지문제, 시험지문제로부터 추출된 시험지문제별텍스트, 시험지문제별텍스트와 문제별 텍스트정보를 비교하여 생성된 유사도를 가지는 유사문제들 정보인 시험지문제별 측정결과를 데이터베이스화 하여 저장한다.
이를 위해, 상기 시험문제DB부(110)는 문제별텍스트추출부(120)가 추출한 문제별 텍스트 정보를 저장하는 문제별텍스트DB(111), 관리자스캔부(130)가 출력하는 스캐닝된 시험지 이미지를 저장하는 시험지DB(113), 시험지문제분리부(140)가 상기 시험지 이미지를 이미지 처리하여 생성한 문제별 이미지 정보인 시험지문제를 시험지별 문제번호별로 저장하는 시험지문제DB(115), 문제OCR부(150)가 상기 시험지문제DB(115)에 저장된 시험지문제들로부터 추출한 시험지문제별텍스트를 저장하는 시험지문제별텍스트DB(117) 및 상기 문제유사도측정부(160)가 상기 시험지문제별텍스트와 상기 문제별텍스트를 비교하여 생성한 유사도와 상기 문제별 텍스트를 시험지문제별측정결과 정보로 저장하는 시험지문제별측정결과DB(119);를 포함하여 구성될 수 있다.
상기 문제별텍스트추출부(120)는 문제별 텍스트 정보를 추출하여 상기 시험문제DB부(110)에 저장하도록 구성된다. 여기서, 상기 문제들은 문제은행의 문제들 또는 수학문제 DB부 등이 보유하는 문제들일 수 있다. 이때 추출된 상기 문제별 텍스트 정보는 시험지에 포함된 문제와의 유사도 측정을 위한 비교 시 사용된다.
상기 관리자스캔부(130)는 스캔부(60)를 통해 입력된 스캐닝된 시험지 이미지를 상기 시험문제DB부(110)에 저장하도록 구성된다. 이 경우, 상기 시험지DB(113)에 저장되는 시험지 이미지는 학교/년도/학년/학기/중간 또는 기말 정보를 가지고 저장될 수 있다.
상기 시험지문제분리부(140)는 상기 시험지 이미지를 이미지 처리하여 문제별 이미지 정보인 시험지문제를 분리한 후 상기 시험문제DB부(110)에 저장하도록 구성된다. 상기 시험지 미지에 대한 이미지 처리는 시험지 이미지를 세로선, 여백, 문제번호를 기준으로 이미지를 분리하여 문제별 이미지를 시험지문제들로 추출하도록 구성될 수 있다(도 4 참조).
상기 문제OCR부(150)는 시험지문제분리부(140)에 의해 분리된 시험지문제별 이미지인 시험지문제들로부터 시험지문제별텍스트를 추출하여 상기 시험문제DB부(110)에 저장하도록 구성된다. 이 경우 추출되는 시험지문제들은 인식률을 높이기 위해 수학문제에 특화하여 커스트마이징될 수 있다. 즉, 수학문제의 경우에는 수식의 경우 수식을 이르는 수학 기호를 주요 구성 요소로 추출하여 함께 저장하도록 구성될 수 있다. 예를 들어, Root(2) 와 Root(3)은 Root가 주요 구성 요소로 추출되고, 2와 3은 X 변수로 취급하여 두 식은 같은 수학 기호를 사용하는 것으로 저장된다. 또한, 비례식 3 : 4 = 6:X 라면, :=: 라는 수학 구성식을 추출하여 주요 구성 요소로 추출한 후 저장된다. 또한 추출된 시험지문제별 텍스트는 사용자가 보정할 수 있도록 생성되는 것이 바람직하다.
상기 문제유사도측정부(160)는 상기 시험지문제별텍스트와 상기 문제별 텍스트 정보를 비교하여 문제 유사도를 추출한 후 각각의 비교된 문제를 유사문제로 추출하여 상기 시험문제DB부(110)에 저장하도록 구성된다. 이때 측정된 문장 유사도의 정확성을 높이기 위해 머신 러닝(Machine Learning)이 문장 유사도 측정 방식에 적용될 수 있다.
상기 측정결과 조회 및 선정부(170)는 상기 시험지문제별 유사도를 가지는 유사문제들을 조회할 수 있도록 하고, 유사문제들을 선택하여 문제출제를 위해 추출할 수 있도록 구성된다.
즉, 상기 측정결과 조회 및 선정부(170)는 시험지 문제별 유사도를 가지는 문제들을 추출하여 표시하여 주고, 표시된 문제들 중 출제 대상 문제를 선택할 수 있도록 하는 인터페이스를 제공하여 주는 것에 의해 사용자가 시험지의 문제별 유사한 문제들을 검색하거나 시험을 위한 문제들을 선택하여 출제할 수 있도록 한다.
또한 상기 유사 문제 추출 장치(1)는 인터넷을 통한 유사문제 출제 서비스를 제공을 위한 인터페이스를 제공하는 인터넷서비스부(170)를 더 포함하여 구성될 수 있다.
도 2는 본 발명의 유사 문제 추출 방법의 처리과정을 나타내는 순서도이고, 도 3은 본 발명의 구성별 유사 문제 추출 방법의 순차적 처리과정을 나타내는 도면이다.
도 2 및 도 3과 같이, 상기 유사 문제 추출 방법은, 문제별텍스트DB(111)와 시험지DB(113)와 시험지문제DB(115)와 시험지문제별텍스트DB(117)와 시험지문제별측정결과DB(119)를 포함하는 시험문제DB부(110), 문제별텍스트추출부(120), 관리자스캔부(130), 시험지문제분리부(140), 문제OCR부(150), 문제유사도측정부(160) 및 측정결과 조회 및 선정부(170);를 포함하는 유사 문제 추출 장치(100)에 의한 유사 문제 추출 방법에 있어서, 문제별덱스트DB생성과정(S100), 시험지DB생성과정(S200), 시험지문제DB생성과정(S300), 시험지문제별텍스트DB생성과정(S400), 시험지문제별측정결과DB생성과정(S500) 및 측정결과 조회 및 선정과정(S600)을 포함하여 이루어진다.
구체적으로, 상기 문제별텍스트DB생성과정(S100)에서 문제별텍스트추출부(120)가 기 저장되어 등록된 문제들로부터 추출한 문제별 텍스트 정보를 문제별텍스트DB(111)에 저장하는 문제별텍스트DB(111)를 생성한다.
시험지DB생성과정(S200)에서 관리자스캔부(130)가 스캐닝된 시험지 이미지를 분류하여 시험지DB(113)에 저장하여 시험지DB(113)를 생성한다.
이 후, 시험지문제DB생성과정(S300)에서 시험지문제분리부(140)가 상기 시험지 이미지를 이미지 처리하여 문제별 이미지 정보인 시험지문제를 생성한 후 문제번호별로 시험지문제DB(115)에 저장하는 것에 의해 시험지문제DB(115)를 생성한다.
도 4는 시험지문제분리부(140)에 의한 시험지문제분리 기준을 나타내는 도면이다.
도 4에 도시된 바와 같이, 시험지문제분리부(140)는 시험지이미지에서 단락을 구별하는 세로선(A)과 문제들을 구별하는 여백(B) 및 문제들의 시작인 문제번호(C)를 인식한 후 시험지문제들의 이미지를 분리하는 것에 의해 시험지문제들을 생성한다.
다시 도 2 및 도 3을 참조하면, 상기 텍스트DB생성과정(S400)에서 문제OCR부(150)가 상기 시험지문제DB(115)에 저장된 시험지문제들로부터 시험지문제별텍스트를 추출하여 시험지문제별텍스트DB(117)에 저장하여 시험지문제별텍스트DB(117)를 생성한다.
그리고 문제유사도측정부(160)가 시험지문제별측정결과DB생성과정(S500)을 수행하는 것에 의해 상기 시험지문제별텍스트와 상기 문제별텍스트를 비교하여 유사도를 측정하고, 문제별 텍스트를 가지는 문제들과 측정된 유사도들 시험지문제별측정결과 정보로 시험지문제별측정결과DB(119)에 저장하여 시험지문제별측정결과DB(119)를 생성한다.
또한, 문제유사도측정부(160)는, 사용자로부터 특정한 수학 기호, 수학 구성식, 단어, 수학 용어 및, 문제의 해결원리와 내용 중 적어도 하나의 비교대상을 지정 받고, 지정된 비교대상을 우선 순위로 하여 문제 유사도를 추출할 수 있다. 예를 들어, 제곱근(√), 인테그랄(∫), 시그마(∑) 등과 같은 수학 기호를 제1 비교대상으로 지정할 수 있고(추출된 문제 내 수학기호가 다양한 경우 사용자가 원하는 기호만 특정할 경우 사용), 비례식 등과 같은 수학 구성식을 제2 비교대상으로 지정할 수 있고, "합동인 삼각형", "합동 조건", "반지름", "부채꼴" 등의 수학 용어를 제3 비교대상으로 지정할 수 있다. 문제의 해결원리와 내용은 제4 비교대상으로서 지정할 수 있다. 문제의 해결원리는 가령, "주어진 집합에 포함되는 원소와 그렇지 않은 원소를 구분하여 원소포함기호를 바르게 나타낼 수 있는지를 묻고 있다." 등의 원리를 지정하거나, "주어진 집합에 포함되는 원소 고르기" 등의 문제에 대한 간략한 내용을 지정할 수 있다. 이는 사용자가 구체적인 사항을 직접 지정할 수 있으며, 머신러닝 엔진을 이용할 수 있다. 각 문제 별로 해결원리와 용어가 연결되어 있으므로, 문제 각각의 해결원리와 용어가 어떤 형태로 구성되어 있는지 머신러닝을 통해 학습될 수 있다. 또한, 추출한 문제와 연결된 해결원리와 용어를 학습한 머신러닝엔진에 시험문제를 제공하여 해당 시험문제가 나타나는 해결원리와 용어를 알아내고, 이러한 해결원리와 용어의 변형문제를 제공할 수 있다. 도 7에는 문제와 연결된 해결원리 데이터베이스 사례가 도시되어 있고, 도 8에는 문제와 연결된 용어 데이터베이스 사례가 도시되어 있다.한편, 상술한 제1 내지 제4 비교대상은 적어도 하나 이상 지정할 수 있으며, 이들 간의 우선 순위 또한 지정할 수 있다. 예를 들어, 제1 비교대상과 제2 비교대상만을 지정할 수 있고, 지정된 비교대상 내에서 사용자가 원하는 내용을 특정할 수 있으며, 제1 비교대상을 우선적으로 지정할 것인지 또는 제2 비교대상을 우선적으로 지정할 것인지를 사용자가 선택할 수 있다.
이후 관리자 또는 출제자들로부터 시험지문제별 유사문제의 검색 요구 또는 시험 출제 요구가 입력되는 경우 측정결과 조회 및 선정부(180)가 유사 시험문제를 검색하고 출력할 수 있도록 하는 인터페이스를 제공하는 인터페이스화면을 출력하고 사용자의 명령에 따라 상기 시험지문제별로 측정된 유사도와 유사도 대응 문제를 검색하여 출력하며, 사용자가 선택한 문제를 출제 문제로 출력하는 측정결과 조회 및 선정과정(S600)를 수행한다.
이때, 인터넷 서비스가 제공되는 경우 관리자 또는 출제자들로부터 시험지문제별 유사문제의 검색 요구 또는 시험 출제 요구 관리자 단말기(3, 도 6 참조) 또는 출제자 단말기(4, 도 6 참조)들로부터 입력될 수 있다. 그리고 상기 출제자 단말기(4)들은 시험을 출제하는 교사 단말기와 시험을 본 학생들 또는 시험지문제별 유사문제를 공부하고자 하는 학생들의 단말기를 포함할 수 있다.
도 5는 유사 문제 추출 서버(1)의 구성도이다.
도 5에 도시된 바와 같이, 상기 유사 문제 추출 서버(1)는 중앙처리장치로서의 제어부(10), 제어부(10)에 의해 실행되는 운영프로그램과 유사 문제 추출 서비스 제공을 위한 유사 문제 추출 장치(100)가 소프트웨어로 구현되어 저장되는 저장부(60), 데이터의 입력 및 사용자 제어 명령을 입력할 수 있도록 구성되는 입력부(30), 내부 동작 과정을 표시하는 표시부(40) 및 외부와의 통신이 필요한 경우 외부와의 통신을 수행할 수 있도록 하는 통신부(50)를 포함하는 서버컴퓨터로 구성될 수 있다. 이에 따라, 상기 유사 문제 추출 장치(100)는 컴퓨터로 읽어 실행되는 코드들이 기록된 기로매체로 제작될 수 있다. 이와 달리, 상기 유사 문제 추출 장치(100)는 FPGA 등이 적용되는 하드웨어 장치로 제작될 수도 있다.
도 6은 유사 문제 추출 장치(100)를 탑재한 유사 문제 추출 서버(1)를 이용하여 인터넷을 통한 유사 문제 추출 서비스를 제공하는 유사 문제 추출 서비스 제공 시스템의 구성도이다.
도 6과 같이, 유사 문제 추출 서비스 제공 시스템은 유사 문제 추출 서버(1), 관리사 단말기(3), 출제자 단말기(4)들이 통신망(9)을 통해 서로 통신을 수행하도록 구성된다.
이러한 구성에 의해 상기 유사 문제 추출 서버(1)는 학생 또는 교사 등이 추출된 시험지의 문제들과 유사한 문제들을 검색하여 학습하거나, 유사한 문제들을 새로운 시험 문제들로 추출하여 시험문제를 출제할 수 있도록 한다.
상기에서 설명한 본 발명의 기술적 사상은 바람직한 실시예에서 구체적으로 기술되었으나, 상기한 실시예는 그 설명을 위한 것이며 그 제한을 위한 것이 아님을 주의하여야 한다. 또한, 본 발명의 기술적 분야의 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 실시예가 가능함을 이해할 수 있을 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
100: 유사 문제 추출 장치
1: 유사 문제 추출 서버
3: 관리자 단말기
4: 출제가 단말기

Claims (5)

  1. 문제들의 문제별 텍스트정보, 시험지이미지, 시험지문제, 시험지문제로부터 추출된 시험지문제별텍스트, 시험지문제별텍스트와 문제별 텍스트정보를 비교하여 생성된 유사도를 가지는 유사문제들 정보인 시험지문제별 측정결과를 데이터베이스화하여 저장하는 시험문제DB부(110);
    문제별 텍스트 정보를 추출하여 상기 시험문제DB부(110)에 저장하는 문제별텍스트추출부(120);
    스캐닝된 시험지 이미지를 상기 시험문제DB부(110)에 저장하는 관리자스캔부(130);
    상기 시험지 이미지를 이미지 처리하여 문제별 이미지 정보인 시험지문제를 분리한 후 상기 시험문제DB부(110)에 저장하는 시험지문제분리부(140);
    상기 시험지문제들로부터 시험지문제별텍스트를 추출하여 상기 시험문제DB부(110)에 저장하는 문제OCR부(150);
    상기 시험지문제별텍스트와 상기 문제별 텍스트 정보를 비교하여 문제 유사도를 측정한 후 각각의 비교된 문제를 유사문제로 추출하여 상기 시험문제DB부(110)에 저장하는 문제유사도측정부(160); 및
    상기 시험지문제별 유사도를 가지는 유사문제들을 조회할 수 있도록 하고, 유사문제들을 선택하여 문제출제를 위해 추출할 수 있도록 하는 측정결과 조회 및 선정부(170);를 포함하여 구성되고,
    상기 문제OCR부(150)는,
    수학 기호와 수학 구성식을 주요 구성 요소로 지정하고 숫자를 변수로 지정하여 시험지문제별텍스트를 추출하고,
    상기 문제유사도측정부(160)는,
    사용자로부터 특정한 수학 기호, 수학 구성식, 수학 용어 및 문제의 해결원리와 내용 중 적어도 하나의 비교대상을 지정 받고, 지정된 비교대상을 우선 순위로 하여 문제 유사도를 추출하고,
    상기 문제의 해결원리와 내용에 대한 비교대상은 머신러닝 엔진을 이용하여 문제 유사도를 추출하고,
    상기 시험지문제분리부(140)는,
    시험지 이미지를 세로선, 여백, 문제번호를 기준으로 이미지를 분리하여 문제별 이미지를 시험지문제들로 추출하도록 구성되는 유사 문제 출제 장치.
  2. 청구항 1에 있어서, 상기 시험문제DB부(110)는,
    문제별텍스트추출부(120)가 추출한 문제별 텍스트 정보를 저장하는 문제별텍스트DB(111);
    관리자스캔부(130)가 출력하는 스캐닝된 시험지 이미지를 저장하는 시험지DB(113);
    시험지문제분리부(140)가 상기 시험지 이미지를 이미지 처리하여 생성한 문제별 이미지 정보인 시험지문제를 시험지별 문제번호별로 저장하는 시험지문제DB(115);
    문제OCR부(150)가 상기 시험지문제DB(115)에 저장된 시험지문제들로부터 추출한 시험지문제별텍스트를 저장하는 시험지문제별텍스트DB(117); 및
    상기 문제유사도측정부(160)가 상기 시험지문제별텍스트와 상기 문제별텍스트를 비교하여 생성한 유사도와 상기 문제별 텍스트를 시험지문제별측정결과 정보로 저장하는 시험지문제별측정결과DB(119);를 포함하여 구성되는 유사 문제 출제 장치.
  3. 제2 항에 있어서,
    상기 시험지DB(113)에 저장되는 시험지 이미지는 학교/년도/학년/학기/중간 또는 기말 정보를 가지고 저장되는 유사 문제 출제 장치.
  4. 제1 항에 있어서,
    상기 문제별 텍스트 정보는, 문제은행의 문제들로부터 기 추출되어 저장되고, 상기 문제은행의 문제들을 수학문제 DB부가 소유한 문제들을 포함하는 유사 문제 출제 장치.
  5. 문제별텍스트DB(111)와 시험지DB(113)와 시험지문제DB(115)와 시험지문제별텍스트DB(117)와 시험지문제별측정결과DB(119)를 포함하는 시험문제DB부(110), 문제별텍스트추출부(120), 관리자스캔부(130), 시험지문제분리부(140), 문제OCR부(150), 문제유사도측정부(160) 및 측정결과 조회 및 선정부(170)를 포함하는 유사 문제 추출 장치(100)에 의한 유사 문제 추출 방법에 있어서,
    문제별텍스트추출부(120)가 기 저장되어 등록된 문제들로부터 추출한 문제별 텍스트 정보를 문제별텍스트DB(111)에 저장하는 문제별덱스트DB생성과정(S100);
    관리자스캔부(130)가 스캐닝된 시험지 이미지를 분류하여 시험지DB(113)에 저장하는 시험지DB생성과정(S200);
    시험지문제분리부(140)가 상기 시험지 이미지를 이미지 처리하여 문제별 이미지 정보인 시험지문제를 생성한 후 시험지별 문제번호별로 시험지문제DB(115)에 저장하는 시험지문제DB생성과정(S300);
    문제OCR부(150)가 상기 시험지문제DB(115)에 저장된 시험지문제들로부터 시험지문제별텍스트를 추출하여 시험지문제별텍스트DB(117)에 저장하는 시험지문제별텍스트DB생성과정(S400);
    문제유사도측정부(160)가 상기 시험지문제별텍스트와 상기 문제별텍스트를 비교하여 문제 유사도를 측정하고, 문제별 텍스트를 가지는 문제들과 측정된 문제 유사도를 시험지문제별측정결과 정보로 시험지문제별측정결과DB(119)에 저장하는 시험지문제별측정결과DB생성과정(S500); 및
    측정결과 조회 및 선정부(180)가 입력된 명령에 따라 상기 시험지문제별로 측정된 유사도와 유사도 대응 문제를 검색하여 출력하고, 입력된 선택 신호에 대응하는 문제를 출제 문제로 출력하는 측정결과 조회 및 선정과정(S600)을 포함하고,
    상기 시험지문제별텍스트DB생성과정(S400)은,
    상기 문제OCR부(150)를 통해 수학 기호와 수학 구성식을 주요 구성 요소로 지정하고 숫자를 변수로 지정하여 시험지문제별텍스트를 추출하고,
    상기 시험지문제별측정결과DB생성과정(S500)은,
    사용자로부터 특정한 수학 기호, 수학 구성식, 단어, 문구 표현 패턴 및, 문제의 해결원리와 내용 중 적어도 하나의 비교대상을 지정 받고, 지정된 비교대상을 우선 순위로 하여 문제 유사도를 추출하고,
    상기 문제의 해결원리와 내용에 대한 비교대상은 머신러닝 엔진을 이용하여 문제 유사도를 추출하여 이루어지고,
    상기 시험지문제DB생성과정(S300)에서 상기 시험지문제분리부(140)가 추출한 시험지문제는, 시험지 이미지를 세로선, 여백, 문제번호를 기준으로 이미지를 분리하여 추출된 문제별 이미지인 것을 특징으로 하는 유사 문제 추출 방법.
KR1020170152320A 2016-12-22 2017-11-15 시험지 인식을 통한 유사 문제 추출 장치 및 그 방법 KR102004180B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20160176621 2016-12-22
KR1020160176621 2016-12-22

Publications (2)

Publication Number Publication Date
KR20180073440A true KR20180073440A (ko) 2018-07-02
KR102004180B1 KR102004180B1 (ko) 2019-10-01

Family

ID=62914221

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170152320A KR102004180B1 (ko) 2016-12-22 2017-11-15 시험지 인식을 통한 유사 문제 추출 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR102004180B1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003492A (zh) * 2018-07-25 2018-12-14 厦门大学附属心血管病医院(厦门市心脏中心) 一种题目选择方法、装置及终端设备
WO2020045714A1 (ko) * 2018-08-31 2020-03-05 망고슬래브 주식회사 콘텐츠 인식 방법 및 시스템
CN112364679A (zh) * 2020-09-04 2021-02-12 联想(北京)有限公司 一种图像区域识别方法及电子设备
CN112989760A (zh) * 2019-12-17 2021-06-18 北京一起教育信息咨询有限责任公司 为题目打标签的方法、装置、存储介质及电子设备
WO2021157776A1 (ko) * 2020-02-03 2021-08-12 주식회사 에스티유니타스 학습을 지원하기 위한 장치, 방법 및 명령을 기록한 기록 매체
CN113821712A (zh) * 2021-09-24 2021-12-21 作业帮教育科技(北京)有限公司 一种扫描搜题的方法、智能扫描笔及存储介质
CN115454951A (zh) * 2022-10-18 2022-12-09 读书郎教育科技有限公司 一种教学数据共享系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102629686B1 (ko) * 2021-03-31 2024-01-29 주식회사 고투무브 사용자 맞춤형 교육 컨텐츠 제공 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040015786A (ko) 2004-01-29 2004-02-19 박철서 인터넷상에서의 시험문제 자동 출제 방법
KR20060044691A (ko) * 2004-03-24 2006-05-16 마이크로소프트 코포레이션 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치
KR20120048438A (ko) * 2010-11-05 2012-05-15 (주)스마트쌤 문항별 식별정보가 구비된 문제지 생성 시스템 및 방법
KR101229860B1 (ko) * 2011-10-20 2013-02-05 주식회사 매쓰홀릭 학습 지원 시스템 및 방법
KR20130089998A (ko) * 2012-01-27 2013-08-13 김범수 학습 정보 제공 시스템 및 이를 이용하여 학습자에게 학습 정보를 제공하는 방법
KR20150025232A (ko) * 2013-08-28 2015-03-10 인하대학교 산학협력단 지능형 학습지도 시스템, 방법 및 서버 그리고 기록매체

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040015786A (ko) 2004-01-29 2004-02-19 박철서 인터넷상에서의 시험문제 자동 출제 방법
KR20060044691A (ko) * 2004-03-24 2006-05-16 마이크로소프트 코포레이션 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치
KR20120048438A (ko) * 2010-11-05 2012-05-15 (주)스마트쌤 문항별 식별정보가 구비된 문제지 생성 시스템 및 방법
KR101229860B1 (ko) * 2011-10-20 2013-02-05 주식회사 매쓰홀릭 학습 지원 시스템 및 방법
KR20130089998A (ko) * 2012-01-27 2013-08-13 김범수 학습 정보 제공 시스템 및 이를 이용하여 학습자에게 학습 정보를 제공하는 방법
KR20150025232A (ko) * 2013-08-28 2015-03-10 인하대학교 산학협력단 지능형 학습지도 시스템, 방법 및 서버 그리고 기록매체

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003492A (zh) * 2018-07-25 2018-12-14 厦门大学附属心血管病医院(厦门市心脏中心) 一种题目选择方法、装置及终端设备
WO2020045714A1 (ko) * 2018-08-31 2020-03-05 망고슬래브 주식회사 콘텐츠 인식 방법 및 시스템
CN112989760A (zh) * 2019-12-17 2021-06-18 北京一起教育信息咨询有限责任公司 为题目打标签的方法、装置、存储介质及电子设备
WO2021157776A1 (ko) * 2020-02-03 2021-08-12 주식회사 에스티유니타스 학습을 지원하기 위한 장치, 방법 및 명령을 기록한 기록 매체
CN112364679A (zh) * 2020-09-04 2021-02-12 联想(北京)有限公司 一种图像区域识别方法及电子设备
CN113821712A (zh) * 2021-09-24 2021-12-21 作业帮教育科技(北京)有限公司 一种扫描搜题的方法、智能扫描笔及存储介质
CN115454951A (zh) * 2022-10-18 2022-12-09 读书郎教育科技有限公司 一种教学数据共享系统
CN115454951B (zh) * 2022-10-18 2023-06-30 读书郎教育科技有限公司 一种教学数据共享系统

Also Published As

Publication number Publication date
KR102004180B1 (ko) 2019-10-01

Similar Documents

Publication Publication Date Title
KR102004180B1 (ko) 시험지 인식을 통한 유사 문제 추출 장치 및 그 방법
CN111144191B (zh) 字体识别方法、装置、电子设备及存储介质
KR102056822B1 (ko) 학습 서비스 제공 방법 및 그 장치
US20190051204A1 (en) Method, apparatus, and computer program for providing personalized educational content
US8867848B2 (en) Display test device, display test method, and storage medium
KR101769918B1 (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
KR101671693B1 (ko) 오답 및 문제 분석 정보의 재가공을 통한 맞춤형 학습 서비스 방법
US20190294912A1 (en) Image processing device, image processing method, and image processing program
US20200005032A1 (en) Classifying digital documents in multi-document transactions based on embedded dates
US8768241B2 (en) System and method for representing digital assessments
JP7147185B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN108920677A (zh) 问卷调查方法、调查系统及电子设备
CN111274239A (zh) 试卷结构化处理方法、装置和设备
KR101812763B1 (ko) 한글 철자 검사지 생성 및 검사 결과 해석 시스템
CN113469067A (zh) 一种文档解析方法、装置、计算机设备和存储介质
CN111767382A (zh) 生成反馈信息的方法、装置及终端设备
KR20200031009A (ko) 교육과정 평가에 따른 평가정보 구축 및 제공방법
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
WO2023038722A1 (en) Entry detection and recognition for custom forms
CN114117222A (zh) 简历文档匹配方法、装置、计算设备及存储介质
US20210390251A1 (en) Automatic generation of form application
JP2004029107A (ja) 答案採点処理システム
KR101607128B1 (ko) 오답과 관련된 연관문제 제공방법
CN116469505A (zh) 数据处理方法、装置、计算机设备及可读存储介质
KR100795951B1 (ko) 채점 시스템 및 그 제어방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant