KR102654311B1 - A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence - Google Patents

A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence Download PDF

Info

Publication number
KR102654311B1
KR102654311B1 KR1020220152543A KR20220152543A KR102654311B1 KR 102654311 B1 KR102654311 B1 KR 102654311B1 KR 1020220152543 A KR1020220152543 A KR 1020220152543A KR 20220152543 A KR20220152543 A KR 20220152543A KR 102654311 B1 KR102654311 B1 KR 102654311B1
Authority
KR
South Korea
Prior art keywords
text
document
unit
module
category
Prior art date
Application number
KR1020220152543A
Other languages
Korean (ko)
Inventor
신창선
심춘보
정세훈
김준영
이명배
장경민
Original Assignee
국립순천대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국립순천대학교산학협력단 filed Critical 국립순천대학교산학협력단
Priority to KR1020220152543A priority Critical patent/KR102654311B1/en
Priority to PCT/KR2023/013797 priority patent/WO2024106721A1/en
Application granted granted Critical
Publication of KR102654311B1 publication Critical patent/KR102654311B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Mining & Mineral Resources (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Animal Husbandry (AREA)
  • Agronomy & Crop Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템은 영농데이터에 대한 이미지를 수집하는 이미지 수집부; 상기 이미지 수집부에서 수집된 영농데이터 이미지를 전처리하는 이미지 전처리부; 상기 이미지 전처리부에서 전처리된 영농데이터 이미지를 인공지능 기반의 광학적 문자 판독(AI-OCR) 모델에 적용하여 상기 영농데이터 이미지를 텍스트로 변환하는 텍스트 변환부; 상기 텍스트 변환부에서 변환된 텍스트를 분석하여 상기 텍스트와 매칭하는 주제별 카테고리를 추천하는 카테고리 추천부; 상기 카테고리 추천부에서 추천된 주제별 카테고리 중 사용자에 의해 선택된 특정 주제의 카테고리에 상기 텍스트를 저장하여 해당 특정 주제의 카테고리가 포함된 영농데이터에 대한 전자화 문서를 생성하는 문서 생성부; 및 상기 문서 생성부에서 생성된 영농데이터 전자화 문서를 저장하는 문서 저장부; 및 상기 영농데이터 전자화 문서를 사용자에게 표시하는 문서 표시부;를 포함하는 것을 특징으로 한다.The smart farm farming data conversion system using an artificial intelligence-based optical character reading model according to the present invention includes an image collection unit that collects images of farming data; an image pre-processing unit that pre-processes the farming data images collected by the image collection unit; A text conversion unit that converts the agricultural data image into text by applying the agricultural data image pre-processed in the image pre-processing unit to an artificial intelligence-based optical character recognition (AI-OCR) model; a category recommendation unit that analyzes the text converted by the text conversion unit and recommends a category by subject that matches the text; a document creation unit that stores the text in a specific subject category selected by the user among the subject categories recommended by the category recommendation unit and generates an electronic document for agricultural data including the category of the specific subject; and a document storage unit that stores the electronic farming data document generated by the document generation unit; and a document display unit that displays the electronic farming data document to the user.

Description

인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템{A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence}A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence}

본 발명의 실시예는 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템에 관한 것이다.An embodiment of the present invention relates to a smart farm farming data conversion system using an artificial intelligence-based optical character reading model.

OCR(광학적 문자 판독, Optical Character Recognition)이란 인쇄된(또는 손으로 쓴) 문자에 빛을 비춰 반사되는 광선의 양적 차이인 강약을 검출하여 문자를 인식하고 판독하는 기술이다.OCR (Optical Character Recognition) is a technology that recognizes and reads characters by shining light on printed (or handwritten) characters and detecting the strength and weakness of the reflected rays.

기존에 사용되고 있는 OCR 기술의 경우 인식률 결과를 보면, OCR 사업은 텍스트를 통한 자동처리라는 필요성은 충족하나 OCR 엔진의 실제 인식률이 매우 낮아 결국 인력을 통한 보정으로 나머지 인식률을 보완해야 하고, 그 결과 활용성에 대한 확신 저하로 사용이 감소하는 문제점이 있다.In the case of existing OCR technology, the recognition rate results show that the OCR project satisfies the need for automatic processing through text, but the actual recognition rate of the OCR engine is very low, so the remaining recognition rate must be supplemented by manual correction, and the results are utilized. There is a problem that use is decreasing due to decreased confidence in sex.

한편 이러한 OCR 중 인공지능(AI)을 접목시킨 AI OCR은 필기체, 정형화되지 않은 정보까지도 인식 가능하며, 정확성과 효율성 향상, 및 시간단축 등 한층 더 강화되어 발전된 기술로, 최근 이러한 AI OCR을 활용하여 금융, 의료, 교육, 공공 등 다양한 서비스가 제공되고 있지만 스마트팜 분야의 영농데이터 변환 기술에 적용되고 있는 사례는 없는 실정이다.Meanwhile, among these OCRs, AI OCR, which incorporates artificial intelligence (AI), is a technology that has been further strengthened and developed to recognize even handwriting and unstructured information, improving accuracy and efficiency, and reducing time. Recently, AI OCR has been utilized to Although various services such as financial, medical, educational, and public are provided, there are no cases of agricultural data conversion technology being applied in the smart farm field.

일반적으로, 영농일지란 농가에서 언제 어떤 일이 있었고 어떤 작업을 하였는지 기록한 자료로, 다음 해 작황 등을 파악하는데 활용할 수 있고, 또한 국가에서 예산지원을 받는 농가의 경우 영농일지 제출이 필수적인 경우가 있다.In general, a farming log is a record of what happened and what work was done at the farm, and can be used to determine the next year's crop, etc. In addition, for farms receiving budget support from the government, submission of a farming log is sometimes essential. .

현재, 휴대폰 또는 PC를 이용하는 농가가 많이 늘어났지만 여전히 수기로 영농일지를 작성하는 농가가 존재한다. 즉, 영농데이터인 영농일지는 공공기관에서도 농민들에게 영농수첩(다이어리)를 지급하는 등 아날로그 방식으로 작성 및 보관되고 있는 사례가 다수이다.Currently, the number of farms using mobile phones or PCs has increased, but there are still farms that write farming logs by hand. In other words, there are many cases where farming logs, which are farming data, are prepared and stored in an analog manner, such as by public institutions providing farming notebooks (diaries) to farmers.

대한민국 등록특허공보 제10-1516684호(2015.05.11)Republic of Korea Patent Publication No. 10-1516684 (May 11, 2015)

본 발명은 수기로 작성된 영농데이터(영농일지)의 이미지를 AI OCR을 활용하여 텍스트로 변환함으로써 해당 영농데이터에 대한 정확성과 신뢰성을 확보할 수 있는 전자화 문서를 생성할 수 있는 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템을 제공하는 것을 목적으로 한다.The present invention is an artificial intelligence-based optical character that can generate an electronic document that can secure the accuracy and reliability of the farming data by converting images of hand-written farming data (farming logbook) into text using AI OCR. The purpose is to provide a smart farm farming data conversion system using a reading model.

또한, 본 발명은 수기로 작성된 영농데이터의 인식률을 높이고, 인력 사용에 따른 비용절감, 및 기록물 활용이 가능한 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템을 제공하는 것을 목적으로 한다.In addition, the purpose of the present invention is to provide a smart farm farming data conversion system using an artificial intelligence-based optical character reading model that increases the recognition rate of hand-written farming data, reduces costs due to the use of manpower, and utilizes records. do.

또한, 본 발명은 빠른 변환으로 시간을 절약하고, 종이로 작성된 영농일지의 파손, 손실 등을 방지하며, 일관된 폼으로 정리 가능하고, 캘린더, 검색 기능을 사용하여 보다 편리한 농장 관리가 가능한 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템을 제공하는 것을 목적으로 한다.In addition, the present invention is an artificial intelligence-based system that saves time through quick conversion, prevents damage and loss of paper farming logs, can be organized in a consistent form, and allows for more convenient farm management using calendar and search functions. The purpose is to provide a smart farm farming data conversion system using the optical character reading model.

아울러, 본 발명은 영농데이터 전자화 문서에 신뢰성을 인증할 수 있는 기능을 추가하여 국가 공공기관에 증빙으로 제출하는 용도로 발전 가능한 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템을 제공하는 것을 목적으로 한다.In addition, the present invention adds a function to certify the reliability of electronic farming data documents and provides a smart farm farming data conversion system using an artificial intelligence-based optical character reading model that can be developed for submission as evidence to national public institutions. The purpose is to provide

상기한 바와 같은 목적을 달성하기 위한 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템은 영농데이터에 대한 이미지를 수집하는 이미지 수집부; 상기 이미지 수집부에서 수집된 영농데이터 이미지를 전처리하는 이미지 전처리부; 상기 이미지 전처리부에서 전처리된 영농데이터 이미지를 인공지능 기반의 광학적 문자 판독(AI-OCR) 모델에 적용하여 상기 영농데이터 이미지를 텍스트로 변환하는 텍스트 변환부; 상기 텍스트 변환부에서 변환된 텍스트를 분석하여 상기 텍스트와 매칭하는 주제별 카테고리를 추천하는 카테고리 추천부; 상기 카테고리 추천부에서 추천된 주제별 카테고리 중 사용자에 의해 선택된 특정 주제의 카테고리에 상기 텍스트를 저장하여 해당 특정 주제의 카테고리가 포함된 영농데이터에 대한 전자화 문서를 생성하는 문서 생성부; 및 상기 문서 생성부에서 생성된 영농데이터 전자화 문서를 저장하는 문서 저장부; 및 상기 영농데이터 전자화 문서를 사용자에게 표시하는 문서 표시부;를 포함하는 것을 특징으로 한다.A smart farm farming data conversion system using an artificial intelligence-based optical character reading model according to the present invention to achieve the above-described purpose includes an image collection unit that collects images of farming data; an image pre-processing unit that pre-processes the farming data images collected by the image collection unit; A text conversion unit that converts the agricultural data image into text by applying the agricultural data image pre-processed in the image pre-processing unit to an artificial intelligence-based optical character recognition (AI-OCR) model; a category recommendation unit that analyzes the text converted by the text conversion unit and recommends a category by subject that matches the text; a document creation unit that stores the text in a specific subject category selected by the user among the subject categories recommended by the category recommendation unit and generates an electronic document for agricultural data including the category of the specific subject; and a document storage unit that stores the electronic farming data document generated by the document generation unit; and a document display unit that displays the electronic farming data document to the user.

또한, 상기 이미지 전처리부는, 상기 영농데이터 이미지의 기울임 보정, 여백 제거, 노이즈 제거 및 회전 보정을 통해 상기 영농데이터 이미지를 전처리할 수 있다.Additionally, the image preprocessing unit may preprocess the farming data image through tilt correction, blank space removal, noise removal, and rotation correction of the farming data image.

또한, 상기 텍스트 변환부는, 상기 영농데이터 이미지에 포함된 객체를 감지하여 상기 객체를 종류별로 분류하는 객체 분류모듈; 상기 객체 분류모듈에서 분류된 종류별 객체를 텍스트로 변환하는 텍스트 변환모듈; 및 상기 텍스트 변환모듈에서 변환된 텍스트의 표시 및 문법을 확인하여 오표시된 텍스트를 교정하는 텍스트 교정모듈;을 포함할 수 있다.In addition, the text conversion unit includes an object classification module that detects objects included in the farming data image and classifies the objects by type; a text conversion module that converts objects by type classified by the object classification module into text; and a text correction module that checks the display and grammar of the text converted by the text conversion module and corrects incorrectly displayed text.

또한, 상기 카테고리 추천부는, 상기 텍스트 변환부에서 변환된 텍스트의 위치, 종류 및 형식을 분석하여 상기 텍스트를 주제별로 분류하는 텍스트 분류모듈; 및 상기 텍스트 분류모듈에서 분류된 상기 텍스트의 주제별 분류에 매칭하는 주제별 카테고리를 자동으로 추천하는 카테고리 추천모듈;을 포함할 수 있다.In addition, the category recommendation unit includes a text classification module that analyzes the location, type, and format of the text converted by the text conversion unit and classifies the text by topic; and a category recommendation module that automatically recommends a thematic category that matches the thematic classification of the text classified by the text classification module.

또한, 상기 문서 생성부는, 상기 사용자에 의해 선택된 특정 주제의 카테고리에 상기 텍스트를 저장하는 텍스트 저장모듈; 상기 텍스트 중 상기 사용자에 의해 특정 단어가 선택된 경우, 해당 특정 단어를 중요단어로 확정하는 중요단어 확정모듈; 및 상기 텍스트가 저장된 특정 주제의 카테고리가 포함된 상기 영농데이터 전자화 문서를 생성하는 문서 생성모듈;을 포함할 수 있다.Additionally, the document creation unit may include a text storage module that stores the text in a category of a specific topic selected by the user; an important word confirmation module that determines the specific word as an important word when a specific word is selected by the user in the text; and a document creation module that generates the agricultural data electronic document including a category of a specific subject in which the text is stored.

또한, 상기 텍스트 저장모듈은, 상기 특정 주제의 카테고리에 상기 텍스트를 저장하는 경우, 상기 중요단어 확정모듈에서 확정된 중요단어를 상기 텍스트를 구성하는 다른 단어들과 상이한 표시방식으로 상기 특정 주제의 카테고리에 저장할 수 있다.In addition, when the text storage module stores the text in the category of the specific topic, the important words determined in the important word confirmation module are displayed in a different display method from other words constituting the text in the category of the specific topic. It can be saved in .

또한, 본 발명은 상기 영농데이터 전자화 문서의 생성을 위한 문서폼이 저장된 문서폼 저장부;를 더 포함할 수 있다.In addition, the present invention may further include a document form storage unit in which a document form for generating the agricultural data electronic document is stored.

또한, 상기 문서폼 저장부는, 상기 영농데이터 전자화 문서의 생성을 위한 기본 문서폼을 저장하는 기본폼 저장모듈; 상기 기본 문서폼을 사용자 설정에 의해 수정하여 수정 문서폼을 형성하는 문서폼 수정모듈; 및 상기 영농데이터 전자화 문서의 생성을 위한 수정 문서폼을 저장하는 수정폼 저장모듈;을 포함할 수 있다.In addition, the document form storage unit includes a basic form storage module that stores a basic document form for generating the agricultural data electronic document; a document form modification module that modifies the basic document form according to user settings to form a modified document form; and a modified form storage module that stores a modified document form for generating the agricultural data electronic document.

또한, 본 발명은 상기 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색하는 문서 검색부를 더 포함할 수 있다.In addition, the present invention may further include a document search unit that searches for a specific electronic farming data document stored in the document storage unit.

아울러, 상기 문서 검색부는, 특정 날짜의 입력으로 상기 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색하는 날짜별 검색모듈; 및 특정 단어의 입력으로 상기 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색하는 단어별 검색모듈;을 포함할 수 있다.In addition, the document search unit includes a date search module that searches for a specific agricultural data electronic document stored in the document storage unit by inputting a specific date; and a word-specific search module that searches for a specific agricultural data electronic document stored in the document storage unit by inputting a specific word.

상기한 바와 같이 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템에 의하면, 수기로 작성된 영농데이터의 이미지를 AI OCR을 활용하여 텍스트로 변환함으로써 해당 영농데이터에 대한 정확성과 신뢰성을 확보할 수 있는 전자화 문서를 생성할 수 있는 효과가 있다.As described above, according to the smart farm farming data conversion system using the artificial intelligence-based optical character reading model according to the present invention, images of hand-written farming data are converted into text using AI OCR to provide information about the farming data. It has the effect of creating electronic documents that can ensure accuracy and reliability.

또한, 본 발명은 수기로 작성된 영농데이터의 인식률을 높이고, 인력 사용에 따른 비용절감, 및 기록물 활용이 가능한 효과가 있다.In addition, the present invention has the effect of increasing the recognition rate of hand-written farming data, reducing costs due to the use of manpower, and enabling the use of records.

또한, 본 발명은 빠른 변환으로 시간을 절약하고, 종이로 작성된 영농일지의 파손, 손실 등을 방지하며, 일관된 폼으로 정리 가능하고, 캘린더, 검색 기능을 사용하여 보다 편리한 농장 관리가 가능한 효과가 있다.In addition, the present invention saves time through quick conversion, prevents damage and loss of farming logs written on paper, organizes them in a consistent form, and enables more convenient farm management using calendar and search functions. .

아울러, 본 발명은 영농데이터 전자화 문서에 신뢰성을 인증할 수 있는 기능을 추가하여 국가 공공기관에 증빙으로 제출하는 용도로 발전 가능한 효과가 있다.In addition, the present invention has the effect of adding a function to certify the reliability of electronic agricultural data documents, which can be developed for use as evidence for submission to national public institutions.

도 1은 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템의 제 1구성도이다.
도 2는 본 발명에 따른 이미지 수집부가 수집하는 영농데이터 이미지의 예시도이다.
도 3은 본 발명에 따른 텍스트 변환부의 구성도이다.
도 4는 본 발명에 따른 카테고리 추천부의 구성도이다.
도 5는 본 발명에 따른 카테고리 추천부가 추천하는 주제별 카테고리의 예시도이다.
도 6은 본 발명에 따른 문서 생성부의 구성도이다.
도 7은 본 발명에 따른 문서 생성부가 생성한 영농데이터 전자화 문서의 예시도이다.
도 8은 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템의 제 2구성도이다.
도 9는 본 발명에 따른 문서폼 저장부의 구성도이다.
도 10은 본 발명에 따른 문서 검색부의 구성도이다.
Figure 1 is a first configuration diagram of a smart farm farming data conversion system using an artificial intelligence-based optical character reading model according to the present invention.
Figure 2 is an example of a farming data image collected by the image collection unit according to the present invention.
Figure 3 is a configuration diagram of a text conversion unit according to the present invention.
Figure 4 is a configuration diagram of a category recommendation unit according to the present invention.
Figure 5 is an example diagram of categories by subject recommended by the category recommendation unit according to the present invention.
Figure 6 is a configuration diagram of a document creation unit according to the present invention.
Figure 7 is an example of an electronic farming data document generated by the document generation unit according to the present invention.
Figure 8 is a second configuration diagram of a smart farm farming data conversion system using an artificial intelligence-based optical character reading model according to the present invention.
Figure 9 is a configuration diagram of a document form storage unit according to the present invention.
Figure 10 is a configuration diagram of a document search unit according to the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 실시 예를 상세히 설명한다. 우선, 도면들 중 동일한 구성요소 또는 부품들은 가능한 한 동일한 참조부호를 나타내고 있음에 유의해야 한다. 본 발명을 설명함에 있어서 관련된 공지기능 혹은 구성에 대한 구체적인 설명은 본 발명의 요지를 모호하게 하지 않기 위해 생략한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the attached drawings. First of all, it should be noted that the same components or parts in the drawings are given the same reference numerals as much as possible. In describing the present invention, detailed descriptions of related known functions or configurations are omitted so as not to obscure the gist of the present invention.

도 1은 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템의 제 1구성도이다.Figure 1 is a first configuration diagram of a smart farm farming data conversion system using an artificial intelligence-based optical character reading model according to the present invention.

본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템은 도 1에 도시된 바와 같이, 이미지 수집부(100), 이미지 전처리부(200), 텍스트 변환부(300), 카테고리 추천부(400), 문서 생성부(500), 문서 저장부(600), 및 문서 표시부(700)를 포함한다.As shown in FIG. 1, the smart farm farming data conversion system using an artificial intelligence-based optical character reading model according to the present invention includes an image collection unit 100, an image preprocessing unit 200, and a text conversion unit 300. , a category recommendation unit 400, a document creation unit 500, a document storage unit 600, and a document display unit 700.

이미지 수집부(100)는 영농데이터에 대한 이미지를 수집할 수 있다.The image collection unit 100 may collect images of farming data.

도 2는 본 발명에 따른 이미지 수집부가 수집하는 영농데이터 이미지의 예시도이다.Figure 2 is an example of a farming data image collected by the image collection unit according to the present invention.

구체적으로, 이미지 수집부(100)는 영농데이터에 대한 이미지로, 도 2에 도시된 바와 같이, 수기에 의해 작성된 비정형데이터인 영농일지에 대한 이미지를 수집할 수 있는데, 여기서 영농일지 이미지는 사진 촬영 및 기타 다양한 방법을 통해 생성될 수 있다.Specifically, the image collection unit 100 is an image of farming data, and as shown in FIG. 2, can collect images of a farming diary, which is unstructured data written by hand, where the farming diary image is a photo taken. and can be generated through various other methods.

이미지 전처리부(200)는 이미지 수집부에서 수집된 영농데이터 이미지를 전처리할 수 있다.The image preprocessing unit 200 may preprocess the agricultural data images collected by the image collection unit.

구체적으로, 이미지 전처리부(200)는 영농데이터인 예를 들어, 영농일지 이미지의 전처리를 위해, 해당 영농일지 이미지에 존재하는 기울임을 보정하고, 해당 이미지의 여백 및 노이즈를 제거하며, 해당 이미지에 존재하는 회전 보정을 통해, 후술하는 텍스트 변환부에 의해 해당 이미지로부터 텍스트 변환이 용이하도록 할 수 있다.Specifically, the image preprocessing unit 200 corrects the tilt existing in the farming log image, removes the blank space and noise of the image, and Through the existing rotation correction, text conversion from the corresponding image can be facilitated by the text conversion unit described later.

텍스트 변환부(300)는 이미지 전처리부에서 전처리된 영농데이터 이미지를 인공지능 기반의 광학적 문자 판독(AI-OCR) 모델에 적용하여 영농데이터 이미지를 텍스트로 변환할 수 있다.The text conversion unit 300 can convert the farming data image into text by applying the agricultural data image pre-processed in the image pre-processing unit to an artificial intelligence-based optical character recognition (AI-OCR) model.

도 3은 본 발명에 따른 텍스트 변환부의 구성도이다.Figure 3 is a configuration diagram of a text conversion unit according to the present invention.

구체적으로, 텍스트 변환부(300)는 도 3에 도시된 바와 같이, 객체 분류모듈(310), 텍스트 변환모듈(320), 및 텍스트 교정모듈(330)을 포함할 수 있다.Specifically, the text conversion unit 300 may include an object classification module 310, a text conversion module 320, and a text correction module 330, as shown in FIG. 3.

객체 분류모듈(310)은 영농데이터 이미지에 포함된 객체를 감지하여 해당 객체를 종류별로 분류할 수 있다.The object classification module 310 can detect objects included in the farming data image and classify the objects by type.

구체적으로, 객체 분류모듈(310)은 영농데이터 이미지에 포함된 객체의 위치 및 종류를 감지하여 해당 객체를 분류할 수 있는데, 이러한 객체 분류모듈(310)은 이러한 객체의 종류로, 예를 들어 텍스트, 도형 등으로 분류할 수 있다.Specifically, the object classification module 310 can classify the object by detecting the location and type of the object included in the farming data image. The object classification module 310 can classify the object by detecting the location and type of the object included in the farming data image. , shapes, etc.

텍스트 변환모듈(320)은 객체 분류모듈에서 분류된 종류별 객체를 텍스트로 변환할 수 있다.The text conversion module 320 can convert objects by type classified by the object classification module into text.

구체적으로, 텍스트 변환모듈(320)은 상기한 바와 같이, 인공지능 기반의 광학적 문자 판독(AI-OCR) 모델을 통해 객체 분류모듈에서 분류된 종류별 객체를 텍스트로 변환할 수 있다.Specifically, as described above, the text conversion module 320 can convert objects by type classified in the object classification module into text through an artificial intelligence-based optical character recognition (AI-OCR) model.

텍스트 교정모듈(330)은 텍스트 변환모듈에서 변환된 텍스트의 표시 및 문법을 확인하여 오표시된 텍스트를 교정할 수 있다.The text correction module 330 can correct incorrectly displayed text by checking the display and grammar of the text converted by the text conversion module.

구체적으로, 텍스트 교정모듈(330)은 AI-OCR 변환하여 문자화된 텍스트의 표시형식 및 문법을 확인한 후, 변환된 텍스트 중 잘못 표기된 오탈자를 감지하여 해당 오탈자를 교정할 수 있다.Specifically, the text correction module 330 can perform AI-OCR conversion to check the display format and grammar of the text, then detect incorrectly written typos in the converted text and correct the typos.

카테고리 추천부(400)는 텍스트 변환부에서 변환된 텍스트를 분석하여 해당 텍스트와 매칭하는 주제별 카테고리를 추천할 수 있다.The category recommendation unit 400 may analyze the text converted by the text conversion unit and recommend a topic-specific category that matches the text.

도 4는 본 발명에 따른 카테고리 추천부의 구성도이다.Figure 4 is a configuration diagram of a category recommendation unit according to the present invention.

구체적으로, 카테고리 추천부(400)는 도 4에 도시된 바와 같이, 텍스트 분류모듈(410), 및 카테고리 추천모듈(420)을 포함할 수 있다.Specifically, the category recommendation unit 400 may include a text classification module 410 and a category recommendation module 420, as shown in FIG. 4 .

텍스트 분류모듈(410)은 텍스트 변환부에서 변환된 텍스트의 위치, 종류 및 형식을 분석하여 해당 텍스트를 주제별로 분류할 수 있다.The text classification module 410 can classify the text by subject by analyzing the location, type, and format of the text converted by the text conversion unit.

구체적으로, 텍스트 분류모듈(410)은 AI-OCR 변환하여 문자화된 텍스트의 위치, 텍스트의 종류(한글, 숫자, 영어 등), 표시 형식(날짜, 금액, 문장 등)을 분석하여 해당 텍스트를 영농데이터(영농일지폼)에 포함된 복수의 주제별 카테고리 중 해당 텍스트와 관련한 특정 주제로 분류할 수 있다.Specifically, the text classification module 410 analyzes the location of the written text through AI-OCR conversion, the type of text (Korean, numeric, English, etc.), and the display format (date, amount, sentence, etc.) Among the multiple thematic categories included in the data (farming log form), it can be classified into a specific topic related to the text.

카테고리 추천모듈(420)은 텍스트 분류모듈에서 분류된 텍스트의 주제별 분류에 매칭하는 주제별 카테고리를 자동으로 추천할 수 있다.The category recommendation module 420 can automatically recommend thematic categories that match the thematic classification of the text classified in the text classification module.

도 5는 본 발명에 따른 카테고리 추천부가 추천하는 주제별 카테고리의 예시도이다.Figure 5 is an example diagram of categories by subject recommended by the category recommendation unit according to the present invention.

구체적으로, 카테고리 추천모듈(420)은 예를 들어, 텍스트 분류모듈에서 분류된 텍스트의 주제별 분류가 영농작업과 관련된 경우, 도 5에 도시된 바와 같이, 영농데이터(영농일지폼)에 포함된 복수의 주제별 카테고리 중 해당 영농작업 주제에 매칭하는 주제별 카테고리로 "작업단계(작업명)" 및 "세부작업내용"을 추천할 수 있다.Specifically, the category recommendation module 420, for example, when the thematic classification of the text classified in the text classification module is related to farming work, as shown in FIG. 5, the category recommendation module 420 recommends multiple items included in the farming data (farming log form). Among the thematic categories of , “Work steps (task name)” and “Detailed work details” can be recommended as the thematic categories that match the relevant farming work topic.

문서 생성부(500)는 카테고리 추천부에서 추천된 주제별 카테고리 중 사용자에 의해 선택된 특정 주제의 카테고리에 관련 텍스트를 저장하여 해당 특정 주제의 카테고리가 포함된 영농데이터에 대한 전자화 문서를 생성할 수 있다.The document creation unit 500 may store related text in a category of a specific subject selected by the user among the subject categories recommended by the category recommendation unit and generate an electronic document about farming data including the category of the specific subject.

도 6은 본 발명에 따른 문서 생성부의 구성도이다.Figure 6 is a configuration diagram of a document creation unit according to the present invention.

구체적으로, 문서 생성부(500)는 도 6에 도시된 바와 같이, 텍스트 저장모듈(510), 중요단어 확정모듈(520), 및 문서 생성모듈(530)을 포함할 수 있다.Specifically, the document creation unit 500 may include a text storage module 510, a key word confirmation module 520, and a document creation module 530, as shown in FIG. 6 .

텍스트 저장모듈(510)은 사용자에 의해 선택된 특정 주제의 카테고리에 관련 텍스트를 저장할 수 있다.The text storage module 510 may store related text in a category of a specific topic selected by the user.

구체적으로, 텍스트 저장모듈(510)은 예들 들어, 카테고리 추천모듈(420)에서 추천한 주제별 카테고리인 "작업단계(작업명)" 및 "세부작업내용" 중 사용자가 "세부작업내용"을 선택하는 경우, 해당 영농작업과 관련된 텍스트를 해당 세부작업내용에 저장할 수 있다.Specifically, the text storage module 510, for example, allows the user to select “detailed work details” among the thematic categories “work steps (task names)” and “detailed work details” recommended by the category recommendation module 420. In this case, text related to the relevant farming work can be stored in the detailed work details.

중요단어 확정모듈(520)은 텍스트 중 사용자에 의해 특정 단어가 선택된 경우, 해당 특정 단어를 중요단어로 확정할 수 있다.When a specific word is selected by a user in the text, the important word confirmation module 520 can confirm the specific word as an important word.

구체적으로, 중요단어 확정모듈(520)은 텍스트 저장모듈(510)과 연동되어 사용자가 선택한 특정 단어를 중요단어로 확정한 경우 해당 중요단어를 텍스트 저장모듈에 제공할 수 있다.Specifically, the important word confirmation module 520 is linked with the text storage module 510, and when a specific word selected by the user is confirmed as an important word, the important word can be provided to the text storage module.

따라서, 텍스트 저장모듈(510)은 해당 텍스트를 특정 주제의 카테고리에 저장하는 과정에서 해당 중요단어를 별도 선택이 가능하도록 저장할 수 있는데, 이러한 텍스트 저장모듈(510)은 중요단어 확정모듈에서 확정된 중요단어를 해당 텍스트를 구성하는 다른 단어들과 상이한 표시방식(색, 폰트, 굵기 등)으로 특정 주제의 카테고리에 저장할 수 있다.Therefore, the text storage module 510 can store the relevant important words so that they can be selected separately in the process of storing the relevant text in the category of a specific topic. The text storage module 510 can store the important words determined in the important word confirmation module. Words can be stored in a category of a specific topic with a different display method (color, font, thickness, etc.) from other words that make up the text.

즉, 텍스트 저장모듈(510)은 사용자가 원하는 카테고리를 선택하면 지정되어 있는 폼의 카테고리 위치에 텍스트를 저장할 수 있고, 중요한 텍스트는 별도로 저장할 수 있다.That is, the text storage module 510 can save text in the category location of a designated form when the user selects a desired category, and important text can be stored separately.

문서 생성모듈(530)은 텍스트가 저장된 특정 주제의 카테고리가 포함된 영농데이터 전자화 문서를 생성할 수 있다.The document creation module 530 can generate an electronic farming data document containing a category of a specific subject in which text is stored.

도 7은 본 발명에 따른 문서 생성부가 생성한 영농데이터 전자화 문서의 예시도이다.Figure 7 is an example of an electronic farming data document generated by the document generation unit according to the present invention.

구체적으로, 문서 생성모듈(530)은 도 7에 도시된 바와 같이, 영농데이터(영농일지폼)에 포함된 복수의 주제별 카테고리에 관련 내용이 저장된 영농데이터 전자화 문서를 생성할 수 있다.Specifically, as shown in FIG. 7, the document creation module 530 can generate an electronic farming data document in which related content is stored in a plurality of thematic categories included in the farming data (farming log form).

문서 저장부(600)는 문서 생성부에서 생성된 영농데이터 전자화 문서를 저장할 수 있다.The document storage unit 600 may store the electronic farming data document generated in the document creation unit.

문서 표시부(700)는 영농데이터 전자화 문서를 사용자에게 표시할 수 있다.The document display unit 700 can display electronic farming data documents to the user.

구체적으로, 문서 표시부(700)는 영농데이터 전자화 문서를 사용자에게 표시함으로써 해당 사용자가 선택한 특정 텍스트가 영농데이터 문서폼에 있는 특정 위치에 잘 들어가 있는지 모니터링 하도록 할 수 있다.Specifically, the document display unit 700 can display an electronic agricultural data document to the user to monitor whether the specific text selected by the user is properly entered in a specific position in the agricultural data document form.

도 8은 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템의 제 2구성도이다.Figure 8 is a second configuration diagram of a smart farm farming data conversion system using an artificial intelligence-based optical character reading model according to the present invention.

한편, 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템은 도 8에 도시된 바와 같이, 상기한 이미지 수집부(100), 이미지 전처리부(200), 텍스트 변환부(300), 카테고리 추천부(400), 문서 생성부(500), 문서 저장부(600), 및 문서 표시부(700) 외에, 그 구성으로, 문서폼 저장부(800), 및 문서 검색부(900)를 더 포함할 수 있다.Meanwhile, as shown in FIG. 8, the smart farm farming data conversion system using the artificial intelligence-based optical character reading model according to the present invention includes the image collection unit 100, image preprocessing unit 200, and text conversion. In addition to the unit 300, the category recommendation unit 400, the document creation unit 500, the document storage unit 600, and the document display unit 700, its configuration includes a document form storage unit 800, and a document search unit. It may further include (900).

문서폼 저장부(800)는 영농데이터 전자화 문서의 생성을 위한 문서폼이 저장될 수 있다.The document form storage unit 800 may store a document form for creating an electronic farming data document.

도 9는 본 발명에 따른 문서폼 저장부의 구성도이다.Figure 9 is a configuration diagram of a document form storage unit according to the present invention.

구체적으로, 문서폼 저장부(800)는 도 9에 도시된 바와 같이, 기본폼 저장모듈(810), 문서폼 수정모듈(820), 및 수정폼 저장모듈(830)을 포함할 수 있다.Specifically, the document form storage unit 800 may include a basic form storage module 810, a document form modification module 820, and a modified form storage module 830, as shown in FIG. 9.

기본폼 저장모듈(810)은 영농데이터 전자화 문서의 생성을 위한 기본 문서폼을 저장할 수 있다.The basic form storage module 810 can store a basic document form for creating an electronic farming data document.

구체적으로, 기본폼 저장모듈(810)은 수기로 작성되는 다양한 영농데이터와 각각 매칭하는 기본적인 폼을 구비한 기본 전자화 문서폼을 저장할 수 있는데, 이러한 기본폼 저장모듈(810)은 카테고리 추천부(400)와 연동되어 해당 카테고리 추천부가 기본 문서폼에 존재하는 특정의 주제별 카테고리를 추천하도록 할 수 있다.Specifically, the basic form storage module 810 can store a basic electronic document form with a basic form that matches various farming data written by hand, and this basic form storage module 810 includes a category recommendation unit 400. ), the category recommendation section can recommend specific thematic categories that exist in the basic document form.

문서폼 수정모듈(820)은 기본 문서폼을 사용자 설정에 의해 수정하여 수정 문서폼을 형성할 수 있다.The document form modification module 820 can form a modified document form by modifying the basic document form according to user settings.

구체적으로, 문서폼 수정모듈(820)은 사용자의 요구에 따라 기본 문서폼을 수정할 수 있는 다양흔 툴(TOOL)을 제공함으로써 해당 기본 문서폼을 사용자 맞춤형 문서폼으로 수정하도록 할 수 있다.Specifically, the document form modification module 820 can modify the basic document form into a user-customized document form by providing various tools that can modify the basic document form according to the user's needs.

수정폼 저장모듈(830)은 영농데이터 전자화 문서의 생성을 위한 수정 문서폼을 저장할 수 있다.The modified form storage module 830 can store a modified document form for creating an electronic farming data document.

구체적으로, 수정폼 저장모듈(830)은 다양한 영농데이터와 각각 매칭하는 사용자에 의해 수정된 수정 전자화 문서폼을 저장할 수 있는데, 이러한 수정폼 저장모듈(830)도 카테고리 추천부(400)와 연동되어 해당 카테고리 추천부가 수정 문서폼에 존재하는 특정의 주제별 카테고리를 추천하도록 할 수 있다.Specifically, the modified form storage module 830 can store a modified electronic document form modified by a user that matches each of the various farming data. This modified form storage module 830 is also linked to the category recommendation unit 400. The category recommendation section can recommend categories for each specific topic that exist in the modified document form.

문서 검색부(900)는 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색할 수 있다.The document search unit 900 can search for a specific electronic farming data document stored in the document storage unit.

도 10은 본 발명에 따른 문서 검색부의 구성도이다.Figure 10 is a configuration diagram of a document search unit according to the present invention.

구체적으로, 문서 검색부(900)는 문서 저장부(600)와 연동되며 문서 표시부(700)에 표시될 수 있는데, 이러한 문서 검색부(900)는 도 10에 도시된 바와 같이, 날짜별 검색모듈(910), 및 단어별 검색모듈(920)을 포함할 수 있다.Specifically, the document search unit 900 is linked with the document storage unit 600 and can be displayed on the document display unit 700. As shown in FIG. 10, the document search unit 900 is a search module by date. (910), and may include a word-specific search module (920).

날짜별 검색모듈(910)은 특정 날짜의 입력으로 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색할 수 있다.The search module 910 by date can search for a specific agricultural data electronic document stored in the document storage unit by inputting a specific date.

구체적으로, 날짜별 검색모듈(910)은 사용자가 캘린더 기능을 사용하여 날짜별로 영농일지를 볼 수 있도록 할 수 있다.Specifically, the search module 910 by date can allow the user to view the farming log by date using the calendar function.

단어별 검색모듈(920)은 특정 단어의 입력으로 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색할 수 있다.The word-specific search module 920 can search for a specific agricultural data electronic document stored in the document storage unit by inputting a specific word.

구체적으로, 단어별 검색모듈(920)은 사용자가 특정 단어의 검색 기능을 사용하여 해당 사용자가 원하는 내용의 영농일지를 볼 수 있도록 할 수 있는데, 해당 사용자는 중요단어로 선택한 특정 단어를 이용하여 검색을 수행함으로써 해당 중요단어가 포함된 영농일지를 쉽게 검색할 수 있다. Specifically, the word-by-word search module 920 allows the user to view the farming log with the content desired by the user using a search function for a specific word, and the user searches using a specific word selected as an important word. By performing , you can easily search for farming logs containing relevant important words.

이처럼, 본 발명에 따르면, 수기로 작성된 영농데이터의 이미지를 AI OCR을 활용하여 텍스트로 변환함으로써 해당 영농데이터에 대한 정확성과 신뢰성을 확보할 수 있고, 인력 사용에 따른 비용절감 및 기록물 활용이 가능하며, 시간을 절약하고, 종이로 작성된 영농일지의 파손, 손실을 방지하며, 일관된 폼으로 정리 가능하고, 캘린더, 검색 기능을 사용하여 보다 편리한 농장 관리가 가능할 수 있다.In this way, according to the present invention, by converting images of hand-written farming data into text using AI OCR, the accuracy and reliability of the farming data can be secured, and it is possible to reduce costs due to the use of manpower and utilize records. , saves time, prevents damage and loss of paper farming logs, can be organized in a consistent form, and allows for more convenient farm management using calendar and search functions.

이상과 같이 본 발명에 따른 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템을 예시한 도면을 참조로 하여 설명하였으나, 본 명세서에 개시된 실시예와 도면에 의해 본 발명이 한정되는 것은 아니며, 본 발명의 기술사상 범위 내에서 당업자에 의해 다양한 변형이 이루어질 수 있음은 물론이다.As described above, the smart farm farming data conversion system using the artificial intelligence-based optical character reading model according to the present invention has been described with reference to the drawings, but the present invention is not limited to the embodiments and drawings disclosed in this specification. It goes without saying that various modifications can be made by those skilled in the art within the scope of the present invention.

100:이미지 수집부 200:이미지 전처리부
300:텍스트 변환부 310:객체 분류모듈
320:텍스트 변환모듈 330:텍스트 교정모듈
400:카테고리 추천부 410:텍스트 분류모듈
420:카테고리 추천모듈 500:문서 생성부
510:텍스트 저장모듈 520:중요단어 확정모듈
530:문서 생성모듈 600:문서 저장부
700:문서 표시부 800:문서폼 저장부
810:기본폼 저장모듈 820:문서폼 수정모듈
830:수정폼 저장모듈 900:문서 검색부
910:날짜별 검색모듈 920:단어별 검색모듈
100: Image collection unit 200: Image pre-processing unit
300: Text conversion unit 310: Object classification module
320: Text conversion module 330: Text correction module
400: Category recommendation unit 410: Text classification module
420: Category recommendation module 500: Document creation unit
510: Text storage module 520: Important word confirmation module
530: Document creation module 600: Document storage unit
700: Document display unit 800: Document form storage unit
810: Basic form storage module 820: Document form editing module
830: Modification form storage module 900: Document search unit
910: Search module by date 920: Search module by word

Claims (10)

영농데이터에 대한 이미지를 수집하는 이미지 수집부;
상기 이미지 수집부에서 수집된 영농데이터 이미지를 전처리하는 이미지 전처리부;
상기 이미지 전처리부에서 전처리된 영농데이터 이미지를 인공지능 기반의 광학적 문자 판독(AI-OCR) 모델에 적용하여 상기 영농데이터 이미지를 텍스트로 변환하는 텍스트 변환부;
상기 텍스트 변환부에서 변환된 텍스트를 분석하여 상기 텍스트와 매칭하는 주제별 카테고리를 추천하는 카테고리 추천부;
상기 카테고리 추천부에서 추천된 주제별 카테고리 중 사용자에 의해 선택된 특정 주제의 카테고리에 상기 텍스트를 저장하여 해당 특정 주제의 카테고리가 포함된 영농데이터에 대한 전자화 문서를 생성하는 문서 생성부;
상기 문서 생성부에서 생성된 영농데이터 전자화 문서를 저장하는 문서 저장부;
상기 영농데이터 전자화 문서를 사용자에게 표시하는 문서 표시부;
상기 영농데이터 전자화 문서의 생성을 위한 문서폼이 저장된 문서폼 저장부; 및,
상기 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색하는 문서 검색부;를 포함하며,
상기 문서 생성부는,
상기 사용자에 의해 선택된 특정 주제의 카테고리에 상기 텍스트를 저장하는 텍스트 저장모듈; 상기 텍스트 중 상기 사용자에 의해 특정 단어가 선택된 경우, 해당 특정 단어를 중요단어로 확정하는 중요단어 확정모듈; 및, 상기 텍스트가 저장된 특정 주제의 카테고리가 포함된 상기 영농데이터 전자화 문서를 생성하는 문서 생성모듈;을 포함하되,
상기 텍스트 저장모듈은,
상기 특정 주제의 카테고리에 상기 텍스트를 저장하는 경우, 상기 중요단어 확정모듈에서 확정된 중요단어를 상기 텍스트를 구성하는 다른 단어들과 상이한 표시방식으로 상기 특정 주제의 카테고리에 저장하며,
상기 문서폼 저장부는,
상기 영농데이터 전자화 문서의 생성을 위한 기본 문서폼을 저장하는 기본폼 저장모듈; 상기 기본 문서폼을 사용자 설정에 의해 수정할 수 있는 툴(TOOL)을 제공함으로써 상기 기본 문서폼을 사용자 맞춤형 문서폼으로 수정하여 수정 문서폼을 형성하는 문서폼 수정모듈; 및, 상기 영농데이터 전자화 문서의 생성을 위한 수정 문서폼을 저장하는 수정폼 저장모듈;을 포함하며,
상기 문서 검색부는,
특정 날짜의 입력으로 상기 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색하는 날짜별 검색모듈; 및, 특정 단어의 입력으로 상기 문서 저장부에 저장된 특정 영농데이터 전자화 문서를 검색하는 단어별 검색모듈;을 포함하는 것을 특징으로 하는 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템.
An image collection unit that collects images of farming data;
an image pre-processing unit that pre-processes the farming data images collected by the image collection unit;
A text conversion unit that converts the agricultural data image into text by applying the agricultural data image pre-processed in the image pre-processing unit to an artificial intelligence-based optical character recognition (AI-OCR) model;
a category recommendation unit that analyzes the text converted by the text conversion unit and recommends a category by subject that matches the text;
a document creation unit that stores the text in a specific subject category selected by the user among the subject categories recommended by the category recommendation unit and generates an electronic document for agricultural data including the category of the specific subject;
a document storage unit that stores the electronic farming data document generated in the document creation unit;
a document display unit that displays the electronic farming data document to the user;
a document form storage unit storing a document form for generating the agricultural data electronic document; and,
It includes a document search unit that searches for a specific agricultural data electronic document stored in the document storage unit,
The document creation unit,
a text storage module that stores the text in a category of a specific topic selected by the user; an important word confirmation module that determines the specific word as an important word when a specific word is selected by the user in the text; And, a document creation module for generating the agricultural data electronic document containing a category of a specific subject in which the text is stored,
The text storage module is,
When storing the text in the category of the specific topic, the important words confirmed in the important word confirmation module are stored in the category of the specific topic in a display method different from other words constituting the text,
The document form storage unit,
A basic form storage module that stores a basic document form for generating the agricultural data electronic document; A document form modification module that forms a modified document form by modifying the basic document form into a user-customized document form by providing a tool (TOOL) that can modify the basic document form according to user settings; And, a modified form storage module that stores a modified document form for generating the agricultural data electronic document,
The document search unit,
A search module by date that searches for a specific agricultural data electronic document stored in the document storage unit by inputting a specific date; And, a word-specific search module that searches for a specific agricultural data electronic document stored in the document storage unit by inputting a specific word; a smart farm agricultural data conversion system using an artificial intelligence-based optical character reading model, comprising: .
제 1항에 있어서,
상기 이미지 전처리부는,
상기 영농데이터 이미지의 기울임 보정, 여백 제거, 노이즈 제거 및 회전 보정을 통해 상기 영농데이터 이미지를 전처리하는 것을 특징으로 하는 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템.
According to clause 1,
The image preprocessing unit,
A smart farm farming data conversion system using an artificial intelligence-based optical character reading model, characterized in that the farming data image is pre-processed through tilt correction, blank space removal, noise removal, and rotation correction of the farming data image.
제 1항에 있어서,
상기 텍스트 변환부는,
상기 영농데이터 이미지에 포함된 객체를 감지하여 상기 객체를 종류별로 분류하는 객체 분류모듈;
상기 객체 분류모듈에서 분류된 종류별 객체를 텍스트로 변환하는 텍스트 변환모듈; 및
상기 텍스트 변환모듈에서 변환된 텍스트의 표시 및 문법을 확인하여 오표시된 텍스트를 교정하는 텍스트 교정모듈;을 포함하는 것을 특징으로 하는 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템.
According to clause 1,
The text conversion unit,
an object classification module that detects objects included in the farming data image and classifies the objects by type;
a text conversion module that converts objects by type classified by the object classification module into text; and
A smart farm farming data conversion system using an artificial intelligence-based optical character reading model, comprising a text correction module that checks the display and grammar of the text converted from the text conversion module and corrects incorrectly displayed text.
제 1항에 있어서,
상기 카테고리 추천부는,
상기 텍스트 변환부에서 변환된 텍스트의 위치, 종류 및 형식을 분석하여 상기 텍스트를 주제별로 분류하는 텍스트 분류모듈; 및
상기 텍스트 분류모듈에서 분류된 상기 텍스트의 주제별 분류에 매칭하는 주제별 카테고리를 자동으로 추천하는 카테고리 추천모듈;을 포함하는 것을 특징으로 하는 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템.
According to clause 1,
In the category recommendation section,
a text classification module that analyzes the location, type, and format of the text converted by the text conversion unit and classifies the text by topic; and
A smart farm farming data conversion system using an artificial intelligence-based optical character reading model, comprising a category recommendation module that automatically recommends a thematic category that matches the thematic classification of the text classified in the text classification module. .
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete
KR1020220152543A 2022-11-15 2022-11-15 A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence KR102654311B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220152543A KR102654311B1 (en) 2022-11-15 2022-11-15 A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence
PCT/KR2023/013797 WO2024106721A1 (en) 2022-11-15 2023-09-14 Smartfarm agricultural data conversion system using artificial intelligence–based optical character recognition model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220152543A KR102654311B1 (en) 2022-11-15 2022-11-15 A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence

Publications (1)

Publication Number Publication Date
KR102654311B1 true KR102654311B1 (en) 2024-04-05

Family

ID=90714044

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220152543A KR102654311B1 (en) 2022-11-15 2022-11-15 A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence

Country Status (2)

Country Link
KR (1) KR102654311B1 (en)
WO (1) WO2024106721A1 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1258818A2 (en) * 2001-05-14 2002-11-20 Hitachi, Ltd. Document management method and document management system
JP2004326563A (en) * 2003-04-25 2004-11-18 Yuki Saisei Co Ltd Management device of cultivation history
JP2011039580A (en) * 2009-08-06 2011-02-24 Konica Minolta Business Technologies Inc Device and method for processing document, and program
KR101516684B1 (en) 2013-12-19 2015-05-11 주식회사 지트레이스 A service method for transforming document using optical character recognition
JP2020044761A (en) * 2018-09-20 2020-03-26 富士ゼロックス株式会社 Information processor and program
JP2020067721A (en) * 2018-10-22 2020-04-30 キヤノン株式会社 Information processing apparatus, server, display method of electronic document, distribution method of electronic document, electronic document generation system and program
KR20220083120A (en) * 2020-12-11 2022-06-20 주식회사 웨시 Apparatus and method for Optical character recognition processing for entrance examination data

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5877775B2 (en) * 2012-09-03 2016-03-08 株式会社日立製作所 Content management apparatus, content management system, content management method, program, and storage medium

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1258818A2 (en) * 2001-05-14 2002-11-20 Hitachi, Ltd. Document management method and document management system
JP2004326563A (en) * 2003-04-25 2004-11-18 Yuki Saisei Co Ltd Management device of cultivation history
JP2011039580A (en) * 2009-08-06 2011-02-24 Konica Minolta Business Technologies Inc Device and method for processing document, and program
KR101516684B1 (en) 2013-12-19 2015-05-11 주식회사 지트레이스 A service method for transforming document using optical character recognition
JP2020044761A (en) * 2018-09-20 2020-03-26 富士ゼロックス株式会社 Information processor and program
JP2020067721A (en) * 2018-10-22 2020-04-30 キヤノン株式会社 Information processing apparatus, server, display method of electronic document, distribution method of electronic document, electronic document generation system and program
KR20220083120A (en) * 2020-12-11 2022-06-20 주식회사 웨시 Apparatus and method for Optical character recognition processing for entrance examination data

Also Published As

Publication number Publication date
WO2024106721A1 (en) 2024-05-23

Similar Documents

Publication Publication Date Title
US8233751B2 (en) Method and system for simplified recordkeeping including transcription and voting based verification
US20200293616A1 (en) Generating a meeting review document that includes links to the one or more documents reviewed
US8196030B1 (en) System and method for comparing and reviewing documents
US8908971B2 (en) Devices, systems and methods for transcription suggestions and completions
US20060282442A1 (en) Method of learning associations between documents and data sets
US8433708B2 (en) Methods and data structures for improved searchable formatted documents including citation and corpus generation
CN113254574A (en) Method, device and system for auxiliary generation of customs official documents
US11379690B2 (en) System to extract information from documents
CN109783796A (en) Predict that the pattern in content of text destroys
US20200175268A1 (en) Systems and methods for extracting and implementing document text according to predetermined formats
US8953228B1 (en) Automatic assignment of note attributes using partial image recognition results
CN110889310A (en) Financial document information intelligent extraction system and method
CN113159969A (en) Financial long text rechecking system
US20190215579A1 (en) Derivative media content systems and methods
RU2702967C1 (en) Method and system for checking an electronic set of documents
Thammarak et al. Automated data digitization system for vehicle registration certificates using google cloud vision API
US20160328374A1 (en) Methods and Data Structures for Improved Searchable Formatted Documents including Citation and Corpus Generation
KR102654311B1 (en) A Smart Farm Farming Data Conversion System Using Optical Character Recognition Model Based On Artificial Intelligence
US20080091694A1 (en) Transcriptional dictation
CN111815108A (en) Evaluation method for power grid engineering design change and on-site visa approval sheet
Pedersen et al. Lessons learned developing and using a machine learning model to automatically transcribe 2.3 million handwritten occupation codes
Vinciarelli et al. Application of information retrieval technologies to presentation slides
CN116384344A (en) Document conversion method, device and storage medium
CN115543915A (en) Automatic database building method and system for personnel file directory
US20240135740A1 (en) System to extract checkbox symbol and checkbox option pertaining to checkbox question from a document