KR102080409B1 - Lecture voice file text conversion system based on lecture-related keywords - Google Patents

Lecture voice file text conversion system based on lecture-related keywords Download PDF

Info

Publication number
KR102080409B1
KR102080409B1 KR1020180125390A KR20180125390A KR102080409B1 KR 102080409 B1 KR102080409 B1 KR 102080409B1 KR 1020180125390 A KR1020180125390 A KR 1020180125390A KR 20180125390 A KR20180125390 A KR 20180125390A KR 102080409 B1 KR102080409 B1 KR 102080409B1
Authority
KR
South Korea
Prior art keywords
module
lecture
text
word
detection module
Prior art date
Application number
KR1020180125390A
Other languages
Korean (ko)
Other versions
KR20190108468A (en
Inventor
오유철
Original Assignee
주식회사 산타
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 산타 filed Critical 주식회사 산타
Priority to KR1020180125390A priority Critical patent/KR102080409B1/en
Publication of KR20190108468A publication Critical patent/KR20190108468A/en
Application granted granted Critical
Publication of KR102080409B1 publication Critical patent/KR102080409B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다. 보다 상세하게는 강의 키워드 입력 모듈을 구비함으로써, 키워드 별 가중치를 적용할 수 있고, 검색 모듈로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키며, 수정 모듈을 구비함으로써, 오류 검출 모듈에서 검출된 단어를 이루는 각 음절의 초성, 중성, 및 종성이 관련 단어 검출 모듈에서 검출된 단어와의 일치도에 따라 차등 표식하여, 사용자 정정 모듈로 이를 확인하고, 텍스트를 정정할 수 있어, 사용자의 작업 시간을 단축하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다.
이를 위해 본 발명은 강의의 음성을 녹음하는 강의 녹음 모듈; 강의 녹음 모듈로 녹음되는 음성을 음성 인식을 수행하여 텍스트로 변환하는 텍스트 변환 모듈; 강의 녹음 모듈로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 강의 키워드 입력 모듈; 웹서버에서 강의 키워드 입력 모듈로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬하는 검색 모듈; 검색 모듈로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 저장하는 텍스트 취합 모듈; 텍스트 취합 모듈로 취합된 텍스트 중 2회 이상 반복된 단어를 검출하는 관련 단어 검출 모듈; 사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈로 변환된 텍스트 중 정보가 없는 단어를 검출하는 오류 검출 모듈; 오류 검출 모듈로 검출된 단어와 관련 단어 검출 모듈로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식하는 수정 모듈; 및 수정 모듈로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 하는 사용자 정정 모듈을 제공한다.
The present invention relates to a lecture voice file text conversion system based on lecture related keywords. More specifically, by providing the keyword input module of the lecture, the weight of each keyword can be applied, and the search module applies the weight to the search module. Can be converted into text, so that words do not deviate from the subject of the lecture as much as possible, improve speech recognition accuracy, and have a correction module, so that the syllables, neutral, and The lecture voice based on the lecture-related keywords that the finality is differentially marked according to the degree of coincidence with the detected words in the related word detection module, and confirmed by the user correction module, and the text can be corrected, thereby reducing the user's working time. File text conversion system.
To this end, the present invention is a lecture recording module for recording the voice of the lecture; A text conversion module for converting the voice recorded by the lecture recording module into text by performing voice recognition; A lecture keyword input module for inputting keywords related to a specific subject of a lecture recorded by the lecture recording module; A search module for searching by a keyword inputted into a lecture keyword input module in a web server and sorting the search results in order of the number of times a keyword is included in a web page; A text collecting module configured to extract and store text posted on web pages up to a predetermined rank among web pages searched by the search module; An associated word detection module for detecting a word repeated two or more times among the text collected by the text collecting module; An error detection module detecting a word having no information among the texts converted into the text conversion module based on the part-of-speech information and the pronunciation information of each word in connection with a dictionary providing service; A correction module for comparing the word detected by the error detection module with the word detected by the related word detection module and correcting the detected word in the related word detection module if it meets a specific condition, and marking it differently according to the specific condition; And it provides a user correction module that can confirm the modified portion with a different marker, and correct the text by the correction module.

Description

강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템{Lecture voice file text conversion system based on lecture-related keywords}Lecture voice file text conversion system based on lecture-related keywords}

본 발명은 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다. 보다 상세하게는 강의 키워드 입력 모듈을 구비함으로써, 키워드별 가중치를 적용할 수 있고, 검색 모듈로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키며, 수정 모듈을 구비함으로써, 오류 검출 모듈에서 검출된 단어를 이루는 각 음절의 초성, 중성, 및 종성이 관련 단어 검출 모듈에서 검출된 단어와의 일치도에 따라 차등 표식하여, 사용자 정정 모듈로 이를 확인하고, 텍스트를 정정할 수 있어, 사용자의 작업 시간을 단축하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다. The present invention relates to a lecture voice file text conversion system based on lecture related keywords. More specifically, by providing the keyword input module of the lecture, the weight of each keyword can be applied, and the search module applies the weight to the search module, so that the voice of the lecture is based on the text of the webpage composed of terms frequently used during the lecture. Can be converted into text, so that words do not deviate from the subject of the lecture as much as possible, improve speech recognition accuracy, and have a correction module, so that the syllables, neutral, and The lecture voice based on the lecture-related keywords that the finality is differentially marked according to the degree of coincidence with the detected word in the related word detection module, and confirmed by the user correction module, and the text can be corrected, thereby reducing the user's working time. File text conversion system.

최근 애플의 시리(Siri), 구글 보이스, 삼성전자 S보이스 등 음성 인식 기술이 대중화되고 있으며, 스마트워치나 구글 글래스와 같은 웨어러블 장치에서는 음성 인식을 가장 주요한 문자 입력 수단으로 활용할 것으로 예상되며, 음성 인식 기술은 오래전부터 개발되어 온 기술임에도 불구하고, 정확한 음성 인식을 통하여 텍스트로 치환되어 입력되는데 있어서 아직도 오류가 다수 발생하고 있다.Recently, voice recognition technologies such as Apple's Siri, Google Voice, and Samsung's S-Voice have become popular, and wearable devices such as smart watches and Google Glass are expected to use voice recognition as the most important means of inputting text. Although the technology has been developed for a long time, a large number of errors still occur in inputting texts through accurate speech recognition.

음성 인식으로 입력을 행하면, 텍스트로 치환되어 이것이 사용자에게 보여지게 되는데, 인식된 텍스트가 의도와 다르거나 오류가 있는 경우가 빈번히 발생한다.When inputting by voice recognition, the text is replaced with text and is displayed to the user, and the recognized text is frequently different from the intention or there is an error.

특히, 음성에서 텍스트로 변환하는 도구인 API는 음성에서 텍스트로 변환할 수 있는 시스템을 제공하나, 음성을 텍스트로 변환하였을 때 사람마다 말하는 방식의 차이, 음성의 차이, 주위 소음이나 잡음 등의 방해 요소로 인해 정확도가 떨어지는 문제점이 있다.In particular, the API, which is a tool that converts voice to text, provides a system that can convert voice to text, but when voice is converted to text, there are differences in how people speak, voice, and noise and noise. There is a problem that the accuracy is low due to the factor.

또한, 강의 시, 강의 음성 내용을 텍스트 변환하여 자막으로 사용할 경우에, 강의 내용 텍스트 파일의 정확성을 요구하지만 인식 오류 등을 포함하여 기대에 미치지 못하는 실정이다. In addition, in the case of lectures, when the lecture voice content is converted to text and used as a subtitle, the accuracy of the lecture text file is required, but it does not meet expectations including recognition errors.

또한, 상기의 강의를 녹음한 파일은 용량이 커 보관하는 데 한계가 있고, 추후 특정 문구를 검색하는 데 무리가 있으며, 추후, 데이터 분석을 통한 2차 자료 활용에도 제약이 따르는 문제점이 있다.In addition, the file recording the lecture has a large capacity, there is a limit to keep, there is a problem to search for a specific phrase in the future, there is a problem that there is a restriction in the secondary data utilization through data analysis later.

선행기술문헌 : KR등록특허공보 제1651909호(2016.8.29 공고)Prior Art Document: KR Patent No. 1165909 (announced Aug. 29, 2016)

본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로, 강의 음성파일로부터 텍스트 추출 정확도가 높은 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템을 제공하는 데 그 목적이 있다.The present invention has been made to solve the above problems, and an object of the present invention is to provide a lecture voice file text conversion system based on lecture-related keywords with high text extraction accuracy from lecture voice files.

상기 목적을 달성하기 위해 안출된 본 발명에 따른 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템은 강의의 음성을 녹음하는 강의 녹음 모듈; 강의 녹음 모듈로 녹음되는 음성을 음성 인식을 수행하여 텍스트로 변환하는 텍스트 변환 모듈; 강의 녹음 모듈로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 강의 키워드 입력 모듈; 웹서버에서 강의 키워드 입력 모듈로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬하는 검색 모듈; 검색 모듈로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 저장하는 텍스트 취합 모듈; 텍스트 취합 모듈로 취합된 텍스트 중 2회 이상 반복된 단어를 검출하는 관련 단어 검출 모듈; 사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈로 변환된 텍스트 중 정보가 없는 단어를 검출하는 오류 검출 모듈; 오류 검출 모듈로 검출된 단어와 관련 단어 검출 모듈로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식하는 수정 모듈; 및 수정 모듈로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 하는 사용자 정정 모듈을 포함할 수 있다.Lecture voice file text conversion system based on the lecture-related keywords according to the present invention devised to achieve the above object comprises a lecture recording module for recording the voice of the lecture; A text conversion module for converting the voice recorded by the lecture recording module into text by performing voice recognition; A lecture keyword input module for inputting keywords related to a specific subject of a lecture recorded by the lecture recording module; A search module for searching by a keyword inputted into a lecture keyword input module in a web server and sorting the search results in order of the number of times a keyword is included in a web page; A text collecting module configured to extract and store text posted on web pages up to a predetermined rank among web pages searched by the search module; An associated word detection module for detecting a word repeated two or more times among the text collected by the text collecting module; An error detection module connected to a dictionary providing service and detecting a word having no information among texts converted into a text conversion module based on parts of speech information and pronunciation information of each word; A correction module for comparing the word detected by the error detection module with the word detected by the related word detection module and correcting the detected word in the related word detection module if it meets a specific condition, and marking it differently according to the specific condition; And a user correction module for identifying the modified part with the different markings and correcting the text.

또한, 수정 모듈은 오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성과 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 표식하고, 오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성과 일치하고, 중성이 하나 이상 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 다르게 표식하며, 오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성이 일치하고, 중성이 하나 이상 일치하며, 종성이 하나 이상 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 또 다르게 표식하는 것을 포함할 수 있다.In addition, when the initiality of the words detected in the error detection module matches the initiality of the words detected in the related word detection module, the correction module corrects the detected words in the related word detection module, marks them, and displays the error in the error detection module. If the initiality of the detected word matches the initiality of the detected word in the related word detection module, and if one or more neutrals match, correct the detected word in the related word detection module, mark it differently, and detect it in the error detection module. If the initiality of the detected words matches the initiality of the words detected in the related word detection module, the one or more neutrals match, and the one or more finality matches, the corrected words are corrected to the detected words in the related word detection module and marked differently. It may include doing.

또한, 강의 키워드 입력 모듈은 입력된 키워드마다 가중치를 부여할 수 있고, 검색 모듈로 검색 시 가중치를 적용하여 키워드 포함 횟수를 산출하도록 하는 것을 포함할 수 있다.In addition, the lecture keyword input module may assign a weight to each input keyword, and may include calculating a number of keyword inclusions by applying a weight to a search module when searching.

본 발명에 의하면, 강의 키워드 입력 모듈을 구비함으로써, 각 키워드 별 가중치를 적용할 수 있고, 검색 모듈로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키는 데 그 효과가 있다. According to the present invention, by providing a keyword input module of the lecture, it is possible to apply the weight for each keyword, and to search by applying the weight with the search module, based on the text of the web page composed of terms frequently used in the lecture The voice of the lecture can be converted into text, which helps to ensure that words do not deviate from the subject of the lecture as much as possible and improves speech recognition accuracy.

또한, 본 발명에 의하면, 수정 모듈을 구비함으로써, 오류 검출 모듈에서 검출된 단어를 이루는 각 음절의 초성, 중성, 및 종성이 관련 단어 검출 모듈에서 검출된 단어와의 일치도에 따라 차등 표식하여, 사용자 정정 모듈로 이를 확인하고, 정정할 수 있어, 정확도를 높이고 사용자의 작업 시간을 단축하는 데 그 효과가 있다.In addition, according to the present invention, by providing a correction module, the initial consonant, the neutral, and the finality of each syllable constituting the word detected by the error detection module are differentially marked according to the degree of agreement with the word detected by the related word detection module. The correction module can check and correct this, which has the effect of increasing accuracy and reducing the user's working time.

도 1은 본 발명의 바람직한 실시예에 따른 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템의 개념도이다.1 is a conceptual diagram of a lecture voice file text conversion system based on lecture related keywords according to a preferred embodiment of the present invention.

이하, 본 발명의 바람직한 실시 예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 이하에서 본 발명의 바람직한 실시예를 설명할 것이나, 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. First of all, in adding reference numerals to the components of each drawing, it should be noted that the same reference numerals have the same reference numerals as much as possible even if displayed on different drawings. In addition, in describing the present invention, if it is determined that the detailed description of the related well-known configuration or function may obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, preferred embodiments of the present invention will be described below, but the technical spirit of the present invention is not limited thereto, but may be variously modified and modified by those skilled in the art.

도 1은 본 발명의 바람직한 실시예에 따른 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템(1000)의 개념도이다.1 is a conceptual diagram of a lecture voice file text conversion system 1000 based on lecture related keywords according to a preferred embodiment of the present invention.

본 발명의 바람직한 실시예에 따른 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템(1000)은, 도 1을 참조하면, 강의 녹음 모듈(10), 잡음 제거 모듈(20), 텍스트 변환 모듈(30), 강의 키워드 입력 모듈(40), 검색 모듈(50), 텍스트 취합 모듈(60), 관련 단어 검출 모듈(70), 오류 검출 모듈(80), 수정 모듈(90), 및 사용자 정정 모듈(100)을 포함하여 구성되고, 강의 시 녹음된 음성을 텍스트로 변환이 용이하게 하며, 정확도를 향상시킴에 따라 강의 자막을 만들 때 사용자의 시간을 절약할 수 있도록 한다.The lecture voice file text conversion system 1000 based on the lecture related keyword according to the preferred embodiment of the present invention, referring to FIG. 1, the lecture recording module 10, the noise removing module 20, and the text conversion module ( 30, lecture keyword input module 40, search module 50, text collection module 60, related word detection module 70, error detection module 80, correction module 90, and user correction module ( 100), and it is easy to convert the recorded voice to text during the lecture, and improve the accuracy to save the user time when creating the lecture subtitles.

이하, 강의 녹음 모듈(10)부터 상세히 설명하기로 한다.Hereinafter, the lecture recording module 10 will be described in detail.

강의 녹음 모듈(10)은 강의의 음성을 녹음하는 것으로, 영상이 필요할 경우에는 영상 촬영 내 음성이 포함될 수 있도록 하며, 본 발명에서는 음성을 텍스트로 변환하는 것으로 음성 파일을 얻을 수 있도록 한다. Lecture recording module 10 is to record the voice of the lecture, if the image is required to include the voice in the video shooting, in the present invention to convert the voice to text to obtain a voice file.

잡음 제거 모듈(20)은 강의 녹음 모듈(10)로 녹음된 음성 데이터를 재생하여 주파수를 추출하고, 주파수 영역에서 사람의 목소리가 조사되는 특정 구간의 주파수를 제외한 나머지 외부 잡음 부분을 제거한다. 특히, 음성 및 잡음구간 인식과 제거는 스펙트럼 차감법이나 LMS 알고리즘 적응필터 등을 이용하여 다양한 방식으로 잡음이 제거될 수 있다.The noise removing module 20 extracts a frequency by reproducing voice data recorded by the lecture recording module 10, and removes an external noise portion except for a frequency of a specific section in which a human voice is irradiated in the frequency domain. In particular, the speech and noise section recognition and removal can be removed in various ways using a spectral subtraction method or an LMS algorithm adaptive filter.

또한, 잡음 제거 모듈(20)은 잡음 부분을 제거하면서, 주파수가 사람의 목소리가 조사되는 구간이고, 일정 이하의 음성 주파수가 일정 시간 지속되는 경우, 강의자의 말이 쉬어주는 부분(글에서 띄어쓰는 부분이 될 수 있다.)이라 판단하고, 이를 기준으로 파일을 분리저장 하도록 할 수 있다. In addition, the noise removing module 20 is a section in which the frequency of the human voice is irradiated while removing the noise portion, and when the voice frequency below a certain duration lasts for a certain time, the part where the lecturer rests (a portion of the text to be written) Can be determined), and the file can be separated and stored.

본 발명에서 분리 저장하는 것은, 길이가 긴 음성파일을 텍스트로 변환하는 것보다 각 부분을 따로 음성에서 텍스트로 변환하는 것이 음성 인식률과 정확성이 높기 때문이다.In the present invention, the separate storage is because the voice recognition rate and the accuracy are higher in converting each part separately from the text to the text rather than converting the long voice file into the text.

텍스트 변환 모듈(30)은 강의 녹음 모듈(10)로 녹음되는 음성, 잡음 제거 모듈(20)로 잡음이 제거된 음성을 음성 인식을 수행하여 텍스트로 변환하고, 텍스트 변환 모듈(30)은 API(Application Programming Interface)를 이용하여 음성을 텍스트로 변환하도록 하며, API는 종래에 사용되는 음성 텍스트 변환용(ex. Google speech API, IBM watson speech)으로 사용될 수 있으며 종류에 한정하지 않도록 한다.The text conversion module 30 converts the voice recorded by the lecture recording module 10 and the noise removal module 20 into speech by performing noise recognition, and converts the text into an API ( Application Programming Interface) to convert the speech to text, and the API can be used for speech text conversion (ex. Google speech API, IBM watson speech) used in the prior art, and is not limited to the type.

강의 키워드 입력 모듈(40)은 강의 녹음 모듈(10)로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 것으로, 입력된 키워드마다 가중치를 부여할 수 있고, 검색 모듈(50)로 검색 시 가중치를 적용하여 키워드 포함 횟수를 산출하도록 할 수 있다.The lecture keyword input module 40 inputs a keyword related to a specific subject of a lecture recorded by the lecture recording module 10, and may assign weights to each of the input keywords. Can be applied to calculate the number of keywords included.

특히, 강의 키워드 입력 모듈(40)은 키워드별 가중치를 개별 적용할 수 있고, 검색 모듈(50)로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키는 장점이 있다.In particular, the lecture keyword input module 40 may individually apply keyword weights, and search by applying weights to the search module 50 based on the text of a webpage composed of terms that are frequently used during the lecture. Since the voice of the lecture can be converted into text, the words do not deviate as much as possible from the subject of the lecture during the conversion, and there is an advantage of improving the speech recognition accuracy.

일례로, "막걸리 만드는법"에 대한 강의를 진행했다고 가정하면, 강의 키워드 입력 모듈(40)로 강의 주제와 연관된 막걸리, 이산화탄소, 효모, 누룩, 등을 포함하는 키워드를 입력하고, 키워드별로 가중치를 부여한다. 막걸리는 50%, 이산화탄소 10%, 효모 5%, 누룩 30%로 가중치를 부여하게 되면, 검색 모듈(50)을 통하여 검색된 웹 페이지에 막걸리가 한 번 기재되어 있더라도, 가중치를 부여하여 세 번 기재된 것으로 계산하도록 하기에 강의 주제와 밀접성이 높은 단어는 가중치를 높게 부여하는 것이 만족도 높은 검색이 가능하도록 한다.For example, assuming that a lecture on "How to make makgeolli" is given, the keyword input module 40 inputs keywords including makgeolli, carbon dioxide, yeast, yeast, and the like, which are related to the subject of the lecture, and weights each keyword. Grant. When rice wine is weighted as 50%, carbon dioxide 10%, yeast 5%, and yeast 30%, even if the rice wine is listed once on the web page searched through the search module 50, the weight is given three times. In order to calculate the high word weights that are closely related to the subject of the lecture, it is possible to search satisfactorily.

검색 모듈(50)은 웹서버에서 강의 키워드 입력 모듈(40)로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬한다.The search module 50 searches for the keyword inputted to the lecture keyword input module 40 in the web server, and sorts the search results in order of the number of times the keyword is included in the web page.

또한, 강의 키워드 입력 모듈(40)로 특정 키워드에 가중치를 부여하면, 가중치를 적용시켜 순서대로 검색 결과를 제공함은 물론이다. In addition, if a specific keyword is weighted by the lecture keyword input module 40, the search results may be provided in order by applying the weight.

텍스트 취합 모듈(60)은 검색 모듈(50)로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 DB에 저장한다.The text collection module 60 extracts the text posted on the web page up to a certain rank among the web pages searched by the search module 50 and stores the text in the DB.

상기의 일정 순위는 사용자의 설정에 의해 변경 실시될 수 있으며, 텍스트 취합 모듈(60)은 앞서 검색 모듈(50)을 통해 강의 내용과 연관성이 높다고 판단되는 텍스트를 취합한다.The schedule ranking may be changed according to a user's setting, and the text collecting module 60 may collect text determined to be highly related to the lecture contents through the search module 50.

관련 단어 검출 모듈(70)은 텍스트 취합 모듈(60)로 취합된 텍스트 중 2회 이상 반복된 단어를 검출한다. 상기 2회 이상(복수회) 반복되는 단어는 강의 주제와 밀접한 관련이 있는 단어라고 볼 수 있고, 상기 단어들을 기준으로 음성 인식 오류 텍스트를 수정하고자 한다.The related word detection module 70 detects a word repeated two or more times among the text collected by the text collecting module 60. The word repeated two or more times may be regarded as a word that is closely related to the subject of the lecture, and the speech recognition error text is corrected based on the words.

오류 검출 모듈(80)은 웹서버의 사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈(30)로 변환된 텍스트 중 정보가 없는 단어를 검출한다. 검출된 단어는 음성 인식의 오류일 가능성이 높다.The error detection module 80 detects a word having no information in the text converted by the text conversion module 30 based on the part-of-speech information and the pronunciation information of each word in connection with a dictionary providing service of the web server. The detected word is most likely an error in speech recognition.

수정 모듈(90)은 오류 검출 모듈(80)로 검출된 단어와 관련 단어 검출 모듈(70)로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈(70)에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식한다. The correction module 90 compares the word detected by the error detection module 80 with the word detected by the related word detection module 70 and corrects the word detected by the related word detection module 70 if it meets a specific condition. And it is labeled differently according to specific conditions.

또한, 수정 모듈(90)의 특정 조건에 대해 상세히 서술하기로 한다.In addition, specific conditions of the modification module 90 will be described in detail.

수정 모듈(90)은 오류 검출 모듈(80)에서 검출된 단어의 초성이 관련 단어 검출 모듈(70)에서 검출된 단어의 초성과 일치할 경우, 관련 단어 검출 모듈(70)에서 검출된 단어로 수정하고, 이를 표식한다.The correction module 90 corrects the word detected by the related word detection module 70 when the initiality of the word detected by the error detection module 80 matches that of the word detected by the related word detection module 70. And mark it.

또한, 수정 모듈(90)은 오류 검출 모듈(80)에서 검출된 단어의 초성이 관련 단어 검출 모듈(70)에서 검출된 단어의 초성과 일치하고, 중성이 하나 이상 일치할 경우, 관련 단어 검출 모듈(70)에서 검출된 단어로 수정하고, 이를 다르게 표식한다.In addition, the correction module 90, if the initiality of the words detected by the error detection module 80 matches the initiality of the words detected by the related word detection module 70, and the neutrality matches one or more, the related word detection module Correct the word detected at 70 and mark it differently.

또한, 수정 모듈(90)은 오류 검출 모듈(80)에서 검출된 단어의 초성이 관련 단어 검출 모듈(70)에서 검출된 단어의 초성이 일치하고, 중성이 하나 이상 일치하며, 종성이 하나 이상 일치할 경우, 관련 단어 검출 모듈(70)에서 검출된 단어로 수정하고, 이를 또 다르게 표식한다.Further, the correction module 90 matches the initiality of the words detected by the error detection module 80 with the initiality of the words detected by the related word detection module 70, one or more neutrals, and one or more finality matches. If so, the word detected by the relevant word detection module 70 is corrected, and it is marked differently.

일례로, 오류 검출 모듈(80)에서 사전에 없는 음성 인식 오류인 "이산하탓소"를 검출했을 경우, 관련 단어 검출 모듈(70)의 단어(텍스트 취합 모듈(60)로 취합된 된 단어 중 복수회 반복되는 단어) 중, 초성, 중성, 종성이 어느 정도 일치하는지 확인한다. For example, when the error detection module 80 detects "discrete data," which is a speech recognition error that is not found in the dictionary, a word of the related word detection module 70 (a plurality of words collected by the text collection module 60). Of the repeated words) to see how closely the initial, neutral, and final species match.

오류 단어인 "이산하탓소"는 관련 단어 검출 모듈(70)의 단어인 "이산화탄소"와 초성 'ㅇ(이)', 'ㅅ(산)', 'ㅎ(하)', 'ㅌ(탓)', 'ㅅ(소)'로 5개가 일치하고, 중성은 'ㅣ(이)', 'ㅏ(산)', 'ㅏ(탓)', 'ㅗ(소)'로 중성도 4개가 일치하며, 종성에서 'ㄴ'으로 '산'의 'ㄴ'과 1개 일치하고, '탄'의 'ㄴ'과 'ㅅ'이 불일치한다. 이에 따라 본 발명에서는 초성은 모두 일치하고, 중성과 종성은 하나 이상 일치하므로 파란색의 표식을 할 수 있다. The error word "dispersed data" is the word of the related word detection module 70, "carbon dioxide" and the initial "ㅇ", "ㅅ (acid)", "ㅎ (하)", "ㅌ (because)" , Five matches with 'ㅅ (소)', four with neutrality with 'ㅣ (이)', 'ㅏ (mountain)', 'ㅏ (be)', 'ㅗ (소)', In baptism, 'b' coincides with 'b' in 'mountain', and 'b' and 's' in 'tan' disagree. Accordingly, in the present invention, all of the initial castles match, and the neutrality and the finality match one or more, so that blue markings can be performed.

만약, 오류 단어가 "이사하타소"라면, "이산화탄소"와 초성은 5개 모두 일치하고, 중성도 4개가 일치하지만, 종성이 불일치하므로, "이산화탄소"로 수정하고, 파란색과 다른 초록색으로 표식을 할 수 있다.If the error word is "Isahatasso," then "carbon dioxide" and all four stars match all four, and four neutrals match, but the finality is inconsistent. can do.

또한, 오류 단어가 "아선하터서"라면, "이산화탄소"와 초성은 5개 모두 일치하고, 중성은 불일치하며, 종성은 '선'에서 'ㄴ'이 '산'과 일치하여 1개가 일치하지만, 중성이 일치하는 부분이 없으므로 초성만 일치하는 것으로하여, "이산화탄소"로 수정하고 파란색과 초록색을 제외한 자주색으로 표식을 할 수 있다.In addition, if the error word is "subtle", "carbon dioxide" and "super" match all 5, neutrals do not match, and "one" matches "san" in "line", but one matches. Since there is no neutral match, only the first star can be matched, so it can be corrected to "CO2" and marked with purple except blue and green.

또한, 오류 단어나 정정 단어의 초성 또는 종성이 쌍자음(ㄲ, ㄸ, ㅃ, ㅆ, ㅉ)일 경우에는, 쌍자음과 자음이 초성 또는 종성이 동일 범주로 카운트하여 일치 여부를 판단하도록 한다.In addition, when the initial or final consonants of an error word or a correction word are twin consonants (ㄲ, ㄸ, ㅃ, ㅆ, ㅉ), the consonants and consonants are counted in the same category to determine whether they match.

보다 상세하게는, 오류 단어가 "눈섭"이라면, "눈썹"과 초성이 1개('ㄴ')가 일치하지만, 된발음으로 인해 "썹"을 "섭"으로 발음하는 경우가 종종 있으므로, '섭'의 자음 'ㅅ'이 쌍자음 'ㅆ'과 일치(동일 범주)한다고 판단하여 초성이 2개가 모두 일치하는 것으로 판단하도록 한다.More specifically, if the error word is "brows", "eyebrows" and the first consonant ('ㄴ') match, but "brows" are often pronounced as "sup" due to old pronunciation, 'Sub' consonant 'ㅅ' is consonant with the consonant 'ㅆ' (the same category), so that the two consonants are judged to match.

또한, 초성, 중성, 종성이 일치하지 않는 경우에는 별도로 표식을 하여 사용자 정정 모듈(100)을 통해 이를 확인하여 수정할 수 있도록 한다.In addition, when the initial, neutral, and finality do not match, a separate marking is made so that the user correction module 100 can check and correct it.

일례로, "이산화탄소"가 "이사나타스"로 인식될 경우, 초성과 종성이 모두 일치하지 않고, 중성이 'ㅣ(이)', 'ㅏ(산)', 'ㅏ(탄)'으로 3개 일치하는 경우로 상기 기재에 해당하지 않는다. 이는 파란색, 초록색, 자주색을 제외한 별개의 색인 빨간색으로 표식할 수 있다.For example, when "carbon dioxide" is recognized as "Isanatas", both the initial and the trailing species do not coincide, and the neutrality is three such as 'ㅣ (이)', 'ㅏ (acid)' and 'ㅏ (tan)'. The same does not correspond to the above description. It can be marked with a separate index red except for blue, green and purple.

또한, 수정 모듈(90)은 사용자의 환경에 맞게 적절히 조건을 부가하여 변경 사용할 수도 있음은 물론이다. In addition, the modification module 90 may be used by changing the conditions as appropriate to the user's environment.

사용자 정정 모듈(100)은 수정 모듈(90)로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 한다.The user correction module 100 may identify the portion modified by the modification module 90 with different marks, and may correct the text.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present invention, and various modifications, changes, and substitutions may be made by those skilled in the art without departing from the essential characteristics of the present invention. will be. Accordingly, the embodiments disclosed in the present invention and the accompanying drawings are not intended to limit the technical spirit of the present invention but to describe the present invention, and the scope of the technical idea of the present invention is not limited by the embodiments and the accompanying drawings. . The protection scope of the present invention should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be construed as being included in the scope of the present invention.

10 - 강의 녹음 모듈
20 - 잡음 제거 모듈
30 - 텍스트 변환 모듈
40 - 강의 키워드 입력 모듈
50 - 검색 모듈
60 - 텍스트 취합 모듈
70 - 관련 단어 검출 모듈
80 - 오류 검출 모듈
90 - 수정 모듈
100 - 사용자 정정 모듈
1000 - 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템
10-Lecture Recording Module
20-noise reduction module
30-text conversion module
40-Lesson Keyword Input Module
50-search module
60-Text Collection Module
70-Related Word Detection Module
80-error detection module
90-fix module
100-user correction module
1000-Lecture speech file text conversion system based on lecture related keywords

Claims (3)

강의의 음성을 녹음하는 강의 녹음 모듈;
강의 녹음 모듈로 녹음되는 음성을 음성 인식을 수행하여 텍스트로 변환하는 텍스트 변환 모듈;
강의 녹음 모듈로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 강의 키워드 입력 모듈;
웹서버에서 강의 키워드 입력 모듈로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬하는 검색 모듈;
검색 모듈로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 저장하는 텍스트 취합 모듈;
텍스트 취합 모듈로 취합된 텍스트 중 2회 이상 반복된 단어를 검출하는 관련 단어 검출 모듈;
사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈로 변환된 텍스트 중 정보가 없는 단어를 검출하는 오류 검출 모듈;
오류 검출 모듈로 검출된 단어와 관련 단어 검출 모듈로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식하는 수정 모듈; 및
수정 모듈로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 하는 사용자 정정 모듈을 포함하고,
수정 모듈은
오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성과 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 표식하고,
오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성과 일치하고, 중성이 하나 이상 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 다르게 표식하며,
오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성이 일치하고, 중성이 하나 이상 일치하며, 종성이 하나 이상 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 또 다르게 표식하는 것을 포함하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템.
A lecture recording module for recording a lecture voice;
A text conversion module for converting the voice recorded by the lecture recording module into text by performing voice recognition;
A lecture keyword input module for inputting keywords related to a specific subject of a lecture recorded by the lecture recording module;
A search module for searching by a keyword inputted into a lecture keyword input module in a web server and sorting the search results in order of the number of times a keyword is included in a web page;
A text collecting module configured to extract and store text posted on web pages up to a predetermined rank among web pages searched by the search module;
An associated word detection module for detecting a word repeated two or more times among the text collected by the text collecting module;
An error detection module detecting a word having no information among the texts converted into the text conversion module based on the part-of-speech information and the pronunciation information of each word in connection with a dictionary providing service;
A correction module for comparing the word detected by the error detection module with the word detected by the related word detection module and correcting the detected word in the related word detection module if it meets a specific condition, and marking it differently according to the specific condition; And
The correction module includes a user correction module that allows the user to check the modified parts with different marks, and to correct the text.
The fix module
If the initiality of the detected words in the error detection module matches the initiality of the words detected in the related word detection module, correct the detected words in the related word detection module, mark them,
If the initiality of the words detected by the error detection module matches the initiality of the words detected by the related word detection module, and if one or more neutrals match, the corrected words are corrected by the words detected by the related word detection module and marked differently,
If the initiality of the words detected in the error detection module matches the initiality of the words detected in the related word detection module, the one or more neutrals match, and the one or more finalities match, correct the words detected in the related word detection module. Lecture speech file text conversion system based on the lecture-related keywords, including other marking it.
삭제delete 제1항에 있어서,
강의 키워드 입력 모듈은
입력된 키워드마다 가중치를 부여할 수 있고, 검색 모듈로 검색 시 가중치를 적용하여 키워드 포함 횟수를 산출하도록 하는 것
을 포함하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템.
The method of claim 1,
The lesson keyword entry module
A weight can be given to each input keyword, and the search module calculates the number of keyword inclusions by applying weights when searching.
Lecture speech file text conversion system based on the lecture-related keywords, including.
KR1020180125390A 2018-10-19 2018-10-19 Lecture voice file text conversion system based on lecture-related keywords KR102080409B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180125390A KR102080409B1 (en) 2018-10-19 2018-10-19 Lecture voice file text conversion system based on lecture-related keywords

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180125390A KR102080409B1 (en) 2018-10-19 2018-10-19 Lecture voice file text conversion system based on lecture-related keywords

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020180029633 Division 2018-03-14 2018-03-14

Publications (2)

Publication Number Publication Date
KR20190108468A KR20190108468A (en) 2019-09-24
KR102080409B1 true KR102080409B1 (en) 2020-02-21

Family

ID=68069074

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180125390A KR102080409B1 (en) 2018-10-19 2018-10-19 Lecture voice file text conversion system based on lecture-related keywords

Country Status (1)

Country Link
KR (1) KR102080409B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101590724B1 (en) * 2014-10-06 2016-02-02 포항공과대학교 산학협력단 Method for modifying error of speech recognition and apparatus for performing the method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140062247A (en) * 2012-11-14 2014-05-23 전소연 Method for producing lecture text data mobile terminal and monbile terminal using the same
KR102243286B1 (en) * 2014-09-18 2021-04-22 경북대학교 산학협력단 Method for constructing database, recording medium for performing the method
KR20170036404A (en) * 2015-09-24 2017-04-03 국민대학교산학협력단 Error analyzing method in a reading test and terminal device and system employing the same method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101590724B1 (en) * 2014-10-06 2016-02-02 포항공과대학교 산학협력단 Method for modifying error of speech recognition and apparatus for performing the method

Also Published As

Publication number Publication date
KR20190108468A (en) 2019-09-24

Similar Documents

Publication Publication Date Title
Barnard et al. The NCHLT speech corpus of the South African languages
Lee et al. ODSQA: Open-domain spoken question answering dataset
US10140976B2 (en) Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing
CN106570180A (en) Artificial intelligence based voice searching method and device
Schlippe et al. Grapheme-to-phoneme model generation for Indo-European languages
CN111369980B (en) Voice detection method, device, electronic equipment and storage medium
Nouza et al. ASR for South Slavic Languages Developed in Almost Automated Way.
JP2018033048A (en) Metadata generation system
Knill et al. Impact of ASR performance on free speaking language assessment
KR20230009564A (en) Learning data correction method and apparatus thereof using ensemble score
CN112382295A (en) Voice recognition method, device, equipment and readable storage medium
KR102170844B1 (en) Lecture voice file text conversion system based on lecture-related keywords
Bigot et al. Person name recognition in ASR outputs using continuous context models
CN102033866A (en) Method and system for checking chemical name
KR102080409B1 (en) Lecture voice file text conversion system based on lecture-related keywords
CN109002454B (en) Method and electronic equipment for determining spelling partition of target word
Rodrigo et al. A Question Answering System based on Information Retrieval and Validation.
US20220189333A1 (en) Method of generating book database for reading evaluation
San et al. Automated speech tools for helping communities process restricted-access corpora for language revival efforts
Ahmed et al. Technique for automatic sentence level alignment of long speech and transcripts.
Jouvet et al. Adaptation of speech recognition vocabularies for improved transcription of youtube videos
Penagarikano et al. Semisupervised training of a fully bilingual ASR system for Basque and Spanish
Evain et al. Towards automatic captioning of university lectures for french students who are deaf
KR102141346B1 (en) Method and Apparatus for Sentence Translation based on Word Sense Disambiguation and Word Translation Knowledge
Hahn et al. Optimizing CRFs for SLU tasks in various languages using modified training criteria

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant