KR102080409B1 - Lecture voice file text conversion system based on lecture-related keywords - Google Patents
Lecture voice file text conversion system based on lecture-related keywords Download PDFInfo
- Publication number
- KR102080409B1 KR102080409B1 KR1020180125390A KR20180125390A KR102080409B1 KR 102080409 B1 KR102080409 B1 KR 102080409B1 KR 1020180125390 A KR1020180125390 A KR 1020180125390A KR 20180125390 A KR20180125390 A KR 20180125390A KR 102080409 B1 KR102080409 B1 KR 102080409B1
- Authority
- KR
- South Korea
- Prior art keywords
- module
- lecture
- text
- word
- detection module
- Prior art date
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 25
- 238000001514 detection method Methods 0.000 claims abstract description 58
- 230000007935 neutral effect Effects 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims 1
- 239000003550 marker Substances 0.000 abstract 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 12
- 229910002092 carbon dioxide Inorganic materials 0.000 description 6
- 239000001569 carbon dioxide Substances 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000002253 acid Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 235000019991 rice wine Nutrition 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229940063664 carbon dioxide 10 % Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
본 발명은 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다. 보다 상세하게는 강의 키워드 입력 모듈을 구비함으로써, 키워드 별 가중치를 적용할 수 있고, 검색 모듈로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키며, 수정 모듈을 구비함으로써, 오류 검출 모듈에서 검출된 단어를 이루는 각 음절의 초성, 중성, 및 종성이 관련 단어 검출 모듈에서 검출된 단어와의 일치도에 따라 차등 표식하여, 사용자 정정 모듈로 이를 확인하고, 텍스트를 정정할 수 있어, 사용자의 작업 시간을 단축하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다.
이를 위해 본 발명은 강의의 음성을 녹음하는 강의 녹음 모듈; 강의 녹음 모듈로 녹음되는 음성을 음성 인식을 수행하여 텍스트로 변환하는 텍스트 변환 모듈; 강의 녹음 모듈로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 강의 키워드 입력 모듈; 웹서버에서 강의 키워드 입력 모듈로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬하는 검색 모듈; 검색 모듈로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 저장하는 텍스트 취합 모듈; 텍스트 취합 모듈로 취합된 텍스트 중 2회 이상 반복된 단어를 검출하는 관련 단어 검출 모듈; 사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈로 변환된 텍스트 중 정보가 없는 단어를 검출하는 오류 검출 모듈; 오류 검출 모듈로 검출된 단어와 관련 단어 검출 모듈로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식하는 수정 모듈; 및 수정 모듈로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 하는 사용자 정정 모듈을 제공한다.The present invention relates to a lecture voice file text conversion system based on lecture related keywords. More specifically, by providing the keyword input module of the lecture, the weight of each keyword can be applied, and the search module applies the weight to the search module. Can be converted into text, so that words do not deviate from the subject of the lecture as much as possible, improve speech recognition accuracy, and have a correction module, so that the syllables, neutral, and The lecture voice based on the lecture-related keywords that the finality is differentially marked according to the degree of coincidence with the detected words in the related word detection module, and confirmed by the user correction module, and the text can be corrected, thereby reducing the user's working time. File text conversion system.
To this end, the present invention is a lecture recording module for recording the voice of the lecture; A text conversion module for converting the voice recorded by the lecture recording module into text by performing voice recognition; A lecture keyword input module for inputting keywords related to a specific subject of a lecture recorded by the lecture recording module; A search module for searching by a keyword inputted into a lecture keyword input module in a web server and sorting the search results in order of the number of times a keyword is included in a web page; A text collecting module configured to extract and store text posted on web pages up to a predetermined rank among web pages searched by the search module; An associated word detection module for detecting a word repeated two or more times among the text collected by the text collecting module; An error detection module detecting a word having no information among the texts converted into the text conversion module based on the part-of-speech information and the pronunciation information of each word in connection with a dictionary providing service; A correction module for comparing the word detected by the error detection module with the word detected by the related word detection module and correcting the detected word in the related word detection module if it meets a specific condition, and marking it differently according to the specific condition; And it provides a user correction module that can confirm the modified portion with a different marker, and correct the text by the correction module.
Description
본 발명은 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다. 보다 상세하게는 강의 키워드 입력 모듈을 구비함으로써, 키워드별 가중치를 적용할 수 있고, 검색 모듈로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키며, 수정 모듈을 구비함으로써, 오류 검출 모듈에서 검출된 단어를 이루는 각 음절의 초성, 중성, 및 종성이 관련 단어 검출 모듈에서 검출된 단어와의 일치도에 따라 차등 표식하여, 사용자 정정 모듈로 이를 확인하고, 텍스트를 정정할 수 있어, 사용자의 작업 시간을 단축하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다. The present invention relates to a lecture voice file text conversion system based on lecture related keywords. More specifically, by providing the keyword input module of the lecture, the weight of each keyword can be applied, and the search module applies the weight to the search module, so that the voice of the lecture is based on the text of the webpage composed of terms frequently used during the lecture. Can be converted into text, so that words do not deviate from the subject of the lecture as much as possible, improve speech recognition accuracy, and have a correction module, so that the syllables, neutral, and The lecture voice based on the lecture-related keywords that the finality is differentially marked according to the degree of coincidence with the detected word in the related word detection module, and confirmed by the user correction module, and the text can be corrected, thereby reducing the user's working time. File text conversion system.
최근 애플의 시리(Siri), 구글 보이스, 삼성전자 S보이스 등 음성 인식 기술이 대중화되고 있으며, 스마트워치나 구글 글래스와 같은 웨어러블 장치에서는 음성 인식을 가장 주요한 문자 입력 수단으로 활용할 것으로 예상되며, 음성 인식 기술은 오래전부터 개발되어 온 기술임에도 불구하고, 정확한 음성 인식을 통하여 텍스트로 치환되어 입력되는데 있어서 아직도 오류가 다수 발생하고 있다.Recently, voice recognition technologies such as Apple's Siri, Google Voice, and Samsung's S-Voice have become popular, and wearable devices such as smart watches and Google Glass are expected to use voice recognition as the most important means of inputting text. Although the technology has been developed for a long time, a large number of errors still occur in inputting texts through accurate speech recognition.
음성 인식으로 입력을 행하면, 텍스트로 치환되어 이것이 사용자에게 보여지게 되는데, 인식된 텍스트가 의도와 다르거나 오류가 있는 경우가 빈번히 발생한다.When inputting by voice recognition, the text is replaced with text and is displayed to the user, and the recognized text is frequently different from the intention or there is an error.
특히, 음성에서 텍스트로 변환하는 도구인 API는 음성에서 텍스트로 변환할 수 있는 시스템을 제공하나, 음성을 텍스트로 변환하였을 때 사람마다 말하는 방식의 차이, 음성의 차이, 주위 소음이나 잡음 등의 방해 요소로 인해 정확도가 떨어지는 문제점이 있다.In particular, the API, which is a tool that converts voice to text, provides a system that can convert voice to text, but when voice is converted to text, there are differences in how people speak, voice, and noise and noise. There is a problem that the accuracy is low due to the factor.
또한, 강의 시, 강의 음성 내용을 텍스트 변환하여 자막으로 사용할 경우에, 강의 내용 텍스트 파일의 정확성을 요구하지만 인식 오류 등을 포함하여 기대에 미치지 못하는 실정이다. In addition, in the case of lectures, when the lecture voice content is converted to text and used as a subtitle, the accuracy of the lecture text file is required, but it does not meet expectations including recognition errors.
또한, 상기의 강의를 녹음한 파일은 용량이 커 보관하는 데 한계가 있고, 추후 특정 문구를 검색하는 데 무리가 있으며, 추후, 데이터 분석을 통한 2차 자료 활용에도 제약이 따르는 문제점이 있다.In addition, the file recording the lecture has a large capacity, there is a limit to keep, there is a problem to search for a specific phrase in the future, there is a problem that there is a restriction in the secondary data utilization through data analysis later.
선행기술문헌 : KR등록특허공보 제1651909호(2016.8.29 공고)Prior Art Document: KR Patent No. 1165909 (announced Aug. 29, 2016)
본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로, 강의 음성파일로부터 텍스트 추출 정확도가 높은 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템을 제공하는 데 그 목적이 있다.The present invention has been made to solve the above problems, and an object of the present invention is to provide a lecture voice file text conversion system based on lecture-related keywords with high text extraction accuracy from lecture voice files.
상기 목적을 달성하기 위해 안출된 본 발명에 따른 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템은 강의의 음성을 녹음하는 강의 녹음 모듈; 강의 녹음 모듈로 녹음되는 음성을 음성 인식을 수행하여 텍스트로 변환하는 텍스트 변환 모듈; 강의 녹음 모듈로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 강의 키워드 입력 모듈; 웹서버에서 강의 키워드 입력 모듈로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬하는 검색 모듈; 검색 모듈로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 저장하는 텍스트 취합 모듈; 텍스트 취합 모듈로 취합된 텍스트 중 2회 이상 반복된 단어를 검출하는 관련 단어 검출 모듈; 사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈로 변환된 텍스트 중 정보가 없는 단어를 검출하는 오류 검출 모듈; 오류 검출 모듈로 검출된 단어와 관련 단어 검출 모듈로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식하는 수정 모듈; 및 수정 모듈로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 하는 사용자 정정 모듈을 포함할 수 있다.Lecture voice file text conversion system based on the lecture-related keywords according to the present invention devised to achieve the above object comprises a lecture recording module for recording the voice of the lecture; A text conversion module for converting the voice recorded by the lecture recording module into text by performing voice recognition; A lecture keyword input module for inputting keywords related to a specific subject of a lecture recorded by the lecture recording module; A search module for searching by a keyword inputted into a lecture keyword input module in a web server and sorting the search results in order of the number of times a keyword is included in a web page; A text collecting module configured to extract and store text posted on web pages up to a predetermined rank among web pages searched by the search module; An associated word detection module for detecting a word repeated two or more times among the text collected by the text collecting module; An error detection module connected to a dictionary providing service and detecting a word having no information among texts converted into a text conversion module based on parts of speech information and pronunciation information of each word; A correction module for comparing the word detected by the error detection module with the word detected by the related word detection module and correcting the detected word in the related word detection module if it meets a specific condition, and marking it differently according to the specific condition; And a user correction module for identifying the modified part with the different markings and correcting the text.
또한, 수정 모듈은 오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성과 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 표식하고, 오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성과 일치하고, 중성이 하나 이상 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 다르게 표식하며, 오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성이 일치하고, 중성이 하나 이상 일치하며, 종성이 하나 이상 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 또 다르게 표식하는 것을 포함할 수 있다.In addition, when the initiality of the words detected in the error detection module matches the initiality of the words detected in the related word detection module, the correction module corrects the detected words in the related word detection module, marks them, and displays the error in the error detection module. If the initiality of the detected word matches the initiality of the detected word in the related word detection module, and if one or more neutrals match, correct the detected word in the related word detection module, mark it differently, and detect it in the error detection module. If the initiality of the detected words matches the initiality of the words detected in the related word detection module, the one or more neutrals match, and the one or more finality matches, the corrected words are corrected to the detected words in the related word detection module and marked differently. It may include doing.
또한, 강의 키워드 입력 모듈은 입력된 키워드마다 가중치를 부여할 수 있고, 검색 모듈로 검색 시 가중치를 적용하여 키워드 포함 횟수를 산출하도록 하는 것을 포함할 수 있다.In addition, the lecture keyword input module may assign a weight to each input keyword, and may include calculating a number of keyword inclusions by applying a weight to a search module when searching.
본 발명에 의하면, 강의 키워드 입력 모듈을 구비함으로써, 각 키워드 별 가중치를 적용할 수 있고, 검색 모듈로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키는 데 그 효과가 있다. According to the present invention, by providing a keyword input module of the lecture, it is possible to apply the weight for each keyword, and to search by applying the weight with the search module, based on the text of the web page composed of terms frequently used in the lecture The voice of the lecture can be converted into text, which helps to ensure that words do not deviate from the subject of the lecture as much as possible and improves speech recognition accuracy.
또한, 본 발명에 의하면, 수정 모듈을 구비함으로써, 오류 검출 모듈에서 검출된 단어를 이루는 각 음절의 초성, 중성, 및 종성이 관련 단어 검출 모듈에서 검출된 단어와의 일치도에 따라 차등 표식하여, 사용자 정정 모듈로 이를 확인하고, 정정할 수 있어, 정확도를 높이고 사용자의 작업 시간을 단축하는 데 그 효과가 있다.In addition, according to the present invention, by providing a correction module, the initial consonant, the neutral, and the finality of each syllable constituting the word detected by the error detection module are differentially marked according to the degree of agreement with the word detected by the related word detection module. The correction module can check and correct this, which has the effect of increasing accuracy and reducing the user's working time.
도 1은 본 발명의 바람직한 실시예에 따른 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템의 개념도이다.1 is a conceptual diagram of a lecture voice file text conversion system based on lecture related keywords according to a preferred embodiment of the present invention.
이하, 본 발명의 바람직한 실시 예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 이하에서 본 발명의 바람직한 실시예를 설명할 것이나, 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. First of all, in adding reference numerals to the components of each drawing, it should be noted that the same reference numerals have the same reference numerals as much as possible even if displayed on different drawings. In addition, in describing the present invention, if it is determined that the detailed description of the related well-known configuration or function may obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, preferred embodiments of the present invention will be described below, but the technical spirit of the present invention is not limited thereto, but may be variously modified and modified by those skilled in the art.
도 1은 본 발명의 바람직한 실시예에 따른 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템(1000)의 개념도이다.1 is a conceptual diagram of a lecture voice file
본 발명의 바람직한 실시예에 따른 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템(1000)은, 도 1을 참조하면, 강의 녹음 모듈(10), 잡음 제거 모듈(20), 텍스트 변환 모듈(30), 강의 키워드 입력 모듈(40), 검색 모듈(50), 텍스트 취합 모듈(60), 관련 단어 검출 모듈(70), 오류 검출 모듈(80), 수정 모듈(90), 및 사용자 정정 모듈(100)을 포함하여 구성되고, 강의 시 녹음된 음성을 텍스트로 변환이 용이하게 하며, 정확도를 향상시킴에 따라 강의 자막을 만들 때 사용자의 시간을 절약할 수 있도록 한다.The lecture voice file
이하, 강의 녹음 모듈(10)부터 상세히 설명하기로 한다.Hereinafter, the
강의 녹음 모듈(10)은 강의의 음성을 녹음하는 것으로, 영상이 필요할 경우에는 영상 촬영 내 음성이 포함될 수 있도록 하며, 본 발명에서는 음성을 텍스트로 변환하는 것으로 음성 파일을 얻을 수 있도록 한다.
잡음 제거 모듈(20)은 강의 녹음 모듈(10)로 녹음된 음성 데이터를 재생하여 주파수를 추출하고, 주파수 영역에서 사람의 목소리가 조사되는 특정 구간의 주파수를 제외한 나머지 외부 잡음 부분을 제거한다. 특히, 음성 및 잡음구간 인식과 제거는 스펙트럼 차감법이나 LMS 알고리즘 적응필터 등을 이용하여 다양한 방식으로 잡음이 제거될 수 있다.The
또한, 잡음 제거 모듈(20)은 잡음 부분을 제거하면서, 주파수가 사람의 목소리가 조사되는 구간이고, 일정 이하의 음성 주파수가 일정 시간 지속되는 경우, 강의자의 말이 쉬어주는 부분(글에서 띄어쓰는 부분이 될 수 있다.)이라 판단하고, 이를 기준으로 파일을 분리저장 하도록 할 수 있다. In addition, the
본 발명에서 분리 저장하는 것은, 길이가 긴 음성파일을 텍스트로 변환하는 것보다 각 부분을 따로 음성에서 텍스트로 변환하는 것이 음성 인식률과 정확성이 높기 때문이다.In the present invention, the separate storage is because the voice recognition rate and the accuracy are higher in converting each part separately from the text to the text rather than converting the long voice file into the text.
텍스트 변환 모듈(30)은 강의 녹음 모듈(10)로 녹음되는 음성, 잡음 제거 모듈(20)로 잡음이 제거된 음성을 음성 인식을 수행하여 텍스트로 변환하고, 텍스트 변환 모듈(30)은 API(Application Programming Interface)를 이용하여 음성을 텍스트로 변환하도록 하며, API는 종래에 사용되는 음성 텍스트 변환용(ex. Google speech API, IBM watson speech)으로 사용될 수 있으며 종류에 한정하지 않도록 한다.The
강의 키워드 입력 모듈(40)은 강의 녹음 모듈(10)로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 것으로, 입력된 키워드마다 가중치를 부여할 수 있고, 검색 모듈(50)로 검색 시 가중치를 적용하여 키워드 포함 횟수를 산출하도록 할 수 있다.The lecture
특히, 강의 키워드 입력 모듈(40)은 키워드별 가중치를 개별 적용할 수 있고, 검색 모듈(50)로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키는 장점이 있다.In particular, the lecture
일례로, "막걸리 만드는법"에 대한 강의를 진행했다고 가정하면, 강의 키워드 입력 모듈(40)로 강의 주제와 연관된 막걸리, 이산화탄소, 효모, 누룩, 등을 포함하는 키워드를 입력하고, 키워드별로 가중치를 부여한다. 막걸리는 50%, 이산화탄소 10%, 효모 5%, 누룩 30%로 가중치를 부여하게 되면, 검색 모듈(50)을 통하여 검색된 웹 페이지에 막걸리가 한 번 기재되어 있더라도, 가중치를 부여하여 세 번 기재된 것으로 계산하도록 하기에 강의 주제와 밀접성이 높은 단어는 가중치를 높게 부여하는 것이 만족도 높은 검색이 가능하도록 한다.For example, assuming that a lecture on "How to make makgeolli" is given, the
검색 모듈(50)은 웹서버에서 강의 키워드 입력 모듈(40)로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬한다.The
또한, 강의 키워드 입력 모듈(40)로 특정 키워드에 가중치를 부여하면, 가중치를 적용시켜 순서대로 검색 결과를 제공함은 물론이다. In addition, if a specific keyword is weighted by the lecture
텍스트 취합 모듈(60)은 검색 모듈(50)로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 DB에 저장한다.The
상기의 일정 순위는 사용자의 설정에 의해 변경 실시될 수 있으며, 텍스트 취합 모듈(60)은 앞서 검색 모듈(50)을 통해 강의 내용과 연관성이 높다고 판단되는 텍스트를 취합한다.The schedule ranking may be changed according to a user's setting, and the
관련 단어 검출 모듈(70)은 텍스트 취합 모듈(60)로 취합된 텍스트 중 2회 이상 반복된 단어를 검출한다. 상기 2회 이상(복수회) 반복되는 단어는 강의 주제와 밀접한 관련이 있는 단어라고 볼 수 있고, 상기 단어들을 기준으로 음성 인식 오류 텍스트를 수정하고자 한다.The related
오류 검출 모듈(80)은 웹서버의 사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈(30)로 변환된 텍스트 중 정보가 없는 단어를 검출한다. 검출된 단어는 음성 인식의 오류일 가능성이 높다.The
수정 모듈(90)은 오류 검출 모듈(80)로 검출된 단어와 관련 단어 검출 모듈(70)로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈(70)에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식한다. The
또한, 수정 모듈(90)의 특정 조건에 대해 상세히 서술하기로 한다.In addition, specific conditions of the
수정 모듈(90)은 오류 검출 모듈(80)에서 검출된 단어의 초성이 관련 단어 검출 모듈(70)에서 검출된 단어의 초성과 일치할 경우, 관련 단어 검출 모듈(70)에서 검출된 단어로 수정하고, 이를 표식한다.The
또한, 수정 모듈(90)은 오류 검출 모듈(80)에서 검출된 단어의 초성이 관련 단어 검출 모듈(70)에서 검출된 단어의 초성과 일치하고, 중성이 하나 이상 일치할 경우, 관련 단어 검출 모듈(70)에서 검출된 단어로 수정하고, 이를 다르게 표식한다.In addition, the
또한, 수정 모듈(90)은 오류 검출 모듈(80)에서 검출된 단어의 초성이 관련 단어 검출 모듈(70)에서 검출된 단어의 초성이 일치하고, 중성이 하나 이상 일치하며, 종성이 하나 이상 일치할 경우, 관련 단어 검출 모듈(70)에서 검출된 단어로 수정하고, 이를 또 다르게 표식한다.Further, the
일례로, 오류 검출 모듈(80)에서 사전에 없는 음성 인식 오류인 "이산하탓소"를 검출했을 경우, 관련 단어 검출 모듈(70)의 단어(텍스트 취합 모듈(60)로 취합된 된 단어 중 복수회 반복되는 단어) 중, 초성, 중성, 종성이 어느 정도 일치하는지 확인한다. For example, when the
오류 단어인 "이산하탓소"는 관련 단어 검출 모듈(70)의 단어인 "이산화탄소"와 초성 'ㅇ(이)', 'ㅅ(산)', 'ㅎ(하)', 'ㅌ(탓)', 'ㅅ(소)'로 5개가 일치하고, 중성은 'ㅣ(이)', 'ㅏ(산)', 'ㅏ(탓)', 'ㅗ(소)'로 중성도 4개가 일치하며, 종성에서 'ㄴ'으로 '산'의 'ㄴ'과 1개 일치하고, '탄'의 'ㄴ'과 'ㅅ'이 불일치한다. 이에 따라 본 발명에서는 초성은 모두 일치하고, 중성과 종성은 하나 이상 일치하므로 파란색의 표식을 할 수 있다. The error word "dispersed data" is the word of the related
만약, 오류 단어가 "이사하타소"라면, "이산화탄소"와 초성은 5개 모두 일치하고, 중성도 4개가 일치하지만, 종성이 불일치하므로, "이산화탄소"로 수정하고, 파란색과 다른 초록색으로 표식을 할 수 있다.If the error word is "Isahatasso," then "carbon dioxide" and all four stars match all four, and four neutrals match, but the finality is inconsistent. can do.
또한, 오류 단어가 "아선하터서"라면, "이산화탄소"와 초성은 5개 모두 일치하고, 중성은 불일치하며, 종성은 '선'에서 'ㄴ'이 '산'과 일치하여 1개가 일치하지만, 중성이 일치하는 부분이 없으므로 초성만 일치하는 것으로하여, "이산화탄소"로 수정하고 파란색과 초록색을 제외한 자주색으로 표식을 할 수 있다.In addition, if the error word is "subtle", "carbon dioxide" and "super" match all 5, neutrals do not match, and "one" matches "san" in "line", but one matches. Since there is no neutral match, only the first star can be matched, so it can be corrected to "CO2" and marked with purple except blue and green.
또한, 오류 단어나 정정 단어의 초성 또는 종성이 쌍자음(ㄲ, ㄸ, ㅃ, ㅆ, ㅉ)일 경우에는, 쌍자음과 자음이 초성 또는 종성이 동일 범주로 카운트하여 일치 여부를 판단하도록 한다.In addition, when the initial or final consonants of an error word or a correction word are twin consonants (ㄲ, ㄸ, ㅃ, ㅆ, ㅉ), the consonants and consonants are counted in the same category to determine whether they match.
보다 상세하게는, 오류 단어가 "눈섭"이라면, "눈썹"과 초성이 1개('ㄴ')가 일치하지만, 된발음으로 인해 "썹"을 "섭"으로 발음하는 경우가 종종 있으므로, '섭'의 자음 'ㅅ'이 쌍자음 'ㅆ'과 일치(동일 범주)한다고 판단하여 초성이 2개가 모두 일치하는 것으로 판단하도록 한다.More specifically, if the error word is "brows", "eyebrows" and the first consonant ('ㄴ') match, but "brows" are often pronounced as "sup" due to old pronunciation, 'Sub' consonant 'ㅅ' is consonant with the consonant 'ㅆ' (the same category), so that the two consonants are judged to match.
또한, 초성, 중성, 종성이 일치하지 않는 경우에는 별도로 표식을 하여 사용자 정정 모듈(100)을 통해 이를 확인하여 수정할 수 있도록 한다.In addition, when the initial, neutral, and finality do not match, a separate marking is made so that the
일례로, "이산화탄소"가 "이사나타스"로 인식될 경우, 초성과 종성이 모두 일치하지 않고, 중성이 'ㅣ(이)', 'ㅏ(산)', 'ㅏ(탄)'으로 3개 일치하는 경우로 상기 기재에 해당하지 않는다. 이는 파란색, 초록색, 자주색을 제외한 별개의 색인 빨간색으로 표식할 수 있다.For example, when "carbon dioxide" is recognized as "Isanatas", both the initial and the trailing species do not coincide, and the neutrality is three such as 'ㅣ (이)', 'ㅏ (acid)' and 'ㅏ (tan)'. The same does not correspond to the above description. It can be marked with a separate index red except for blue, green and purple.
또한, 수정 모듈(90)은 사용자의 환경에 맞게 적절히 조건을 부가하여 변경 사용할 수도 있음은 물론이다. In addition, the
사용자 정정 모듈(100)은 수정 모듈(90)로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 한다.The
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present invention, and various modifications, changes, and substitutions may be made by those skilled in the art without departing from the essential characteristics of the present invention. will be. Accordingly, the embodiments disclosed in the present invention and the accompanying drawings are not intended to limit the technical spirit of the present invention but to describe the present invention, and the scope of the technical idea of the present invention is not limited by the embodiments and the accompanying drawings. . The protection scope of the present invention should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be construed as being included in the scope of the present invention.
10 - 강의 녹음 모듈
20 - 잡음 제거 모듈
30 - 텍스트 변환 모듈
40 - 강의 키워드 입력 모듈
50 - 검색 모듈
60 - 텍스트 취합 모듈
70 - 관련 단어 검출 모듈
80 - 오류 검출 모듈
90 - 수정 모듈
100 - 사용자 정정 모듈
1000 - 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템10-Lecture Recording Module
20-noise reduction module
30-text conversion module
40-Lesson Keyword Input Module
50-search module
60-Text Collection Module
70-Related Word Detection Module
80-error detection module
90-fix module
100-user correction module
1000-Lecture speech file text conversion system based on lecture related keywords
Claims (3)
강의 녹음 모듈로 녹음되는 음성을 음성 인식을 수행하여 텍스트로 변환하는 텍스트 변환 모듈;
강의 녹음 모듈로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 강의 키워드 입력 모듈;
웹서버에서 강의 키워드 입력 모듈로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬하는 검색 모듈;
검색 모듈로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 저장하는 텍스트 취합 모듈;
텍스트 취합 모듈로 취합된 텍스트 중 2회 이상 반복된 단어를 검출하는 관련 단어 검출 모듈;
사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈로 변환된 텍스트 중 정보가 없는 단어를 검출하는 오류 검출 모듈;
오류 검출 모듈로 검출된 단어와 관련 단어 검출 모듈로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식하는 수정 모듈; 및
수정 모듈로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 하는 사용자 정정 모듈을 포함하고,
수정 모듈은
오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성과 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 표식하고,
오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성과 일치하고, 중성이 하나 이상 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 다르게 표식하며,
오류 검출 모듈에서 검출된 단어의 초성이 관련 단어 검출 모듈에서 검출된 단어의 초성이 일치하고, 중성이 하나 이상 일치하며, 종성이 하나 이상 일치할 경우, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 또 다르게 표식하는 것을 포함하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템.A lecture recording module for recording a lecture voice;
A text conversion module for converting the voice recorded by the lecture recording module into text by performing voice recognition;
A lecture keyword input module for inputting keywords related to a specific subject of a lecture recorded by the lecture recording module;
A search module for searching by a keyword inputted into a lecture keyword input module in a web server and sorting the search results in order of the number of times a keyword is included in a web page;
A text collecting module configured to extract and store text posted on web pages up to a predetermined rank among web pages searched by the search module;
An associated word detection module for detecting a word repeated two or more times among the text collected by the text collecting module;
An error detection module detecting a word having no information among the texts converted into the text conversion module based on the part-of-speech information and the pronunciation information of each word in connection with a dictionary providing service;
A correction module for comparing the word detected by the error detection module with the word detected by the related word detection module and correcting the detected word in the related word detection module if it meets a specific condition, and marking it differently according to the specific condition; And
The correction module includes a user correction module that allows the user to check the modified parts with different marks, and to correct the text.
The fix module
If the initiality of the detected words in the error detection module matches the initiality of the words detected in the related word detection module, correct the detected words in the related word detection module, mark them,
If the initiality of the words detected by the error detection module matches the initiality of the words detected by the related word detection module, and if one or more neutrals match, the corrected words are corrected by the words detected by the related word detection module and marked differently,
If the initiality of the words detected in the error detection module matches the initiality of the words detected in the related word detection module, the one or more neutrals match, and the one or more finalities match, correct the words detected in the related word detection module. Lecture speech file text conversion system based on the lecture-related keywords, including other marking it.
강의 키워드 입력 모듈은
입력된 키워드마다 가중치를 부여할 수 있고, 검색 모듈로 검색 시 가중치를 적용하여 키워드 포함 횟수를 산출하도록 하는 것
을 포함하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템. The method of claim 1,
The lesson keyword entry module
A weight can be given to each input keyword, and the search module calculates the number of keyword inclusions by applying weights when searching.
Lecture speech file text conversion system based on the lecture-related keywords, including.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180125390A KR102080409B1 (en) | 2018-10-19 | 2018-10-19 | Lecture voice file text conversion system based on lecture-related keywords |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180125390A KR102080409B1 (en) | 2018-10-19 | 2018-10-19 | Lecture voice file text conversion system based on lecture-related keywords |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180029633 Division | 2018-03-14 | 2018-03-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190108468A KR20190108468A (en) | 2019-09-24 |
KR102080409B1 true KR102080409B1 (en) | 2020-02-21 |
Family
ID=68069074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180125390A KR102080409B1 (en) | 2018-10-19 | 2018-10-19 | Lecture voice file text conversion system based on lecture-related keywords |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102080409B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101590724B1 (en) * | 2014-10-06 | 2016-02-02 | 포항공과대학교 산학협력단 | Method for modifying error of speech recognition and apparatus for performing the method |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140062247A (en) * | 2012-11-14 | 2014-05-23 | 전소연 | Method for producing lecture text data mobile terminal and monbile terminal using the same |
KR102243286B1 (en) * | 2014-09-18 | 2021-04-22 | 경북대학교 산학협력단 | Method for constructing database, recording medium for performing the method |
KR20170036404A (en) * | 2015-09-24 | 2017-04-03 | 국민대학교산학협력단 | Error analyzing method in a reading test and terminal device and system employing the same method |
-
2018
- 2018-10-19 KR KR1020180125390A patent/KR102080409B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101590724B1 (en) * | 2014-10-06 | 2016-02-02 | 포항공과대학교 산학협력단 | Method for modifying error of speech recognition and apparatus for performing the method |
Also Published As
Publication number | Publication date |
---|---|
KR20190108468A (en) | 2019-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Barnard et al. | The NCHLT speech corpus of the South African languages | |
Lee et al. | ODSQA: Open-domain spoken question answering dataset | |
US10140976B2 (en) | Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing | |
CN106570180A (en) | Artificial intelligence based voice searching method and device | |
Schlippe et al. | Grapheme-to-phoneme model generation for Indo-European languages | |
CN111369980B (en) | Voice detection method, device, electronic equipment and storage medium | |
Nouza et al. | ASR for South Slavic Languages Developed in Almost Automated Way. | |
JP2018033048A (en) | Metadata generation system | |
Knill et al. | Impact of ASR performance on free speaking language assessment | |
KR20230009564A (en) | Learning data correction method and apparatus thereof using ensemble score | |
CN112382295A (en) | Voice recognition method, device, equipment and readable storage medium | |
KR102170844B1 (en) | Lecture voice file text conversion system based on lecture-related keywords | |
Bigot et al. | Person name recognition in ASR outputs using continuous context models | |
CN102033866A (en) | Method and system for checking chemical name | |
KR102080409B1 (en) | Lecture voice file text conversion system based on lecture-related keywords | |
CN109002454B (en) | Method and electronic equipment for determining spelling partition of target word | |
Rodrigo et al. | A Question Answering System based on Information Retrieval and Validation. | |
US20220189333A1 (en) | Method of generating book database for reading evaluation | |
San et al. | Automated speech tools for helping communities process restricted-access corpora for language revival efforts | |
Ahmed et al. | Technique for automatic sentence level alignment of long speech and transcripts. | |
Jouvet et al. | Adaptation of speech recognition vocabularies for improved transcription of youtube videos | |
Penagarikano et al. | Semisupervised training of a fully bilingual ASR system for Basque and Spanish | |
Evain et al. | Towards automatic captioning of university lectures for french students who are deaf | |
KR102141346B1 (en) | Method and Apparatus for Sentence Translation based on Word Sense Disambiguation and Word Translation Knowledge | |
Hahn et al. | Optimizing CRFs for SLU tasks in various languages using modified training criteria |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |