KR20240053994A - Stt 엔진 및 nlp를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법 - Google Patents

Stt 엔진 및 nlp를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법 Download PDF

Info

Publication number
KR20240053994A
KR20240053994A KR1020220134195A KR20220134195A KR20240053994A KR 20240053994 A KR20240053994 A KR 20240053994A KR 1020220134195 A KR1020220134195 A KR 1020220134195A KR 20220134195 A KR20220134195 A KR 20220134195A KR 20240053994 A KR20240053994 A KR 20240053994A
Authority
KR
South Korea
Prior art keywords
audiobook
text
sentence
sound source
stt
Prior art date
Application number
KR1020220134195A
Other languages
English (en)
Inventor
이우석
구준성
오지웅
인병규
Original Assignee
에스케이 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 주식회사 filed Critical 에스케이 주식회사
Priority to KR1020220134195A priority Critical patent/KR20240053994A/ko
Publication of KR20240053994A publication Critical patent/KR20240053994A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Document Processing Apparatus (AREA)

Abstract

STT(Speech To Text) 엔진 및 NLP(Natural Language Processing, 자연어 처리)를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법이 제공된다. 본 발명의 실시예에 따른 오디오북 낭독 오류 자동 검출 시스템은, 성우 녹음 기반으로 제작된 오디오북 음원 파일 및 오디오북 음원 파일의 낭독 대상인 원본 도서 텍스트가 수신하는 통신부; 및 오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진 및 NLP(Natural Language Processing) 알고리즘을 이용하여 텍스트를 추출하고, 추출된 텍스트를 원본 도서 텍스트와 비교하여 불일치 구간을 검출하는 프로세서;를 포함한다. 이에 의해, 오디오북 품질 검수 작업을 자동으로 수행하여 불일치 구간을 최소화함으로써, 오디오북 품질을 향상시키고, 오디오북 품질 검수 작업의 작업 시간 및 작업 비용을 절감할 수 있다.

Description

STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법{Audiobook reading error automatic detection system and method using STT engine and NLP}
본 발명은 오디오북 낭독 오류 자동 검출 시스템 및 방법에 관한 것으로, 더욱 상세하게는 STT(Speech To Text) 엔진 및 NLP(Natural Language Processing, 자연어 처리)를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법에 관한 것이다.
코로나 팬데믹으로 촉발된 뉴노멀(New Normal) 시대에 맞춰 전세계 오디오북 호황기를 맞이하고 있는 가운데, 국내 오디오북 시장 역시 높은 시장 성장율을 보이고 있다.
이러한 오디오북 시장에서 오디오북 제작은 주로 성우를 기반으로 스튜디오 녹음 방식으로 오프라인 기반에서 제작이 이루어지고 있고, 스튜디오 녹음 전문가의 수기에 의한 작업 의존도가 높아 자동화 및 효율성 관점에서 제작 과정의 고도화에 대한 필요성이 대두 되고 있다.
기존에는 오디오북 녹음 후 품질 검수 작업이 100% 수작업으로 수행되고 있고, 음질의 Normalization 작업, Noise Floor 및 RMS 조율을 위해 모두 수기 검수 및 보정을 하고 있는 실정이다.
특히, 녹음 완료된 오디오북 음원 파일 중 낭독 오류(불일치)가 발생된 구간을 검출하는 경우, 전체 오디오북 음원을 청취하면서 원본 도서 텍스트와 비교 검수하는 작업을 100% 수작업으로 수행하고 있어, 이를 개선하기 위한 방안의 모색이 요구된다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 종래 수작업으로 진행되는 오디오북 품질 검수(불일치 구간 검출) 작업을 자동으로 수행할 수 있는 오디오북 낭독 오류 자동 검출 시스템 및 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 오디오북 낭독 오류 자동 검출 시스템은, 성우 녹음 기반으로 제작된 오디오북 음원 파일 및 오디오북 음원 파일의 낭독 대상인 원본 도서 텍스트가 수신하는 통신부; 및 오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진 및 NLP(Natural Language Processing) 알고리즘을 이용하여 텍스트를 추출하고, 추출된 텍스트를 원본 도서 텍스트와 비교하여 불일치 구간을 검출하는 프로세서;를 포함한다.
그리고 프로세서는, 원본 도서 텍스트를 대상으로 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하는 전처리 작업을 수행하는 전처리부; 오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진을 이용하여 텍스트를 추출하는 문장 추출부; 및 전처리 작업이 수행된 원본 도서 텍스트와 STT 엔진을 통해 추출된 STT 추출 텍스트를 비교하여 불일치 구간을 검출하는 문장 비교부;를 포함할 수 있다.
또한, 전처리부는, 원본 도서 텍스트 내 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하고, 불용 문자 제거가 완료되면, 페이지네이션 처리를 위해, 불용 문자가 제거된 텍스트를 페이지 단위로 구분하되, 불용 문자가 제거된 텍스트에서 페이지 단위로 구분할 수 있는 정보가 존재하도록 표준화된 epub 문서가 아닌 경우, 페이지네이션 처리의 복잡도를 낮추기 위해, 문장 단위로 분할하여, 페이지네이션 처리를 위한 인덱싱 작업을 수행할 수 있다.
그리고 전처리부는, 페이지네이션 처리가 완료되면, 비교 문장과의 유사도 체크를 위해, NLP 알고리즘을 이용하여 각 문장별 벡터 값을 추출할 수 있다.
또한, 문장 추출부는, 오디오북 음원 파일이 STT 엔진이 수용 가능한 음원 포맷이 아닌 경우, 오디오북 음원 파일을 STT 엔진이 수용 가능한 포맷으로 트랜스 코딩하는 작업을 수행할 수 있다.
그리고 문장 비교부는, STT 추출 텍스트가 페이지 단위로 구분되는 경우, 원본 도서 텍스트의 각 페이지별 시작 문장 및 종료 문장과 STT 추출 텍스트를 비교하여 STT 추출 텍스트 내 페이지 단위별로 시작 문장과 종료 문장을 선별하고, 선별된 시작 문장과 종료 문장을 기준으로 해당 페이지에 해당하는 원본 도서 텍스트와 STT 추출 텍스트를 비교하여 불일치 구간을 검출할 수 있다.
또한, 문장 비교부는, 특정 페이지에서 불일치 구간이 검출되면, 불일치 구간 내 불일치 문장의 시작점을 식별하기 위해, 불일치 문장의 시작점에 타임 스탬프(Timestamp) 정보가 매핑된 불일치 단어 식별 태그를 부가할 수 있다.
그리고 프로세서는, 문장 비교부를 통해 검출되는 불일치 구간에 대한 정보를 기반으로 오디오북 음원 파일의 재작업 여부가 결정되도록 하는 결과 분석부;를 더 포함할 수 있다.
또한, 결과 분석부는, 불일치 구간 내 불일치 문장의 시작점에 타임 스탬프(Timestamp) 정보가 매핑된 불일치 단어 식별 태그가 부가되는 경우, 타임 스탬프 정보와 연동하여 불일치 문장의 바로듣기 기능을 제공하며, 타임 스탬프 정보가 매핑된 불일치 단어 식별 태그가 부가된 불일치 문장이 복수인 경우, 하나 이상의 불일치 문장이 그룹핑되어 관리되는 북마크 기능을 제공할 수 있다.
한편, 본 발명의 다른 실시예에 따른, 오디오북 낭독 오류 자동 검출 방법은, 오디오북 낭독 오류 자동 검출 시스템이, 성우 녹음 기반으로 제작된 오디오북 음원 파일 및 오디오북 음원 파일의 낭독 대상인 원본 도서 텍스트를 수신하는 단계; 오디오북 낭독 오류 자동 검출 시스템이, 수신된 원본 도서 텍스트를 대상으로 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하는 전처리 작업을 수행하는 단계; 오디오북 낭독 오류 자동 검출 시스템이, 오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진 및 NLP(Natural Language Processing) 알고리즘을 이용하여 텍스트를 추출하는 단계; 및 오디오북 낭독 오류 자동 검출 시스템이, 추출된 텍스트를 전처리 작업이 수행된 원본 도서 텍스트와 비교하여 불일치 구간을 검출하는 단계;를 포함한다.
이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 오디오북 품질 검수 작업을 자동으로 수행하여 불일치 구간을 최소화함으로써, 오디오북 품질을 향상시키고, 오디오북 품질 검수 작업의 작업 시간 및 작업 비용을 절감할 수 있다.
도 1은, 본 발명의 일 실시예에 따른 STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 시스템의 구성 설명에 제공된 도면,
도 2는, 상기 도 1에 도시된 프로세서의 구성 설명에 제공된 도면,
도 3은, 본 발명의 일 실시예에 따른 STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 방법의 설명에 제공된 흐름도,
도 4는, 본 발명의 일 실시예에 따라 오디오북 음원 파일 및 원본 도서 텍스트의 등록 과정의 더욱 상세한 설명에 제공된 흐름도,
도 5는, 본 발명의 일 실시예에 따라 원본 도서 텍스트의 전처리 과정의 더욱 상세한 설명에 제공된 흐름도,
도 6은, 본 발명의 일 실시예에 따라 오디오북 음원 파일에서 텍스트를 추출하는 과정의 더욱 상세한 설명에 제공된 흐름도,
도 7은, 본 발명의 일 실시예에 따라 원본 도서 텍스트와 STT 추출 텍스트를 비교하여 불일치 구간을 검출하는 과정의 더욱 상세한 설명에 제공된 흐름도, 그리고
도 8은, 본 발명의 일 실시예에 따라 불일치 구간의 검출 결과를 기반으로 후속 조치가 수행되는 과정의 설명에 제공된 흐름도이다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 1은, 본 발명의 일 실시예에 따른 STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 시스템의 구성 설명에 제공된 도면이다.
도 1을 참조하면, 본 실시예에 따른 STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 시스템(이하에서는 '시스템'으로 총칭하기로 함)은, 통신부(100), 프로세서(200), 입력부(300), 출력부(400) 및 저장부(500)를 포함한다.
통신부(100)는, 시스템이 외부와 통신 네트워크로 연결되도록 하기 위한 통신 수단이다.
예를 들면, 통신부(100)는, 성우 녹음 기반으로 제작된 오디오북 음원 파일 및 오디오북 음원 파일의 낭독 대상인 원본 도서 텍스트를 수신할 수 있다.
입력부(300)는, 마우스, 키보드, 마이크, USB 입력 인터페이스 등 사용자의 입력을 수신하는 입력 인터페이스 장치를 구비할 수 있다.
출력부(400)는, 프로세서(200)가 동작하여 출력하고자 하는 정보들을 화면에 출력하는 디스플레이 수단이고, 저장부(500)는, 프로세서(200)가 동작함에 있어 필요한 프로그램 및 데이터를 저장하는 저장매체이다.
프로세서(200)는, 시스템의 제반사항을 처리하기 위해 마련된다.
예를 들면, 프로세서(200)는, 수신된 오디오북 음원 파일 및 원본 도서 텍스트가 저장부에 등록되도록 하고, 등록된 오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진 및 NLP(Natural Language Processing) 알고리즘을 이용하여 텍스트를 추출하고, 추출된 텍스트를 원본 도서 텍스트와 비교하여 불일치 구간을 검출할 수 있다.
또한, 프로세서(200)는, 오디오북 음원 파일이 STT 엔진이 수용 가능한 음원 포맷이 아닌 경우, 오디오북 음원 파일을 STT 엔진이 수용 가능한 포맷으로 트랜스 코딩하는 작업을 수행할 수 있다.
그리고 프로세서(200)는, 검출되는 불일치 구간에 대한 정보를 기반으로 오디오북 음원 파일의 재작업 여부가 결정되도록 할 수 있다.
도 2는, 상기 도 1에 도시된 프로세서(200)의 구성 설명에 제공된 도면이다.
도 2를 참조하면, 프로세서(200)는, 제어부(210), 전처리부(220), 문장 추출부(230), 문장 비교부(240) 및 결과 분석부(250)를 포함할 수 있다.
제어부(210)는, 오디오북 낭독 오류 자동 검출 과정에서 필요한 구성요소 호출 및 처리 결과에 따른 제어를 수행하는 역할을 하고, 필요에 따른 분기 처리를 통해 오디오북 낭독 오류 검출을 보다 유연하게 이루어질 수 있도록 흐름을 관리하며, 사용자가 UI를 통해 검출된 오류를 보다 효과적으로 확인하도록 할 수 있다.
또한, 제어부(210)는, 통신부(100)를 통해 수신되거나 입력부(300)를 통해 입력되는 오디오북 음원 파일 또는/및 원본 도서 텍스트 파일이 저장부(500)에 마련되는 DB(데이터베이스)에 등록되도록 할 수 있다.
그리고 제어부(210)는, 오디오북 음원 또는 테스트 파일이 내부 시스템에서 수용 불가한 파일 포맷으로 판정될 경우, 통신부(100) 또는 출력부(400)를 통해 에러 메시지를 전송/표시하여, 사용자가 이후 상응하는 조치를 취할 수 있도록 충실한 가이드를 제공할 수 있다.
전처리부(220)는, 등록된 원본 도서 텍스트를 대상으로 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하는 전처리 작업을 수행할 수 있다. 여기서, 불용 문자는, 불필요한 기호 및 물음표, 쉼표, 따옴표 등의 문장 부호 등을 포함할 수 있다. 다만, 조사 등의 불용어는 NLP 문장 유사도 과정에서 빈도 체크에 따라 필터링되는 요소로 별도 제외 처리는 수행하지 않는다.
문장 추출부(230)는, 오디오북 음원 파일을 대상으로 STT 엔진을 이용하여 텍스트를 추출할 수 있다.
그리고 문장 추출부(230)는, 오디오북 음원 파일이 STT 엔진이 수용 가능한 음원 포맷이 아닌 경우, 오디오북 음원 파일을 STT 엔진이 수용 가능한 포맷으로 트랜스 코딩하는 작업을 수행한 이후, STT 엔진을 이용하여 텍스트를 추출할 수 있다.
문장 비교부(240)는, 전처리 작업이 수행된 원본 도서 텍스트와 STT 엔진을 통해 추출된 STT 추출 텍스트를 비교하여 불일치 구간을 검출할 수 있다.
결과 분석부(250)는, 문장 비교부(240)를 통해 검출되는 불일치 구간에 대한 정보를 기반으로 오디오북 음원 파일의 재작업 여부가 결정되도록 할 수 있다.
예를 들면, 결과 분석부(250)는, 불일치 구간 내 불일치 문장의 시작점에 타임 스탬프 정보가 매핑된 불일치 단어 식별 태그가 부가되는 경우, 타임 스탬프 정보와 연동하여 불일치 문장의 바로듣기 기능을 제공할 수 있다.
또한, 결과 분석부(250)는, 타임 스탬프 정보가 매핑된 불일치 단어 식별 태그가 부가된 불일치 문장이 복수인 경우, 하나 이상의 불일치 문장이 그룹핑되어 관리되는 북마크 기능을 제공할 수 있다.
도 3은, 본 발명의 일 실시예에 따른 STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 방법의 설명에 제공된 흐름도이다.
본 실시예에 따른 STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 방법은 도 1 내지 도 2를 참조하여 전술한 시스템에 의해 실행될 수 있다.
도 3을 참조하면, STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 방법은 시스템의 제어부(210)를 통해 성우 녹음 기반으로 제작된 오디오북 음원 파일 및 오디오북 음원 파일의 낭독 대상인 원본 도서 텍스트가 저장부(500)에 마련되는 DB에 등록되도록 할 수 있다(S310).
그리고 STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 방법은 전처리부(220)를 통해, 등록된 원본 도서 텍스트를 대상으로 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하는 전처리 작업을 수행하고(S320), 문장 추출부(230)를 통해, 오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진 및 NLP(Natural Language Processing) 알고리즘을 이용하여 텍스트를 추출할 수 있다(S330).
또한, STT 엔진 및 NLP를 활용한 오디오북 낭독 오류 자동 검출 방법은 문장 비교부(240)를 통해, 추출된 텍스트를 전처리 작업이 수행된 원본 도서 텍스트와 비교하여 불일치 구간을 검출할 수 있다(S340).
또한, 결과 분석부(250)를 통해, 문장 비교부(240)를 통해 검출되는 불일치 구간에 대한 정보가 출력되도록 하여, 출력되는 불일치 구간에 대한 정보를 기반으로 오디오북 음원 파일의 재작업 여부가 결정되도록 할 수 있다. 이를 통해, 불일치 구간의 검출 결과를 기반으로 후속 조치가 효율적으로 수행되도록 할 수 있다.
도 4는, 본 발명의 일 실시예에 따라 오디오북 음원 파일 및 원본 도서 텍스트의 등록 과정의 더욱 상세한 설명에 제공된 흐름도이다.
도 4를 참조하면, 제어부(210)는, 통신부(100)를 통해 수신되거나 입력부(300)를 통해 입력되는 오디오북 음원 파일 또는/및 원본 도서 텍스트 파일이 저장부(500)에 마련되는 DB에 등록되도록 할 수 있다(S410).
그리고 제어부(210)는, 등록된 음원 파일 및 텍스트 파일에 대한 속성 값을 추출하여 DB에 저장할 수 있다(S420).
즉, 등록되는 오디오북 음원 파일 또는/및 원본 도서 텍스트 파일은, 전처리부(220) 및 문장 추출부(230)에서 연동될 수 있도록 속성 값에 대한 정보가 DB에 함께 등록될 수 있으며, 오디오북 음원 파일 또는/및 원본 도서 텍스트 파일이 등록되는 DB는 내부 시스템 간의 연동의 효율성을 위해 프로세서(200)의 구성요소들이 자유롭게 접근할 수 있다.
여기서, 저장부(500)는, 프로세서(200)의 구성요소들이 자유롭게 접근할 수 있는 DB 저장소와 오디오북 음원 파일을 외부 전송하기 위해, 통신부(100) 등이 접근할 수 있는 제1 저장소 및 원본 도서 텍스트 파일의 전처리를 위해 전처리부(220) 등이 접근할 수 있는 제2 저장소를 포함할 수 있다.
즉, 제어부(210)는, 추출된 음원 파일 및 텍스트 파일에 대한 속성 값을 DB에 저장한 이후, 음원 파일을 외부 전송을 위한 제1 저장소에 저장시키고(S430), 원본 도서 텍스트 파일의 전처리를 위해, 원본 도서 텍스트 파일을 제2 저장소에 저장시킬 수 있다(S440).
그리고, 제어부(210)는, 제2 저장소에 원본 도서 텍스트 파일이 저장되면, 저장된 원본 도서 텍스트 파일을 대상으로 전처리부(220)에 전처리 작업을 요청할 수 있다(S450).
도 5는, 본 발명의 일 실시예에 따라 원본 도서 텍스트의 전처리 과정의 더욱 상세한 설명에 제공된 흐름도이다.
전처리부(220)는, 전술한 바와 같이 등록된 원본 도서 텍스트를 대상으로 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하는 전처리 작업을 수행할 수 있다.
도 5를 참조하여 설명하면, 전처리부(220)는, 원본 도서 텍스트 내 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거할 수 있다(S510).
그리고 전처리부(220)는, 불용 문자 제거가 완료되면, 페이지네이션 처리를 위해, 불용 문자가 제거된 텍스트를 페이지 단위로 구분하되, 불용 문자가 제거된 텍스트에서 페이지 단위로 구분할 수 있는 정보가 존재하도록 표준화된 epub 문서가 아닌 경우, 페이지네이션 처리의 복잡도를 낮추기 위해, 문장 단위로 분할하여, 페이지네이션 처리를 위한 인덱싱 작업을 수행할 수 있다.
구체적으로, 전처리부(220)는, 불용 문자가 제거된 텍스트가 표준화된 epub(electronic publication) 문서인지 여부를 판단하여(S520), 표준화된 epub 문서가 아닌 경우(S520-No), 불용 문자가 제거된 텍스트를 문장 단위로 분할하여(S530), 페이지네이션 처리를 위한 인덱싱 작업을 수행하고(S540), 페이지네이션 인덱싱 처리 결과를 저장할 수 있다(S550).
즉, 전처리부(220)는, 전체 텍스트 문장에서 페이지 단위로 구분할 수 있는 정보가 존재하도록 표준화된 epub 문서가 아닌 경우, 페이지 구분할 수단이 없으므로, 페이지네이션 처리의 복잡도를 낮추기 위해 불용 문자가 제거된 텍스트를 문장 단위로 분할하여, 페이지네이션 처리를 위한 인덱싱 작업을 수행할 수 있다.
이때, 전처리부(220)는, 한 페이지를 20개 문장 단위구성으로 가정하여 페이지네이션 처리할 수 있다.
반면에, 전처리부(220)는, 불용 문자가 제거된 텍스트가 표준화된 epub 문서인 경우(S520-Yes), 페이지 단위로 구분하여 분할하여(S560), 분할 결과를 저장할 수 있다(S570).
그리고 전처리부(220)는, 페이지네이션 처리가 완료되면, 비교 문장과의 유사도 체크를 위해, NLP 알고리즘을 이용하여 각 문장별 벡터 값을 추출할 수 있다.
도 6은, 본 발명의 일 실시예에 따라 오디오북 음원 파일에서 텍스트를 추출하는 과정의 더욱 상세한 설명에 제공된 흐름도이다.
문장 추출부(230)는, 전술한 바와 같이 오디오북 음원 파일을 대상으로 STT 엔진을 이용하여 텍스트를 추출할 수 있다.
도 6을 참조하여 설명하면, 문장 추출부(230)는, 오디오북 음원 파일이 STT 엔진이 수용 가능한 음원 포맷(STT 샘플링이 가능한 포맷)인지 여부를 판단하여(S610), 오디오북 음원 파일이 STT 엔진이 수용 가능한 음원 포맷이 아닌 경우(S610-No), 오디오북 음원 파일을 STT 엔진이 수용 가능한 포맷으로 트랜스 코딩하는 작업을 수행할 수 있다(S620).
즉, 문장 추출부(230)는, STT 엔진이 수용 가능한 음원 포맷(ex. mp3, wav, aac 등)과 최소 요구조건의 음질(bitrate, sample rate)을 점검하고, 요구되는 음원 포맷이 아닌 경우, 자동 트랜스 코딩을 통해 음원 포맷을 규격화할 수 있다.
이때, 음질의 경우 scale up을 통해 음질 보정이 될 수 없으므로 기준에 부합하지 않은 음질의 경우는 제어부(210)가 통신부(100) 또는 출력부(400)를 통해 에러 메시지를 전달함으로써, 사용자가 후속 조치를 취할 수 있도록 가이드할 수 있다.
한편, 문장 추출부(230)는, STT 엔진을 통해 텍스트를 추출하기 위해, STT 엔진에 적합한 파라미터 정보를 구성하고(S630), STT 엔진에 텍스트 및 타임스탬프 추출을 요청하여(S640), STT 엔진을 통해 텍스트가 추출되도록 할 수 있다.
이때, STT 엔진으로 텍스트 추출 요청 작업은, 재생 시간에 준한 대기 시간을 요구하므로, 실시간 처리하기에 부적합하기 때문에, STT 엔진으로 비동기 형태로 텍스트 추출 요청을 전달하고, 완료 후 callback을 통해 텍스트 추출 결과 송신하는 형태의 프로세스로 정의할 수 있다.
그리고 STT 엔진은 텍스트 추출 외에 각 문장 단위 타임스탬프를 추출하는데, 이는 문장 단위 비교 후 불일치 구간에 대해 검수자가 직접 청취하여 최종 오류 여부를 확인할 수 있도록 편의성을 높이기 위한 정보로 활용될 수 있다.
그리고 문장 추출부(230)는, STT 엔진을 통한 텍스트 작업이 완료되면, STT 엔진을 통해 추출된 텍스트인 STT 추출 텍스트를 NLP 알고리즘에 적용하여 벡터값을 추출하여(S650), 텍스트 및 타임스탬프가 매핑된 정보를 구성할 수 있다(S660).
여기서, STT 엔진에서 텍스트 및 타임스탬프 추출 후 해당 정보를 문장 추출부(230)에게 비동기 방식으로 송신하게 되면, STT 엔진의 역할은 종료된다.
그리고 문장 추출부(230)는 추출된 텍스트와 타임스탬프 수신 후 추출된 전체 텍스트를 기준으로 문장 단위로 분할 처리 및 각 문장별 NLP를 활용한 벡터값을 추출할 수 있다.
여기서, 추출된 전체 텍스트, 분할된 문장, 문장별 원본 음원 타임스탬프 정보, 원본 음원 파일의 상호 관계 정의가 필요한 영역으로 관계형 데이터로 상호 연계될 수 있도록 데이터 모델링을 적용하여 DB화 되어, 저장부(500)에 저장될 수 있다.
한편, 이러한 텍스트 추출 과정은 추가 파일이 존재하는 경우(S670-Yes), 오디오북 음원 파일이 STT 엔진이 수용 가능한 음원 포맷인지 여부를 판단하는 단계(S610)부터 텍스트 및 타임스탬프가 매핑된 정보를 구성하는 단계(S660)까지 과정이 반복적으로 실행될 수 있다.
즉, 모든 정보 처리 및 저장이 완료되었으면 다음 파일이 존재하는지 확인 후 동일한 절차대로 STT 엔진과 연계하여 텍스트 추출, 원본 음원 타임스탬프 정보를 순환적으로 추출하고, 더 이상 추가 파일이 존재하지 않을 경우, 텍스트 추출 프로세스는 종료된다.
도 7은, 본 발명의 일 실시예에 따라 원본 도서 텍스트와 STT 추출 텍스트를 비교하여 불일치 구간을 검출하는 과정의 더욱 상세한 설명에 제공된 흐름도이다.
통상적으로, 350 페이지 기준 도서 책자의 글자수가 평균 20만자 수준으로 한 번에 전체 텍스트를 추출하는 것은 프로세스 전반의 비효율성을 야기하게 되므로, 문장 비교부(240)는, 페이지 단위로 전체 텍스트를 분할하여 효율성을 높일 수 있다.
즉, 문장 비교부(240)는, 전처리부(220)를 통해 처리된 페이지 단위로 원본 도서 텍스트와 STT 추출 텍스트 간의 일치 여부를 검증하여, 불일치 구간을 검출할 수 있다.
이때, 원본 도서 텍스트는 페이지 단위로 구분 정보가 확보되었지만, STT 추출 텍스트는 페이지 단위 구분 정보가 존재하지 않아, 원본 텍스트의 페이지 시작, 종료 문장의 텍스트 유사도를 기준으로 STT 추출 텍스트 내 페이지를 구분할 수 있다.
이를 위해, 문장 비교부(240)는, 원본 도서 텍스트의 각 페이지별 시작 문장 및 종료 문장을 선정하고(S710), 선정된 시작 문장과 종료 문장을 STT 추출 텍스트와 비교하여(S720), STT 추출 텍스트 내에서 해당 페이지의 페이지 시작 문장 및 종료 문장을 선별할 수 있다(S730).
즉, 문장 비교부(240)는, STT 추출 텍스트가 페이지 단위로 구분되는 경우, 원본 도서 텍스트의 각 페이지별 시작 문장 및 종료 문장과 STT 추출 텍스트를 비교하여 STT 추출 텍스트 내 페이지 단위별로 시작 문장과 종료 문장을 선별하고(S730), 선별된 시작 문장과 종료 문장을 기준으로 해당 페이지에 해당하는 원본 도서 텍스트와 STT 추출 텍스트를 비교하여 불일치 구간을 검출할 수 있다(S740).
구체적으로, 문장 비교부(240)는, 원본 도서 텍스트의 첫 번째 페이지 시작 문장의 사전 계산된 벡터 값을 활용하여 문장 추출부(230)에서 계산된 STT 추출 텍스트의 문장 중 유사도가 가장 높은 문장을 찾을 수 있다.
문장 비교부(240)는, 종료 문장의 경우에도 동일한 알고리즘을 통해 STT 추출 문서내 문장을 탐색하고, 시작 및 종료 문장의 offset 정보를 기준으로 STT 추출 텍스트 내 탐색하고자 하는 페이지 전체 텍스트를 수집할 수 있다.
그리고 문장 비교부(240)는, 특정 페이지에서 불일치 구간이 검출되면, 불일치 구간 내 불일치 문장의 시작점을 식별하기 위해, 불일치 문장의 시작점에 타임 스탬프(Timestamp) 정보가 매핑된 불일치 단어 식별 태그를 부가할 수 있다(S750).
구체적으로, 비교 대상 원본 도서 페이지와 STT 추출 텍스트 페이지 간의 비교는 문장 단위 불일치 검증 알고리즘을 통해 진행되고, 검증 진행 중 불일치 문장내 단어 수준의 불일치 여부를 표시하고, 해당 영역에는 CSS Tag 적용을 통해 시각화를 통해 식별이 용이하도록 지원할 수 있다.
또한, 불일치 단어 식별 태그에는 원본 음원의 재생 시작 지점인 Timestamp 값이 매핑되며, 이는 결과 분석부(250)에서 검수자가 해당 구간을 청취 후 재작업 여부를 마킹하는데 지원하는 용도로 활용될 수 있다.
그리고 대상 페이지 검수 완료 후 이후 페이지가 존재할 경우(S760-Yes), S710 단계부터 S750 단계까지 동일한 절차로 페이지 검수를 반복 수행하고, 최종 페이지 검수가 완료 후 문장 비교부(240) 전체 과정이 종료된다.
도 8은, 본 발명의 일 실시예에 따라 불일치 구간의 검출 결과를 기반으로 후속 조치가 수행되는 과정의 설명에 제공된 흐름도이다.
결과 분석부(250)는, 전술한 바와 같이 문장 비교부(240)를 통해 검출되는 불일치 구간에 대한 정보를 기반으로 오디오북 음원 파일의 재작업 여부가 결정되도록 할 수 있다.
즉, 결과 분석부(250)는 검수자가 최종 검수 시, 불일치 구간이 검출된 페이지를 검수하며 추가 낭독(재작업) 여부를 결정하는데 도움을 줄 수 있는 기능들을 제공할 수 있다.
도 8을 참조하여 설명하면, 결과 분석부(250)는, 문장 비교부(240)로부터 불일치 검출 결과를 수신하여, 수신된 불일치 검출 결과를 반영하여 불일치 구간을 식별하고(S810), 불일치 구간이 검출된 페이지가 검수자의 최종 검수 시, 쉽게 식별되도록 하기 위해, 불일치 구간이 검출된 페이지만으로 검출 결과 페이지를 구성할 수 있다(S820).
그리고 결과 분석부(250)는, 불일치 구간 내 불일치 문장에 불일치 단어 식별 태그를 적용할 수 있다(S830). 이때, 불일치 단어 식별 태그에는, 타임스탬프가 매핑될 수 있다.
즉, 결과 분석부(250)는, 문장 비교부(240)를 통해 처리된 페이지 단위 결과(불일치 구간 검출 작업의 결과물) 중 완전 일치의 경우는 표시하지 않고, 불일치 구간이 검출된 페이지만으로 검출 결과 페이지를 구성할 수 있다.
이때, 결과 분석부(250)는, 불일치 구간 내 불일치 문장의 시작점에 타임 스탬프 정보가 매핑된 불일치 단어 식별 태그가 부가되는 경우, 타임 스탬프 정보와 연동하여 불일치 문장의 바로듣기 기능을 제공할 수 있다.
예를 들면, 결과 분석부(250)는, 검출 결과 페이지 내의 불일치 구간(불일치 문장)이 출력되는 영역이 클릭되면, 오디오북 원본 음원의 타임스탬프를 기준으로 오디오북 원본 음원 내 불일치 구간에 해당하는 음원이 재생되도록 할 수 있다(S840). 이를 통해 검수자는, 해당 부분에서 실제 낭독 오류가 있는지를 최종 판단할 수 있다.
결과 분석부(250)는, 불일치 구간에 해당하는 음원이 재생되는 경우, 검수자에 의해 최종 검수 작업이 수행되어, 해당 불일치 구간에 대한 재작업 여부가 결정되면, 검수 결과(재작업 여부에 대한 결정 사항)가 해당 불일치 구간의 텍스트 페이지에 마킹되도록 할 수 있다(S850).
그리고 결과 분석부(250)는, 검수자에 의해 전체 페이지의 최종 검수 작업이 완료되면, 검수 결과에 따라 재작업이 결정된 구간들의 리스트가 출력되도록 할 수 있다(S860).
이때, 결과 분석부(250)는, 각 리스트에 포함된 항목(재작업이 결정된 구간들)마다 추후 바로듣기 기능을 제공하기 위해, 각각 타임 스탬프 정보가 연동되도록 할 수 있다.
한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
100 : 통신부
200 : 프로세서
210 : 제어부
220 : 전처리부
230 : 문장 추출부
240 : 문장 비교부
250 : 결과 분석부
300 : 입력부
400 : 출력부
500 : 저장부

Claims (10)

  1. 성우 녹음 기반으로 제작된 오디오북 음원 파일 및 오디오북 음원 파일의 낭독 대상인 원본 도서 텍스트를 수신하는 통신부; 및
    오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진 및 NLP(Natural Language Processing) 알고리즘을 이용하여 텍스트를 추출하고, 추출된 텍스트를 원본 도서 텍스트와 비교하여 불일치 구간을 검출하는 프로세서;를 포함하는 오디오북 낭독 오류 자동 검출 시스템.
  2. 청구항 1에 있어서,
    프로세서는,
    등록된 원본 도서 텍스트를 대상으로 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하는 전처리 작업을 수행하는 전처리부;
    오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진을 이용하여 텍스트를 추출하는 문장 추출부; 및
    전처리 작업이 수행된 원본 도서 텍스트와 STT 엔진을 통해 추출된 STT 추출 텍스트를 비교하여 불일치 구간을 검출하는 문장 비교부;를 포함하는 것을 특징으로 하는 오디오북 낭독 오류 자동 검출 시스템.
  3. 청구항 2에 있어서,
    전처리부는,
    원본 도서 텍스트 내 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하고,
    불용 문자 제거가 완료되면, 페이지네이션 처리를 위해, 불용 문자가 제거된 텍스트를 페이지 단위로 구분하되,
    불용 문자가 제거된 텍스트에서 페이지 단위로 구분할 수 있는 정보가 존재하도록 표준화된 epub 문서가 아닌 경우, 페이지네이션 처리의 복잡도를 낮추기 위해, 문장 단위로 분할하여, 페이지네이션 처리를 위한 인덱싱 작업을 수행하는 것을 특징으로 하는 오디오북 낭독 오류 자동 검출 시스템.
  4. 청구항 3에 있어서,
    전처리부는,
    페이지네이션 처리가 완료되면, 비교 문장과의 유사도 체크를 위해, NLP 알고리즘을 이용하여 각 문장별 벡터 값을 추출하는 것을 특징으로 하는 오디오북 낭독 오류 자동 검출 시스템.
  5. 청구항 2에 있어서,
    문장 추출부는,
    오디오북 음원 파일이 STT 엔진이 수용 가능한 음원 포맷이 아닌 경우, 오디오북 음원 파일을 STT 엔진이 수용 가능한 포맷으로 트랜스 코딩하는 작업을 수행하는 것을 특징으로 하는 오디오북 낭독 오류 자동 검출 시스템.
  6. 청구항 2에 있어서,
    문장 비교부는,
    STT 추출 텍스트가 페이지 단위로 구분되는 경우, 원본 도서 텍스트의 각 페이지별 시작 문장 및 종료 문장과 STT 추출 텍스트를 비교하여 STT 추출 텍스트 내 페이지 단위별로 시작 문장과 종료 문장을 선별하고,
    선별된 시작 문장과 종료 문장을 기준으로 해당 페이지에 해당하는 원본 도서 텍스트와 STT 추출 텍스트를 비교하여 불일치 구간을 검출하는 것을 특징으로 하는 오디오북 낭독 오류 자동 검출 시스템.
  7. 청구항 6에 있어서,
    문장 비교부는,
    특정 페이지에서 불일치 구간이 검출되면, 불일치 구간 내 불일치 문장의 시작점을 식별하기 위해, 불일치 문장의 시작점에 타임 스탬프(Timestamp) 정보가 매핑된 불일치 단어 식별 태그를 부가하는 것을 특징으로 하는 오디오북 낭독 오류 자동 검출 시스템.
  8. 청구항 2에 있어서,
    프로세서는,
    문장 비교부를 통해 검출되는 불일치 구간에 대한 정보를 기반으로 오디오북 음원 파일의 재작업 여부가 결정되도록 하는 결과 분석부;를 더 포함하는 것을 특징으로 하는 오디오북 낭독 오류 자동 검출 시스템.
  9. 청구항 8에 있어서,
    결과 분석부는,
    불일치 구간 내 불일치 문장의 시작점에 타임 스탬프 정보가 매핑된 불일치 단어 식별 태그가 부가되는 경우, 타임 스탬프 정보와 연동하여 불일치 문장의 바로듣기 기능을 제공하며,
    타임 스탬프 정보가 매핑된 불일치 단어 식별 태그가 부가된 불일치 문장이 복수인 경우, 하나 이상의 불일치 문장이 그룹핑되어 관리되는 북마크 기능을 제공하는 것을 특징으로 하는 오디오북 낭독 오류 자동 검출 시스템.
  10. 오디오북 낭독 오류 자동 검출 시스템이, 성우 녹음 기반으로 제작된 오디오북 음원 파일 및 오디오북 음원 파일의 낭독 대상인 원본 도서 텍스트가 수신하는 단계;
    오디오북 낭독 오류 자동 검출 시스템이, 수신된 원본 도서 텍스트를 대상으로 문장 단위 일치 여부 검토에 방해되는 불용 문자를 제거하는 전처리 작업을 수행하는 단계;
    오디오북 낭독 오류 자동 검출 시스템이, 오디오북 음원 파일을 대상으로 STT(Speech To Text) 엔진 및 NLP(Natural Language Processing) 알고리즘을 이용하여 텍스트를 추출하는 단계; 및
    오디오북 낭독 오류 자동 검출 시스템이, 추출된 텍스트를 전처리 작업이 수행된 원본 도서 텍스트와 비교하여 불일치 구간을 검출하는 단계;를 포함하는 오디오북 낭독 오류 자동 검출 방법.
KR1020220134195A 2022-10-18 2022-10-18 Stt 엔진 및 nlp를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법 KR20240053994A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220134195A KR20240053994A (ko) 2022-10-18 2022-10-18 Stt 엔진 및 nlp를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220134195A KR20240053994A (ko) 2022-10-18 2022-10-18 Stt 엔진 및 nlp를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20240053994A true KR20240053994A (ko) 2024-04-25

Family

ID=90885095

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220134195A KR20240053994A (ko) 2022-10-18 2022-10-18 Stt 엔진 및 nlp를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20240053994A (ko)

Similar Documents

Publication Publication Date Title
WO2021088400A1 (zh) 一种文档审核方法、装置、系统、设备及存储介质
CN105931644B (zh) 一种语音识别方法及移动终端
US8756064B2 (en) Method and system for creating frugal speech corpus using internet resources and conventional speech corpus
WO2020224119A1 (zh) 用于语音识别的音频语料筛选方法、装置及计算机设备
US9361891B1 (en) Method for converting speech to text, performing natural language processing on the text output, extracting data values and matching to an electronic ticket form
US20200090661A1 (en) Systems and Methods for Improved Digital Transcript Creation Using Automated Speech Recognition
US9442910B2 (en) Method and system for adding punctuation to voice files
US20160179831A1 (en) Systems and methods for textual content creation from sources of audio that contain speech
US7996227B2 (en) System and method for inserting a description of images into audio recordings
CN101025735A (zh) 用于通过不同语言之间的翻译来支持交流的装置和方法
US20190095428A1 (en) Information processing apparatus, dialogue processing method, and dialogue system
CN111666746A (zh) 会议纪要的生成方法及装置、电子设备及存储介质
JP7107229B2 (ja) 情報処理装置および情報処理方法、並びにプログラム
JP6495792B2 (ja) 音声認識装置、音声認識方法、プログラム
EP4322029A1 (en) Method and apparatus for generating video corpus, and related device
CN104750677A (zh) 语音传译装置、语音传译方法及语音传译程序
CN113626573A (zh) 一种销售会话异议及应对提取方法及系统
US20210005204A1 (en) Recording medium recording program, information processing apparatus, and information processing method for transcription
KR20240053994A (ko) Stt 엔진 및 nlp를 활용한 오디오북 낭독 오류 자동 검출 시스템 및 방법
JP5713782B2 (ja) 情報処理装置、情報処理方法及びプログラム
WO2021153403A1 (ja) テキスト情報編集装置及びテキスト情報編集方法
БАРКОВСЬКА Performance study of the text analysis module in the proposed model of automatic speaker’s speech annotation
KR101508718B1 (ko) 온라인상에서의 듣고 받아쓰기 시스템
WO2021017302A1 (zh) 一种数据提取方法、装置、计算机系统及可读存储介质
KR101336716B1 (ko) 온라인상에서의 듣고 받아쓰기 시스템