KR20200036419A - 음성을 이용한 키워드 추출 방법 및 서버 - Google Patents
음성을 이용한 키워드 추출 방법 및 서버 Download PDFInfo
- Publication number
- KR20200036419A KR20200036419A KR1020180116031A KR20180116031A KR20200036419A KR 20200036419 A KR20200036419 A KR 20200036419A KR 1020180116031 A KR1020180116031 A KR 1020180116031A KR 20180116031 A KR20180116031 A KR 20180116031A KR 20200036419 A KR20200036419 A KR 20200036419A
- Authority
- KR
- South Korea
- Prior art keywords
- correction
- text
- word
- voice
- spoken
- Prior art date
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 50
- 238000012937 correction Methods 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 14
- 230000001755 vocal effect Effects 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 7
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 음성을 이용한 키워드 추출 방법 및 서버에 관한 것으로, 본 발명에 따른 음성을 이용한 키워드 추출 방법은 키워드 추출부가 메인 데이터베이스를 참조해 키워드를 추출하는 제1 단계; 상기 키워드의 추출에 실패한 경우, 음성인식 테스트부가 원문 텍스트의 발성 시 사용한 발성 예제 텍스트와 음성 인식된 결과 생성된 음성 텍스트를 비교하는 제2 단계; 상기 발성 예제 텍스트와 상기 음성 텍스트가 상이하면, 유사 단어 선정부가 상기 음성 텍스트 상에서 보정 가능한 유사 단어를 선정하는 제3 단계; 및 보정 단어 저장부가 선정된 상기 유사 단어를 보정 가능한 보정 단어에 매칭하여 보정 데이터베이스에 저장하는 제4 단계;를 포함한다.
Description
본 발명의 실시예는 음성을 이용한 키워드 추출 방법 및 서버에 관한 것이다.
현재, 여러 연구기관에서 연속 음성인식 연구가 활발하게 진행되고 있으며, 연속 음성 인식 시스템의 인식률과 인식속도 측면에서 사용자의 요구사항을 만족시키기 위한 지속적인 연구 개발이 이루어지고 있다.
종래에는 이러한 음성인식을 위해 어절을 이용한 음성인식, 의사 형태소를 이용하여 낭독체, 대화체의 음성인식, 또는 의사형태소와 어절을 동시에 사용하는 다중 수준의 음성인식 단위를 제공하는 방법 등이 사용되어 왔다.
대한민국 특허 출원번호 1997-0065686호는 의사형태소를 이용하여 음성 인식 단위를 설정하는 방법을 게시하고 있으며, 대한민국 특허 출원번호 1998-0044518호는 연속 음성인식을 위한 어절 분리방법 및 그를 이용한 음성 인식방법에 대하여 게시하고 있다.
한편, 이와 같은 음성인식기와 형태소분석을 통해 특정 도메인의 응용 프로그램 작성 시에 음성인식기와 형태소분석기의 사전에서 무한정 단어를 제공할 수 없으므로, 대부분의 전문 용어는 미지어(Unknown Word)로 처리되어 인식률이 현저히 저하되어, 키워드를 추출하는 응응 프로그램을 작성할 수 없는 문제점이 있었다.
본 발명은 전술한 문제를 해결하기 위해 안출된 것으로서, 본 발명에 따르면 키워드 추출 예제를 발성한 음성의 인식 테스트를 통해 보정 가능한 유사 단어를 선정하여 데이터베이스를 구축하여 미지어(Unknown Word)를 인식할 수 있도록 하여 기존 사전을 보정하는 데이터베이스를 구축하여 보조사전에 추가 엔트리를 등록할 수 있도록 하여, 보다 정확도 높은 검색이 가능하도록 하고자 한다.
전술한 문제를 해결하기 위한 본 발명의 실시예에 따른 음성을 이용한 키워드 추출 방법은 키워드 추출부가 메인 데이터베이스를 참조해 키워드를 추출 하는 제1 단계; 상기 키워드 추출에 실패한 경우, 음성인식 테스트부가 원문 텍스트의 발성 예제 텍스트와 음성 인식된 음성 텍스트를 비교하는 제2 단계; 상기 테스트에서 발성 예제 텍스트와 음성 텍스트가 상이하면, 유사 단어 선정부가 상기 음성 텍스트 상에서 보정 가능한 유사 단어를 선정하는 제3 단계; 및 보정 단어 저장부가 선정된 상기 유사 단어를 보정 가능한 보정 단어에 매칭하여 보정 데이터베이스에 저장하는 제4 단계;를 포함한다.
본 발명의 다른 일실시예에 따르면, 상기 제4 단계는 상기 보정 단어 저장부가 복수개의 상기 유사 단어를 하나의 상기 보정 단어에 매칭하여 구성한 데이터를 상기 보정 데이터베이스에 저장할 수 있다.
본 발명의 다른 일실시예에 따르면, 단어 보정부가 상기 보정 데이터베이스에 보정 단어를 이용해 상기 음성 텍스트의 유사 단어를 보정하는 제5 단계; 및 정확도 산출부가 상기 보정된 음성 텍스트의 정확도를 계산하는 제6 단계;를 더 포함할 수 있다.
본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 서버는 메인 데이터베이스를 참조해 키워드를 추출하는 키워드 추출부; 상기 키워드에 추출에 실패한 경우, 원문 텍스트의 발성 예제 텍스트와 음성 인식된 음성 텍스트를 비교하는 음성인식 테스트부; 상기 발성 예제 텍스트와 상기 음성 텍스트가 상이하면, 상기 음성 텍스트 상에서 보정 가능한 유사 단어를 선정하는 유사 단어 선정부; 및 선정된 상기 유사 단어를 보정 가능한 보정 단어에 매칭하여 보정 데이터베이스에 저장하는 보정 단어 저장부;를 포함한다.
본 발명의 다른 일실시예에 따르면, 상기 보정 단어 저장부는 복수 개의 상기 유사 단어를 하나의 상기 보정 단어에 매칭하여 구성한 데이터를 상기 보정 데이터베이스에 저장할 수 있다.
본 발명의 다른 일실시예에 따르면, 상기 보정 데이터베이스에 보정 단어를 이용해 상기 음성 텍스트의 유사 단어를 보정하는 단어 보정부; 및 상기 보정된 음성 텍스트의 정확도를 산출하는 정확도 산출부;를 더 포함할 수 있다.
본 발명의 실시예에 따르면 키워드 추출 예제를 발성한 음성의 인식 테스트를 통해 보정 가능한 유사 단어를 선정하여 데이터베이스를 구축하여 미지어(Unknown Word)를 인식할 수 있도록 하여 기존 사전을 보정하는 데이터베이스를 구축하여 보조사전에 추가 엔트리를 등록할 수 있도록 하여, 키워드 추출율을 제고함으로써 보다 정확도 높은 검색이 가능하도록 할 수 있다.
도 1은 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 서버 및 키워드 추출 시스템을 설명하기 위한 개념도이다.
도 2는 본 발명의 일실시예에 따른 보정 데이터베이스에 매칭되어 저장되는 유사 단어와 보정 단어를 설명하기 위한 도면이다.
도 3은 본 발명의 다른 일실시예에 따른 음성을 이용한 키워드 추출 시스템을 설명하기 위한 개념도이다.
도 4는 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 방법을 설명하기 위한 흐름도이다.
도 5 및 도 6은 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 방법의 정확도 계산 결과를 설명하기 위한 도면이다.
도 2는 본 발명의 일실시예에 따른 보정 데이터베이스에 매칭되어 저장되는 유사 단어와 보정 단어를 설명하기 위한 도면이다.
도 3은 본 발명의 다른 일실시예에 따른 음성을 이용한 키워드 추출 시스템을 설명하기 위한 개념도이다.
도 4는 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 방법을 설명하기 위한 흐름도이다.
도 5 및 도 6은 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 방법의 정확도 계산 결과를 설명하기 위한 도면이다.
이하에서는 첨부한 도면을 참조하여 바람직한 본 발명의 일실시예에 대해서 상세히 설명한다. 다만, 실시형태를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다. 또한, 도면에서의 각 구성요소들의 크기는 설명을 위하여 과장될 수 있으며, 실제로 적용되는 크기를 의미하는 것은 아니다.
도 1은 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 서버 및 키워드 추출 시스템을 설명하기 위한 개념도이고, 도 2는 본 발명의 일실시예에 따른 보정 데이터베이스에 매칭되어 저장되는 유사 단어와 보정 단어를 설명하기 위한 도면이다.
이후부터는 도 1을 참조하여 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 서버 및 키워드 추출 시스템을 설명하기로 한다.
본 발명의 일실시예에 따른 음성을 이용한 키워드 시스템은 키워드 추출 서버(110), 음성 인식 서버(200), 보정 데이터베이스(310) 및 메인 데이터베이스(320)를 포함하여 구성될 수 있다.
키워드 추출 서버(110)는 키워드 추출부(111), 음성인식 테스트부(112), 유사 단어 선정부(113) 및 보정 단어 저장부(114)를 포함하여 구성될 수 있다.
먼저, 키워드 추출부(111)는 음성인식 텍스트를 형태소 단위로 나눈 다음, 메인 데이터베이스(320)를 참조해 키워드를 추출한다.
음성인식 테스트부(112)는 상기 키워드 추출이 실패한 경우, 원문 텍스트의 발성 시 사용한 발성 예제 텍스트와 음성인식 결과 생성된 음성 텍스트를 비교한다.
유사 단어 선정부(113)는 상기 음성 텍스트 상에서 보정 가능한 유사 단어를 선정한다.
이때, 상기 유사 단어 선정부(113)는 상기 음성인식 테스트부(112)의 테스트 결과, 원문 텍스트를 발성한 텍스트와 상기 음성 인식된 결과 생성된 텍스트가 상이하여 테스트가 실패한 경우, 상기 음성 텍스트 상에서 보정 가능한 유사 단어를 선정할 수 있다.
보정 단어 저장부(114)는 선정된 상기 유사 단어를 보정 가능한 보정 단어에 매칭하여 보정 데이터베이스(310)에 저장한다.
이때, 상기 보정 단어 저장부(113)는 복수개의 상기 유사 단어를 하나의 상기 보정 단어에 매칭하여 구성한 데이터를 상기 보정 데이터베이스(310)에 저장할 수 있다.
도 2를 참조하여 보다 상세하게 설명하면, 상기 보정 단어 저장부(113)는 상기 보정 데이터베이스(310)에 인덱스 별로 하나의 보정 단어에 보정하고자 하는 다수의 유사 단어를 매칭시켜 저장할 수 있다.
아울러, 본 발명의 다른 일실시예에 따르면 상기 키워드 추출 서버(110)는 단어 보정부 및 정확도 산출부를 더 포함하여 구성될 수 있다.
상기 단어 보정부는 상기 보정 데이터베이스에 보정 단어를 이용해 상기 음성 텍스트의 유사 단어를 보정할 수 있으며, 상기 정확도 산출부는 상기 보정된 음성 텍스트의 정확도를 산출하여, 보정 정확도를 확인 및 검증할 수 있다.
도 3은 본 발명의 다른 일실시예에 따른 음성을 이용한 키워드 추출 시스템을 설명하기 위한 개념도이고, 도 4는 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 방법을 설명하기 위한 흐름도이다.
이후부터는 도 3 및 도 4를 참조하여 본 발명의 다른 일실시예에 따른 음성을 이용한 키워드 추출 시스템을 설명하기로 한다.
사용자(201)가 사용자 사전을 제공하는 어플리케이션(202)을 통해 음성을 입력하면, 어플리케이션(202)은 음성 인식 서버(200)를 통해 음성 데이터를 음성 텍스트로 변환한다.
키워드 추출 서버(110)는 형태소 분석기를 포함하여 구성되며 상기 어플리케이션(202)으로부터 음성 텍스트를 입력 받는다.
그에 따라, 상기 키워드 추출 서버(110)는 입력받은 음성 텍스트를 형태소 분석하고 이를 토대로 메인 데이터베이스(320)를 참조하여 키워드를 추출 하고(410), 추출에 성공하면 다음프로세스를 진행한다(S420). 상기 키워드 추출에 실패한 경우, 음성입력에 사용한 원문 텍스트와 음성 텍스트를 테스트하여(S430), 상기 테스트가 성공하면 메인 데이터베이스 검색 실패로 판정하고 키워드 추출을 종료한다(440). 이때, 사용자에게는 상기 어플리케이션(202)을 통해 키워트 추출에 실패했음을 알리는 에러 메시지가 제공될 수 있다.
한편, 상기 음성 텍스트를 테스트하여 실패하면, 키워드 추출 서버(110)는 보정 데이터베이스(310)를 참조하여 키워드 추출을 하고(S450), 이때 키워드 추출에 성공하면(S460, S465), 다음 프로세스를 진행한다(S470).
또한, 상기 키워드 추출에 실패하면 보정 프로세스를 시작할 수 있다(S480).
보다 구체적으로, 키워드 추출 서버(110)가 음성 텍스트 상에서 보정 가능한 유사 단어를 선정하고, 상기 선정된 유사 단어를 보정 가능한 보정 단어에 매칭하여 보정 데이터베이스(310)에 저장할 수 있으며, 아울러 상기 키워드 추출 서버(110)의 사용자 사전과 기분석사전에 함께 저장하여 등록할 수 있다.
도 5 및 도 6은 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 방법의 정확도 계산 결과를 설명하기 위한 도면이다.
도 5 및 도 6을 참조하면, 본 발명의 일실시예에 따른 음성을 이용한 키워드 추출 방법을 약품 용어의 보정에 사용하면, 보정전에 비교하여 약품명, 용량숫자, 용량단위, 주문수량 및 주문단위에서 정확도가 상승하는 것을 확인할 수 있으며, 검색률도 상승하는 것을 알 수 있다.
전술한 바와 같은 본 발명의 상세한 설명에서는 구체적인 실시예에 관해 설명하였다. 그러나 본 발명의 범주에서 벗어나지 않는 한도 내에서는 여러 가지 변형이 가능하다. 본 발명의 기술적 사상은 본 발명의 전술한 실시예에 국한되어 정해져서는 안 되며, 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
110: 키워드 추출 서버
111: 키워드 추출부
112: 음성인식 테스트부
113: 유사 단어 선정부
114: 보정 단어 저장부
200: 음성 인식 서버
201: 사용자
202: 어플리케이션
310: 보정 데이터베이스
320: 메인 데이터베이스
111: 키워드 추출부
112: 음성인식 테스트부
113: 유사 단어 선정부
114: 보정 단어 저장부
200: 음성 인식 서버
201: 사용자
202: 어플리케이션
310: 보정 데이터베이스
320: 메인 데이터베이스
Claims (6)
- 키워드 추출부가 메인 데이터베이스를 참조해 키워드를 추출하는 제1 단계;
상기 키워드의 추출에 실패한 경우, 음성인식 테스트부가 원문 텍스트의 발성 시 사용한 발성 예제 텍스트와 음성 인식된 결과 생성된 음성 텍스트를 비교하는 제2 단계;
상기 발성 예제 텍스트와 상기 음성 텍스트가 상이하면, 유사 단어 선정부가 상기 음성 텍스트 상에서 보정 가능한 유사 단어를 선정하는 제3 단계; 및
보정 단어 저장부가 선정된 상기 유사 단어를 보정 가능한 보정 단어에 매칭하여 보정 데이터베이스에 저장하는 제4 단계;
를 포함하는 음성을 이용한 키워드 추출 방법.
- 청구항 1에 있어서,
상기 제4 단계는,
상기 보정 단어 저장부가 복수개의 상기 유사 단어를 하나의 상기 보정 단어에 매칭하여 구성한 데이터를 상기 보정 데이터베이스에 저장하는 음성을 이용한 키워드 추출 방법.
- 청구항 1에 있어서,
단어 보정부가 상기 보정 데이터베이스에 보정 단어를 이용해 상기 음성 텍스트의 유사 단어를 보정하는 제5 단계; 및
정확도 산출부가 상기 보정된 음성 텍스트의 정확도를 계산하는 제6 단계;
를 더 포함하는 음성을 이용한 키워드 추출 방법.
- 메인 데이터베이스를 참조해 키워드를 추출하는 키워드 추출부;
상기 키워드에 추출에 실패한 경우, 원문 텍스트의 발성 시 사용한 발성 예제 텍스트와 음성 인식된 결과 생성된 음성 텍스트를 비교하는 음성인식 테스트부;
상기 발성 예제 텍스트와 상기 음성 텍스트가 상이하면, 상기 음성 텍스트 상에서 보정 가능한 유사 단어를 선정하는 유사 단어 선정부; 및
선정된 상기 유사 단어를 보정 가능한 보정 단어에 매칭하여 보정 데이터베이스에 저장하는 보정 단어 저장부;
를 포함하는 음성을 이용한 키워드 추출 서버.
- 청구항 4에 있어서,
상기 보정 단어 저장부는,
복수개의 상기 유사 단어를 하나의 상기 보정 단어에 매칭하여 구성한 데이터를 상기 보정 데이터베이스에 저장하는 음성을 이용한 키워드 추출 서버.
- 청구항 1에 있어서,
상기 보정 데이터베이스에 보정 단어를 이용해 상기 음성 텍스트의 유사 단어를 보정하는 단어 보정부; 및
상기 보정된 음성 텍스트의 정확도를 산출하는 정확도 산출부;
를 더 포함하는 음성을 이용한 키워드 추출 서버.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180116031A KR102166446B1 (ko) | 2018-09-28 | 2018-09-28 | 음성을 이용한 키워드 추출 방법 및 서버 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180116031A KR102166446B1 (ko) | 2018-09-28 | 2018-09-28 | 음성을 이용한 키워드 추출 방법 및 서버 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200036419A true KR20200036419A (ko) | 2020-04-07 |
KR102166446B1 KR102166446B1 (ko) | 2020-10-15 |
Family
ID=70290995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180116031A KR102166446B1 (ko) | 2018-09-28 | 2018-09-28 | 음성을 이용한 키워드 추출 방법 및 서버 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102166446B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113297348A (zh) * | 2021-04-15 | 2021-08-24 | 国网江苏省电力有限公司南京供电分公司 | 语音识别中文文本的校正方法 |
WO2023128547A1 (ko) * | 2021-12-30 | 2023-07-06 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001092485A (ja) * | 1999-09-10 | 2001-04-06 | Internatl Business Mach Corp <Ibm> | 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体 |
WO2008029881A1 (fr) * | 2006-09-07 | 2008-03-13 | Nec Corporation | Système de traitement du langage naturel et système d'enregistrement de dictionnaire |
JP2012128188A (ja) * | 2010-12-15 | 2012-07-05 | Nippon Hoso Kyokai <Nhk> | テキスト修正装置およびプログラム |
JP2012242421A (ja) * | 2011-05-16 | 2012-12-10 | Nippon Telegr & Teleph Corp <Ntt> | 単語追加装置、単語追加方法及びそのプログラム |
-
2018
- 2018-09-28 KR KR1020180116031A patent/KR102166446B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001092485A (ja) * | 1999-09-10 | 2001-04-06 | Internatl Business Mach Corp <Ibm> | 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体 |
WO2008029881A1 (fr) * | 2006-09-07 | 2008-03-13 | Nec Corporation | Système de traitement du langage naturel et système d'enregistrement de dictionnaire |
JP2012128188A (ja) * | 2010-12-15 | 2012-07-05 | Nippon Hoso Kyokai <Nhk> | テキスト修正装置およびプログラム |
JP2012242421A (ja) * | 2011-05-16 | 2012-12-10 | Nippon Telegr & Teleph Corp <Ntt> | 単語追加装置、単語追加方法及びそのプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113297348A (zh) * | 2021-04-15 | 2021-08-24 | 国网江苏省电力有限公司南京供电分公司 | 语音识别中文文本的校正方法 |
WO2023128547A1 (ko) * | 2021-12-30 | 2023-07-06 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102166446B1 (ko) | 2020-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8880400B2 (en) | Voice recognition device | |
KR101892734B1 (ko) | 음성 인식 시스템에서의 오류 수정 방법 및 그 장치 | |
US8401847B2 (en) | Speech recognition system and program therefor | |
US9697827B1 (en) | Error reduction in speech processing | |
US8346553B2 (en) | Speech recognition system and method for speech recognition | |
US6823493B2 (en) | Word recognition consistency check and error correction system and method | |
US10643603B2 (en) | Acoustic model training using corrected terms | |
US20020128831A1 (en) | Disambiguation language model | |
US20160336007A1 (en) | Speech search device and speech search method | |
US9704483B2 (en) | Collaborative language model biasing | |
JP2001249684A (ja) | 音声認識装置および音声認識方法、並びに記録媒体 | |
JP2007041319A (ja) | 音声認識装置および音声認識方法 | |
CN111737979B (zh) | 语音文本的关键词修正方法、装置、修正设备及存储介质 | |
US9135911B2 (en) | Automated generation of phonemic lexicon for voice activated cockpit management systems | |
CN111613214A (zh) | 一种用于提升语音识别能力的语言模型纠错方法 | |
US20150179169A1 (en) | Speech Recognition By Post Processing Using Phonetic and Semantic Information | |
Jyothi et al. | Transcribing continuous speech using mismatched crowdsourcing. | |
US11636853B2 (en) | Natural language grammar improvement | |
KR102166446B1 (ko) | 음성을 이용한 키워드 추출 방법 및 서버 | |
KR101242182B1 (ko) | 음성인식장치 및 음성인식방법 | |
Kou et al. | Fix it where it fails: Pronunciation learning by mining error corrections from speech logs | |
US20150206539A1 (en) | Enhanced human machine interface through hybrid word recognition and dynamic speech synthesis tuning | |
JP2007264229A (ja) | 対話装置 | |
Pundak et al. | On-the-fly ASR Corrections with Audio Exemplars. | |
Warusawithana et al. | Enhanced time delay neural network architectures for sinhala speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right |