KR102395700B1 - 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법 - Google Patents
사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법 Download PDFInfo
- Publication number
- KR102395700B1 KR102395700B1 KR1020200181614A KR20200181614A KR102395700B1 KR 102395700 B1 KR102395700 B1 KR 102395700B1 KR 1020200181614 A KR1020200181614 A KR 1020200181614A KR 20200181614 A KR20200181614 A KR 20200181614A KR 102395700 B1 KR102395700 B1 KR 102395700B1
- Authority
- KR
- South Korea
- Prior art keywords
- learning
- sentences
- sentence
- category
- information
- Prior art date
Links
- 238000011017 operating method Methods 0.000 title claims abstract description 7
- 238000012549 training Methods 0.000 title claims description 43
- 238000000034 method Methods 0.000 claims description 23
- 230000007717 exclusion Effects 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 8
- 235000013550 pizza Nutrition 0.000 description 22
- 235000013305 food Nutrition 0.000 description 16
- 235000013527 bean curd Nutrition 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 235000015220 hamburgers Nutrition 0.000 description 4
- 235000021185 dessert Nutrition 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000010411 cooking Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005226 mechanical processes and functions Effects 0.000 description 1
- 235000012149 noodles Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법이 개시된다. 본 발명은 사용자로부터 제1 개체명 단어, 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 수신되면, 사용자로부터 수신된 정보들을 활용하여, 사전 저장되어 있는 참조 문장들 중 학습 데이터의 기초가 될 학습 문장들을 선택하고, 사전 저장되어 있는 학습 문장들 각각에 대응되는 음성 데이터를 추출하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 기술에 대한 것이다.
Description
본 발명은 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법에 대한 것이다.
최근, 다양한 분야에서 음성 인식 기술이 도입되면서, 보다 정확도가 높은 음성 인식을 수행하는 기술에 대한 수요가 증가하고 있다.
여기서, 음성 인식 기술은 음성이 입력되면, 음성의 특징을 분석하여 특징 벡터를 추출하고, 특징 벡터의 패턴을 인식한 후, 패턴 인식 결과를 기반으로 입력된 음성에 매칭되는 텍스트를 생성하여 생성된 텍스트를 결과로 출력하는 기술을 의미한다.
관련해서, 이러한 음성 인식 기술은 사전 수집된 다양한 음성 데이터와 음성 데이터에 매칭되는 텍스트로 구성된 학습 데이터를 기초로 소정의 음성 인식 모델을 구축해 둠으로써, 입력된 음성에 매칭되는 텍스트를 생성한다. 따라서, 보다 많은 양의 학습 데이터를 기초로 음성 인식 모델을 구축할수록, 정확도가 높은 음성 인식을 수행할 수 있다.
즉, 고품질의 음성 인식 모델을 구축하기 위해서는 충분한 양의 학습 데이터를 확보하는 것이 중요한데, 이러한 학습 데이터를 개발자가 일일이 만들어내는 데에는 한계가 존재하기 때문에, 보다 효율적으로 학습 데이터를 확보하는 방안에 대한 연구가 필요하다.
특히, 고품질의 음성 인식 모델을 만들기 위해서는 음성 인식 모델이 사용되는 환경 조건에 따라 적절한 학습 데이터를 구축할 필요가 있다. 예컨대, 의문문에 대한 음성 인식이 주로 사용되는 환경에서는 의문문 위주의 학습 데이터들이 구축되어 있을 필요가 있고, 요리와 관련된 분야에서 자주 사용되는 음성 인식 모델을 구축하려는 경우, 요리와 연관된 단어들이 포함되어 있는 문장들을 기초로 학습 데이터를 구축할 필요가 있다.
따라서, 많은 수의 참조 문장들과 이러한 참조 문장들에 대응되는 음성 데이터를 미리 확보해 둔 상태에서, 음성 인식 모델을 구축하려는 사용자가 자신이 구축하고자 하는 음성 인식 모델의 환경 조건에 따른 소정의 입력 조건을 인가하면, 이러한 입력 조건에 매칭되는 참조 문장들과 음성 데이터만을 적절히 추출해낼 수 있도록 지원하는 기법을 제시함으로써, 사용자가 구축하고자 하는 음성 인식 모델에 최적화된 학습 데이터를 생성할 수 있도록 지원하는 기술에 대한 연구가 필요하다.
본 발명은 사용자로부터 입력된 제1 개체명 단어, 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 수신되면, 사용자로부터 수신된 정보들을 활용하여, 사전 저장되어 있는 참조 문장들 중 학습 데이터의 기초가 될 학습 문장들을 선택하고, 사전 저장되어 있는 학습 문장들 각각에 대응되는 음성 데이터를 추출하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 기술을 제시함으로써, 사용자가 생성된 학습 데이터를 활용하여, 보다 정확도가 높은 음성 인식 모델을 구축할 수 있도록 지원하고자 한다.
본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치는 복수의 개체명 단어들 - 상기 복수의 개체명 단어들은 개체의 명칭을 지칭하는 단어들을 의미함 - 과, 상기 복수의 개체명 단어들 각각이 속하는 카테고리에 대한 정보 - 상기 카테고리에 대한 정보는 사전 설정된 복수의 카테고리들 중 상기 복수의 개체명 단어들 각각이 속하는 것으로 사전 분류된 카테고리에 대한 정보를 의미함 - 가 저장되어 있는 사전 데이터베이스, 상기 복수의 개체명 단어들 중 적어도 어느 하나의 개체명 단어를 포함하는 복수의 참조 문장들과, 상기 복수의 참조 문장들 각각이 속하는 도메인에 대한 정보 - 상기 도메인에 대한 정보는 문장의 종류와 관련된 사전 설정된 복수의 도메인들 중 상기 복수의 참조 문장들 각각이 속하는 것으로 사전 분류된 도메인에 대한 정보를 의미함 - 및 상기 복수의 참조 문장들 각각에 대응되는 음성 데이터가 서로 대응되어 저장되어 있는 참조 문장 저장부, 사용자로부터 상기 복수의 개체명 단어들 중 어느 하나인 제1 개체명 단어, 상기 복수의 도메인들 중 어느 하나인 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 인가되면, 상기 사전 데이터베이스를 참조하여, 상기 제1 개체명 단어가 속하는 제1 카테고리를 확인하는 카테고리 확인부, 상기 제1 카테고리가 확인되면, 상기 참조 문장 저장부를 참조하여, 상기 제1 도메인에 속하는 것으로 분류된 참조 문장들 중 상기 제1 글자 수 이하의 글자 수를 가지는 제1 참조 문장들을 선택하는 참조 문장 선택부 및 상기 제1 참조 문장들이 선택되면, 상기 제1 참조 문장들 중 상기 제1 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 학습 문장들로 선택한 후, 상기 참조 문장 저장부로부터, 상기 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 학습 문장들과 상기 학습 문장들 각각에 대응되는 음성 데이터로 구성된 학습 데이터를 생성하는 학습 데이터 생성부를 포함한다.
또한, 본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법은 복수의 개체명 단어들 - 상기 복수의 개체명 단어들은 개체의 명칭을 지칭하는 단어들을 의미함 - 과, 상기 복수의 개체명 단어들 각각이 속하는 카테고리에 대한 정보 - 상기 카테고리에 대한 정보는 사전 설정된 복수의 카테고리들 중 상기 복수의 개체명 단어들 각각이 속하는 것으로 사전 분류된 카테고리에 대한 정보를 의미함 - 가 저장되어 있는 사전 데이터베이스를 유지하는 단계, 상기 복수의 개체명 단어들 중 적어도 어느 하나의 개체명 단어를 포함하는 복수의 참조 문장들과, 상기 복수의 참조 문장들 각각이 속하는 도메인에 대한 정보 - 상기 도메인에 대한 정보는 문장의 종류와 관련된 사전 설정된 복수의 도메인들 중 상기 복수의 참조 문장들 각각이 속하는 것으로 사전 분류된 도메인에 대한 정보를 의미함 - 및 상기 복수의 참조 문장들 각각에 대응되는 음성 데이터가 서로 대응되어 저장되어 있는 참조 문장 저장부를 유지하는 단계, 사용자로부터 상기 복수의 개체명 단어들 중 어느 하나인 제1 개체명 단어, 상기 복수의 도메인들 중 어느 하나인 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 인가되면, 상기 사전 데이터베이스를 참조하여, 상기 제1 개체명 단어가 속하는 제1 카테고리를 확인하는 단계, 상기 제1 카테고리가 확인되면, 상기 참조 문장 저장부를 참조하여, 상기 제1 도메인에 속하는 것으로 분류된 참조 문장들 중 상기 제1 글자 수 이하의 글자 수를 가지는 제1 참조 문장들을 선택하는 단계 및 상기 제1 참조 문장들이 선택되면, 상기 제1 참조 문장들 중 상기 제1 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 학습 문장들로 선택한 후, 상기 참조 문장 저장부로부터, 상기 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 학습 문장들과 상기 학습 문장들 각각에 대응되는 음성 데이터로 구성된 학습 데이터를 생성하는 단계를 포함한다.
본 발명은 사용자로부터 제1 개체명 단어, 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 수신되면, 사용자로부터 수신된 정보들을 활용하여, 사전 저장되어 있는 참조 문장들 중 학습 데이터의 기초가 될 학습 문장들을 선택하고, 사전 저장되어 있는 학습 문장들 각각에 대응되는 음성 데이터를 추출하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 기술을 제시함으로써, 사용자가 생성된 학습 데이터를 활용하여, 보다 정확도가 높은 음성 인식 모델을 구축할 수 있도록 지원할 수 있다.
도 1은 본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 구조를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법을 도시한 순서도이다.
도 2는 본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법을 도시한 순서도이다.
이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다.
한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.
도 1은 본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 구조를 도시한 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 전자 장치(110)는 사전 데이터베이스(111), 참조 문장 저장부(112), 카테고리 확인부(113), 참조 문장 선택부(114) 및 학습 데이터 생성부(115)를 포함한다.
먼저, 사전 데이터베이스(111)에는 복수의 개체명 단어들과, 상기 복수의 개체명 단어들 각각이 속하는 카테고리에 대한 정보가 저장되어 있다.
여기서, 상기 복수의 개체명 단어들은 개체의 명칭을 지칭하는 단어들을 의미하는 것으로, '피자', '컴퓨터', '스마트폰' 등과 같은 명사를 의미한다.
또한, 상기 카테고리에 대한 정보는 사전 설정된 복수의 카테고리들 중 상기 복수의 개체명 단어들 각각이 속하는 것으로 사전 분류된 카테고리에 대한 정보를 의미하는 것으로, 각 개체명 단어가 '양식'에 대한 것인지, '한식'에 대한 것인지, '전자제품'에 대한 것인지 등과 같이, 각 개체명 단어가 지칭하는 개체의 종류에 따라 사전 분류된 정보를 의미한다. 예컨대, 개체명 단어를 '피자'라고 하는 경우, '피자'라는 개체명 단어가 속하는 카테고리는 '양식'이라고 할 수 있다.
이와 관련해서, 사전 데이터베이스(111)에는 하기의 표 1과 같이, 상기 복수의 개체명 단어들과 상기 복수의 개체명 단어들 각각이 속하는 카테고리에 대한 정보가 저장되어 있을 수 있다.
개체명 단어들 | 카테고리 |
피자 | 양식 |
스파게티 | 양식 |
햄버거 | 양식 |
순두부 | 한식 |
청국장 | 한식 |
떡볶이 | 한식 |
케이크 | 디저트 |
자장면 | 중식 |
스마트폰 | 전자제품 |
... | ... |
참조 문장 저장부(112)에는 상기 복수의 개체명 단어들 중 적어도 어느 하나의 개체명 단어를 포함하는 복수의 참조 문장들과, 상기 복수의 참조 문장들 각각이 속하는 도메인에 대한 정보 및 상기 복수의 참조 문장들 각각에 대응되는 음성 데이터가 서로 대응되어 저장되어 있다.
여기서, 상기 복수의 참조 문장들은 개발자에 의해서 사전 지정된 문장들을 의미하는 것이고, 개발자는 상기 복수의 참조 문장들을 음성으로 녹음하여 상기 복수의 참조 문장들 각각에 대응되는 음성 데이터를 저장해 둘 수 있다.
또한, 상기 도메인에 대한 정보는 문장의 종류와 관련된 사전 설정된 복수의 도메인들 중 상기 복수의 참조 문장들 각각이 속하는 것으로 사전 분류된 도메인에 대한 정보를 의미하는 것으로, 평서문, 의문문, 명령문, 감탄문 등과 같은 복수의 도메인들 중 각 참조 문장이 속해있는 도메인을 의미한다. 예컨대, 참조 문장을 '이번에 새로운 피자가 나온다고 해서 출시 날만 기다리다가 먹어봤어요.'라고 하는 경우, '이번에 새로운 피자가 나온다고 해서 출시 날만 기다리다가 먹어봤어요.'라는 참조 문장이 속하는 도메인은 '평서문'이라고 할 수 있다.
이와 관련해서, 참조 문장 저장부(112)에는 하기의 표 2와 같이, 상기 복수의 개체명 단어들 중 적어도 어느 하나의 개체명 단어를 포함하는 복수의 참조 문장들과, 상기 복수의 참조 문장들 각각이 속하는 도메인에 대한 정보 및 상기 복수의 참조 문장들 각각에 대응되는 음성 데이터가 서로 대응되어 저장되어 있을 수 있다.
복수의 참조 문장들 | 도메인 | 음성 데이터 |
이번에 새로운 피자가 나온다고 해서 출시 날만 기다리다가 먹어봤어요. | 평서문 | 음성 데이터 1 |
피자는 지역마다 요리하는 방법이 다릅니다. | 평서문 | 음성 데이터 2 |
비 오는 일요일에는 스파게티가 먹고 싶어요. | 평서문 | 음성 데이터 3 |
그곳에 가면 맛있는 스파게티를 먹을 수 있어요. | 평서문 | 음성 데이터 4 |
햄버거 하나 얼마입니까? | 의문문 | 음성 데이터 5 |
고향에서 만든 순두부가 그립다. | 평서문 | 음성 데이터 6 |
청국장 냄새가 코를 자극한다. | 평서문 | 음성 데이터 7 |
떡볶이 맛있게 먹어라. | 명령문 | 음성 데이터 8 |
케이크에 초를 몇 개 꽂을까요? | 의문문 | 음성 데이터 9 |
자장면은 제 동생이 제일 좋아하는 음식입니다. | 평서문 | 음성 데이터 10 |
스마트폰을 이용하여 셀카를 찍을 수 있습니다. | 평서문 | 음성 데이터 11 |
... | ... | ... |
카테고리 확인부(113)는 사용자(130)로부터 상기 복수의 개체명 단어들 중 어느 하나인 제1 개체명 단어, 상기 복수의 도메인들 중 어느 하나인 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 인가되면, 사전 데이터베이스(111)를 참조하여, 상기 제1 개체명 단어가 속하는 제1 카테고리를 확인한다.
참조 문장 선택부(114)는 카테고리 확인부(113)에 의해 상기 제1 카테고리가 확인되면, 참조 문장 저장부(112)를 참조하여, 상기 제1 도메인에 속하는 것으로 분류된 참조 문장들 중 상기 제1 글자 수 이하의 글자 수를 가지는 제1 참조 문장들을 선택한다.
학습 데이터 생성부(115)는 참조 문장 선택부(114)에 의해 상기 제1 참조 문장들이 선택되면, 상기 제1 참조 문장들 중 상기 제1 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 학습 문장들로 선택한 후, 참조 문장 저장부(112)로부터, 상기 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 학습 문장들과 상기 학습 문장들 각각에 대응되는 음성 데이터로 구성된 학습 데이터를 생성한다.
이하에서는, 카테고리 확인부(113), 참조 문장 선택부(114) 및 학습 데이터 생성부(115)의 동작을 예를 들어, 상세히 설명하기로 한다.
먼저, 사용자(130)로부터 '피자', '평서문' 및 '30글자'가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 인가되었다고 가정하자.
이때, 카테고리 확인부(113)는 사전 데이터베이스(111)를 참조하여, '피자'가 속하는 제1 카테고리를 확인할 수 있다.
관련해서, 상기 표 1과 같은 사전 데이터베이스(111)에서는, '피자'가 속하는 카테고리가 '양식'인 것으로 저장되어 있으므로, 카테고리 확인부(113)는 '양식'을 상기 제1 카테고리로 확인할 수 있다.
그러면, 참조 문장 선택부(114)는 참조 문장 저장부(112)를 참조하여, '평서문'에 속하는 것으로 분류된 참조 문장들 중 '30글자' 이하의 글자 수를 가지는 제1 참조 문장들을 선택할 수 있다.
관련해서, 상기 표 2와 같은 참조 문장 저장부(112)에서는 '평서문'에 속하는 것으로 분류된 참조 문장들 중 '30글자' 이하의 글자 수를 가지는 참조 문장들이 '피자는 지역마다 요리하는 방법이 다릅니다., 비 오는 일요일에는 스파게티가 먹고 싶어요., 그곳에 가면 맛있는 스파게티를 먹을 수 있어요., 고향에서 만든 순두부가 그립다., 청국장 냄새가 코를 자극한다., 자장면은 제 동생이 제일 좋아하는 음식입니다., 스마트폰을 이용하여 셀카를 찍을 수 있습니다.'인 것으로 저장되어 있다. 따라서, 참조 문장 선택부(114)는 '피자는 지역마다 요리하는 방법이 다릅니다., 비 오는 일요일에는 스파게티가 먹고 싶어요., 그곳에 가면 맛있는 스파게티를 먹을 수 있어요., 고향에서 만든 순두부가 그립다., 청국장 냄새가 코를 자극한다., 자장면은 제 동생이 제일 좋아하는 음식입니다., 스마트폰을 이용하여 셀카를 찍을 수 있습니다.'를 상기 제1 참조 문장들로 선택할 수 있다.
이렇게, 참조 문장 선택부(114)에 의해 상기 제1 참조 문장들이 선택되면, 학습 데이터 생성부(115)는 상기 제1 참조 문장들 중 '양식'에 속하는 개체명 단어를 포함하는 참조 문장들을 학습 문장들로 선택할 수 있다.
관련해서, 상기 표 1과 같은 사전 데이터베이스(111)에서는 '양식'에 속하는 개체명 단어들이 '피자, 스파게티, 햄버거'인 것으로 저장되어 있으므로, 상기 제1 참조 문장들 중 '양식'에 속하는 개체명 단어를 포함하는 참조 문장들은 '피자는 지역마다 요리하는 방법이 다릅니다., 비 오는 일요일에는 스파게티가 먹고 싶어요., 그곳에 가면 맛있는 스파게티를 먹을 수 있어요.'이다. 따라서, 학습 데이터 생성부(115)는 '피자, 스파게티, 햄버거' 중 적어도 어느 하나의 개체명 단어를 포함하는 참조 문장들로 '피자는 지역마다 요리하는 방법이 다릅니다., 비 오는 일요일에는 스파게티가 먹고 싶어요., 그곳에 가면 맛있는 스파게티를 먹을 수 있어요.'를 상기 학습 문장들로 선택할 수 있다.
그러면, 학습 데이터 생성부(115)는 참조 문장 저장부(112)로부터, '피자는 지역마다 요리하는 방법이 다릅니다., 비 오는 일요일에는 스파게티가 먹고 싶어요., 그곳에 가면 맛있는 스파게티를 먹을 수 있어요.' 각각에 대응되는 음성 데이터를 추출할 수 있다.
관련해서, 상기 표 2와 같은 참조 문장 저장부(112)에서는, '피자는 지역마다 요리하는 방법이 다릅니다.'에 대응되는 음성 데이터로 '음성 데이터 2'가 저장되어 있고, '비 오는 일요일에는 스파게티가 먹고 싶어요.'에 대응되는 음성 데이터로 '음성 데이터 3'이 저장되어 있으며, '그곳에 가면 맛있는 스파게티를 먹을 수 있어요.'에 대응되는 음성 데이터로 '음성 데이터 4'가 저장되어 있다. 따라서, 학습 데이터 생성부(115)는 상기 표 2와 같은 참조 문장 저장부(112)로부터 '음성 데이터 2, 음성 데이터 3, 음성 데이터 4'를 추출할 수 있다.
그러고 나서, 학습 데이터 생성부(115)는 '피자는 지역마다 요리하는 방법이 다릅니다., 비 오는 일요일에는 스파게티가 먹고 싶어요., 그곳에 가면 맛있는 스파게티를 먹을 수 있어요.'와 '음성 데이터 2, 음성 데이터 3, 음성 데이터 4'로 구성된 학습 데이터를 하기의 표 3과 같이 생성할 수 있다.
학습 문장들 | 음성 데이터 |
피자는 지역마다 요리하는 방법이 다릅니다. | 음성 데이터 2 |
비 오는 일요일에는 스파게티가 먹고 싶어요. | 음성 데이터 3 |
그곳에 가면 맛있는 스파게티를 먹을 수 있어요. | 음성 데이터 4 |
즉, 전자 장치(110)는 사용자(130)로부터 상기 제1 개체명 단어, 상기 제1 도메인에 대한 정보 및 상기 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 수신되면, 사용자(130)로부터 수신된 정보들을 활용하여, 참조 문장 저장부(112)에 사전 저장되어 있는 상기 참조 문장들 중 상기 학습 데이터의 기초가 될 상기 학습 문장들을 선택하고, 참조 문장 저장부(112)로부터 상기 학습 문장들 각각에 대응되는 음성 데이터를 추출하여 상기 학습 데이터를 생성할 수 있다.
이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 연관도 정보 저장부(116), 카테고리 선택부(117) 및 추가 학습 데이터 생성부(118)를 더 포함할 수 있다.
먼저, 연관도 정보 저장부(116)에는 상기 복수의 카테고리들 간의 사전 설정된 연관도에 대한 정보가 저장되어 있다.
예컨대, 연관도 정보 저장부(116)에는 하기의 표 4와 같은 상기 복수의 카테고리들 간의 사전 설정된 연관도에 대한 정보가 저장되어 있을 수 있다.
양식 | 한식 | 디저트 | 중식 | 전자제품 | |
양식 | - | 85% | 80% | 75% | 0% |
한식 | 85% | - | 75% | 80% | 0% |
디저트 | 80% | 75% | - | 70% | 0% |
중식 | 75% | 80% | 70% | - | 0% |
전자제품 | 0% | 0% | 0% | 0% | - |
카테고리 선택부(117)는 학습 데이터 생성부(115)에 의해 상기 학습 데이터가 생성되면, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수를 사전 설정된 기준 개수와 비교하여, 상기 학습 문장들의 개수가 상기 기준 개수 미만인 경우, 연관도 정보 저장부(116)를 참조하여, 상기 복수의 카테고리들 중 상기 제1 카테고리와의 연관도가 가장 높은 제2 카테고리를 선택한다.
추가 학습 데이터 생성부(118)는 카테고리 선택부(117)에 의해 상기 제2 카테고리가 선택되면, 상기 제1 참조 문장들 중 상기 제2 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 추가 학습 문장들로 선택한 후, 참조 문장 저장부(112)로부터, 상기 추가 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 추가 학습 문장들과 상기 추가 학습 문장들 각각에 대응되는 음성 데이터로 구성된 추가 학습 데이터를 생성한다.
이하에서는, 카테고리 선택부(117) 및 추가 학습 데이터 생성부(118)의 동작을 예를 들어, 상세히 설명하기로 한다.
먼저, 사전 설정된 기준 개수를 '5개'라고 하고, 전술한 예와 같이, 학습 데이터 생성부(115)에 의해 상기 학습 데이터가 상기 표 3과 같이 생성되었다고 가정하자.
여기서, 상기 기준 개수는 설명의 편의를 위해 '5개'인 것으로 가정하였지만, 실제 본 발명에서 생성될 학습 문장들의 기준 개수는 '5개'보다 훨씬 많은 개수로 설정되는 것이 바람직하다. 이는, 더 많은 수의 학습 문장들로 구성된 학습 데이터를 기초로 음성 인식 모델을 구축할수록, 보다 정확도가 높은 음성 인식 모델을 구축할 수 있기 때문이다.
이때, 상기 표 3과 같은 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수는 '3개'이므로, 카테고리 선택부(117)는 상기 학습 문장들의 개수가 상기 기준 개수 미만인 것으로 확인한 후, 연관도 정보 저장부(116)를 참조하여, 상기 복수의 카테고리들 중 '양식'과의 연관도가 가장 높은 제2 카테고리를 선택할 수 있다.
관련해서, 상기 표 4와 같은 연관도 정보 저장부(116)에서는 상기 복수의 카테고리들 중 '양식'과의 연관도가 가장 높은 카테고리가 '한식'인 것으로 저장되어 있으므로, 카테고리 선택부(117)는 '한식'을 상기 제2 카테고리로 선택할 수 있다.
그러면, 추가 학습 데이터 생성부(118)는 상기 제1 참조 문장들 중 '한식'에 속하는 개체명 단어를 포함하는 참조 문장들을 추가 학습 문장들로 선택할 수 있다.
관련해서, 전술한 예에 따르면, 상기 제1 참조 문장들은 '피자는 지역마다 요리하는 방법이 다릅니다., 비 오는 일요일에는 스파게티가 먹고 싶어요., 그곳에 가면 맛있는 스파게티를 먹을 수 있어요., 고향에서 만든 순두부가 그립다., 청국장 냄새가 코를 자극한다., 자장면은 제 동생이 제일 좋아하는 음식입니다., 스마트폰을 이용하여 셀카를 찍을 수 있습니다.'이고, 상기 표 1과 같은 사전 데이터베이스(111)에서는 '한식'에 속하는 개체명 단어가 '순두부, 청국장, 떡볶이'인 것으로 저장되어 있다. 따라서, 상기 제1 참조 문장들 중 '한식'에 속하는 개체명 단어를 포함하는 참조 문장들은 '고향에서 만든 순두부가 그립다., 청국장 냄새가 코를 자극한다.'이므로, 추가 학습 데이터 생성부(118)는 '고향에서 만든 순두부가 그립다., 청국장 냄새가 코를 자극한다.'를 상기 추가 학습 문장들로 선택할 수 있다.
그러고 나서, 추가 학습 데이터 생성부(118)는 참조 문장 저장부(112)로부터, '고향에서 만든 순두부가 그립다., 청국장 냄새가 코를 자극한다.' 각각에 대응되는 음성 데이터를 추출할 수 있다.
관련해서, 표 2와 같은 참조 문장 저장부(112)에서는, '고향에서 만든 순두부가 그립다.'에 대응되는 음성 데이터로 '음성 데이터 6'이 저장되어 있고, '청국장 냄새가 코를 자극한다.'에 대응되는 음성 데이터로 '음성 데이터 7'이 저장되어 있으므로, 추가 학습 데이터 생성부(118)는 참조 문장 저장부(112)로부터, '음성 데이터 6, 음성 데이터 7'을 추출할 수 있다.
그러고 나서, 추가 학습 데이터 생성부(118)는 '고향에서 만든 순두부가 그립다., 청국장 냄새가 코를 자극한다.'와 '음성 데이터 6, 음성 데이터 7'로 구성된 추가 학습 데이터를 하기의 표 5와 같이 생성할 수 있다.
추가 학습 문장들 | 음성 데이터 |
고향에서 만든 순두부가 그립다. | 음성 데이터 6 |
청국장 냄새가 코를 자극한다. | 음성 데이터 7 |
이때, 본 발명의 일실시예에 따르면, 카테고리 선택부(117)는 중요 도메인 저장부(119), 기준 개수 보정부(120) 및 선택부(121)를 포함할 수 있다.
먼저, 중요 도메인 저장부(119)에는 상기 복수의 도메인들 중 상기 기준 개수보다 많은 개수의 학습 문장들로 구성된 학습 데이터가 필요한 도메인인 것으로 사전 지정된 중요 도메인에 대한 정보가 저장되어 있다.
예컨대, 중요 도메인 저장부(119)에는 상기 복수의 도메인들 중 사전 지정된 중요 도메인이 '평서문'인 것으로 저장되어 있을 수 있다.
기준 개수 보정부(120)는 상기 제1 도메인이 상기 중요 도메인에 포함되는지 확인하여, 상기 제1 도메인이 상기 중요 도메인에 포함되는 것으로 확인되는 경우, 상기 기준 개수에 대해, 1 초과 2 미만의 값을 갖는 사전 설정된 보정치를 곱함으로써, 상기 기준 개수를 보정한다.
선택부(121)는 기준 개수 보정부(120)에 의해 상기 기준 개수가 보정되면, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수를 상기 보정된 기준 개수와 비교하여, 상기 학습 문장들의 개수가 상기 보정된 기준 개수 미만인 것으로 확인되는 경우, 연관도 정보 저장부(116)를 참조하여, 상기 복수의 카테고리들 중 상기 제1 카테고리와의 연관도가 가장 높은 상기 제2 카테고리를 선택한다.
이하에서는, 기준 개수 보정부(120) 및 선택부(121)의 동작을 예를 들어, 상세히 설명하기로 한다.
먼저, 전술한 예와 같이, 상기 제1 도메인을 '평서문'이라고 하고, 상기 기준 개수를 '5개'라고 하며, 사전 설정된 보정치를 '1.6'이라고 가정하자.
이때, 중요 도메인 저장부(119)에는 상기 중요 도메인이 '평서문'인 것으로 저장되어 있으므로, 기준 개수 보정부(120)는 상기 제1 도메인인 '평서문'이 상기 중요 도메인에 포함되는 것으로 확인할 수 있다.
그러면, 기준 개수 보정부(120)는 상기 기준 개수인 '5개'에 대해, 상기 보정치인 '1.6'을 곱함으로써, 상기 기준 개수를 '8개'와 같이 보정할 수 있다.
이때, 전술한 예와 같이, 상기 학습 데이터가 상기 표 3과 같다고 하는 경우, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수는 '3개'이므로, 선택부(121)는 상기 학습 문장들의 개수가 상기 보정된 기준 개수 미만인 것으로 확인할 수 있다.
그러면, 선택부(121)는 상기 표 4와 같은 연관도 정보 저장부(116)를 참조하여, 상기 복수의 카테고리들 중 '양식'과의 연관도가 가장 높은 '한식'을 상기 제2 카테고리로 선택할 수 있다.
이렇게, 선택부(121)에 의해 '한식'이 상기 제2 카테고리로 선택되면, 추가 학습 데이터 생성부(118)는 상기 제1 참조 문장들 중 '한식'에 속하는 개체명 단어를 포함하는 참조 문장들을 추가 학습 문장들로 선택한 후, 참조 문장 저장부(112)로부터, 상기 추가 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 추가 학습 문장들과 상기 추가 학습 문장들 각각에 대응되는 음성 데이터로 구성된 추가 학습 데이터를 생성할 수 있다.
이를 통해, 전자 장치(110)는 상기 복수의 도메인들 중 상기 중요 도메인으로 지정된 도메인에 대해서는, 사용자(130)가 상기 기준 개수보다 많은 개수의 학습 문장들로 구성된 학습 데이터를 활용하여, 보다 정확도 높은 음성 인식 모델을 구축할 수 있도록 지원할 수 있다.
또한, 본 발명의 일실시예에 따르면, 전자 장치(110)는 유사도 연산부(122), 학습 문장 선택부(123) 및 제외 처리부(124)를 더 포함할 수 있다.
먼저, 유사도 연산부(122)는 학습 데이터 생성부(115)에 의해 상기 학습 데이터가 생성된 이후, 사용자(130)로부터, 상기 학습 데이터를 구성하는 상기 학습 문장들 중 어느 하나의 제1 학습 문장과 상기 제1 학습 문장에 대응되는 음성 데이터를 상기 학습 데이터에서 제외하기 위한 학습 데이터 제외 명령이 인가되면, 하기의 수학식 1에 따라, 상기 학습 문장들 중 상기 제1 학습 문장을 제외한 나머지 학습 문장들 각각에 대해, 상기 제1 학습 문장과의 유사도를 연산한다.
여기서, 는 상기 나머지 학습 문장들 중 i번째 학습 문장과 상기 제1 학습 문장 간의 유사도로, 는 상기 i번째 학습 문장과 상기 제1 학습 문장 간의 최장 공통 부분 수열(Longest Common Subsequence: LCS)의 길이를 의미하고, K는 상기 제1 학습 문장의 글자 수를 의미한다.
이때, 상기 최장 공통 부분 수열이란 두 개의 문자열에서 일치하는 연속된 문자열을 의미한다. 관련해서, 두 개의 문자열을 각각 'ACAYKP, CAPCAK'라고 하는 경우, 상기 두 개의 문자열 간의 최장 공통 부분 수열은 'ACAK'이므로, 상기 두 개의 문자열 간의 최장 공통 부분 수열의 길이는 '4'이다.
학습 문장 선택부(123)는 유사도 연산부(122)에 의해 상기 나머지 학습 문장들 각각에 대한 상기 제1 학습 문장과의 유사도가 연산되면, 상기 나머지 학습 문장들 중 상기 제1 학습 문장과의 유사도가 사전 설정된 기준 유사도를 초과하는 값으로 연산된 유사 학습 문장들을 제2 학습 문장들로 선택한다.
제외 처리부(124)는 학습 문장 선택부(123)에 의해 상기 제2 학습 문장들이 선택되면, 상기 학습 데이터에서, 상기 제1 학습 문장과 상기 제1 학습 문장에 대응되는 음성 데이터를 제외 처리하고, 상기 제2 학습 문장들과 상기 제2 학습 문장들에 대응되는 음성 데이터를 추가로 제외 처리한다.
이하에서는, 유사도 연산부(122), 학습 문장 선택부(123) 및 제외 처리부(124)의 동작을 예를 들어, 상세히 설명하기로 한다.
먼저, 전술한 예와 같이, 학습 데이터 생성부(115)에 의해 상기 학습 데이터가 상기 표 3과 같이 생성되었다고 하고, 그 이후, 사용자(130)로부터, '비 오는 일요일에는 스파게티가 먹고 싶어요.'와 '음성 데이터 3'을 상기 학습 데이터에서 제외하기 위한 학습 데이터 제외 명령이 인가되었다고 가정하자.
그러면, 유사도 연산부(122)는 상기 수학식 1에 따라, '피자는 지역마다 요리하는 방법이 다릅니다., 그곳에 가면 맛있는 스파게티를 먹을 수 있어요.' 각각에 대해, '비 오는 일요일에는 스파게티가 먹고 싶어요.'와의 유사도를 연산할 수 있다.
이때, 유사도 연산부(122)에 의해, '피자는 지역마다 요리하는 방법이 다릅니다.'와 '비 오는 일요일에는 스파게티가 먹고 싶어요.' 간의 유사도는 사전 설정된 기준 유사도를 초과하지 않는 값으로 연산되었고, '그곳에 가면 맛있는 스파게티를 먹을 수 있어요.'와 '비 오는 일요일에는 스파게티가 먹고 싶어요.' 간의 유사도는 상기 기준 유사도를 초과하는 값으로 연산되었다고 가정하자.
그러면, 학습 문장 선택부(123)는 '그곳에 가면 맛있는 스파게티를 먹을 수 있어요.'를 제2 학습 문장으로 선택할 수 있다.
이렇게, 학습 문장 선택부(123)에 의해 '그곳에 가면 맛있는 스파게티를 먹을 수 있어요.'가 제2 학습 문장으로 선택되면, 제외 처리부(124)는 상기 학습 데이터에서, '비 오는 일요일에는 스파게티가 먹고 싶어요.'와 '음성 데이터 3'을 제외 처리하고, '그곳에 가면 맛있는 스파게티를 먹을 수 있어요.'와 '음성 데이터 4'를 추가로 제외 처리할 수 있다.
또한, 본 발명의 일실시예에 따르면, 전자 장치(110)는 신규 참조 문장 지정부(125) 및 갱신부(126)를 더 포함할 수 있다.
먼저, 신규 참조 문장 지정부(125)는 학습 데이터 생성부(115)에 의해 상기 학습 데이터가 생성된 이후, 사용자(130)로부터, 상기 복수의 개체명 단어들 중 어느 하나의 개체명 단어가 포함된 제1 문장, 상기 제1 문장이 속하는 제1 도메인에 대한 정보 및 상기 제1 문장에 대응되는 제1 음성 데이터가 수신되면서, 상기 제1 문장을 상기 복수의 참조 문장들에 추가하기 위한 참조 문장 추가 명령이 인가되면, 상기 제1 문장을 신규 참조 문장으로 지정한다.
갱신부(126)는 신규 참조 문장 지정부(125)에 의해 상기 제1 문장이 신규 참조 문장으로 지정되면, 상기 제1 문장을 상기 제1 도메인에 대한 정보 및 상기 제1 음성 데이터와 서로 대응시켜 참조 문장 저장부(112)에 신규 저장함으로써, 참조 문장 저장부(112)를 갱신한다.
이하에서는, 신규 참조 문장 지정부(125) 및 갱신부(126)의 동작을 예를 들어, 상세히 설명하기로 한다.
먼저, 학습 데이터 생성부(115)에 의해 상기 학습 데이터가 상기 표 3과 같이 생성되었다고 하고, 그 이후, 사용자(130)로부터 '제 생일에는 꼭 맛있는 케이크를 먹고 싶습니다.'라는 제1 문장과 '평서문' 및 상기 제1 문장에 대응되는 음성 데이터인 '음성 데이터 12'가 수신되면서, '제 생일에는 꼭 맛있는 케이크를 먹고 싶습니다.'를 상기 복수의 참조 문장들에 추가하기 위한 참조 문장 추가 명령이 인가되었다고 가정하자.
그러면, 신규 참조 문장 지정부(125)는 '제 생일에는 꼭 맛있는 케이크를 먹고 싶습니다.'를 신규 참조 문장으로 지정할 수 있다.
이렇게, 신규 참조 문장 지정부(125)에 의해 '제 생일에는 꼭 맛있는 케이크를 먹고 싶습니다.'가 신규 참조 문장으로 지정되면, 갱신부(126)는 '제 생일에는 꼭 맛있는 케이크를 먹고 싶습니다.'를 '평서문' 및 '음성 데이터 12'와 서로 대응시켜 참조 문장 저장부(112)에 신규 저장함으로써, 참조 문장 저장부(112)를 갱신할 수 있다.
이러한 방식으로, 참조 문장 저장부(112)가 갱신된 이후, 사용자(130)로부터 학습 데이터 생성 명령이 새롭게 인가되면, 전자 장치(110)는 '제 생일에는 꼭 맛있는 케이크를 먹고 싶습니다.'가 포함되어 있는 참조 문장들을 기초로 새로운 학습 데이터를 생성할 수 있을 것이다.
도 2는 본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법을 도시한 순서도이다.
단계(S210)에서는 복수의 개체명 단어들(상기 복수의 개체명 단어들은 개체의 명칭을 지칭하는 단어들을 의미함)과, 상기 복수의 개체명 단어들 각각이 속하는 카테고리에 대한 정보 (상기 카테고리에 대한 정보는 사전 설정된 복수의 카테고리들 중 상기 복수의 개체명 단어들 각각이 속하는 것으로 사전 분류된 카테고리에 대한 정보를 의미함)가 저장되어 있는 사전 데이터베이스를 유지한다.
단계(S220)에서는 상기 복수의 개체명 단어들 중 적어도 어느 하나의 개체명 단어를 포함하는 복수의 참조 문장들과, 상기 복수의 참조 문장들 각각이 속하는 도메인에 대한 정보(상기 도메인에 대한 정보는 문장의 종류와 관련된 사전 설정된 복수의 도메인들 중 상기 복수의 참조 문장들 각각이 속하는 것으로 사전 분류된 도메인에 대한 정보를 의미함)및 상기 복수의 참조 문장들 각각에 대응되는 음성 데이터가 서로 대응되어 저장되어 있는 참조 문장 저장부를 유지한다.
단계(S230)에서는 사용자로부터 상기 복수의 개체명 단어들 중 어느 하나인 제1 개체명 단어, 상기 복수의 도메인들 중 어느 하나인 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 인가되면, 상기 사전 데이터베이스를 참조하여, 상기 제1 개체명 단어가 속하는 제1 카테고리를 확인한다.
단계(S240)에서는 상기 제1 카테고리가 확인되면, 상기 참조 문장 저장부를 참조하여, 상기 제1 도메인에 속하는 것으로 분류된 참조 문장들 중 상기 제1 글자 수 이하의 글자 수를 가지는 제1 참조 문장들을 선택한다.
단계(S250)에서는 상기 제1 참조 문장들이 선택되면, 상기 제1 참조 문장들 중 상기 제1 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 학습 문장들로 선택한 후, 상기 참조 문장 저장부로부터, 상기 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 학습 문장들과 상기 학습 문장들 각각에 대응되는 음성 데이터로 구성된 학습 데이터를 생성한다.
이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 복수의 카테고리들 간의 사전 설정된 연관도에 대한 정보가 저장되어 있는 연관도 정보 저장부를 유지하는 단계, 단계(S250)에서 상기 학습 데이터가 생성되면, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수를 사전 설정된 기준 개수와 비교하여, 상기 학습 문장들의 개수가 상기 기준 개수 미만인 경우, 상기 연관도 정보 저장부를 참조하여, 상기 복수의 카테고리들 중 상기 제1 카테고리와의 연관도가 가장 높은 제2 카테고리를 선택하는 단계 및 상기 제2 카테고리가 선택되면, 상기 제1 참조 문장들 중 상기 제2 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 추가 학습 문장들로 선택한 후, 상기 참조 문장 저장부로부터, 상기 추가 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 추가 학습 문장들과 상기 추가 학습 문장들 각각에 대응되는 음성 데이터로 구성된 추가 학습 데이터를 생성하는 단계를 더 포함할 수 있다.
이때, 본 발명의 일실시예에 따르면, 상기 제2 카테고리를 선택하는 단계는 상기 복수의 도메인들 중 상기 기준 개수보다 많은 개수의 학습 문장들로 구성된 학습 데이터가 필요한 도메인인 것으로 사전 지정된 중요 도메인에 대한 정보가 저장되어 있는 중요 도메인 정보 저장부를 유지하는 단계, 상기 제1 도메인이 상기 중요 도메인에 포함되는지 확인하여, 상기 제1 도메인이 상기 중요 도메인에 포함되는 것으로 확인되는 경우, 상기 기준 개수에 대해, 1 초과 2 미만의 값을 갖는 사전 설정된 보정치를 곱함으로써, 상기 기준 개수를 보정하는 단계 및 상기 기준 개수가 보정되면, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수를 상기 보정된 기준 개수와 비교하여, 상기 학습 문장들의 개수가 상기 보정된 기준 개수 미만인 것으로 확인되는 경우, 상기 연관도 정보 저장부를 참조하여, 상기 복수의 카테고리들 중 상기 제1 카테고리와의 연관도가 가장 높은 상기 제2 카테고리를 선택하는 단계를 포함할 수 있다.
또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 학습 데이터가 생성된 이후, 상기 사용자로부터, 상기 학습 데이터를 구성하는 상기 학습 문장들 중 어느 하나의 제1 학습 문장과 상기 제1 학습 문장에 대응되는 음성 데이터를 상기 학습 데이터에서 제외하기 위한 학습 데이터 제외 명령이 인가되면, 상기 수학식 1에 따라, 상기 학습 문장들 중 상기 제1 학습 문장을 제외한 나머지 학습 문장들 각각에 대해, 상기 제1 학습 문장과의 유사도를 연산하는 단계, 상기 나머지 학습 문장들 각각에 대한 상기 제1 학습 문장과의 유사도가 연산되면, 상기 나머지 학습 문장들 중 상기 제1 학습 문장과의 유사도가 사전 설정된 기준 유사도를 초과하는 값으로 연산된 유사 학습 문장들을 제2 학습 문장들로 선택하는 단계 및 상기 제2 학습 문장들이 선택되면, 상기 학습 데이터에서, 상기 제1 학습 문장과 상기 제1 학습 문장에 대응되는 음성 데이터를 제외 처리하고, 상기 제2 학습 문장들과 상기 제2 학습 문장들에 대응되는 음성 데이터를 추가로 제외 처리하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 학습 데이터가 생성된 이후, 상기 사용자로부터, 상기 복수의 개체명 단어들 중 어느 하나의 개체명 단어가 포함된 제1 문장, 상기 제1 문장이 속하는 제1 도메인에 대한 정보 및 상기 제1 문장에 대응되는 제1 음성 데이터가 수신되면서, 상기 제1 문장을 상기 복수의 참조 문장들에 추가하기 위한 참조 문장 추가 명령이 인가되면, 상기 제1 문장을 신규 참조 문장으로 지정하는 단계 및 상기 제1 문장이 신규 참조 문장으로 지정되면, 상기 제1 문장을 상기 제1 도메인에 대한 정보 및 상기 제1 음성 데이터와 서로 대응시켜 상기 참조 문장 저장부에 신규 저장함으로써, 상기 참조 문장 저장부를 갱신하는 단계를 더 포함할 수 있다.
이상, 도 2를 참조하여 본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 상기 전자 장치의 동작 방법은 도 1을 이용하여 설명한 전자 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.
본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.
또한, 본 발명의 일실시예에 따른 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
110: 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치
111: 사전 데이터베이스 112: 참조 문장 저장부
113: 카테고리 확인부 114: 참조 문장 선택부
115: 학습 데이터 생성부 116: 연관도 저장부
117: 카테고리 선택부 118: 추가 학습 데이터 생성부
119: 중요 도메인 정보 저장부 120: 기준 개수 보정부
121: 선택부 122: 유사도 연산부
123: 학습 문장 선택부 124: 제외 처리부
125: 신규 참조 문장 지정부 126: 갱신부
130: 사용자
111: 사전 데이터베이스 112: 참조 문장 저장부
113: 카테고리 확인부 114: 참조 문장 선택부
115: 학습 데이터 생성부 116: 연관도 저장부
117: 카테고리 선택부 118: 추가 학습 데이터 생성부
119: 중요 도메인 정보 저장부 120: 기준 개수 보정부
121: 선택부 122: 유사도 연산부
123: 학습 문장 선택부 124: 제외 처리부
125: 신규 참조 문장 지정부 126: 갱신부
130: 사용자
Claims (12)
- 복수의 개체명 단어들 - 상기 복수의 개체명 단어들은 개체의 명칭을 지칭하는 단어들을 의미함 - 과, 상기 복수의 개체명 단어들 각각이 속하는 카테고리에 대한 정보 - 상기 카테고리에 대한 정보는 사전 설정된 복수의 카테고리들 중 상기 복수의 개체명 단어들 각각이 속하는 것으로 사전 분류된 카테고리에 대한 정보를 의미함 - 가 저장되어 있는 사전 데이터베이스;
상기 복수의 개체명 단어들 중 적어도 어느 하나의 개체명 단어를 포함하는 복수의 참조 문장들과, 상기 복수의 참조 문장들 각각이 속하는 도메인에 대한 정보 - 상기 도메인에 대한 정보는 문장의 종류와 관련된 사전 설정된 복수의 도메인들 중 상기 복수의 참조 문장들 각각이 속하는 것으로 사전 분류된 도메인에 대한 정보를 의미함 - 및 상기 복수의 참조 문장들 각각에 대응되는 음성 데이터가 서로 대응되어 저장되어 있는 참조 문장 저장부;
사용자로부터 상기 복수의 개체명 단어들 중 어느 하나인 제1 개체명 단어, 상기 복수의 도메인들 중 어느 하나인 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 인가되면, 상기 사전 데이터베이스를 참조하여, 상기 제1 개체명 단어가 속하는 제1 카테고리를 확인하는 카테고리 확인부;
상기 제1 카테고리가 확인되면, 상기 참조 문장 저장부를 참조하여, 상기 제1 도메인에 속하는 것으로 분류된 참조 문장들 중 상기 제1 글자 수 이하의 글자 수를 가지는 제1 참조 문장들을 선택하는 참조 문장 선택부; 및
상기 제1 참조 문장들이 선택되면, 상기 제1 참조 문장들 중 상기 제1 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 학습 문장들로 선택한 후, 상기 참조 문장 저장부로부터, 상기 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 학습 문장들과 상기 학습 문장들 각각에 대응되는 음성 데이터로 구성된 학습 데이터를 생성하는 학습 데이터 생성부
를 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치. - 제1항에 있어서,
상기 복수의 카테고리들 간의 사전 설정된 연관도에 대한 정보가 저장되어 있는 연관도 정보 저장부;
상기 학습 데이터 생성부에 의해 상기 학습 데이터가 생성되면, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수를 사전 설정된 기준 개수와 비교하여, 상기 학습 문장들의 개수가 상기 기준 개수 미만인 경우, 상기 연관도 정보 저장부를 참조하여, 상기 복수의 카테고리들 중 상기 제1 카테고리와의 연관도가 가장 높은 제2 카테고리를 선택하는 카테고리 선택부; 및
상기 제2 카테고리가 선택되면, 상기 제1 참조 문장들 중 상기 제2 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 추가 학습 문장들로 선택한 후, 상기 참조 문장 저장부로부터, 상기 추가 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 추가 학습 문장들과 상기 추가 학습 문장들 각각에 대응되는 음성 데이터로 구성된 추가 학습 데이터를 생성하는 추가 학습 데이터 생성부
를 더 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치. - 제2항에 있어서,
상기 카테고리 선택부는
상기 복수의 도메인들 중 상기 기준 개수보다 많은 개수의 학습 문장들로 구성된 학습 데이터가 필요한 도메인인 것으로 사전 지정된 중요 도메인에 대한 정보가 저장되어 있는 중요 도메인 정보 저장부;
상기 제1 도메인이 상기 중요 도메인에 포함되는지 확인하여, 상기 제1 도메인이 상기 중요 도메인에 포함되는 것으로 확인되는 경우, 상기 기준 개수에 대해, 1 초과 2 미만의 값을 갖는 사전 설정된 보정치를 곱함으로써, 상기 기준 개수를 보정하는 기준 개수 보정부; 및
상기 기준 개수가 보정되면, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수를 상기 보정된 기준 개수와 비교하여, 상기 학습 문장들의 개수가 상기 보정된 기준 개수 미만인 것으로 확인되는 경우, 상기 연관도 정보 저장부를 참조하여, 상기 복수의 카테고리들 중 상기 제1 카테고리와의 연관도가 가장 높은 상기 제2 카테고리를 선택하는 선택부
를 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치. - 제1항에 있어서,
상기 학습 데이터가 생성된 이후, 상기 사용자로부터, 상기 학습 데이터를 구성하는 상기 학습 문장들 중 어느 하나의 제1 학습 문장과 상기 제1 학습 문장에 대응되는 음성 데이터를 상기 학습 데이터에서 제외하기 위한 학습 데이터 제외 명령이 인가되면, 하기의 수학식 1에 따라, 상기 학습 문장들 중 상기 제1 학습 문장을 제외한 나머지 학습 문장들 각각에 대해, 상기 제1 학습 문장과의 유사도를 연산하는 유사도 연산부;
상기 나머지 학습 문장들 각각에 대한 상기 제1 학습 문장과의 유사도가 연산되면, 상기 나머지 학습 문장들 중 상기 제1 학습 문장과의 유사도가 사전 설정된 기준 유사도를 초과하는 값으로 연산된 유사 학습 문장들을 제2 학습 문장들로 선택하는 학습 문장 선택부; 및
상기 제2 학습 문장들이 선택되면, 상기 학습 데이터에서, 상기 제1 학습 문장과 상기 제1 학습 문장에 대응되는 음성 데이터를 제외 처리하고, 상기 제2 학습 문장들과 상기 제2 학습 문장들에 대응되는 음성 데이터를 추가로 제외 처리하는 제외 처리부
를 더 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치.
[수학식 1]
여기서, 는 상기 나머지 학습 문장들 중 i번째 학습 문장과 상기 제1 학습 문장 간의 유사도로, 는 상기 i번째 학습 문장과 상기 제1 학습 문장 간의 최장 공통 부분 수열(Longest Common Subsequence: LCS)의 길이를 의미하고, K는 상기 제1 학습 문장의 글자 수를 의미함. - 제1항에 있어서,
상기 학습 데이터가 생성된 이후, 상기 사용자로부터, 상기 복수의 개체명 단어들 중 어느 하나의 개체명 단어가 포함된 제1 문장, 상기 제1 문장이 속하는 제1 도메인에 대한 정보 및 상기 제1 문장에 대응되는 제1 음성 데이터가 수신되면서, 상기 제1 문장을 상기 복수의 참조 문장들에 추가하기 위한 참조 문장 추가 명령이 인가되면, 상기 제1 문장을 신규 참조 문장으로 지정하는 신규 참조 문장 지정부; 및
상기 제1 문장이 신규 참조 문장으로 지정되면, 상기 제1 문장을 상기 제1 도메인에 대한 정보 및 상기 제1 음성 데이터와 서로 대응시켜 상기 참조 문장 저장부에 신규 저장함으로써, 상기 참조 문장 저장부를 갱신하는 갱신부
를 더 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치. - 복수의 개체명 단어들 - 상기 복수의 개체명 단어들은 개체의 명칭을 지칭하는 단어들을 의미함 - 과, 상기 복수의 개체명 단어들 각각이 속하는 카테고리에 대한 정보 - 상기 카테고리에 대한 정보는 사전 설정된 복수의 카테고리들 중 상기 복수의 개체명 단어들 각각이 속하는 것으로 사전 분류된 카테고리에 대한 정보를 의미함 - 가 저장되어 있는 사전 데이터베이스를 유지하는 단계;
상기 복수의 개체명 단어들 중 적어도 어느 하나의 개체명 단어를 포함하는 복수의 참조 문장들과, 상기 복수의 참조 문장들 각각이 속하는 도메인에 대한 정보 - 상기 도메인에 대한 정보는 문장의 종류와 관련된 사전 설정된 복수의 도메인들 중 상기 복수의 참조 문장들 각각이 속하는 것으로 사전 분류된 도메인에 대한 정보를 의미함 - 및 상기 복수의 참조 문장들 각각에 대응되는 음성 데이터가 서로 대응되어 저장되어 있는 참조 문장 저장부를 유지하는 단계;
사용자로부터 상기 복수의 개체명 단어들 중 어느 하나인 제1 개체명 단어, 상기 복수의 도메인들 중 어느 하나인 제1 도메인에 대한 정보 및 제1 글자수에 대한 정보가 수신되면서, 음성 인식 모델 구축을 위한 학습 데이터 생성 명령이 인가되면, 상기 사전 데이터베이스를 참조하여, 상기 제1 개체명 단어가 속하는 제1 카테고리를 확인하는 단계;
상기 제1 카테고리가 확인되면, 상기 참조 문장 저장부를 참조하여, 상기 제1 도메인에 속하는 것으로 분류된 참조 문장들 중 상기 제1 글자 수 이하의 글자 수를 가지는 제1 참조 문장들을 선택하는 단계; 및
상기 제1 참조 문장들이 선택되면, 상기 제1 참조 문장들 중 상기 제1 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 학습 문장들로 선택한 후, 상기 참조 문장 저장부로부터, 상기 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 학습 문장들과 상기 학습 문장들 각각에 대응되는 음성 데이터로 구성된 학습 데이터를 생성하는 단계
를 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법. - 제6항에 있어서,
상기 복수의 카테고리들 간의 사전 설정된 연관도에 대한 정보가 저장되어 있는 연관도 정보 저장부를 유지하는 단계;
상기 학습 데이터를 생성하는 단계에서 상기 학습 데이터가 생성되면, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수를 사전 설정된 기준 개수와 비교하여, 상기 학습 문장들의 개수가 상기 기준 개수 미만인 경우, 상기 연관도 정보 저장부를 참조하여, 상기 복수의 카테고리들 중 상기 제1 카테고리와의 연관도가 가장 높은 제2 카테고리를 선택하는 단계; 및
상기 제2 카테고리가 선택되면, 상기 제1 참조 문장들 중 상기 제2 카테고리에 속하는 개체명 단어를 포함하는 참조 문장들을 추가 학습 문장들로 선택한 후, 상기 참조 문장 저장부로부터, 상기 추가 학습 문장들 각각에 대응되는 음성 데이터를 추출하여, 상기 추가 학습 문장들과 상기 추가 학습 문장들 각각에 대응되는 음성 데이터로 구성된 추가 학습 데이터를 생성하는 단계
를 더 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법. - 제7항에 있어서,
상기 제2 카테고리를 선택하는 단계는
상기 복수의 도메인들 중 상기 기준 개수보다 많은 개수의 학습 문장들로 구성된 학습 데이터가 필요한 도메인인 것으로 사전 지정된 중요 도메인에 대한 정보가 저장되어 있는 중요 도메인 정보 저장부를 유지하는 단계;
상기 제1 도메인이 상기 중요 도메인에 포함되는지 확인하여, 상기 제1 도메인이 상기 중요 도메인에 포함되는 것으로 확인되는 경우, 상기 기준 개수에 대해, 1 초과 2 미만의 값을 갖는 사전 설정된 보정치를 곱함으로써, 상기 기준 개수를 보정하는 단계; 및
상기 기준 개수가 보정되면, 상기 학습 데이터를 구성하는 상기 학습 문장들의 개수를 상기 보정된 기준 개수와 비교하여, 상기 학습 문장들의 개수가 상기 보정된 기준 개수 미만인 것으로 확인되는 경우, 상기 연관도 정보 저장부를 참조하여, 상기 복수의 카테고리들 중 상기 제1 카테고리와의 연관도가 가장 높은 상기 제2 카테고리를 선택하는 단계
를 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법. - 제6항에 있어서,
상기 학습 데이터가 생성된 이후, 상기 사용자로부터, 상기 학습 데이터를 구성하는 상기 학습 문장들 중 어느 하나의 제1 학습 문장과 상기 제1 학습 문장에 대응되는 음성 데이터를 상기 학습 데이터에서 제외하기 위한 학습 데이터 제외 명령이 인가되면, 하기의 수학식 1에 따라, 상기 학습 문장들 중 상기 제1 학습 문장을 제외한 나머지 학습 문장들 각각에 대해, 상기 제1 학습 문장과의 유사도를 연산하는 단계;
상기 나머지 학습 문장들 각각에 대한 상기 제1 학습 문장과의 유사도가 연산되면, 상기 나머지 학습 문장들 중 상기 제1 학습 문장과의 유사도가 사전 설정된 기준 유사도를 초과하는 값으로 연산된 유사 학습 문장들을 제2 학습 문장들로 선택하는 단계; 및
상기 제2 학습 문장들이 선택되면, 상기 학습 데이터에서, 상기 제1 학습 문장과 상기 제1 학습 문장에 대응되는 음성 데이터를 제외 처리하고, 상기 제2 학습 문장들과 상기 제2 학습 문장들에 대응되는 음성 데이터를 추가로 제외 처리하는 단계
를 더 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법.
[수학식 1]
여기서, 는 상기 나머지 학습 문장들 중 i번째 학습 문장과 상기 제1 학습 문장 간의 유사도로, 는 상기 i번째 학습 문장과 상기 제1 학습 문장 간의 최장 공통 부분 수열(Longest Common Subsequence: LCS)의 길이를 의미하고, K는 상기 제1 학습 문장의 글자 수를 의미함. - 제6항에 있어서,
상기 학습 데이터가 생성된 이후, 상기 사용자로부터, 상기 복수의 개체명 단어들 중 어느 하나의 개체명 단어가 포함된 제1 문장, 상기 제1 문장이 속하는 제1 도메인에 대한 정보 및 상기 제1 문장에 대응되는 제1 음성 데이터가 수신되면서, 상기 제1 문장을 상기 복수의 참조 문장들에 추가하기 위한 참조 문장 추가 명령이 인가되면, 상기 제1 문장을 신규 참조 문장으로 지정하는 단계; 및
상기 제1 문장이 신규 참조 문장으로 지정되면, 상기 제1 문장을 상기 제1 도메인에 대한 정보 및 상기 제1 음성 데이터와 서로 대응시켜 상기 참조 문장 저장부에 신규 저장함으로써, 상기 참조 문장 저장부를 갱신하는 단계
를 더 포함하는 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치의 동작 방법. - 제6항 내지 제10항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
- 제6항 내지 제10항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200181614A KR102395700B1 (ko) | 2020-12-23 | 2020-12-23 | 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200181614A KR102395700B1 (ko) | 2020-12-23 | 2020-12-23 | 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102395700B1 true KR102395700B1 (ko) | 2022-05-09 |
Family
ID=81582676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200181614A KR102395700B1 (ko) | 2020-12-23 | 2020-12-23 | 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102395700B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190002812A (ko) * | 2017-06-30 | 2019-01-09 | 삼성에스디에스 주식회사 | 음성 인식 방법 및 그 장치 |
KR20200074603A (ko) * | 2018-12-17 | 2020-06-25 | 주식회사 한글과컴퓨터 | 신규 개체명 단어에 연관된 말뭉치 생성을 위한 문장 자동 생성 장치 및 그 동작 방법 |
-
2020
- 2020-12-23 KR KR1020200181614A patent/KR102395700B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190002812A (ko) * | 2017-06-30 | 2019-01-09 | 삼성에스디에스 주식회사 | 음성 인식 방법 및 그 장치 |
KR20200074603A (ko) * | 2018-12-17 | 2020-06-25 | 주식회사 한글과컴퓨터 | 신규 개체명 단어에 연관된 말뭉치 생성을 위한 문장 자동 생성 장치 및 그 동작 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10061769B2 (en) | Machine translation method for performing translation between languages | |
US6188976B1 (en) | Apparatus and method for building domain-specific language models | |
JP5377889B2 (ja) | 言語処理装置およびプログラム | |
US6510412B1 (en) | Method and apparatus for information processing, and medium for provision of information | |
US5715469A (en) | Method and apparatus for detecting error strings in a text | |
US20140019115A1 (en) | Multi-mode input method editor | |
TWI610294B (zh) | 語音辨識系統及其方法、詞彙建立方法與電腦程式產品 | |
CN111462751B (zh) | 解码语音数据的方法、装置、计算机设备和存储介质 | |
US20150169537A1 (en) | Using statistical language models to improve text input | |
KR20040068319A (ko) | 콘텐트 변환 방법 및 장치 | |
KR102168319B1 (ko) | 신규 개체명 단어에 연관된 말뭉치 생성을 위한 문장 자동 생성 장치 및 그 동작 방법 | |
JP2022047291A (ja) | 情報処理装置、方法、及びプログラム | |
KR20200014047A (ko) | 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램 | |
KR20200030354A (ko) | 사용자 정의 단어에 기초하여 음성 인식 결과의 보정 처리를 수행하는 음성 인식 처리 장치 및 그 동작 방법 | |
KR102523807B1 (ko) | 사용자 입력 조건에 기초하여 기계 번역 엔진의 구축에 사용될 학습용 문장 세트를 생성하는 학습용 문장 세트 생성 서버 및 그 동작 방법 | |
KR102395700B1 (ko) | 사용자 입력 조건에 기초하여 음성 인식 모델 구축에 사용될 학습 데이터를 생성하는 전자 장치 및 그 동작 방법 | |
US7487081B2 (en) | Sentence creation apparatus and creation method | |
KR20200074624A (ko) | 도메인 기반의 음성 인식 모델의 최적화가 가능한 음성 인식 장치 및 그 동작 방법 | |
KR102589350B1 (ko) | 소스코드 보안 취약점의 종류를 구별하는 인공지능 기반의 구별 모델의 생성을 통해 소스코드에 대한 보안 취약점의 종류를 확인할 수 있도록 지원하는 전자 장치 및 그 동작 방법 | |
KR102375572B1 (ko) | 기계 번역 모델 생성에 사용할 학습 문장을 자동으로 생성하는 전자 단말 장치 및 그 동작 방법 | |
KR102287167B1 (ko) | 번역 엔진에 미포함된 신규 개체명에 대한 번역 기능을 제공하기 위한 번역 처리 장치 및 그 동작 방법 | |
KR101982490B1 (ko) | 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치 | |
KR102523767B1 (ko) | Bleu 스코어를 기초로 유사 문장에 대한 검색을 수행하는 전자 장치 및 그 동작 방법 | |
WO2023073886A1 (ja) | 情報処理システム、情報処理装置、情報処理方法、及び記録媒体 | |
KR102528849B1 (ko) | 인공지능 기반의 소스코드 보안 취약점 판단 모델의 생성을 통해 소스코드에 대한 보안 취약점 판단을 가능하게 하는 전자 장치 및 그 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |