KR20170061016A - 데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치 - Google Patents

데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치 Download PDF

Info

Publication number
KR20170061016A
KR20170061016A KR1020150165891A KR20150165891A KR20170061016A KR 20170061016 A KR20170061016 A KR 20170061016A KR 1020150165891 A KR1020150165891 A KR 1020150165891A KR 20150165891 A KR20150165891 A KR 20150165891A KR 20170061016 A KR20170061016 A KR 20170061016A
Authority
KR
South Korea
Prior art keywords
data
recognition model
model
recognition
learning
Prior art date
Application number
KR1020150165891A
Other languages
English (en)
Other versions
KR102601848B1 (ko
Inventor
이호식
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020150165891A priority Critical patent/KR102601848B1/ko
Priority to US15/332,166 priority patent/US10475442B2/en
Publication of KR20170061016A publication Critical patent/KR20170061016A/ko
Application granted granted Critical
Publication of KR102601848B1 publication Critical patent/KR102601848B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G06K9/62
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0635Training updating or merging of old and new templates; Mean values; Weighting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Forklifts And Lifting Vehicles (AREA)

Abstract

데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치를 개시한다. 일 양상에 따르면, 데이터 인식 모델 구축 장치는 추가 학습데이터를 이용한 데이터 인식 모델 구축 장치에 있어서, 추가 학습데이터를 입력받는 학습데이터 입력부, 추가 학습데이터가 입력되면, 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델을 추가 학습데이터로 학습시키는 모델 학습부 및 학습에 따라 생성된 제2 인식 모델을 제1 인식 모델과 통합하여 최종 인식 모델을 구축하는 모델 구축부를 포함할 수 있다.

Description

데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치{DEVICE AND METHOD OF DATA RECOGNITION MODEL CONSTRUCTION, AND DATA RECOGNITION DEVICCE}
추가 학습데이터를 이용하여 데이터 인식 모델을 구축하는 장치 및 방법과 데이터 인식 장치와 관련된다.
컴퓨터, 스마트폰 등의 정보기기의 보급으로 인하여 디지털컴퓨터의 응용 및 디지털신호처리 기술이 발전하게 되었다. 그 중 신경회로망을 이용하는 정보처리는 네트워크 메커니즘에 의한 병렬처리 분산형의 정보처리를 할 수 있다. 이러한 병렬처리 분산형의 정보처리는 단순한 많은 정보처리요소가 조합되어서 간단한 신호를 주고받고 하는 것과 같은 형태의 네트워크 상의 메커니즘을 사용한 정보처리라 할 수 있다. 이러한 네트워크 메커니즘에 의한 정보처리로서 인간의 뇌 구조를 컴퓨터상에서 모의하는 신경회로망에 의한 정보처리가 여러 방면에서 활발히 연구되고 있다.
일반적으로 대용량 데이터로 학습된 모델을 추가된 데이터로 학습하기 위해서는 기존의 학습데이터 및 추가 학습데이터를 합한 데이터 전체를 통하여 학습하는 방법이 사용되었다. 하지만 이와 같은 방법은 데이터의 양이 늘어나고 기존의 학습데이터가 대용량일 경우 시간이 많이 증가하게 된다.
추가 학습데이터를 반영하여 각종 데이터를 인식하는 모델을 구축하는 데이터 인식 모델 구축 장치 및 방법과 그 데이터 인식 장치를 제시한다.
일 실시예에 따르면 추가 학습데이터를 이용한 데이터 인식 모델 구축 장치는 추가 학습데이터를 입력받는 학습데이터 입력부, 추가 학습데이터가 입력되면 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델을 추가 학습데이터로 학습시키는 모델 학습부 및 학습에 따라 생성된 제2 인식 모델을 제1 인식 모델과 통합하여 최종 인식 모델을 구축하는 모델 구축부를 포함할 수 있다.
기본 학습데이터 및 추가 학습데이터는 음성 데이터, 영상 데이터, 텍스트 데이터 및 생체신호 데이터 중의 적어도 하나를 포함할 수 있다.
제1 인식 모델은 신경망(Neural Network)을 기반으로 할 수 있다.
모델 학습부는 오류 역전파법(error back-propagation) 및 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 중의 적어도 하나를 이용하여 제1 인식 모델을 학습시킬 수 있다.
데이터 인식 모델 구축 장치는 하나 이상의 기본 학습데이터로 미리 학습되어 구축이 된 하나 이상의 제1 인식 모델을 저장하는 모델 저장부를 더 포함할 수 있다.
모델 학습부는 추가 학습데이터가 입력되면, 모델 저장부로부터 입력된 추가 학습데이터와 관련된 제1 인식 모델을 획득할 수 있다.
모델 구축부는 제1 인식 모델 및 제2 인식 모델을 선형 합산(linear sum)하여 통합할 수 있다.
모델 구축부는 미리 설정된 가중치 후보군에서 하나 이상의 가중치를 선택하고, 선택된 가중치를 부여하여 선형 합산함으로써 각 가중치별로 하나 이상의 인식 모델을 생성하고, 상기 생성된 하나 이상의 인식 모델 중의 적어도 하나를 최종 인식 모델로 결정할 수 있다.
이때, 가중치는 기본 학습데이터 및 추가 학습데이터 간의 개수의 차이, 추가 학습의 목적 및 추가 학습의 중요도 중의 적어도 하나에 기초하여 미리 설정될 수 있다.
모델 평가부는 최종 인식 모델이 구축되면, 평가 데이터를 이용하여 구축된 최종 인식 모델을 평가할 수 있다.
모델 학습부는 평가 결과 최종 인식 모델이 소정 기준을 만족하지 못하면, 최종 인식 모델을 추가 학습데이터로 재학습시킬 수 있다.
일 양상에 따르면, 추가 학습데이터를 이용한 데이터 인식 모델 구축 방법은 학습데이터를 입력받는 단계, 추가 학습데이터가 입력되면, 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델을 추가 학습데이터로 학습시키는 단계 및 학습에 따라 생성된 제2 인식 모델을 제1 인식 모델과 통합하여 최종 인식 모델을 구축하는 단계를 포함할 수 있다.
데이터 인식 모델 구축 방법의 제1 인식 모델은 신경망(Neural Network)을 기반으로 할 수 있다.
제1 인식 모델을 학습시키는 단계는 추가 학습데이터가 입력되면, 모델 저장부로부터 입력된 추가 학습데이터와 관련된 제1 인식 모델을 획득하는 단계를 포함할 수 있다.
최종 인식 모델을 구축하는 단계는 제1 인식 모델과 제2 인식 모델을 선형 합산(linear sum)하여 통합할 수 있다.
최종 인식 모델을 구축하는 단계는 미리 설정된 가중치 후보군에서 하나 이상의 가중치를 선택하고, 선택된 가중치를 부여하여 선형 합산함으로써 각 가중치별로 하나 이상의 인식 모델을 생성하고, 상기 생성된 하나 이상의 인식 모델 중의 적어도 하나를 최종 인식 모델로 결정할 수 있다.
데이터 인식 모델 구축 방법은 최종 인식 모델이 구축되면, 평가 데이터를 이용하여 구축된 최종 인식 모델을 평가하는 단계를 더 포함할 수 있다.
모델을 학습시키는 단계는 평가 결과 최종 인식 모델이 소정 기준을 만족하지 못하면, 최종 인식 모델을 추가 학습데이터로 재학습시킬 수 있다.
일 양상에 따르면, 데이터 인식 장치는 사용자로부터 인식할 데이터를 입력 받는 인식데이터 입력부, 인식할 데이터를 기초로, 미리 구축된 인식 모델의 갱신 여부를 판단하는 모델 갱신 판단부, 판단 결과 갱신이 필요하면, 추가 학습데이터를 이용하여 인식 모델을 학습시키고 학습 결과를 기초로 인식 모델을 갱신하는 모델 갱신부 및 판단 결과에 따라 미리 구축된 인식 모델 또는 갱신된 인식 모델을 이용하여 인식할 데이터를 인식하는 데이터 인식부를 포함할 수 있다.
갱신 판단부는 미리 구축된 인식 모델의 학습에 이용된 기본 학습데이터와 인식할 데이터와의 관련성 및 미리 구축된 인식 모델을 이용하여 데이터 인식부에 의해 인식된 결과의 정확도 중의 적어도 하나를 기초로 갱신 여부를 판단할 수 있다.
데이터 인식 장치는 판단 결과 갱신이 필요하면, 사용자로부터 인식할 데이터와 관련된 추가 학습데이터를 입력받는 추가 학습데이터 입력부를 더 포함할 수 있다.
모델 갱신부는 미리 구축된 인식 모델의 학습 결과 생성된 인식 모델을 미리 구축된 인식 모델과 가중치를 부여한 선형 합산(linear sum)을 하여, 선형 합산 결과를 기초로 미리 구축된 인식 모델을 갱신할 수 있다.
모델 갱신부에서의 선형 합산은 미리 구축된 인식 모델과 학습 결과 생성된 인식 모델에 가중치를 부여하여 합산할 수 있다.
데이터 인식 장치는 데이터의 인식 목적을 기초로 인식 결과를 처리하여 사용자에게 제공하는 인식 결과 제공부를 더 포함할 수 있다.
기존 데이터를 고려하지 않고 기존 모델을 추가 학습데이터로 학습하므로 모델의 학습 속도 및 인식 속도를 향상시킬 수 있다.
도 1은 일 실시예에 따른 데이터 인식 모델 구축 장치의 블록도이다.
도 2는 다른 실시예에 따른 데이터 인식 모델 구축 장치의 블록도이다.
도 3은 일 실시예에 따른 데이터 인식 모델 구축 방법의 흐름도이다.
도 4는 다른 실시예에 따른 데이터 인식 모델 구축 방법의 흐름도이다.
도 5는 일 실시예에 따른 데이터 인식 장치의 블록도이다.
도 6은 다른 실시예에 따른 데이터 인식 장치의 블록도이다.
도 7은 일 실시예에 따른 데이터 인식 방법의 흐름도이다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다. 기재된 기술의 이점 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
이하, 데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치의 실시예들을 도면들을 참고하여 자세히 설명하도록 한다.
도 1은 일 실시예에 따른 데이터 인식 모델 구축 장치(100)의 블록도이다. 데이터 인식 모델 구축 장치(100)는 소프트웨어 모듈로 구현되거나 하드웨어 칩 형태로 제작되어 각종 전자 장치에 탑재될 수 있다. 이때, 전자 장치는 데스크탑 컴퓨터, 서버, 노트북, 스마트폰, 스마트패드 등의 각종 정보 처리 장치를 포함하는 것으로서 특별히 예시된 바에 제한되지는 않는다. 또한, 데이터 인식 모델 구축 장치(100)는 후술하는 데이터 인식 장치의 일 구성 또는 별도의 모듈로서 그 데이터 인식 장치와 함께 전자 장치에 탑재될 수 있다. 또는 데이터 인식 모델 구축 장치(100)는 데이터 인식 장치와는 별도의 전자 장치에 탑재될 수 있으며, 데이터 인식 장치와 유무선으로 통신하여 구축된 모델 정보를 데이터 인식 장치에 제공하는 것도 가능하다.
한편, 데이터 인식 모델 구축 장치(100)가 인식할 수 있는 데이터의 종류에는 음성 데이터, 영상 데이터, 텍스트 데이터, 헬스케어 장치로부터 획득되는 생체신호 데이터 등이 포함되나, 특별히 예시된 바에 국한되지 않으며 그 밖의 인식 모델을 이용하여 분류 가능한 모든 데이터를 포함할 수 있다. 다만, 설명의 편의를 위해 이하에서는 음성 또는 영상 데이터를 예로 들어 설명하기로 한다.
도 1을 참조하면, 데이터 인식 모델 구축 장치(100)는 학습데이터 입력부(110), 모델 학습부(120), 모델 저장부(130) 및 모델 구축부(140)를 포함할 수 있다.
학습데이터 입력부(110)는 학습이 필요한 추가 학습데이터를 입력 받는다.
이때, 학습데이터는 인식하고자 하는 데이터와 관련되며, 예컨대, 음성 데이터, 영상 데이터, 텍스트 데이터, 생체신호 데이터 등이 될 수 있다.
일 양상에 따르면, 학습데이터 입력부(110)는 모델 구축 장치(100)가 탑재된 전자 장치에 내장되거나, 그 전자 장치와 직/간접적으로 연결되는 기기(예: 마이크로폰, 카메라 등)를 통해 사용자로부터 음성/영상 데이터를 추가 학습데이터로 입력 받을 수 있다. 다른 양상으로, CCTV 또는 블랙박스와 같은 외부의 자동화 장치에 의해 수집된 음성/영상 데이터를 추가 학습데이터로 입력 받을 수 있다.
일 예로, 미리 구축된 제1 인식 모델이 음성 데이터에 포함되는 음성을 인식하는 것인 경우에는, 학습데이터 입력부(110)에 입력되는 추가 학습데이터는 제1 인식 모델을 미리 구축함에 있어 기초가 된 기본 학습데이터에 포함되어 있지 않은 음성 데이터일 수 있다. 예를 들어, 제1 인식 모델이 한국 표준 발음으로 생성이 된 음성 데이터를 기본 학습데이터로 하여 구축이 된 경우, 학습데이터 입력부(110)에 입력되는 추가 학습데이터는 지역 사투리, 은어, 신조어 또는 외국어 등이 해당 될 수 있으나, 이에 한정되지 않는다.
다른 양상으로, 미리 구축된 제1 인식 모델이 영상 데이터에 포함되는 객체를 인식하는 것인 경우에는, 학습데이터 입력부(110)에 입력되는 추가 학습데이터는 제1 인식 모델을 미리 구축함에 있어 기초가 된 기본 학습데이터에 포함되어 있지 않은 객체가 될 수 있다. 예를 들어, 제1 인식 모델이 개, 고양이 및 사자와 같이 이미 알려진 동물 객체를 포함하는 각 영상 데이터를 기본 학습데이터로 하여 구축이 된 경우, 새로운 동물이 발견되거나 상상의 동물 캐릭터 등이 창조되는 경우, 그 새로운 동물이나 상상의 동물 캐릭터에 대한 영상 데이터를 추가 학습데이터로 입력 받을 수 있다. 이때, 영상 데이터는, 동적인 영상일 수도 있고, 정적인 영상일 수도 있다.
한편, 입력되는 추가 학습데이터의 크기는 추가 학습의 목적, 인식 모델의 적용 분야, 장치의 컴퓨팅 성능 등에 따라 미리 설정될 수 있다. 예를 들어, 정확한 인식 결과 제공이 중요한 분야에 인식 모델이 활용되는 경우 추가 학습에 필요한 추가 학습데이터의 크기는 상대적으로 크게 설정될 수 있다.
제1 인식 모델은 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예컨대, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)과 같은 모델이 사용될 수 있으며, 여기에 특별히 한정되지는 않는다.
모델 학습부(120)는 추가 학습데이터가 입력되면, 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델을 추가 학습데이터로 학습시킬 수 있다.
모델 학습부(120)는 추가 학습데이터가 입력되면, 입력된 추가 학습데이터의 타입 등을 분석하고, 그 분석 결과를 기초로 모델 저장부(130)로부터 추가 학습데이터와 관련된 제1 인식 모델을 획득할 수 있다. 모델 학습부(120)는 미리 구축된 제1 인식 모델이 복수 개 존재하는 경우 입력된 추가 학습데이터와 기본 학습데이터와의 관련성이 큰 제1 인식 모델을 추가 학습시킬 모델로 결정할 수 있다.
모델 저장부(130)는 기본 학습데이터로 학습된 기존의 제1 인식 모델을 저장할 수 있다. 이때, 기본 학습데이터는 음성, 영상 등과 같은 데이터의 타입에 따라 분류될 수 있으며, 제1 인식 모델은 이와 같이 각 데이터 타입별로 미리 학습되어 구축될 수 있다. 또한, 기본 학습데이터는 각 데이터 타입별로 보다 세분화될 수 있으며, 제1 인식 모델은 이와 같이 각 데이터 타입별, 세분화된 그룹별로 미리 구축될 수 있다. 예컨대, 데이터 타입이 음성인 경우, 기본 학습데이터는 그 음성의 언어, 그 음성을 발화한 사용자의 지역, 성별, 연령 등에 따라 세분화될 수 있다. 또한, 데이터 타입이 영상인 경우, 기본 학습데이터는 영상 내의 객체의 종류, 예컨대, 동물, 식물, 사람 등의 다양한 기준으로 세분화될 수 있다.
모델 학습부(120)는 오류 역전파법(error back-propagation) 및 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 중의 적어도 하나를 이용하여 제1 인식 모델을 학습시킬 수 있다. 구체적으로, 심층 신경망은 표준 오류역전파 알고리즘을 가지고 구별되게 학습될 수 있다. 이때, 가중치(weight)들은 확률적 경사 하강법(stochastic gradient descent)을 통하여 갱신될 수 있다.
모델 구축부(140)는 학습에 따라 생성된 제2 인식 모델을 제1 인식 모델과 통합하여 최종 인식 모델을 구축할 수 있다. 즉, 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델과 제1 인식 모델을 추가 학습데이터로 학습한 제2 인식 모델을 통합하여 최종 인식 모델을 구축할 수 있다.
예를 들어, 모델 구축부(140)는 제1 인식 모델 및 제2 인식 모델을 선형 합산함으로써 최종 인식 모델을 구축할 수 있다. 이때, 모델 구축부(140)는 아래의 수학식 1과 같이 L2 norm penalty 방법에 근거하는 선형 함수 이용할 수 있으며, 미리 설정된 파라미터(λ)를 사용하여 제1 인식 모델(
Figure pat00001
)에 (1-λ)의 가중치를 부여하고, 제2 인식 모델(
Figure pat00002
)에 λ의 가중치를 부여하여 선형 합산을 할 수 있다.
Figure pat00003
여기서,
Figure pat00004
은 최종 인식 모델을 의미하고,
Figure pat00005
는 추가 학습데이터로만 학습한 제2 인식 모델을 의미하며,
Figure pat00006
는 제2 인식 모델과 통합할 기존에 구축된 기존 인식 모델을 의미하는 것으로서, 여기서는 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델을 의미한다.
한편, 가중치 즉, 파라미터(λ)는 기본 학습데이터 및 추가 학습데이터 간의 개수의 차이, 학습의 목적, 인식 모델의 적용 분야 및 학습의 중요도 등을 기초로 임의로 설정되며, 여러 번의 전처리 과정을 통해 적절한 값으로 미리 설정될 수 있다.
일 예로, 기본 학습데이터의 개수가 추가 학습데이터의 개수에 비하여 많을 경우 가중치는 제1 인식 모델의 비중이 커지도록 설정될 수 있다.
다른 예로, 기본 학습데이터가 여행, 식사, 대중교통 이용과 같은 여행에서만 사용되는 언어에 관한 것이고 추가 학습데이터는 일상적인 언어들을 모두 포함하고 있는 경우에는, 학습의 목적 및 학습의 중요도에 비추어 가중치는 추가 학습데이터로만 학습된 제2 인식 모델의 비중이 커지도록 설정될 수 있다.
또 다른 예로, 학습의 목적이 특정 사용자의 개인화된 인식 모델 구축과 관련된 경우에는 그 사용자가 입력하는 추가 학습데이터, 예컨대 그 사용자의 특유한 발음으로 발화된 음성 데이터를 이용하여 학습이 된 제2 인식 모델의 가중치를 상대적으로 높게 설정할 수 있다. 예를 들어, 영어로 음성 인식을 수행하는 경우, 비영어권 국가의 사용자는 영어 알파벳 "R"과 "L", "F"와 "P" 를 구분하여 발음하는 것이 어려운 경향이 있으므로, 그 사용자는 자신이 어려워하는 영어 단어, 구, 문장 등에 관한 추가 학습데이터를 통해 최종 인식 모델을 구축할 수 있으며 이때, 그 추가 학습데이터를 이용하여 학습된 제2 인식 모델에 상대적으로 더 높은 가중치를 부여함으로써 그 사용자에 보다 최적화된 최종 인식 모델을 구축할 수 있다.
한편, 파라미터(λ)는 하나의 값으로 미리 설정될 수 있으나, 두 개 이상의 다수의 값(예: λ1, λ2,…,λn)포함하는 가중치 후보군을 미리 설정되는 것도 가능하다. 이 경우, 모델 구축부(140)는 가중치 후보군에서 하나 또는 그 이상의 파라미터를 선택할 수 있고, 가중치 후보군 전체를 선택할 수도 있다. 선택된 파라미터(예: λ1, λ2,…,λn) 각각에 대하여 수학식 1을 적용하여 선형 합산함으로써 복수 개의 통합 결과를 생성할 수 있고, 생성된 복수 개의 통합 결과를 최종 인식 모델로 구축할 수 있다. 이때, 복수 개의 최종 인식 모델 중에서 적어도 하나를 최종 인식 모델로 결정할 수 있다. 한편, 가중치 후보군에서 선택하는 파라미터의 개수는 요청되는 모델의 정확도, 모델 구축시간 등에 따라 설정될 수 있다. 일 예로, 구축할 최종 인식 모델의 정확도를 높이기 위해 파라미터를 많이 선택할 수도 있고, 모델 구축의 시간을 단축하기 위해 파라미터를 적게 선택할 수도 있다.
개시된 실시예에 따르면, 최종 인식 모델을 구축하기 위해 기본 학습데이터와 추가 학습데이터를 포함하는 전체 학습데이터를 기초로 인식 모델을 학습하는 과정을 요구하지 않으므로, 연산량 증가나 메모리 등의 추가 자원을 거의 요구하지 않아 추가 학습의 속도가 증가할 수 있다. 또한 추가 학습데이터를 기초로 인식 모델을 학습할 때 기본 학습데이터를 사용하지 않고, 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델을 이용하여 추가 학습데이터를 반영하므로, 미리 구축된 제1 인식 모델의 성능을 최대한 유지할 수 있다.
도 2는 다른 실시예에 따른 데이터 인식 모델 구축 장치(200)의 블록도이다.
도 2를 참조하면, 데이터 인식 모델 구축 장치(200)는 학습데이터 입력부(210), 모델 학습부(220), 모델 저장부(230), 모델 구축부(240) 및 모델 평가부(250) 를 포함할 수 있다.
학습데이터 입력부(210), 모델 학습부(220), 모델 저장부(230) 및 모델 구축부(240)는 도 1을 참조하여 자세히 설명하였으므로 이하 자세한 설명은 생략한다.
학습데이터 입력부(210)는 전술한 바와 같이 추가 학습이 필요한 추가 학습데이터를 입력 받는다.
모델 학습부(220)는 추가 학습데이터가 입력되면, 입력된 추가 학습데이터를 학습시킬 인식 모델인 제1 인식 모델을 결정하고, 결정된 제1 인식 모델을 이용하여 추가 학습데이터를 학습시킬 수 있다.
모델 학습부(220)는 추가 학습데이터가 입력되면, 입력된 추가 학습데이터의 타입 등을 분석하고, 그 분석 결과를 기초로 모델 저장부(230)로부터 추가 학습데이터와 관련된 제1 인식 모델을 모델 저장부(230)로부터 획득할 수 있다.
모델 구축부(240)는 모델 학습부(220)가 추가 학습데이터를 이용하여 제1 인식 모델의 학습을 완료하면, 제1 인식 모델과 추가 학습데이터를 이용하여 학습된 결과 생성된 제2 인식 모델을 이용하여 최종 인식 모델을 구축할 수 있다. 예를 들어, 모델 구축부(240)는 전술한 바와 같이 수학식 1의 선형 함수를 사용하여 제1 인식 모델과 제2 인식 모델을 선형 합산하여 모델을 통합할 수 있고, 이때, 제1 인식 모델과 제2 인식 모델에 미리 설정된 가중치를 부여하여 최종 인식 모델에 통합되는 제1 인식 모델과 제2 인식 모델의 비중을 조절할 수 있다.
모델 평가부(250)는 최종 인식 모델이 구축되면, 평가 데이터를 이용하여 구축된 최종 인식 모델을 평가할 수 있다. 모델 평가부(250)는 최종 인식 모델에 복수의 평가 데이터를 입력하고, 최종 인식 모델로부터 출력되는 인식 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(220)로 하여금 다시 학습하도록 할 수 있다.
예를 들어, 모델 평가부(250)는 복수의 평가 데이터에 대한 최종 인식 모델의 인식 결과 중에서, 인식 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우 소정 기준을 만족하지 못한 것으로 평가할 수 있다. 예컨대, 소정 기준이 비율 20%로 정의되는 경우, 최종 인식 모델이 총 1000개의 평가 데이터 중의 20개를 초과하는 평가 데이터에 대하여 잘못된 인식 결과를 출력하는 구축된 최종 인식 모델이 적합하지 않은 것으로 평가할 수 있다.
모델 학습부(220)는 모델 평가부(250)의 평가 결과 최종 인식 모델이 소정 기준을 만족하지 못하면, 추가 학습데이터를 다시 학습할 수 있으며, 이때, 모델 학습부(220)는 모델 구축부(240)에 의해 구축된 최종 인식 모델을 전술한 수학식 1에서 기존 인식 모델(
Figure pat00007
)을 사용하여 학습데이터 입력부(210)가 입력받은 추가 학습데이터로 재학습할 수 있다.
한편, 도 1을 참조하여 설명한 바와 같이, 복수 개의 파라미터를 포함하는 가중치 후보군이 미리 설정되는 경우, 모델 구축부(240)는 가중치 후보군에서 하나 이상의 파라미터를 선택하고, 선택된 복수 개의 파라미터 각각에 대하여 최종 인식 모델을 생성할 수 있다. 모델 평가부(250)는 각각의 최종 인식 모델에 대하여 소정 기준을 만족하는지를 평가하고 소정 기준을 만족하는 모델을 최종 인식 모델로 결정할 수 있다. 이때, 소정 기준을 만족하는 모델이 둘 이상인 경우, 만족하는 모델 전체를 최종 인식 모델로 결정할 수 있으며, 또는 만족하는 모델 중에서 평가 점수가 높은 순으로 미리 설정된 어느 하나 또는 미리 정의된 개수의 모델을 최종 인식 모델로 결정할 수 있다. 다만, 이에 제한되지 않는다.
도 3은 일 실시예에 따른 데이터 인식 모델 구축 방법의 흐름도이다.
도 3의 데이터 인식 모델 구축 방법은 도 1의 데이터 인식 모델 구축 장치(100)에 의해 수행되는 일 양상이다.
먼저, 데이터 인식 모델 구축 장치(100)는 추가 학습데이터를 입력 받을 수 있다(310). 데이터 인식 모델 구축 장치(100)는 사용자로부터 음성/영상 데이터를 추가 학습데이터로 입력 받거나, CCTV 또는 블랙박스와 같은 외부의 자동화 장치에 의해 수집된 음성/영상 데이터를 추가 학습데이터로 입력 받을 수 있다.
데이터 인식 모델 구축 장치(100)는 추가 학습데이터가 입력되면, 입력된 추가 학습데이터의 타입 등을 분석하고, 그 분석 결과를 기초로 데이터 인식 모델 구축 장치(100)로부터 추가 학습데이터와 관련된 제1 인식 모델을 획득할 수 있다(320). 데이터 인식 모델 구축 장치(100)는 미리 구축된 제1 인식 모델이 복수 개 존재하는 경우 입력된 추가 학습데이터와 기본 학습데이터와의 관련성이 큰 제1 인식 모델을 추가 학습시킬 모델로 결정할 수 있다. 이때, 제1 인식 모델은 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예컨대, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)과 같은 모델이 사용될 수 있으며, 여기에 특별히 한정되지는 않는다.
그 다음, 인식 모델 구축 장치(100)는 추가 학습데이터가 입력되면, 제1 인식 모델을 입력된 추가 학습데이터로 학습하여 제2 인식 모델을 생성할 수 있다(330). 이때, 데이터 인식 모델 구축 장치(100)는 오류 역전파법(error back-propagation) 및 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 중의 적어도 하나를 이용하여 제1 인식 모델을 학습시킬 수 있다. 구체적으로, 심층 신경망은 표준 오류역전파 알고리즘을 가지고 구별되게 학습될 수 있다. 이때, 가중치(weight)들은 확률적 경사 하강법(stochastic gradient descent)을 통하여 갱신될 수 있다.
그 다음, 데이터 인식 모델 구축 장치(100)는 학습에 따라 생성된 제2 인식 모델을 제1 인식 모델과 통합하여 최종 인식 모델을 구축할 수 있다(340).
예를 들어, 데이터 인식 모델 구축 장치(100)는 제1 인식 모델 및 제2 인식 모델을 선형 함수를 이용하여 선형 합산함으로써 최종 인식 모델을 구축할 수 있다(340). 이때, 선형 함수는 전술한 수학식 1과 같이 L2 norm penalty 방법에 근거하는 선형 함수일 수 있으나 이에 제한되는 것은 아니다. 수학식 1과 같은 선형 함수에서 각각의 인식 모델에 부여될 가중치 즉 파라미터(λ)는 전처리 과정을 통해 적절한 값으로 미리 설정될 수 있다. 이때, 복수 개의 파라미터(λ)를 포함하는 가중치 후보군이 설정될 수도 있으며, 이 경우 전술한 바와 같이 복수 개의 인식 모델이 구축될 수 있다.
도 4는 다른 실시예에 따른 데이터 인식 모델 구축 방법의 흐름도이다.도 4의 데이터 인식 모델 구축 방법은 도 2의 데이터 인식 모델 구축 장치(200)에 의해 수행되는 일 양상으로서, 먼저, 데이터 인식 모델 구축 장치(200)는 추가 학습데이터를 입력 받을 수 있다(410).
그 다음, 데이터 인식 모델 구축 장치(200)는 추가 학습데이터가 입력되면, 입력된 추가 학습데이터를 분석하고, 분석 결과를 기초로 모델 저장부로부터 학습을 시킬 제1 인식 모델을 획득할 수 있다 (420). 이때, 모델 저장부에는 다양하게 분류된 기본 학습데이터를 이용하여 학습된 기존 인식 모델들을 저장하고 있으며, 입력된 추가 학습데이터와 관련성이 큰 기존 인식 모델이 제1 인식 모델로 결정될 수 있다. 데이터 인식 모델 구축 장치(200)는 입력된 추가 학습데이터의 타입이 음성인 경우 모델 저장부로부터 음성 인식 모델을 획득하며, 이때, 음성이 영어인 경우 영어 음성으로 구성된 기본 학습데이터를 이용하여 학습이 된 음성 인식 모델을 제1 인식 모델로 획득할 수 있다. 다만, 이에 특별히 한정되는 것이 아니며, 도 2를 참조하여 모델 저장부에 대해 앞에서 자세히 설명한 바와 같이 데이터 인식 모델 구축 장치(200)는 기존 인식 모델의 다양한 분류 기준에 맞추어 추가 학습데이터를 분석할 수 있다.
그 다음, 데이터 인식 모델 구축 장치(200)는 획득된 제1 인식 모델을 추가 학습데이터로 학습하여 제2 인식 모델을 생성할 수 있다(430).
그 다음, 데이터 인식 모델 구축 장치(200)는 학습에 따라 생성된 제2 인식 모델을 제1 인식 모델과 통합하여 최종 인식 모델을 구축할 수 있다(440). 이때, 수학식 1과 같은 선형 함수가 이용될 수 있으며, 미리 설정된 기준에 따라 각 인식 모델에 적절한 가중치가 부여될 수 있다.
그 다음, 데이터 인식 모델 구축 장치(200)는 최종 인식 모델이 구축되면 평가 데이터를 이용하여 구축된 최종 인식 모델을 평가할 수 있다(450).
그 다음, 데이터 인식 모델 구축 장치(200)는 평가 결과 최종 인식 모델이 소정 기준을 만족하는지 여부를 판단 할 수 있다(460). 예를 들어, 모델 평가부(250)는 복수의 평가 데이터에 대한 최종 인식 모델의 인식 결과 중에서, 정확하지 않은 결과를 출력한 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우 소정 기준을 만족하지 못한 것으로 평가할 수 있다. 단계(460)에서 판단 결과 소정 기준을 만족하지 못하면, 추가 학습데이터로 인식 모델을 학습하는 단계(430)로 이동할 수 있다.
이때, 데이터 인식 모델 구축 장치(200)는 단계(440)에서 미리 설정된 복수 개의 파라미터(λ)를 포함하는 가중치 후보군에서 하나 이상의 파라미터(λ)를 이용하여 복수 개의 인식 모델을 구축하는 경우, 평가 결과를 기초로 구축된 인식 모델 중의 일부를 최종 인식 모델로 결정할 수 있다. 이 경우, 소정 기준을 만족하는 인식 모델이 존재하지 않는 경우 재학습 하는 단계(430)로 이동할 수 있다.
데이터 인식 모델 구축 장치(200)는 기존에 미리 구축되어 있는 제1 인식 모델 대신에 이전 단계(440)에서 구축된 최종 인식 모델을 추가 학습데이터로 학습시켜 제2 인식 모델을 생성할 수 있다(430). 이와 같은 과정은, 최종 인식 모델이 소정 기준을 만족하게 될 때까지 반복될 수 있다.
도 5는 일 실시예에 따른 데이터 인식 장치(600)의 블록도이다. 이때, 데이터 인식 장치(500)는 소프트웨어 모듈로 구현되거나 하드웨어 칩 형태로 제작되어 각종 전자 장치에 탑재될 수 있다. 또한, 데이터 인식 장치(500)에는 전술한 실시예들의 데이터 인식 모델 구축 장치가 탑재될 수 있다.
도 5을 참조하면, 데이터 인식 장치(500)는 인식데이터 입력부(510), 모델 갱신 판단부(520), 모델 갱신부(530) 및 데이터 인식부(540)를 포함할 수 있다.
인식데이터 입력부(510)는 사용자로부터 인식할 데이터를 입력받는다. 예를 들어, 사용자는 통역, 번역, 애플리케이션 실행, 전자장치의 제어, 메신저 애플리케이션 등에서의 메시지 입력 등의 다양한 상황에서 자신이 소지하고 있는 스마트폰 등의 전자장치를 통해 음성 데이터나 영상 데이터를 입력할 수 있다. 이때, 사용자가 소지하고 있는 그 전자장치 내에 탑재되거나 그 전자장치와 연결된 다른 장치에 탑재된 데이터 인식 장치(500)의 인식데이터 입력부(510)는 사용자가 입력한 음성 데이터 또는 영상 데이터를 인식하고자 하는 인식 데이터로 입력받을 수 있다.
모델 갱신 판단부(520)는 사용자로부터 인식할 데이터가 입력이 되면, 탑재되어 있는 인식 모델을 그대로 사용할지 아니면 갱신이 필요한지 여부를 판단할 수 있다.
일 예를 들면, 모델 갱신 판단부(520)는 미리 구축되어 있는 인식 모델의 학습에 이용된 기본 학습데이터와 사용자로부터 입력된 인식할 데이터와의 관련성 등을 분석하여 갱신 여부를 판단할 수 있다. 이때, 관련성은 사용자의 위치, 거주지역, 사용언어, 발음특성(예: 지역 사투리), 연령, 성별 등의 다양한 기준에 기초하여 결정될 수 있다. 모델 갱신 판단부(520)는 이하 예를 들어 설명하는 바와 같이 기본 학습데이터와 인식할 데이터 간의 관련성이 낮은 경우 갱신이 필요하다고 판단할 수 있다.
예를 들어, 인식 모델이 한국 표준 발음의 음성 데이터를 기본 학습데이터로 하여 구축이 된 경우, 인식할 데이터가 외국어로 입력이 되면, 기본 학습데이터와의 관련성이 낮다고 판단하여 인식 모델의 갱신이 필요하다고 판단할 수 있다. 또는, 그 사용자가 특정 지역 사투리를 사용하는 경우 표준어 발음의 기본 학습데이터와의 관련성이 낮다고 판단하여 인식 모델의 갱신이 필요하다고 판단할 수 있다. 이때, 데이터 인식 장치(500)는 도시되지는 않았지만 사용자의 사용언어, 거주지역, 발음특성, 성별, 연령 등을 관리하는 정보 관리부를 더 포함할 수도 있다.
또는, 모델 갱신 판단부(520)는 사용자로부터 인식할 데이터가 입력되면, 범지구적 위성 항법 시스템(Global Navigation Satellite System, GNSS), 셀 아이디(cell-ID) 방식 및 무선 랜(LAN) 접속 위치 감지 방식 등을 통해 사용자의 현재 위치(예: 공항)를 파악하고, 기본 학습데이터가 사용자의 현재 위치(예: 공항)에 맞는 상황을 반영하고 있지 않으면 관련성이 낮다고 판단하여 인식 모델의 갱신이 필요하다고 판단할 수 있다.
이러한 예시들은 이해의 편의를 돕기 위한 것으로 예시된 바에 특별히 한정되지 않으며 다양한 상황으로 확장이 가능하다.
다른 예로, 모델 갱신 판단부(520)는 현재 탑재되어 있는 인식 모델의 인식 정확도를 기초로 갱신 여부를 판단할 수 있다. 이때, 모델 갱신 판단부(520)는 이전에 일정 기간 동안 그 인식 모델을 사용하여 인식한 결과를 기초로 인식 정확도를 판단할 수 있으며, 판단된 인식 정확도가 소정 기준(예: 평균 80%)을 만족하지 못하는 경우 인식 모델의 갱신이 필요하다고 판단할 수 있다. 이때, 소정 기준은 인식 모델이 주로 이용되는 분야 등을 기초로 미리 설정될 수 있다.
또 다른 예로, 모델 갱신 판단부(520)는 데이터 인식부(540)의 인식 결과에 대한 사용자의 응답을 기초로 현재 인식 모델의 갱신 여부를 판단할 수 있다. 예를 들어, 데이터 인식부(540)가 사용자로부터 입력된 인식 데이터를 인식 모델을 이용하여 인식 결과를 출력하면, 모델 갱신 판단부(540)는 그 인식 결과가 정확한지를 문의하는 질의를 사용자에게 제시하고, 그 질의에 대한 사용자의 응답을 기초로 갱신 여부를 판단할 수 있다.
모델 갱신부(530)는 모델 갱신 판단부(520)가 현재 탑재되어 있는 인식 모델의 갱신이 필요하다고 판단하면, 미리 설정된 다양한 방법을 이용하여 인식 모델을 갱신할 수 있다. 일 예로, 모델 갱신부(530)는 미리 구축된 인식 모델의 학습 결과 생성된 인식 모델을 미리 구축된 인식 모델과 선형 합산(linear sum)하여, 선형 합산 결과를 기초로 미리 구축된 인식 모델을 갱신할 수 있다. 이때, 선형 함수는 전술한 수학식 1과 같이 L2 norm penalty 방법에 근거하는 선형 함수일 수 있으나 이에 제한되는 것은 아니다. 수학식 1과 같은 선형 함수에서 각각의 인식 모델에 부여될 가중치 즉 파라미터(λ)는 전처리 과정을 통해 적절한 값으로 미리 설정될 수 있다.
예를 들어, 데이터 인식 장치(500)가 데이터 인식 모델 구축 장치와 유무선 네트워크로 연결된 경우, 모델 갱신부(530)는 현재 위치, 현재 상황 등에 대한 사용자의 정보를 데이터 인식 모델 구축 장치에 전송하고, 데이터 인식 모델 구축 장치로부터 그 사용자의 정보를 기초로 추가 학습데이터를 이용하여 학습이 된 인식 모델을 수신하여 현재 인식 모델을 갱신할 수 있다.
또는, 도 6을 참조하여 자세히 후술하는 바와 같이 사용자로부터 현재 상황에 맞는 추가 학습데이터를 입력받고 입력된 추가 학습데이터를 이용하여 현재 인식 모델을 갱신하거나, 인식할 데이터를 추가 학습데이터로서 이용하여 현재 인식 모델을 갱신할 수 있다.
데이터 인식부(540)는 현재 탑재되어 있는 인식 모델을 이용하여 입력된 인식할 데이터를 인식하고 그 인식 결과를 출력할 수 있다.
도 6은 다른 실시예에 따른 데이터 인식 장치(600)의 블록도이다.
도 6을 참조하면, 데이터 인식 장치(600)는 인식데이터 입력부(610), 모델 갱신 판단부(620), 추가 학습데이터 입력부(630), 모델 갱신부(640), 데이터 인식부(650) 및 인식 결과 제공부(660)를 포함할 수 있다.
인식데이터 입력부(610)는 사용자로부터 인식할 데이터를 입력받는다.
모델 갱신 판단부(620)는 사용자로부터 인식할 데이터가 입력이 되면, 탑재되어 있는 인식 모델을 그대로 사용할지 아니면 갱신이 필요한지 여부를 판단할 수 있다.
추가 학습데이터 입력부(630)는 모델 갱신 판단부(620)의 판단 결과 갱신한다고 판단되면 사용자로부터 현재 상황에 맞는 추가 학습데이터를 입력 받을 수 있다. 일 예로, 데이터 인식 장치(600)가 표준어 발음을 기초로 구축된 음성 인식 모델을 지역 사투리의 발음을 인식할 수 있도록 갱신하는 경우, 추가 학습데이터 입력부(630)는 인식하고자 하는 지역 사투리 발음으로 된 다양한 단어 또는 서술어 등의 음성을 포함하는 음성 데이터를 추가 학습데이터로 입력 받을 수 있다. 다른 예로, 데이터 인식 장치(600)가 새로운 동물 객체를 인식할 수 있도록 영상 인식 모델을 갱신하는 경우, 추가 학습데이터 입력부(630) 인식할 새로운 동물 객체와 관련하여 자세, 동작, 촬영한 각도 또는 촬영된 배경이 다양한 다수의 영상 데이터를 추가 학습데이터로 입력 받을 수 있다.
모델 갱신부(640)는 모델 갱신 판단부(620)가 현재 탑재되어 있는 인식 모델의 갱신이 필요하다고 판단하면, 미리 설정된 다양한 방법을 이용하여 인식 모델을 갱신할 수 있다. 모델 갱신부(640)가 모델을 갱신하는데 필요한 추가 학습데이터는 추가 학습데이터 입력부(630)로부터 획득하거나, 인식데이터 입력부(610)의 인식할 데이터를 추가 학습데이터로서 획득할 수 있다.
데이터 인식부(650)는 현재 탑재되어 있는 인식 모델을 이용하여 입력된 인식할 데이터를 인식하고 그 인식 결과를 출력할 수 있다.
인식 결과 제공부(660)는 데이터의 인식 목적을 기초로 인식 결과를 처리하여 사용자에게 제공할 수 있다.
일 양상에 따르면, 인식 결과 제공부(660)는 인식 결과에 관련된 텍스트, 음성, 동영상 또는 정적 영상을 제공할 수 있다. 일 예로, 사람의 목소리, 짐승의 울음소리 및 새소리 등의 소리를 포함하는 음성 데이터를 인식데이터 입력부(610)에 입력하면 인식 결과 제공부(660)는 인식 결과를 처리하여 음성 데이터에 포함된 소리의 내용을 설명하거나 소리를 내는 대상의 종류, 예컨대 인식된 울음소리에 해당하는 동물, 새소리에 해당하는 새와 관련된 텍스트, 영상 또는 미리 저장된 관련 음성을 제공할 수 있다. 다른 예로, 영상 데이터를 인식데이터 입력부(610)에 입력하면 인식 결과 제공부(660)는 영상의 객체를 설명, 영상의 객체와 관련된 동적 또는 정적 영상을 제공 또는 객체와 관련된 음성을 사용자에게 제공할 수 있다.
다른 양상에 따르면, 인식 결과 제공부(660)는 인식 결과와 관련된 데이터 인식 장치(600)의 애플리케이션을 실시하거나 실시되고 있는 애플리케이션 내에서 인식 결과와 관련된 애플리케이션 내의 동작을 실행 할 수 있다. 인식 결과와 관련된 애플리케이션을 예로 들면, 인식 결과 제공부(660)는 인식된 결과에 포함되는 단어 또는 문장 등을 애플리케이션 이름에 포함하는 데이터 인식 장치(600)의 애플리케이션을 실행할 수 있다. 인식 결과와 관련된 애플리케이션 내의 동작을 하는 예를 들면, 인식 결과 제공부(660)는 사용자가 "시작" 또는 "종료"라고 말하면 데이터 인식 장치(600)의 애플리케이션이 실행 또는 종료되는 것과 같은 애플리케이션의 동작 등을 실행하거나, 사용자가 말한 내용을 키보드로 입력한 것처럼 애플리케이션 내에서 텍스트화하는 동작 등을 할 수 있다.
도 7은 일 실시예에 따른 데이터 인식 방법의 흐름도이다.
도 7의 데이터 인식 방법의 흐름도는 도 7의 데이터 인식 장치(600)에 의해 수행되는 일 실시예으로서, 데이터 인식 장치(600)는 추가 학습데이터를 입력받을 수 있다(710).
그 다음, 데이터 인식 장치(600)는 사용자로부터 인식할 데이터가 입력이 되면, 탑재되어 있는 인식 모델을 그대로 사용할지 아니면 갱신이 필요한지 여부를 판단할 수 있다(720). 데이터 인식 장치(600)는 미리 구축된 인식 모델의 학습에 이용된 기본 학습데이터와 인식할 데이터와의 관련성 및 미리 구축된 인식 모델을 이용하여 데이터 인식 장치(600)에 의해 인식된 결과의 정확도 중의 적어도 하나를 기초로 갱신 여부를 판단할 수 있다.
그 다음, 데이터 인식 장치(600)가 현재 탑재되어 있는 인식 모델의 갱신이 필요하다고 판단하면, 미리 설정된 다양한 방법을 이용하여 인식 모델을 갱신할 수 있다(730). 이 때, 데이터 인식 장치(600)는 현재 상황에 맞는 추가 학습데이터를 입력 받아 이를 기초로 인식 모델을 갱신할 수 있다. 일 예로, 데이터 인식 장치(600)는 미리 구축된 인식 모델의 학습 결과 생성된 인식 모델을 미리 구축된 인식 모델과 선형 합산(linear sum)하여, 선형 합산 결과를 기초로 미리 구축된 인식 모델을 갱신할 수 있다.
그 다음, 데이터 인식 장치(600)는 현재 탑재되어 있는 인식 모델을 이용하여 입력된 인식할 데이터를 인식하고 그 인식 결과를 출력할 수 있다(740).
이와 달리 데이터 인식 장치(600)가 현재 탑재되어 있는 인식 모델을 그대로 사용한다고 판단하면, 데이터 인식 장치(600)는 현재 탑재되어 있는 인식 모델을 이용하여 입력된 인식할 데이터를 인식하고 그 인식 결과를 출력할 수 있다(750).
인식할 데이터를 인식한 다음, 데이터 인식 장치(600)는 데이터의 인식 목적을 기초로 인식 결과를 처리하여 사용자에게 제공할 수 있다(760). 일 양상에 따르면, 데이터 인식 장치(600)는 인식 결과에 관련된 텍스트, 음성, 동영상 또는 정적 영상을 제공할 수 있다. 다른 양상에 따르면, 데이터 인식 장치(600)는 인식 결과와 관련된 애플리케이션이 실시할 수 있다. 데이터 인식 장치(600)는 인식 결과와 관련된 애플리케이션을 실시하거나 실시되고 있는 애플리케이션 내에서 인식 결과와 관련된 애플리케이션 내의 동작을 실행 할 수 있다.
한편, 앞서 설명한 실시예들은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.
컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현하는 것을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 실시예들을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술 분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.
본 개시가 속하는 기술분야의 통상의 지식을 가진 자는 개시된 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
100,200 : 데이터 인식 모델 구축 장치 110,210 : 학습데이터 입력부
120,220 : 모델 학습부 130,230 : 모델 저장부
140,240 : 모델 구축부 250 : 모델 평가부
500,600 : 데이터 인식 장치 510,610 : 인식데이터 입력부
520,620 : 모델 갱신 판단부 530,640 : 모델 갱신부
630 : 추가 학습데이터 입력부 540,650 : 데이터 인식부
660 : 인식 결과 제공부

Claims (22)

  1. 추가 학습데이터를 이용한 데이터 인식 모델 구축 장치에 있어서,
    추가 학습데이터를 입력받는 학습데이터 입력부;
    추가 학습데이터가 입력되면, 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델을 상기 추가 학습데이터로 학습시키는 모델 학습부; 및
    상기 학습에 따라 생성된 제2 인식 모델을 상기 제1 인식 모델과 통합하여 최종 인식 모델을 구축하는 모델 구축부를 포함하는 데이터 인식 모델 구축 장치.
  2. 제1항에 있어서,
    상기 기본 학습데이터 및 추가 학습데이터는 음성 데이터, 영상 데이터, 텍스트 데이터 및 생체신호 데이터 중의 적어도 하나를 포함하는 데이터 인식 모델 구축 장치.
  3. 제1항에 있어서,
    상기 제1 인식 모델은 신경망(Neural Network)을 기반으로 하는 데이터 인식 모델 구축 장치.
  4. 제3항에 있어서,
    상기 모델 학습부는
    오류 역전파법(error back-propagation) 및 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 중의 적어도 하나를 이용하여 상기 제1 인식 모델을 학습시키는 데이터 인식 모델 구축 장치.
  5. 제1항에 있어서,
    하나 이상의 기본 학습데이터로 미리 학습되어 구축이 된 하나 이상의 제1 인식 모델을 저장하는 모델 저장부를 더 포함하고,
    상기 모델 학습부는
    상기 추가 학습데이터가 입력되면, 상기 모델 저장부로부터 상기 입력된 추가 학습데이터와 관련된 제1 인식 모델을 획득하는 데이터 인식 모델 구축 장치.
  6. 제1항에 있어서,
    상기 모델 구축부는
    상기 제1 인식 모델 및 제2 인식 모델을 선형 합산(linear sum) 하여 통합하는 데이터 인식 모델 구축 장치.
  7. 제6항에 있어서,
    상기 모델 구축부는
    미리 설정된 가중치 후보군에서 하나 이상의 가중치를 선택하고, 선택된 가중치를 부여하여 선형 합산함으로써 각 가중치별로 하나 이상의 인식 모델을 생성하고, 상기 생성된 하나 이상의 인식 모델 중의 적어도 하나를 최종 인식 모델로 결정하는 데이터 인식 모델 구축 장치.
  8. 제7항에 있어서,
    상기 가중치는 상기 기본 학습데이터 및 추가 학습데이터 간의 개수의 차이, 추가 학습의 목적 및 추가 학습의 중요도 중의 적어도 하나에 기초하여 미리 설정되는 데이터 인식 모델 구축 장치.
  9. 제1항에 있어서,
    상기 최종 인식 모델이 구축되면, 평가 데이터를 이용하여 상기 구축된 최종 인식 모델을 평가하는 모델 평가부를 더 포함하는 데이터 인식 모델 구축 장치.
  10. 제9항에 있어서,
    상기 모델 학습부는
    상기 평가 결과 최종 인식 모델이 소정 기준을 만족하지 못하면, 상기 최종 인식 모델을 상기 추가 학습데이터로 재학습시키는 데이터 인식 모델 구축 장치.
  11. 추가 학습데이터를 이용한 데이터 인식 모델 구축 방법에 있어서,
    추가 학습데이터를 입력받는 단계;
    추가 학습데이터가 입력되면, 기본 학습데이터를 기초로 미리 구축된 제1 인식 모델을 상기 추가 학습데이터로 학습시키는 단계; 및
    상기 학습에 따라 생성된 제2 인식 모델을 상기 제1 인식 모델과 통합하여 최종 인식 모델을 구축하는 단계를 포함하는 데이터 인식 모델 구축 방법.
  12. 제11항에 있어서,
    상기 제1 인식 모델은 신경망(Neural Network)을 기반으로 하는 데이터 인식 모델 구축 방법.
  13. 제11항에 있어서,
    상기 제1 인식 모델을 학습시키는 단계는
    상기 추가 학습데이터가 입력되면, 모델 저장부로부터 상기 입력된 추가 학습데이터와 관련된 제1 인식 모델을 획득하는 단계를 포함하는 데이터 인식 모델 구축 방법.
  14. 제11항에 있어서,
    상기 최종 인식 모델을 구축하는 단계는
    상기 제1 인식 모델 및 제2 인식 모델을 선형 합산(linear sum)하여 통합하는 데이터 인식 모델 구축 방법.
  15. 제14항에 있어서,
    상기 최종 인식 모델을 구축하는 단계는
    미리 설정된 가중치 후보군에서 하나 이상의 가중치를 선택하고, 선택된 가중치를 부여하여 선형 합산함으로써 각 가중치별로 하나 이상의 인식 모델을 생성하고, 상기 생성된 하나 이상의 인식 모델 중의 적어도 하나를 최종 인식 모델로 결정하는 데이터 인식 모델 구축 방법.
  16. 제11항에 있어서,
    상기 최종 인식 모델이 구축되면, 평가 데이터를 이용하여 상기 구축된 최종 인식 모델을 평가하는 단계를 더 포함하는 데이터 인식 모델 구축 방법.
  17. 제16항에 있어서,
    상기 모델을 학습시키는 단계는
    상기 평가 결과 최종 인식 모델이 소정 기준을 만족하지 못하면, 상기 최종 인식 모델을 상기 추가 학습데이터로 재학습시키는 데이터 인식 모델 구축 방법.
  18. 사용자로부터 인식할 데이터를 입력 받는 인식데이터 입력부;
    상기 인식할 데이터를 기초로, 미리 구축된 인식 모델의 갱신 여부를 판단하는 모델 갱신 판단부;
    상기 판단 결과 갱신이 필요하면, 추가 학습데이터를 이용하여 상기 인식 모델을 학습시키고, 학습 결과를 기초로 상기 인식 모델을 갱신하는 모델 갱신부; 및
    상기 판단 결과에 따라 상기 미리 구축된 인식 모델 또는 상기 갱신된 인식 모델을 이용하여 상기 인식할 데이터를 인식하는 데이터 인식부를 포함하는 데이터 인식 장치.
  19. 제18항에 있어서,
    상기 모델 갱신 판단부는
    상기 미리 구축된 인식 모델의 학습에 이용된 기본 학습데이터와 상기 인식할 데이터와의 관련성 및 상기 미리 구축된 인식 모델을 이용하여 상기 데이터 인식부에 의해 인식된 결과의 정확도 중의 적어도 하나를 기초로 갱신 여부를 판단하는 데이터 인식 장치.
  20. 제18항에 있어서,
    상기 판단 결과 갱신이 필요하면, 사용자로부터 상기 인식할 데이터와 관련된 추가 학습데이터를 입력받는 추가 학습데이터 입력부를 더 포함하는 데이터 인식 장치.
  21. 제18항에 있어서,
    상기 모델 갱신부는
    상기 미리 구축된 인식 모델의 학습 결과 생성된 인식 모델을 상기 미리 구축된 인식 모델과 가중치를 부여한 선형 합산(linear sum)을 하여, 상기 선형 합산 결과를 기초로 상기 미리 구축된 인식 모델을 갱신하는 데이터 인식 장치.
  22. 제18항에 있어서,
    상기 데이터의 인식 목적을 기초로 상기 인식 결과를 처리하여 사용자에게 제공하는 인식 결과 제공부를 더 포함하는 데이터 인식 장치.
KR1020150165891A 2015-11-25 2015-11-25 데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치 KR102601848B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150165891A KR102601848B1 (ko) 2015-11-25 2015-11-25 데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치
US15/332,166 US10475442B2 (en) 2015-11-25 2016-10-24 Method and device for recognition and method and device for constructing recognition model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150165891A KR102601848B1 (ko) 2015-11-25 2015-11-25 데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치

Publications (2)

Publication Number Publication Date
KR20170061016A true KR20170061016A (ko) 2017-06-02
KR102601848B1 KR102601848B1 (ko) 2023-11-13

Family

ID=58721017

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150165891A KR102601848B1 (ko) 2015-11-25 2015-11-25 데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치

Country Status (2)

Country Link
US (1) US10475442B2 (ko)
KR (1) KR102601848B1 (ko)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101887415B1 (ko) * 2017-11-21 2018-08-10 주식회사 크라우드웍스 데이터 라벨링 작업 검수방법 및 프로그램
KR20180138558A (ko) * 2018-10-10 2018-12-31 에스케이텔레콤 주식회사 객체 검출을 위한 영상분석 서버장치 및 방법
KR20190038137A (ko) * 2017-09-29 2019-04-08 에스케이텔레콤 주식회사 채널별 객체 검출 최적화를 위한 영상분석 방법 및 서버장치
WO2019117646A1 (ko) * 2017-12-15 2019-06-20 한국전자통신연구원 분산 처리 환경에서의 학습 파라미터의 압축 및 전송을 제공하는 방법 및 장치
KR20190072450A (ko) * 2017-12-15 2019-06-25 한국전자통신연구원 분산 처리 환경에서의 학습 파라미터의 압축 및 전송을 제공하는 방법 및 장치
WO2019124602A1 (ko) * 2017-12-21 2019-06-27 건국대학교 산학협력단 객체 추적 방법 및 이를 수행하는 장치들
WO2019132168A1 (ko) * 2017-12-28 2019-07-04 (주)휴톰 수술영상데이터 학습시스템
WO2019132459A1 (ko) * 2017-12-28 2019-07-04 주식회사 써로마인드로보틱스 사용자 정서적 행동 인식을 위한 멀티 모달 정보 결합 방법 및 그 장치
KR20190124600A (ko) * 2018-04-26 2019-11-05 한국전자통신연구원 신경망 학습에 기반한 적층형 다종 영상 객체 보호 장치, 시스템 및 방법
WO2020017814A1 (ko) * 2018-07-19 2020-01-23 엘지이노텍 주식회사 이상 개체 검출 시스템 및 방법
KR20200017131A (ko) * 2018-08-08 2020-02-18 전남대학교산학협력단 상태 분류기 생성 방법 및 이를 이용한 보행상태 판단 방법
KR20200017573A (ko) * 2018-07-24 2020-02-19 삼성전자주식회사 객체 인식 장치, 이를 포함하는 전자 장치 및 객체 인식 방법
KR102127171B1 (ko) * 2019-08-30 2020-06-26 주식회사 카카오뱅크 신분증 인식 모델을 이용한 분산 학습 방법, 서버, 어플리케이션 및 이를 통한 신분증 인식 방법
KR20200094089A (ko) * 2019-01-29 2020-08-06 도쿄엘렉트론가부시키가이샤 화상 인식 시스템 및 화상 인식 방법
KR20200104959A (ko) * 2019-02-27 2020-09-07 한국전력공사 분산 딥러닝 환경에서 데이터 압축 장치 및 방법
KR20200116279A (ko) * 2019-04-01 2020-10-12 주식회사 엘렉시 학습기반 데이터 처리 시스템 및 모델 갱신 방법
KR20200142487A (ko) * 2020-12-04 2020-12-22 주식회사 엘렉시 학습기반 데이터 처리 시스템 및 모델 갱신 방법
KR20210038051A (ko) 2019-09-30 2021-04-07 국방과학연구소 음성 복원 장치 및 그 방법, 그 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는 컴퓨터 판독 가능한 기록매체 및 컴퓨터 프로그램
KR20210104415A (ko) * 2020-02-17 2021-08-25 주식회사 텐덤 개인 맞춤형 커리어 추천 방법 및 서버
KR20220131774A (ko) * 2021-03-22 2022-09-29 유왕상 지우개 기능 및 후보자 리스트를 이용하여 인식율 개선에 필요한 인공지능 학습 데이터 수집 방법
KR102574645B1 (ko) 2023-06-15 2023-09-07 주식회사 이글루코퍼레이션 문답 형식의 보안 데이터를 이용한 인공지능 모델의 미세조정 장치 및 방법

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11694072B2 (en) 2017-05-19 2023-07-04 Nvidia Corporation Machine learning technique for automatic modeling of multiple-valued outputs
KR102586173B1 (ko) 2017-10-31 2023-10-10 삼성전자주식회사 프로세서 및 그 제어 방법
KR102561261B1 (ko) 2017-11-14 2023-07-28 삼성전자주식회사 커널을 이용한 컨볼루션 연산 처리 방법 및 장치
CN109472280B (zh) * 2018-09-10 2023-04-07 广东数相智能科技有限公司 一种更新物种识别模型库的方法、存储介质及电子设备
CN109119071A (zh) * 2018-09-26 2019-01-01 珠海格力电器股份有限公司 一种语音识别模型的训练方法及装置
TWI682325B (zh) * 2018-11-20 2020-01-11 新唐科技股份有限公司 辨識系統及辨識方法
US11069352B1 (en) * 2019-02-18 2021-07-20 Amazon Technologies, Inc. Media presence detection
CN110148081B (zh) * 2019-03-25 2024-02-23 腾讯科技(深圳)有限公司 图像处理模型的训练方法、图像处理方法、装置及存储介质
US11217245B2 (en) * 2019-08-29 2022-01-04 Sony Interactive Entertainment Inc. Customizable keyword spotting system with keyword adaptation
CN110619317B (zh) * 2019-09-26 2022-11-18 联想(北京)有限公司 模型训练方法、模型训练装置和电子设备
CN112702751A (zh) * 2019-10-23 2021-04-23 中国移动通信有限公司研究院 无线通信模型的训练和升级方法、网络设备及存储介质
CN110909543A (zh) * 2019-11-15 2020-03-24 广州洪荒智能科技有限公司 意图识别方法、装置、设备及介质
CN111177483A (zh) * 2019-12-04 2020-05-19 北京奇虎科技有限公司 终端设备的识别方法、设备及计算机可读存储介质
CN112965804A (zh) * 2021-03-25 2021-06-15 深圳市优必选科技股份有限公司 一种处理信息的方法、装置、终端、系统以及存储介质
US11887583B1 (en) * 2021-06-09 2024-01-30 Amazon Technologies, Inc. Updating models with trained model update objects
WO2023009721A1 (en) * 2021-07-30 2023-02-02 Electrifai, Llc Systems and methods for adapting machine learning models
CN114821252B (zh) * 2022-03-16 2023-05-26 电子科技大学 一种图像识别算法的自成长方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140257803A1 (en) * 2013-03-06 2014-09-11 Microsoft Corporation Conservatively adapting a deep neural network in a recognition system
US20150019214A1 (en) * 2013-07-10 2015-01-15 Tencent Technology (Shenzhen) Company Limited Method and device for parallel processing in model training

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US819531A (en) 1905-10-30 1906-05-01 Frank C Fisher Mouthpiece for telephones.
US6167377A (en) * 1997-03-28 2000-12-26 Dragon Systems, Inc. Speech recognition language models
US6456969B1 (en) * 1997-12-12 2002-09-24 U.S. Philips Corporation Method of determining model-specific factors for pattern recognition, in particular for speech patterns
JP3667332B2 (ja) * 2002-11-21 2005-07-06 松下電器産業株式会社 標準モデル作成装置及び標準モデル作成方法
US7574359B2 (en) * 2004-10-01 2009-08-11 Microsoft Corporation Speaker selection training via a-posteriori Gaussian mixture model analysis, transformation, and combination of hidden Markov models
GB2433150B (en) * 2005-12-08 2009-10-07 Toshiba Res Europ Ltd Method and apparatus for labelling speech
US20070150424A1 (en) 2005-12-22 2007-06-28 Pegasus Technologies, Inc. Neural network model with clustering ensemble approach
WO2008004666A1 (fr) * 2006-07-07 2008-01-10 Nec Corporation Dispositif, procédé et programme de reconnaissance vocale
KR100869554B1 (ko) 2007-02-23 2008-11-21 재단법인서울대학교산학협력재단 영역 밀도 표현에 기반한 점진적 패턴 분류 방법
US20110060587A1 (en) * 2007-03-07 2011-03-10 Phillips Michael S Command and control utilizing ancillary information in a mobile voice-to-speech application
JP2010009177A (ja) 2008-06-25 2010-01-14 Nec Corp 学習装置、ラベル予測装置、方法、及び、プログラム
JP5321596B2 (ja) 2008-10-21 2013-10-23 日本電気株式会社 統計モデル学習装置、統計モデル学習方法、およびプログラム
BRPI0823183B8 (pt) 2008-10-31 2021-06-22 Fundacio Inst Guttmann método e sistema implementado por computador para otimizar previsões para intervenções personalizadas para um determinado usuário em processos cujo substrato é a plasticidade neuronal.
EP2192575B1 (en) * 2008-11-27 2014-04-30 Nuance Communications, Inc. Speech recognition based on a multilingual acoustic model
JP5530729B2 (ja) * 2009-01-23 2014-06-25 本田技研工業株式会社 音声理解装置
JP5772825B2 (ja) 2010-07-07 2015-09-02 日本電気株式会社 画像処理学習装置、画像処理学習方法、および画像処理学習プログラム
US8918352B2 (en) 2011-05-23 2014-12-23 Microsoft Corporation Learning processes for single hidden layer neural networks with linear output units
US8620837B2 (en) * 2011-07-11 2013-12-31 Accenture Global Services Limited Determination of a basis for a new domain model based on a plurality of learned models
US8775167B2 (en) * 2011-09-26 2014-07-08 Adobe Systems Incorporated Noise-robust template matching
US9240184B1 (en) * 2012-11-15 2016-01-19 Google Inc. Frame-level combination of deep neural network and gaussian mixture models
US20140180974A1 (en) 2012-12-21 2014-06-26 Fair Isaac Corporation Transaction Risk Detection
DE102013206292A1 (de) 2013-04-10 2014-10-16 Robert Bosch Gmbh Verfahren und Vorrichtung zum Erstellen eines datenbasierten Funktionsmodells
EP2994846A4 (en) 2013-05-09 2017-01-25 Moodwire, Inc. Hybrid human machine learning system and method
US9715660B2 (en) * 2013-11-04 2017-07-25 Google Inc. Transfer learning for deep neural network based hotword detection
US9520127B2 (en) * 2014-04-29 2016-12-13 Microsoft Technology Licensing, Llc Shared hidden layer combination for speech recognition systems
US9785630B2 (en) * 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) * 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9846836B2 (en) * 2014-06-13 2017-12-19 Microsoft Technology Licensing, Llc Modeling interestingness with deep neural networks
US9690776B2 (en) * 2014-12-01 2017-06-27 Microsoft Technology Licensing, Llc Contextual language understanding for multi-turn language tasks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140257803A1 (en) * 2013-03-06 2014-09-11 Microsoft Corporation Conservatively adapting a deep neural network in a recognition system
US20150019214A1 (en) * 2013-07-10 2015-01-15 Tencent Technology (Shenzhen) Company Limited Method and device for parallel processing in model training

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190038137A (ko) * 2017-09-29 2019-04-08 에스케이텔레콤 주식회사 채널별 객체 검출 최적화를 위한 영상분석 방법 및 서버장치
KR101887415B1 (ko) * 2017-11-21 2018-08-10 주식회사 크라우드웍스 데이터 라벨링 작업 검수방법 및 프로그램
KR20190072450A (ko) * 2017-12-15 2019-06-25 한국전자통신연구원 분산 처리 환경에서의 학습 파라미터의 압축 및 전송을 제공하는 방법 및 장치
US11663476B2 (en) 2017-12-15 2023-05-30 Electronics And Telecommunications Research Institute Method and device for providing compression and transmission of training parameters in distributed processing environment
WO2019117646A1 (ko) * 2017-12-15 2019-06-20 한국전자통신연구원 분산 처리 환경에서의 학습 파라미터의 압축 및 전송을 제공하는 방법 및 장치
US11176680B2 (en) 2017-12-21 2021-11-16 Konkuk University Industrial Cooperation Corp Method of tracking object and apparatuses performing the same
WO2019124602A1 (ko) * 2017-12-21 2019-06-27 건국대학교 산학협력단 객체 추적 방법 및 이를 수행하는 장치들
WO2019132168A1 (ko) * 2017-12-28 2019-07-04 (주)휴톰 수술영상데이터 학습시스템
WO2019132459A1 (ko) * 2017-12-28 2019-07-04 주식회사 써로마인드로보틱스 사용자 정서적 행동 인식을 위한 멀티 모달 정보 결합 방법 및 그 장치
KR20190124600A (ko) * 2018-04-26 2019-11-05 한국전자통신연구원 신경망 학습에 기반한 적층형 다종 영상 객체 보호 장치, 시스템 및 방법
WO2020017814A1 (ko) * 2018-07-19 2020-01-23 엘지이노텍 주식회사 이상 개체 검출 시스템 및 방법
KR20200017573A (ko) * 2018-07-24 2020-02-19 삼성전자주식회사 객체 인식 장치, 이를 포함하는 전자 장치 및 객체 인식 방법
KR20200017131A (ko) * 2018-08-08 2020-02-18 전남대학교산학협력단 상태 분류기 생성 방법 및 이를 이용한 보행상태 판단 방법
KR20180138558A (ko) * 2018-10-10 2018-12-31 에스케이텔레콤 주식회사 객체 검출을 위한 영상분석 서버장치 및 방법
KR20200094089A (ko) * 2019-01-29 2020-08-06 도쿄엘렉트론가부시키가이샤 화상 인식 시스템 및 화상 인식 방법
KR20200104959A (ko) * 2019-02-27 2020-09-07 한국전력공사 분산 딥러닝 환경에서 데이터 압축 장치 및 방법
KR20200116279A (ko) * 2019-04-01 2020-10-12 주식회사 엘렉시 학습기반 데이터 처리 시스템 및 모델 갱신 방법
US11556760B2 (en) 2019-04-01 2023-01-17 Ellexi Co., Ltd. Learning-based data processing system and model update method
KR102127171B1 (ko) * 2019-08-30 2020-06-26 주식회사 카카오뱅크 신분증 인식 모델을 이용한 분산 학습 방법, 서버, 어플리케이션 및 이를 통한 신분증 인식 방법
WO2021040318A1 (ko) * 2019-08-30 2021-03-04 주식회사 카카오뱅크 신분증 인식 모델을 이용한 분산 학습 방법, 서버, 어플리케이션 및 이를 통한 신분증 인식 방법
US11741691B2 (en) 2019-08-30 2023-08-29 Kakaobank Corp. Distributed learning method, server and application using identification card recognition model, and identification card recognition method using the same
KR20210038051A (ko) 2019-09-30 2021-04-07 국방과학연구소 음성 복원 장치 및 그 방법, 그 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는 컴퓨터 판독 가능한 기록매체 및 컴퓨터 프로그램
KR20210104415A (ko) * 2020-02-17 2021-08-25 주식회사 텐덤 개인 맞춤형 커리어 추천 방법 및 서버
KR20200142487A (ko) * 2020-12-04 2020-12-22 주식회사 엘렉시 학습기반 데이터 처리 시스템 및 모델 갱신 방법
KR20220131774A (ko) * 2021-03-22 2022-09-29 유왕상 지우개 기능 및 후보자 리스트를 이용하여 인식율 개선에 필요한 인공지능 학습 데이터 수집 방법
KR102574645B1 (ko) 2023-06-15 2023-09-07 주식회사 이글루코퍼레이션 문답 형식의 보안 데이터를 이용한 인공지능 모델의 미세조정 장치 및 방법

Also Published As

Publication number Publication date
KR102601848B1 (ko) 2023-11-13
US10475442B2 (en) 2019-11-12
US20170148430A1 (en) 2017-05-25

Similar Documents

Publication Publication Date Title
KR20170061016A (ko) 데이터 인식 모델 구축 장치 및 방법과 데이터 인식 장치
US10762892B2 (en) Rapid deployment of dialogue system
CN106997370B (zh) 基于作者的文本分类和转换
CN107066464B (zh) 语义自然语言向量空间
US11227128B2 (en) Linguistically rich cross-lingual text event embeddings
WO2019153737A1 (zh) 用于对评论进行评估的方法、装置、设备和存储介质
US11482212B2 (en) Electronic device for analyzing meaning of speech, and operation method therefor
KR102656620B1 (ko) 전자 장치, 그의 제어 방법 및 비일시적 컴퓨터 판독가능 기록매체
CN110795552B (zh) 一种训练样本生成方法、装置、电子设备及存储介质
AU2016256753A1 (en) Image captioning using weak supervision and semantic natural language vector space
KR20190094315A (ko) 스타일을 고려하여 텍스트와 음성을 상호 변환하는 인공 지능 장치 및 그 방법
CN113268609B (zh) 基于知识图谱的对话内容推荐方法、装置、设备及介质
US11645479B1 (en) Method for AI language self-improvement agent using language modeling and tree search techniques
Arumugam et al. Hands-On Natural Language Processing with Python: A practical guide to applying deep learning architectures to your NLP applications
EP4125029A1 (en) Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium
KR20210155401A (ko) 인공 지능을 이용하여, 합성 음성의 품질을 평가하는 음성 합성 장치 및 그의 동작 방법
KR20210083986A (ko) 반지도 학습 기반 단어 단위 감정 임베딩과 lstm 모델을 이용한 대화 내에서 발화의 감정 분류 방법
Islam et al. A simple and mighty arrowhead detection technique of Bangla sign language characters with CNN
CN116541492A (zh) 一种数据处理方法及相关设备
KR102198295B1 (ko) 복수의 대화 도메인을 가지는 대화 시스템
US20240037335A1 (en) Methods, systems, and media for bi-modal generation of natural languages and neural architectures
US20210337274A1 (en) Artificial intelligence apparatus and method for providing visual information
KR20230120790A (ko) 가변적 언어모델을 이용한 음성인식 헬스케어 서비스
Gorbunova et al. Intelligent analysis of technical support requests in Service Desk ticketing systems
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant