KR20220133414A - 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치 - Google Patents
음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치 Download PDFInfo
- Publication number
- KR20220133414A KR20220133414A KR1020210038469A KR20210038469A KR20220133414A KR 20220133414 A KR20220133414 A KR 20220133414A KR 1020210038469 A KR1020210038469 A KR 1020210038469A KR 20210038469 A KR20210038469 A KR 20210038469A KR 20220133414 A KR20220133414 A KR 20220133414A
- Authority
- KR
- South Korea
- Prior art keywords
- utterance
- utterances
- recommended
- electronic device
- list
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000004891 communication Methods 0.000 claims description 55
- 238000007726 management method Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000013500 data storage Methods 0.000 description 9
- 238000013473 artificial intelligence Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 238000013480 data collection Methods 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003155 kinesthetic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/686—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/64—Browsing; Visualisation therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
전자 장치의 음성 어시스턴트 서비스 제공 방법은 음성 어시스턴트 업데이트를 감지하는 동작; 업데이트된 리스트 상에 지원 가능한 발화가 존재하는지 여부를 판단하는 동작; 상기 업데이트된 리스트 상에 지원 가능한 발화가 존재하면, 데이터 베이스에 저장된 발화와 상기 업데이트된 리스트를 비교하여 일치된 발화가 존재하는지 여부를 판단하는 동작; 상기 일치된 발화가 존재하면, 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작; 및 상기 추천 발화 리스트에 기반하여 발화를 추천하는 동작을 포함할 수 있다.
Description
본 발명의 다양한 실시예는 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치에 관한 것이다.
음성 어시스턴트를 포함하는 인공지능 에이전트(artificial intelligence agent)는 사용자가 요청한 작업을 수행하고, 요청된 작업에 따라서, 정보 또는 서비스를 제공할 수 있다. 인공지능 에이전트 서비스는 사용자의 발화를 이해하고 발화 의도에 따른 서비스를 제공할 수 있다.
인공지능 에이전트는 사용자에게 가능한 기능을 가장 일반적인 표현의 '대표 발화' 로 사용법을 안내하지만, 실사용 환경에서 사용자는 자신의 평소 발화 습관에 기반하여 다양한 발화를 이용하여 인공지능 에이전트를 이용할 수 있다.
사용자의 다양한 발화 양태에 따라, 음성 어시스턴트가 작업을 수행하지 못할 수 있다. 다만, 음성 어시스턴트는 업데이트를 통해 사용자가 자주 쓰는 패턴과 다양한 기능을 보완하지만, 사용자는 자신이 실패했던 발화가 보완되었다는 사실을 알 수 없다.
본 발명의 다양한 실시예에 따른 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치는 음성 어시스턴트에 발화했던 내용과 결과를 저장하고 추후 음성 어시스턴트의 업데이트로 인해 지원 가능한 발화가 있다면 사용자에게 지원 가능한 발화를 추천하고 알려주는데 목적이 있다.
본 발명의 다양한 실시예에 따른 전자 장치의 음성 어시스턴트 서비스 제공 방법은 음성 어시스턴트 업데이트를 감지하는 동작; 업데이트된 리스트 상에 지원 가능한 발화가 존재하는지 여부를 판단하는 동작; 상기 업데이트된 리스트 상에 지원 가능한 발화가 존재하면, 데이터 베이스에 저장된 발화와 상기 업데이트된 리스트를 비교하여 일치된 발화가 존재하는지 여부를 판단하는 동작; 상기 일치된 발화가 존재하면, 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작; 및 상기 추천 발화 리스트에 기반하여 발화를 추천하는 동작을 포함할 수 있다.
본 발명의 다양한 실시예에 따른 전자 장치는 통신 모듈; 디스플레이 모듈; 메모리; 및 프로세서를 포함하며, 상기 프로세서는 음성 어시스턴트 업데이트를 감지하고, 업데이트된 리스트 상에 지원 가능한 발화가 존재하는지 여부를 판단하며, 상기 업데이트된 리스트 상에 지원 가능한 발화가 존재하면, 데이터 베이스에 저장된 발화와 상기 업데이트된 리스트를 비교하여 일치된 발화가 존재하는지 여부를 판단하고, 상기 일치된 발화가 존재하면, 상기 일치된 발화를 추천 발화 리스트로 상기 메모리에 저장하도록 제어하며, 상기 추천 발화 리스트에 기반하여 발화를 추천할 수 있다.
본 발명의 다양한 실시예에 따른 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치는 기능 개선을 통해서 지원 가능해진 발화가 있으면 추천함으로써, 사용자의 음성 어시스턴트 서비스의 활용도를 높일 수 있다.
도 1은 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는 본 발명의 다양한 실시예에 따른 전자 장치와 서버를 포함하는 음성 어시스턴트를 나타내는 도면이다.
도 3은 본 발명의 다양한 실시예에 따른 전자 장치의 사용자 발화 관리 모듈을 나타내는 블록도이다.
도 4는 본 발명의 다양한 실시예에 따른 발화 추천 모듈을 나타내는 블록도이다.
도 5는 본 발명의 다양한 실시예에 따른 전자 장치의 음성 어시스턴트 서비스 제공 방법을 나타내는 순서도이다.
도 6은 본 발명의 다양한 실시예에 따른 전자 장치의 음성 어시스턴트 서비스 제공 방법을 나타내는 순서도이다.
도 7은 본 발명의 다양한 실시예에 따른 전자 장치의 발화 추천을 나타내는 도면이다.
도 8은 본 발명의 다양한 실시예에 따른 전자 장치의 발화 추천을 나타내는 도면이다.
도 2는 본 발명의 다양한 실시예에 따른 전자 장치와 서버를 포함하는 음성 어시스턴트를 나타내는 도면이다.
도 3은 본 발명의 다양한 실시예에 따른 전자 장치의 사용자 발화 관리 모듈을 나타내는 블록도이다.
도 4는 본 발명의 다양한 실시예에 따른 발화 추천 모듈을 나타내는 블록도이다.
도 5는 본 발명의 다양한 실시예에 따른 전자 장치의 음성 어시스턴트 서비스 제공 방법을 나타내는 순서도이다.
도 6은 본 발명의 다양한 실시예에 따른 전자 장치의 음성 어시스턴트 서비스 제공 방법을 나타내는 순서도이다.
도 7은 본 발명의 다양한 실시예에 따른 전자 장치의 발화 추천을 나타내는 도면이다.
도 8은 본 발명의 다양한 실시예에 따른 전자 장치의 발화 추천을 나타내는 도면이다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다. 도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108) 중 적어도 하나와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제 2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제 2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
도 2는 본 발명의 다양한 실시예에 따른 전자 장치(101)와 서버(108)를 포함하는 음성 어시스턴트(voice assistant, 200)를 나타내는 도면이다.
음성 어시스턴트(200)는 전자 장치(101) 및 서버(108)를 포함할 수 있다.
전자 장치(101)는 사용자 발화 관리 모듈(210), 음성 어시스턴트 클라이언트(220), 데이터 저장부(230) 및/또는 발화 추천 모듈(240)을 포함할 수 있다.
사용자 발화 관리 모듈(210)은 프로세서(예: 도 1의 프로세서(120))의 제어 하에 전자 장치(101) 및/또는 음성 어시스턴트(200) 상에 발화된 음성 명령과 음성 명령에 따른 결과를 데이터 저장부(230)에 저장하도록 제어할 수 있다. 사용자가 전자 장치(101) 및/또는 음성 어시스턴트(200)에 음성 명령을 발화한 경우, 사용자 발화 관리 모듈(210)은 프로세서(120)의 제어 하에 해당 발화와 발화에 기반하여 음성 어시스턴트(200)가 실행한 작업(task)을 저장할 수 있다.
예를 들어, 사용자가 전자 장치(101) 및/또는 음성 어시스턴트(200)에 "오늘 날씨 어때?"와 같은 음성 명령을 발화한 경우, 전자 장치(101) 및/또는 음성 어시스턴트(200)는 "서울의 9월 25일 날씨는 화창하겠습니다."와 같은 답변을 결과로서 제공할 수 있다. 이때, 사용자 발화 관리 모듈(210)은 "오늘 날씨 어때?"와 같은 발화와 이 발화에 대응하는 결과인 "서울의 9월 25일 날씨는 화창하겠습니다."를 데이터 저장부(230)에 저장하도록 할 수 있다.
다양한 실시예에서, 사용자 발화 관리 모듈(210)은 프로세서(120)의 제어 하에 발화와 관련된 정보를 저장하거나 분석할 수 있다.
음성 어시스턴트 클라이언트(220)는 프로세서(120)의 제어 하에 통신 모듈(190)을 이용하여 사용자의 음성을 서버(108)로 전송할 수 있다.
전자 장치(101)는 통신 모듈(190)을 이용하여 서버(108)로부터 발화에 대한 결과로 전자 장치(101)에 포함된 어플리케이션을 실행하는 명령이나, 기능을 실행하는 명령을 전달받을 수 있다. 음성 어시스턴트 클라이언트(220)는 서버(108)로부터 수신한 명령을 어플리케이션 및/또는 기능에 전달할 수 있다.
데이터 저장부(230)는 메모리(130)일 수 있다. 데이터 저장부(230)는 사용자 발화 관리 모듈(210)에 의해 관리되는 발화된 음성 명령과 음성 명령에 따른 결과를 데이터 베이스(database)로서 저장할 수 있다. 데이터 저장부(230)는 사용자 발화 관리 모듈(210)에 의해 관리되는 발화와 관련하여 분석된 정보를 저장할 수 있다. 데이터 저장부(230)는 사용자 발화 관리 모듈(210)에 의해 관리되는 데이터 베이스를 저장할 수 있다. 데이터 저장부(230)는 음성 어시스턴트 클라이언트(220)로부터 실행 결과에 대응하는 기능 및/또는 정보를 데이터 저장부(230)에 포함된 사용자 발화 관리 모듈(210)에 의해 관리되는 데이터 베이스에 저장할 수 있다.
음성 어시스턴트(200)가 업데이트 될 때, 발화 추천 모듈(240)은 업데이트된 리스트(updated list, 261)를 서버(108)의 업데이트 매니저(260)로부터 통신 모듈(190)을 이용하여 수신할 수 있다.
발화 추천 모듈(240)은 수신된 업데이트된 리스트(261)가 사용자 발화 관리 모듈(210)에 의해 관리되는 데이터 베이스에 있는 발화와 비교하여, 일치되는 발화가 존재하는지 여부를 판단할 수 있다.
발화 추천 모듈(240)은 업데이트된 리스트(261)와 미리 저장된 사용자 발화 중 일치하는 발화 및 우선 순위에 기반하여 발화 추천의 우선순위를 결정할 수 있다.
발화 추천 모듈(240)은 사용자가 전자 장치(101)를 통해 제공받는 모든 예시 발화 (예를 들어, 추천 발화, 힌트, 또는 매뉴얼 예시)를 일괄 관리할 수 있다. 모든 예시 발화 (예를 들어, 추천 발화, 힌트, 또는 매뉴얼 예시)는 전자 장치(101)의 디스플레이 모듈(160) 상에 사용자 인터페이스로 표시될 수 있다.
발화 추천 모듈(240)은 발화 추천 우선순위를 통해 결정된 신규 추천 발화를 추천 발화 데이터에 기록할 수 있다. 발화 추천 모듈(240)은 추천 발화 데이터에 업데이트 된 내용을 디스플레이 모듈(160) 상에 사용자 인터페이스(user interface, UI)로 표시할 수 있다.
서버(108)는 입력 인식 모듈(250), 업데이트 매니저(260) 및/또는 실행 모듈(270)을 포함할 수 있다.
입력 인식 모듈(250)은 ASR(automatic speech recognition, 251) 및 NLU(natural language understanding, 252) 중 적어도 하나 이상을 포함할 수 있다.
ASR(251)은 음성 어시스턴트 클라이언트(220)로부터 전달받은 사용자 발화를 포함하는 음성 데이터를 NLU(252)가 분석 가능한 텍스트(text) 데이터로 변환할 수 있다.
NLU(252)는 ASR(251)로부터 전달받은 텍스트 데이터를 기반으로 발화의 도메인(domain), 발화의 의도(intent) 또는 파라미터(parameter) 중 적어도 하나 이상을 추출할 수 있다.
다양한 실시예에서, NLU(252)는 ASR(251)로부터 전달받은 텍스트 데이터를 기반으로 발화의 도메인(domain), 발화의 의도(intent) 또는 파라미터(parameter) 중 적어도 하나 이상을 확인할 수 있다.
의도는 전자 장치(101)(또는, 서버(108))가 수행할 동작을 의미할 수 있고, 파라미터는 해당 동작을 수행할 때 필요한 인자를 의미할 수 있다.
예를 들어, NLU(252)는 ASR(251)로부터 텍스트 데이터(예:"오늘 날씨 어때?")를 수신할 수 있다. NLU(252)는 텍스트 데이터에 포함된 '날씨' 로부터 이 발화가 날씨에 관한 도메인에 속하는 것을 확인할 수 있다. NLU(252)는 이 발화로부터 사용자가 날씨에 관한 것을 묻는 사용자 의도를 확인할 수 있다. NLU(252)는 이 발화로부터 "오늘"이라는 파라미터를 추출할 수 있다.
실행 모듈(270)은 입력 인식 모듈(250)로부터 확인된 발화를 기반으로 실행 결과를 생성할 수 있다. 실행 모듈(270)은 입력 인식 모듈(250)로부터 확인된 발화의 도메인, 발화의 의도 또는 파라미터 중 적어도 하나 이상에 기반하여 실행 결과를 생성할 수 있다. 실행 모듈(270)은 실행 결과에 대응하는 기능 및/또는 정보를 확인하고, 사용자가 이해할 수 있는 언어로 변환하여 음성 어시스턴트 클라이언트(220)로 전달할 수 있다. 실행 모듈(270)은 실행 결과에 대응하는 기능 및/또는 정보를 확인하고 음성 어시스턴트 클라이언트(220)로 전달할 수 있다. 예를 들어, 실행 모듈(270)은 "서울의 9월 25일 날씨는 화창하겠습니다."와 같은 답변을 결과로서 음성 어시스턴트 클라이언트(220)로 제공할 수 있다. 음성 어시스턴트 클라이언트(220)는 실행 모듈(270)로부터 전달받은 실행 결과에 대응하는 기능 및/또는 정보를 데이터 저장부(230)에 저장할 수 있다.
업데이트 매니저(260)는 업데이트된 리스트(261) 및 테스트 케이스 매니저(test case manager, 262)를 포함할 수 있다.
업데이트 매니저(260)는 음성 어시스턴트 클라이언트 레벨에서 감지한 이슈를 수신 받아 테스트 케이스 매니저(test case manager, 262)에서 관리하도록 할 수 있다
업데이트 매니저(260)는 음성 어시스턴트(200)에 신규 개선 사항이 있으면, 업데이트 사항을 관리할 수 있다.
업데이트 매니저(260)는 신규 기능이 추가되면 신규 기능을 처리할 수 있는 발화의 범위를 테스트 케이스 매니저(262)를 이용하여 관리할 수 있다.
테스트 케이스 매니저(262)는 발화의 성공여부를 확인하고, 테스트 케이스 매니저(262)를 통과한 지원 발화는 업데이트된 리스트(261)에 저장될 수 있다.
업데이트된 리스트(261)는 전자 장치(101)의 발화 추천 모듈(240)로 전달될 수 있다. 다양한 실시예에서, 음성 어시스턴트(200)의 업데이트가 있으면, 업데이트된 리스트(261)는 전자 장치(101)의 발화 추천 모듈(240)로 전달될 수 있다.
사용자 발화 관리 모듈(210)은 이슈 우선 순위가 미리 정해진 기준 이상인 발화가 미리 정해진 개수 이상이면, 통신 모듈(190)을 통해 업데이트 매니저(260)로 문제가 발생한 발화를 전송할 수 있다.
업데이트 매니저(260)는 문제가 발생한 발화를 사용자 발화 관리 모듈(210)로부터 전달받고, 문제가 발생한 발화는 업데이트 매니저(260)의 테스트 케이스 매니저(262)를 통해 관리할 수 있다.
도 3은 본 발명의 다양한 실시예에 따른 전자 장치(101)의 사용자 발화 관리 모듈(210)을 나타내는 블록도이다.
사용자 발화 관리 모듈(210)은 데이터 수집 모듈(211), 데이터 판단 모듈(212), 이슈 우선 순위 판단 모듈(213) 및/또는 이슈 송신 모듈(214)을 포함할 수 있다.
데이터 수집 모듈(211)은 사용자 발화와 사용자 발화에 따른 실행 결과를 표 1과 같은 데이터베이스에 기반하여 데이터를 수집할 수 있다.
최신 타임스탬프 | 발화 | 목표 | 빈도 | 실패여부 | 이슈 우선 순위 | 발화 추천 우선 순위 |
20200925 10:00 | 오늘 날씨 어때 | Weather | 100 | PASS | NA | NA |
20200925 09:00 | 네비게이션 연결해줘 | Rejection | 5 | FAIL | 1 | 1 |
표 1에서, 최신 타임스탬프(latest timestamp)는 사용자가 해당 발화를 마지막으로 한 시간을 나타내는 필드일 수 있다. 같은 발화를 여러 번 했을 경우 가장 마지막에 발화한 시간을 나타낼 수 있다. 예를 들어, 사용자가 "오늘 날씨 어때?"라는 발화를 2020년 9월 25일 오전 10시에 발화했다면, 데이터 수집 모듈(211)은 데이터베이스에 20200925 10:00로 최신 타임스탬프에 저장할 수 있다. 표 1에서, 발화(utterance)는 사용자의 발화 내용을 저장하는 필드로, 예를 들어, 오늘 날씨 어때가 기록될 수 있다.
표 1에서, 목표(goal)는 사용자 발화에 대응하는 기능 실행 결과를 저장하는 필드로서, 예를 들어, 날씨(weather)를 알려주는 기능이 수행되었음을 나타내는 로그 정보를 포함할 수 있다.
표 1에서, 빈도는 사용자의 발화 빈도를 저장하는 필드로서, 동일한 발화가 반복해서 수신될 때마다 최신 타임스탬프와 같이 저장(또는 업데이트)될 수 있다. 예를 들어, 사용자로부터 "오늘 날씨 어때?"발화를 100번째 수신하면, 숫자 100이 기록될 수 있다.
데이터 판단 모듈(212)은 데이터 수집 모듈(211)을 통해 수집된 데이터의 실행 결과를 통해 사용자 발화의 성공 및/또는 실패 여부를 판단할 수 있다. 예를 들어, 음성 어시스턴트(200)가 지원하지 못하는 기능이면, 최신 타임스탬프, 발화, 및 빈도에 관한 필드에 데이터가 저장되고 목표 필드에는 해당 발화를 수행하지 못한 결과로서, 거절(rejection)이 저장될 수 있다. 예를 들어, 음성 어시스턴트(200)가 지원하는 기능이면, 최신 타임스탬프, 발화, 및 빈도에 관한 필드에 데이터가 저장되고 목표 필드에는 실행된 결과가 저장될 수 있다.
데이터 판단 모듈(212)은 실패여부 판단 조건에 기반하여 실행결과의 성공 및/또는 실패를 판단할 수 있다. 실패여부 판단 조건은 실행 결과가 명백하게 실패인 경우, 지원하지 않는 발화로 에러 처리된 경우, 서로 유사도가 큰 발화 간에 실행결과가 상이한 경우 중 적어도 하나에 경우일 수 있다. 예를 들어, 유사도가 큰 발화 간에 실행결과가 상이한 경우는 발화의 도메인이 다른 경우 및/또는 발화의 도메인이 같으나 목표(goal)가 다른 경우일 수 있다.
다양한 실시예에서, 데이터 판단 모듈(212)은 실행 결과가 명백하게 실패인 경우, 지원하지 않는 발화로 에러 처리된 경우, 서로 유사도가 큰 발화 간에 실행결과가 상이한 경우 중 적어도 하나에 해당하는 경우에 실행결과를 실패여부 필드에 실패(FAIL)로 기록할 수 있다.
예를 들어, 음성 어시스턴트(200)가 지원하지 못하는 기능이면, 데이터 판단 모듈(212)은 지원하지 않는 발화로 에러 처리된 경우로 판단하여 실행결과를 실패로 기록할 수 있다.
이슈 우선 순위 판단 모듈(213)은 데이터 수집 모듈(211)을 통해 수집된 데이터를 기반으로 이슈 우선 순위를 판단하고 이슈 우선 순위 필드에 기록할 수 있다.
이슈 우선 순위 판단 모듈(213)은 최신 타임스탬프, 목표, 실패여부 판단 조건 및/또는 빈도에 관한 데이터에 기반하여 우선순위를 판단하고, 이슈 우선 순위 필드에 이슈 우선 순위를 저장할 수 있다. 이슈는 발화의 문제 발생을 의미하며, 이슈 우선 순위는 발화의 문제 관리의 우선 순위를 의미할 수 있다. 이슈 우선 순위 판단 모듈(213)은 최신 타임스탬프, 목표, 실패여부 판단 조건 및/또는 빈도에 관한 데이터에 기반하여 발화의 문제 관리의 우선 순위를 판단할 수 있다.
이슈 우선 순위 판단 모듈(213)은 성공 발화로 판단된 발화의 경우, 이슈 우선 순위를 판단하는데 있어 제외할 수 있고, 실패 여부 판단 조건에 의해 실패(FAIL)로 기록된 발화들 중에서 우선 순위가 기록될 수 있다.
이슈 송신 모듈(214)은 이슈 우선 순위가 미리 정해진 기준 이상인 발화가 미리 정해진 개수 이상이면, 통신 모듈(190)을 통해 업데이트 매니저(260)로 발화를 전송할 수 있다.
도 4는 본 발명의 다양한 실시예에 따른 발화 추천 모듈(240)을 나타내는 블록도이다.
발화 추천 모듈(240)은 발화 비교 모듈(241), 발화 추천 우선 순위 관리 모듈(242) 및/또는 추천 발화 관리 모듈(243)을 포함할 수 있다.
발화 비교 모듈(241)은 업데이트 매니저(260)로부터 수신된 업데이트된 리스트(261)와 데이터베이스에 저장된 발화에 대응하는 내용이 있는지 여부를 판단할 수 있다.
발화 추천 우선 순위 관리 모듈(242)은 수신된 업데이트된 리스트(261)와 데이터베이스에 저장된 발화에 대응하는 발화 중 최신 타임스탬프, 빈도, 또는 이슈 우선 순위에 관한 필드에 저장된 데이터에 기반하여 발화 추천 우선 순위를 결정할 수 있다. 추천 발화 관리 모듈(243)은 발화 추천 우선 순위를 결정하고, 발화 추천 우선 순위 필드에 발화 추천 우선 순위를 저장할 수 있다.
표 1을 참조하면, "네비게이션 연결해줘"에 관한 기능 지원을 포함하는 업데이트된 리스트(261)를 수신하면, 발화 추천 우선 순위 관리 모듈(242)은 "네비게이션 연결해줘"에 대해 발화 추천 우선 순위를 결정하고, 발화 추천 우선 순위 필드에 발화 추천 우선 순위를 저장할 수 있다.
추천 발화 관리 모듈(243)은 사용자가 전자 장치(101)를 통해 제공받을 수 있는 모든 예시 발화를 관리할 수 있다. 추천 발화 관리 모듈(243)은 발화 추천 우선 순위를 통해 결정된 신규 추천 발화 및/또는 추천 발화 리스트를 표 2와 같이 저장할 수 있다.
추천 영역 | 발화 | 목표 | 최근 업데이트 일자 |
힌트(hint) | 알람 맞춰줘 | Clock | 20210101 |
메인 화면 | 네비게이션 연결해줘 | navigation | 20210101 |
팁카드(tipcard) | 메모리 정리 | system | 20210101 |
추천 발화 관리 모듈(243)은 추천 발화 데이터를 기반하여 디스플레이 모듈(160) 상에 사용자 인터페이스를 표시할 수 있다.
도 5는 본 발명의 다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법을 나타내는 순서도이다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 501 동작에서, 사용자 발화 입력을 감지할 수 있다. 다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 입력 모듈(150)을 통해 사용자 발화 입력을 감지할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 503 동작에서, 감지된 사용자 발화 입력과 동일한 발화가 존재하는지 여부를 판단할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 503 동작에서, 감지된 사용자 발화 입력과 동일한 발화가 존재하는지 여부를 판단하는 동작은 감지된 사용자 발화와 변환된 텍스트 데이터가 모두 동일한 발화인지를 판단하는 동작일 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 503 동작에서, 감지된 사용자 발화 입력과 동일한 발화가 존재하는지 여부를 판단하는 동작은 감지된 사용자 발화 입력과 이전의 발화가 상이하여도 발화의 도메인(domain), 발화의 의도(intent) 및/또는 파라미터(parameter)가 동일한 발화로 판단되면 감지된 사용자 발화 입력과 동일한 발화로 판단할 수 있다.
예를 들어, 전자 장치(101)는, 프로세서(120)의 제어 하에, 503 동작에서, 이전의 발화가 '오늘 날씨는?(What is the weather today?)" 이고, 감지된 발화가 '오늘 날씨 어때?(How is the weather today?)"로 발화의 변화(variation)이 있고, 완전히 동일하지 않아도 발화의 도메인(domain), 발화의 의도(intent) 및/또는 파라미터(parameter)가 동일한 발화로 판단되면 감지된 사용자 발화 입력과 동일한 발화로 판단할 수 있다.
전자 장치(101)는 감지된 사용자 발화 입력과 동일한 발화가 존재하면(동작 503 - '예'), 프로세서(120)의 제어 하에, 503 동작에서 505 동작으로 분기할 수 있다.
전자 장치(101)는 감지된 사용자 발화 입력과 동일 발화가 존재하지 않으면(동작 503 - '아니오'), 프로세서(120)의 제어 하에, 503 동작에서 515 동작으로 분기할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 505 동작에서, 데이터 베이스를 업데이트할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 505 동작에서, 감지된 사용자 발화 입력과 동일한 발화가 존재하면 사용자 발화를 데이터베이스에 저장 및/또는 업데이트할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 505 동작에서, 감지된 사용자 발화 입력과 동일한 발화가 존재하면 사용자 발화 관리 모듈(210)을 이용하여 사용자 발화를 데이터베이스에 저장 및/또는 업데이트할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 505 동작에서, 데이터 베이스를 업데이트 할 때, 발화 필드, 목표 필드 및/또는 최근 타임스탬프 필드가 업데이트될 수 있다. 이때, 동일한 발화가 존재하면, 전자 장치(101)는, 프로세서(120)의 제어 하에, 505 동작에서, 사용자 발화에 기반하여 미리 저장된 발화의 빈도 필드와 최근 타임스탬프 필드를 업데이트할 수 있다.
전자 장치(101)는 감지된 사용자 발화 입력과 동일한 발화가 존재하지 않으면, 프로세서(120)의 제어 하에, 515 동작에서, 데이터 베이스에 신규 발화를 추가할 수 있다. 이때, 빈도 필드는 1로 기록될 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 507 동작에서, 사용자 발화에 대응하는 동작 결과에 따라 성공 여부를 판단할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 507 동작에서, 사용자 발화에 대응하는 동작은 실패여부 판단 조건에 기반하여 성공 여부를 판단할 수 있다. 실패여부 판단 조건은 실행 결과가 명백하게 실패인 경우, 지원하지 않는 발화로 에러 처리된 경우, 서로 유사도가 큰 발화 간에 실행결과가 상이한 경우 중 적어도 하나일 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 507 동작에서, 사용자 발화에 대응하는 동작 결과가 성공한 경우 데이터 베이스의 실패 여부 필드에 패스(pass)로 기록할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 507 동작에서, 사용자 발화에 대응하는 동작 결과가 실패한 경우 데이터 베이스의 실패 여부 필드에 실패(fail)로 기록할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 509 동작에서, 실패로 기록된 발화들의 우선 순위를 판단하여 데이터 베이스에 이슈 우선 순위 필드에 이슈 우선 순위를 업데이트할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 511 동작에서, 이슈 우선 순위에 기반하여 실패한 발화가 미리 정해진 개수 이상인지 여부를 판단할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 511 동작에서, 데이터 베이스에 저장된 이슈 우선 순위에 기반하여 미리 정해진 순위 이상의 실패한 발화가 미리 정해진 개수 이상인지 여부를 판단할 수 있다.
전자 장치(101)는 실패한 발화가 미리 정해진 개수 이상이면(동작 511 - '예'), 프로세서(120)의 제어 하에, 511 동작에서 513 동작으로 분기할 수 있다.
전자 장치(101)는 실패한 발화가 미리 정해진 개수 미만이면(동작 511 - '아니오'), 프로세서(120)의 제어 하에, 511 동작에서 517 동작으로 분기할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 513 동작에서, 실패한 발화 리스트를 서버(108)로 전송할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 517 동작에서, 사용자 발화 관리 동작을 중지할 수 있다.
도 6은 본 발명의 다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법을 나타내는 순서도이다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 601 동작에서, 음성 어시스턴트 업데이트를 감지할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 601 동작에서 통신 모듈(190)을 통해 서버(108)로부터 수신된 음성 어시스턴트 업데이트를 감지할 수 있다. 음성 어시스턴트 업데이트는 서버(108)의 업데이트 매니저(260)로부터 전달되는 업데이트된 리스트(261)를 포함할 수 있다. 음성 어시스턴트 업데이트는 전자 장치(101)에서 음성 어시스턴트 성능 개선에 관한 정보를 포함할 수 있다. 업데이트된 리스트(261)는 음성 어시스턴트 서비스에서 지원 가능한 사용자 발화 리스트를 포함할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 603 동작에서, 업데이트된 리스트(261)가 존재하는지 여부를 판단할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 603 동작에서, 업데이트된 리스트(261) 상에 지원 가능한 발화가 존재하는지 여부를 판단할 수 있다.
전자 장치(101)는 업데이트된 리스트(261)가 존재하면(동작 603 - '예'), 프로세서(120)의 제어 하에 603 동작에서 605 동작으로 분기할 수 있다.
전자 장치(101)는 업데이트된 리스트(261)가 없으면(동작 603 - '아니오'), 프로세서(120)의 제어 하에 603 동작에서 613 동작으로 분기할 수 있다.
다양한 실시예에서, 전자 장치(101)는 업데이트된 리스트(261) 상에 지원 가능한 발화가 존재하면, 프로세서(120)의 제어 하에 603 동작에서 605 동작으로 분기할 수 있다.
다양한 실시예에서, 전자 장치(101)는 업데이트된 리스트(261) 상에 지원 가능한 발화가 없으면, 프로세서(120)의 제어 하에 603 동작에서 613 동작으로 분기할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 605 동작에서, 저장된 발화와 업데이트된 리스트(261)를 비교할 수 있다. 저장된 발화는 데이터 베이스의 발화 필드에 저장된 데이터일 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 607 동작에서, 일치된 발화가 존재하는지 여부를 판단할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 607 동작에서, 저장된 발화와 업데이트된 리스트(261)를 비교하여 일치된 발화가 존재하는지 여부를 판단할 수 있다. 전자 장치(101)는, 프로세서(120)의 제어 하에, 저장된 발화와 업데이트된 리스트(261)를 비교하여 업데이트된 리스트(261) 상에 포함된 지원 가능한 발화에 저장된 발화가 대응하는지 여부를 판단할 수 있다.
저장된 발화와 업데이트된 리스트(261)를 비교하여 일치된 발화가 존재하면(동작 607 - '예'), 전자 장치(101)는 프로세서(120)의 제어 하에, 607 동작에서 609 동작으로 분기할 수 있다.
저장된 발화와 업데이트된 리스트(261)를 비교하여 일치된 발화가 없으면(동작 607 - '아니오'), 전자 장치(101)는 프로세서(120)의 제어 하에, 607 동작에서 613 동작으로 분기할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 613 동작에서, 발화 추천 동작을 중지할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 609 동작에서, 일치된 발화를 추천 발화 리스트로 저장할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 609 동작에서, 저장된 발화와 업데이트된 리스트(261)를 비교하여 일치된 발화의 개수가 미리 정해진 개수 이상이면, 데이터베이스에 저장된 발화 추천 우선 순위에 기반하여 일치된 발화를 추천 발화 리스트로 저장할 수 있다. 추천 발화 리스트는 표 2의 신규 추천 발화 및/또는 추천 발화 리스트와 동일할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 609 동작에서, 저장된 발화와 업데이트된 리스트(261)를 비교하여 일치된 발화의 개수가 미리 정해진 개수 이상이면, 미리 정해진 순위 이내의 일치된 발화만을 추천 발화 리스트로 저장할 수 있다.
다양한 실시예에서, 전자 장치(101)는 수신된 업데이트된 리스트(261)와 데이터베이스에 저장된 발화에 대응하는 발화 중 최신 타임스탬프, 빈도, 또는 이슈 우선 순위에 관한 필드에 저장된 데이터에 기반하여 발화 추천 우선 순위를 결정할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 609 동작에서, 저장된 발화와 업데이트된 리스트(261)를 비교하여 일치된 발화의 개수가 미리 정해진 개수 미만이면, 일치된 발화를 전부를 추천 발화 리스트로 저장할 수 있다.
전자 장치(101)는, 프로세서(120)의 제어 하에, 611 동작에서, 추천 발화 리스트에 기반하여 발화를 추천할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 611 동작에서, 추천 발화 리스트에 기반하여 추천 발화를 디스플레이 모듈(160) 상에 표시할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 611 동작에서, 추천 발화 리스트에 기반하여 추천 발화를 디스플레이 모듈(160) 상에 사용자 인터페이스로 표시할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 611 동작에서, 사용자 인터페이스에 추천 발화를 힌트(hint)로서 사용자에게 제공할 수 있다.
다양한 실시예에서, 전자 장치(101)는, 프로세서(120)의 제어 하에, 611 동작에서, 추천 발화가 복수 개이면, 추천 발화 영역(또는 사용자 인터페이스)에 미리 정해진 시간 간격으로 복수의 추천 발화를 전환하면서 디스플레이 모듈(160) 상에 표시할 수 있다.
도 7은 본 발명의 다양한 실시예에 따른 전자 장치(101)의 발화 추천을 나타내는 도면이다.
전자 장치(101)는 저장된 발화와 업데이트된 리스트(261)를 비교하여 일치된 발화를 추천 발화 리스트로 메모리(130)에 저장할 수 있다.
사용자가 전자 장치(101) 상에서 음성 어시스턴트(200)를 실행하면, 전자 장치(101)는 지원 가능한 발화를 추천하여 디스플레이 모듈(160) 상에 표시할 수 있다. 전자 장치(101)는 음성 어시스턴트(200)의 업데이트 전에 지원하지 않았던 발화를 업데이트 후에 지원 가능하면 추천 발화로 디스플레이 모듈(160) 상에 표시할 수 있다.
예를 들어, 음성 어시스턴트(200)의 업데이트 전에 지원하지 않았던 "네비게이션 연결해줘"와 같은 발화를 추천 발화로 디스플레이 모듈(160) 상에 사용자 인터페이스(701)로 표시할 수 있다. 디스플레이 모듈(160) 상에 표시되는 사용자 인터페이스(701)는 추천 발화를 힌트(hint)로서 사용자에게 제공하는 인터페이스일 수 있다.
도 8은 본 발명의 다양한 실시예에 따른 전자 장치(101)의 발화 추천을 나타내는 도면이다.
사용자가 전자 장치(101) 상에서 음성 어시스턴트(200)를 실행하면, 전자 장치(101)는 지원 가능한 발화를 추천하여 디스플레이 모듈(160) 상에 표시할 수 있다. 전자 장치(101)는 음성 어시스턴트(200)의 업데이트 전에 지원하지 않았던 발화를 업데이트 후에 지원 가능하면 추천 발화로 디스플레이 모듈(160) 상에 표시할 수 있다. 이때, 추천 발화가 복수 개이면, 전자 장치(101)는 추천 발화 영역에 미리 정해진 시간 간격으로 복수의 추천 발화를 전환하면서 디스플레이 모듈(160) 상에 표시할 수 있다.
예를 들어, 음성 어시스턴트(200)의 업데이트 전에 지원하지 않았던 "네비게이션 연결해줘"와 같은 발화와 "메시지 보내줘"와 같은 복수의 발화가 업데이트 후에 지원 가능해지면, 추천 발화로 디스플레이 모듈(160) 상에 사용자 인터페이스(801)로 표시할 수 있다. 이때, 전자 장치(101)는 사용자 인터페이스(801) 상에 "네비게이션 연결해줘"와 "메시지 보내줘"를 미리 정해진 시간 간격으로 전환하면서 표시할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법은 음성 어시스턴트 업데이트를 감지하는 동작; 업데이트된 리스트 상에 지원 가능한 발화가 존재하는지 여부를 판단하는 동작; 상기 업데이트된 리스트 상에 지원 가능한 발화가 존재하면, 데이터 베이스에 저장된 발화와 상기 업데이트된 리스트를 비교하여 일치된 발화가 존재하는지 여부를 판단하는 동작; 상기 일치된 발화가 존재하면, 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작; 및 상기 추천 발화 리스트에 기반하여 발화를 추천하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법의 상기 추천 발화 리스트에 기반하여 발화를 추천하는 동작은 상기 추천 발화 리스트에 기반하여 추천 발화를 사용자 인터페이스로 표시하는 동작을 더 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법의 상기 추천 발화 리스트에 기반하여 발화를 추천하는 동작은 추천 발화가 복수 개이면, 미리 정해진 시간 간격으로 복수의 추천 발화를 전환하면서 사용자 인터페이스 상에 표시하는 동작을 더 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법의 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작은 상기 일치된 발화의 개수가 미리 정해진 개수 이상이면, 데이터 베이스에 저장된 발화 추천 우선 순위에 기반하여 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작을 더 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법의 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작은 상기 일치된 발화의 개수가 미리 정해진 개수 이상이면, 미리 정해진 순위 이내의 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작을 더 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법의 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작은 상기 일치된 발화의 개수가 미리 정해진 개수 미만이면, 상기 일치된 발화를 전부를 추천 발화 리스트로 저장하는 동작을 더 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법의 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작은 상기 업데이트된 리스트와 상기 저장된 발화에 대응하는 발화 중 최신 타임스탬프, 빈도, 이슈 우선 순위에 관한 필드에 저장된 데이터에 기반하여 발화 추천 우선 순위를 결정하는 동작을 더 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법은 사용자 발화 입력을 감지하면, 동일 발화가 존재하는 여부를 판단하는 동작; 감지된 사용자 발화 입력과 동일 발화가 존재하면 사용자 발화를 데이터베이스에 저장 또는 업데이트하는 동작; 사용자 발화에 대응하는 동작 결과에 따라 성공 여부를 판단하는 동작; 실패로 기록된 발화들의 우선 순위를 판단하여 데이터 베이스에 이슈 우선 순위 필드에 이슈 우선 순위를 업데이트하는 동작; 이슈 우선 순위에 기반하여 실패한 발화가 미리 정해진 개수 이상인지 여부를 판단하는 동작; 및 상기 실패한 발화가 미리 정해진 개수 이상이면, 발화 리스트를 서버(108)로 전송하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법은 사용자 발화 입력과 동일 발화가 존재하지 않으면, 데이터 베이스에 신규 발화를 추가하는 동작을 더 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)의 음성 어시스턴트 서비스 제공 방법의 상기 사용자 발화에 대응하는 동작은 실패여부 판단 조건에 기반하여 성공 여부를 판단하는 동작을 더 포함할 수 있다.
다양한 실시예에 따른 전자 장치(101)는 통신 모듈(190); 디스플레이 모듈(160); 메모리(130); 및 프로세서(120)를 포함하며, 상기 프로세서(120)는 음성 어시스턴트 업데이트를 감지하고, 업데이트된 리스트 상에 지원 가능한 발화가 존재하는지 여부를 판단하며, 상기 업데이트된 리스트 상에 지원 가능한 발화가 존재하면, 데이터 베이스에 저장된 발화와 상기 업데이트된 리스트를 비교하여 일치된 발화가 존재하는지 여부를 판단하고, 상기 일치된 발화가 존재하면, 상기 일치된 발화를 추천 발화 리스트로 상기 메모리(130)에 저장하도록 제어하며, 상기 추천 발화 리스트에 기반하여 발화를 추천할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 상기 추천 발화 리스트에 기반하여 추천 발화를 사용자 인터페이스로 상기 디스플레이 모듈(160) 상에 표시하도록 제어할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 추천 발화가 복수 개이면, 미리 정해진 시간 간격으로 복수의 추천 발화를 전환하면서 사용자 인터페이스로 상기 디스플레이 모듈(160) 상에 표시하도록 제어할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 상기 일치된 발화의 개수가 미리 정해진 개수 이상이면, 데이터 베이스에 저장된 발화 추천 우선 순위에 기반하여 상기 일치된 발화를 추천 발화 리스트로 상기 메모리(130)에 저장하도록 제어할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 상기 일치된 발화의 개수가 미리 정해진 개수 이상이면, 미리 정해진 순위 이내의 상기 일치된 발화를 추천 발화 리스트로 저장하도록 제어할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 상기 일치된 발화의 개수가 미리 정해진 개수 미만이면, 상기 일치된 발화를 전부를 추천 발화 리스트로 저장하도록 제어할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 상기 업데이트된 리스트와 상기 저장된 발화에 대응하는 발화 중 최신 타임스탬프, 빈도, 이슈 우선 순위에 관한 필드에 저장된 데이터에 기반하여 발화 추천 우선 순위를 결정할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 사용자 발화 입력을 감지하면, 동일 발화가 존재하는 여부를 판단하고, 감지된 사용자 발화 입력과 동일 발화가 존재하면 사용자 발화를 데이터베이스에 저장 또는 업데이트하며, 사용자 발화에 대응하는 동작 결과에 따라 성공 여부를 판단하고, 실패로 기록된 발화들의 우선 순위를 판단하여 데이터 베이스에 이슈 우선 순위 필드에 이슈 우선 순위를 업데이트하며, 이슈 우선 순위에 기반하여 실패한 발화가 미리 정해진 개수 이상인지 여부를 판단하고, 상기 실패한 발화가 미리 정해진 개수 이상이면, 발화 리스트를 서버(108)로 전송할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 사용자 발화 입력과 동일 발화가 존재하지 않으면, 데이터 베이스에 신규 발화를 추가할 수 있다.
다양한 실시예에 따른 상기 프로세서(120)는 실패여부 판단 조건에 기반하여 성공 여부를 판단할 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.
Claims (20)
- 전자 장치의 음성 어시스턴트 서비스 제공 방법에 있어서,
음성 어시스턴트 업데이트를 감지하는 동작;
업데이트된 리스트 상에 지원 가능한 발화가 존재하는지 여부를 판단하는 동작;
상기 업데이트된 리스트 상에 지원 가능한 발화가 존재하면, 데이터 베이스에 저장된 발화와 상기 업데이트된 리스트를 비교하여 일치된 발화가 존재하는지 여부를 판단하는 동작;
상기 일치된 발화가 존재하면, 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작; 및
상기 추천 발화 리스트에 기반하여 발화를 추천하는 동작을 포함하는 방법.
- 제 1항에 있어서,
상기 추천 발화 리스트에 기반하여 발화를 추천하는 동작은
상기 추천 발화 리스트에 기반하여 추천 발화를 사용자 인터페이스로 표시하는 동작을 더 포함하는 방법.
- 제 1항에 있어서,
상기 추천 발화 리스트에 기반하여 발화를 추천하는 동작은
추천 발화가 복수 개이면, 미리 정해진 시간 간격으로 복수의 추천 발화를 전환하면서 사용자 인터페이스 상에 표시하는 동작을 더 포함하는 방법.
- 제 1항에 있어서,
상기 일치된 발화를 추천 발화 리스트로 저장하는 동작은
상기 일치된 발화의 개수가 미리 정해진 개수 이상이면, 데이터 베이스에 저장된 발화 추천 우선 순위에 기반하여 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작을 더 포함하는 방법.
- 제 1항에 있어서,
상기 일치된 발화를 추천 발화 리스트로 저장하는 동작은
상기 일치된 발화의 개수가 미리 정해진 개수 이상이면, 미리 정해진 순위 이내의 상기 일치된 발화를 추천 발화 리스트로 저장하는 동작을 더 포함하는 방법.
- 제 1항에 있어서,
상기 일치된 발화를 추천 발화 리스트로 저장하는 동작은
상기 일치된 발화의 개수가 미리 정해진 개수 미만이면, 상기 일치된 발화를 전부를 추천 발화 리스트로 저장하는 동작을 더 포함하는 방법.
- 제 1항에 있어서,
상기 일치된 발화를 추천 발화 리스트로 저장하는 동작은
상기 업데이트된 리스트와 상기 저장된 발화에 대응하는 발화 중 최신 타임스탬프, 빈도, 이슈 우선 순위에 관한 필드에 저장된 데이터에 기반하여 발화 추천 우선 순위를 결정하는 동작을 더 포함하는 방법.
- 제 1항에 있어서,
사용자 발화 입력을 감지하면, 동일 발화가 존재하는 여부를 판단하는 동작;
감지된 사용자 발화 입력과 동일 발화가 존재하면 사용자 발화를 데이터베이스에 저장 또는 업데이트하는 동작;
사용자 발화에 대응하는 동작 결과에 따라 성공 여부를 판단하는 동작;
실패로 기록된 발화들의 우선 순위를 판단하여 데이터 베이스에 이슈 우선 순위 필드에 이슈 우선 순위를 업데이트하는 동작;
이슈 우선 순위에 기반하여 실패한 발화가 미리 정해진 개수 이상인지 여부를 판단하는 동작; 및
상기 실패한 발화가 미리 정해진 개수 이상이면, 발화 리스트를 서버로 전송하는 동작을 포함하는 방법.
- 제 8항에 있어서,
사용자 발화 입력과 동일 발화가 존재하지 않으면, 데이터 베이스에 신규 발화를 추가하는 동작을 더 포함하는 방법.
- 제 8항에 있어서,
상기 사용자 발화에 대응하는 동작은
실패여부 판단 조건에 기반하여 성공 여부를 판단하는 동작을 더 포함하는 방법.
- 통신 모듈;
디스플레이 모듈;
메모리; 및
프로세서를 포함하며,
상기 프로세서는
음성 어시스턴트 업데이트를 감지하고,
업데이트된 리스트 상에 지원 가능한 발화가 존재하는지 여부를 판단하며,
상기 업데이트된 리스트 상에 지원 가능한 발화가 존재하면, 데이터 베이스에 저장된 발화와 상기 업데이트된 리스트를 비교하여 일치된 발화가 존재하는지 여부를 판단하고,
상기 일치된 발화가 존재하면, 상기 일치된 발화를 추천 발화 리스트로 상기 메모리에 저장하도록 제어하며,
상기 추천 발화 리스트에 기반하여 발화를 추천하는 전자 장치.
- 제 11항에 있어서,
상기 프로세서는
상기 추천 발화 리스트에 기반하여 추천 발화를 사용자 인터페이스로 상기 디스플레이 모듈 상에 표시하도록 제어하는 전자 장치.
- 제 11항에 있어서,
상기 프로세서는
추천 발화가 복수 개이면, 미리 정해진 시간 간격으로 복수의 추천 발화를 전환하면서 사용자 인터페이스로 상기 디스플레이 모듈 상에 표시하도록 제어하는 전자 장치.
- 제 11항에 있어서,
상기 프로세서는
상기 일치된 발화의 개수가 미리 정해진 개수 이상이면, 데이터 베이스에 저장된 발화 추천 우선 순위에 기반하여 상기 일치된 발화를 추천 발화 리스트로 상기 메모리에 저장하도록 제어하는 전자 장치.
- 제 11항에 있어서,
상기 프로세서는
상기 일치된 발화의 개수가 미리 정해진 개수 이상이면, 미리 정해진 순위 이내의 상기 일치된 발화를 추천 발화 리스트로 저장하도록 제어하는 전자 장치.
- 제 11항에 있어서,
상기 프로세서는
상기 일치된 발화의 개수가 미리 정해진 개수 미만이면, 상기 일치된 발화를 전부를 추천 발화 리스트로 저장하도록 제어하는 전자 장치.
- 제 11항에 있어서,
상기 프로세서는
상기 업데이트된 리스트와 상기 저장된 발화에 대응하는 발화 중 최신 타임스탬프, 빈도, 이슈 우선 순위에 관한 필드에 저장된 데이터에 기반하여 발화 추천 우선 순위를 결정하는 전자 장치.
- 제 11항에 있어서,
상기 프로세서는
사용자 발화 입력을 감지하면, 동일 발화가 존재하는 여부를 판단하고,
감지된 사용자 발화 입력과 동일 발화가 존재하면 사용자 발화를 데이터베이스에 저장 또는 업데이트하며,
사용자 발화에 대응하는 동작 결과에 따라 성공 여부를 판단하고,
실패로 기록된 발화들의 우선 순위를 판단하여 데이터 베이스에 이슈 우선 순위 필드에 이슈 우선 순위를 업데이트하며,
이슈 우선 순위에 기반하여 실패한 발화가 미리 정해진 개수 이상인지 여부를 판단하고,
상기 실패한 발화가 미리 정해진 개수 이상이면, 발화 리스트를 서버로 전송하는 전자 장치.
- 제 18항에 있어서,
상기 프로세서는
사용자 발화 입력과 동일 발화가 존재하지 않으면, 데이터 베이스에 신규 발화를 추가하는 전자 장치.
- 제 18항에 있어서,
상기 프로세서는
실패여부 판단 조건에 기반하여 성공 여부를 판단하는 전자 장치.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210038469A KR20220133414A (ko) | 2021-03-25 | 2021-03-25 | 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치 |
EP22776074.1A EP4287183A4 (en) | 2021-03-25 | 2022-03-23 | METHOD OF PROVIDING A VOICE ASSISTANCE SERVICE AND ELECTRONIC DEVICE FOR SUPPORTING SAME |
PCT/KR2022/004023 WO2022203374A1 (ko) | 2021-03-25 | 2022-03-23 | 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치 |
US17/715,763 US11966439B2 (en) | 2021-03-25 | 2022-04-07 | Method for providing voice assistant service and electronic device supporting the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210038469A KR20220133414A (ko) | 2021-03-25 | 2021-03-25 | 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220133414A true KR20220133414A (ko) | 2022-10-05 |
Family
ID=83397699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210038469A KR20220133414A (ko) | 2021-03-25 | 2021-03-25 | 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11966439B2 (ko) |
EP (1) | EP4287183A4 (ko) |
KR (1) | KR20220133414A (ko) |
WO (1) | WO2022203374A1 (ko) |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8954325B1 (en) | 2004-03-22 | 2015-02-10 | Rockstar Consortium Us Lp | Speech recognition in automated information services systems |
KR101456974B1 (ko) | 2013-05-21 | 2014-10-31 | 삼성전자 주식회사 | 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법 |
US10565984B2 (en) | 2013-11-15 | 2020-02-18 | Intel Corporation | System and method for maintaining speech recognition dynamic dictionary |
EP3193328B1 (en) * | 2015-01-16 | 2022-11-23 | Samsung Electronics Co., Ltd. | Method and device for performing voice recognition using grammar model |
US11227589B2 (en) * | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
KR101949497B1 (ko) | 2017-05-02 | 2019-02-18 | 네이버 주식회사 | 사용자 발화의 표현법을 파악하여 기기의 동작이나 컨텐츠 제공 범위를 조정하여 제공하는 사용자 명령 처리 방법 및 시스템 |
KR102356889B1 (ko) | 2017-08-16 | 2022-01-28 | 삼성전자 주식회사 | 음성 인식을 수행하는 방법 및 이를 사용하는 전자 장치 |
US10468017B2 (en) | 2017-12-14 | 2019-11-05 | GM Global Technology Operations LLC | System and method for understanding standard language and dialects |
KR102519635B1 (ko) | 2018-01-05 | 2023-04-10 | 삼성전자주식회사 | 음성 명령을 처리하기 위한 전자 문서 표시 방법 및 그 전자 장치 |
US11158310B2 (en) * | 2018-05-01 | 2021-10-26 | Dell Products, L.P. | Intelligent assistance for handling usage modes |
WO2020004213A1 (ja) * | 2018-06-29 | 2020-01-02 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
KR20200013152A (ko) | 2018-07-18 | 2020-02-06 | 삼성전자주식회사 | 이전에 대화를 수집한 결과를 기반으로 인공 지능 서비스를 제공하는 전자 장치 및 방법 |
US12062362B2 (en) * | 2018-07-20 | 2024-08-13 | Sony Corporation | Information processing device, information processing system, and information processing method |
US10908883B2 (en) * | 2018-11-13 | 2021-02-02 | Adobe Inc. | Voice interaction development tool |
WO2020214988A1 (en) * | 2019-04-17 | 2020-10-22 | Tempus Labs | Collaborative artificial intelligence method and system |
US20220232278A1 (en) | 2019-04-30 | 2022-07-21 | Lg Electronics Inc. | Display device for providing speech recognition service |
EP3977446A4 (en) * | 2019-06-28 | 2022-07-06 | Samsung Electronics Co., Ltd. | USER VOICE INPUT RECOGNITION DEVICE AND METHOD OF OPERATION THEREOF |
KR20210001937A (ko) * | 2019-06-28 | 2021-01-06 | 삼성전자주식회사 | 사용자의 음성 입력을 인식하는 디바이스 및 그 동작 방법 |
KR102696200B1 (ko) | 2019-07-29 | 2024-08-20 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 인공 지능 장치 및 그의 동작 방법 |
AU2021254787A1 (en) * | 2020-04-15 | 2022-10-27 | Pindrop Security, Inc. | Passive and continuous multi-speaker voice biometrics |
-
2021
- 2021-03-25 KR KR1020210038469A patent/KR20220133414A/ko active Search and Examination
-
2022
- 2022-03-23 EP EP22776074.1A patent/EP4287183A4/en active Pending
- 2022-03-23 WO PCT/KR2022/004023 patent/WO2022203374A1/ko unknown
- 2022-04-07 US US17/715,763 patent/US11966439B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP4287183A4 (en) | 2024-07-03 |
EP4287183A1 (en) | 2023-12-06 |
US11966439B2 (en) | 2024-04-23 |
WO2022203374A1 (ko) | 2022-09-29 |
US20220318304A1 (en) | 2022-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220034571A (ko) | 음성에 포함된 커맨드를 확인하는 전자 장치와 이의 동작 방법 | |
US11929080B2 (en) | Electronic device and method for providing memory service by electronic device | |
US20230214397A1 (en) | Server and electronic device for processing user utterance and operating method thereof | |
KR20220043534A (ko) | 컨텐츠 추천 서비스를 제공하는 전자 장치 및 그 방법 | |
EP4411544A1 (en) | Electronic device and operation method thereof | |
US11929079B2 (en) | Electronic device for managing user model and operating method thereof | |
US12027163B2 (en) | Electronic device and operation method thereof | |
KR20220133414A (ko) | 음성 어시스턴트 서비스 제공 방법 및 이를 지원하는 전자 장치 | |
KR20220091085A (ko) | 전자 장치 및 그의 연속성을 가지는 사용자 입력에 대한 실행 정보를 공유하는 방법 | |
KR20220102405A (ko) | 전자 장치 및 전자 장치의 동작 방법 | |
KR20220128868A (ko) | 대체 컨텐츠를 제공하는 전자 장치 및 그의 동작 방법 | |
KR20220126544A (ko) | 사용자 명령을 처리하는 장치 및 그 동작 방법 | |
KR20220073136A (ko) | 배경 화면을 설정하기 위한 전자 장치 및 그의 동작 방법 | |
KR20220054067A (ko) | 전자 장치 및 서버를 포함하는 시스템, 및 그 시스템을 이용한 컨텐츠 추천 방법 | |
US20230252988A1 (en) | Method for responding to voice input and electronic device supporting same | |
US12074956B2 (en) | Electronic device and method for operating thereof | |
KR20220045732A (ko) | 전자 장치 및 전자 장치의 동작 방법 | |
US20240241513A1 (en) | Method and apparatus for updating predictive model predicting product failure | |
KR20230055269A (ko) | 광학 문자 인식을 수행하는 전자 장치, 방법, 및 컴퓨터 판독가능 저장 매체 | |
US20240233716A1 (en) | Electronic device and method of processing response to user of electronic device | |
KR20240026820A (ko) | 전자 장치 및 전자 장치의 인식 모델 관리 방법 | |
KR20230028081A (ko) | 어플리케이션의 실행 오류를 검출하는 전자 장치 및 그 작동 방법 | |
KR20210158270A (ko) | 전자 장치 및 전자 장치에서 신조어 기반 문장 변환 방법 | |
KR20220057046A (ko) | 전자 장치 및 전자 장치에서 태스크 수행을 위한 장치를 결정하는 방법 | |
KR20220122022A (ko) | 검색 서비스를 제공하기 위한 전자 장치 및 그 작동 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |