WO2015156443A1 - Cartoon-type mobile personal secretary service system - Google Patents

Cartoon-type mobile personal secretary service system Download PDF

Info

Publication number
WO2015156443A1
WO2015156443A1 PCT/KR2014/003622 KR2014003622W WO2015156443A1 WO 2015156443 A1 WO2015156443 A1 WO 2015156443A1 KR 2014003622 W KR2014003622 W KR 2014003622W WO 2015156443 A1 WO2015156443 A1 WO 2015156443A1
Authority
WO
WIPO (PCT)
Prior art keywords
response
cartoon
module
emotion
window
Prior art date
Application number
PCT/KR2014/003622
Other languages
French (fr)
Korean (ko)
Inventor
태정수
Original Assignee
네무스텍(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네무스텍(주) filed Critical 네무스텍(주)
Publication of WO2015156443A1 publication Critical patent/WO2015156443A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Definitions

  • the present invention relates to a cartoon-type mobile personal assistant service system, and more particularly, the user's interest and convenience in recognizing a user's voice in a mobile device, processing a command according to the voice, and displaying the result on a display.
  • the present invention relates to a cartoon type mobile personal assistant service system that provides a cartoon form in order to enhance and effectively express emotions that are difficult to express with letters.
  • Mobile personal assistant service such as the iPhone's SIRI service, that sends a voice command to a mobile device to notify the user by voice of the results of processing or processing a search, sending an email, or scheduling an event on the mobile device.
  • a conventional personal assistant service generally recognizes a user's voice command as a text command using various voice recognition techniques and processes the user's voice command according to the recognition result.
  • Korean Laid-Open Patent Publication No. 2003-0033890 discloses a system for providing a personal assistant service using such a voice recognition technology.
  • the conventional personal assistant service converts a voice command into text through the meaning of a word included in a user's voice command and recognizes only the information as a command and responds only by voice or in the form of a simple text.
  • Such a conventional mobile personal assistant service has a problem that can be felt dry to the user and soon lose the interest of use. As a result, there is a problem that the frequency of use of the user is reduced and the desire for use of the user is also reduced.
  • the present invention has been made to solve the problems described above, by displaying the user's voice command and the response of the personal assistant service to the mobile device in a cartoon format to improve the user's interest and convenience and effectively convey emotion To provide personal assistant services.
  • Cartoon-type mobile personal assistant service system of the present invention for achieving the above object, by receiving a user's voice command from the mobile device to generate a response to the voice command of the mobile device through a virtual personal assistant
  • a cartoon type mobile personal assistant service system displayed on a display unit comprising: a voice receiving module configured to receive a voice command of a user through a microphone of a mobile device; A texting module for analyzing the voice command and converting the voice command into a textual text command; A response module for generating a response to the text command in a characterized response sentence; And a display module configured to generate a chat window on the display unit of the mobile device, generate a command window for displaying the text command in a cartoon form, and a response window for displaying the response sentence in a cartoon form, and scrollably display the chat window.
  • a voice receiving module configured to receive a voice command of a user through a microphone of a mobile device
  • a texting module for analyzing the voice command and converting the voice command into a textual
  • the cartoon-type mobile personal assistant service system of the present invention improves user's interest and improves service satisfaction by displaying commands and responses of a user and a virtual personal assistant on a display of a mobile device in a cartoon format.
  • FIG. 1 is a block diagram of a cartoon-type mobile personal assistant service system according to an embodiment of the present invention.
  • FIG. 2 is a diagram illustrating a state in which a chat window of the cartoon-type mobile personal assistant service system illustrated in FIG. 1 is displayed on a display unit of a mobile device.
  • FIG. 3 illustrates an emotion plane for explaining the cartoon-type mobile personal assistant service system shown in FIG. 1.
  • FIG. 4 illustrates another example of a command window and a response window displayed by the cartoon-type mobile personal assistant service system shown in FIG. 1.
  • FIG. 5 and 6 show another example of the response window displayed by the cartoon-type mobile personal assistant service system shown in FIG. 1, respectively.
  • the cartoon-type mobile personal assistant service system of the present embodiment includes a voice receiving module 110, a texting module 120, a response module 140, and a display module 150.
  • the voice receiving module 110 receives a voice command of a user through a microphone of the mobile device.
  • the user may speak voice commands such as "What is the weather of the day?”, “What is my schedule today?", "What is the phone number of the nearest coffee shop?”
  • the voice command received by the voice receiving module 110 is transmitted to the texting module 120 and the emotion extraction module 130.
  • the texting module 120 analyzes the voice commands and converts them into textual text commands.
  • the texting module 120 converts a user's voice command into a textual command using commonly used speech recognition technology.
  • the emotion extracting module 130 receives and analyzes a voice command from the voice receiving module 110 and extracts a user's emotion by receiving and analyzing a text command from the texting module 120.
  • the emotion extraction module 130 determines the degree of harmony of the user conversation using the text command, and determines the tension of the user using the voice command.
  • the degree of harmony is a value obtained by quantifying the degree of pleasantness and displeasure of user emotion.
  • the emotion extracting module 130 analyzes the words of the text command and analyzes the degree of inclusion of negative morphemes or positive morphemes, the degree of inclusion of negative or positive words in the text command, and the degree of discomfort of the ending of the text command. And the degree of pleasantness are quantified as the degree of harmony.
  • the emotion extraction module 130 digitizes the degree of harmony in consideration of the morpheme, the vocabulary, the presence or absence of a compound, etc.
  • the degree of tension is a numerical value of the degree of tension or excitement of the user. High tension is a state of surprise and awakening; low tension is a state of calm and relaxation.
  • the emotion extraction module 130 analyzes the sound of the voice command and digitizes the degree of tension to the degree of relaxation and awakening. The emotion extracting module 130 recognizes that the sound of the voice command is awake state when the sound of the voice command is higher and faster than the preset sound criterion, and is relaxed when the sound of the voice command is lower than the sound criterion.
  • the emotion extraction module 130 may quantify the tension in consideration of the amplitude of the sound of the voice command, that is, the amplitude of the sound.
  • the emotion extraction module 130 may quantify the degree of tension by further considering the accuracy of the pronunciation of the voice command read by the recognition rate of the voice.
  • the emotion extraction module 130 may determine the emotion of the user by expressing the harmony and tension as described above as coordinate values on the emotion plane as shown in FIG. 3.
  • the degree of unpleasantness and the level of unpleasantness is expressed by the coordinates of the first axis (x-axis), and the tension indicating the degree of excitement of the user is represented by the second axis (y-axis). It is represented by coordinates.
  • the emotion extraction module 130 may classify the type of emotion for each area on the emotion plane. For example, in the state of moderate tension, when the degree of harmony is low, it is judged by the feeling of "unhappy, misery, sadness", and when the degree of harmony is high, it is judged by the feeling of "happy, joy".
  • the response module 140 analyzes the text command characterizing the voice command in the text module 120 to process the command and to provide a textual response to the text command. That is, the response module 140 analyzes the text command to determine the meaning of the voice command and performs the command according to the meaning.
  • the response module 140 may search for information necessary by wireless communication, search for a contact stored in the mobile device of the user, and grasp a user's schedule or register a new user.
  • the response module 140 retrieves the weather of the day through wireless communication and “rains today.” Or a response that says, "I'll tell you today's weather.”
  • the display module 150 generates a chat window 200 as shown in FIG. 2 on the display unit 170 of the mobile device, and communicates the dialog between the user and the virtual personal assistant through the chat window 200 in a cartoon format. ).
  • the display module 150 displays the command window 210, the response window 220, and the result window 230 in a chat window 200 in a scrollable manner.
  • the command window 210 is a result of the text module 120 converting a user's voice command into a text command.
  • the display module 150 does not simply display the text command in the command window 210 in letters, but in a cartoon format.
  • the cartoon format means setting a frame that is a frame of the command window 210 like a cartoon format, setting a background image or a background color in the frame, displaying a character representing the user, and using a speech bubble.
  • the user's voice command draws a speech bubble next to the user character and a text command inside the speech bubble.
  • the command window 210 may further display an image of an object suitable for the voice command of the user and the conversation of the personal assistant.
  • the user's interest can be enhanced and satisfaction with the personal assistant service can be improved.
  • the emotion of the user using a cartoon format can have a transmission power more than the character and has the advantage of improving the satisfaction of the user.
  • the display module 150 displays the response window 220 in a similar manner to the command window 210 described above.
  • the response window 220 displays a response of the personal assistant to the voice command of the user in the chat window 200 in a cartoon form.
  • the frame is composed of a background color, a character image of a personal assistant, and text of a response sentence displayed inside a speech bubble. Response sentences such as "I will inform you the weather of today", "I will guide the phone number information" is displayed inside the speech bubble of the response window (220).
  • the display module 150 displays the result of inquiring the information (response information) in the result window 230. That is, when the voice command is a command for requesting inquiry of response information (eg, a phone number) stored in the mobile device or response information (eg, bus operation information) stored in an external server, the response module 140 may request response information. The result is displayed in the result window 230.
  • the response module 140 receives the response information in the HTML format or processes the response information in the HTML format and transmits the response information to the display module 150, and the display module 150 displays the response information in the result window 230.
  • the display module 150 may simply display the result window 230 in text form according to the content of the HTML format of the response information, and like the command window 210 and the response window 220, the result window 230 may be in a cartoon format. ) Can also be displayed. In the example shown in FIG. 2, the result window 230 displays a picture, a name, and a phone number of the person inquiring.
  • the cartoon-type mobile personal assistant service system of the present embodiment can be used in conjunction with an external server that provides various information such as movie timetable, bus operation information, aircraft operation information, weather information, etc.
  • the external server may provide response information in various visual ways.
  • the operator providing the cartoon-type mobile personal assistant service system of the present embodiment only needs to manage the cartoon image of the command window 210 and the result window 230, and the server manager of the external connection service of the result window 230 Since the result window 230 can be provided in an effective way according to the standard, there is an advantage of improving the operation efficiency of the overall service.
  • the response module 140 pre-examines the size of the result window 230 when inquiring the response information to the external server. Will be sent to the server.
  • the external server transmits the response information in HTML format to the mobile device in consideration of the size of the result window 230.
  • the display module 150 links and generates the result window 230 with the related application so as to be linked with the related application by the touch.
  • a weather-related result window 230 when a user touches the result window 230, a weather application connected to an external server providing weather information is executed on the mobile device.
  • the result window 230 related to the movie showing time when the user touches the result window 230, an application connected to an external server that provides the movie showing timetable is executed on the mobile device.
  • the phonebook application is executed to search for more detailed information desired by the user. In this way, if the user wants to inquire more detailed information from the cartoon-type mobile personal assistant service system of the present embodiment, it is possible to inquire the corresponding information by touching the result window 230.
  • the cartoon storage module 160 stores various images used for constructing the command window 210 and the response window 220.
  • Various images of the user character to be used in the command window 210 and various images of the personal assistant character to be used in the response window 220 are stored in the cartoon storage module 160.
  • the user character and the personal assistant character are designed with expressions corresponding to various emotions such as joy, anger, and sadness and are stored in the cartoon storage module 160.
  • Various shapes of speech bubbles to be used in the command window 210 and the response window 220 are also stored in the cartoon storage module 160. Speech balloons are also variously designed according to the emotion of the user or personal assistant and stored in the cartoon storage module 160.
  • various background colors of the command window 210 and the response window 220 corresponding to the emotion of the user or the personal assistant may also be stored in the cartoon storage module 160 in response to the emotion, and the command window 210 and Various objects such as a clock, a cup, and a book to be displayed in the response window 220 are also stored in the cartoon storage module 160.
  • the display module 150 configures the command window 210 by inquiring the character image and the speech bubble image of the appropriate user character in the cartoon storage module 160 according to the emotion of the user extracted by the emotion extraction module 130 described above.
  • the response module 140 determines a response emotion corresponding to the emotion of the user extracted by the emotion extraction module 130 and constructs a response sentence accordingly.
  • the response module 140 determines the response text according to the response feelings.
  • the display module 150 configures the response window 220 by inquiring the character image and the speech bubble image of the personal assistant character who can express the appropriate emotion in the cartoon storage module 160 according to the response emotion determined by the response module 140. .
  • the coordinates on the emotion plane of the response sentence corresponding thereto are set for each coordinate on the emotion plane of the voice command.
  • the correspondence between the coordinates on the emotion plane of the voice command and the emotion plane of the response emotion may be set in various ways. For example, when the user's emotion is "happiness, joy", the response emotion may also be set to correspond to the user's emotion by "corresponding to" happy, joy ". In addition, when the emotion of the voice command is "unhappy, sad", the response emotion may be set to comfort and alleviate the user's emotion by responding with "difference, calm”.
  • the response sentence may be configured or the background color of the response window 220 or the shape of the speech bubble may be determined according to the determined emotion.
  • the response module 140 configures the response sentence by adjusting the morpheme, vocabulary, and ending of the response sentence of the response sentence according to the position on the emotion plane of the response emotion.
  • the command window 210 is configured and displayed on the display unit 170 in a form that can be expressed.
  • 5 and 6 illustrate examples of character images, background images, and speech bubbles of personal assistants modified according to response emotions.
  • an appropriate response to the voice command of the user is displayed in the response window 220 in the form of a cartoon, so that the user's interest and satisfaction can be improved as compared to a personal assistant service that has conventionally only responded to text.

Abstract

According to the present invention, a cartoon-type mobile personal secretary service system, which receives a voice command of a user on a mobile device to generate a response to the voice command, thereby displaying the response on a display unit of the mobile device through a virtual personal secretary, comprises: a voice reception module for receiving a user voice command through a microphone of the mobile device; a transcription module for converting the voice command into a transcribed text command by analyzing the voice command; a response module for generating a response to the text command as a transcribed response sentence; and a display module for generating a chat window on the display unit of the mobile device and respectively generating a command window displaying the text command in a cartoon format and a response window displaying the response sentence in the cartoon format such that scrolling is enabled in the chat window.

Description

카툰형 모바일 개인 비서 서비스 시스템Cartoon Mobile Personal Assistant Service System
본 발명은 카툰형 모바일 개인 비서 서비스 시스템에 관한 것으로서, 더욱 상세하게는 모바일 기기에서 사용자의 음성을 인식하여 그 음성에 따른 명령을 처리하고 그 결과를 디스플레이를 통해 표시함에 있어서 사용자의 흥미와 편의성을 향상시키고 문자로 표현하기 어려운 감정을 효과적으로 표현하기 위하여 만화의 형식을 이용하여 제공하는 카툰형 모바일 개인 비서 서비스 시스템에 관한 것이다.The present invention relates to a cartoon-type mobile personal assistant service system, and more particularly, the user's interest and convenience in recognizing a user's voice in a mobile device, processing a command according to the voice, and displaying the result on a display. The present invention relates to a cartoon type mobile personal assistant service system that provides a cartoon form in order to enhance and effectively express emotions that are difficult to express with letters.
아이폰의 시리(SIRI) 서비스와 같이 사용자가 모바일 기기에 대해 음성으로 명령을 전달하면 모바일 기기에서 검색, 이메일 발송, 일정 등록 등의 업무를 처리하거나 처리한 결과를 음성으로 사용자에게 알리는 모바일 개인 비서 서비스가 최근에 실용화되고 있다.Mobile personal assistant service, such as the iPhone's SIRI service, that sends a voice command to a mobile device to notify the user by voice of the results of processing or processing a search, sending an email, or scheduling an event on the mobile device. Has been put to practical use in recent years.
종래의 개인 비서 서비스는 사용자의 음성 명령을 다양한 음성 인식 기술을 이용하여 텍스트 명령으로 인식한 후 그 인식 결과에 따라 사용자의 음성 명령을 처리하는 방식이 일반적이다. 한국 공개 특허공보 제2003-0033890호에는 이와 같은 음성 인식 기술을 이용하여 개인 비서 서비스를 제공하는 시스템이 개시되어 있다.A conventional personal assistant service generally recognizes a user's voice command as a text command using various voice recognition techniques and processes the user's voice command according to the recognition result. Korean Laid-Open Patent Publication No. 2003-0033890 discloses a system for providing a personal assistant service using such a voice recognition technology.
이와 같은 종래의 개인 비서 서비스는 사용자의 음성 명령에 포함된 단어의 의미를 통해서 음성 명령을 텍스트로 변환하여 명령으로서의 정보만 인식하고 음성으로만 응답하거나 단순한 문자의 형태로 응답하였다.The conventional personal assistant service converts a voice command into text through the meaning of a word included in a user's voice command and recognizes only the information as a command and responds only by voice or in the form of a simple text.
이와 같은 종래의 모바일 개인 비서 서비스는 사용자에게 무미건조하게 느껴질 수 있고 곧 사용의 흥미를 잃을 수 있는 문제점이 있다. 이로 인해 사용자의 사용빈도가 감소하고 사용자의 사용욕구도 감소하는 문제점이 있다.Such a conventional mobile personal assistant service has a problem that can be felt dry to the user and soon lose the interest of use. As a result, there is a problem that the frequency of use of the user is reduced and the desire for use of the user is also reduced.
본 발명은 상술한 바와 같은 문제점을 해결하기 위해 안출된 것으로, 사용자의 음성 명령과 그에 대한 개인 비서 서비스의 응답을 카툰 형식으로 모바일 기기에 표시하여 사용자의 흥미와 편의성을 향상시키고 효과적으로 감정 전달을 할 수 있는 개인 비서 서비스를 제공하는 것을 목적으로 한다.The present invention has been made to solve the problems described above, by displaying the user's voice command and the response of the personal assistant service to the mobile device in a cartoon format to improve the user's interest and convenience and effectively convey emotion To provide personal assistant services.
상술한 바와 같은 목적을 달성하기 위한 본 발명의 카툰형 모바일 개인 비서 서비스 시스템은, 모바일 기기에서 사용자의 음성 명령을 수신하여 상기 음성 명령에 대한 응답을 생성하여 가상의 개인 비서를 통해 상기 모바일 기기의 표시부에 표시하는 카툰형 모바일 개인 비서 서비스 시스템에 있어서, 모바일 기기의 마이크를 통해 사용자의 음성 명령을 수신하는 음성 수신 모듈; 상기 음성 명령을 분석하여 문자화된 텍스트 명령으로 변환하는 문자화 모듈; 상기 텍스트 명령에 대한 응답을 문자화된 응답 문장으로 생성하는 응답 모듈; 및 상기 모바일 기기의 표시부에 대화창을 생성하고, 상기 텍스트 명령을 카툰 형태로 표시하는 명령창과, 상기 응답 문장을 카툰 형태로 표시하는 응답창을 각각 생성하여 상기 대화창에 스크롤 가능하게 표시하는 표시 모듈;을 포함하는 점에 특징이 있다.Cartoon-type mobile personal assistant service system of the present invention for achieving the above object, by receiving a user's voice command from the mobile device to generate a response to the voice command of the mobile device through a virtual personal assistant A cartoon type mobile personal assistant service system displayed on a display unit, comprising: a voice receiving module configured to receive a voice command of a user through a microphone of a mobile device; A texting module for analyzing the voice command and converting the voice command into a textual text command; A response module for generating a response to the text command in a characterized response sentence; And a display module configured to generate a chat window on the display unit of the mobile device, generate a command window for displaying the text command in a cartoon form, and a response window for displaying the response sentence in a cartoon form, and scrollably display the chat window. There is a feature in that it includes.
본 발명의 카툰형 모바일 개인 비서 서비스 시스템은 사용자와 가상의 개인 비서의 명령과 응답을 카툰 형식으로 모바일 기기의 디스플레이에 표시함으로써 사용자의 흥미를 향상시키고 서비스의 만족도를 향상시키는 효과가 있다.The cartoon-type mobile personal assistant service system of the present invention improves user's interest and improves service satisfaction by displaying commands and responses of a user and a virtual personal assistant on a display of a mobile device in a cartoon format.
도 1은 본 발명의 일실시예에 따른 카툰형 모바일 개인 비서 서비스 시스템의 블록도이다.1 is a block diagram of a cartoon-type mobile personal assistant service system according to an embodiment of the present invention.
도 2는 도 1에 도시된 카툰형 모바일 개인 비서 서비스 시스템의 대화창이 모바일 기기의 표시부에 표시된 상태를 도시한 도면이다.FIG. 2 is a diagram illustrating a state in which a chat window of the cartoon-type mobile personal assistant service system illustrated in FIG. 1 is displayed on a display unit of a mobile device.
도 3은 도 1에 도시된 카툰형 모바일 개인 비서 서비스 시스템을 설명하기 위한 감정 평면을 도시한 것이다.FIG. 3 illustrates an emotion plane for explaining the cartoon-type mobile personal assistant service system shown in FIG. 1.
도 4는 도 1에 도시된 카툰형 모바일 개인 비서 서비스 시스템에 의해 표시되는 명령창과 응답창의 다른 예를 도시한 것이다.4 illustrates another example of a command window and a response window displayed by the cartoon-type mobile personal assistant service system shown in FIG. 1.
도 5 및 도 6은 각각 도 1에 도시된 카툰형 모바일 개인 비서 서비스 시스템에 의해 표시되는 응답창의 다른 예를 도시한 것이다.5 and 6 show another example of the response window displayed by the cartoon-type mobile personal assistant service system shown in FIG. 1, respectively.
이하, 본 발명에 따른 카툰형 모바일 개인 비서 서비스 시스템을 바람직한 실시예를 들어 상세히 설명한다.Hereinafter, a cartoon-type mobile personal assistant service system according to the present invention will be described in detail with reference to a preferred embodiment.
도 1을 참조하면 본 실시예의 카툰형 모바일 개인 비서 서비스 시스템은 음성 수신 모듈(110)과 문자화 모듈(120)과 응답 모듈(140)과 표시 모듈(150)을 포함하여 이루어진다.Referring to FIG. 1, the cartoon-type mobile personal assistant service system of the present embodiment includes a voice receiving module 110, a texting module 120, a response module 140, and a display module 150.
음성 수신 모듈(110)은 모바일 기기의 마이크를 통해 사용자의 음성 명령을 수신한다. 사용자는 "오늘의 날씨는?", "오늘 나의 일정은?", "가까운 커피 전문점의 전화번호는?"과 같은 음성 명령을 말할 수 있다.The voice receiving module 110 receives a voice command of a user through a microphone of the mobile device. The user may speak voice commands such as "What is the weather of the day?", "What is my schedule today?", "What is the phone number of the nearest coffee shop?"
음성 수신 모듈(110)에서 수신된 음성 명령은 문자화 모듈(120)과 감정 추출 모듈(130)로 전달된다.The voice command received by the voice receiving module 110 is transmitted to the texting module 120 and the emotion extraction module 130.
문자화 모듈(120)은 음성 명령을 분석하여 문자화된 텍스트 명령으로 변환한다. 문자화 모듈(120)은 일반적으로 사용되는 음성 인식 기술을 이용하여 사용자의 음성 명령을 문자화된 텍스트 명령으로 변환한다.The texting module 120 analyzes the voice commands and converts them into textual text commands. The texting module 120 converts a user's voice command into a textual command using commonly used speech recognition technology.
감정 추출 모듈(130)은 음성 수신 모듈(110)에서 음성 명령을 전달받아 분석하고, 문자화 모듈(120)에서 텍스트 명령을 전달받아 분석하여 사용자의 감정을 추출한다. 감정 추출 모듈(130)은 텍스트 명령을 이용하여 사용자 대화의 조화도를 판단하고 음성 명령을 이용하여 사용자의 긴장도를 판단한다.The emotion extracting module 130 receives and analyzes a voice command from the voice receiving module 110 and extracts a user's emotion by receiving and analyzing a text command from the texting module 120. The emotion extraction module 130 determines the degree of harmony of the user conversation using the text command, and determines the tension of the user using the voice command.
조화도는 도 3에 도시한 것과 같이 사용자 감정의 유쾌함과 불쾌함의 정도를 수치화한 값이다. 감정 추출 모듈(130)은 텍스트 명령의 단어를 분석하여 부정 형태소 또는 긍정 형태소의 포함 정도, 상기 텍스트 명령에 부정적 어휘 또는 긍정적 어휘의 포함 정도 및 상기 텍스트 명령의 어미가 경어인지 정도를 분석하여 불쾌함과 유쾌함의 정도를 조화도로서 수치화한다. 감정 추출 모듈(130)은 형태소, 어휘, 경어 여부 등을 복합적으로 고려하여 조화도를 수치화한다.As shown in FIG. 3, the degree of harmony is a value obtained by quantifying the degree of pleasantness and displeasure of user emotion. The emotion extracting module 130 analyzes the words of the text command and analyzes the degree of inclusion of negative morphemes or positive morphemes, the degree of inclusion of negative or positive words in the text command, and the degree of discomfort of the ending of the text command. And the degree of pleasantness are quantified as the degree of harmony. The emotion extraction module 130 digitizes the degree of harmony in consideration of the morpheme, the vocabulary, the presence or absence of a compound, etc.
긴장도는 도 3에 도시한 것과 같이 사용자의 긴장 또는 흥분의 정도를 수치화한 것이다. 긴장도가 높은 경우는 놀람, 각성의 상태이고 긴장도가 낮은 경우는 차분, 이완의 상태이다. 감정 추출 모듈(130)은 음성 명령의 음향을 분석하여 긴장도를 이완 상태와 각성 상태의 정도로 수치화한다. 감정 추출 모듈(130)은 음성 명령의 음향이 미리 설정된 음향 기준보다 높고 빠르면 각성 상태로 인식하고, 상기 음향 기준보다 낮고 느리면 이완 상태로 인식한다. 감정 추출 모듈(130)은 음성 명령의 음향의 크기 즉, 소리의 진폭도 함께 고려하여 긴장도를 수치화할 수 있다. 감정 추출 모듈(130)은 음성의 인식률에 의해 판독된 음성 명령의 발음의 정확성을 추가로 고려하여 긴장도를 수치화할 수 있다. As shown in FIG. 3, the degree of tension is a numerical value of the degree of tension or excitement of the user. High tension is a state of surprise and awakening; low tension is a state of calm and relaxation. The emotion extraction module 130 analyzes the sound of the voice command and digitizes the degree of tension to the degree of relaxation and awakening. The emotion extracting module 130 recognizes that the sound of the voice command is awake state when the sound of the voice command is higher and faster than the preset sound criterion, and is relaxed when the sound of the voice command is lower than the sound criterion. The emotion extraction module 130 may quantify the tension in consideration of the amplitude of the sound of the voice command, that is, the amplitude of the sound. The emotion extraction module 130 may quantify the degree of tension by further considering the accuracy of the pronunciation of the voice command read by the recognition rate of the voice.
감정 추출 모듈(130)은 상술한바와 같은 조화도와 긴장도를 도 3에 도시한 것과 같은 감정 평면 상의 좌표값으로 표현하여 사용자의 감정을 판단할 수 있다. 도 3에 도시한 감정 평면상에서 불쾌함과 유쾌함의 정도를 나타내는 조화도는 제1축(x축)의 좌표에 의해 표시되고, 사용자의 흥분의 정도를 나타내는 긴장도는 제2축(y축)의 좌표에 의해 표시된다. 감정 추출 모듈(130)은 이와 같은 감정 평면상의 영역별로 감정의 유형을 구분할 수 있다. 예를 들어, 긴장도가 중간인 상태에서, 조화도가 낮으면 "불행, 비참, 슬픔"의 감정으로 판단하고, 조화도가 높으면 "행복, 기쁨"의 감정으로 판단하게 된다. 긴장도가 높은 각성 상태에서 조화도가 낮으면 "고민, 괴로움"의 감정, 조화도가 중간이면 "놀람, 자극"의 감정, 조화도가 높으면 "행복, 기쁨"의 감정으로 판단한다. 긴장도가 낮은 이완 상태에서 조화도가 낮으면 "나른, 따분"의 감정, 조화도가 중간이면 "차분, 고요"의 감정, 조화도가 높으면 "느슨, 만족"의 감정으로 판단하게 된다. The emotion extraction module 130 may determine the emotion of the user by expressing the harmony and tension as described above as coordinate values on the emotion plane as shown in FIG. 3. On the emotion plane shown in Fig. 3, the degree of unpleasantness and the level of unpleasantness is expressed by the coordinates of the first axis (x-axis), and the tension indicating the degree of excitement of the user is represented by the second axis (y-axis). It is represented by coordinates. The emotion extraction module 130 may classify the type of emotion for each area on the emotion plane. For example, in the state of moderate tension, when the degree of harmony is low, it is judged by the feeling of "unhappy, misery, sadness", and when the degree of harmony is high, it is judged by the feeling of "happy, joy". In the state of high arousal, the harmony is low, the feeling of "anguishment, anguish", the harmony is in the middle of "surprise, stimulation", the feeling of harmony, the feeling of "happy, joy". In the relaxed state of low tension, if the harmony is low, the feeling of "dry, boring", if the harmony is medium, "difference, calm" feeling, if the harmony is high, "loose, satisfied" feeling.
한편, 응답 모듈(140)에서는 문자화 모듈(120)에서 음성 명령을 문자화한 텍스트 명령을 분석하여 명령을 처리하고 그 텍스트 명령에 대한 텍스트 형태의 응답을 마련한다. 즉, 응답 모듈(140)은 텍스트 명령을 분석하여 음성 명령의 의미를 파악하고 그 의미에 따른 명령을 수행한다. 응답 모듈(140)은 무선 통신에 의해 필요한 정보를 검색할 수도 있고, 사용자의 모바일 기기에 저장된 연락처를 검색할 수도 있으며, 사용자의 일정을 파악하거나 새로 등록할 수도 있다.On the other hand, the response module 140 analyzes the text command characterizing the voice command in the text module 120 to process the command and to provide a textual response to the text command. That is, the response module 140 analyzes the text command to determine the meaning of the voice command and performs the command according to the meaning. The response module 140 may search for information necessary by wireless communication, search for a contact stored in the mobile device of the user, and grasp a user's schedule or register a new user.
예를 들어, 사용자의 음성 명령이 "오늘의 날씨는?"인 경우, 응답 모듈(140)은 무선 통신을 통해 오늘의 날씨를 검색하여 "오늘 비가 옵니다." 또는 "오늘의 날씨를 알려드리겠습니다."와 같은 응답 문장을 생성하게 된다.For example, if the user's voice command is "What is the weather of the day?", The response module 140 retrieves the weather of the day through wireless communication and "rains today." Or a response that says, "I'll tell you today's weather."
표시 모듈(150)은 모바일 기기의 표시부(170)에 도 2에 도시한 것과 같은 대화창(200)을 생성하고 그 대화창(200)을 통해 사용자와 가상의 개인 비서간의 대화를 카툰 형식으로 대화창(200)에 표시한다. The display module 150 generates a chat window 200 as shown in FIG. 2 on the display unit 170 of the mobile device, and communicates the dialog between the user and the virtual personal assistant through the chat window 200 in a cartoon format. ).
표시 모듈(150)은 대화창(200)에 명령창(210)과 응답창(220)과 결과창(230)을 스크롤 가능하게 표시한다. 도 2 및 도 4를 참조하면, 명령창(210)은 사용자의 음성 명령을 문자화 모듈(120)이 텍스트 명령으로 변환한 결과이다. 표시 모듈(150)은 단순히 텍스트 명령을 명령창(210)에 글자만으로 표시하는 것이 아니라 카툰 형식으로 표시한다. 카툰 형식이라 함은 만화의 형식과 같이 명령창(210)의 틀인 프레임을 설정하고 그 프레임 내에 배경 이미지 또는 배경색을 설정하고 사용자를 표시하는 캐릭터를 표시하고 말풍선을 사용하는 것을 의미한다. 사용자의 음성 명령은 사용자 캐릭터의 옆에 말풍선을 그리고 그 말풍선 내부에 텍스트 명령을 글자로 표시한다. "오늘의 날씨는?", "수아 전화번호?"와 같은 텍스트 명령을 말풍선 내에 표시하게 된다. 경우에 따라서는 사용자의 음성 명령과 개인 비서의 대화에 어울리는 사물의 이미지를 명령창(210)에 추가로 표시하는 것도 가능하다. 이와 같이 카툰 형식으로 사용자의 명령과 그에 대한 가상의 개인 비서의 응답을 표시함으로써 사용자의 흥미를 향상시키고 개인 비서 서비스에 대한 만족도를 향상시킬 수 있다. 또한, 사용자의 감정을 카툰 형식을 사용하여 표현함으로써 문자 이상의 전달력을 가질 수 있고 사용자의 만족감도 향상시킬 수 있는 장점이 있다.The display module 150 displays the command window 210, the response window 220, and the result window 230 in a chat window 200 in a scrollable manner. 2 and 4, the command window 210 is a result of the text module 120 converting a user's voice command into a text command. The display module 150 does not simply display the text command in the command window 210 in letters, but in a cartoon format. The cartoon format means setting a frame that is a frame of the command window 210 like a cartoon format, setting a background image or a background color in the frame, displaying a character representing the user, and using a speech bubble. The user's voice command draws a speech bubble next to the user character and a text command inside the speech bubble. Text commands such as "What is the weather for today?" And "Sua phone number?" Will be displayed in the speech bubble. In some cases, the command window 210 may further display an image of an object suitable for the voice command of the user and the conversation of the personal assistant. As such, by displaying a user's command in response to a virtual personal assistant in a cartoon format, the user's interest can be enhanced and satisfaction with the personal assistant service can be improved. In addition, by expressing the emotion of the user using a cartoon format can have a transmission power more than the character and has the advantage of improving the satisfaction of the user.
도 2 및 도 4를 참조하면 표시 모듈(150)은 응답창(220)도 상술한 명령창(210)과 유사한 방법으로 표시한다. 응답창(220)은 사용자의 음성 명령에 대한 개인 비서의 응답을 카툰 형태로 대화창(200)에 표시하는 것이다. 명령창(210)과 마찬가지로 프레임의 배경색과, 개인 비서의 캐릭터 이미지, 말풍선 내부에 표시되는 응답 문장의 텍스트로 구성된다. "오늘의 날씨를 알려드리겠습니다.", "전화번호 정보를 안내해 드리겠습니다."와 같은 응답 문장이 응답창(220)의 말풍선 내부에 표시된다.2 and 4, the display module 150 displays the response window 220 in a similar manner to the command window 210 described above. The response window 220 displays a response of the personal assistant to the voice command of the user in the chat window 200 in a cartoon form. Like the command window 210, the frame is composed of a background color, a character image of a personal assistant, and text of a response sentence displayed inside a speech bubble. Response sentences such as "I will inform you the weather of today", "I will guide the phone number information" is displayed inside the speech bubble of the response window (220).
도 2를 참조하면, 음성 명령이 정보의 조회를 요구하는 내용의 명령인 경우에는 그 정보를 조회한 결과(응답 정보)를 표시 모듈(150)이 결과창(230)에 표시한다. 즉, 음성 명령이 모바일 기기 내부에 저장된 응답 정보(예컨대, 전화번호) 또는 외부 서버에 저장된 응답 정보(예컨대, 버스 운행 정보)의 조회를 요구하는 명령인 경우에 응답 모듈(140)은 응답 정보를 조회하여 그 결과를 결과창(230)에 표시한다. 응답 모듈(140)은 HTML 형식의 응답 정보를 수신하거나 응답 정보를 HTML 형식으로 가공하여 표시 모듈(150)에 전달하고, 표시 모듈(150)은 그 응답 정보를 결과창(230)에 표시한다. 표시 모듈(150)은 응답 정보의 HTML 형식의 내용에 따라 단순히 텍스트 형태로 결과창(230)에 표시할 수도 있고, 명령창(210) 및 응답창(220)과 마찬가지로 카툰 형식으로 결과창(230)을 표시할 수도 있다. 도 2에 도시한 예의 경우, 결과창(230)에는 사용자가 문의한 사람의 사진과 이름 및 전화번호가 표시된다. Referring to FIG. 2, when the voice command is an instruction requesting information inquiry, the display module 150 displays the result of inquiring the information (response information) in the result window 230. That is, when the voice command is a command for requesting inquiry of response information (eg, a phone number) stored in the mobile device or response information (eg, bus operation information) stored in an external server, the response module 140 may request response information. The result is displayed in the result window 230. The response module 140 receives the response information in the HTML format or processes the response information in the HTML format and transmits the response information to the display module 150, and the display module 150 displays the response information in the result window 230. The display module 150 may simply display the result window 230 in text form according to the content of the HTML format of the response information, and like the command window 210 and the response window 220, the result window 230 may be in a cartoon format. ) Can also be displayed. In the example shown in FIG. 2, the result window 230 displays a picture, a name, and a phone number of the person inquiring.
특히, 본 실시예의 카툰형 모바일 개인 비서 서비스 시스템은 영화 시간표, 버스 운행 정보, 항공기 운행 정보, 날씨 정보 등의 다양한 정보를 제공하는 외부 서버와 연동하여 사용될 수 있는데, 이때 상술한 바와 같이 HTML 형식으로 결과창(230)을 표시하는 표시 모듈(150)을 이용하여 외부 서버는 다양한 시각적인 방법으로 응답 정보를 제공할 수 있다. 이와 같이 함으로써 본 실시예의 카툰형 모바일 개인 비서 서비스 시스템을 제공하는 사업자는 명령창(210)과 결과창(230)의 카툰 이미지만 관리하면 되고, 외부 연결 서비스의 서버 관리자는 결과창(230)의 규격에 맞추어 자신에게 효과적인 방법으로 결과창(230)을 제공할 수 있으므로 전체적인 서비스의 운용 효율을 향상시킬 수 있는 장점이 있다. In particular, the cartoon-type mobile personal assistant service system of the present embodiment can be used in conjunction with an external server that provides various information such as movie timetable, bus operation information, aircraft operation information, weather information, etc. By using the display module 150 displaying the result window 230, the external server may provide response information in various visual ways. By doing so, the operator providing the cartoon-type mobile personal assistant service system of the present embodiment only needs to manage the cartoon image of the command window 210 and the result window 230, and the server manager of the external connection service of the result window 230 Since the result window 230 can be provided in an effective way according to the standard, there is an advantage of improving the operation efficiency of the overall service.
이와 같이 외부 서버에서 결과창(230)의 규격에 맞는 HTML 형식의 응답 정보를 제공할 수 있도록, 응답 모듈(140)은 외부 서버에 응답 정보를 조회할 때 결과창(230)의 크기를 미리 외부 서버에 전송하게 된다. 외부 서버는 결과창(230)의 크기를 고려하여 응답 정보를 HTML 형식으로 모바일 기기에 전달하게 된다. As such, when the external server provides the response information in the HTML format conforming to the standard of the result window 230, the response module 140 pre-examines the size of the result window 230 when inquiring the response information to the external server. Will be sent to the server. The external server transmits the response information in HTML format to the mobile device in consideration of the size of the result window 230.
한편, 표시 모듈(150)은 터치에 의해 관련 애플리케이션과 연동될 수 있도록 결과창(230)을 관련 애플리케이션과 링크하여 생성한다. 예컨대 날씨와 관련된 결과창(230)의 경우 사용자가 결과창(230)을 터치하면 날씨 정보를 제공하는 외부 서버와 연결된 날씨 애플리케이션이 모바일 기기에서 실행된다. 영화 상영 시간과 관련된 결과창(230)의 경우 사용자가 결과창(230)을 터치하면 영화 상영 시간표를 제공하는 외부 서버와 연결된 애플리케이션이 모바일 기기에서 실행된다. 도 2의 경우에는 사용자가 결과창(230)을 터치하면 전화번호부 애플리케이션이 실행되어 사용자가 원하는 더욱 자세한 정보를 조회하는 것이 가능하다. 이와 같이 사용자는 본 실시예의 카툰형 모바일 개인 비서 서비스 시스템에서 벗어나 더욱 자세한 정보를 조회하기 원하는 경우, 결과창(230)을 터치하여 해당 정보를 조회하는 것이 가능하다. Meanwhile, the display module 150 links and generates the result window 230 with the related application so as to be linked with the related application by the touch. For example, in the case of a weather-related result window 230, when a user touches the result window 230, a weather application connected to an external server providing weather information is executed on the mobile device. In the case of the result window 230 related to the movie showing time, when the user touches the result window 230, an application connected to an external server that provides the movie showing timetable is executed on the mobile device. In the case of FIG. 2, when the user touches the result window 230, the phonebook application is executed to search for more detailed information desired by the user. In this way, if the user wants to inquire more detailed information from the cartoon-type mobile personal assistant service system of the present embodiment, it is possible to inquire the corresponding information by touching the result window 230.
한편, 카툰 저장 모듈(160)에는 명령창(210)과 응답창(220) 구성을 위해 사용되는 다양한 이미지들이 저장된다. 명령창(210)에 사용될 사용자 캐릭터의 다양한 이미지와 응답창(220)에 사용될 개인 비서 캐릭터의 다양한 이미지가 카툰 저장 모듈(160)에 저장된다. 경우에 따라서는 사용자 캐릭터와 개인 비서 캐릭터는 기쁨, 분노, 슬픔 등의 다양한 감정에 대응하는 표정으로 디자인되어 카툰 저장 모듈(160)에 저장된다. 명령창(210)과 응답창(220)에 사용될 말풍선의 모양도 다양하게 디자인되어 카툰 저장 모듈(160)에 저장된다. 말풍선 역시 사용자 또는 개인 비서의 감정에 따라 다양하게 디자인되어 카툰 저장 모듈(160)에 저장된다. 경우에 따라서는 사용자 또는 개인 비서의 감정에 대응하는 명령창(210) 및 응답창(220)의 다양한 배경색도 감정에 대응하여 카툰 저장 모듈(160)에 저장될 수 있고, 명령창(210) 및 응답창(220)에 표시될 시계, 컵, 도서와 같은 다양한 사물들도 카툰 저장 모듈(160)에 저장된다.Meanwhile, the cartoon storage module 160 stores various images used for constructing the command window 210 and the response window 220. Various images of the user character to be used in the command window 210 and various images of the personal assistant character to be used in the response window 220 are stored in the cartoon storage module 160. In some cases, the user character and the personal assistant character are designed with expressions corresponding to various emotions such as joy, anger, and sadness and are stored in the cartoon storage module 160. Various shapes of speech bubbles to be used in the command window 210 and the response window 220 are also stored in the cartoon storage module 160. Speech balloons are also variously designed according to the emotion of the user or personal assistant and stored in the cartoon storage module 160. In some cases, various background colors of the command window 210 and the response window 220 corresponding to the emotion of the user or the personal assistant may also be stored in the cartoon storage module 160 in response to the emotion, and the command window 210 and Various objects such as a clock, a cup, and a book to be displayed in the response window 220 are also stored in the cartoon storage module 160.
표시 모듈(150)은 앞에서 설명한 감정 추출 모듈(130)에서 추출된 사용자의 감정에 따라 카툰 저장 모듈(160)에서 적절한 사용자 캐릭터의 캐릭터 이미지와 말풍선 이미지를 조회하여 명령창(210)을 구성한다.The display module 150 configures the command window 210 by inquiring the character image and the speech bubble image of the appropriate user character in the cartoon storage module 160 according to the emotion of the user extracted by the emotion extraction module 130 described above.
응답 모듈(140)은 감정 추출 모듈(130)에서 추출된 사용자의 감정에 대응하는 응답 감정을 결정하고 그에 따라 응답 문장을 구성한다. 응답 모듈(140)은 응답 감정에 따라 응답 텍스트를 결정한다. 표시 모듈(150)은 응답 모듈(140)에서 결정된 응답 감정에 따라 카툰 저장 모듈(160)에서 적절한 감정을 표현할 수 있는 개인 비서 캐릭터의 캐릭터 이미지와 말풍선 이미지를 조회하여 응답창(220)을 구성한다.The response module 140 determines a response emotion corresponding to the emotion of the user extracted by the emotion extraction module 130 and constructs a response sentence accordingly. The response module 140 determines the response text according to the response feelings. The display module 150 configures the response window 220 by inquiring the character image and the speech bubble image of the personal assistant character who can express the appropriate emotion in the cartoon storage module 160 according to the response emotion determined by the response module 140. .
응답 모듈(140)에서 응답 감정을 결정하는 과정을 더욱 구체적으로 설명하면 다음과 같다. 먼저, 음성 명령의 감정 평면상의 좌표마다 그에 대응하는 응답 문장의 감정 평면상의 좌표를 설정한다. 이와 같은 음성 명령의 감정 평면상의 좌표와 응답 감정의 감정 평면상의 대응관계는 다양한 방법으로 설정될 수 있다. 예를 들어, 사용자의 감정이 "행복, 기쁨"인 경우, 응답 감정도 "행복, 기쁨"으로 대응시켜, 사용자의 감정에 호응하도록 설정할 수 있다. 또한, 음성 명령의 감정이 "불행, 슬픔"인 경우, 응답 감정은 "차분, 고요"로 대응시켜 사용자의 감정을 위로하고 완화시키도록 설정할 수 있다.The process of determining the response feeling in the response module 140 will be described in more detail as follows. First, the coordinates on the emotion plane of the response sentence corresponding thereto are set for each coordinate on the emotion plane of the voice command. The correspondence between the coordinates on the emotion plane of the voice command and the emotion plane of the response emotion may be set in various ways. For example, when the user's emotion is "happiness, joy", the response emotion may also be set to correspond to the user's emotion by "corresponding to" happy, joy ". In addition, when the emotion of the voice command is "unhappy, sad", the response emotion may be set to comfort and alleviate the user's emotion by responding with "difference, calm".
이와 같이 응답 감정이 결정되면 그 결정된 감정에 따라 응답 문장을 구성하거나 응답창(220)의 배경색 또는 말풍선의 형상을 결정하게 된다. 응답 모듈(140)은 응답 감정의 감정 평면상의 위치에 다라 응답 문장의 응답 문장의 형태소, 어휘, 어미를 조절하여 응답 문장을 구성하게 된다.When the response emotion is determined as described above, the response sentence may be configured or the background color of the response window 220 or the shape of the speech bubble may be determined according to the determined emotion. The response module 140 configures the response sentence by adjusting the morpheme, vocabulary, and ending of the response sentence of the response sentence according to the position on the emotion plane of the response emotion.
도 4를 참조하면, 사용자의 음성 명령이 각성과, 불쾌의 감정으로 인식되는 경우 이를 표현할 수 있는 형태로 명령창(210)을 구성하여 표시부(170)에 표시한다. 또한 그에 대한 응답 문장과 응답창(220)을 구성함에 있어서도 사용자의 음성 명령의 감정을 고려하여 그 음성 명령의 감정에 적절하게 대응하도록 매핑된 응답 감정에 따라 응답창(220)에 사용될 캐릭터의 이미지와 말풍선의 유형을 선택하게 된다. 도 5 및 도 6은 응답 감정에 따라 변형된 개인 비서의 캐릭터 이미지와 배경 이미지 및 말풍선의 유형을 예를 들어 도시한 것이다. 이와 같이 다양한 이미지를 조합하여 사용자의 음성 명령에 대한 적절한 반응을 카툰 형식으로 응답창(220)에 나타냄으로써 종래에 문자만으로 반응하던 개인 비서 서비스에 비해 사용자의 흥미와 만족감을 향상시킬 수 있다.Referring to FIG. 4, when the user's voice command is recognized as an awakening and unpleasant emotion, the command window 210 is configured and displayed on the display unit 170 in a form that can be expressed. In addition, in constructing the response sentence and the response window 220, the image of the character to be used in the response window 220 according to the response feeling mapped to appropriately correspond to the emotion of the voice command in consideration of the emotion of the voice command of the user. You will choose the type of speech bubble. 5 and 6 illustrate examples of character images, background images, and speech bubbles of personal assistants modified according to response emotions. By combining various images as described above, an appropriate response to the voice command of the user is displayed in the response window 220 in the form of a cartoon, so that the user's interest and satisfaction can be improved as compared to a personal assistant service that has conventionally only responded to text.

Claims (14)

  1. 모바일 기기에서 사용자의 음성 명령을 수신하여 상기 음성 명령에 대한 응답을 생성하여 가상의 개인 비서를 통해 상기 모바일 기기의 표시부에 표시하는 카툰형 모바일 개인 비서 서비스 시스템에 있어서,In the cartoon-type mobile personal assistant service system for receiving a user's voice command from the mobile device to generate a response to the voice command to display on the display unit of the mobile device through a virtual personal assistant,
    모바일 기기의 마이크를 통해 사용자의 음성 명령을 수신하는 음성 수신 모듈;A voice receiving module configured to receive a voice command of a user through a microphone of the mobile device;
    상기 음성 명령을 분석하여 문자화된 텍스트 명령으로 변환하는 문자화 모듈;A texting module for analyzing the voice command and converting the voice command into a textual text command;
    상기 텍스트 명령에 대한 응답을 문자화된 응답 문장으로 생성하는 응답 모듈; 및A response module for generating a response to the text command in a characterized response sentence; And
    상기 모바일 기기의 표시부에 대화창을 생성하고, 상기 텍스트 명령을 카툰 형태로 표시하는 명령창과, 상기 응답 문장을 카툰 형태로 표시하는 응답창을 각각 생성하여 상기 대화창에 스크롤 가능하게 표시하는 표시 모듈;을 포함하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.A display module for creating a chat window on a display unit of the mobile device, a command window for displaying the text command in a cartoon form, and a response window for displaying the response sentence in a cartoon form, and scrollably displaying the chat window in the chat window; Cartoon-type mobile personal assistant service system, characterized in that it comprises.
  2. 제1항에 있어서,The method of claim 1,
    상기 명령창은, 상기 사용자를 표시하는 캐릭터와, 상기 텍스트 명령이 표시되는 말풍선과 상기 명령창의 배경색에 의해 카툰 형태로 표시되고,The command window is displayed in a cartoon form by a character displaying the user, a speech bubble displaying the text command, and a background color of the command window.
    상기 응답창은, 상기 개인 비서를 표시하는 캐릭터와, 상기 응답 문장이 표시되는 말풍선과 상기 응답창의 배경색에 의해 카툰 형태로 표시되는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The response window is cartoon type mobile personal assistant service system, characterized in that the character is displayed in a cartoon form by the character, the speech bubble, the response sentence is displayed and the background color of the response window.
  3. 제1항 또는 제2항에 있어서,The method according to claim 1 or 2,
    상기 음성 명령이 상기 모바일 기기와 네트워크를 통해 연결된 외부 서버에 저장되거나 상기 모바일 기기 내부에 저장된 응답 정보의 조회를 요청하는 경우, When the voice command is stored in an external server connected to the mobile device through a network or requests an inquiry of response information stored in the mobile device,
    상기 응답 모듈은, 상기 응답 정보를 조회하여 수신하고,The response module inquires and receives the response information,
    상기 표시 모듈은, 상기 모바일 기기의 표시부에 생성한 대화창에 상기 응답 정보를 표시하는 결과창을 더 표시하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The display module, the cartoon-type mobile personal assistant service system, characterized in that for further displaying a result window for displaying the response information in the chat window generated on the display unit of the mobile device.
  4. 제3항에 있어서,The method of claim 3,
    상기 응답 모듈은, 상기 외부 서버로부터 상기 결과창에 표시할 수 있는 HTML 형식의 상기 응답 정보를 수신하고,The response module receives the response information in HTML format that can be displayed in the result window from the external server,
    상기 표시 모듈은, 상기 HTML 형식의 응답 정보를 표시할 수 있도록 상기 결과창을 구성하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The display module, Cartoon-type mobile personal assistant service system, characterized in that for configuring the result window to display the response information in the HTML format.
  5. 제4항에 있어서,The method of claim 4, wherein
    상기 응답 모듈은, 상기 외부 서버에 상기 응답 정보를 조회할 때 상기 외부 서버가 상기 결과창의 크기에 맞는 HTML 형식의 응답 정보를 송신할 수 있도록 상기 결과창의 크기를 상기 외부 서버에 전송하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The response module transmits the size of the result window to the external server so that when the response information is inquired to the external server, the external server can transmit the response information in HTML format corresponding to the size of the result window. Cartoon mobile personal assistant service system.
  6. 제5항에 있어서,The method of claim 5,
    상기 표시 모듈은, 상기 결과창을 사용자가 터치하면 상기 외부 서버에 연결되는 애플리케이션이 상기 모바일 기기에서 실행될 수 있도록 상기 결과창을 터치 가능하고 상기 애플리케이션에 링크된 형태로 구성하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The display module is cartoon type, characterized in that configured to form a form that can be touched and linked to the application so that an application connected to the external server can be executed in the mobile device when the user touches the result window. Mobile personal assistant service system.
  7. 제4항에 있어서,The method of claim 4, wherein
    상기 음성 명령의 음향의 높낮이와 빠르기를 분석하고, 상기 텍스트 명령의 단어를 분석하여 사용자의 감정을 추출하는 감정 추출 모듈; 및An emotion extraction module for analyzing the height and speed of the sound of the voice command and extracting the user's emotion by analyzing the word of the text command; And
    상기 감정 추출 모듈에서 추출한 사용자의 각각의 감정에 대응하는 표정으로 디자인된 상기 사용자와 개인 비서의 캐릭터들과 말풍선의 모양이 저장된 카툰 저장 모듈;을 더 포함하고,And a cartoon storage module in which characters of the user and the personal assistant and the shape of the speech bubble are designed to have expressions corresponding to the emotions of the user extracted by the emotion extraction module.
    상기 표시 모듈은, 상기 감정 추출 모듈에서 추출된 사용자의 감정에 따라 상기 카툰 저장 모듈에서 상기 사용자 캐릭터의 캐릭터 이미지와 말풍선 이미지를 조회하여 상기 명령창을 구성하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The display module, the cartoon-type mobile personal assistant service, characterized in that to configure the command window by querying the character image and the speech bubble image of the user character in the cartoon storage module according to the emotion of the user extracted from the emotion extraction module system.
  8. 제7항에 있어서,The method of claim 7, wherein
    상기 응답 모듈은, 상기 감정 추출 모듈에서 추출된 사용자의 감정에 대응하는 응답 감정을 결정하고 상기 응답 감정에 따라 상기 응답 텍스트를 결정하고,The response module determines a response emotion corresponding to the emotion of the user extracted by the emotion extraction module and determines the response text according to the response emotion,
    상기 표시 모듈은, 상기 응답 모듈에서 결정된 상기 응답 감정에 따라 상기 카툰 저장 모듈에서 상기 개인 비서 캐릭터의 캐릭터 이미지와 말풍선 이미지를 조회하여 상기 응답창을 구성하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The display module, the cartoon-type mobile personal assistant service system, characterized in that for configuring the response window by querying the character image and the speech bubble image of the personal assistant character in the cartoon storage module according to the response feelings determined in the response module. .
  9. 제8항에 있어서,The method of claim 8,
    상기 감정 추출 모듈은, 상기 음성 명령의 음향이 미리 설정된 음향 기준보다 높고 빠르면 각성 상태로 인식하고, 상기 음향 기준보다 낮고 느리면 이완 상태로 인식하여 상기 음성 명령의 긴장도를 이완 상태와 각성 상태의 정도로 수치화하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The emotion extraction module recognizes the sound of the voice command as an awake state when the sound of the voice command is higher and faster than a preset sound reference, and recognizes it as a relaxed state when the sound of the voice command is higher and faster than the preset sound reference and digitizes the tension of the voice command to the degree of relaxation and awake state. Cartoon-type mobile personal assistant service system, characterized in that.
  10. 제9항에 있어서,The method of claim 9,
    상기 감정 추출 모듈은, 상기 텍스트 명령의 단어를 분석하여 부정 형태소 또는 긍정 형태소의 포함 정도, 상기 텍스트 명령에 부정적 어휘 또는 긍정적 어휘의 포함 정도 및 상기 텍스트 명령의 어미가 경어인지 정도를 분석하여 불쾌함과 유쾌함의 정도를 수치화하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The emotion extraction module analyzes a word of the text command and analyzes the degree of inclusion of a negative morpheme or a positive morpheme, a degree of inclusion of a negative or positive vocabulary in the text command, and a degree of displeasure of whether the ending of the text command is a verb. Cartoon mobile personal assistant service system, characterized in that to quantify the degree of enjoyment and fun.
  11. 제10항에 있어서,The method of claim 10,
    상기 감정 추출 모듈은, 상기 텍스트 명령의 분석 결과에 따른 불쾌함과 유쾌함의 정도를 표현하는 제1축과, 상기 음성 명령의 분석 결과에 따른 긴장도를 표현하는 제2축으로 감정 평면을 형성하고, 상기 2차원 감정 평면상의 위치에 따라 사용자의 감정을 분류하여 추출하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The emotion extracting module may include an emotion plane formed of a first axis representing a degree of discomfort and a pleasantness according to an analysis result of the text command, and a second axis representing a tension degree according to an analysis result of the voice command, Cartoon-type mobile personal assistant service system, characterized in that for classifying and extracting the user's emotions according to the position on the two-dimensional emotion plane.
  12. 제11항에 있어서,The method of claim 11,
    상기 응답 모듈은, 상기 감정 추출 모듈에서 인식된 음성 명령의 상기 감정 평면상의 위치에 따라, 상기 응답 감정의 상기 감정 평면상의 위치를 설정하고 그 감정 평면 상의 위치에 따라 상기 응답 문장을 구성하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The response module sets the position on the emotion plane of the response emotion according to the position on the emotion plane of the voice command recognized by the emotion extraction module and constructs the response sentence according to the position on the emotion plane. Cartoon mobile personal assistant service system.
  13. 제12항에 있어서,The method of claim 12,
    상기 응답 모듈은, 상기 응답 감정의 상기 감정 평면상의 위치에 따라, 상기 응답창의 캐릭터의 표정, 말풍선의 모양, 배경색을 조절하여 응답창을 구성하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The response module, Cartoon-type mobile personal assistant service system, characterized in that for configuring the response window by adjusting the expression, the shape of the speech bubble, the background color of the character of the response window in response to the position on the emotion plane.
  14. 제12항에 있어서,The method of claim 12,
    상기 응답 모듈은, 상기 응답 감정의 상기 감정 평면상의 위치에 따라, 상기 응답 문장의 형태소, 어휘, 어미를 조절하여 상기 응답 문장을 구성하는 것을 특징으로 하는 카툰형 모바일 개인 비서 서비스 시스템.The response module, Cartoon-type mobile personal assistant service system, characterized in that for configuring the response sentence by adjusting the morpheme, vocabulary, and ending of the response sentence according to the position on the emotion plane of the response emotion.
PCT/KR2014/003622 2014-04-11 2014-04-24 Cartoon-type mobile personal secretary service system WO2015156443A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2014-0043484 2014-04-11
KR20140043484 2014-04-11

Publications (1)

Publication Number Publication Date
WO2015156443A1 true WO2015156443A1 (en) 2015-10-15

Family

ID=54288009

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/003622 WO2015156443A1 (en) 2014-04-11 2014-04-24 Cartoon-type mobile personal secretary service system

Country Status (1)

Country Link
WO (1) WO2015156443A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364653A (en) * 2018-02-12 2018-08-03 王磊 Voice data processing method and processing unit
WO2020116818A1 (en) * 2018-12-03 2020-06-11 Samsung Electronics Co., Ltd. Electronic device and method of controlling thereof
CN113794927A (en) * 2021-08-12 2021-12-14 维沃移动通信有限公司 Information display method and device and electronic equipment

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0855130A (en) * 1994-08-11 1996-02-27 Sharp Corp Electronic secretary system
US20050080783A1 (en) * 2000-01-05 2005-04-14 Apple Computer, Inc. One Infinite Loop Universal interface for retrieval of information in a computer system
KR20100088461A (en) * 2009-01-30 2010-08-09 삼성전자주식회사 Apparatus and method for recognizing emotion using a voice signal

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0855130A (en) * 1994-08-11 1996-02-27 Sharp Corp Electronic secretary system
US20050080783A1 (en) * 2000-01-05 2005-04-14 Apple Computer, Inc. One Infinite Loop Universal interface for retrieval of information in a computer system
KR20100088461A (en) * 2009-01-30 2010-08-09 삼성전자주식회사 Apparatus and method for recognizing emotion using a voice signal

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MARO&SUNNYSPOT: "TOONPAL (Cartoon Random Chatting", GOOGLE PLAY, 13 March 2014 (2014-03-13), Retrieved from the Internet <URL:https://play.google.com/store/apps/details?id=com.sunnyspot.toonpal&hl=ko> *
TOM WARREN: "Apple has Siri, and Microsoft is about to get Cortana", THE VERGE, 20 February 2014 (2014-02-20), Retrieved from the Internet <URL:http://www.theverge.com/2014/2/20/5430188/microsoft-cortana-personal-digital-assistant-windows-phone-8-1> *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364653A (en) * 2018-02-12 2018-08-03 王磊 Voice data processing method and processing unit
WO2020116818A1 (en) * 2018-12-03 2020-06-11 Samsung Electronics Co., Ltd. Electronic device and method of controlling thereof
US11495220B2 (en) 2018-12-03 2022-11-08 Samsung Electronics Co., Ltd. Electronic device and method of controlling thereof
CN113794927A (en) * 2021-08-12 2021-12-14 维沃移动通信有限公司 Information display method and device and electronic equipment

Similar Documents

Publication Publication Date Title
CN109447234B (en) Model training method, method for synthesizing speaking expression and related device
CN110418208B (en) Subtitle determining method and device based on artificial intelligence
CN110444191B (en) Rhythm level labeling method, model training method and device
KR101777807B1 (en) Sign language translator, system and method
CN103116576A (en) Voice and gesture interactive translation device and control method thereof
JP6392374B2 (en) Head mounted display system and method for operating head mounted display device
CN108763552B (en) Family education machine and learning method based on same
US9128930B2 (en) Method, device and system for providing language service
EP2933607A1 (en) Navigation system having language category self-adaptive function and method of controlling the system
US11120063B2 (en) Information processing apparatus and information processing method
KR102628211B1 (en) Electronic apparatus and thereof control method
JP2017531197A (en) Outputting the contents of character data with the voice of the character data sender
CN203149569U (en) Voice and gesture interactive translation device
WO2016203805A1 (en) Information processing device, information processing system, information processing method, and program
WO2015062312A1 (en) Method, device and system for providing language service
CN109308178A (en) A kind of voice drafting method and its terminal device
CN110493123A (en) Instant communication method, device, equipment and storage medium
WO2021006538A1 (en) Avatar visual transformation device expressing text message as v-moji and message transformation method
WO2015156443A1 (en) Cartoon-type mobile personal secretary service system
CN109686359B (en) Voice output method, terminal and computer readable storage medium
CN110555329A (en) Sign language translation method, terminal and storage medium
KR101981091B1 (en) Device for creating subtitles that visualizes emotion
KR101567154B1 (en) Method for processing dialogue based on multiple user and apparatus for performing the same
CN108491471B (en) Text information processing method and mobile terminal
CN111145734A (en) Voice recognition method and electronic equipment

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14888917

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14888917

Country of ref document: EP

Kind code of ref document: A1