WO2020045712A1 - Device, method and computer-readable recording medium for providing asynchronous instant messaging service - Google Patents

Device, method and computer-readable recording medium for providing asynchronous instant messaging service Download PDF

Info

Publication number
WO2020045712A1
WO2020045712A1 PCT/KR2018/010172 KR2018010172W WO2020045712A1 WO 2020045712 A1 WO2020045712 A1 WO 2020045712A1 KR 2018010172 W KR2018010172 W KR 2018010172W WO 2020045712 A1 WO2020045712 A1 WO 2020045712A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice
messages
user
message
character
Prior art date
Application number
PCT/KR2018/010172
Other languages
French (fr)
Korean (ko)
Inventor
장준수
윤용기
장재웅
김세미
신희욱
김영상
임중신
정정화
Original Assignee
주식회사 닫닫닫
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 닫닫닫 filed Critical 주식회사 닫닫닫
Publication of WO2020045712A1 publication Critical patent/WO2020045712A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/50Business processes related to the communications industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information

Definitions

  • the present disclosure relates to an apparatus, a method and a computer readable storage medium for providing an asynchronous instant message service.
  • a user using an instant message service can transfer messages between two or more users relatively quickly and simply.
  • mobile devices such as smart phones are widely used, the use of instant messaging services has exploded.
  • the instant message service enables the transmission of a relatively short voice message.
  • the voice message is easier to input than the text message, and may transmit various features that the user who inputs the voice message wants to deliver.
  • the data size of the voice message is generally larger than that of the text message, and the user must perform an operation of playing each voice message (eg, clicking, touching, etc.) the voice message, and listening to the voice message being played.
  • voice messages may have spatial constraints, such as temporal constraints or memory space or physical space, compared to text messages that can be quickly identified by eye.
  • Prior Art Document 1 when a user inputs a voice message, performs a voice recognition from the voice message to generate a text message, and extracts the user's emotion from the voice message
  • Prior Art Document 1 A text representation method of changing and outputting a font of a text message generated from a voice message is disclosed.
  • the prior art document 1 extracts information on various emotions from a voice message and generates a text message using the information, but only a part of information that a user wants to deliver through the voice message can be obtained. The rest of the information may be lost.
  • the present disclosure is directed to solving the above problems, and provides an apparatus, method, and computer readable storage medium that are convenient for playing a voice message in an instant message service and are efficient in data management.
  • the present disclosure provides an apparatus, method, and computer readable storage medium capable of providing an improved instant message service utilizing characters in an instant message service.
  • a method of providing an instant message service performed under the control of a computing device of a first user includes receiving one or more voice messages including a voice message sent by a computing device of a second user and one or more voice recognized text messages corresponding to each of the one or more voice messages; Receiving a request for playing a voice message from a first user; And responsive to the voice message reproducing request, reproducing one or more voice messages sequentially received.
  • the method may include storing each of the one or more voice recognized text messages corresponding to the one or more voice messages.
  • the method may further include displaying, in response to the playing of the one or more voice messages, the one or more voice recognized text messages.
  • the exemplary method may further include receiving character information for the character of the second user.
  • sequentially playing the received one or more voice messages may include playing back the voice message along with displaying the character of the second user based on the character information.
  • An instant message service providing apparatus may include a communication module, a user interface module, a voice playback module, a display module, and a memory module.
  • the communication module may be configured to receive one or more voice messages including voice messages sent by the sender's external computing device and one or more voice recognized text messages corresponding to the one or more voice messages, respectively.
  • the user interface module may be configured to receive input for an instant message service.
  • the user interface module may receive a voice message playing request from a user.
  • the voice playback module may be configured to sequentially reproduce one or more voice messages received by the communication module in response to the voice message playback request received by the user interface module.
  • the display module may be configured to sequentially display one or more voice recognized text messages in response to the playback of the one or more voice messages by the voice playback module.
  • the memory module may be configured to store one or more voice messages and one or more voice recognized text messages.
  • the user interface module can be configured to receive an input voice message from the user.
  • the instant message service providing apparatus may further include a voice recognition module and a text recognition module.
  • the voice recognition module may be configured to perform voice recognition on the input voice message to obtain a voice recognized input text message.
  • the character recognition module may be configured to detect an operation character that enables selecting an operation of a character of a user displayed by the display module, from the voice recognized input text message obtained by the speech recognition module.
  • the instant message service providing apparatus may further include a camera module and an expression determining module.
  • the camera module may be configured to obtain face information of the user.
  • the facial expression determination module may be configured to determine the facial expression of the character of the user based on the face information.
  • a computer readable storage medium having stored thereon a computer program for providing an instant message service.
  • the computer program stored in the computer readable storage medium when executed, causes the first user's computing device to correspond to the one or more voice messages and the one or more voice messages, respectively, including the voice message sent by the second user's computing device.
  • Receiving one or more voice recognized text messages ; Storing at least one voice message and at least one voice recognized text message; Receiving a request for playing a voice message from a first user; Responsive to the voice message reproducing request, reproducing one or more voice messages sequentially received; And displaying the one or more voice recognized text messages in response to the reproduction of the one or more voice messages.
  • FIG. 1 is an exemplary environmental diagram illustrating an environment in which an instant message service is provided in accordance with at least some embodiments of the present disclosure
  • FIG. 2 illustrates an example of using an instant message service in accordance with the present disclosure
  • FIG. 3 illustrates an example of displaying and playing a message on a user's mobile device when using an instant message service according to FIG. 2;
  • FIGS. 2 and 3 shows an example showing a log of an instant message, in the example according to FIGS. 2 and 3;
  • FIG. 5 is a block diagram schematically illustrating an apparatus for providing an instant message service according to at least some embodiments of the present disclosure
  • FIG. 6 is a flow diagram illustrating an example process for a method of providing instant message services, in accordance with at least some embodiments of the present disclosure
  • FIG. 7 is a flowchart illustrating another example process for a method of providing instant message services, in accordance with at least some embodiments of the present disclosure.
  • FIG 8 illustrates an example computer program product that may be used to provide an instant message service, in accordance with at least some embodiments of the present disclosure.
  • FIG. 9 is a block diagram schematically illustrating a server for providing an instant message service according to at least some embodiments of the present disclosure.
  • the present disclosure generally relates to an apparatus, a method and a computer readable storage medium for providing an instant message service.
  • instant message service may refer to a service in which a message received by a recipient is displayed and / or played back if the sender sends a message, such as a text message, voice message, image, or the like, to one or more recipients.
  • character means an object that is represented by a computer graphic and has a face, and can be expressed in various forms such as, for example, a person, an animal, a virtual animal, a robot, and the like, and according to the present disclosure, a character is instant It is an object displayed on the message service and can be operated by the control of the user or the user's device.
  • module may refer to an apparatus, a server, a program unit, or a suitable combination thereof.
  • memory module refers not only to hardware for storing data in memory, but also to devices, servers, program units or their suitable controls for deleting data stored in such hardware according to predetermined conditions. May refer to a combination.
  • FIG. 1 is an exemplary environmental diagram illustrating an environment 100 in which an instant message service is provided, in accordance with at least some embodiments of the present disclosure.
  • Exemplary environment 100 includes network environment 110, one or more user devices 120-1, 120-2, 120-3, 120-4,. (130-1, 130-2, 130-3, ...; hereinafter referred to as 130).
  • the network environment 110 represents various environments for connecting the user device 120 and the user device 130 by wired or wireless communication.
  • the network environment 110 may include a server 115 for providing an instant message service.
  • the user device 120 may send an instant message to or receive an instant message from the user device 130 through the server 115 providing an instant message service.
  • user device 120 may send a notification for an instant message to user device 130 via server 115, where user device 130 receives the notification from the server and sends the user an instant message. Can be received directly from the device 120.
  • server 115 may serve as a relay server, and after user device 130 receives the notification, user device 130 may, for example, be peer-to-peer.
  • An instant message can be received by connecting directly to the user device 120 using a peer technique.
  • network environment 110 may further include a communication environment, such as a wired environment, a wireless environment, a base station, or the like, between user devices 120, 130.
  • the server 115 stores the instant message sent by the user device 120 and then, when the user device 130 is connected to the server 115, receives the instant message received from the user device 120. Can be configured to transmit.
  • server 115 may assist network environment 110 to establish a peer-to-peer connection between user devices 120, 130.
  • user devices 120 and 130 include communicable devices, such as smartphones, tablet computers, desktop computers, laptop computers, mobile phones, personal digital assistants (PDAs), special purpose devices, or any of the above functions.
  • Small form factor portable (mobile) electronic devices such as a fusion device.
  • user devices 120 and 130 may perform one-to-one or many-to-many instant message communications as well as one-to-one instant message communications, and server 115 provides such instant messaging services. can do.
  • a user (first user) of user device 120 may enter an instant message to send to user (second user) of user device 130 using user device 120.
  • the instant message may be a voice message entered by the first user.
  • the first user may input a voice message to the user device 120 for a predetermined time.
  • the user device 120 may perform voice recognition on the voice message to generate a voice recognized text message, and various voice recognition techniques well known in the art according to the present disclosure may be used.
  • the user device 120 may transmit a voice message and a voice recognized text message corresponding to the voice message to the user device 130 by an input of the first user. Voice and text messages may be sent from the user device 120 to the user device 130 through the server 115 or directly from the user device 120 to the user device 130.
  • the user device 120 may combine two or more voice messages input by the first user and transmit them in one voice message. In some other examples, the user device 120 may combine one or more voice messages input by the first user and one or more text messages input by the first user and send them into one instant message.
  • a character for the first user and a character for the second user may be displayed.
  • the user device 120 may transmit character information about the character for the first user while transmitting the instant message to the user device 130.
  • the character information may include information on at least one of the type of the character of the first user, the expression of the character, or the operation of the character.
  • the user device 120 may obtain face information of the first user using a device such as an image / video camera, a depth camera, and the like, and based on the acquired face information, a character for the first user. Can determine the facial expression.
  • the facial expression of the character for the first user may be determined while the first user is entering an instant message.
  • the facial expression of the character may be selected by the first user.
  • the first user may select an action of the character from a list of predetermined actions.
  • the user device 120 may recognize the characters associated with the character's movement from the voice recognized text message or typed text message. The first user may select an action of the character by selecting the recognized character.
  • the first user may check a voice recognized text message, a facial expression and motion of the character, and determine the transmission of the voice message.
  • the server 115 may receive the instant message received from the user device 120. For example, voice messages, typed text messages, etc.).
  • the server 115 may store the voice message corresponding to the voice recognized text message.
  • the server 115 may receive character information from the user device 120 along with the instant message and store it in correspondence with the received instant message.
  • server 115 may send a notification to user device 130, and the user device ( 130 may receive a notification message for an instant message received from the user device 120 from the server 115.
  • the user device 130 may access the server 115.
  • the user device 130 may receive from the user device 120 one or more voice messages including voice messages input by the first user and one or more voice recognized text messages respectively corresponding to the one or more voice messages. Can be received.
  • the notification may include an indication of one or more voice messages to the user device 130 including the voice message received from the user device 120. have.
  • user device 130 may store therein one or more voice messages and corresponding one or more voice recognized text messages. In some examples, user device 130 may store the received one or more voice messages and the voice recognized text message in correspondence.
  • user device 130 may receive a voice message playback request from a user (second user) to play the received one or more voice messages.
  • the user device 130 may sequentially play one or more received voice messages in response to the voice message play request.
  • the voice message can be played back asynchronously with the reception of the voice message.
  • playback of the voice message may be controlled to pause, stop, or play the previous voice message or the next voice message at the request of the user.
  • the user device 130 may display one or more voice recognized text messages in response to playback of the one or more voice messages.
  • the user device 130 may filter the one or more voice recognized text messages based on a predetermined censoring condition.
  • predetermined censorship conditions may include, but are not limited to, abusive language, slang, and the like.
  • the user device 130 may play one or more voice messages based on the result of the filtering. For example, if a slang is included in the voice recognized text message, the user device 130 may mute and reproduce at least a part of the corresponding voice message.
  • This filtering process is not limited to what the user device 130 performs, and in some embodiments, the server 115 may perform the filtering process before sending the one or more voice messages and the corresponding one or more voice recognized text messages. have.
  • user device 130 may delete one or more voice messages based on a predetermined condition. In some examples, the user device 130 may delete the corresponding voice message when playback ends. In some other examples, user device 130 may delete the old voice message based on a predetermined storage capacity condition.
  • the user device 130 may receive character information for the character of the first user from the server 115 in addition to receiving one or more voice messages. In some examples, when the user device 130 sequentially plays one or more voice messages, the user device 130 may display the character of the first user based on the received character information. In some examples, the user device 130 may display a character whose expression, motion, or the like of the character of the first user is controlled based on the character information.
  • FIG. 2 illustrates an example of using an instant message service according to the present disclosure
  • FIG. 3 illustrates an example of displaying and playing a message on a user's mobile device when using the instant message service according to FIG. 2.
  • the first user 210, the second user 220, and the third user 230 are respectively connected to the user device 212, the user device 222, and the user device 232.
  • the users 210, 220, and 230 may share an instant message transmitted and received at the request of at least one of the users 210, 220, and 230.
  • the first user 210 transmits an instant message the second user 220 and the third user 230 may receive the instant message.
  • the first user 210 and the second user 220 may transmit a voice message.
  • first user 210 may select character 216 and second user 220 may select character 226.
  • the first user 210 may input a voice message 214 that is "not cold?"
  • the user device 212 may detect the facial expression of the first user 210 and may determine the facial expression of the character 216.
  • the user device 212 can obtain the speech recognized text message 214-2 by performing speech recognition on the voice message 214.
  • the first user 210 selects one of a list of predetermined actions or removes a character (eg, “cold” is recognized) that the user device 212 recognizes from the voice recognized text message 214-2. 1
  • the user 210 can determine the operation of the character 216 by selecting.
  • the voice message 214 may then be sent towards the user devices 222, 232 of the second and third users 220, 230.
  • the second user 220 may input the voice message 224 "I'm hot!"
  • the user device 222 may detect an expression of the second user 220 and may determine an expression of the character 226.
  • the user device 222 may obtain the voice recognized text message 224-2 from the voice message 224.
  • the second user 220 selects one of a list of predetermined actions, or selects a character recognized by the user device 222 from the voice recognized text message 224-2 (eg, “hot” is recognized).
  • the operation of the character 226 may be determined by the selection of the second user 220.
  • the voice message 224 may then be sent towards the user devices 212, 232 of the first and third users 210, 230.
  • the third user 230 may access a server (not shown) that provides an instant message service using the user device 232, and the user device 232 may have a voice message 214 and a voice message 224. ) Can be received.
  • the user device 232 may receive the voice recognized text messages 214-2, 224-2.
  • the voice recognized text messages 214-2 and 224-2 may be displayed in response to playback of the voice messages 214 and 224.
  • the third user 230 may input a voice message playback request using the user interface 240 displayed on the user device 232.
  • a voice message reproduction request is input, as shown in Fig. 3A, the voice message 214 is reproduced with the display of the character 216.
  • voice recognized text message 214-2 may be displayed in response to playback of voice message 214.
  • the character 216 may show facial expressions and actions determined by the user device 212 of the first user 210.
  • the voice message 224 is played along with the display of the character 226.
  • the voice recognized text message 224-2 may be displayed in response to the reproduction of the voice message 224.
  • the character 226 may show facial expressions and actions determined by the user device 222 of the second user 220.
  • the third user 230 may be configured to receive instant messages 214-2 and 224-2 received from the first user 210 and the second user 220.
  • An example displayed sequentially is shown.
  • instant messages transmitted by the user device 232 of the third user 330 may also be sequentially displayed based on the transmission time and / or the reception time.
  • the instant message service providing apparatus 500 may include a communication module 510, a user interface module 520, a voice playback module 530, a display module 540, a memory module 550, and a voice.
  • Recognition module 570 may be included.
  • the instant message service providing apparatus 500 may further include a message filter 560, a text recognition module 580, a camera module 590-1, and an facial expression determination module 590-2.
  • Components included in the instant message service providing apparatus 500 may be individually implemented or two or more of the components may be combined to form one component.
  • the instant message service providing apparatus 500 transmits a voice message and a voice recognized text message, while the text message received from an external computing device such as the instant message service providing apparatus 500. Can be configured to display and play the voice message at the request of the user.
  • the instant message service providing device 500 may be a variety of computing devices, such as, for example, smartphones, tablet computers, desktop computers, laptop computers, mobile phones, personal digital assistants (PDAs), special purpose devices, or any of the above functions. Small form factor portable (mobile) electronic devices, such as including fusion devices.
  • the communication module 510 may be configured to connect the instant message service providing apparatus 500 to a server.
  • the communication module 510 may be configured to receive one or more voice messages and one or more voice recognized text messages corresponding to one or more voice messages, respectively, from an external computing device.
  • communication module 510 may receive one or more voice messages and corresponding one or more voice recognized text messages from an external computing device via a server.
  • communication module 510 may receive a notification from a server. The notification may indicate that one or more voice messages have been sent.
  • the communication module 510 receives one or more voice messages and corresponding one or more voice recognized text messages directly from an external computing device, such as in a manner such as a peer to peer connection, based on this notification. can do.
  • the user interface module 520 may be configured to receive a voice message playing request for the received one or more voice messages from the user.
  • the voice playing module 530 may be configured to sequentially play one or more voice messages received by the communication module 510 in response to a voice message playing request received by the user interface module 520.
  • the user interface module 520 may receive various requests from the user for pausing, stopping, playing the previous voice message, or playing the next voice message, as required. ) May play the voice message according to the request received by the user interface module 520.
  • the display module 540 may be configured to display one or more voice recognized text messages corresponding to one or more voice messages, respectively, in response to playback of the one or more voice messages.
  • the memory module 550 may be configured to store one or more voice messages received by the communication module 510 and corresponding one or more voice recognized text messages. In some examples, the memory module 550 may store one or more received voice messages and voice recognized text messages in correspondence. In some embodiments, the memory module 550 may delete one or more voice messages based on a predetermined condition. In some examples, the memory module 550 may delete the corresponding voice message stored in the memory module 550 when the playback of the voice message ends. In some other examples, the memory module 550 may delete the old voice message based on the predetermined storage capacity condition.
  • the memory module 550 may delete the oldest voice message if the total capacity of the stored voice message exceeds a predetermined value. In another example, the memory module 550 may delete the voice message when the voice message, for which playback ends, exceeds a predetermined value.
  • the message filter 560 may filter the one or more voice recognized text messages based on a predetermined censoring condition before the voice playback module 530 plays the received one or more voice messages.
  • the censoring method by the message filter 560 may use a well-known censoring method for a text message.
  • the predetermined censorship condition may include, but is not limited to, abusive language, slang, and the like.
  • the voice reproduction module 530 may reproduce one or more voice messages based on the filtering result of the message filter 560. For example, when a slang is included in a voice recognized text message, the voice reproducing module 530 may mute the corresponding voice message.
  • the communication module 510 may receive character information about the character of the sender from the server while receiving one or more voice messages.
  • the display module 540 may display the sender's character based on the received character information.
  • the display module 540 may display a character whose expression, motion, or the like is controlled based on the character information.
  • the user interface module 520 may be configured to receive a voice message (hereinafter, “input voice message”) input by a user of the instant message service providing apparatus 500.
  • user interface module 520 may receive an input voice message for a predetermined time.
  • the user interface module 520 may generate one input voice message by combining two or more input voice messages received for a predetermined time at a user's request.
  • the voice recognition module 570 may generate a voice recognized text message by performing voice recognition on the input voice message received by the user interface module 520, and various voices well known in the art according to the present disclosure. Recognition techniques can be used. It is also possible for a user to type a text message through the user interface module 520.
  • the communication module 510 may transmit an input voice message and a corresponding voice recognized text message to an external computing device. The voice recognized text message corresponding to the input voice message may be transmitted to the external computing device or directly to the external computing device through the server.
  • the display module 540 may display a character of the user of the instant message service providing apparatus 500.
  • the communication module 510 may transmit character information about the character of the user.
  • the character information may include information about at least one of a type of a character of a user, an expression of a character, or an operation of the character.
  • text recognition module 580 may recognize text associated with the movement of the character from a speech recognized text message or typed text message generated by speech recognition module 570. The user can select an action of the character by selecting the recognized character. In some other examples, the user may select an action of the character from the list of predetermined actions of the character via the user interface module 520.
  • the camera module 590-1 may acquire face information of the user using a device such as an image / video camera, a depth camera, or the like.
  • the facial expression determination module 590-2 may determine the facial expression of the character of the user based on the face information obtained by the camera module 590-1.
  • the user interface module 520 receives an instant message, such as a voice message or text message
  • the camera module 590-1 obtains face information of the user
  • the facial expression determination module 590-2 The facial expression of the character may be determined based on the acquired face information.
  • the user may determine the transmission of an instant message, such as a voice message, after confirming a text message, a facial expression, an action, or the like appearing on the display module 540.
  • an instant message such as a voice message
  • FIG. 6 and 7 are flowcharts illustrating example processes 600 and 700 for a method of providing instant message services, in accordance with at least some embodiments of the present disclosure.
  • 6 illustrates a process 600 for receiving an instant message
  • FIG. 7 illustrates a process 700 for sending an instant message.
  • the processes 600 and 700 may be performed under the control of a computing device such as the user device 120, 130 of FIG. 1, or the instant message service providing device 500 of FIG. 5.
  • the process 600 shown in FIG. 6 may include one or more operations, functions or actions as illustrated by blocks 610, 620, 630, 640 and / or 650.
  • FIGS. 6 and 7 may include one or more operations, functions, or actions as illustrated by blocks 710, 720, 730, and / or 740.
  • the various blocks are not intended to be limited to the described embodiments.
  • those skilled in the art will appreciate that, for the present processes disclosed herein, the functions performed in the processes and methods may be implemented in a different order.
  • the schematic operations illustrated in FIGS. 6 and 7 are provided by way of example only, and some of the operations may be optional, may be combined in fewer operations, or extended to additional operations without departing from the spirit of the disclosed embodiment. Can be.
  • the process 600 shown in FIG. 6 begins at block 610 connecting to a server.
  • the computing device may connect to the server.
  • Process 600 may continue to block 620 to receive one or more voice messages and one or more voice recognized text messages at block 610.
  • the computing device may receive one or more voice messages and one or more voice recognized text messages corresponding to each of the one or more voice messages from the sender's external computing device.
  • the server may send a notification for one or more voice messages received from the sender, and the computing device may receive such a notification from the server.
  • the computing device may then receive one or more voice messages and corresponding one or more voice recognized text messages that appear in the notification directly from an external computing device or through a server.
  • Process 600 may continue at block 620 with block 630 storing the received one or more voice messages and one or more voice recognized text messages.
  • the computing device may store therein one or more voice messages and corresponding one or more voice recognized text messages therein. In some examples, the computing device may store the received one or more voice messages and the one or more voice recognized text messages in correspondence. Process 600 may continue to block 640 to receive a voice message playback request from a user at block 630.
  • the computing device may receive a voice message playback request from the user to play the received one or more voice messages.
  • Process 600 may continue to block 650 to sequentially play one or more voice messages at block 640.
  • the computing device may sequentially play one or more voice messages received in response to the voice message playback request.
  • playback of the voice message may be controlled to pause, stop, or play the previous voice message or the next voice message at the request of the user.
  • the computing device may delete the voice message for which playback has ended based on a predetermined condition.
  • the computing device may play one or more voice messages sequentially while displaying the sender's character based on the character information.
  • the computing device may filter the one or more voice recognized text messages based on the predetermined censoring condition before performing block 650. Thereafter, at block 650, the computing device may play one or more voice messages based on the result of the filtering. For example, when a slang is included in the voice recognized text message, the computing device may mute and reproduce at least a portion of the corresponding voice message.
  • Process 700 shown in FIG. 7 may begin at block 710 for receiving an input voice message from a user.
  • a user can enter a voice message to be sent using the computing device.
  • a user may enter a voice message into the computing device, for example, for a predetermined time, and the computing device may receive this input voice message.
  • Process 700 may continue to block 720 to obtain a voice recognized input text message at block 710.
  • the computing device may perform voice recognition on the input voice message to generate a voice recognized input text message.
  • Speech recognition for input voice messages can use a variety of known techniques.
  • the computing device may display a voice recognized input text message and the user may confirm the displayed message.
  • Process 700 may continue to block 730 to obtain character information at block 720.
  • the computing device may obtain character information for the character of the user to be displayed on the instant message service.
  • the computing device may obtain facial information of the user using an accessory device connected to the computing device, such as an image / video camera, a depth camera, and the like, and based on the acquired facial information, the facial expression of the character to the user Can be determined.
  • the facial expression of the character may be selected by the user.
  • the computing device may obtain gesture information of the character selected from the list of gestures predefined by the user.
  • the computing device may recognize a character associated with the movement of the character from the voice recognized input text message, and when the user selects one of the recognized characters, the computing device may retrieve the movement information of the character corresponding to the character. Can be obtained.
  • the character information may include not only the type of character but also the expression of the character and the operation of the character.
  • Process 700 may continue from block 730 to block 740 where the computing device may transmit a voice message, a voice recognized input text message and character information to an external computing device.
  • signal bearing media 802 of one or more computer program products 700 may include computer readable media 806, recordable media 808, and / or communication media 810.
  • the instructions 804 included in the signal bearing medium 802 may be executed by a computing device such as the user device 120, 130 shown in FIG. 1 and / or the instant message service providing device shown in FIG. 5.
  • the instruction 804 may, when executed, provide an instant message service for the first user in accordance with the present disclosure.
  • the instructions 804 may include one or more instructions for receiving one or more voice messages including a voice message sent by the computing device of the second user and one or more voice recognized text messages respectively corresponding to the one or more voice messages; One or more instructions for storing one or more voice messages and one or more voice recognized text messages; One or more instructions for receiving a voice message playing request from a first user; One or more instructions for reproducing the one or more voice messages sequentially received in response to the voice message playback request; And one or more instructions for displaying the one or more voice recognized text messages in response to playing of the one or more voice messages.
  • the instant message service providing server 900 may include a communication module 910, a character module 920, a voice memory 930, and a text memory 940.
  • the communication module 910 may receive instant message and character information, such as a voice message and / or text message, from the sender.
  • the communication module 910 may transmit a notification and / or an instant message for the instant message to the recipient of the instant message.
  • the communication module 910 may transmit a voice message, a voice recognized text message, and character information of the sender.
  • the character module 920 may store character information received from the sender, for example, information on a type, facial expression, motion, and the like of the sender's character.
  • the voice memory 930 may store a voice message received from the sender. In some examples, the voice message stored in the voice memory 930 may be deleted according to a predetermined condition.
  • the text memory 940 can store voice recognized text messages and typed text messages. In some examples, the text memory 940 may store the voice recognized text message corresponding to the voice message stored in the voice memory 930, and the character module 920 may store the character information in the voice message stored in the voice memory 930. And / or corresponding to the voice recognized text message or typed text message stored in the text memory 940.
  • the claimed subject matter is not limited in scope to the specific embodiments described herein.
  • some implementations may be in hardware, such as may be used to operate on a device or combination of devices, while other implementations may be in software and / or firmware, for example.
  • the claimed subject matter is not limited in scope in this respect, but some embodiments may include one or more articles, such as signal bearing media, storage media.
  • Such storage media such as CD-ROMs, computer disks, flash memory, etc., may be executed by computing devices such as, for example, computing systems, computing platforms, or other systems, for example, to claimed subject matter, such as one of the embodiments described above.
  • instructions may be stored that may cause the processor to execute.
  • the computing device may comprise one or more processing units or processors, one or more input / output devices such as displays, keyboards and / or mice, and static random access memory, dynamic random access memory, flash memory and / or hard drives. It may include one or more of the same memory.
  • the implementer may primarily choose hardware and / or firmware means; if flexibility is paramount, the implementer may choose a software implementation primarily; Or, as another alternative, the implementer may choose any combination of hardware, software and / or firmware.
  • aspects of the embodiments of the present disclosure may include one or more computer programs running on one or more computers (eg, one or more programs running on one or more computer systems), one running on one or more processors.
  • Software, and / or firmware that may be implemented in integrated circuits, in whole or in part, as one or more programs (eg, one or more programs running on one or more microprocessors), firmware, or substantially any combination thereof It will be appreciated that the writing of code for and / or the design of circuitry is within the skill of one of ordinary skill in the art in light of this disclosure.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)
  • Operations Research (AREA)

Abstract

A method for providing an instant messaging service is provided. One exemplary method can be performed under the control of a computing device of a first user. The method can comprise the steps of: receiving one or more voice messages, which comprise a voice message transmitted by means of a computing device of a second user, and one or more voice-recognized text messages respectively corresponding to the one or more voice messages; receiving a voice message play request from the first user; and, in response to the voice message play request, playing one or more voice messages which have been received sequentially.

Description

비동기적 인스턴트 메시지 서비스를 제공하기 위한 장치, 방법 및 컴퓨터 판독가능 저장 매체 Apparatus, method and computer readable storage medium for providing asynchronous instant message service
본 개시는 비동기적인 인스턴트 메시지 서비스를 제공하기 위한 장치, 방법 및 컴퓨터 판독가능 저장 매체에 관한 것이다.The present disclosure relates to an apparatus, a method and a computer readable storage medium for providing an asynchronous instant message service.
여기에서 달리 언급하지 않으면 본 섹션에서 기술되는 내용은 본 출원에서의 청구범위의 선행 기술이 아니며, 본 섹션에 기재하였다는 이유로 선행 기술로 인정되어서는 안 된다.Unless stated otherwise herein, the contents described in this section are not prior art to the claims in this application and should not be admitted to be prior art for the purposes described in this section.
인스턴트 메시지 서비스를 이용하는 사용자는 둘 이상의 사용자 간에 메시지를 비교적 빠르고 간편하게 전달할 수 있다. 최근, 스마트폰과 같은 모바일 장치가 널리 이용됨에 따라 인스턴트 메시지 서비스의 이용은 폭발적으로 증가해왔다. 최근, 인스턴트 메시지 서비스에서는 종래의 텍스트 메시지에 더하여 비교적 짧은 음성 메시지의 전송도 가능해지도록 하고 있다. 음성 메시지는 텍스트 메시지에 비하여 입력이 간편하고, 음성 메시지를 입력한 사용자가 전달하고자 하는 다양한 특징을 전달할 수 있다. 그러나, 음성 메시지의 데이터 사이즈는 일반적으로, 텍스트 메시지에 비하여 크고, 사용자는 각각의 음성 메시지를 재생하는 동작(예컨대, 음성 메시지를 클릭, 터치, 등)을 수행하고, 재생되는 음성 메시지를 귀로 들어야 한다는 점에서, 음성 메시지는 눈으로 빠르게 확인 가능한 텍스트 메시지에 비하여, 시간적 제약 또는 메모리 공간 또는 물리적인 공간과 같은 공간적인 제약을 가질 수 있다.A user using an instant message service can transfer messages between two or more users relatively quickly and simply. Recently, as mobile devices such as smart phones are widely used, the use of instant messaging services has exploded. In recent years, in addition to the conventional text message, the instant message service enables the transmission of a relatively short voice message. The voice message is easier to input than the text message, and may transmit various features that the user who inputs the voice message wants to deliver. However, the data size of the voice message is generally larger than that of the text message, and the user must perform an operation of playing each voice message (eg, clicking, touching, etc.) the voice message, and listening to the voice message being played. In that sense, voice messages may have spatial constraints, such as temporal constraints or memory space or physical space, compared to text messages that can be quickly identified by eye.
대한민국 등록 특허공보 제10-1863776호(이하, 선행기술문헌 1)은, 사용자가 음성 메시지를 입력하면, 음성 메시지로부터 음성 인식을 수행하여 텍스트 메시지를 생성하고, 음성 메시지로부터 사용자의 감정을 추출하여, 음성 메시지로부터 생성된 텍스트 메시지의 폰트를 변경하여 출력하는 텍스트 표현 방법을 개시하고 있다. Republic of Korea Patent Publication No. 10-1863776 (hereinafter referred to as Prior Art Document 1), when a user inputs a voice message, performs a voice recognition from the voice message to generate a text message, and extracts the user's emotion from the voice message A text representation method of changing and outputting a font of a text message generated from a voice message is disclosed.
이와 같이 선행기술문헌 1은 음성 메시지로부터 다양한 감정에 관한 정보를 추출하고, 이러한 정보를 이용하여 텍스트 메시지를 생성하지만, 사용자가 음성 메시지를 통하여 전달하고자 하는 정보 중 일부만을 얻을 수 있으며, 음성 메시지의 나머지 정보는 잃을 수 있다.As described above, the prior art document 1 extracts information on various emotions from a voice message and generates a text message using the information, but only a part of information that a user wants to deliver through the voice message can be obtained. The rest of the information may be lost.
본 개시는 위와 같은 문제점들을 해결하기 위한 것으로서, 인스턴트 메시지 서비스에서 음성 메시지를 재생하기에 편리하고, 데이터 관리에 있어서 효율적인 장치, 방법 및 컴퓨터 판독가능 저장 매체를 제시한다. 또한, 본 개시는 인스턴트 메시지 서비스에서, 캐릭터를 이용하는 보다 향상된 인스턴트 메시지 서비스를 제공할 수 있는 장치, 방법 및 컴퓨터 판독가능 저장 매체를 제시한다. SUMMARY The present disclosure is directed to solving the above problems, and provides an apparatus, method, and computer readable storage medium that are convenient for playing a voice message in an instant message service and are efficient in data management. In addition, the present disclosure provides an apparatus, method, and computer readable storage medium capable of providing an improved instant message service utilizing characters in an instant message service.
본 개시의 일부 실시예에서, 제1 사용자의 컴퓨팅 장치의 제어 하에서 수행되는 인스턴트 메시지 서비스 제공 방법이 설명된다. 일 예시적인 방법은 제2 사용자의 컴퓨팅 장치에 의해 전송된 음성 메시지를 포함하는 하나 이상의 음성 메시지 및 하나 이상의 음성 메시지 각각에 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신하는 단계; 제1 사용자로부터 음성 메시지 재생 요청을 수신하는 단계; 및 음성 메시지 재생 요청에 응답하여, 순차적으로 수신된 하나 이상의 음성 메시지를 재생하는 단계를 포함할 수 있다. 일부 예시에서, 방법은 하나 이상의 음성 인식된 텍스트 메시지를 각각 하나 이상의 음성 메시지에 대응하여 저장하는 단계를 포함할 수 있다. 일부 예시에서, 방법은 하나 이상의 음성 인식된 텍스트 메시지를 하나 이상의 음성 메시지의 재생에 대응하여, 디스플레이 하는 단계를 더 포함할 수 있다.In some embodiments of the present disclosure, a method of providing an instant message service performed under the control of a computing device of a first user is described. One example method includes receiving one or more voice messages including a voice message sent by a computing device of a second user and one or more voice recognized text messages corresponding to each of the one or more voice messages; Receiving a request for playing a voice message from a first user; And responsive to the voice message reproducing request, reproducing one or more voice messages sequentially received. In some examples, the method may include storing each of the one or more voice recognized text messages corresponding to the one or more voice messages. In some examples, the method may further include displaying, in response to the playing of the one or more voice messages, the one or more voice recognized text messages.
일부 추가적인 예시에서, 일 예시적인 방법은 제2 사용자의 캐릭터에 대한 캐릭터 정보를 수신하는 단계를 더 포함할 수 있다. 이러한 예시에서, 수신된 하나 이상의 음성 메시지를 순차적으로 재생하는 단계는 캐릭터 정보에 기초하여 제2 사용자의 캐릭터를 디스플레이 함과 함께, 음성 메시지를 재생하는 단계를 포함할 수 있다.In some additional examples, the exemplary method may further include receiving character information for the character of the second user. In this example, sequentially playing the received one or more voice messages may include playing back the voice message along with displaying the character of the second user based on the character information.
일부 실시예에서, 인스턴트 메시지 서비스 제공 장치가 설명된다. 일 예시적인 인스턴트 메시지 서비스 제공 장치는 통신 모듈, 사용자 인터페이스 모듈, 음성 재생 모듈, 디스플레이 모듈 및 메모리 모듈을 포함할 수 있다. 통신 모듈은 송신자의 외부 컴퓨팅 장치에 의해 전송된 음성 메시지를 포함하는 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신하도록 구성될 수 있다. 사용자 인터페이스 모듈은 인스턴트 메시지 서비스에 대한 입력을 수신하도록 구성될 수 있다. 사용자 인터페이스 모듈은 사용자로부터 음성 메시지 재생 요청을 수신할 수 있다. 음성 재생 모듈은 사용자 인터페이스 모듈에 의해 수신된 음성 메시지 재생 요청에 응답하여, 순차적으로 통신 모듈에 의해 수신된 하나 이상의 음성 메시지를 재생하도록 구성될 수 있다. 디스플레이 모듈은 음성 재생 모듈에 의한 하나 이상의 음성 메시지의 재생에 대응하여, 하나 이상의 음성 인식된 텍스트 메시지를 순차적으로 디스플레이 하도록 구성될 수 있다. 메모리 모듈은 하나 이상의 음성 메시지 및 하나 이상의 음성 인식된 텍스트 메시지를 저장하도록 구성될 수 있다.In some embodiments, an instant message service providing apparatus is described. An exemplary instant message service providing apparatus may include a communication module, a user interface module, a voice playback module, a display module, and a memory module. The communication module may be configured to receive one or more voice messages including voice messages sent by the sender's external computing device and one or more voice recognized text messages corresponding to the one or more voice messages, respectively. The user interface module may be configured to receive input for an instant message service. The user interface module may receive a voice message playing request from a user. The voice playback module may be configured to sequentially reproduce one or more voice messages received by the communication module in response to the voice message playback request received by the user interface module. The display module may be configured to sequentially display one or more voice recognized text messages in response to the playback of the one or more voice messages by the voice playback module. The memory module may be configured to store one or more voice messages and one or more voice recognized text messages.
일부 실시예에서, 사용자 인터페이스 모듈은 상기 사용자로부터 입력 음성 메시지를 수신하도록 구성될 수 있다. 이러한 실시예에서, 인스턴트 메시지 서비스 제공 장치는 음성 인식모듈 및 문자 인식 모듈을 더 포함할 수 있다. 음성 인식 모듈은 입력 음성 메시지에 음성 인식을 수행하여 음성 인식된 입력 텍스트 메시지를 획득하도록 구성될 수 있다. 문자 인식 모듈은 음성 인식 모듈에 의해 획득된 음성 인식된 입력 텍스트 메시지로부터, 디스플레이 모듈에 의해 디스플레이되는 사용자의 캐릭터의 동작을 선택 가능하도록 하는 동작 문자를 검출하도록 구성될 수 있다. 추가적인 예시에서, 인스턴트 메시지 서비스 제공 장치는 카메라 모듈 및 표정 결정 모듈을 더 포함할 수 있다. 카메라 모듈은 사용자의 얼굴 정보를 획득하도록 구성될 수 있다. 표정 결정 모듈은 얼굴 정보에 기초하여 사용자의 캐릭터의 표정을 결정하도록 구성될 수 있다.In some embodiments, the user interface module can be configured to receive an input voice message from the user. In this embodiment, the instant message service providing apparatus may further include a voice recognition module and a text recognition module. The voice recognition module may be configured to perform voice recognition on the input voice message to obtain a voice recognized input text message. The character recognition module may be configured to detect an operation character that enables selecting an operation of a character of a user displayed by the display module, from the voice recognized input text message obtained by the speech recognition module. In a further example, the instant message service providing apparatus may further include a camera module and an expression determining module. The camera module may be configured to obtain face information of the user. The facial expression determination module may be configured to determine the facial expression of the character of the user based on the face information.
일부 실시예에서, 인스턴트 메시지 서비스를 제공하기 위한 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 저장 매체가 설명된다. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램은 실행되면, 제1 사용자의 컴퓨팅 장치로 하여금, 제2 사용자의 컴퓨팅 장치에 의해 전송된 음성 메시지를 포함하는 하나 이상의 음성 메시지 및 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신하는 동작; 하나 이상의 음성 메시지 및 하나 이상의 음성 인식된 텍스트 메시지를 저장하는 동작; 제1 사용자로부터 음성 메시지 재생 요청을 수신하는 동작; 음성 메시지 재생 요청에 응답하여, 순차적으로 수신된 하나 이상의 음성 메시지를 재생하는 동작; 및 하나 이상의 음성 인식된 텍스트 메시지를 하나 이상의 음성 메시지의 재생에 대응하여, 디스플레이 하는 동작을 포함하는 동작들을 실행가능하도록 할 수 있다.In some embodiments, a computer readable storage medium having stored thereon a computer program for providing an instant message service is described. The computer program stored in the computer readable storage medium, when executed, causes the first user's computing device to correspond to the one or more voice messages and the one or more voice messages, respectively, including the voice message sent by the second user's computing device. Receiving one or more voice recognized text messages; Storing at least one voice message and at least one voice recognized text message; Receiving a request for playing a voice message from a first user; Responsive to the voice message reproducing request, reproducing one or more voice messages sequentially received; And displaying the one or more voice recognized text messages in response to the reproduction of the one or more voice messages.
이상의 간단한 요약 및 효과에 관한 설명은 단순히 예시적인 것으로서 본 개시에서 의도한 기술적 사항을 제한하기 위한 것이 아니다. 이하의 상세한 설명과 첨부된 도면을 참조함으로써, 전술한 예시적인 실시예들과 기술적 특징들에 더하여, 추가적인 실시예와 기술적 특징들이 이해될 수 있을 것이다.The above brief summary and description of the effects are merely exemplary and are not intended to limit the technical matters intended in the present disclosure. By referring to the following detailed description and the accompanying drawings, in addition to the above-described exemplary embodiments and technical features, additional embodiments and technical features will be understood.
앞서 설명한 본 개시의 특징들과 기타 추가적인 특징들에 대해서는 첨부된 도면을 참조하여 이하에서 자세하게 설명한다. 이러한 도면들은 본 개시에 따르는 단지 몇 가지의 실시예만을 도시한 것이며, 본 개시의 기술적 사상의 범위를 제한하는 것으로 간주되어서는 안 된다. 본 개시의 기술적 사상은 첨부된 도면을 사용하여 더 구체적이고 상세하게 기술될 것이다.Features and other additional features of the present disclosure described above are described in detail below with reference to the accompanying drawings. These drawings illustrate only a few embodiments in accordance with the present disclosure and should not be regarded as limiting the scope of the spirit of the present disclosure. The technical spirit of the present disclosure will be described in more detail and in detail using the accompanying drawings.
도 1은 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스가 제공되는 환경을 나타내는 예시적인 환경도이고;1 is an exemplary environmental diagram illustrating an environment in which an instant message service is provided in accordance with at least some embodiments of the present disclosure;
도 2는 본 개시에 따라 인스턴트 메시지 서비스를 이용하는 일 예시를 도시하고;2 illustrates an example of using an instant message service in accordance with the present disclosure;
도 3은 도 2에 따라 인스턴트 메시지 서비스를 이용하는 경우 사용자의 모바일 장치 상에서 메시지가 디스플레이 및 재생되는 일 예시를 도시하고;3 illustrates an example of displaying and playing a message on a user's mobile device when using an instant message service according to FIG. 2;
도 4는 도 2 및 도 3에 따른 예시에서, 인스턴트 메시지의 로그를 나타내는 일 예시를 도시하고;4 shows an example showing a log of an instant message, in the example according to FIGS. 2 and 3;
도 5는 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스 제공 장치를 개략적으로 도시하는 블록도이고;5 is a block diagram schematically illustrating an apparatus for providing an instant message service according to at least some embodiments of the present disclosure;
도 6는 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스 제공 방법에 관한 일 예시적인 프로세스를 도시하는 흐름도이고;6 is a flow diagram illustrating an example process for a method of providing instant message services, in accordance with at least some embodiments of the present disclosure;
도 7은 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스 제공 방법에 관한 다른 예시적인 프로세스를 도시하는 흐름도이고;7 is a flowchart illustrating another example process for a method of providing instant message services, in accordance with at least some embodiments of the present disclosure;
도 8은 본 개시의 적어도 일부 실시예에 따라 인스턴트 메시지 서비스를 제공하는 데 이용될 수 있는 예시적인 컴퓨터 프로그램 제품을 도시하고,8 illustrates an example computer program product that may be used to provide an instant message service, in accordance with at least some embodiments of the present disclosure.
도 9는 본 개시의 적어도 일부 실시예에 따라 인스턴트 메시지 서비스 제공 서버를 개략적으로 도시하는 블록도이다.9 is a block diagram schematically illustrating a server for providing an instant message service according to at least some embodiments of the present disclosure.
이하, 첨부한 도면을 참조하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 구현예 및 실시예를 상세히 설명한다. 그러나, 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 구현예 및 실시예에 한정되지 않는다. DETAILED DESCRIPTION Hereinafter, exemplary embodiments and embodiments of the present disclosure will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present disclosure. However, the present disclosure may be embodied in many different forms and should not be construed as limited to the embodiments and examples set forth herein.
본 개시는 일반적으로 인스턴트 메시지 서비스를 제공하기 위한 장치, 방법 및 컴퓨터 판독가능 저장 매체에 관한 것이다.The present disclosure generally relates to an apparatus, a method and a computer readable storage medium for providing an instant message service.
이하에서, "인스턴트 메시지 서비스"는 송신자가 텍스트 메시지, 음성 메시지, 이미지, 등과 같은 메시지를 하나 이상의 수신자에게 전송하면, 수신자에 의해 수신된 메시지가 디스플레이 및/또는 재생되는 서비스를 지칭할 수 있다. "캐릭터"라는 용어는 컴퓨터 그래픽에 의해 표현되고 얼굴을 가지는 객체를 의미하며, 예컨대, 사람, 동물, 가상의 동물, 로봇, 등과 같은 다양한 형태로 표현될 수 있으며, 본 개시에 따르면, 캐릭터는 인스턴트 메시지 서비스 상에서 디스플레이 되는 개체이며, 사용자 또는 사용자의 장치의 제어에 의해 동작할 수 있다.Hereinafter, "instant message service" may refer to a service in which a message received by a recipient is displayed and / or played back if the sender sends a message, such as a text message, voice message, image, or the like, to one or more recipients. The term " character " means an object that is represented by a computer graphic and has a face, and can be expressed in various forms such as, for example, a person, an animal, a virtual animal, a robot, and the like, and according to the present disclosure, a character is instant It is an object displayed on the message service and can be operated by the control of the user or the user's device.
이하에서, "모듈"이라는 용어는, 장치, 서버, 프로그램 유닛 또는 이들의 적절한 조합을 지칭할 수 있다. 예컨대, 이하에서 설명될 "메모리 모듈"이라는 용어는 메모리에 데이터를 저장하기 위한 하드웨어 뿐만 아니라, 그러한 하드웨어에 저장된 데이터를 미리 정해진 조건에 따라 삭제하도록 제어하는, 장치, 서버, 프로그램 유닛 또는 이들의 적절한 조합을 지칭할 수 있다.In the following, the term “module” may refer to an apparatus, a server, a program unit, or a suitable combination thereof. For example, the term " memory module ", which will be described below, refers not only to hardware for storing data in memory, but also to devices, servers, program units or their suitable controls for deleting data stored in such hardware according to predetermined conditions. May refer to a combination.
도 1은 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스가 제공되는 환경(100)을 나타내는 예시적인 환경도이다. 예시적인 환경(100)은 네트워크 환경(110), 하나 이상의 사용자 장치(120-1, 120-2, 120-3, 120-4, ...; 이하에서는 120으로 통칭함) 및 하나 이상의 사용자 장치(130-1, 130-2, 130-3, ...; 이하에서는 130으로 통칭함)를 포함할 수 있다. 네트워크 환경(110)은 사용자 장치(120)와 사용자 장치(130)를 유선 또는 무선의 통신으로 연결하기 위한 다양한 환경을 나타낸다. 네트워크 환경(110)은 인스턴트 메시지 서비스를 제공하기 위한 서버(115)를 포함할 수 있다.1 is an exemplary environmental diagram illustrating an environment 100 in which an instant message service is provided, in accordance with at least some embodiments of the present disclosure. Exemplary environment 100 includes network environment 110, one or more user devices 120-1, 120-2, 120-3, 120-4,. (130-1, 130-2, 130-3, ...; hereinafter referred to as 130). The network environment 110 represents various environments for connecting the user device 120 and the user device 130 by wired or wireless communication. The network environment 110 may include a server 115 for providing an instant message service.
일부 실시예에서, 사용자 장치(120)는 인스턴트 메시지 서비스를 제공하는 서버(115)를 통하여 사용자 장치(130)에 인스턴트 메시지를 전송하거나 사용자 장치(130)로부터 인스턴트 메시지를 수신할 수 있다. 일부 다른 예시에서, 사용자 장치(120)는 서버(115)를 통하여 사용자 장치(130)에 인스턴트 메시지에 대한 알림을 전송할 수 있으며, 사용자 장치(130)는 서버로부터 알림을 수신하고, 인스턴트 메시지를 사용자 장치(120)로부터 직접적으로 수신할 있다. 이러한 실시예에서, 서버(115)는 릴레이 서버(relay server)로서 역할할 수 있고, 사용자 장치(130)가 알림을 수신한 이후, 사용자 장치(130)는 예컨대, 피어 투 피어(peer-to-peer)기법을 이용하여 사용자 장치(120)에 직접 연결함으로써 인스턴트 메시지를 수신할 수 있다. In some embodiments, the user device 120 may send an instant message to or receive an instant message from the user device 130 through the server 115 providing an instant message service. In some other examples, user device 120 may send a notification for an instant message to user device 130 via server 115, where user device 130 receives the notification from the server and sends the user an instant message. Can be received directly from the device 120. In such an embodiment, server 115 may serve as a relay server, and after user device 130 receives the notification, user device 130 may, for example, be peer-to-peer. An instant message can be received by connecting directly to the user device 120 using a peer technique.
다양한 실시예에서, 네트워크 환경(110)은 사용자 장치(120, 130) 간의 유선 환경, 무선 환경, 기지국, 등과 같은 통신 환경을 더 포함할 수 있다. 일부 예시에서, 서버(115)는 사용자 장치(120)가 전송한 인스턴트 메시지를 저장하고, 이후, 사용자 장치(130)가 서버(115)에 연결되면, 사용자 장치(120)로부터 수신된 인스턴트 메시지를 전송하도록 구성될 수 있다. 피어 투 피어 기법으로 인스턴트 메시지를 직접적으로 전송하는 예시에서, 서버(115)는 네트워크 환경(110)은 사용자 장치(120, 130) 간의 피어 투 피어 연결을 수립되도록 지원할 수 있다.In various embodiments, network environment 110 may further include a communication environment, such as a wired environment, a wireless environment, a base station, or the like, between user devices 120, 130. In some examples, the server 115 stores the instant message sent by the user device 120 and then, when the user device 130 is connected to the server 115, receives the instant message received from the user device 120. Can be configured to transmit. In the example of directly sending an instant message in a peer-to-peer technique, server 115 may assist network environment 110 to establish a peer-to-peer connection between user devices 120, 130.
도 1에서 사용자 장치(120 및 130)는 통신 가능한 장치, 예컨대, 스마트폰, 태블릿 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 휴대 전화기, 개인 휴대용 단말기(PDA), 특정 용도 장치 또는 상기 기능 중 임의의 것을 포함하는 융합 장치와 같은 소형 폼팩터 휴대용(모바일) 전자 장치를 포함할 수 있다. 도 1에서 도시된 바와 같이, 사용자 장치(120 및 130)는 일대일의 인스턴트 메시지 통신뿐만 아니라, 일대다 또는 다대다의 인스턴트 메시지 통신도 수행할 수 있으며, 서버(115)는 그러한 인스턴트 메시지 서비스를 제공할 수 있다.In FIG. 1, user devices 120 and 130 include communicable devices, such as smartphones, tablet computers, desktop computers, laptop computers, mobile phones, personal digital assistants (PDAs), special purpose devices, or any of the above functions. Small form factor portable (mobile) electronic devices, such as a fusion device. As shown in FIG. 1, user devices 120 and 130 may perform one-to-one or many-to-many instant message communications as well as one-to-one instant message communications, and server 115 provides such instant messaging services. can do.
일부 예시에서, 사용자 장치(120)의 사용자(제1 사용자)는 사용자 장치(120)를 이용하여, 사용자 장치(130)의 사용자(제2 사용자)에게 전송할 인스턴트 메시지를 입력할 수 있다. 일부 예시에서, 인스턴트 메시지는 제1 사용자에 의해 입력된 음성 메시지일 수 있다. 제1 사용자는 예컨대, 미리 정해진 시간 동안 사용자 장치(120)에 음성 메시지를 입력할 수 있다. 이후, 사용자 장치(120)는 음성 메시지에 대하여 음성 인식을 수행하여, 음성 인식된 텍스트 메시지를 생성할 수 있으며, 여기서, 본 개시에 따른 기술 분야에서 잘 알려진 다양한 음성 인식 기법이 이용될 수 있다. 사용자 장치(120)는 제1 사용자의 입력에 의해, 음성 메시지 및 음성 메시지에 대응하는 음성 인식된 텍스트 메시지를 사용자 장치(130)에 전송할 수 있다. 음성 메시지와 텍스트 메시지는 사용자 장치(120)로부터 서버(115)를 통하여 사용자 장치(130)로 전송되거나 사용자 장치(120)로부터 사용자 장치(130)로 직접적으로 전송될 수 있다.In some examples, a user (first user) of user device 120 may enter an instant message to send to user (second user) of user device 130 using user device 120. In some examples, the instant message may be a voice message entered by the first user. For example, the first user may input a voice message to the user device 120 for a predetermined time. Thereafter, the user device 120 may perform voice recognition on the voice message to generate a voice recognized text message, and various voice recognition techniques well known in the art according to the present disclosure may be used. The user device 120 may transmit a voice message and a voice recognized text message corresponding to the voice message to the user device 130 by an input of the first user. Voice and text messages may be sent from the user device 120 to the user device 130 through the server 115 or directly from the user device 120 to the user device 130.
일부 예시에서, 사용자 장치(120)는 제1 사용자에 의해 입력된 둘 이상의 음성 메시지를 결합하여, 하나의 음성 메시지로 전송할 수 있다. 일부 다른 예시에서, 사용자 장치(120)는 제1 사용자에 의해 입력된 하나 이상의 음성 메시지와 제1 사용자에 의해 입력된 하나 이상의 텍스트 메시지를 결합하여 하나의 인스턴트 메시지로 전송할 수 있다.In some examples, the user device 120 may combine two or more voice messages input by the first user and transmit them in one voice message. In some other examples, the user device 120 may combine one or more voice messages input by the first user and one or more text messages input by the first user and send them into one instant message.
추가적인 일부 실시예에서, 인스턴트 메시지 서비스가 제공되는 중에, 제1 사용자에 대한 캐릭터와 제2 사용자에 대한 캐릭터가 디스플레이 될 수 있다. 사용자 장치(120)는 인스턴트 메시지를 사용자 장치(130)에 전송하면서, 제1 사용자에 대한 캐릭터에 대한 캐릭터 정보를 전송할 수 있다. 캐릭터 정보는 제1 사용자의 캐릭터의 종류, 캐릭터의 표정 또는 캐릭터의 동작 중 적어도 하나에 대한 정보를 포함할 수 있다. In some further embodiments, while the instant messaging service is being provided, a character for the first user and a character for the second user may be displayed. The user device 120 may transmit character information about the character for the first user while transmitting the instant message to the user device 130. The character information may include information on at least one of the type of the character of the first user, the expression of the character, or the operation of the character.
일부 예시에서, 사용자 장치(120)는 이미지/비디오 카메라, 뎁스 카메라, 등과 같은 장치를 이용하여 제1 사용자의 얼굴 정보를 획득할 수 있으며, 획득한 얼굴 정보에 기초하여, 제1 사용자에 대한 캐릭터의 표정을 결정할 수 있다. 일 예시에서, 제1 사용자에 대한 캐릭터의 표정은 제1 사용자가 인스턴트 메시지를 입력하는 중에 결정될 수 있다. 일부 다른 예시에서, 캐릭터의 표정은 제1 사용자에 의해 선택될 수 있다. 일부 예시에서, 제1 사용자는 미리 정해진 동작의 목록으로부터 캐릭터의 동작을 선택할 수 있다. 일부 다른 예시에서, 사용자 장치(120)는 음성 인식된 텍스트 메시지 또는 타이핑된 텍스트 메시지로부터 캐릭터의 동작과 연관된 문자를 인식할 수 있다. 제1 사용자는 인식된 문자를 선택함으로써, 캐릭터의 동작을 선택할 수 있다. 제1 사용자는 음성 인식된 텍스트 메시지, 캐릭터의 표정 및 동작, 등을 확인하고, 음성 메시지의 전송을 결정할 수 있다.In some examples, the user device 120 may obtain face information of the first user using a device such as an image / video camera, a depth camera, and the like, and based on the acquired face information, a character for the first user. Can determine the facial expression. In one example, the facial expression of the character for the first user may be determined while the first user is entering an instant message. In some other examples, the facial expression of the character may be selected by the first user. In some examples, the first user may select an action of the character from a list of predetermined actions. In some other examples, the user device 120 may recognize the characters associated with the character's movement from the voice recognized text message or typed text message. The first user may select an action of the character by selecting the recognized character. The first user may check a voice recognized text message, a facial expression and motion of the character, and determine the transmission of the voice message.
제1 사용자에 의해 입력된 인스턴트 메시지가 사용자 장치(120)로부터 서버(115)를 통하여 사용자 장치(130)로 전송되는 일부 예시에서, 서버(115)는 사용자 장치(120)로부터 수신된 인스턴트 메시지(예컨대, 음성 메시지, 타이핑된 텍스트 메시지, 등)를 저장할 수 있다. 서버(115)는 음성 메시지를 음성 인식된 텍스트 메시지와 대응하여 저장할 수 있다. 추가적인 일부 예시에서, 서버(115)는 사용자 장치(120)로부터 캐릭터 정보를 인스턴트 메시지와 함께 수신할 수 있으며, 수신된 인스턴트 메시지와 대응하여 저장할 수 있다. In some examples where an instant message entered by a first user is sent from the user device 120 to the user device 130 through the server 115, the server 115 may receive the instant message received from the user device 120. For example, voice messages, typed text messages, etc.). The server 115 may store the voice message corresponding to the voice recognized text message. In some further examples, the server 115 may receive character information from the user device 120 along with the instant message and store it in correspondence with the received instant message.
제1 사용자에 의해 입력된 인스턴트 메시지가 사용자 장치(120)로부터 사용자 장치(130)로 직접적으로 전송되는 일부 예시에서, 서버(115)는 사용자 장치(130)에 알림을 전송할 수 있으며, 사용자 장치(130)는 서버(115)로부터 사용자 장치(120)로부터 수신된 인스턴트 메시지에 대한 알림 메시지를 수신할 수 있다.In some examples where an instant message entered by a first user is sent directly from user device 120 to user device 130, server 115 may send a notification to user device 130, and the user device ( 130 may receive a notification message for an instant message received from the user device 120 from the server 115.
사용자 장치(130)는 서버(115)에 접속할 수 있다. 일부 실시예에서, 사용자 장치(130)는 사용자 장치(120)로부터 제1 사용자에 의해 입력된 음성 메시지를 포함하는 하나 이상의 음성 메시지 및 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신할 수 있다. 사용자 장치(130)가 서버(115)로부터 알림을 수신하는 예시에서, 알림은 사용자 장치(120)로부터 수신된 음성 메시지를 포함하는 사용자 장치(130)로의 하나 이상의 음성 메시지에 대한 표시를 포함할 수 있다. The user device 130 may access the server 115. In some embodiments, the user device 130 may receive from the user device 120 one or more voice messages including voice messages input by the first user and one or more voice recognized text messages respectively corresponding to the one or more voice messages. Can be received. In the example where the user device 130 receives a notification from the server 115, the notification may include an indication of one or more voice messages to the user device 130 including the voice message received from the user device 120. have.
일부 실시예에서, 사용자 장치(130)는 수신된 하나 이상의 음성 메시지 및 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 내부에 저장할 수 있다. 일부 예시에서, 사용자 장치(130)는 수신된 하나 이상의 음성 메시지와 음성 인식된 텍스트 메시지를 대응지어 저장할 수 있다.In some embodiments, user device 130 may store therein one or more voice messages and corresponding one or more voice recognized text messages. In some examples, user device 130 may store the received one or more voice messages and the voice recognized text message in correspondence.
일부 실시예에서, 사용자 장치(130)는 수신된 하나 이상의 음성 메시지를 재생하기 위한 음성 메시지 재생 요청을 사용자(제2 사용자)로부터 수신할 수 있다. 사용자 장치(130)는 음성 메시지 재생 요청에 응답하여, 수신된 하나 이상의 음성 메시지를 순차적으로 재생할 수 있다. 이와 같이, 음성 메시지는 음성 메시지의 수신과는 비동기적으로 재생될 수 있다. 추가적으로, 음성 메시지의 재생은 사용자의 요청에 의해, 일시 정지 되거나, 중단되거나, 이전 음성 메시지 또는 다음 음성 메시지를 재생하도록 제어될 수 있다. 일부 예시에서, 사용자 장치(130)는 하나 이상의 음성 인식된 텍스트 메시지를 하나 이상의 음성 메시지의 재생에 대응하여, 디스플레이 할 수 있다.In some embodiments, user device 130 may receive a voice message playback request from a user (second user) to play the received one or more voice messages. The user device 130 may sequentially play one or more received voice messages in response to the voice message play request. As such, the voice message can be played back asynchronously with the reception of the voice message. In addition, playback of the voice message may be controlled to pause, stop, or play the previous voice message or the next voice message at the request of the user. In some examples, the user device 130 may display one or more voice recognized text messages in response to playback of the one or more voice messages.
추가적인 일부 실시예에서, 사용자 장치(130)가 하나 이상의 음성 메시지를 재생하기 전에, 사용자 장치(130)는 미리 정해진 검열 조건에 기초하여, 하나 이상의 음성 인식된 텍스트 메시지를 필터링할 수 있다. 예컨대, 미리 정해진 검열 조건은 욕설, 비속어, 등을 포함할 수 있지만, 이에 제한되지 않는다. 사용자 장치(130)는 필터링의 결과에 기초하여 하나 이상의 음성 메시지를 재생할 수 있다. 예컨대, 음성 인식된 텍스트 메시지에 비속어가 포함되는 경우, 사용자 장치(130)는 대응하는 음성 메시지의 적어도 일부를 묵음(mute)처리 하여 재생할 수 있다. 이러한 필터링 처리는 사용자 장치(130)가 수행하는 것에 한정되지 않으며, 일부 실시예에서는 서버(115)가 하나 이상의 음성 메시지 및 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 전송하기 전에 필터링 처리를 수행할 수 있다.In some further embodiments, before the user device 130 plays one or more voice messages, the user device 130 may filter the one or more voice recognized text messages based on a predetermined censoring condition. For example, predetermined censorship conditions may include, but are not limited to, abusive language, slang, and the like. The user device 130 may play one or more voice messages based on the result of the filtering. For example, if a slang is included in the voice recognized text message, the user device 130 may mute and reproduce at least a part of the corresponding voice message. This filtering process is not limited to what the user device 130 performs, and in some embodiments, the server 115 may perform the filtering process before sending the one or more voice messages and the corresponding one or more voice recognized text messages. have.
일부 실시예에서, 사용자 장치(130)는 하나 이상의 음성 메시지를 미리 정해진 조건에 기초하여 삭제할 수 있다. 일부 예시에서, 사용자 장치(130)는 재생이 종료되면 해당 음성 메시지를 삭제할 수 있다. 일부 다른 예시에서, 사용자 장치(130)는 미리 정해진 저장 용량 조건에 기초하여, 오래된 음성 메시지를 삭제할 수 있다.In some embodiments, user device 130 may delete one or more voice messages based on a predetermined condition. In some examples, the user device 130 may delete the corresponding voice message when playback ends. In some other examples, user device 130 may delete the old voice message based on a predetermined storage capacity condition.
추가적인 일부 실시예에서, 사용자 장치(130)는 하나 이상의 음성 메시지를 수신함과 함께 제1 사용자의 캐릭터에 대한 캐릭터 정보를 서버(115)로부터 수신할 수 있다. 일부 예시에서, 사용자 장치(130)는 하나 이상의 음성 메시지를 순차적으로 재생하는 경우, 이와 함께 수신된 캐릭터 정보에 기초하여 제1 사용자의 캐릭터를 디스플레이 할 수 있다. 일부 예시에서, 사용자 장치(130)는 캐릭터 정보에 기초하여, 제1 사용자의 캐릭터의 표정, 동작, 등이 제어되는 캐릭터를 디스플레이 할 수 있다.In some additional embodiments, the user device 130 may receive character information for the character of the first user from the server 115 in addition to receiving one or more voice messages. In some examples, when the user device 130 sequentially plays one or more voice messages, the user device 130 may display the character of the first user based on the received character information. In some examples, the user device 130 may display a character whose expression, motion, or the like of the character of the first user is controlled based on the character information.
도 2는 본 개시에 따라 인스턴트 메시지 서비스를 이용하는 일 예시를 도시하고, 도 3은 도 2에 따라 인스턴트 메시지 서비스를 이용하는 경우 사용자의 모바일 장치 상에서 메시지가 디스플레이 및 재생되는 일 예시를 도시한다. 도 2에 도시된 바와 같이, 제1 사용자(210), 제2 사용자(220) 및 제3 사용자(230)는 각각 사용자 장치(212), 사용자 장치(222) 및 사용자 장치(232)를 통하여, 인스턴트 메시지 서비스를 이용하고 있다. 도 2의 예시에서, 사용자(210, 220, 230)는, 사용자(210, 220, 230) 중 적어도 하나의 요청에 의해, 송수신 하는 인스턴트 메시지를 공유할 수 있다. 예컨대, 제1 사용자(210)가 인스턴트 메시지를 전송하는 경우, 제2 사용자(220) 및 제3 사용자(230)는 해당 인스턴트 메시지를 수신할 수 있다. 도 2에 도시된 바와 같이, 제1 사용자(210) 및 제2 사용자(220)는 음성 메시지를 전송할 수 있다. 2 illustrates an example of using an instant message service according to the present disclosure, and FIG. 3 illustrates an example of displaying and playing a message on a user's mobile device when using the instant message service according to FIG. 2. As shown in FIG. 2, the first user 210, the second user 220, and the third user 230 are respectively connected to the user device 212, the user device 222, and the user device 232. I use an instant messaging service. In the example of FIG. 2, the users 210, 220, and 230 may share an instant message transmitted and received at the request of at least one of the users 210, 220, and 230. For example, when the first user 210 transmits an instant message, the second user 220 and the third user 230 may receive the instant message. As illustrated in FIG. 2, the first user 210 and the second user 220 may transmit a voice message.
일부 예시에서, 제1 사용자(210)는 캐릭터(216)를 선택할 수 있고, 제2 사용자(220)는 캐릭터(226)를 선택할 수 있다. 제1 사용자(210)는 "춥지 않나요?"라는 내용의 음성 메시지(214)를 입력할 수 있다. 제1 사용자(210)가 음성 메시지(214)를 입력할 때, 사용자 장치(212)는 제1 사용자(210)의 표정을 검출할 수 있으며, 캐릭터(216)의 표정을 결정할 수 있다. 사용자 장치(212)는 음성 메시지(214)에 대하여 음성 인식을 수행함으로써 음성 인식된 텍스트 메시지(214-2)를 획득할 수 있다. 또한, 제1 사용자(210)는 미리 정해진 동작의 목록 중의 하나를 선택하거나, 사용자 장치(212)가 음성 인식된 텍스트 메시지(214-2)로부터 인식한 문자(예컨대 "춥지"가 인식됨)를 제1 사용자(210)가 선택함으로써 캐릭터(216)의 동작을 결정할 수 있다. 이후, 음성 메시지(214)는 제2 및 제3 사용자(220 및 230)의 사용자 장치(222, 232)를 향하여 전송될 수 있다. In some examples, first user 210 may select character 216 and second user 220 may select character 226. The first user 210 may input a voice message 214 that is "not cold?" When the first user 210 inputs the voice message 214, the user device 212 may detect the facial expression of the first user 210 and may determine the facial expression of the character 216. The user device 212 can obtain the speech recognized text message 214-2 by performing speech recognition on the voice message 214. In addition, the first user 210 selects one of a list of predetermined actions or removes a character (eg, “cold” is recognized) that the user device 212 recognizes from the voice recognized text message 214-2. 1 The user 210 can determine the operation of the character 216 by selecting. The voice message 214 may then be sent towards the user devices 222, 232 of the second and third users 220, 230.
음성 메시지(214)가 전송된 이후, 제2 사용자(220)는 "저는 더워요!"라는 내용의 음성 메시지(224)를 입력할 수 있다. 제2 사용자(220)가 음성 메시지(224)를 입력할 때, 사용자 장치(222)는 제2 사용자(220)의 표정을 검출할 수 있으며, 캐릭터(226)의 표정을 결정할 수 있다. 사용자 장치(222)는 음성 메시지(224)로부터 음성 인식된 텍스트 메시지(224-2)를 획득할 수 있다. 또한, 제2 사용자(220)는 미리 정해진 동작의 목록 중의 하나를 선택하거나, 사용자 장치(222)가 음성 인식된 텍스트 메시지(224-2)로부터 인식한 문자(예컨대, "더워요"가 인식됨)를 제2 사용자(220)가 선택함으로써 캐릭터(226)의 동작을 결정할 수 있다. 이후, 음성 메시지(224)가 제1 및 제3 사용자(210, 230)의 사용자 장치(212, 232)를 향하여 전송될 수 있다.After the voice message 214 is transmitted, the second user 220 may input the voice message 224 "I'm hot!" When the second user 220 inputs the voice message 224, the user device 222 may detect an expression of the second user 220 and may determine an expression of the character 226. The user device 222 may obtain the voice recognized text message 224-2 from the voice message 224. In addition, the second user 220 selects one of a list of predetermined actions, or selects a character recognized by the user device 222 from the voice recognized text message 224-2 (eg, “hot” is recognized). The operation of the character 226 may be determined by the selection of the second user 220. The voice message 224 may then be sent towards the user devices 212, 232 of the first and third users 210, 230.
이후, 제3 사용자(230)는 사용자 장치(232)를 이용하여 인스턴트 메시지 서비스를 제공하는 서버(도시되지 않음)에 접속할 수 있으며, 사용자 장치(232)는 음성 메시지(214) 및 음성 메시지(224)를 수신할 수 있다. 또한, 사용자 장치(232)는 음성 인식된 텍스트 메시지(214-2, 224-2)를 수신할 수 있다. 도 3(a) 및 도 3(b)에 도시되는 바와 같이, 음성 인식된 텍스트 메시지(214-2, 224-2)는, 음성 메시지(214, 224)의 재생에 대응하여 디스플레이 될 수 있다. 제3 사용자(230)는 사용자 장치(232) 상에 표시된 사용자 인터페이스(240)를 이용하여 음성 메시지 재생 요청을 입력할 수 있다. 음성 메시지 재생 요청이 입력되면, 도 3(a)에 도시된 바와 같이, 음성 메시지(214)가 캐릭터(216)의 디스플레이와 함께 재생된다. 또한, 음성 메시지(214)가 재생되는 동안, 음성 인식된 텍스트 메시지(214-2)가 음성 메시지(214)의 재생에 대응하여, 디스플레이 될 수 있다. 캐릭터(216)는 제1 사용자(210)의 사용자 장치(212)에서 결정된 표정 및 동작을 보여줄 수 있다. 이후, 도 3(b)에 도시된 바와 같이, 음성 메시지(224)가 캐릭터(226)의 디스플레이와 함께 재생된다. 또한, 음성 메시지(224)가 재생되는 동안, 음성 인식된 텍스트 메시지(224-2)가, 음성 메시지(224)의 재생에 대응하여, 디스플레이 될 수 있다. 캐릭터(226)는 제2 사용자(220)의 사용자 장치(222)에서 결정된 표정 및 동작을 보여줄 수 있다. Thereafter, the third user 230 may access a server (not shown) that provides an instant message service using the user device 232, and the user device 232 may have a voice message 214 and a voice message 224. ) Can be received. In addition, the user device 232 may receive the voice recognized text messages 214-2, 224-2. As shown in FIGS. 3A and 3B, the voice recognized text messages 214-2 and 224-2 may be displayed in response to playback of the voice messages 214 and 224. The third user 230 may input a voice message playback request using the user interface 240 displayed on the user device 232. When a voice message reproduction request is input, as shown in Fig. 3A, the voice message 214 is reproduced with the display of the character 216. Also, while voice message 214 is played back, voice recognized text message 214-2 may be displayed in response to playback of voice message 214. The character 216 may show facial expressions and actions determined by the user device 212 of the first user 210. Thereafter, as shown in FIG. 3B, the voice message 224 is played along with the display of the character 226. In addition, while the voice message 224 is reproduced, the voice recognized text message 224-2 may be displayed in response to the reproduction of the voice message 224. The character 226 may show facial expressions and actions determined by the user device 222 of the second user 220.
도 4는 도 2 및 도 3에 따른 예시에서, 인스턴트 메시지의 로그를 나타내는 일 예시를 도시한다. 제3 사용자(230)의 사용자 장치(232)에서, 제3 사용자(230)는 제1 사용자(210) 및 제2 사용자(220)로부터 수신한 인스턴트 메시지들(214-2, 224-2)이 순차적으로 디스플레이되는 예시를 나타낸다. 도 4의 예시에서는 도시되지 않았지만, 제3 사용자(330)의 사용자 장치(232)가 전송한 인스턴트 메시지 또한 전송 시각 및/또는 수신 시각에 기초하여 순차적으로 디스플레이 될 수 있다.4 shows an example showing a log of an instant message in the example according to FIGS. 2 and 3. In the user device 232 of the third user 230, the third user 230 may be configured to receive instant messages 214-2 and 224-2 received from the first user 210 and the second user 220. An example displayed sequentially is shown. Although not shown in the example of FIG. 4, instant messages transmitted by the user device 232 of the third user 330 may also be sequentially displayed based on the transmission time and / or the reception time.
도 5는 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스 제공 장치(500)를 개략적으로 도시하는 블록도이다. 도 5에 도시된 바와 같이, 인스턴트 메시지 서비스 제공 장치(500)는 통신 모듈(510), 사용자 인터페이스 모듈(520), 음성 재생 모듈(530), 디스플레이 모듈(540), 메모리 모듈(550) 및 음성 인식 모듈(570)을 포함할 수 있다. 추가적으로, 인스턴트 메시지 서비스 제공 장치(500)는 메시지 필터(560), 문자 인식 모듈(580), 카메라 모듈(590-1) 및 표정 결정 모듈(590-2)을 더 포함할 수 있다. 인스턴트 메시지 서비스 제공 장치(500)에 포함되는 컴포넌트는 각각 개별적으로 구현될 수 있거나 컴포넌트 중 둘 이상이 결합되어 하나의 컴포넌트를 형성하는 방식으로 구현될 수 있다. 이하에서 보다 구체적으로 설명되는 바와 같이, 인스턴트 메시지 서비스 제공 장치(500)는 음성 메시지 및 음성 인식된 텍스트 메시지를 전송하는 한편, 인스턴트 메시지 서비스 제공 장치(500)와 같은 외부 컴퓨팅 장치로부터 수신된 텍스트 메시지를 디스플레이 하고 음성 메시지를 사용자의 요청에 따라 재생하도록 구성될 수 있다. 인스턴트 메시지 서비스 제공 장치(500)는 다양한 컴퓨팅 장치일 수 있으며, 예컨대, 스마트폰, 태블릿 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 휴대 전화기, 개인 휴대용 단말기(PDA), 특정 용도 장치 또는 상기 기능 중 임의의 것을 포함하는 융합 장치와 같은 소형 폼팩터 휴대용(모바일) 전자 장치를 포함할 수 있다.5 is a block diagram schematically illustrating an instant message service providing apparatus 500 according to at least some embodiments of the present disclosure. As illustrated in FIG. 5, the instant message service providing apparatus 500 may include a communication module 510, a user interface module 520, a voice playback module 530, a display module 540, a memory module 550, and a voice. Recognition module 570 may be included. In addition, the instant message service providing apparatus 500 may further include a message filter 560, a text recognition module 580, a camera module 590-1, and an facial expression determination module 590-2. Components included in the instant message service providing apparatus 500 may be individually implemented or two or more of the components may be combined to form one component. As described in more detail below, the instant message service providing apparatus 500 transmits a voice message and a voice recognized text message, while the text message received from an external computing device such as the instant message service providing apparatus 500. Can be configured to display and play the voice message at the request of the user. The instant message service providing device 500 may be a variety of computing devices, such as, for example, smartphones, tablet computers, desktop computers, laptop computers, mobile phones, personal digital assistants (PDAs), special purpose devices, or any of the above functions. Small form factor portable (mobile) electronic devices, such as including fusion devices.
통신 모듈(510)은 인스턴트 메시지 서비스 제공 장치(500)를 서버에 접속하도록 구성될 수 있다. 통신 모듈(510)은 외부 컴퓨팅 장치로부터 하나 이상의 음성 메시지 및 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신하도록 구성될 수 있다. 일부 예시에서, 통신 모듈(510)은 외부 컴퓨팅 장치로부터 서버를 통하여 하나 이상의 음성 메시지 및 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신할 수 있다. 일부 다른 예시에서, 통신 모듈(510)은 서버로부터 알림을 수신할 수 있다. 알림은 하나 이상의 음성 메시지가 전송되었음을 나타낼 수 있다. 이러한 예시에서, 통신 모듈(510)은 이러한 알림에 기초하여, 예컨대, 피어 투 피어 연결과 같은 방식에 의해, 외부 컴퓨팅 장치로부터 직접적으로 하나 이상의 음성 메시지 및 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신할 수 있다.The communication module 510 may be configured to connect the instant message service providing apparatus 500 to a server. The communication module 510 may be configured to receive one or more voice messages and one or more voice recognized text messages corresponding to one or more voice messages, respectively, from an external computing device. In some examples, communication module 510 may receive one or more voice messages and corresponding one or more voice recognized text messages from an external computing device via a server. In some other examples, communication module 510 may receive a notification from a server. The notification may indicate that one or more voice messages have been sent. In this example, the communication module 510 receives one or more voice messages and corresponding one or more voice recognized text messages directly from an external computing device, such as in a manner such as a peer to peer connection, based on this notification. can do.
사용자 인터페이스 모듈(520)은 수신된 하나 이상의 음성 메시지에 대한 음성 메시지 재생 요청을 사용자로부터 수신하도록 구성될 수 있다. 음성 재생 모듈(530)은 사용자 인터페이스 모듈(520)에 의해 수신된 음성 메시지 재생 요청에 응답하여, 통신 모듈(510)에 의해 수신된 하나 이상의 음성 메시지를 순차적으로 재생하도록 구성될 수 있다. 사용자 인터페이스 모듈(520)은 요구되는 바에 따라, 사용자로부터 음성 메시지의 재생의 일시 정지, 중지, 이전 음성 메시지의 재생 또는 다음 음성 메시지의 재생에 대한 다양한 요청을 수신할 수 있으며, 음성 재생 모듈(530)은 사용자 인터페이스 모듈(520)에 의해 수신된 요청에 따라 음성 메시지를 재생할 수 있다.The user interface module 520 may be configured to receive a voice message playing request for the received one or more voice messages from the user. The voice playing module 530 may be configured to sequentially play one or more voice messages received by the communication module 510 in response to a voice message playing request received by the user interface module 520. The user interface module 520 may receive various requests from the user for pausing, stopping, playing the previous voice message, or playing the next voice message, as required. ) May play the voice message according to the request received by the user interface module 520.
또한, 디스플레이 모듈(540)은 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지를, 하나 이상의 음성 메시지의 재생에 대응하여, 디스플레이 하도록 구성될 수 있다. 메모리 모듈(550)은 통신 모듈(510)에 의해 수신된 하나 이상의 음성 메시지 및 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 저장하도록 구성될 수 있다. 일부 예시에서, 메모리 모듈(550)은 수신된 하나 이상의 음성 메시지와 음성 인식된 텍스트 메시지를 대응지어 저장할 수 있다. 일부 실시예에서, 메모리 모듈(550)은 하나 이상의 음성 메시지를 미리 정해진 조건에 기초하여 삭제할 수 있다. 일부 예시에서, 메모리 모듈(550)은 음성 메시지의 재생이 종료되면 메모리 모듈(550)에 저장된 해당 음성 메시지를 삭제할 수 있다. 일부 다른 예시에서, 메모리 모듈(550)은 미리 정해진 저장 용량 조건에 기초하여, 오래된 음성 메시지를 삭제할 수 있다. 일 예시에서, 메모리 모듈(550)은 저장된 음성 메시지의 총 용량이 미리 정해진 값을 초과하면 가장 오래된 음성 메시지를 삭제할 수 있다. 다른 예시에서, 메모리 모듈(550)은 재생이 종료된 음성 메시지가 미리 정해진 값을 초과하면, 해당 음성 메시지를 삭제할 수 있다.In addition, the display module 540 may be configured to display one or more voice recognized text messages corresponding to one or more voice messages, respectively, in response to playback of the one or more voice messages. The memory module 550 may be configured to store one or more voice messages received by the communication module 510 and corresponding one or more voice recognized text messages. In some examples, the memory module 550 may store one or more received voice messages and voice recognized text messages in correspondence. In some embodiments, the memory module 550 may delete one or more voice messages based on a predetermined condition. In some examples, the memory module 550 may delete the corresponding voice message stored in the memory module 550 when the playback of the voice message ends. In some other examples, the memory module 550 may delete the old voice message based on the predetermined storage capacity condition. In one example, the memory module 550 may delete the oldest voice message if the total capacity of the stored voice message exceeds a predetermined value. In another example, the memory module 550 may delete the voice message when the voice message, for which playback ends, exceeds a predetermined value.
추가적인 실시예에서, 메시지 필터(560)는 음성 재생 모듈(530)이 수신된 하나 이상의 음성 메시지를 재생하기 전에, 미리 정해진 검열 조건에 기초하여, 하나 이상의 음성 인식된 텍스트 메시지를 필터링 할 수 있다. 메시지 필터(560)에 의한 검열 방식은 텍스트 메시지에 대한 잘 알려진 검열 방식을 이용할 수 있다. 예컨대, 미리 정해진 검열 조건은, 욕설, 비속어, 등을 포함할 수 있지만, 이에 제한되지 않는다. 음성 재생 모듈(530)은 메시지 필터(560)의 필터링의 결과에 기초하여 하나 이상의 음성 메시지를 재생할 수 있다. 예컨대, 음성 인식된 텍스트 메시지에 비속어가 포함되는 경우, 음성 재생 모듈(530)은 대응하는 음성 메시지에 대하여 묵음(mute) 처리를 수행할 수 있다.In a further embodiment, the message filter 560 may filter the one or more voice recognized text messages based on a predetermined censoring condition before the voice playback module 530 plays the received one or more voice messages. The censoring method by the message filter 560 may use a well-known censoring method for a text message. For example, the predetermined censorship condition may include, but is not limited to, abusive language, slang, and the like. The voice reproduction module 530 may reproduce one or more voice messages based on the filtering result of the message filter 560. For example, when a slang is included in a voice recognized text message, the voice reproducing module 530 may mute the corresponding voice message.
추가적으로, 통신 모듈(510)은 하나 이상의 음성 메시지를 수신함과 함께 송신자의 캐릭터에 대한 캐릭터 정보를 서버로부터 수신할 수 있다. 일부 예시에서, 음성 재생 모듈(530)이 하나 이상의 음성 메시지를 순차적으로 재생하는 경우, 디스플레이 모듈(540)은 수신된 캐릭터 정보에 기초하여 송신자의 캐릭터를 디스플레이 할 수 있다. 디스플레이 모듈(540)은 캐릭터 정보에 기초하여 표정, 동작, 등이 제어되는 캐릭터를 디스플레이 할 수 있다.In addition, the communication module 510 may receive character information about the character of the sender from the server while receiving one or more voice messages. In some examples, when the voice playback module 530 sequentially plays one or more voice messages, the display module 540 may display the sender's character based on the received character information. The display module 540 may display a character whose expression, motion, or the like is controlled based on the character information.
일부 실시예에서, 사용자 인터페이스 모듈(520)은 인스턴트 메시지 서비스 제공 장치(500)의 사용자에 의하여 입력되는 음성 메시지(이하, "입력 음성 메시지")를 수신하도록 구성될 수 있다. 일부 예시에서, 사용자 인터페이스 모듈(520)은 미리 정해진 시간 동안 입력 음성 메시지를 수신할 수 있다. 일부 예시에서, 사용자 인터페이스 모듈(520)은 사용자의 요청에 따라, 미리 정해진 시간 동안 수신된 입력 음성 메시지를 둘 이상 결합하여 하나의 입력 음성 메시지를 생성할 수 있다. 음성 인식 모듈(570)은 사용자 인터페이스 모듈(520)에 의해 수신된 입력 음성 메시지에 대하여 음성 인식을 수행하여, 음성 인식된 텍스트 메시지를 생성할 수 있으며, 본 개시에 따른 기술 분야에서 잘 알려진 다양한 음성 인식 기법이 이용될 수 있다. 사용자는 사용자 인터페이스 모듈(520)을 통하여 텍스트 메시지를 타이핑 하는 것 또한 가능하다. 통신 모듈(510)은 입력 음성 메시지 및 대응하는 음성 인식된 텍스트 메시지를 외부 컴퓨팅 장치로 전송할 수 있다. 입력 음성 메시지와 대응하는 음성 인식된 텍스트 메시지는 서버를 통하여 외부 컴퓨팅 장치로 전송되거나 외부 컴퓨팅 장치로 직접적으로 전송될 수 있다.In some embodiments, the user interface module 520 may be configured to receive a voice message (hereinafter, “input voice message”) input by a user of the instant message service providing apparatus 500. In some examples, user interface module 520 may receive an input voice message for a predetermined time. In some examples, the user interface module 520 may generate one input voice message by combining two or more input voice messages received for a predetermined time at a user's request. The voice recognition module 570 may generate a voice recognized text message by performing voice recognition on the input voice message received by the user interface module 520, and various voices well known in the art according to the present disclosure. Recognition techniques can be used. It is also possible for a user to type a text message through the user interface module 520. The communication module 510 may transmit an input voice message and a corresponding voice recognized text message to an external computing device. The voice recognized text message corresponding to the input voice message may be transmitted to the external computing device or directly to the external computing device through the server.
추가적인 일부 실시예에서, 인스턴트 메시지 서비스가 제공되는 중에, 디스플레이 모듈(540)은 인스턴트 메시지 서비스 제공 장치(500)의 사용자의 캐릭터를 디스플레이 할 수 있다. 통신 모듈(510)은 사용자의 캐릭터에 대한 캐릭터 정보를 전송할 수 있다. 캐릭터 정보는 사용자의 캐릭터의 종류, 캐릭터의 표정 또는 캐릭터의 동작 중 적어도 하나에 대한 정보를 포함할 수 있다.In some further embodiments, while the instant message service is being provided, the display module 540 may display a character of the user of the instant message service providing apparatus 500. The communication module 510 may transmit character information about the character of the user. The character information may include information about at least one of a type of a character of a user, an expression of a character, or an operation of the character.
일부 예시에서, 문자 인식 모듈(580)은 음성 인식 모듈(570)에 의해 생성된 음성 인식된 텍스트 메시지 또는 타이핑된 텍스트 메시지로부터 캐릭터의 동작과 연관된 문자를 인식할 수 있다. 사용자는 인식된 문자를 선택함으로써, 캐릭터의 동작을 선택할 수 있다. 일부 다른 예시에서, 사용자는 사용자 인터페이스 모듈(520)을 통하여 캐릭터의 미리 정해진 동작의 목록으로부터 캐릭터의 동작을 선택할 수 있다.In some examples, text recognition module 580 may recognize text associated with the movement of the character from a speech recognized text message or typed text message generated by speech recognition module 570. The user can select an action of the character by selecting the recognized character. In some other examples, the user may select an action of the character from the list of predetermined actions of the character via the user interface module 520.
일부 예시에서, 카메라 모듈(590-1)은 이미지/비디오 카메라, 뎁스 카메라, 등과 같은 장치를 이용하여 사용자의 얼굴 정보를 획득할 수 있다. 표정 결정 모듈(590-2)은 카메라 모듈(590-1)에 의해 획득한 얼굴 정보에 기초하여, 사용자의 캐릭터의 표정을 결정할 수 있다. 일 예시에서, 사용자 인터페이스 모듈(520)이 음성 메시지 또는 텍스트 메시지와 같은 인스턴트 메시지를 수신하는 동안, 카메라 모듈(590-1)은 사용자의 얼굴 정보를 획득하고, 표정 결정 모듈(590-2)은 획득된 얼굴 정보에 기초하여 캐릭터의 표정을 결정할 수 있다.In some examples, the camera module 590-1 may acquire face information of the user using a device such as an image / video camera, a depth camera, or the like. The facial expression determination module 590-2 may determine the facial expression of the character of the user based on the face information obtained by the camera module 590-1. In one example, while the user interface module 520 receives an instant message, such as a voice message or text message, the camera module 590-1 obtains face information of the user, and the facial expression determination module 590-2 The facial expression of the character may be determined based on the acquired face information.
추가적으로 또는 선택적으로, 사용자는 디스플레이 모듈(540)에 나타나는 텍스트 메시지, 캐릭터의 표정, 동작, 등을 확인한 후에, 음성 메시지와 같은 인스턴트 메시지의 전송을 결정할 수 있다.Additionally or alternatively, the user may determine the transmission of an instant message, such as a voice message, after confirming a text message, a facial expression, an action, or the like appearing on the display module 540.
도 6 및 도 7은 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스 제공 방법에 관한 예시적인 프로세스(600, 700)를 도시하는 흐름도이다. 도 6은 인스턴트 메시지를 수신하는 프로세스(600)를 설명하고, 도 7은 인스턴트 메시지를 전송하는 프로세스(700)를 설명한다. 예컨대, 프로세스(600, 700)는 도 1의 사용자 장치(120, 130), 도 5의 인스턴트 메시지 서비스 제공 장치(500)와 같은 컴퓨팅 장치의 제어 하에서 수행될 수 있다. 도 6에 도시된 프로세스(600)는 블록(610, 620, 630, 640 및/또는 650)에 의해 예시된 바와 같은 하나 이상의 동작, 기능 또는 작용을 포함할 수 있다. 또한, 도 7에 도시된 프로세스(700)는 블록(710, 720, 730 및/또는 740)에 의해 예시된 바와 같은 하나 이상의 동작, 기능 또는 작용을 포함할 수 있다. 다양한 블록은 설명된 실시예로 제한하려고 의도되지는 않는다. 예컨대, 당업자는 여기에서 개시된 본 프로세스에 대하여, 프로세스 및 방법에서 수행되는 기능이 상이한 순서로 구현될 수 있다는 점을 인정할 것이다. 도 6 및 도 7에 예시된 개략적인 동작들은 예시로서만 제공되고, 개시된 실시예의 본질에서 벗어나지 않으면서, 동작들 중 일부가 선택적일 수 있거나, 더 적은 동작으로 조합될 수 있거나, 추가적인 동작으로 확장될 수 있다. 6 and 7 are flowcharts illustrating example processes 600 and 700 for a method of providing instant message services, in accordance with at least some embodiments of the present disclosure. 6 illustrates a process 600 for receiving an instant message, and FIG. 7 illustrates a process 700 for sending an instant message. For example, the processes 600 and 700 may be performed under the control of a computing device such as the user device 120, 130 of FIG. 1, or the instant message service providing device 500 of FIG. 5. The process 600 shown in FIG. 6 may include one or more operations, functions or actions as illustrated by blocks 610, 620, 630, 640 and / or 650. In addition, the process 700 shown in FIG. 7 may include one or more operations, functions, or actions as illustrated by blocks 710, 720, 730, and / or 740. The various blocks are not intended to be limited to the described embodiments. For example, those skilled in the art will appreciate that, for the present processes disclosed herein, the functions performed in the processes and methods may be implemented in a different order. The schematic operations illustrated in FIGS. 6 and 7 are provided by way of example only, and some of the operations may be optional, may be combined in fewer operations, or extended to additional operations without departing from the spirit of the disclosed embodiment. Can be.
도 6에 도시된 프로세스(600)는 서버에 접속하는 블록(610)에서 시작한다. 블록(610)에서, 컴퓨팅 장치는 서버에 접속할 수 있다. 프로세스(600)는 블록(610)에서 하나 이상의 음성 메시지 및 하나 이상의 음성 인식된 텍스트 메시지를 수신하는 블록(620)으로 이어질 수 있다.The process 600 shown in FIG. 6 begins at block 610 connecting to a server. At block 610, the computing device may connect to the server. Process 600 may continue to block 620 to receive one or more voice messages and one or more voice recognized text messages at block 610.
블록(620)에서, 컴퓨팅 장치는 송신자의 외부 컴퓨팅 장치로부터 하나 이상의 음성 메시지 및 하나 이상의 음성 메시지 각각에 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신할 수 있다. 일부 예시에서, 서버는 송신자로부터 수신된 하나 이상의 음성 메시지에 대한 알림을 전송할 수 있고, 컴퓨팅 장치는 그러한 알림을 서버로부터 수신할 수 있다. 컴퓨팅 장치는 이후, 알림에 나타나는 하나 이상의 음성 메시지 및 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 외부 컴퓨팅 장치로부터 직접적으로 수신하거나 서버를 통하여 수신할 수 있다. 프로세스(600)는 블록(620)에서, 수신된 하나 이상의 음성 메시지 및 하나 이상의 음성 인식된 텍스트 메시지를 저장하는 블록(630)으로 이어질 수 있다.At block 620, the computing device may receive one or more voice messages and one or more voice recognized text messages corresponding to each of the one or more voice messages from the sender's external computing device. In some examples, the server may send a notification for one or more voice messages received from the sender, and the computing device may receive such a notification from the server. The computing device may then receive one or more voice messages and corresponding one or more voice recognized text messages that appear in the notification directly from an external computing device or through a server. Process 600 may continue at block 620 with block 630 storing the received one or more voice messages and one or more voice recognized text messages.
블록(630)에서, 컴퓨팅 장치는 수신된 하나 이상의 음성 메시지 및 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 내부에 저장할 수 있다. 일부 예시에서, 컴퓨팅 장치는 수신된 하나 이상의 음성 메시지와 하나 이상의 음성 인식된 텍스트 메시지를 대응지어 저장할 수 있다. 프로세스(600)는 블록(630)에서 사용자로부터 음성 메시지 재생 요청을 수신하는 블록(640)으로 이어질 수 있다.At block 630, the computing device may store therein one or more voice messages and corresponding one or more voice recognized text messages therein. In some examples, the computing device may store the received one or more voice messages and the one or more voice recognized text messages in correspondence. Process 600 may continue to block 640 to receive a voice message playback request from a user at block 630.
블록(640)에서, 컴퓨팅 장치는 수신된 하나 이상의 음성 메시지를 재생하기 위한 음성 메시지 재생 요청을 사용자로부터 수신할 수 있다. 프로세스(600)는 블록(640)에서 하나 이상의 음성 메시지를 순차적으로 재생하는 블록(650)으로 이어질 수 있다.At block 640, the computing device may receive a voice message playback request from the user to play the received one or more voice messages. Process 600 may continue to block 650 to sequentially play one or more voice messages at block 640.
블록(650)에서, 컴퓨팅 장치는 음성 메시지 재생 요청에 응답하여 수신된 하나 이상의 음성 메시지를 순차적으로 재생할 수 있다. 추가적으로, 음성 메시지의 재생은 사용자의 요청에 의해, 일시 정지 되거나, 중단되거나, 이전 음성 메시지 또는 다음 음성 메시지를 재생하도록 제어될 수 있다. 일부 예시에서, 컴퓨팅 장치는 재생이 종료된 음성 메시지를 미리 정해진 조건에 기초하여 삭제할 수 있다. 송신자의 캐릭터 정보를 수신하는 일부 예시에서, 컴퓨팅 장치는 하나 이상의 음성 메시지를 순차적으로 재생하는 한편, 캐릭터 정보에 기초하여 송신자의 캐릭터를 디스플레이할 수 있다.At block 650, the computing device may sequentially play one or more voice messages received in response to the voice message playback request. In addition, playback of the voice message may be controlled to pause, stop, or play the previous voice message or the next voice message at the request of the user. In some examples, the computing device may delete the voice message for which playback has ended based on a predetermined condition. In some examples of receiving the sender's character information, the computing device may play one or more voice messages sequentially while displaying the sender's character based on the character information.
추가적으로, 컴퓨팅 장치는 블록(650)을 수행하기 전에, 미리 정해진 검열 조건에 기초하여, 하나 이상의 음성 인식된 텍스트 메시지를 필터링할 수 있다. 이후, 블록(650)에서 컴퓨팅 장치는 필터링의 결과에 기초하여 하나 이상의 음성 메시지를 재생할 수 있다. 예컨대, 음성 인식된 텍스트 메시지에 비속어가 포함되는 경우, 컴퓨팅 장치는 대응하는 음성 메시지의 적어도 일부를 묵음 처리하여 재생할 수 있다.In addition, the computing device may filter the one or more voice recognized text messages based on the predetermined censoring condition before performing block 650. Thereafter, at block 650, the computing device may play one or more voice messages based on the result of the filtering. For example, when a slang is included in the voice recognized text message, the computing device may mute and reproduce at least a portion of the corresponding voice message.
도 7에 도시된 프로세스(700)는 사용자로부터 입력 음성 메시지를 수신하는 블록(710)에서 시작할 수 있다. 블록(710)에서, 사용자는 컴퓨팅 장치를 이용하여 전송될 음성 메시지를 입력할 수 있다. 일부 예시에서, 사용자는 예컨대, 미리 정해진 시간 동안 컴퓨팅 장치에 음성 메시지를 입력할 수 있으며, 컴퓨팅 장치는 이러한 입력 음성 메시지를 수신할 수 있다. 프로세스(700)는 블록(710)에서 음성 인식된 입력 텍스트 메시지를 획득하는 블록(720)으로 이어질 수 있다. Process 700 shown in FIG. 7 may begin at block 710 for receiving an input voice message from a user. At block 710, a user can enter a voice message to be sent using the computing device. In some examples, a user may enter a voice message into the computing device, for example, for a predetermined time, and the computing device may receive this input voice message. Process 700 may continue to block 720 to obtain a voice recognized input text message at block 710.
블록(720)에서, 컴퓨팅 장치는 입력 음성 메시지에 대하여 음성 인식을 수행하여, 음성 인식된 입력 텍스트 메시지를 생성할 수 있다. 입력 음성 메시지에 대한 음성 인식은 알려진 다양한 기법을 이용할 수 있다. 일부 예시에서, 컴퓨팅 장치는 음성 인식된 입력 텍스트 메시지를 디스플레이 하고 사용자는 디스플레이 된 메시지를 확인할 수 있다. 프로세스(700)는 블록(720)에서 캐릭터 정보를 획득하는 블록(730)으로 이어질 수 있다.In block 720, the computing device may perform voice recognition on the input voice message to generate a voice recognized input text message. Speech recognition for input voice messages can use a variety of known techniques. In some examples, the computing device may display a voice recognized input text message and the user may confirm the displayed message. Process 700 may continue to block 730 to obtain character information at block 720.
블록(730)에서, 컴퓨팅 장치는 인스턴트 메시지 서비스 상에서 디스플레이 될 사용자의 캐릭터에 대한 캐릭터 정보를 획득할 수 있다. 일부 예시에서, 컴퓨팅 장치는 이미지/비디오 카메라, 뎁스 카메라, 등과 같은 컴퓨팅 장치에 연결된 부속 장치를 이용하여 사용자의 얼굴 정보를 획득할 수 있으며, 획득한 얼굴 정보에 기초하여, 사용자에 대한 캐릭터의 표정을 결정할 수 있다. 일부 다른 예시에서, 캐릭터의 표정은 사용자에 의해 선택될 수 있다. 일부 예시에서, 컴퓨팅 장치는 사용자에 의해 미리 정해진 동작의 목록으로부터 선택된 캐릭터의 동작 정보를 획득할 수 있다. 일부 다른 예시에서, 컴퓨팅 장치는 음성 인식된 입력 텍스트 메시지로부터 캐릭터의 동작과 연관된 문자를 인식할 수 있으며, 사용자가 인식된 문자 중 하나를 선택하면, 컴퓨팅 장치는 문자에 대응하는 캐릭터의 동작 정보를 획득할 수 있다. 이와 같이 캐릭터 정보는 캐릭터의 종류뿐만 아니라, 캐릭터의 표정, 캐릭터의 동작을 포함할 수 있다. 프로세스(700)는 블록(730)에서 블록(740)으로 이어질 수 있으며, 블록(740)에서 컴퓨팅 장치는 음성 메시지, 음성 인식된 입력 텍스트 메시지 및 캐릭터 정보를 외부 컴퓨팅 장치로 전송할 수 있다.In block 730, the computing device may obtain character information for the character of the user to be displayed on the instant message service. In some examples, the computing device may obtain facial information of the user using an accessory device connected to the computing device, such as an image / video camera, a depth camera, and the like, and based on the acquired facial information, the facial expression of the character to the user Can be determined. In some other examples, the facial expression of the character may be selected by the user. In some examples, the computing device may obtain gesture information of the character selected from the list of gestures predefined by the user. In some other examples, the computing device may recognize a character associated with the movement of the character from the voice recognized input text message, and when the user selects one of the recognized characters, the computing device may retrieve the movement information of the character corresponding to the character. Can be obtained. As described above, the character information may include not only the type of character but also the expression of the character and the operation of the character. Process 700 may continue from block 730 to block 740 where the computing device may transmit a voice message, a voice recognized input text message and character information to an external computing device.
이와 같이, 인스턴트 메시지 서비스를 제공함으로써, 음성 메시지를 수신하는 경우, 수신된 음성 메시지 각각을 재생하기 위한 개별적인 요청을 입력하지 않고, 음성 메시지를 순차적으로 재생함으로써, 음성 메시지의 내용을 이해하기 보다 쉬워진다. 또한, 음성 메시지와 함께 음성 인식된 텍스트 메시지를 저장 및 디스플레이하므로, 음성 메시지를 재생하지 않거나 음성 메시지가 용량의 문제로 지워지더라도 인스턴트 메시지 서비스의 제공 중에 이루어진 대화를 빠르게 이해하고 내용을 검색하는 것이 용이해진다. Thus, by providing an instant message service, when receiving a voice message, it is easier to understand the contents of the voice message by sequentially playing the voice messages without inputting a separate request for playing each of the received voice messages. Lose. It also stores and displays voice-recognized text messages along with voice messages, making it easy to quickly understand and search for conversations made during the provision of instant messaging services, even if the voice messages are not played or the voice messages are erased due to capacity issues. Become.
도 8은 본 개시의 적어도 일부 실시예에 따라 결함 검사를 수행하는 데 이용될 수 있는 예시적인 컴퓨터 프로그램 제품(800)을 도시한다. 예시적인 컴퓨터 프로그램 제품의 예시적인 실시예는 신호 포함 매체(802)를 이용하여 제공된다. 일부 실시예에서, 하나 이상의 컴퓨터 프로그램 제품(700)의 신호 포함 매체(802)는 컴퓨터 판독가능 매체(806), 기록 가능 매체(808) 및/또는 통신 매체(810)를 포함할 수 있다.8 illustrates an example computer program product 800 that may be used to perform defect inspection in accordance with at least some embodiments of the present disclosure. An example embodiment of an example computer program product is provided using a signal bearing medium 802. In some embodiments, signal bearing media 802 of one or more computer program products 700 may include computer readable media 806, recordable media 808, and / or communication media 810.
신호 포함 매체(802)에 포함된 명령어(804)는 도 1에 도시된 사용자 장치(120, 130) 및/또는 도 5에 도시된 인스턴트 메시지 서비스 제공 장치와 같은 컴퓨팅 장치에 의해 실행될 수 있다. 명령어(804)는 실행되면, 본 개시에 따른 제1 사용자의 인스턴트 메시지 서비스를 제공하도록 할 수 있다. 명령어(804)는 제2 사용자의 컴퓨팅 장치에 의해 전송된 음성 메시지를 포함하는 하나 이상의 음성 메시지 및 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지를 수신하기 위한 하나 이상의 명령어; 하나 이상의 음성 메시지 및 하나 이상의 음성 인식된 텍스트 메시지를 저장하기 위한 하나 이상의 명령어; 제1 사용자로부터 음성 메시지 재생 요청을 수신하기 위한 하나 이상의 명령어; 음성 메시지 재생 요청에 응답하여, 순차적으로 수신된 하나 이상의 음성 메시지를 재생하기 위한 하나 이상의 명령어; 및 하나 이상의 음성 인식된 텍스트 메시지를 하나 이상의 음성 메시지의 재생에 대응하여, 디스플레이 하기 위한 하나 이상의 명령어 중 적어도 하나를 포함할 수 있다. The instructions 804 included in the signal bearing medium 802 may be executed by a computing device such as the user device 120, 130 shown in FIG. 1 and / or the instant message service providing device shown in FIG. 5. The instruction 804 may, when executed, provide an instant message service for the first user in accordance with the present disclosure. The instructions 804 may include one or more instructions for receiving one or more voice messages including a voice message sent by the computing device of the second user and one or more voice recognized text messages respectively corresponding to the one or more voice messages; One or more instructions for storing one or more voice messages and one or more voice recognized text messages; One or more instructions for receiving a voice message playing request from a first user; One or more instructions for reproducing the one or more voice messages sequentially received in response to the voice message playback request; And one or more instructions for displaying the one or more voice recognized text messages in response to playing of the one or more voice messages.
도 9는 본 개시의 적어도 일부 실시예에 따라 인스턴트 메시지 서비스 제공 서버(900)를 개략적으로 도시하는 블록도이다. 도 9에 도시된 바와 같이, 인스턴트 메시지 서비스 제공 서버(900)는 통신 모듈(910), 캐릭터 모듈(920), 음성 메모리(930) 및 텍스트 메모리(940)를 포함할 수 있다. 통신 모듈(910)은 송신자로부터 음성 메시지 및/또는 텍스트 메시지와 같은 인스턴트 메시지 및 캐릭터 정보를 수신할 수 있다. 또한, 통신 모듈(910)은 인스턴트 메시지의 수신자에게, 인스턴트 메시지에 대한 알림 및/또는 인스턴트 메시지를 전송할 수 있다. 일부 예시에서, 통신 모듈(910)은 음성 메시지, 음성 인식된 텍스트 메시지 및 송신자의 캐릭터 정보를 전송할 수 있다. 캐릭터 모듈(920)은 송신자로부터 수신된 캐릭터 정보, 예컨대, 송신자의 캐릭터의 종류, 표정, 동작, 등에 관한 정보를 저장할 수 있다. 음성 메모리(930)는 송신자로부터 수신된 음성 메시지를 저장할 수 있다. 일부 예시에서, 음성 메모리(930)에 저장된 음성 메시지는 미리 정해진 조건에 따라 삭제될 수 있다. 텍스트 메모리(940)는 음성 인식된 텍스트 메시지 및 타이핑된 텍스트 메시지를 저장할 수 있다. 일부 예시에서, 텍스트 메모리(940)는 음성 인식된 텍스트 메시지를 음성 메모리(930)에 저장된 음성 메시지와 대응하여 저장할 수 있고, 캐릭터 모듈(920)은 캐릭터 정보를 음성 메모리(930)에 저장된 음성 메시지 및/또는 텍스트 메모리(940)에 저장된 음성 인식된 텍스트 메시지 또는 타이핑된 텍스트 메시지에 대응하여 저장할 수 있다.9 is a block diagram schematically illustrating an instant message service providing server 900 according to at least some embodiments of the present disclosure. As illustrated in FIG. 9, the instant message service providing server 900 may include a communication module 910, a character module 920, a voice memory 930, and a text memory 940. The communication module 910 may receive instant message and character information, such as a voice message and / or text message, from the sender. In addition, the communication module 910 may transmit a notification and / or an instant message for the instant message to the recipient of the instant message. In some examples, the communication module 910 may transmit a voice message, a voice recognized text message, and character information of the sender. The character module 920 may store character information received from the sender, for example, information on a type, facial expression, motion, and the like of the sender's character. The voice memory 930 may store a voice message received from the sender. In some examples, the voice message stored in the voice memory 930 may be deleted according to a predetermined condition. The text memory 940 can store voice recognized text messages and typed text messages. In some examples, the text memory 940 may store the voice recognized text message corresponding to the voice message stored in the voice memory 930, and the character module 920 may store the character information in the voice message stored in the voice memory 930. And / or corresponding to the voice recognized text message or typed text message stored in the text memory 940.
청구된 대상은 여기에서 기술된 특정 구현예로 범위가 제한되지 않는다. 예컨대, 일부 구현예는 장치 또는 장치의 조합 상에서 동작하도록 사용될 수 있는 것과 같은 하드웨어로 있을 수 있는 반면, 예컨대, 다른 구현예는 소프트웨어 및/또는 펌웨어로 있을 수 있다. 마찬가지로, 청구된 대상은 이러한 점에서 범위가 제한되지 않지만, 일부 구현예는 신호 베어링 매체, 저장 매체와 같은 하나 이상의 물품을 포함할 수 있다. CD-ROM, 컴퓨터 디스크, 플래시 메모리 등과 같은 이러한 저장 매체는, 예컨대, 컴퓨팅 시스템, 컴퓨팅 플랫폼 또는 기타 시스템과 같은 컴퓨팅 장치에 의하여 실행되면, 예컨대, 앞서 설명된 구현예 중 하나와 같은 청구된 대상에 따라 프로세서의 실행을 야기시킬 수 있는 명령을 저장할 수 있다. 하나의 가능성으로서, 컴퓨팅 장치는 하나 이상의 처리 유닛 또는 프로세서, 디스플레이, 키보드 및/또는 마우스와 같은 하나 이상의 입/출력 장치, 및 정적 랜덤 액세스 메모리, 동적 랜덤 액세스 메모리, 플래시 메모리 및/또는 하드 드라이브와 같은 하나 이상의 메모리를 포함할 수 있다.The claimed subject matter is not limited in scope to the specific embodiments described herein. For example, some implementations may be in hardware, such as may be used to operate on a device or combination of devices, while other implementations may be in software and / or firmware, for example. Likewise, the claimed subject matter is not limited in scope in this respect, but some embodiments may include one or more articles, such as signal bearing media, storage media. Such storage media, such as CD-ROMs, computer disks, flash memory, etc., may be executed by computing devices such as, for example, computing systems, computing platforms, or other systems, for example, to claimed subject matter, such as one of the embodiments described above. As a result, instructions may be stored that may cause the processor to execute. As one possibility, the computing device may comprise one or more processing units or processors, one or more input / output devices such as displays, keyboards and / or mice, and static random access memory, dynamic random access memory, flash memory and / or hard drives. It may include one or more of the same memory.
시스템의 양상들의 하드웨어 및 소프트웨어 구현 사이에는 구별이 거의 없다; 하드웨어 또는 소프트웨어의 사용은 일반적으로 (그러나 어떤 맥락에서 하드웨어 및 소프트웨어 사이의 선택이 중요할 수 있다는 점에서 항상 그런 것은 아니지만) 비용 대비 효율의 트레이드오프(tradeoff)를 나타내는 설계상 선택(design choice)이다. 본 개시에서 기재된 프로세스 및/또는 시스템 및/또는 다른 기술들이 영향 받을 수 있는 다양한 수단(vehicles)(예를 들어, 하드웨어, 소프트웨어 및/또는 펌웨어)이 있으며, 선호되는 수단은 프로세스 및/또는 시스템 및/또는 다른 기술이 사용되는 맥락(context)에 따라 변경될 것이다. 예를 들어, 구현자가 속도 및 정확성이 가장 중요하다고 결정한다면, 구현자는 주로 하드웨어 및/또는 펌웨어 수단을 선택할 수 있으며, 유연성이 가장 중요하다면, 구현자는 주로 소프트웨어 구현을 선택할 수 있으며; 또는, 다른 대안으로서, 구현자는 하드웨어, 소프트웨어 및/또는 펌웨어의 어떤 결합을 선택할 수 있다.There is little distinction between hardware and software implementations of aspects of the system; The use of hardware or software is generally a design choice that represents a tradeoff in cost-efficiency (but not always in the sense that the choice between hardware and software can be important in some contexts). . There are various vehicles (eg, hardware, software and / or firmware) in which the processes and / or systems and / or other techniques described in this disclosure can be affected, and preferred means are processes and / or systems and And / or other techniques will change depending on the context in which it is used. For example, if an implementer decides that speed and accuracy are the most important, then the implementer may primarily choose hardware and / or firmware means; if flexibility is paramount, the implementer may choose a software implementation primarily; Or, as another alternative, the implementer may choose any combination of hardware, software and / or firmware.
전술한 상세한 설명은 블록도, 흐름도, 및/또는 예시를 통해 장치 및/또는 프로세스의 다양한 실시예를 설명하였다. 그러한 블록도, 흐름도, 및/또는 예시는 하나 이상의 기능 및/또는 동작을 포함하는 한, 당업자라면 그러한 블록도, 흐름도, 또는 예시 내의 각각의 기능 및/또는 동작은 하드웨어, 소프트웨어, 펌웨어, 또는 그들의 실질적으로 임의의 조합의 넓은 범위에 의해 개별적으로 및/또는 집합적으로 구현될 수 있다는 것이 이해할 것이다. 일 실시예에서, 본 개시에 기재된 대상의 몇몇 부분은 ASIC(Application Specific Integrated Circuit), FPGA(Field Programmable Gate Array), DSP(Digital Signal Processor) 또는 다른 집적의 형태를 통해 구현될 수 있다. 그러나, 당업자라면, 본 개시의 실시예의 일부 양상은, 하나 이상의 컴퓨터 상에 실행되는 하나 이상의 컴퓨터 프로그램(예를 들어, 하나 이상의 컴퓨터 시스템 상에 실행되는 하나 이상의 프로그램), 하나 이상의 프로세서 상에서 실행되는 하나 이상의 프로그램(예를 들어, 하나 이상의 마이크로프로세서 상에서 실행되는 하나 이상의 프로그램), 펌웨어 또는 이들의 실질적으로 임의의 조합으로써, 전체적으로 또는 부분적으로 균등하게 집적 회로에서 구현될 수 있다는 점, 소프트웨어 및/또는 펌웨어를 위한 코드의 작성 및/또는 회로의 설계는 본 개시에 비추어 당업자의 기술 범위 내라는 점을 알 수 있을 것이다. 또한, 당업자라면, 본 개시의 대상의 매커니즘(mechanism)들이 다양한 형태의 프로그램 제품으로 분배될 수 있음을 이해할 것이며, 본 개시의 대상의 예시는, 분배를 실제로 수행하는데 사용되는 신호 베어링 매체의 특정 유형과 무관하게 적용됨을 이해할 것이다. The foregoing detailed description has described various embodiments of the apparatus and / or process via block diagrams, flow diagrams, and / or examples. As long as such block diagrams, flowcharts, and / or examples include one or more functions and / or operations, one of ordinary skill in the art will appreciate that each function and / or operation within such block diagrams, flowcharts, or examples is hardware, software, firmware, or their It will be understood that they may be implemented individually and / or collectively by a wide range of substantially any combination. In one embodiment, some portions of the subject matter described in this disclosure may be implemented via an Application Specific Integrated Circuit (ASIC), Field Programmable Gate Array (FPGA), Digital Signal Processor (DSP), or other integrated form. However, those skilled in the art will appreciate that some aspects of the embodiments of the present disclosure may include one or more computer programs running on one or more computers (eg, one or more programs running on one or more computer systems), one running on one or more processors. Software, and / or firmware that may be implemented in integrated circuits, in whole or in part, as one or more programs (eg, one or more programs running on one or more microprocessors), firmware, or substantially any combination thereof It will be appreciated that the writing of code for and / or the design of circuitry is within the skill of one of ordinary skill in the art in light of this disclosure. Moreover, those skilled in the art will understand that the mechanisms of the subject matter of the present disclosure may be distributed in various forms of program products, and examples of the subject matter of the present disclosure are specific types of signal bearing media used to actually perform the distribution. It will be understood that it is applied regardless of.
특정 예시적 기법이 다양한 방법 및 시스템을 이용하여 여기에서 기술되고 도시되었으나, 청구된 대상에서 벗어나지 않고, 다양한 기타의 수정이 이루어질 수 있고, 등가물이 대체될 수 있음이 당업자에 의해 이해되어야 한다. 추가적으로, 여기에 기술된 중심 개념으로부터 벗어남이 없이 특정 상황을 청구된 대상의 교시로 적응시키도록 많은 수정이 이루어질 수 있다. 따라서, 청구된 대상이 개시된 특정 예시로 제한되지 않으나, 그러한 청구된 대상은 또한 첨부된 청구범위 및 그 균등의 범위 내에 들어가는 모든 구현예를 포함할 수 있음이 의도된다.While certain example techniques have been described and illustrated herein using various methods and systems, it should be understood by those skilled in the art that various other modifications may be made and equivalents may be substituted without departing from the claimed subject matter. In addition, many modifications may be made to adapt a particular situation to the teachings of the claimed subject matter without departing from the central concept described herein. Thus, while the claimed subject matter is not limited to the specific examples disclosed, it is intended that such claimed subject matter may also include all embodiments falling within the scope of the appended claims and their equivalents.

Claims (18)

  1. 제1 사용자의 컴퓨팅 장치의 제어 하에서 수행되는 인스턴트 메시지 서비스 제공 방법으로서,An instant message service providing method performed under the control of a computing device of a first user,
    제2 사용자의 컴퓨팅 장치에 의해 전송된 음성 메시지를 포함하는 하나 이상의 음성 메시지, 상기 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지 및 상기 제2 사용자의 캐릭터에 대한 정보를 수신하는 단계;Receiving at least one voice message comprising a voice message sent by the computing device of a second user, at least one voice recognized text message corresponding to each of the at least one voice message, and information about a character of the second user ;
    상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 저장하는 단계;Storing the one or more voice messages and the one or more voice recognized text messages;
    상기 제1 사용자로부터 음성 메시지 재생 요청을 수신하는 단계; 및Receiving a request for playing a voice message from the first user; And
    상기 음성 메시지 재생 요청에 응답하여, 상기 캐릭터 정보에 기초하여 상기 제2 사용자의 캐릭터를 디스플레이 함과 함께, 상기 수신된 하나 이상의 음성 메시지를 순차적으로 재생하는 단계;In response to the voice message reproduction request, displaying the character of the second user based on the character information and sequentially playing the received one or more voice messages;
    를 포함하는 인스턴트 메시지 서비스 제공 방법.Instant message service providing method comprising a.
  2. 제1항에 있어서,The method of claim 1,
    상기 하나 이상의 음성 메시지, 상기 하나 이상의 음성 인식된 텍스트 메시지 및 상기 제2 사용자의 캐릭터에 대한 정보를 수신하는 단계는,Receiving information about the one or more voice messages, the one or more voice recognized text messages and the character of the second user may include:
    상기 하나 이상의 음성 메시지에 대한 알림을 서버로부터 수신하는 단계; 및Receiving a notification from the server for the one or more voice messages; And
    상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 상기 제2 사용자의 컴퓨팅 장치로부터 직접적으로 수신하는 단계Receiving the one or more voice messages and the one or more voice recognized text messages directly from the computing device of the second user.
    를 포함하는 것인, 인스턴트 메시지 서비스 제공 방법.That includes, instant messaging service providing method.
  3. 제1항에 있어서,The method of claim 1,
    상기 하나 이상의 음성 메시지, 상기 하나 이상의 음성 인식된 텍스트 메시지 및 상기 제2 사용자의 캐릭터에 대한 정보를 수신하는 단계는,Receiving information about the one or more voice messages, the one or more voice recognized text messages and the character of the second user may include:
    상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 저장하는 서버로부터 상기 제2 사용자의 컴퓨팅 장치에 의해 전송된 상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 수신하는 단계Receiving the one or more voice messages and the one or more voice recognized text messages sent by the computing device of the second user from a server storing the one or more voice messages and the one or more voice recognized text messages.
    를 포함하는 것인, 인스턴트 메시지 서비스 제공 방법.That includes, instant messaging service providing method.
  4. 제1항에 있어서,The method of claim 1,
    상기 하나 이상의 음성 인식된 텍스트 메시지를 상기 하나 이상의 음성 메시지의 재생에 대응하여, 디스플레이 하는 단계Displaying the one or more voice recognized text messages in response to playing the one or more voice messages.
    를 더 포함하는 것인, 인스턴트 메시지 서비스 제공 방법.It further comprises, instant message service providing method.
  5. 제1항에 있어서,The method of claim 1,
    상기 수신된 하나 이상의 음성 메시지를 순차적으로 재생하는 단계 이전에,Prior to sequentially playing the received one or more voice messages,
    미리 정해진 검열 조건에 기초하여, 상기 하나 이상의 음성 인식된 텍스트 메시지를 필터링하는 단계Filtering the one or more voice recognized text messages based on a predetermined censoring condition
    를 더 포함하고,More,
    상기 수신된 하나 이상의 음성 메시지를 재생하는 단계는 필터링의 결과에 기초하여, 상기 하나 이상의 음성 메시지를 재생하는 단계를 포함하는 것인, 인스턴트 메시지 서비스 제공 방법.Playing the received one or more voice messages comprises playing the one or more voice messages based on a result of the filtering.
  6. 제1항에 있어서,The method of claim 1,
    상기 수신된 하나 이상의 음성 메시지를 순차적으로 재생하는 단계 이후에, After sequentially playing the received one or more voice messages,
    상기 하나 이상의 음성 메시지 중 적어도 일부를, 미리 정해진 조건에 기초하여, 삭제하는 단계Deleting at least a portion of the one or more voice messages based on a predetermined condition
    를 더 포함하는 인스턴트 메시지 서비스 제공 방법.Instant message service providing method further comprising.
  7. 제1항에 있어서,The method of claim 1,
    상기 캐릭터 정보는 상기 제2 사용자의 상기 캐릭터의 종류, 상기 캐릭터의 표정 또는 상기 캐릭터의 동작 중 적어도 하나에 대한 정보를 포함하는 것인, 인스턴트 메시지 서비스 제공 방법.The character information includes information on at least one of the type of the character of the second user, the expression of the character or the operation of the character.
  8. 인스턴트 메시지 서비스 제공 장치로서,An instant message service providing apparatus,
    송신자의 외부 컴퓨팅 장치에 의해 전송된 음성 메시지를 포함하는 하나 이상의 음성 메시지, 상기 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지 및 상기 송신자의 캐릭터에 대한 정보를 수신하도록 구성된 통신 모듈;A communication module configured to receive one or more voice messages including voice messages sent by the sender's external computing device, one or more voice recognized text messages corresponding to each of the one or more voice messages, and information about the character of the sender;
    사용자로부터 인스턴트 메시지 서비스에 대한 입력을 수신하도록 구성된 사용자 인터페이스 모듈;A user interface module configured to receive input for an instant message service from a user;
    음성 재생 모듈;Voice playback module;
    디스플레이 모듈; 및Display module; And
    상기 통신 모듈에 동작 가능하게 결합된 메모리 모듈A memory module operatively coupled to the communication module
    을 포함하고,Including,
    상기 사용자 인터페이스 모듈은 상기 사용자로부터 음성 메시지 재생 요청을 수신하도록 구성되고,The user interface module is configured to receive a voice message playback request from the user,
    상기 음성 재생 모듈은 상기 사용자 인터페이스 모듈에 의해 수신된 상기 음성 메시지 재생 요청에 응답하여, 상기 통신 모듈에 의해 수신된 상기 하나 이상의 음성 메시지를 순차적으로 재생하도록 구성되고,The voice playing module is configured to sequentially play the one or more voice messages received by the communication module in response to the voice message playing request received by the user interface module,
    상기 디스플레이 모듈은 상기 음성 재생 모듈에 의한 상기 하나 이상의 음성 메시지의 재생에 대응하여, 상기 하나 이상의 음성 인식된 텍스트 메시지를 디스플레이 하도록 구성되고, The display module is configured to display the one or more voice recognized text messages in response to the playback of the one or more voice messages by the voice playback module,
    상기 디스플레이 모듈은 상기 음성 재생 모듈에 의한 상기 하나 이상의 음성 메시지의 재생과 함께, 상기 캐릭터 정보에 기초하여, 상기 송신자의 캐릭터를 디스플레이 하도록 더 구성되며,The display module is further configured to display a character of the sender based on the character information, with the reproduction of the one or more voice messages by the voice reproducing module,
    상기 메모리 모듈은 상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 저장하도록 구성되는 것인,The memory module is configured to store the one or more voice messages and the one or more voice recognized text messages,
    인스턴트 메시지 서비스 제공 장치.Device for providing instant message service.
  9. 제8항에 있어서,The method of claim 8,
    상기 통신 모듈은,The communication module,
    상기 하나 이상의 음성 메시지에 대한 알림을 상기 서버로부터 수신하며; 그리고Receive a notification from the server for the one or more voice messages; And
    상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 상기 외부 컴퓨팅 장치로부터 직접적으로 수신하도록 구성되는 것인, 인스턴트 메시지 서비스 제공 장치.And receive the one or more voice messages and the one or more voice recognized text messages directly from the external computing device.
  10. 제8항에 있어서The method of claim 8
    상기 통신 모듈은 상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 저장하는 서버로부터 상기 외부 컴퓨팅 장치에 의해 전송된 상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 수신하도록 구성되는 것인, 인스턴트 메시지 서비스 제공 장치.The communication module is configured to receive the one or more voice messages and the one or more voice recognized text messages sent by the external computing device from a server that stores the one or more voice messages and the one or more voice recognized text messages. And an instant message service providing device.
  11. 제8항에 있어서The method of claim 8
    상기 메모리 모듈은 The memory module
    상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 저장하고,Store the one or more voice messages and the one or more voice recognized text messages,
    상기 하나 이상의 음성 메시지 중 적어도 일부를, 미리 정해진 조건에 기초하여, 삭제하도록 구성되는 것인, 인스턴트 메시지 서비스 제공 장치.And delete at least some of the one or more voice messages based on a predetermined condition.
  12. 제11항에 있어서,The method of claim 11,
    상기 메모리 모듈은 상기 메모리 모듈에 저장된 상기 하나 이상의 음성 메시지의 총 용량이 미리 정해진 값을 초과하는 경우, 가장 오래된 음성 메시지를 삭제하도록 구성되는 것인, 인스턴트 메시지 서비스 제공 장치.And the memory module is configured to delete the oldest voice message when the total capacity of the one or more voice messages stored in the memory module exceeds a predetermined value.
  13. 제8항에 있어서,The method of claim 8,
    미리 정해진 검열 조건에 기초하여, 상기 하나 이상의 음성 인식된 텍스트 메시지를 필터링하도록 구성되는 메시지 필터A message filter configured to filter the one or more voice recognized text messages based on a predetermined censoring condition
    를 더 포함하고,More,
    상기 음성 재생 모듈은 상기 메시지 필터에 의한 필터의 결과에 기초하여, 상기 하나 이상의 음성 메시지를 재생하도록 구성되는 것인, 인스턴트 메시지 서비스 제공 장치.And the voice playback module is configured to play the one or more voice messages based on a result of the filter by the message filter.
  14. 제8항에 있어서,The method of claim 8,
    상기 캐릭터 정보는 상기 송신자의 상기 캐릭터의 종류, 상기 캐릭터의 표정 또는 상기 캐릭터의 동작 중 적어도 하나에 대한 정보를 포함하는 것인, 인스턴트 메시지 서비스 제공 장치.And the character information includes information on at least one of a type of the character of the sender, an expression of the character, or an operation of the character.
  15. 제8에 있어서,According to claim 8,
    상기 사용자 인터페이스 모듈은 상기 사용자로부터 입력 음성 메시지를 수신하도록 구성되고, The user interface module is configured to receive an input voice message from the user,
    상기 인스턴트 메시지 서비스 제공 장치는The instant message service providing apparatus
    상기 입력 음성 메시지에 음성 인식을 수행하여 음성 인식된 입력 텍스트 메시지를 획득하도록 구성된 음성 인식 모듈A voice recognition module configured to perform voice recognition on the input voice message to obtain a voice recognized input text message
    을 더 포함하는 인스턴트 메시지 서비스 제공 장치.Instant message service providing device further comprising.
  16. 제15항에 있어서,The method of claim 15,
    상기 음성 인식 모듈에 의해 획득된 상기 음성 인식된 입력 텍스트 메시지로부터, 상기 디스플레이 모듈에 의해 디스플레이되는 상기 사용자의 캐릭터의 동작을 선택 가능하도록 하는 동작 문자를 검출하도록 구성된 문자 인식 모듈A character recognition module configured to detect a motion character from the speech recognized input text message obtained by the speech recognition module to enable selection of an action of the character of the user displayed by the display module
    을 더 포함하는 인스턴트 메시지 서비스 제공 장치.Instant message service providing device further comprising.
  17. 제15항에 있어서,The method of claim 15,
    상기 사용자의 얼굴 정보를 획득하도록 구성된 카메라 모듈; 및A camera module configured to obtain face information of the user; And
    상기 카메라 모듈에 의하여 획득된 상기 얼굴 정보에 기초하여, 상기 사용자의 캐릭터의 표정을 결정하도록 구성된 표정 결정 모듈An expression determining module configured to determine an expression of a character of the user based on the face information obtained by the camera module.
    을 더 포함하는 인스턴트 메시지 서비스 제공 장치.Instant message service providing device further comprising.
  18. 인스턴트 메시지 서비스를 제공하기 위한 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 저장 매체로서, 상기 컴퓨터 프로그램은 실행되면, 제1 사용자의 컴퓨팅 장치로 하여금,A computer readable storage medium having stored thereon a computer program for providing an instant message service, wherein the computer program, when executed, causes the first user's computing device to:
    제2 사용자의 컴퓨팅 장치에 의해 전송된 음성 메시지를 포함하는 하나 이상의 음성 메시지, 상기 하나 이상의 음성 메시지에 각각 대응하는 하나 이상의 음성 인식된 텍스트 메시지 및 상기 제2 사용자의 캐럭터에 대한 정보를 수신하는 동작;Receiving at least one voice message comprising a voice message sent by a computing device of a second user, at least one voice recognized text message corresponding to each of the at least one voice message, and information about the character of the second user ;
    상기 하나 이상의 음성 메시지 및 상기 하나 이상의 음성 인식된 텍스트 메시지를 저장하는 동작;Storing the one or more voice messages and the one or more voice recognized text messages;
    상기 제1 사용자로부터 음성 메시지 재생 요청을 수신하는 동작;Receiving a voice message playing request from the first user;
    상기 음성 메시지 재생 요청에 응답하여, 상기 캐릭터 정보에 기초하여 상기 제2 사용자의 캐릭터를 디스플레이 함과 함께, 상기 수신된 하나 이상의 음성 메시지를 순차적으로 재생하는 동작; 및In response to the voice message reproduction request, displaying the character of the second user based on the character information and sequentially playing the received one or more voice messages; And
    상기 하나 이상의 음성 인식된 텍스트 메시지를 상기 하나 이상의 음성 메시지의 재생에 대응하여, 디스플레이 하는 동작 Displaying the one or more voice recognized text messages in response to playing the one or more voice messages.
    을 포함하는 동작들을 실행가능 하도록 하는 하나 이상의 컴퓨터 실행가능 명령어를 포함하는 것인, 컴퓨터 판독가능 저장 매체.And one or more computer executable instructions for making the operations executable.
PCT/KR2018/010172 2018-08-27 2018-08-31 Device, method and computer-readable recording medium for providing asynchronous instant messaging service WO2020045712A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180100210A KR20200023814A (en) 2018-08-27 2018-08-27 Device, method and computer readable storage medium to provide asynchronous instant message service
KR10-2018-0100210 2018-08-27

Publications (1)

Publication Number Publication Date
WO2020045712A1 true WO2020045712A1 (en) 2020-03-05

Family

ID=69645007

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/010172 WO2020045712A1 (en) 2018-08-27 2018-08-31 Device, method and computer-readable recording medium for providing asynchronous instant messaging service

Country Status (2)

Country Link
KR (1) KR20200023814A (en)
WO (1) WO2020045712A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102368300B1 (en) * 2020-09-08 2022-03-02 박일호 System for expressing act and emotion of character based on sound and facial expression
CN117014397A (en) * 2022-09-02 2023-11-07 腾讯科技(深圳)有限公司 Interaction method and device based on voice message, computer equipment and storage medium

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010035529A (en) * 2001-02-27 2001-05-07 이병관 Voice Character Messaging Service System and The Method Thereof
JP2010507353A (en) * 2006-10-18 2010-03-04 ソニー オンライン エンタテインメント エルエルシー System and method for coordinating overlapping media messages
KR20100129122A (en) * 2009-05-28 2010-12-08 삼성전자주식회사 Animation system for reproducing text base data by animation
KR20120107293A (en) * 2011-03-21 2012-10-02 김주연 System and method for transferring message
KR20140107736A (en) * 2013-02-26 2014-09-05 에스케이플래닛 주식회사 Method for providing of voice message, apparatus and system for the same

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010035529A (en) * 2001-02-27 2001-05-07 이병관 Voice Character Messaging Service System and The Method Thereof
JP2010507353A (en) * 2006-10-18 2010-03-04 ソニー オンライン エンタテインメント エルエルシー System and method for coordinating overlapping media messages
KR20100129122A (en) * 2009-05-28 2010-12-08 삼성전자주식회사 Animation system for reproducing text base data by animation
KR20120107293A (en) * 2011-03-21 2012-10-02 김주연 System and method for transferring message
KR20140107736A (en) * 2013-02-26 2014-09-05 에스케이플래닛 주식회사 Method for providing of voice message, apparatus and system for the same

Also Published As

Publication number Publication date
KR20200023814A (en) 2020-03-06

Similar Documents

Publication Publication Date Title
US11405678B2 (en) Live streaming interactive method, apparatus, electronic device, server and storage medium
CN109921976B (en) Group-based communication control method, device and storage medium
JP6910300B2 (en) A method for displaying chat history records and a device for displaying chat history records
US11061641B2 (en) Screen sharing system, and information processing apparatus
WO2016129811A1 (en) Method and system for providing rich menu in instant messaging service and recording medium
WO2015133777A1 (en) Method and device for providing social network service
CN107317689B (en) Message processing method, electronic equipment and computer storage medium
WO2020045712A1 (en) Device, method and computer-readable recording medium for providing asynchronous instant messaging service
JP2023516449A (en) Information processing method, device and storage medium
CN110989889A (en) Information display method, information display device and electronic equipment
WO2018182223A1 (en) Systems and methods for notification delivery
CN112328094A (en) Information input method, cloud input method system and client
WO2014058153A1 (en) Address book information service system, and method and device for address book information service therein
WO2018182063A1 (en) Video call providing device, method, and computer program
WO2019221385A1 (en) Method for operating messaging application
WO2015102125A1 (en) Text message conversation system and method
WO2019031621A1 (en) Method and system for recognizing emotion during telephone call and utilizing recognized emotion
WO2022092439A1 (en) Speech image provision method, and computing device for performing same
WO2015183043A1 (en) Method, device, and server for grouping chat messages
WO2014171613A1 (en) Method for providing messaging service, record medium recorded with program for same, and terminal therefor
WO2015037871A1 (en) System, server and terminal for providing voice playback service using text recognition
WO2012057561A2 (en) System and method for providing an instant messenger service, and communication terminal and communication method therefor
WO2020067597A1 (en) Device, method and computer-readable recording medium for providing asynchronous instant messaging service
CN113542257B (en) Video processing method, video processing device, electronic apparatus, and storage medium
CN112968826B (en) Voice interaction method and device and electronic equipment

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18932160

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18932160

Country of ref document: EP

Kind code of ref document: A1