WO2020067597A1 - Device, method and computer-readable recording medium for providing asynchronous instant messaging service - Google Patents

Device, method and computer-readable recording medium for providing asynchronous instant messaging service Download PDF

Info

Publication number
WO2020067597A1
WO2020067597A1 PCT/KR2018/011769 KR2018011769W WO2020067597A1 WO 2020067597 A1 WO2020067597 A1 WO 2020067597A1 KR 2018011769 W KR2018011769 W KR 2018011769W WO 2020067597 A1 WO2020067597 A1 WO 2020067597A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
voice
message
text
transmitting terminal
Prior art date
Application number
PCT/KR2018/011769
Other languages
French (fr)
Korean (ko)
Inventor
장준수
윤용기
장재웅
김세미
신희욱
김영상
임중신
정정화
Original Assignee
주식회사 닫닫닫
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 닫닫닫 filed Critical 주식회사 닫닫닫
Publication of WO2020067597A1 publication Critical patent/WO2020067597A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/50Business processes related to the communications industry
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services

Definitions

  • This disclosure relates to apparatus, methods, and computer readable storage media for providing asynchronous instant message services.
  • the voice message is simpler to input than the text message, and can deliver various features that the user who input the voice message wants to deliver.
  • the data size of the voice message is generally larger than that of the text message, and the user needs to perform an operation (eg, click, touch, etc.) of each voice message and listen to the voice message being played.
  • the voice message may have a temporal constraint or a spatial constraint such as a memory space or a physical space, compared to a text message that can be quickly identified with an eye.
  • prior art document 1 extracts information on various emotions from a voice message and generates a text message using the information, but only a part of information that a user intends to transmit through a voice message can be obtained. The rest of the information can be lost.
  • the present disclosure is intended to solve the above problems, and provides an apparatus, method, and computer readable storage medium that are convenient for reproducing a voice message in an instant message service and are efficient in data management.
  • the present disclosure proposes an apparatus, method, and computer-readable storage medium capable of providing an improved instant message service using a character in an instant message service.
  • An exemplary method may include receiving a voice message from a user of a transmitting terminal, generating text data, combining voice data and text data to generate a data packet, and transmitting the generated data packet.
  • generating the text data may include generating text data corresponding to the voice message based on the voice data.
  • generating the text data may include receiving text corresponding to a voice message from a user and generating text data.
  • transmitting the data packet may include transmitting the data packet to an integrated server.
  • the method may further include generating a notification message regarding the data packet.
  • the method may include transmitting a notification message to a relay server and transmitting a data packet to at least one receiving terminal.
  • An exemplary transmission terminal may include a voice input module, a voice data generation module, a text data generation module, a data packet generation module, and a communication module.
  • the voice input module may be configured to receive a voice message from a user of the transmitting terminal.
  • the voice data generation module may be configured to generate corresponding voice data from voice messages received by the voice input module.
  • the text data generation module may be configured to generate text data corresponding to a voice message.
  • the data packet generation module may be configured to combine voice data and text data to generate a data packet.
  • the text data generation module may include a voice recognition module configured to perform voice recognition on voice data from the voice data generation module and a text input module configured to receive text corresponding to a voice message from a user.
  • the text data generation module may be configured to generate text data using at least one of a speech recognition module and a text input module.
  • the transmitting terminal may further include a character module.
  • the character module may be configured to acquire information about a character displayable on a transmitting terminal and at least one receiving terminal and generate character data from the information on the character.
  • a computer readable storage medium in which computer programs for executing an instant message service application to generate and send messages are stored.
  • One exemplary computer-readable storage medium includes a computer program, when a computer program is executed, receiving a voice message from a user of the computing device, generating corresponding voice data from the input voice message, and voice data. On the basis, the operation of generating text data corresponding to the voice message, combining the voice data with the text data to generate a data packet, and transmitting the data packet to an integrated server providing an instant message service. It may include one or more computer-executable instructions to make operations executable.
  • a method performed on a receiving terminal that executes an instant message service application to receive a message is described.
  • the receiving terminal may be capable of data communication through an network with an integrated server providing an instant message service, the method comprising: receiving a data packet transmitted by the transmitting terminal from the integrated server; Obtaining voice data from the data packet; Generating text data corresponding to a voice message based on the voice data; Reproducing a voice message corresponding to the voice data based on the voice data; And based on the text data, displaying a text message corresponding to the text data in response to reproduction of the voice message.
  • a method in another example, includes receiving a data packet from an integrated server; Obtaining text data from the data packet; Determining that speech data corresponding to the text data cannot be obtained; Generating voice data corresponding to the text data based on the text data; The method may include reproducing a voice message corresponding to the voice data based on the voice data, and displaying a text message corresponding to the text data corresponding to the reproduction of the voice message based on the text data.
  • the receiving terminal may be connected to a data communication via a network and a relay service providing an instant message service, and may also be connected to enable direct communication with a transmitting terminal executing an instant message service application.
  • the method may include receiving a notification message for the data packet transmitted by the transmitting terminal from the relay server and receiving the data packet from the transmitting terminal in response to the notification message.
  • a receiving terminal for executing an instant message service application and receiving an instant message.
  • the receiving terminal may include a communication module, a data acquisition module, a data supplementation module, and an output module.
  • the communication module may be configured to receive a data packet transmitted by the transmitting terminal from the server or the transmitting terminal.
  • the data acquisition module may be configured to acquire at least one of voice data or text data from a data packet.
  • the data supplement module may include a speech recognition module and a speech generation module. If the data acquisition module is unable to acquire voice data from the data packet and acquire text data corresponding to the voice data, the data supplement module may cause the voice recognition module to generate text data corresponding to the voice data.
  • the data supplement module may cause the speech generation module to generate speech data corresponding to the text data.
  • the output module is configured to display a text message corresponding to the text data in response to the reproduction of the voice message, based on the text data, and a playback module configured to play the voice message corresponding to the voice data, It can include modules.
  • a computer readable storage medium in which a computer program for executing an instant message service application to receive a message is stored includes, when a computer program is executed, causing a computing device to receive a data packet transmitted by a transmitting terminal from a server or a transmitting terminal; Obtaining text data from the data packet; Determining that speech data corresponding to text data cannot be obtained from the data packet; Generating voice data corresponding to the text data based on the text data; Reproducing a voice message corresponding to the voice data based on the voice data; And based on the text data, one or more computer-executable instructions to make the actions executable, including displaying a text message corresponding to the text data in response to the reproduction of the voice message.
  • FIG. 1 is an exemplary environment diagram illustrating an environment in which an instant message service is provided according to at least some embodiments of the present disclosure
  • FIG. 2 is a block diagram schematically illustrating a transmitting terminal according to at least some embodiments of the present disclosure
  • FIG. 3 is a flow diagram illustrating an exemplary process performed at a transmitting terminal, according to at least some embodiments of the present disclosure
  • FIG. 4 is a block diagram schematically illustrating a receiving terminal according to at least some embodiments of the present disclosure
  • 5-7 are flow diagrams illustrating exemplary processes performed at a receiving terminal, according to at least some embodiments of the present disclosure
  • FIG. 9 shows an example in which a message is displayed and played on a user's terminal when using the instant message service according to FIG. 8;
  • FIG. 10 illustrates an exemplary computer program product that can be used to provide instant message service in accordance with at least some embodiments of the present disclosure
  • 11 is a block diagram schematically illustrating an instant message service providing server according to at least some embodiments of the present disclosure.
  • This disclosure relates generally to apparatus, methods and computer readable storage media for providing instant messaging services.
  • instant message service may refer to a service in which a message received by a recipient is displayed and / or played when the sender sends a message such as a text message, a voice message, an image, or the like to one or more recipients.
  • character refers to an object represented by a computer graphic and having a face, and may be expressed in various forms, such as a person, an animal, a virtual animal, a robot, etc., and according to the present disclosure, a character is instant It is an object displayed on the message service, and is operated by control of a user device, such as a transmitting terminal or a receiving terminal, as described below, so that the animation of the character can be displayed on the user device.
  • module may refer to a device, a server, a program unit, or a suitable combination thereof.
  • character module as will be described below, as well as hardware such as a camera for obtaining information about a character to be displayed on a user's device, as well as devices, servers, programs for processing data acquired by such a camera. Units or any suitable combination thereof.
  • the exemplary environment 100 is a network environment 110, one or more transmitting terminals (120-1, 120-2, 120-3, 120-4, ...; hereinafter referred to as 120) and one or more receiving terminals (130-1, 130-2, 130-3, ...; hereinafter collectively referred to as 130).
  • 120 is referred to as a transmitting terminal and 130 is called a receiving terminal, the transmitting terminal and the receiving terminal may also perform reception and transmission, respectively.
  • the network environment 110 represents various environments for connecting the transmitting terminal 120 and the receiving terminal 130 by wired or wireless communication.
  • the network environment 110 may include a server 115 for providing instant message service.
  • the transmitting terminal 120 may transmit an instant message to the user device 130 through the server 115 providing an instant message service or receive an instant message from the user device 130.
  • the server 115 may be an integrated server that provides an instant message service, receives the instant message from the transmitting terminal 120, stores it, and transmits it to the receiving terminal 130.
  • the transmitting terminal 120 may transmit a notification message for an instant message to the receiving terminal 130 through the server 115, and the receiving terminal 130 receives the notification message from the server 115 and , In response to the received notification message, an instant message may be directly received from the transmitting terminal 120.
  • the server 115 provides an instant message service and can act as a relay server, such as a relay server. After the receiving terminal 130 receives the notification message from the server 115, the receiving terminal 130 connects to the transmitting terminal 120 directly, for example, using a peer-to-peer technique. You can receive the message.
  • the network environment 110 may further include a communication environment such as a wired environment, a wireless environment, a base station, and the like between the transmitting terminal 120 and the receiving terminal 130.
  • the server 115 stores the instant message transmitted by the transmitting terminal 120, and then, when the receiving terminal 130 is connected to the server 115, receives the instant message received from the transmitting terminal 120. Can be configured to transmit.
  • the server 115 may support establishing a peer-to-peer connection between user devices 120 and 130 in the network environment 110.
  • the transmitting terminal 120 and the receiving terminal 130 are devices that can communicate with each other, such as a smart phone, a tablet computer, a desktop computer, a laptop computer, a mobile phone, a personal digital assistant (PDA), a specific purpose device, or one of the above functions And a small form factor portable (mobile) electronic device such as a fusion device including any.
  • the transmitting terminal 120 and the receiving terminal 1300 may perform one-to-one or many-to-many instant message communication as well as one-to-one instant message communication, and the server 115 may perform such instant message. Can provide services.
  • a user (first user) of the transmitting terminal 120 may use the transmitting terminal 120 to input an instant message to be transmitted to a user (the second user) of the receiving terminal 130.
  • the instant message can be a voice message or a text message.
  • the transmitting terminal 120 may receive a text message from a first user, generate a data packet, and transmit it to the receiving terminal 130.
  • the instant message is a voice message
  • the transmitting terminal 120 may receive a voice message from a first user. In some examples, the transmitting terminal 120 may receive a voice message from a first user for a predetermined time. The transmitting terminal 120 may generate corresponding voice data from the input voice message.
  • the transmitting terminal 120 may acquire text data corresponding to the voice message.
  • the transmitting terminal 120 may generate text data corresponding to a voice message based on the voice data.
  • a speech recognition technique well known in the art according to the present disclosure may be used to generate the text data.
  • the transmitting terminal 120 may receive text corresponding to a voice message from the first user, and generate text data based on the input text.
  • the transmitting terminal 120 may receive a plurality of voice messages and generate a plurality of voice data from the plurality of voice messages.
  • the transmitting terminal 120 may generate text data corresponding to a plurality of voice messages based on the plurality of voice data or receive input from a user.
  • the transmitting terminal 120 may generate a data packet by combining voice data and text data corresponding to the voice message. In some examples, the transmitting terminal 120 may generate integrated message data by matching voice data with corresponding text data, and may generate a data packet by encoding the integrated message data. In some examples of receiving a plurality of voice messages at the request of the first user, the transmitting terminal 120 associates each voice data with text data, and combines the pair of the voice data and text data to be combined, thereby providing integrated message data. Can generate
  • the server 115 may be an integrated server, and the transmitting terminal 120 may transmit the generated data packet to the server 115.
  • the server 115 may be a relay server, the transmitting terminal 120 may generate a notification message regarding the generated data packet, and transmit the generated notification message to the relay server 115 have. In this embodiment, the transmitting terminal 120 may then directly transmit data packets by connecting to at least one receiving terminal.
  • the first character for the first user and the second character for the second user can be displayed on the sender device 120 and / or the recipient device 13. .
  • the sender device 120 may also transmit character data for the first character.
  • the character data may include information on at least one of the type of the first character, the expression of the first character, or the operation of the first character.
  • the character data may include connection information with a voice message or text message.
  • the sender device 120 may further combine character data in addition to voice data and text data in generating a data packet.
  • the server 115 may include data from the data packet received from the transmitting terminal 120 ( For example, voice data, text data, character data, etc.) may be stored.
  • the server 115 may store the voice message in correspondence with the voice-recognized text message.
  • the server 115 receives the notification message from the transmitting terminal 120 and transmits the notification message to the receiving terminal 130.
  • the receiving terminal 130 may receive a notification message for the instant message received from the transmitting terminal 120 from the server 115.
  • the receiving terminal 130 can access the server 115. In some embodiments, the receiving terminal 130 may receive a data packet transmitted by the transmitting terminal 120 from the server 115. In some other embodiments, the receiving terminal 130 may receive a notification message for the data packet transmitted by the transmitting terminal 120 from the server 115. The receiving terminal 130 may connect to the transmitting terminal 120 in response to the received notification message, and receive a data packet from the transmitting terminal 120. In this embodiment, the notification message received from the server 115 may include an indication of one or more voice messages to the transmitting terminal 130 including the voice message received from the transmitting terminal 120.
  • the receiving terminal 130 may acquire at least one of voice data or text data from the received data packet.
  • the transmitting terminal 120 may receive and receive a voice message, as described above, and transmit a data packet including voice data from the voice message and text data corresponding to the voice message to the receiving terminal 130 Can transmit.
  • the receiving terminal 130 may receive a data packet and obtain voice data and text data corresponding to a voice message from the received data packet.
  • the receiving terminal 130 may acquire voice data from the received data packet.
  • the transmitting terminal 120 may receive a voice message, and may transmit a data packet including only the voice message toward the receiving terminal 130.
  • the receiving terminal 130 may receive such a data packet, acquire voice data from the data packet, and may not acquire text data.
  • the receiving terminal 130 may generate text data corresponding to a voice message based on the obtained voice data.
  • a well-known speech recognition technique can be used to generate text data.
  • the receiving terminal 130 may determine that it is not possible to obtain text data corresponding to a voice message from the received data packet, and in response to this determination, text data corresponding to the voice message based on the voice data Can generate
  • the receiving terminal 130 may acquire text data from the received data packet.
  • the transmitting terminal 120 may receive text from the first user, and may transmit a data packet including only the text toward the receiving terminal 130.
  • the transmitting terminal 120 may receive a voice message from a first user, generate voice data from the voice message, and use the voice recognition technique or text corresponding to the voice message generated by the user input
  • a data packet combining data with voice data may be transmitted toward the receiving terminal 130, and voice data may be lost for various reasons, such as a transmission environment, an abnormal operation of a transmitting / receiving terminal, and the like.
  • the receiving terminal 130 may acquire text data from the received data packet, and generate voice data corresponding to the text data based on the obtained text data.
  • the receiving terminal 130 may determine that the voice data corresponding to the text data cannot be obtained from the data packet, and in response to the determination, the voice data based on the text data may be generated.
  • the receiving terminal 130 may store the generated or acquired voice data and text data inside the receiving terminal 130. In some examples, the receiving terminal 130 may store the received voice data and text data in association.
  • the receiving terminal 130 may play a voice message corresponding to the voice data based on the voice data. Also, the reception terminal 130 may display a text message corresponding to the text data, along with the reproduction of the voice message, based on the text data. In some examples, the receiving terminal 130 may receive a voice message play request for playing one or more voice messages from a user (second user). The receiving terminal 130 may sequentially play one or more voice messages based on one or more voice data in response to the voice message reproduction request. As such, the voice message can be reproduced asynchronously with the reception of the voice message. Additionally, the playback of the voice message may be paused, stopped, or controlled to play the previous voice message or the next voice message at the user's request. The receiving terminal 130 may display a corresponding text message in response to the reproduction of the voice message.
  • the receiving terminal 130 may filter the text message corresponding to the text data based on a predetermined censorship condition.
  • the predetermined censorship conditions may include profanity, profanity, and the like, but are not limited thereto.
  • the receiving terminal 130 may play a corresponding unfiltered voice message based on the filtering result. For example, when a slang is included in the voice-recognized text message, the receiving terminal 130 may mute at least a part of the voice message corresponding to the text message.
  • the filtering process is not limited to what the receiving terminal 130 performs, and in some embodiments, the filtering process may be performed before the server 115 or the transmitting terminal 120 transmits a data packet.
  • the receiving terminal 130 may delete one or more voice data based on a predetermined condition, while leaving the corresponding one or more text data. In some examples, the receiving terminal 130 may When playback of the message ends, the corresponding voice data can be deleted. In some other examples, the receiving terminal 130 may delete old voice data based on a predetermined storage capacity condition.
  • the receiving terminal 130 may obtain character data from the data packet. In some examples, the receiving terminal 130 may obtain character data for the first character for the first user. The reception terminal 130 may display the character together with the display of the text message and the reproduction of the voice message, based on the character data.
  • the transmitting terminal 200 includes a voice input module 210, a voice data generation module 220, a text data generation module 230, a data packet generation module 250 and a communication module 260. It may include. Additionally, the transmitting terminal 200 may further include a character module 240 and a notification generating module 270.
  • the voice input module 210, the text input module 232, the camera 242, and the motion input module 244 are examples of a user interface (UI) for receiving input from a user.
  • UI user interface
  • the components included in the transmitting terminal 200 may be individually implemented, or two or more of the components may be combined to form a single component.
  • the transmitting terminal 200 is configured to execute an instant message service application, and can generate and transmit an instant message.
  • the transmitting terminal 200 may be various computing devices, for example, a smart phone, a tablet computer, a desktop computer, a laptop computer, a mobile phone, a personal digital assistant (PDA), a specific purpose device, or a fusion including any of the above functions Small form factor portable (mobile) electronic devices such as devices.
  • the voice input module 210 may be configured to receive a voice message from a user of the transmitting terminal 200.
  • the voice input module 210 may include an element capable of receiving a user's voice message, for example, a microphone.
  • the voice input module 210 may receive a voice message from a user for a predetermined time.
  • the voice input module 210 may sequentially receive one or more voice messages according to a user's request.
  • the voice data generation module 220 may be configured to generate corresponding voice data from voice messages input by a user.
  • the text data generation module 230 may be configured to generate text data.
  • the text data generation module 230 may include a text input module 232 and a speech recognition module 234.
  • the speech recognition module 234 may receive speech data from the speech data generation module 220, and may perform speech recognition using the speech data, and the text data generation module 230 may recognize speech Based on the results of the, it is possible to generate text data corresponding to the voice message.
  • the transmitting terminal 200 may request a user to input text corresponding to a voice message, and the text input module 232 receives text corresponding to a voice message from the user, and the text data generation module ( 230) may generate text data from the input text.
  • the data packet generation module 250 may be configured to combine the voice data generated by the voice data generation module 220 and the text data generated by the text data generation module 230 to generate a data packet.
  • the data packet generation module 250 may generate voice message data and corresponding text data to generate integrated message data, and encode the integrated message data to generate a data packet for transmission.
  • the voice input module 210 receives a plurality of voice messages sequentially in response to a user's request
  • the text data generation module 230 may generate text data corresponding to each of the plurality of voice messages
  • the data packet generation module 250 may correspond to each voice data and text data, and combine the paired voice data and text data to generate integrated message data.
  • the communication module 260 may be capable of data communication via an integrated server providing an instant message service through a network. In this embodiment, the communication module 260 may transmit the data packet generated by the data packet generation module 250 to the integrated server.
  • the communication module 260 may be communicatively connected to a relay server providing an instant message service through a network.
  • the notification generation module 270 may be configured to generate a notification message regarding the data packet generated by the data packet generation module 250.
  • the notification message can include an indication of the voice message and / or text message.
  • the communication module 260 may be configured to transmit the notification message generated by the notification generation module 270 to the relay server. Thereafter, the communication module 260 may be connected to enable direct communication with at least one receiving terminal executing the instant message service application, and may directly transmit data packets.
  • the sender or recipient's character may be displayed on the transmitting terminal 200 while the instant message service is provided on the transmitting terminal 200, and the transmitting terminal 200 further includes a character module 240 can do.
  • the character module 240 may be configured to acquire information about a character and generate character data from the information about the acquired character.
  • the data packet generation module combines voice data from the voice data generation module 220, text data from the text data generation module 230, and character data from the character module 240 to generate a data packet. It can be configured to generate.
  • the character data may include information on at least one of the type of the user's character, the expression of the character, or the behavior of the character.
  • the character module 240 may include a camera 242, a motion input module 244, and a text recognition module 246.
  • the camera 242 may acquire face information of the user, and the character module 240 may determine the facial expression of the character based on the face information obtained by the camera 242.
  • the voice input module 210 receives a voice message from the user
  • the camera 242 acquires the user's face information and the character module 240 can determine the facial expression of the character based on the face information .
  • the motion input module 244 may receive input of a character's motion from a user. For example, the user may select at least one action from a list of actions of the character presented to the user.
  • the text recognition module 246 may recognize a character associated with an action of the character, based on the text data generated by the text data generation module 230. In some examples, the character module 240 may determine the behavior of the character based on the recognized character. In some other examples, the text recognition module 246 may associate the recognized character with the motion of the character, and the motion input module 244 may allow the user to input a selection for the recognized character, from the user, the character module ( 240) can determine the behavior of the character.
  • the user may determine the transmission of the instant message after confirming the text message, the facial expression, the action, and the like displayed on the transmitting terminal 200.
  • FIG. 3 is a flow diagram illustrating an exemplary process 300 performed in a transmitting terminal, in accordance with at least some embodiments of the present disclosure.
  • the process 300 may be performed under the control of a computing device, such as the transmitting terminal 120 of FIG. 1 and the transmitting terminal 200 of FIG. 2.
  • the process 300 shown in FIG. 2 can include one or more actions, functions, or actions as illustrated by blocks 310, 320, 330, 340, 350, 360 and / or 370.
  • the various blocks are not intended to be limited to the described embodiment.
  • those skilled in the art will appreciate that for the processes disclosed herein, the functions performed in the processes and methods may be implemented in different orders.
  • the schematic operations illustrated in FIG. 3 are provided by way of example only, and some of the operations may be optional, combined with fewer operations, or extended to additional operations without departing from the essence of the disclosed embodiment. You can.
  • the process 300 can begin at block 310 receiving a voice message.
  • the computing device may receive a voice message from a user.
  • the computing device may receive a voice message from a user for a predetermined time.
  • the computing device may sequentially receive one or more voice messages at the user's request.
  • Process 300 may continue to block 320 for generating voice data at block 310, and the computing device may be configured to generate the corresponding voice data from the voice message input by the user.
  • the process 300 can continue at block 320 to block 330 to determine if there is text input corresponding to the voice message.
  • the computing device may determine whether there is text input corresponding to the voice message. For example, the user may enter a voice message, and may enter a request to enter text corresponding to the voice message, and if there is no such request, the computing device determines that the text corresponding to the voice message is not input by the user. Can decide. If the text corresponding to the voice message is not input by the user, the process 300 may continue to block 340 for generating text data based on the voice data. In block 340, the computing device may perform speech recognition using speech data. The computing device may generate text data corresponding to the voice message based on the result of the voice recognition. Process 300 can continue from block 340 to block 360 that generates a data packet.
  • the process 300 may continue to block 350 for receiving text from block 330 and generating text data.
  • the computing device may receive text corresponding to a voice message from the user.
  • the user can input text using various input devices such as a touch pad, a keyboard, a mouse, and the like.
  • the computing device may generate text data from text input by the user.
  • Process 300 can continue from block 350 to block 360 that generates a data packet.
  • the computing device may generate a data packet by combining the voice data generated in block 320 and the text data generated in block 340 or 350.
  • the computing device may generate voice message data and corresponding text data to generate integrated message data, and encode the integrated message data to generate a data packet for transmission.
  • the computing device in response to a user's request, if a plurality of voice messages are sequentially input, in block 360, the computing device may generate text data corresponding to each of the plurality of voice messages. The voice data and the text data can be matched, and a pair of the corresponding voice data and text data can be combined to generate integrated message data.
  • the computing device may obtain information about the user's character before performing block 360 and generate character data from the information about the obtained character, where the character is displayable on the computing device .
  • the computing device may receive information about a character, such as a character's facial expression, motion, or the like.
  • the computing device may obtain information about the character using a device, such as a camera.
  • the computing device may, at block 360, further combine character data, in addition to voice data and text data, to generate a data packet.
  • Process 300 may continue at block 360 to block 370 that transmits the data packet.
  • the computing device may receive a user's confirmation of text message, character expression, action, etc., to be transmitted before performing block 370.
  • the computing device may transmit the generated data packet to at least one receiving terminal.
  • the computing device may be capable of data communication via a network with an integrated server that provides instant messaging services.
  • the integrated server may receive, store, and at least transmit voice data and text data from the computing device to the recipient terminal, as described in more detail with respect to FIG. 11.
  • the computing device may be communicatively connected to a relay server providing an instant message service through a network, and the computing device may be communicatively connected to at least one receiving terminal.
  • the computing device can generate a notification message about the data packet.
  • the computing device can send the notification message to the relay server. Thereafter, when at least one receiving terminal is connected to the computing device, the computing device may directly transmit a data packet to the connected at least one receiving terminal.
  • the receiving terminal 400 may include a communication module 410, a data acquisition module 420, a data complementing module 430, an output module 440 and a memory 450.
  • the components included in the receiving terminal 400 may be individually implemented, or may be implemented in a manner that two or more of the components are combined to form one component.
  • the connections between the components shown in FIG. 4 are for convenience of description only, and The connection is not limited to this connection.
  • the memory is shown as having no connection in FIG.
  • the receiving terminal 400 can be a variety of computing devices, for example, a smartphone, a tablet computer, a desktop computer, a laptop computer, a mobile phone, a personal digital assistant (PDA), a specific purpose device, or a fusion comprising any of the above functions Small form factor portable (mobile) electronic devices such as devices.
  • the receiving terminal 400 may be implemented integrally with the transmitting terminal 200 described in FIG. 2, and some components may be implemented in one entity.
  • the communication module 260 illustrated in FIG. 2 and the communication module 410 illustrated in FIG. 4 may be integrally implemented.
  • the receiving terminal 400 is configured to execute the instant message service application, and can receive and output the instant message.
  • the communication module 410 may be configured to receive data packets transmitted by the transmitting terminal from the server or the transmitting terminal. In some embodiments, the communication module 410 may connect to the integrated server and receive data packets transmitted by the transmitting terminal from the integrated server. In some other embodiments, the communication module 410 may connect to the relay server and receive a notification message for the data packet transmitted by the transmitting terminal from the relay server. In this embodiment, the communication module 410 may directly connect to the transmitting terminal in response to the received notification message, for example, using a peer-to-peer connection technique, and receive from the connected transmitting terminal.
  • the data acquisition module 420 may be configured to acquire at least one of voice data or text data from a data packet received by the communication module 410.
  • the communication module 410 may receive data packets transmitted by the transmitting terminal, and the data packets may include voice data for voice messages and text data corresponding to voice messages.
  • the data acquisition module 420 may acquire both voice data and text data corresponding to the voice message from the data packet.
  • the data acquisition module 420 may transmit the acquired voice data and text data to the output module 440.
  • the communication module 410 may receive data packets transmitted by the transmitting terminal, and these data packets may include only voice data, or may include voice data and corrupted text data corresponding to voice messages. have.
  • the data acquisition module 420 may acquire voice data from the data packet, and transmit the voice data to the data supplement module 430.
  • the data acquisition module 420 may determine that the text data corresponding to the voice message cannot be obtained, and in response to the determination, the voice data may be transmitted to the data supplementation module 430.
  • the data supplement module 430 may include a speech recognition module 432 and a speech generation module 434.
  • the voice recognition module 432 When the data supplement module 430 receives the voice data from the data acquisition module 420, the voice recognition module 432 generates text data corresponding to the voice message from the voice data using a well-known voice recognition technique. can do.
  • the output module 440 may receive voice data from the data acquisition module 420 and text data from the data supplement module 432.
  • the communication module 410 may receive a data packet transmitted by the transmitting terminal, and the data packet may include only text data, or text data and corrupted voice data corresponding to the text data. You can.
  • the data acquisition module 420 may acquire text data from the data packet, and transmit the text data to the data supplement module 430.
  • the data acquisition module 420 may determine that speech data corresponding to the text data cannot be acquired, and in response to the determination, the text data may be transmitted to the data supplementation module 430.
  • the speech generation module 434 may generate speech data from the text data using a well-known speech synthesis technique.
  • the output module 440 may include a playback module 442 and a display module 444.
  • the reproduction module 442 may be configured to reproduce a voice message corresponding to the voice data, based on the voice data.
  • the receiving terminal 400 may receive a voice message reproduction request to reproduce a voice message from the user through an appropriate user interface (not shown).
  • the playback module 442 sequentially responds to the voice message playback request, sequentially sequentially one or more voice messages corresponding to the one or more voice data.
  • the sequential playback may be performed according to the user's control, such as playback, pause, pause, playback of the previous voice message, or playback of the next voice message.
  • the display module 444 may be configured to display a text message corresponding to text data in response to the reproduction of the voice message by the playback module 442.
  • the memory 450 may store voice data and text data from the data acquisition module 420 and / or the data supplement module 430. In some examples, voice data and text data corresponding to the voice message may be stored in association. In some embodiments, the memory 450 may delete one or more voice data based on predetermined conditions. In some examples, the memory 450 may delete stored voice data when playback of the voice message ends. In some other examples, the memory 450 may delete old voice data based on predetermined storage capacity conditions. For example, if the total capacity of voice data stored in the memory 450 exceeds a predetermined value, the oldest voice message can be deleted.
  • the output module 440 may filter text messages from text data based on predetermined censorship conditions.
  • the filtering of the output module 440 can use a well-known method.
  • predetermined filtered characters may include profanity, profanity, and the like, but are not limited thereto.
  • the playback module 442 can play back a voice message
  • the display module 444 can display a text message.
  • the output module 440 may change at least a part of the text message to a predetermined character and perform mute processing on at least a part of the voice message.
  • the communication module 410 may receive a data packet transmitted by the transmitting terminal, the data packet including character data including information about a character displayable by the display module 444 can do.
  • the data acquisition module 420 may further acquire character data in addition to voice data and / or text data from the received data packet.
  • the display module 444 may be configured to display the character based on the character data, with the reproduction of the voice message by the reproduction module 442 and the display of the text message by the display module 444.
  • FIG. 5-7 are flow diagrams illustrating exemplary processes 500, 600 and 700 performed at a receiving terminal, according to at least some embodiments of the present disclosure.
  • the processes 500, 600, and 700 may be performed under the control of a computing device, such as the receiving terminal 130 of FIG. 1 and the receiving terminal 400 of FIG.
  • the process 500 of FIG. 5 can include one or more actions, functions, or actions as illustrated by blocks 510, 520, 530 and / or 540.
  • the process 600 of FIG. 6 can include one or more actions, functions, or actions as illustrated by blocks 610, 620, 630, 640, 650 and / or 660.
  • FIG. 7 can include one or more actions, functions, or actions as illustrated by blocks 710, 720, 730, 740, 750, and / or 760.
  • the various blocks are not intended to be limited to the described embodiment.
  • those skilled in the art will appreciate that for the present process disclosed herein, the functions performed in the processes and methods may be implemented in different orders.
  • the block 530 for reproducing a voice message and the block 540 for displaying a text message may be performed sequentially or simultaneously, depending on the implementation.
  • the schematic operations illustrated in FIGS. 5-7 are provided as examples only, and some of the operations may be optional, combined with fewer operations, or additional operations without departing from the essence of the disclosed embodiment. Can be extended to
  • the process 500 shown in FIG. 5 begins at block 510 receiving a data packet.
  • the computing device may be configured to receive data packets transmitted by the transmitting terminal from the server or the transmitting terminal.
  • the computing device can connect to the integrated server and receive data packets sent by the transmitting terminal from the integrated server.
  • the computing device may connect to the relay server, receive a notification message for the data packet transmitted by the transmitting terminal from the relay server, and then connect directly to the transmitting terminal and connect to the transmitting terminal Can receive data packets from.
  • Process 500 may continue at block 510 to block 520 to acquire voice data and text data.
  • the computing device may obtain voice data and text data from the data packet received in block 510.
  • the received data packet may include voice data for a voice message and text data corresponding to the voice message.
  • the computing device may acquire both voice data and text data from the received data packet.
  • the process 500 may continue at block 520 to block 530 to reproduce the voice message and block 540 to display the text message.
  • the received data packet can include character data that includes information about a character displayable on the computing device.
  • the computing device may obtain character data in addition to voice data and text data at block 520.
  • the computing device may play a voice message corresponding to the voice data based on the obtained voice data.
  • the computing device may receive a voice message play request to play a voice message from the user.
  • the computing device may sequentially play one or more voice messages if there is more than one voice message to play. Additionally, the playback of the voice message may be paused, stopped, or controlled to play the previous voice message or the next voice message at the user's request.
  • the computing device may display a text message corresponding to text data in response to the reproduction of the voice message according to block 530.
  • the computing device may display the character along with the reproduction of the voice message and the display of a text message based on the acquired character data.
  • the computing device may filter the text message from the text data based on a pre-determined censorship condition, prior to performing block 530 and block 540, and based on the results of the filtering, block 530 And block 540.
  • characters filtered according to the censorship conditions may include abusive language, profanity, and the like.
  • the computing device may change at least a part of the text to a predetermined character, for example, an asterisk (*), and mute the at least part of the voice message. .
  • the process 600 shown in FIG. 6 begins at block 610 receiving a data packet.
  • the description of the block 610 will be omitted because it overlaps with the description of the block 510 of FIG. 5.
  • Process 600 can continue at block 510 to block 620 for acquiring voice data.
  • the computing device may obtain voice data corresponding to the voice message from the data packet received in block 610.
  • the received data packet may include only voice data, or may include voice data and corrupted text data corresponding to the voice message.
  • the computing device can obtain voice data from the data packet.
  • Process 600 may continue at block 620 to block 630 where it is determined that text data cannot be obtained.
  • the computing device may determine that it is possible to obtain speech data from the data packet, but not text data corresponding to the speech message.
  • Process 600 may continue at block 630 to block 640 for generating text data and block 660 to reproduce the voice message.
  • the computing device may generate text data based on the acquired voice data.
  • the computing device may generate text data corresponding to a voice message from voice data using a well-known voice recognition technique.
  • Process 600 may continue to block 650 that displays a text message after performing block 640. Descriptions of the block 660 for reproducing the voice message and the block 650 for displaying the text message are duplicated with the blocks 530 and 540 described in FIG. 5, respectively, and thus will be omitted.
  • the process 700 shown in FIG. 7 begins at block 710 receiving a data packet.
  • the description of the block 710 is omitted because it overlaps with the description of the block 510 of FIG. 5.
  • Process 700 may continue at block 710 to block 720 for obtaining text data.
  • the computing device may obtain text data from the data packet received in block 710.
  • the received data packet may contain only text data, or may include text data and corrupted voice data corresponding to the text data.
  • the computing device can obtain text data from the data packet.
  • Process 700 may continue at block 720 to block 730 where it is determined that speech data cannot be obtained.
  • the computing device may determine that it is able to obtain text data from the data packet, but cannot acquire speech data corresponding to the text data.
  • Process 700 may continue at block 730 to block 740 for generating voice data and block 760 for displaying text messages.
  • the computing device may generate speech data based on the acquired text data.
  • the computing device may generate speech data from text data using a well-known speech synthesis technique.
  • process 700 may continue to block 750 that plays a voice message. Descriptions of the block 750 for reproducing the voice message and the block 760 for displaying the text message are duplicated with the blocks 530 and 540 described in FIG. 5, respectively, and thus will be omitted.
  • a voice message or a text message can be complemented by transmitting, receiving, and acquiring a voice message together with a text message, sequentially playing the voice message, and displaying the text message correspondingly. It is easier to understand the content of the voice message.
  • by storing text data corresponding to a voice message even if the voice data is erased due to a problem of capacity, it becomes easy to quickly understand a conversation made during the provision of an instant message service and to search and review the contents.
  • it is possible to provide a new type of instant message service by displaying a character together with voice reproduction and text display.
  • FIG. 8 shows an example of using an instant message service according to the present disclosure
  • FIG. 9 shows an example of displaying and playing a message on a user's computing device when using the instant message service according to the foregoing.
  • the first user 810, the second user 820, and the third user 830 are respectively through the user device 812, the user device 822, and the user device 832, I am using an instant message service.
  • the users 810, 820, and 830 may share an instant message that is transmitted and received by at least one of the users 810, 820, and 830.
  • the first user 810 transmits an instant message
  • the second user 820 and the third user 830 may receive the corresponding instant message.
  • the first user 810 and the second user 820 may transmit a voice message.
  • the first user 810 can select the character 816 and the second user 820 can select the character 826.
  • the first user 810 may input a voice message 814 with the phrase "Aren't it cold?"
  • the user device 812 may detect the facial expression of the first user 810 and determine the facial expression of the character 816.
  • the user device 812 may obtain a text message 814-2 corresponding to the voice message 814 by performing voice recognition on the voice message 814.
  • the first user 810 selects one of a list of predetermined actions, or provides a text (eg, “cold” is recognized) recognized by the user device 812 from the voice-recognized text message 814-2. 1
  • the user 810 may determine the operation of the character 816 by selecting it. Thereafter, the voice message 814 may be transmitted to the user devices 822 and 832 of the second and third users 820 and 830.
  • the second user 820 may input the voice message 824 with the phrase "I am hot!”.
  • the user device 822 may detect the facial expression of the second user 820 and determine the facial expression of the character 826.
  • the user device 822 can obtain the text message 824-2 from the voice message 824.
  • the second user 820 selects one of a list of predetermined actions, or the second user recognizes the text recognized by the user device 822 from the text message 824-2 (eg, “hot” is recognized).
  • the action of the character 826 may be determined by the selection by the 820.
  • the voice message 824 may be transmitted to the user devices 812 and 232 of the first and third users 810 and 830.
  • the third user 830 may access a server (not shown) that provides an instant message service using the user device 832, and the user device 832 may be configured to provide voice data corresponding to the voice message 814. And a data packet containing text data corresponding to the text message 814-2 and a data packet including voice data corresponding to the voice message 824 and text data corresponding to the text message 824-2. You can. 9 (a) and 9 (b), text messages 814-2 and 824-2 may be displayed in response to reproduction of voice messages 814 and 824.
  • the third user 830 may input a voice message playback request using the user interface 840 displayed on the user device 832. When a request to play a voice message is inputted, as shown in FIG.
  • the voice message 814 is played together with the display of the character 816. Also, while the voice message 814 is being reproduced, the voice-recognized text message 814-2 may be displayed in response to the reproduction of the voice message 814.
  • the character 816 may show the facial expression and motion determined by the user device 812 of the first user 810. Then, as shown in Fig. 9 (b), the voice message 824 is played with the display of the character 826. Further, while the voice message 824 is being played, the voice-recognized text message 824-2 may be displayed in response to the reproduction of the voice message 824.
  • the character 826 may show facial expressions and actions determined by the user device 822 of the second user 820.
  • the user device 832 of the third user 830 may sequentially display text messages 814-2 and 824-2 received from the first user 810 and the second user 820.
  • FIG. 10 shows an example computer program product 1000 that can be used to perform defect inspection in accordance with at least some embodiments of the present disclosure.
  • An exemplary embodiment of an exemplary computer program product is provided using a signal containing medium 1002.
  • the signal-bearing medium 1002 of one or more computer program products 1000 may include a computer-readable medium 1006, a recordable medium 1008 and / or a communication medium 1010.
  • the command 1004 included in the signal-containing medium 1002 includes the transmitting terminal 120 and the receiving terminal 130 illustrated in FIG. 1, the transmitting terminal 200 illustrated in FIG. 2, and / or the receiving terminal illustrated in FIG. 4 ( 400).
  • the instructions 1004, when executed, may include at least one instruction for causing the computing device to perform at least one of the processes of FIGS. 3, 5, 6, and 7.
  • the instant message service providing server 1100 may be implemented to have functions of an integrated server and / or a relay server. As illustrated in FIG. 11, the instant message service providing server 1100 may include a communication module 1110, a character module 1120, a voice memory 1130 and a text memory 1140. The communication module 1110 may receive a data packet including voice data, text data, and / or character data from the transmitting terminal from the transmitting terminal. In addition, the communication module 1110 may transmit a notification and / or data packet for a data packet to a receiving terminal.
  • the character module 1120 may store character data received from the transmitting terminal, for example, information on the type of the sender's character, facial expression, action, and the like.
  • the voice memory 1130 may store voice data received from a transmitting terminal. In some examples, voice data stored in the voice memory 1130 may be deleted according to predetermined conditions.
  • the text memory 1140 may store text data corresponding to a voice message, for example, a voice recognized text message and a typed text message. In some examples, text memory 1140 may store text data corresponding to voice data stored in voice memory 1130, and character module 1120 may store character data in voice memory 1130 and / or The text data stored in the text memory 1140 may be stored.
  • the claimed subject matter is not to be limited in scope by the specific embodiments described herein.
  • some implementations can be in hardware, such as can be used to operate on a device or combination of devices, while other implementations can be in software and / or firmware, for example.
  • the claimed subject matter is not limited in scope in this respect, but some implementations may include one or more articles such as signal bearing media, storage media.
  • Such storage media such as CD-ROMs, computer disks, flash memories, and the like, are executed by a computing device, such as a computing system, computing platform, or other system, to a claimed subject, such as one of the embodiments described above.
  • a computing device such as a computing system, computing platform, or other system, to a claimed subject, such as one of the embodiments described above.
  • it can store instructions that can cause the processor to run.
  • the computing device may include one or more processing units or one or more input / output devices, such as a processor, display, keyboard and / or mouse, and static random access memory, dynamic random access memory, flash memory and / or hard drive. It may contain more than one memory.
  • processing units such as a processor, display, keyboard and / or mouse, and static random access memory, dynamic random access memory, flash memory and / or hard drive. It may contain more than one memory.
  • the implementer determines that speed and accuracy are the most important, the implementer can primarily choose the hardware and / or firmware means, and if flexibility is the most important, the implementer can mainly choose the software implementation; Or, as another alternative, implementers may choose any combination of hardware, software and / or firmware.
  • some aspects of the embodiments of the present disclosure may include one or more computer programs running on one or more computers (eg, one or more programs running on one or more computer systems), one running on one or more processors.
  • the above program e.g., one or more programs running on one or more microprocessors
  • firmware or substantially any combination thereof, that may be implemented in an integrated circuit, in whole or in part, equally, software and / or firmware
  • writing code for and / or designing circuitry is within the skill of the artisan in light of the present disclosure.
  • the mechanisms of the subject matter of the present disclosure can be distributed into various types of program products, and examples of the subject matter of the present disclosure are specific types of signal bearing media used to actually perform the distribution. You will understand that it applies regardless of

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)
  • Operations Research (AREA)

Abstract

Disclosed is a transmitting terminal for executing an instant message service application and generating and sending an instant message. The transmitting terminal comprises a voice input module, a voice data generation module, a text data generation module, a data packet generation module, and a communication module. The voice input module may receive a voice message from a user. The voice data generation module may generate voice data from the voice message. The text data generation module may generate text data corresponding to the voice message. The data packet generation module may combine the voice data and the text data to generate a data packet. The communication module may transmit the generated data packet to a server or at least one receiving terminal.

Description

비동기적 인스턴트 메시지 서비스를 제공하기 위한 장치, 방법 및 컴퓨터 판독가능 저장 매체Apparatus, method and computer readable storage medium for providing asynchronous instant message service
본 개시는 비동기적인 인스턴트 메시지 서비스를 제공하기 위한 장치, 방법 및 컴퓨터 판독가능 저장 매체에 관한 것이다.This disclosure relates to apparatus, methods, and computer readable storage media for providing asynchronous instant message services.
여기에서 달리 언급하지 않으면 본 섹션에서 기술되는 내용은 본 출원에서의 청구범위의 선행 기술이 아니며, 본 섹션에 기재하였다는 이유로 선행 기술로 인정되어서는 안 된다.Unless otherwise stated herein, the content described in this section is not prior art to the claims in this application and should not be construed as prior art for the reasons set forth in this section.
인스턴트 메시지 서비스를 이용하는 사용자는 둘 이상의 사용자 간에 메시지를 비교적 빠르고 간편하게 전달할 수 있다. 최근, 스마트폰과 같은 모바일 장치가 널리 이용됨에 따라 인스턴트 메시지 서비스의 이용은 폭발적으로 증가해왔다. 최근, 인스턴트 메시지 서비스에서는 종래의 텍스트 메시지에 더하여 비교적 짧은 음성 메시지의 전송도 가능해지도록 하고 있다. 음성 메시지는 텍스트 메시지에 비하여 입력이 간편하고, 음성 메시지를 입력한 사용자가 전달하고자 하는 다양한 특징을 전달할 수 있다. 그러나, 음성 메시지의 데이터 사이즈는 일반적으로, 텍스트 메시지에 비하여 크고, 사용자는 각각의 음성 메시지를 재생하는 동작(예컨대, 음성 메시지를 클릭, 터치, 등)을 수행하고, 재생되는 음성 메시지를 귀로 들어야 한다는 점에서, 음성 메시지는 눈으로 빠르게 확인 가능한 텍스트 메시지에 비하여, 시간적 제약 또는 메모리 공간 또는 물리적인 공간과 같은 공간적인 제약을 가질 수 있다.Users using instant messaging services can deliver messages relatively quickly and easily between two or more users. In recent years, as mobile devices such as smartphones are widely used, the use of instant message services has exploded. Recently, in the instant message service, it is possible to transmit a relatively short voice message in addition to the conventional text message. The voice message is simpler to input than the text message, and can deliver various features that the user who input the voice message wants to deliver. However, the data size of the voice message is generally larger than that of the text message, and the user needs to perform an operation (eg, click, touch, etc.) of each voice message and listen to the voice message being played. In view of the above, the voice message may have a temporal constraint or a spatial constraint such as a memory space or a physical space, compared to a text message that can be quickly identified with an eye.
대한민국 등록 특허공보 제10-1863776호(이하, 선행기술문헌 1)은, 사용자가 음성 메시지를 입력하면, 음성 메시지로부터 음성 인식을 수행하여 텍스트 메시지를 생성하고, 음성 메시지로부터 사용자의 감정을 추출하여, 음성 메시지로부터 생성된 텍스트 메시지의 폰트를 변경하여 출력하는 텍스트 표현 방법을 개시하고 있다. Republic of Korea Registered Patent Publication No. 10-1863776 (hereinafter, prior art document 1), when a user inputs a voice message, performs voice recognition from the voice message to generate a text message, extracts the user's emotion from the voice message Disclosed is a text expression method for changing and outputting a font of a text message generated from a voice message.
이와 같이 선행기술문헌 1은 음성 메시지로부터 다양한 감정에 관한 정보를 추출하고, 이러한 정보를 이용하여 텍스트 메시지를 생성하지만, 사용자가 음성 메시지를 통하여 전달하고자 하는 정보 중 일부만을 얻을 수 있으며, 음성 메시지의 나머지 정보는 잃을 수 있다.As described above, prior art document 1 extracts information on various emotions from a voice message and generates a text message using the information, but only a part of information that a user intends to transmit through a voice message can be obtained. The rest of the information can be lost.
본 개시는 위와 같은 문제점들을 해결하기 위한 것으로서, 인스턴트 메시지 서비스에서 음성 메시지를 재생하기에 편리하고, 데이터 관리에 있어서 효율적인 장치, 방법 및 컴퓨터 판독가능 저장 매체를 제시한다. 또한, 본 개시는 인스턴트 메시지 서비스에서, 캐릭터를 이용하는 보다 향상된 인스턴트 메시지 서비스를 제공할 수 있는 장치, 방법 및 컴퓨터 판독가능 저장 매체를 제시한다. The present disclosure is intended to solve the above problems, and provides an apparatus, method, and computer readable storage medium that are convenient for reproducing a voice message in an instant message service and are efficient in data management. In addition, the present disclosure proposes an apparatus, method, and computer-readable storage medium capable of providing an improved instant message service using a character in an instant message service.
본 개시의 일부 실시예에서, 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 생성 및 송신하는 송신 단말 상에서 수행되는 방법이 설명된다. 예시적인 방법은 송신 단말의 사용자로부터 음성 메시지를 입력 받는 단계와 텍스트 데이터를 생성하는 단계와 음성 데이터와 텍스트 데이터를 결합하여 데이터 패킷을 생성하는 단계와 생성된 데이터 패킷을 전송하는 단계를 포함할 수 있다. 일부 예시에서, 텍스트 데이터를 생성하는 단계는 음성 데이터에 기초하여 음성 메시지에 해당하는 텍스트 데이터를 생성하는 단계를 포함할 수 있다. 일부 다른 예시에서, 텍스트 데이터를 생성하는 단계는 사용자로부터 음성 메시지에 해당하는 텍스트를 입력 받아 텍스트 데이터를 생성하는 단계를 포함할 수 있다. 일부 예시에서, 데이터 패킷을 전송하는 단계는 데이터 패킷을 통합 서버로 전송하는 단계를 포함할 수 있다. 일부 다른 예시에서, 방법은 데이터 패킷에 관한 알림 메시지를 생성하는 단계를 더 포함할 수 있다. 이러한 예시에서, 방법은 알림 메시지를 중계 서버로 전송하는 단계 및 데이터 패킷을 적어도 하나의 수신 단말로 전송하는 단계를 포함할 수 있다.In some embodiments of the present disclosure, a method performed on a transmitting terminal that executes an instant message service application to generate and transmit a message is described. An exemplary method may include receiving a voice message from a user of a transmitting terminal, generating text data, combining voice data and text data to generate a data packet, and transmitting the generated data packet. have. In some examples, generating the text data may include generating text data corresponding to the voice message based on the voice data. In some other examples, generating the text data may include receiving text corresponding to a voice message from a user and generating text data. In some examples, transmitting the data packet may include transmitting the data packet to an integrated server. In some other examples, the method may further include generating a notification message regarding the data packet. In this example, the method may include transmitting a notification message to a relay server and transmitting a data packet to at least one receiving terminal.
일부 실시예에서, 인스턴트 메시지 서비스 어플리케이션을 실행하고, 인스턴트 메시지를 생성 및 송신하기 위한 송신 단말이 설명된다. 일 예시적인 송신 단말은 음성 입력 모듈, 음성 데이터 생성 모듈, 텍스트 데이터 생성 모듈, 데이터 패킷 생성 모듈 및 통신 모듈을 포함할 수 있다. 음성 입력 모듈은 송신 단말의 사용자로부터 음성 메시지를 입력 받도록 구성될 수 있다. 음성 데이터 생성 모듈은 음성 입력 모듈에 의해 수신된 음성 메시지로부터 해당 음성 데이터를 생성하도록 구성될 수 있다. 텍스트 데이터 생성 모듈은 음성 메시지에 해당하는 텍스트 데이터를 생성하도록 구성될 수 있다. 데이터 패킷 생성 모듈은 음성 데이터와 텍스트 데이터를 결합하여 데이터 패킷을 생성하도록 구성될 수 있다. 텍스트 데이터 생성 모듈은 음성 데이터 생성 모듈로부터의 음성 데이터에 대한 음성 인식을 수행하도록 구성되는 음성 인식 모듈 및 사용자로부터 음성 메시지에 해당하는 텍스트를 입력 받도록 구성되는 텍스트 입력 모듈을 포함할 수 있다. 텍스트 데이터 생성 모듈은 음성 인식 모듈 또는 텍스트 입력 모듈 중 적어도 하나를 이용하여 텍스트 데이터를 생성하도록 구성될 수 있다.In some embodiments, a transmitting terminal for running an instant message service application and generating and transmitting an instant message is described. An exemplary transmission terminal may include a voice input module, a voice data generation module, a text data generation module, a data packet generation module, and a communication module. The voice input module may be configured to receive a voice message from a user of the transmitting terminal. The voice data generation module may be configured to generate corresponding voice data from voice messages received by the voice input module. The text data generation module may be configured to generate text data corresponding to a voice message. The data packet generation module may be configured to combine voice data and text data to generate a data packet. The text data generation module may include a voice recognition module configured to perform voice recognition on voice data from the voice data generation module and a text input module configured to receive text corresponding to a voice message from a user. The text data generation module may be configured to generate text data using at least one of a speech recognition module and a text input module.
일부 예시에서, 송신 단말은 캐릭터 모듈을 더 포함할 수 있다. 캐릭터 모듈은 송신 단말 및 적어도 하나의 수신 단말 상에서 디스플레이 가능한 캐릭터에 관한 정보를 획득하고 캐릭터에 관한 정보로부터 캐릭터 데이터를 생성하도록 구성될 수 있다.In some examples, the transmitting terminal may further include a character module. The character module may be configured to acquire information about a character displayable on a transmitting terminal and at least one receiving terminal and generate character data from the information on the character.
일부 실시예에서, 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 생성 및 송신 하기 위한 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 저장 매체가 설명된다. 일 예시적인 컴퓨터 판독가능 저장 매체는 컴퓨터 프로그램이 실행되면, 컴퓨팅 장치로 하여금, 컴퓨팅 장치의 사용자로부터 음성 메시지를 입력 받는 동작과, 입력된 음성 메시지로부터 해당 음성 데이터를 생성하는 동작과, 음성 데이터에 기초하여 음성 메시지에 해당하는 텍스트 데이터를 생성하는 동작과, 음성 데이터와 텍스트 데이터를 결합하여 데이터 패킷을 생성하는 동작과, 그리고 데이터 패킷을 인스턴트 메시지 서비스를 제공하는 통합 서버로 전송하는 동작을 포함하는 동작들을 실행 가능하도록 하는 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있다.In some embodiments, a computer readable storage medium in which computer programs for executing an instant message service application to generate and send messages are stored. One exemplary computer-readable storage medium includes a computer program, when a computer program is executed, receiving a voice message from a user of the computing device, generating corresponding voice data from the input voice message, and voice data. On the basis, the operation of generating text data corresponding to the voice message, combining the voice data with the text data to generate a data packet, and transmitting the data packet to an integrated server providing an instant message service. It may include one or more computer-executable instructions to make operations executable.
일부 실시예에서, 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 수신하는 수신 단말 상에서 수행되는 방법이 설명된다. 일 예시적인 방법에서, 수신 단말은 인스턴트 메시지 서비스를 제공하는 통합 서버와 네트워크를 통해 데이터 통신 가능하게 연결될 수 있으며, 방법은 통합 서버로부터 송신 단말에 의해 전송된 데이터 패킷을 수신하는 단계; 데이터 패킷으로부터 음성 데이터를 획득하는 단계; 음성 데이터에 기초하여, 음성 메시지에 해당하는 텍스트 데이터를 생성하는 단계; 음성 데이터에 기초하여, 음성 데이터에 대응하는 음성 메시지를 재생하는 단계; 및텍스트 데이터에 기초하여, 음성 메시지의 재생에 대응하여 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하는 단계를 포함할 수 있다. 다른 예시에서, 방법은 통합 서버로부터 데이터 패킷을 수신하는 단계; 데이터 패킷으로부터 텍스트 데이터를 획득하는 단계; 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없다고 결정하는 단계; 텍스트 데이터에 기초하여 텍스트 데이터에 해당하는 음성 데이터를 생성하는 단계; 음성 데이터에 기초하여 음성 데이터에 대응하는 음성 메시지를 재생하는 단계 및 텍스트 데이터에 기초하여, 음성 메시지의 재생에 대응하여 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하는 단계를 포함할 수 있다. 또 다른 예시적인 방법에서, 수신 단말은 인스턴트 메시지 서비스를 제공하는 중계 서비와 네트워크를 통해 데이터 통신 가능하게 연결되고, 또한 인스턴트 메시지 서비스 어플리케이션을 실행하는 송신 단말과 직접적으로 통신 가능 하도록 연결될 수 있다. 이러한 예시에서, 방법은 중계 서버로부터 송신 단말에 의해 전송된 데이터 패킷에 대한 알림 메시지를 수신하는 단계 및 알림 메시지에 응답하여 송신 단말로부터 데이터 패킷을 수신하는 단계를 포함할 수 있다.In some embodiments, a method performed on a receiving terminal that executes an instant message service application to receive a message is described. In one exemplary method, the receiving terminal may be capable of data communication through an network with an integrated server providing an instant message service, the method comprising: receiving a data packet transmitted by the transmitting terminal from the integrated server; Obtaining voice data from the data packet; Generating text data corresponding to a voice message based on the voice data; Reproducing a voice message corresponding to the voice data based on the voice data; And based on the text data, displaying a text message corresponding to the text data in response to reproduction of the voice message. In another example, a method includes receiving a data packet from an integrated server; Obtaining text data from the data packet; Determining that speech data corresponding to the text data cannot be obtained; Generating voice data corresponding to the text data based on the text data; The method may include reproducing a voice message corresponding to the voice data based on the voice data, and displaying a text message corresponding to the text data corresponding to the reproduction of the voice message based on the text data. In another exemplary method, the receiving terminal may be connected to a data communication via a network and a relay service providing an instant message service, and may also be connected to enable direct communication with a transmitting terminal executing an instant message service application. In this example, the method may include receiving a notification message for the data packet transmitted by the transmitting terminal from the relay server and receiving the data packet from the transmitting terminal in response to the notification message.
일부 실시예에서, 인스턴트 메시지 서비스 어플리케이션을 실행하고, 인스턴트 메시지를 수신하기 위한 수신 단말이 설명된다. 수신 단말은 통신 모듈, 데이터 획득 모듈, 데이터 보완 모듈 및 출력 모듈을 포함할 수 있다. 통신 모듈은 송신 단말에 의해 전송된 데이터 패킷을 서버 또는 송신 단말로부터 수신하도록 구성될 수 있다. 데이터 획득 모듈은 데이터 패킷으로부터 음성 데이터 또는 텍스트 데이터 중 적어도 하나를 획득하도록 구성될 수 있다. 데이터 보완 모듈은 음성 인식 모듈 및 음성 생성 모듈을 포함할 수 있다. 데이터 획득 모듈이 데이터 패킷으로부터 음성 데이터를 획득하고 음성 데이터에 해당하는 텍스트 데이터를 획득할 수 없는 경우, 데이터 보완 모듈은 음성 인식 모듈로 하여금 음성 데이터에 해당하는 텍스트 데이터를 생성하도록 할 수 있다. 데이터 획득 모듈이 데이터 패킷으로부터 텍스트 데이터를 획득하고 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없는 경우, 데이터 보완 모듈은 음성 생성 모듈로 하여금 텍스트 데이터에 해당하는 음성 데이터를 생성하도록 할 수 있다. 출력 모듈은 음성 데이터에 기초하여, 음성 데이터에 대응하는 음성 메시지를 재생하도록 구성되는 재생 모듈 및 텍스트 데이터에 기초하여, 음성 메시지의 재생에 대응하여 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하도록 구성되는 디스플레이 모듈을 포함할 수 있다.In some embodiments, a receiving terminal for executing an instant message service application and receiving an instant message is described. The receiving terminal may include a communication module, a data acquisition module, a data supplementation module, and an output module. The communication module may be configured to receive a data packet transmitted by the transmitting terminal from the server or the transmitting terminal. The data acquisition module may be configured to acquire at least one of voice data or text data from a data packet. The data supplement module may include a speech recognition module and a speech generation module. If the data acquisition module is unable to acquire voice data from the data packet and acquire text data corresponding to the voice data, the data supplement module may cause the voice recognition module to generate text data corresponding to the voice data. If the data acquisition module is unable to acquire text data from the data packet and acquire speech data corresponding to the text data, the data supplement module may cause the speech generation module to generate speech data corresponding to the text data. The output module is configured to display a text message corresponding to the text data in response to the reproduction of the voice message, based on the text data, and a playback module configured to play the voice message corresponding to the voice data, It can include modules.
일부 실시예에서, 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 수신하기 위한 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 저장 매체가 설명된다. 일 예시적인 컴퓨터 판독가능 저장 매체는 컴퓨터 프로그램이 실행되면, 컴퓨팅 장치로 하여금, 서버 또는 송신 단말로부터 송신 단말에 의해 전송된 데이터 패킷을 수신하는 동작; 데이터 패킷으로부터 텍스트 데이터를 획득하는 동작; 데이터 패킷으로부터 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없다고 결정하는 동작; 텍스트 데이터에 기초하여, 텍스트 데이터에 해당하는 음성 데이터를 생성하는 동작; 음성 데이터에 기초하여, 음성 데이터에 대응하는 음성 메시지를 재생하는 동작; 및 텍스트 데이터에 기초하여, 음성 메시지의 재생에 대응하여 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하는 동작을 포함하는 동작들을 실행가능 하도록 하는 하나 이상의 컴퓨터 실행 가능 명령어를 포함를 포함할 수 있다.In some embodiments, a computer readable storage medium in which a computer program for executing an instant message service application to receive a message is stored is described. One exemplary computer-readable storage medium includes, when a computer program is executed, causing a computing device to receive a data packet transmitted by a transmitting terminal from a server or a transmitting terminal; Obtaining text data from the data packet; Determining that speech data corresponding to text data cannot be obtained from the data packet; Generating voice data corresponding to the text data based on the text data; Reproducing a voice message corresponding to the voice data based on the voice data; And based on the text data, one or more computer-executable instructions to make the actions executable, including displaying a text message corresponding to the text data in response to the reproduction of the voice message.
이상의 간단한 요약 및 효과에 관한 설명은 단순히 예시적인 것으로서 본 개시에서 의도한 기술적 사항을 제한하기 위한 것이 아니다. 이하의 상세한 설명과 첨부된 도면을 참조함으로써, 전술한 예시적인 실시예들과 기술적 특징들에 더하여, 추가적인 실시예와 기술적 특징들이 이해될 수 있을 것이다.The above brief summary and description of effects are merely illustrative and are not intended to limit the technical details intended in the present disclosure. By referring to the following detailed description and accompanying drawings, in addition to the above-described exemplary embodiments and technical features, additional embodiments and technical features may be understood.
앞서 설명한 본 개시의 특징들과 기타 추가적인 특징들에 대해서는 첨부된 도면을 참조하여 이하에서 자세하게 설명한다. 이러한 도면들은 본 개시에 따르는 단지 몇 가지의 실시예만을 도시한 것이며, 본 개시의 기술적 사상의 범위를 제한하는 것으로 간주되어서는 안 된다. 본 개시의 기술적 사상은 첨부된 도면을 사용하여 더 구체적이고 상세하게 기술될 것이다.The features of the present disclosure described above and other additional features will be described in detail below with reference to the accompanying drawings. These drawings show only a few embodiments according to the present disclosure and should not be considered as limiting the scope of the technical spirit of the present disclosure. The technical spirit of the present disclosure will be described in more detail and in detail using the accompanying drawings.
도 1은 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스가 제공되는 환경을 나타내는 예시적인 환경도이고;1 is an exemplary environment diagram illustrating an environment in which an instant message service is provided according to at least some embodiments of the present disclosure;
도 2는 본 개시의 적어도 일부 실시예에 따른 송신 단말을 개략적으로 도시하는 블록도이고;2 is a block diagram schematically illustrating a transmitting terminal according to at least some embodiments of the present disclosure;
도 3은 본 개시의 적어도 일부 실시예에 따라, 송신 단말에서 수행되는 일 예시적인 프로세스를 도시하는 흐름도이고;3 is a flow diagram illustrating an exemplary process performed at a transmitting terminal, according to at least some embodiments of the present disclosure;
도 4는 본 개시의 적어도 일부 실시예에 따른 수신 단말을 개략적으로 도시하는 블록도이고;4 is a block diagram schematically illustrating a receiving terminal according to at least some embodiments of the present disclosure;
도 5 내지 도 7은 본 개시의 적어도 일부 실시예에 따라, 수신 단말에서 수행되는 예시적인 프로세스를 도시하는 흐름도이고;5-7 are flow diagrams illustrating exemplary processes performed at a receiving terminal, according to at least some embodiments of the present disclosure;
도 8는 본 개시에 따라 인스턴트 메시지 서비스를 이용하는 일 예시를 도시하고;8 shows an example of using an instant message service according to the present disclosure;
도 9은 도 8에 따라 인스턴트 메시지 서비스를 이용하는 경우 사용자의 단말 상에서 메시지가 디스플레이 및 재생되는 일 예시를 도시하고;9 shows an example in which a message is displayed and played on a user's terminal when using the instant message service according to FIG. 8;
도 10은 본 개시의 적어도 일부 실시예에 따라 인스턴트 메시지 서비스를 제공하는 데 이용될 수 있는 예시적인 컴퓨터 프로그램 제품을 도시하고,10 illustrates an exemplary computer program product that can be used to provide instant message service in accordance with at least some embodiments of the present disclosure,
도 11는 본 개시의 적어도 일부 실시예에 따라 인스턴트 메시지 서비스 제공 서버를 개략적으로 도시하는 블록도이다.11 is a block diagram schematically illustrating an instant message service providing server according to at least some embodiments of the present disclosure.
이하, 첨부한 도면을 참조하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 구현예 및 실시예를 상세히 설명한다. 그러나, 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 구현예 및 실시예에 한정되지 않는다. Hereinafter, embodiments and examples of the present application will be described in detail with reference to the accompanying drawings so that those skilled in the art to which the present disclosure pertains can easily implement them. However, the present application can be implemented in many different forms and is not limited to the embodiments and examples described herein.
본 개시는 일반적으로 인스턴트 메시지 서비스를 제공하기 위한 장치, 방법 및 컴퓨터 판독가능 저장 매체에 관한 것이다.This disclosure relates generally to apparatus, methods and computer readable storage media for providing instant messaging services.
이하에서, "인스턴트 메시지 서비스"는 송신자가 텍스트 메시지, 음성 메시지, 이미지, 등과 같은 메시지를 하나 이상의 수신자에게 전송하면, 수신자에 의해 수신된 메시지가 디스플레이 및/또는 재생되는 서비스를 지칭할 수 있다. "캐릭터"라는 용어는 컴퓨터 그래픽에 의해 표현되고 얼굴을 가지는 객체를 의미하며, 예컨대, 사람, 동물, 가상의 동물, 로봇, 등과 같은 다양한 형태로 표현될 수 있으며, 본 개시에 따르면, 캐릭터는 인스턴트 메시지 서비스 상에서 디스플레이 되는 개체이며, 사용자 또는 이하에서 설명되는 바와 같이 송신 단말 또는 수신 단말과 같은 사용자 장치의 제어에 의해 동작하여, 캐릭터의 애니메이션이 사용자 장치 상에서 디스플레이 될 수 있다.Hereinafter, “instant message service” may refer to a service in which a message received by a recipient is displayed and / or played when the sender sends a message such as a text message, a voice message, an image, or the like to one or more recipients. The term "character" refers to an object represented by a computer graphic and having a face, and may be expressed in various forms, such as a person, an animal, a virtual animal, a robot, etc., and according to the present disclosure, a character is instant It is an object displayed on the message service, and is operated by control of a user device, such as a transmitting terminal or a receiving terminal, as described below, so that the animation of the character can be displayed on the user device.
이하에서, "모듈"이라는 용어는, 장치, 서버, 프로그램 유닛 또는 이들의 적절한 조합을 지칭할 수 있다. 예컨대, 이하에서 설명될 "캐릭터 모듈"이라는 용어는 사용자의 장치 상에서 디스플레이될 캐릭터에 관한 정보를 획득하기 위한 카메라와 같은 하드웨어뿐만 아니라, 그러한 카메라에 의해 획득된 데이터를 처리하기 위한 장치, 서버, 프로그램 유닛 또는 이들의 적절한 조합을 지칭할 수 있다.Hereinafter, the term "module" may refer to a device, a server, a program unit, or a suitable combination thereof. For example, the term "character module" as will be described below, as well as hardware such as a camera for obtaining information about a character to be displayed on a user's device, as well as devices, servers, programs for processing data acquired by such a camera. Units or any suitable combination thereof.
도 1은 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스가 제공되는 환경(100)을 나타내는 예시적인 환경도이다. 예시적인 환경(100)은 네트워크 환경(110), 하나 이상의 송신 단말(120-1, 120-2, 120-3, 120-4, ...; 이하에서는 120으로 통칭함) 및 하나 이상의 수신 단말(130-1, 130-2, 130-3, ...; 이하에서는 130으로 통칭함)을 포함할 수 있다. 설명의 편의를 위하여, 120이 송신 단말이고 130이 수신 단말이라고 지칭하였지만, 송신 단말과 수신 단말은 각각 수신과 송신을 또한 수행할 수 있다. 네트워크 환경(110)은 송신 단말(120)과 수신 단말(130)을 유선 또는 무선의 통신으로 연결하기 위한 다양한 환경을 나타낸다. 네트워크 환경(110)은 인스턴트 메시지 서비스를 제공하기 위한 서버(115)를 포함할 수 있다.1 is an exemplary environment diagram illustrating an environment 100 in which an instant message service is provided according to at least some embodiments of the present disclosure. The exemplary environment 100 is a network environment 110, one or more transmitting terminals (120-1, 120-2, 120-3, 120-4, ...; hereinafter referred to as 120) and one or more receiving terminals (130-1, 130-2, 130-3, ...; hereinafter collectively referred to as 130). For convenience of description, although 120 is referred to as a transmitting terminal and 130 is called a receiving terminal, the transmitting terminal and the receiving terminal may also perform reception and transmission, respectively. The network environment 110 represents various environments for connecting the transmitting terminal 120 and the receiving terminal 130 by wired or wireless communication. The network environment 110 may include a server 115 for providing instant message service.
일부 실시예에서, 송신 단말(120)는 인스턴트 메시지 서비스를 제공하는 서버(115)를 통하여 사용자 장치(130)에 인스턴트 메시지를 전송하거나 사용자 장치(130)로부터 인스턴트 메시지를 수신할 수 있다. 이러한 실시예에서, 서버(115)는 인스턴트 메시지 서비스를 제공하고, 인스턴트 메시지를 송신 단말(120)로부터 수신하고, 저장하고 수신 단말(130)로 전송하는 통합 서버일 수 있다. 일부 다른 예시에서, 송신 단말(120)은 서버(115)를 통하여 수신 단말(130)에 인스턴트 메시지에 대한 알림 메시지를 전송할 수 있으며, 수신 단말(130)은 서버(115)로부터 알림 메시지를 수신하고, 수신된 알림 메시지에 응답하여 인스턴트 메시지를 송신 단말(120)로부터 직접적으로 수신할 있다. 이러한 실시예에서, 서버(115)는 인스턴트 메시지 서비스를 제공하고, 릴레이 서버(relay server)와 같은 중계 서버로서 역할할 수 있다. 수신 단말(130)은 서버(115)로부터 알림 메시지를 수신한 이후, 수신 단말(130)은 예컨대, 피어 투 피어(peer-to-peer)기법을 이용하여 송신 단말(120)에 직접 연결함으로써 인스턴트 메시지를 수신할 수 있다. In some embodiments, the transmitting terminal 120 may transmit an instant message to the user device 130 through the server 115 providing an instant message service or receive an instant message from the user device 130. In this embodiment, the server 115 may be an integrated server that provides an instant message service, receives the instant message from the transmitting terminal 120, stores it, and transmits it to the receiving terminal 130. In some other examples, the transmitting terminal 120 may transmit a notification message for an instant message to the receiving terminal 130 through the server 115, and the receiving terminal 130 receives the notification message from the server 115 and , In response to the received notification message, an instant message may be directly received from the transmitting terminal 120. In this embodiment, the server 115 provides an instant message service and can act as a relay server, such as a relay server. After the receiving terminal 130 receives the notification message from the server 115, the receiving terminal 130 connects to the transmitting terminal 120 directly, for example, using a peer-to-peer technique. You can receive the message.
다양한 실시예에서, 네트워크 환경(110)은 송신 단말(120) 및 수신 단말(130) 간의 유선 환경, 무선 환경, 기지국, 등과 같은 통신 환경을 더 포함할 수 있다. 일부 예시에서, 서버(115)는 송신 단말(120)이 전송한 인스턴트 메시지를 저장하고, 이후, 수신 단말(130)이 서버(115)에 연결되면, 송신 단말(120)로부터 수신된 인스턴트 메시지를 전송하도록 구성될 수 있다. 피어 투 피어 기법으로 인스턴트 메시지를 직접적으로 전송하는 예시에서, 서버(115)는 네트워크 환경(110)에서 사용자 장치(120, 130) 간의 피어 투 피어 연결을 수립되도록 지원할 수 있다.In various embodiments, the network environment 110 may further include a communication environment such as a wired environment, a wireless environment, a base station, and the like between the transmitting terminal 120 and the receiving terminal 130. In some examples, the server 115 stores the instant message transmitted by the transmitting terminal 120, and then, when the receiving terminal 130 is connected to the server 115, receives the instant message received from the transmitting terminal 120. Can be configured to transmit. In the example of sending an instant message directly in a peer-to-peer technique, the server 115 may support establishing a peer-to-peer connection between user devices 120 and 130 in the network environment 110.
도 1에서 송신 단말(120) 및 수신 단말(130)은 통신 가능한 장치, 예컨대, 스마트폰, 태블릿 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 휴대 전화기, 개인 휴대용 단말기(PDA), 특정 용도 장치 또는 상기 기능 중 임의의 것을 포함하는 융합 장치와 같은 소형 폼팩터 휴대용(모바일) 전자 장치를 포함할 수 있다. 도 1에서 도시된 바와 같이, 송신 단말(120) 및 수신 단말(1300은 일대일의 인스턴트 메시지 통신뿐만 아니라, 일대다 또는 다대다의 인스턴트 메시지 통신도 수행할 수 있으며, 서버(115)는 그러한 인스턴트 메시지 서비스를 제공할 수 있다.In FIG. 1, the transmitting terminal 120 and the receiving terminal 130 are devices that can communicate with each other, such as a smart phone, a tablet computer, a desktop computer, a laptop computer, a mobile phone, a personal digital assistant (PDA), a specific purpose device, or one of the above functions And a small form factor portable (mobile) electronic device such as a fusion device including any. As shown in FIG. 1, the transmitting terminal 120 and the receiving terminal 1300 may perform one-to-one or many-to-many instant message communication as well as one-to-one instant message communication, and the server 115 may perform such instant message. Can provide services.
일부 예시에서, 송신 단말(120)의 사용자(제1 사용자)는 송신 단말(120)을 이용하여, 수신 단말(130)의 사용자(제2 사용자)에게 전송될 인스턴트 메시지를 입력할 수 있다. 인스턴트 메시지는 음성 메시지 또는 텍스트 메시지일 수 있다. 인스턴트 메시지가 텍스트 메시지인 경우, 기술분야에서 잘 알려진 바에 따라, 송신 단말(120)은 제1 사용자로부터 텍스트 메시지를 입력 받고, 데이터 패킷을 생성하여, 수신 단말(130)을 향하여 전송할 수 있다. 이하에서는, 인스턴트 메시지가 음성 메시지인 경우에 관하여 설명된다.In some examples, a user (first user) of the transmitting terminal 120 may use the transmitting terminal 120 to input an instant message to be transmitted to a user (the second user) of the receiving terminal 130. The instant message can be a voice message or a text message. When the instant message is a text message, as well known in the art, the transmitting terminal 120 may receive a text message from a first user, generate a data packet, and transmit it to the receiving terminal 130. Hereinafter, the case where the instant message is a voice message will be described.
일부 실시예에서, 송신 단말(120)은 제1 사용자로부터 음성 메시지를 입력 받을 수 있다. 일부 예시에서, 송신 단말(120)은 제1 사용자로부터 미리 정해진 시간 동안 음성 메시지를 입력 받을 수 있다. 송신 단말(120)은 입력된 음성 메시지로부터 해당 음성 데이터를 생성할 수 있다. In some embodiments, the transmitting terminal 120 may receive a voice message from a first user. In some examples, the transmitting terminal 120 may receive a voice message from a first user for a predetermined time. The transmitting terminal 120 may generate corresponding voice data from the input voice message.
이후, 송신 단말(120)은 음성 메시지에 해당하는 텍스트 데이터를 획득할 수 있다. 일부 실시예에서, 송신 단말(120)은 음성 데이터에 기초하여, 음성 메시지에 해당하는 텍스트 데이터를 생성할 수 있다. 이러한 텍스트 데이터의 생성에는 본 개시에 따른 기술 분야에서 잘 알려진 음성 인식 기법이 이용될 수 있다. 일부 다른 실시예에서, 송신 단말(120)은 제1 사용자로부터 음성 메시지에 해당하는 텍스트를 입력 받을 수 있으며, 입력된 텍스트에 기초하여 텍스트 데이터를 생성할 수 있다. 일부 예시에서, 제1 사용자의 요청에 따라, 송신 단말(120)은 복수의 음성 메시지를 입력 받을 수 있으며, 복수의 음성 메시지로부터 복수의 음성 데이터를 생성할 수 있다. 송신 단말(120)은 복수의 음성 메시지에 해당하는 텍스트 데이터를 복수의 음성 데이터에 기초하여 생성하거나 사용자로부터 입력 받을 수 있다.Thereafter, the transmitting terminal 120 may acquire text data corresponding to the voice message. In some embodiments, the transmitting terminal 120 may generate text data corresponding to a voice message based on the voice data. A speech recognition technique well known in the art according to the present disclosure may be used to generate the text data. In some other embodiments, the transmitting terminal 120 may receive text corresponding to a voice message from the first user, and generate text data based on the input text. In some examples, at the request of the first user, the transmitting terminal 120 may receive a plurality of voice messages and generate a plurality of voice data from the plurality of voice messages. The transmitting terminal 120 may generate text data corresponding to a plurality of voice messages based on the plurality of voice data or receive input from a user.
일부 실시예에서, 송신 단말(120)은 음성 데이터와 음성 메시지에 해당하는 텍스트 데이터를 결합하여, 데이터 패킷을 생성할 수 있다. 일부 예시에서, 송신 단말(120)은 음성 데이터와 해당 텍스트 데이터를 대응시켜 통합 메시지 데이터를 생성할 수 있으며, 통합 메시지 데이터를 인코딩하여 데이터 패킷을 생성할 수 있다. 제1 사용자의 요청에 의해 복수의 음성 메시지를 수신하는 일부 예시에서, 송신 단말(120)은 각각의 음성 데이터와 텍스트 데이터를 대응시키고, 대응시킨 음성 데이터와 텍스트 데이터의 쌍을 결합하여 통합 메시지 데이터를 생성할 수 있다. In some embodiments, the transmitting terminal 120 may generate a data packet by combining voice data and text data corresponding to the voice message. In some examples, the transmitting terminal 120 may generate integrated message data by matching voice data with corresponding text data, and may generate a data packet by encoding the integrated message data. In some examples of receiving a plurality of voice messages at the request of the first user, the transmitting terminal 120 associates each voice data with text data, and combines the pair of the voice data and text data to be combined, thereby providing integrated message data. Can generate
일부 실시예에서, 서버(115)는 통합 서버일 수 있으며, 송신 단말(120)은 생성된 데이터 패킷을 서버(115)로 전송할 수 있다. 일부 다른 실시예에서, 서버(115)는 중계 서버일 수 있으며, 송신 단말(120)은 생성된 데이터 패킷에 관한 알림 메시지를 생성할 수 있고, 생성된 알림 메시지를 중계 서버(115)로 전송할 수 있다. 이러한 실시예에서, 송신 단말(120)은 이후, 적어도 하나의 수신 단말에 연결하여 직접적으로 데이터 패킷을 전송할 수 있다.In some embodiments, the server 115 may be an integrated server, and the transmitting terminal 120 may transmit the generated data packet to the server 115. In some other embodiments, the server 115 may be a relay server, the transmitting terminal 120 may generate a notification message regarding the generated data packet, and transmit the generated notification message to the relay server 115 have. In this embodiment, the transmitting terminal 120 may then directly transmit data packets by connecting to at least one receiving terminal.
추가적인 일부 실시예에서, 인스턴트 메시지 서비스가 제공되는 중에, 제1 사용자에 대한 제1 캐릭터와 제2 사용자에 대한 제2 캐릭터가 송신자 장치(120) 및/또는 수신자 장치(13) 상에서 디스플레이 될 수 있다. 송신자 장치(120)는 인스턴트 메시지를 수신자 장치(130)에 전송하면서, 제1 캐릭터에 대한 캐릭터 데이터 또한 함께 전송할 수 있다. 캐릭터 데이터는 제1 캐릭터의 종류, 제1 캐릭터의 표정 또는 제1 캐릭터의 동작 중 적어도 하나에 대한 정보를 포함할 수 있다. 또한, 캐릭터 데이터는 음성 메시지 또는 텍스트 메시지와의 연결 정보를 포함할 수 있다. 이러한 실시예에서, 송신자 장치(120)는 데이터 패킷을 생성함에 있어서, 음성 데이터 및 텍스트 데이터에 더하여 캐릭터 데이터를 더 결합할 수 있다.In some additional embodiments, while the instant message service is being provided, the first character for the first user and the second character for the second user can be displayed on the sender device 120 and / or the recipient device 13. . While transmitting the instant message to the recipient device 130, the sender device 120 may also transmit character data for the first character. The character data may include information on at least one of the type of the first character, the expression of the first character, or the operation of the first character. Also, the character data may include connection information with a voice message or text message. In this embodiment, the sender device 120 may further combine character data in addition to voice data and text data in generating a data packet.
데이터 패킷이 송신 단말(120)로부터 통합 서버와 같은 서버(115)를 통하여 수신 단말(130)로 전송되는 일부 예시에서, 서버(115)는 송신 단말(120)로부터 수신된 데이터 패킷으로부터의 데이터(예컨대, 음성 데이터, 텍스트 데이터, 캐릭터 데이터, 등)를 저장할 수 있다. 서버(115)는 음성 메시지를 음성 인식된 텍스트 메시지와 대응하여 저장할 수 있다. In some examples in which a data packet is transmitted from the transmitting terminal 120 to the receiving terminal 130 through the server 115 such as an integrated server, the server 115 may include data from the data packet received from the transmitting terminal 120 ( For example, voice data, text data, character data, etc.) may be stored. The server 115 may store the voice message in correspondence with the voice-recognized text message.
데이터 패킷이 송신 단말(120)로부터 수신 단말(130)로 직접적으로 전송되는 일부 예시에서, 서버(115)는 송신 단말(120)로부터 알림 메시지를 수신하고, 수신 단말(130)에 알림 메시지를 전송할 수 있으며, 수신 단말(130)은 서버(115)로부터 송신 단말(120)로부터 수신된 인스턴트 메시지에 대한 알림 메시지를 수신할 수 있다.In some examples in which data packets are transmitted directly from the transmitting terminal 120 to the receiving terminal 130, the server 115 receives the notification message from the transmitting terminal 120 and transmits the notification message to the receiving terminal 130. The receiving terminal 130 may receive a notification message for the instant message received from the transmitting terminal 120 from the server 115.
수신 단말(130)은 서버(115)에 접속할 수 있다. 일부 실시예에서, 수신 단말(130)은 송신 단말(120)에 의해 전송된 데이터 패킷을 서버(115)로부터 수신할 수 있다. 일부 다른 실시예에서, 수신 단말(130)은 송신 단말(120)에 의해 전송된 데이터 패킷에 대한 알림 메시지를 서버(115)로부터 수신할 수 있다. 수신 단말(130)은 수신된 알림 메시지에 응답하여, 송신 단말(120)에 연결할 수 있고, 데이터 패킷을 송신 단말(120)로부터 수신할 수 있다. 이러한 실시예에서, 서버(115)로부터 수신된 알림 메시지는 송신 단말(120)로부터 수신된 음성 메시지를 포함하는 송신 단말(130)로의 하나 이상의 음성 메시지에 대한 표시를 포함할 수 있다.The receiving terminal 130 can access the server 115. In some embodiments, the receiving terminal 130 may receive a data packet transmitted by the transmitting terminal 120 from the server 115. In some other embodiments, the receiving terminal 130 may receive a notification message for the data packet transmitted by the transmitting terminal 120 from the server 115. The receiving terminal 130 may connect to the transmitting terminal 120 in response to the received notification message, and receive a data packet from the transmitting terminal 120. In this embodiment, the notification message received from the server 115 may include an indication of one or more voice messages to the transmitting terminal 130 including the voice message received from the transmitting terminal 120.
수신 단말(130)은 수신된 데이터 패킷으로부터 음성 데이터 또는 텍스트 데이터 중 적어도 하나를 획득할 수 있다. 일부 예시에서, 송신 단말(120)는 상술된 바와 같이, 음성 메시지를 입력받을 수 있으며, 음성 메시지로부터의 음성 데이터 및 음성 메시지에 해당하는 텍스트 데이터를 포함하는 데이터 패킷을 수신 단말(130)을 향하여 전송할 수 있다. 수신 단말(130)은 데이터 패킷을 수신하고, 수신된 데이터 패킷으로부터 음성 데이터 및 음성 메시지에 해당하는 텍스트 데이터를 획득할 수 있다.The receiving terminal 130 may acquire at least one of voice data or text data from the received data packet. In some examples, the transmitting terminal 120 may receive and receive a voice message, as described above, and transmit a data packet including voice data from the voice message and text data corresponding to the voice message to the receiving terminal 130 Can transmit. The receiving terminal 130 may receive a data packet and obtain voice data and text data corresponding to a voice message from the received data packet.
일부 다른 실시예에서, 수신 단말(130)은 수신된 데이터 패킷으로부터 음성 데이터를 획득할 수 있다. 일부 예시에서, 송신 단말(120)은 음성 메시지를 입력 받을 수 있으며, 이러한 음성 메시지 만을 포함하는 데이터 패킷을 수신 단말(130)을 향하여 전송할 수 있다. 수신 단말(130)은 이러한 데이터 패킷을 수신하고, 데이터 패킷으로부터 음성 데이터를 획득하고 텍스트 데이터를 획득하지 않을 수 있다. 수신 단말(130)은 획득된 음성 데이터에 기초하여, 음성 메시지에 해당하는 텍스트 데이터를 생성할 수 있다. 텍스트 데이터의 생성에는 송신 단말(120)에 관하여 상술한 바와 마찬가지로, 잘 알려진 음성 인식 기법이 이용될 수 있다. 일 예시에서, 수신 단말(130)은 수신된 데이터 패킷으로부터 음성 메시지에 해당하는 텍스트 데이터를 획득할 수 없다고 결정할 수 있으며, 이러한 결정에 응답하여, 음성 데이터에 기초하여, 음성 메시지에 해당하는 텍스트 데이터를 생성할 수 있다.In some other embodiments, the receiving terminal 130 may acquire voice data from the received data packet. In some examples, the transmitting terminal 120 may receive a voice message, and may transmit a data packet including only the voice message toward the receiving terminal 130. The receiving terminal 130 may receive such a data packet, acquire voice data from the data packet, and may not acquire text data. The receiving terminal 130 may generate text data corresponding to a voice message based on the obtained voice data. As described above with respect to the transmitting terminal 120, a well-known speech recognition technique can be used to generate text data. In one example, the receiving terminal 130 may determine that it is not possible to obtain text data corresponding to a voice message from the received data packet, and in response to this determination, text data corresponding to the voice message based on the voice data Can generate
일부 다른 실시예에서, 수신 단말(130)은 수신된 데이터 패킷으로부터 텍스트 데이터를 획득할 수 있다. 일부 예시에서, 송신 단말(120)은 제1 사용자로부터 텍스트를 입력 받을 수 있으며, 이러한 텍스트 만을 포함하는 데이터 패킷을 수신 단말(130)을 향하여 전송할 수 있다. 일부 다른 예시에서, 송신 단말(120)은 제1 사용자로부터 음성 메시지를 입력 받을 수 있고, 음성 메시지로부터 음성 데이터를 생성하고, 음성 인식 기법의 이용 또는 사용자 입력에 의해 생성된 음성 메시지에 대응하는 텍스트 데이터를 음성 데이터와 결합한 데이터 패킷을 수신 단말(130)을 향하여 전송할 수 있고, 전송 환경, 송수신 단말의 동작 이상, 등의 다양한 이유로, 음성 데이터가 손실될 수 있다. 이후, 수신 단말(130)은 수신된 데이터 패킷으로부터 텍스트 데이터를 획득하고, 획득된 텍스트 데이터에 기초하여, 텍스트 데이터에 해당하는 음성 데이터를 생성할 수 있다. 일 예시에서, 수신 단말(130)은 데이터 패킷으로부터 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없다고 결정할 수 있고, 이러한 결정에 응답하여, 텍스트 데이터에 기초한 음성 데이터를 생성할 수 있다.In some other embodiments, the receiving terminal 130 may acquire text data from the received data packet. In some examples, the transmitting terminal 120 may receive text from the first user, and may transmit a data packet including only the text toward the receiving terminal 130. In some other examples, the transmitting terminal 120 may receive a voice message from a first user, generate voice data from the voice message, and use the voice recognition technique or text corresponding to the voice message generated by the user input A data packet combining data with voice data may be transmitted toward the receiving terminal 130, and voice data may be lost for various reasons, such as a transmission environment, an abnormal operation of a transmitting / receiving terminal, and the like. Thereafter, the receiving terminal 130 may acquire text data from the received data packet, and generate voice data corresponding to the text data based on the obtained text data. In one example, the receiving terminal 130 may determine that the voice data corresponding to the text data cannot be obtained from the data packet, and in response to the determination, the voice data based on the text data may be generated.
일부 실시예에서, 수신 단말(130)은 생성 또는 획득된 음성 데이터 및 텍스트 데이터를 수신 단말(130) 내부에 저장할 수 있다. 일부 예시에서, 수신 단말(130)은 수신된 음성 데이터와 텍스트 데이터를 대응지어 저장할 수 있다.In some embodiments, the receiving terminal 130 may store the generated or acquired voice data and text data inside the receiving terminal 130. In some examples, the receiving terminal 130 may store the received voice data and text data in association.
일부 실시예에서, 수신 단말(130)은 음성 데이터에 기초하여, 음성 데이터에 대응하는 음성 메시지를 재생할 수 있다. 또한, 수신 단말(130)은 텍스트 데이터에 기초하여, 음성 메시지의 재생과 함께, 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 할 수 있다. 일부 예시에서, 수신 단말(130)은 하나 이상의 음성 메시지를 재생하기 위한 음성 메시지 재생 요청을 사용자(제2 사용자)로부터 수신할 수 있다. 수신 단말(130)은 음성 메시지 재생 요청에 응답하여, 하나 이상의 음성 데이터에 기초한 하나 이상의 음성 메시지를 순차적으로 재생할 수 있다. 이와 같이, 음성 메시지는 음성 메시지의 수신과는 비동기적으로 재생될 수 있다. 추가적으로, 음성 메시지의 재생은 사용자의 요청에 의해, 일시 정지 되거나, 중단되거나, 이전 음성 메시지 또는 다음 음성 메시지를 재생하도록 제어될 수 있다. 수신 단말(130)은 음성 메시지의 재생에 대응하여, 해당하는 텍스트 메시지를 디스플레이 할 수 있다.In some embodiments, the receiving terminal 130 may play a voice message corresponding to the voice data based on the voice data. Also, the reception terminal 130 may display a text message corresponding to the text data, along with the reproduction of the voice message, based on the text data. In some examples, the receiving terminal 130 may receive a voice message play request for playing one or more voice messages from a user (second user). The receiving terminal 130 may sequentially play one or more voice messages based on one or more voice data in response to the voice message reproduction request. As such, the voice message can be reproduced asynchronously with the reception of the voice message. Additionally, the playback of the voice message may be paused, stopped, or controlled to play the previous voice message or the next voice message at the user's request. The receiving terminal 130 may display a corresponding text message in response to the reproduction of the voice message.
추가적인 일부 실시예에서, 수신 단말(130)이 하나 이상의 음성 메시지를 재생하기 전에, 수신 단말(130)은 미리 정해진 검열 조건에 기초하여, 텍스트 데이터에 해당하는 텍스트 메시지를 필터링할 수 있다. 예컨대, 미리 정해진 검열 조건은 욕설, 비속어, 등을 포함할 수 있지만, 이에 제한되지 않는다. 수신 단말(130)은 필터링의 결과에 기초하여 필터링되지 않은 해당 음성 메시지를 재생할 수 있다. 예컨대, 음성 인식된 텍스트 메시지에 비속어가 포함되는 경우, 수신 단말(130)은 텍스트 메시지에 대응하는 음성 메시지의 적어도 일부를 묵음(mute)처리할 수 있다. 이러한 필터링 처리는 수신 단말(130)이 수행하는 것에 한정되지 않으며, 일부 실시예에서는 서버(115) 또는 송신 단말(120)이 데이터 패킷을 전송하기 전에 필터링 처리를 수행할 수 있다.In some additional embodiments, before the receiving terminal 130 plays one or more voice messages, the receiving terminal 130 may filter the text message corresponding to the text data based on a predetermined censorship condition. For example, the predetermined censorship conditions may include profanity, profanity, and the like, but are not limited thereto. The receiving terminal 130 may play a corresponding unfiltered voice message based on the filtering result. For example, when a slang is included in the voice-recognized text message, the receiving terminal 130 may mute at least a part of the voice message corresponding to the text message. The filtering process is not limited to what the receiving terminal 130 performs, and in some embodiments, the filtering process may be performed before the server 115 or the transmitting terminal 120 transmits a data packet.
일부 실시예에서, 수신 단말(130)은 하나 이상의 음성 데이터를 미리 정해진 조건에 기초하여 삭제할 수 있는 한편, 대응하는 하나 이상의 텍스트 데이터를 남길 수 있다.. 일부 예시에서, 수신 단말(130)은 음성 메시지의 재생이 종료되면 해당 음성 데이터를 삭제할 수 있다. 일부 다른 예시에서, 수신 단말(130)은 미리 정해진 저장 용량 조건에 기초하여, 오래된 음성 데이터를 삭제할 수 있다.In some embodiments, the receiving terminal 130 may delete one or more voice data based on a predetermined condition, while leaving the corresponding one or more text data. In some examples, the receiving terminal 130 may When playback of the message ends, the corresponding voice data can be deleted. In some other examples, the receiving terminal 130 may delete old voice data based on a predetermined storage capacity condition.
추가적인 일부 실시예에서, 수신 단말(130)은 데이터 패킷으로부터 캐릭터 데이터를 획득할 수 있다. 일부 예시에서, 수신 단말(130)은 제1 사용자에 대한 제1 캐릭터에 대한 캐릭터 데이터를 획득할 수 있다. 수신 단말(130)은, 캐릭터 데이터에 기초하여, 텍스트 메시지의 디스플레이 및 음성 메시지의 재생과 함께 캐릭터를 디스플레이 할 수 있다.In some additional embodiments, the receiving terminal 130 may obtain character data from the data packet. In some examples, the receiving terminal 130 may obtain character data for the first character for the first user. The reception terminal 130 may display the character together with the display of the text message and the reproduction of the voice message, based on the character data.
도 2는 본 개시의 적어도 일부 실시예에 따른 송신 단말(200)을 개략적으로 도시하는 블록도이다. 도 2에 도시된 바와 같이, 송신 단말(200)은 음성 입력 모듈(210), 음성 데이터 생성 모듈(220), 텍스트 데이터 생성 모듈(230), 데이터 패킷 생성 모듈(250) 및 통신 모듈(260)을 포함할 수 있다. 추가적으로, 송신 단말(200)은 캐릭터 모듈(240) 및 알림 생성 모듈(270)을 더 포함할 수 있다. 음성 입력 모듈(210), 텍스트 입력 모듈(232), 카메라(242) 및 동작 입력 모듈(244)은 사용자로부터의 입력을 수신하기 위한 사용자 인터페이스(User Interface; UI)의 일 예시이다. 송신 단말(200)에 포함되는 컴포넌트는 각각 개별적으로 구현될 수 있거나, 컴포넌트 중 둘 이상이 결합되어 하나의 컴포넌트를 형성하는 방식으로 구현될 수 있다. 도 2에서 컴포넌트 사이의 연결들[예컨대, 음성 데이터 모듈(220)과 음성 입력 모듈(210), 음성 인식 모듈(234) 또는 데이터 패킷 생성 모듈 사이의 연결, 등]은 단지 설명의 편의를 위한 것이며, 각 컴포넌트들의 연결은 이러한 연결에 제한되지 않는다. 이하에서, 보다 구체적으로 설명되는 바와 같이, 송신 단말(200)은 인스턴트 메시지 서비스 어플리케이션을 실행하도록 구성되며, 인스턴트 메시지를 생성 및 송신할 수 있다. 송신 단말(200)은 다양한 컴퓨팅 장치일 수 있으며, 예컨대, 스마트폰, 태블릿 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 휴대 전화기, 개인 휴대용 단말기(PDA), 특정 용도 장치 또는 상기 기능 중 임의의 것을 포함하는 융합 장치와 같은 소형 폼팩터 휴대용(모바일) 전자 장치를 포함할 수 있다.2 is a block diagram schematically illustrating a transmitting terminal 200 according to at least some embodiments of the present disclosure. As shown in FIG. 2, the transmitting terminal 200 includes a voice input module 210, a voice data generation module 220, a text data generation module 230, a data packet generation module 250 and a communication module 260. It may include. Additionally, the transmitting terminal 200 may further include a character module 240 and a notification generating module 270. The voice input module 210, the text input module 232, the camera 242, and the motion input module 244 are examples of a user interface (UI) for receiving input from a user. The components included in the transmitting terminal 200 may be individually implemented, or two or more of the components may be combined to form a single component. The connections between the components in FIG. 2 (eg, the connection between the voice data module 220 and the voice input module 210, the voice recognition module 234 or the data packet generation module, etc.) are for convenience of explanation only. However, the connection of each component is not limited to this connection. Hereinafter, as described in more detail, the transmitting terminal 200 is configured to execute an instant message service application, and can generate and transmit an instant message. The transmitting terminal 200 may be various computing devices, for example, a smart phone, a tablet computer, a desktop computer, a laptop computer, a mobile phone, a personal digital assistant (PDA), a specific purpose device, or a fusion including any of the above functions Small form factor portable (mobile) electronic devices such as devices.
음성 입력 모듈(210)은 송신 단말(200)의 사용자로부터 음성 메시지를 입력 받도록 구성될 수 있다. 음성 입력 모듈(210)은 사용자의 음성 메시지를 수신할 수 있는 요소, 예컨대, 마이크를 포함할 수 있다. 일부 예시에서, 음성 입력 모듈(210)은 사용자로부터 미리 정해진 시간 동안 음성 메시지를 입력 받을 수 있다. 일부 예시에서, 음성 입력 모듈(210)은 사용자의 요청에 따라, 하나 이상의 음성 메시지를 순차적으로 입력 받을 수 있다. 음성 데이터 생성 모듈(220)은 사용자에 의해 입력된 음성 메시지로부터 해당 음성 데이터를 생성하도록 구성될 수 있다. 이하에서는 본 개시의 기술분야에서 잘 알려진 구성에 대해서는 설명을 생략하고, 본 개시에 따른 구성을 구체적으로 설명한다.The voice input module 210 may be configured to receive a voice message from a user of the transmitting terminal 200. The voice input module 210 may include an element capable of receiving a user's voice message, for example, a microphone. In some examples, the voice input module 210 may receive a voice message from a user for a predetermined time. In some examples, the voice input module 210 may sequentially receive one or more voice messages according to a user's request. The voice data generation module 220 may be configured to generate corresponding voice data from voice messages input by a user. Hereinafter, a description of well-known components in the technical field of the present disclosure will be omitted, and the configuration according to the present disclosure will be described in detail.
텍스트 데이터 생성 모듈(230)은 텍스트 데이터를 생성하도록 구성될 수 있다. 텍스트 데이터 생성 모듈(230)은 텍스트 입력 모듈(232) 및 음성 인식 모듈(234)를 포함할 수 있다. 일부 예시에서, 음성 인식 모듈(234)은 음성 데이터 생성 모듈(220)로부터 음성 데이터를 수신할 수 있으며, 음성 데이터를 이용하여 음성 인식을 수행할 수 있고, 텍스트 데이터 생성 모듈(230)은 음성 인식의 결과에 기초하여, 음성 메시지에 해당하는 텍스트 데이터를 생성할 수 있다. 일부 다른 예시에서, 송신 단말(200)은 사용자에게 음성 메시지에 대응하는 텍스트의 입력을 요청할 수 있고, 텍스트 입력 모듈(232)은 사용자로부터 음성 메시지에 해당하는 텍스트를 입력 받고, 텍스트 데이터 생성 모듈(230)은 입력된 텍스트로부터 텍스트 데이터를 생성할 수 있다.The text data generation module 230 may be configured to generate text data. The text data generation module 230 may include a text input module 232 and a speech recognition module 234. In some examples, the speech recognition module 234 may receive speech data from the speech data generation module 220, and may perform speech recognition using the speech data, and the text data generation module 230 may recognize speech Based on the results of the, it is possible to generate text data corresponding to the voice message. In some other examples, the transmitting terminal 200 may request a user to input text corresponding to a voice message, and the text input module 232 receives text corresponding to a voice message from the user, and the text data generation module ( 230) may generate text data from the input text.
데이터 패킷 생성 모듈(250)은 음성 데이터 생성 모듈(220)에 의해 생성된 음성 데이터와 텍스트 데이터 생성 모듈(230)에 의해 생성된 텍스트 데이터를 결합하여 데이터 패킷을 생성하도록 구성될 수 있다. 일부 예시에서, 데이터 패킷 생성 모듈(250)은 음성 데이터와 해당 텍스트 데이터를 대응시켜 통합 메시지 데이터를 생성할 수 있으며, 통합 메시지 데이터를 인코딩하여 전송을 위한 데이터 패킷을 생성할 수 있다. 음성 입력 모듈(210)이, 사용자의 요청에 응답하여, 복수의 음성 메시지를 순차적으로 입력 받은 경우, 텍스트 데이터 생성 모듈(230)은 복수의 음성 메시지 각각에 해당하는 텍스트 데이터를 생성할 수 있으며, 데이터 패킷 생성 모듈(250)은 각각의 음성 데이터와 텍스트 데이터를 대응시키고, 대응시킨 음성 데이터와 텍스트 데이터의 쌍을 결합하여 통합 메시지 데이터를 생성할 수 있다.The data packet generation module 250 may be configured to combine the voice data generated by the voice data generation module 220 and the text data generated by the text data generation module 230 to generate a data packet. In some examples, the data packet generation module 250 may generate voice message data and corresponding text data to generate integrated message data, and encode the integrated message data to generate a data packet for transmission. When the voice input module 210 receives a plurality of voice messages sequentially in response to a user's request, the text data generation module 230 may generate text data corresponding to each of the plurality of voice messages, The data packet generation module 250 may correspond to each voice data and text data, and combine the paired voice data and text data to generate integrated message data.
일부 실시예에서, 통신 모듈(260)은 인스턴트 메시지 서비스를 제공하는 통합 서버와 네트워크를 통해 데이터 통신 가능하게 연결될 수 있다. 이러한 실시예에서, 통신 모듈(260)은 데이터 패킷 생성 모듈(250)에 의해 생성된 데이터 패킷을 통합 서버로 전송할 수 있다.In some embodiments, the communication module 260 may be capable of data communication via an integrated server providing an instant message service through a network. In this embodiment, the communication module 260 may transmit the data packet generated by the data packet generation module 250 to the integrated server.
일부 다른 실시예에서, 통신 모듈(260)은 인스턴트 메시지 서비스를 제공하는 중계 서버와 네트워크를 통해 데이터 통신 가능하게 연결될 수 있다. 이러한 실시예에서, 알림 생성 모듈(270)은 데이터 패킷 생성 모듈(250)에 의해 생성된 데이터 패킷에 관한 알림 메시지를 생성하도록 구성될 수 있다. 알림 메시지는 음성 메시지 및/또는 텍스트 메시지에 대한 표시를 포함할 수 있다. 통신 모듈(260)은 알림 생성 모듈(270)에 의해 생성된 알림 메시지를 중계 서버로 전송하도록 구성될 수 있다. 이후, 통신 모듈(260)은 인스턴트 메시지 서비스 어플리케이션을 실행하는 적어도 하나의 수신 단말과 직접적으로 통신 가능하도록 연결될 수 있고, 데이터 패킷을 직접적으로 전송할 수 있다.In some other embodiments, the communication module 260 may be communicatively connected to a relay server providing an instant message service through a network. In this embodiment, the notification generation module 270 may be configured to generate a notification message regarding the data packet generated by the data packet generation module 250. The notification message can include an indication of the voice message and / or text message. The communication module 260 may be configured to transmit the notification message generated by the notification generation module 270 to the relay server. Thereafter, the communication module 260 may be connected to enable direct communication with at least one receiving terminal executing the instant message service application, and may directly transmit data packets.
추가적인 일부 실시예에서, 인스턴트 메시지 서비스가 송신 단말(200) 상에서 제공되는 중에 송신자 또는 수신자의 캐릭터가 송신 단말(200) 상에서 디스플레이 될 수 있으며, 송신 단말(200)은 캐릭터 모듈(240)을 더 포함할 수 있다. 캐릭터 모듈(240)은 캐릭터에 관한 정보를 획득하고, 획득된 캐릭터에 관한 정보로부터 캐릭터 데이터를 생성하도록 구성될 수 있다. 이러한 실시예에서, 데이터 패킷 생성 모듈은 음성 데이터 생성 모듈(220)로부터의 음성 데이터, 텍스트 데이터 생성 모듈(230)로부터의 텍스트 데이터 및 캐릭터 모듈(240)로부터의 캐릭터 데이터를 결합하여, 데이터 패킷을 생성하도록 구성될 수 있다. 캐릭터 데이터는 사용자의 캐릭터의 종류, 캐릭터의 표정 또는 캐릭터의 동작 중 적어도 하나에 대한 정보를 포함할 수 있다.In some additional embodiments, the sender or recipient's character may be displayed on the transmitting terminal 200 while the instant message service is provided on the transmitting terminal 200, and the transmitting terminal 200 further includes a character module 240 can do. The character module 240 may be configured to acquire information about a character and generate character data from the information about the acquired character. In this embodiment, the data packet generation module combines voice data from the voice data generation module 220, text data from the text data generation module 230, and character data from the character module 240 to generate a data packet. It can be configured to generate. The character data may include information on at least one of the type of the user's character, the expression of the character, or the behavior of the character.
캐릭터 모듈(240)은 카메라(242), 동작 입력 모듈(244) 및 텍스트 인식 모듈(246)을 포함할 수 있다. 카메라(242)는 사용자의 얼굴 정보를 획득할 수 있으며, 캐릭터 모듈(240)은 카메라(242)에 의해 획득된 얼굴 정보에 기초하여, 캐릭터의 표정을 결정할 수 있다. 일 예시에서, 음성 입력 모듈(210)이 사용자로부터 음성 메시지를 입력받는 한편, 카메라(242)는 사용자의 얼굴 정보를 획득하고 캐릭터 모듈(240)은 얼굴 정보에 기초하여 캐릭터의 표정을 결정할 수 있다. 동작 입력 모듈(244)은 사용자로부터 캐릭터의 동작에 대한 입력을 받을 수 있다. 예컨대, 사용자는 사용자에게 제시되는 캐릭터의 동작에 관한 목록으로부터 적어도 하나의 동작을 선택할 수 있다. 텍스트 인식 모듈(246)은 텍스트 데이터 생성 모듈(230)에 의해 생성된 텍스트 데이터에 기초하여, 캐릭터의 동작과 연관된 문자를 인식할 수 있다. 일부 예시에서, 캐릭터 모듈(240)은 인식된 문자에 기초하여, 캐릭터의 동작을 결정할 수 있다. 일부 다른 예시에서, 텍스트 인식 모듈(246)은 인식된 문자를 캐릭터의 동작과 연결시킬 수 있으며, 동작 입력 모듈(244)은 사용자는 인식된 문자에 대한 선택을 사용자로부터 입력 받음으로써, 캐릭터 모듈(240)이 캐릭터의 동작을 결정할 수 있다.The character module 240 may include a camera 242, a motion input module 244, and a text recognition module 246. The camera 242 may acquire face information of the user, and the character module 240 may determine the facial expression of the character based on the face information obtained by the camera 242. In one example, while the voice input module 210 receives a voice message from the user, the camera 242 acquires the user's face information and the character module 240 can determine the facial expression of the character based on the face information . The motion input module 244 may receive input of a character's motion from a user. For example, the user may select at least one action from a list of actions of the character presented to the user. The text recognition module 246 may recognize a character associated with an action of the character, based on the text data generated by the text data generation module 230. In some examples, the character module 240 may determine the behavior of the character based on the recognized character. In some other examples, the text recognition module 246 may associate the recognized character with the motion of the character, and the motion input module 244 may allow the user to input a selection for the recognized character, from the user, the character module ( 240) can determine the behavior of the character.
추가적으로 또는 선택적으로, 사용자는 송신 단말(200) 상에 디스플레이 되는 텍스트 메시지, 캐릭터의 표정, 동작, 등을 확인한 후에, 인스턴트 메시지의 전송을 결정할 수 있다.Additionally or alternatively, the user may determine the transmission of the instant message after confirming the text message, the facial expression, the action, and the like displayed on the transmitting terminal 200.
도 3은 본 개시의 적어도 일부 실시예에 따라, 송신 단말에서 수행되는 일 예시적인 프로세스(300)를 도시하는 흐름도이다. 예컨대, 프로세스(300)는 도 1의 송신 단말(120), 도 2의 송신 단말(200)과 같은 컴퓨팅 장치의 제어 하에서 수행될 수 있다. 도 2에 도시된 프로세스(300)는 블록(310, 320, 330, 340, 350, 360 및/또는 370)에 의하여 예시된 바와 같은 하나 이상의 동작, 기능 또는 작용을 포함할 수 있다. 다양한 블록은 설명된 실시예로 제한하려고 의도되지는 않는다. 예컨대, 당업자는 여기에서 개시된 프로세스에 대하여, 프로세스 및 방법에서 수행되는 기능이 상이한 순서로 구현될 수 있다는 점을 인정할 것이다. 또한, 도 3에 예시된 개략적인 동작들은 예시로서만 제공되고, 개시된 실시예의 본질을 벗어나지 않으면서, 동작들중 일부가 선택적일 수 있거나, 더 적은 동작으로 조합될 수 있거나, 추가적인 동작으로 확장될 수 있다. 프로세스(300)는 음성 메시지를 입력 받는 블록(310)에서 시작할 수 있다.3 is a flow diagram illustrating an exemplary process 300 performed in a transmitting terminal, in accordance with at least some embodiments of the present disclosure. For example, the process 300 may be performed under the control of a computing device, such as the transmitting terminal 120 of FIG. 1 and the transmitting terminal 200 of FIG. 2. The process 300 shown in FIG. 2 can include one or more actions, functions, or actions as illustrated by blocks 310, 320, 330, 340, 350, 360 and / or 370. The various blocks are not intended to be limited to the described embodiment. For example, those skilled in the art will appreciate that for the processes disclosed herein, the functions performed in the processes and methods may be implemented in different orders. In addition, the schematic operations illustrated in FIG. 3 are provided by way of example only, and some of the operations may be optional, combined with fewer operations, or extended to additional operations without departing from the essence of the disclosed embodiment. You can. The process 300 can begin at block 310 receiving a voice message.
블록(310)에서, 컴퓨팅 장치는 사용자로부터 음성 메시지를 입력 받을 수 있다. 일부 예시에서, 컴퓨팅 장치는 사용자로부터 미리 정해진 시간 동안 음성 메시지를 입력 받을 수 있다. 일부 예시에서, 컴퓨팅 장치는, 사용자의 요청에 따라, 하나 이상의 음성 메시지를 순차적으로 입력 받을 수 있다. 프로세스(300)는 블록(310)에서 음성 데이터를 생성하는 블록 (320)으로 이어질 수 있으며, 컴퓨팅 장치는 사용자에 의해 입력된 음성 메시지로부터 해당 음성 데이터를 생성하도록 구성될 수 있다. 프로세스(300)는 블록(320)에서, 음성 메시지 대응 텍스트 입력이 있는지 여부를 결정하는 블록(330)으로 이어질 수 있다.In block 310, the computing device may receive a voice message from a user. In some examples, the computing device may receive a voice message from a user for a predetermined time. In some examples, the computing device may sequentially receive one or more voice messages at the user's request. Process 300 may continue to block 320 for generating voice data at block 310, and the computing device may be configured to generate the corresponding voice data from the voice message input by the user. The process 300 can continue at block 320 to block 330 to determine if there is text input corresponding to the voice message.
블록(330)에서 컴퓨팅 장치는 음성 메시지에 대응한 텍스트 입력이 있는지 여부를 결정할 수 있다. 예컨대, 사용자는 음성 메시지를 입력하고, 해당 음성 메시지에 대응하는 텍스트를 입력하겠다는 요청을 입력할 수 있으며, 그러한 요청이 없는 경우, 컴퓨팅 장치는 음성 메시지에 대응한 텍스트가 사용자에 의해 입력되지 않는 것으로 결정할 수 있다. 프로세스(300)는 음성 메시지에 대응한 텍스트가 사용자에 의해 입력되지 않는 경우, 음성 데이터에 기초하여 텍스트 데이터를 생성하는 블록(340)으로 이어질 수 있다. 블록(340)에서, 컴퓨팅 장치는 음성 데이터를 이용하여 음성 인식을 수행할 수 있다. 컴퓨팅 장치는 음성 인식의 결과에 기초하여, 음성 메시지에 해당하는 텍스트 데이터를 생성할 수 있다. 프로세스(300)는 블록(340)으로부터 데이터 패킷을 생성하는 블록(360)으로 이어질 수 있다.In block 330, the computing device may determine whether there is text input corresponding to the voice message. For example, the user may enter a voice message, and may enter a request to enter text corresponding to the voice message, and if there is no such request, the computing device determines that the text corresponding to the voice message is not input by the user. Can decide. If the text corresponding to the voice message is not input by the user, the process 300 may continue to block 340 for generating text data based on the voice data. In block 340, the computing device may perform speech recognition using speech data. The computing device may generate text data corresponding to the voice message based on the result of the voice recognition. Process 300 can continue from block 340 to block 360 that generates a data packet.
블록(330)에서, 음성 메시지에 대응하는 텍스트가 사용자에 의해 입력되는 경우, 프로세스(300)는 블록(330)으로부터 텍스트를 입력 받아 텍스트 데이터를 생성하는 블록(350)으로 이어질 수 있다. 블록(350)에서, 컴퓨팅 장치는 사용자에게 음성 메시지에 대응하는 텍스트를 입력 받을 수 있다. 사용자는 터치패드, 키보드, 마우스, 등과 같은 다양한 입력 장치를 이용하여 텍스트를 입력할 수 있다. 컴퓨팅 장치는 사용자에 의해 입력된 텍스트로부터 텍스트 데이터를 생성할 수 있다. 프로세스(300)는 블록(350)으로부터 데이터 패킷을 생성하는 블록(360)으로 이어질 수 있다.In block 330, when the text corresponding to the voice message is input by the user, the process 300 may continue to block 350 for receiving text from block 330 and generating text data. In block 350, the computing device may receive text corresponding to a voice message from the user. The user can input text using various input devices such as a touch pad, a keyboard, a mouse, and the like. The computing device may generate text data from text input by the user. Process 300 can continue from block 350 to block 360 that generates a data packet.
블록(360)에서, 컴퓨팅 장치는 블록(320)에서 생성된 음성 데이터와 블록(340 또는 350)에서 생성된 텍스트 데이터를 결합하여, 데이터 패킷을 생성할 수 있다. 일부 예시에서, 컴퓨팅 장치는 음성 데이터와 해당 텍스트 데이터를 대응시켜 통합 메시지 데이터를 생성할 수 있으며, 통합 메시지 데이터를 인코딩하여 전송을 위한 데이터 패킷을 생성할 수 있다. 블록(310)에서, 사용자의 요청에 응답하여, 복수의 음성 메시지를 순차적으로 입력 받은 경우, 블록(360)에서 컴퓨팅 장치는 복수의 음성 메시지 각각에 해당하는 텍스트 데이터를 생성할 수 있으며, 각각의 음성 데이터와 텍스트 데이터를 대응시키고, 대응시킨 음성 데이터와 텍스트 데이터의 쌍을 결합하여 통합 메시지 데이터를 생성할 수 있다. In block 360, the computing device may generate a data packet by combining the voice data generated in block 320 and the text data generated in block 340 or 350. In some examples, the computing device may generate voice message data and corresponding text data to generate integrated message data, and encode the integrated message data to generate a data packet for transmission. In block 310, in response to a user's request, if a plurality of voice messages are sequentially input, in block 360, the computing device may generate text data corresponding to each of the plurality of voice messages. The voice data and the text data can be matched, and a pair of the corresponding voice data and text data can be combined to generate integrated message data.
추가적인 일부 실시예에서, 컴퓨팅 장치는 블록(360)을 수행하기 전에 사용자의 캐릭터에 관한 정보를 획득하고 획득된 캐릭터에 관한 정보로부터 캐릭터 데이터를 생성할 수 있고, 여기서 캐릭터는 컴퓨팅 장치 상에서 디스플레이 가능하다. 일부 예시에서, 컴퓨팅 장치는 캐릭터의 표정, 동작, 등과 같은 캐릭터에 관한 정보를 입력을 받을 수 있다. 일부 다른 예시에서, 컴퓨팅 장치는 카메라, 등의 장치를 이용하여, 캐릭터에 관한 정보를 획득할 수 있다. 에 관한 이러한 실시예에서, 컴퓨팅 장치는 블록(360)에서, 음성 데이터 및 텍스트 데이터에 더하여, 캐릭터 데이터를 더 결합하여, 데이터 패킷을 생성할 수 있다.In some additional embodiments, the computing device may obtain information about the user's character before performing block 360 and generate character data from the information about the obtained character, where the character is displayable on the computing device . In some examples, the computing device may receive information about a character, such as a character's facial expression, motion, or the like. In some other examples, the computing device may obtain information about the character using a device, such as a camera. In this embodiment with respect to, the computing device may, at block 360, further combine character data, in addition to voice data and text data, to generate a data packet.
프로세스(300)는 블록(360)에서 데이터 패킷을 전송하는 블록(370)으로 이어질 수 있다. 일부 실시예에서, 일부 실시예에서, 컴퓨팅 장치는 블록(370)을 수행하기 전에, 전송될 텍스트 메시지, 캐릭터의표정, 동작, 등에 대한, 사용자의 확인을 수신할 수 있다. Process 300 may continue at block 360 to block 370 that transmits the data packet. In some embodiments, in some embodiments, the computing device may receive a user's confirmation of text message, character expression, action, etc., to be transmitted before performing block 370.
블록(370)에서, 컴퓨팅 장치는 생성된 데이터 패킷을 적어도 하나의 수신 단말을 향하여 전송할 수 있다. 일부 실시예에서, 컴퓨팅 장치는 인스턴트 메시지 서비스를 제공하는 통합 서버와 네트워크를 통해 데이터 통신 가능하게 연결될 수 있다. 통합 서버는 도 11에 관하여 보다 자세히 설명되는 바와 같이, 음성 데이터 및 텍스트 데이터를 컴퓨팅 장치로부터 수신하고, 저장하고, 적어도 수신자 단말로 전송할 수 있다. 일부 다른 실시예에서, 컴퓨팅 장치는 인스턴트 메시지 서비스를 제공하는 중계 서버와 네트워크를 통해 데이터 통신 가능하게 연결될 수 있으며, 컴퓨팅 장치는 적어도 하나의 수신 단말과 직접적으로 통신 가능하도록 연결될 수 있다. 이러한 실시예에서, 컴퓨팅 장치는 데이터 패킷에 관한 알림 메시지를 생성할 수 있다. 컴퓨팅 장치는 알림 메시지를 중계 서버로 전송할 수 있다. 이후, 적어도 하나의 수신 단말이 컴퓨팅 장치에 연결되면, 컴퓨팅 장치는 데이터 패킷을 연결된 적어도 하나의 수신 단말에 직접적으로 전송할 수 있다.In block 370, the computing device may transmit the generated data packet to at least one receiving terminal. In some embodiments, the computing device may be capable of data communication via a network with an integrated server that provides instant messaging services. The integrated server may receive, store, and at least transmit voice data and text data from the computing device to the recipient terminal, as described in more detail with respect to FIG. 11. In some other embodiments, the computing device may be communicatively connected to a relay server providing an instant message service through a network, and the computing device may be communicatively connected to at least one receiving terminal. In this embodiment, the computing device can generate a notification message about the data packet. The computing device can send the notification message to the relay server. Thereafter, when at least one receiving terminal is connected to the computing device, the computing device may directly transmit a data packet to the connected at least one receiving terminal.
도 4는 본 개시의 적어도 일부 실시예에 따른 수신 단말(400)을 개략적으로 도시하는 블록도이다. 도 4에 도시된 바와 같이, 수신 단말(400)은 통신 모듈(410), 데이터 획득 모듈(420), 데이터 보완 모듈(430), 출력 모듈(440) 및 메모리(450)를 포함할 수 있다. 수신 단말(400)에 포함되는 컴포넌트는 각각 개별적으로 구현될 수 있거나, 컴퓨턴트 중 둘 이상이 결합되어 하나의 컴포넌트를 형성하는 방식으로 구현될 수 있다. 도 4에서 도시된 컴포넌트 사이의 연결들[예컨대, 데이터 획득 모듈(420)과 데이터 보완 모듈(430) 및 출력 모듈(440) 사이의 연결, 등]은 단지 설명의 편의를 위한 것이며, 각 컴포넌트들의 연결은 이러한 연결에 제한되지 않는다. 예컨대, 메모리는 도 4에서 연결이 없는 것으로 도시되었지만, 구현예에 따라, 통신 모듈(410), 데이터 획득 모듈(420), 데이터 보완 모듈(430) 및 출력 모듈(440) 중 적어도 하나와 동작 가능하게 연결될 수 있다. 수신 단말(400)은 다양한 컴퓨팅 장치일 수 있으며, 예컨대, 스마트폰, 태블릿 컴퓨터, 데스크탑 컴퓨터, 랩탑 컴퓨터, 휴대 전화기, 개인 휴대용 단말기(PDA), 특정 용도 장치 또는 상기 기능 중 임의의 것을 포함하는 융합 장치와 같은 소형 폼팩터 휴대용(모바일) 전자 장치를 포함할 수 있다. 또한, 수신 단말(400)은 도 2에서 설명된 송신 단말(200)과 일체로 구현될 수 있으며, 일부 컴포넌트는 하나의 개체에서 구현될 수 있다. 예컨대, 구현예에 따라, 도 2에 도시된 통신 모듈(260)과 도 4에 도시된 통신 모듈(410)은 일체로 구현될 수 있다. 이하에서, 보다 구체적으로 설명되는 바와 같이, 수신 단말(400)은 인스턴트 메시지 서비스 어플리케이션을 실행하도록 구성되며, 인스턴트 메시지를 수신 및 출력할 수 있다.4 is a block diagram schematically illustrating a receiving terminal 400 according to at least some embodiments of the present disclosure. As shown in FIG. 4, the receiving terminal 400 may include a communication module 410, a data acquisition module 420, a data complementing module 430, an output module 440 and a memory 450. The components included in the receiving terminal 400 may be individually implemented, or may be implemented in a manner that two or more of the components are combined to form one component. The connections between the components shown in FIG. 4 (eg, connections between the data acquisition module 420 and the data supplementation module 430 and the output module 440, etc.) are for convenience of description only, and The connection is not limited to this connection. For example, although the memory is shown as having no connection in FIG. 4, depending on the implementation, it is possible to operate with at least one of the communication module 410, the data acquisition module 420, the data supplementation module 430, and the output module 440. Can be connected. The receiving terminal 400 can be a variety of computing devices, for example, a smartphone, a tablet computer, a desktop computer, a laptop computer, a mobile phone, a personal digital assistant (PDA), a specific purpose device, or a fusion comprising any of the above functions Small form factor portable (mobile) electronic devices such as devices. In addition, the receiving terminal 400 may be implemented integrally with the transmitting terminal 200 described in FIG. 2, and some components may be implemented in one entity. For example, depending on the implementation, the communication module 260 illustrated in FIG. 2 and the communication module 410 illustrated in FIG. 4 may be integrally implemented. Hereinafter, as described in more detail, the receiving terminal 400 is configured to execute the instant message service application, and can receive and output the instant message.
통신 모듈(410)은 송신 단말에 의해 전송된 데이터 패킷을 서버 또는 송신 단말로부터 수신하도록 구성될 수 있다. 일부 실시예에서, 통신 모듈(410)은 통합 서버에 접속할 수 있고, 송신 단말에 의해 전송된 데이터 패킷을 통합 서버로부터 수신할 수 있다. 일부 다른 실시예에서, 통신 모듈(410)은 중계 서버에 접속할 수 있고, 송신 단말에 의해 전송된 데이터 패킷에 대한 알림 메시지를 중계 서버로부터 수신할 수 있다. 이러한 실시예에서, 통신 모듈(410)은 수신된 알림 메시지에 응답하여, 예컨대, 피어-투-피어 연결 기법을 이용하여, 송신 단말에 직접적으로 연결할 수 있으며, 연결된 송신 단말로부터 수신할 수 있다.The communication module 410 may be configured to receive data packets transmitted by the transmitting terminal from the server or the transmitting terminal. In some embodiments, the communication module 410 may connect to the integrated server and receive data packets transmitted by the transmitting terminal from the integrated server. In some other embodiments, the communication module 410 may connect to the relay server and receive a notification message for the data packet transmitted by the transmitting terminal from the relay server. In this embodiment, the communication module 410 may directly connect to the transmitting terminal in response to the received notification message, for example, using a peer-to-peer connection technique, and receive from the connected transmitting terminal.
데이터 획득 모듈(420)은 통신 모듈(410)에 의해 수신된 데이터 패킷으로부터 음성 데이터 또는 텍스트 데이터 중 적어도 하나를 획득하도록 구성될 수 있다. 일부 예시에서, 통신 모듈(410)은 송신 단말에 의해 전송된 데이터 패킷을 수신할 수 있으며, 이러한 데이터 패킷은 음성 메시지에 대한 음성 데이터 및 음성 메시지에 해당하는 텍스트 데이터를 포함할 수 있다. 데이터 획득 모듈(420)은 데이터 패킷으로부터 음성 데이터 및 음성 메시지에 해당하는 텍스트 데이터를 모두 획득할 수 있다. 이러한 예시에서, 데이터 획득 모듈(420)은 획득된 음성 데이터 및 텍스트 데이터를 출력 모듈(440)로 전송할 수 있다.The data acquisition module 420 may be configured to acquire at least one of voice data or text data from a data packet received by the communication module 410. In some examples, the communication module 410 may receive data packets transmitted by the transmitting terminal, and the data packets may include voice data for voice messages and text data corresponding to voice messages. The data acquisition module 420 may acquire both voice data and text data corresponding to the voice message from the data packet. In this example, the data acquisition module 420 may transmit the acquired voice data and text data to the output module 440.
다른 일부 예시에서, 통신 모듈(410)은 송신 단말에 의해 전송된 데이터 패킷을 수신할 수 있으며, 이러한 데이터 패킷은 음성 데이터만을 포함하거나, 음성 데이터와 음성 메시지에 대응하는 손상된 텍스트 데이터를 포함할 수 있다. 이러한 예시에서, 데이터 획득 모듈(420)은 데이터 패킷으로부터 음성 데이터를 획득할 수 있고, 음성 데이터를 데이터 보완 모듈(430)로 전송할 수 있다. 일 예시에서, 데이터 획득 모듈(420)은 음성 메시지에 해당하는 텍스트 데이터를 획득할 수 없다고 결정할 수 있고, 이러한 결정에 응답하여, 음성 데이터를 데이터 보완 모듈(430)로 전송할 수 있다. 데이터 보완 모듈(430)은 음성 인식 모듈(432) 및 음성 생성 모듈(434)을 포함할 수 있다. 데이터 보완 모듈(430)이 음성 데이터를 데이터 획득 모듈(420)로부터 수신하는 경우, 음성 인식 모듈(432)은, 잘 알려진 음성 인식 기법을 이용하여, 음성 데이터로부터 음성 메시지에 해당하는 텍스트 데이터를 생성할 수 있다. 이러한 예시에서, 출력 모듈(440)은 데이터 획득 모듈(420)로부터 음성 데이터를 수신하고, 데이터 보완 모듈(432)로부터 텍스트 데이터를 수신할 수 있다. In some other examples, the communication module 410 may receive data packets transmitted by the transmitting terminal, and these data packets may include only voice data, or may include voice data and corrupted text data corresponding to voice messages. have. In this example, the data acquisition module 420 may acquire voice data from the data packet, and transmit the voice data to the data supplement module 430. In one example, the data acquisition module 420 may determine that the text data corresponding to the voice message cannot be obtained, and in response to the determination, the voice data may be transmitted to the data supplementation module 430. The data supplement module 430 may include a speech recognition module 432 and a speech generation module 434. When the data supplement module 430 receives the voice data from the data acquisition module 420, the voice recognition module 432 generates text data corresponding to the voice message from the voice data using a well-known voice recognition technique. can do. In this example, the output module 440 may receive voice data from the data acquisition module 420 and text data from the data supplement module 432.
또 다른 일부 예시에서, 통신 모듈(410)은 송신 단말에 의해 전송된 데이터 패킷을 수신할 수 있으며, 이러한 데이터 패킷은 텍스트 데이터만을 포함하거나, 텍스트 데이터와 텍스트 데이터에 해당하는 손상된 음성 데이터를 포함할 수 있다. 이러한 예시에서, 데이터 획득 모듈(420)은 데이터 패킷으로부터 텍스트 데이터를 획득할 수 있고, 텍스트 데이터를 데이터 보완 모듈(430)로 전송할 수 있다. 일 예시에서, 데이터 획득 모듈(420)은 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없다고 결정할 수 있고, 이러한 결정에 응답하여, 텍스트 데이터를 데이터 보완 모듈(430)로 전송할 수 있다. 데이터 보완 모듈(430)이 텍스트 데이터를 데이터 획득 모듈(420)로부터 수신하는 경우, 음성 생성 모듈(434)은 잘 알려진 음성 합성 기법을 이용하여, 텍스트 데이터로부터 음성 데이터를 생성할 수 있다.In some other examples, the communication module 410 may receive a data packet transmitted by the transmitting terminal, and the data packet may include only text data, or text data and corrupted voice data corresponding to the text data. You can. In this example, the data acquisition module 420 may acquire text data from the data packet, and transmit the text data to the data supplement module 430. In one example, the data acquisition module 420 may determine that speech data corresponding to the text data cannot be acquired, and in response to the determination, the text data may be transmitted to the data supplementation module 430. When the data supplement module 430 receives text data from the data acquisition module 420, the speech generation module 434 may generate speech data from the text data using a well-known speech synthesis technique.
출력 모듈(440)은 재생 모듈(442) 및 디스플레이 모듈(444)을 포함할 수 있다. 재생 모듈(442)은 음성 데이터에 기초하여, 음성 데이터에 대응하는 음성 메시지를 재생하도록 구성될 수 있다. 수신 단말(400)은 도시되지 않은 적절한 사용자 인터페이스를 통하여, 사용자로부터 음성 메시지를 재생하라는 음성 메시지 재생 요청을 수신할 수 있다. 일부 실시예에서, 데이터 획득 모듈(420)에 의해 획득된 음성 데이터가 하나 이상인 경우, 재생 모듈(442)은 음성 메시지 재생 요청에 응답하여, 하나 이상의 음성 데이터에 대응하는 하나 이상의 음성 메시지를 순차적으로 재생하도록 구성될 수 있다. 이러한 순차적인 재생은, 사용자의 제어에 따라, 재생, 일시 정치, 중지, 이전 음성 메시지 재생 또는 다음 음성 메시지의 재생이 수행될 수 있다. 디스플레이 모듈(444)은 재생 모듈(442)에 의한 음성 메시지의 재생에 대응하여, 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하도록 구성될 수 있다.The output module 440 may include a playback module 442 and a display module 444. The reproduction module 442 may be configured to reproduce a voice message corresponding to the voice data, based on the voice data. The receiving terminal 400 may receive a voice message reproduction request to reproduce a voice message from the user through an appropriate user interface (not shown). In some embodiments, when there is more than one voice data acquired by the data acquisition module 420, the playback module 442 sequentially responds to the voice message playback request, sequentially sequentially one or more voice messages corresponding to the one or more voice data. Can be configured to play. The sequential playback may be performed according to the user's control, such as playback, pause, pause, playback of the previous voice message, or playback of the next voice message. The display module 444 may be configured to display a text message corresponding to text data in response to the reproduction of the voice message by the playback module 442.
메모리(450)는 데이터 획득 모듈(420) 및/또는 데이터 보완 모듈(430)로부터의 음성 데이터 및 텍스트 데이터를 저장할 수 있다. 일부 예시에서, 음성 데이터 및 음성 메시지에 해당하는 텍스트 데이터를 대응지어 저장할 수 있다. 일부 실시예에서, 메모리(450)는 하나 이상의 음성 데이터를 미리 정해진 조건에 기초하여, 삭제할 수 있다. 일부 예시에서, 메모리(450)는 음성 메시지의 재생이 종료되면, 저장된 음성 데이터를 삭제할 수 있다. 일부 다른 예시에서, 메모리(450)는 미리 정해진 저장 용량 조건에 기초하여, 오래된 음성 데이터를 삭제할 수 있다. 예컨대, 메모리(450)에 저장된 음성 데이터의 총 용량이 미리 정해진 값을 초과하면 가장 오래된 음성 메시지를 삭제할 수 있다.The memory 450 may store voice data and text data from the data acquisition module 420 and / or the data supplement module 430. In some examples, voice data and text data corresponding to the voice message may be stored in association. In some embodiments, the memory 450 may delete one or more voice data based on predetermined conditions. In some examples, the memory 450 may delete stored voice data when playback of the voice message ends. In some other examples, the memory 450 may delete old voice data based on predetermined storage capacity conditions. For example, if the total capacity of voice data stored in the memory 450 exceeds a predetermined value, the oldest voice message can be deleted.
추가적인 일부 실시예에서, 출력 모듈(440)은 미리 정해진 검열 조건에 기초하여, 텍스트 데이터로부터의 텍스트 메시지를 필터링 할 수 있다. 출력 모듈(440)의 필터링은 잘 알려진 방식을 이용할 수 있다. 예컨대, 미리 정해진 필터링되는 문자는 욕설, 비속어, 등을 포함할 수 있지만, 이에 제한되지 않는다. 출력 모듈(440)에 의한 필터링의 결과에 기초하여, 재생 모듈(442)은 음성 메시지를 재생할 수 있고, 디스플레이 모듈(444)은 텍스트 메시지를 디스플레이 할 수 있다. 예컨대, 텍스트 메시지에 비속어가 포함되는 경우, 출력 모듈(440)은 텍스트 메시지의 적어도 일부를 미리 정해진 문자로 변경하고 음성 메시지의 적어도 일부에 대하여 묵음(mute) 처리를 수행할 수 있다.In some additional embodiments, the output module 440 may filter text messages from text data based on predetermined censorship conditions. The filtering of the output module 440 can use a well-known method. For example, predetermined filtered characters may include profanity, profanity, and the like, but are not limited thereto. Based on the result of filtering by the output module 440, the playback module 442 can play back a voice message, and the display module 444 can display a text message. For example, when a slang is included in a text message, the output module 440 may change at least a part of the text message to a predetermined character and perform mute processing on at least a part of the voice message.
추가적인 일부 실시예에서, 통신 모듈(410)은 송신 단말에 의해 전송된 데이터 패킷을 수신할 수 있으며, 이러한 데이터 패킷은 디스플레이 모듈(444)에 의해 디스플레이 가능한 캐릭터에 관한 정보를 포함하는 캐릭터 데이터를 포함할 수 있다. 데이터 획득 모듈(420)은 수신된 데이터 패킷으로부터 음성 데이터 및/또는 텍스트 데이터에 더하여, 캐릭터 데이터를 더 획득할 수 있다. 디스플레이 모듈(444)은 캐릭터 데이터에 기초하여, 재생 모듈(442)에 의한 음성 메시지의 재생 및 디스플레이 모듈(444)에 의한 텍스트 메시지의 디스플레이와 함께 캐릭터를 디스플레이 하도록 구성될 수 있다.In some additional embodiments, the communication module 410 may receive a data packet transmitted by the transmitting terminal, the data packet including character data including information about a character displayable by the display module 444 can do. The data acquisition module 420 may further acquire character data in addition to voice data and / or text data from the received data packet. The display module 444 may be configured to display the character based on the character data, with the reproduction of the voice message by the reproduction module 442 and the display of the text message by the display module 444.
도 5 내지 도 7은 본 개시의 적어도 일부 실시예에 따라, 수신 단말에서 수행되는 예시적인 프로세스(500, 600 및 700)를 도시하는 흐름도이다. 예컨대, 프로세스(500, 600 및 700)는 도 1의 수신 단말(130), 도 4의 수신 단말(400)과 같은 컴퓨팅 장치의 제어 하에서 수행될 수 있다. 도 5의 프로세스(500)는 블록(510, 520, 530 및/또는 540)에 의해 예시된 바와 같은 하나 이상의 동작, 기능 또는 작용을 포함할 수 있다. 도 6의 프로세스(600)는 블록(610, 620, 630, 640, 650 및/또는 660)에 의해 예시된 바와 같은 하나 이상의 동작, 기능 또는 작용을 포함할 수 있다. 또한, 도 7에 도시된 프로세스(700)는 블록(710, 720, 730, 740, 750 및/또는 760)에 의해 예시된 바와 같은 하나 이상의 동작, 기능 또는 작용을 포함할 수 있다. 다양한 블록은 설명된 실시예로 제한하려고 의도되지는 않는다. 예컨대, 당업자는 여기에서 개시된 본 프로세스에 대하여, 프로세스 및 방법에서 수행되는 기능이 상이한 순서로 구현될 수 있다는 점을 인정할 것이다. 예컨대, 음성 메시지를 재생하는 블록(530)과 텍스트 메시지를 디스플레이 하는 블록(540)은 구현예에 따라, 순차적으로 수행될 수 있거나 동시에 수행될 수 있다. 또한, 도 5 내지 도 7에 예시된 개략적인 동작들은 예시로서만 제공되고, 개시된 실시예의 본질에서 벗어나지 않으면서, 동작들 중 일부가 선택적일 수 있거나, 더 적은 동작으로 조합될 수 있거나, 추가적인 동작으로 확장될 수 있다. 5-7 are flow diagrams illustrating exemplary processes 500, 600 and 700 performed at a receiving terminal, according to at least some embodiments of the present disclosure. For example, the processes 500, 600, and 700 may be performed under the control of a computing device, such as the receiving terminal 130 of FIG. 1 and the receiving terminal 400 of FIG. The process 500 of FIG. 5 can include one or more actions, functions, or actions as illustrated by blocks 510, 520, 530 and / or 540. The process 600 of FIG. 6 can include one or more actions, functions, or actions as illustrated by blocks 610, 620, 630, 640, 650 and / or 660. In addition, the process 700 shown in FIG. 7 can include one or more actions, functions, or actions as illustrated by blocks 710, 720, 730, 740, 750, and / or 760. The various blocks are not intended to be limited to the described embodiment. For example, those skilled in the art will appreciate that for the present process disclosed herein, the functions performed in the processes and methods may be implemented in different orders. For example, the block 530 for reproducing a voice message and the block 540 for displaying a text message may be performed sequentially or simultaneously, depending on the implementation. In addition, the schematic operations illustrated in FIGS. 5-7 are provided as examples only, and some of the operations may be optional, combined with fewer operations, or additional operations without departing from the essence of the disclosed embodiment. Can be extended to
도 5에 도시된 프로세스(500)는 데이터 패킷을 수신하는 블록(510)에서 시작한다. 블록(510)에서, 컴퓨팅 장치는 송신 단말에 의해 전송된 데이터 패킷을 서버 또는 송신 단말로부터 수신하도록 구성될 수 있다. 일부 실시예에서, 컴퓨팅 장치는 통합 서버에 접속할 수 있고, 송신 단말에 의해 전송된 데이터 패킷을 통합 서버로부터 수신할 수 있다. 일부 다른 실시예에서, 컴퓨팅 장치는 중계 서버에 접속할 수 있고, 송신 단말에 의해 전송된 데이터 패킷에 대한 알림 메시지를 중계 서버로부터 수신할 수 있고, 이후, 송신 단말에 직접적으로 연결하고, 연결된 송신 단말로부터 데이터 패킷을 수신할 수 있다. 프로세스(500)는 블록(510)에서 음성 데이터 및 텍스트 데이터를 획득하는 블록(520)으로 이어질 수 있다.The process 500 shown in FIG. 5 begins at block 510 receiving a data packet. In block 510, the computing device may be configured to receive data packets transmitted by the transmitting terminal from the server or the transmitting terminal. In some embodiments, the computing device can connect to the integrated server and receive data packets sent by the transmitting terminal from the integrated server. In some other embodiments, the computing device may connect to the relay server, receive a notification message for the data packet transmitted by the transmitting terminal from the relay server, and then connect directly to the transmitting terminal and connect to the transmitting terminal Can receive data packets from. Process 500 may continue at block 510 to block 520 to acquire voice data and text data.
블록(520)에서, 컴퓨팅 장치는 블록(510)에서 수신된 데이터 패킷으로부터 음성 데이터 및 텍스트 데이터를 획득할 수 있다. 일부 예시에서, 수신된 데이터 패킷은 음성 메시지에 대한 음성 데이터 및 음성 메시지에 해당하는 텍스트 데이터를 포함할 수 있다. 컴퓨팅 장치는 수신된 데이터 패킷으로부터 음성 데이터 및 텍스트 데이터를 모두 획득할 수 있다. 프로세스(500)는 블록(520)에서 음성 메시지를 재생하는 블록(530)과 텍스트 메시지를 디스플레이 하는 블록(540)으로 이어질 수 있다. 추가적인 일부 예시에서, 수신된 데이터 패킷은 컴퓨팅 장치 상에서 디스플레이 가능한 캐릭터에 관한 정보를 포함하는 캐릭터 데이터를 포함할 수 있다. 이러한 예시에서, 컴퓨팅 장치는 블록(520)에서 음성 데이터 및 텍스트 데이터에 더하여, 캐릭터 데이터를 획득할 수 있다In block 520, the computing device may obtain voice data and text data from the data packet received in block 510. In some examples, the received data packet may include voice data for a voice message and text data corresponding to the voice message. The computing device may acquire both voice data and text data from the received data packet. The process 500 may continue at block 520 to block 530 to reproduce the voice message and block 540 to display the text message. In some additional examples, the received data packet can include character data that includes information about a character displayable on the computing device. In this example, the computing device may obtain character data in addition to voice data and text data at block 520.
블록(530)에서, 컴퓨팅 장치는 획득된 음성 데이터에 기초하여 음성 데이터에 대응하는 음성 메시지를 재생할 수 있다. 일부 예시에서, 컴퓨팅 장치는 사용자로부터 음성 메시지를 재생하라는 음성 메시지 재생 요청을 수신할 수 있다. 일부 예시에서, 컴퓨팅 장치는 재생할 음성 메시지가 하나 이상인 경우, 하나 이상의 음성 메시지를 순차적으로 재생할 수 있다. 추가적으로, 음성 메시지의 재생은 사용자의 요청에 의해, 일시 정지 되거나, 중단되거나, 이전 음성 메시지 또는 다음 음성 메시지를 재생하도록 제어될 수 있다.In block 530, the computing device may play a voice message corresponding to the voice data based on the obtained voice data. In some examples, the computing device may receive a voice message play request to play a voice message from the user. In some examples, the computing device may sequentially play one or more voice messages if there is more than one voice message to play. Additionally, the playback of the voice message may be paused, stopped, or controlled to play the previous voice message or the next voice message at the user's request.
블록(540)에서, 컴퓨팅 장치는 블록(530)에 따른 음성 메시지의 재생에 대응하여, 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 할 수 있다. 컴퓨팅 장치가 데이터 패킷으로부터 캐릭터 데이터를 더 획득하는 일부 예시에서, 컴퓨팅 장치는 획득된 캐릭터 데이터에 기초하여, 음성 메시지의 재생 및 텍스트 메시지의 디스플레이와 함께 캐릭터를 디스플레이 할 수 있다.In block 540, the computing device may display a text message corresponding to text data in response to the reproduction of the voice message according to block 530. In some examples in which the computing device further obtains character data from a data packet, the computing device may display the character along with the reproduction of the voice message and the display of a text message based on the acquired character data.
추가적으로, 컴퓨팅 장치는 블록(530) 및 블록(540)을 수행하기 전에, 미리 정해진 검열 조건에 기초하여, 텍스트 데이터로부터의 텍스트 메시지를 필터링 할 수 있고, 필터링의 결과에 기초하여, 블록(530) 및 블록(540)을 수행할 수 있다. 일 예시에서, 검열 조건에 따라 필터링되는 문자는 욕설, 비속어, 등을 포함할 수 있다. 텍스트 메시지가 비속어가 포함되는 경우, 컴퓨팅 장치는 텍스트의 적어도 일부를 미리 정해진 문자, 예컨대, 별표(asterisk; *)로 변경하고, 음성 메시지의 적어도 일부에 대하여, 묵음(mute) 처리를 할 수 있다.Additionally, the computing device may filter the text message from the text data based on a pre-determined censorship condition, prior to performing block 530 and block 540, and based on the results of the filtering, block 530 And block 540. In one example, characters filtered according to the censorship conditions may include abusive language, profanity, and the like. When the text message includes a profanity, the computing device may change at least a part of the text to a predetermined character, for example, an asterisk (*), and mute the at least part of the voice message. .
도 6에 도시된 프로세스(600)는 데이터 패킷을 수신하는 블록(610)에서 시작한다. 블록(610)에 관한 설명은 도 5의 블록(510)에 관한 설명과 중복되므로 생략한다. 프로세스(600)는 블록(510)에서 음성 데이터를 획득하는 블록(620)으로 이어질 수 있다. 블록(620)에서, 컴퓨팅 장치는 블록(610)에서 수신된 데이터 패킷으로부터 음성 메시지에 대응하는 음성 데이터를 획득할 수 있다. 일부 예시에서, 수신된 데이터 패킷은 음성 데이터 만을 포함하거나, 음성 데이터와 음성 메시지에 대응하는 손상된 텍스트 데이터를 포함할 수 있다. 이러한 예시에서, 컴퓨팅 장치는 데이터 패킷으로부터 음성 데이터를 획득할 수 있다. 프로세스(600)는 블록(620)에서 텍스트 데이터를 획득할 수 없다고 결정하는 블록(630)으로 이어질 수 있다.The process 600 shown in FIG. 6 begins at block 610 receiving a data packet. The description of the block 610 will be omitted because it overlaps with the description of the block 510 of FIG. 5. Process 600 can continue at block 510 to block 620 for acquiring voice data. In block 620, the computing device may obtain voice data corresponding to the voice message from the data packet received in block 610. In some examples, the received data packet may include only voice data, or may include voice data and corrupted text data corresponding to the voice message. In this example, the computing device can obtain voice data from the data packet. Process 600 may continue at block 620 to block 630 where it is determined that text data cannot be obtained.
블록(630)에서, 컴퓨팅 장치는 데이터 패킷으로부터 음성 데이터를 획득할 수 있지만, 음성 메시지에 해당하는 텍스트 데이터를 획득할 수 없다고 결정할 수 있다. 프로세스(600)는 블록(630)에서 텍스트 데이터를 생성하는 블록(640) 및 음성 메시지를 재생하는 블록(660)으로 이어질 수 있다.In block 630, the computing device may determine that it is possible to obtain speech data from the data packet, but not text data corresponding to the speech message. Process 600 may continue at block 630 to block 640 for generating text data and block 660 to reproduce the voice message.
블록(640)에서, 컴퓨팅 장치는 획득된 음성 데이터에 기초하여 텍스트 데이터를 생성할 수 있다. 컴퓨팅 장치는 잘 알려진 음성 인식 기법을 이용하여, 음성 데이터로부터 음성 메시지에 해당하는 텍스트 데이터를 생성할 수 있다. 프로세스(600)는 블록(640)을 수행한 이후에, 텍스트 메시지를 디스플레이 하는 블록(650)으로 이어질 수 있다. 음성 메시지를 재생하는 블록(660)과 텍스트 메시지를 디스플레이 하는 블록(650)에 관한 설명은 각각 도 5에서 설명된 블록(530) 및 블록(540)과 중복되므로, 생략한다.In block 640, the computing device may generate text data based on the acquired voice data. The computing device may generate text data corresponding to a voice message from voice data using a well-known voice recognition technique. Process 600 may continue to block 650 that displays a text message after performing block 640. Descriptions of the block 660 for reproducing the voice message and the block 650 for displaying the text message are duplicated with the blocks 530 and 540 described in FIG. 5, respectively, and thus will be omitted.
도 7에 도시된 프로세스(700)는 데이터 패킷을 수신하는 블록(710)에서 시작한다. 블록(710)에 관한 설명은 도 5의 블록(510)에 관한 설명과 중복되므로 생략한다. 프로세스(700)는 블록(710)에서 텍스트 데이터를 획득하는 블록(720)으로 이어질 수 있다. 블록(720)에서, 컴퓨팅 장치는 블록(710)에서 수신된 데이터 패킷으로부터 텍스트 데이터를 획득할 수 있다. 일부 예시에서, 수신된 데이터 패킷은 텍스트 데이터 만을 포함하거나, 텍스트 데이터와 텍스트 데이터에 대응하는 손상된 음성 데이터를 포함할 수 있다. 이러한 예시에서, 컴퓨팅 장치는 데이터 패킷으로부터 텍스트 데이터를 획득할 수 있다. 프로세스(700)는 블록(720)에서 음성 데이터를 획득할 수 없다고 결정하는 블록(730)으로 이어질 수 있다.The process 700 shown in FIG. 7 begins at block 710 receiving a data packet. The description of the block 710 is omitted because it overlaps with the description of the block 510 of FIG. 5. Process 700 may continue at block 710 to block 720 for obtaining text data. In block 720, the computing device may obtain text data from the data packet received in block 710. In some examples, the received data packet may contain only text data, or may include text data and corrupted voice data corresponding to the text data. In this example, the computing device can obtain text data from the data packet. Process 700 may continue at block 720 to block 730 where it is determined that speech data cannot be obtained.
블록(730)에서, 컴퓨팅 장치는 데이터 패킷으로부터 텍스트 데이터를 획득할 수 있지만, 텍스트 데이터에 대응하는 음성 데이터를 획득할 수 없다고 결정할 수 있다. 프로세스(700)는 블록(730)에서 음성 데이터를 생성하는 블록(740) 및 텍스트 메시지를 디스플레이 하는 블록(760)으로 이어질 수 있다. 블록(740)에서, 컴퓨팅 장치는 획득된 텍스트 데이터에 기초하여 음성 데이터를 생성할 수 있다. 컴퓨팅 장치는 잘 알려진 음성 합성 기법을 이용하여, 텍스트 데이터로부터 음성 데이터를 생성할 수 있다. 프로세스(700)는 블록(740)을 수행한 이후에, 음성 메시지를 재생하는 블록(750)으로 이어질 수 있다. 음성 메시지를 재생하는 블록(750)과 텍스트 메시지를 디스플레이 하는 블록(760)에 관한 설명은 각각 도 5에서 설명된 블록(530) 및 블록(540)과 중복되므로, 생략한다.At block 730, the computing device may determine that it is able to obtain text data from the data packet, but cannot acquire speech data corresponding to the text data. Process 700 may continue at block 730 to block 740 for generating voice data and block 760 for displaying text messages. In block 740, the computing device may generate speech data based on the acquired text data. The computing device may generate speech data from text data using a well-known speech synthesis technique. After performing block 740, process 700 may continue to block 750 that plays a voice message. Descriptions of the block 750 for reproducing the voice message and the block 760 for displaying the text message are duplicated with the blocks 530 and 540 described in FIG. 5, respectively, and thus will be omitted.
이와 같이, 인스턴트 메시지 서비스를 제공함에 있어서, 음성 메시지를 텍스트 메시지와 함께 전송, 수신 및 획득하고, 음성 메시지를 순차 재생하고 그에 대응하여 텍스트 메시지를 디스플레이 함으로써, 음성 메시지 또는 텍스트 메시지를 서로 보완할 수 있고, 음성 메시지의 내용을 이해하기 보다 쉬워진다. 또한, 음성 메시지에 대응하는 텍스트 데이터를 저장함으로써, 음성 데이터가 용량의 문제로 지워지더라도 인스턴트 메시지 서비스의 제공 중에 이루어진 대화를 빠르게 이해하고 내용을 검색 및 검토하는 것이 용이해진다. 한편, 음성 재생과 텍스트 디스플레이와 함께 캐릭터를 디스플레이 함으로써, 새로운 유형의 인스턴트 메시지 서비스를 제공하는 것이 가능해진다.In this way, in providing an instant message service, a voice message or a text message can be complemented by transmitting, receiving, and acquiring a voice message together with a text message, sequentially playing the voice message, and displaying the text message correspondingly. It is easier to understand the content of the voice message. In addition, by storing text data corresponding to a voice message, even if the voice data is erased due to a problem of capacity, it becomes easy to quickly understand a conversation made during the provision of an instant message service and to search and review the contents. On the other hand, it is possible to provide a new type of instant message service by displaying a character together with voice reproduction and text display.
도 8은 본 개시에 따라 인스턴트 메시지 서비스를 이용하는 일 예시를 도시하고, 도 9는 전술한 바에 따라 따라 인스턴트 메시지 서비스를 이용하는 경우 사용자의 컴퓨팅 장치 상에서 메시지가 디스플레이 및 재생되는 일 예시를 도시한다. 도 8에 도시된 바와 같이, 제1 사용자(810), 제2 사용자(820) 및 제3 사용자(830)는 각각 사용자 장치(812), 사용자 장치(822) 및 사용자 장치(832)를 통하여, 인스턴트 메시지 서비스를 이용하고 있다. 도 8의 예시에서, 사용자(810, 820, 830)는, 사용자(810, 820, 830) 중 적어도 하나의 요청에 의해, 송수신 하는 인스턴트 메시지를 공유할 수 있다. 예컨대, 제1 사용자(810)가 인스턴트 메시지를 전송하는 경우, 제2 사용자(820) 및 제3 사용자(830)는 해당 인스턴트 메시지를 수신할 수 있다. 도 8에 도시된 바와 같이, 제1 사용자(810) 및 제2 사용자(820)는 음성 메시지를 전송할 수 있다. 8 shows an example of using an instant message service according to the present disclosure, and FIG. 9 shows an example of displaying and playing a message on a user's computing device when using the instant message service according to the foregoing. As illustrated in FIG. 8, the first user 810, the second user 820, and the third user 830 are respectively through the user device 812, the user device 822, and the user device 832, I am using an instant message service. In the example of FIG. 8, the users 810, 820, and 830 may share an instant message that is transmitted and received by at least one of the users 810, 820, and 830. For example, when the first user 810 transmits an instant message, the second user 820 and the third user 830 may receive the corresponding instant message. As shown in FIG. 8, the first user 810 and the second user 820 may transmit a voice message.
일부 예시에서, 제1 사용자(810)는 캐릭터(816)를 선택할 수 있고, 제2 사용자(820)는 캐릭터(826)를 선택할 수 있다. 제1 사용자(810)는 "춥지 않나요?"라는 내용의 음성 메시지(814)를 입력할 수 있다. 제1 사용자(810)가 음성 메시지(814)를 입력할 때, 사용자 장치(812)는 제1 사용자(810)의 표정을 검출할 수 있으며, 캐릭터(816)의 표정을 결정할 수 있다. 사용자 장치(812)는 음성 메시지(814)에 대하여 음성 인식을 수행함으로써 음성 메시지(814)에 대응하는 텍스트 메시지(814-2)를 획득할 수 있다. 또한, 제1 사용자(810)는 미리 정해진 동작의 목록 중의 하나를 선택하거나, 사용자 장치(812)가 음성 인식된 텍스트 메시지(814-2)로부터 인식한 문자(예컨대 "춥지"가 인식됨)를 제1 사용자(810)가 선택함으로써 캐릭터(816)의 동작을 결정할 수 있다. 이후, 음성 메시지(814)는 제2 및 제3 사용자(820 및 830)의 사용자 장치(822, 832)를 향하여 전송될 수 있다. In some examples, the first user 810 can select the character 816 and the second user 820 can select the character 826. The first user 810 may input a voice message 814 with the phrase "Aren't it cold?" When the first user 810 inputs the voice message 814, the user device 812 may detect the facial expression of the first user 810 and determine the facial expression of the character 816. The user device 812 may obtain a text message 814-2 corresponding to the voice message 814 by performing voice recognition on the voice message 814. In addition, the first user 810 selects one of a list of predetermined actions, or provides a text (eg, “cold” is recognized) recognized by the user device 812 from the voice-recognized text message 814-2. 1 The user 810 may determine the operation of the character 816 by selecting it. Thereafter, the voice message 814 may be transmitted to the user devices 822 and 832 of the second and third users 820 and 830.
음성 메시지(814)가 전송된 이후, 제2 사용자(820)는 "저는 더워요!"라는 내용의 음성 메시지(824)를 입력할 수 있다. 제2 사용자(820)가 음성 메시지(824)를 입력할 때, 사용자 장치(822)는 제2 사용자(820)의 표정을 검출할 수 있으며, 캐릭터(826)의 표정을 결정할 수 있다. 사용자 장치(822)는 음성 메시지(824)로부터 텍스트 메시지(824-2)를 획득할 수 있다. 또한, 제2 사용자(820)는 미리 정해진 동작의 목록 중의 하나를 선택하거나, 사용자 장치(822)가 텍스트 메시지(824-2)로부터 인식한 문자(예컨대, "더워요"가 인식됨)를 제2 사용자(820)가 선택함으로써 캐릭터(826)의 동작을 결정할 수 있다. 이후, 음성 메시지(824)가 제1 및 제3 사용자(810, 830)의 사용자 장치(812,232)를 향하여 전송될 수 있다.After the voice message 814 is transmitted, the second user 820 may input the voice message 824 with the phrase "I am hot!". When the second user 820 inputs the voice message 824, the user device 822 may detect the facial expression of the second user 820 and determine the facial expression of the character 826. The user device 822 can obtain the text message 824-2 from the voice message 824. In addition, the second user 820 selects one of a list of predetermined actions, or the second user recognizes the text recognized by the user device 822 from the text message 824-2 (eg, “hot” is recognized). The action of the character 826 may be determined by the selection by the 820. Thereafter, the voice message 824 may be transmitted to the user devices 812 and 232 of the first and third users 810 and 830.
이후, 제3 사용자(830)는 사용자 장치(832)를 이용하여 인스턴트 메시지 서비스를 제공하는 서버(도시되지 않음)에 접속할 수 있으며, 사용자 장치(832)는 음성 메시지(814)에 대응하는 음성 데이터와 텍스트 메시지(814-2)에 대응하는 텍스트 데이터를 포함하는 데이터 패킷 및 음성 메시지(824)에 대응하는 음성 데이터와 텍스트 메시지(824-2)에 대응하는 텍스트 데이터를 포함하는 데이터 패킷을 수신할 수 있다. 도 9(a) 및 도 9(b)에 도시되는 바와 같이, 텍스트 메시지(814-2, 824-2)는, 음성 메시지(814, 824)의 재생에 대응하여 디스플레이 될 수 있다. 제3 사용자(830)는 사용자 장치(832) 상에 표시된 사용자 인터페이스(840)를 이용하여 음성 메시지 재생 요청을 입력할 수 있다. 음성 메시지 재생 요청이 입력되면, 도 8(a)에 도시된 바와 같이, 음성 메시지(814)가 캐릭터(816)의 디스플레이와 함께 재생된다. 또한, 음성 메시지(814)가 재생되는 동안, 음성 인식된 텍스트 메시지(814-2)가 음성 메시지(814)의 재생에 대응하여, 디스플레이 될 수 있다. 캐릭터(816)는 제1 사용자(810)의 사용자 장치(812)에서 결정된 표정 및 동작을 보여줄 수 있다. 이후, 도 9(b)에 도시된 바와 같이, 음성 메시지(824)가 캐릭터(826)의 디스플레이와 함께 재생된다. 또한, 음성 메시지(824)가 재생되는 동안, 음성 인식된 텍스트 메시지(824-2)가, 음성 메시지(824)의 재생에 대응하여, 디스플레이 될 수 있다. 캐릭터(826)는 제2 사용자(820)의 사용자 장치(822)에서 결정된 표정 및 동작을 보여줄 수 있다.Thereafter, the third user 830 may access a server (not shown) that provides an instant message service using the user device 832, and the user device 832 may be configured to provide voice data corresponding to the voice message 814. And a data packet containing text data corresponding to the text message 814-2 and a data packet including voice data corresponding to the voice message 824 and text data corresponding to the text message 824-2. You can. 9 (a) and 9 (b), text messages 814-2 and 824-2 may be displayed in response to reproduction of voice messages 814 and 824. The third user 830 may input a voice message playback request using the user interface 840 displayed on the user device 832. When a request to play a voice message is inputted, as shown in FIG. 8 (a), the voice message 814 is played together with the display of the character 816. Also, while the voice message 814 is being reproduced, the voice-recognized text message 814-2 may be displayed in response to the reproduction of the voice message 814. The character 816 may show the facial expression and motion determined by the user device 812 of the first user 810. Then, as shown in Fig. 9 (b), the voice message 824 is played with the display of the character 826. Further, while the voice message 824 is being played, the voice-recognized text message 824-2 may be displayed in response to the reproduction of the voice message 824. The character 826 may show facial expressions and actions determined by the user device 822 of the second user 820.
도 9(c)는 인스턴트 메시지의 로그를 나타내는 일 예시를 도시한다. 제3 사용자(830)의 사용자 장치(832)는 제1 사용자(810) 및 제2 사용자(820)로부터 수신한 텍스트 메시지들(814-2, 824-2)을 순차적으로 디스플레이 할 수 있다. 9 (c) shows an example of a log of instant messages. The user device 832 of the third user 830 may sequentially display text messages 814-2 and 824-2 received from the first user 810 and the second user 820.
도 10은 본 개시의 적어도 일부 실시예에 따라 결함 검사를 수행하는 데 이용될 수 있는 예시적인 컴퓨터 프로그램 제품(1000)을 도시한다. 예시적인 컴퓨터 프로그램 제품의 예시적인 실시예는 신호 포함 매체(1002)를 이용하여 제공된다. 일부 실시예에서, 하나 이상의 컴퓨터 프로그램 제품(1000)의 신호 포함 매체(1002)는 컴퓨터 판독가능 매체(1006), 기록 가능 매체(1008) 및/또는 통신 매체(1010)를 포함할 수 있다. 신호 포함 매체(1002)에 포함된 명령어(1004)는 도 1에 도시된 송신 단말(120) 및 수신 단말(130), 도 2에 도시된 송신 단말(200) 및/또는 도 4에 수신 단말(400)과 같은 컴퓨팅 장치에 의해 실행될 수 있다. 일부 실시예에서, 명령어(1004)는 실행되면, 컴퓨팅 장치로 하여금 도 3, 도 5, 도 6 및 도 7 중 적어도 하나의 프로세스를 수행하기 위한 적어도 하나의 명령어를 포함할 수 있다.10 shows an example computer program product 1000 that can be used to perform defect inspection in accordance with at least some embodiments of the present disclosure. An exemplary embodiment of an exemplary computer program product is provided using a signal containing medium 1002. In some embodiments, the signal-bearing medium 1002 of one or more computer program products 1000 may include a computer-readable medium 1006, a recordable medium 1008 and / or a communication medium 1010. The command 1004 included in the signal-containing medium 1002 includes the transmitting terminal 120 and the receiving terminal 130 illustrated in FIG. 1, the transmitting terminal 200 illustrated in FIG. 2, and / or the receiving terminal illustrated in FIG. 4 ( 400). In some embodiments, the instructions 1004, when executed, may include at least one instruction for causing the computing device to perform at least one of the processes of FIGS. 3, 5, 6, and 7.
도 11은 본 개시의 적어도 일부 실시예에 따른 인스턴트 메시지 서비스 제공 서버(1100)를 개략적으로 도시하는 블록도이다. 인스턴트 메시지 서비스 제공 서버(1100)는 통합 서버 및/또는 중계 서버의 기능을 가지도록 구현될 수 있다. 도 11에 도시된 바와 같이, 인스턴트 메시지 서비스 제공 서버(1100)는 통신 모듈(1110), 캐릭터 모듈(1120), 음성 메모리(1130) 및 텍스트 메모리(1140)를 포함할 수 있다. 통신 모듈(1110)은 송신 단말로부터 음성 데이터, 텍스트 데이터 및/또는 캐릭터 데이터를 포함하는 데이터 패킷을 송신 단말로부터 수신할 수 있다. 또한, 통신 모듈(1110)은 수신 단말에, 데이터 패킷에 대한 알림 및/또는 데이터 패킷을 전송할 수 있다. 캐릭터 모듈(1120)은 송신 단말로부터 수신된 캐릭터 데이터, 예컨대, 송신자의 캐릭터의 종류, 표정, 동작, 등에 관한 정보를 저장할 수 있다. 음성 메모리(1130)는 송신 단말로부터 수신된 음성 데이터를 저장할 수 있다. 일부 예시에서, 음성 메모리(1130)에 저장된 음성 데이터는 미리 정해진 조건에 따라 삭제될 수 있다. 텍스트 메모리(1140)는 음성 메시지에 해당하는 텍스트 데이터, 예컨대, 음성 인식된 텍스트 메시지 및 타이핑된 텍스트 메시지를 저장할 수 있다. 일부 예시에서, 텍스트 메모리(1140)는 텍스트 데이터를 음성 메모리(1130)에 저장된 음성 데이터와 대응하여 저장할 수 있고, 캐릭터 모듈(1120)은 캐릭터 데이터를 음성 메모리(1130)에 저장된 음성 데이터 및/또는 텍스트 메모리(1140)에 저장된 텍스트 데이터에 대응하여 저장할 수 있다.11 is a block diagram schematically illustrating an instant message service providing server 1100 according to at least some embodiments of the present disclosure. The instant message service providing server 1100 may be implemented to have functions of an integrated server and / or a relay server. As illustrated in FIG. 11, the instant message service providing server 1100 may include a communication module 1110, a character module 1120, a voice memory 1130 and a text memory 1140. The communication module 1110 may receive a data packet including voice data, text data, and / or character data from the transmitting terminal from the transmitting terminal. In addition, the communication module 1110 may transmit a notification and / or data packet for a data packet to a receiving terminal. The character module 1120 may store character data received from the transmitting terminal, for example, information on the type of the sender's character, facial expression, action, and the like. The voice memory 1130 may store voice data received from a transmitting terminal. In some examples, voice data stored in the voice memory 1130 may be deleted according to predetermined conditions. The text memory 1140 may store text data corresponding to a voice message, for example, a voice recognized text message and a typed text message. In some examples, text memory 1140 may store text data corresponding to voice data stored in voice memory 1130, and character module 1120 may store character data in voice memory 1130 and / or The text data stored in the text memory 1140 may be stored.
청구된 대상은 여기에서 기술된 특정 구현예로 범위가 제한되지 않는다. 예컨대, 일부 구현예는 장치 또는 장치의 조합 상에서 동작하도록 사용될 수 있는 것과 같은 하드웨어로 있을 수 있는 반면, 예컨대, 다른 구현예는 소프트웨어 및/또는 펌웨어로 있을 수 있다. 마찬가지로, 청구된 대상은 이러한 점에서 범위가 제한되지 않지만, 일부 구현예는 신호 베어링 매체, 저장 매체와 같은 하나 이상의 물품을 포함할 수 있다. CD-ROM, 컴퓨터 디스크, 플래시 메모리 등과 같은 이러한 저장 매체는, 예컨대, 컴퓨팅 시스템, 컴퓨팅 플랫폼 또는 기타 시스템과 같은 컴퓨팅 장치에 의하여 실행되면, 예컨대, 앞서 설명된 구현예 중 하나와 같은 청구된 대상에 따라 프로세서의 실행을 야기시킬 수 있는 명령을 저장할 수 있다. 하나의 가능성으로서, 컴퓨팅 장치는 하나 이상의 처리 유닛 또는 프로세서, 디스플레이, 키보드 및/또는 마우스와 같은 하나 이상의 입/출력 장치, 및 정적 랜덤 액세스 메모리, 동적 랜덤 액세스 메모리, 플래시 메모리 및/또는 하드 드라이브와 같은 하나 이상의 메모리를 포함할 수 있다.The claimed subject matter is not to be limited in scope by the specific embodiments described herein. For example, some implementations can be in hardware, such as can be used to operate on a device or combination of devices, while other implementations can be in software and / or firmware, for example. Likewise, the claimed subject matter is not limited in scope in this respect, but some implementations may include one or more articles such as signal bearing media, storage media. Such storage media, such as CD-ROMs, computer disks, flash memories, and the like, are executed by a computing device, such as a computing system, computing platform, or other system, to a claimed subject, such as one of the embodiments described above. Thus, it can store instructions that can cause the processor to run. As one possibility, the computing device may include one or more processing units or one or more input / output devices, such as a processor, display, keyboard and / or mouse, and static random access memory, dynamic random access memory, flash memory and / or hard drive. It may contain more than one memory.
시스템의 양상들의 하드웨어 및 소프트웨어 구현 사이에는 구별이 거의 없다; 하드웨어 또는 소프트웨어의 사용은 일반적으로 (그러나 어떤 맥락에서 하드웨어 및 소프트웨어 사이의 선택이 중요할 수 있다는 점에서 항상 그런 것은 아니지만) 비용 대비 효율의 트레이드오프(tradeoff)를 나타내는 설계상 선택(design choice)이다. 본 개시에서 기재된 프로세스 및/또는 시스템 및/또는 다른 기술들이 영향 받을 수 있는 다양한 수단(vehicles)(예를 들어, 하드웨어, 소프트웨어 및/또는 펌웨어)이 있으며, 선호되는 수단은 프로세스 및/또는 시스템 및/또는 다른 기술이 사용되는 맥락(context)에 따라 변경될 것이다. 예를 들어, 구현자가 속도 및 정확성이 가장 중요하다고 결정한다면, 구현자는 주로 하드웨어 및/또는 펌웨어 수단을 선택할 수 있으며, 유연성이 가장 중요하다면, 구현자는 주로 소프트웨어 구현을 선택할 수 있으며; 또는, 다른 대안으로서, 구현자는 하드웨어, 소프트웨어 및/또는 펌웨어의 어떤 결합을 선택할 수 있다.There is little distinction between hardware and software implementation of aspects of the system; The use of hardware or software is generally a design choice that represents a cost-effective tradeoff (but not always in the sense that the choice between hardware and software in some contexts can be important). . There are various vehicles (e.g., hardware, software and / or firmware) in which the processes and / or systems and / or other techniques described in this disclosure can be affected, preferred means being processes and / or systems and And / or will change depending on the context in which other technologies are used. For example, if the implementer determines that speed and accuracy are the most important, the implementer can primarily choose the hardware and / or firmware means, and if flexibility is the most important, the implementer can mainly choose the software implementation; Or, as another alternative, implementers may choose any combination of hardware, software and / or firmware.
전술한 상세한 설명은 블록도, 흐름도, 및/또는 예시를 통해 장치 및/또는 프로세스의 다양한 실시예를 설명하였다. 그러한 블록도, 흐름도, 및/또는 예시는 하나 이상의 기능 및/또는 동작을 포함하는 한, 당업자라면 그러한 블록도, 흐름도, 또는 예시 내의 각각의 기능 및/또는 동작은 하드웨어, 소프트웨어, 펌웨어, 또는 그들의 실질적으로 임의의 조합의 넓은 범위에 의해 개별적으로 및/또는 집합적으로 구현될 수 있다는 것이 이해할 것이다. 일 실시예에서, 본 개시에 기재된 대상의 몇몇 부분은 ASIC(Application Specific Integrated Circuit), FPGA(Field Programmable Gate Array), DSP(Digital Signal Processor) 또는 다른 집적의 형태를 통해 구현될 수 있다. 그러나, 당업자라면, 본 개시의 실시예의 일부 양상은, 하나 이상의 컴퓨터 상에 실행되는 하나 이상의 컴퓨터 프로그램(예를 들어, 하나 이상의 컴퓨터 시스템 상에 실행되는 하나 이상의 프로그램), 하나 이상의 프로세서 상에서 실행되는 하나 이상의 프로그램(예를 들어, 하나 이상의 마이크로프로세서 상에서 실행되는 하나 이상의 프로그램), 펌웨어 또는 이들의 실질적으로 임의의 조합으로써, 전체적으로 또는 부분적으로 균등하게 집적 회로에서 구현될 수 있다는 점, 소프트웨어 및/또는 펌웨어를 위한 코드의 작성 및/또는 회로의 설계는 본 개시에 비추어 당업자의 기술 범위 내라는 점을 알 수 있을 것이다. 또한, 당업자라면, 본 개시의 대상의 매커니즘(mechanism)들이 다양한 형태의 프로그램 제품으로 분배될 수 있음을 이해할 것이며, 본 개시의 대상의 예시는, 분배를 실제로 수행하는데 사용되는 신호 베어링 매체의 특정 유형과 무관하게 적용됨을 이해할 것이다. The foregoing detailed description has described various embodiments of apparatus and / or processes through block diagrams, flow diagrams, and / or examples. As long as such block diagrams, flow diagrams, and / or examples include one or more functions and / or operations, those skilled in the art can provide each function and / or operation in such block diagrams, flow diagrams, or examples in hardware, software, firmware, or their It will be understood that it can be implemented individually and / or collectively by a wide range of virtually any combination. In one embodiment, some portions of the subject matter described in this disclosure may be implemented through an application specific integrated circuit (ASIC), field programmable gate array (FPGA), digital signal processor (DSP), or other form of integration. However, for those skilled in the art, some aspects of the embodiments of the present disclosure may include one or more computer programs running on one or more computers (eg, one or more programs running on one or more computer systems), one running on one or more processors. The above program (e.g., one or more programs running on one or more microprocessors), firmware, or substantially any combination thereof, that may be implemented in an integrated circuit, in whole or in part, equally, software and / or firmware It will be appreciated that writing code for and / or designing circuitry is within the skill of the artisan in light of the present disclosure. Further, those skilled in the art will understand that the mechanisms of the subject matter of the present disclosure can be distributed into various types of program products, and examples of the subject matter of the present disclosure are specific types of signal bearing media used to actually perform the distribution. You will understand that it applies regardless of
특정 예시적 기법이 다양한 방법 및 시스템을 이용하여 여기에서 기술되고 도시되었으나, 청구된 대상에서 벗어나지 않고, 다양한 기타의 수정이 이루어질 수 있고, 등가물이 대체될 수 있음이 당업자에 의해 이해되어야 한다. 추가적으로, 여기에 기술된 중심 개념으로부터 벗어남이 없이 특정 상황을 청구된 대상의 교시로 적응시키도록 많은 수정이 이루어질 수 있다. 따라서, 청구된 대상이 개시된 특정 예시로 제한되지 않으나, 그러한 청구된 대상은 또한 첨부된 청구범위 및 그 균등의 범위 내에 들어가는 모든 구현예를 포함할 수 있음이 의도된다.While certain exemplary techniques have been described and illustrated herein using various methods and systems, it should be understood by those skilled in the art that various other modifications may be made, and equivalents may be substituted, without departing from the claimed subject matter. Additionally, many modifications can be made to adapt a particular situation to the teaching of the claimed subject without departing from the central concept described herein. Accordingly, it is intended that the claimed subject matter is not limited to the particular examples disclosed, but such claimed subject matter may also include all embodiments falling within the scope of the appended claims and their equivalents.

Claims (16)

  1. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 생성 및 송신하는 송신 단말 상에서 수행되는 방법으로서, 상기 송신 단말은 인스턴트 메시지 서비스를 제공하는 통합 서버와 네트워크를 통해 데이터 통신 가능하게 연결되며, As a method performed on a transmitting terminal that generates and transmits a message by executing an instant message service application, the transmitting terminal is connected to an integrated server that provides an instant message service and enables data communication through a network.
    상기 방법은,The above method,
    상기 송신 단말의 사용자로부터 음성 메시지를 입력 받는 단계와,Receiving a voice message from a user of the transmitting terminal;
    상기 입력된 음성 메시지로부터 해당 음성 데이터를 생성하는 단계와,Generating corresponding voice data from the input voice message;
    상기 음성 데이터에 기초하여 상기 음성 메시지에 해당하는 텍스트 데이터를 생성하는 단계와, Generating text data corresponding to the voice message based on the voice data;
    상기 음성 데이터와 상기 텍스트 데이터를 결합하여 데이터 패킷을 생성하는 단계와, 그리고Generating a data packet by combining the voice data and the text data, and
    상기 데이터 패킷을 상기 통합 서버로 전송하는 단계Transmitting the data packet to the integrated server
    를 포함하는, 송신 단말 상에서 수행되는 방법.Method comprising, on the transmitting terminal.
  2. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 생성 및 송신하는 송신 단말 상에서 수행되는 방법으로서, 상기 송신 단말은 인스턴트 메시지 서비스를 제공하는 통합 서버와 네트워크를 통해 데이터 통신 가능하게 연결되며, As a method performed on a transmitting terminal that generates and transmits a message by executing an instant message service application, the transmitting terminal is connected to an integrated server that provides an instant message service and enables data communication through a network.
    상기 방법은,The above method,
    상기 송신 단말의 사용자로부터 음성 메시지를 입력 받는 단계와,Receiving a voice message from a user of the transmitting terminal;
    상기 입력된 음성 메시지로부터 해당 음성 데이터를 생성하는 단계와,Generating corresponding voice data from the input voice message;
    상기 사용자로부터 상기 음성 메시지에 해당하는 텍스트를 입력 받아 텍스트 데이터를 생성하는 단계와, Generating text data by receiving text corresponding to the voice message from the user;
    상기 음성 데이터와 상기 텍스트 데이터를 결합하여 데이터 패킷을 생성하는 단계와, 그리고Generating a data packet by combining the voice data and the text data, and
    상기 데이터 패킷을 상기 통합 서버로 전송하는 단계Transmitting the data packet to the integrated server
    를 포함하는, 송신 단말 상에서 수행되는 방법.Method comprising, on the transmitting terminal.
  3. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 생성 및 송신하는 송신 단말 상에서 수행되는 방법으로서, 상기 송신 단말은 인스턴트 메시지 서비스를 제공하는 중계 서버와 네트워크를 통해 데이터 통신 가능하게 연결되고, 또한 상기 송신 단말은 상기 인스턴트 메시지 서비스 어플리케이션을 실행하는 적어도 하나의 수신 단말과 직접적으로 통신 가능하도록 연결되며, A method performed on a transmitting terminal that generates and transmits a message by executing an instant message service application, wherein the transmitting terminal is connected to a relay server that provides an instant message service to enable data communication, and the transmitting terminal is It is connected to enable direct communication with at least one receiving terminal executing an instant message service application,
    상기 방법은,The above method,
    상기 송신 단말의 사용자로부터 음성 메시지를 입력 받는 단계와,Receiving a voice message from a user of the transmitting terminal;
    상기 입력된 음성 메시지로부터 해당 음성 데이터를 생성하는 단계와,Generating corresponding voice data from the input voice message;
    상기 음성 데이터에 기초하여 상기 음성 메시지에 해당하는 텍스트 데이터를 생성하는 단계와, Generating text data corresponding to the voice message based on the voice data;
    상기 음성 데이터와 상기 텍스트 데이터를 결합하여 데이터 패킷을 생성하는 단계와,Generating a data packet by combining the voice data and the text data;
    상기 데이터 패킷에 관한 알림 메시지를 생성하는 단계와,Generating a notification message regarding the data packet,
    상기 생성된 알림 메시지를 상기 중계 서버로 전송하는 단계와, 그리고Transmitting the generated notification message to the relay server, and
    상기 데이터 패킷을 상기 적어도 하나의 수신 단말로 전송하는 단계Transmitting the data packet to the at least one receiving terminal
    를 포함하는, 송신 단말 상에서 수행되는 방법.Method comprising, on the transmitting terminal.
  4. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 생성 및 송신하는 송신 단말 상에서 수행되는 방법으로서, 상기 송신 단말은 인스턴트 메시지 서비스를 제공하는 중계 서버와 네트워크를 통해 데이터 통신 가능하게 연결되고, 또한 상기 송신 단말은 상기 인스턴트 메시지 서비스 어플리케이션을 실행하는 적어도 하나의 수신 단말과 직접적으로 통신 가능하도록 연결되며, A method performed on a transmitting terminal that generates and transmits a message by executing an instant message service application, wherein the transmitting terminal is connected to a relay server that provides an instant message service to enable data communication, and the transmitting terminal is It is connected to enable direct communication with at least one receiving terminal executing an instant message service application,
    상기 방법은,The above method,
    상기 송신 단말의 사용자로부터 음성 메시지를 입력 받는 단계와,Receiving a voice message from a user of the transmitting terminal;
    상기 입력된 음성 메시지로부터 해당 음성 데이터를 생성하는 단계와,Generating corresponding voice data from the input voice message;
    상기 사용자로부터 상기 음성 메시지에 해당하는 텍스트를 입력 받아 텍스트 데이터를 생성하는 단계와, Generating text data by receiving text corresponding to the voice message from the user;
    상기 음성 데이터와 상기 텍스트 데이터를 결합하여 데이터 패킷을 생성하는 단계와,Generating a data packet by combining the voice data and the text data;
    상기 데이터 패킷에 관한 알림 메시지를 생성하는 단계와,Generating a notification message regarding the data packet,
    상기 생성된 알림 메시지를 상기 중계 서버로 전송하는 단계와, 그리고 Transmitting the generated notification message to the relay server, and
    상기 데이터 패킷을 상기 적어도 하나의 수신 단말로 전송하는 단계Transmitting the data packet to the at least one receiving terminal
    를 포함하는, 송신 단말 상에서 수행되는 방법.Method comprising, on the transmitting terminal.
  5. 인스턴트 메시지 서비스 어플리케이션을 실행하고, 인스턴트 메시지를 생성 및 송신하기 위한 송신 단말로서,As a transmitting terminal for executing an instant message service application, and generating and transmitting an instant message,
    상기 송신 단말의 사용자로부터 음성 메시지를 입력 받도록 구성되는 음성 입력 모듈;A voice input module configured to receive a voice message from a user of the transmitting terminal;
    상기 음성 입력 모듈에 의해 수신된 상기 음성 메시지로부터 해당 음성 데이터를 생성하도록 구성되는 음성 데이터 생성 모듈;A voice data generation module configured to generate corresponding voice data from the voice message received by the voice input module;
    상기 음성 메시지에 해당하는 텍스트 데이터를 생성하도록 구성된 텍스트 데이터 생성 모듈;A text data generation module configured to generate text data corresponding to the voice message;
    상기 음성 데이터와 상기 텍스트 데이터를 결합하여 데이터 패킷을 생성하도록 구성되는 데이터 패킷 생성 모듈; 및A data packet generation module configured to combine the voice data and the text data to generate a data packet; And
    상기 데이터 패킷을 서버 또는 적어도 하나의 수신 단말에 전송하도록 구성되는 통신 모듈A communication module configured to transmit the data packet to a server or at least one receiving terminal
    을 포함하고,Including,
    상기 텍스트 데이터 생성 모듈은 상기 음성 데이터 생성 모듈로부터의 상기 음성 데이터에 대한 음성 인식을 수행하도록 구성되는 음성 인식 모듈 및 상기 사용자로부터 상기 음성 메시지에 해당하는 텍스트를 입력 받도록 구성되는 텍스트 입력 모듈을 포함하고, The text data generation module includes a speech recognition module configured to perform speech recognition on the speech data from the speech data generation module and a text input module configured to receive text corresponding to the speech message from the user. ,
    상기 텍스트 데이터 생성 모듈은 상기 음성 인식 모듈 또는 상기 텍스트 입력 모듈 중 적어도 하나를 이용하여 상기 텍스트 데이터를 생성하도록 구성되는, 송신 단말.The text data generating module is configured to generate the text data using at least one of the speech recognition module or the text input module, the transmitting terminal.
  6. 제5항에 있어서,The method of claim 5,
    상기 데이터 패킷에 대한 알림 메시지를 생성하도록 구성되는 알림 생성 모듈Notification generating module configured to generate a notification message for the data packet
    을 더 포함하는 송신 단말.The transmitting terminal further comprising.
  7. 제5항에 있어서,The method of claim 5,
    상기 송신 단말 및 상기 적어도 하나의 수신 단말 상에서 디스플레이 가능한 캐릭터에 관한 정보를 획득하고 상기 캐릭터에 관한 정보로부터 캐릭터 데이터를 생성하도록 구성되는 캐릭터 모듈Character module configured to obtain information about a character that can be displayed on the transmitting terminal and the at least one receiving terminal, and generate character data from the information on the character
    을 더 포함하고,Further comprising,
    상기 데이터 패킷 생성 모듈은 상기 음성 데이터, 상기 텍스트 데이터 및 상기 캐릭터 데이터를 결합하여 상기 데이터 패킷을 생성하도록 구성되는, 송신 단말.The data packet generation module is configured to combine the voice data, the text data, and the character data to generate the data packet.
  8. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 생성 및 송신하기 위한 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 저장 매체로서, 상기 컴퓨터 프로그램은 실행되면, 컴퓨팅 장치로 하여금,A computer-readable storage medium storing a computer program for executing an instant message service application to generate and transmit a message, which, when executed, causes the computing device to:
    상기 컴퓨팅 장치의 사용자로부터 음성 메시지를 입력 받는 동작과,Receiving a voice message from a user of the computing device,
    상기 입력된 음성 메시지로부터 해당 음성 데이터를 생성하는 동작과,Generating corresponding voice data from the input voice message,
    상기 음성 데이터에 기초하여 상기 음성 메시지에 해당하는 텍스트 데이터를 생성하는 동작과, Generating text data corresponding to the voice message based on the voice data;
    상기 음성 데이터와 상기 텍스트 데이터를 결합하여 데이터 패킷을 생성하는 동작과, 그리고Generating a data packet by combining the voice data and the text data, and
    상기 데이터 패킷을 인스턴트 메시지 서비스를 제공하는 통합 서버로 전송하는 동작을 포함하는 동작들을 실행가능 하도록 하는 하나 이상의 컴퓨터 실행 가능 명령어를 포함하는 것인, 컴퓨터 판독가능 저장 매체.And one or more computer-executable instructions for making the actions executable, including sending the data packet to an integrated server providing an instant message service.
  9. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 수신하는 수신 단말 상에서 수행되는 방법으로서, 상기 수신 단말은 인스턴트 메시지 서비스를 제공하는 통합 서버와 네트워크를 통해 데이터 통신 가능하게 연결되며,As a method performed on a receiving terminal that executes an instant message service application to receive a message, the receiving terminal is connected to an integrated server providing an instant message service and data communication is possible through a network,
    상기 통합 서버로부터 송신 단말에 의해 전송된 데이터 패킷을 수신하는 단계;Receiving a data packet transmitted by the transmitting terminal from the integrated server;
    상기 데이터 패킷으로부터 음성 데이터를 획득하는 단계;Obtaining voice data from the data packet;
    상기 음성 데이터에 기초하여, 상기 음성 메시지에 해당하는 텍스트 데이터를 생성하는 단계;Generating text data corresponding to the voice message based on the voice data;
    상기 음성 데이터에 기초하여, 상기 음성 데이터에 대응하는 음성 메시지를 재생하는 단계; 및Reproducing a voice message corresponding to the voice data based on the voice data; And
    상기 텍스트 데이터에 기초하여, 상기 음성 메시지의 재생에 대응하여 상기 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하는 단계Based on the text data, displaying a text message corresponding to the text data in response to reproduction of the voice message
    를 포함하는 수신 단말 상에서 수행되는 방법.Method performed on the receiving terminal comprising a.
  10. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 수신하는 수신 단말 상에서 수행되는 방법으로서, 상기 수신 단말은 인스턴트 메시지 서비스를 제공하는 통합 서버와 네트워크를 통해 데이터 통신 가능하게 연결되며,As a method performed on a receiving terminal that executes an instant message service application to receive a message, the receiving terminal is connected to an integrated server providing an instant message service and data communication is possible through a network,
    상기 통합 서버로부터 송신 단말에 의해 전송된 데이터 패킷을 수신하는 단계;Receiving a data packet transmitted by the transmitting terminal from the integrated server;
    상기 데이터 패킷으로부터 텍스트 데이터를 획득하는 단계;Obtaining text data from the data packet;
    상기 데이터 패킷으로부터 상기 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없다고 결정하는 단계;Determining that speech data corresponding to the text data cannot be obtained from the data packet;
    상기 텍스트 데이터에 기초하여, 상기 텍스트 데이터에 해당하는 상기 음성 데이터를 생성하는 단계;Generating the voice data corresponding to the text data based on the text data;
    상기 음성 데이터에 기초하여, 상기 음성 데이터에 대응하는 음성 메시지를 재생하는 단계; 및Reproducing a voice message corresponding to the voice data based on the voice data; And
    상기 텍스트 데이터에 기초하여, 상기 음성 메시지의 재생에 대응하여 상기 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하는 단계Based on the text data, displaying a text message corresponding to the text data in response to reproduction of the voice message
    를 포함하는 수신 단말 상에서 수행되는 방법.Method performed on the receiving terminal comprising a.
  11. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 수신하는 수신 단말 상에서 수행되는 방법으로서, 상기 수신 단말은 인스턴트 메시지 서비스를 제공하는 중계 서버와 네트워크를 통해 데이터 통신 가능하게 연결되고, 또한 상기 수신 단말은 상기 인스턴트 메시지 서비스 어플리케이션을 실행하는 송신 단말과 직접적으로 통신 가능하도록 연결되며, As a method performed on a receiving terminal that executes an instant message service application to receive a message, the receiving terminal is capable of data communication through a network with a relay server providing an instant message service, and the receiving terminal is also capable of receiving the instant message. It is connected to be able to communicate directly with the transmitting terminal running the service application,
    상기 중계 서버로부터 상기 송신 단말에 의해 전송된 데이터 패킷에 대한 알림 메시지를 수신하는 단계;Receiving a notification message for a data packet transmitted by the transmitting terminal from the relay server;
    상기 알림 메시지에 응답하여, 상기 송신 단말로부터 상기 데이터 패킷을 수신하는 단계;Receiving the data packet from the transmitting terminal in response to the notification message;
    상기 데이터 패킷으로부터 음성 데이터를 획득하는 단계;Obtaining voice data from the data packet;
    상기 음성 데이터에 기초하여, 상기 음성 메시지에 해당하는 텍스트 데이터를 생성하는 단계;Generating text data corresponding to the voice message based on the voice data;
    상기 음성 데이터에 기초하여, 상기 음성 데이터에 대응하는 음성 메시지를 재생하는 단계; 및Reproducing a voice message corresponding to the voice data based on the voice data; And
    상기 텍스트 데이터에 기초하여, 상기 음성 메시지의 재생에 대응하여 상기 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하는 단계Based on the text data, displaying a text message corresponding to the text data in response to reproduction of the voice message
    를 포함하는 수신 단말 상에서 수행되는 방법.Method performed on the receiving terminal comprising a.
  12. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 수신하는 수신 단말 상에서 수행되는 방법으로서, 상기 수신 단말은 인스턴트 메시지 서비스를 제공하는 중계 서버와 네트워크를 통해 데이터 통신 가능하게 연결되고, 또한 상기 수신 단말은 상기 인스턴트 메시지 서비스 어플리케이션을 실행하는 송신 단말과 직접적으로 통신 가능하도록 연결되며, As a method performed on a receiving terminal that executes an instant message service application to receive a message, the receiving terminal is capable of data communication through a network with a relay server providing an instant message service, and the receiving terminal is also capable of receiving the instant message. It is connected to be able to communicate directly with the transmitting terminal running the service application,
    상기 중계 서버로부터 상기 송신 단말에 의해 전송된 데이터 패킷에 대한 알림 메시지를 수신하는 단계;Receiving a notification message for a data packet transmitted by the transmitting terminal from the relay server;
    상기 알림 메시지에 응답하여, 상기 송신 단말로부터 상기 데이터 패킷을 수신하는 단계;Receiving the data packet from the transmitting terminal in response to the notification message;
    상기 데이터 패킷으로부터 텍스트 데이터를 획득하는 단계;Obtaining text data from the data packet;
    상기 데이터 패킷으로부터 상기 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없다고 결정하는 단계;Determining that speech data corresponding to the text data cannot be obtained from the data packet;
    상기 텍스트 데이터에 기초하여, 상기 텍스트 데이터에 해당하는 상기 음성 데이터를 생성하는 단계;Generating the voice data corresponding to the text data based on the text data;
    상기 음성 데이터에 기초하여, 상기 음성 데이터에 대응하는 음성 메시지를 재생하는 단계; 및Reproducing a voice message corresponding to the voice data based on the voice data; And
    상기 텍스트 데이터에 기초하여, 상기 음성 메시지의 재생에 대응하여 상기 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하는 단계Based on the text data, displaying a text message corresponding to the text data in response to reproduction of the voice message
    를 포함하는 수신 단말 상에서 수행되는 방법.Method performed on the receiving terminal comprising a.
  13. 인스턴트 메시지 서비스 어플리케이션을 실행하고, 인스턴트 메시지를 수신하기 위한 수신 단말로서,As a receiving terminal for executing an instant message service application and receiving an instant message,
    송신 단말에 의해 전송된 데이터 패킷을 서버 또는 상기 송신 단말로부터 수신하도록 구성되는 통신 모듈;A communication module configured to receive a data packet transmitted by a transmitting terminal from a server or the transmitting terminal;
    상기 데이터 패킷으로부터 음성 데이터 또는 텍스트 데이터 중 적어도 하나를 획득하도록 구성되는 데이터 획득 모듈;A data acquisition module, configured to acquire at least one of voice data or text data from the data packet;
    음성 인식 모듈 및 음성 생성 모듈을 포함하는 데이터 보완 모듈; 및A data supplement module including a speech recognition module and a speech generation module; And
    상기 음성 데이터에 기초하여, 상기 음성 데이터에 대응하는 음성 메시지를 재생하도록 구성되는 재생 모듈 및 상기 텍스트 데이터에 기초하여, 상기 음성 메시지의 재생에 대응하여 상기 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하도록 구성되는 디스플레이 모듈을 포함하는 출력 모듈Based on the voice data, a playback module configured to play back a voice message corresponding to the voice data, and based on the text data, configured to display a text message corresponding to the text data in response to the reproduction of the voice message Output module including a display module
    을 포함하고,Including,
    상기 데이터 획득 모듈이 상기 데이터 패킷으로부터 상기 음성 데이터를 획득하고 상기 음성 데이터에 해당하는 상기 텍스트 데이터를 획득할 수 없는 경우, 상기 데이터 보완 모듈은 상기 음성 인식 모듈로 하여금 상기 음성 데이터에 해당하는 상기 텍스트 데이터를 생성하도록 하고,If the data acquisition module is unable to acquire the voice data from the data packet and acquire the text data corresponding to the voice data, the data supplement module causes the voice recognition module to cause the text corresponding to the voice data. To generate data,
    상기 데이터 획득 모듈이 상기 데이터 패킷으로부터 상기 텍스트 데이터를 획득하고 상기 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없는 경우, 상기 데이터 보완 모듈은 상기 음성 생성 모듈로 하여금 상기 텍스트 데이터에 해당하는 상기 음성 데이터를 생성하도록 하는 것인, 수신 단말.When the data acquisition module is unable to acquire the text data from the data packet and acquire speech data corresponding to the text data, the data supplement module causes the speech generation module to generate the speech data corresponding to the text data. It is to be generated, the receiving terminal.
  14. 제13항에 있어서,The method of claim 13,
    상기 통신 모듈은, The communication module,
    상기 서버로부터 상기 데이터 패킷에 대한 알림 메시지를 수신하고, 그리고Receiving a notification message for the data packet from the server, and
    상기 알림 메시지에 응답하여, 상기 송신 단말로부터 상기 데이터 패킷을 수신하도록 구성되는 것인, 수신 단말.In response to the notification message, it is configured to receive the data packet from the transmitting terminal, the receiving terminal.
  15. 제13항에 있어서,The method of claim 13,
    상기 데이터 획득 모듈은 상기 데이터 패킷으로부터 상기 디스플레이 모듈에 의해 디스플레이 가능한 캐릭터에 관한 정보를 포함하는 캐릭터 데이터를 획득하도록 구성되고,The data acquisition module is configured to acquire character data including information about a character displayable by the display module from the data packet,
    상기 출력 모듈은 상기 디스플레이 모듈로 하여금 상기 캐릭터 데이터에 기초하여, 상기 텍스트 메시지의 디스플레이 및 상기 음성 메시지의 재생과 함께 상기 캐릭터를 디스플레이 하도록 구성되는 것인, 수신 단말.The output module is configured to cause the display module to display the character together with the display of the text message and reproduction of the voice message based on the character data.
  16. 인스턴트 메시지 서비스 어플리케이션을 실행하여 메시지를 수신하기 위한 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 저장 매체로서, 상기 컴퓨터 프로그램은 실행되면, 컴퓨팅 장치로 하여금,A computer-readable storage medium storing a computer program for executing an instant message service application and receiving a message, the computer program, when executed, causes the computing device to:
    서버 또는 송신 단말로부터 상기 송신 단말에 의해 전송된 데이터 패킷을 수신하는 동작;Receiving a data packet transmitted by the transmitting terminal from a server or transmitting terminal;
    상기 데이터 패킷으로부터 텍스트 데이터를 획득하는 동작;Obtaining text data from the data packet;
    상기 데이터 패킷으로부터 상기 텍스트 데이터에 해당하는 음성 데이터를 획득할 수 없다고 결정하는 동작;Determining that speech data corresponding to the text data cannot be obtained from the data packet;
    상기 텍스트 데이터에 기초하여, 상기 텍스트 데이터에 해당하는 상기 음성 데이터를 생성하는 동작;Generating the voice data corresponding to the text data based on the text data;
    상기 음성 데이터에 기초하여, 상기 음성 데이터에 대응하는 음성 메시지를 재생하는 동작; 및Reproducing a voice message corresponding to the voice data based on the voice data; And
    상기 텍스트 데이터에 기초하여, 상기 음성 메시지의 재생에 대응하여 상기 텍스트 데이터에 대응하는 텍스트 메시지를 디스플레이 하는 동작을 포함하는 동작들을 실행가능 하도록 하는 하나 이상의 컴퓨터 실행 가능 명령어를 포함하는 것인, 컴퓨터 판독가능 저장 매체.And based on the text data, comprising one or more computer-executable instructions to make operations executable, including displaying a text message corresponding to the text data in response to reproduction of the voice message. Possible storage media.
PCT/KR2018/011769 2018-09-28 2018-10-05 Device, method and computer-readable recording medium for providing asynchronous instant messaging service WO2020067597A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180116025A KR20200036414A (en) 2018-09-28 2018-09-28 Device, method and computer readable storage medium to provide asynchronous instant message service
KR10-2018-0116025 2018-09-28

Publications (1)

Publication Number Publication Date
WO2020067597A1 true WO2020067597A1 (en) 2020-04-02

Family

ID=69952980

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2018/011769 WO2020067597A1 (en) 2018-09-28 2018-10-05 Device, method and computer-readable recording medium for providing asynchronous instant messaging service

Country Status (2)

Country Link
KR (1) KR20200036414A (en)
WO (1) WO2020067597A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060034635A (en) * 2003-05-08 2006-04-24 빔플리시티 엘티디. Methods and systems for instant voice messaging and instant voice message retrieval
KR20060083338A (en) * 2005-01-14 2006-07-20 에스케이 텔레콤주식회사 Method and system for providing messenger service
KR20060104324A (en) * 2005-03-30 2006-10-09 주식회사 케이티프리텔 System and method for providing messages mixed character
KR101181785B1 (en) * 2008-04-08 2012-09-11 가부시키가이샤 엔.티.티.도코모 Media process server apparatus and media process method therefor
KR20130125057A (en) * 2012-05-08 2013-11-18 삼성전자주식회사 Operation method and system for communication service

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060034635A (en) * 2003-05-08 2006-04-24 빔플리시티 엘티디. Methods and systems for instant voice messaging and instant voice message retrieval
KR20060083338A (en) * 2005-01-14 2006-07-20 에스케이 텔레콤주식회사 Method and system for providing messenger service
KR20060104324A (en) * 2005-03-30 2006-10-09 주식회사 케이티프리텔 System and method for providing messages mixed character
KR101181785B1 (en) * 2008-04-08 2012-09-11 가부시키가이샤 엔.티.티.도코모 Media process server apparatus and media process method therefor
KR20130125057A (en) * 2012-05-08 2013-11-18 삼성전자주식회사 Operation method and system for communication service

Also Published As

Publication number Publication date
KR20200036414A (en) 2020-04-07

Similar Documents

Publication Publication Date Title
US11032709B2 (en) Host a conference call
WO2022089192A1 (en) Interaction processing method and apparatus, electronic device, and storage medium
WO2016171515A1 (en) Method for transferring user's uploaded contents to user-related chat room, and contents-sharing apparatus and application implementing same
EP3583789A1 (en) Systems and methods for notification delivery
WO2023143299A1 (en) Message display method and apparatus, device, and storage medium
CN110989889A (en) Information display method, information display device and electronic equipment
WO2018182063A1 (en) Video call providing device, method, and computer program
WO2015102125A1 (en) Text message conversation system and method
WO2020045712A1 (en) Device, method and computer-readable recording medium for providing asynchronous instant messaging service
WO2022092439A1 (en) Speech image provision method, and computing device for performing same
WO2013125915A1 (en) Method and apparatus for processing information of image including a face
WO2020233171A1 (en) Song list switching method, apparatus and system, terminal, and storage medium
WO2020067597A1 (en) Device, method and computer-readable recording medium for providing asynchronous instant messaging service
EP4322090A1 (en) Information processing device and information processing method
CN112968826B (en) Voice interaction method and device and electronic equipment
WO2021220812A1 (en) Information processing device, information processing method, output device, output method, program, and notification system
WO2016195324A1 (en) Device for providing messenger-based service and method using same
CN114566173A (en) Audio mixing method, device, equipment and storage medium
KR20220081090A (en) Method and system for generating emotion based multimedia content
US10623448B2 (en) Audio data transfer device and audio data transfer method
WO2020055027A1 (en) Language learning apparatus
US20240129432A1 (en) Systems and methods for enabling a smart search and the sharing of results during a conference
WO2022270669A1 (en) Method for providing utterance image and computing device for performing same
JP2019125972A (en) Terminal device, information processing method, program, and communication system
WO2018030557A1 (en) Messenger service method, system and recording medium for providing output effect

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18935206

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18935206

Country of ref document: EP

Kind code of ref document: A1