WO2022131576A1 - Method and device for providing artificial intelligence assistant service through voice call - Google Patents

Method and device for providing artificial intelligence assistant service through voice call Download PDF

Info

Publication number
WO2022131576A1
WO2022131576A1 PCT/KR2021/016688 KR2021016688W WO2022131576A1 WO 2022131576 A1 WO2022131576 A1 WO 2022131576A1 KR 2021016688 W KR2021016688 W KR 2021016688W WO 2022131576 A1 WO2022131576 A1 WO 2022131576A1
Authority
WO
WIPO (PCT)
Prior art keywords
terminal
request message
query
data call
server
Prior art date
Application number
PCT/KR2021/016688
Other languages
French (fr)
Korean (ko)
Inventor
최승진
Original Assignee
주식회사 아이큐브넷
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아이큐브넷 filed Critical 주식회사 아이큐브넷
Publication of WO2022131576A1 publication Critical patent/WO2022131576A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations

Definitions

  • Embodiments relate to a method and apparatus for providing an artificial intelligence assistant service through a voice call. More specifically, it relates to a method of providing an artificial intelligence assistant service through a voice call based on automatic reception.
  • the following describes a method and apparatus for providing a service using artificial intelligence so that it can flexibly respond to various requests of consumers by using artificial intelligence.
  • Patent Document 1 Korean Patent Application Publication No. 10-2018-0112349
  • the present specification may provide a method and apparatus for providing an artificial intelligence assistant service through a voice call.
  • the receiver terminal may provide an automatic answer based on artificial intelligence to the caller terminal through a voice call.
  • the present specification may generate a response through artificial intelligence based on the request of the sender terminal, and provide the generated response to the sender terminal.
  • the present specification may provide an artificial intelligence assistant service based on a voice call by converting it into a data call.
  • the method of operation of the first terminal includes the steps of receiving a voice call from the second terminal, performing automatic connection, receiving a first query request message from the second terminal after the automatic connection is performed, the first transmitting a second query request message based on the first query request message to an AI server; receiving a first query response message based on the second query request message from the AI server; and a first query response message based on the first query response message It may include transmitting the second query response message to the second terminal.
  • the first query request message is transmitted to the first terminal by voice based on the voice call, and the second query request transmitted by the first terminal to the AI server
  • the message may include at least one of text information converted by performing speech to text (STT) processing on the first query request message and voice file information generated based on the first query request message.
  • STT speech to text
  • the first query response message delivered by the AI server to the first terminal includes text information generated based on the second query request message and the second query request message. At least one of the voice file information generated based on the information, wherein the first terminal generates the second query response message based on the first query response message received from the AI server, and the generated second A question and answer message may be provided to the second terminal by voice based on the voice call.
  • transmitting a request message for converting the voice call into a data call to the second terminal receiving an acceptance message in response to the request message from the second terminal , and converting the voice call into the data call based on the acceptance message.
  • the request message may be transmitted to the second terminal.
  • the method further comprising the step of determining, by the first terminal, whether the data call conversion is necessary based on the data processing capability, wherein the first terminal is the first terminal based on the data processing capability
  • the request message may be transmitted to the second terminal.
  • the data call is performed based on a third messenger platform, and the data call includes identification information in the third messenger platform of the first terminal and the data call of the second terminal. It may be performed based on identification information in the third messenger platform.
  • the method may further include receiving an acceptance message for the data call from a third messenger platform, wherein when the acceptance message is received, the data call may be performed based on the third messenger platform.
  • the method may further include receiving the related content information selected by the second terminal based on the information, wherein the first query request message may be generated based on the related content information selected by the second terminal.
  • the present specification may provide a method and apparatus for providing an artificial intelligence assistant service through a voice call.
  • the present specification has an effect of providing a response to the calling terminal through artificial intelligence in consideration of the contents of the called terminal through a voice call.
  • the present specification has the effect of providing a flexible response by analyzing the request of the sender terminal through artificial intelligence and generating and providing a response corresponding to the request.
  • the present specification has an effect of providing specific response information by converting an artificial intelligence assistant service based on a voice call into a data call.
  • FIG. 1 is a diagram illustrating an example of an operating environment of a system according to an embodiment of the present specification.
  • FIG. 2 is a block diagram illustrating an internal configuration of the computing device 200 according to an embodiment of the present specification.
  • FIG. 3 is a diagram illustrating a method of providing a response to a request of a caller terminal through a voice call based on artificial intelligence according to an embodiment of the present specification.
  • 4A is a diagram illustrating a method of providing a response to a request of a caller terminal according to an embodiment of the present specification.
  • 4B is a diagram illustrating a method of providing a response to a request of a caller terminal based on related content according to an embodiment of the present specification.
  • 4C is a diagram illustrating a method of providing a response to a request of a caller terminal based on related content according to an embodiment of the present specification.
  • 4D is a diagram illustrating a method of providing a response to a request of a caller terminal based on related content according to an embodiment of the present specification.
  • 5A is a diagram illustrating a method of converting a voice call into a data call according to an embodiment of the present specification.
  • 5B is a diagram illustrating a method of converting a voice call into a data call based on a preset time according to an embodiment of the present specification.
  • 5C is a diagram illustrating a method of converting a voice call into a data call based on artificial intelligence according to an embodiment of the present specification.
  • 6A is a diagram illustrating a method of converting a voice call into a data call based on a third messenger platform according to an embodiment of the present specification.
  • 6B is a diagram illustrating a method of converting a voice call into a data call based on the third messenger platform according to an embodiment of the present specification.
  • FIG. 7A is a diagram illustrating a method of providing a response to a caller terminal according to an embodiment of the present specification.
  • 7B is a diagram illustrating a method of providing a response to a caller terminal according to an embodiment of the present specification.
  • FIG. 8 is a flowchart illustrating a method of providing an artificial intelligence assistant service through a voice call according to an embodiment of the present specification.
  • a component when a component is “connected”, “coupled” or “connected” with another component, it is not only a direct connection relationship, but also an indirect relationship where another component exists in the middle. It can also include human connections.
  • a component when a component is said to "include” or “have” another component, it means that another component may be further included without excluding other components unless otherwise stated. .
  • first, second, etc. are used only for the purpose of distinguishing one component from other components, and unless otherwise specified, do not limit the order or importance between the components. does not Accordingly, within the scope of the embodiments herein, a first component in an embodiment may be referred to as a second component in another embodiment, and similarly, a second component in an embodiment is referred to as a first component in another embodiment. can also be called
  • the components that are distinguished from each other are for clearly explaining each characteristic, and the components do not necessarily mean that the components are separated. That is, a plurality of components may be integrated to form one hardware or software unit, or one component may be distributed to form a plurality of hardware or software units. Accordingly, even if not specifically mentioned, such integrated or dispersed embodiments are also included in the scope of the embodiments of the present specification.
  • the network may be a concept including both wired and wireless networks.
  • the network may mean a communication network in which data exchange between the device and the system and devices can be performed, and is not limited to a specific network.
  • Embodiments described herein may have aspects that are entirely hardware, partly hardware and partly software, or entirely software.
  • "unit,” “device,” or “system,” or the like refers to hardware, a combination of hardware and software, or a computer-related entity, such as software.
  • a part, module, device, or system is a running process, a processor, an object, an executable, a thread of execution, a program, and/or a computer. (computer), but is not limited thereto.
  • both an application running on a computer and a computer may correspond to a part, module, device, or system of the present specification.
  • the device may be a mobile device such as a smart phone, a tablet PC, a wearable device, and a head mounted display (HMD), as well as a fixed device such as a PC or home appliance having a display function.
  • the device may be an in-vehicle cluster or an Internet of Things (IoT) device. That is, in the present specification, a device may refer to devices capable of operating an application, and is not limited to a specific type. Hereinafter, for convenience of description, a device in which an application operates is referred to as a device.
  • the communication method of the network is not limited, and the connection between each component may not be connected in the same network method.
  • the network may include not only a communication method using a communication network (eg, a mobile communication network, a wired Internet, a wireless Internet, a broadcasting network, a satellite network, etc.) but also short-range wireless communication between devices.
  • the network may include all communication methods through which an object and an object can network, and is not limited to wired communication, wireless communication, 3G, 4G, 5G, or other methods.
  • a wired and/or network may be a Local Area Network (LAN), a Metropolitan Area Network (MAN), a Global System for Mobile Network (GSM), an Enhanced Data GSM Environment (EDGE), a High Speed Downlink Packet Access (HSDPA), W-CDMA (Wideband Code Division Multiple Access), CDMA (Code Division Multiple Access), TDMA (Time Division Multiple Access), Bluetooth, Zigbee, Wi-Fi, VoIP (Voice over) Internet Protocol), LTE Advanced, IEEE802.16m, WirelessMAN-Advanced, HSPA+, 3GPP Long Term Evolution (LTE), Mobile WiMAX (IEEE 802.16e), UMB (formerly EV-DO Rev.
  • LAN Local Area Network
  • MAN Metropolitan Area Network
  • GSM Global System for Mobile Network
  • EDGE Enhanced Data GSM Environment
  • HSDPA High Speed Downlink Packet Access
  • W-CDMA Wideband Code Division Multiple Access
  • CDMA Code Division Multiple Access
  • TDMA Time Division Multiple Access
  • Bluetooth Zigbee, Wi-
  • Flash-OFDM Flash-OFDM
  • iBurst and MBWA (IEEE 802.20) systems Flash-OFDM
  • iBurst and MBWA (IEEE 802.20) systems HIPERMAN
  • Beam-Division Multiple Access (BDMA) Beam-Division Multiple Access
  • Wi-MAX Worldwide Interoperability for Microwave Access
  • ultrasonic-based communication can refer to a communication network by one or more communication methods selected from the group consisting of However, the present invention is not limited thereto.
  • Components described in various embodiments do not necessarily mean essential components, and some may be optional components. Accordingly, an embodiment composed of a subset of the components described in the embodiment is also included in the scope of the embodiment of the present specification. In addition, embodiments including other components in addition to the components described in various embodiments are also included in the scope of the embodiments of the present specification.
  • FIG. 1 is a diagram illustrating an example of an operating environment of a system according to an embodiment of the present specification.
  • a user device 110 and one or more servers 120 , 130 , 140 are connected through a network 1 .
  • 1 is an example for explaining the invention, and the number of user devices or the number of servers is not limited as in FIG. 1 .
  • the user device 110 may be a fixed terminal implemented as a computer system or a mobile terminal.
  • the user device 110 is, for example, a smart phone, a mobile phone, a navigation system, a computer, a laptop computer, a digital broadcasting terminal, a PDA (Personal Digital Assistants), a PMP (Portable Multimedia Player), a tablet PC, a game console (game). console), a wearable device, an Internet of things (IoT) device, a virtual reality (VR) device, and an augmented reality (AR) device.
  • the user device 110 may actually use one of a variety of physical computer systems capable of communicating with the other servers 120 - 140 over the network 1 using a wireless or wired communication scheme. can mean
  • Each server may be implemented as a computer device or a plurality of computer devices that communicate with the user device 110 and the network 1 to provide commands, codes, files, contents, services, and the like.
  • the server may be a system that provides each service to the user device 110 connected through the network 1 .
  • the server may provide a service (eg, information provision, etc.) targeted by the corresponding application to the user device 110 through an application as a computer program installed and driven in the user device 110 .
  • the server may distribute the above-described file for installation and operation of the application to the user device 110 , and may provide a corresponding service by receiving user input information.
  • the artificial intelligence (AI) server may be any one of the servers of FIG. 1 .
  • the receiver terminal performing data communication with the AI server and the caller terminal performing voice call and/or data communication with the receiver terminal may be one of the users of FIG. 1 .
  • the third messenger platform may be any one of the servers of FIG. 1 , and is not limited to the above-described embodiment.
  • FIG. 2 is a block diagram illustrating an internal configuration of the computing device 200 according to an embodiment of the present specification.
  • the computing device 200 may be applied to one or more of the user devices 110-1 and 110-2 or the servers 120-140 described above with reference to FIG. 1, and each device and server may add some components or By being configured to exclude, it may have the same or similar internal configuration.
  • the computing device 200 may include a memory 210 , a processor 220 , a communication module 230 , and a transceiver 240 .
  • the memory 210 is a non-transitory computer-readable recording medium, and is a non-volatile, high-capacity, non-volatile memory such as random access memory (RAM), read only memory (ROM), disk drive, solid state drive (SSD), and flash memory. It may include a permanent mass storage device.
  • a non-volatile mass storage device such as a ROM, an SSD, a flash memory, a disk drive, etc. may be included in the above-described device or server as a separate permanent storage device distinct from the memory 210 .
  • the memory 210 stores an operating system and at least one program code (eg, a browser installed and driven on the user device 110 , or an application installed on the user device 110 to provide a specific service).
  • program code eg, a browser installed and driven on the user device 110 , or an application installed on the user device 110 to provide a specific service.
  • the separate computer-readable recording medium may include a computer-readable recording medium such as a floppy drive, a disk, a tape, a DVD/CD-ROM drive, and a memory card.
  • the software components may be loaded into the memory 210 through the communication module 230 instead of a computer-readable recording medium.
  • the at least one program is a computer program installed by files provided through the network 1 by a file distribution system (eg, the above-described server) that distributes the installation files of developers or applications (eg, a computer program) It may be loaded into the memory 210 based on the above-described application).
  • the processor 220 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations.
  • the instructions may be provided to the processor 220 by the memory 210 or the communication module 230 .
  • the processor 220 may be configured to execute a received instruction according to a program code stored in a recording device such as the memory 210 .
  • the communication module 230 may provide a function for the user device 110 and the server 120 -140 to communicate with each other via the network 1, and the device 110 and/or the server 120 - 140, respectively. It may provide a function for communicating with other electronic devices.
  • the transceiver 240 may be a means for interfacing with an external input/output device (not shown).
  • the external input device may include devices such as a keyboard, mouse, microphone, and camera
  • the external output device may include devices such as a display, a speaker, and a haptic feedback device.
  • the transceiver 240 may be a means for an interface with a device in which functions for input and output are integrated into one, such as a touch screen.
  • the computing device 200 may include more components than those of FIG. 2 according to the properties of the applied device.
  • the computing device 200 when it is applied to the user device 110, it is implemented to include at least some of the above-described input/output devices, or a transceiver, a global positioning system (GPS) module, a camera, various sensors, It may further include other components such as a database and the like.
  • GPS global positioning system
  • the user device when the user device is a smartphone, various types of acceleration sensors, gyro sensors, camera modules, various physical buttons, buttons using a touch panel, input/output ports, vibrators for vibration, etc. included in the smartphone are generally included. It may be implemented to include more components.
  • each of the terminals and servers may be devices that communicate with other terminals or servers based on FIG. 2 . That is, the terminal and the server described below may be subjects that are connected through a mutual network based on FIG. 1 and perform communication, and each terminal and the server have a memory, a processor, a communication module, and a transceiver based on FIG. 2 . and other configurations and may be a computing device that operates.
  • the configurations may include various configurations as a computing device, and may not be limited to a specific computing device.
  • a voice call (or voice call) may be received, and a service may be provided based on a predetermined item through the ARS response server.
  • companies that have many stores and customers such as card companies or home appliance companies, and companies that sell a lot of products can build and provide a server for ARS response.
  • a method for performing automatic reception in the user terminal will be described below.
  • a method for the user terminal to provide a flexible answer according to a request rather than a preset item through the AI server will be described. That is, the following describes a method in which the receiver terminal provides an artificial intelligence assistant service that flexibly responds to various requests and responses of the sender terminal by using artificial intelligence.
  • FIG. 3 is a diagram illustrating a method of providing a response to a request of a caller terminal through a voice call based on artificial intelligence according to an embodiment of the present specification.
  • the receiver terminal 320 may set automatic reception of a voice call delivered from the caller terminal 310 .
  • the receiver terminal 320 may be a carrier terminal, and may be a smartphone or other device. That is, the receiver terminal 320 is not implemented as a specific server, and may be a commonly used mobile device and may not be limited to a specific device.
  • the caller terminal 310 may be a device of a user who wants to receive a service from a service provider. That is, the sender terminal 310 may be a device of a customer who wants to receive a service from a service provider based on the receiver terminal 320 .
  • the receiver terminal 320 may receive a voice call (or voice call) from the caller terminal 310 .
  • the user of the caller terminal 310 may attempt a voice call with the receiver terminal 320 based on identification information (e.g. phone number).
  • identification information e.g. phone number
  • the sender terminal 310 and the receiver terminal 320 may perform data exchange by performing data communication with each other, and the embodiment is not limited thereto.
  • the receiver terminal 320 may perform data communication with the AI server 330 . That is, the receiver terminal 320 performs data exchange by communicating with the AI server 330 as a general device rather than a separate server, and can acquire desired information through this.
  • the AI server 330 may be a server that processes the request of the sender terminal 310 and provides it to the receiver terminal 320 .
  • the AI server 330 may be a server that has a learning model and is continuously updated by learning through a response to a request from a plurality of caller terminals 310 .
  • the input of the AI server 330 may be a request from the sender terminal 310
  • the output may be a response to the request of the sender terminal 310 .
  • the AI server 330 may continuously perform an update based on the above-described input and output, and may provide a flexible response to the caller terminal 310 based on the update.
  • the receiver terminal 320 when the receiver terminal 320 receives a voice call from the caller terminal 310, the receiver terminal 320 provides an automatic answer to the caller terminal 310, and based on the automatic answer, the caller terminal 320 ) can be processed.
  • the caller terminal 310 may transmit a query request to the receiver terminal 320 based on the voice call. That is, the user of the caller terminal 310 may transmit "query 1A" to the receiver terminal 320 by voice based on the automatic answer.
  • the receiver terminal 320 may transmit the query request message converted into text to the AI server 330 by processing "Query 1A" from the sender terminal 310 by STT (Speech to Text).
  • the receiver terminal 320 may generate a request from the sender terminal 310 as a voice file and transmit the generated voice file to the AI server 330 , but is not limited to the above-described embodiment. That is, the receiver terminal 320 may generate "Query 1B" related to "Query 1A" received from the sender terminal 310 in the form of a text or voice file, and transmit it to the AI server 330 . "Query 1B" may be in the form of a text or audio file and is not limited to the above-described embodiment. Thereafter, the receiver terminal 320 may receive "response 1A" which is a response to "query 1B" from the AI server 330 .
  • response 1A may be in the form of a text or voice file. That is, the AI server 330 may respond to “Query 1B” to the receiver terminal 320 as a message in the form of a text message or a message in the form of a voice file. In this case, as an example, the AI server 330 may obtain “answer 1A” that is an output with “query 1B” as an input based on the above-described learning model, and through this, can provide a flexible response.
  • the receiver terminal 320 may provide the "response 1B" to the sender terminal 310 based on the "response 1A".
  • the "response 1A” received from the AI server 330 is text
  • the "response 1B” may be provided to the caller terminal 310 after conversion to a voice file through text to speech (TTS) processing.
  • TTS text to speech
  • the receiver terminal 320 may provide the "response 1B" converted to voice to the caller terminal 310 based on the voice call. .
  • the user of the sender terminal 310 when the user of the sender terminal 310 has an additional query, as described above, the user of the sender terminal 310 performs an additional query request to the receiver terminal 320 , and the receiver terminal 320 provides a flexible response based on the AI server 330 . Information may be generated and provided to the caller terminal 310 .
  • a method for specifying query information of the caller terminal may be required.
  • service quality degradation may occur.
  • the information processing time of the AI server that receives the related information from the receiver terminal may be delayed, and based on this, delay may occur in service provision.
  • the receiver terminal 420 and the caller terminal 410 are related content can be determined.
  • the related content may be determined based on the characteristics or content of the receiver terminal 420 .
  • related content may be set based on related information.
  • the related content may be set to any one of order-related, consultation-related, and business hours-related.
  • this is only one example, and related content may be set in various ways, and is not limited to the above-described embodiment.
  • related content when the operator of the receiver terminal 420 sets the receiver terminal 420 based on health-related business, related content may be set based on related information.
  • the related content may be set to any one of sports related, counseling related, business hours related, and visiting method related.
  • related content when the operator of the receiver terminal 420 sets the receiver terminal 420 based on sales related to product sales, related content may be set based on related information.
  • the related content may be set to any one of shopping item related, consultation related, and business hours related.
  • related content may be set in various ways, and is not limited to the above-described embodiment.
  • related contents may be determined based on the characteristics and contents of the recipient terminal 420 , and specific related contents among a plurality of related contents are based on consultation between the sender terminal 410 and the recipient terminal 420 . can be decided.
  • the receiver terminal 420 provides a plurality of related content information in an automatic response, and the sender terminal 410 determines specific related content and provides the corresponding information to the receiver terminal 420 .
  • the receiver terminal 420 may transmit the determined related content information to the AI server 430 .
  • the AI server 430 may process each of the related contents in an integrated form or exist separately for each related content, and is not limited to the above-described embodiment.
  • the AI server 430 can check the response to the inquiry request from the caller terminal 410 based on the determined information based on the related content, the information processing time may be reduced. Then, the sender terminal 410 provides a query based on the determined related content to the receiver terminal 420, and the receiver terminal 420 responds to the query through the AI server 430 based on the query from the sender terminal 410. A response may be obtained and provided, and a specific method may be the same as that of FIG. 3 .
  • the receiver terminal 520 inquires the caller terminal 510 for data call transfer, and if the caller terminal 510 accepts, ends the voice call, and a data call (e.g. Voice over Internet Protocol (VOIP)) ) can be converted to
  • VOIP Voice over Internet Protocol
  • the sender terminal may provide information on whether to accept to the receiver terminal 520 based on a voice response or a key input method.
  • the receiver terminal 520 when the receiver terminal 520 maintains a voice call with the caller terminal 510 differently from the existing ARS server, the receiver terminal 520 may not receive a voice call to another caller terminal. In consideration of the above, the receiver terminal 520 needs to convert a voice call into a data call. In addition, when providing a response based on a query from the caller terminal 510, there is a need to store related information in a database and perform voice recognition or other data processing, but providing information based on a voice call In some cases, there may be limitations in data processing. That is, the receiver terminal 520 has a limit in processing the query of the caller terminal 510 based on the voice call, and conversion to the data call may be performed in consideration of the above points.
  • the receiver terminal 520 may perform data call conversion with the caller terminal 510 based on a preset time. That is, the receiver terminal 520 processes the query of the caller terminal 510 for a certain period of time, such as a short answer, and when a preset time elapses after automatic connection, considers the voice call of another caller terminal 510 and tries to switch the data call. can do. As an example, the receiver terminal 520 may notify the caller terminal 510 of a reference time for a voice call after a preset time after automatic connection and transmit a request for whether to switch a data call. Thereafter, if the caller terminal 510 accepts this, it may switch to a data call and process the query of the caller terminal 510 .
  • a preset time such as a short answer
  • the receiver terminal 520 may perform data call conversion based on the query content of the caller terminal. That is, when a predetermined time is required to respond to a query or a predetermined visual information is required to be provided, data call conversion can be performed. For example, data currency conversion may be performed to provide terms and conditions, receive specific user opinions, explicitly confirm specific items, conclude a contract, remittance, exchange, set the disclosure scope of information, etc., but the present invention is limited thereto. not.
  • the receiver terminal 520 may request conversion to a data call in consideration of data processing for the inquiry and response of the caller terminal 510 .
  • the AI server 530 may perform a data processing process such as storing related information in a database or converting voice information into text in a process of providing a response based on a query from the caller terminal 510 .
  • there may be a limit in processing information based on a voice call and the AI server 530 may request conversion to a data call in consideration of the above-mentioned points.
  • voice data received in a voice call connection state may have a larger capacity than voice data received in a data call connection state, or data processing may be complicated.
  • data call conversion may be requested for data processing efficiency at the AI server end or the receiver end.
  • the AI server 530 may perform a data call transfer request to the receiver terminal 520 in response to a query or through a separate message.
  • the receiver terminal 520 may also request data call conversion from the caller terminal 510 through a response or a separate message. That is, it may be converted to a data call in consideration of a response or data processing provided, and is not limited to the above-described embodiment.
  • the receiver terminal 520 and the AI server 530 may process a large amount of data.
  • the receiver terminal 520 and the AI server 530 may process high-capacity data such as images or videos as well as information through voice and provide them to the caller terminal 510, and the caller terminal is more A specific response can be obtained.
  • the data call may be performed based on a third messenger platform.
  • the receiver terminal may process the query of the sender terminal based on data communication with the AI server in the same manner as described above.
  • data call can be performed through a third-party messenger platform.
  • the receiver terminal 620 may request data call transfer from the caller terminal 610 and receive acceptance of the data call from the caller terminal 610 as a response. Thereafter, the receiver terminal 620 may transmit a data call provision request to the third messenger platform 640 based on the information of the caller terminal 610 . Thereafter, the third messenger platform 640 may determine whether to accept the data call provision request based on the request, and transmit the information to the receiver terminal 620 .
  • the receiver terminal 620 may perform a data call based on the caller terminal 610 and the third messenger platform 640 . That is, the receiver terminal 620 obtains response information through the AI server 630 to the inquiry of the caller terminal 610, and the data call can be performed through a third messenger platform, through which the caller terminal 610 can provide flexible AI assistant services.
  • the sender terminal and the receiver terminal need to check identification information on the third messenger platform (e.g. friend relationship). That is, the sender terminal and the receiver terminal.
  • the terminal recognizes mutual identification information based on the third messenger platform, and there is a need for approval for identification information.
  • the third messenger platform may not accept the data call conversion when the calling terminal and the receiving terminal do not recognize mutual identification information.
  • the third messenger platform may accept the data call based on the record information of the sender terminal and the receiver terminal even if the caller terminal and the receiver terminal do not recognize each other's identification information.
  • the third messenger platform may perform mutual confirmation based on the past call records of the caller terminal and the receiver terminal, and may provide a data call by accepting a data call based on this.
  • the receiver terminal may transmit the phone number of the caller terminal to the third messenger platform.
  • the third messenger platform may request whether or not to send a data call to the caller terminal based on the received information, and may perform a data call connection based on the acceptance of the caller terminal. That is, the third messenger platform may accept the data call connection based on the fact that the caller terminal and the receiver terminal are users who are approved based on identification information in the third messenger platform, or that the receiver terminal is the receiver of the corresponding number.
  • the receiver terminal 620 may transmit a data call transfer request to the caller terminal 610 while also delivering a data call-related third messenger platform information provision request. For example, if the receiver terminal 620 recognizes the identification information of the third messenger platform as described above or if there is a past record, acceptance of the data call may be performed based on this. On the other hand, when the above-described information does not exist in the receiver terminal 620 , the receiver terminal 620 may request information for a data call together while transmitting the data call transfer request to the caller terminal 610 .
  • the receiver terminal 620 may not have information related to the caller terminal 610 , and the receiver terminal 620 may provide data Information for a call may be requested from the caller terminal 610 .
  • the information for the data call may be a request for identification information confirmation and approval based on the third platform 640. (e.g. receiving a response after requesting a friend relationship agreement) That is, the receiver terminal 620 is a third messenger platform ( 640), it is possible to request related information so as to perform a data call with the caller terminal 610, and receive a response thereto to perform preliminary preparation for a data call. Thereafter, the receiver terminal 620 transmits the data call provision request to the third messenger platform 640 and performs a data call connection with the caller terminal 610 based on the acceptance of the third messenger platform 640 . have.
  • related information may be displayed through a messenger as well as a data call.
  • information on query details along with information on the receiver terminal may be provided to the calling terminal through the third messenger platform.
  • information on query details may be provided through the third messenger platform.
  • the provided information may be an image or a video, and more specific information may be provided to the caller terminal through the above-mentioned bar.
  • the sender terminal may also check information on related content through the third messenger platform, and may change the information on this through the third messenger platform. That is, more specific data information may be provided to the caller terminal through the third messenger platform, and through this, a flexible answer may be provided to the caller terminal.
  • the AI server may determine when a call is delayed or data processing capacity is increased, and inquire whether to switch a data call. At this time, if user A accepts, the messenger account of the operator of Chinese house B connects the data call to user A through a messenger, and the related data can be provided through the messenger.
  • FIG. 8 is a flowchart illustrating a method of providing an artificial intelligence assistant service through a voice call (voice call) according to an embodiment of the present specification.
  • the first terminal may receive a voice call from the second terminal and perform automatic connection (S810).
  • the first terminal may be a receiver terminal, and the second terminal may be a caller terminal. .
  • the first terminal may receive a first query request message from the second terminal (S820).
  • the first terminal sends a second query request message based on the first query request message. It may be transmitted to the AI server.
  • the first query request message may be transmitted from the second terminal to the first terminal by voice based on the voice call.
  • the first terminal may transmit the converted text information to the AI server as the second query request message by performing STT (Speech To Text) processing on the first query request message.
  • the first terminal may transmit voice file information generated based on the first query request message to the AI server as the second query request message, and the embodiment is not limited thereto.
  • the first terminal may receive a first query response message based on the second query request message from the AI server.
  • the first terminal receives a second query response message based on the first query response message can be transmitted to the second terminal.
  • the first query response message delivered by the AI server to the first terminal is based on the text information generated based on the second query request message and the second query request message. It may include at least one of the generated voice file information.
  • the first terminal may generate a second query response message based on the first query response message received from the AI server, and may provide the generated second query response message to the second terminal by voice based on a voice call.
  • the first terminal may transmit a request message for converting a voice call into a data call to the second terminal.
  • the first terminal may receive an acceptance message in response to the request message from the second terminal, and may convert the voice call into a data call based on the acceptance message.
  • the first terminal determines whether a preset time has elapsed after the automatic connection with the second terminal is performed, and when the set time has elapsed after the automatic connection with the second terminal is performed, a request message is sent. It can be transmitted to the second terminal, as described above.
  • the first terminal or the AI server may determine whether data call conversion is necessary based on the data processing capability. In this case, when the first terminal or the AI server intends to convert the voice call into a data call, the first terminal may transmit a request message to the second terminal.
  • the data call may be performed based on a third messenger platform.
  • the data call may be performed based on identification information on the third messenger platform of the first terminal and identification information on the third messenger platform of the second terminal. For example, when mutual identification information is recognized and approved, data call connection may be performed, as described above.
  • the first terminal when the first terminal performs a data call based on the third messenger platform, it transmits a data call provision request message to the third messenger platform and receives a data call acceptance message from the third messenger platform Then, a data call can be performed, as described above.
  • the first terminal may transmit at least one piece of related content information related to the first terminal to the second terminal after automatic connection is performed based on FIGS. 4A to 4D described above.
  • the second terminal may select a specific content based on at least one piece of related content information, and transmit the information to the first terminal. Also, the second terminal may generate the above-described first query request message based on the selected content, as described above.
  • the embodiments described above may be at least partially implemented as a computer program and recorded in a computer-readable recording medium.
  • a computer-readable recording medium in which a program for implementing the embodiments is recorded includes all types of recording devices in which computer-readable data is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, and optical data storage devices.
  • the computer-readable recording medium may be distributed in a network-connected computer system, and the computer-readable code may be stored and executed in a distributed manner.
  • functional programs, codes, and code segments for implementing the present embodiment may be easily understood by those skilled in the art to which the present embodiment belongs.
  • the present specification has the advantage of providing a flexible response by generating and providing a response corresponding to the request by analyzing the request of the sender terminal through artificial intelligence, and can be used in industry.

Abstract

Embodiments may provide an operation method of a first terminal performing a question-and-answer operation through a voice call. In this case, the operation method of the first terminal may comprise the steps of: receiving a voice call from a second terminal and making an automatic connection; after the automatic connection is made, receiving a first query request message from the second terminal; transmitting, to an AI server, a second query request message based on the first query request message; receiving, from the AI server, a first query response message based on the second query request message; and transferring, to the second terminal, a second query response message based on the first query response message.

Description

음성 호를 통한 인공지능 비서 서비스 제공 방법 및 장치Method and apparatus for providing artificial intelligence assistant service through voice call
실시예들은 음성 호를 통한 인공지능 비서 서비스 제공 방법 및 장치에 대한 것이다. 보다 상세하게는, 자동수신에 기초하여 음성 호를 통해 인공지능 비서 서비스를 제공하는 방법에 대한 것이다. Embodiments relate to a method and apparatus for providing an artificial intelligence assistant service through a voice call. More specifically, it relates to a method of providing an artificial intelligence assistant service through a voice call based on automatic reception.
최근 비대면 서비스가 증가하고 있으며, 비대면 서비스를 위한 ARS 응답이나 자동응답에 대한 활용도 증가하고 있다. 다만, ARS 응답이나 자동응답은 사전에 정해진 선택지를 기준으로 진행되기 때문에 서비스를 이용하는 소비자가 원하는 답변을 얻기가 쉽지 않을 수 있다. 이러한 이유로 소비자들은 ARS 응답이나 자동응답 대신 상담원을 통해 원하는 답변을 획득하는 경우가 많으나, 상담원 수도 제한되어 있어 원하는 답변을 얻기까지 많은 시간이 소요되어 서비스 제공에 한계가 존재하는 실정이다. Recently, non-face-to-face services are increasing, and the use of ARS responses or automatic responses for non-face-to-face services is also increasing. However, it may not be easy for consumers to use the service to get the answer they want because the ARS response or automatic response is conducted based on a pre-determined option. For this reason, consumers often obtain a desired answer through an agent instead of an ARS response or an automatic response, but the number of agents is limited and it takes a lot of time to get the desired answer, which limits the service provision.
상술한 점을 고려하여, 하기에서는 인공지능을 활용하여 소비자의 다양한 요청에 대하여 유연하게 대처할 수 있도록 인공지능을 이용하여 서비스를 제공하는 방법 및 장치에 대해 서술한다. In consideration of the above points, the following describes a method and apparatus for providing a service using artificial intelligence so that it can flexibly respond to various requests of consumers by using artificial intelligence.
[선행기술문헌][Prior art literature]
(특허문헌 1) 한국특허출원공개 제10-2018-0112349호(Patent Document 1) Korean Patent Application Publication No. 10-2018-0112349
본 명세서는 음성 호를 통한 인공지능 비서 서비스 제공 방법 및 장치를 제공할 수 있다.The present specification may provide a method and apparatus for providing an artificial intelligence assistant service through a voice call.
본 명세서는 음성 호를 통해 수신자 단말이 발신자 단말에게 인공지능에 기초하여 자동응답을 제공할 수 있다.In the present specification, the receiver terminal may provide an automatic answer based on artificial intelligence to the caller terminal through a voice call.
본 명세서는 발신자 단말의 요청에 기초하여 인공지능을 통해 응답을 생성하고, 생성된 응답을 발신자 단말에게 제공할 수 있다.The present specification may generate a response through artificial intelligence based on the request of the sender terminal, and provide the generated response to the sender terminal.
본 명세서는 음성 통화에 기초한 인공지능 비서 서비스를 데이터 통화로 전환하여 제공할 수 있다.The present specification may provide an artificial intelligence assistant service based on a voice call by converting it into a data call.
본 명세서의 해결하고자 하는 과제는 상술한 바에 한정되지 아니하고, 하기에서 설명하는 발명의 실시예들에 의해 도출될 수 있는 다양한 사항들로 확장될 수 있다.The problem to be solved in the present specification is not limited to the above, but may be extended to various matters that can be derived by the embodiments of the invention described below.
본 명세서의 일 실시예에 따라, 음성 통화를 통해 질의 응답을 수행하는 제 1 단말의 동작 방법을 제공할 수 있다. 이때, 제 1 단말의 동작 방법은 제 2 단말로부터 음성 통화를 수신하고, 자동 연결을 수행하는 단계, 상기 자동 연결이 수행된 후 상기 제 2 단말로부터 제 1 질의 요청 메시지를 수신하는 단계, 상기 제 1 질의 요청 메시지에 기초한 제 2 질의 요청 메시지를 AI 서버로 전송하는 단계, 상기 AI 서버로부터 상기 제 2 질의 요청 메시지에 기초한 제 1 질의 응답 메시지를 수신하는 단계 및 상기 제 1 질의 응답 메시지에 기초한 제 2 질의 응답 메시지를 상기 제 2 단말로 전달하는 단계를 포함할 수 있다.According to an embodiment of the present specification, it is possible to provide a method of operating a first terminal for performing a question and answer through a voice call. In this case, the method of operation of the first terminal includes the steps of receiving a voice call from the second terminal, performing automatic connection, receiving a first query request message from the second terminal after the automatic connection is performed, the first transmitting a second query request message based on the first query request message to an AI server; receiving a first query response message based on the second query request message from the AI server; and a first query response message based on the first query response message It may include transmitting the second query response message to the second terminal.
또한, 본 명세서의 일 실시예에 따라, 상기 제 1 질의 요청 메시지는 상기 음성 통화에 기초하여 음성으로 상기 제 1 단말로 전달되고, 상기 제 1 단말이 상기 AI 서버로 전달하는 상기 제 2 질의 요청 메시지는 상기 제 1 질의 요청 메시지에 STT(Speech To Text) 처리를 수행하여 전환된 텍스트 정보 및 상기 제 1 질의 요청 메시지에 기초하여 생성된 음성 파일 정보 중 적어도 어느 하나를 포함할 수 있다.In addition, according to an embodiment of the present specification, the first query request message is transmitted to the first terminal by voice based on the voice call, and the second query request transmitted by the first terminal to the AI server The message may include at least one of text information converted by performing speech to text (STT) processing on the first query request message and voice file information generated based on the first query request message.
또한, 본 명세서의 일 실시예에 따라, 상기 AI 서버가 상기 제 1 단말로 전달하는 상기 제 1 질의 응답 메시지는 상기 제 2 질의 요청 메시지에 기초하여 생성되는 텍스트 정보 및 상기 제 2 질의 요청 메시지에 기초하여 생성되는 음성 파일 정보 중 적어도 어느 하나를 포함하고, 상기 제 1 단말은 상기 AI 서버로부터 수신한 상기 제 1 질의 응답 메시지에 기초하여 상기 제 2 질의 응답 메시지를 생성하고, 상기 생성된 제 2 질의 응답 메시지를 상기 음성 통화에 기초하여 음성으로 상기 제 2 단말로 제공할 수 있다.In addition, according to an embodiment of the present specification, the first query response message delivered by the AI server to the first terminal includes text information generated based on the second query request message and the second query request message. At least one of the voice file information generated based on the information, wherein the first terminal generates the second query response message based on the first query response message received from the AI server, and the generated second A question and answer message may be provided to the second terminal by voice based on the voice call.
또한, 본 명세서의 일 실시예에 따라, 상기 제 2 단말로 상기 음성 통화를 데이터 통화로 전환하는 요청 메시지를 전송하는 단계, 상기 제 2 단말부터 상기 요청 메시지에 대한 응답으로 수락 메시지를 수신하는 단계, 및 상기 수락 메시지에 기초하여 상기 음성 통화를 상기 데이터 통화로 전환하는 단계를 더 포함할 수 있다.In addition, according to an embodiment of the present specification, transmitting a request message for converting the voice call into a data call to the second terminal, receiving an acceptance message in response to the request message from the second terminal , and converting the voice call into the data call based on the acceptance message.
또한, 본 명세서의 일 실시예에 따라, 상기 제 2 단말과 자동 연결이 수행된 후 기 설정된 시간이 도과하는지 여부를 판단하는 단계를 더 포함하되, 상기 제 2 단말과 자동 연결이 수행된 후 상기 설정된 시간이 도과하면 상기 요청 메시지를 상기 제 2 단말로 전송할 수 있다.In addition, according to an embodiment of the present specification, further comprising the step of determining whether a preset time has elapsed after the automatic connection with the second terminal is performed, after the automatic connection with the second terminal is performed When the set time elapses, the request message may be transmitted to the second terminal.
또한, 본 명세서의 일 실시예에 따라, 상기 제 1 단말이 데이터 처리 능력에 기초하여 상기 데이터 통화 전환 필요 여부를 판단하는 단계를 더 포함하되, 상기 제 1 단말이 상기 데이터 처리 능력에 기초하여 상기 데이터 통화 전환이 필요하다고 판단한 경우, 상기 요청 메시지를 상기 제 2 단말로 전송할 수 있다.In addition, according to an embodiment of the present specification, the method further comprising the step of determining, by the first terminal, whether the data call conversion is necessary based on the data processing capability, wherein the first terminal is the first terminal based on the data processing capability When it is determined that data call conversion is necessary, the request message may be transmitted to the second terminal.
또한, 본 명세서의 일 실시예에 따라, 상기 데이터 통화는 제 3 메신저 플랫폼에 기초하여 수행되되, 상기 데이터 통화는 상기 제 1 단말의 상기 제 3 메신저 플랫폼에서의 식별 정보 및 상기 제 2 단말의 상기 제 3 메신저 플랫폼에서의 식별 정보에 기초하여 수행될 수 있다.In addition, according to an embodiment of the present specification, the data call is performed based on a third messenger platform, and the data call includes identification information in the third messenger platform of the first terminal and the data call of the second terminal. It may be performed based on identification information in the third messenger platform.
또한, 본 명세서의 일 실시예에 따라, 상기 제 1 단말이 상기 제 3 메신저 플랫폼에 기초하여 상기 데이터 통화를 수행하는 경우, 상기 제 3 메신저 플랫폼으로 데이터 통화 제공 요청 메시지를 전송하는 단계 및 상기 제 3 메신저 플랫폼으로부터 상기 데이터 통화에 대한 수락 메시지를 수신하는 단계를 더 포함하고, 상기 수락 메시지가 수신되면 상기 제 3 메신저 플랫폼에 기초하여 상기 데이터 통화가 수행될 수 있다.In addition, according to an embodiment of the present specification, when the first terminal performs the data call based on the third messenger platform, transmitting a data call provision request message to the third messenger platform; The method may further include receiving an acceptance message for the data call from a third messenger platform, wherein when the acceptance message is received, the data call may be performed based on the third messenger platform.
또한, 본 명세서의 일 실시예에 따라, 상기 자동 연결이 수행된 후 상기 제 1 단말과 관련된 적어도 어느 하나의 관련 콘텐츠 정보를 상기 제 2 단말로 전송하는 단계, 상기 적어도 어느 하나의 관련 콘텐츠 정보에 기초하여 상기 제 2 단말이 선택한 관련 콘텐츠 정보를 수신하는 단계를 더 포함하되, 상기 제 1 질의 요청 메시지는 상기 제 2 단말에 의해 선택된 상기 관련 콘텐츠 정보에 기초하여 생성될 수 있다. In addition, according to an embodiment of the present specification, after the automatic connection is performed, transmitting at least one piece of related content information related to the first terminal to the second terminal; The method may further include receiving the related content information selected by the second terminal based on the information, wherein the first query request message may be generated based on the related content information selected by the second terminal.
본 명세서는 음성 호를 통한 인공지능 비서 서비스 제공 방법 및 장치를 제공할 수 있다.The present specification may provide a method and apparatus for providing an artificial intelligence assistant service through a voice call.
본 명세서는 음성 호를 통해 수신자 단말의 콘텐츠를 고려하여 발신자 단말에게 인공지능을 통해 응답을 제공하는 효과가 있다.The present specification has an effect of providing a response to the calling terminal through artificial intelligence in consideration of the contents of the called terminal through a voice call.
본 명세서는 발신자 단말의 요청을 인공지능을 통해 분석하여 요청에 대응되는 응답을 생성하여 제공함으로서 유연한 응답을 제공하는 효과가 있다.The present specification has the effect of providing a flexible response by analyzing the request of the sender terminal through artificial intelligence and generating and providing a response corresponding to the request.
본 명세서는 음성 통화에 기초한 인공지능 비서 서비스를 데이터 통화로 전환하여 구체적인 응답 정보를 제공하는 효과가 있다.The present specification has an effect of providing specific response information by converting an artificial intelligence assistant service based on a voice call into a data call.
본 명세서의 해결하고자 하는 과제는 상술한 바에 한정되지 아니하고, 하기에서 설명하는 발명의 실시예들에 의해 도출될 수 있는 다양한 사항들로 확장될 수 있다.The problem to be solved in the present specification is not limited to the above, but may be extended to various matters that can be derived by the embodiments of the invention described below.
도 1은 본 명세서의 일실시예에 따른 시스템의 동작 환경의 예를 도시한 도면이다.1 is a diagram illustrating an example of an operating environment of a system according to an embodiment of the present specification.
도 2는 본 명세서의 일실시예에 있어서 컴퓨팅 장치(200)의 내부 구성을 설명하기 위한 블록도이다. 2 is a block diagram illustrating an internal configuration of the computing device 200 according to an embodiment of the present specification.
도 3은 본 명세서의 일실시예에 있어서 음성 호를 통한 발신자 단말의 요청에 대한 응답을 인공지능에 기초하여 제공하는 방법을 나타낸 도면이다. 3 is a diagram illustrating a method of providing a response to a request of a caller terminal through a voice call based on artificial intelligence according to an embodiment of the present specification.
도 4a는 본 명세서의 일실시예에 있어서 발신자 단말의 요청에 대한 응답을 제공하는 방법을 나타내 도면이다. 4A is a diagram illustrating a method of providing a response to a request of a caller terminal according to an embodiment of the present specification.
도 4b는 본 명세서의 일실시예에 있어서 관련 콘텐츠에 기초하여 발신자 단말의 요청에 대한 응답을 제공하는 방법을 나타내 도면이다. 4B is a diagram illustrating a method of providing a response to a request of a caller terminal based on related content according to an embodiment of the present specification.
도 4c는 본 명세서의 일실시예에 있어서 관련 콘텐츠에 기초하여 발신자 단말의 요청에 대한 응답을 제공하는 방법을 나타내 도면이다. 4C is a diagram illustrating a method of providing a response to a request of a caller terminal based on related content according to an embodiment of the present specification.
도 4d는 본 명세서의 일실시예에 있어서 관련 콘텐츠에 기초하여 발신자 단말의 요청에 대한 응답을 제공하는 방법을 나타내 도면이다. 4D is a diagram illustrating a method of providing a response to a request of a caller terminal based on related content according to an embodiment of the present specification.
도 5a는 본 명세서의 일실시예에 있어서 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다. 5A is a diagram illustrating a method of converting a voice call into a data call according to an embodiment of the present specification.
도 5b는 본 명세서의 일실시예에 있어서 기 설정된 시간에 기초하여 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다.5B is a diagram illustrating a method of converting a voice call into a data call based on a preset time according to an embodiment of the present specification.
도 5c는 본 명세서의 일실시예에 있어서 인공지능에 기초하여 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다.5C is a diagram illustrating a method of converting a voice call into a data call based on artificial intelligence according to an embodiment of the present specification.
도 6a는 본 명세서의 일실시예에 있어서 제 3 메신저 플랫폼에 기초하여 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다. 6A is a diagram illustrating a method of converting a voice call into a data call based on a third messenger platform according to an embodiment of the present specification.
도 6b는 본 명세서의 일실시예에 있어서 제 3 메신저 플랫폼에 기초하여 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다.6B is a diagram illustrating a method of converting a voice call into a data call based on the third messenger platform according to an embodiment of the present specification.
도 7a은 본 명세서의 일실시예에 있어서 발신자 단말로 응답을 제공하는 방법을 나타낸 도면이다.7A is a diagram illustrating a method of providing a response to a caller terminal according to an embodiment of the present specification.
도 7b는 본 명세서의 일실시예에 있어서 발신자 단말로 응답을 제공하는 방법을 나타낸 도면이다.7B is a diagram illustrating a method of providing a response to a caller terminal according to an embodiment of the present specification.
도 8은 본 명세서의 일실시예에 있어서 음성 호를 통한 인공지능 비서 서비스를 제공하는 방법을 나타낸 순서도이다.8 is a flowchart illustrating a method of providing an artificial intelligence assistant service through a voice call according to an embodiment of the present specification.
본 명세서의 실시예를 설명함에 있어서 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 실시예의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다. 그리고, 도면에서 본 명세서의 실시예에 대한 설명과 관계없는 부분은 생략하였으며, 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. In the description of the embodiments of the present specification, if it is determined that a detailed description of a known configuration or function may obscure the gist of the embodiment of the present specification, a detailed description thereof will be omitted. In addition, in the drawings, parts not related to the description of the embodiments of the present specification are omitted, and similar reference numerals are attached to similar parts.
본 명세서의 실시예에 있어서, 어떤 구성요소가 다른 구성요소와 "연결", "결합" 또는 "접속"되어 있다고 할 때, 이는 직접적인 연결관계뿐만 아니라, 그 중간에 또 다른 구성요소가 존재하는 간접적인 연결관계도 포함할 수 있다. 또한 어떤 구성요소가 다른 구성요소를 "포함한다" 또는 "가진다"고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 배제하는 것이 아니라 또 다른 구성요소를 더 포함할 수 있는 것을 의미한다. In the embodiments of the present specification, when a component is "connected", "coupled" or "connected" with another component, it is not only a direct connection relationship, but also an indirect relationship where another component exists in the middle. It can also include human connections. In addition, when a component is said to "include" or "have" another component, it means that another component may be further included without excluding other components unless otherwise stated. .
본 명세서의 실시예에 있어서, 제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 특별히 언급되지 않는 한 구성요소들 간의 순서 또는 중요도 등을 한정하지 않는다. 따라서, 본 명세서의 실시예의 범위 내에서 실시예에서의 제1 구성요소는 다른 실시예에서 제2 구성요소라고 칭할 수도 있고, 마찬가지로 실시예에서의 제2 구성요소를 다른 실시예에서 제1 구성요소라고 칭할 수도 있다. In the embodiment of the present specification, terms such as first, second, etc. are used only for the purpose of distinguishing one component from other components, and unless otherwise specified, do not limit the order or importance between the components. does not Accordingly, within the scope of the embodiments herein, a first component in an embodiment may be referred to as a second component in another embodiment, and similarly, a second component in an embodiment is referred to as a first component in another embodiment. can also be called
본 명세서의 실시예에 있어서, 서로 구별되는 구성요소들은 각각의 특징을 명확하게 설명하기 위함 이며, 구성요소들이 반드시 분리되는 것을 의미하지는 않는다. 즉, 복수의 구성요소가 통합되어 하나의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있고, 하나의 구성요소가 분산되어 복수의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다. 따라서, 별도로 언급하지 않더라도 이와 같이 통합된 또는 분산된 실시예도 본 명세서의 실시예의 범위에 포함된다. In the embodiment of the present specification, the components that are distinguished from each other are for clearly explaining each characteristic, and the components do not necessarily mean that the components are separated. That is, a plurality of components may be integrated to form one hardware or software unit, or one component may be distributed to form a plurality of hardware or software units. Accordingly, even if not specifically mentioned, such integrated or dispersed embodiments are also included in the scope of the embodiments of the present specification.
본 명세서에서 네트워크는 유무선 네트워크를 모두 포함하는 개념일 수 있다. 이때, 네트워크는 디바이스와 시스템 및 디바이스 상호 간의 데이터 교환이 수행될 수 있는 통신망을 의미할 수 있으며, 특정 네트워크로 한정되는 것은 아니다. In the present specification, the network may be a concept including both wired and wireless networks. In this case, the network may mean a communication network in which data exchange between the device and the system and devices can be performed, and is not limited to a specific network.
본 명세서에 기술된 실시예는 전적으로 하드웨어이거나, 부분적으로 하드웨어이고 부분적으로 소프트웨어이거나, 또는 전적으로 소프트웨어인 측면을 가질 수 있다. 본 명세서에서 "부(unit)", "장치" 또는 "시스템" 등은 하드웨어, 하드웨어와 소프트웨어의 조합, 또는 소프트웨어 등 컴퓨터 관련 엔티티(entity)를 지칭한다. 예를 들어, 본 명세서에서 부, 모듈, 장치 또는 시스템 등은 실행중인 프로세스, 프로세서, 객체(object), 실행 파일(executable), 실행 스레드(thread of execution), 프로그램(program), 및/또는 컴퓨터(computer)일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 컴퓨터에서 실행중인 애플리케이션(application) 및 컴퓨터의 양쪽이 모두 본 명세서의 부, 모듈, 장치 또는 시스템 등에 해당할 수 있다. Embodiments described herein may have aspects that are entirely hardware, partly hardware and partly software, or entirely software. As used herein, "unit," "device," or "system," or the like, refers to hardware, a combination of hardware and software, or a computer-related entity, such as software. For example, as used herein, a part, module, device, or system is a running process, a processor, an object, an executable, a thread of execution, a program, and/or a computer. (computer), but is not limited thereto. For example, both an application running on a computer and a computer may correspond to a part, module, device, or system of the present specification.
또한, 본 명세서에서 디바이스는 스마트폰, 태블릿 PC, 웨어러블 디바이스 및 HMD(Head Mounted Display)와 같이 모바일 디바이스뿐만 아니라, PC나 디스플레이 기능을 구비한 가전처럼 고정된 디바이스일 수 있다. 또한, 일 예로, 디바이스는 차량 내 클러스터 또는 IoT (Internet of Things) 디바이스일 수 있다. 즉, 본 명세서에서 디바이스는 어플리케이션 동작이 가능한 기기들을 지칭할 수 있으며, 특정 타입으로 한정되지 않는다. 하기에서는 설명의 편의를 위해 어플리케이션이 동작하는 기기를 디바이스로 지칭한다.In addition, in the present specification, the device may be a mobile device such as a smart phone, a tablet PC, a wearable device, and a head mounted display (HMD), as well as a fixed device such as a PC or home appliance having a display function. Also, as an example, the device may be an in-vehicle cluster or an Internet of Things (IoT) device. That is, in the present specification, a device may refer to devices capable of operating an application, and is not limited to a specific type. Hereinafter, for convenience of description, a device in which an application operates is referred to as a device.
본 명세서에 있어서 네트워크의 통신 방식은 제한되지 않으며, 각 구성요소간 연결이 동일한 네트워크 방식으로 연결되지 않을 수도 있다. 네트워크는, 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망, 위성망 등)을 활용하는 통신 방식뿐만 아니라 기기들 간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크는, 객체와 객체가 네트워킹 할 수 있는 모든 통신 방법을 포함할 수 있으며, 유선 통신, 무선 통신, 3G, 4G, 5G, 혹은 그 이외의 방법으로 제한되지 않는다. 예를 들어, 유선 및/또는 네트워크는 LAN(Local Area Network), MAN(Metropolitan Area Network), GSM(Global System for Mobile Network), EDGE(Enhanced Data GSM Environment), HSDPA(High Speed Downlink Packet Access), W-CDMA(Wideband Code Division Multiple Access), CDMA(Code Division Multiple Access), TDMA(Time Division Multiple Access), 블루투스(Bluetooth), 지그비(Zigbee), 와이-파이(Wi-Fi), VoIP(Voice over Internet Protocol), LTE Advanced, IEEE802.16m, WirelessMAN-Advanced, HSPA+, 3GPP Long Term Evolution (LTE), Mobile WiMAX (IEEE 802.16e), UMB (formerly EV-DO Rev. C), Flash-OFDM, iBurst and MBWA (IEEE 802.20) systems, HIPERMAN, Beam-Division Multiple Access (BDMA), Wi-MAX(World Interoperability for Microwave Access) 및 초음파 활용 통신으로 이루어진 군으로부터 선택되는 하나 이상의 통신 방법에 의한 통신 네트워크를 지칭할 수 있으나, 이에 한정되는 것은 아니다.In the present specification, the communication method of the network is not limited, and the connection between each component may not be connected in the same network method. The network may include not only a communication method using a communication network (eg, a mobile communication network, a wired Internet, a wireless Internet, a broadcasting network, a satellite network, etc.) but also short-range wireless communication between devices. For example, the network may include all communication methods through which an object and an object can network, and is not limited to wired communication, wireless communication, 3G, 4G, 5G, or other methods. For example, a wired and/or network may be a Local Area Network (LAN), a Metropolitan Area Network (MAN), a Global System for Mobile Network (GSM), an Enhanced Data GSM Environment (EDGE), a High Speed Downlink Packet Access (HSDPA), W-CDMA (Wideband Code Division Multiple Access), CDMA (Code Division Multiple Access), TDMA (Time Division Multiple Access), Bluetooth, Zigbee, Wi-Fi, VoIP (Voice over) Internet Protocol), LTE Advanced, IEEE802.16m, WirelessMAN-Advanced, HSPA+, 3GPP Long Term Evolution (LTE), Mobile WiMAX (IEEE 802.16e), UMB (formerly EV-DO Rev. C), Flash-OFDM, iBurst and MBWA (IEEE 802.20) systems, HIPERMAN, Beam-Division Multiple Access (BDMA), Wi-MAX (World Interoperability for Microwave Access), and ultrasonic-based communication can refer to a communication network by one or more communication methods selected from the group consisting of However, the present invention is not limited thereto.
다양한 실시예에서 설명하는 구성요소들이 반드시 필수적인 구성요소들은 의미하는 것은 아니며, 일부는 선택적인 구성요소일 수 있다. 따라서, 실시예에서 설명하는 구성요소들의 부분집합으로 구성되는 실시예도 본 명세서의 실시예의 범위에 포함된다. 또한, 다양한 실시예에서 설명하는 구성요소들에 추가적으로 다른 구성요소를 포함하는 실시예도 본 명세서의 실시예의 범위에 포함된다.Components described in various embodiments do not necessarily mean essential components, and some may be optional components. Accordingly, an embodiment composed of a subset of the components described in the embodiment is also included in the scope of the embodiment of the present specification. In addition, embodiments including other components in addition to the components described in various embodiments are also included in the scope of the embodiments of the present specification.
이하에서, 도면을 참조하여 본 명세서의 실시예들에 대하여 상세히 살펴본다.Hereinafter, embodiments of the present specification will be described in detail with reference to the drawings.
*도 1은 본 명세서의 일실시예에 따른 시스템의 동작 환경의 예를 도시한 도면이다. 도 1을 참조하면 사용자 디바이스(110), 하나 이상의 서버(120, 130, 140)가 네트워크(1)를 통해 연결되어 있다. 이러한 도 1은 발명의 설명을 위한 일례로 사용자 디바이스의 수나 서버의 수가 도 1과 같이 한정되는 것은 아니다.* FIG. 1 is a diagram illustrating an example of an operating environment of a system according to an embodiment of the present specification. Referring to FIG. 1 , a user device 110 and one or more servers 120 , 130 , 140 are connected through a network 1 . 1 is an example for explaining the invention, and the number of user devices or the number of servers is not limited as in FIG. 1 .
사용자 디바이스(110)는 컴퓨터 시스템으로 구현되는 고정형 단말이거나 이동형 단말일 수 있다. 사용자 디바이스(110)는 예를 들면, 스마트폰(smart phone), 휴대폰, 내비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC, 게임 콘솔(game console), 웨어러블 디바이스(wearable device), IoT(internet of things) 디바이스, VR(virtual reality) 디바이스, AR(augmented reality) 디바이스 등이 있다. 일례로 실시예들에서 사용자 디바이스(110)는 실질적으로 무선 또는 유선 통신 방식을 이용하여 네트워크(1)를 통해 다른 서버들(120 - 140)과 통신할 수 있는 다양한 물리적인 컴퓨터 시스템들 중 하나를 의미할 수 있다.The user device 110 may be a fixed terminal implemented as a computer system or a mobile terminal. The user device 110 is, for example, a smart phone, a mobile phone, a navigation system, a computer, a laptop computer, a digital broadcasting terminal, a PDA (Personal Digital Assistants), a PMP (Portable Multimedia Player), a tablet PC, a game console (game). console), a wearable device, an Internet of things (IoT) device, a virtual reality (VR) device, and an augmented reality (AR) device. In one example embodiments, the user device 110 may actually use one of a variety of physical computer systems capable of communicating with the other servers 120 - 140 over the network 1 using a wireless or wired communication scheme. can mean
각 서버는 사용자 디바이스(110)와 네트워크(1)를 통해 통신하여 명령, 코드, 파일, 콘텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다. 예를 들어, 서버는 네트워크(1)를 통해 접속한 사용자 디바이스(110)로 각각의 서비스를 제공하는 시스템일 수 있다. 보다 구체적인 예로, 서버는 사용자 디바이스(110)에 설치되어 구동되는 컴퓨터 프로그램으로서의 어플리케이션을 통해, 해당 어플리케이션이 목적하는 서비스(일례로, 정보 제공 등)를 사용자 디바이스(110)로 제공할 수 있다. 다른 예로, 서버는 상술한 어플리케이션의 설치 및 구동을 위한 파일을 사용자 디바이스(110)로 배포하고 사용자 입력 정보를 수신해 대응하는 서비스를 제공할 수 있다. 일 예로, 하기에서 인공지능(Artificial Intelligence, AI) 서버는 도 1의 서버 중 어느 하나일 수 있다. 또한, AI 서버와 데이터 통신을 수행하는 수신자 단말 및 수신자 단말과 음성 통화 및/또는 데이터 통신을 수행하는 발신자 단말은 도 1의 사용자 중 하나일 수 있다. 또한, 하기에서 제 3 메신저 플랫폼은 도 1의 서버 중 어느 하나일 수 있으며, 상술한 실시예로 한정되지 않는다. Each server may be implemented as a computer device or a plurality of computer devices that communicate with the user device 110 and the network 1 to provide commands, codes, files, contents, services, and the like. For example, the server may be a system that provides each service to the user device 110 connected through the network 1 . As a more specific example, the server may provide a service (eg, information provision, etc.) targeted by the corresponding application to the user device 110 through an application as a computer program installed and driven in the user device 110 . As another example, the server may distribute the above-described file for installation and operation of the application to the user device 110 , and may provide a corresponding service by receiving user input information. As an example, below, the artificial intelligence (AI) server may be any one of the servers of FIG. 1 . In addition, the receiver terminal performing data communication with the AI server and the caller terminal performing voice call and/or data communication with the receiver terminal may be one of the users of FIG. 1 . Also, below, the third messenger platform may be any one of the servers of FIG. 1 , and is not limited to the above-described embodiment.
도 2는 본 명세서의 일실시예에 있어서 컴퓨팅 장치(200)의 내부 구성을 설명하기 위한 블록도이다. 이러한 컴퓨팅 장치(200)는 도1을 참조하여 상술한 하나 이상의 사용자 디바이스(110-1, 110-2) 또는 서버(120-140)에 적용될 수 있으며, 각 장치와 서버들은 일부 구성요소를 더 하거나 제외하여 구성됨으로써 동일하거나 유사한 내부 구성을 가질 수 있다. 2 is a block diagram illustrating an internal configuration of the computing device 200 according to an embodiment of the present specification. The computing device 200 may be applied to one or more of the user devices 110-1 and 110-2 or the servers 120-140 described above with reference to FIG. 1, and each device and server may add some components or By being configured to exclude, it may have the same or similar internal configuration.
도 2를 참조하면 컴퓨팅 장치(200)는 메모리(210), 프로세서(220), 통신 모듈(230) 그리고 송수신부(240)를 포함할 수 있다. 메모리(210)는 비-일시적인 컴퓨터 판독 가능한 기록매체로서, RAM(random access memory), ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다. 여기서 ROM, SSD, 플래시 메모리, 디스크 드라이브 등과 같은 비소멸성 대용량 저장 장치는 메모리(210)와는 구분되는 별도의 영구 저장 장치로서 상술한 장치나 서버에 포함될 수도 있다. 또한, 메모리(210)에는 운영체제와 적어도 하나의 프로그램 코드(일례로 사용자 디바이스(110) 등에 설치되어 구동되는 브라우저나 특정 서비스의 제공을 위해 사용자 디바이스(110) 등에 설치된 어플리케이션 등을 위한 코드)가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 메모리(210)와는 별도의 컴퓨터에서 판독 가능한 기록매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다. Referring to FIG. 2 , the computing device 200 may include a memory 210 , a processor 220 , a communication module 230 , and a transceiver 240 . The memory 210 is a non-transitory computer-readable recording medium, and is a non-volatile, high-capacity, non-volatile memory such as random access memory (RAM), read only memory (ROM), disk drive, solid state drive (SSD), and flash memory. It may include a permanent mass storage device. Here, a non-volatile mass storage device such as a ROM, an SSD, a flash memory, a disk drive, etc. may be included in the above-described device or server as a separate permanent storage device distinct from the memory 210 . In addition, the memory 210 stores an operating system and at least one program code (eg, a browser installed and driven on the user device 110 , or an application installed on the user device 110 to provide a specific service). can be These software components may be loaded from a computer-readable recording medium separate from the memory 210 . The separate computer-readable recording medium may include a computer-readable recording medium such as a floppy drive, a disk, a tape, a DVD/CD-ROM drive, and a memory card.
다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 모듈(230)을 통해 메모리(210)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 어플리케이션의 설치 파일을 배포하는 파일 배포 시스템(일례로, 상술한 서버)이 네트워크(1)를 통해 제공하는 파일들에 의해 설치되는 컴퓨터 프로그램(일례로 상술한 어플리케이션)에 기반하여 메모리(210)에 로딩될 수 있다.In another embodiment, the software components may be loaded into the memory 210 through the communication module 230 instead of a computer-readable recording medium. For example, the at least one program is a computer program installed by files provided through the network 1 by a file distribution system (eg, the above-described server) that distributes the installation files of developers or applications (eg, a computer program) It may be loaded into the memory 210 based on the above-described application).
프로세서(220)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(210) 또는 통신 모듈(230)에 의해 프로세서(220)로 제공될 수 있다. 예를 들어 프로세서(220)는 메모리(210)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.The processor 220 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations. The instructions may be provided to the processor 220 by the memory 210 or the communication module 230 . For example, the processor 220 may be configured to execute a received instruction according to a program code stored in a recording device such as the memory 210 .
통신 모듈(230)은 네트워크(1)를 통해 사용자 기기(110)와 서버(120 -140)가 서로 통신하기 위한 기능을 제공할 수 있으며, 장치(110) 및/또는 서버(120 - 140) 각각이 다른 전자 기기와 통신하기 위한 기능을 제공할 수 있다. The communication module 230 may provide a function for the user device 110 and the server 120 -140 to communicate with each other via the network 1, and the device 110 and/or the server 120 - 140, respectively. It may provide a function for communicating with other electronic devices.
송수신부(240)는 외부 입력/출력장치(미도시)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 외부 입력장치는 키보드, 마우스, 마이크로폰, 카메라 등의 장치를, 그리고 외부 출력 장치는 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다. The transceiver 240 may be a means for interfacing with an external input/output device (not shown). For example, the external input device may include devices such as a keyboard, mouse, microphone, and camera, and the external output device may include devices such as a display, a speaker, and a haptic feedback device.
다른 예로 송수신부(240)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다. As another example, the transceiver 240 may be a means for an interface with a device in which functions for input and output are integrated into one, such as a touch screen.
또한, 다른 실시예들에서 컴퓨팅 장치(200)는 적용되는 장치의 성질에 따라서 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 예를 들어, 컴퓨팅 장치(200)가 사용자 디바이스(110)에 적용되는 경우 상술한 입출력 장치 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다. 보다 구체적인 예로, 사용자 디바이스가 스마트폰인 경우, 일반적으로 스마트폰이 포함하고 있는 가속도 센서나 자이로 센서, 카메라 모듈, 각종 물리적인 버튼, 터치패널을 이용한 버튼, 입출력 포트, 진동을 위한 진동기 등의 다양한 구성요소들이 더 포함되도록 구현될 수 있다.Also, in other embodiments, the computing device 200 may include more components than those of FIG. 2 according to the properties of the applied device. For example, when the computing device 200 is applied to the user device 110, it is implemented to include at least some of the above-described input/output devices, or a transceiver, a global positioning system (GPS) module, a camera, various sensors, It may further include other components such as a database and the like. As a more specific example, when the user device is a smartphone, various types of acceleration sensors, gyro sensors, camera modules, various physical buttons, buttons using a touch panel, input/output ports, vibrators for vibration, etc. included in the smartphone are generally included. It may be implemented to include more components.
하기에서 각각의 단말 및 서버들은 도 2에 기초하여 다른 단말 또는 서버와 통신을 수행하는 장치일 수 있다. 즉, 하기에서 서술하는 단말 및 서버는 도 1에 기초하여 상호 간의 네트워크를 통해 연결되어 통신을 수행하는 주체일 수 있고, 각각의 단말 및 서버는 도 2에 기초한 메모리, 프로세서, 통신 모듈 및 송수신부와 그 밖의 구성을 구비하고, 동작하는 컴퓨팅 장치일 수 있다. 하기에서는 설명의 편의를 위해 단말 및 서버에 기초하여 서술하지만, 상기 구성들은 컴퓨팅 장치로서 다양한 구성들을 포함할 수 있으며, 특정 컴퓨팅 장치로 한정되는 것은 아닐 수 있다.In the following, each of the terminals and servers may be devices that communicate with other terminals or servers based on FIG. 2 . That is, the terminal and the server described below may be subjects that are connected through a mutual network based on FIG. 1 and perform communication, and each terminal and the server have a memory, a processor, a communication module, and a transceiver based on FIG. 2 . and other configurations and may be a computing device that operates. Hereinafter, descriptions are made based on a terminal and a server for convenience of description, but the configurations may include various configurations as a computing device, and may not be limited to a specific computing device.
일 예로, 기존 스마트 폰에서 ARS 응답(또는 자동응답)을 제공하기 위해서는 음성 통화(또는 음성 호)를 수신하고, ARS 응답 서버를 통해 사전에 정해진 항목에 기초하여 서비스가 제공될 수 있었다. 이때, 카드 회사나 가전 회사 등 많은 매장 및 고객을 보유하고 다수의 상품을 판매하는 기업들은 ARS 응답을 위한 서버를 구축하여 제공할 수 있으나, 일반 소매 업체나 기타 소규모 영업을 수행하는 경우에는 이러한 서버를 구축하는데 한계가 존재할 수 있다. 상술한 점을 고려하여, 하기에서는 사용자 단말에 자동 수신을 수행하는 방법에 대해 서술한다. 나아가, 사용자 단말이 자동 수신을 수행하는 경우, 해당 사용자 단말은 AI 서버를 통해 기 설정된 항목이 아닌 요청에 의한 유연한 답변을 제공하는 방법에 대해 서술한다. 즉, 하기에서는 수신자 단말이 인공지능을 활용해서 발신자 단말의 다양한 요청과 반응에 대하여 유연하게 대응하는 인공지능 비서 서비스를 제공하는 방법에 대해 서술한다.For example, in order to provide an ARS response (or automatic response) in an existing smart phone, a voice call (or voice call) may be received, and a service may be provided based on a predetermined item through the ARS response server. At this time, companies that have many stores and customers, such as card companies or home appliance companies, and companies that sell a lot of products can build and provide a server for ARS response. There may be limitations in building In consideration of the above, a method for performing automatic reception in the user terminal will be described below. Furthermore, when the user terminal performs automatic reception, a method for the user terminal to provide a flexible answer according to a request rather than a preset item through the AI server will be described. That is, the following describes a method in which the receiver terminal provides an artificial intelligence assistant service that flexibly responds to various requests and responses of the sender terminal by using artificial intelligence.
도 3은 본 명세서의 일실시예에 있어서 음성 호를 통한 발신자 단말의 요청에 대한 응답을 인공지능에 기초하여 제공하는 방법을 나타낸 도면이다. 3 is a diagram illustrating a method of providing a response to a request of a caller terminal through a voice call based on artificial intelligence according to an embodiment of the present specification.
수신자 단말(320)은 발신자 단말(310)로부터 전달되는 음성 통화에 대한 자동 수신을 설정할 수 있다. 일 예로, 수신자 단말(320)은 사업자 단말일 수 있으며, 스마트폰이나 그 밖의 디바이스일 수 있다. 즉, 수신자 단말(320)은 특정 서버로 구현되지 않고, 일반적으로 사용되는 모바일 디바이스일 수 있으며 특정 디바이스로 한정되지 않을 수 있다. 또한, 발신자 단말(310)은 사업자로부터 서비스를 제공받고자 하는 사용자의 디바이스일 수 있다. 즉, 발신자 단말(310)은 수신자 단말(320)에 기초한 사업자로부터 서비스를 제공받고자 하는 고객의 디바이스일 수 있다.The receiver terminal 320 may set automatic reception of a voice call delivered from the caller terminal 310 . For example, the receiver terminal 320 may be a carrier terminal, and may be a smartphone or other device. That is, the receiver terminal 320 is not implemented as a specific server, and may be a commonly used mobile device and may not be limited to a specific device. In addition, the caller terminal 310 may be a device of a user who wants to receive a service from a service provider. That is, the sender terminal 310 may be a device of a customer who wants to receive a service from a service provider based on the receiver terminal 320 .
이때, 도 3을 참조하면, 수신자 단말(320)은 발신자 단말(310)로부터 음성 통화(또는 음성 호)를 수신할 수 있다. 발신자 단말(310)의 사용자는 식별 정보(e.g. 전화번호)에 기초하여 수신자 단말(320)과 음성 통화를 시도할 수 있다. 일 예로, 발신자 단말(310)과 수신자 단말(320)은 상호 간에 데이터 통신을 수행하여 데이터 교환을 수행할 수 있으며, 상술한 실시예로 한정되지 않는다. 또한, 수신자 단말(320)은 AI 서버(330)와 데이터 통신을 수행할 수 있다. 즉, 수신자 단말(320)은 별도의 서버가 아닌 일반 디바이스로 AI 서버(330)와 통신을 수행하여 데이터 교환을 수행하고, 이를 통해 원하는 정보를 획득할 수 있다. AI 서버(330)는 발신자 단말(310)의 요청을 처리하여 수신자 단말(320)에 제공하는 서버일 수 있다. 일 예로, AI 서버(330)는 학습모델을 구비하고, 복수의 발신자 단말(310)의 요청에 대한 응답을 통해 학습을 수행하여 지속적으로 업데이트되는 서버일 수 있다. 일 예로, AI 서버(330)의 입력은 발신자 단말(310)의 요청일 수 있고, 출력은 발신자 단말(310)의 요청에 대한 응답일 수 있다. AI 서버(330)는 상술한 입력과 출력에 기초하여 지속적으로 업데이트를 수행하고, 업데이트에 기초하여 발신자 단말(310)로 유연한 응답을 제공할 수 있다. In this case, referring to FIG. 3 , the receiver terminal 320 may receive a voice call (or voice call) from the caller terminal 310 . The user of the caller terminal 310 may attempt a voice call with the receiver terminal 320 based on identification information (e.g. phone number). For example, the sender terminal 310 and the receiver terminal 320 may perform data exchange by performing data communication with each other, and the embodiment is not limited thereto. Also, the receiver terminal 320 may perform data communication with the AI server 330 . That is, the receiver terminal 320 performs data exchange by communicating with the AI server 330 as a general device rather than a separate server, and can acquire desired information through this. The AI server 330 may be a server that processes the request of the sender terminal 310 and provides it to the receiver terminal 320 . As an example, the AI server 330 may be a server that has a learning model and is continuously updated by learning through a response to a request from a plurality of caller terminals 310 . As an example, the input of the AI server 330 may be a request from the sender terminal 310 , and the output may be a response to the request of the sender terminal 310 . The AI server 330 may continuously perform an update based on the above-described input and output, and may provide a flexible response to the caller terminal 310 based on the update.
구체적인 일 예로, 수신자 단말(320)이 발신자 단말(310)로부터 음성 통화를 수신하는 경우, 수신자 단말(320)은 발신자 단말(310)에게 자동 응답을 제공하고, 자동 응답에 기초하여 발신자 단말(320)의 요청을 처리할 수 있다. 일 예로, 발신자 단말(310)은 수신자 단말(320)에 의해 음성 통화가 자동 수신되면 질의 요청을 음성 통화에 기초하여 수신자 단말(320)로 전송할 수 있다. 즉, 발신자 단말(310)의 사용자는 자동응답에 기초하여 음성으로 "질의 1A"를 수신자 단말(320)로 전송할 수 있다. 발신자 단말(310)로부터 "질의 1A"를 수신자 단말(320)은 STT(Speech to Text) 처리하여 텍스트로 전환된 질의 요청 메시지를 AI 서버(330)로 전송할 수 있다. 또한, 일 예로, 수신자 단말(320)은 발신자 단말(310)의 요청을 음성파일로 생성하고, 생성된 음성파일을 AI 서버(330)로 전송할 수 있으나 상술한 실시예로 한정되지 않는다. 즉, 수신자 단말(320)은 발신자 단말(310)로부터 수신한 "질의 1A"와 관련된 "질의 1B"를 텍스트 또는 음성 파일 형태로 생성하고, 이를 AI 서버(330)로 전송할 수 있다. "질의 1B"는 텍스트 또는 음성 파일 형태일 수 있으며 상술한 실시예로 한정되지 않는다. 그 후, 수신자 단말(320)은 AI 서버(330)로부터 "질의 1B"에 대한 응답인 "응답 1A"를 수신할 수 있다. 이때, "응답 1A"는 텍스트 또는 음성 파일 형태일 수 있다. 즉, AI 서버(330)는 텍스트 형태의 메시지나 음성 파일 형태의 메시지로 수신자 단말(320)로 "질의 1B"에 대한 응답을 수행할 수 있다. 이때, 일 예로, AI 서버(330)는 상술한 학습 모델에 기초하여 "질의 1B"를 입력으로 출력인 "응답 1A"를 획득할 수 있으며, 이를 통해 유연한 응답을 제공하도록 할 수 있다. As a specific example, when the receiver terminal 320 receives a voice call from the caller terminal 310, the receiver terminal 320 provides an automatic answer to the caller terminal 310, and based on the automatic answer, the caller terminal 320 ) can be processed. For example, when a voice call is automatically received by the receiver terminal 320 , the caller terminal 310 may transmit a query request to the receiver terminal 320 based on the voice call. That is, the user of the caller terminal 310 may transmit "query 1A" to the receiver terminal 320 by voice based on the automatic answer. The receiver terminal 320 may transmit the query request message converted into text to the AI server 330 by processing "Query 1A" from the sender terminal 310 by STT (Speech to Text). Also, as an example, the receiver terminal 320 may generate a request from the sender terminal 310 as a voice file and transmit the generated voice file to the AI server 330 , but is not limited to the above-described embodiment. That is, the receiver terminal 320 may generate "Query 1B" related to "Query 1A" received from the sender terminal 310 in the form of a text or voice file, and transmit it to the AI server 330 . "Query 1B" may be in the form of a text or audio file and is not limited to the above-described embodiment. Thereafter, the receiver terminal 320 may receive "response 1A" which is a response to "query 1B" from the AI server 330 . In this case, "response 1A" may be in the form of a text or voice file. That is, the AI server 330 may respond to “Query 1B” to the receiver terminal 320 as a message in the form of a text message or a message in the form of a voice file. In this case, as an example, the AI server 330 may obtain “answer 1A” that is an output with “query 1B” as an input based on the above-described learning model, and through this, can provide a flexible response.
그 후, 수신자 단말(320)은 "응답 1A"에 기초하여 "응답 1B"를 발신자 단말(310)로 제공할 수 있다. 이때, AI 서버(330)로부터 수신한 "응답 1A"가 텍스트인 경우, TTS(Text to Speech) 처리를 통해 음성 파일로 전환 후 "응답 1B"를 발신자 단말(310)에게 제공할 수 있다. 반면, AI 서버(330)로부터 수신한 "응답 1A"가 음성 파일인 경우, 수신자 단말(320)은 음성으로 전환된 "응답 1B"를 음성 통화에 기초하여 발신자 단말(310)에게 제공될 수 있다.Thereafter, the receiver terminal 320 may provide the "response 1B" to the sender terminal 310 based on the "response 1A". In this case, when the "response 1A" received from the AI server 330 is text, the "response 1B" may be provided to the caller terminal 310 after conversion to a voice file through text to speech (TTS) processing. On the other hand, when the "response 1A" received from the AI server 330 is a voice file, the receiver terminal 320 may provide the "response 1B" converted to voice to the caller terminal 310 based on the voice call. .
또한, 발신자 단말(310)의 사용자가 추가 질의가 존재하는 경우, 상술한 바와 같이 수신자 단말(320)로 추가 질의 요청을 수행하고, 수신자 단말(320)은 AI 서버(330)에 기초하여 유연한 응답 정보를 생성하여 발신자 단말(310)로 제공할 수 있다. In addition, when the user of the sender terminal 310 has an additional query, as described above, the user of the sender terminal 310 performs an additional query request to the receiver terminal 320 , and the receiver terminal 320 provides a flexible response based on the AI server 330 . Information may be generated and provided to the caller terminal 310 .
**
여기서, 발신자 단말의 질의 정보를 특정하는 방법이 필요할 수 있다. 일 예로, 발신자 단말에 대한 질의에 기초하여 수신자 단말의 응답이 지연되는 경우에 서비스 품질 저하가 발생할 수 있다. 이때, 발신자 단말의 질의 정보에 대한 범위가 광범위한 경우, 수신자 단말로부터 관련 정보를 수신한 AI 서버의 정보처리 시간이 지연될 수 있으며, 이에 기초하여 서비스 제공에 지연이 발생할 수 있다.Here, a method for specifying query information of the caller terminal may be required. As an example, when the response of the receiver terminal is delayed based on the inquiry to the sender terminal, service quality degradation may occur. In this case, when the scope of the query information of the sender terminal is wide, the information processing time of the AI server that receives the related information from the receiver terminal may be delayed, and based on this, delay may occur in service provision.
상술한 점을 고려하여, 도 4a를 참조하면, 발신자 단말(410)과 수신자 단말(420)이 음성 통화에 기초하여 자동응답을 수행하는 경우, 수신자 단말(420)과 발신자 단말(410)은 관련 콘텐츠를 결정할 수 있다. 여기서, 관련 콘텐츠는 수신자 단말(420)의 특징 또는 콘텐츠에 기초하여 결정될 수 있다. 보다 구체적인 일 예로, 수신자 단말(420)의 사업자가 식품업에 기초하여 수신자 단말(420)를 설정한 경우, 관련 콘텐츠는 관련 정보에 기초하여 설정될 수 있다. 도 4b를 참조하면, 관련 콘텐츠는 주문 관련, 상담 관련 또는 영업 시간 관련 중 어느 하나로 설정될 수 있다. 다만, 이는 하나의 일 예일 뿐, 관련 콘텐츠는 다양하게 설정될 수 있으며, 상술한 실시예로 한정되지 않는다. 또한, 일 예로, 수신자 단말(420)의 사업자가 헬스 관련 영업에 기초하여 수신자 단말(420)를 설정한 경우, 관련 콘텐츠는 관련 정보에 기초하여 설정될 수 있다. 도 4c를 참조하면, 관련 콘텐츠는 운동 종목 관련, 상담 관련, 영업 시간 관련 또는 방문 방법 관련 중 어느 하나로 설정될 수 있다. 다만, 이는 하나의 일 예일 뿐, 관련 콘텐츠는 다양하게 설정될 수 있으며, 상술한 실시예로 한정되지 않는다. 또한, 일 예로, 수신자 단말(420)의 사업자가 제품 판매 관련 영업에 기초하여 수신자 단말(420)를 설정한 경우, 관련 콘텐츠는 관련 정보에 기초하여 설정될 수 있다. 도 4d를 참조하면, 관련 콘텐츠는 쇼핑 항목 관련, 상담 관련 또는 영업 시간 관련 중 어느 하나로 설정될 수 있다. 다만, 이는 하나의 일 예일 뿐, 관련 콘텐츠는 다양하게 설정될 수 있으며, 상술한 실시예로 한정되지 않는다. In consideration of the foregoing, referring to FIG. 4A , when the caller terminal 410 and the receiver terminal 420 perform an automatic answer based on a voice call, the receiver terminal 420 and the caller terminal 410 are related content can be determined. Here, the related content may be determined based on the characteristics or content of the receiver terminal 420 . As a more specific example, when the operator of the receiver terminal 420 sets the receiver terminal 420 based on the food industry, related content may be set based on related information. Referring to FIG. 4B , the related content may be set to any one of order-related, consultation-related, and business hours-related. However, this is only one example, and related content may be set in various ways, and is not limited to the above-described embodiment. Also, as an example, when the operator of the receiver terminal 420 sets the receiver terminal 420 based on health-related business, related content may be set based on related information. Referring to FIG. 4C , the related content may be set to any one of sports related, counseling related, business hours related, and visiting method related. However, this is only one example, and related content may be set in various ways, and is not limited to the above-described embodiment. Also, as an example, when the operator of the receiver terminal 420 sets the receiver terminal 420 based on sales related to product sales, related content may be set based on related information. Referring to FIG. 4D , the related content may be set to any one of shopping item related, consultation related, and business hours related. However, this is only one example, and related content may be set in various ways, and is not limited to the above-described embodiment.
즉, 상술한 바처럼 수신자 단말(420)의 특징 및 콘텐츠에 기초하여 관련 콘텐츠가 결정될 수 있으며, 복수 개의 관련 콘텐츠 중 특정 관련 콘텐츠는 발신자 단말(410)과 수신자 단말(420)의 협의에 기초하여 결정될 수 있다. 일 예로, 도 4a를 참조하면, 수신자 단말(420)은 자동 응답시 복수 개의 관련 콘텐츠 정보를 제공하고, 발신자 단말(410)은 특정 관련 콘텐츠를 결정하여 해당 정보를 수신자 단말(420)로 제공할 수 있다. 그 후, 수신자 단말(420)은 결정된 관련 콘텐츠 정보를 AI 서버(430)로 전송할 수 있다. 이때, AI 서버(430)는 관련 콘텐츠별로 분리하여 존재하거나 통합된 형태로서 관련 콘텐츠 각각을 처리할 수 있으며, 상술한 실시예로 한정되지 않는다. 다만, AI 서버(430)는 결정된 관련 콘텐츠에 기초한 정보를 기준으로 발신자 단말(410)의 질의 요청에 대한 응답을 확인할 수 있는바 정보 처리 시간이 줄어들 수 있다. 그 후, 발신자 단말(410)은 결정된 관련 콘텐츠에 기초한 질의를 수신자 단말(420)로 제공하고, 수신자 단말(420)은 발신자 단말(410)의 질의에 기초하여 AI 서버(430)를 통해 질의에 대한 응답을 획득하여 제공할 수 있으며, 구체적인 방법은 도 3과 동일할 수 있다.That is, as described above, related contents may be determined based on the characteristics and contents of the recipient terminal 420 , and specific related contents among a plurality of related contents are based on consultation between the sender terminal 410 and the recipient terminal 420 . can be decided. For example, referring to FIG. 4A , the receiver terminal 420 provides a plurality of related content information in an automatic response, and the sender terminal 410 determines specific related content and provides the corresponding information to the receiver terminal 420 . can Thereafter, the receiver terminal 420 may transmit the determined related content information to the AI server 430 . In this case, the AI server 430 may process each of the related contents in an integrated form or exist separately for each related content, and is not limited to the above-described embodiment. However, since the AI server 430 can check the response to the inquiry request from the caller terminal 410 based on the determined information based on the related content, the information processing time may be reduced. Then, the sender terminal 410 provides a query based on the determined related content to the receiver terminal 420, and the receiver terminal 420 responds to the query through the AI server 430 based on the query from the sender terminal 410. A response may be obtained and provided, and a specific method may be the same as that of FIG. 3 .
또 다른 일 예로, 발신자 단말과 수신자 단말의 음성 통화가 자동 응답에 기초하여 수신된 후에 데이터 통화로 전환될 수 있다. 도 5a를 참조하면, 수신자 단말(520)은 발신자 단말(510)에게 데이터 통화 전환을 문의하고, 발신자 단말(510)이 수락하면 음성 통화를 종료하고, 데이터 통화(e.g. VOIP(Voice over Internet Protocol))로 전환할 수 있다. 여기서, 발신자 단말은 음성 응답 또는 키 입력의 방식에 기초하여 수락 여부에 대한 정보를 수신자 단말(520)로 제공할 수 있다. As another example, after the voice call between the caller terminal and the receiver terminal is received based on an automatic answer, it may be converted into a data call. Referring to FIG. 5A , the receiver terminal 520 inquires the caller terminal 510 for data call transfer, and if the caller terminal 510 accepts, ends the voice call, and a data call (e.g. Voice over Internet Protocol (VOIP)) ) can be converted to Here, the sender terminal may provide information on whether to accept to the receiver terminal 520 based on a voice response or a key input method.
일 예로, 수신자 단말(520)은 기존의 ARS 서버와 다르게 음성 통화를 발신자 단말(510)과 유지하는 경우, 다른 발신자 단말에 대한 음성 통화를 수신하지 못할 수 있다. 상술한 점을 고려하여, 수신자 단말(520)은 음성 통화를 데이터 통화로 전환할 필요성이 있다. 또한, 발신자 단말(510)의 질의에 기초하여 응답을 제공하는 경우, 데이터베이스에 관련 정보를 저장하고, 음성 인식이나 그 밖의 데이터 처리를 수행해야 할 필요성이 있으나, 음성 통화에 기초하여 정보를 제공하는 경우에는 데이터 처리에 한계가 존재할 수 있다. 즉, 수신자 단말(520)은 음성 통화에 기초하여 발신자 단말(510)의 질의를 처리하는데 한계가 존재하며 상술한 점을 고려하여 데이터 통화로 전환이 수행될 수 있다.For example, when the receiver terminal 520 maintains a voice call with the caller terminal 510 differently from the existing ARS server, the receiver terminal 520 may not receive a voice call to another caller terminal. In consideration of the above, the receiver terminal 520 needs to convert a voice call into a data call. In addition, when providing a response based on a query from the caller terminal 510, there is a need to store related information in a database and perform voice recognition or other data processing, but providing information based on a voice call In some cases, there may be limitations in data processing. That is, the receiver terminal 520 has a limit in processing the query of the caller terminal 510 based on the voice call, and conversion to the data call may be performed in consideration of the above points.
보다 구체적인 일 예로, 도 5b를 참조하면, 수신자 단말(520)은 발신자 단말(510)과 기 설정된 시간에 기초하여 데이터 통화 전환을 수행할 수 있다. 즉, 수신자 단말(520)은 짧은 답변 등 일정시간까지는 발신자 단말(510)의 질의를 처리하다가 자동 연결 후 기 설정된 시간이 도과하면 다른 발신자 단말(510)의 음성 통화를 고려하여 데이터 통화 전환을 시도할 수 있다. 일 예로, 수신자 단말(520)은 자동 연결 후 기 설정된 시간 이후에 발신자 단말(510)에게 음성 통화 기준 시간을 통보하고 데이터 통화 전환 여부에 대한 요청을 전달할 수 있다. 그 후, 발신자 단말(510)이 이를 수락하면 데이터 통화로 전환하여 발신자 단말(510)의 질의를 처리할 수 있다. As a more specific example, referring to FIG. 5B , the receiver terminal 520 may perform data call conversion with the caller terminal 510 based on a preset time. That is, the receiver terminal 520 processes the query of the caller terminal 510 for a certain period of time, such as a short answer, and when a preset time elapses after automatic connection, considers the voice call of another caller terminal 510 and tries to switch the data call. can do. As an example, the receiver terminal 520 may notify the caller terminal 510 of a reference time for a voice call after a preset time after automatic connection and transmit a request for whether to switch a data call. Thereafter, if the caller terminal 510 accepts this, it may switch to a data call and process the query of the caller terminal 510 .
또한 일 예로 수신자 단말(520)은 발신자 단말의 질의 내용에 기초하여 데이터 통화 전환을 수행할 수 있다. 즉 질의 내용에 대한 응답을 위해서 소정의 시간이 필요하거나, 소정의 시각적 정보 제공이 필요한 경우 데이터 통화 전환을 수행할 수 있다. 예컨대 약관의 제공, 구체적인 사용자의 의견 수신, 특정 항목에 대한 명시적 확인, 계약의 체결, 송금, 환전, 정보의 공개범위 설정 등을 위해 데이터 통화 전환이 수행될 수 있으나 이에 본 발명이 제한되는 것은 아니다.In addition, as an example, the receiver terminal 520 may perform data call conversion based on the query content of the caller terminal. That is, when a predetermined time is required to respond to a query or a predetermined visual information is required to be provided, data call conversion can be performed. For example, data currency conversion may be performed to provide terms and conditions, receive specific user opinions, explicitly confirm specific items, conclude a contract, remittance, exchange, set the disclosure scope of information, etc., but the present invention is limited thereto. not.
또 다른 일 예로, 도 5c를 참조하면, 수신자 단말(520)(또는 AI 서버(530))는 발신자 단말(510)의 질의 및 응답에 대한 데이터 처리를 고려하여 데이터 통화로 전환을 요청할 수 있다. 일 예로, AI 서버(530)는 발신자 단말(510)의 질의에 기초하여 응답을 제공하는 과정에서 데이터베이스에 관련 정보를 저장하거나 음성정보를 텍스트화 하는 등 데이터 처리 과정을 수행할 수 있다. 여기서, 음성 통화에 기초하여 정보를 처리하는데 한계가 존재할 수 있으며, 상술한 점을 고려하여 AI 서버(530)는 데이터 통화로 전환을 요청할 수 있다. 예컨대 음성 호 연결상태에서 수신하는 음성 데이터는 데이터 호 연결상태에서 수신하는 음성 데이터에 비하여 큰 용량을 갖거나, 데이터 처리가 복잡할 수 있다. 이러한 문제를 해결하기 위해서, AI 서버단 또는 수신자 단말단에서의 데이터처리 효율화를 위해서 데이터 통화 전환을 요청할 수 있다.As another example, referring to FIG. 5C , the receiver terminal 520 (or the AI server 530 ) may request conversion to a data call in consideration of data processing for the inquiry and response of the caller terminal 510 . For example, the AI server 530 may perform a data processing process such as storing related information in a database or converting voice information into text in a process of providing a response based on a query from the caller terminal 510 . Here, there may be a limit in processing information based on a voice call, and the AI server 530 may request conversion to a data call in consideration of the above-mentioned points. For example, voice data received in a voice call connection state may have a larger capacity than voice data received in a data call connection state, or data processing may be complicated. In order to solve this problem, data call conversion may be requested for data processing efficiency at the AI server end or the receiver end.
일 예로, AI 서버(530)는 질의에 대한 응답 또는 별도의 메시지를 통해 수신자 단말(520)에게 데이터 통화 전환 요청을 수행할 수 있다. 또한, 수신자 단말(520)도 응답 또는 별도의 메시지를 통해 발신자 단말(510)에게 데이터 통화 전환을 요청할 수 있다. 즉, 제공되는 응답이나 데이터 처리를 고려하여 데이터 통화로 전환될 수 있으며, 상술한 실시예로 한정되지 않는다. 여기서, 데이터 통화로 전환된 후에는 수신자 단말(520) 및 AI 서버(530)는 고용량의 데이터를 처리할 수 있다. 따라서, 데이터 통화로 전환된 후에 수신자 단말(520) 및 AI 서버(530)는 음성을 통한 정보 뿐만 아니라 이미지나 동영상 등 고용량 데이터를 처리하여 발신자 단말(510)에게 제공할 수 있으며, 발신자 단말은 보다 구체적인 응답을 획득할 수 있다.For example, the AI server 530 may perform a data call transfer request to the receiver terminal 520 in response to a query or through a separate message. In addition, the receiver terminal 520 may also request data call conversion from the caller terminal 510 through a response or a separate message. That is, it may be converted to a data call in consideration of a response or data processing provided, and is not limited to the above-described embodiment. Here, after being converted to a data call, the receiver terminal 520 and the AI server 530 may process a large amount of data. Therefore, after being converted to a data call, the receiver terminal 520 and the AI server 530 may process high-capacity data such as images or videos as well as information through voice and provide them to the caller terminal 510, and the caller terminal is more A specific response can be obtained.
또 다른 일 예로, 데이터 통화는 제 3 메신저 플랫폼에 기초하여 수행될 수 있다. 수신자 단말은 상술한 바와 동일하게 AI 서버와 데이터 통신에 기초하여 발신자 단말의 질의를 처리할 수 있다. 또한, 수신자 단말이 데이터 통화를 위해 자체적으로 플랫폼을 구축하는데 한계가 존재하므로 제 3자 메신저 플랫폼을 통해 데이터 통화가 수행되도록 할 수 있다.As another example, the data call may be performed based on a third messenger platform. The receiver terminal may process the query of the sender terminal based on data communication with the AI server in the same manner as described above. In addition, since the receiver terminal has a limit in building its own platform for data call, data call can be performed through a third-party messenger platform.
보다 구체적인 일 예로, 도 6a를 참조하면, 수신자 단말(620)은 발신자 단말(610)로부터 데이터 통화 전환을 요청하고, 발신자 단말(610)로부터 데이터 통화에 대한 수락을 응답으로 수신할 수 있다. 그 후, 수신자 단말(620)은 발신자 단말(610)의 정보에 기초하여 제 3 메신저 플랫폼(640)으로 데이터 통화 제공 요청을 전달할 수 있다. 그 후, 제 3 메신저 플랫폼(640)은 데이터 통화 제공 요청에 기초하여 수락 여부를 판단하고, 이에 대한 정보를 수신자 단말(620)로 전달할 수 있다. 여기서, 제 3 메신저 플랫폼(640)에 의해 데이터 통화 제공이 수락된 경우, 수신자 단말(620)은 발신자 단말(610)과 제 3 메신저 플랫폼(640)에 기초하여 데이터 통화를 수행할 수 있다. 즉, 수신자 단말(620)은 발신자 단말(610)의 질의에 대해서는 AI 서버(630)를 통해 응답 정보를 획득하고, 데이터 통화는 제 3 메신저 플랫폼을 통해 수행할 수 있으며 이를 통해 발신자 단말(610)로 유연한 인공지능 비서 서비스를 제공할 수 있다.As a more specific example, referring to FIG. 6A , the receiver terminal 620 may request data call transfer from the caller terminal 610 and receive acceptance of the data call from the caller terminal 610 as a response. Thereafter, the receiver terminal 620 may transmit a data call provision request to the third messenger platform 640 based on the information of the caller terminal 610 . Thereafter, the third messenger platform 640 may determine whether to accept the data call provision request based on the request, and transmit the information to the receiver terminal 620 . Here, when the data call provision is accepted by the third messenger platform 640 , the receiver terminal 620 may perform a data call based on the caller terminal 610 and the third messenger platform 640 . That is, the receiver terminal 620 obtains response information through the AI server 630 to the inquiry of the caller terminal 610, and the data call can be performed through a third messenger platform, through which the caller terminal 610 can provide flexible AI assistant services.
또 다른 일 예로, 제 3 메신저 플랫폼을 통해 데이터 통화를 수행하는 경우, 발신자 단말과 수신자 단말은 제 3자 메신저 플랫폼에 대한 식별 정보를 확인할 필요성이 있다.(e.g. 친구 관계) 즉, 발신자 단말과 수신자 단말은 제 3 메신저 플랫폼에 기초한 상호 간의 식별 정보를 인지하고 있고, 식별 정보에 대한 승인이 존재하는 상태일 필요성이 있다. 일 예로, 제 3 메신저 플랫폼은 발신자 단말과 수신자 단말이 상호 간의 식별 정보를 인지하지 않은 경우에 데이터 통화 전환을 수락하지 않을 수 있다.As another example, when performing a data call through a third messenger platform, the sender terminal and the receiver terminal need to check identification information on the third messenger platform (e.g. friend relationship). That is, the sender terminal and the receiver terminal. The terminal recognizes mutual identification information based on the third messenger platform, and there is a need for approval for identification information. For example, the third messenger platform may not accept the data call conversion when the calling terminal and the receiving terminal do not recognize mutual identification information.
다만, 일 예로, 제 3 메신저 플랫폼은 발신자 단말과 수신자 단말이 상호 간의 식별 정보를 인지하고 있지 않더라도 발신자 단말과 수신자 단말의 기록 정보에 기초하여 데이터 통화를 수락할 수 있다. 제 3 메신저 플랫폼은 발신자 단말과 수신자 단말의 과거 통화 기록에 기초하여 상호 간의 확인을 수행하고, 이에 기초하여 데이터 통화를 수락하여 데이터 통화를 제공할 수 있다. 구체적인 일 예로, 수신자 단말은 발신자 단말의 전화번호를 제3 메신저 플랫폼에 전송할 수 있다. 이때, 제 3 메신저 플랫폼은 수신한 정보에 기초하여 발신자 단말로 데이터 통화 발신 가부를 요청하고, 발신자 단말의 수락에 기초하여 데이터 통화 연결을 수행할 수 있다. 즉, 제3 메신저 플랫폼은 발신자 단말과 수신자 단말이 제 3 메신저 플랫폼 내의 식별 정보에 기초하여 승인된 사용자이거나 수신자 단말이 해당 번호의 수신자인 점에 기초하여 데이터 통화 연결을 수락할 수 있다. However, as an example, the third messenger platform may accept the data call based on the record information of the sender terminal and the receiver terminal even if the caller terminal and the receiver terminal do not recognize each other's identification information. The third messenger platform may perform mutual confirmation based on the past call records of the caller terminal and the receiver terminal, and may provide a data call by accepting a data call based on this. As a specific example, the receiver terminal may transmit the phone number of the caller terminal to the third messenger platform. In this case, the third messenger platform may request whether or not to send a data call to the caller terminal based on the received information, and may perform a data call connection based on the acceptance of the caller terminal. That is, the third messenger platform may accept the data call connection based on the fact that the caller terminal and the receiver terminal are users who are approved based on identification information in the third messenger platform, or that the receiver terminal is the receiver of the corresponding number.
또한, 일 예로, 도 6b를 참조하면, 수신자 단말(620)은 발신자 단말(610)로 데이터 통화 전환 요청을 전달하면서 데이터 통화 관련 제 3 메신저 플랫폼 정보 제공 요청도 전달할 수 있다. 일 예로, 수신자 단말(620)이 상술한 바처럼 제 3 메신저 플랫폼의 식별 정보를 인지하고 있거나 과거 기록이 존재하는 경우라면 이에 기초하여 데이터 통화에 대한 수락이 수행될 수 있다. 반면, 수신자 단말(620)에 상술한 정보가 존재하지 않은 경우, 수신자 단말(620)은 데이터 통화 전환 요청을 발신자 단말(610)에게 전달하면서 데이터 통화를 위한 정보도 함께 요청할 수 있다. 일 예로, 발신자 단말(610)이 수신자 단말(620)로 처음 음성 통화를 시도한 경우, 수신자 단말(620)은 발신자 단말(610)과 관련된 정보를 가지고 있지 않을 수 있으며, 수신자 단말(620)은 데이터 통화를 위한 정보를 발신자 단말(610)로 요청할 수 있다. 일 예로, 데이터 통화를 위한 정보는 제 3 플랫폼(640)에 기초한 식별 정보 확인 및 승인 요청일 수 있다.(e.g. 친구 관계 동의 요청 후 응답 수신) 즉, 수신자 단말(620)은 제 3 메신저 플랫폼(640)을 통해 발신자 단말(610)과 데이터 통화를 수행할 수 있도록 관련 정보를 요청하고, 이에 대한 응답을 수신하여 데이터 통화를 위한 사전 준비를 수행할 수 있다. 그 후, 수신자 단말(620)은 데이터 통화 제공 요청을 제 3 메신저 플랫폼(640)에 전달하고, 제 3 메신저 플랫폼(640)의 수락에 기초하여 발신자 단말(610)과 데이터 통화 연결을 수행할 수 있다.Also, as an example, referring to FIG. 6B , the receiver terminal 620 may transmit a data call transfer request to the caller terminal 610 while also delivering a data call-related third messenger platform information provision request. For example, if the receiver terminal 620 recognizes the identification information of the third messenger platform as described above or if there is a past record, acceptance of the data call may be performed based on this. On the other hand, when the above-described information does not exist in the receiver terminal 620 , the receiver terminal 620 may request information for a data call together while transmitting the data call transfer request to the caller terminal 610 . For example, when the caller terminal 610 first attempts a voice call to the receiver terminal 620 , the receiver terminal 620 may not have information related to the caller terminal 610 , and the receiver terminal 620 may provide data Information for a call may be requested from the caller terminal 610 . As an example, the information for the data call may be a request for identification information confirmation and approval based on the third platform 640. (e.g. receiving a response after requesting a friend relationship agreement) That is, the receiver terminal 620 is a third messenger platform ( 640), it is possible to request related information so as to perform a data call with the caller terminal 610, and receive a response thereto to perform preliminary preparation for a data call. Thereafter, the receiver terminal 620 transmits the data call provision request to the third messenger platform 640 and performs a data call connection with the caller terminal 610 based on the acceptance of the third messenger platform 640 . have.
또한, 일 예로, 도 7a를 참조하면, 데이터 통화로 전환된 경우에 데이터 통화뿐만 아니라 메신저를 통해 관련 정보가 디스플레이될 수 있다. 데이터 통화로 전환된 경우, 발신자 단말에게 수신자 단말에 대한 정보와 함께 질의 내역에 대한 정보가 제 3 메신저 플랫폼을 통해 제공될 수 있다. 또한, 일 예로, 제 3 메신저 플랫폼을 통해 질의 내역에 대한 정보뿐만 아니라, 관련된 다양한 정보가 제공될 수 있다. 일 예로, 제공되는 정보는 이미지나 동영상 등일 수 있으며, 상술한 바를 통해 보다 구체적인 정보를 발신자 단말에게 제공할 수 있다. Also, as an example, referring to FIG. 7A , when a data call is converted, related information may be displayed through a messenger as well as a data call. When the data call is switched, information on query details along with information on the receiver terminal may be provided to the calling terminal through the third messenger platform. Also, as an example, not only information on query details but also various related information may be provided through the third messenger platform. As an example, the provided information may be an image or a video, and more specific information may be provided to the caller terminal through the above-mentioned bar.
또한, 일 예로, 도 7b를 참조하면, 발신자 단말은 제 3 메신저 플랫폼을 통해 관련 콘텐츠에 대한 정보도 확인할 수 있으며, 이에 대한 정보도 제 3 메신저 플랫폼을 통해 변경할 수 있다. 즉, 제 3 메신저 플랫폼을 통해 보다 구체적인 데이터 정보가 발신자 단말에게 제공될 수 있으며, 이를 통해 발신자 단말로 유연한 답변을 제공할 수 있다. Also, as an example, referring to FIG. 7B , the sender terminal may also check information on related content through the third messenger platform, and may change the information on this through the third messenger platform. That is, more specific data information may be provided to the caller terminal through the third messenger platform, and through this, a flexible answer may be provided to the caller terminal.
여기서, 보다 구체적인 실시예를 고려하면, 사용자A(발신자 단말)가 중국집B(수신자 단말)에 전화를 걸었을 때, 음성통화가 연결되고(착신되고), AI 서버에 기초하여 간단한 주문 대응이 수행될 수 있다. 일 예로, AI 서버는 통화가 지연되거나 데이터 처리 용량이 증가하는 경우를 판단하고, 데이터 통화 전환 여부를 문의할 수 있다. 이때, 사용자A가 수락하면 중국집B의 사업자의 메신저 계정이 사용자A 에게 메신저를 통해 데이터 통화를 연결하게 되며, 메신저를 통해 관련 데이터를 제공할 수 있다.Here, considering a more specific embodiment, when user A (sender terminal) makes a call to Chinese house B (receiver terminal), a voice call is connected (received), and a simple order response is performed based on the AI server can be As an example, the AI server may determine when a call is delayed or data processing capacity is increased, and inquire whether to switch a data call. At this time, if user A accepts, the messenger account of the operator of Chinese house B connects the data call to user A through a messenger, and the related data can be provided through the messenger.
도 8은 본 명세서의 일실시예에 있어서 음성 통화(음성 호)를 통한 인공지능 비서 서비스를 제공하는 방법을 나타낸 순서도이다.8 is a flowchart illustrating a method of providing an artificial intelligence assistant service through a voice call (voice call) according to an embodiment of the present specification.
도 8을 참조하면, 제 1단말은 제 2 단말로부터 음성 통화를 수신하고, 자동 연결을 수행할 수 있다.(S810) 여기서, 제 1 단말은 수신자 단말이고, 제 2 단말은 발신자 단말일 수 있다. 다음으로 자동 연결이 수행된 후 제 1 단말은 제 2 단말로부터 제 1 질의 요청 메시지를 수신할 수 있다.(S820) 그 후, 제 1 단말은 제 1 질의 요청 메시지에 기초한 제 2 질의 요청 메시지를 AI 서버로 전송할 수 있다.(S830) 이때, 제 1 질의 요청 메시지는 음성 통화에 기초하여 음성으로 제 2 단말에서 제 1 단말로 전달될 수 있다. 여기서, 제 1 단말은 제 1 질의 요청 메시지에 STT(Speech To Text) 처리를 수행하여 전환된 텍스트 정보를 제 2 질의 요청 메시지로서 AI 서버로 전달할 수 있다. 또한, 일 예로, 제 1 단말은 제 1 질의 요청 메시지에 기초하여 생성된 음성 파일 정보를 제 2 질의 요청 메시지로서 AI 서버로 전달할 수 있으며, 상술한 실시예로 한정되지 않는다.Referring to FIG. 8 , the first terminal may receive a voice call from the second terminal and perform automatic connection (S810). Here, the first terminal may be a receiver terminal, and the second terminal may be a caller terminal. . Next, after automatic connection is performed, the first terminal may receive a first query request message from the second terminal (S820). Thereafter, the first terminal sends a second query request message based on the first query request message. It may be transmitted to the AI server. (S830) In this case, the first query request message may be transmitted from the second terminal to the first terminal by voice based on the voice call. Here, the first terminal may transmit the converted text information to the AI server as the second query request message by performing STT (Speech To Text) processing on the first query request message. Also, as an example, the first terminal may transmit voice file information generated based on the first query request message to the AI server as the second query request message, and the embodiment is not limited thereto.
다음으로, 제 1 단말이 AI 서버로부터 제 2 질의 요청 메시지에 기초한 제 1 질의 응답 메시지를 수신할 수 있다.(S840) 그 후, 제 1 단말이 제 1 질의 응답 메시지에 기초한 제 2 질의 응답 메시지를 제 2 단말로 전달할 수 있다.(S850) 이때, AI 서버가 제 1 단말로 전달하는 제 1 질의 응답 메시지는 제 2 질의 요청 메시지에 기초하여 생성되는 텍스트 정보 및 제 2 질의 요청 메시지에 기초하여 생성되는 음성 파일 정보 중 적어도 어느 하나를 포함할 수 있다. 제 1 단말은 AI 서버로부터 수신한 제 1 질의 응답 메시지에 기초하여 제 2 질의 응답 메시지를 생성하고, 생성된 제 2 질의 응답 메시지를 음성 통화에 기초하여 음성으로 제 2 단말로 제공할 수 있다.Next, the first terminal may receive a first query response message based on the second query request message from the AI server. (S840) Thereafter, the first terminal receives a second query response message based on the first query response message can be transmitted to the second terminal. (S850) In this case, the first query response message delivered by the AI server to the first terminal is based on the text information generated based on the second query request message and the second query request message. It may include at least one of the generated voice file information. The first terminal may generate a second query response message based on the first query response message received from the AI server, and may provide the generated second query response message to the second terminal by voice based on a voice call.
또한, 일 예로, 제 1 단말은 제 2 단말로 음성 통화를 데이터 통화로 전환하는 요청 메시지를 전송할 수 있다. 이때, 제 1 단말은 제 2 단말로부터 요청 메시지에 대한 응답으로 수락 메시지를 수신하고, 수락 메시지에 기초하여 음성 통화를 데이터 통화로 전환할 수 있다. 이때, 상술한 바와 같이, 제 1 단말은 제 2 단말과 자동 연결이 수행된 후 기 설정된 시간이 도과하는지 여부를 판단하고, 제 2 단말과 자동 연결이 수행된 후 설정된 시간이 도과하면 요청 메시지를 제 2 단말로 전송할 수 있으며, 이는 상술한 바와 같다. 또 다른 일 예로, 제 1 단말 또는 AI 서버는 데이터 처리 능력에 기초하여 데이터 통화 전환이 필요한지 여부를 판단할 수 있다. 이때, 제 1 단말 또는 AI 서버에 의해 음성 통화를 데이터 통화로 전환하고자 하는 경우, 제 1 단말은 요청 메시지를 제 2 단말로 전송할 수 있다.Also, as an example, the first terminal may transmit a request message for converting a voice call into a data call to the second terminal. In this case, the first terminal may receive an acceptance message in response to the request message from the second terminal, and may convert the voice call into a data call based on the acceptance message. At this time, as described above, the first terminal determines whether a preset time has elapsed after the automatic connection with the second terminal is performed, and when the set time has elapsed after the automatic connection with the second terminal is performed, a request message is sent. It can be transmitted to the second terminal, as described above. As another example, the first terminal or the AI server may determine whether data call conversion is necessary based on the data processing capability. In this case, when the first terminal or the AI server intends to convert the voice call into a data call, the first terminal may transmit a request message to the second terminal.
또 다른 일 예로, 데이터 통화는 제 3 메신저 플랫폼에 기초하여 수행될 수 있다. 이때, 상술한 바와 같이, 데이터 통화는 제 1 단말의 제 3 메신저 플랫폼에서의 식별 정보 및 제 2 단말의 제 3 메신저 플랫폼에서의 식별 정보에 기초하여 수행될 수 있다. 일 예로, 상호 간의 식별 정보를 인지하고 승인된 경우에 데이터 통화 연결이 수행될 수 있으며, 이는 상술한 바와 같다.As another example, the data call may be performed based on a third messenger platform. In this case, as described above, the data call may be performed based on identification information on the third messenger platform of the first terminal and identification information on the third messenger platform of the second terminal. For example, when mutual identification information is recognized and approved, data call connection may be performed, as described above.
또 다른 일 예로, 제 1 단말이 제 3 메신저 플랫폼에 기초하여 데이터 통화를 수행하는 경우, 제 3 메신저 플랫폼으로 데이터 통화 제공 요청 메시지를 전송하고, 제 3 메신저 플랫폼으로부터 데이터 통화에 대한 수락 메시지를 수신하면 데이터 통화를 수행할 수 있으며, 이는 상술한 바와 같다. 또한, 일 예로, 제 1 단말은 상술한 도 4a 내지 도 4d에 기초하여 자동 연결이 수행된 후 제 1 단말과 관련된 적어도 어느 하나의 관련 콘텐츠 정보를 제 2 단말로 전송할 수 있다. 여기서, 제 2 단말은 적어도 어느 하나의 관련 콘텐츠 정보에 기초하여 특정 콘텐츠를 선택하고, 이에 대한 정보를 제 1 단말로 전송할 수 있다. 또한, 제 2 단말은 상술한 제 1 질의 요청 메시지를 선택된 콘텐츠에 기초하여 생성할 수 있으며, 이는 상술한 바와 같다.As another example, when the first terminal performs a data call based on the third messenger platform, it transmits a data call provision request message to the third messenger platform and receives a data call acceptance message from the third messenger platform Then, a data call can be performed, as described above. Also, as an example, the first terminal may transmit at least one piece of related content information related to the first terminal to the second terminal after automatic connection is performed based on FIGS. 4A to 4D described above. Here, the second terminal may select a specific content based on at least one piece of related content information, and transmit the information to the first terminal. Also, the second terminal may generate the above-described first query request message based on the selected content, as described above.
이상에서 설명한 실시예들은 적어도 부분적으로 컴퓨터 프로그램으로 구현되고 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 실시예들을 구현하기 위한 프로그램이 기록되고 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽힐 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.The embodiments described above may be at least partially implemented as a computer program and recorded in a computer-readable recording medium. A computer-readable recording medium in which a program for implementing the embodiments is recorded includes all types of recording devices in which computer-readable data is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, and optical data storage devices. In addition, the computer-readable recording medium may be distributed in a network-connected computer system, and the computer-readable code may be stored and executed in a distributed manner. In addition, functional programs, codes, and code segments for implementing the present embodiment may be easily understood by those skilled in the art to which the present embodiment belongs.
이상에서 살펴본 본 명세서는 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 명세서의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 명세서의 진정한 기술적 보호범위는 첨부된 청구범위의 기술적 사상에 의해서 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 포함하도록 정해져야 할 것이다.Although the present specification described above has been described with reference to the embodiments shown in the drawings, it will be understood that this is merely exemplary, and that various modifications and variations of the embodiments are possible therefrom by those of ordinary skill in the art. However, such modifications should be considered to be within the technical protection scope of the present specification. Accordingly, the true technical protection scope of the present specification should be defined to include other implementations, other embodiments, and equivalents to the claims by the spirit of the appended claims.
본 명세서는 발신자 단말의 요청을 인공지능을 통해 분석하여 요청에 대응되는 응답을 생성하여 제공함으로서 유연한 응답을 제공하는 이점이 있으며 산업상 이용 가능하다.The present specification has the advantage of providing a flexible response by generating and providing a response corresponding to the request by analyzing the request of the sender terminal through artificial intelligence, and can be used in industry.

Claims (10)

  1. 음성 통화를 통해 질의 응답을 수행하는 제 1 단말의 동작 방법에 있어서,In the operating method of the first terminal performing a question and answer through a voice call,
    제 2 단말로부터 음성 통화를 수신하고, 자동 연결을 수행하는 단계;receiving a voice call from a second terminal and performing automatic connection;
    상기 자동 연결이 수행된 후 상기 제 2 단말로부터 제 1 질의 요청 메시지를 수신하는 단계;receiving a first query request message from the second terminal after the automatic connection is performed;
    상기 제 1 질의 요청 메시지에 기초한 제 2 질의 요청 메시지를 AI(Artificial Intelligence) 서버로 전송하는 단계;transmitting a second query request message based on the first query request message to an artificial intelligence (AI) server;
    상기 AI 서버로부터 상기 제 2 질의 요청 메시지에 기초한 제 1 질의 응답 메시지를 수신하는 단계; 및receiving a first query response message based on the second query request message from the AI server; and
    상기 제 1 질의 응답 메시지에 기초한 제 2 질의 응답 메시지를 상기 제 2 단말로 전달하는 단계;를 포함하는, 제 1 단말의 동작 방법.and transmitting a second query response message based on the first query response message to the second terminal.
  2. 제 1 항에 있어서,The method of claim 1,
    상기 제 1 질의 요청 메시지는 상기 음성 통화에 기초하여 음성으로 상기 제 1 단말로 전달되고,The first query request message is transmitted to the first terminal by voice based on the voice call,
    상기 제 1 단말이 상기 AI 서버로 전달하는 상기 제 2 질의 요청 메시지는 상기 제 1 질의 요청 메시지에 STT(Speech To Text) 처리를 수행하여 전환된 텍스트 정보 및 상기 제 1 질의 요청 메시지에 기초하여 생성된 음성 파일 정보 중 적어도 어느 하나를 포함하는, 제 1 단말의 동작 방법.The second query request message delivered by the first terminal to the AI server is generated based on text information converted by STT (Speech To Text) processing on the first query request message and the first query request message. A method of operating a first terminal, including at least one of the voice file information.
  3. 제 2 항에 있어서,3. The method of claim 2,
    상기 AI 서버가 상기 제 1 단말로 전달하는 상기 제 1 질의 응답 메시지는 상기 제 2 질의 요청 메시지에 기초하여 생성되는 텍스트 정보 및 상기 제 2 질의 요청 메시지에 기초하여 생성되는 음성 파일 정보 중 적어도 어느 하나를 포함하고,The first query response message delivered by the AI server to the first terminal is at least one of text information generated based on the second query request message and voice file information generated based on the second query request message. including,
    상기 제 1 단말은 상기 AI 서버로부터 수신한 상기 제 1 질의 응답 메시지에 기초하여 상기 제 2 질의 응답 메시지를 생성하고, 상기 생성된 제 2 질의 응답 메시지를 상기 음성 통화에 기초하여 음성으로 상기 제 2 단말로 제공하는, 제 1 단말의 동작 방법.The first terminal generates the second query response message based on the first query response message received from the AI server, and uses the generated second query response message as a voice based on the voice call. A method of operating the first terminal, provided to the terminal.
  4. 제 1 항에 있어서,The method of claim 1,
    상기 제 2 단말로 상기 음성 통화를 데이터 통화로 전환하는 요청 메시지를 전송하는 단계;transmitting a request message for converting the voice call into a data call to the second terminal;
    상기 제 2 단말부터 상기 요청 메시지에 대한 응답으로 수락 메시지를 수신하는 단계; 및receiving an acceptance message in response to the request message from the second terminal; and
    상기 수락 메시지에 기초하여 상기 음성 통화를 상기 데이터 통화로 전환하는 단계;를 더 포함하는, 제 1 단말의 동작 방법.Converting the voice call to the data call based on the acceptance message; further comprising, the operating method of the first terminal.
  5. 제 4 항에 있어서,5. The method of claim 4,
    상기 제 2 단말과 자동 연결이 수행된 후 기 설정된 시간이 도과하는지 여부를 판단하는 단계;를 더 포함하되,Further comprising; determining whether a preset time has elapsed after the automatic connection with the second terminal is performed;
    상기 제 2 단말과 자동 연결이 수행된 후 상기 설정된 시간이 도과하면 상기 요청 메시지를 상기 제 2 단말로 전송하는, 제 1 단말의 동작 방법.When the set time elapses after the automatic connection with the second terminal is performed, the request message is transmitted to the second terminal, the operating method of the first terminal.
  6. 제 4 항에 있어서,5. The method of claim 4,
    상기 제 1 단말이 데이터 처리 능력에 기초하여 상기 데이터 통화 전환 필요 여부를 판단하는 단계;를 더 포함하되,Determining whether the data call conversion is necessary based on the data processing capability of the first terminal; further comprising,
    상기 제 1 단말이 상기 데이터 처리 능력에 기초하여 상기 데이터 통화 전환이 필요하다고 판단한 경우, 상기 요청 메시지를 상기 제 2 단말로 전송하는, 제 1 단말의 동작 방법.When the first terminal determines that the data call conversion is necessary based on the data processing capability, transmitting the request message to the second terminal.
  7. 제 4 항에 있어서,5. The method of claim 4,
    상기 데이터 통화는 제 3 메신저 플랫폼에 기초하여 수행되되,The data call is performed based on a third messenger platform,
    상기 데이터 통화는 상기 제 1 단말의 상기 제 3 메신저 플랫폼에서의 식별 정보 및 상기 제 2 단말의 상기 제 3 메신저 플랫폼에서의 식별 정보에 기초하여 수행되는, 제 1 단말의 동작 방법.The method of operating the first terminal, wherein the data call is performed based on identification information in the third messenger platform of the first terminal and identification information in the third messenger platform of the second terminal.
  8. 제 7 항에 있어서,8. The method of claim 7,
    상기 제 1 단말이 상기 제 3 메신저 플랫폼에 기초하여 상기 데이터 통화를 수행하는 경우, 상기 제 3 메신저 플랫폼으로 데이터 통화 제공 요청 메시지를 전송하는 단계; 및transmitting a data call provision request message to the third messenger platform when the first terminal performs the data call based on the third messenger platform; and
    상기 제 3 메신저 플랫폼으로부터 상기 데이터 통화에 대한 수락 메시지를 수신하는 단계;를 더 포함하고,Receiving an acceptance message for the data call from the third messenger platform; further comprising,
    상기 수락 메시지가 수신되면 상기 제 3 메신저 플랫폼에 기초하여 상기 데이터 통화가 수행되는, 제 1 단말의 동작 방법.When the acceptance message is received, the data call is performed based on the third messenger platform.
  9. 제 1 항에 있어서,The method of claim 1,
    상기 자동 연결이 수행된 후 상기 제 1 단말과 관련된 적어도 어느 하나의 관련 콘텐츠 정보를 상기 제 2 단말로 전송하는 단계;transmitting at least one piece of related content information related to the first terminal to the second terminal after the automatic connection is performed;
    상기 적어도 어느 하나의 관련 콘텐츠 정보에 기초하여 상기 제 2 단말이 선택한 관련 콘텐츠 정보를 수신하는 단계;를 더 포함하되,Receiving the related content information selected by the second terminal based on the at least one piece of related content information;
    상기 제 1 질의 요청 메시지는 상기 제 2 단말에 의해 선택된 상기 관련 콘텐츠 정보에 기초하여 생성되는, 제 1 단말의 동작 방법.The method of operating the first terminal, wherein the first query request message is generated based on the related content information selected by the second terminal.
  10. 하드웨어와 결합되어 제 1항 내지 제9항 중 어느 한 항에 따른 동작 방법을 실행하도록 컴퓨터로 판독 가능한 매체에 저장된 컴퓨터 프로그램.A computer program stored in a computer-readable medium to be combined with hardware to execute the method according to any one of claims 1 to 9.
PCT/KR2021/016688 2020-12-16 2021-11-16 Method and device for providing artificial intelligence assistant service through voice call WO2022131576A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0176554 2020-12-16
KR1020200176554A KR102426288B1 (en) 2020-12-16 2020-12-16 Method and apparatus for providing artificial intelligence assistant service using voice call

Publications (1)

Publication Number Publication Date
WO2022131576A1 true WO2022131576A1 (en) 2022-06-23

Family

ID=82057798

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/016688 WO2022131576A1 (en) 2020-12-16 2021-11-16 Method and device for providing artificial intelligence assistant service through voice call

Country Status (2)

Country Link
KR (1) KR102426288B1 (en)
WO (1) WO2022131576A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160247068A1 (en) * 2013-11-01 2016-08-25 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
KR20190103502A (en) * 2018-02-12 2019-09-05 보리 주식회사 AI helper and phone monitoring system corresponding to telephone order during telephone call for delivery restaurant and its method
KR20190124877A (en) * 2018-04-27 2019-11-06 경희대학교 산학협력단 Apparatus and method for providing query-response service related to funeral process
KR20200092259A (en) * 2019-01-24 2020-08-03 주식회사 브리지텍 System and method for issuing certificate based on non-face-to-face identity verification
KR20200092499A (en) * 2019-01-11 2020-08-04 주식회사 하나은행 Method and apparatus for counseling support using interactive artificial intelligence technology

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102194616B1 (en) 2017-04-03 2020-12-23 주식회사 아이큐브온 Mobile Terminal for Providing ARS and Method for Providing ARS in Mobile Terminal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160247068A1 (en) * 2013-11-01 2016-08-25 Tencent Technology (Shenzhen) Company Limited System and method for automatic question answering
KR20190103502A (en) * 2018-02-12 2019-09-05 보리 주식회사 AI helper and phone monitoring system corresponding to telephone order during telephone call for delivery restaurant and its method
KR20190124877A (en) * 2018-04-27 2019-11-06 경희대학교 산학협력단 Apparatus and method for providing query-response service related to funeral process
KR20200092499A (en) * 2019-01-11 2020-08-04 주식회사 하나은행 Method and apparatus for counseling support using interactive artificial intelligence technology
KR20200092259A (en) * 2019-01-24 2020-08-03 주식회사 브리지텍 System and method for issuing certificate based on non-face-to-face identity verification

Also Published As

Publication number Publication date
KR102426288B1 (en) 2022-07-29
KR20220086262A (en) 2022-06-23

Similar Documents

Publication Publication Date Title
WO2012033340A2 (en) Method and system for bluetooth communication
CN101917586B (en) Joining method and equipment for conference
WO2014112754A1 (en) Web service push method and web service push server and web service providing server performing same
WO2014035094A1 (en) System and method for providing additional information to mobile communication terminal during call attempts
WO2014185711A1 (en) Method and system for providing call center service through web
WO2014073935A1 (en) Method and system for sharing an output device between multimedia devices to transmit and receive data
CN106105158B (en) For establishing the method and system of connection between searchers's device and destination apparatus
WO2014175603A1 (en) Method and server for providing music contents use services
WO2016028113A1 (en) Electronic device and call-forwarding control method thereof
WO2017018688A1 (en) Method for distributing work in personal secretary service using text message
WO2014014229A1 (en) System for providing contact number information having added search function, and method for same
WO2013032281A2 (en) Electronic apparatus and method for transferring contents on cloud system to device connected to dlna
WO2020085539A1 (en) Method for establishing peer to peer service session over infrastructure link
WO2018105867A1 (en) Server for providing cloud service and operating method thereof
WO2022131576A1 (en) Method and device for providing artificial intelligence assistant service through voice call
WO2022225285A1 (en) Method and device for analyzing and recommending schedules by using artificial intelligence
WO2017168302A1 (en) System and methods for providing at least one service to a user device through a multimedia gateway
WO2011118915A2 (en) Application search system
WO2014168407A1 (en) System for transmitting heterogeneous network-linked data and method therefor
WO2021251761A1 (en) Non-contact universal remote platform providing system using avatar robot
WO2013100484A1 (en) User terminal and method for sharing data between applications thereof
WO2015174644A1 (en) System for providing advertisement to user terminal through wireless router and advertisement service providing server
CN113055350B (en) Data transmission method, device, equipment and readable storage medium
WO2019179141A1 (en) Intelligent terminal, wireless network sharing method, and storage medium
CN112383904A (en) Pair-free quick peripheral calling method and device

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21906881

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21906881

Country of ref document: EP

Kind code of ref document: A1