WO2022039433A1 - 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법 - Google Patents

대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법 Download PDF

Info

Publication number
WO2022039433A1
WO2022039433A1 PCT/KR2021/010575 KR2021010575W WO2022039433A1 WO 2022039433 A1 WO2022039433 A1 WO 2022039433A1 KR 2021010575 W KR2021010575 W KR 2021010575W WO 2022039433 A1 WO2022039433 A1 WO 2022039433A1
Authority
WO
WIPO (PCT)
Prior art keywords
text
conversation
information
score
type
Prior art date
Application number
PCT/KR2021/010575
Other languages
English (en)
French (fr)
Inventor
윤상혁
송희준
목정호
송재민
유희재
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to US17/441,766 priority Critical patent/US20220309231A1/en
Publication of WO2022039433A1 publication Critical patent/WO2022039433A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Definitions

  • the present disclosure relates to an electronic device for generating summary information for conversation text, and a method of operating the same.
  • Steping with the customer may be conducted in a variety of ways.
  • customer consultation may be performed not only by telephone consultation but also by chatting consultation using a chatting method.
  • the chatting consultation can be performed in real time by exchanging text messages between the customer and the agent, and there is an advantage that the agent can consult with a large number of customers at the same time.
  • the disclosed embodiments are intended to solve the above-described problem, and provide an electronic device for generating summary information for a conversation text and an operating method thereof.
  • the disclosed embodiments may provide a non-transitory computer-readable recording medium in which a program for executing the method in a computer is recorded.
  • the technical problem to be solved is not limited to the technical problems as described above, and other technical problems may exist.
  • an embodiment disclosed is a method of generating summary information for a conversation text in an electronic device, at least one dialog text extracted from at least one conversation text for a previous conversation obtaining a first summary text; extracting, from the conversation text for the current conversation, at least one second summary text; identifying a summary text of the at least one first summary text having the same type as a type of the at least one second abstract text; adjusting a score indicative of accuracy for the identified summary text; and selecting, from among the at least one first summary text and the second summary text, each summary text corresponding to at least one preset type, based on a score for each summary text; and generating the summary information based on the selected summary text.
  • the disclosed embodiment provides an electronic device for generating summary information on a conversation text, comprising: a memory for storing at least one first summary text extracted from at least one conversation text for a previous conversation; extracting at least one second summary text from the dialogue text for the current dialogue, and identifying a summary text having the same type as the type of the at least one second summary text among the at least one first summary text; Adjust a score indicating accuracy for the identified abstract text, and among the at least one first summary text and the second summary text, based on the score for each summary text, a summary corresponding to at least one preset type, respectively at least one processor for selecting text and generating the summary information based on the selected summary text; and an output unit for outputting the summary information.
  • the disclosed embodiment may provide a computer-readable recording medium in which a program for performing the method of the first aspect is stored.
  • FIG. 1 is a block diagram illustrating an example of generating summary information for a dialogue text according to various embodiments of the present disclosure
  • FIG. 2 is a block diagram illustrating an example of generating summary information according to various embodiments of the present disclosure
  • FIG. 3 is a block diagram illustrating an example of a configuration of an electronic device according to various embodiments of the present disclosure
  • FIG. 4 is a block diagram illustrating an example of a configuration of an electronic device according to various embodiments of the present disclosure
  • FIG. 5 is a flowchart illustrating an example of a method of generating summary information for a conversation text according to various embodiments of the present disclosure
  • FIG. 6 is a diagram illustrating an example of summary information according to various embodiments of the present disclosure.
  • FIG. 7 is a diagram illustrating an example of summary information according to various embodiments of the present disclosure.
  • FIG. 8 is a diagram illustrating an example of providing summary information to a user according to various embodiments of the present disclosure
  • the expression “at least one of a, b or c” means “a”, “b”, “c”, “a and b”, “a and c”, “b and c”, “a, b” and c all", or variations thereof.
  • a processor may include one or a plurality of processors.
  • one or a plurality of processors include a general-purpose processor such as a central processing unit (CPU), a dedicated processor, an application processor (AP), a digital signal processor (DSP), and the like, a GPU, and a graphics such as a VPU (Vision Processing Unit). It may be a dedicated processor, an NPU, or an artificial intelligence dedicated processor like that.
  • One or a plurality of processors process input data according to a predefined operation rule or artificial intelligence model stored in the memory.
  • the AI-only processor may be designed with a hardware structure specialized for processing a specific AI model.
  • a predefined action rule or artificial intelligence model can be created through learning.
  • a predefined action rule or artificial intelligence model is created through training, the basic artificial intelligence model is learned using a plurality of learning data by a learning algorithm, thereby Behavioral rules or artificial intelligence models can be created.
  • Such learning may be performed in the device itself on which artificial intelligence according to the present disclosure is performed, or may be performed through a separate server and/or system.
  • examples of the learning algorithm include supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but limited to the above example doesn't happen
  • the artificial intelligence model may be composed of a plurality of neural network layers.
  • Each of the plurality of neural network layers has a plurality of weight values, and a neural network operation is performed through an operation between the operation result of a previous layer and the plurality of weights.
  • the plurality of weights of the plurality of neural network layers may be optimized by the learning result of the artificial intelligence model. For example, a plurality of weights may be updated so that a loss value or a cost value obtained from the artificial intelligence model during the learning process is reduced or minimized.
  • the artificial neural network may include a deep neural network (DNN), for example, a Convolutional Neural Network (CNN), a Deep Neural Network (DNN), a Recurrent Neural Network (RNN), a Restricted Boltzmann Machine (RBM), There may be a Deep Belief Network (DBN), a Bidirectional Recurrent Deep Neural Network (BRDNN), or a Deep Q-Networks, but is not limited thereto.
  • DNN Deep Neural Network
  • DNN Deep Belief Network
  • BBDNN Bidirectional Recurrent Deep Neural Network
  • Deep Q-Networks Deep Q-Networks
  • FIG. 1 is a block diagram illustrating an example of generating summary information for a dialogue text according to various embodiments of the present disclosure
  • the electronic device 1000 extracts a summary text 120 from a dialogue text 110 , and based on the extracted summary text 120 and the dialogue text 110 , , it is possible to generate 130 summary information.
  • the summary information according to an embodiment is provided to a user of the electronic device 1000, for example, a counselor who conducts chatting consultation, the counselor can easily grasp the contents of the chatting consultation conducted with the customer through the summary information.
  • the electronic device 1000 may be implemented in various forms.
  • the electronic device 1000 described herein may include a digital camera, a smart phone, a laptop computer, a tablet PC, an electronic book terminal, a digital broadcasting terminal, and a personal digital assistant (PDA). , a Portable Multimedia Player (PMP), a navigation system, an MP3 player, a vehicle, and the like, but is not limited thereto.
  • PDA personal digital assistant
  • PMP Portable Multimedia Player
  • the electronic device 1000 described herein may be a wearable device that can be worn by a user.
  • a wearable device is an accessory-type device (e.g., watch, ring, wristband, ankle band, necklace, eyeglasses, contact lens), a head-mounted-device (HMD), a fabric or clothing-integrated device (e.g., electronic clothing), a body attachable device (eg, a skin pad), or a bioimplantable device (eg, an implantable circuit).
  • HMD head-mounted-device
  • a fabric or clothing-integrated device e.g., electronic clothing
  • a body attachable device eg, a skin pad
  • a bioimplantable device eg, an implantable circuit
  • Conversation text 110 may include message conversation content between a plurality of users.
  • Conversation text 110 according to an embodiment is not limited to message conversation, and may include conversation content converted into text by voice recognition of voice conversation.
  • the conversation text 110 may be generated for each conversation window created for each conversation partner. Accordingly, the summary information 130 according to an embodiment may be generated for each chat window. For example, when the counselor conducts chatting consultation with several customers at the same time, the content of the message conversation progressed for each customer may be respectively generated as the conversation text 110 . In addition, summary information 130 for each conversation text 110 may be generated and provided to the user.
  • Conversation text 110 is not limited to the chatting consultation by the counselor, and may also include a chatting message by the chatting consultation by the chatbot.
  • the conversation text 110 is not limited to the content of the message conversation performed between a plurality of users, and may also include the content of the message conversation generated by the chatbot system that automatically generates the conversation message.
  • the counselor performing the chatting consultation can quickly and easily grasp the contents of the chatting consultation performed first by receiving the summary information 130 generated for the chatting consultation by the chatbot.
  • the summary text 120 may be obtained by extracting a name or topic of a preset type from the conversation text 110 .
  • the summary text 120 may include a name or a subject extracted from the conversation text 110 for each at least one preset type.
  • the type according to an embodiment may be set as a type from which an entity or topic having high importance among the conversation text 110 can be extracted.
  • the product name and the date of purchase in the conversation contents may be extracted as important information.
  • the product name and purchase date may be preset as types for the summary text 120 so that the high importance product name and purchase date can be extracted from the conversation conversation text 110 .
  • various types such as product name, purchase date, serial number, conversation topic, inquiry type, problem solving, and consultation satisfaction may be preset for extraction of the summary text 120 .
  • the summary text 120 is to be extracted from the conversation text 110 for each type using a pre-trained artificial intelligence model, for example, a natural language understanding model (NLU).
  • NLU natural language understanding model
  • a characteristic of each text included in the dialogue text 110 may be extracted, and a text corresponding to a preset type among the texts of the dialogue text 110 is identified based on the extracted characteristic.
  • the identified text may be obtained as a name or subject corresponding to each type.
  • the summary information 130 may be generated based on the conversation text 110 and the summary text 120 .
  • the summary information 130 may include at least one of a summary form and a summary text.
  • the summary form according to an embodiment may include information about the summary text 120 respectively corresponding to each preset type.
  • the summary sentence according to an embodiment may include at least one sentence generated by summarizing the conversation text 110 .
  • the summary text may be generated to include the summary text 120 .
  • the summary text 120 may include a name or topic having high importance, the summary text may be generated to include the summary text 120 .
  • the summary information 130 may include various types of information in which the conversation text 110 is summarized.
  • At least one of the abstract text extraction 120 and the generation 130 of the summary information may be performed in real time whenever the conversation text 110 is obtained.
  • a new conversation text 110 may be continuously acquired, and whenever a new conversation text 110 is acquired, the abstract text extraction 120 and generation of summary information ( 130) may be repeatedly performed.
  • the electronic device 1000 may further use a server (not shown) to generate summary information based on conversation text.
  • the server may be implemented as at least one computer device.
  • the server may be distributed in the form of a cloud, and may provide commands, codes, files, contents, and the like.
  • the server may perform operations that the electronic device 1000 may execute. For example, the server (not shown) obtains the dialog text 110 based on the dialog-related information received from the electronic device 1000 , generates summary information on the dialog text 110 , and sends it to the electronic device 1000 . can send Without being limited to the above-described example, the server (not shown) may perform various operations for the electronic device 1000 to generate summary information according to an embodiment, and transmit the result to the electronic device 1000 .
  • FIG. 2 is a block diagram illustrating an example of generating summary information according to various embodiments of the present disclosure
  • the electronic device 1000 may generate summary information based on a summary text obtained for a previous conversation and a summary text obtained for a current conversation.
  • a summary text having the same type as the summary text obtained for the current conversation among the summary texts obtained for the previous conversation may exist.
  • a summary text of the same type as that of the previously extracted summary text may be obtained.
  • a model name mentioned by the customer in a previous conversation may be repeated in the current conversation, and another model name may be mentioned again.
  • the summary information 130 generated based on the content of the previous conversation may be modified to reflect the content of the current conversation.
  • the summary information 130 including information related to the model name mentioned in the previous conversation may be modified to include the model name mentioned in the current conversation by reflecting the contents of the current conversation.
  • the summary information 130 preferably includes one summary text for each type. Accordingly, when each summary text is obtained, a score indicating accuracy for each summary text may be determined together, and based on the score, the summary text to be used to generate the summary information 130 will be selected for each type.
  • the score according to an embodiment may be determined based on probability information of the extracted summary text based on the characteristics of the dialogue text. For example, as the dialogue text from which the summary text is extracted has a higher probability value as it has more features corresponding to the summary text, the score of the summary text may be determined to be a large value. On the other hand, as the dialogue text from which the summary text is extracted has fewer features corresponding to the summary text and has a smaller probability value, the score of the summary text may be determined to be a small value.
  • the score according to an embodiment may be obtained based on the characteristics of the dialogue text in sentence units including the summary text. Without being limited to the above-described example, the score may be obtained based on various ranges of dialogue text from which the summary text was extracted.
  • the score according to an embodiment is not limited to the dialogue text used for extracting the summary text, and may be modified based on at least one dialogue text adjacent to the dialogue text.
  • the score for the current summary text is at least one dialogue text corresponding to the previous dialogue and the subsequent dialogue text. It may be modified based on at least one dialogue text corresponding to the dialogue. Accordingly, the score may be further modified after the subsequently conducted conversation is ended, for example, after all the conversations are finished, based on the subsequently performed conversation and the previous conversation.
  • the score according to an embodiment is further modified based on not only the dialogue text for the current dialogue, but also the dialogue text for the previous dialogue and the subsequent dialogue, so that the contextual flow based on the previous dialogue and the subsequent dialogue is further reflected
  • a score value may be obtained. For example, when the summary text includes content that does not fit the contextual flow, a lower score value may be determined for the summary text.
  • the final score for each summary text may be finally determined based on the first score and the second score obtained for each summary text.
  • the first score may include an adjusted score as a summary text having the same type is newly extracted.
  • the second score may include a score obtained by further reflecting a contextual flow based on a previous conversation and a subsequent conversation.
  • a final score value for each summary text may be determined based on a value obtained by multiplying the first score and the second score.
  • the final score value for the summary text may be obtained according to various methods, based on the first score and the second score.
  • a summary text corresponding to each preset type may be selected according to the final score value, and summary information may be generated based on the selected summary text.
  • the first summary text 220 may include the summary text 210 extracted from at least one previously performed dialogue text. From among the first summary text 220 according to an embodiment, a summary text having the same type as that of the second summary text 240 extracted from the currently performed dialogue text 230 may be identified.
  • the score of the abstract text identified in the first summary text 220 may be adjusted at 250 by the second summary text 240 .
  • the score of the first summary text 220 is a lower value as a summary text having the same type is extracted from the currently performed dialogue text 230, for example, preset (eg, a current value). For example, it can be adjusted to have a value as small as a specified) constant value. This is because the recently mentioned conversation content is regarded as more accurate than the previous conversation content, and the score of the first summary text 220 extracted from the previous conversation is adjusted to be lower.
  • the present invention is not limited to the above-described example, and even if the score of the first summary text 220 is adjusted to be low, when the score of the second summary text 240 is relatively lower, the score of the first summary text 220 . may have a value greater than the score of the second summary text 240 .
  • the summary information 130 may be generated based on the score of each summary text.
  • at least one summary text selected based on a score may exist.
  • the summary information 130 may be generated based on the summary text selected for each type based on the score. For example, the summary text having the highest score for each type may be selected, and the summary information 130 may be generated based on the selected summary text.
  • the score adjustment 250 of the summary text may be performed. Accordingly, according to an embodiment, whenever the score adjustment 250 is performed, the summary text may be reselected for each type, and the summary information 130 may be generated according to the reselected summary text. For example, in the current conversation, as the model name is reversed, the summary text selected for the model name type may be changed, and the summary information 130 may be generated according to the differently selected summary text.
  • FIG. 3 is a block diagram illustrating an example of a configuration of an electronic device according to various embodiments of the present disclosure
  • FIG. 4 is a block diagram illustrating an example of a configuration of an electronic device according to various embodiments of the present disclosure
  • the electronic device 1000 includes a processor 1300 (eg, including an arithmetic circuit), an output unit 1200 (eg, including an output circuit), and a memory 1700 .
  • a processor 1300 eg, including an arithmetic circuit
  • an output unit 1200 eg, including an output circuit
  • a memory 1700 may include However, not all of the components shown in FIG. 3 are essential components of the electronic device 1000 .
  • the electronic device 1000 may be implemented by more components than those illustrated in FIG. 3 , or the electronic device 1000 may be implemented by fewer components than those illustrated in FIG. 3 .
  • the electronic device 1000 includes a processor 1300 and an output unit 1200 (eg, an output circuit). ) and memory 1700 in addition to a user input unit 1100 (eg, including an input circuit), a sensing unit 1400, a communication unit 1500 (eg, including a communication circuit) and audio/video ( An A/V) input unit 1600 (eg, including an A/V input circuit) may be further included.
  • a user input unit 1100 eg, including an input circuit
  • a sensing unit 1400 eg, a communication unit 1500
  • An A/V input unit 1600 eg, including an A/V input circuit
  • the user input unit 1100 includes means for a user to input data for controlling the electronic device 1000 , for example, various input circuits are included.
  • the user input unit 1100 includes a key pad, a dome switch, and a touch pad (contact capacitive method, pressure resistance film method, infrared sensing method, surface ultrasonic conduction method, integral type).
  • a tension measurement method a piezo effect method, etc.
  • a jog wheel a jog switch, and the like, but is not limited thereto.
  • the user input unit 1100 may receive a user input for generating summary information about the conversation text.
  • the user input unit 1100 may receive a user input for inputting conversation text.
  • the output unit 1200 may include various output circuits, may output an audio signal, a video signal, a vibration signal, etc., and the output unit 1200 may include a display unit 1210 (eg, a display). ), a sound output unit 1220 (eg, a sound output circuit is included), and a vibration motor 1230 .
  • the display unit 1210 may include a display that displays and outputs information processed by the electronic device 1000 . According to an embodiment, the display 1210 may output summary information generated with respect to the conversation text.
  • the display unit 1210 may be used as an input device in addition to an output device.
  • the display unit 1210 includes a liquid crystal display, a thin film transistor-liquid crystal display, an organic light-emitting diode, a flexible display, a three-dimensional display ( 3D display) and electrophoretic display (electrophoretic display) may include at least one. Also, depending on the implementation form of the electronic device 1000 , the electronic device 1000 may include two or more display units 1210 .
  • the sound output unit 1220 may include various output circuits, and may output audio data received from the communication unit 1500 or stored in the memory 1700 .
  • the vibration motor 1230 may output a vibration signal. Also, the vibration motor 1230 may output a vibration signal when a touch is input to the touch screen. According to an embodiment, the sound output unit 1220 and the vibration motor 1230 may output information related to summary information generated with respect to the dialogue text.
  • the processor 1300 may include various arithmetic circuits and may generally control the overall operation of the electronic device 1000 .
  • the processor 1300 executes programs stored in the memory 1700 , and thus the user input unit 1100 , the output unit 1200 , the sensing unit 1400 , the communication unit 1500 , and the A/V input unit 1600 . ), etc., can be controlled in general.
  • the electronic device 1000 may include at least one processor 1300 .
  • the electronic device 1000 may include various types of processors, such as a central processing unit (CPU), a dedicated processor, a graphics processing unit (GPU), and a neural processing unit (NPU), but is not limited thereto.
  • CPU central processing unit
  • GPU graphics processing unit
  • NPU neural processing unit
  • the processor 1300 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations.
  • the command may be provided to the processor 1300 from the memory 1700 or may be received through the communication unit 1500 and provided to the processor 1300 .
  • the processor 1300 may be configured to execute instructions according to program codes stored in a recording device such as a memory.
  • the processor 1300 may obtain a first summary text extracted from at least one dialogue text for a previously conducted dialogue and a second summary text extracted from a dialogue text for a currently conducted dialogue. there is.
  • the processor 1300 may identify a summary text having the same type as that of the second summary text from among the at least one first summary text.
  • the processor 1300 may adjust a score indicating accuracy with respect to the identified summary text among the first summary texts.
  • the score may be adjusted to have a value smaller than the current value by a preset constant value. Accordingly, the probability that the first summary text extracted from the previous conversation will be included in the summary information may decrease as the accuracy of the first summary text extracted from the current conversation of the same type is lowered as the second summary text extracted from the current conversation of the same type is extracted.
  • the processor 1300 selects a summary text respectively corresponding to at least one preset type based on a score indicating accuracy for each of the first summary text and the second summary text, and selects the selected summary Summary information may be generated based on the text. For example, for each type, based on the score, one summary text may be selected, and based on the selected summary text, summary information may be generated.
  • the sensing unit 1400 may detect a state of the electronic device 1000 or a state around the electronic device 1000 , and transmit the sensed information to the processor 1300 .
  • the sensing unit 1400 includes a geomagnetic sensor 1410 , an acceleration sensor 1420 , a temperature/humidity sensor 1430 , an infrared sensor 1440 , a gyroscope sensor 1450 , and a position sensor. (eg, GPS) 1460 , a barometric pressure sensor 1470 , a proximity sensor 1480 , and/or an RGB sensor (illuminance sensor) 1490 may include, but is not limited thereto.
  • a score value indicating the accuracy of the summary text may be determined based on the information sensed by the sensing unit 1400 .
  • the score of the summary text may be determined based on the characteristics of the dialogue text from which the summary text is extracted, but is not limited thereto, and is based on various information detected by the sensing unit 1400 in relation to the dialogue text. Based on it, it may be determined. Without being limited to the above example, the score of the summary text may be determined according to various methods.
  • the communication unit 1500 may include one or more components that allow the electronic device 1000 to communicate with the server 2000 or an external device (not shown).
  • the communication unit 1500 may include various units or modules each including various communication circuits, such as, for example, a short-distance communication unit 1510, a mobile communication unit 1520, and a broadcast receiving unit 1530. .
  • Short-range wireless communication unit 1510 Bluetooth communication unit, BLE (Bluetooth Low Energy) communication unit, short-range wireless communication unit (Near Field Communication unit), WLAN (Wi-Fi) communication unit, Zigbee (Zigbee) communication unit, infrared ( It may include an IrDA, infrared Data Association (not shown) communication unit, a Wi-Fi Direct (WFD) communication unit, an ultra wideband (UWB) communication unit, an Ant+ communication unit, and the like, but is not limited thereto.
  • BLE Bluetooth Low Energy
  • WLAN Wi-Fi
  • Zigbee Zigbee
  • IrDA infrared Data Association
  • WFD Wi-Fi Direct
  • UWB ultra wideband
  • Ant+ communication unit an Ant+ communication unit
  • the mobile communication unit 1520 transmits/receives a radio signal to and from at least one of a base station, an external terminal, and a server on a mobile communication network.
  • the wireless signal may include various types of data according to transmission/reception of a voice call signal, a video call signal, or a text/multimedia message.
  • the broadcast receiver 1530 receives a broadcast signal and/or broadcast-related information from the outside through a broadcast channel.
  • the broadcast channel may include a satellite channel and a terrestrial channel.
  • the electronic device 1000 may not include the broadcast receiver 1530 .
  • the communication unit 1500 may transmit/receive at least one message to and from an external device. Also, the communication unit 1500 may transmit/receive voice data for performing a call.
  • the communication unit 1500 may transmit/receive information necessary to generate summary information on the conversation text.
  • the communication unit 1500 may transmit and receive a conversation message corresponding to the conversation text to the outside.
  • the A/V (Audio/Video) input unit 1600 may include various A/V input circuits for inputting an audio signal or a video signal, a camera 1610 , a microphone 1620 , and the like.
  • the camera 1610 may obtain an image frame such as a still image or a moving image through an image sensor in a video call mode or a shooting mode.
  • the image captured through the image sensor may be processed through the processor 1300 or a separate image processing unit (not shown).
  • the microphone 1620 receives an external sound signal and processes it as electrical voice data.
  • the microphone 1620 may receive a voice input of a user conducting a conversation.
  • the memory 1700 may store a program for processing and control of the processor 1300 , and may also store data input to or output from the electronic device 1000 .
  • the memory 1700 may store at least one summary text extracted for a previous conversation.
  • the memory 1700 may store summary information generated with respect to the conversation text, according to an embodiment.
  • the memory 1700 may include a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (eg, SD or XD memory), and a RAM.
  • RAM Random Access Memory
  • SRAM Static Random Access Memory
  • ROM Read-Only Memory
  • EEPROM Electrically Erasable Programmable Read-Only Memory
  • PROM Programmable Read-Only Memory
  • magnetic memory magnetic disk
  • magnetic disk may include at least one type of storage medium among optical disks.
  • Programs stored in the memory 1700 may be classified into a plurality of modules according to their functions, for example, a user interface (UI) module 1710 , a touch screen module 1720 , and a notification module 1730 . ) can be classified as
  • the UI module 1710 may provide a specialized UI, GUI, etc. interworking with the electronic device 1000 for each application.
  • the touch screen module 1720 may detect a touch gesture on the user's touch screen and transmit information about the touch gesture to the processor 1300 .
  • the touch screen module 1720 according to some embodiments may recognize and analyze a touch code.
  • the touch screen module 1720 may be configured as separate hardware including a controller.
  • Various sensors may be provided inside or near the touch screen to detect a touch or a proximity touch of the touch screen.
  • a sensor for detecting a touch of a touch screen there is a tactile sensor.
  • a tactile sensor refers to a sensor that senses a touch of a specific object to the extent or higher than that of a human being.
  • the tactile sensor may sense various information such as the roughness of the contact surface, the hardness of the contact object, and the temperature of the contact point.
  • the user's touch gesture may include tap, touch & hold, double tap, drag, pan, flick, drag and drop, swipe, and the like.
  • the notification module 1730 may generate a signal for notifying the occurrence of an event in the electronic device 1000 .
  • FIG. 5 is a flowchart illustrating an example of a method of generating summary information for a conversation text according to various embodiments of the present disclosure
  • the electronic device 1000 may obtain at least one first summary text extracted from at least one dialogue text for a previous conversation.
  • the at least one first summary text according to an embodiment may include at least one summary text obtained with respect to previous conversations.
  • the first summary text according to an embodiment may be the summary text stored in the memory 1700 whenever the summary text is extracted in the electronic device 1000 .
  • the electronic device 1000 may extract the second summary text from the conversation text for the current conversation.
  • the second summary text according to an embodiment may be obtained by extracting a name or topic from the conversation text for the current conversation for each preset type.
  • the type according to an embodiment is a type related to a summary text of high importance that can be used to generate the summary information 130 , for example, various types of types such as product name, customer name, purchase date, and consultation topic. It can be preset.
  • the electronic device 1000 may identify a summary text having the same type as that of the second summary text from among the at least one first summary text. According to an embodiment, it is highly likely that summary texts of the same type include incompatible information. Accordingly, it is preferable to generate the summary information 130 based on one summary text determined to have the highest accuracy among summary texts of the same type.
  • a summary text of the same type as that of a previously obtained summary text is extracted from the dialogue text for the current dialogue, a summary text for adjusting a score indicating the accuracy of each summary text may be identified.
  • step 540 the score of the identified summary text is adjusted to be lower, so that the abstract text extracted from the current conversation is more likely to be used to generate the summary information 130 .
  • a summary text of the same type as the summary text obtained in the previous conversation may be extracted, and the summary text of the current conversation is
  • the identified summary text is scored so that the abstract text extracted from the current conversation is more likely to be used in generating the summary information 130, viewed as containing more accurate content than the summary text of the previous conversation. can be adjusted.
  • the electronic device 1000 based on each score of the at least one first summary text and the at least one second summary text, summarizes each corresponding to a preset (eg, designated) type. You can select text. For example, for each type, the summary text having the highest score value may be selected.
  • the electronic device 1000 may generate summary information based on the selected summary text in operation 550 .
  • the summary information may include a summary form in which summary text is listed for each type.
  • the summary information may include a summary including at least one sentence generated based on the summary text. The above-described example is not limited, and summary information generated in various forms may be generated based on the summary text.
  • the generated summary information is provided to the user of the electronic device 1000 , so that the user can easily check summary information indicating the content of conversations that have been conducted so far.
  • Operations 510 to 560 may be performed whenever the second summary text for the current conversation is extracted as the conversation progresses. For example, whenever the second summary text for the current conversation is extracted, the score of the summary text identified among the first summary text is adjusted, based on the newly adjusted score, based on the selected summary text, summary information can be created.
  • the conversation text 610 of the conversation performed between the customer and the agent may be obtained in the order of 611 , 612 , and 613 , which is the order in which the conversation is performed.
  • summary information 620 may be generated. For example, from the first conversation text 611, a summary text of product name, purchase date, conversation topic, and inquiry type among preset types, "Galaxy Note 10", “2019-10", “battery discharge”, and “technical consultation” may be extracted.
  • the summary text according to an embodiment may be obtained as "Note 10" or "October last year”, which is the text included in the dialogue text 610, but is not limited thereto, and has the same meaning but is expressed differently, " It can also be obtained with the Galaxy Note 10", "2019-10".
  • the above-described example is not limited, and variously modified summary texts may be obtained based on the dialogue text 610 .
  • a summary text 622 may be further generated based on the summary text and the first dialogue text 611 .
  • a second dialogue text 612 may be additionally obtained.
  • the summary information 620 including at least one of the summary form 621 and the summary text 622 may be generated based on the newly acquired second conversation text 612 .
  • the summary information 620 generated based on the first dialogue text 612 is modified based on the second dialogue text 612, so that the summary information further based on the second dialogue text 612 ( 620) may be generated.
  • “unsolved” and “dissatisfied”, which are summary texts about whether a problem has been solved and a counseling satisfaction level among preset types, may be extracted.
  • the summary information 620 generated based on the first dialogue text 611 may not include information related to the summary text on whether the problem is solved and the consultation satisfaction level, but the second dialogue text 612 is obtained Accordingly, summary information 620 that further includes information related to a summary text on whether a problem has been solved and a consultation satisfaction level may be obtained.
  • a third dialogue text 613 may be additionally obtained.
  • the summary information 620 including at least one of the summary form 621 and the summary text 622 may be generated based on the newly acquired third dialogue text 613 .
  • the summary information 620 generated based on the first dialogue text 611 and the second dialogue text 612 is modified based on the third dialogue text 613, so that the third dialogue text ( Summary information 620 based further on 613 may be generated.
  • “01038948-1938020598502985” which is a summary text for a serial number among preset types, may be extracted from the third conversation text 613 .
  • the summary information 620 generated based on the first dialogue text 611 and the second dialogue text 612 may not include information related to the summary text for the serial number, but the third dialogue text ( As 613 ) is obtained, summary information 620 further including information related to a serial number may be obtained.
  • the summary text 622 may be generated based on at least one summary text included in the summary information 620 and the conversation text 610 .
  • the summary 622 may be generated after the conversation is finished, but is not limited thereto, and may be generated whenever the conversation text is generated.
  • FIG. 7 is a diagram illustrating an example of summary information according to various embodiments of the present disclosure.
  • summary information 1 720 and summary information 2 730 may be obtained.
  • “Galaxy Note 10” and “2018-10” may be obtained as summary texts based on the first conversation text 711 obtained first among the conversation texts 710 . Also, summary information 1 720 including the summary text may be obtained.
  • the second conversation text 712 may be obtained based on the conversation performed after the first conversation text 711 .
  • "Galaxy Note 8" may be obtained as a summary text from the second conversation text 712 according to an embodiment.
  • the score indicating the accuracy of the identified "Galaxy Note 10" may be adjusted to be lower so that the probability that the summary text obtained in the current conversation is selected as summary information increases.
  • icons 721 and 731 indicating the summary text with low accuracy are displayed.
  • summary information 1 720 or summary information 2 730 if there is a type in which the summary text is not obtained among the preset types, information indicating that the summary text is not obtained is additionally included for the type. can In addition, in summary information 1 720 or summary information 2 730 , when a plurality of summary texts obtained for any one type exist and the score values of each summary text are within a preset similarity range, the summary text Information indicating that correction is required may be additionally included.
  • the user checks the summary text with low accuracy or the need for correction, or the type in which the summary text is not obtained, in summary information 1 720 or summary information 2 730 , and directly summarizes information Summary information including summary text with high accuracy may be regenerated by modifying .
  • FIG. 8 is a diagram illustrating an example of providing summary information to a user according to various embodiments of the present disclosure
  • the electronic device 1000 may provide a conversation text 810 and summary information 820 on the conversation text 810 to the user.
  • tooltips 811 , 812 , and 813 may be displayed for a text part extracted as summary text from among the conversation text 810 .
  • the tooltips 811 , 812 , and 813 may include information about a type corresponding to the summary text. Accordingly, based on the tooltips 811 , 812 , and 813 , the user determines from which part of the dialogue text 810 the summary text of the summary information 820 is extracted and whether it is extracted as an appropriate type of summary text. can be checked easily.
  • the summary information 820 may include a summary form 821 and a summary text 822 .
  • the summary information 820 may further include a submit button 824 and an edit button 823 .
  • the counselor may check the summary information 820 , and as the edit button 823 is input, the summary information 820 may be further modified.
  • the submit button 824 is inputted by the counselor, the summary information 820 may be finally submitted to the outside.
  • the summary information 820 may be finally submitted by being delivered to an external server (not shown) for storing the contents of consultations with various customers.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • 'non-transitory storage medium' may mean a tangible device and only means that it does not include a signal (eg, electromagnetic wave), and this term means that data is semi-permanently stored in the storage medium. It does not distinguish between a case where it is used and a case where it is temporarily stored.
  • the 'non-transitory storage medium' may include a buffer in which data is temporarily stored.
  • the method according to various embodiments disclosed in the present disclosure may be provided by being included in a computer program product.
  • Computer program products may be traded between sellers and buyers as commodities.
  • the computer program product is distributed in the form of a machine-readable storage medium (eg compact disc read only memory (CD-ROM)), or via an application store (eg Play Store TM ) or on two user devices ( It can be distributed online (eg download or upload), directly between smartphones (eg smartphones).
  • a portion of the computer program product eg, a downloadable app
  • a machine-readable storage medium such as a memory of a manufacturer's server, a server of an application store, or a relay server. It may be temporarily stored or temporarily created.
  • unit may be a hardware component such as a processor or circuit, and/or a software component executed by a hardware component such as a processor.

Abstract

이전 대화에 대한 적어도 하나의 대화 텍스트로부터 추출된 적어도 하나의 제1 요약 텍스트를 획득하고, 현재 대화에 대한 대화 텍스트로부터, 적어도 하나의 제2 요약 텍스트를 추출하고, 적어도 하나의 제1 요약 텍스트 중 적어도 하나의 제2 요약 텍스트의 타입과 동일한 타입을 가지는 요약 텍스트를 식별하고, 식별된 요약 텍스트에 대한 정확도를 나타내는 스코어를 조정하고, 적어도 하나의 제1 요약 텍스트 및 제2 요약 텍스트 중에서, 각 요약 텍스트에 대한 스코어에 기초하여, 지정된 적어도 하나의 타입에 각각 대응되는 요약 텍스트를 선택하고, 선택된 요약 텍스트에 기초하여, 요약 정보를 생성하는, 전자 장치에서 대화 텍스트에 대한 요약 정보를 생성하는 방법이 제공된다.

Description

대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법
본 개시는, 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법에 관한 것이다.
고객과의 상담은 다양한 방식으로 수행될 수 있다. 예를 들면, 고객 상담은, 전화 상담뿐만 아니라, 채팅 방식을 이용한 채팅 상담으로도 수행될 수 있다. 채팅 상담은, 고객과 상담원 간에 문자 메시지를 교환함으로써, 실시간으로 수행될 수 있으며, 상담원이 많은 수의 고객을 동시에 상담할 수 있는 장점이 있다.
그러나, 한 명의 상담원이 많은 수의 고객을 동시에 채팅 상담하는 경우, 상담원이 고객과의 상담 내용을 일일이 명확하게 기억하기가 힘들어서, 상담이 원활하게 진행되기 어려울 수 있다. 따라서, 상담원이 상담 내용을 쉽고 빠르게 파악할 수 있도록, 채팅 상담의 내용을 실시간으로 요약하여, 상담원에게 제공하는 방법이 필요하다.
개시된 실시예들은 전술한 문제를 해결하기 위한 것으로서, 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법을 제공한다.
또한, 개시된 실시예들은 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 비일시적인 컴퓨터로 읽을 수 있는 기록매체를 제공할 수 있다. 해결하려는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 개시된 일 실시예는, 전자 장치에서, 대화 텍스트에 대한 요약 정보를 생성하는 방법에 있어서, 이전 대화에 대한 적어도 하나의 대화 텍스트로부터 추출된 적어도 하나의 제1 요약 텍스트를 획득하는 단계; 현재 대화에 대한 대화 텍스트로부터, 적어도 하나의 제2 요약 텍스트를 추출하는 단계; 상기 적어도 하나의 제1 요약 텍스트 중 상기 적어도 하나의 제2 요약 텍스트의 타입과 동일한 타입을 가지는 요약 텍스트를 식별하는 단계; 상기 식별된 요약 텍스트에 대한 정확도를 나타내는 스코어를 조정하는 단계; 및 상기 적어도 하나의 제1 요약 텍스트 및 제2 요약 텍스트 중에서, 각 요약 텍스트에 대한 스코어에 기초하여, 미리 설정된 적어도 하나의 타입에 각각 대응되는 요약 텍스트를 선택하는 단계; 및 상기 선택된 요약 텍스트에 기초하여, 상기 요약 정보를 생성하는 단계를 포함하는, 방법을 제공할 수 있다.
또한, 개시된 일 실시예는, 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치에 있어서, 이전 대화에 대한 적어도 하나의 대화 텍스트로부터 추출된 적어도 하나의 제1 요약 텍스트를 저장하는 메모리; 현재 대화에 대한 대화 텍스트로부터, 적어도 하나의 제2 요약 텍스트를 추출하고, 상기 적어도 하나의 제1 요약 텍스트 중 상기 적어도 하나의 제2 요약 텍스트의 타입과 동일한 타입을 가지는 요약 텍스트를 식별하고, 상기 식별된 요약 텍스트에 대한 정확도를 나타내는 스코어를 조정하고, 상기 적어도 하나의 제1 요약 텍스트 및 제2 요약 텍스트 중에서, 각 요약 텍스트에 대한 스코어에 기초하여, 미리 설정된 적어도 하나의 타입에 각각 대응되는 요약 텍스트를 선택하고, 상기 선택된 요약 텍스트에 기초하여, 상기 요약 정보를 생성하는 적어도 하나의 프로세서; 및 상기 요약 정보를 출력하는 출력부를 포함하는, 전자 장치를 제공할 수 있다.
또한, 개시된 일 실시예는, 제1 측면의 방법을 수행하도록 하는 프로그램이 저장된 컴퓨터로 읽을 수 있는 기록매체를 제공할 수 있다.
위의 측면 및 다른 측면들, 본 개시의 특정 실시예들의 특징 및 장점은 첨부된 도면과 함께 다음의 상세한 설명으로부터 더 명백해질 것이다.
도 1은 다양한 실시 예들에 의한 대화 텍스트에 대한 요약 정보를 생성하는 일 예를 나타낸 블록도이다.
도 2는 다양한 실시 예들에 의한 요약 정보를 생성하는 일 예를 나타낸 블록도이다.
도 3은 다양한 실시 예들에 의한 전자 장치의 구성의 일 예를 설명하기 위한 블록도이다.
도 4는 다양한 실시 예들에 의한 전자 장치의 구성의 일 예를 설명하기 위한 블록도이다.
도 5는 다양한 실시 예들에 의한 대화 텍스트에 대한 요약 정보를 생성하는 방법의 일 예를 나타낸 순서도이다.
도 6은 다양한 실시 예들에 의한 요약 정보의 일 예를 나타낸 도면이다.
도 7은 다양한 실시 예들에 의한 요약 정보의 일 예를 나타낸 도면이다.
도 8은 다양한 실시 예들에 의한 요약 정보를 사용자에게 제공하는 일 예를 나타낸 도면이다.
본 개시에서, "a, b 또는 c 중 적어도 하나" 표현은 " a", " b", " c", "a 및 b", "a 및 c", "b 및 c", "a, b 및 c 모두", 혹은 그 변형들을 지칭할 수 있다.
아래에서는 본 개시의 다양한 실시예들을 도시하고 설명하는 첨부한 도면을 참조하여 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략되고, 본 개시의 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 어떤 부분이 어떤 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 요소를 제외하는 것이 아니라 다른 요소를 더 포함할 수 있는 것을 의미한다.
본 개시에 따른 인공지능과 관련된 기능은 프로세서와 메모리를 통해 수행 될 수 있다. 프로세서는 하나 또는 복수의 프로세서를 포함할 수 있다. 이때, 예를 들면, 하나 또는 복수의 프로세서는 CPU(central processing unit), 전용 프로세서, AP(application processor), DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU, VPU(Vision Processing Unit)와 같은 그래픽 전용 프로세서, NPU 또는 그와 같은 인공지능 전용 프로세서일 수 있다. 하나 또는 복수의 프로세서는, 메모리에 저장된 기 정의된 동작 규칙 또는 인공지능 모델에 따라, 입력 데이터를 처리한다. 또는, 하나 또는 복수의 프로세서가 인공지능 전용 프로세서인 경우, 인공지능 전용 프로세서는, 특정 인공지능 모델의 처리에 특화된 하드웨어 구조로 설계될 수 있다.
기 정의된 동작 규칙 또는 인공지능 모델은 학습을 통해 만들어 질 수 있다. 훈련을 통해 미리 정의된 동작 규칙이나 인공지능 모델을 생성할 떄, 기본 인공지능 모델이 학습 알고리즘에 의하여 다수의 학습 데이터들을 이용하여 학습됨으로써, 원하는 특성(또는, 목적)을 수행하도록 설정된 기 정의된 동작 규칙 또는 인공지능 모델이 생성될 수 있다. 이러한 학습은 본 개시에 따른 인공지능이 수행되는 기기 자체에서 이루어질 수도 있고, 별도의 서버 및/또는 시스템을 통해 이루어 질 수도 있다. 예를 들면, 학습 알고리즘의 예로는, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)이 있으나, 전술한 예에 한정되지 않는다.
인공지능 모델은, 복수의 신경망 레이어들로 구성될 수 있다. 복수의 신경망 레이어들 각각은 복수의 가중치들(weight values)을 갖고 있으며, 이전(previous) 레이어의 연산 결과와 복수의 가중치들 간의 연산을 통해 신경망 연산을 수행한다. 복수의 신경망 레이어들이 갖고 있는 복수의 가중치들은 인공지능 모델의 학습 결과에 의해 최적화될 수 있다. 예를 들어, 학습 과정 동안 인공지능 모델에서 획득한 로스(loss) 값 또는 코스트(cost) 값이 감소 또는 최소화되도록 복수의 가중치들이 갱신될 수 있다. 인공 신경망은 심층 신경망(DNN:Deep Neural Network)를 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등이 있으나, 전술한 예에 한정되지 않는다.
이하 첨부된 도면을 참고하여 본 발명을 구체적으로 상세히 설명하기로 한다.
도 1은 다양한 실시 예들에 의한 대화 텍스트에 대한 요약 정보를 생성하는 일 예를 나타낸 블록도이다.
도 1을 참조하면, 일 실시 예에 의한 전자 장치(1000)는, 대화 텍스트(110)로부터 요약 텍스트를 추출(120)하고, 추출된 요약 텍스트(120)와, 대화 텍스트(110)에 기초하여, 요약 정보를 생성(130)할 수 있다. 일 실시 예에 의한 요약 정보가 전자 장치(1000)의 사용자, 예를 들면, 채팅 상담을 진행하는 상담자에게 제공됨으로써, 상담자는, 고객과 진행된 채팅 상담의 내용을 요약 정보를 통해 쉽게 파악할 수 있다.
일 실시예에 따른 전자 장치(1000)는 다양한 형태로 구현될 수 있다. 예를 들어, 본 명세서에서 기술되는 전자 장치(1000)는, 디지털 카메라, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 태블릿 PC, 전자북 단말기, 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, MP3 플레이어, 차량(vehicle) 등이 있을 수 있으나, 이에 한정되는 것은 아니다. 본 명세서에서 기술되는 전자 장치(1000)는 사용자에 의해 착용될 수 있는 장치(wearable device)일 수 있다. 웨어러블 디바이스는 액세서리 형 장치(예컨대, 시계, 반지, 팔목 밴드, 발목 밴드, 목걸이, 안경, 콘택트 렌즈), 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형 장치(예: 전자 의복), 신체 부착형 장치(예컨대, 스킨 패드(skin pad)), 또는 생체 이식형 장치(예: implantable circuit) 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다.
일 실시 예에 의한 대화 텍스트(110)는, 복수의 사용자 간의 메시지 대화 내용을 포함할 수 있다. 일 실시 예에 의한 대화 텍스트(110)는, 메시지 대화에 한하지 않고, 음성 대화가 음성 인식됨으로써, 텍스트로 변환된 대화 내용을 포함할 수도 있다.
일 실시 예에 의한 대화 텍스트(110)는, 전자 장치(1000)의 사용자에 대한 대화 상대가 복수 명 존재하는 경우, 대화 상대자 별로 생성된 각각의 대화창에 대하여 생성될 수 있다. 따라서, 일 실시 예에 의한 요약 정보(130)는, 각각의 대화창 별로 생성될 수 있다. 예를 들어, 상담자가, 여러 고객들을 상대로 동시에 채팅 상담을 진행하는 경우, 각 고객마다 진행된 메시지 대화 내용이, 대화 텍스트(110)로 각각 생성될 수 있다. 또한, 각 대화 텍스트(110)에 대한 요약 정보(130)가 생성되어 사용자에게 제공될 수 있다.
일 실시 예에 의한 대화 텍스트(110)는, 상담자에 의한 채팅 상담에 한하지 않고, 챗봇에 의한 채팅 상담에 의한 대화 메시지도 포함할 수 있다. 예를 들어, 상담자에 의한 채팅 상담이 수행되기 전에, 챗봇에 의하여 자동으로 채팅 상담이 먼저 수행된 후, 고객 요청에 따라서, 상담자에 의한 채팅 상담이 수행될 수 있다. 따라서, 일 실시 예에 의한 대화 텍스트(110)는, 복수의 사용자 간에 수행된 메시지 대화 내용에 한하지 않고, 대화 메시지를 자동으로 생성하는 챗봇 시스템에 의해 생성된 메시지 대화 내용도 포함할 수 있다.
또한, 일 실시 예에 의한 채팅 상담을 수행하는 상담자는, 챗봇에 의한 채팅 상담에 대하여 생성된 요약 정보(130)를 제공받음으로써, 먼저 수행된 채팅 상담에 관한 내용을 빠르고 쉽게 파악할 수 있다.
일 실시 예에 의한 요약 텍스트(120)는, 대화 텍스트(110)로부터 미리 설정된 타입의 명칭 또는 주제가 추출됨으로써, 획득될 수 있다. 일 실시 예에 의한 요약 텍스트(120)는, 미리 설정된 적어도 하나의 타입 별로, 대화 텍스트(110)로부터 추출된 명칭 또는 주제를 포함할 수 있다.
일 실시 예에 의한 타입은, 대화 텍스트(110) 중 중요도가 높은 명칭(entity) 또는 주제(topic)가 추출될 수 있는 타입으로 설정될 수 있다. 예를 들어, 채팅 상담이 제품에 관한 서비스를 문의하는 내용을 포함하는 경우, 대화 내용 중 제품명과 구매일이 중요한 정보로서, 추출될 수 있다. 따라서, 중요도가 높은 제품명과, 구매일이 대화 대화 텍스트(110)로부터 추출될 수 있도록, 제품명과 구매일이 요약 텍스트(120)에 대한 타입으로서 미리 설정될 수 있다. 또한, 상술한 예에 한하지 않고, 제품명, 구매일, 시리얼번호, 대화 주제, 문의 타입, 문제 해결 여부, 상담 만족도 등의 다양한 타입이 요약 텍스트(120)의 추출을 위하여 미리 설정될 수 있다.
일 실시 예에 의하면, 미리 학습된 인공지능 모델, 예를 들면, 자연어 이해 모델(NLU; Natural Language Understanding)을 이용하여, 각각의 타입 별로, 대화 텍스트(110)로부터 요약 텍스트(120)가 추출될 수 있다. 일 실시 예에 의하면, 대화 텍스트(110)에 포함된 각각의 텍스트에 대한 특징이 추출될 수 있고, 추출된 특징에 기초하여, 대화 텍스트(110)의 텍스트 중 미리 설정된 타입과 대응되는 텍스트가 식별될 수 있다. 일 실시 예에 의하면, 상기 식별된 텍스트가, 각각의 타입에 대응되는 명칭 또는 주제로서 획득될 수 있다.
일 실시 예에 의한 요약 정보(130)는, 대화 텍스트(110) 및 요약 텍스트(120)에 기초하여, 생성될 수 있다. 일 실시 예에 의한 요약 정보(130)는, 요약 폼과, 요약문 중 적어도 하나를 포함할 수 있다. 일 실시 예에 의한 요약 폼은, 미리 설정된 타입별로 각각 대응되는 요약 텍스트(120)에 관한 정보를 포함할 수 있다. 또한, 일 실시 예에 의한 요약 문은, 대화 텍스트(110)가 요약되어 생성된, 적어도 하나의 문장을 포함할 수 있다. 이때, 요약문은, 요약 텍스트(120)가 포함되도록, 생성될 수 있다. 일 실시 예에 의한 요약 텍스트(120)는, 중요도가 높은 명칭 또는 주제를 포함할 수 있으므로, 요약문은, 요약 텍스트(120)를 포함할 수 있도록, 생성될 수 있다. 상술한 예에 한하지 않고, 요약 정보(130)는, 대화 텍스트(110)가 요약된 다양한 형태의 정보를 포함할 수 있다.
일 실시 예에 의한 요약 텍스트 추출(120) 및 요약 정보의 생성(130) 중 적어도 하나는, 대화 텍스트(110)가 획득될 때마다 실시간으로 수행될 수 있다. 일 실시 예에 의하면, 대화가 진행됨에 따라서, 새로운 대화 텍스트(110)가 지속적으로 획득될 수 있고, 새로운 대화 텍스트(110)가 획득될 때마다, 요약 텍스트 추출(120) 및 요약 정보의 생성(130) 중 적어도 하나가 반복적으로 수행될 수 있다.
일 실시예에 의한 전자 장치(1000)는, 대화 텍스트에 의한 요약 정보를 생성하는데, 서버(미도시)를 더 이용할 수도 있다.
서버(미도시)는 적어도 하나의 컴퓨터 장치로 구현될 수 있다. 서버(미도시)는 클라우드 형태로 분산될 수 있으며, 명령, 코드, 파일, 컨텐츠 등을 제공할 수 있다.
서버(미도시)는 전자 장치(1000)가 실행할 수 있는 동작들을 수행할 수 있다. 예컨대, 서버(미도시)는 전자 장치(1000)로부터 수신되는 대화와 관련된 정보에 기초하여 대화 텍스트(110)를 획득하고, 대화 텍스트(110)에 대한 요약 정보를 생성하여 전자 장치(1000)에 송신할 수 있다. 상술된 예에 한하지 않고 서버(미도시)는 전자 장치(1000)가 일 실시 예에 의한 요약 정보를 생성하기 위한 다양한 동작을 수행하고, 그 결과를 전자 장치(1000)로 송신할 수 있다.
도 2는 다양한 실시 예들에 의한 요약 정보를 생성하는 일 예를 나타낸 블록도이다.
도 2를 참조하면, 일 실시 예에 의한 전자 장치(1000)는, 이전 대화에 대하여 획득된 요약 텍스트 및 현재 대화에 대하여 획득된 요약 텍스트에 기초하여, 요약 정보를 생성할 수 있다.
일 실시 예에 의하면, 이전 대화에 대하여 획득된 요약 텍스트 중 현재 대화에 대하여 획득된 요약 텍스트와 동일한 타입을 가진 요약 텍스트가 존재할 수 있다. 예를 들어, 현재 대화에서, 이전 대화에서 언급했던 내용이 번복되는 경우, 이전에 추출되었던 요약 텍스트와 동일한 타입의 요약 텍스트가 획득될 수 있다. 일 예로, 고객이 이전 대화에서 언급한 모델명을 현재 대화에서 번복하여, 다른 모델명을 다시 언급할 수 있다. 이경우, 이전 대화의 내용에 기초하여 생성된 요약 정보(130)가, 현재 대화의 내용이 반영되도록, 수정될 수 있다. 예를 들어, 이전 대화에서 언급된 모델명과 관련된 정보를 포함한 요약 정보(130)가, 현재 대화의 내용을 반영하여, 현재 대화에서 언급된 모델명을 포함하도록 수정될 수 있다.
일 실시 예에 의한 요약 정보(130)는, 각 타입마다, 하나의 요약 텍스트가 포함됨이 바람직하다. 따라서, 각각의 요약 텍스트가 획득될 때, 각 요약 텍스트에 대한 정확도를 나타내는 스코어가 함께 결정될 수 있고, 스코어에 기초하여, 요약 정보(130)가 생성되는데 이용될 요약 텍스트가 각각의 타입 별로 선택될 수 있다.
일 실시 예에 의한 스코어는, 대화 텍스트의 특징에 기초하여, 추출된 요약 텍스트의 확률 정보에 기초하여 결정될 수 있다. 예를 들어, 요약 텍스트가 추출된 대화 텍스트가, 상기 요약 텍스트에 대응되는 특징을 많이 가질수록, 높은 확률 값을 가짐에 따라, 요약 텍스트의 스코어는 큰 값으로 결정될 수 있다. 반면, 요약 텍스트가 추출된 대화 텍스트가, 상기 요약 텍스트에 대응되는 특징을 적게 가질수록, 작은 확률 값을 가짐에 따라, 요약 텍스트의 스코어는 작은 값으로 결정될 수 있다.
일 실시 예에 의한 스코어는, 요약 텍스트가 포함된 문장 단위의 대화 텍스트의 특징에 기초하여, 획득될 수 있다. 상술한 예에 한하지 않고, 스코어는, 요약 텍스트가 추출되는데 이용된, 다양한 범위의 대화 텍스트에 기초하여, 획득될 수 있다.
또한, 일 실시 예에 의한 스코어는, 요약 텍스트가 추출되는데 이용된 대화 텍스트에 한하지 않고, 상기 대화 텍스트에 이웃하는, 적어도 하나의 대화 텍스트에 더 기초하여, 수정될 수 있다. 예를 들어, 현재의 요약 텍스트가, 현재 대화와 대응되는, 문장 단위의 대화 텍스트로부터 추출된 경우, 현재의 요약 텍스트에 대한 스코어는, 이전 대화와 대응되는 적어도 하나의 대화 텍스트 및 이후에 수행된 대화와 대응되는 적어도 하나의 대화 텍스트에 기초하여, 수정될 수 있다. 따라서, 이후에 수행된 대화가 종료된 이후, 예를 들면, 대화가 모두 종료된 후에, 상기 이후에 수행된 대화 및 이전 대화에 기초하여, 상기 스코어가 추가적으로 수정될 수 있다.
또한, 일 실시 예에 의한 스코어는, 현재 대화에 대한 대화 텍스트뿐만 아니라, 이전 대화 및 이후 대화에 대한 대화 텍스트에 더 기초하여, 수정됨에 따라서, 이전 대화 및 이후 대화에 기초한 문맥적 흐름이 더 반영된 스코어 값이 획득될 수 있다. 예를 들어, 요약 텍스트가, 문맥적 흐름에 맞지 않는 내용을 포함하는 경우, 상기 요약 텍스트에 대해 더 낮은 스코어 값이 결정될 수 있다.
일 실시 예에 의하면, 각 요약 텍스트에 대한 최종 스코어는, 각 요약 텍스트에 대해 획득된, 제1 스코어 및 제2 스코어에 기초하여, 최종적으로 결정될 수 있다. 일 실시 예에 의한 제1 스코어는, 동일한 타입을 가진 요약 텍스트가 새로 추출됨에 따라서, 조정된 스코어를 포함할 수 있다. 또한, 제2 스코어는, 이전 대화 및 이후 대화에 기초한 문맥적 흐름이 더 반영되어 획득된 스코어를 포함할 수 있다.
일 실시 예에 의하면, 제1 스코어 및 제2 스코어가 곱해진 값에 기초하여, 각 요약 텍스트에 대한 최종 스코어 값이 결정될 수 있다. 상술한 예에 한하지 않고, 요약 텍스트에 대한 최종 스코어 값은, 제1 스코어 및 제2 스코어에 기초하여, 다양한 방법에 따라 획득될 수 있다.
또한, 일 실시 예에 의하면, 최종 스코어 값에 따라서, 미리 설정된 각 타입에 대응하는, 요약 텍스트가 선택될 수 있고, 선택된 요약 텍스트에 기초하여, 요약 정보가 생성될 수 있다.
일 실시 예에 의한 제1 요약 텍스트(220)는, 이전에 수행된 적어도 하나의 대화 텍스트로부터 추출된 요약 텍스트(210)를 포함할 수 있다. 일 실시 예에 의한 제1 요약 텍스트(220) 중에서, 현재 수행된 대화 텍스트(230)로부터 추출된 제2 요약 텍스트(240)의 타입과 동일한 타입을 가진 요약 텍스트가 식별될 수 있다.
일 실시 예에 의하면, 제1 요약 텍스트(220) 중에서 식별된 요약 텍스트의 스코어가, 제2 요약 텍스트(240)에 의하여, 250에서, 조정될 수 있다. 예를 들어, 제1 요약 텍스트(220)의 스코어는, 현재 수행된 대화 텍스트(230)로부터 동일한 타입을 가진 요약 텍스트가 추출됨에 따라서, 보다 낮은 값으로, 일 예로, 현재값보다 미리 설정된(예를 들면, 지정된) 상수값만큼 적은 값을 가지도록, 조정될 수 있다. 이는, 최근에 언급된 대화 내용이 이전 대화 내용보다 정확한 것으로 보고, 이전 대화에서 추출된 제1 요약 텍스트(220)의 스코어를 더 낮게 조정한 것이다.
다만, 상술한 예에 한하지 않고, 제1 요약 텍스트(220)의 스코어가 낮게 조정되어도, 제2 요약 텍스트(240)의 스코어가 상대적으로 더 많이 낮은 경우, 제1 요약 텍스트(220)의 스코어가 제2 요약 텍스트(240)의 스코어보다 더 큰 값을 가질 수도 있다.
일 실시 예에 의하면, 260에서, 각각의 요약 텍스트의 스코어에 기초하여, 요약 정보(130)가 생성될 수 있다. 일 실시 예에 의하면, 실시간으로 생성되는 대화 텍스트(110)에 대하여, 각 타입 별로, 스코어에 기초하여 선택된, 적어도 하나의 요약 텍스트가 존재할 수 있다. 일 실시 예에 의한 요약 정보(130)는, 스코어에 기초하여, 각 타입별로 선택된 요약 텍스트에 기초하여, 생성될 수 있다. 예를 들면, 각 타입별로 가장 큰 스코어를 가지는 요약 텍스트가 선택될 수 있고, 선택된 요약 텍스트에 기초하여, 요약 정보(130)가 생성될 수 있다.
일 실시 예에 의하면, 현재 대화에 대한 대화 텍스트(230)가 획득될 때마다, 요약 텍스트의 스코어 조정(250)이 수행될 수 있다. 따라서, 일 실시 예에 의하면, 스코어 조정(250)이 수행될 때마다, 각 타입 별로 요약 텍스트가 다시 선택될 수 있고, 다시 선택된 요약 텍스트에 따라, 요약 정보(130)가 생성될 수 있다. 예를 들어, 현재 대화에서, 모델명이 번복됨에 따라, 모델명 타입에 대해 선택되는 요약 텍스트가 변경될 수 있고, 다르게 선택된 요약 텍스트에 따라서, 요약 정보(130)가 생성될 수 있다.
도 3은 다양한 실시 예들에 의한 전자 장치의 구성의 일 예를 설명하기 위한 블록도이다.
도 4는 다양한 실시 예들에 의한 전자 장치의 구성의 일 예를 설명하기 위한 블록도이다.
도 3을 참조하면, 전자 장치(1000)는, 프로세서(1300)(예를 들면, 연산 회로를 포함한다), 출력부(1200)(예를 들면, 출력 회로를 포함한다) 및 메모리(1700)을 포함할 수 있다. 그러나, 도 3에 도시된 구성 요소 모두가 전자 장치(1000)의 필수 구성 요소인 것은 아니다. 도 3에 도시된 구성 요소보다 많은 구성 요소에 의해 전자 장치(1000)가 구현될 수도 있고, 도 3에 도시된 구성 요소보다 적은 구성 요소에 의해 전자 장치(1000)가 구현될 수도 있다.
예를 들면, 전자 장치(1000)는 도 4에 도시된 바와 같이, 일 실시예에 따른 전자 장치(1000)는, 프로세서(1300), 출력부(1200)(예를 들면, 출력 회로를 포함한다) 및 메모리(1700) 이외에 사용자 입력부(1100)(예를 들면, 입력 회로를 포함한다), 센싱부(1400), 통신부(1500)(예를 들면, 통신 회로를 포함하는) 및 오디오/비디오(A/V) 입력부(1600)(예를 들면, A/V 입력 회로를 포함한다)를 더 포함할 수도 있다.
사용자 입력부(1100)는, 사용자가 전자 장치(1000)를 제어하기 위한 데이터를 입력하는 수단, 예를 들면 다양한 입력 회로가 포함된, 을 포함한다. 예를 들어, 사용자 입력부(1100)에는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등이 있을 수 있으나 이에 한정되는 것은 아니다.
일 실시 예에 의하면, 사용자 입력부(1100)는, 대화 텍스트에 대한 요약 정보를 생성하기 위한 사용자 입력을 수신할 수 있다. 예를 들면, 사용자 입력부(1100)는, 대화 텍스트를 입력하는 사용자 입력을 수신할 수 있다.
출력부(1200)는, 다양한 출력 회로를 포함할 수 있고, 오디오 신호 또는 비디오 신호, 진동 신호 등을 출력할 수 있으며, 출력부(1200)는 디스플레이부(1210)(예를 들면, 디스플레이를 포함한다), 음향 출력부(1220)(예를 들면, 음향 출력 회로를 포함한다.), 및 진동 모터(1230)를 포함할 수 있다.
디스플레이부(1210)는 전자 장치(1000)에서 처리되는 정보를 표시 출력하는 디스플레이를 포함할 수 있다. 일 실시 예에 의하면, 디스플레이부(1210)는 대화 텍스트에 대해 생성된 요약 정보를 출력할 수 있다.
디스플레이부(1210)와 터치패드가 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이부(1210)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 디스플레이부(1210)는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전기영동 디스플레이(electrophoretic display) 중에서 적어도 하나를 포함할 수 있다. 그리고 전자 장치(1000)의 구현 형태에 따라 전자 장치(1000)는 디스플레이부(1210)를 2개 이상 포함할 수도 있다.
음향 출력부(1220)는 다양한 출력 회로를 포함할 수 있고, 통신부(1500)로부터 수신되거나 메모리(1700)에 저장된 오디오 데이터를 출력할 수 있다. 진동 모터(1230)는 진동 신호를 출력할 수 있다. 또한, 진동 모터(1230)는 터치스크린에 터치가 입력되는 경우 진동 신호를 출력할 수도 있다. 일 실시 예에 의하면, 음향 출력부(1220) 및 진동 모터(1230)는 대화 텍스트에 대해 생성된 요약 정보와 관련된 정보를 출력할 수 있다.
프로세서(1300)는, 다양한 연산 회로를 포함할 수 있고 통상적으로 전자 장치(1000)의 전반적인 동작을 제어할 수 있다. 예를 들어, 프로세서(1300)는, 메모리(1700)에 저장된 프로그램들을 실행함으로써, 사용자 입력부(1100), 출력부(1200), 센싱부(1400), 통신부(1500), A/V 입력부(1600) 등을 전반적으로 제어할 수 있다.
전자 장치(1000)는 적어도 하나의 프로세서(1300)를 포함할 수 있다. 예를 들면, 전자 장치(1000)는 CPU(Central Processing Unit), 전용 프로세서, GPU(Graphics Processing Unit), NPU(Neural Processing Unit) 등의 다양한 종류의 프로세서를 포함할 수 있으나 이에 한정되지 않는다.
프로세서(1300)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(1700)로부터 프로세서(1300)에 제공되거나, 통신부(1500)를 통해 수신되어 프로세서(1300)로 제공될 수 있다. 예를 들면 프로세서(1300)는 메모리와 같은 기록 장치에 저장된 프로그램 코드에 따라 명령을 실행하도록 구성될 수 있다.
일 실시 예에 의한 프로세서(1300)는 이전에 수행된 대화에 대한 적어도 하나의 대화 텍스트로부터 추출된 제1 요약 텍스트와, 현재 수행된 대화에 대한 대화 텍스트로부터 추출된 제2 요약 텍스트를 획득할 수 있다. 프로세서(1300)는, 적어도 하나의 제1 요약 텍스트 중에서, 제2 요약 텍스트의 타입과 동일한 타입을 가지는 요약 텍스트를 식별할 수 있다.
일 실시 예에 의한 프로세서(1300)는, 제1 요약 텍스트 중에서, 상기 식별된 요약 텍스트에 대한 정확도를 나타내는 스코어를 조정할 수 있다. 예를 들면, 상기 스코어는, 현재값보다 미리 설정된 상수값만큼 작은 값을 가지도록 조정될 수 있다. 따라서, 이전 대화에서 추출된 제1 요약 텍스트는, 동일한 타입의 현재 대화에서 추출된 제2 요약 텍스트가 추출됨에 따라서, 정확도가 낮아짐에 따라, 요약 정보에 포함될 확률이 낮아질 수 있다.
일 실시 예에 의한 프로세서(1300)는, 각각의 제1 요약 텍스트 및 제2 요약 텍스트에 대한 정확도를 나타내는 스코어에 기초하여, 미리 설정된 적어도 하나의 타입에 각각 대응되는 요약 텍스트를 선택하고, 선택된 요약 텍스트에 기초하여 요약 정보를 생성할 수 있다. 예를 들면, 각 타입에 대하여, 스코어에 기초하여, 하나의 요약 텍스트가 선택될 수 있고, 선택된 요약 텍스트에 기초하여, 요약 정보가 생성될 수 있다.
센싱부(1400)는, 전자 장치(1000)의 상태 또는 전자 장치(1000) 주변의 상태를 감지하고, 감지된 정보를 프로세서(1300)로 전달할 수 있다.
센싱부(1400)는, 지자기 센서(Geomagnetic sensor)(1410), 가속도 센서(Acceleration sensor)(1420), 온/습도 센서(1430), 적외선 센서(1440), 자이로스코프 센서(1450), 위치 센서(예컨대, GPS)(1460), 기압 센서(1470), 근접 센서(1480), 및/또는 RGB 센서(illuminance sensor)(1490) 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다.
일 실시 예에 따라 센싱부(1400)에 의해 감지된 정보에 기초하여, 요약 텍스트의 정확도를 나타내는 스코어 값이 결정될 수 있다. 예를 들면, 요약 텍스트의 스코어는, 요약 텍스트가 추출된 대화 텍스트의 특징에 기초하여, 결정될 수 있으나, 이에 한하지 않고, 대화 텍스트와 관련하여, 센싱부(1400)에 의해 감지된 다양한 정보에 기초하여, 결정될 수도 있다. 상술한 예에 한하지 않고, 요약 텍스트의 스코어는 다양한 방법에 따라서, 결정될 수 있다.
통신부(1500)는, 전자 장치(1000)가 서버(2000) 또는 외부 장치(미도시)와 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 통신부(1500)는 예를 들면, 근거리 통신부(1510), 이동 통신부(1520), 방송 수신부(1530)와 같은 각각이 다양한 통신 회로를 포함하는 다양한 유닛들 또는 모듈들을 포함할 수 있다.
근거리 통신부(short-range wireless communication unit)(1510)는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association)(미도시) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
이동 통신부(1520)는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
방송 수신부(1530)는, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 구현 예에 따라서 전자 장치(1000)가 방송 수신부(1530)를 포함하지 않을 수도 있다.
일 실시 예에 의한, 통신부(1500)는 외부 장치와 적어도 하나의 메시지를 송수신할 수 있다. 또한, 통신부(1500)는 통화를 수행하기 위한 음성 데이터를 송수신할 수 있다.
일 실시 예에 의한 통신부(1500)는, 대화 텍스트에 대한 요약 정보를 생성하는데 필요한 정보를 송수신할 수 있다. 예를 들면, 통신부(1500)는 대화 텍스트와 대응되는 대화 메시지를 외부로 송수신할 수 있다.
A/V(Audio/Video) 입력부(1600)는 오디오 신호 또는 비디오 신호 입력을 위한 다양한 A/V 입력 회로, 카메라(1610)와 마이크로폰(1620) 등을 포함할 수 있다. 카메라(1610)는 화상 통화모드 또는 촬영 모드에서 이미지 센서를 통해 정지영상 또는 동영상 등의 화상 프레임을 얻을 수 있다. 이미지 센서를 통해 캡쳐된 이미지는 프로세서(1300) 또는 별도의 이미지 처리부(미도시)를 통해 처리될 수 있다.
마이크로폰(1620)은, 외부의 음향 신호를 입력 받아 전기적인 음성 데이터로 처리한다. 예를 들어, 마이크로폰(1620)은 대화를 수행하는 사용자의 음성 입력을 수신할 수 있다.
메모리(1700)는, 프로세서(1300)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 전자 장치(1000)로 입력되거나 전자 장치(1000)로부터 출력되는 데이터를 저장할 수도 있다.
일 실시 예에 의한 메모리(1700)는 이전 대화에 대해 추출된 적어도 하나의 요약 텍스트를 저장할 수 있다. 메모리(1700)는, 일 실시 예에 따라서, 대화 텍스트에 대해 생성된 요약 정보를 저장할 수 있다.
메모리(1700)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
메모리(1700)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류할 수 있는데, 예를 들어, 유저 인터페이스(User interface, UI) 모듈(1710), 터치 스크린 모듈(1720), 알림 모듈(1730) 등으로 분류될 수 있다.
UI 모듈(1710)은, 애플리케이션 별로 전자 장치(1000)와 연동되는 특화된 UI, GUI 등을 제공할 수 있다. 터치 스크린 모듈(1720)은 사용자의 터치 스크린 상의 터치 제스처를 감지하고, 터치 제스처에 관한 정보를 프로세서(1300)로 전달할 수 있다. 일부 실시예에 따른 터치 스크린 모듈(1720)은 터치 코드를 인식하고 분석할 수 있다. 터치 스크린 모듈(1720)은 컨트롤러를 포함하는 별도의 하드웨어로 구성될 수도 있다.
터치스크린의 터치 또는 근접 터치를 감지하기 위해 터치스크린의 내부 또는 근처에 다양한 센서가 구비될 수 있다. 터치스크린의 터치를 감지하기 위한 센서의 일례로 촉각 센서가 있다. 촉각 센서는 사람이 느끼는 정도로 또는 그 이상으로 특정 물체의 접촉을 감지하는 센서를 말한다. 촉각 센서는 접촉면의 거칠기, 접촉 물체의 단단함, 접촉 지점의 온도 등의 다양한 정보를 감지할 수 있다.
사용자의 터치 제스처에는 탭, 터치&홀드, 더블 탭, 드래그, 패닝, 플릭, 드래그 앤드 드롭, 스와이프 등이 있을 수 있다.
알림 모듈(1730)은 전자 장치(1000)의 이벤트 발생을 알리기 위한 신호를 발생할 수 있다.
도 5는 다양한 실시 예들에 의한 대화 텍스트에 대한 요약 정보를 생성하는 방법의 일 예를 나타낸 순서도이다.
도 5를 참조하면, 단계 510에서, 일 실시 예에 의한 전자 장치(1000)는, 이전 대화에 대한 적어도 하나의 대화 텍스트로부터 추출된 적어도 하나의 제1 요약 텍스트를 획득할 수 있다. 따라서, 일 실시 예에 의한 적어도 하나의 제1 요약 텍스트는, 이전 대화들에 대하여, 획득된 적어도 하나의 요약 텍스트를 포함할 수 있다. 일 실시 예에 의한 제1 요약 텍스트는, 전자 장치(1000)에서, 요약 텍스트가 추출될 때마다, 메모리(1700)에 저장된 요약 텍스트일 수 있다.
단계 520에서, 전자 장치(1000)는, 현재 대화에 대한 대화 텍스트로부터 제2 요약 텍스트를 추출할 수 있다. 일 실시 예에 의한 제2 요약 텍스트는, 미리 설정된 타입 별로, 현재 대화에 대한 대화 텍스트로부터 명칭 또는 주제가 추출됨으로써, 획득될 수 있다. 일 실시 예에 의한 타입은, 요약 정보(130)를 생성하는데 이용될 수 있는 중요도 높은 요약 텍스트에 관한 타입으로서, 예를 들면, 제품명, 고객명, 구매일, 상담 주제 등의 다양한 종류의 타입으로 미리 설정될 수 있다.
단계 530에서, 전자 장치(1000)는, 적어도 하나의 제1 요약 텍스트 중에서, 제2 요약 텍스트의 타입과 동일한 타입을 가지는 요약 텍스트를 식별할 수 있다. 일 실시 예에 의하면, 동일한 타입의 요약 텍스트들은 서로 양립되지 않지 않는 정보를 포함할 가능성이 높다. 따라서, 동일한 타입의 요약 텍스트들 중 정확도가 가장 높은 것으로 판단된, 하나의 요약 텍스트에 기초하여, 요약 정보(130)를 생성함이 바람직하다.
일 실시 예에 의하면, 현재 대화에 대한 대화 텍스트에서, 이전에 획득된 요약 텍스트의 타입과 동일한 타입의 요약 텍스트가 추출된 경우, 각 요약 텍스트의 정확도를 나타내는 스코어를 조정하기 위한 요약 텍스트가 식별될 수 있다.
일 실시 예에 의하면, 단계 540에서, 식별된 요약 텍스트의 스코어가 더 낮게 조정됨으로써, 현재 대화에서 추출된 요약 텍스트가 요약 정보(130)를 생성하는데 이용될 가능성이 더 높아질 수 있다. 일 실시 예에 의하면, 현재 대화에서, 이전 대화의 내용과는 다르게 번복된 내용을 포함함에 따라서, 이전 대화에서 획득된 요약 텍스트와 동일한 타입의 요약 텍스트가 추출될 수 있고, 현재 대화의 요약 텍스트가 이전 대화의 요약 텍스트보다 더 정확한 내용을 포함하는 것으로 보고, 현재 대화에서 추출된 요약 텍스트가 요약 정보(130)를 생성하는데 이용될 가능성이 높아질 수 있도록, 단계 540에서, 식별된 요약 텍스트가 스코어가 조정될 수 있다.
단계 550에서, 전자 장치(1000)는, 적어도 하나의 제1 요약 텍스트, 및 적어도 하나의 제2 요약 텍스트의 각각의 스코어에 기초하여, 미리 설정된 (예를 들면, 지정된) 타입에 각각 대응되는 요약 텍스트를 선택할 수 있다. 예를 들면, 각 타입별로, 스코어 값이 가장 높은 요약 텍스트가 선택될 수 있다.
단계 560에서, 전자 장치(1000)는, 단계 550에서, 선택된 요약 텍스트에 기초하여 요약 정보를 생성할 수 있다. 일 실시 예에 의한, 요약 정보는, 요약 텍스트가 각 타입별로 나열된 요약 폼을 포함할 수 있다. 또한, 요약 정보는, 요약 텍스트에 기초하여, 생성된 적어도 하나의 문장을 포함하는 요약문을 포함할 수 있다. 상술한 예에 한하지 않고, 요약 텍스트에 기초하여, 다양한 형태로 생성된 요약 정보가 생성될 수 있다.
일 실시 예에 따라 생성된 요약 정보는, 전자 장치(1000)의 사용자에게 제공됨으로써, 사용자는, 현재까지 진행된 대화 내용을 나타내는 요약 정보를 쉽게 확인할 수 있다.
일 실시 예에 의한 단계 510 내지 560의 동작은, 대화가 진행됨에 따라서, 현재 대화에 대한 제2 요약 텍스트가 추출될 때마다 수행될 수 있다. 예를 들면, 현재 대화에 대한 제2 요약 텍스트가 추출될 때마다, 제1 요약 텍스트 중에서 식별된 요약 텍스트의 스코어가 조정되고, 새로 조정된 스코어에 기초하여, 선택된 요약 텍스트에 기초하여, 요약 정보가 생성될 수 있다.
도 6은 다양한 실시 예들에 의한 요약 정보의 일 예를 나타낸 도면이다. 도 6을 참조하면, 고객과 상담원 간에 수행된 대화의 대화 텍스트(610)는, 대화가 수행된 순서인, 611, 612 및 613의 순서대로, 획득될 수 있다.
일 실시 예에 의하면, 대화가 진행됨에 따라서, 제1 대화 텍스트(611)가 추출되면, 제1 대화 텍스트(611)에 기초하여, 요약 폼(621) 및 요약문(622) 중 적어도 하나를 포함하는, 요약 정보(620)가 생성될 수 있다. 예를 들면, 제1 대화 텍스트(611)로부터, 미리 설정된 타입 중 제품명, 구매일, 대화 주제 및 문의 종류에 대한 요약 텍스트인, "Galaxy Note 10", "2019-10", "배터리 방전", 및 "기술 상담"이 추출될 수 있다. 일 실시 예에 의한 요약 텍스트는, 대화 텍스트(610)에 포함된 텍스트 그대로인, "노트 10"이나 "작년 10월"로 획득될 수 있으나, 이에 한하지 않고, 동일한 의미를 가지나 다르게 표현된, "Galaxy Note 10", "2019-10"로 획득될 수도 있다. 상술한 예에 한하지 않고, 대화 텍스트(610)에 기초하여, 다양하게 변형된 요약 텍스트가 획득될 수 있다. 또한, 상기 요약 텍스트 및 제1 대화 텍스트(611)에 기초하여, 요약문(622)이 더 생성될 수도 있다.
일 실시 예에 의하면, 제1 대화 텍스트(611) 이후에, 제2 대화 텍스트(612)가 추가적으로 더 획득될 수 있다. 일 실시 예에 의하면, 새로 획득된 제2 대화 텍스트(612)에 기초하여, 요약 폼(621) 및 요약문(622) 중 적어도 하나를 포함하는, 요약 정보(620)가 생성될 수 있다. 예를 들면, 제1 대화 텍스트(612)에 기초하여 생성된 요약 정보(620)가, 제2 대화 텍스트(612)에 기초하여, 수정됨으로써, 제2 대화 텍스트(612)에 더 기초한 요약 정보(620)가 생성될 수 있다.
일 실시 예에 의하면, 제2 대화 텍스트(612)로부터, 미리 설정된 타입 중 문제 해결 여부 및 상담만족도에 대한 요약 텍스트인, "미해결" 및 "불만족"이 추출될 수 있다.
따라서, 제1 대화 텍스트(611)에 기초하여 생성된 요약 정보(620)는, 문제 해결 여부 및 상담만족도에 대한 요약 텍스트와 관련된 정보를 포함하지 않을 수 있으나, 제2 대화 텍스트(612)가 획득됨에 따라서, 문제 해결 여부 및 상담만족도에 대한 요약 텍스트와 관련된 정보를 더 포함하는 요약 정보(620)가 획득될 수 있다.
일 실시 예에 의하면, 제2 대화 텍스트(612) 이후에, 제3 대화 텍스트(613)가 추가적으로 더 획득될 수 있다. 일 실시 예에 의하면, 새로 획득된 제3 대화 텍스트(613)에 기초하여, 요약 폼(621) 및 요약문(622) 중 적어도 하나를 포함하는, 요약 정보(620)가 생성될 수 있다. 예를 들면, 제1 대화 텍스트(611) 및 제2 대화 텍스트(612)에 기초하여 생성된 요약 정보(620)가, 제3 대화 텍스트(613)에 기초하여, 수정됨으로써, 제3 대화 텍스트(613)에 더 기초한 요약 정보(620)가 생성될 수 있다.
일 실시 예에 의하면, 제3 대화 텍스트(613)로부터, 미리 설정된 타입 중 시리얼 번호에 대한 요약 텍스트인, "01038948-1938020598502985"이 추출될 수 있다.
따라서, 제1 대화 텍스트(611) 및 제2 대화 텍스트(612)에 기초하여 생성된 요약 정보(620)는, 시리얼 번호에 대한 요약 텍스트와 관련된 정보를 포함하지 않을 수 있으나, 제3 대화 텍스트(613)가 획득됨에 따라서, 시리얼 번호에 관련된 정보를 더 포함하는 요약 정보(620)가 획득될 수 있다.
일 실시 예에 의한 요약문(622)은, 요약 정보(620)에 포함된 적어도 하나의 요약 텍스트와, 대화 텍스트(610)에 기초하여 생성될 수 있다. 일 실시 예에 의한 요약문(622)은, 대화가 종료된 이후에 생성될 수 있으나, 이에 한하지 않고, 대화 텍스트가 생성될 때마다 생성될 수도 있다.
도 7은 다양한 실시 예들에 의한 요약 정보의 일 예를 나타낸 도면이다.
도 7을 참조하면, 대화 텍스트(710)에 기초하여, 요약 정보 1(720) 및 요약 정보 2(730)가 획득될 수 있다.
일 실시 예에 의하면, 대화 텍스트(710) 중 먼저 획득된 제1 대화 텍스트(711)에 기초하여, 요약 텍스트로서, "Galaxy Note 10" 및 "2018-10"이 획득될 수 있다. 또한, 상기 요약 텍스트를 포함하는, 요약 정보 1(720)이 획득될 수 있다.
일 실시 예에 의하면, 제1 대화 텍스트(711) 이후에 수행된 대화에 기초하여, 제2 대화 텍스트(712)가 획득될 수 있다. 일 실시 예에 의한 제2 대화 텍스트(712)로부터 요약 텍스트로서 "Galaxy Note 8"이 획득될 수 있다. 일 실시 예에 의한 제2 대화 텍스트(712)로부터 획득된 요약 텍스트인, "Galaxy Note 8"의 타입과 동일한 타입을 가지는, 제1 대화 텍스트(711)에서 획득된 요약 텍스트로, "Galaxy Note 10"이 식별될 수 있다. 일 실시 예에 의하면, 현재 대화에서 획득된 요약 텍스트가 요약 정보로서 선택될 확률이 높아질 수 있도록, 식별된 "Galaxy Note 10"의 정확도를 나타내는 스코어가 더 낮게 조정될 수 있다.
일 실시 예에 의하면, 요약 정보 1(720) 또는 요약 정보 2(730)에서, 요약 텍스트에 대한 정확도를 나타내는 스코어가 기준값 이하인 경우에는, 정확도가 낮은 요약 텍스트를 나타내는 아이콘(721, 731)이 표시될 수 있다. 상술한 예에 한하지 않고, 각 타입에 대해 획득된 요약 텍스트의 정확도를 나타내는 다양한 형태의 정보가 표시될 수 있다.
또한, 요약 정보 1(720) 또는 요약 정보 2(730)에서, 미리 설정된 타입 중 요약 텍스트가 획득되지 않은 타입이 존재하는 경우, 상기 타입에 대해, 요약 텍스트가 획득되지 않음을 나타내는 정보가 추가적으로 포함될 수 있다. 또한, 요약 정보 1(720) 또는 요약 정보 2(730)에서, 어느 한 타입에 대하여 획득된 요약 텍스트가 복수 개 존재하고, 각 요약 텍스트의 스코어 값들이, 미리 설정된 유사범위 내의 값인 경우, 요약 텍스트에 대한 수정이 필요함을 나타내는 정보가 추가적으로 포함될 수 있다.
따라서, 일 실시 예에 의한 사용자는, 요약 정보 1(720) 또는 요약 정보 2(730)에서, 정확도가 낮거나 수정이 필요한 요약 텍스트나, 요약 텍스트가 획득되지 않은 타입을 확인하고, 직접 요약 정보를 수정하거나, 추가적인 대화(ex. "제품명"을 고객에게 다시 문의함)를 수행함으로써, 정확도가 높은 요약 텍스트를 포함하는 요약 정보가 다시 생성될 수 있다.
도 8은 다양한 실시 예들에 의한 요약 정보를 사용자에게 제공하는 일 예를 나타낸 도면이다.
도 8을 참조하면, 일 실시 예에 의한 전자 장치(1000)는, 대화 텍스트(810)와, 대화 텍스트(810)에 대한 요약 정보(820)를 사용자에게 제공할 수 있다.
일 실시 예에 의하면, 대화 텍스트(810) 중 요약 텍스트로서 추출된 텍스트 부분에 대해, 툴팁(811, 812, 813)이 표시될 수 있다. 일 실시 예에 의한 툴팁(811, 812, 813)은, 요약 텍스트와 대응되는 타입에 관한 정보를 포함할 수 있다. 따라서, 사용자는, 툴팁(811, 812, 813)에 기초하여, 요약 정보(820)의 요약 텍스트가 대화 텍스트(810) 중 어느 부분으로부터 추출된 것인지 및, 적절한 타입의 요약 텍스트로 추출되었는지 여부를 쉽게 확인할 수 있다.
일 실시 예에 의한 요약 정보(820)는 요약 폼(821)과 요약문(822)을 포함할 수 있다. 또한, 요약 정보(820)는, 제출 버튼(824) 및 수정 버튼(823)을 더 포함할 수 있다. 예를 들면, 고객과의 대화가 종료되면, 상담사는, 요약 정보(820)를 확인할 수 있고, 수정 버튼(823)이 입력됨에 따라, 요약 정보(820)가 추가적으로 더 수정될 수 있다. 또한, 요약 정보(820)에서 더 수정할 내용이 없는 경우, 상담사에 의해 제출 버튼(824)이 입력됨에 따라, 요약 정보(820)가 외부로 최종 제출될 수 있다. 예를 들면, 요약 정보(820)는, 여러 고객과의 상담 내용을 저장하기 위한 외부 서버(미도시)로 전달됨으로써, 최종 제출될 수 있다.
일 실시 예에 의하면, 실시간으로 진행되는 대화 내용을 요약하여 사용자에게 제공할 수 있다.
기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적 저장매체'는 실재(tangible)하는 장치를 의미할 수 있고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다. 예로, '비일시적 저장매체'는 데이터가 임시적으로 저장되는 버퍼를 포함할 수 있다.
일 실시예에 따르면, 본 개시에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품(예: 다운로더블 앱(downloadable app))의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
또한, 본 개시에서, “부”는 프로세서 또는 회로와 같은 하드웨어 구성(hardware component), 및/또는 프로세서와 같은 하드웨어 구성에 의해 실행되는 소프트웨어 구성(software component)일 수 있다.
본 개시가 다양한 예시적인 실시예를 참조하여 예시되고 설명되었지만, 다양한 예시적인 실시예가 제한이 아니라 예시적인 것으로 의도된다는 것이 이해될 것이다. 본 개시가 속하는 기술 분야의 통상의 지식을 가진 자는 첨부된 청구범위를 포함하는 본 개시의 기술적 사상이나 개시의 전체 범위를 벗어남이 없이 형태 및 세부 사항의 다양한 변경이 가능하다는 것을 이해할 수 있다.. 다양한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

Claims (15)

  1. 전자 장치에서, 대화 텍스트에 대한 요약 정보를 생성하는 방법에 있어서,
    이전 대화에 대한 적어도 하나의 대화 텍스트로부터 추출된 적어도 하나의 제1 요약 텍스트를 획득하는 단계;
    현재 대화에 대한 대화 텍스트로부터, 적어도 하나의 제2 요약 텍스트를 추출하는 단계;
    상기 적어도 하나의 제1 요약 텍스트 중 상기 적어도 하나의 제2 요약 텍스트의 타입과 동일한 타입을 가지는 요약 텍스트를 식별하는 단계;
    상기 식별된 요약 텍스트에 대한 정확도를 나타내는 스코어를 조정하는 단계; 및
    상기 적어도 하나의 제1 요약 텍스트 및 제2 요약 텍스트 중에서, 각 요약 텍스트에 대한 스코어에 기초하여, 지정된 적어도 하나의 타입에 각각 대응되는 요약 텍스트를 선택하는 단계; 및
    상기 선택된 요약 텍스트에 기초하여, 상기 요약 정보를 생성하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 스코어는,
    상기 각 요약 텍스트가 추출되는데 이용된, 대화 텍스트의 특징에 기초하여, 획득되는, 방법.
  3. 제2항에 있어서, 상기 스코어는,
    상기 각 요약 텍스트가 추출되는데 이용된, 상기 대화 텍스트에 이웃하는 적어도 하나의 대화 텍스트에 더 기초하여, 문맥적 흐름이 반영된 값으로, 수정되는, 방법.
  4. 제1항에 있어서, 상기 요약 텍스트는
    상기 지정된 적어도 하나의 타입별로, 상기 대화 텍스트로부터 추출된, 명칭 또는 주제를 포함하는, 방법.
  5. 제1항에 있어서, 상기 식별된 요약 텍스트의 스코어는,
    현재값보다 지정된 상수값만큼 적은 값을 가지도록 조정되는, 방법.
  6. 제1항에 있어서, 상기 요약 정보는
    상기 지정된 타입별로 각각 대응되는 요약 텍스트에 관한 정보를 포함하는 요약 폼 및 상기 요약 텍스트를 포함하는 적어도 하나의 문장을 포함하는 요약문 중 적어도 하나를 포함하는, 방법.
  7. 제1항에 있어서, 상기 요약 정보는,
    상기 지정된 적어도 하나의 타입 중 요약 텍스트가 획득되지 않은 타입이 존재하는것에 기초하여, 상기 타입에 대하여, 요약 텍스트가 획득되지 않음을 나타내는 정보를 추가적으로 포함하는, 방법.
  8. 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치에 있어서,
    이전 대화에 대한 적어도 하나의 대화 텍스트로부터 추출된 적어도 하나의 제1 요약 텍스트를 저장하는 메모리;
    현재 대화에 대한 대화 텍스트로부터, 적어도 하나의 제2 요약 텍스트를 추출하고, 상기 적어도 하나의 제1 요약 텍스트 중 상기 적어도 하나의 제2 요약 텍스트의 타입과 동일한 타입을 가지는 요약 텍스트를 식별하고, 상기 식별된 요약 텍스트에 대한 정확도를 나타내는 스코어를 조정하고, 상기 적어도 하나의 제1 요약 텍스트 및 제2 요약 텍스트 중에서, 각 요약 텍스트에 대한 스코어에 기초하여, 지정된 적어도 하나의 타입에 각각 대응되는 요약 텍스트를 선택하고, 상기 선택된 요약 텍스트에 기초하여, 상기 요약 정보를 생성하는 적어도 하나의 프로세서; 및
    상기 요약 정보를 출력하는 출력 회로를 포함하는 출력부를 포함하는, 전자 장치.
  9. 제8항에 있어서, 상기 스코어는,
    상기 각 요약 텍스트가 추출되는데 이용된, 대화 텍스트의 특징에 기초하여, 획득되는, 전자 장치.
  10. 제9항에 있어서, 상기 스코어는,
    상기 각 요약 텍스트가 추출되는데 이용된, 상기 대화 텍스트에 이웃하는 적어도 하나의 대화 텍스트에 더 기초하여, 문맥적 흐름이 반영된 값으로, 수정되는, 전자 장치.
  11. 제8항에 있어서, 상기 요약 텍스트는
    상기 지정된 적어도 하나의 타입별로, 상기 대화 텍스트로부터 추출된, 명칭 또는 주제를 포함하는, 전자 장치.
  12. 제8항에 있어서, 상기 식별된 요약 텍스트의 스코어는,
    현재값보다 지정된 상수값만큼 적은 값을 가지도록 조정되는, 전자 장치.
  13. 제8항에 있어서, 상기 요약 정보는
    상기 지정된 타입별로 각각 대응되는 요약 텍스트에 관한 정보를 포함하는 요약 폼 및 상기 요약 텍스트를 포함하는 적어도 하나의 문장을 포함하는 요약문 중 적어도 하나를 포함하는, 전자 장치.
  14. 제8항에 있어서, 상기 요약 정보는,
    상기 지정된 적어도 하나의 타입 중 요약 텍스트가 획득되지 않은 타입이 존재하는 것에 기초하여, 상기 타입에 대하여, 요약 텍스트가 획득되지 않음을 나타내는 정보를 추가적으로 포함하는, 전자 장치.
  15. 제1항의 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
PCT/KR2021/010575 2020-08-20 2021-08-10 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법 WO2022039433A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/441,766 US20220309231A1 (en) 2020-08-20 2021-08-10 Electronic device for generating summary information of conversation text and operating method thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200104808A KR20220023211A (ko) 2020-08-20 2020-08-20 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법
KR10-2020-0104808 2020-08-20

Publications (1)

Publication Number Publication Date
WO2022039433A1 true WO2022039433A1 (ko) 2022-02-24

Family

ID=80350494

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/010575 WO2022039433A1 (ko) 2020-08-20 2021-08-10 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법

Country Status (3)

Country Link
US (1) US20220309231A1 (ko)
KR (1) KR20220023211A (ko)
WO (1) WO2022039433A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230063713A1 (en) * 2021-08-31 2023-03-02 Paypal, Inc. Sentence level dialogue summaries using unsupervised machine learning for keyword selection and scoring
US20230376515A1 (en) * 2022-05-18 2023-11-23 Slack Technologies, Llc Generating summary documents for communications in a communication platform

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130006973A1 (en) * 2011-06-28 2013-01-03 Microsoft Corporation Summarization of Conversation Threads
KR101508260B1 (ko) * 2014-02-04 2015-04-07 성균관대학교산학협력단 문서 특징을 반영하는 요약문 생성 장치 및 방법
JP2019121139A (ja) * 2017-12-29 2019-07-22 Airev株式会社 要約装置、要約方法、及び要約プログラム
WO2020036190A1 (ja) * 2018-08-15 2020-02-20 日本電信電話株式会社 要点抽出装置、要点抽出方法、及びプログラム
KR20200021162A (ko) * 2018-08-20 2020-02-28 주식회사 부뜰정보시스템 상담원의 상담내용을 기반으로 상담 챗봇을 학습하는 시스템 및 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10764534B1 (en) * 2017-08-04 2020-09-01 Grammarly, Inc. Artificial intelligence communication assistance in audio-visual composition
US10498898B2 (en) * 2017-12-13 2019-12-03 Genesys Telecommunications Laboratories, Inc. Systems and methods for chatbot generation
US10782986B2 (en) * 2018-04-20 2020-09-22 Facebook, Inc. Assisting users with personalized and contextual communication content
US10388272B1 (en) * 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
JP7028198B2 (ja) * 2019-01-28 2022-03-02 日本電信電話株式会社 要約生成装置、方法、プログラム、及び記憶媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130006973A1 (en) * 2011-06-28 2013-01-03 Microsoft Corporation Summarization of Conversation Threads
KR101508260B1 (ko) * 2014-02-04 2015-04-07 성균관대학교산학협력단 문서 특징을 반영하는 요약문 생성 장치 및 방법
JP2019121139A (ja) * 2017-12-29 2019-07-22 Airev株式会社 要約装置、要約方法、及び要約プログラム
WO2020036190A1 (ja) * 2018-08-15 2020-02-20 日本電信電話株式会社 要点抽出装置、要点抽出方法、及びプログラム
KR20200021162A (ko) * 2018-08-20 2020-02-28 주식회사 부뜰정보시스템 상담원의 상담내용을 기반으로 상담 챗봇을 학습하는 시스템 및 방법

Also Published As

Publication number Publication date
KR20220023211A (ko) 2022-03-02
US20220309231A1 (en) 2022-09-29

Similar Documents

Publication Publication Date Title
US10956771B2 (en) Image recognition method, terminal, and storage medium
WO2020166896A1 (en) Electronic apparatus and controlling method thereof
WO2022039433A1 (ko) 대화 텍스트에 대한 요약 정보를 생성하는 전자 장치 및 그 동작 방법
WO2020204655A1 (en) System and method for context-enriched attentive memory network with global and local encoding for dialogue breakdown detection
WO2020060223A1 (ko) 애플리케이션의 번역 정보를 제공하는 디바이스 및 방법
US11227594B2 (en) Method and device for providing response to voice input of user
WO2022057435A1 (zh) 基于搜索的问答方法及存储介质
CN111737573A (zh) 资源推荐方法、装置、设备及存储介质
KR102517228B1 (ko) 사용자의 입력에 대한 외부 전자 장치의 응답 시간에 기반하여 지정된 기능을 제어하는 전자 장치 및 그의 방법
US11335348B2 (en) Input method, device, apparatus, and storage medium
CN110830368B (zh) 即时通讯消息发送方法及电子设备
WO2019125060A1 (ko) 전화번호 연관 정보를 제공하기 위한 전자 장치 및 그의 동작 방법
WO2021137657A1 (en) Method and apparatus for personalizing content recommendation model
US20230359541A1 (en) Electronic device for identifying force touch and method for operating same
WO2020050554A1 (ko) 전자 장치 및 그의 제어방법
WO2022227507A1 (zh) 唤醒程度识别模型训练方法及语音唤醒程度获取方法
WO2021149890A1 (ko) 사용자의 개인 모델을 학습하는 전자 장치 및 그 동작 방법
CN110750198A (zh) 一种表情发送方法及移动终端
WO2022039494A1 (ko) 단말의 모델을 갱신하는 서버 및 그 동작 방법
CN110837557A (zh) 摘要生成方法、装置、设备及介质
WO2022131476A1 (ko) 인공지능 모델을 변환하는 전자 장치 및 그 동작 방법
US11669694B2 (en) Electronic device for obtaining sentence corresponding to context information and operating method thereof
KR20190142192A (ko) 전자 장치 및 전자 장치의 제어 방법
CN115658857A (zh) 智能对话方法、装置、设备及存储介质
CN114844985A (zh) 数据质检方法、装置、设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21858520

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21858520

Country of ref document: EP

Kind code of ref document: A1