WO2023058256A1 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
WO2023058256A1
WO2023058256A1 PCT/JP2022/001146 JP2022001146W WO2023058256A1 WO 2023058256 A1 WO2023058256 A1 WO 2023058256A1 JP 2022001146 W JP2022001146 W JP 2022001146W WO 2023058256 A1 WO2023058256 A1 WO 2023058256A1
Authority
WO
WIPO (PCT)
Prior art keywords
telephone
information
address
user
call
Prior art date
Application number
PCT/JP2022/001146
Other languages
English (en)
French (fr)
Inventor
健一 町田
一比良 松井
隆朗 福冨
Original Assignee
Nttテクノクロス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nttテクノクロス株式会社 filed Critical Nttテクノクロス株式会社
Priority to JP2023552685A priority Critical patent/JPWO2023058256A1/ja
Publication of WO2023058256A1 publication Critical patent/WO2023058256A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing

Definitions

  • the present invention relates to an information processing device, an information processing method, and a program.
  • CTI Computer Telephony Integration
  • PBXs Primary branch exchanges
  • the free address system is a system in which an operator does not have a fixed seat and can select a seat freely or according to some rules. Under the free address system, the operator's seat may change on a daily basis.
  • CTI Middleware CBASE/Core NTT Technocross
  • Internet https://www.ntt-tx.co.jp/products/ctbase/core.html>
  • An embodiment of the present invention has been made in view of the above points, and aims to associate a call with an operator.
  • an information processing apparatus provides user identification for identifying a user using a telephone, based on predetermined first information transmitted from a terminal connected via a communication network.
  • a setting unit that associates and sets predetermined second information that can be obtained from a voice packet in a call between the phone and another phone with respect to the information; and a call between the phone and the other phone.
  • a specifying unit that acquires the second information from the voice packet and specifies the user identification information linked to the acquired second information when the voice packet is received in the above.
  • the call and the operator can be linked.
  • FIG. 4 is a diagram for explaining an example of a method of linking a call and an operator according to the first embodiment;
  • FIG. It is a figure showing an example of functional composition of a contact center system concerning a first embodiment.
  • FIG. 7 is a sequence diagram showing an example of processing at logon or logoff according to the first embodiment;
  • 4 is a sequence diagram showing an example of speech recognition processing according to the first embodiment;
  • FIG. It is a figure which shows an example of an operator screen. It is a figure for demonstrating an example of the connection method of the telephone call and operator which concern on 2nd embodiment.
  • FIG. 4 is a diagram for explaining an example of a method of linking a call and an operator according to the first embodiment
  • FIG. It is a figure showing an example of functional composition of a contact center system concerning a first embodiment.
  • FIG. 7 is a sequence diagram showing an example of processing at logon or logoff according to the
  • FIG. 11 is a sequence diagram showing an example of processing at the time of logon or logoff according to the second embodiment;
  • FIG. 10 is a sequence diagram showing an example of speech recognition processing according to the second embodiment;
  • FIG. 11 is a diagram (part 1) for explaining an application example;
  • FIG. 12 is a diagram (part 2) for explaining an application example;
  • a first embodiment and a second embodiment will be described below as one embodiment of the present invention.
  • a contact center when a contact center is targeted for voice recognition of a call (voice call) with a customer, the call is associated with the operator who is responding to the call without CTI cooperation.
  • a contact center system 1 capable of However, the contact center is just an example, and other than the contact center, for example, when linking a call to a person in charge who works in an office, etc. It is possible to apply More generally, it can be similarly applied to linking a call with a person who is answering the call.
  • FIG. 1 shows an example of the overall configuration of a contact center system 1 according to this embodiment.
  • the contact center system 1 includes a voice recognition system 10, a plurality of operator terminals 20, a plurality of telephones 30, one or more manager terminals 40, a PBX 50, A NW switch 60 and a customer terminal 70 are included.
  • the voice recognition system 10, the operator terminal 20, the telephone 30, the administrator terminal 40, the PBX 50, and the NW switch 60 are installed in the contact center environment E, which is the system environment of the contact center.
  • the contact center environment E is not limited to the system environment in the same building, and may be, for example, system environments in a plurality of geographically separated buildings.
  • the voice recognition system 10 uses packets (voice packets) transmitted from the NW switch 60 to convert the call between the customer and the operator into text by voice recognition, and identifies the operator who is answering the call. do.
  • the operator terminal 20 is a terminal such as a PC (personal computer) used by the operator.
  • the telephone 30 is an IP (Internet Protocol) telephone (fixed IP telephone, mobile IP telephone, etc.) used by an operator.
  • IP Internet Protocol
  • the contact center adopts a free address system, and that the operator's seat can change daily (or, for example, between morning and afternoon, at some timing such as a change in the work in charge, etc.).
  • the contact center adopts a free address system, and that the operator's seat can change daily (or, for example, between morning and afternoon, at some timing such as a change in the work in charge, etc.).
  • one operator terminal 20 and one telephone 30 are installed at each operator's seat, and the IP address of the operator terminal 20 and the IP address of the telephone 30 are fixed. It is often associated with a one-to-one relationship.
  • one operator terminal 20 and one telephone 30 are installed at each operator's seat. and the IP address of are fixedly associated one-to-one. Specifically, for example, one operator terminal 20 and one telephone 30 are fixedly installed on the desk of each operator's seat, and the IP address of the operator terminal 20 and the telephone 30 are fixedly assigned, and the IP addresses of the operator terminal 20 and the telephone 30 installed in the same seat are associated with each other.
  • the administrator terminal 40 is a terminal such as a PC used by an administrator who manages multiple operators (such an administrator is also called a supervisor). Although only one administrator terminal 40 is illustrated in the example shown in FIG. 1, a plurality of administrator terminals 40 may exist.
  • the PBX 50 is a telephone exchange (IP-PBX) and is connected to a communication network 80 including a VoIP (Voice over Internet Protocol) network and a PSTN (Public Switched Telephone Network).
  • IP-PBX telephone exchange
  • VoIP Voice over Internet Protocol
  • PSTN Public Switched Telephone Network
  • the NW switch 60 relays packets between the telephone 30 and the PBX 50, captures the packets, and transmits them to the speech recognition system 10.
  • the customer terminals 70 are various terminals such as smart phones, mobile phones, and landline phones used by customers.
  • the overall configuration of the contact center system 1 shown in FIG. 1 is an example, and other configurations may be used.
  • the speech recognition system 10 is included in the contact center environment E (that is, the speech recognition system 10 is an on-premise type), but all or part of the functions of the speech recognition system 10 are realized by a cloud service or the like.
  • the PBX 50 is an on-premise telephone exchange, but may be realized by cloud services.
  • logon may also be referred to as login.
  • the contact center system 1 associates the call with the operator according to (1-1) to (1-4) below.
  • the operator terminal 20 transmits the logon ID used for the operator's logon to the voice recognition system 10 in response to the operator's logon.
  • the speech recognition system 10 has an address table storage unit 110 in which the address table 1000 is stored and a user information table storage unit 120 in which the user information table 2000 is stored.
  • the IP address of the telephone 30 (hereinafter referred to as telephone IP address) and the IP address of the operator terminal 20 (hereinafter referred to as terminal IP address) are stored in the address table 1000 in a one-to-one correspondence.
  • User IDs (logon IDs) are stored in the user information table 2000 so as to be associated with telephone IP addresses. Note that, for example, before the telephone IP address and the user ID (logon ID) are associated, only the user ID (logon ID) is stored in the user information table 2000 (or a NULL value is stored as the telephone IP address). Or a user ID (logon ID) associated with a blank is stored.).
  • the speech recognition system 10 upon receiving the logon ID from the operator terminal 20, the speech recognition system 10 refers to the address table 1000 and identifies the telephone IP address linked to the terminal IP address of the operator terminal 20.
  • the telephone IP address "192.168.11.3" is specified.
  • the voice recognition system 10 selects the user ID that matches the logon ID received from the operator terminal 20 for the above (1- The telephone IP address specified in 2) is linked and set.
  • the logon ID is "user3”
  • the telephone IP address specified in (1-2) above is "192.168.11.3”
  • this logon ID "user3” In contrast, the telephone IP address "192.168.11.3” is associated and set.
  • the NW switch 60 captures the call packet (voice packet) and transmits it to the voice recognition system 10. do.
  • This packet contains the IP address of the telephone 30 (telephone IP address).
  • the voice recognition system 10 refers to the user information table 2000 to identify the user ID associated with the telephone IP address included in the packet. As a result, the user ID of the operator who is answering the call is identified, and the call is associated with the operator identified by the user ID.
  • FIG. 3 shows functional configurations of the voice recognition system 10 and the operator terminal 20 included in the contact center system 1 according to this embodiment.
  • the speech recognition system 10 has a telephone IP identification unit 101, a user ID setting unit 102, a user ID identification unit 103, and a speech recognition text conversion unit 104. These units are implemented by, for example, one or more programs installed in the speech recognition system 10 causing a processor such as a CPU (Central Processing Unit) to execute processing.
  • the speech recognition system 10 according to this embodiment also has an address table storage unit 110 , a user information table storage unit 120 and a call history information storage unit 130 .
  • These units can be implemented by storage devices such as HDDs (Hard Disk Drives), SSDs (Solid State Drives), and flash memories.
  • the telephone IP identification unit 101 refers to the address table 1000 and identifies the telephone IP address from the terminal IP address.
  • User ID setting unit 102 assigns a telephone IP address specified by telephone IP specifying unit 101 to a user ID that matches the logon ID received from operator terminal 20 among the user IDs stored in user information table 2000 . set.
  • the user ID identifying unit 103 refers to the user information table 2000 and identifies the user ID associated with the telephone IP address included in the packet transmitted from the NW switch 60.
  • the speech recognition text conversion unit 104 performs speech recognition on the speech data included in the packet transmitted from the NW switch 60, and converts the speech represented by the speech data into text. Note that the voice recognition text conversion unit 104 may convert both the operator's voice and the customer's voice into text, or may convert only one of the voices into text.
  • the speech recognition text conversion unit 104 transmits the text (speech recognition result) to the operator terminal 20 logged on with the user ID (logon ID) specified by the user ID specifying unit 103 . Furthermore, the speech recognition text conversion unit 104 associates the text with the call ID that identifies the call and the user ID specified by the user ID specifying unit 103, and converts the text into call history information 3000, which is the call history information storage unit. Save to 130.
  • the address table storage unit 110 stores an address table 1000.
  • the IP addresses of the operator terminal 20 and the telephone 30 installed in the same seat are stored in a one-to-one correspondence. That is, in the address table 1000, for each seat, the terminal IP address of the operator terminal 20 installed at that seat and the telephone IP address of the telephone 30 installed at that seat are linked one-to-one. stored. Note that the address table 1000 is appropriately updated when the operator terminal 20 or the telephone 30 is added or deleted, or when the IP address assignment is changed.
  • the user information table storage unit 120 stores a user information table 2000.
  • User IDs (logon IDs) are stored in the user information table 2000 so as to be associated with telephone IP addresses. Note that when a user ID is added or deleted, the user ID stored in the user information table 2000 is appropriately added or deleted.
  • the call history information storage unit 130 stores call history information 3000.
  • the call history information 3000 is a speech recognition result (text) in which a call ID and a user ID are linked.
  • the call history information 3000 may include, for example, the voice data of the call represented by the call ID, or some kind of text obtained from the voice data.
  • Information for example, information such as speech speed may be given.
  • the operator terminal 20 has a logon ID transmission section 201 and a UI control section 202 . These units are implemented by, for example, one or more programs installed in the operator terminal 20 causing a processor such as a CPU to execute.
  • the logon ID transmission unit 201 transmits the logon ID used for this logon to the speech recognition system 10 in response to the operator's logon or logoff. Note that this can be realized, for example, by a script that is executed at logon or logoff.
  • the UI control unit 202 displays the text representing the speech recognition result transmitted from the speech recognition system 10 on the screen (for example, the operator screen to be described later). In addition to this, the UI control unit 202 receives various input operations from the operator.
  • steps S101 to S104 in FIG. 4 are for login processing, and steps S105 to S107 are for logoff processing.
  • the logon ID transmission section 201 of the operator terminal 20 transmits the logon ID used for the logon to the voice recognition system 10 (step S102).
  • the telephone IP specifying unit 101 of the voice recognition system 10 Upon receiving the logon ID, the telephone IP specifying unit 101 of the voice recognition system 10 refers to the address table 1000 to find the IP address (terminal IP address) of the operator terminal 20 that sent the logon ID. The IP address of the telephone is specified (step S103).
  • the user ID setting unit 102 of the speech recognition system 10 selects the user ID that matches the log-on ID received from the operator terminal 20 among the user IDs stored in the user information table 2000 in step S103.
  • the identified telephone IP address is set (step S104). As a result, the telephone IP address is associated with the user ID.
  • user IDs are stored in advance in the user information table 2000, and one of these user IDs is associated with the telephone IP address.
  • the user ID is not stored in advance in the user information table 2000, and the logon ID received from the operator terminal 20 and the telephone IP address specified in step S103 are linked and stored in the user information table 2000.
  • the logon ID transmission unit 201 of the operator terminal 20 transmits the logged off logon ID to the voice recognition system 10 (step S106).
  • the user ID setting unit 102 of the voice recognition system 10 deletes the telephone IP address associated with the user ID that matches the logon ID received from the operator terminal 20, among the user IDs stored in the user information table 2000. (step S107). As a result, the association between the user ID and the telephone IP address is released.
  • the user IDs are assumed to be stored in advance in the user information table 2000, and the telephone IP address associated with one of these user IDs is deleted. is not limited to For example, if the user ID is not stored in advance in the user information table 2000, the set of the logon ID received from the operator terminal 20 and the associated telephone IP address can be deleted from the user information table 2000. good.
  • ⁇ Voice recognition processing> it is assumed that the operator is logged on to the operator terminal 20 and is talking with the customer terminal 70 using the telephone 30 installed in the same seat as the operator terminal 20 .
  • processing for performing speech recognition of the call and displaying the result on the display of the operator terminal 20 will be described with reference to FIG.
  • packets (voice packets) of the call are captured by the NW switch 60, and each time or a predetermined amount of data is buffered. After that, it is sent to the speech recognition system 10 .
  • This voice packet contains the IP addresses of the telephone 30 and the customer terminal 70 that are communicating with each other.
  • the user ID identification unit 103 of the speech recognition system 10 refers to the user information table 2000 to identify the IP address of the telephone associated with the packet.
  • user ID is specified (step S202). As a result, the user ID of the operator who is answering the call is specified, and the call and the operator are linked.
  • the speech recognition text conversion unit 104 of the speech recognition system 10 performs speech recognition on the speech data included in the packet, and converts the speech represented by the speech data into text (step S203).
  • the speech recognition text conversion unit 104 of the speech recognition system 10 sends the text (voice recognition result) is transmitted (step S204).
  • the speech recognition text conversion unit 104 of the speech recognition system 10 associates the text obtained in step S204 with the call ID that identifies the call and the user ID specified in step S202. is stored in the call history information storage unit 130 as the call history information 3000 (step S205).
  • the text is associated with the call ID and the user ID and stored as the call history information 3000 in the call history information storage unit 130 .
  • the call ID and the user ID may be associated with all the texts obtained in the call and stored as the call history information 3000 in the call history information storage unit 130 .
  • the UI control unit 202 of the operator terminal 20 When the UI control unit 202 of the operator terminal 20 receives the text representing the speech recognition result, it displays this text on the display (step S206). For example, it is assumed that the operator screen G1000 shown in FIG. 6 is displayed on the display of the operator terminal 20 concerned. This operator screen G1000 includes an utterance display field G1100 in which the utterances of the operator and the customer are displayed as text. are displayed in chronological order for each speaker. As a result, the operator can check the contents of each utterance of each utterer during a call in real time in text form.
  • the contact center system 1 associates a call with an operator according to (2-1) to (2-3) below.
  • the operator terminal 20 recognizes the logon ID used for this logon and the phone number of the telephone 30 installed in the same seat as the operator terminal 20 by voice recognition. Send to system 10 .
  • this telephone number may be set in the operator terminal 20 in advance as a setting file or the like, for example.
  • the speech recognition system 10 has the user information table storage unit 120, and the user information table 2000 stores a user ID (logon ID) is stored. Note that, for example, before the telephone number of the telephone 30 and the user ID (logon ID) are associated, only the user ID (logon ID) is stored in the user information table 2000 (or the telephone number of the telephone 30 A user ID (logon ID) associated with a NULL value or blank is stored as a number.).
  • the voice recognition system 10 receives the logon ID and the telephone number from the operator terminal 20, the voice recognition system 10, among the user IDs stored in the user information table 2000, recognizes the user ID that matches the logon ID.
  • Set a phone number In the example shown in FIG. 7, for example, if the logon ID is "user3" and the telephone number is "090-1234-5678", the telephone number "090-1234-5678" is linked to this logon ID "user3". is set with
  • the NW switch 60 captures the call packet (voice packet) and transmits it to the voice recognition system 10. do.
  • This packet contains the telephone number of the telephone 30 concerned.
  • the speech recognition system 10 refers to the user information table 2000 to identify the user ID associated with the telephone number included in the packet. As a result, the user ID of the operator who is answering the call is identified, and the call is associated with the operator identified by the user ID.
  • FIG. 8 shows functional configurations of the voice recognition system 10 and the operator terminal 20 included in the contact center system 1 according to this embodiment.
  • the speech recognition system 10 differs from the first embodiment in that it does not have the telephone IP identification unit 101 and the address table storage unit 110.
  • FIG. Further, the user information table 2000 according to this embodiment differs from the first embodiment in that user IDs (logon IDs) are stored so as to be associated with the telephone number of the telephone 30 .
  • the operator terminal 20 has a logon ID transmission unit 201 and a UI control unit 202 as in the first embodiment. It is different from the first embodiment in that the telephone number is also sent in addition to the logon ID in response to the operator's logon.
  • the logon ID transmission unit 201 of the operator terminal 20 transmits the logon ID used for the logon and the telephone number of the telephone 30 installed in the same seat as the operator terminal 20.
  • the telephone number is transmitted to the speech recognition system 10 (step S302). It is assumed that the telephone number of the telephone 30 installed at the same seat is preset in the operator terminal 20 as a setting file or the like.
  • the user ID setting unit 102 of the voice recognition system 10 Upon receiving the logon ID and the telephone number from the operator terminal 20, the user ID setting unit 102 of the voice recognition system 10 selects the user ID that matches the logon ID from among the user IDs stored in the user information table 2000. to set the telephone number (step S303). As a result, the telephone number is associated with the user ID.
  • user IDs are stored in advance in the user information table 2000, and one of these user IDs is associated with a telephone number.
  • the user ID is not stored in the user information table 2000 in advance, and the logon ID and the telephone number received from the operator terminal 20 may be linked and stored in the user information table 2000 .
  • the logon ID transmission unit 201 of the operator terminal 20 transmits the logged off logon ID to the voice recognition system 10 (step S305).
  • the user ID setting unit 102 of the voice recognition system 10 deletes the telephone number associated with the user ID that matches the logon ID received from the operator terminal 20, among the user IDs stored in the user information table 2000. (Step S306). As a result, the association between the user ID and the telephone number is released.
  • user IDs are stored in advance in the user information table 2000, and the telephone number associated with one of these user IDs is deleted. Not limited. For example, if the user ID is not stored in advance in the user information table 2000, the set of the logon ID received from the operator terminal 20 and the associated telephone number may be deleted from the user information table 2000. .
  • the speech recognition processing according to this embodiment will be described below with reference to FIG.
  • the voice packet of the call between the telephone 30 and the customer terminal 70 contains the telephone numbers of the telephone 30 and the customer terminal 70 communicating with each other.
  • the user ID identifying unit 103 of the speech recognition system 10 refers to the user information table 2000 and associates it with the telephone number of the telephone 30 included in the packet. specified user ID (step S402). As a result, the user ID of the operator who is answering the call is specified, and the call and the operator are linked.
  • Steps S403 to S406 that follow are the same as steps S203 to S206 in FIG. 5, respectively.
  • an IP address is used to associate a call with an operator, but a MAC (Media Access Control) address may be used instead of the IP address.
  • the address table 1000 stores the MAC address of the operator terminal 20 and the MAC address of the telephone 30 installed in the same seat in a one-to-one correspondence.
  • User IDs are stored in the user information table 2000 so as to be associated with the MAC address of the telephone 30 .
  • any information that can be obtained from the voice packet and that can identify the telephone 30 can be used instead of the IP address.
  • the operator terminal 20 and the telephone 30 are installed at each operator's seat. may be introduced.
  • the telephone 30 may not be installed in the seat where the operator terminal 20 installed with the softphone is installed.
  • the IP address (terminal IP address) of the operator terminal 20 installed with the softphone matches the telephone IP address.
  • ⁇ Application example 1> By associating the call with the operator, the administrator can use the administrator terminal 40 to check the content of each utterance in the call by text for each operator in real time or offline, for example.
  • the operator support screen G2000 shown in FIG. 11 is displayed on the display of the administrator terminal 40.
  • the operator support screen G2000 includes a call selection field G2100 in which a list of calls and operator names of the calls is displayed, and an utterance content display field in which the utterance content of the call selected in the call selection field G2100 is displayed in text. G2200 and. Therefore, by selecting a desired call from the call selection field G2100, the administrator can confirm the content of the speech in this call in the speech content display field G2200. As a result, the administrator can, for example, assist an inexperienced operator or check whether the operator is speaking inappropriately.
  • ⁇ Application example 2> Various analyzes (for example, analysis of whether or not appropriate words are being uttered according to the scene, whether or not the speech rate is appropriate, analysis for grasping utterance trends, etc.) are performed on the call history information 3000. By visiting and evaluating the call response quality, for example, it is possible to support the improvement of customer satisfaction. Such response quality evaluation results are displayed on the display of the manager terminal 40 (or the operator terminal 20, or a terminal used by a person in charge of quality control, etc.).
  • the response quality evaluation screen G3000 shown in FIG. 12 is a screen on which the response quality of calls is scored for each operator and displayed so as to allow comparison.
  • the manager, the person in charge of quality, and the like can consider measures for improving the quality of call response and educate operators.
  • the contact center system 1 uses information obtained from the operator terminal 20 installed at the same seat as the telephone 30 (logon ID, or the logon ID and the telephone number of the telephone 30). can be used to associate a call with the operator who is answering the call. As a result, in the contact center system 1 according to the present embodiment, it is possible to realize various functions that are possible when CTI cooperation is performed without CTI cooperation.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一実施形態に係る情報処理装置は、通信ネットワークを介して接続される端末から送信された所定の第1の情報に基づいて、電話機を利用するユーザを識別するユーザ識別情報に対して、前記電話機と他の電話機との間の通話における音声パケットから取得可能な所定の第2の情報を紐付けて設定する設定部と、前記電話機と他の電話機との間の通話における音声パケットを受信すると、前記音声パケットから前記第2の情報を取得し、取得した前記第2の情報に紐付けられているユーザ識別情報を特定する特定部と、を有する。

Description

情報処理装置、情報処理方法及びプログラム
 本発明は、情報処理装置、情報処理方法及びプログラムに関する。
 近年、コンタクトセンタ(又は、コールセンタとも呼ばれる。)では、オペレータの業務支援や業務効率化、顧客満足度向上等を目的として、CTI(Computer Telephony Integration)が導入されることが多くなってきている。CTIとは、音声認識システムや顧客管理システム等といったコンピュータと電話機やPBX(Private branch exchange)とを統合・連携させる仕組みのことである(例えば、非特許文献1)。CTIを導入することで、例えば、音声認識システムとPBXとを連携させて、コンタクトセンタの通話に対して音声認識を行うこと等が可能となる。以下、CTIを導入し、コンピュータと電話機やPBXとを連携させることを「CTI連携」とも呼ぶ。
 ところで、近年では、オペレータの着座座席に関してフリーアドレス制を採用するコンタクトセンタが増えている。フリーアドレス制とは、オペレータが固定的な座席を持たず、自由に又は何等かのルールに従って座席を選択できる仕組みのことである。フリーアドレス制ではオペレータの座席は日々変わり得るが、CTI連携によって音声認識を行うことで、音声認識された通話とオペレータとを紐付けることが可能となる。
"CTIミドルウェア「CTBASE/Core」 | NTTテクノクロス",インターネット<URL:https://www.ntt-tx.co.jp/products/ctbase/core.html>
 しかしながら、コンタクトセンタに音声認識システムを導入して通話の音声認識を行いたい一方で、様々な事情によりCTIを導入できない場合もある。例えば、既設のPBXがCTI連携機能を備えていない又はキャパティ不足によりCTI連携が困難であるが、PBXの入れ替えコストは許容できないような場合である。
 このような場合、特にフリーアドレス制を採用しているコンタクトセンタでは、音声認識された通話とオペレータとの紐付けができない、という問題がある。このため、どの音声認識結果がどのオペレータの通話に関するものであるかを紐付けることができない。
 本発明の一実施形態は、上記の点に鑑みてなされたもので、通話とオペレータとを紐付けることを目的とする。
 上記目的を達成するため、一実施形態に係る情報処理装置は、通信ネットワークを介して接続される端末から送信された所定の第1の情報に基づいて、電話機を利用するユーザを識別するユーザ識別情報に対して、前記電話機と他の電話機との間の通話における音声パケットから取得可能な所定の第2の情報を紐付けて設定する設定部と、前記電話機と他の電話機との間の通話における音声パケットを受信すると、前記音声パケットから前記第2の情報を取得し、取得した前記第2の情報に紐付けられているユーザ識別情報を特定する特定部と、を有する。
 通話とオペレータとを紐付けることができる。
第一の実施形態に係るコンタクトセンタシステムの全体構成の一例を示す図である。 第一の実施形態に係る通話とオペレータの紐付け方法の一例を説明するための図である。 第一の実施形態に係るコンタクトセンタシステムの機能構成の一例を示す図である。 第一の実施形態に係るログオン時又はログオフ時の処理の一例を示すシーケンス図である。 第一の実施形態に係る音声認識処理の一例を示すシーケンス図である。 オペレータ画面の一例を示す図である。 第二の実施形態に係る通話とオペレータの紐付け方法の一例を説明するための図である。 第二の実施形態に係るコンタクトセンタシステムの機能構成の一例を示す図である。 第二の実施形態に係るログオン時又はログオフ時の処理の一例を示すシーケンス図である。 第二の実施形態に係る音声認識処理の一例を示すシーケンス図である。 応用例を説明するための図(その1)である。 応用例を説明するための図(その2)である。
 以下、本発明の一実施形態として第一の実施形態と第二の実施形態について説明する。以下、各実施形態では、コンタクトセンタを対象として、顧客との通話(音声通話)を音声認識する際に、CTI連携せずに、当該通話とその通話に応対しているオペレータとを紐付けることが可能なコンタクトセンタシステム1について説明する。ただし、コンタクトセンタは一例であって、コンタクトセンタ以外にも、例えば、オフィス等で勤務する担当者を対象として、通話とその通話に応対している担当者とを紐付ける場合等にも同様に適用することが可能である。より一般には、ある通話とその通話に応対している人とを紐付ける場合にも同様に適用することが可能である。
 [第一の実施形態]
 まず、第一の実施形態について説明する。
 <コンタクトセンタシステム1の全体構成>
 本実施形態に係るコンタクトセンタシステム1の全体構成例を図1に示す。図1に示すように、本実施形態に係るコンタクトセンタシステム1には、音声認識システム10と、複数のオペレータ端末20と、複数の電話機30と、1以上の管理者端末40と、PBX50と、NWスイッチ60と、顧客端末70とが含まれる。ここで、音声認識システム10、オペレータ端末20、電話機30、管理者端末40、PBX50、及びNWスイッチ60は、コンタクトセンタのシステム環境であるコンタクトセンタ環境E内に設置されている。なお、コンタクトセンタ環境Eは同一の建物内のシステム環境に限られず、例えば、地理的に離れた複数の建物内のシステム環境であってもよい。
 音声認識システム10は、NWスイッチ60から送信されたパケット(音声パケット)を用いて、顧客とオペレータとの間の通話を音声認識によりテキストに変換すると共に、その通話に応対しているオペレータを特定する。
 オペレータ端末20は、オペレータが利用するPC(パーソナルコンピュータ)等の端末である。電話機30は、オペレータが利用するIP(Internet Protocol)電話機(固定IP電話機又は携帯IP電話機等)である。ここで、以下では、コンタクトセンタではフリーアドレス制が採用されており、オペレータの座席が日々(又は、例えば、午前と午後の間、担当業務の変更等といった何等かのタイミングで)変わり得ることを想定する。一方で、一般的なコンタクトセンタでは、オペレータの各座席には1台のオペレータ端末20と1台の電話機30とが設置されており、オペレータ端末20のIPアドレスと電話機30のIPアドレスとが固定的に1対1に紐付けられていることが多い。そこで、本実施形態でも、このようなコンタクトセンタを想定し、オペレータの各座席には1台のオペレータ端末20と1台の電話機30とが設置されており、オペレータ端末20のIPアドレスと電話機30のIPアドレスとが固定的に1対1に紐付けられているものとする。具体的には、例えば、オペレータの各座席のデスク上には1台のオペレータ端末20と1台の電話機30とが固定的に設置されていると共に、当該オペレータ端末20のIPアドレスと当該電話機30のIPアドレスとが固定的に割り当てられており、同一座席に設置されているオペレータ端末20と電話機30のIPアドレスは互いに紐付けられているものとする。
 管理者端末40は、複数のオペレータを管理する管理者(このような管理者はスーパバイザとも呼ばれる。)が利用するPC等の端末である。なお、図1に示す例では管理者端末40が1台のみ図示されているが、管理者端末40は複数台存在してもよい。
 PBX50は、電話交換機(IP-PBX)であり、VoIP(Voice over Internet Protocol)網やPSTN(Public Switched Telephone Network)を含む通信ネットワーク80に接続されている。
 NWスイッチ60は、電話機30とPBX50との間でパケットを中継すると共に、そのパケットをキャプチャして音声認識システム10に送信する。
 顧客端末70は、顧客が利用するスマートフォンや携帯電話、固定電話等の各種端末である。
 なお、図1に示すコンタクトセンタシステム1の全体構成は一例であって、他の構成であってもよい。例えば、音声認識システム10がコンタクトセンタ環境Eに含まれているが(つまり、音声認識システム10はオンプレミス型であるが)、音声認識システム10の全部又は一部の機能がクラウドサービス等により実現されていてもよい。同様に、図1に示す例では、PBX50はオンプレミス型の電話交換機であるが、クラウドサービスにより実現されていてもよい。
 <通話とオペレータの紐付け方法>
 本実施形態に係るコンタクトセンタシステム1で通話とオペレータとを紐付ける方法例について、図2を参照しながら説明する。ここで、各オペレータは、電話応対業務を開始する際に、自身の座席を選択し、その座席のオペレータ端末20に自身のログオンIDでログオンするものとする。また、その座席を利用しなくなった場合、オペレータは、その座席のオペレータ端末20からログオフするものとする。なお、典型的には、オペレータは出勤時にその日に利用する座席を選択するが、これに限られず、例えば、午前と午後で異なる座席を利用してもよいし、担当業務が変更になった際に座席を変更してもよいし、その他の何等かのタイミングで座席を変更してもよい。
 また、以下では簡単のため、オペレータを識別するユーザIDと、オペレータ端末20へのログオンに用いられるログオンIDとが一致しているものとする。ただし、ユーザIDとログオンIDとが1対1に紐付けられていれば、必ずしも一致している必要はない。なお、ログオンはログインと呼ばれてもよい。
 このとき、本実施形態に係るコンタクトセンタシステム1は、以下の(1-1)~(1-4)により通話とオペレータとを紐付ける。
 (1-1)まず、オペレータ端末20は、オペレータのログオンに応じて、このログオンに用いられたログオンIDを音声認識システム10に送信する。
 (1-2)音声認識システム10はアドレステーブル1000が記憶されたアドレステーブル記憶部110とユーザ情報テーブル2000が記憶されたユーザ情報テーブル記憶部120とを有している。アドレステーブル1000には、電話機30のIPアドレス(以下、電話機IPアドレスという。)とオペレータ端末20のIPアドレス(以下、端末IPアドレスという。)とが1対1に紐付けて格納されている。また、ユーザ情報テーブル2000には、電話機IPアドレスと紐付け可能なようにユーザID(ログオンID)が格納されている。なお、例えば、電話機IPアドレスとユーザID(ログオンID)とが紐付けられる前は、ユーザ情報テーブル2000には当該ユーザID(ログオンID)のみが格納されている(又は、電話機IPアドレスとしてNULL値又はブランクと紐付けられたユーザID(ログオンID)が格納されている。)。
 このとき、音声認識システム10は、オペレータ端末20からログオンIDを受信すると、アドレステーブル1000を参照して、当該オペレータ端末20の端末IPアドレスに紐付けられている電話機IPアドレスを特定する。図2に示す例では、例えば、当該オペレータ端末20の端末IPアドレスが「192.168.110.3」である場合、電話機IPアドレス「192.168.11.3」が特定される。
 (1-3)次に、音声認識システム10は、ユーザ情報テーブル2000に格納されているユーザIDのうち、オペレータ端末20から受信したログオンIDと一致するユーザIDに対して、上記の(1-2)で特定した電話機IPアドレスを紐付けて設定する。図2に示す例では、例えば、ログオンIDが「user3」、上記の(1-2)で特定した電話機IPアドレスが「192.168.11.3」である場合、このログオンID「user3」に対して電話機IPアドレス「192.168.11.3」が紐付けて設定される。
 (1-4)その後、PBX50を介して電話機30と顧客端末70との間で通話が行われた場合、NWスイッチ60はその通話のパケット(音声パケット)をキャプチャし、音声認識システム10に送信する。なお、このパケットには当該電話機30のIPアドレス(電話機IPアドレス)が含まれる。
 このとき、音声認識システム10は、ユーザ情報テーブル2000を参照して、当該パケットに含まれる電話機IPアドレスに紐付けられているユーザIDを特定する。これにより、当該通話に応対しているオペレータのユーザIDが特定され、当該通話と当該ユーザIDによって識別されるオペレータとが紐付けられたことになる。
 <コンタクトセンタシステム1の機能構成>
 本実施形態に係るコンタクトセンタシステム1に含まれる音声認識システム10及びオペレータ端末20の機能構成を図3に示す。
  ≪音声認識システム10≫
 図3に示すように、本実施形態に係る音声認識システム10は、電話機IP特定部101と、ユーザID設定部102と、ユーザID特定部103と、音声認識テキスト変換部104とを有する。これら各部は、例えば、音声認識システム10にインストールされた1以上のプログラムが、CPU(Central Processing Unit)等のプロセッサに実行させる処理により実現される。また、本実施形態に係る音声認識システム10は、アドレステーブル記憶部110と、ユーザ情報テーブル記憶部120と、通話履歴情報記憶部130とを有する。これら各部は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)、フラッシュメモリ等の記憶装置により実現可能である。
 電話機IP特定部101は、アドレステーブル1000を参照して、端末IPアドレスから電話機IPアドレスを特定する。
 ユーザID設定部102は、ユーザ情報テーブル2000に格納されているユーザIDのうち、オペレータ端末20から受信したログオンIDと一致するユーザIDに対して、電話機IP特定部101によって特定された電話機IPアドレスを設定する。
 ユーザID特定部103は、ユーザ情報テーブル2000を参照して、NWスイッチ60から送信されたパケットに含まれる電話機IPアドレスに紐付けられているユーザIDを特定する。
 音声認識テキスト変換部104は、NWスイッチ60から送信されたパケットに含まれる音声データに対して音声認識を行って、当該音声データが表す音声をテキストに変換する。なお、音声認識テキスト変換部104は、オペレータの音声と顧客の音声の両方をテキストに変換してもよいし、いずれか一方の音声のみをテキストに変換してもよい。
 また、音声認識テキスト変換部104は、ユーザID特定部103によって特定されたユーザID(ログオンID)でログオンされているオペレータ端末20に対して当該テキスト(音声認識結果)を送信する。更に、音声認識テキスト変換部104は、当該テキストに対して、当該通話を識別する通話IDとユーザID特定部103によって特定されたユーザIDとを紐付けて通話履歴情報3000として通話履歴情報記憶部130に保存する。
 アドレステーブル記憶部110は、アドレステーブル1000を記憶する。アドレステーブル1000には、同一座席に設置されているオペレータ端末20と電話機30のIPアドレスが1対1に紐付けて格納されている。すなわち、アドレステーブル1000には、座席毎に、その座席に設置されているオペレータ端末20の端末IPアドレスと、その座席に設置されている電話機30の電話機IPアドレスとが1対1に紐付けて格納されている。なお、オペレータ端末20や電話機30が追加された場合や削除された場合、IPアドレスの割り当てが変更された場合等には、アドレステーブル1000が適宜更新されるものとする。
 ユーザ情報テーブル記憶部120は、ユーザ情報テーブル2000を記憶する。ユーザ情報テーブル2000には、電話機IPアドレスと紐付け可能なようにユーザID(ログオンID)が格納されている。なお、ユーザIDが追加された場合や削除された場合等には、ユーザ情報テーブル2000に格納されているユーザIDが、適宜、追加や削除等されるものとする。
 通話履歴情報記憶部130は、通話履歴情報3000を記憶する。通話履歴情報3000とは通話IDとユーザIDとが紐付けられた音声認識結果(テキスト)のことである。ただし、これは一例であって、通話履歴情報3000には、例えば、当該通話IDが表す通話の音声データが含まれていてもよいし、テキストに対して当該音声データから得られた何等かの情報(例えば、話速等の情報)が付与されていてもよい。
  ≪オペレータ端末20≫
 図3に示すように、本実施形態に係るオペレータ端末20は、ログオンID送信部201と、UI制御部202とを有する。これら各部は、例えば、オペレータ端末20にインストールされた1以上のプログラムが、CPU等のプロセッサに実行させる処理により実現される。
 ログオンID送信部201は、オペレータのログオン又はログオフに応じて、このログオンに用いられたログオンIDを音声認識システム10に送信する。なお、これは、例えば、ログオン又はログオフ時に実行されるスクリプトにより実現することが可能である。
 UI制御部202は、音声認識システム10から送信された音声認識結果を表すテキストを画面(例えば、後述するオペレータ画面)上に表示する。また、これ以外にも、UI制御部202は、オペレータからの各種入力操作を受け付ける。
 <ログオン時又はログオフ時の処理>
 以下、オペレータがオペレータ端末20にログオンした場合又はオペレータ端末20からログオフした場合の処理について、図4を参照しながら説明する。なお、図4のステップS101~ステップS104がログイン時の処理、ステップS105~ステップS107がログオフ時の処理である。
 オペレータがオペレータ端末20にログオンすると(ステップS101)、当該オペレータ端末20のログオンID送信部201は、当該ログオンに用いられたログオンIDを音声認識システム10に送信する(ステップS102)。
 音声認識システム10の電話機IP特定部101は、ログオンIDを受信すると、アドレステーブル1000を参照して、当該ログオンIDの送信元のオペレータ端末20のIPアドレス(端末IPアドレス)に紐付けられている電話機IPアドレスを特定する(ステップS103)。
 そして、音声認識システム10のユーザID設定部102は、ユーザ情報テーブル2000に格納されているユーザIDのうち、オペレータ端末20から受信したログオンIDと一致するユーザIDに対して、上記のステップS103で特定された電話機IPアドレスを設定する(ステップS104)。これにより、ユーザIDに対して電話機IPアドレスが紐付けられたことになる。
 なお、本実施形態では、ユーザ情報テーブル2000にはユーザIDが予め格納されているものとして、これらのユーザIDのうちの1つのユーザIDに対して電話機IPアドレスを紐付けて設定したが、これに限られない。例えば、ユーザ情報テーブル2000には予めユーザIDは格納されておらず、オペレータ端末20から受信したログオンIDと上記のステップS103で特定された電話機IPアドレスとを紐付けてユーザ情報テーブル2000に格納してもよい。
 一方で、オペレータがオペレータ端末20からログオフすると(ステップS105)、当該オペレータ端末20のログオンID送信部201は、ログオフしたログオンIDを音声認識システム10に送信する(ステップS106)。
 音声認識システム10のユーザID設定部102は、ユーザ情報テーブル2000に格納されているユーザIDのうち、オペレータ端末20から受信したログオンIDと一致するユーザIDに紐付けられている電話機IPアドレスを削除する(ステップS107)。これにより、ユーザIDと電話機IPアドレスとの紐付けが解除されたことになる。
 なお、本実施形態では、ユーザ情報テーブル2000にはユーザIDが予め格納されているものとして、これらのユーザIDのうちの1つのユーザIDに紐付けられている電話機IPアドレスを削除したが、これに限られない。例えば、ユーザ情報テーブル2000に予めユーザIDが格納されていない場合には、オペレータ端末20から受信したログオンIDとそれに紐付けられている電話機IPアドレスとの組をユーザ情報テーブル2000から削除してもよい。
 <音声認識処理>
 以下、オペレータがオペレータ端末20にログオンしており、当該オペレータ端末20と同一座席に設置されている電話機30を用いて顧客端末70と通話しているものとする。このとき、当該通話の音声認識を行って、その結果を当該オペレータ端末20のディスプレイ上に表示する場合の処理について、図5を参照しながら説明する。ここで、電話機30と顧客端末70との間で通話が行われている間、当該通話のパケット(音声パケット)がNWスイッチ60によってキャプチャされ、その都度又は所定のデータ量のパケットをバッファさせた後、音声認識システム10に送信される。なお、この音声パケットには、互いに通話を行っている電話機30と顧客端末70のIPアドレスが含まれている。
 NWスイッチ60でキャプチャされたパケットを受信すると(ステップS201)、音声認識システム10のユーザID特定部103は、ユーザ情報テーブル2000を参照して、当該パケットに含まれる電話機IPアドレスに紐付けられているユーザIDを特定する(ステップS202)。これにより、当該通話に応対しているオペレータのユーザIDが特定されたため、当該通話と当該オペレータとが紐付けられたことになる。
 次に、音声認識システム10の音声認識テキスト変換部104は、当該パケットに含まれる音声データに対して音声認識を行って、当該音声データが表す音声をテキストに変換する(ステップS203)。
 そして、音声認識システム10の音声認識テキスト変換部104は、上記のステップS202で特定されたユーザIDのオペレータがログオンしているオペレータ端末20に対して、上記のステップS203で得られたテキスト(音声認識結果)を送信する(ステップS204)。
 また、音声認識システム10の音声認識テキスト変換部104は、上記のステップS204で得られたテキストに対して、当該通話を識別する通話IDと上記のステップS202で特定されたユーザIDとを紐付けて通話履歴情報3000として通話履歴情報記憶部130に保存する(ステップS205)。なお、本実施形態では、テキスト(音声認識結果)が得られた都度、そのテキストに対して通話IDとユーザIDとを紐付けて通話履歴情報3000として通話履歴情報記憶部130に保存しているが、これに限られない。例えば、通話終了後に、その通話で得られたすべてのテキストに対して通話IDとユーザIDとを紐付けて通話履歴情報3000として通話履歴情報記憶部130に保存してもよい。
 オペレータ端末20のUI制御部202は、音声認識結果を表すテキストを受信すると、このテキストをディスプレイ上に表示する(ステップS206)。例えば、当該オペレータ端末20のディスプレイ上には、図6に示すオペレータ画面G1000が表示されているものとする。このオペレータ画面G1000にはオペレータと顧客の発話がテキストで表示される発話表示欄G1100が含まれており、音声認識結果を表すテキストを受信すると、UI制御部202によって発話表示欄G1100内に当該テキストが発話者毎に時系列順で表示される。これにより、オペレータは通話中における各発話者の各発話内容をテキストでリアルタイムに確認することが可能となる。
 [第二の実施形態]
 次に、第二の実施形態について説明する。第二の実施形態では、アドレステーブル1000を用いずに通話とオペレータとを紐付ける場合について説明する。なお、第二の実施形態では、主に、第一の実施形態との相違点について説明し、第一の実施形態と同一の構成要素についてはその説明を省略するものとする。
 <通話とオペレータの紐付け方法>
 本実施形態に係るコンタクトセンタシステム1で通話とオペレータとを紐付ける方法例について、図7を参照しながら説明する。
 本実施形態に係るコンタクトセンタシステム1は、以下の(2-1)~(2-3)により通話とオペレータとを紐付ける。
 (2-1)まず、オペレータ端末20は、オペレータのログオンに応じて、このログオンに用いられたログオンIDと、当該オペレータ端末20と同一座席に設置されている電話機30の電話番号とを音声認識システム10に送信する。なお、この電話番号は、例えば、設定ファイル等としてオペレータ端末20に予め設定しておけばよい。
 (2-2)本実施形態に係る音声認識システム10はユーザ情報テーブル記憶部120を有しており、ユーザ情報テーブル2000には、電話機30の電話番号と紐付け可能なようにユーザID(ログオンID)が格納されている。なお、例えば、電話機30の電話番号とユーザID(ログオンID)とが紐付けられる前は、ユーザ情報テーブル2000には当該ユーザID(ログオンID)のみが格納されている(又は、電話機30の電話番号としてNULL値又はブランクと紐付けられたユーザID(ログオンID)が格納されている。)。
 このとき、音声認識システム10は、オペレータ端末20からログオンIDと電話番号とを受信すると、ユーザ情報テーブル2000に格納されているユーザIDのうち、当該ログオンIDと一致するユーザIDに対して、当該電話番号を設定する。図7に示す例では、例えば、ログオンIDが「user3」、電話番号が「090-1234-5678」である場合、このログオンID「user3」に対して電話番号「090-1234-5678」が紐付けて設定される。
 (2-3)その後、PBX50を介して電話機30と顧客端末70との間で通話が行われた場合、NWスイッチ60はその通話のパケット(音声パケット)をキャプチャし、音声認識システム10に送信する。なお、このパケットには当該電話機30の電話番号が含まれる。
 このとき、音声認識システム10は、ユーザ情報テーブル2000を参照して、当該パケットに含まれる電話番号に紐付けられているユーザIDを特定する。これにより、当該通話に応対しているオペレータのユーザIDが特定され、当該通話と当該ユーザIDによって識別されるオペレータとが紐付けられたことになる。
 <コンタクトセンタシステム1の機能構成>
 本実施形態に係るコンタクトセンタシステム1に含まれる音声認識システム10及びオペレータ端末20の機能構成を図8に示す。
  ≪音声認識システム10≫
 図8に示すように、本実施形態に係る音声認識システム10は、電話機IP特定部101と、アドレステーブル記憶部110とを有しない点が第一の実施形態と異なる。また、本実施形態に係るユーザ情報テーブル2000には、電話機30の電話番号と紐付け可能なようにユーザID(ログオンID)が格納されている点が第一の実施形態と異なる。
  ≪オペレータ端末20≫
 図8に示すように、本実施形態に係るオペレータ端末20は、第一の実施形態と同様にログオンID送信部201とUI制御部202とを有しているが、ログオンID送信部201が、オペレータのログオンに応じて、ログオンIDに加えて電話番号も送信する点が第一の実施形態と異なる。
 <ログオン時又はログオフ時の処理>
 以下、オペレータがオペレータ端末20にログオンした場合又はオペレータ端末20からログオフした場合の処理について、図9を参照しながら説明する。なお、図9のステップS301~ステップS303がログイン時の処理、ステップS304~ステップS306がログオフ時の処理である。
 オペレータがオペレータ端末20にログオンすると(ステップS301)、当該オペレータ端末20のログオンID送信部201は、当該ログオンに用いられたログオンIDと、当該オペレータ端末20と同一座席に設置されている電話機30の電話番号とを音声認識システム10に送信する(ステップS302)。なお、オペレータ端末20には、同一座席に設置されている電話機30の電話番号が設定ファイル等として予め設定されているものとする。
 音声認識システム10のユーザID設定部102は、オペレータ端末20からログオンIDと電話番号とを受信すると、ユーザ情報テーブル2000に格納されているユーザIDのうち、当該ログオンIDと一致するユーザIDに対して、当該電話番号を設定する(ステップS303)。これにより、ユーザIDに対して電話番号が紐付けられたことになる。
 なお、本実施形態では、ユーザ情報テーブル2000にはユーザIDが予め格納されているものとして、これらのユーザIDのうちの1つのユーザIDに対して電話番号を紐付けて設定したが、これに限られない。例えば、ユーザ情報テーブル2000には予めユーザIDは格納されておらず、オペレータ端末20から受信したログオンIDと電話番号とを紐付けてユーザ情報テーブル2000に格納してもよい。
 一方で、オペレータがオペレータ端末20からログオフすると(ステップS304)、当該オペレータ端末20のログオンID送信部201は、ログオフしたログオンIDを音声認識システム10に送信する(ステップS305)。
 音声認識システム10のユーザID設定部102は、ユーザ情報テーブル2000に格納されているユーザIDのうち、オペレータ端末20から受信したログオンIDと一致するユーザIDに紐付けられている電話番号を削除する(ステップS306)。これにより、ユーザIDと電話番号との紐付けが解除されたことになる。
 なお、本実施形態では、ユーザ情報テーブル2000にはユーザIDが予め格納されているものとして、これらのユーザIDのうちの1つのユーザIDに紐付けられている電話番号を削除したが、これに限られない。例えば、ユーザ情報テーブル2000に予めユーザIDが格納されていない場合には、オペレータ端末20から受信したログオンIDとそれに紐付けられている電話番号との組をユーザ情報テーブル2000から削除してもよい。
 <音声認識処理>
 以下、本実施形態に係る音声認識処理について、図10を参照しながら説明する。なお、電話機30と顧客端末70との間の通話の音声パケットには、互いに通話を行っている電話機30と顧客端末70の電話番号が含まれている。
 NWスイッチ60でキャプチャされたパケットを受信すると(ステップS401)、音声認識システム10のユーザID特定部103は、ユーザ情報テーブル2000を参照して、当該パケットに含まれる電話機30の電話番号に紐付けられているユーザIDを特定する(ステップS402)。これにより、当該通話に応対しているオペレータのユーザIDが特定されたため、当該通話と当該オペレータとが紐付けられたことになる。
 以降のステップS403~ステップS406は、図5のステップS203~ステップS206とそれぞれ同様である。
 [変形例]
 以下、上述した各実施形態の変形例について説明する。
 <変形例1>
 第一の実施形態では、IPアドレスを用いて通話とオペレータとの紐付けを行ったが、IPアドレスの代わりに、MAC(Media Access Control)アドレスを用いてもよい。この場合、アドレステーブル1000には、同一座席に設置されているオペレータ端末20のMACアドレスと電話機30のMACアドレスとが1対1に紐付けて格納される。また、ユーザ情報テーブル2000には、電話機30のMACアドレスと紐付け可能なようにユーザID(ログオンID)が格納される。なお、MACアドレス以外にも、音声パケットから取得可能で、かつ、電話機30を識別可能な情報であれば、この情報をIPアドレスの代わりに用いることが可能である。
 <変形例2>
 第一の実施形態及び第二の実施形態では、オペレータの各座席にはオペレータ端末20と電話機30とが設置されているものとしたが、例えば、全部又は一部のオペレータ端末20にソフトフォンが導入されてもよい。この場合、ソフトフォンが導入されているオペレータ端末20が設置されている座席には電話機30が設置されていなくてもよい。なお、この場合、第一の実施形態では、ソフトフォンが導入されているオペレータ端末20のIPアドレス(端末IPアドレス)は電話機IPアドレスと一致することになる。
 [応用例]
 通話とオペレータとを紐付けることで、通話中における各発話者の各発話内容をオペレータがリアルタイムで確認できるだけなく、CTI連携を行った場合に可能となる様々な機能を実現することができるようになる。以下、このような機能の一例について、応用例として説明する。なお、以下で説明する応用例以外にも、CTI連携を行った場合に可能となる様々な機能が実現できることは言うまでもない。
 <応用例1>
 通話とオペレータとが紐付けられることで、管理者は、管理者端末40を用いて、例えば、リアルタイム又はオフラインでオペレータ毎に当該通話における各発話内容をテキストで確認することができるようになる。
 例えば、図11に示すオペレータ支援画面G2000を管理者端末40のディスプレイ上に表示する。このオペレータ支援画面G2000には、通話及びその通話のオペレータ名が一覧で表示される通話選択欄G2100と、この通話選択欄G2100で選択された通話における発話内容がテキストで表示される発話内容表示欄G2200とが含まれる。したがって、管理者は、通話選択欄G2100から所望の通話を選択することで、この通話における発話内容を発話内容表示欄G2200で確認することができる。これにより、管理者は、例えば、不慣れなオペレータを支援したり、オペレータが不適切な発話を行っていないかを確認したりすることが可能となる。
 これ以外にも、例えば、ユーザIDをキーとして所望のオペレータの通話履歴情報3000を検索し、その通話履歴情報3000に含まれる音声認識結果を管理者端末40に表示する、といったことも可能である。
 <応用例2>
 通話履歴情報3000に対して様々な分析(例えば、シーンに応じた適切な単語が発話されているか否か、話速は適切か否か等といった分析、発話傾向を把握するための分析等)を行って通話の応対品質を評価することで、例えば、顧客満足度の向上等を支援することが可能となる。このような応対品質の評価結果は、管理者端末40(又はオペレータ端末20でもよいし、品質担当者等が使用する端末等でもよい。)のディスプレイ上に表示される。
 例えば、図12に示す応対品質評価画面G3000を管理者端末40等のディスプレイ上に表示するといった応用が可能である。図12に示す応対品質評価画面G3000は、オペレータ毎に通話の応対品質をスコア化し、比較可能なように表示した画面である。これにより、管理者や品質担当者等は、通話の応対品質を向上させるための施策等を検討したり、オペレータを教育したりすることが可能となる。
 [まとめ]
 以上のように、本実施形態に係るコンタクトセンタシステム1は、電話機30と同一座席に設置されているオペレータ端末20から得られた情報(ログオンID、又は、ログオンIDと当該電話機30の電話番号)を用いて、通話とその通話に応対しているオペレータとを紐付けることが可能となる。これにより、本実施形態に係るコンタクトセンタシステム1では、CTI連携をせずに、CTI連携を行った場合に可能となる様々な機能を実現することが可能となる。このため、CTIを導入できない様々な事情(例えば、既設のPBXがCTI連携機能を備えていない又はキャパティ不足によりCTI連携が困難であるが、PBXの入れ替えコストは許容できないような場合等)がある場合であっても、例えば、オペレータの応対支援を行ったり、通話の品質評価を行ったりといった様々な機能を実現することが可能となる。
 本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
 本願は、日本国に2021年10月4日に出願された基礎出願2021-163442号に基づくものであり、その全内容はここに参照をもって援用される。
 1    コンタクトセンタシステム
 10   音声認識システム
 20   オペレータ端末
 30   電話機
 40   管理者端末
 50   PBX
 60   NWスイッチ
 70   顧客端末
 80   通信ネットワーク
 101  電話機IP特定部
 102  ユーザID設定部
 103  ユーザID特定部
 104  音声認識テキスト変換部
 110  アドレステーブル記憶部
 120  ユーザ情報テーブル記憶部
 130  通話履歴情報記憶部
 201  ログオンID送信部
 202  UI制御部
 1000 アドレステーブル
 2000 ユーザ情報テーブル
 3000 通話履歴情報
 E    コンタクトセンタ環境

Claims (9)

  1.  通信ネットワークを介して接続される端末から送信された所定の第1の情報に基づいて、電話機を利用するユーザを識別するユーザ識別情報に対して、前記電話機と他の電話機との間の通話における音声パケットから取得可能な所定の第2の情報を紐付けて設定する設定部と、
     前記電話機と他の電話機との間の通話における音声パケットを受信すると、前記音声パケットから前記第2の情報を取得し、取得した前記第2の情報に紐付けられているユーザ識別情報を特定する特定部と、
     を有する情報処理装置。
  2.  前記第1の情報には、前記端末のログオンIDが含まれ、
     同一ユーザに関しては、前記ログオンIDと前記ユーザ識別情報とが一致又は紐付けられており、
     前記設定部は、
     前記ログオンIDに一致する又は紐付けられたユーザ識別情報に対して、前記第2の情報を紐付けて設定する、請求項1に記載の情報処理装置。
  3.  前記第2の情報は、前記電話機のIPアドレス又はMACアドレスであり、
     前記設定部は、
     前記第1の情報の送信元の端末のIPアドレス又はMACアドレスに基づいて、前記端末に対応する電話機のIPアドレス又はMACアドレスを特定し、
     前記ログオンIDと同一のユーザ識別情報に対して、前記電話機のIPアドレス又はMACアドレスを紐付けて設定し、
     前記特定部は、
     前記電話機のIPアドレス又はMACアドレスを前記音声パケットから取得し、取得したIPアドレス又はMACアドレスに紐付けられているユーザ識別情報を特定する、請求項2に記載の情報処理装置。
  4.  前記設定部は、
     前記端末のIPアドレス又はMACアドレスと、前記電話機のIPアドレス又はMACアドレスとが1対1に紐づけられたテーブルを参照して、前記端末に対応する電話機のIPアドレス又はMACアドレスを特定する、請求項3に記載の情報処理装置。
  5.  前記第1の情報には、前記電話機の電話番号が更に含まれ、
     前記第2の情報は、前記電話機の電話番号であり、
     前記設定部は、
     前記ログオンIDと同一のユーザ識別情報に対して、前記第1の情報に含まれる電話番号を紐付けて設定し、
     前記特定部は、
     前記電話機の電話番号を前記音声パケットから取得し、取得した電話番号に紐付けられているユーザ識別情報を特定する、請求項2に記載の情報処理装置。
  6.  前記音声パケットに含まれる音声データに対して音声認識を行う音声認識部を有し、
     前記音声認識部は、
     前記特定部によって特定されたユーザ識別情報を持つユーザが利用している端末に対して、前記音声認識の結果を送信する、請求項1乃至5の何れか一項に記載の情報処理装置。
  7.  前記音声認識部は、
     前記特定部によって特定されたユーザ識別情報と前記音声認識結果とを紐付けた情報を、前記ユーザ識別情報をキーとした検索が可能なように、かつ、前記ユーザ識別情報毎の発話傾向の分析を含む、応答品質評価のための所定の分析が可能なように、所定の記憶部に格納する、請求項6に記載の情報処理装置。
  8.  通信ネットワークを介して接続される端末から送信された所定の第1の情報に基づいて、電話機を利用するユーザを識別するユーザ識別情報に対して、前記電話機と他の電話機との間の通話における音声パケットから取得可能な所定の第2の情報を紐付けて設定する設定手順と、
     前記電話機と他の電話機との間の通話における音声パケットを受信すると、前記音声パケットから前記第2の情報を取得し、取得した前記第2の情報に紐付けられているユーザ識別情報を特定する特定手順と、
     をコンピュータが実行する情報処理方法。
  9.  通信ネットワークを介して接続される端末から送信された所定の第1の情報に基づいて、電話機を利用するユーザを識別するユーザ識別情報に対して、前記電話機と他の電話機との間の通話における音声パケットから取得可能な所定の第2の情報を紐付けて設定する設定手順と、
     前記電話機と他の電話機との間の通話における音声パケットを受信すると、前記音声パケットから前記第2の情報を取得し、取得した前記第2の情報に紐付けられているユーザ識別情報を特定する特定手順と、
     をコンピュータに実行させるプログラム。
PCT/JP2022/001146 2021-10-04 2022-01-14 情報処理装置、情報処理方法及びプログラム WO2023058256A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023552685A JPWO2023058256A1 (ja) 2021-10-04 2022-01-14

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021163442 2021-10-04
JP2021-163442 2021-10-04

Publications (1)

Publication Number Publication Date
WO2023058256A1 true WO2023058256A1 (ja) 2023-04-13

Family

ID=85804084

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/001146 WO2023058256A1 (ja) 2021-10-04 2022-01-14 情報処理装置、情報処理方法及びプログラム

Country Status (2)

Country Link
JP (1) JPWO2023058256A1 (ja)
WO (1) WO2023058256A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003092632A (ja) * 2001-09-18 2003-03-28 Toshiba Corp 通話録音装置及び通話録音システム
JP2014187583A (ja) * 2013-03-25 2014-10-02 Hitachi Information & Telecommunication Engineering Ltd 電話接続システム及びその方法、プログラム
JP2017169037A (ja) * 2016-03-16 2017-09-21 株式会社日立情報通信エンジニアリング 通話録音システム及び通話録音方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003092632A (ja) * 2001-09-18 2003-03-28 Toshiba Corp 通話録音装置及び通話録音システム
JP2014187583A (ja) * 2013-03-25 2014-10-02 Hitachi Information & Telecommunication Engineering Ltd 電話接続システム及びその方法、プログラム
JP2017169037A (ja) * 2016-03-16 2017-09-21 株式会社日立情報通信エンジニアリング 通話録音システム及び通話録音方法

Also Published As

Publication number Publication date
JPWO2023058256A1 (ja) 2023-04-13

Similar Documents

Publication Publication Date Title
US7222301B2 (en) Method and apparatus enabling voice-based management of state and interaction of a remote knowledge worker in a contact center environment
US9553755B2 (en) Method for implementing and executing communication center routing strategies represented in extensible markup language
US9386154B2 (en) System, method and software program for enabling communications between customer service agents and users of communication devices
JP4205310B2 (ja) 規則ベースのマルチメディア顧客/企業対話ネットワークオペレーティングシステム
US6587558B2 (en) System and method for virtual interactive response unit
US8117538B2 (en) Method for dynamically converting voice XML scripts into other compatible markup language scripts based on required modality
US7376227B2 (en) Method and apparatus for integrating agent status between a customer relations management system and a multiple channel communications center
US20090144428A1 (en) Method and Apparatus For Multimodal Voice and Web Services
EP1408678A2 (en) Management of remote knowledge workers of a communication center
US8467321B1 (en) Real time voice quality statistics in audio teleconferencing
US8610755B2 (en) Methods and apparatuses for multi-lingual support for hearing impaired communication
USRE46153E1 (en) Method and apparatus enabling voice-based management of state and interaction of a remote knowledge worker in a contact center environment
CN112887194B (zh) 实现听障人士通话的交互方法、装置、终端及存储介质
CN112040073B (zh) 一种智能查号服务器、查号系统及查号方法
US7120140B1 (en) Digital browser phone
CN1863254A (zh) 呼叫中心服务方法及呼叫中心服务系统
CN109831591A (zh) 呼叫中心的呼叫方法、装置及终端
WO2023058256A1 (ja) 情報処理装置、情報処理方法及びプログラム
US8498390B2 (en) Presence based DTMF signaling enablement of voice communication controller and method
JP2017067881A (ja) 音声認識装置、音声認識システムおよび音声認識方法
US9042541B2 (en) Multi-node predictive dialing for scalability
WO2023162010A1 (ja) 支援装置、支援方法及びプログラム
KR20020084783A (ko) 인터넷망과 브이오아이피 기능을 이용한 사내전화시스템및 방법
JP2006185319A (ja) 顧客対応支援方法及び顧客対応支援システム
KR20030063064A (ko) Ip-pbx를 이용해 내선용 단말기로 cti 서비스를제공하는 방법 및 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22878129

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023552685

Country of ref document: JP