WO2023188313A1 - 情報処理装置、情報処理方法、プログラム、及びデータ構造 - Google Patents

情報処理装置、情報処理方法、プログラム、及びデータ構造 Download PDF

Info

Publication number
WO2023188313A1
WO2023188313A1 PCT/JP2022/016665 JP2022016665W WO2023188313A1 WO 2023188313 A1 WO2023188313 A1 WO 2023188313A1 JP 2022016665 W JP2022016665 W JP 2022016665W WO 2023188313 A1 WO2023188313 A1 WO 2023188313A1
Authority
WO
WIPO (PCT)
Prior art keywords
operator
user
telephone number
information
terminal
Prior art date
Application number
PCT/JP2022/016665
Other languages
English (en)
French (fr)
Inventor
健一 町田
一比良 松井
麻斗 田中
Original Assignee
Nttテクノクロス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nttテクノクロス株式会社 filed Critical Nttテクノクロス株式会社
Priority to PCT/JP2022/016665 priority Critical patent/WO2023188313A1/ja
Priority to JP2024511065A priority patent/JPWO2023188313A1/ja
Publication of WO2023188313A1 publication Critical patent/WO2023188313A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication

Definitions

  • the present disclosure relates to an information processing device, an information processing method, a program, and a data structure.
  • CTI Computer Telephony Integration
  • contact centers also called call centers
  • CTI is a mechanism for integrating and linking a computer such as a voice recognition system or a customer management system with a telephone or a private branch exchange (PBX) (for example, Non-Patent Document 1).
  • PBX private branch exchange
  • CTI it becomes possible, for example, to link a voice recognition system and a PBX to perform voice recognition on calls at a contact center.
  • CTI linkage introducing CTI and linking a computer with a telephone or PBX will also be referred to as "CTI linkage.”
  • a free address system is a system in which operators do not have fixed seats and can choose seats freely or according to some rules.
  • the operator's seat may change daily, but by performing voice recognition through CTI cooperation, it becomes possible to link voice-recognized calls and operators.
  • CTI middleware CBASE/Core
  • NTT Techno Cross Internet ⁇ URL: https://www.ntt-tx.co.jp/products/ctbase/core.html>
  • the present disclosure has been made in view of the above points, and provides a technology for linking calls and operators.
  • An information processing apparatus associates a user ID used for authentication of a first terminal connected via a communication network with a first telephone number transmitted from the first terminal.
  • a number holding unit configured to hold attached correspondence information in a storage unit;
  • a number identification unit configured to identify a second telephone number from a voice packet of a voice call; and
  • a user identification unit configured to identify a user ID associated with a first telephone number that matches the second telephone number, using the stored correspondence information.
  • a technique for linking a call and an operator is provided.
  • FIG. 1 is a diagram showing an example of the overall configuration of a contact center system according to a first embodiment.
  • FIG. 2 is a diagram for explaining an example of a method for associating a call with an operator and transmission of a voice recognition result using the method according to the first embodiment. It is a diagram showing an example of the functional configuration of a contact center according to the first embodiment.
  • FIG. 2 is a sequence diagram illustrating an example of processing during logon according to the first embodiment. It is a figure showing an example of a logon screen. It is a figure which shows an example of an extension number input screen.
  • FIG. 7 is a diagram showing another example of an extension number input screen.
  • FIG. 3 is a sequence diagram showing an example of speech recognition processing according to the first embodiment.
  • FIG. 7 is a sequence diagram showing an example of speech recognition processing according to the second embodiment.
  • FIG. 7 is a sequence diagram illustrating an example of operator information/log matching processing according to the second embodiment.
  • FIG. 7 is a sequence diagram illustrating an example of log completion/correction processing according to the second embodiment.
  • a first embodiment and a second embodiment will be described as one embodiment of the present invention.
  • voice recognition is performed on a call (voice call) with a customer, targeting a contact center
  • the call will be linked to the operator handling the call without CTI coordination.
  • a contact center system 1 that can perform the following will be described.
  • contact centers are just one example, and the same applies to cases other than contact centers, such as when linking a call with the person in charge who is answering the call, for example, targeting a person in charge working in an office, etc. It is possible to apply.
  • the present invention can be similarly applied to the case where a certain call is associated with the person who is answering the call.
  • FIG. 1 shows an example of the overall configuration of a contact center system 1 according to this embodiment.
  • the contact center system 1 includes a voice recognition system 10, a plurality of operator terminals 20, a plurality of telephones 30, one or more supervisor terminals 40, and one or more management terminals.
  • a customer terminal 50, a PBX 60, a NW switch 70, and a customer terminal 80 are included.
  • the voice recognition system 10, operator terminal 20, telephone 30, supervisor terminal 40, administrator terminal 50, PBX 60, and NW switch 70 are installed in a contact center environment E, which is a system environment of a contact center.
  • the contact center environment E is not limited to a system environment within the same building, but may be a system environment within a plurality of geographically separated buildings, for example.
  • the voice recognition system 10 uses packets (voice packets) sent from the NW switch 70 to convert a call between a customer and an operator into text through voice recognition, and also identifies the operator who is answering the call. do.
  • packets voice packets sent from the NW switch 70 to convert a call between a customer and an operator into text through voice recognition, and also identifies the operator who is answering the call. do.
  • the operator terminal 20 is a terminal such as a PC (personal computer) used by an operator.
  • the telephone 30 is an IP (Internet Protocol) telephone (such as a fixed IP telephone or a mobile IP telephone) used by an operator.
  • IP Internet Protocol
  • the contact center uses a free-address system, and that the operator's seat can change daily (or at any time, for example, between morning and afternoon, or when there is a change in work assignments, etc.).
  • a free address system is adopted, and operator seats can change daily, and each seat is equipped with one operator terminal 20 and one operator terminal 20. It is assumed that a telephone 30 is installed.
  • the supervisor terminal 40 is a terminal such as a PC used by the supervisor.
  • a supervisor is, for example, a person who monitors calls by an operator and supports the operator's telephone answering work when a problem is likely to occur or in response to a request from the operator. Normally, calls of several to more than ten operators are generally monitored by one supervisor.
  • the administrator terminal 50 is a terminal such as a PC used by the system administrator of the contact center environment E. Note that although only one administrator terminal 50 is illustrated in the example shown in FIG. 1, a plurality of administrator terminals 50 may exist.
  • the PBX 60 is a telephone exchange (IP-PBX) and is connected to a communication network 90 including a VoIP (Voice over Internet Protocol) network and a PSTN (Public Switched Telephone Network).
  • IP-PBX telephone exchange
  • VoIP Voice over Internet Protocol
  • PSTN Public Switched Telephone Network
  • the NW switch 70 relays packets between the telephone 30 and the PBX 60, and also captures and transmits the packets to the voice recognition system 10.
  • the customer terminal 80 is a variety of terminals used by the customer, such as a smartphone, mobile phone, or landline phone.
  • the overall configuration of the contact center system 1 shown in FIG. 1 is an example, and other configurations may be used.
  • the voice recognition system 10 is included in the contact center environment E (that is, the voice recognition system 10 is on-premises), but all or part of the functions of the voice recognition system 10 are may be realized by a cloud service or the like.
  • the PBX 60 is an on-premise telephone exchange, but it may also be implemented using a cloud service.
  • the contact center system 1 associates a call with an operator and uses the association to transmit a voice recognition result to the operator terminal 20 used by the operator.
  • each operator selects his or her own seat and logs on to the operator terminal 20 of that seat using his or her operator ID and corresponding password when starting telephone answering duties.
  • the operator ID is identification information that uniquely identifies the operator.
  • other identification information such as a logon ID and a corresponding password may be used for logon.
  • the operator typically selects the seat and logs on as described above when arriving at work, but is not limited to this; for example, if the operator uses different seats in the morning and afternoon, the operator selects the seat and logs on at the start of work in the morning and at the start of work in the afternoon.
  • Seat selection and logon may also be performed.
  • seat selection and logon may be performed at the start of the task in charge before the change and at the start of the task in charge after the change. In addition to these, seat selection and logon may be performed at any other timing.
  • the contact center system 1 associates the call with the operator according to (1-1) to (1-6) below, and allows the operator to use the voice recognition result of the call. It is displayed on the operator terminal 20.
  • the operator terminal 20 transmits the logon information (operator ID and corresponding password) input in this logon operation to the voice recognition system 10.
  • the operator ID and the corresponding password may be held by the voice recognition system 10, but the present invention is not limited to this, and for example, a system or device other than the voice recognition system 10, such as an authentication system, etc. etc. may be held.
  • the operator terminal 20 transmits the extension number (for example, "XXXX") to the voice recognition system 10 in response to the operator's input operation of the extension number (for example, "XXXX").
  • the operator inputs the extension number of the telephone 30 installed at his or her seat (that is, the telephone 30 installed at the same seat as the operator terminal 20 from which he logged on in (1-1) above).
  • the extension number of the telephone 30 may be displayed on the display of the telephone 30, or may be posted on a paper or the like on the seat where the telephone 30 is installed.
  • the voice recognition system 10 associates and holds the operator ID included in the logon information sent from the operator terminal 20 and the extension number sent from the operator terminal 20. This makes it possible to identify the operator ID from the extension number.
  • the voice recognition system 10 captures the packets of the call between the customer terminal 80 and the telephone 30, and uses the packets to transmit the call to the telephone 30. Identify your extension number. As a result, the operator ID can be identified from the extension number, so the call and the operator are linked.
  • the voice recognition system 10 performs voice recognition on the voice data included in the packet of the call between the customer terminal 80 and the telephone 30, and converts the voice represented by the voice data into text (hereinafter referred to as (also called "speech recognition text").
  • the voice recognition system 10 transmits the voice recognition text, which is the voice recognition result, to the operator terminal 20 used by the operator associated with the call. This makes it possible to display the voice recognition text on the operator terminal 20 in real time.
  • the voice recognition system 10 stores, for example, operator terminal information such as the identification information and IP address of the operator terminal 20 used for logging on the operator in association with the operator ID. This operator terminal information may be used to specify the operator terminal 20 to which the voice recognition text is to be transmitted.
  • the voice recognition system 10 identifies the operator terminal 20 to which the voice recognition text is to be transmitted, transmits the voice recognition text, and displays the voice recognition text. It is assumed that the screen is generated by the operator terminal 20.
  • the operator terminal 20 sends a request including an operator ID, etc. to the voice recognition system 20, and as a response to this request, a voice recognition text (or the voice recognition text is displayed). screen information, etc.) may be returned from the voice recognition system 10 to the operator terminal 20.
  • FIG. 3 shows the functional configuration of the voice recognition system 10 and operator terminal 20 included in the contact center system 1 according to this embodiment.
  • the speech recognition system 10 includes an authentication section 101, an extension number holding section 102, an extension number identification section 103, and a speech recognition section 104. Each of these units is realized, for example, by one or more programs installed in the speech recognition system 10 causing a processor such as a CPU (Central Processing Unit) to execute the process.
  • the speech recognition system 10 also includes a storage unit 110.
  • the storage unit 110 can be realized by, for example, a storage device such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), or a flash memory. However, the storage unit 110 may be realized, for example, by a storage device or the like connected to the speech recognition system 10 via a communication network.
  • the authentication unit 101 authenticates the operator terminal 20 using the logon information (operator ID and corresponding password) received from the operator terminal 20.
  • the extension number holding unit 102 associates the extension number sent from the successfully authenticated operator terminal 20 with the operator ID included in the logon information used to authenticate the operator terminal 20 and holds it in the storage unit 110. .
  • the extension number identification unit 103 identifies the extension number of the telephone 30 that is communicating with the customer terminal 80 from the packet transmitted from the NW switch 70.
  • the speech recognition unit 104 performs speech recognition on the speech data included in the packet transmitted from the NW switch 70, and converts the speech represented by the speech data into speech recognition text. Further, the voice recognition unit 104 refers to the correspondence between extension numbers and operator IDs stored in the storage unit 110, identifies the operator ID corresponding to the extension number identified by the extension number identification unit 103, and , transmits the voice recognition text to the operator terminal 20 logged on with the operator ID.
  • the storage unit 110 stores information representing the association between extension numbers and operator IDs.
  • the storage unit 110 may store various information (for example, information necessary for authentication of the operator terminal 20, etc.).
  • the operator terminal 20 includes a logon request section 201, an extension number transmission section 202, and a UI control section 203.
  • Each of these units is realized, for example, by one or more programs installed on the operator terminal 20 causing a processor such as a CPU to execute the process.
  • the logon request unit 201 transmits the logon information (operator ID and corresponding password) input through the logon operation to the voice recognition system 10 in response to the operator's operation.
  • the extension number transmitting unit 202 transmits the extension number to the voice recognition system 10 in response to the operator's input operation of the extension number.
  • the UI control unit 203 displays various screens (for example, a logon screen, an extension number input screen, an operator screen, etc., which will be described later) on the display of the operator terminal 20. Further, the UI control unit 203 accepts various input operations from the operator on these various screens.
  • screens for example, a logon screen, an extension number input screen, an operator screen, etc., which will be described later.
  • the UI control unit 203 of the operator terminal 20 receives an input operation of logon information by the operator (step S101).
  • the operator can input logon information on a logon screen G1000 as shown in FIG. 5, for example. That is, on the logon screen G1000 shown in FIG. 5, the operator enters his or her operator ID in the operator ID input field G1001, enters the password corresponding to the operator ID in the password input field G1002, and then presses the OK button G1003. By pressing , you can enter logon information.
  • the logon request unit 201 of the operator terminal 20 transmits the logon information (operator ID and corresponding password) input by the input operation in step S101 above to the voice recognition system 10 (step S102).
  • the authentication unit 101 of the voice recognition system 10 Upon receiving the logon information from the operator terminal 20, the authentication unit 101 of the voice recognition system 10 authenticates the operator terminal 20 using this logon information (step S103). That is, the authentication unit 101 verifies whether the operator ID and password included in the logon information are correct, and if the verification is successful, the authentication is successful; otherwise, the authentication is failed. It is possible to verify whether the operator ID and password are correct in various ways, but for example, by referring to the authentication information table that stores the correct operator ID and password, it is possible to A common method is to verify whether the operator ID and password provided are correct.
  • the authentication unit 101 returns the above authentication result (authentication success or authentication failure) to the operator terminal 20.
  • the explanation will be continued assuming that an authentication result indicating successful authentication has been returned.
  • the UI control unit 203 of the operator terminal 20 receives an input operation of an extension number by the operator (step S104).
  • the operator can input an extension number on an extension number input screen G2000 as shown in FIG. 6, for example. That is, on the extension number input screen G2000 shown in FIG. 6, the operator inputs the extension number of the telephone 30 installed at his or her seat into the extension number input field G2001, and then presses the OK button G2002. You can input an extension number.
  • the extension number transmitting unit 202 of the operator terminal 20 transmits the extension number input by the input operation in step S104 above to the voice recognition system 10 (step S105).
  • the extension number holding unit 102 of the voice recognition system 10 When the extension number holding unit 102 of the voice recognition system 10 receives the extension number from the operator terminal 20, it associates this extension number with the operator ID included in the logon information received in step S103 above and stores it in the storage unit 110. It is held (step S106). As a result, information in which the extension number and operator ID are associated in the format (extension number, operator ID) (hereinafter also referred to as correspondence information) is held in the storage unit 110. Note that, for example, if correspondence information that includes the same extension number as the extension number received from the operator terminal 20 is already stored in the storage unit 110, the extension number holding unit 102 stores the operator ID included in the correspondence information. may be updated to the operator ID included in the logon information received in step S103 above.
  • the operator can freely input an extension number in the extension number input field G2001. Therefore, there is a possibility that an error in inputting the extension number may occur. Furthermore, by inputting the extension number of another seat, the operator can refer to calls made by other operators on the operator screen, which will be described later. Therefore, it is preferable to be able to select from a plurality of predetermined extension numbers, rather than being able to freely input an extension number.
  • extension number input screen G2000 shown in FIG. 6 it may be possible to display an extension number input screen G3000 as shown in FIG. 7, for example.
  • a pull-down button G3011 exists in the extension number input field G30001 of the extension number input screen G3000 shown in FIG. 7, and when the operator presses the pull-down button G3011, extension numbers selectable by the operator are displayed as a pull-down menu G3012. Therefore, the operator selects the extension number of the telephone 30 installed at his or her seat from the pull-down menu G3012, presses the OK button G3002, and performs an operation to input the extension number. This makes it possible to prevent a situation in which an incorrect extension number is entered or an extension number for another seat is incorrectly entered.
  • an extension number that the operator can select is determined for each seat group. It may be. Alternatively, for example, an extension number that can be selected by the operator may be determined for each area where a seat or a group of seats exists. In addition to these, for example, if operators are divided into groups according to the content of their telephone handling duties, it is possible to specify the group to which the operator belongs based on the operator ID used for logon, and select according to that group. An extension number may be determined.
  • the logon information is entered on the logon screen and the extension number is entered on the extension number input screen, but the invention is not limited to this. For example, even if both logon information and extension number are entered on the same screen, good.
  • the extension number identification unit 103 of the voice recognition system 10 Upon receiving the packet captured by the NW switch 70 (step S201), the extension number identification unit 103 of the voice recognition system 10 identifies the extension number of the telephone 30 making the call from the packet (step S202). . Thereby, the operator ID can be specified from the specified extension number and the correspondence information stored in the storage unit 110, so that the call and the operator are linked.
  • the extension number identification unit 103 can identify the extension number by analyzing the packet. However, for example, if the packet is encrypted or if the protocol of the packet is not a common protocol, it is difficult to analyze it. Therefore, in such a case, on the premise that the IP address of the telephone 30 is fixed, the extension number identification unit 103 should refer to the extension number table in which the IP address of the telephone 30 and its extension number are stored. Then, the extension number can be specified from the IP address of the packet.
  • the voice recognition unit 104 of the voice recognition system 10 performs voice recognition on the voice data included in the packet, and converts the voice represented by the voice data into voice recognition text (step S203).
  • the voice recognition unit 104 of the voice recognition system 10 refers to the correspondence information stored in the storage unit 110 and identifies the operator ID corresponding to the extension number specified in step S202 above (step S204 ).
  • the voice recognition unit 104 of the voice recognition system 10 sends the voice recognition text (voice recognition result) (step S205).
  • the UI control unit 203 of the operator terminal 20 Upon receiving the voice recognition text representing the voice recognition result, the UI control unit 203 of the operator terminal 20 displays this voice recognition text on the display (step S206). For example, it is assumed that an operator screen G4000 as shown in FIG. 9 is displayed on the display of the operator terminal 20. This operator screen G4000 includes an utterance display field G4001 that is displayed with voice recognition text representing the utterances of the operator and the customer.
  • the UI control unit 203 displays the voice in the utterance display field G4001. Recognized texts are displayed in chronological order for each speaker. This allows the operator to check the content of each utterance by each speaker during a call in real time in text format.
  • FIG. 10 shows the functional configuration of the voice recognition system 10, operator terminal 20, supervisor terminal 40, and administrator terminal 50 included in the contact center system 1 according to this embodiment.
  • the voice recognition system 10 differs from the first embodiment in that it further includes a fraud detection section 105 and a log storage section 106.
  • the fraud detection unit 105 and the log storage unit 106 are realized, for example, by a process in which one or more programs installed in the voice recognition system 10 are caused to be executed by a processor such as a CPU.
  • the fraud detection unit 105 detects if the extension number transmitted from the successfully authenticated operator terminal 20 is fraudulent. Further, if fraud is detected, the fraud detection unit 105 transmits a notification to the supervisor terminal 40 indicating that an incorrect extension number may have been input (hereinafter also referred to as fraud detection notification).
  • the log storage unit 106 creates a log that includes the extension number specified by the extension number identification unit 103 and the voice recognition text converted by the voice recognition unit 104, and stores it in the storage unit 110 as a call log.
  • the log includes, for example, time, extension number, voice recognition text, and the like.
  • information such as call ID, operator ID, name of the operator identified by the operator ID, call start time, telephone number of customer terminal 80, etc. May be included. Further, for example, information such as the operator's arrival time and leaving time, the logon time when the operator logged on to the operator terminal 20, and the logout time when the operator logged out may be included.
  • the log may be identified by a log ID, or because a log is created for each call, it may be identified by a call ID.
  • the voice recognition unit 104 transmits the operator ID and voice recognition text to the supervisor terminal 40 that monitors the operator with the specified operator ID.
  • the supervisor terminal 40 includes a UI control section 401.
  • the UI control unit 401 is realized, for example, by a process in which one or more programs installed on the supervisor terminal 40 are executed by a processor such as a CPU.
  • the UI control unit 401 When the UI control unit 401 receives a fraud detection notification from the voice recognition system 10, it displays an alert indicating that an incorrect extension number may have been input. Further, the UI control unit 401 displays the voice recognition text and the like received from the voice recognition system 10 on a predetermined screen (for example, a monitoring screen for monitoring an operator's call).
  • a predetermined screen for example, a monitoring screen for monitoring an operator's call.
  • the administrator terminal 50 includes a UI control unit 501.
  • the UI control unit 501 is realized, for example, by a process in which one or more programs installed on the administrator terminal 50 are executed by a processor such as a CPU.
  • the UI control unit 501 displays a predetermined screen (hereinafter also referred to as operator information/log correspondence screen) for associating operator information and logs, and displays a predetermined screen (hereinafter also referred to as operator information/log correspondence screen) for complementing and correcting logs. , also called the log completion/correction screen).
  • the UI control unit 501 receives an input operation for operator information/log correspondence information that represents the correspondence between operator information and logs on the operator information/log correspondence screen, and also includes information input by the operation.
  • the operator information/log correspondence information that is displayed is transmitted to the voice recognition system 10.
  • the operator information is information that includes at least an operator ID.
  • the operator information may include information such as the operator's name, the operator's work hours, and the like.
  • operator information/log association information is information for associating operator information and logs, and is information that includes at least an operator ID and an extension number, for example. In the operation of inputting operator information/log association information, operator ID, extension number, etc. can be input, but various information other than these may also be input.
  • the UI control unit 501 accepts an input operation for log completion/correction information on the log completion/correction screen, and transmits log completion/correction information including the information input through the operation to the voice recognition system 10.
  • operator ID etc. can be input, but in addition to this, for example, the arrival time, leaving time, logon time, logout time of the operator identified by the operator ID can be input. You may be able to input various information such as.
  • Steps S301 to S304 in FIG. 11 are the same as steps S201 to S204 in FIG. 8, respectively, so a description thereof will be omitted.
  • the fraud detection unit 105 of the voice recognition system 10 detects if the extension number transmitted from the successfully authenticated operator terminal 20 is fraudulent (step S305). That is, the fraud detection unit 105 uses the operator ID specified in step S304 to determine whether the extension number associated with this operator ID is fraudulent, and determines whether the extension number is fraudulent. If it is determined, it is assumed that fraud has been detected.
  • the fraud detection unit 105 may detect whether the extension number is fraudulent, for example, by method 1 or 2 below.
  • Method 1 In general, contact center operators often conduct telephone answering operations according to a manual called a talk script.
  • the talk script defines the contents of the operator's utterances for each telephone response scene, and in the "opening" scene at the beginning of the telephone response, generally, "Thank you for calling.
  • the name is often defined as "I am Mr. Operator.” Therefore, in method 1, the voice recognition text representing "introduction" in the "opening" scene of the call is compared (matched) with the name of the operator identified by the operator ID, and the voice recognition text includes the name of the operator identified by the operator ID. If the operator's name is included, it is determined that the extension number associated with that operator ID is not invalid; if it is not included, the extension number associated with that operator ID is invalid. It is determined that Note that the above comparison (matching) can be realized by, for example, pattern matching of character strings.
  • Method 2 Using a known technology called voiceprint authentication, the voice of the call is compared with the voice of the operator identified by the operator ID, and if the degree of matching is greater than a predetermined threshold, the operator ID is It is determined that the extension number associated with the operator ID is not invalid, and if the matching degree is less than a predetermined threshold value, it is determined that the extension number associated with the operator ID is invalid. Note that it is necessary to register in advance audio data representing the voice of the operator identified by the operator ID, data representing the feature amount of the operator's voice, and the like. By using voiceprint authentication, even if the operator is working in a remote location (e.g., the operator's home, a remote location, a shared office, etc.), entering an incorrect or incorrect extension number will be prevented. It becomes possible to detect.
  • a remote location e.g., the operator's home, a remote location, a shared office, etc.
  • the fraud detection unit 105 of the voice recognition system 10 transmits a fraud detection notification to the supervisor terminal 40 that monitors the operator with the operator ID (step S306).
  • this fraud detection notification includes, for example, the operator ID and an extension number associated with this operator ID using correspondence information.
  • the UI control unit 401 of the supervisor terminal 40 displays an alert on the display indicating that an unauthorized extension number may have been input (step S307).
  • the UI control unit 401 also displays the operator ID and extension number included in the fraud detection notification together with the alert. Further, along with the operator ID, the name and the like of the operator identified by the operator ID may be displayed. Furthermore, information related to the call represented by the extension number (for example, call start time, call end time, log, etc.) may be displayed, and information other than the call (for example, work time, clock out time, logon time, etc.) may be displayed. logout time, etc.) may be displayed.
  • the alert may be displayed in a display mode such as a pop-up window, or in any other display mode. Further, the alert may be displayed with a sound or the like, or may be output as a sound using a technology such as speech synthesis.
  • Steps S308 to S309 in FIG. 11 are the same as steps S205 to S206 in FIG. 8, respectively, so the explanation thereof will be omitted.
  • the voice recognition unit 104 of the voice recognition system 10 sends the supervisor terminal 40, which monitors the operator with the operator ID specified in step S304, the operator ID and the voice recognition text (speech) obtained in step S303. (recognition result) is transmitted (step S310).
  • the UI control unit 401 of the supervisor terminal 40 Upon receiving the operator ID and voice recognition text, the UI control unit 401 of the supervisor terminal 40 displays the name of the operator identified by the operator ID and the voice recognition text on the monitoring screen (step S311). This allows the supervisor to check the name of the operator and the content of the call in real time, thereby making it possible to check whether the operator is really making the call. This makes it possible to prevent operators from inputting incorrect extension numbers, and even if an alert is not displayed, it is possible to detect input of an incorrect extension number. You can expect it to happen.
  • the log storage unit 106 of the voice recognition system 10 stores a log that includes at least the extension number specified in step S302 and the voice recognition text of the call (that is, the voice recognition text created in step S303). This log is created and stored in the storage unit 110 (step S312). Further, at this time, if the operator ID is specified in step S304 and the data format is such that the operator ID can be included in the log, the log storage unit 106 creates a log that also includes the operator ID. . This makes it possible to use the log at a later date, for example, in an audit to confirm that no unauthorized extension number has been entered.
  • the UI control unit 501 of the administrator terminal 50 receives an input operation of operator information and log association information by the administrator (step S401).
  • the administrator can input the operator information/log correspondence information by, for example, specifying the operator ID included in the operator information and the extension number included in the log on the operator information/log association screen. It can be carried out. Note that at this time, the administrator may be able to designate an appropriate operator ID and extension number with reference to the work time zone included in the operator information, the work start time, the work leave time, etc. included in the log.
  • the UI control unit 501 of the administrator terminal 50 transmits the operator information/log association information input by the input operation in step S501 above to the voice recognition system 10 (step S402).
  • the log storage unit 106 of the speech recognition system 10 Upon receiving the operator information/log association information, the log storage unit 106 of the speech recognition system 10 stores this operator information/log association information in the storage unit 110 (step S403). As a result, operator information/log association information that associates operator information and logs is stored in the storage unit 110, and which log belongs to which operator is associated with each other.
  • operator information/log correspondence information can be created and saved from this matching result.
  • operator information/log correspondence information can be created without recording operator information in a log.
  • operator terminal information such as identification information and IP address of the operator terminal 20 is held, this information may be used to perform the association.
  • the log can include an operator ID (that is, the operator ID can be included in the log due to the data format of the log).
  • the log created in step S312 of FIG. 11 will not include the operator ID. Further, for example, if an incorrect extension number is input, the log created in step S312 of FIG. 11 will include an incorrect operator ID. Therefore, below, processing for supplementing a log with an operator ID or modifying an operator ID included in a log will be described with reference to FIG. 13.
  • the UI control unit 501 of the administrator terminal 50 receives an input operation of log supplement/correction information by the administrator (step S501).
  • the administrator for example, specifies the log to be complemented/corrected on the log completion/correction screen using the log ID (or call ID), and then specifies the information to be supplemented/corrected (for example, the operator ID, etc.), it is possible to input log supplement/correction information.
  • the information to be supplemented and corrected is not limited to the operator ID, as described above, and may be, for example, the operator's arrival time, leaving time, logon time, logout time, log retention period, etc.
  • the UI control unit 501 of the administrator terminal 50 transmits the log supplement/correction information input by the input operation in step S501 above to the voice recognition system 10 (step S502).
  • the log storage unit 106 of the speech recognition system 10 Upon receiving the log supplement/correction information, the log storage unit 106 of the speech recognition system 10 complements/corrects the log stored in the storage unit 110 using the log supplement/correction information (step S503).
  • the log storage unit 106 sets "user1" as the operator ID of the log. As a result, when the operator ID is not included in the log, the operator ID "user1" is complemented.
  • the log ID "002" and the operator ID "user2” are included in the log supplement/correction information, and the log with the log ID "002" stored in the storage unit 110 includes the operator ID "user3". If so, the log storage unit 106 modifies the operator ID of the log from "user3" to "user2". As a result, if the log contains an incorrect operator ID "user3", the operator ID is corrected to "user2". However, the information before modification (for example, the operator ID before modification) may be left in the log for later auditing or the like.
  • the log storage unit 106 stores the information in the storage unit 110.
  • the working time of the log with log ID "001" stored in the log may be set to "9:00” and the leaving time may be set to "17:00".
  • the arrival and departure times logon time, logout time, etc.
  • the log can be useful for, for example, auditing.
  • the contact center system 1 uses information (operator ID, extension number of the telephone 30) input at the operator terminal 20 installed at the same seat as the telephone 30. Using this, it becomes possible to link a call and the operator who is answering the call. Thereby, in the contact center system 1 according to the first and second embodiments, it becomes possible to display voice recognition text on the operator terminal 20 without CTI cooperation. In addition to this, by linking a call and the operator handling the call, various functions that become possible when CTI cooperation is performed (for example, call quality evaluation for each operator) can be implemented. It becomes possible to realize this.
  • the contact center system 1 according to the second embodiment it becomes possible to detect extension number input errors and unauthorized inputs that may occur in the first embodiment, and to audit these errors and fraud. Logs can also be saved. Therefore, compared to the contact center system 1 according to the first embodiment, it is possible to operate with higher security.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一態様による情報処理装置(10)は、通信ネットワークを介して接続される第1の端末(20)の認証に用いられたユーザIDと、前記第1の端末(20)から送信された第1の電話番号とを対応付けた対応情報を記憶部(110)に保持するように構成されている番号保持部(102)と、音声通話の音声パケットから第2の電話番号を特定するように構成されている番号特定部(103)と、前記記憶部(110)に保持されている対応情報を用いて、前記第2の電話番号と一致する第1の電話番号に対応付けられているユーザIDを特定するように構成されているユーザ特定部(104)と、を有する。

Description

情報処理装置、情報処理方法、プログラム、及びデータ構造
 本開示は、情報処理装置、情報処理方法、プログラム、及びデータ構造に関する。
 近年、コンタクトセンタ(又は、コールセンタとも呼ばれる。)では、オペレータの業務支援や業務効率化、顧客満足度向上等を目的として、CTI(Computer Telephony Integration)が導入されることが多くなってきている。CTIとは、音声認識システムや顧客管理システム等といったコンピュータと電話機やPBX(Private branch exchange)とを統合・連携させる仕組みのことである(例えば、非特許文献1)。CTIを導入することで、例えば、音声認識システムとPBXとを連携させて、コンタクトセンタの通話に対して音声認識を行うこと等が可能となる。以下、CTIを導入し、コンピュータと電話機やPBXとを連携させることを「CTI連携」とも呼ぶ。
 ところで、近年では、オペレータの着座座席に関してフリーアドレス制を採用するコンタクトセンタが増えている。フリーアドレス制とは、オペレータが固定的な座席を持たず、自由に又は何等かのルールに従って座席を選択できる仕組みのことである。フリーアドレス制ではオペレータの座席は日々変わり得るが、CTI連携によって音声認識を行うことで、音声認識された通話とオペレータとを紐付けることが可能となる。
"CTIミドルウェア「CTBASE/Core」 | NTTテクノクロス",インターネット<URL:https://www.ntt-tx.co.jp/products/ctbase/core.html>
 しかしながら、コンタクトセンタに音声認識システムを導入して通話の音声認識を行いたい一方で、様々な事情によりCTIを導入できない場合もある。例えば、既設のPBXがCTI連携機能を備えていない又はキャパティ不足によりCTI連携が困難であるが、PBXの入れ替えコストは許容できないような場合である。
 このような場合、特にフリーアドレス制を採用しているコンタクトセンタでは、音声認識された通話とオペレータとの紐付けができない、という問題がある。このため、どの音声認識結果がどのオペレータの通話に関するものであるかを紐付けることができない。
 本開示は、上記の点に鑑みてなされたもので、通話とオペレータとを紐付ける技術を提供する。
 本開示の一態様による情報処理装置は、通信ネットワークを介して接続される第1の端末の認証に用いられたユーザIDと、前記第1の端末から送信された第1の電話番号とを対応付けた対応情報を記憶部に保持するように構成されている番号保持部と、音声通話の音声パケットから第2の電話番号を特定するように構成されている番号特定部と、前記記憶部に保持されている対応情報を用いて、前記第2の電話番号と一致する第1の電話番号に対応付けられているユーザIDを特定するように構成されているユーザ特定部と、を有する。
 本開示によれば、通話とオペレータとを紐付ける技術が提供される。
第一の実施形態に係るコンタクトセンタシステムの全体構成の一例を示す図である。 第一の実施形態に係る通話とオペレータの紐付け方法とそれを利用した音声認識結果の送信の一例を説明するための図である。 第一の実施形態に係るコンタクトセンタの機能構成の一例を示す図である。 第一の実施形態に係るログオン時の処理の一例を示すシーケンス図である。 ログオン画面の一例を示す図である。 内線番号入力画面の一例を示す図である。 内線番号入力画面の他の例を示す図である。 第一の実施形態に係る音声認識処理の一例を示すシーケンス図である。 オペレータ画面の一例を示す図である。 第二の実施形態に係るコンタクトセンタの機能構成の一例を示す図である。 第二の実施形態に係る音声認識処理の一例を示すシーケンス図である。 第二の実施形態に係るオペレータ情報・ログ対応付け処理の一例を示すシーケンス図である。 第二の実施形態に係るログ補完・修正処理の一例を示すシーケンス図である。
 以下、本発明の一実施形態として第一の実施形態と第二の実施形態について説明する。以下、各実施形態では、コンタクトセンタを対象として、顧客との通話(音声通話)を音声認識する際に、CTI連携せずに、当該通話とその通話に応対しているオペレータとを紐付けることが可能なコンタクトセンタシステム1について説明する。ただし、コンタクトセンタは一例であって、コンタクトセンタ以外にも、例えば、オフィス等で勤務する担当者を対象として、通話とその通話に応対している担当者とを紐付ける場合等にも同様に適用することが可能である。より一般には、ある通話とその通話に応対している人とを紐付ける場合にも同様に適用することが可能である。
 [第一の実施形態]
 まず、第一の実施形態について説明する。
 <コンタクトセンタシステム1の全体構成>
 本実施形態に係るコンタクトセンタシステム1の全体構成例を図1に示す。図1に示すように、本実施形態に係るコンタクトセンタシステム1には、音声認識システム10と、複数のオペレータ端末20と、複数の電話機30と、1以上のスーパバイザ端末40と、1以上の管理者端末50と、PBX60と、NWスイッチ70と、顧客端末80とが含まれる。ここで、音声認識システム10、オペレータ端末20、電話機30、スーパバイザ端末40、管理者端末50、PBX60、及びNWスイッチ70は、コンタクトセンタのシステム環境であるコンタクトセンタ環境E内に設置されている。なお、コンタクトセンタ環境Eは同一の建物内のシステム環境に限られず、例えば、地理的に離れた複数の建物内のシステム環境であってもよい。
 音声認識システム10は、NWスイッチ70から送信されたパケット(音声パケット)を用いて、顧客とオペレータとの間の通話を音声認識によりテキストに変換すると共に、その通話に応対しているオペレータを特定する。
 オペレータ端末20は、オペレータが利用するPC(パーソナルコンピュータ)等の端末である。電話機30は、オペレータが利用するIP(Internet Protocol)電話機(固定IP電話機又は携帯IP電話機等)である。ここで、以下では、コンタクトセンタではフリーアドレス制が採用されており、オペレータの座席が日々(又は、例えば、午前と午後の間、担当業務の変更等といった何等かのタイミングで)変わり得ることを想定する。また、一般的なコンタクトセンタでは、オペレータの各座席には1台のオペレータ端末20と1台の電話機30とが設置されていることが多い。そこで、本実施形態でも、このようなコンタクトセンタを想定し、フリーアドレス制が採用されており、オペレータの座席が日々変わり得ると共に、それらの各座席には1台のオペレータ端末20と1台の電話機30とが設置されているものとする。
 スーパバイザ端末40は、スーパバイザが利用するPC等の端末である。スーパバイザとは、例えば、オペレータの通話を監視し、何等かの問題が発生しそうな場合やオペレータからの要請に応じてそのオペレータの電話応対業務を支援する者のことである。通常、数人~十数人程度のオペレータの通話が1人のスーパバイザにより監視されることが一般的である。
 管理者端末50は、コンタクトセンタ環境Eのシステム管理者が利用するPC等の端末である。なお、図1に示す例では管理者端末50が1台のみ図示されているが、管理者端末50は複数台存在してもよい。
 PBX60は、電話交換機(IP-PBX)であり、VoIP(Voice over Internet Protocol)網やPSTN(Public Switched Telephone Network)を含む通信ネットワーク90に接続されている。
 NWスイッチ70は、電話機30とPBX60との間でパケットを中継すると共に、そのパケットをキャプチャして音声認識システム10に送信する。
 顧客端末80は、顧客が利用するスマートフォンや携帯電話、固定電話等の各種端末である。
 なお、図1に示すコンタクトセンタシステム1の全体構成は一例であって、他の構成であってもよい。例えば、図1に示す例では、音声認識システム10がコンタクトセンタ環境Eに含まれているが(つまり、音声認識システム10はオンプレミス型であるが)、音声認識システム10の全部又は一部の機能がクラウドサービス等により実現されていてもよい。同様に、図1に示す例では、PBX60はオンプレミス型の電話交換機であるが、クラウドサービスにより実現されていてもよい。
 <通話とオペレータの紐付けとその紐付けを利用した音声認識結果の送信>
 本実施形態に係るコンタクトセンタシステム1で通話とオペレータとを紐付けて、その紐付けを利用して音声認識結果をそのオペレータが利用するオペレータ端末20に送信する場合について、図2を参照しながら説明する。ここで、各オペレータは、電話応対業務を開始する際に、自身の座席を選択し、その座席のオペレータ端末20に自身のオペレータIDとそれに対応するパスワードでログオンするものとする。なお、オペレータIDはオペレータを一意に識別する識別情報である。オペレータIDの代わりに、ログオンID等といった別の識別情報とそれに対応するパスワードがログオンに用いられてもよい。
 オペレータは、典型的には、上記の座席選択及びログオンを出勤時に行うが、これに限られず、例えば、午前と午後で異なる座席を利用する場合には午前の業務開始時と午後の業務開始時に座席選択及びログオンを行ってもよい。また、担当業務の変更に応じて異なる座席を利用する場合には変更前の担当業務の開始時と変更後の担当業務の開始時に座席選択及びログオンを行ってもよい。これら以外にも、その他の何等かのタイミングで座席選択及びログオンを行ってもよい。
 なお、オペレータは、退勤時等といった業務終了時や担当業務の変更時にオペレータ端末20からログアウトするが、これは従来技術と同様であるため、本実施形態ではその説明を省略する。
 このとき、本実施形態に係るコンタクトセンタシステム1は、以下の(1-1)~(1-6)により、通話とオペレータとを紐付けて、その通話の音声認識結果をそのオペレータが利用するオペレータ端末20上に表示させる。
 (1-1)まず、オペレータ端末20は、オペレータのログオン操作に応じて、このログオン操作で入力されたログオン情報(オペレータID及びそれに対応するパスワード)を音声認識システム10に送信する。なお、オペレータIDとそれに対応するパスワード(正しいパスワード)は音声認識システム10が保持していてもよいが、これに限られるものではなく、例えば、認証システム等といった音声認識システム10以外のシステム又は装置等が保持していてもよい。
 (1-2)次に、オペレータ端末20は、オペレータによる内線番号(例えば、「XXXX」)の入力操作に応じて、その内線番号を音声認識システム10に送信する。ここで、オペレータは、自身の座席に設置されている電話機30(つまり、上記の(1-1)でログオンしたオペレータ端末20と同一座席に設置されている電話機30)の内線番号を入力する。なお、当該電話機30の内線番号は、例えば、その電話機30のディスプレイ上に表示されていてもよいし、その電話機30が設置されている座席に張り紙等されていてもよい。
 (1-3)音声認識システム10は、オペレータ端末20から送信されたログオン情報に含まれるオペレータIDと、当該オペレータ端末20から送信された内線番号とを対応付けて保持する。これにより、内線番号からオペレータIDを特定することが可能となる。
 (1-4)顧客端末80からの発信を電話機30が着信した場合、音声認識システム10は、当該顧客端末80と当該電話機30との間の通話のパケットをキャプチャし、そのパケットから当該電話機30の内線番号を特定する。これにより、その内線番号からオペレータIDを特定することができるため、当該通話とオペレータとが紐付けられたことになる。
 (1-5)音声認識システム10は、当該顧客端末80と当該電話機30との間の通話のパケットに含まれる音声データに対して音声認識を行って、当該音声データが表す音声をテキスト(以下、「音声認識テキスト」ともいう。)に変換する。
 (1-6)そして、音声認識システム10は、当該通話に紐付けられているオペレータが利用するオペレータ端末20に対して、音声認識結果である音声認識テキストを送信する。これにより、当該オペレータ端末20上に音声認識テキストをリアルタイムに表示することが可能となる。なお、この場合、音声認識システム10は、例えば、オペレータのログオン時にそのオペレータのログオンに用いられたオペレータ端末20の識別情報やIPアドレス等といったオペレータ端末情報をオペレータIDと対応付けて保持しておき、このオペレータ端末情報を用いて音声認識テキストの送信先となるオペレータ端末20を特定すればよい。以下では、特に言及しないが、上記のように、音声認識システム10が音声認識テキストの送信先のオペレータ端末20を特定した上でその音声認識テキストを送信し、この音声認識テキストを表示するための画面はオペレータ端末20で生成されるものとする。ただし、これに限られるものではなく、例えば、オペレータID等が含まれる要求をオペレータ端末20が音声認識システム20に送信し、この要求に対する応答として音声認識テキスト(やその音声認識テキストが表示される画面の情報等)が音声認識システム10から当該オペレータ端末20に返信されてもよい。
 <コンタクトセンタシステム1の機能構成>
 本実施形態に係るコンタクトセンタシステム1に含まれる音声認識システム10及びオペレータ端末20の機能構成を図3に示す。
  ≪音声認識システム10≫
 図3に示すように、本実施形態に係る音声認識システム10は、認証部101と、内線番号保持部102と、内線番号特定部103と、音声認識部104とを有する。これら各部は、例えば、音声認識システム10にインストールされた1以上のプログラムが、CPU(Central Processing Unit)等のプロセッサに実行させる処理により実現される。また、本実施形態に係る音声認識システム10は、記憶部110を有する。記憶部110は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)、フラッシュメモリ等の記憶装置により実現可能である。ただし、記憶部110は、例えば、音声認識システム10と通信ネットワークを介して接続される記憶装置等により実現されていてもよい。
 認証部101は、オペレータ端末20から受信したログオン情報(オペレータIDとそれに対応するパスワード)を用いて、そのオペレータ端末20の認証を行う。
 内線番号保持部102は、認証に成功したオペレータ端末20から送信された内線番号と、そのオペレータ端末20の認証に用いられたログオン情報に含まれるオペレータIDとを対応付けて記憶部110に保持する。
 内線番号特定部103は、NWスイッチ70から送信されたパケットから、顧客端末80と通話を行っている電話機30の内線番号を特定する。
 音声認識部104は、NWスイッチ70から送信されたパケットに含まれる音声データに対して音声認識を行って、当該音声データが表す音声を音声認識テキストに変換する。また、音声認識部104は、記憶部110に記憶されている内線番号とオペレータIDの対応付けを参照して、内線番号特定部103によって特定された内線番号に対応するオペレータIDを特定した上で、そのオペレータIDでログオンしているオペレータ端末20に対してその音声認識テキストを送信する。
 記憶部110には、内線番号とオペレータIDの対応付けを表す情報が格納される。これ以外にも、記憶部110には様々な情報(例えば、オペレータ端末20の認証に必要な情報等)が格納されていてもよい。
  ≪オペレータ端末20≫
 図3に示すように、本実施形態に係るオペレータ端末20は、ログオン要求部201と、内線番号送信部202と、UI制御部203とを有する。これら各部は、例えば、オペレータ端末20にインストールされた1以上のプログラムが、CPU等のプロセッサに実行させる処理により実現される。
 ログオン要求部201は、オペレータの操作に応じて、このログオン操作で入力されたログオン情報(オペレータID及びそれに対応するパスワード)を音声認識システム10に送信する。
 内線番号送信部202は、オペレータによる内線番号の入力操作に応じて、その内線番号を音声認識システム10に送信する。
 UI制御部203は、オペレータ端末20のディスプレイ上に各種画面(例えば、後述するログオン画面、内線番号入力画面、オペレータ画面等)を表示する。また、UI制御部203は、これらの各種画面において、オペレータからの各種入力操作を受け付ける。
 <ログオン時の処理>
 以下、オペレータがオペレータ端末20にログオンする時の処理について、図4を参照しながら説明する。
 オペレータ端末20のUI制御部203は、オペレータによるログオン情報の入力操作を受け付ける(ステップS101)。ここで、オペレータは、例えば、図5に示すようなログオン画面G1000上でログオン情報の入力操作を行うことができる。すなわち、オペレータは、図5に示すログオン画面G1000において、自身のオペレータIDをオペレータID入力欄G1001に入力すると共に、そのオペレータIDに対応するパスワードをパスワード入力欄G1002に入力した上で、OKボタンG1003を押下することで、ログオン情報の入力操作を行うことができる。
 オペレータ端末20のログオン要求部201は、上記のステップS101の入力操作によって入力されたログオン情報(オペレータID及びそれに対応するパスワード)を音声認識システム10に送信する(ステップS102)。
 音声認識システム10の認証部101は、オペレータ端末20からログオン情報を受信すると、このログオン情報を用いて当該オペレータ端末20を認証する(ステップS103)。すなわち、認証部101は、当該ログオン情報に含まれるオペレータIDとパスワードが正しいか否かを検証し、その検証に成功した場合は認証成功とし、そうでない場合は認証失敗とする。なお、オペレータIDとパスワードが正しいか否かの検証は様々な方法で行うことが可能であるが、例えば、正しいオペレータIDとパスワードが格納された認証情報テーブルを参照することで、ログオン情報に含まれるオペレータIDとパスワードが正しいか否かを検証する方法が一般的である。
 なお、認証部101は、上記の認証結果(認証成功又は認証失敗)をオペレータ端末20に返信する。以下では、認証成功を示す認証結果が返信されたものとして説明を続ける。
 オペレータ端末20のUI制御部203は、オペレータによる内線番号の入力操作を受け付ける(ステップS104)。ここで、オペレータは、例えば、図6に示すような内線番号入力画面G2000上で内線番号の入力操作を行うことができる。すなわち、オペレータは、図6に示す内線番号入力画面G2000において、自身の座席に設置されている電話機30の内線番号を内線番号入力欄G2001に入力した上で、OKボタンG2002を押下することで、内線番号の入力操作を行うことができる。
 オペレータ端末20の内線番号送信部202は、上記のステップS104の入力操作によって入力された内線番号を音声認識システム10に送信する(ステップS105)。
 音声認識システム10の内線番号保持部102は、オペレータ端末20から内線番号を受信すると、この内線番号と、上記のステップS103で受信したログオン情報に含まれるオペレータIDとを対応付けて記憶部110に保持する(ステップS106)。これにより、(内線番号,オペレータID)という形式で内線番号とオペレータIDとを対応付けた情報(以下、対応情報ともいう。)が記憶部110に保持される。なお、例えば、オペレータ端末20から受信した内線番号と同一の内線番号が含まれる対応情報が既に記憶部110に記憶されている場合は、内線番号保持部102は、その対応情報に含まれるオペレータIDを、上記のステップS103で受信したログオン情報に含まれるオペレータIDに更新すればよい。
 ここで、図6に示す内線番号入力画面G2000では、オペレータは内線番号入力欄G2001に自由に内線番号を入力することが可能である。このため、内線番号の入力誤りが発生する可能性がある。また、他の座席の内線番号が入力されることで、後述するオペレータ画面におい他のオペレータの通話を参照できてしまう。そこで、自由に内線番号を入力できるのではなく、予め決められた複数の内線番号の中から選択可能となることが好ましい。
 この場合、例えば、図6に示す内線番号入力画面G2000の代わりに、例えば、図7に示すような内線番号入力画面G3000を表示することが考えられる。図7に示す内線番号入力画面G3000の内線番号入力欄G30001にはプルダウンボタンG3011が存在し、オペレータがプルダウンボタンG3011を押下すると、そのオペレータが選択可能な内線番号がプルダウンメニューG3012として表示される。このため、オペレータは、プルダウンメニューG3012の中から自身の座席に設置されている電話機30の内線番号を選択した上で、OKボタンG3002を押下し、内線番号の入力操作を行うことになる。これにより、誤った内線番号が入力されてしまう事態や他の座席の内線番号が不正に入力されてしまう事態等を防止できる。
 なお、一般に、コンタクトセンタでは電話応対業務の内容(例えば、契約業務、サポート業務、営業業務等)に応じていくつかの座席がまとめて設置(つまり、いわゆる島型レイアウトで座席が設置)されていることが多い。このため、例えば、自身の電話応対業務の内容に応じて特定の座席群の中から自身の座席を選択するようなフリーアドレス制の場合、その座席群毎にオペレータが選択可能な内線番号が決められていてもよい。又は、例えば、座席又は座席群が存在するエリア毎にオペレータが選択可能な内線番号が決められていてもよい。これら以外にも、例えば、オペレータが電話応対業務の内容に応じてグループ分けされている場合は、ログオンに用いられたオペレータIDから当該オペレータが属するグループ等を特定し、そのグループに応じて選択可能な内線番号が決められてもよい。
 また、上記ではログオン画面でログオン情報を入力し、内線番号入力画面で内線番号を入力したが、これに限られるものではなく、例えば、同一画面でログオン情報と内線番号の両方が入力されてもよい。
 <音声認識処理>
 以下、オペレータがオペレータ端末20にログオンしており、当該オペレータ端末20と同一座席に設置されている電話機30を用いて顧客端末80と通話しているものとする。このとき、当該通話の音声認識を行って、その結果を当該オペレータ端末20のディスプレイ上に表示する場合の処理について、図8を参照しながら説明する。ここで、電話機30と顧客端末80との間で通話が行われている間、当該通話のパケット(音声パケット)はNWスイッチ70によってキャプチャされ、その都度又は所定のデータ量のパケットをバッファさせた後、音声認識システム10に送信される。
 NWスイッチ70でキャプチャされたパケットを受信すると(ステップS201)、音声認識システム10の内線番号特定部103は、当該パケットから、当該通話を行っている電話機30の内線番号を特定する(ステップS202)。これにより、特定した内線番号と記憶部110に格納されている対応情報からオペレータIDを特定することができるため、当該通話とオペレータとが紐付けられたことになる。
 ここで、一般にパケットには内線番号が含まれているため、内線番号特定部103は、そのパケットを解析することで、当該内線番号を特定することが可能である。ただし、例えば、パケットが暗号化されている場合やパケットのプロトコルが一般的なプロトコルではない場合等には、その解析が困難である。そこで、このような場合、電話機30のIPアドレスが固定的であるという前提の下、内線番号特定部103は、電話機30のIPアドレスとその内線番号とが格納された内線番号テーブルを参照することで、当該パケットのIPアドレスから内線番号を特定すればよい。
 次に、音声認識システム10の音声認識部104は、当該パケットに含まれる音声データに対して音声認識を行って、当該音声データが表す音声を音声認識テキストに変換する(ステップS203)。
 次に、音声認識システム10の音声認識部104は、記憶部110に記憶されている対応情報を参照して、上記のステップS202で特定された内線番号に対応するオペレータIDを特定する(ステップS204)。
 次に、音声認識システム10の音声認識部104は、上記のステップS204で特定されたオペレータIDでログオンしているオペレータ端末20に対して、上記のステップS203で得られた音声認識テキスト(音声認識結果)を送信する(ステップS205)。
 オペレータ端末20のUI制御部203は、音声認識結果を表す音声認識テキストを受信すると、この音声認識テキストをディスプレイ上に表示する(ステップS206)。例えば、当該オペレータ端末20のディスプレイ上には、図9に示すようなオペレータ画面G4000が表示されているものとする。このオペレータ画面G4000にはオペレータと顧客の発話を表す音声認識テキストで表示される発話表示欄G4001が含まれており、音声認識テキストを受信すると、UI制御部203によって発話表示欄G4001内に当該音声認識テキストが発話者毎に時系列順で表示される。これにより、オペレータは通話中における各発話者の各発話内容をテキストでリアルタイムに確認することが可能となる。
 [第二の実施形態]
 次に、第二の実施形態について説明する。上述したように、図6に示すような内線番号入力画面G2000では内線番号の入力誤りや内線番号の不正入力が発生し得る。これに対して、図7に示すような内線番号入力画面G3000では内線番号の入力誤りや内線番号の不正入力を防止することが可能となるが、例えば、座席群毎にオペレータが選択可能な内線番号が決められているような場合には、自身が選択した座席と同一の座席群の内線番号を入力することは可能である。このため、例えば、自身が選択した座席と同一の座席群の中の他の座席の内線番号を入力し、その他の座席に座っているオペレータの通話を不正に見ることが可能できてしまう。
 そこで、本実施形態では、上記のような不正を抑止することを目的として、不正が検知された場合はスーパバイザ等にアラートを通知する場合について説明する。また、後日の監査等のために、オペレータが入力した内線番号等を音声認識テキスト等と共にログとして保存する場合についても説明する。加えて、ログのデータ形式上、ログにオペレータIDが含まれない場合は、どのログがどのオペレータのログであるかが不明となってしまうため、そのようなログを、オペレータを表す情報(以下、オペレータ情報ともいう。)と対応付ける場合についても説明する。また、ログにオペレータIDが含まれ得るとしても、内線番号が入力されなかった場合や誤った内線番号が入力された場合等にはオペレータIDが含まれないログや誤ったオペレータIDが含まれるログが作成されてしまうため、そのようなログを補完・修正する場合についても説明する。
 なお、本実施形態では、第一の実施形態との相違点について説明し、第一の実施形態と同様の構成要素についてはその説明を省略する。
 <コンタクトセンタシステム1の機能構成>
 本実施形態に係るコンタクトセンタシステム1に含まれる音声認識システム10、オペレータ端末20、スーパバイザ端末40、及び管理者端末50の機能構成を図10に示す。
  ≪音声認識システム10≫
 図10に示すように、本実施形態に係る音声認識システム10は、不正検知部105と、ログ保存部106とを更に有する点が第一の実施形態と異なる。不正検知部105とログ保存部106は、例えば、音声認識システム10にインストールされた1以上のプログラムが、CPU等のプロセッサに実行させる処理により実現される。
 不正検知部105は、認証に成功したオペレータ端末20から送信された内線番号が不正なものである場合それを検知する。また、不正検知部105は、不正が検知された場合、不正な内線番号が入力された可能性があることを示す通知(以下、不正検知通知ともいう。)をスーパバイザ端末40に送信する。
 ログ保存部106は、内線番号特定部103によって特定された内線番号等と音声認識部104によって変換された音声認識テキスト等が含まれるログを作成し、通話のログとして記憶部110に保存する。ここで、ログには、例えば、時刻、内線番号、音声認識テキスト等が含まれる。ただし、これは一例であって、これに限られるものではなく、例えば、通話ID、オペレータID、当該オペレータIDによって識別されるオペレータの氏名、通話開始時刻、顧客端末80の電話番号等といった情報が含まれていてもよい。また、例えば、オペレータの出勤時刻や退勤時刻、オペレータがオペレータ端末20にログオンしたログオン時刻、ログアウトしたログアウト時刻等といった情報を含めてもよい。更に、例えば、ログによってそのログの保存期間を異ならせる場合には、保存期間等といった情報をログに含めることができてもよい。なお、ログはログIDによって識別されてもよいし、通話毎にログが作成されるため通話IDによって識別されてもよい。
 また、音声認識部104は、第一の実施形態で説明した機能に加えて、特定したオペレータIDのオペレータを監視するスーパバイザ端末40に対して、そのオペレータIDと音声認識テキストとを送信する。
  ≪スーパバイザ端末40≫
 図10に示すように、本実施形態に係るスーパバイザ端末40は、UI制御部401を有する。UI制御部401は、例えば、スーパバイザ端末40にインストールされた1以上のプログラムが、CPU等のプロセッサに実行させる処理により実現される。
 UI制御部401は、音声認識システム10から不正検知通知を受信すると、不正な内線番号が入力された可能性があることを表すアラートを表示する。また、UI制御部401は、音声認識システム10から受信した音声認識テキスト等を所定の画面(例えば、オペレータの通話を監視するための監視画面等)上に表示する。
  ≪管理者端末50≫
 図10に示すように、本実施形態に係る管理者端末50は、UI制御部501を有する。UI制御部501は、例えば、管理者端末50にインストールされた1以上のプログラムが、CPU等のプロセッサに実行させる処理により実現される。
 UI制御部501は、オペレータ情報とログとを対応付けるため所定の画面(以下、オペレータ情報・ログ対応付け画面ともいう。)を表示したり、ログの補完・修正を行うための所定の画面(以下、ログ補完・修正画面ともいう。)を表示したりする。
 また、UI制御部501は、オペレータ情報・ログ対応付け画面上におけるオペレータ情報とログとの対応付けを表すオペレータ情報・ログ対応付け情報の入力操作を受け付けると共に、その操作で入力された情報が含まれるオペレータ情報・ログ対応付け情報を音声認識システム10に送信する。ここで、オペレータ情報とはオペレータIDが少なくとも含まれる情報である。オペレータ情報には、オペレータID以外にも、例えば、オペレータの氏名、そのオペレータの出勤時間帯等といった情報が含まれていてもよい。一方で、オペレータ情報・ログ対応付け情報とは、オペレータ情報とログとを対応付けるための情報であり、例えば、オペレータIDと内線番号とが少なくとも含まれる情報である。オペレータ情報・ログ対応付け情報の入力操作ではオペレータID及び内線番号等を入力することができるが、これ以外にも、様々な情報が入力できてもよい。
 更に、UI制御部501は、ログ補完・修正画面上におけるログ補完・修正情報の入力操作を受け付けると共に、その操作で入力された情報が含まれるログ補完・修正情報を音声認識システム10に送信する。ここで、ログ補完・修正情報の入力操作ではオペレータID等を入力することができるが、これ以外にも、例えば、そのオペレータIDによって識別されるオペレータの出勤時刻、退勤時刻、ログオン時刻、ログアウト時刻等といった様々な情報を入力することができてもよい。
 <音声認識処理>
 以下、オペレータがオペレータ端末20にログオンしており、当該オペレータ端末20と同一座席に設置されている電話機30を用いて顧客端末80と通話しているものとする。このとき、当該通話の音声認識を行って、その結果を当該オペレータ端末20のディスプレイ上に表示する場合の処理について、図11を参照しながら説明する。ここで、電話機30と顧客端末80との間で通話が行われている間、当該通話のパケット(音声パケット)はNWスイッチ70によってキャプチャされ、その都度又は所定のデータ量のパケットをバッファさせた後、音声認識システム10に送信される。
 図11のステップS301~ステップS304は、図8のステップS201~ステップS204とそれぞれ同様であるため、その説明を省略する。
 ステップS304に続いて、音声認識システム10の不正検知部105は、認証に成功したオペレータ端末20から送信された内線番号が不正なものである場合それを検知する(ステップS305)。すなわち、不正検知部105は、ステップS304で特定されたオペレータIDを用いて、このオペレータIDに対応付けられている内線番号が不正なものであるか否かを判定し、不正なものであると判定された場合は不正が検知されたものとする。
 ここで、不正検知部105は、例えば、以下の方法1又は2により内線番号が不正なものであるか否かを検知すればよい。
 方法1:一般に、コンタクトセンタのオペレータはトークスクリプトと呼ばれるマニュアルに従って電話応対業務を行っている場合が多い。また、トークスクリプトには電話応対のシーン毎にオペレータの発話内容が定義されおり、電話応対開始時の「オープニング」シーンでは、一般に、「お電話ありがとうございます。〇〇〇コールセンタの×××(オペレータの氏)でございます。」といった名乗りが定義されていることが多い。そこで、方法1では、当該通話における「オープニング」シーンの「名乗り」を表す音声認識テキストと、当該オペレータIDによって識別されるオペレータの氏とを比較(マッチング)し、その音声認識テキストの中に当該オペレータの氏が含まれていればそのオペレータIDに対応付けられている内線番号は不正なものではないと判定し、含まれていなければそのオペレータIDに対応付けられている内線番号は不正なものであると判定する。なお、上記の比較(マッチング)は、例えば、文字列のパターンマッチング等により実現することができる。
 方法2:既知の声紋認証と呼ばれる技術を利用し、当該通話の音声と、当該オペレータIDによって識別されるオペレータの音声とを比較し、その一致度が所定の閾値以上である場合はそのオペレータIDに対応付けられている内線番号は不正なものではないと判定し、一致度が所定の閾値未満である場合はそのオペレータIDに対応付けられている内線番号は不正なものであると判定する。なお、当該オペレータIDによって識別されるオペレータの音声を表す音声データやオペレータの音声の特徴量を表すデータ等を予め登録しておく必要がある。声紋認証を利用することで、オペレータが遠隔地(例えば、オペレータの自宅、遠隔拠点、シェアオフィス等)で勤務している場合であっても、不正な内線番号の入力や誤った内線番号の入力を検知することが可能となる。
 上記のステップS305で不正が検知された場合、音声認識システム10の不正検知部105は、当該オペレータIDのオペレータを監視するスーパバイザ端末40に対して不正検知通知を送信する(ステップS306)。なお、この不正検知通知には、例えば、当該オペレータIDと、このオペレータIDと対応情報により対応付けられている内線番号とが含まれる。
 スーパバイザ端末40のUI制御部401は、不正検知通知を受信すると、不正な内線番号が入力された可能性があることを表すアラートをディスプレイ上に表示する(ステップS307)。このとき、UI制御部401は、不正検知通知に含まれるオペレータID及び内線番号もアラートと共に表示される。また、オペレータIDと共に、そのオペレータIDによって識別されるオペレータの氏名等が表示されてもよい。更に、当該内線番号によって表される通話に関する情報(例えば、通話開始時刻、通話終了時刻、ログ等)が表示されてもよいし、通話以外の情報(例えば、出勤時刻、退勤時刻、ログオン時刻、ログアウト時刻等)が表示されてもよい。アラートは、例えば、ポップアップウィンドウ等といった表示態様で表示されてもよいし、その他の任意の表示態様で表示されてもよい。更に、アラートは音等と共に表示されてもよいし、音声合成等の技術により音声として出力されてもよい。
 これにより、スーパバイザは、不正な内線番号が入力された場合には容易にそれを知ることができる。
 図11のステップS308~ステップS309は、図8のステップS205~ステップS206とそれぞれ同様であるため、その説明を省略する。
 続いて、音声認識システム10の音声認識部104は、ステップS304で特定されたオペレータIDのオペレータを監視するスーパバイザ端末40に対して、そのオペレータIDと、ステップS303で得られた音声認識テキスト(音声認識結果)とを送信する(ステップS310)。
 スーパバイザ端末40のUI制御部401は、オペレータIDと音声認識テキストを受信すると、そのオペレータIDによって識別されるオペレータの氏名とその音声認識テキストを監視画面上に表示する(ステップS311)。これにより、スーパバイザは、オペレータの氏名と当該通話の通話内容をリアルタイムに確認することができるため、そのオペレータが本当にその通話を行っているのかを確認することが可能となる。このため、オペレータに対しては不正な内線番号の入力を抑止させることが可能になり、また万が一、アラートが表示されなかった場合であっても不正な内線番号の入力を発見することが可能になることが期待できる。
 一方で、音声認識システム10のログ保存部106は、ステップS302で特定された内線番号と、当該通話の音声認識テキスト(つまり、ステップS303で作成された音声認識テキスト)とが少なくとも含まれるログを作成し、このログを記憶部110に保存する(ステップS312)。また、このとき、ステップS304でオペレータIDが特定されており、かつ、ログにオペレータIDを含めることができるデータ形式である場合は、ログ保存部106は、そのオペレータIDも含まれるログを作成する。これにより、例えば、後日、不正な内線番号が入力されていないことを確認するための監査等に当該ログを利用することが可能となる。
 <オペレータ情報・ログ対応付け処理>
 以下では、ログにはオペレータIDが含まれない(つまり、ログのデータ形式上、オペレータIDがログに含まれない)ものとする。この場合、どのログがどのオペレータのログであるかが不明となってしまう。そこで、以下では、オペレータ情報とログとを対応付ける場合の処理について、図12を参照しながら説明する。
 管理者端末50のUI制御部501は、管理者によるオペレータ情報・ログ対応付け情報の入力操作を受け付ける(ステップS401)。ここで、管理者は、例えば、オペレータ情報・ログ対応付け画面上でオペレータ情報に含まれるオペレータIDとログに含まれる内線番号とを指定することで、オペレータ情報・ログ対応付け情報の入力操作を行うことができる。なお、このとき、管理者は、オペレータ情報に含まれる出勤時間帯、ログに含まれる出勤時刻や退勤時刻等を参考に、適切なオペレータIDと内線番号とを指定することができてもよい。これにより、例えば、オペレータの出勤時間帯と実際の出勤時刻及び退勤時刻とを突合し、同一時間帯における異なる内線番号のログに同一のオペレータが重複して対応付けられてしまう事態を防止したり、オペレータの不在時間にも関わらずそのオペレータにログが対応付けられてしまう事態を防止したりすることが可能となり、より精度の高い対応付けを実現することができるようになる。また、仮にオペレータによって誤った内線番号が入力されてしまった場合であっても、そのオペレータの出勤時間帯と実際の出勤時刻及び退勤時刻とを突合し、オペレータ情報とログとを正しく対応付けることが可能となる。
 管理者端末50のUI制御部501は、上記のステップS501の入力操作によって入力されたオペレータ情報・ログ対応付け情報を音声認識システム10に送信する(ステップS402)。
 音声認識システム10のログ保存部106は、オペレータ情報・ログ対応付け情報を受信すると、このオペレータ情報・ログ対応付け情報を記憶部110に保存する(ステップS403)。これにより、オペレータ情報とログとを対応付けるオペレータ情報・ログ対応付け情報が記憶部110に保存され、どのログがどのオペレータのものであるかが対応付けられたことになる。
 ここでは管理者によりオペレータ情報・ログ対応付け情報の入力操作の事例を説明したが、これに限らない。例えば、オペレータがオペレータ端末20からログオン(認証に成功)した時点で、オペレータIDと内線番号の対応付けがなされると共に、ログオンとログオフの時刻を記録する。一方で、ログには少なくも内線番号と通話開始時刻と通話終了時刻(又は、個々の発話時刻)が記録されるとする。この場合、通話開始時刻及び通話終了時刻(又は、個々の発話時刻)とログオンからログオフまでの時刻とを突合することによって、ログとオペレータ情報の対応付けを自動的に行うことができる。このため、この突合結果からオペレータ情報・ログ対応付け情報を作成及び保存できる。このようにして、ログにオペレータ情報を記録しなくても、オペレータ情報・ログ対応付け情報を作成することができる。更に、オペレータ端末20の識別情報やIPアドレス等といったオペレータ端末情報を保持している場合は、これらの情報を利用して対応付けを行ってもよい。
 <ログ補完・修正処理>
 以下では、ログにはオペレータIDが含まれ得る(つまり、ログのデータ形式上、オペレータIDをログに含めることができる)ものとする。
 例えば、オペレータがオペレータ端末20にログオンしなかった場合(つまり、内線番号が入力されなかった場合)には、図11のステップS312で作成されたログにはオペレータIDが含まれないことになる。また、例えば、誤った内線番号が入力された場合には、図11のステップS312で作成されたログには誤ったオペレータIDが含まれてしまうことになる。そこで、以下では、ログにオペレータIDを補完したり、ログに含まれるオペレータIDを修正したりする場合の処理について、図13を参照しながら説明する。
 管理者端末50のUI制御部501は、管理者によるログ補完・修正情報の入力操作を受け付ける(ステップS501)。ここで、管理者は、例えば、ログ補完・修正画面上で補完・修正対象のログをログID(又は通話IDでもよい。)により指定した上で、補完・修正対象となる情報(例えば、オペレータID等)を入力することで、ログ補完・修正情報の入力操作を行うことができる。なお、補完・修正対象となる情報は、上述したように、オペレータIDだけに限られず、例えば、オペレータの出勤時刻、退勤時刻、ログオン時刻、ログアウト時刻、ログの保存期間等であってもよい。
 管理者端末50のUI制御部501は、上記のステップS501の入力操作によって入力されたログ補完・修正情報を音声認識システム10に送信する(ステップS502)。
 音声認識システム10のログ保存部106は、ログ補完・修正情報を受信すると、このログ補完・修正情報により記憶部110に保存されているログを補完・修正する(ステップS503)。
 例えば、ログID「001」、オペレータID「user1」がログ補完・修正情報に含まれており、記憶部110に保存されているログID「001」のログにオペレータIDが含まれていない場合、ログ保存部106は、そのログのオペレータIDに「user1」に設定する。これにより、そのログにオペレータIDが含まれていない場合に、オペレータID「user1」が補完される。
 また、例えば、ログID「002」、オペレータID「user2」がログ補完・修正情報に含まれており、記憶部110に保存されているログID「002」のログにオペレータID「user3」が含まれている場合、ログ保存部106は、そのログのオペレータIDを「user3」から「user2」に修正する。これにより、そのログに誤ったオペレータID「user3」が含まれている場合に、そのオペレータIDが「user2」に修正される。ただし、後日の監査等のために、ログに修正前の情報(例えば、修正前のオペレータID等)を残しておいてもよい。
 これ以外にも、例えば、ログID「001」、出勤時刻「9:00」、退勤時刻「17:00」がログ補完・修正情報に含まれている場合、ログ保存部106は、記憶部110に保存されているログID「001」のログの出勤時刻を「9:00」、退勤時刻を「17:00」に設定してもよい。このように、ログが作成された後に、そのログに含まれるオペレータIDによって識別されるオペレータの出勤時刻や退勤時刻(ログオン時刻やログアウト時刻等でもよい。)等を設定することもできる。これにより、例えば、監査等により有用なログとすることができる。
 [まとめ]
 以上のように、第一及び第二の実施形態に係るコンタクトセンタシステム1は、電話機30と同一座席に設置されているオペレータ端末20で入力された情報(オペレータID、その電話機30の内線番号)を用いて、通話とその通話に応対しているオペレータとを紐付けることが可能になる。これにより、第一及び第二の実施形態に係るコンタクトセンタシステム1では、CTI連携をせずに、音声認識テキストをそのオペレータ端末20上に表示させることが可能となる。なお、これ以外にも、通話とその通話に応対しているオペレータとを紐付けることで、CTI連携を行った場合に可能となる様々な機能(例えば、オペレータ毎の通話の品質評価等)を実現することが可能となる。
 このため、CTIを導入できない様々な事情(例えば、既設のPBXがCTI連携機能を備えていない又はキャパティ不足によりCTI連携が困難であるが、PBXの入れ替えコストは許容できないような場合等)がある場合であっても、例えば、オペレータの応対支援を行ったり、通話の品質評価を行ったりといった様々な機能を実現することが可能となる。
 また、第二の実施形態に係るコンタクトセンタシステム1では、第一の実施形態で発生し得る内線番号の入力誤りや不正入力等を検知することが可能となり、またそれらの誤りや不正を監査するためのログも保存することができる。このため、第一の実施形態に係るコンタクトセンタシステム1と比べて、セキュリティをより担保した運用が可能となる。
 本発明は、具体的に開示された上記の実施形態に限定されるものではなく、請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
 1    コンタクトセンタシステム
 10   音声認識システム
 20   オペレータ端末
 30   電話機
 40   スーパバイザ端末
 50   管理者端末
 60   PBX
 70   NWスイッチ
 80   顧客端末
 90   通信ネットワーク
 101  認証部
 102  内線番号保持部
 103  内線番号特定部
 104  音声認識部
 105  不正検知部
 106  ログ保存部
 110  記憶部
 201  ログオン要求部
 202  内線番号送信部
 203  UI制御部
 401  UI制御部
 501  UI制御部
 E    コンタクトセンタ環境

Claims (14)

  1.  通信ネットワークを介して接続される第1の端末の認証に用いられたユーザIDと、前記第1の端末から送信された第1の電話番号とを対応付けた対応情報を記憶部に保持するように構成されている番号保持部と、
     音声通話の音声パケットから第2の電話番号を特定するように構成されている番号特定部と、
     前記記憶部に保持されている対応情報を用いて、前記第2の電話番号と一致する第1の電話番号に対応付けられているユーザIDを特定するように構成されているユーザ特定部と、
     を有する情報処理装置。
  2.  前記音声パケットに含まれる音声データが表す音声を音声認識によりテキストに変換するように構成されている音声認識部と、
     前記ユーザ特定部によって特定されたユーザIDでログオンしている第1の端末に対して、前記テキストを送信するように構成されている送信部と、を更に有する請求項1に記載の情報処理装置。
  3.  前記送信部は、
     前記ユーザIDによって識別されるユーザを監視する監視者の第2の端末に対して、前記ユーザIDと前記テキストとを送信するように構成されている、請求項2に記載の情報処理装置。
  4.  前記第2の電話番号と前記テキストとが少なくとも含まれるログ情報を作成し、前記ログ情報を前記記憶部に保存するように構成されているログ保存部を更に有する請求項2又は3に記載の情報処理装置。
  5.  前記ログ保存部は、
     通信ネットワークを介して接続される第3の端末上に表示された所定の画面における前記ユーザID及び前記第2の電話番号の指定に応じて、前記ユーザIDが含まれるユーザ情報と前記第2の電話番号が含まれるログ情報とを対応付ける情報を前記記憶部に保存するように構成されている、請求項4に記載の情報処理装置。
  6.  前記第2の電話番号を用いて、前記対応情報に含まれる第1の電話番号が不正なものであるか否かを判定するように構成されている不正検知部と、
     前記不正検知部によって前記第1の電話番号が不正なものであると判定された場合、前記ユーザIDによって識別されるユーザを監視する監視者の第2の端末に対して、前記対応情報におけるユーザIDと第1の電話番号との対応付けに関して前記監視者に確認を求める提示を行うための提示情報を送信するように構成されている提示部と、を更に有する請求項1乃至5の何れか一項に記載の情報処理装置。
  7.  前記提示部は、
     前記第1の電話番号によって表される通話に関する情報と、前記通話以外の情報との少なくとも1つの情報と共に前記対応付けの確認を前記監視者に求める提示を行うための提示情報を生成する、請求項6に記載の情報処理装置。
  8.  前記不正検知部は、
     前記音声通話の開始時を表すシーンであるオープニングシーンの音声認識結果を表すテキストの中に、前記ユーザIDによって識別されるユーザの氏が含まれている場合、前記第1の電話番号は不正なものではないと判定し、前記テキストの中に、前記ユーザIDによって識別されるユーザの氏が含まれていない場合、前記第1の電話番号は不正なものであると判定するように構成されている、請求項6又は7に記載の情報処理装置。
  9.  前記不正検知部は、
     前記音声通話の音声と、前記ユーザIDによって識別されるユーザの音声とを声紋認証により比較し、前記比較の結果を表す一致度が所定の閾値以上である場合、前記第1の電話番号は不正なものではないと判定し、前記一致度が所定の閾値未満である場合、前記第1の電話番号は不正なものであると判定するように構成されている、請求項6又は7に記載の情報処理装置。
  10.  前記第1の電話番号は、前記第1の端末が設置されているエリア又は前記ユーザIDに応じて予め決められた複数の電話番号の中から選択された電話番号である、請求項1乃至9の何れか一項に記載の情報処理装置。
  11.  前記番号保持部は、
     前記第1の端末に表示された認証画面で入力された前記ユーザIDと、前記第1の端末に表示された前記認証画面又は前記認証画面での認証に成功した後に表示される画面で入力された前記第1の電話番号とを対応付けた前記対応情報を前記記憶部に保持するように構成されている、請求項1乃至10の何れか一項に記載の情報処理装置。
  12.  通信ネットワークを介して接続される第1の端末の認証に用いられたユーザIDと、前記第1の端末から送信された第1の電話番号とを対応付けた対応情報を記憶部に保持する番号保持手順と、
     音声通話の音声パケットから第2の電話番号を特定する番号特定手順と、
     前記記憶部に保持されている対応情報を用いて、前記第2の電話番号と一致する第1の電話番号に対応付けられているユーザIDを特定するユーザ特定手順と、
     をコンピュータが実行する情報処理方法。
  13.  通信ネットワークを介して接続される第1の端末の認証に用いられたユーザIDと、前記第1の端末から送信された第1の電話番号とを対応付けた対応情報を記憶部に保持する番号保持手順と、
     音声通話の音声パケットから第2の電話番号を特定する番号特定手順と、
     前記記憶部に保持されている対応情報を用いて、前記第2の電話番号と一致する第1の電話番号に対応付けられているユーザIDを特定するユーザ特定手順と、
     をコンピュータに実行させるプログラム。
  14.  端末を操作するユーザと前記ユーザが音声通話を行うための電話番号との対応関係をコンピュータが保持するためのデータ構造であって、
     前記端末の認証に成功した前記ユーザのユーザIDと共に指定された前記電話番号が、前記音声通話の音声パケットに含まれる電話番号と同じ場合に、前記ユーザの通話と関連付けて、前記ユーザに関する通話として前記音声パケットを音声処理可能とする、データ構造。
PCT/JP2022/016665 2022-03-31 2022-03-31 情報処理装置、情報処理方法、プログラム、及びデータ構造 WO2023188313A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2022/016665 WO2023188313A1 (ja) 2022-03-31 2022-03-31 情報処理装置、情報処理方法、プログラム、及びデータ構造
JP2024511065A JPWO2023188313A1 (ja) 2022-03-31 2022-03-31

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/016665 WO2023188313A1 (ja) 2022-03-31 2022-03-31 情報処理装置、情報処理方法、プログラム、及びデータ構造

Publications (1)

Publication Number Publication Date
WO2023188313A1 true WO2023188313A1 (ja) 2023-10-05

Family

ID=88199927

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/016665 WO2023188313A1 (ja) 2022-03-31 2022-03-31 情報処理装置、情報処理方法、プログラム、及びデータ構造

Country Status (2)

Country Link
JP (1) JPWO2023188313A1 (ja)
WO (1) WO2023188313A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293500A (ja) * 2006-04-24 2007-11-08 Nomura Research Institute Ltd コールセンターにおける情報提供システム、情報提供方法および情報提供プログラム
JP2009010503A (ja) * 2007-06-26 2009-01-15 Hitachi Communication Technologies Ltd 通話システム
JP2021158413A (ja) * 2020-03-25 2021-10-07 株式会社日立情報通信エンジニアリング コールセンタシステムおよびコールセンタ管理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293500A (ja) * 2006-04-24 2007-11-08 Nomura Research Institute Ltd コールセンターにおける情報提供システム、情報提供方法および情報提供プログラム
JP2009010503A (ja) * 2007-06-26 2009-01-15 Hitachi Communication Technologies Ltd 通話システム
JP2021158413A (ja) * 2020-03-25 2021-10-07 株式会社日立情報通信エンジニアリング コールセンタシステムおよびコールセンタ管理方法

Also Published As

Publication number Publication date
JPWO2023188313A1 (ja) 2023-10-05

Similar Documents

Publication Publication Date Title
US8755500B2 (en) Biometric identification in communication
US7260201B2 (en) Method and apparatus for monitoring telephone status
US8838081B2 (en) Mobile device applications for computer-telephony systems
US20040022384A1 (en) Method for customer recognition and management
US7940913B2 (en) System and method for improved contact center services to disabled callers
CN1937662B (zh) 一种电信语音增值业务中用户统一认证的方法
US8428238B2 (en) System and method for ensuring call privacy in a shared telephone environment
JP2014531694A (ja) ユーザ認証
CA2196989A1 (en) Method and system therefor of establishing an acceptance threshold for controlling fraudulent telephone calls
US8280032B2 (en) Registration of a telephone/computer association in a computer telephony integration environment
US20090086943A1 (en) Identification of multiple persons on a phone call
US20060210044A1 (en) Automated conference call outdial security method
KR101626302B1 (ko) 화자 인식을 위한 자연적 등록 방법
JP2012049756A (ja) 在宅コールセンタシステム及び在宅コール応答方法
KR101199311B1 (ko) 자동응답시스템의 자동 시나리오 테스트 시스템, 장치 및 방법
WO2023188313A1 (ja) 情報処理装置、情報処理方法、プログラム、及びデータ構造
US7020249B1 (en) Voice interface unit for line conditioner control
KR20030009562A (ko) 범용 사설 교환기와 호환되는 콜센터 시스템과 그 운용방법
TWI830099B (zh) 專用交換機自動障礙偵測與通報之方法、系統及電腦可讀媒介
JP5947419B1 (ja) コールセンタシステムにより実行される認証方法
US20240013779A1 (en) Information-processing apparatus, information-processing method, and program
WO2023058256A1 (ja) 情報処理装置、情報処理方法及びプログラム
KR20080109102A (ko) 화상정보 기반 고객상담시스템 및 그 방법
JP2024061068A (ja) 障害対応装置、障害対応システム、障害対応方法、及び障害対応プログラム
JP2012195856A (ja) 電話通信システム及び方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22935455

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2024511065

Country of ref document: JP