JP7001241B2 - Packet monitoring device, private branch exchange, virtual assistant calling method, and program - Google Patents

Packet monitoring device, private branch exchange, virtual assistant calling method, and program Download PDF

Info

Publication number
JP7001241B2
JP7001241B2 JP2020024846A JP2020024846A JP7001241B2 JP 7001241 B2 JP7001241 B2 JP 7001241B2 JP 2020024846 A JP2020024846 A JP 2020024846A JP 2020024846 A JP2020024846 A JP 2020024846A JP 7001241 B2 JP7001241 B2 JP 7001241B2
Authority
JP
Japan
Prior art keywords
call
virtual assistant
telephones
private
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020024846A
Other languages
Japanese (ja)
Other versions
JP2021132240A (en
Inventor
慎吾 飯山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2020024846A priority Critical patent/JP7001241B2/en
Publication of JP2021132240A publication Critical patent/JP2021132240A/en
Application granted granted Critical
Publication of JP7001241B2 publication Critical patent/JP7001241B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本開示は、パケット監視装置、構内交換機、バーチャルアシスタント呼び出し方法、及びプログラムに関する。 The present disclosure relates to packet monitoring devices, private branch exchanges, virtual assistant calling methods, and programs.

官公庁、企業、学校等の構内に設置される構内交換機は、複数の構内電話機を収容し、構内電話機間での通話や外部の電話機との通話を可能にする。 A private branch exchange installed on the premises of a government office, a company, a school, etc. accommodates a plurality of private telephones and enables a call between the private telephones and a call with an external telephone.

特許文献1には、ユーザ間の音声通信において、ユーザを補助するバーチャルアシスタントを供給するためのシステムが記載されている。特許文献1に記載のシステムでは、バーチャルアシスタントが通話に参加してもよく、通話上のユーザによって呼び出されることで、ユーザに応じて通話から音声指示を識別し、その音声指示に対応するタスクを実行している。 Patent Document 1 describes a system for supplying a virtual assistant assisting a user in voice communication between users. In the system described in Patent Document 1, a virtual assistant may participate in a call, and when called by a user on the call, a task of identifying a voice instruction from the call according to the user and corresponding to the voice instruction is performed. Running.

特表2016-533690号公報Special Table 2016-533690 Gazette

しかしながら、特許文献1に記載の技術は、バーチャルアシスタントを呼び出す際に通話者であるユーザがシステム側で意図的に予め定められた音声指示を行う必要があり、またユーザの端末において呼び出しのためのモジュールが必要となる。 However, in the technique described in Patent Document 1, when calling a virtual assistant, the user who is the caller needs to intentionally give a predetermined voice instruction on the system side, and the technique for calling is performed on the user's terminal. You will need a module.

よって、バーチャルアシスタントを呼び出すためのモジュールを搭載していない或いは搭載できないような電話機においても、通話中にバーチャルアシスタントを呼び出して参加させるような技術が望まれる。 Therefore, even in a telephone that does not have or cannot have a module for calling a virtual assistant, a technique for calling and participating in the virtual assistant during a call is desired.

本開示の目的は、上述した課題を解決することが可能なパケット監視装置、構内交換機、バーチャルアシスタント呼び出し方法、及びプログラムを提供することにある。この課題は、バーチャルアシスタントを通話に参加させるための機能をもたない電話機であっても、通話中の適切なタイミングでバーチャルアシスタントを通話に参加させることを可能にするというものである。 An object of the present disclosure is to provide a packet monitoring device, a private branch exchange, a virtual assistant calling method, and a program capable of solving the above-mentioned problems. The challenge is to make it possible for a virtual assistant to join a call at the right time during a call, even if the phone does not have the ability to have the virtual assistant join the call.

本開示の第1の態様に係るパケット監視装置は、複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視部と、制御部と、を備え、前記制御部は、前記監視部で監視された前記通信パケットデータに対して音声認識処理を実行し、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行し、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行する、ものである。 The packet monitoring device according to the first aspect of the present disclosure is a call between telephones including at least one of the premises telephones in a network in which a plurality of premises telephones and a premises exchange accommodating the plurality of premises telephones are connected. The control unit includes a monitoring unit and a control unit that monitor the communication packet data of the above, and the control unit executes voice recognition processing on the communication packet data monitored by the monitoring unit, and performs voice recognition processing in the voice recognition processing. When a predetermined keyword is included in the recognition result, a call process for calling the virtual assistant is executed, and a mixing process for mixing the voice of the virtual assistant into the call is executed.

本開示の第2の態様に係る構内交換機は、収容する複数の構内電話機を、ネットワークを介して接続する接続部と、前記ネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視部と、制御部と、を備え、前記制御部は、前記監視部で監視された前記通信パケットデータに対して音声認識処理を実行し、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行し、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行する、ものである。 The premises exchange according to the second aspect of the present disclosure is a communication of a call between a connection unit for connecting a plurality of premises telephones to be accommodated via a network and a telephone including at least one of the premises telephones in the network. A monitoring unit for monitoring packet data and a control unit are provided, and the control unit executes voice recognition processing on the communication packet data monitored by the monitoring unit, and the recognition result in the voice recognition processing. If a predetermined keyword is included in the phone, a call process for calling the virtual assistant is executed, and a mixing process for mixing the voice of the virtual assistant into the call is executed.

本開示の第3の態様に係るバーチャルアシスタント呼び出し方法は、パケット監視装置が、複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視ステップと、前記パケット監視装置が、前記監視ステップで監視された前記通信パケットデータに対して音声認識処理を実行するステップと、前記パケット監視装置が、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行するステップと、前記パケット監視装置が、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行するステップと、を備えた、ものである。 In the virtual assistant calling method according to the third aspect of the present disclosure, in a network in which a packet monitoring device is connected to a plurality of premises telephones and a premises exchange accommodating the plurality of premises telephones, at least one of the premises telephones is used. A monitoring step for monitoring communication packet data of a call between telephones including the telephone, a step for the packet monitoring device to execute voice recognition processing for the communication packet data monitored in the monitoring step, and the packet monitoring device. However, when a predetermined keyword is included in the recognition result in the voice recognition process, the step of executing the call process for calling the virtual assistant and the packet monitoring device mix the voice of the virtual assistant into the call. It is provided with a step of executing a mixing process.

本開示の第4の態様に係るプログラムは、コンピュータに、複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視ステップと、前記監視ステップで監視された前記通信パケットデータに対して音声認識処理を実行するステップと、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行するステップと、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行するステップと、を実行させるためのプログラムである。 The program according to the fourth aspect of the present disclosure is between telephones including at least one of the private telephones in a network in which a computer is connected to a plurality of private telephones and a private exchange accommodating the plurality of private telephones. A monitoring step for monitoring the communication packet data of a call, a step for executing a voice recognition process for the communication packet data monitored in the monitoring step, and a recognition result in the voice recognition process include a predetermined keyword. If so, it is a program for executing a step of executing a call process for calling the virtual assistant and a step of executing a mixing process for mixing the voice of the virtual assistant into the call.

本開示により、次のような効果を奏するパケット監視装置、構内交換機、バーチャルアシスタント呼び出し方法、及びプログラムを提供することができる。この効果は、バーチャルアシスタントを通話に参加させるための機能をもたない電話機であっても、通話中の適切なタイミングでバーチャルアシスタントを通話に参加させることが可能になるというものである。 According to the present disclosure, it is possible to provide a packet monitoring device, a private branch exchange, a virtual assistant calling method, and a program having the following effects. The effect is that even a phone that does not have the ability to have the virtual assistant join the call can have the virtual assistant join the call at the right time during the call.

実施形態1に係るパケット監視装置の一構成例を示すブロック図である。It is a block diagram which shows one configuration example of the packet monitoring apparatus which concerns on Embodiment 1. FIG. 図1のパケット監視装置におけるバーチャルアシスタント呼び出し方法の一例を説明するためのフロー図である。It is a flow diagram for demonstrating an example of the virtual assistant calling method in the packet monitoring apparatus of FIG. 実施形態2に係る構内交換機の一構成例を示すブロック図である。It is a block diagram which shows one configuration example of the private branch exchange which concerns on Embodiment 2. 実施形態3に係るパケット監視装置を含む電話システムの一構成例を示すブロック図である。FIG. 3 is a block diagram showing a configuration example of a telephone system including a packet monitoring device according to the third embodiment. 図4の電話システムにおけるパケット監視装置を介した通話の一例について概略的に説明するための模式図である。FIG. 3 is a schematic diagram for schematically explaining an example of a telephone call via a packet monitoring device in the telephone system of FIG. 4. 図4のパケット監視装置において実行される、バーチャルアシスタントを呼び出す前処理の一例を説明するためのフロー図である。It is a flow diagram for demonstrating an example of the preprocessing which calls a virtual assistant executed in the packet monitoring apparatus of FIG. 図4のパケット監視装置におけるパケット監視解析部の一例を示すブロック図である。It is a block diagram which shows an example of the packet monitoring analysis part in the packet monitoring apparatus of FIG. 図4のパケット監視装置におけるパケット監視解析部の一例を示すブロック図である。It is a block diagram which shows an example of the packet monitoring analysis part in the packet monitoring apparatus of FIG. 実施形態4に係る電話システムにおいてパケット監視装置で実行されるバーチャルアシスタント呼び出し処理の一例を説明するためのブロック図である。It is a block diagram for demonstrating an example of the virtual assistant call processing executed by the packet monitoring apparatus in the telephone system which concerns on Embodiment 4. FIG. 実施形態4に係る電話システムにおいてパケット監視装置で実行されるバーチャルアシスタント呼び出し処理及び音声ミキシング処理の一例を説明するためのブロック図である。It is a block diagram for demonstrating an example of the virtual assistant call processing and voice mixing processing executed by the packet monitoring apparatus in the telephone system which concerns on Embodiment 4. FIG. 装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware composition of a device.

以下、図面を参照して、実施形態について説明する。なお、実施形態において、同一又は同等の要素には、同一の符号を付し、重複する説明を省略する場合がある。また、以下に説明する図面には一方向性、双方向性の矢印を描いている図面があるが、いずれの矢印もある信号(データ)の流れの方向を端的に示したものであり、それぞれ双方向性、一方向性を排除するものではない。 Hereinafter, embodiments will be described with reference to the drawings. In the embodiment, the same or equivalent elements may be designated by the same reference numerals, and duplicate description may be omitted. In addition, there are drawings that draw unidirectional and bidirectional arrows in the drawings described below, but both arrows simply show the direction of the flow of a certain signal (data), and each of them. It does not exclude bidirectionality and one-wayness.

<実施形態1>
実施形態1について、まず、図1を参照しながら説明する。図1は、実施形態1に係るパケット監視装置の一構成例を示すブロック図である。
<Embodiment 1>
First, the first embodiment will be described with reference to FIG. FIG. 1 is a block diagram showing a configuration example of the packet monitoring device according to the first embodiment.

図1に示すように、本実施形態に係るパケット監視装置1は、制御部1a及び監視部1bを備え、図示しないが、複数の構内電話機とそれらの構内電話機を収容する構内交換機とが接続されるネットワークに接続されることができる。 As shown in FIG. 1, the packet monitoring device 1 according to the present embodiment includes a control unit 1a and a monitoring unit 1b, and although not shown, a plurality of private telephones and a private branch exchange accommodating those private telephones are connected to each other. Can be connected to a network.

ここで、上記ネットワークは、例えばインターネットやイントラネット等とすることができる。また、構内とは、例えば官公庁、企業、学校等のオフィス内や事業所内などを指すことができる。構内交換機は、パケット通信による通話を中継するものであり、電子構内交換機などと称することができる。構内交換機としては、例えば、IP(Internet Protocol)-PBX(Private Branch eXchanger)が挙げられる。また、構内交換機としては、VoIP(Voice over Internet Protocol)等の外線接続ユニット及びIP電話機等の内線接続ユニットを備えたボタン電話装置なども挙げられる。 Here, the network may be, for example, the Internet, an intranet, or the like. Further, the premises can refer to, for example, the inside of an office such as a government office, a company, or a school, or the inside of a business establishment. The private branch exchange relays a call by packet communication, and can be referred to as an electronic private branch exchange or the like. Examples of the private branch exchange include IP (Internet Protocol) -PBX (Private Branch eXchanger). Examples of the private branch exchange include a button telephone device equipped with an external line connection unit such as VoIP (Voice over Internet Protocol) and an extension connection unit such as an IP telephone.

構内電話機や構内電話機を用いた通話の通話先となり得る構外電話機はいずれも、パケット通信による通話が可能なものであればよく、例えば固定のIP電話機、携帯電話機(スマートフォンと称されるものも含む)などが挙げられる。構内電話機や構外電話機はいずれも、パケット通信による通話機能が備わっていれば、設置型のPC(Personal Computer)、モバイルPC等の端末装置(端末)などであってもよい。 Any of the private telephones and the external telephones that can be the destinations of calls using the private telephones may be those capable of making a call by packet communication, for example, fixed IP telephones and mobile phones (including those called smartphones). ) And so on. Both the internal telephone and the external telephone may be a terminal device (terminal) such as a stationary PC (Personal Computer) or a mobile PC as long as they have a call function by packet communication.

監視部1bは、上記ネットワークにおいて、構内電話機を少なくとも1つ含む複数の電話機間での通話の通信パケットデータを監視する。つまり、電話機間は、通話時において、パケット監視装置1を経由して接続され、その通話がパケット監視装置1により監視される。よって、監視部1b又はパケット監視装置1の他の部位には、上記ネットワークに接続し通信パケットデータを送受するための通信インタフェース等の通信部を設けておけばよい。 The monitoring unit 1b monitors the communication packet data of a call between a plurality of telephones including at least one private telephone in the network. That is, the telephones are connected to each other via the packet monitoring device 1 during a call, and the call is monitored by the packet monitoring device 1. Therefore, a communication unit such as a communication interface for connecting to the network and transmitting / receiving communication packet data may be provided in the monitoring unit 1b or another part of the packet monitoring device 1.

上述のように、監視部1bは、2以上の構内電話機間での通話(内線通話)の通信パケットデータを監視するように構成すること、1以上の構内電話機と1以上の構外電話機との間での通話(外線通話)の通信パケットデータを監視するように構成することができる。無論、監視部1bは、これら双方の構成を採用することができる。なお、3地点以上の通話は、多地点会議と称されることもある。 As described above, the monitoring unit 1b is configured to monitor the communication packet data of a call (extension call) between two or more private telephones, and is between one or more private telephones and one or more external telephones. It can be configured to monitor the communication packet data of a telephone call (outside line call). Of course, the monitoring unit 1b can adopt both of these configurations. Calls at three or more points may be referred to as multipoint meetings.

制御部1aは、監視部1bを制御することができるが、その他の図示しない部位を含め、パケット監視装置1の全体を制御するように構成することができる。制御部1aは、例えば、CPU(Central Processing Unit)、作業用メモリ、及び上述のような制御を行うためのプログラムを記憶した不揮発性の記憶装置などによって実現することができる。また、制御部1aは、例えばIC(Integrated Circuit)によって実現することもできる。制御部1aは、コントローラと称することもできる。 The control unit 1a can control the monitoring unit 1b, but can be configured to control the entire packet monitoring device 1 including other parts (not shown). The control unit 1a can be realized by, for example, a CPU (Central Processing Unit), a working memory, a non-volatile storage device that stores a program for performing control as described above, and the like. Further, the control unit 1a can also be realized by, for example, an IC (Integrated Circuit). The control unit 1a can also be referred to as a controller.

そして、制御部1aは、監視部1bで監視された通信パケットデータに対して音声認識処理を実行する。次いで、制御部1aは、その音声認識処理での認識結果(例えば音声をテキストに変換した結果)に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行する。上記所定のキーワードは予め登録しておくことができる。 Then, the control unit 1a executes voice recognition processing for the communication packet data monitored by the monitoring unit 1b. Next, the control unit 1a executes a call process for calling the virtual assistant when a predetermined keyword is included in the recognition result (for example, the result of converting the voice into text) in the voice recognition process. The above-mentioned predetermined keywords can be registered in advance.

ここで、パケット監視装置1は、バーチャルアシスタントを提供するサーバ装置(図示せず)に上記ネットワークを介して接続されることができる。このサーバ装置は、バーチャルアシスタントを提供する装置であり、上記ネットワーク(及び他の外部ネットワーク)を介したパケット監視装置1からの参加要求に応じて、バーチャルアシスタントを提供する。このように、上記呼び出し処理は、上記ネットワークを介してサーバ装置にバーチャルアシスタントを提供させる処理とすることができる。この場合のパケット監視装置1、構内交換機、複数の構内電話機、及びサーバ装置は、電話システムを構成することができる。 Here, the packet monitoring device 1 can be connected to a server device (not shown) that provides a virtual assistant via the above network. This server device is a device that provides a virtual assistant, and provides a virtual assistant in response to a participation request from the packet monitoring device 1 via the above network (and other external network). As described above, the call process can be a process of causing the server device to provide the virtual assistant via the network. In this case, the packet monitoring device 1, the private branch exchange, the plurality of private telephones, and the server device can form a telephone system.

また、バーチャルアシスタントは、パケット監視装置1の内部の記憶部(バーチャルアシスタント記憶部と称す)に制御部1aから読み出し可能なように記憶しておくこともできる。この場合の電話システムは、上記のサーバ装置は不要であり、パケット監視装置1、構内交換機、及び複数の構内電話機を含むように構成されることができる。 Further, the virtual assistant can be stored in a storage unit (referred to as a virtual assistant storage unit) inside the packet monitoring device 1 so that it can be read from the control unit 1a. The telephone system in this case does not require the above server device, and can be configured to include a packet monitoring device 1, a private branch exchange, and a plurality of private telephones.

一方、認識結果に上記所定のキーワードが含まれていなかった場合、制御部1aはこのような呼び出し処理を行わないようにする。無論、制御部1aは、上記所定のキーワードと類似するキーワードが含まれていた場合にも、この呼び出し処理を実行するように構成することができ、このことは認識結果を検索する際に類似検索を適用することでも実現させることができる。 On the other hand, if the recognition result does not include the above-mentioned predetermined keyword, the control unit 1a prevents such a calling process. Of course, the control unit 1a can be configured to execute this call processing even when a keyword similar to the above-mentioned predetermined keyword is included, which means that a similar search is performed when searching for a recognition result. It can also be realized by applying.

そして、制御部1aは、バーチャルアシスタントの音声を上述の通話にミキシングするミキシング処理を実行する。ミキシング処理の手法は問わない。例えば、制御部1aは、通話にバーチャルアシスタントの音声をミキシングするよう、その通話についての通信パケットデータを変更することができる。 Then, the control unit 1a executes a mixing process for mixing the voice of the virtual assistant into the above-mentioned call. The mixing processing method does not matter. For example, the control unit 1a can change the communication packet data for the call so as to mix the voice of the virtual assistant with the call.

このように、パケット監視装置1は、通信パケットデータを監視し、ユーザにより入力された音声を認識し、所定のキーワードを検出すると、バーチャルアシスタントを呼び出し、その音声を電話機間の通話にミキシングする。 As described above, the packet monitoring device 1 monitors the communication packet data, recognizes the voice input by the user, calls the virtual assistant when the predetermined keyword is detected, and mixes the voice into the call between the telephones.

また、制御部1aは、ミキシング処理の後も、監視部1bで監視された通信パケットデータに対して音声認識処理を実行することもできる。その場合、制御部1aは、その音声認識処理での認識結果に他の所定のキーワードが含まれていた場合、バーチャルアシスタントの提供を中止させる中止処理を実行するように構成することができる。 Further, the control unit 1a can also execute the voice recognition process on the communication packet data monitored by the monitoring unit 1b even after the mixing process. In that case, the control unit 1a can be configured to execute a stop process for stopping the provision of the virtual assistant when the recognition result in the voice recognition process includes another predetermined keyword.

この中止処理は、バーチャルアシスタントの提供先(呼び出し先)に対して行えばよい。例えば、サーバ装置が提供先である場合には、この中止処理は、上記ネットワークを介してサーバ装置に、バーチャルアシスタントを退出(消去)させるよう指示する処理を指すことができる。例えば提供先がバーチャルアシスタント記憶部である場合には、この中止処理は、バーチャルアシスタント記憶部からのバーチャルアシスタント(そのプログラム)の読み出しを中止する処理とすることができる。このような中止処理により、バーチャルアシスタントの音声のミキシングが中止される。 This cancellation process may be performed for the virtual assistant provider (call destination). For example, when the server device is a provider, this cancel process can refer to a process of instructing the server device to leave (erase) the virtual assistant via the network. For example, when the provider is a virtual assistant storage unit, this cancellation process can be a process of canceling the reading of the virtual assistant (the program) from the virtual assistant storage unit. By such a stop process, the mixing of the voice of the virtual assistant is stopped.

このようなパケット監視装置1におけるバーチャルアシスタント呼び出し方法の一例について、図2を併せて参照しながら説明する。図2は、図1のパケット監視装置におけるバーチャルアシスタント呼び出し方法の一例を説明するためのフロー図である。このバーチャルアシスタント呼び出し方法は、次のような監視ステップ、認識ステップ、呼び出しステップ、及びミキシングステップを含むことができる。 An example of such a virtual assistant calling method in the packet monitoring device 1 will be described with reference to FIG. FIG. 2 is a flow chart for explaining an example of a virtual assistant calling method in the packet monitoring device of FIG. This virtual assistant calling method can include a monitoring step, a recognition step, a calling step, and a mixing step as follows.

まず、監視ステップとして、パケット監視装置1が、上記ネットワークにおいて、構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する(ステップS1)。認識ステップとして、パケット監視装置1が、監視ステップで監視された通信パケットデータに対して音声認識処理を実行する(ステップS2)。 First, as a monitoring step, the packet monitoring device 1 monitors the communication packet data of a call between telephones including at least one private telephone in the network (step S1). As a recognition step, the packet monitoring device 1 executes voice recognition processing for the communication packet data monitored in the monitoring step (step S2).

呼び出しステップとして、パケット監視装置1が、音声認識処理での認識結果に所定のキーワードが含まれているか否かを判定し(ステップS3)、含まれていた場合(YESの場合)、呼び出し処理を実行する(ステップS4)。この呼び出し処理は、パケット監視装置1が、内部のバーチャルアシスタント記憶部からバーチャルアシスタントを呼び出す処理、或いはサーバ装置に上記ネットワークを介してバーチャルアシスタントを提供させる処理とすることができる。 As a call step, the packet monitoring device 1 determines whether or not a predetermined keyword is included in the recognition result in the voice recognition process (step S3), and if it is included (YES), the call process is performed. Execute (step S4). This calling process can be a process in which the packet monitoring device 1 calls a virtual assistant from the internal virtual assistant storage unit, or a process in which the server device provides the virtual assistant via the network.

一方、ステップS3でNOの場合、ステップS1に戻り監視を継続する。なお、ステップS2の音声認識結果は、例えば、一定期間保持しておくようにすること、或いは、所定のキーワードに合致しないと判定できる段階まで保持しておくことができる。 On the other hand, if NO in step S3, the process returns to step S1 and monitoring is continued. The voice recognition result in step S2 can be held, for example, for a certain period of time, or can be held until it can be determined that the keyword does not match a predetermined keyword.

ステップS4に次いで、ミキシングステップとして、パケット監視装置1が、呼び出し処理の後、バーチャルアシスタントの音声を通話にミキシングするミキシング処理を実行し(ステップS5)、処理を終了する。 Following step S4, as a mixing step, the packet monitoring device 1 executes a mixing process of mixing the voice of the virtual assistant into a call after the call process (step S5), and ends the process.

なお、図2の処理は、ミキシング処理後も繰り返し行うことができ、例えば他の実施形態で後述するが他のバーチャルアシスタントを呼び出すこともできる。また、図2の処理後、呼び出したバーチャルアシスタントを消すような処理を行うこともでき、その場合にも同様に他の所定のキーワードが音声認識結果に含まれていた場合に実行することができる。 The process of FIG. 2 can be repeated even after the mixing process, and for example, another virtual assistant can be called as described later in another embodiment. Further, after the process of FIG. 2, it is also possible to perform a process of erasing the called virtual assistant, and in that case as well, it can be executed when another predetermined keyword is included in the voice recognition result. ..

以上に説明したように、本実施形態に係るパケット監視装置1では、ユーザ間(少なくとも一方が構内電話機を使用するユーザ)の通話をネットワーク上で監視し、その通話中にバーチャルアシスタントの呼び出しを行う。そのため、ユーザは通話中にバーチャルアシスタントを利用することができる。ここで、本実施形態では、2者間の通話中にバーチャルアシスタントを参加させることができるだけではなく、3者以上の通話(電話会議)中にバーチャルアシスタントを参加させるように構成することもできる。 As described above, in the packet monitoring device 1 according to the present embodiment, a call between users (a user whose at least one uses a private telephone) is monitored on the network, and a virtual assistant is called during the call. .. Therefore, the user can use the virtual assistant during the call. Here, in the present embodiment, not only the virtual assistant can be joined during a call between two parties, but also the virtual assistant can be joined during a call (conference call) between three or more parties.

さらに、本実施形態に係るパケット監視装置1によれば、バーチャルアシスタントを通話に参加させるための機能をもたない電話機であっても、バーチャルアシスタントを通話に参加させることが可能になる。 Further, according to the packet monitoring device 1 according to the present embodiment, the virtual assistant can be made to participate in the call even if the telephone does not have the function for making the virtual assistant participate in the call.

例えば、構内電話機が、スマートフォンのようなアプリケーションソフトウェア(以下、アプリケーション)を追加搭載できるような電話機ではない場合、クライアントモジュールも追加搭載できない。なお、ここでのクライアントモジュールはサーバ装置からバーチャルアシスタントを呼び出すためのクライアントアプリケーションを指す。特に、企業内で一般的に利用される電話システムに収容される多機能電話機は、このようなクライアントモジュールは実装されていないものが多い。しかし、本実施形態では、そのような特別な機能を有する電話機ではなく、単純なIP電話機のような電話機(例えば2者間通話ができる程度の処理能力の電話機)であっても、通話中のバーチャルアシスタントの参加が可能になる。 For example, if the private telephone is not a telephone that can additionally install application software (hereinafter, application) such as a smartphone, the client module cannot be additionally installed. The client module here refers to a client application for calling a virtual assistant from a server device. In particular, many multifunctional telephones housed in telephone systems generally used in enterprises do not have such a client module. However, in the present embodiment, even a telephone such as a simple IP telephone (for example, a telephone having a processing capacity capable of making a two-way call), instead of a telephone having such a special function, is in a call. Virtual assistants can participate.

よって、バーチャルアシスタントの利用を行うに際し、ユーザ用に高性能の電話機やスマートスピーカなどを導入する必要がなく、既存環境を利用することができる。また、スマートフォンのようなアプリケーションを追加搭載できる電話機であっても、バーチャルアシスタントを呼び出すためのクライアントアプリケーション(クライアントモジュール)を追加搭載する必要がない。つまり、本実施形態では、パケット監視装置1を導入することで、パケット監視装置1側でバーチャルアシスタントの呼び出しや音声のミキシングを行うため、構内電話機の処理能力や機能が低くても、通話にバーチャルアシスタントを参加させることができる。 Therefore, when using the virtual assistant, it is not necessary to introduce a high-performance telephone or smart speaker for the user, and the existing environment can be used. Further, even if the telephone can be additionally equipped with an application such as a smartphone, it is not necessary to additionally install a client application (client module) for calling the virtual assistant. That is, in the present embodiment, by introducing the packet monitoring device 1, the packet monitoring device 1 calls the virtual assistant and mixes the voices. Therefore, even if the processing capacity and functions of the private telephone are low, the call is virtual. You can have an assistant join you.

また、本実施形態では、通話中にバーチャルアシスタントをユーザの通話に参加させるに際し、複数のセッションが張られることがなく、それらをミキシングするといった必要がない。例えば、本実施形態では、発信元の電話機において、発信元ユーザ及び発信先ユーザ間のセッションと発信元ユーザ及びバーチャルアシスタント間のセッションとを張る必要がなく、複数のセッションをミキシングする必要もない。なお、このセッションは、例えばSIP(Session Initiation Protocol)セッションを指すことができる。 Further, in the present embodiment, when the virtual assistant participates in the user's call during the call, a plurality of sessions are not set up, and there is no need to mix them. For example, in the present embodiment, it is not necessary to establish a session between the source user and the destination user and a session between the source user and the virtual assistant on the calling telephone, and it is not necessary to mix a plurality of sessions. Note that this session can refer to, for example, a SIP (Session Initiation Protocol) session.

このように、本実施形態によれば、電話機にバーチャルアシスタントクライアントモジュールを実装する必要がないだけでなく、複数のセッションを張る必要がなく、それらのセッションのミキシングも不要である。 As described above, according to the present embodiment, not only is it not necessary to implement the virtual assistant client module in the telephone, it is not necessary to set up a plurality of sessions, and it is not necessary to mix those sessions.

この点からも、本実施形態によれば、特別な機能を有する電話機ではなく、単純なIP電話機のような電話機であっても、通話中のバーチャルアシスタントの参加が可能になると言え、既存環境を利用することができると言える。特に、企業内で一般的に利用される電話システムに収容される多機能電話機は、同時に使用可能なセッション数に制限があることが多く、場合によっては複数のセッションをミキシングして使用することができないことも想定される。しかしながら、本実施形態では、バーチャルアシスタントを参加させる場合に1つのセッションで足りるため、セッションが1つに制限されるような電話機を用いた場合であっても、バーチャルアシスタントの音声をミキシングして使用することができる。 From this point as well, according to the present embodiment, it can be said that the virtual assistant can participate during a call even if the telephone is not a telephone having a special function but a telephone such as a simple IP telephone, and the existing environment can be used. It can be said that it can be used. In particular, multifunction telephones housed in telephone systems commonly used in enterprises often have a limit on the number of sessions that can be used at the same time, and in some cases, multiple sessions may be mixed and used. It is assumed that it cannot be done. However, in the present embodiment, one session is sufficient when the virtual assistant is involved, so even when a telephone whose session is limited to one is used, the voice of the virtual assistant is mixed and used. can do.

また、ネットワーク帯域はセッション分だけ消費されるが、本実施形態では、セッションは1つで足りるため、ネットワーク帯域の負荷を必要最低限まで低減させることができると言える。 Further, although the network bandwidth is consumed only for the session, in the present embodiment, since one session is sufficient, it can be said that the load on the network bandwidth can be reduced to the minimum necessary.

さらに、本実施形態に係るパケット監視装置1によれば、通話中の適切なタイミングでバーチャルアシスタントを通話に参加させることが可能になる。具体的には、本実施形態では、ユーザ間の通話内容を監視して、所定のキーワードが検出された場合にバーチャルアシスタントを参加させることができるため、ユーザが必要となるような場面のみ、バーチャルアシスタントをユーザの通話に参加させることができる。よって、通話中にバーチャルアシスタントを呼び出す場合に、利用するユーザが意図的にバーチャルアシスタントを呼び出す必要がなく、ユーザが意図してアクションを起こす必要がない。 Further, according to the packet monitoring device 1 according to the present embodiment, it is possible to have the virtual assistant participate in the call at an appropriate timing during the call. Specifically, in the present embodiment, it is possible to monitor the contents of a call between users and join a virtual assistant when a predetermined keyword is detected, so that only the scenes that the user needs are virtual. You can have the assistant join the user's call. Therefore, when calling the virtual assistant during a call, the user does not need to intentionally call the virtual assistant, and the user does not need to take an action intentionally.

また、本実施形態では、ユーザが必要となるような場面になった時点でバーチャルアシスタントを参加させることができるため、この点からもネットワーク帯域の負荷を抑えることができると言える。また、上述の中止処理も採用することで、ユーザが必要となるような場面のみでバーチャルアシスタントを参加させることができるため、ネットワーク帯域の負荷を必要最低限に抑えることができる。 Further, in the present embodiment, since the virtual assistant can be joined when the user needs it, it can be said that the load on the network bandwidth can be suppressed from this point as well. In addition, by adopting the above-mentioned cancellation process, the virtual assistant can be joined only in the situations where the user needs it, so that the load on the network bandwidth can be minimized.

<実施形態2>
実施形態2について、実施形態1との相違点を中心に図3を参照しながら説明するが、実施形態1で説明した様々な例が適用できる。図3は、実施形態2に係る構内交換機の一構成例を示すブロック図である。
<Embodiment 2>
The second embodiment will be described with reference to FIG. 3, focusing on the differences from the first embodiment, but various examples described in the first embodiment can be applied. FIG. 3 is a block diagram showing a configuration example of the private branch exchange according to the second embodiment.

図3に示すように、本実施形態に係る構内交換機2は、制御部2a、監視部2b、及び接続部2cを備える。接続部2cは、収容する複数の構内電話機(図示せず)を、インターネットやイントラネット等のネットワークを介して接続する。接続部2cは、上記ネットワークを介して、呼制御と端末制御(構内電話機の制御)を行い、構外電話機と構内電話機との通話(外線通話)や構内電話機同士の通話(内線通話)を可能にする機能を有することができる。つまり、構内交換機2は、主に接続部2cを有することで、外線を内線に繋ぐ機能、構内電話機を外線に繋ぐ機能、及び構内電話機間を繋ぐ機能を有することができる。 As shown in FIG. 3, the private branch exchange 2 according to the present embodiment includes a control unit 2a, a monitoring unit 2b, and a connection unit 2c. The connection unit 2c connects a plurality of private telephones (not shown) to be accommodated via a network such as the Internet or an intranet. The connection unit 2c performs call control and terminal control (control of the premises telephone) via the above network, and enables a call between the premises telephone and the premises telephone (external line call) and a call between the premises telephones (extension call). Can have the function of That is, the private branch exchange 2 can have a function of connecting an outside line to an extension, a function of connecting a private telephone to an external line, and a function of connecting between private telephones, mainly by having a connection portion 2c.

監視部2bは、上記ネットワークにおいて、構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する。監視部2bは、接続部2cで接続された電話機間での通話の通信パケットデータを監視することになる。 The monitoring unit 2b monitors the communication packet data of the call between the telephones including at least one private telephone in the network. The monitoring unit 2b monitors the communication packet data of the call between the telephones connected by the connection unit 2c.

構内交換機2としては、実施形態1で説明したように例えばIP-PBX、ボタン電話装置等が挙げられる。また、本実施形態に係る構内交換機2と複数の構内電話機と後述のサーバ装置とを含むシステムは、電話システムと称することができる。本実施形態に係る電話システムは、実施形態1に係る電話システムにおいて、構内交換機の内部にパケット監視装置1を備えたものである。よって、制御部2a、監視部2bは、それぞれ図1の制御部1a、監視部1bの機能を有することになり、本実施形態における構内電話機やサーバ装置の機能も基本的に実施形態1と同様となる。 Examples of the private branch exchange 2 include an IP-PBX, a button telephone device, and the like as described in the first embodiment. Further, a system including a private branch exchange 2 according to the present embodiment, a plurality of private telephones, and a server device described later can be referred to as a telephone system. The telephone system according to the present embodiment is the telephone system according to the first embodiment, in which the packet monitoring device 1 is provided inside the private branch exchange. Therefore, the control unit 2a and the monitoring unit 2b have the functions of the control unit 1a and the monitoring unit 1b of FIG. 1, respectively, and the functions of the private telephone and the server device in the present embodiment are basically the same as those of the first embodiment. Will be.

例えば、制御部2aは、監視部2bで監視された通信パケットデータに対して音声認識処理を実行する。そして、制御部2aは、その音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行する。呼び出し処理がなされた後は、制御部2aは、バーチャルアシスタントの音声を上記通話にミキシングするミキシング処理を実行することになる。 For example, the control unit 2a executes voice recognition processing on the communication packet data monitored by the monitoring unit 2b. Then, when the recognition result in the voice recognition process includes a predetermined keyword, the control unit 2a executes a call process for calling the virtual assistant. After the call processing is performed, the control unit 2a will execute a mixing process for mixing the voice of the virtual assistant into the call.

なお、制御部2aは、監視部2b及び接続部2cを制御することができるが、その他の図示しない部位を含め、構内交換機2の全体を制御するように構成することができる。制御部2aは、例えば、CPU、作業用メモリ、及び上述のような制御を行うためのプログラムを記憶した不揮発性の記憶装置などによって実現することができる。また、制御部2aは、例えばICによって実現することもできる。制御部2aは、コントローラと称することもできる。 The control unit 2a can control the monitoring unit 2b and the connection unit 2c, but can be configured to control the entire private branch exchange 2 including other parts (not shown). The control unit 2a can be realized by, for example, a CPU, a working memory, and a non-volatile storage device that stores a program for performing the above-mentioned control. Further, the control unit 2a can also be realized by, for example, an IC. The control unit 2a can also be referred to as a controller.

また、構内交換機2におけるバーチャルアシスタント呼び出し方法は、その主体がパケット監視装置1から構内交換機2(構内交換機2中のパケット監視装置1として機能する部分)に変わる以外、図2を参照して説明したものと同様である。 Further, the method of calling the virtual assistant in the private branch exchange 2 has been described with reference to FIG. 2, except that the main body thereof changes from the packet monitoring device 1 to the private branch exchange 2 (the part that functions as the packet monitoring device 1 in the private branch exchange 2). Similar to the one.

以上の説明から明らかなように、本実施形態に係る構内交換機2は、実施形態1に係るパケット監視装置1と同様の効果を奏する。 As is clear from the above description, the private branch exchange 2 according to the present embodiment has the same effect as the packet monitoring device 1 according to the first embodiment.

<実施形態3>
実施形態3について、図4~図10を併せて参照しながら、実施形態1との相違点を中心に説明するが、実施形態1,2で説明した様々な例が適用できる。なお、本実施形態に係るパケット監視装置を実施形態2に適用する場合、実施形態2に係る構内交換機2に本実施形態に係るパケット監視装置の機能を搭載すればよい。図4は、実施形態3に係るパケット監視装置を含む電話システムの一構成例を示すブロック図である。
<Embodiment 3>
Although the third embodiment will be described mainly on the differences from the first embodiment with reference to FIGS. 4 to 10, various examples described in the first and second embodiments can be applied. When the packet monitoring device according to the present embodiment is applied to the second embodiment, the function of the packet monitoring device according to the present embodiment may be mounted on the private branch exchange 2 according to the second embodiment. FIG. 4 is a block diagram showing a configuration example of a telephone system including the packet monitoring device according to the third embodiment.

図4に示すように、本実施形態に係る電話システムは、パケット監視装置10、構内交換機20、構内電話機の例であるユーザ端末30a,30b、及びサーバ装置(以下、単にサーバ)40がネットワークに接続された構成とすることができる。パケット監視装置10、構内交換機20、ユーザ端末30a,30b、サーバ40は、それぞれ実施形態1におけるパケット監視装置1、構内交換機、構内電話機、サーバ装置の例となる。 As shown in FIG. 4, in the telephone system according to the present embodiment, the packet monitoring device 10, the private branch exchange 20, the user terminals 30a and 30b which are examples of the private telephone, and the server device (hereinafter, simply server) 40 are connected to the network. It can be a connected configuration. The packet monitoring device 10, the private branch exchange 20, the user terminals 30a and 30b, and the server 40 are examples of the packet monitoring device 1, the private branch exchange, the private telephone, and the server device in the first embodiment, respectively.

ユーザ端末30a,30bは、IP電話機等の端末であり、それぞれユーザA,Bが使用する端末として説明する。無論、ユーザ端末30a,30b以外にも構内電話機をネットワーク上に配することができ、また構内電話機は1台であっても外線通話に限ることになるが本実施形態は適用できる。 The user terminals 30a and 30b are terminals such as IP telephones, and will be described as terminals used by users A and B, respectively. Of course, premises telephones can be arranged on the network other than the user terminals 30a and 30b, and even if there is only one premises telephone, it is limited to outside line calls, but this embodiment can be applied.

上述のネットワークは、LAN(Local Area Network)又は無線LANを利用したイントラネット等とすることができ、構外のネットワークとも接続することができる。以下では、本実施形態に係る電話システムが或る企業の社内ネットワークに組み込まれた例を挙げて説明する。なお、この場合、構内交換機20は社内交換機などと称することができる。 The above-mentioned network can be a LAN (Local Area Network), an intranet using a wireless LAN, or the like, and can be connected to a network outside the premises. In the following, an example in which the telephone system according to the present embodiment is incorporated in an internal network of a certain company will be described. In this case, the private branch exchange 20 can be referred to as an in-house exchange or the like.

本実施形態に係る電話システムは、社内ネットワーク上にIP電話機等のユーザ端末30a,30bを接続し、内線電話網とLANを統合したものとすることができる。ユーザAとユーザBは、構内交換機20の配下に所属しているユーザ端末30aとユーザ端末30bを用い、社内ネットワークを介して通話を行うことができる。 In the telephone system according to the present embodiment, user terminals 30a and 30b such as IP telephones may be connected to the in-house network, and the extension telephone network and the LAN may be integrated. The user A and the user B can make a call via the in-house network by using the user terminal 30a and the user terminal 30b belonging to the subordinate of the private branch exchange 20.

ユーザAのユーザ端末30aとユーザBのユーザ端末30bは構内交換機20の配下に所属しており、社内ネットワークを介して繋がっている。パケット監視装置10は社内ネットワーク内に接続されている。サーバ40は、バーチャルアシスタント41を提供できるように図示しない記憶部に図示しない制御部から呼び出し可能に記憶されることができる。 The user terminal 30a of the user A and the user terminal 30b of the user B belong to the private branch exchange 20 and are connected to each other via the in-house network. The packet monitoring device 10 is connected to the company network. The server 40 can be recallably stored in a storage unit (not shown) so that the virtual assistant 41 can be provided by a control unit (not shown).

但し、バーチャルアシスタント41は、パケット監視装置10に内蔵しておくこともでき、その場合、電話システムは、サーバ40を備えない構成、或いはパケット監視装置10にサーバ40が内蔵される構成とすることができる。また、バーチャルアシスタント41は、単体であってもよいが、複数あってもよい。なお、バーチャルアシスタントを複数利用可能にする構成においては、パケット監視装置10内、サーバ40内の双方から呼び出し可能に構成することもできる。 However, the virtual assistant 41 may be built in the packet monitoring device 10, and in that case, the telephone system shall be configured not to include the server 40 or to have the server 40 built in the packet monitoring device 10. Can be done. Further, the virtual assistant 41 may be a single unit or a plurality of virtual assistants 41. In the configuration in which a plurality of virtual assistants can be used, it can be configured to be callable from both the packet monitoring device 10 and the server 40.

パケット監視装置10は、制御部11及び通信部12を備えることができる。通信部12は、社内ネットワークに接続する通信インタフェースを有することができる。制御部11は、図1の制御部1aの機能と監視部1bの一部の機能を有することができ、本例においては、後述するパケット監視解析部13、バーチャルアシスタント呼び出し部14、及び音声ミキシング部15を有することができる。 The packet monitoring device 10 can include a control unit 11 and a communication unit 12. The communication unit 12 can have a communication interface for connecting to the in-house network. The control unit 11 can have a function of the control unit 1a of FIG. 1 and a part of the functions of the monitoring unit 1b. In this example, the packet monitoring analysis unit 13, the virtual assistant calling unit 14, and the voice mixing unit to be described later. It can have a portion 15.

制御部11は、通信部12を制御することができるが、その他の図示しない部位を含め、パケット監視装置10の全体を制御するように構成することができる。制御部11は、例えば、CPU、作業用メモリ、及び上述のような制御を行うためのプログラムを記憶した不揮発性の記憶装置などによって実現することができる。また、制御部11は、例えばICによって実現することもできる。制御部11は、コントローラと称することもできる。 The control unit 11 can control the communication unit 12, but can be configured to control the entire packet monitoring device 10 including other parts (not shown). The control unit 11 can be realized by, for example, a CPU, a working memory, and a non-volatile storage device that stores a program for performing the above-mentioned control. Further, the control unit 11 can also be realized by, for example, an IC. The control unit 11 can also be referred to as a controller.

次に、パケット監視解析部13、バーチャルアシスタント呼び出し部14、及び音声ミキシング部15について、図5~図10を参照しながら説明する。 Next, the packet monitoring analysis unit 13, the virtual assistant calling unit 14, and the voice mixing unit 15 will be described with reference to FIGS. 5 to 10.

パケット監視解析部13は、ユーザ間の通話の通信パケットデータを監視し、解析する。パケット監視解析部13は、パケットデータ監視解析部と称することもできる。まず、その対象となる通話について、図5を参照しながら説明する。図5は、図4の電話システムにおけるパケット監視装置10を介した通話の一例について概略的に説明するための模式図である。 The packet monitoring analysis unit 13 monitors and analyzes the communication packet data of the call between users. The packet monitoring analysis unit 13 can also be referred to as a packet data monitoring analysis unit. First, the target call will be described with reference to FIG. FIG. 5 is a schematic diagram for schematically explaining an example of a call via the packet monitoring device 10 in the telephone system of FIG.

ユーザ間の通話はパケット通信で行われるが、その際、例えばRTP(Real-time Transport Protocol)等の通信プロトコルを適用することができる。上記の通信パケットデータはRTPパケットのデータとすることができる。また、このパケット通信では、事前に相手との情報のやりとりを行うために、SIPなどの、IPネットワークを介した通話における呼制御処理のための呼制御プロトコルを採用しておくことができる。以下、このパケット通信で送受されるパケットをSIP/RTPパケットと称す。 Calls between users are made by packet communication, and at that time, a communication protocol such as RTP (Real-time Transport Protocol) can be applied. The above communication packet data can be RTP packet data. Further, in this packet communication, in order to exchange information with the other party in advance, a call control protocol for call control processing in a call via an IP network such as SIP can be adopted. Hereinafter, the packet transmitted / received by this packet communication is referred to as a SIP / RTP packet.

通話開始からSIP/RTPパケットの監視及び解析までは、次のように実行されることができる。図5の破線矢印で示すように、ユーザAとユーザBは、構内交換機20の配下に所属しているユーザ端末30aとユーザ端末30bで社内ネットワークを介して通話がなされる。このとき、ユーザ端末30aとユーザ端末30bとの通話(通話時のパケット通信)は、SIP/RTPパケットの送受を図5の実線矢印で示すように、パケット監視装置10を必ず仲介して実施される。以下では、この通話は、通信部12を必ず仲介して実行され、通信部12で受信される通信パケットが制御部11のパケット監視解析部13に入力されるものとして説明する。 From the start of the call to the monitoring and analysis of the SIP / RTP packet, it can be executed as follows. As shown by the broken line arrow in FIG. 5, the user A and the user B make a call via the in-house network on the user terminal 30a and the user terminal 30b belonging to the private branch exchange 20. At this time, the call between the user terminal 30a and the user terminal 30b (packet communication during a call) is always carried out through the packet monitoring device 10 as shown by the solid line arrow in FIG. 5 for sending and receiving SIP / RTP packets. To. In the following, it is assumed that this call is always executed via the communication unit 12, and the communication packet received by the communication unit 12 is input to the packet monitoring analysis unit 13 of the control unit 11.

次に、パケット監視解析部13の詳細について、図6~図8を参照しながら説明する。図6は、バーチャルアシスタントを呼び出す前処理の一例を説明するためのフロー図である。図7及び図8は、パケット監視解析部13の一例を示すブロック図である。図7はパケット監視解析部13における監視及び解析処理に注目した部分を示す図で、図8はパケット監視解析部13のバーチャルアシスタント呼び出し部14に対する呼び出し前処理に注目した部分を示す図である。 Next, the details of the packet monitoring analysis unit 13 will be described with reference to FIGS. 6 to 8. FIG. 6 is a flow chart for explaining an example of preprocessing for calling a virtual assistant. 7 and 8 are block diagrams showing an example of the packet monitoring analysis unit 13. FIG. 7 is a diagram showing a portion of the packet monitoring / analysis unit 13 focusing on monitoring and analysis processing, and FIG. 8 is a diagram showing a portion of the packet monitoring / analysis unit 13 focusing on pre-call processing for the virtual assistant calling unit 14.

図7に示すように、パケット監視解析部13は、パケット監視部51、SIPヘッダ情報保存部52、及びパケット解析部53を有することができ、ユーザ端末30aとユーザ端末30bの通信パケットデータを監視及び解析する。 As shown in FIG. 7, the packet monitoring analysis unit 13 can include a packet monitoring unit 51, a SIP header information storage unit 52, and a packet analysis unit 53, and monitors communication packet data between the user terminal 30a and the user terminal 30b. And analyze.

パケット監視部51は、SIPヘッダ情報読取部54及びRTPデータ読取部55を有することができる。SIPヘッダ情報読取部54は、通信パケットデータからユーザA及びユーザBのSIPヘッダ情報(発信元/発信先情報)を読み取り、SIPヘッダ情報保存部52に記録し、どのユーザ同士の通話かを通話開始の際に保存しておく。RTPデータ読取部55は、通話開始後、通信パケットデータからRTPデータ(音声データ)を読み取り、その音声データをパケット解析部53に流し込む。 The packet monitoring unit 51 can include a SIP header information reading unit 54 and an RTP data reading unit 55. The SIP header information reading unit 54 reads the SIP header information (source / destination information) of users A and B from the communication packet data, records it in the SIP header information storage unit 52, and makes a call between users. Save it when you start. After starting the call, the RTP data reading unit 55 reads the RTP data (voice data) from the communication packet data, and flows the voice data into the packet analysis unit 53.

パケット解析部53は、音声データテキスト変換部56、データ比較部57、命令指示部58、及び特定キーワード(KW)登録データベース(DB)59を有することができる。ここで、特定KW登録DB59は、所定のキーワード(以下、特定キーワード)を1又は複数登録しておくことができる。特定KW登録DB59は、パケット監視装置10に搭載された記憶装置に記憶させておけばよい。 The packet analysis unit 53 can have a voice data text conversion unit 56, a data comparison unit 57, a command instruction unit 58, and a specific keyword (KW) registration database (DB) 59. Here, in the specific KW registration DB 59, one or a plurality of predetermined keywords (hereinafter, specific keywords) can be registered. The specific KW registration DB 59 may be stored in a storage device mounted on the packet monitoring device 10.

音声データテキスト変換部56は、RTPデータ読取部55から流し込まれた音声データを入力し、それをリアルタイムに解析し、テキストへ変換する変換エンジンを有することができる。この変換エンジンは、適切な文節単位で音声データをテキストデータに変換する機能を有することができる。このようにして、音声データテキスト変換部56は音声データをテキスト化する(図6のステップS11)。 The voice data text conversion unit 56 can have a conversion engine that inputs voice data flowed from the RTP data reading unit 55, analyzes it in real time, and converts it into text. This conversion engine may have a function of converting voice data into text data in appropriate phrase units. In this way, the voice data text conversion unit 56 converts the voice data into text (step S11 in FIG. 6).

データ比較部57は、変換されたテキストデータと特定KW登録DB59に登録済みの特定キーワード(例えば「の説明が必要だ」)を、例えば文節単位で随時比較し、その比較結果を命令指示部58に渡す(ステップS12)。 The data comparison unit 57 compares the converted text data with the specific keyword registered in the specific KW registration DB 59 (for example, "explanation is required") at any time for each phrase, and the comparison result is compared with the command instruction unit 58. (Step S12).

命令指示部58は、図8に示すように、マッチング判定部58a及びバーチャルアシスタント呼び出し前処理部58bを有することができる。マッチング判定部58aは、データ比較部57での比較の結果、特定KW登録DB59に登録されている特定キーワードとマッチングするワードがテキストデータの中に存在するか否かを判定する(ステップS12)。マッチングするワードが存在した場合(ステップS12でYESの場合)、バーチャルアシスタント呼び出し前処理部58bが次のような前処理を実行する(ステップS13)。一方で、ステップS12でNOの場合、ステップS11に戻り、次以降の文節についてステップS12でYESとなるまで処理を繰り返すことができる。 As shown in FIG. 8, the command instruction unit 58 can have a matching determination unit 58a and a virtual assistant call pre-processing unit 58b. As a result of the comparison in the data comparison unit 57, the matching determination unit 58a determines whether or not a word matching the specific keyword registered in the specific KW registration DB 59 exists in the text data (step S12). If there is a matching word (YES in step S12), the virtual assistant call preprocessing unit 58b executes the following preprocessing (step S13). On the other hand, if NO in step S12, the process can be returned to step S11 and the process can be repeated for the next and subsequent clauses until YES in step S12.

ステップS13で実行される前処理は、バーチャルアシスタント呼び出し部14にバーチャルアシスタントの呼び出し指示を送る処理である。具体的には、バーチャルアシスタント呼び出し前処理部58b(以下、前処理部58b)が、呼び出し情報をバーチャルアシスタント呼び出し部14に送信する。 The pre-processing executed in step S13 is a process of sending a virtual assistant calling instruction to the virtual assistant calling unit 14. Specifically, the virtual assistant call pre-processing unit 58b (hereinafter, pre-processing unit 58b) transmits the call information to the virtual assistant calling unit 14.

この呼び出し情報には、呼び出すことが必要であること(マッチングしたこと)を示す情報又は実際の呼び出し命令を含むことができるが、バーチャルアシスタントにどのような行動(発言を含む)を望むかを示す行動情報も含むことができる。例えば、前処理部58bは、前者の情報としてのmatch_trueと、後者の情報(行動情報)としてのmatch_actionとを、バーチャルアシスタント呼び出し部14に送信することができる。このような行動情報を得るために、特定KW登録DB59には、図8に示すように登録データ59aと行動データ59bとを関連付けて格納しておくことができる。登録データ59aは特定キーワードを登録したデータとし、行動データ59bはその特定キーワードに対して呼び出すバーチャルアシスタントの行動を示すデータとすることができる。なお、特定キーワードと行動とは一対一、一対多もしくは多対一いずれかで対応しているものとする。 This call information can include information indicating that it is necessary to call (matching) or an actual call instruction, but indicates what action (including remarks) is desired from the virtual assistant. Behavioral information can also be included. For example, the pre-processing unit 58b can transmit the match_true as the former information and the match_action as the latter information (behavioral information) to the virtual assistant calling unit 14. In order to obtain such behavior information, the registration data 59a and the behavior data 59b can be stored in association with each other in the specific KW registration DB 59 as shown in FIG. The registration data 59a can be data in which a specific keyword is registered, and the action data 59b can be data indicating the action of the virtual assistant called for the specific keyword. It is assumed that the specific keyword and the action correspond to each other on a one-to-one basis, a one-to-many basis, or a many-to-one basis.

一例として、通話中にユーザAが「本件はユーザCさんの説明が必要だ」と発言した場合において、「の説明が必要だ」という特定キーワードが「誰かを呼び出す」という行動データに関連付けられて特定KW登録DB59に登録されていた場合について説明する。この場合、前処理部58bは、テキストデータと「の説明が必要だ」のマッチングにより、マッチングしたことを示す情報(match_true)とそれに対応する行動命令(match_action)とを、バーチャルアシスタント呼び出し部14に送信する。この場合、前処理部58bは、行動命令として、「の説明が必要だ」に関連付けられた行動データ「誰かを呼び出す」を特定KW登録DB59から読み出して得ることができる。 As an example, when user A says "this case requires explanation of user C" during a call, the specific keyword "needs explanation" is associated with the behavior data of "calling someone". The case where it is registered in the specific KW registration DB 59 will be described. In this case, the pre-processing unit 58b provides the virtual assistant calling unit 14 with information (match_true) indicating matching and an action command (match_action) corresponding to the matching by matching the text data with “explanation is required”. Send. In this case, the preprocessing unit 58b can read the action data "call someone" associated with "need to explain" from the specific KW registration DB 59 as an action command.

このように、前処理部58bは、マッチングしたことを示す情報とともに、マッチした特定キーワードに対してバーチャルアシスタントが実際に行う行動を示す命令を示す情報を、バーチャルアシスタント呼び出し部14に送信する。バーチャルアシスタント呼び出し部14は、上述のような呼び出し情報を受けて、バーチャルアシスタント呼び出し処理を行うことになる。 In this way, the preprocessing unit 58b transmits to the virtual assistant calling unit 14 information indicating that the virtual assistant actually performs an action with respect to the matched specific keyword, together with information indicating that the match has been made. The virtual assistant calling unit 14 receives the calling information as described above and performs the virtual assistant calling process.

次に、図9を参照しながら、このバーチャルアシスタント呼び出し処理の一例について説明する。図9は、パケット監視装置10で実行されるバーチャルアシスタント呼び出し処理の一例を説明するためのブロック図である。 Next, an example of this virtual assistant call process will be described with reference to FIG. FIG. 9 is a block diagram for explaining an example of the virtual assistant call process executed by the packet monitoring device 10.

バーチャルアシスタント呼び出し部14は、図9に示すようにバーチャルアシスタント呼び出し処理部14aを有し、パケット解析部53による解析結果から(上記呼び出し情報に基づき)バーチャルアシスタントを呼び出す処理を行う。バーチャルアシスタント呼び出し処理部14aは、マッチングしたことを示す情報match_trueをキーにして(その情報の有無に基づき)、バーチャルアシスタントを呼び出すか否かを決定している。 As shown in FIG. 9, the virtual assistant calling unit 14 has a virtual assistant calling processing unit 14a, and performs a process of calling a virtual assistant (based on the above calling information) from the analysis result by the packet analysis unit 53. The virtual assistant call processing unit 14a uses the information match_true indicating matching as a key (based on the presence or absence of the information) to determine whether or not to call the virtual assistant.

呼び出すことが決定した場合、バーチャルアシスタント呼び出し処理部14aは、構内交換機20に対し、行動命令(match_action)のパラメータを付与した要求であって、バーチャルアシスタント41と接続する要求を送信する。図9の破線矢印で示すように、構内交換機20は、この要求をサーバ40に伝える。 When it is decided to call, the virtual assistant call processing unit 14a transmits a request to the private branch exchange 20 to which the parameter of the action command (match_action) is added and to connect to the virtual assistant 41. As shown by the dashed arrow in FIG. 9, the private branch exchange 20 conveys this request to the server 40.

サーバ40は、構内交換機20から要求を受け、パケット監視装置10と通話セッションを開始する。具体的には、サーバ40のバーチャルアシスタント41は、受信したmatch_actionのデータを読み取り、実行する命令を認識し、サーバ40又はバーチャルアシスタント41がパケット監視装置10とのSIPセッションを確立する。なお、バーチャルアシスタント41は受信したmatch_actionのデータを読み取り、実行する命令を認識する機能を有することができる。 The server 40 receives a request from the private branch exchange 20 and starts a call session with the packet monitoring device 10. Specifically, the virtual assistant 41 of the server 40 reads the received match_action data, recognizes an instruction to be executed, and the server 40 or the virtual assistant 41 establishes a SIP session with the packet monitoring device 10. The virtual assistant 41 can have a function of reading the received match_action data and recognizing an instruction to be executed.

次に、音声ミキシング処理の例について、図10を参照しながら説明する。図10は、パケット監視装置10で実行されるバーチャルアシスタント呼び出し処理及び音声ミキシング処理の一例を説明するためのブロック図である。 Next, an example of the voice mixing process will be described with reference to FIG. FIG. 10 is a block diagram for explaining an example of a virtual assistant calling process and a voice mixing process executed by the packet monitoring device 10.

図10に示すように、サーバ40とのSIPセッション確立後、バーチャルアシスタント呼び出し処理部14aは、音声ミキシング部15へ、サーバ40とのRTPセッションを接続する。これにより、音声ミキシング部15は、ユーザ端末30aとユーザ端末30bとの間の通話の通信パケットデータにバーチャルアシスタント41の音声をミキシングする音声ミキシング処理を開始する。この時、音声ミキシング部15は、ユーザ端末30aとバーチャルアシスタント41の音声をミキシングしてユーザ端末30bに送信し、ユーザ端末30bとバーチャルアシスタント41の音声をミキシングしてユーザ端末30aに送信する。このようにして、音声ミキシング部15を含むパケット監視装置10は、3者間の通話を成立させる。 As shown in FIG. 10, after establishing the SIP session with the server 40, the virtual assistant call processing unit 14a connects the RTP session with the server 40 to the voice mixing unit 15. As a result, the voice mixing unit 15 starts the voice mixing process of mixing the voice of the virtual assistant 41 with the communication packet data of the call between the user terminal 30a and the user terminal 30b. At this time, the voice mixing unit 15 mixes the voices of the user terminal 30a and the virtual assistant 41 and transmits them to the user terminal 30b, and mixes the voices of the user terminal 30b and the virtual assistant 41 and transmits the voices to the user terminal 30a. In this way, the packet monitoring device 10 including the voice mixing unit 15 establishes a call between the three parties.

音声ミキシング処理の開始後、バーチャルアシスタント41は、受信したmatch_actionの値に基づいたシナリオを実施する。ここでは、ユーザAとユーザBの会話に参加後、例えば、「この会話に誰かを参加させますか?」と発言する。以降の処理については、バーチャルアシスタント41自体の処理(バーチャルアシスタント41のエンジン自体の処理)になるため、その説明を省略する。例えば、ユーザA又はユーザBが「ユーザCさんを参加」と発言するとバーチャルアシスタント41は、ユーザCに電話をかけ、ユーザA及びユーザBの通話に参加させることができる。 After the start of the audio mixing process, the virtual assistant 41 implements a scenario based on the received match_action value. Here, after participating in the conversation between user A and user B, for example, "Do you want someone to participate in this conversation?" Is said. Since the subsequent processing is the processing of the virtual assistant 41 itself (the processing of the engine itself of the virtual assistant 41), the description thereof will be omitted. For example, when the user A or the user B says "Join user C", the virtual assistant 41 can call the user C and have the user A and the user B participate in the call.

また、「本件はユーザCさんの説明が必要だ」と発言した場合について例示した。他の例として、例えば通話中にユーザA又はユーザBが「バーチャルアシスタントの説明が必要だ」と発言した場合には、バーチャルアシスタント41を呼び出し、バーチャルアシスタント41には「何かご用ですか?」などと発言させることができる。 In addition, an example was given when he said, "This case requires explanation by user C." As another example, for example, when User A or User B says "I need an explanation of the virtual assistant" during a call, the virtual assistant 41 is called and the virtual assistant 41 is asked "What do you want?" And so on.

なお、バーチャルアシスタント41の種類/種別、どういった行動をとるエンジンを搭載するのかなどは問わず、どのようなバーチャルアシスタント41であっても本実施形態に適用することができる。 It should be noted that any virtual assistant 41 can be applied to the present embodiment regardless of the type / type of the virtual assistant 41, what kind of action the engine is mounted on, and the like.

以上のように、本実施形態によれば、実施形態1による効果と同様の効果を奏することができる。 As described above, according to the present embodiment, the same effect as that of the first embodiment can be obtained.

また、特定KW登録DB59で例示したように、パケット監視装置10は、特定キーワードを複数記憶した記憶部を備えることができる。これにより、複数の特定キーワードに対してバーチャルアシスタントの呼び出し処理を行うことができるようになる。 Further, as illustrated in the specific KW registration DB 59, the packet monitoring device 10 can include a storage unit that stores a plurality of specific keywords. This makes it possible to call the virtual assistant for a plurality of specific keywords.

さらに、制御部11は、音声認識結果に含まれる特定キーワードに応じて、呼び出し処理を異ならせることもできる。このような様々な例について、以下に具体的に説明する。 Further, the control unit 11 can make the calling process different according to the specific keyword included in the voice recognition result. Such various examples will be specifically described below.

例えば、行動データ59bを読み出して行動命令を指定した例を挙げたように、制御部11は、音声認識結果に含まれる特定キーワードに応じて、出力する音声の内容(行動)及び声質の少なくとも一方を指定して、呼び出し処理を実行することができる。この場合には1つのバーチャルアシスタント41が行動及び声質の少なくとも一方を変更できることを前提としている。なお、バーチャルアシスタントが出力する音声の内容は、バーチャルアシスタントの行動を指すものとすること、或いは行動と対応付けられた内容を指すものとすることができる。 For example, as shown in the example of reading the action data 59b and designating the action command, the control unit 11 outputs at least one of the voice content (behavior) and the voice quality according to the specific keyword included in the voice recognition result. Can be specified to execute the call processing. In this case, it is assumed that one virtual assistant 41 can change at least one of behavior and voice quality. The content of the voice output by the virtual assistant may refer to the action of the virtual assistant, or may indicate the content associated with the action.

代替処理として、制御部11は、音声認識結果に含まれる特定キーワードを示す情報を指定して、呼び出し処理を実行することもできる。この場合、バーチャルアシスタント41は、指定された情報(によって示される特定キーワード)に応じて、出力する音声の内容(行動)及び声質の少なくとも一方を異ならせるようにすればよい。バーチャルアシスタント41において、特定キーワードを示す情報と採るべき行動及び/又は使用すべき声質とを関連付けておけばよい。 As an alternative process, the control unit 11 can also specify information indicating a specific keyword included in the voice recognition result and execute the call process. In this case, the virtual assistant 41 may make at least one of the output voice content (behavior) and voice quality different according to the designated information (specific keyword indicated by). In the virtual assistant 41, the information indicating the specific keyword may be associated with the action to be taken and / or the voice quality to be used.

また、制御部11が、音声認識結果に含まれる特定キーワードを示す情報を指定して、呼び出し処理を実行する場合、パケット監視装置10では、指定された情報に応じてバーチャルアシスタントが選択されて提供されるようにすることもできる。但し、この場合、サーバ40及びパケット監視装置10のいずれか一方又は双方によって、バーチャルアシスタントを複数提供可能に構成されることを前提とする。 Further, when the control unit 11 specifies information indicating a specific keyword included in the voice recognition result and executes the call processing, the packet monitoring device 10 selects and provides a virtual assistant according to the designated information. It can also be done. However, in this case, it is premised that one or both of the server 40 and the packet monitoring device 10 can provide a plurality of virtual assistants.

例えば、サーバ40は、指定された情報に応じてバーチャルアシスタントを選択して提供するようにすることができる。この場合、サーバ40がバーチャルアシスタントを複数提供可能に構成されることを前提とする。或いは、パケット監視装置10は、指定された情報に応じて(換言すれば特定キーワードに応じて)、バーチャルアシスタントを選択して読み出すようにすることができる。この場合、パケット監視装置10のバーチャルアシスタント記憶部がバーチャルアシスタントを複数記憶していることを前提とする。或いは、パケット監視装置10は、指定された情報に応じて、バーチャルアシスタント記憶部及びサーバ40の双方に記憶された複数のバーチャルアシスタントの中から、呼び出すバーチャルアシスタントを選択し、呼び出すこともできる。 For example, the server 40 may select and provide a virtual assistant according to the specified information. In this case, it is assumed that the server 40 is configured to be able to provide a plurality of virtual assistants. Alternatively, the packet monitoring device 10 may select and read the virtual assistant according to the specified information (in other words, according to a specific keyword). In this case, it is assumed that the virtual assistant storage unit of the packet monitoring device 10 stores a plurality of virtual assistants. Alternatively, the packet monitoring device 10 may select and call a virtual assistant to be called from a plurality of virtual assistants stored in both the virtual assistant storage unit and the server 40 according to the designated information.

また、特定キーワードが通話中のユーザに依らずに共通であることを前提として説明したが、ユーザ毎に適用する特定キーワードを異ならせることもできる。具体的には、制御部11は、まず、通信パケットデータから通話中のユーザ端末(又はそれを利用するユーザ)を特定する。ここで、ユーザ端末の端末情報だけで通話を実施しているユーザ端末を特定することもできるが、ユーザまで特定する場合にもユーザ端末とユーザとを関連付けておけばよい。なお、ユーザの特定をより正確に行うのであれば、例えば、音声認識処理により予め登録したユーザ毎の音声の発話データから実行することもできる。 Further, although the description has been made on the premise that the specific keyword is common regardless of the user during the call, the specific keyword applied to each user can be different. Specifically, the control unit 11 first identifies the user terminal (or the user who uses it) during a call from the communication packet data. Here, it is possible to specify the user terminal that is making a call only by the terminal information of the user terminal, but even when specifying the user, the user terminal and the user may be associated with each other. If the user is specified more accurately, for example, it can be executed from the utterance data of the voice for each user registered in advance by the voice recognition process.

そして、制御部11は、特定したユーザ端末に応じて、バーチャルアシスタント41を呼び出すトリガ(呼び出し処理のトリガ)とする特定キーワードを異ならせればよい。このトリガとなる特定キーワードは、トリガフレーズ又はウェイクワードなどと称することもでき、後者はバーチャルアシスタント41を呼び起こすためそのように称される。 Then, the control unit 11 may use different specific keywords as triggers for calling the virtual assistant 41 (triggers for call processing) according to the specified user terminal. The specific keyword that serves as a trigger can also be referred to as a trigger phrase, a wake word, or the like, and the latter is so referred to because it evokes the virtual assistant 41.

このようにして、ウェイクワードをユーザ毎に異ならせることができる。なお、1ユーザにつき2つ以上の特定キーワードを使用できるように特定キーワードを登録しておくこともできる。 In this way, the wake word can be different for each user. It is also possible to register specific keywords so that one user can use two or more specific keywords.

また、制御部11が1つのユーザ端末(又は1人のユーザ)を特定することを前提として説明した。しかし、制御部11は、少なくとも一方のユーザ端末を特定すればよく、1つのユーザ端末(又は1人のユーザ。以下同様。)でなくても、通話に参加している全て又は一部のユーザ端末の組み合わせを特定してもよい。いずれの場合でも、特定したユーザ端末又はユーザ端末の組み合わせに、バーチャルアシスタント41を呼び出すトリガとする特定キーワードを関連付けて記憶させておけばよい。これにより、特定したユーザ端末又は特定したユーザ端末の組み合わせに応じて、ウェイクワードを異ならせることができる。 Further, the description has been made on the premise that the control unit 11 identifies one user terminal (or one user). However, the control unit 11 only needs to specify at least one user terminal, and all or some of the users participating in the call, even if they are not one user terminal (or one user; the same applies hereinafter). You may specify the combination of terminals. In any case, the specified user terminal or the combination of user terminals may be associated with a specific keyword as a trigger for calling the virtual assistant 41 and stored. Thereby, the wake word can be made different according to the specified user terminal or the combination of the specified user terminal.

また、制御部11は、通信パケットデータから通話中のユーザ端末を特定し、呼び出し処理を実行する場合には、特定したユーザ端末に応じて、バーチャルアシスタントを指定して実行するように構成することもできる。但し、この場合も、サーバ40及びパケット監視装置10のいずれか一方又は双方によって、バーチャルアシスタントを複数提供可能に構成されることを前提とする。 Further, when the control unit 11 identifies a user terminal during a call from communication packet data and executes a call process, the control unit 11 is configured to specify and execute a virtual assistant according to the specified user terminal. You can also. However, also in this case, it is premised that a plurality of virtual assistants can be provided by either one or both of the server 40 and the packet monitoring device 10.

また、制御部11は、監視された通信パケットデータがユーザ端末間の通話の通信パケットデータである場合に、音声認識処理、呼び出し処理、及びミキシング処理を実行するように構成することもできる。つまり、この例では、音声認識処理、呼び出し処理、及びミキシング処理は、内線通話の場合にのみ実行され、外線通話に対しては実行されない。これにより、社外などへの通話が想定される外線通話については、余計なミキシングを行わないようにすることができる。 Further, the control unit 11 can be configured to execute the voice recognition process, the call process, and the mixing process when the monitored communication packet data is the communication packet data of the call between the user terminals. That is, in this example, the voice recognition process, the call process, and the mixing process are executed only for the extension call, not for the outside line call. As a result, it is possible to prevent unnecessary mixing for outside line calls that are expected to be made outside the company.

また、制御部11は、ユーザ端末からの操作に基づき特定キーワードを変更する設定部を有することが好ましい。これにより、ユーザ端末のユーザがバーチャルアシスタントを呼び出すウェイクワードを指定することができるようになり、1つのウェイクワードに固定されることがなくなるため、ユーザ利便性をさらに向上させることができる。 Further, it is preferable that the control unit 11 has a setting unit for changing a specific keyword based on an operation from the user terminal. As a result, the user of the user terminal can specify a wake word to call the virtual assistant, and the wake word is not fixed to one wake word, so that the user convenience can be further improved.

なお、本実施形態で説明した様々な例は、適宜、1又は複数を組み合わせて実装することができる。 The various examples described in the present embodiment can be appropriately implemented by one or a combination of two or more.

<他の実施形態>
上述した各実施形態では、パケット監視装置、構内交換機等の装置の各部について説明したが、各装置としてこれらの機能が実現できればよい。
<Other embodiments>
In each of the above-described embodiments, each part of the device such as the packet monitoring device and the private branch exchange has been described, but it is sufficient that each device can realize these functions.

また、上述した各実施形態では、電話機によるユーザ同士の通話の場面に限って説明した。しかしながら、上述した各実施形態は、テレビ会議やビデオ通話(チャット付きであってもよい)などといった映像を伴う通話に対しても同様に適用することができる。例えば、テレビ会議用の端末側のシステムは構内電話機又は構外電話機を備えると言える。ビデオ通話機能をアプリケーションソフトウェア等により備えるスマートフォン等の端末は、構内電話機又は構外電話機を備えると言える。また、映像を伴う通話に際しては、バーチャルアシスタントとして音声だけではなく映像付きのものを呼び出すようにしておくこともできる。 Further, in each of the above-described embodiments, the description is limited to the situation where the users talk to each other by the telephone. However, each of the above-described embodiments can be similarly applied to a call involving video such as a video conference or a video call (which may be accompanied by a chat). For example, it can be said that the system on the terminal side for video conference includes a private telephone or an external telephone. It can be said that a terminal such as a smartphone having a video call function by application software or the like includes a private telephone or an external telephone. In addition, when making a call with video, it is possible to call not only audio but also video as a virtual assistant.

また、各実施形態に係るパケット監視装置、構内交換機、サーバ装置、電話機等の装置は、次のようなハードウェア構成を有することができる。図11は、各実施形態に係る装置のハードウェア構成の一例を示す図である。 Further, the devices such as the packet monitoring device, the private branch exchange, the server device, and the telephone according to each embodiment can have the following hardware configurations. FIG. 11 is a diagram showing an example of the hardware configuration of the device according to each embodiment.

図11に示す装置100は、プロセッサ101、メモリ102、及びインタフェース103を有する。インタフェース103は、図示しない接続対象の装置に接続するためのインタフェースとすることができる。各実施形態で説明した各装置の機能は、プロセッサ101がメモリ102に記憶されたプログラムを読み込んで、必要に応じてインタフェース103と協働しながら実行することにより実現されることができる。このプログラムは、各実施形態で説明したプログラムとすることができる。 The device 100 shown in FIG. 11 has a processor 101, a memory 102, and an interface 103. The interface 103 can be an interface for connecting to a device to be connected (not shown). The function of each device described in each embodiment can be realized by the processor 101 reading the program stored in the memory 102 and executing the program in cooperation with the interface 103 as needed. This program can be the program described in each embodiment.

上述の例において、上記プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)を含む。さらに、この例は、CD-ROM(Read Only Memory)、CD-R、CD-R/Wを含む。さらに、この例は、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、上記プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。 In the above example, the program can be stored and supplied to a computer using various types of non-transitory computer readable medium. Non-temporary computer-readable media include various types of tangible storage media. Examples of non-temporary computer-readable media include magnetic recording media (eg, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (eg, magneto-optical disks). Further, this example includes a CD-ROM (Read Only Memory), a CD-R, and a CD-R / W. Further, this example includes semiconductor memories (eg, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (Random Access Memory)). The program may also be supplied to the computer by various types of transient computer readable medium. Examples of temporary computer readable media include electrical, optical, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.

さらに、上述した様々な実施形態では、例えば図2を参照するなどしてパケット監視装置におけるバーチャルアシスタント呼び出し方法の手順を説明した。このように、本開示は、パケット監視装置(又はその機能を備えた構内交換機)が実行する監視ステップ、認識ステップ、呼び出しステップ、及びミキシングステップを備えたバーチャルアシスタント呼び出し方法としての形態も採り得る。また、上記プログラムは、パケット監視装置又は構内交換機の内部のコンピュータ(制御コンピュータ)に上述したバーチャルアシスタント呼び出し方法を実行させるためのプログラムであると言える。 Further, in the various embodiments described above, the procedure of the virtual assistant calling method in the packet monitoring device has been described, for example, with reference to FIG. As described above, the present disclosure may also take the form of a virtual assistant calling method including a monitoring step, a recognition step, a calling step, and a mixing step executed by the packet monitoring device (or a private branch exchange having the function thereof). Further, it can be said that the above program is a program for causing a computer (control computer) inside the packet monitoring device or the private branch exchange to execute the above-mentioned virtual assistant calling method.

なお、本開示は上述した様々な実施形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。また、本開示は、それぞれの実施形態を適宜組み合わせて実施されてもよい。 The present disclosure is not limited to the various embodiments described above, and can be appropriately modified without departing from the spirit. Further, the present disclosure may be carried out by appropriately combining the respective embodiments.

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
<付記>
Some or all of the above embodiments may also be described, but not limited to:
<Additional notes>

(付記1)
複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視部と、
制御部と、
を備え、
前記制御部は、前記監視部で監視された前記通信パケットデータに対して音声認識処理を実行し、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行し、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行する、
パケット監視装置。
(Appendix 1)
In a network in which a plurality of private telephones and a private branch exchange accommodating the plurality of private telephones are connected, a monitoring unit for monitoring communication packet data of a call between telephones including at least one of the private telephones, and a monitoring unit.
Control unit and
Equipped with
The control unit executes voice recognition processing on the communication packet data monitored by the monitoring unit, and calls a virtual assistant when a predetermined keyword is included in the recognition result in the voice recognition processing. Execute the process and execute the mixing process to mix the voice of the virtual assistant with the call.
Packet monitoring device.

(付記2)
前記所定のキーワードを複数記憶した記憶部を備えた、
付記1に記載のパケット監視装置。
(Appendix 2)
A storage unit that stores a plurality of the predetermined keywords is provided.
The packet monitoring device according to Appendix 1.

(付記3)
前記制御部は、前記認識結果に含まれる前記所定のキーワードに応じて、前記呼び出し処理を異ならせる、
付記2に記載のパケット監視装置。
(Appendix 3)
The control unit makes the calling process different according to the predetermined keyword included in the recognition result.
The packet monitoring device according to Appendix 2.

(付記4)
前記制御部は、前記認識結果に含まれる前記所定のキーワードに応じて、出力する音声の内容及び声質の少なくとも一方を指定して前記呼び出し処理を実行する、
付記3に記載のパケット監視装置。
(Appendix 4)
The control unit executes the calling process by designating at least one of the content and voice quality of the voice to be output according to the predetermined keyword included in the recognition result.
The packet monitoring device according to Appendix 3.

(付記5)
前記制御部は、前記認識結果に含まれる前記所定のキーワードを示す情報を指定して前記呼び出し処理を実行し、
前記バーチャルアシスタントは、指定された前記情報に応じて、出力する音声の内容及び声質の少なくとも一方を異ならせる、
付記3に記載のパケット監視装置。
(Appendix 5)
The control unit executes the calling process by designating information indicating the predetermined keyword included in the recognition result.
The virtual assistant makes at least one of the output audio content and voice quality different according to the specified information.
The packet monitoring device according to Appendix 3.

(付記6)
前記バーチャルアシスタントは複数提供可能になっており、
前記制御部は、前記認識結果に含まれる前記所定のキーワードを示す情報を指定して前記呼び出し処理を実行し、
指定された前記情報に応じて前記バーチャルアシスタントが選択されて提供される、
付記3に記載のパケット監視装置。
(Appendix 6)
Multiple virtual assistants can be provided,
The control unit executes the calling process by designating information indicating the predetermined keyword included in the recognition result.
The virtual assistant is selected and provided according to the specified information.
The packet monitoring device according to Appendix 3.

(付記7)
前記制御部は、前記通信パケットデータから通話中の前記構内電話機を特定し、特定した前記構内電話機に応じて、前記バーチャルアシスタントを呼び出すトリガとする前記所定のキーワードを異ならせる、
付記2~6のいずれか1項に記載のパケット監視装置。
(Appendix 7)
The control unit identifies the private telephone in a call from the communication packet data, and makes the predetermined keyword that is a trigger for calling the virtual assistant different according to the identified private telephone.
The packet monitoring device according to any one of Supplementary note 2 to 6.

(付記8)
前記バーチャルアシスタントは複数提供可能になっており、
前記制御部は、前記通信パケットデータから通話中の前記構内電話機を特定し、前記呼び出し処理を実行する場合には、特定した前記構内電話機に応じて、前記バーチャルアシスタントを指定して実行する、
付記1~7のいずれか1項に記載のパケット監視装置。
(Appendix 8)
Multiple virtual assistants can be provided,
When the control unit identifies the private telephone during a call from the communication packet data and executes the call processing, the control unit designates and executes the virtual assistant according to the specified private telephone.
The packet monitoring device according to any one of Supplementary note 1 to 7.

(付記9)
前記制御部は、前記監視部で監視された前記通信パケットデータが前記構内電話機間の通話の通信パケットデータである場合に、前記音声認識処理、前記呼び出し処理、及び前記ミキシング処理を実行する、
付記1~8のいずれか1項に記載のパケット監視装置。
(Appendix 9)
The control unit executes the voice recognition process, the call process, and the mixing process when the communication packet data monitored by the monitoring unit is the communication packet data of a call between the private telephones.
The packet monitoring device according to any one of Supplementary note 1 to 8.

(付記10)
前記制御部は、前記構内電話機からの操作に基づき前記所定のキーワードを変更する設定部を有する、
付記1~9のいずれか1項に記載のパケット監視装置。
(Appendix 10)
The control unit has a setting unit that changes the predetermined keyword based on an operation from the private telephone.
The packet monitoring device according to any one of Supplementary note 1 to 9.

(付記11)
前記制御部は、前記ミキシング処理の後の前記音声認識処理による前記認識結果に他の所定のキーワードが含まれていた場合、前記バーチャルアシスタントの提供を中止させる中止処理を実行する、
付記1~10のいずれか1項に記載のパケット監視装置。
(Appendix 11)
When the recognition result by the voice recognition process after the mixing process contains another predetermined keyword, the control unit executes a stop process for discontinuing the provision of the virtual assistant.
The packet monitoring device according to any one of Supplementary note 1 to 10.

(付記12)
前記バーチャルアシスタントを提供するサーバ装置に前記ネットワークを介して接続され、
前記呼び出し処理は、前記ネットワークを介して前記サーバ装置に前記バーチャルアシスタントを提供させる処理を含む、
付記1~11のいずれか1項に記載のパケット監視装置。
(Appendix 12)
Connected to the server device that provides the virtual assistant via the network,
The call process includes a process of causing the server device to provide the virtual assistant via the network.
The packet monitoring device according to any one of Supplementary note 1 to 11.

(付記13)
前記バーチャルアシスタントを前記制御部から読み出し可能に記憶するバーチャルアシスタント記憶部を備えた、
付記1~12のいずれか1項に記載のパケット監視装置。
(Appendix 13)
A virtual assistant storage unit for storing the virtual assistant so that it can be read from the control unit is provided.
The packet monitoring device according to any one of Supplementary note 1 to 12.

(付記14)
収容する複数の構内電話機を、ネットワークを介して接続する接続部と、
前記ネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視部と、
制御部と、
を備え、
前記制御部は、前記監視部で監視された前記通信パケットデータに対して音声認識処理を実行し、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行し、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行する、
構内交換機。
(Appendix 14)
A connection part that connects multiple premises telephones to be accommodated via a network,
In the network, a monitoring unit that monitors communication packet data of a call between telephones including at least one of the private telephones, and a monitoring unit.
Control unit and
Equipped with
The control unit executes voice recognition processing on the communication packet data monitored by the monitoring unit, and calls a virtual assistant when a predetermined keyword is included in the recognition result in the voice recognition processing. Execute the process and execute the mixing process to mix the voice of the virtual assistant with the call.
Private branch exchange.

(付記15)
パケット監視装置が、複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視ステップと、
前記パケット監視装置が、前記監視ステップで監視された前記通信パケットデータに対して音声認識処理を実行するステップと、
前記パケット監視装置が、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行するステップと、
前記パケット監視装置が、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行するステップと、
を備えた、バーチャルアシスタント呼び出し方法。
(Appendix 15)
A monitoring step in which a packet monitoring device monitors communication packet data of a call between telephones including at least one of the private telephones in a network in which a plurality of private telephones and a private branch exchange accommodating the plurality of private telephones are connected. When,
A step in which the packet monitoring device executes voice recognition processing on the communication packet data monitored in the monitoring step, and
When the packet monitoring device includes a predetermined keyword in the recognition result in the voice recognition process, a step of executing a call process for calling the virtual assistant, and a step of executing the call process.
A step in which the packet monitoring device executes a mixing process of mixing the voice of the virtual assistant into the call.
How to call a virtual assistant.

(付記16)
コンピュータに、
複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視ステップと、
前記監視ステップで監視された前記通信パケットデータに対して音声認識処理を実行するステップと、
前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行するステップと、
前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行するステップと、
を実行させるためのプログラム。
(Appendix 16)
On the computer
In a network in which a plurality of private telephones and a private branch exchange accommodating the plurality of private telephones are connected, a monitoring step for monitoring communication packet data of a call between telephones including at least one of the private telephones, and a monitoring step.
A step of executing voice recognition processing for the communication packet data monitored in the monitoring step, and
When a predetermined keyword is included in the recognition result in the voice recognition process, a step of executing a call process for calling the virtual assistant and a step of executing the call process.
A step of executing a mixing process for mixing the voice of the virtual assistant into the call, and
A program to execute.

1、10 パケット監視装置
1a、11 制御部
1b 監視部
2、20 構内交換機
2a 構内交換機の制御部
2b 構内交換機の監視部
2c 接続部
12 通信部
13 パケット監視解析部
14 バーチャルアシスタント呼び出し部
14a バーチャルアシスタント呼び出し処理部
15 音声ミキシング部
30a、30b ユーザ端末(電話機)
40 サーバ
41 バーチャルアシスタント
51 パケット監視部
52 SIPヘッダ情報保存部
53 パケット解析部
54 SIPヘッダ情報読取部
55 RTPデータ読取部
56 音声データテキスト変換部
57 データ比較部
58 命令指示部
58a マッチング判定部
58b バーチャルアシスタント呼び出し前処理部
59 特定KW登録DB
59a 登録データ
59b 行動データ
100 装置
101 プロセッサ
102 メモリ
103 インタフェース
1, 10 Packet monitoring device 1a, 11 Control unit 1b Monitoring unit 2, 20 Private branch exchange control unit 2b Private branch exchange monitoring unit 2c Connection unit 12 Communication unit 13 Packet monitoring analysis unit 14 Virtual assistant calling unit 14a Virtual assistant Call processing unit 15 Voice mixing unit 30a, 30b User terminal (telephone)
40 Server 41 Virtual Assistant 51 Packet Monitoring Unit 52 SIP Header Information Storage Unit 53 Packet Analysis Unit 54 SIP Header Information Reading Unit 55 RTP Data Reading Unit 56 Voice Data Text Conversion Unit 57 Data Comparison Unit 58 Command Instruction Unit 58a Matching Judgment Unit 58b Virtual Assistant call pre-processing unit 59 Specific KW registration DB
59a Registration data 59b Behavior data 100 Device 101 Processor 102 Memory 103 Interface

Claims (9)

複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視部と、
制御部と、
を備え、
前記制御部は、前記監視部で監視された前記通信パケットデータが前記構内電話機間の通話の通信パケットデータである場合に、前記監視部で監視された前記通信パケットデータに対して音声認識処理を実行し、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行し、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行する、
パケット監視装置。
In a network in which a plurality of private telephones and a private branch exchange accommodating the plurality of private telephones are connected, a monitoring unit for monitoring communication packet data of a call between telephones including at least one of the private telephones, and a monitoring unit.
Control unit and
Equipped with
When the communication packet data monitored by the monitoring unit is the communication packet data of a call between the premises telephones, the control unit performs voice recognition processing on the communication packet data monitored by the monitoring unit. When the recognition result in the voice recognition process includes a predetermined keyword, a call process for calling the virtual assistant is executed, and a mixing process for mixing the voice of the virtual assistant into the call is executed.
Packet monitoring device.
前記所定のキーワードを複数記憶した記憶部を備えた、
請求項1に記載のパケット監視装置。
A storage unit that stores a plurality of the predetermined keywords is provided.
The packet monitoring device according to claim 1.
前記制御部は、前記認識結果に含まれる前記所定のキーワードに応じて、前記呼び出し処理を異ならせる、
請求項2に記載のパケット監視装置。
The control unit makes the calling process different according to the predetermined keyword included in the recognition result.
The packet monitoring device according to claim 2.
前記制御部は、前記通信パケットデータから通話中の前記構内電話機を特定し、特定した前記構内電話機に応じて、前記バーチャルアシスタントを呼び出すトリガとする前記所定のキーワードを異ならせる、
請求項2又は3に記載のパケット監視装置。
The control unit identifies the private telephone in a call from the communication packet data, and makes the predetermined keyword that is a trigger for calling the virtual assistant different according to the identified private telephone.
The packet monitoring device according to claim 2 or 3.
前記バーチャルアシスタントは複数提供可能になっており、
前記制御部は、前記通信パケットデータから通話中の前記構内電話機を特定し、前記呼び出し処理を実行する場合には、特定した前記構内電話機に応じて、前記バーチャルアシスタントを指定して実行する、
請求項1~4のいずれか1項に記載のパケット監視装置。
Multiple virtual assistants can be provided,
When the control unit identifies the private telephone during a call from the communication packet data and executes the call processing, the control unit designates and executes the virtual assistant according to the specified private telephone.
The packet monitoring device according to any one of claims 1 to 4.
前記制御部は、前記構内電話機からの操作に基づき前記所定のキーワードを変更する設定部を有する、
請求項1~のいずれか1項に記載のパケット監視装置。
The control unit has a setting unit that changes the predetermined keyword based on an operation from the private telephone.
The packet monitoring device according to any one of claims 1 to 5 .
収容する複数の構内電話機を、ネットワークを介して接続する接続部と、
前記ネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視部と、
制御部と、
を備え、
前記制御部は、前記監視部で監視された前記通信パケットデータが前記構内電話機間の通話の通信パケットデータである場合に、前記監視部で監視された前記通信パケットデータに対して音声認識処理を実行し、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行し、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行する、
構内交換機。
A connection part that connects multiple premises telephones to be accommodated via a network,
In the network, a monitoring unit that monitors communication packet data of a call between telephones including at least one of the private telephones, and a monitoring unit.
Control unit and
Equipped with
When the communication packet data monitored by the monitoring unit is the communication packet data of a call between the premises telephones, the control unit performs voice recognition processing on the communication packet data monitored by the monitoring unit. When the recognition result in the voice recognition process includes a predetermined keyword, a call process for calling the virtual assistant is executed, and a mixing process for mixing the voice of the virtual assistant into the call is executed.
Private branch exchange.
パケット監視装置が、複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視ステップと、
前記パケット監視装置が、前記監視ステップで監視された前記通信パケットデータが前記構内電話機間の通話の通信パケットデータである場合に、前記監視ステップで監視された前記通信パケットデータに対して音声認識処理を実行するステップと、
前記パケット監視装置が、前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行するステップと、
前記パケット監視装置が、前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行するステップと、
を備えた、バーチャルアシスタント呼び出し方法。
A monitoring step in which a packet monitoring device monitors communication packet data of a call between telephones including at least one of the private telephones in a network in which a plurality of private telephones and a private branch exchange accommodating the plurality of private telephones are connected. When,
When the communication packet data monitored in the monitoring step is the communication packet data of a call between the premises telephones , the packet monitoring device performs voice recognition processing on the communication packet data monitored in the monitoring step. And the steps to perform
When the packet monitoring device includes a predetermined keyword in the recognition result in the voice recognition process, a step of executing a call process for calling the virtual assistant, and a step of executing the call process.
A step in which the packet monitoring device executes a mixing process of mixing the voice of the virtual assistant into the call.
How to call a virtual assistant.
コンピュータに、
複数の構内電話機と前記複数の構内電話機を収容する構内交換機とが接続されるネットワークにおいて、前記構内電話機を少なくとも1つ含む電話機間での通話の通信パケットデータを監視する監視ステップと、
前記監視ステップで監視された前記通信パケットデータが前記構内電話機間の通話の通信パケットデータである場合に、前記監視ステップで監視された前記通信パケットデータに対して音声認識処理を実行するステップと、
前記音声認識処理での認識結果に所定のキーワードが含まれていた場合、バーチャルアシスタントを呼び出す呼び出し処理を実行するステップと、
前記バーチャルアシスタントの音声を前記通話にミキシングするミキシング処理を実行するステップと、
を実行させるためのプログラム。
On the computer
In a network in which a plurality of private telephones and a private branch exchange accommodating the plurality of private telephones are connected, a monitoring step for monitoring communication packet data of a call between telephones including at least one of the private telephones, and a monitoring step.
When the communication packet data monitored in the monitoring step is the communication packet data of a call between the private telephones, a step of executing voice recognition processing on the communication packet data monitored in the monitoring step, and a step of executing voice recognition processing.
When a predetermined keyword is included in the recognition result in the voice recognition process, a step of executing a call process for calling the virtual assistant and a step of executing the call process.
A step of executing a mixing process for mixing the voice of the virtual assistant into the call, and
A program to execute.
JP2020024846A 2020-02-18 2020-02-18 Packet monitoring device, private branch exchange, virtual assistant calling method, and program Active JP7001241B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020024846A JP7001241B2 (en) 2020-02-18 2020-02-18 Packet monitoring device, private branch exchange, virtual assistant calling method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020024846A JP7001241B2 (en) 2020-02-18 2020-02-18 Packet monitoring device, private branch exchange, virtual assistant calling method, and program

Publications (2)

Publication Number Publication Date
JP2021132240A JP2021132240A (en) 2021-09-09
JP7001241B2 true JP7001241B2 (en) 2022-01-19

Family

ID=77551283

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020024846A Active JP7001241B2 (en) 2020-02-18 2020-02-18 Packet monitoring device, private branch exchange, virtual assistant calling method, and program

Country Status (1)

Country Link
JP (1) JP7001241B2 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003032388A (en) 2001-07-12 2003-01-31 Denso Corp Communication terminal and processing system
JP2016533690A (en) 2013-09-25 2016-10-27 アマゾン テクノロジーズ インコーポレイテッド Virtual assistant during a call
WO2018068096A1 (en) 2016-10-13 2018-04-19 Optus Administration Pty Ltd Method and system for offering digital services within a phone call
JP2018525751A (en) 2015-09-28 2018-09-06 百度在線網絡技術(北京)有限公司 Interactive control method and apparatus for voice and video calls
JP2019506659A (en) 2015-12-21 2019-03-07 グーグル エルエルシー Automatic suggestions and other content for messaging applications
US20190189120A1 (en) 2017-12-08 2019-06-20 Samsung Electronics Co., Ltd. Method for providing artificial intelligence service during phone call and electronic device thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003032388A (en) 2001-07-12 2003-01-31 Denso Corp Communication terminal and processing system
JP2016533690A (en) 2013-09-25 2016-10-27 アマゾン テクノロジーズ インコーポレイテッド Virtual assistant during a call
JP2018525751A (en) 2015-09-28 2018-09-06 百度在線網絡技術(北京)有限公司 Interactive control method and apparatus for voice and video calls
JP2019506659A (en) 2015-12-21 2019-03-07 グーグル エルエルシー Automatic suggestions and other content for messaging applications
WO2018068096A1 (en) 2016-10-13 2018-04-19 Optus Administration Pty Ltd Method and system for offering digital services within a phone call
US20190189120A1 (en) 2017-12-08 2019-06-20 Samsung Electronics Co., Ltd. Method for providing artificial intelligence service during phone call and electronic device thereof

Also Published As

Publication number Publication date
JP2021132240A (en) 2021-09-09

Similar Documents

Publication Publication Date Title
US8380521B1 (en) System, method and computer-readable medium for verbal control of a conference call
US9118734B2 (en) Systems for managing conferences
US20130339455A1 (en) Method and Apparatus for Identifying an Active Participant in a Conferencing Event
US11570217B2 (en) Switch controller for separating multiple portions of call
JP5079686B2 (en) Method and system for associating a conference participant with a telephone call
US20110150200A1 (en) Web guided collaborative audio
WO2018133702A1 (en) Conference communication method, server, intelligent terminal and computer-readable storage medium
US10057426B2 (en) Speaker priority for conference calls
CA2818776C (en) Method and apparatus for identifying an active participant in a conferencing event
US8611877B2 (en) Automatic management control of external resources
US20160301805A1 (en) Government enterprise network communication device and communication method, and computer storage medium
US20200084057A1 (en) Conference session management with mode selection
US11606464B2 (en) System and method for facilitating setup and joining of conference calls
US20130077539A1 (en) System and method for a conference foyer
US9762632B2 (en) Systems and methods for establishing and controlling conference call bridges
US8149741B2 (en) Apparatus and method for asymmetrical conferencing between local and external transceivers
KR100675325B1 (en) Ip telephone system, enum server and method for performing telephone conference
CN107666396B (en) Multi-terminal conference processing method and device
JP7001241B2 (en) Packet monitoring device, private branch exchange, virtual assistant calling method, and program
KR102056807B1 (en) Remote video conference system
US20170078339A1 (en) Systems and methods for providing conference calling functions
KR100598351B1 (en) The conference aparatus applied between another networks
CN113727060B (en) Internet court trial processing method, device and system
US20230261892A1 (en) Audio and video conference implementation method, audio and video conference system, and related apparatus
EP2587778B1 (en) Automatic management control of external resources

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211216

R150 Certificate of patent or registration of utility model

Ref document number: 7001241

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150