WO2021025074A1 - グループ通話システム、グループ通話方法及びプログラム - Google Patents

グループ通話システム、グループ通話方法及びプログラム Download PDF

Info

Publication number
WO2021025074A1
WO2021025074A1 PCT/JP2020/030064 JP2020030064W WO2021025074A1 WO 2021025074 A1 WO2021025074 A1 WO 2021025074A1 JP 2020030064 W JP2020030064 W JP 2020030064W WO 2021025074 A1 WO2021025074 A1 WO 2021025074A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice
voice data
server
format
external system
Prior art date
Application number
PCT/JP2020/030064
Other languages
English (en)
French (fr)
Inventor
元気 大森
寛史 三浦
Original Assignee
株式会社Bonx
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Bonx filed Critical 株式会社Bonx
Priority to US17/785,119 priority Critical patent/US20230254411A1/en
Priority to EP20850287.2A priority patent/EP4027630A4/en
Priority to JP2020556994A priority patent/JP6842227B1/ja
Publication of WO2021025074A1 publication Critical patent/WO2021025074A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • H04M11/02Telephonic communication systems specially adapted for combination with other electrical systems with bell or annunciator systems
    • H04M11/027Annunciator systems for hospitals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2207/00Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place
    • H04M2207/18Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place wireless networks

Definitions

  • Patent Document 1 when a group call is started, the voice from the outside is taken into the call by interrupting the group call, and conversely, the content of the group call cannot be output to the external system.
  • a staff member of a nursing care facility makes a group call
  • one of the staff members voices the daily report of the day in the nursing care system, or an external system that detects a nurse call during the group call makes a nurse call to this group call. It was impossible to output audio.
  • the terminal A voice bot display means for displaying a voice bot as a virtual user indicating an external system in the group call, and Provided is a group call system including a bot output means for outputting voice data from the external system as voice data by the voice bot via the voice server.
  • FIG. 1 is an overall configuration diagram of the group call system 1.
  • FIG. 2 is a functional block diagram of the daemon server 200, the command server 100, and the user terminal 50.
  • FIG. 3 is a diagram showing voice output processing from the external system 300 to a group call.
  • FIG. 4 is a diagram showing an input process from a group call to an external system.
  • FIG. 5 is a diagram showing a flowchart of keyword detection processing executed by the command server 100 and the daemon server 200.
  • the command server 100 transmits to the daemon server 200 a "format change command" that changes the voice data received by the daemon server 200 to the first format, which is a predetermined format instructed by the care system (step S11). ).
  • system side including the daemon server 200 may also construct a call environment by assigning a new user ID to the external system 300'to be additionally connected as if it were the same as another user.
  • a new external system 300' can be added to interrupt a group call without imposing a heavy load on the system.
  • a new type of "bot” may be added to the newly added external system 300', or a plurality of external systems 300 may be integrated and made to talk to one "bot".
  • the daemon server 200 may be configured to receive audio data periodically output by the external system 300.
  • regular means every preset time, and corresponds to some kind of service such as meals, baths, and medical examinations that the resident or staff (user) provides at regular intervals or regular hours. ..
  • the audio data periodically acquired by the daemon server 200 is changed to the audio data after the format change based on the "format change command" from the command server 100.
  • the formatted audio data will be transmitted to the audio server 220.
  • step S51 when the keyword detection module 204 determines that the voice data contains the "command declaration keyword" (YES in step S51), it indicates that the voice data contains the "command declaration keyword”. , Notify the command server 100 (step S52).
  • 1 group call system 10 computers, 50a-c user terminals, 55a-c headphones, 100 command server, 110 API server, 200 daemon server, 220 voice server, 300 external system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】本発明は、グループ通話と外部システムとを連携し、グループ通話を違和感なく実現しながら、外部システムからグループ通話への割り込みによる音声出力と、グループ通話からの音声を外部システムへ入力することを目的とする。 【解決手段】複数の端末でグループ通話を実現するグループ通話システム1において、デーモンサーバ200は、利用者端末50との音声の送受信を行う音声サーバ220又は外部システム330からの音声データの受信を常時受付け、受付けた音声データを、所定のフォーマットに変更する。そして、音声サーバ220から音声データを受信した場合は、フォーマットが変更された音声データを、外部システム300に送信し、外部システム300から音声データを受信した場合は、フォーマットが変更された音声データを、利用者端末50に出力するために、音声サーバ220に送信する。

Description

グループ通話システム、グループ通話方法及びプログラム
 本発明は、複数の端末により利用者がグループ通話を実現するグループ通話システム、グループ通話方法及びプログラムに関する。
 従来より、電話やIP電話による電話会議等により、複数人からなるグループによる通話(グループ通話)を行うシステムが知られている。このようなシステムは、通話を開始する前に、互いに通話者が有する端末装置をグループとして登録し、このグループに登録された端末装置間で、グループ通話を行い、音声のやりとりを行っている。
 このようなシステムの例として、各通話者が、自身が有する端末装置と近距離無線方式で接続したヘッドセットを用い、グループ通話を行う構成が開示されている(特許文献1参照)。
特開2011-182407号公報
 しかしながら、特許文献1の構成では、グループ通話を開始すると、それに割り込む形で、外部からの音声を通話に取り込み、逆に、グループ通話の内容を、外部システムに出力することができなかった。例えば、介護施設の職員がグループ通話をする際、職員の一人が介護システムに音声でその日の日報を登録したり、グループ通話中にナースコールを検知した外部システムが、このグループ通話にナースコールを音声出力することは不可能であった。
 本発明は、グループ通話と外部システムとを連携し、グループ通話を違和感なく実現しながら、外部システムからグループ通話へ音声割り込みによる音声出力と、グループ通話からの音声を外部システムへ入力することが可能なグループ通話システム、グループ通話方法及びプログラムを提供することを目的とする。
 本発明では、以下のような解決手段を提供する。
 (1)複数の端末でグループ通話を実現するグループ通話システムであって、
 前記端末との音声の送受信を行う音声サーバ及び外部システムからの音声データの受信を常時受付ける常駐受付手段と、
 受付けた前記音声データを、所定のフォーマット(例えば、音声サーバから受信した場合は、リニアPCMフォーマット、外部システムから受信した場合は、後述する第1のフォーマット)に変更するフォーマット変更手段と、
 前記音声サーバから前記音声データを受信した場合は、フォーマットが変更された音声データを、前記外部システムに送信し、
 前記外部システムから前記音声データを受信した場合は、フォーマットが変更された音声データを、前記端末に出力するために、前記音声サーバに送信する送信手段と、を備えるグループ通話システムを提供する。
 本発明によれば、複数の端末でグループ通話を実現するグループ通話システムは、端末との音声の送受信を行う音声サーバ又は外部システムからの音声データの受信を常時受付け、受付けた音声データを、所定のフォーマットに変更し、音声サーバから音声データを受信した場合は、フォーマットが変更された音声データを、外部システムに送信し、外部システムから前記音声データを受信した場合は、フォーマットが変更された音声データを、端末に出力するために、音声サーバに送信する。
 本発明は、システムのカテゴリであるが、方法及びプログラム等の他のカテゴリにおいても、そのカテゴリに応じた同様の作用・効果を発揮する。
 (2)(1)のグループ通話システムであって、さらに、前記送信手段が、外部システムから前記音声データを受信した場合において、
 前記端末は、
  前記グループ通話内に外部システムを示す仮想的な利用者として音声ボットを表示する音声ボット表示手段と、
  前記外部システムからの音声データを、前記音声サーバを介して、前記音声ボットが音声データとして出力するボット出力手段と、を備えるグループ通話システムを提供する。
 (3)(1)のグループ通話システムであって、さらに、前記送信手段が、前記音声サーバから前記音声データを受信した場合において、
 前記端末は、
   前記グループ通話内に外部システムを示す仮想的な利用者として音声ボットを表示する音声ボット表示手段と、
   前記音声ボットに発話された音声データを前記音声サーバに送信する音声データ送信手段と、を備え、
 前記音声データを受信した音声サーバを介して前記音声データを受信し、前記フォーマット変更手段が前記音声データのフォーマット変更を行い、
  前記送信手段は、前記外部システムにフォーマット変更された当該音声データを送信するグループ通話システムを提供する。
 本発明によれば、グループ通話と外部システムとを連携し、グループ通話を違和感なく実現しながら、グループ通話への音声割り込みと、グループ通話から外部システムへの音声出力が可能な音声入出力システムを提供することが可能となる。
図1は、グループ通話システム1の全体構成図である。 図2は、デーモンサーバ200、コマンドサーバ100、利用者端末50の機能ブロック図である。 図3は、外部システム300からグループ通話への音声出力処理を示す図である。 図4は、グループ通話から外部システムへの入力処理を示す図である。 図5は、コマンドサーバ100とデーモンサーバ200が実行するキーワード検知処理のフローチャートを示す図である。
 以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これらはあくまでも例であって、本発明の技術的範囲はこれに限られるものではない。
 [グループ通話システム1の概要]
 本発明の好適な実施形態の概要について、図1に基づいて説明する。図1は、本発明の好適な実施形態であるグループ通話システム1の概要を説明するための図である。グループ通話システム1は、利用者端末50a、b、cと、音声サーバ220と、API(Application Programming Interface)サーバ110と、デーモンサーバ200と、コマンドサーバ100と、外部システム300と、から構成されてよい。
 利用者端末50a、b、cは、それぞれ音声サーバ220、APIサーバ110と通信可能に接続され、音声サーバ220は、音声データの送受信を行うために、デーモンサーバ200と通信可能に接続され、APIサーバ110は、コマンドサーバ100と通信可能に接続される。そして、外部システム300は、デーモンサーバ200及びコマンドサーバ100と各々、通信可能に接続される。
 利用者端末50a、b、cは、例えば、スマートフォンやタブレット端末等の携帯端末や、スマートグラス等のヘッドマウントディスプレイといったウェアラブル端末であってよい。グループ通話を行うために、この利用者端末50a、b、cと近距離無線通信等により通信可能に接続されたマイク付きの耳当て型ヘッドフォン55a、b、cが使用され利用者の音声入出力が行われてもよい。
 利用者端末50a、b、cには、グループ通話用のアプリケーション・プログラムがインストールされ、これが実行され、APIサーバ110及び音声サーバ220と通信を行うことでグループ通話が実現される。ここで、利用者端末50a、b、c毎に、各利用者のユーザIDが対応付けられており、さらに、利用者端末50a、b、cにより構成される一のグループ通話は、他のグループ通話と識別するために、トークルームIDが付与される。これによって、特定のメンバーが指定されたトークルームでの会話は、指定外のメンバーには送信されない。
 利用者端末50a、b、cは、グループ通話を違和感なく実現するために音声データのフォーマットを適宜変更する。すなわち、利用者端末50a、b、cのヘッドフォン55a、b、cに内蔵されたマイクによって取得された利用者の音声を、連続的な音声データ、例えば、リニアPCM(Pulse Code Modulation)フォーマットで取得する。一般的に、音声における会話において、発話者である利用者の発話は、いつ終了するかが事前に予想が出来ず、話者がしゃべり続ける限り、音声データは連続的なものになるため、この音声データは、長い連続的なデータとなる。
 次に、利用者端末50a、b、cは、受信したリニアPCMフォーマットの長い連続的なデータを、例えば、10m秒乃至1秒の長さ、最適にはデータサイズと遅延時間のバランスの取れた40m秒毎に断片化し、所定のオーバーヘッド付加した「第1のフォーマット」にコード化した音声パケットを生成する。このパケット生成は、随時行われ、長い連続的なリニアPCMフォーマットデータの全体の受信完了を待つことなく、データの受信と音声パケットの生成が同時進行で行われて良い。ところで、上記の「第1のフォーマット」の変換は、利用者端末50内部の処理で行われてもいいし、リニアPCMフォーマットのまま音声サーバ220にデータを送信し、音声サーバ220の内部で実行されてもよい。例えば、利用者端末がネットワーク通信速度に制限のある4G環境におかれている場合、よりデータ圧縮がされた「第1のフォーマット」による通信のほうが通信効率が良いため、本実施例においては利用者端末50内部で変換処理を行うものとしている。
 この第1のフォーマットは、例えば、サンプリングレートが、16Khz‐44.1khzの、Opusフォーマット(非可逆音声圧縮フォーマット)であってよい。本実施例においては、この第1のフォーマットにオーバーヘッドを付与しており、例えば、(1)発話者を識別するユーザID、(2)音声を届ける相手の相手先ユーザIDやトークルームID、(3)発話の時刻を示すタイムスタンプが格納されている。
 発話した利用者端末50cは、第1のフォーマットの音声データを音声サーバ220に送信し、音声サーバ220は、発話者以外の利用者端末50に対して、この音声データを送信する。逐次受信した利用者端末50a、bは、オーバーヘッドに格納されたタイムスタンプの順に、再び音声にデコードする。これにより、利用者端末50a、bは、互いに発話者の発話を聞き取ることができて、グループ通話を成立させる。
 この第1のフォーマットの断片化は、0.5秒以下、好ましくは30乃至40m秒等の短い時間とすることで、長いリニアPCMの音声データが終了することを待つことなく、実質的なリアルタイム(可能な限り遅延が小さく、実用上リアルタイムと遜色がない)での通話が可能となる。さらに、断片化する時間を短くすることで、1つの音声パケットが受領されなくても音声として聴取者が意味を聞き取り理解するのに大きな問題が生じない。
 各ヘッドフォン55a、b、cと利用者端末50a、b、cを含む本実施例のシステムには、各ヘッドフォン装着者の発話を検知する機能が搭載されており、発話者の音声を強調もしくは選択してコード化する発話検知モードと、ヘッドフォン55a、b、cに設けられたボタン56a、b、cを押した際にのみ、発話者の音声の取得を開始するプッシュ・トゥ・トークモードを切り替えて使用することができる。
 なお、後述するように、音声サーバ220は、第1のフォーマットの音声データをデーモンサーバ200等の所定のサーバから受信した場合には、第1のフォーマットの音声データで、利用者端末50a、b、cに送信してよい。
 外部システム300は、グループ通話と連携する基幹システム、すなわち、ERP(Enterprise Resource Planning)システムであってよく、上述のように、介護システム、作業管理システム等であってよい。
 コマンドサーバ100は、デーモンサーバ200と通信可能に接続されたサーバであって、外部システム300又はAPIサーバ110からの指示に応じて、デーモンサーバ200が受信した音声データを所定のフォーマットに変更するための「フォーマット変更コマンド」を、デーモンサーバ200に送信する。
 デーモンサーバ200は、音声サーバ220及び外部システム300からの音声データの受信を常時受付け、コマンドサーバ100からの「フォーマット変更コマンド」に基づいて、所定のフォーマットに変更し、音声サーバ220又は外部システム300に変更した音声データを送信する。
 図2に示すように、デーモンサーバ200は、所定のプログラムをメモリに記憶し、プロセッサー(CPU等)がメモリに記憶されたプログラムを読み込むことで、常駐受付モジュール201、フォーマット変更モジュール202、音声データ送信モジュール203、キーワード検知モジュール204を実現する。さらに、コマンドサーバ100は、所定のプログラムをメモリに記憶し、プロセッサーが読み込むことで、フォーマット変更コマンド送信モジュール120を実現する。さらに、利用者端末50は、所定のプログラムをメモリに記憶し、これをプロセッサーが読み込むことで、音声ボット表示モジュール51、ボット出力モジュール52、音声データ送信モジュール53を実現する。
 なお、コマンドサーバ100及びデーモンサーバ200の各機能は、1台のコンピュータで実現されてもよいし、クラウドコンピュータのように、複数のコンピュータで実現されてもよいし、コマンドサーバ100とデーモンサーバ200とが其々別のコンピュータにより実現されてもよい。
 [グループ通話への音声出力処理]
 次に、図3に基づいて、音声データを外部システム300からグループ通話に出力(割り込み)する処理について説明する。外部システム300の一例として、介護施設における入居者の状態や行動を管理する介護システムとして適宜説明する。
 ここで、外部システム300は、基幹システム(ERP)から出力する音声データを他のコンピュータに送信する機能を有したり、所定のデータ(テキストデータ等)を音声データに変換する音声変換エンジンを備え、変換された音声データを他のコンピュータに送信する機能を有していてよい。
 最初に、介護システムにおいて、ドアやベッド等に設けられたセンサや入居者自身が装着するセンサが入居者の起床を検知する。センサは、起床を検知したデータを介護システムに送信する(ステップS05)。ここで、介護システムが音声変換エンジンを有する場合、これを起動し、センサが検知したデータを、音声変換エンジンが、例えば、「入居者Aさんが、起床しました」と出力する音声データに変換する。ここで「入居者Aさんが、起床しました」という音声データが予め録音され記憶されており、センサにより検知したデータと、この録音データが予め対応付けられていることで、検知後にこの録音データを選択して音声データとしてもよい。
 このように変換された音声データ又は、選択された録音データ(以下、まとめて音声データとする)を、介護システムが、デーモンサーバ200に送信する(ステップS10)。ここで送信する音声データ又は録音データは、外部システムの使用に沿ったフォーマット、例えば、リニアPCMフォーマットの連続的な長いデータであってよい。デーモンサーバ200の常駐受付モジュール201は、この音声データを受信する。
 なお、デーモンサーバ200は、外部システム300である介護システムから、いつ音声データを受信するか不明であるため、少なくとも常駐受付モジュール201は、常時、起動しており、いわゆるデーモンとしてプログラムがメモリに常駐して音声データの受信を受付ける。この受注受付モジュール201(デーモン)は、音声データの入力に応じて必要なサブシステムを起動することが定義された必要最小限のプログラムであるため、サイズが小さく、音声データの入力がない限り動作することもないので、システム全体の負荷を不必要に増大させることがない。
 ここで、介護システムは、デーモンサーバ200に音声データを送信した際、コマンドサーバ100に、この音声データのフォーマットを所定のフォーマットに変更するよう指示する。ここで、変更を指示する所定のフォーマットは、上述の第1のフォーマットである。
 コマンドサーバ100は、このデーモンサーバ200が受信した音声データを介護システムから指示があった所定のフォーマットである第1のフォーマットに変更する「フォーマット変更コマンド」を、デーモンサーバ200に送信する(ステップS11)。
 ここで、この介護システム(外部システム300)から受信した音声データのオーバーヘッドには、
(1) 発話者を識別するユーザID
ここでは、介護システムのユーザIDであって、ボットIDである。すなわち、外部システム300も一人の仮想的な利用者としてユーザIDが付与された状態で「ボット」としてグループ通話に参加して音声出力を行う。
(2)音声を届ける相手先ユーザID,トークルームID
(3)発話の時刻を示すタイムスタンプ
が格納されており、このオーバーヘッドに基づいて、第1のフォーマットのオーバーヘッドが生成される。音声データを届ける相手先ユーザIDは、タイムスタンプ情報を用いてその時刻における当該「入居者Aさん」を担当する介護士のユーザIDを図示しないシフト管理システムから読み出して設定する。この場合に、介護システムのIDと、当該担当の介護士のIDがトークルームのメンバーとなっており、例えば医師などの医療チームや事務処理チームには音声データは送信されない。
 デーモンサーバ200のフォーマット変更モジュール202は、常駐受付モジュール201からの起動信号に応じてメインメモリに読みだされて起動し、受信した「フォーマット変更コマンド」に基づいて、外部システム300から受信した例えばリニアPCMフォーマットの音声データをグループ会話システムで使用するフォーマットと同じ第1のフォーマット(本実施例においてはOpusフォーマット)に変更する(ステップS12)。
 デーモンサーバ200の音声データ送信モジュール203は、このフォーマットを変更した音声データ(変更後音声データ)を、コマンドサーバ100が指示した利用者端末50a、b、cに出力するために、音声サーバ220に送信する(ステップS13)。
 音声サーバ220は、変更後音声データを受信し、第1のフォーマットに格納されたトークルームIDやユーザIDを参照して、該当するIDが付与された利用者端末50a、b、cに変更後音声データを送信する(ステップS14)。
 ここで、利用者端末50a、b、cの音声ボット表示モジュール51は、介護システムに対応した仮想的な利用者である「ボット」を画面に出力表示し、利用者端末50a、b、cのボット出力モジュール52は、変更後音声データを受信し、ヘッドフォン55a、b、cを介して、この変更後の音声データを介護システムの「ボット」として音声出力する。すなわち、ヘッドフォン55を用いてユーザ同士で多人数会話を行っているところに、外部システムからの音声メッセージが介入するにあたり、ユーザは恰も新たなユーザが会話に参加したかのように、自然にシステムメッセージを受領することができる。しかも、多人数の会話を前提とした本実施例で用いられているOpus形式は、データサイズが小さく、遅延の少ない送受信に適している。これを受信者の利用者端末においてリニアPCMに復号することによって、ボットが発する機械的な音声も、人間同士の継続している会話にシステムメッセージを重畳したとしても、当該会話を阻害することなく、各ユーザにメッセージを伝達可能である。なお、音声ボットの表示及び音声出力の制御は、APIサーバ100が利用者端末50a、b、cのアプリケーション・プログラムと協働して実現してよい。
 ここで、介護システムが発する音声の内容は、人とは異なり、典型的には定型文であるので、外部システム300から音声データを受信することなく、デーモンサーバ200が外部システム300から所定のパケットを受信すると、そのパケットに応じて予め対応付けられている音声データをグループ通話の利用者端末50a、b、cに出力させることも可能である。
 しかし、本実施例では、定型文であったとしても、外部システム300は、一旦、当該外部システム300が採用している通常の音声データとして出力する。そして、受信した音声データを本実施例のデーモンサーバ200が所定の第1のフォーマットに変更している。そうすることで、汎用システムである外部システム300は、元々採用している通常の音声としてデータを出力すればよく(第1のフォーマットを出力するシステムである必要が無い)、本実施例のグループ通話に音声出力するにあたり、殆どカスタマイズすることなく本実施形態の会話システムと接続し、音声メッセージを出力することが可能となる。さらに、デーモンサーバ200を含むシステム側も、追加で接続する外部システム300’を、恰も他の利用者と同じであるかのように新たなユーザIDを付与して通話環境を構築すればよく、システムに大きな負荷をかけることなく新たな外部システム300’を追加してグループ通話に割り込ませることができる。
 この際、新たに追加する外部システム300’に対し、新たな種類の「ボット」を付与しても良いし、複数の外部システム300を統合して一つの「ボット」に会話させても良い。
 なお、デーモンサーバ200は、外部システム300が定期的に出力する音声データを受信する構成であってもよい。この場合、定期的とは、予め設定された時間毎であり、食事、風呂、検診といった入居者や職員(利用者)が一定期間毎や一定時間毎に行う何らかのサービス等に対応するものである。
 この場合であっても、上述したように、デーモンサーバ200が定期的に取得する音声データを、コマンドサーバ100からの「フォーマット変更コマンド」に基づいて、フォーマット変更後の音声データに変更し、このフォーマットが変更された音声データを、音声サーバ220に送信することになる。
 利用者端末50a、b、cは、ヘッドフォン55a、b、cを介して介護システムからの音声データを音声出力する際に、音声ボット表示モジュール51が、グループ通話内の仮想的な利用者として、画面に音声ボットを出力表示し、この音声ボットが発話しているかのように動画制御して、ボット出力モジュール52が、音声データをヘッドフォン55a、b、cを介して音声出力させてもよい。
 [グループ通話から外部システムへの入力]
 次に、図4を用いて、グループ通話を行っている各利用者端末50a、b、cからの発話による音声データを、各サーバを介して、外部システム300にデータとして入力させる処理について説明する。
 利用者の発話(後述する「コマンド宣言キーワード」であってもよい)をヘッドフォン55cのマイクが受信し、利用者端末50cの音声データ送信モジュール53が、リニアPCMフォーマット等の長い音声データを上述の第1のフォーマットに変更し、音声サーバ220に送信する(ステップS30)。
 音声サーバ220は、この音声データを受信し、デーモンサーバ200に送信する(ステップS31)。この際、音声サーバ220は、音声データを発話者以外の利用者端末a、bに送信する。
 次に、ステップS31に応じて、デーモンサーバ200の常駐受付モジュール201は、音声サーバ220から、第1のフォーマットとなった音声データを受信する。ここで、常駐受付モジュール201は、音声サーバ220から、いつ音声データを受信するか不明であるため、常駐受付モジュール201は、常時、起動しており、デーモンとしてプログラムがメモリに常駐して音声データの受信を受付ける。
 一方、コマンドサーバ100は、このデーモンサーバ200が取得した音声データ(第1のフォーマット)のフォーマット(例えば、断片化されていない「リニアPCMフォーマット」のデータ)をデーモンサーバ200に変更させるための「フォーマット変更コマンド」を、デーモンサーバ200に送信する。
 この処理の前提として、発話された利用者端末50cは、音声データを音声サーバ220に送信するタイミングで、利用者端末50cは、この音声データに関するデータをAPIサーバ110に送信する。この音声データに関するデータとは、この音声データが利用される外部システム300のIDや、デーモンサーバ200に変更させるフォーマットの種類を示すデータであってよい。
 APIサーバ110は、この音声データに関するデータを受信し、コマンドサーバ100に、この所定のデータを送信する。コマンドサーバ100は、APIサーバ110から所定のデータを受信し、この所定のデータに基づいて、例えば、第1のフォーマットの音声データを、断片化されていないリニアPCMフォーマットのデータに変更するよう、デーモンサーバ200に「フォーマット変更コマンド」を送信する。
 デーモンサーバ200の常駐受付モジュール201は、コマンドサーバ100から「フォーマット変更コマンド」を受信する(ステップS32)。ここで、常駐受付モジュール201は、コマンドサーバ100から、いつ「フォーマット変更コマンド」を受信するか不明であるため、常駐受付モジュール201は、常時、起動しており、デーモンとしてプログラムがメモリに常駐して「フォーマット変更コマンド」の受信を受付ける。
 デーモンサーバ200のフォーマット変更モジュール202は、コマンドサーバ100から受信した「フォーマット変更コマンド」の指示に基づいて、取得した音声データを、断片化されていないリニアPCMフォーマットのデータに変更する。
 デーモンサーバ200の音声データ送信モジュール203は、フォーマット変更した音声データを、外部システム300に送信する(ステップS33)。外部システム300は、フォーマット変更をした音声データを、例えば、自らが備える音声変換エンジンにより文字認識をしてシステムへのデータ入力としたり、コマンドとして実行することができる。
 例えば、自動車整備工場で用いられる作業管理システムの例では、「ナンバー12-34のSUV、オイル交換入ります」といった作業開始を声出し確認する音声を音声データとして作業管理システムに送信し、この音声データに含まれる「作業者名=ユーザIDに紐づいた担当者名」及び「作業名=音声認識したオイル交換」「作業対象=音声認識したナンバー12-34のSUVと、作業対象リストのマッチング結果」を作業管理システムに入力させるとともに、この「音声データのタイムスタンプ」を「作業開始時刻」として自動的に記録することが可能となる。声出し確認は、様々な作業現場で周囲に作業状況を周知させるために行われているので、その声出し確認で自動的に作業記録を作成することで、作業効率が大幅に向上する。
 また、上述した自動車整備会社の例では、「オイル交換OK」という作業終了の声出し確認の音声データを受信したら、整備会社のシステムの業務日報データに、オイル交換完了のステータスを入力できる。特に作業終了時において、オイル交換作業等で汚れた手を洗浄することなく作業記録を完了し、直ちに次の作業を開始できるので、作業効率の向上効果が大きい。
 このように、利用者端末50cは、リニアPCMフォーマットの音声データを、断片化した第1のフォーマットに変更して、音声サーバ220を介してグループ通話に違和感なく音声を利用者端末50a、bに出力した後に、さらに、デーモンサーバ200がこの第1のフォーマットの音声データをリニアPCMフォーマットの音声データに変更する。ところで、リアルタイムでの音声データ授受が重視される会話と異なり、外部システム300に向けて発信する音声データはシステム動作を制御するコマンド命令や、記録事項であることが多く、リアルタイムであることの重要性は低いことが多い。従って、外部システム300へ出力する音声データのフォーマットは、通話で用いる第1のフォーマットと同じである必要性は低く、外部システム300が元々対応しているフォーマット、本実施例においてはリニアPCMフォーマットで良い。特にコマンド命令の場合、断片化されて送信されるOpusフォーマットよりも、データの始点と終点が明確なデータフォーマットの方が適しており、例えばWAV(WAVEFORM AUDIO FORMAT)であれば好適である。
 したがって、外部システム300は、このグループ通話を実現するシステム特有の第1のフォーマットの音声データを取扱うシステムである必要はなく、標準的なリニアPCMフォーマットの音声データを取り扱うシステムであれば、上記の処理を実現することが可能となる。
 なお、デーモンサーバ200は、音声サーバ220から受信した音声データに含まれる所定のキーワード(予め定められた掛け声や宣言)を検知し、このキーワード以後の音声データを、所定のデータに変更して、外部システム300に送信する構成であってもよい。この処理について、図5に基づいて説明する。
[キーワード検知処理]
 図5は、コマンドサーバ100、デーモンサーバ200が実行するキーワード検知処理のフローチャートを示す図である。下記の処理の前提として、後述する「コマンド宣言キーワード」を検知するためのデータは、予めデーモンサーバ200に記憶されている。
 最初に、上述のステップS31に応じて、デーモンサーバ200の常駐受付モジュール201は、利用者端末50cから、音声サーバ220を介して、音声データを受信する(ステップS50)。
 そして、キーワード検知モジュール204は、受信した音声データに、コマンドを宣言するキーワードが含まれているか否かを判断する(ステップS51)。すなわち、予めデーモンサーバ200に記憶された「コマンド宣言キーワード」を検知するためのデータと、受信した音声データとを比較して判断する。
 コマンド宣言キーワードとは、例えば、所定の掛け声や宣言(「Hei,Siri」、「OK,Google等)といった、利用者ではなく、コンピュータシステムに入力させるためのコマンド指令を開始するための言葉である。なお、SiriやGoogleは各社の商標もしくは登録商標である。
 キーワード検知モジュール204は、取得した音声データを音声認識することにより、この音声データにキーワードが含まれているか否かを判断する。このとき、キーワード検知モジュール204が、音声認識を実行してもよいし、デーモンサーバ200が、音声データを音声認識するAPIに音声データを出力し、このAPIの認識結果を取得し、この認識結果に基づいて、この音声データに「コマンド宣言キーワード」が含まれているか否かを判断してもよい。
 ここで、作業管理システム、スケジュール管理システム等の特定の外部システム300にコマンドを音声で送る場合等のように、「コマンド宣言キーワード」は、必ずしもグループ通話の他の利用者に聞かせる必要がない場合がある。この場合、利用者端末50a、b、cに備える発話検知(発話検知モード)では、発話を開始したタイミングで、その発話が「コマンド宣言キーワード」であるのか、他の利用者へ話しかけたのかが判別できない。判別できないまま音声データを送信してしまうと、他の通常会話と同様、コマンド宣言キーワードと、続くコマンド命令が他のユーザに会話の一部として送信されてしまう。送信後、この発話が他の利用者に聞こえた後で、外部システム300は、当該発話が「コマンド宣言キーワード」であったことを認識することになる。
 そこで、利用者が発話するヘッドフォン55cのボタン56cにより、プッシュ・トゥ・トークモードにおいて、例えば、「コマンド宣言キーワード」をこれから発話することを音声サーバ220やデーモンサーバ200に認識させる動作として、ダブルクリックや長押し等を発話前に実行することで、「コマンド宣言キーワード」及びそれに続くコマンド指令を他の利用者に聞こえないようにフィルタすることができる。また、ダブルクリックによってコマンド入力待ちに変位させることによって、「コマンド宣言キーワード」なしとすることもでき例えばダブルクリック後15秒間程度はグループトークに発信せず、音声認識エンジンにのみ送信するようにしても良い。
 より具体的には、発話者がボタン56cを長く押した場合は、これを検知した利用者端末50cと音声サーバ220は、ボタン56cが押下されている間は、第1のフォーマットのオーバーヘッドに記載する相手先ユーザIDを当該「コマンド宣言キーワード」が指示すべき外部システム300のIDのみに設定することで、コマンド指令を他の利用者に聞こえないようにフィルタリングを実施できる。
 一方、作業現場等で手を操作機器から話してボタン56を押下できない環境等の場合は、発話時に「コマンド宣言キーワード」を検知する発話検知モードにする必要がある。この場合は、発話が「コマンド宣言キーワード」であることを認識した時点で、オーバーヘッドの相手先ユーザIDを所定の外部システム300に設定することで、コマンド宣言キーワード自体は他の利用者に聞こえてしまうが、その後のコマンド指令はフィルタすることができる。このために、本実施例においては、キーワードの検知を、リニアPCMフォーマットから第1のフォーマットへの変換と同時に行っている。前述したように、いつ発話が終わるか予測できない会話において、リニアPCMフォーマットの全体が受信されるのを待つことなく、随時OPUSフォーマットである第1のフォーマットに変換している。この変換とコマンド宣言キーワードの検知を同時に行うことで、リニアPCMフォーマット全体の受信が完了することを待つことなくコマンド宣言キーワードを検知することができるので、速やかに他のユーザをフィルタリングすることができる。特に、コマンド宣言キーワードは、発話の途中で現れることは稀であり、たいていは発話の開始時に宣言されるので、受信開始から速やかに検知を開始し、例えば5秒などの所定時間以上経過して発話が継続するときは、コマンド宣言キーワードの検出精度を低下させて、システムの負荷を低減しても良い。
また、上述した自動車整備会社の例では、「オイル交換、OK」といったように、作業現場では頻出する常用フレーズが用いられることが多い。そこで、そのような常用フレーズを全体としてコマンドとして登録しても良いし、「オイル交換」といった特定の作業項目用語と、「OK」や「開始」といった特定の作業状態用語をそれぞれ辞書登録してコード置換可能に準備しておき、外部システム300としての作業記録システムに置換したコードだけを送信しても良い。このような作業の声出し確認は、周囲の作業者に、自分の作業進捗を知らせる意味もあるため、フィルタリングする必要はない。常用フレーズをコマンド化することによって、音声認識の精度を向上させてシステムの信頼性を向上させるとともに、外部システム300に音声データを送信するよりもデータ通信量を大幅に削減し、システムの負荷を低減することができる。
 図5に戻り、キーワード検知モジュール204は、音声データに「コマンド宣言キーワード」が含まれていないと判断した場合(ステップS51 NO)、本処理を終了する。なお、キーワード検知モジュール204が、「コマンド宣言キーワード」が含まれていないと判断した場合、グループ通話システム1は、上述したステップS32以降の処理を実行する構成であってもよい。
 一方、ステップS51において、キーワード検知モジュール204は、音声データに「コマンド宣言キーワード」が含まれていると判断した場合(ステップS51 YES)、音声データに「コマンド宣言キーワード」が含まれていたことを、コマンドサーバ100に通知する(ステップS52)。
 ここで、この際にコマンド指令を外部システム300が受付ける状態となったことを発話者に認識させるべく、サウンドエフェクト(ビープ音)や音声による返事を、キーワード検知モジュール204が音声サーバ220を介して、発話者の利用者端末50cに音声出力してもよい。
 コマンドサーバ100のフォーマット変更コマンド送信モジュール120は、この通知により、デーモンサーバ200が取得した音声データは、外部システム300に対するデータであると判断する。そして、フォーマット変更コマンド送信モジュール120は、「コマンド宣言キーワード」後に音声出力されたコマンド指令の音声データを、所定のデータに変更する「フォーマット変更コマンド」を、デーモンサーバ200に送信する(ステップS53)。
 ステップS53において、フォーマット変更コマンド送信モジュール120は、このコマンド指令を所定のデータに変更させるために、「フォーマット変更コマンド」をデーモンサーバ200に送信する。この「フォーマット変更コマンド」は、デーモンサーバ200が、コマンド指令の音声データを、所定のデータに変更するためのコマンドである。例えば、デーモンサーバ200が、この音声データを、テキストデータに変更するために必要な処理を実行させるものである。
 デーモンサーバ200のフォーマット変更モジュール202は、取得したフォーマット変更コマンドに基づいて、取得した音声データのうち、キーワード以降の音声データ(コマンド指令の音声データ)を、所定のデータ(例えば、テキストデータ)に変更する(ステップS54)。
 デーモンサーバ200は、このテキストデータを、コマンドサーバ100に送信し(ステップS55)コマンドサーバ1000が、外部システム300にテキストデータを送信する(ステップS56)。このテキストデータを受信した外部システム300は、このテキストデータをコマンド指令として、所定のコマンドを実行したり、所定のデータ入力を行う。
 以上の実施例では、外部システム300は、デーモンサーバ200、コマンドサーバ100に対して一のシステム(例えば、介護システム)で説明したが、複数の外部システム300(例えば、介護システムと作業管理システムの双方)がデーモンサーバ200、コマンドサーバ100に接続され、グループ通話システム1により、グループ通話への割り込みや、外部システム300への入力を実現してもよい。その場合は、外部システム300毎に異なる上述の「ボット」が対応付けられて、利用者端末50は、外部システム300毎に異なる表示態様のボットを出力表示し、音声出力する。この際、ボットは、各外部システム300それぞれに対応付けられた個性のあるボットとしても良いし、複数のシステムを統合して象徴するボットとしても良い。
 これによって、上述した介護システムであれば、予定された入浴時間をスケジュール管理モジュールが通知し、音声で介護士全員に通知しつつ、端末50aを使う担当介護士が「了解」と返事をすることで、管理記録システムに当該介護士を担当者として作業開始を登録し、「入居者Aさん、入浴完了です」の声がけで作業記録を更新しつつ、別の介護士が着替えの介助を行いながら、「爪が伸びていますね」と声がけすることで、更に別の介護士が爪切りの準備を行うとともに管理システムが作業項目として「爪切り」を追加する、といった連携が容易に実現できる。
 (1)複数の端末の各々がAPIサーバ及び音声サーバと接続されてグループ通話を実現するシステムに対して接続される音声入出力システムであって、
 前記APIサーバ及び外部システムと接続され、音声データ以外のデータの処理・制御を行うコマンド手段と、
 前記音声サーバ、前記コマンド手段、前記外部システムに各々接続されたデーモン手段と、
 を備え、
 前記デーモン手段は、
 前記外部システムから受信した音声データを前記コマンド手段の指示に基づいて、所定のフォーマットに変更する変更手段と、
 変更した音声データを、前記コマンド手段が指示した端末に出力するために、前記音声サーバに出力するデーモン出力手段と、
 を備えることを特徴とする音声入出力システム。
 (2)複数の端末の各々が、端末を識別するAPIサーバ及び音声サーバと接続された音声入出力システムであって、
 前記APIサーバ及び外部システムと接続され、音声データ以外のデータの処理・制御を行うコマンド手段と、
 前記音声サーバ、前記コマンド手段、前記外部システムに各々接続されたデーモン手段と、
 を備え、
 前記デーモン手段は、
 前記端末から前記音声サーバを介して受信した音声データを前記コマンド手段の指示に基づいて、所定のデータに変更する変更手段と、
 を備え、
 前記コマンド手段は、
 変更した所定のデータを、前記外部システムに出力するコマンド出力手段と、
 を備えることを特徴とする音声入出力システム。
 (3)前記変更手段は、前記外部システムが定期的に出力する所定の音声データを前記コマンド手段の指示に基づいて、所定のフォーマットに変更する、
 ことを特徴とする(1)に記載の音声入出力システム。
 (4)前記デーモン手段は、
 前記音声データに含まれるキーワードを検知する検知手段と、
 をさらに備え、
 前記変更手段は、検知した前記キーワード以後の音声データを、所定のデータに変更する、
 ことを特徴とする(2)に記載の音声入出力システム。
 上述した手段、機能は、コンピュータ(CPU、情報処理装置、各種端末を含む)が、所定のプログラムを読み込んで、実行することによって実現される。プログラムは、例えば、コンピュータからネットワーク経由で提供される(SaaS:ソフトウェア・アズ・ア・サービス)形態で提供される。また、プログラムは、例えば、コンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体からプログラムを読み取って内部記録装置又は外部記録装置に転送し記録して実行する。また、そのプログラムを、例えば、磁気ディスク、光ディスク、光磁気ディスク等の記録装置(記録媒体)に予め記録しておき、その記録装置から通信回線を介してコンピュータに提供するようにしてもよい。
 以上、本発明の実施形態について説明したが、本発明は上述したこれらの実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
 1 グループ通話システム、10 コンピュータ、50a~c 利用者端末、55a~c ヘッドフォン、100 コマンドサーバ、110 APIサーバ、200 デーモンサーバ、220 音声サーバ、300 外部システム

Claims (5)

  1.  複数の端末でグループ通話を実現するグループ通話システムであって、
     前記端末との音声の送受信を行う音声サーバ又は外部システムからの音声データの受信を常時受付ける常駐受付手段と、
     受付けた前記音声データを、所定のフォーマットに変更するフォーマット変更手段と、
     前記音声サーバから前記音声データを受信した場合は、フォーマットが変更された音声データを、前記外部システムに送信し、
     前記外部システムから前記音声データを受信した場合は、フォーマットが変更された音声データを、前記端末に出力するために、前記音声サーバに送信する送信手段と、を備えるグループ通話システム。
  2.  前記送信手段が、前記外部システムから前記音声データを受信した場合において、
     前記端末は、
      前記グループ通話内に外部システムを示す仮想的な利用者として音声ボットを表示する音声ボット表示手段と、
      前記外部システムからの音声データを、前記音声サーバを介して、前記音声ボットが音声データとして出力するボット出力手段と、を備える請求項1に記載のグループ通話システム。
  3.  前記送信手段が、前記音声サーバから前記音声データを受信した場合において、
     前記端末は、
       前記グループ通話内に外部システムを示す仮想的な利用者として音声ボットを表示する音声ボット表示手段と、
       前記音声ボットに発話された音声データを前記音声サーバに送信する音声データ送信手段と、を備え、
     前記音声データを受信した音声サーバを介して前記音声データを受信し、前記フォーマット変更手段が前記音声データのフォーマット変更を行い、
      前記送信手段は、前記外部システムにフォーマット変更された当該音声データを送信する請求項1に記載のグループ通話システム。
  4.  複数の端末でグループ通話を実現するグループ通話システムが実行する通話方法であって、
     前記端末との音声の送受信を行う音声サーバ又は外部システムからの音声データの受信を常時受付けるステップと、
     受付けた前記音声データを、所定のフォーマットに変更するステップと、
     前記音声サーバから前記音声データを受信した場合は、フォーマットが変更された音声データを、前記外部システムに送信し、
     前記外部システムから前記音声データを受信した場合は、フォーマットが変更された音声データを、前記端末に出力するために、前記音声サーバに送信する送信ステップと、を備えるグループ通話方法。
  5.  複数の端末でグループ通話を実現するグループ通話システムに、
     前記端末との音声の送受信を行う音声サーバ又は外部システムからの音声データの受信を常時受付けるステップ、
     受付けた前記音声データを、所定のフォーマットに変更するステップ、
     前記音声サーバから前記音声データを受信した場合は、フォーマットが変更された音声データを、前記外部システムに送信し、
     前記外部システムから前記音声データを受信した場合は、フォーマットが変更された音声データを、前記端末に出力するために、前記音声サーバに送信する送信ステップ、を実行させるためのプログラム。
PCT/JP2020/030064 2019-08-05 2020-08-05 グループ通話システム、グループ通話方法及びプログラム WO2021025074A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/785,119 US20230254411A1 (en) 2019-08-05 2020-08-05 Group calling system, group calling method, and program
EP20850287.2A EP4027630A4 (en) 2019-08-05 2020-08-05 GROUP CALL SYSTEM, GROUP CALL METHOD, AND PROGRAM
JP2020556994A JP6842227B1 (ja) 2019-08-05 2020-08-05 グループ通話システム、グループ通話方法及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019144053 2019-08-05
JP2019-144053 2019-08-05

Publications (1)

Publication Number Publication Date
WO2021025074A1 true WO2021025074A1 (ja) 2021-02-11

Family

ID=74502971

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/030064 WO2021025074A1 (ja) 2019-08-05 2020-08-05 グループ通話システム、グループ通話方法及びプログラム

Country Status (4)

Country Link
US (1) US20230254411A1 (ja)
EP (1) EP4027630A4 (ja)
JP (2) JP6842227B1 (ja)
WO (1) WO2021025074A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002158782A (ja) * 2000-11-16 2002-05-31 Matsushita Electric Ind Co Ltd 構内交換機を用いた緊急対策システム及び構内交換機の緊急時グループ通話自動設定方法
JP2003298744A (ja) * 2002-03-29 2003-10-17 Canon Inc 通信制御装置、ゲートウェイ装置、情報保持装置、情報配信システム、通信制御方法、プログラム及び記憶媒体
JP2011182407A (ja) 2004-05-10 2011-09-15 Sony Ericsson Mobile Communications Ab Bluetoothのペアリング方法及びデバイス
JP2015002506A (ja) * 2013-06-18 2015-01-05 パナソニック株式会社 セキュリティシステム
JP2017085675A (ja) * 2017-02-21 2017-05-18 アイコム株式会社 中継装置および通信システム
WO2019038807A1 (ja) * 2017-08-21 2019-02-28 リーズンホワイ株式会社 情報処理システム及び情報処理プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10134395B2 (en) * 2013-09-25 2018-11-20 Amazon Technologies, Inc. In-call virtual assistants
US9253330B2 (en) * 2014-02-28 2016-02-02 International Business Machines Corporation Automatically record and reschedule conference calls for playback based upon calendar invitations and presence monitoring
US20150347399A1 (en) * 2014-05-27 2015-12-03 Microsoft Technology Licensing, Llc In-Call Translation
US10176808B1 (en) * 2017-06-20 2019-01-08 Microsoft Technology Licensing, Llc Utilizing spoken cues to influence response rendering for virtual assistants
US20190244613A1 (en) * 2018-02-07 2019-08-08 Net2Phone, Inc. VoIP Cloud-Based Virtual Digital Assistant Using Voice Commands
US11615363B2 (en) * 2021-01-19 2023-03-28 Servicenow, Inc. Digital chat conversation and virtual agent analytics

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002158782A (ja) * 2000-11-16 2002-05-31 Matsushita Electric Ind Co Ltd 構内交換機を用いた緊急対策システム及び構内交換機の緊急時グループ通話自動設定方法
JP2003298744A (ja) * 2002-03-29 2003-10-17 Canon Inc 通信制御装置、ゲートウェイ装置、情報保持装置、情報配信システム、通信制御方法、プログラム及び記憶媒体
JP2011182407A (ja) 2004-05-10 2011-09-15 Sony Ericsson Mobile Communications Ab Bluetoothのペアリング方法及びデバイス
JP2015002506A (ja) * 2013-06-18 2015-01-05 パナソニック株式会社 セキュリティシステム
JP2017085675A (ja) * 2017-02-21 2017-05-18 アイコム株式会社 中継装置および通信システム
WO2019038807A1 (ja) * 2017-08-21 2019-02-28 リーズンホワイ株式会社 情報処理システム及び情報処理プログラム

Also Published As

Publication number Publication date
JP2021101537A (ja) 2021-07-08
US20230254411A1 (en) 2023-08-10
EP4027630A4 (en) 2023-11-01
JP6842227B1 (ja) 2021-03-17
EP4027630A1 (en) 2022-07-13
JPWO2021025074A1 (ja) 2021-09-13

Similar Documents

Publication Publication Date Title
US9571638B1 (en) Segment-based queueing for audio captioning
KR102268327B1 (ko) 비동기식 멀티모드 메시징 시스템 및 방법
US8977548B2 (en) Speech recognition system and method using group call statistics
JP6402748B2 (ja) 音声対話装置および発話制御方法
KR20190107106A (ko) 공유된 음성 작동 디바이스상의 호출 핸들링
KR20190075800A (ko) 지능형 개인 보조 인터페이스 시스템
US20020077831A1 (en) Data input/output method and system without being notified
JP6073649B2 (ja) 音声自動認識・音声変換システム
CN111263962A (zh) 信息处理设备和信息处理方法
US20160366528A1 (en) Communication system, audio server, and method for operating a communication system
WO2015083741A1 (ja) 中継装置、表示装置および通信システム
US20210183363A1 (en) Method for operating a hearing system and hearing system
WO2013071738A1 (zh) 一种个人专用生活协助装置和方法
JP5251588B2 (ja) 携帯電話端末装置及び通話伝達の判断方法
US11315574B2 (en) Mobile device, system and method for task management based on voice intercom function
JP2017204130A (ja) 問合せ対応支援装置、システム、方法及びプログラム
WO2021025074A1 (ja) グループ通話システム、グループ通話方法及びプログラム
KR20150088532A (ko) 통화 중 서비스 제공 장치 및 이를 이용하는 방법
JP6462291B2 (ja) 通訳サービスシステム及び通訳サービス方法
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
CN113808592A (zh) 通话录音的转写方法及装置、电子设备和存储介质
JP2021177598A (ja) 音声処理システム、音声処理方法、及び音声処理プログラム
JP7351642B2 (ja) 音声処理システム、会議システム、音声処理方法、及び音声処理プログラム
KR102142338B1 (ko) 인공지능 통신 장치 및 그 동작 방법
JP2021173880A (ja) 情報処理装置、プログラム、および情報処理方法

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2020556994

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20850287

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020850287

Country of ref document: EP

Effective date: 20220307