JP2021018664A - 情報処理システム、情報処理方法、及びプログラム - Google Patents

情報処理システム、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2021018664A
JP2021018664A JP2019134713A JP2019134713A JP2021018664A JP 2021018664 A JP2021018664 A JP 2021018664A JP 2019134713 A JP2019134713 A JP 2019134713A JP 2019134713 A JP2019134713 A JP 2019134713A JP 2021018664 A JP2021018664 A JP 2021018664A
Authority
JP
Japan
Prior art keywords
information
user
response content
speaker device
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019134713A
Other languages
English (en)
Other versions
JP7258686B2 (ja
Inventor
尚史 福江
Naofumi Fukue
尚史 福江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIS Inc
Original Assignee
TIS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIS Inc filed Critical TIS Inc
Priority to JP2019134713A priority Critical patent/JP7258686B2/ja
Publication of JP2021018664A publication Critical patent/JP2021018664A/ja
Application granted granted Critical
Publication of JP7258686B2 publication Critical patent/JP7258686B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】スピーカからユーザに対して能動的に音声出力させることができないため、会議などを円滑に進行させるには不十分である。【解決手段】マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得する取得部と、前記取得部で取得された前記ユーザ情報に基づいて、所定の応答内容を特定する応答内容特定部と、前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、前記応答内容特定部で特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信する送信部と、を備える。【選択図】図2

Description

本発明は、情報処理システム、情報処理方法、及びプログラムに関する。
画像センサで検知された画像情報に基づいてスピーカに音声出力させるか否かを決定する決定装置が開示されている(特許文献1)。
特開2019−35897号公報
特許文献1には、ユーザの居住内に設けられたスピーカにおける音声出力のタイミングを画像情報に基づいて決定する決定装置が開示されている。また、特許文献1に記載の決定装置は、音声情報が途切れたタイミングにおいてスピーカに音声出力させる。特許文献1の決定装置によれば居住内の状況に応じてスピーカに音声出力させることができる。しかしながら、特許文献1に記載の決定装置では、スピーカからユーザに対して能動的に音声出力させることができないため、会議などを円滑に進行させるには不十分であるという問題があった。
本発明の目的は、上記のような問題に鑑みてなされたものであり、スピーカを使用するユーザのユーザ情報に基づいて能動的に音声出力するシステムを提供することにある。
本発明の一態様に係る情報処理システムは、マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得するユーザ情報取得部と、前記ユーザ情報取得部で取得された前記ユーザ情報に基づいて、所定の応答内容を特定する応答内容特定部と、前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、前記特定部で特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信する送信部と、を備える。
本発明の一態様に係る情報処置方法は、コンピュータが、マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得するユーザ情報取得ステップと、前記ユーザ情報取得ステップで取得された前記ユーザ情報に基づいて、所定の応答内容を特定する応答内容特定ステップと、前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、前記応答内容特定ステップで特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信する送信ステップと、を実現する。
本発明の一態様に係るプログラムは、コンピュータに、マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得させることと、前記ユーザ情報に基づいて、所定の応答内容を特定させることと、前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信させることと、を実現させる。
本発明によれば、ユーザ情報に基づき能動的にユーザに対して音声出力することで、ユーザの発言を促すことができる。
音声通知システムの構成の一例を示す図である。 音声通知システムにおける処理の概要を示す図である。 応答サーバ装置の機能構成の一例を示す図である。 スピーカ情報テーブルの一例を示す図である。 ユーザ情報テーブルの一例を示す図である。 議事録情報テーブルの一例を示す図である。 画像情報テーブルの一例を示す図である。 応答内容テーブルの一例を示す図である。 ユーザ情報を取得する方法の一例を示す図である。 ユーザ情報を取得する方法の他の例を示す図である。 スピーカ装置の機能構成の一例を示す図である。 ユーザ端末装置の機能構成の一例を示す図である。 応答サーバ装置の処理の一例を示すフロー図である。 コンピュータのハードウェア構成の一例を示す図である。 応答サーバ装置の処理の他の例を示すフロー図である。
以下に、本発明の一実施形態における音声通知システム1について、図面を参照して詳細に説明する。ただし、以下に説明する実施形態は、あくまでも例示であり、以下に明示しない種々の変形や技術の適用を排除する意図はない。即ち、本発明は、その趣旨を逸脱しない範囲で種々変形し、又は各実施例を組み合わせる等して実施することができる。また、以下の図面の記載において、同一または類似の部分には同一または類似の符号を付して表している。
==構成==
図1は、音声通知システム1の構成の一例を示す図である。図1に示すように、音声通知システム1は、例えば、応答サーバ装置10、スピーカ装置20、ユーザ端末装置30を含む。なお、応答サーバ装置10とスピーカ装置20の機能を一のシステムで実現してもよい。また、応答サーバ装置10とスピーカ装置20のそれぞれの機能を、他の複数の装置で実現してもよい。以下、音声通知システム1の各構成要素について説明する。
応答サーバ装置10は、スピーカ装置20に所定の音声情報を送信することで、ユーザに対してスピーカ装置20から能動的に発話させる装置である。応答サーバ装置10は、例えばサーバコンピュータなどの情報処理装置で構成され、ネットワーク200を介して、スピーカ装置20、ユーザ端末装置30と接続される。応答サーバ装置10と他の装置との間の各種データの送受信については後述する。
なお、音声通知システム1には音声認識サーバ装置(不図示)が含まれていてもよい。この場合、応答サーバ装置10は、音声認識サーバ装置において様々な従来技術を用いてユーザの音声を認識して、ユーザの音声を解析して所定の応答を実行する際の、バックエンドとして機能する。すなわち、後述するスピーカ装置20は、応答サーバ装置10が提供する機能をAPI(Application Programming Interface)で呼び出すことで、応答サーバ装置10の機能を利用してもよい。以下では音声認識サーバ装置の有する機能については適宜省略して説明する。
スピーカ装置20は、ユーザからの音声を取得し、該音声を音声情報に変換して応答サーバ装置10に送信する装置である。また、スピーカ装置20から取得した音声情報に基づき発話する。スピーカ装置20は所謂スマートスピーカである。ここで、以下説明の理解を助けるために、スピーカ装置20のハードウェア構成の一例について説明する。スピーカ装置20は、例えば、音声を検出して電気信号に変換するマイクロフォン、応答サーバ装置10から取得する音声情報を音声出力するスピーカ、外部の装置と通信するための通信モジュール、視覚的にスピーカ装置20のステータスを示す表示部、各種操作指示を行うための操作ボタン、サポートオペレータと通信するためのサポートボタン、各構成要素を制御する制御部を備える。なお、サポートボタンの機能については後述する。スピーカ装置20については、様々の種類のものが存在し、例えば、複数マイクロフォン及び複数スピーカを有するものや、上面の外周部に等間隔にマイクロフォンを配設したものや、側面の外周部に等間隔にスピーカを配設したものなどが存在し、その仕様が限定されるものではない。
ユーザ端末装置30は、ユーザの端末装置であり例えばスマートフォンである。ユーザ端末装置30は、ネットワーク200を介して応答サーバ装置10に接続され、応答サーバ装置10から送信される各種情報を、図13に示す表示装置107に表示する。ユーザは、ユーザ端末装置30を用いて応答サーバ装置10に各種要求を行う。なお、ユーザ端末装置30は近距離無線通信にてスピーカ装置20に接続されてもよい。
==音声通知システム1の概要==
図2は、音声通知システム1における処理の概要を示す図である。図2を参照して、音声通知システム1の動作の概要を説明する。
まず、S1において、スピーカ装置20は、スピーカ装置20を識別するためのスピーカ情報を応答サーバ装置10に送信する。これにより応答サーバ装置10においてスピーカ装置20の設置場所や機能などを把握できる。
次に、S2において、ユーザ端末装置30は、スピーカ装置20を介してまたは応答サーバ装置10に直接、ユーザ端末装置30を識別するためのユーザ情報を送信する。これにより応答サーバにおいてユーザ端末装置30がどのスピーカ装置20と関連付けられているかを特定される。
次に、S3において、応答サーバ装置10は、スピーカ情報とユーザ情報とに基づいて、所定の条件で特定された音声情報をスピーカ装置20に送信する。これにより、スピーカ装置20は、ユーザがスピーカ装置20に対して発話する前に、ユーザにとって適切なタイミングで適切な内容の音声を、スピーカ装置20からユーザに対して発話する。スピーカ装置20から出力される音声の内容やタイミングなどについては後述する。
次に、S4において、応答サーバ装置10はスピーカ装置20を介してユーザの音声を音声情報として取得し、該音声情報に基づき特定された音声情報をスピーカ装置20に送信する。これによりユーザにはスピーカ装置20を介して音声にて様々な情報が提供される。提供される情報については後述する。
==音声通知システム1の構成==
以下、応答サーバ装置10、スピーカ装置20、ユーザ端末装置30が備える機能について説明する。なお、以下説明においては、理解を容易にするために、一例として、予約管理システム(不図示)にて予約済の会議において、ユーザが所定の会議室に設置されたスピーカ装置20の使用を想定する。
<<応答サーバ装置10>>
図3を参照して、応答サーバ装置10の機能構成について説明する。図3は、応答サーバ装置10の機能構成の一例を示す図である。図3に示すとおり、応答サーバ装置10は、記憶部11、スピーカ情報取得部12a、ユーザ情報取得部12b、予約情報取得部12c、認識部13、議事録特定部14、画像特定部15、応答内容特定部16、分析部17、送信部18の機能を有する。応答サーバ装置10が有する機能は、図13に示すプロセッサ101が、記憶装置103に記憶されたコンピュータプログラムを読み込み、実行し、応答サーバ装置10の各構成を制御すること等により実現される。
記憶部11は、例えば、スピーカ情報テーブル11a、ユーザ情報テーブル11b、議事録情報テーブル11c、画像情報テーブル11d、応答内容テーブル11eを有する。各テーブルは一例を示すものであり、その内容が特に限定されるものではない。
スピーカ情報テーブル11aは、スピーカ情報を格納したテーブルである。図4に示すように、スピーカ情報テーブル11aのデータ構造は、例えばスピーカIDなどの適宜な項目を主キーとして、設置場所、仕様などのデータから成るレコードの集合体である。ここで、スピーカIDとはスピーカを識別する識別符号である。識別符号はユニークな番号であればよい。設置場所とは該スピーカ装置20が設置されている場所であり例えば会議室番号などである。仕様とは該スピーカ装置20の機能仕様である。スピーカ情報テーブル11aの内容は例えば応答サーバ装置10の管理者により適宜更新される。応答サーバ装置10はスピーカ情報テーブル11aを参照することでスピーカ装置20を特定できる。
ユーザ情報テーブル11bは、ユーザ情報を格納したテーブルである。図5に示すように、ユーザ情報テーブル11bのデータ構造は、例えばユーザIDなどの適宜な項目を主キーとして、氏名、役職などのデータから成るレコードの集合体である。ここで、ユーザIDとはユーザを識別する識別符号であり、例えば、ユニークな任意の番号、携帯番号、MAC(Media Access Control)アドレス、BD(Bluetooth(登録商標) Device)アドレスなどである。氏名とはユーザの氏名を示す。役職とはユーザの役職を示す。ユーザ情報テーブル11bの内容は例えば応答サーバ装置10の管理者により適宜更新される。応答サーバ装置10はユーザ情報テーブル11bを参照することでスピーカ装置20を使用するユーザを特定できる。
議事録情報テーブル11cは、過去の議事録を示す議事録情報を格納したテーブルである。図6に示すように、議事録情報テーブル11cのデータ構造は、例えば議事録IDなどの適宜な項目を主キーとして、議事録内容、会議IDなどのデータから成るレコードの集合体である。ここで、議事録IDとは議事録を識別する識別符号である。議事録内容とは過去の会議における議事録の内容を記録したデータである。会議IDは該議事録に対応する会議を識別する識別符号である。議事録情報テーブル11cの内容は会議終了時に自動的に更新される。応答サーバ装置10は議事録情報テーブル11cを参照することで会議に対応する過去の会議における議事録をユーザに提示することができるため、円滑な会議運営を実現できる。
画像情報テーブル11dは、例えば円滑な会議運営に要する画像を格納したテーブルである。図7に示すように、画像情報テーブル11dのデータ構造は、例えば画像IDなどの適宜な項目を主キーとして、画像(動画含む)などのデータから成るレコードの集合体である。ここで、画像とは静止画像または動画像などである。画像には会議で使用されるプレゼンテーション資料などが含まれていてもよい。画像情報テーブル11dの内容は例えば応答サーバ装置10の管理者により適宜更新される。応答サーバ装置10は画像情報テーブル11dを参照することで会議に対応する画像をユーザに提示することができるため、円滑な会議運営を実現できる。
応答内容テーブル11eは、例えばユーザ情報や音声情報に対応する応答内容を格納したテーブルである。図8に示すように、応答内容テーブル11eのデータ構造は、例えば応答内容IDなどの適宜な項目を主キーとして、スピーカID、ユーザID、画像ID、議事録ID、キーワード、応答内容などのデータから成るレコードの集合体である。具体的には、応答内容IDには画像IDや議事録IDなど関連付けられている。例えば、応答サーバ装置10は、所定の会議において使用されるスピーカ装置20のスピーカID、会議室で特定されたユーザ端末装置30のユーザIDなどを特定し、それに対応する応答内容IDを特定する。これにより応答内容IDに対応する応答内容を特定する。ここで、応答内容とは、会議、音声情報、ユーザ情報に対応する単文または複文である。応答内容には、音声、画像、議事録などが示され、スピーカ装置20に送信する応答内容が示される。また、キーワードとは、音声情報を変換したテキスト情報における単語などである。応答サーバ装置10は、キーワードに基づいて応答内容を特定することもできる。応答内容テーブル11eの内容は例えば応答サーバ装置10の管理者により適宜更新される。応答サーバ装置10は、応答内容テーブル11eを参照することで、会議またはユーザに対応する音声をスピーカ装置20から出力させることができ、円滑な会議運営を実現できる。
スピーカ情報取得部12aは、スピーカ装置20から送信されたスピーカ情報を取得する。取得されたスピーカ情報はスピーカ情報テーブル11aに格納される。
ユーザ情報取得部12bは、所定のスピーカ装置20を使用するユーザ端末装置30から送信されたユーザ情報を取得する。ユーザ情報には例えばユーザが使用するスピーカ装置20のスピーカ情報が関連付けられている。ここで、ユーザ情報取得部12bは、ユーザ情報を、ユーザ端末装置30から直接に取得してもよいし、スピーカ装置20を介して取得してもよい。
具体的には、図9Aに示すように、応答サーバ装置10がユーザ端末装置30から直接、ユーザ情報を取得する場合、例えば、会議室に掲示されるQRコード(登録商標)または表示装置300に表示されるQRコードをユーザ端末装置30の読取機能で読み取ることで、ユーザ情報に該QRコードに含まれるスピーカ情報が付加され、該ユーザ情報が応答サーバ装置10に送信される。
また、図9Bに示すように、応答サーバ装置10がスピーカ装置20を介してユーザ情報を取得する場合、例えば、ユーザ端末装置30はユーザ情報として自己のMACアドレスまたはBDアドレスをスピーカ装置20に送信することで、ユーザ情報とスピーカ情報とが関連付けられ、それらの情報が応答サーバ装置10に送信される。
予約情報取得部12cは、予約管理システム(不図示)から、会議室の予約状況を示す予約情報を取得する。予約情報には、例えば、日時、利用者、会議室、利用目的に関する情報が含まれる。これにより、応答サーバ装置10は、例えば、いつ、どのユーザが、どの会議室を、どのような目的で使用するかを特定できる。
認識部13は、ユーザ情報取得部12bで取得されたユーザ情報に基づき、スピーカ情報テーブル11aを参照して、ユーザ端末装置30とユーザが使用するスピーカ装置20とを関連付けて認識する。これにより、応答サーバ装置10は、どのユーザがどこの会議室でどのスピーカを使用する状況であるかを特定できる。ここで、応答サーバ装置10は、認識部13で認識されたユーザ情報に対応するユーザにつき、スピーカ装置20に接続された表示装置300に出力してもよい。これにより会議における参加者の出席状況を把握できる。
議事録特定部14は、後述する応答内容特定部16で議事録を使用すると特定された場合、応答内容特定部の応答内容に応じて、議事録情報テーブル11cを参照して、過去の会議で作成された所定の議事録を特定する。議事録特定部14は、送信部18を介して特定された所定の議事録をスピーカ装置20に接続された表示装置300に出力してもよい。これにより、ユーザは表示装置300に出力された以前の会議の議事録を確認できるため会議を円滑に進行できる。
画像特定部15は、後述する応答内容特定部16で画像を使用すると特定された場合、応答内容特定部の応答内容に応じて、画像情報テーブル11dを参照して、所定の画像を特定する。画像特定部15は、送信部18を介して特定された所定の画像をスピーカ装置20に接続された表示装置300に出力してもよい。これにより会議における議論を円滑に進行できる。
応答内容特定部16は、応答内容テーブル11eを参照して、スピーカ情報と関連付くユーザ情報に基づいて、応答内容を特定する。具体的に述べると、ユーザ情報に基づいて会議室に存在するユーザを特定し、該ユーザに対する適当な応答内容を特定する。例えば、予約情報に基づき特定される会議に参加する予定のユーザが、会議室に入室した際に、ユーザ情報取得部12bで取得されるユーザ情報に基づいて、応答内容テーブル11eを参照して、例えば該ユーザの名前を確認する応答内容を特定する。特定された応答内容に基づき生成される音声情報を、送信部18を介してスピーカ装置20に送信する。これによりスピーカ装置20を介して能動的にユーザに向けて音声を出力できる。
応答内容特定部16は、その後、例えば取得されたユーザ情報と予約情報とに基づいて、会議に参加予定のユーザが揃ったことが特定された時点で、応答内容テーブル11eを参照して、参加者の氏名を確認する応答内容を特定する。さらに、例えば会議の終了時間が迫っていることが特定された時点で、応答内容テーブル11eを参照して、会議室の利用時間を延長するか否かを問い合わせる応答内容を特定する。特定された応答内容に基づき生成される音声情報をスピーカ装置20に送信する。
また、応答内容特定部16は、特定された応答内容に基づいて、過去の議事録を示す議事録情報または会議に対応する画像を使用するか否かを判定する。
分析部17は、会議においてユーザが発言した音声に関する音声情報を分析する。具体的に述べると、例えば、分析部17は音声情報に基づいて会議の参加者が使用した感情を分析する。分析部17は、例えば感情を示すタグ付きコーパスに基づいて、分類器を学習させる。分析部17は、ユーザの音声情報をテキスト情報に変換し、例えば所定の自然言語解析手法を用いて単語(形態素)に分解する。該単語を分類器に入力することで音声情報に含まれる感情が分析される。
分析部17は、例えば感情を分析した結果に基づいて会議に点数を付与する機能を有していてもよい。例えば、会議全体につきプラスの感情、例えば「喜び」「楽しみ」「期待」などの感情の割合が相対的に多い場合は点数を高く評価し、例えば「嫌悪」「絶望」「落胆」などの感情の割合が相対的に多い場合は点数を低く評価する。評価した結果を示す情報をスピーカ装置20に送信するよう、処理を実行させる。これにより会議の内容を改善する動機をユーザに与える。すなわち応答サーバ装置10はスピーカ装置20を介して会議に能動的に参加し、会議の効率化を図ることができる。
また、分析部17は、例えば感情を分析した結果に基づいて会議の雰囲気に適当な音楽を出力する。例えば、会議全体につきマイナスの感情、例えば「嫌悪」「絶望」「落胆」などの感情の割合が相対的に多い場合は心が明るくなるようなジャズ音楽に関する情報をスピーカ装置20に送信し、例えば「怒り」などの感情の割合が相対的に多い場合は心が落ち着くようなクラシック音楽に関する情報をスピーカ装置20に送信するよう、処理を実行させる。これにより会議の内容を改善する動機をユーザに与える。すなわち応答サーバ装置10はスピーカ装置20を介して会議の雰囲気を能動的に改善するよう機能し、会議の効率化を図ることができる。
また、分析部17は、例えば、ユーザ情報テーブル11bを参照して、ユーザの音声情報を分析することで、役職の高いユーザの発言が相対的に多いと分析された場合、前述の応答内容特定部16において、役職の高いユーザの発言を控える応答内容を特定し、該応答内容に基づき生成される音声情報をスピーカ装置20に送信するよう、処理を実行させる。これにより会議を活発化し多様な意見を抽出できる。
送信部18は、音声情報など各種情報をスピーカ装置20に送信する。
<<スピーカ装置20>>
次に、図10を参照して、スピーカ装置20の機能構成について説明する。図10は、スピーカ装置20の機能構成の一例を示す図である。図10に示すとおり、スピーカ装置20は、送受信部21、表示制御部22、およびサポート部23の機能を有する。スピーカ装置20が有する機能は、図13に示す、スピーカ装置20の制御部(プロセッサ101)が、記憶装置103に記憶されたコンピュータプログラムを読み込み、実行し、スピーカ装置20の各構成を制御すること等により実現される。
送受信部21は、スピーカ装置20におけるデータの送受信を制御する。例えば、送受信部21は、上述したマイクロフォンに入力された音声に関する音声情報を応答サーバ装置10などの外部装置に送信する。また、送受信部21は、応答サーバ装置10などの外部装置からの各種情報を受信する。
表示制御部22は、スピーカ装置20が備える、またはスピーカ装置20に接続された表示装置107(表示装置300)の表示を制御する。例えば、表示制御部22は、管理者の設定操作に必要な各種の画面(ユーザインタフェース)を生成し、表示装置107へ表示することを制御する。
サポート部23は、上述したサポートボタンが押下されたことを契機に、スピーカ装置20に不具合が生じたことを示すサポート情報を生成する。サポート部23は、送受信部21を介してサポート情報をサポートセンター(不図示)に送信する。これにより、スピーカ装置20に不具合が生じた場合、管理者が迅速に障害対応できる。
<<ユーザ端末装置30>>
次に、図11を参照して、ユーザ端末装置30の機能構成について説明する。図11は、ユーザ端末装置30の機能構成の一例を示す図である。図11に示すとおり、ユーザ端末装置30は、入力部31、送受信部32、および表示制御部33の機能を有する。ユーザ端末装置30が有する機能は、図13に示す、ユーザ端末装置30の制御部(プロセッサ101)が、記憶装置103に記憶されたコンピュータプログラムを読み込み、実行し、ユーザ端末装置30の各構成を制御すること等により実現される。
入力部31は、ユーザによるユーザ端末装置30に対する操作に応じて各種の情報を受け付ける。例えば、入力部31は、ユーザによる操作に応じて、応答サーバ装置10にアクセスするための入力を受け付ける。
送受信部32は、ユーザ端末装置30におけるデータの送受信を制御する。例えば、送受信部32は、入力部31により入力された情報を応答サーバ装置10などの外部装置に送信する。また、送受信部32は、応答サーバ装置10などの外部装置からの通知や各種情報を受信する。
表示制御部33は、ユーザ端末装置30が備える、またはユーザ端末装置30に接続された表示装置107の表示を制御する。例えば、表示制御部33は、管理者の各種操作に必要な各種の画面(ユーザインタフェース)を生成し、表示装置107へ表示することを制御する。
==動作フロー==
図12は、応答サーバ装置10の処理の一例を示すフロー図である。図12を参照して、応答サーバ装置10により実行される処理の一例を説明する。
まず、S100において、応答サーバ装置10はスピーカ装置20からスピーカ情報を取得する。
次に、S101において、応答サーバ装置10はユーザ端末装置30またはスピーカ装置20からユーザ情報を取得する。これにより応答サーバ装置10はユーザがいずれの会議室にいるか認識できる。
次に、S102において、応答サーバ装置10はユーザ情報に基づき予約管理システムから予約情報を取得する。これにより応答サーバ装置10はユーザが存在する会議室の予約状況を認識できる。
次に、S103において、応答サーバ装置10は、予約情報に基づいて、会議目的に応じた応答内容を特定する。特定された応答内容に基づき、議事録情報テーブル11cまたは画像情報テーブル11dを参照して、会議目的に応じた議事録情報または画像情報を特定する。
次に、S104において、応答サーバ装置10は、応答内容テーブル11eを参照して、ユーザ情報に基づく応答内容を特定する。
次に、S105において、応答サーバ装置10は、特定された応答内容に関する音声情報をスピーカ装置20に送信する。例えば、スピーカ装置20を介して、会議の冒頭に参加者の氏名を読み上げて出席確認をすることや、会議の目的を音声通知することなどを実行する。これによりスピーカ装置20からユーザに対して能動的に発話するため、会議を円滑に進行できる。
次に、S106において、応答サーバ装置10は、議事録情報と画像情報とをスピーカ装置20に送信する。スピーカ装置20は取得した議事録情報と画像情報を表示装置300に出力する。例えば、スピーカ装置20を介して表示装置300に前回の議事録を表示し、会議の目的に応じた写真やグラフなどを表示する。これにより応答サーバ装置10は会議を円滑に進行するために過去の議事録と会議に要する画像をユーザに提供できる。
次に、S107において、応答サーバ装置10は会議が終了したか否かを判定する。具体的に述べると、応答サーバ装置10は所定の時間になると会議が終了されたか否かを問いかける音声情報をスピーカ装置20に送信する。例えば、スピーカ装置20から「会議時間が終了します。延長しますか?」という音声を出力する。スピーカ装置20から出力された音声に応じてユーザからの応答を示す音声情報を、スピーカ装置20を介して取得する。例えば、スピーカ装置20を介して、ユーザから「30分延長してください」という音声情報を取得すると、応答サーバ装置10は送信部18を介して予約管理システムに対して会議室の予約時間を30分延長する延長情報を送信する。その後、応答サーバ装置10は、ユーザの音声情報に基づいて、応答内容テーブル11eを参照して、会議が終了したか否かを判定する。
会議が終了したと判定した場合(S107:NO)、S104から処理を繰り返す。これによりユーザの音声情報に応じた応答内容を特定する。
会議が終了したと判定した場合(S107:YES)、会議内容を分析する(S108)。分析結果をスピーカ装置20に送信する。これによりユーザそれぞれが会議において改善すべき点を把握できる。例えば、「本日の会議は70点です」や「B部長話しすぎです」という音声を出力する。
==音声通知システム1のハードウェア構成==
図13を参照して、応答サーバ装置10、スピーカ装置20およびユーザ端末装置30をコンピュータ100により実現する場合のハードウェア構成の一例を説明する。なお、それぞれの装置の機能は、複数台の装置に分けて実現することもできる。また、スピーカ装置20における一部のハードウェア構成については上述したとおりである。
図13は、コンピュータのハードウェア構成の一例を示す図である。図13に示すように、コンピュータ100は、プロセッサ101と、メモリ102と、記憶装置103と、入力I/F部104と、データI/F部105と、通信I/F部106、及び表示装置107を含む。
プロセッサ101は、メモリ102に記憶されているプログラムを実行することによりコンピュータ100における各種の処理を制御する制御部である。
メモリ102は、例えばRAM(Random Access Memory)等の記憶媒体である。メモリ102は、プロセッサ101によって実行されるプログラムのプログラムコードや、プログラムの実行時に必要となるデータを一時的に記憶する。
記憶装置103は、例えばハードディスクドライブ(HDD)やフラッシュメモリ等の不揮発性の記憶媒体である。記憶装置103は、オペレーティングシステムや、上記各構成を実現するための各種プログラムを記憶する。
入力I/F部104は、ユーザからの入力を受け付けるためのデバイスである。入力I/F部104の具体例としては、キーボードやマウス、タッチパネル、各種センサ、ウェアラブル・デバイス等が挙げられる。入力I/F部104は、例えばUSB(Universal Serial Bus)等のインタフェースを介してコンピュータ100に接続されても良い。
データI/F部105は、コンピュータ100の外部からデータを入力するためのデバイスである。データI/F部105の具体例としては、各種記憶媒体に記憶されているデータを読み取るためのドライブ装置等がある。データI/F部105は、コンピュータ100の外部に設けられることも考えられる。その場合、データI/F部105は、例えばUSB等のインタフェースを介してコンピュータ100へと接続される。
通信I/F部106は、コンピュータ100の外部の装置と有線又は無線により、インターネットNを介したデータ通信を行うためのデバイスである。通信I/F部106は、コンピュータ100の外部に設けられることも考えられる。その場合、通信I/F部106は、例えばUSB等のインタフェースを介してコンピュータ100に接続される。
表示装置107は、各種情報を表示するためのデバイスである。表示装置107の具体例としては、例えば液晶ディスプレイや有機EL(Electro−Luminescence)ディスプレイ、ウェアラブル・デバイスのディスプレイ等が挙げられる。表示装置107は、コンピュータ100の外部に設けられても良い。その場合、表示装置107は、例えばディスプレイケーブル等を介してコンピュータ100に接続される。また、入力I/F部104としてタッチパネルが採用される場合には、表示装置107は、入力I/F部104と一体化して構成することが可能である。
==他の実施形態==
応答内容特定部16は、例えば会議室の予約管理を行ってもよい。例えば、応答内容特定部16は、予約情報に基づいて、応答内容テーブル11eを参照して、スピーカ装置20を介して会議室にユーザがいるか否かを問いかける応答内容を特定する。これにつき、図14を参照して具体的に述べると、まず、応答サーバ装置10は予約管理システムから予約情報を取得する(S200)。次に、応答サーバ装置10は、現時点において会議室が予約されているか否かを判定する(S201)。会議室が予約されていると判定した場合(S201:YES)、スピーカ装置20から音声情報を取得することで、会議室に人がいるか否かを判定する(S202)。会議室に人がいると判定した場合(S202:YES)、応答内容特定部16は、予約情報に基づいて、応答内容テーブル11eを参照して、会議室を予約した人の氏名を問いかける応答内容(「あなたは誰ですか?」など)を特定し、送信部18を介して該応答内容に関する音声情報をスピーカ装置20に送信する(S203)。一方、会議室に人がいないと判定した場合(S202:NO)、応答内容特定部16は誰かがいるかを問いかける応答内容(「誰かいますか?」など)を特定し、送信部18を介して該応答内容に関する音声情報をスピーカ装置20に送信する。ここで、スピーカ装置20からの問いかけに対して返答がなかった場合、予約管理システムの予約をキャンセルする(S204)。また、会議室が予約されていない場合(S201:NO)、スピーカ装置20から音声情報を取得することで、会議室に人がいるか否かを判定する(S205)。会議室に人がいると判定した場合(S205:YES)、応答内容特定部16は予約するか否かを問いかける応答内容(「予約しますか?」など)を特定し、送信部18を介して該応答内容に関する音声情報をスピーカ装置20に送信する(S206)。これにより応答サーバ装置10は会議室の予約状況に対して能動的に機能するため、会議室の有効活用を図ることができる。
応答サーバ装置10は、プレゼン特定実行部(不図示)の機能をさらに有していてもよい。プレゼン特定実行部は、例えばクラウド上で公開されているプレゼン資料データベース(不図示)を参照し、ユーザ情報に基づき応答内容特定部16で特定された応答内容に基づいて、プレゼン資料を特定する。例えば、応答内容における所定のキーワードを特定し、該キーワードに関するプレゼン資料を特定する。プレゼン特定実行部は、送信部18を介して、特定されたプレゼン資料に関する情報をスピーカ装置20に送信するとともに、プレゼン資料に記載されているテキスト情報を音声情報に変換し、該音声情報をスピーカ装置20に送信する。これにより応答サーバ装置10はスピーカ装置20を介してユーザに対して能動的にプレゼン資料を提供するとともに、プレゼン資料の内容につき音声案内することができるため、会議の効率化を図ることができる。
また、プレゼン特定実行部(不図示)は、予約情報に基づいて、会議室の利用目的におけるキーワードを特定し、該キーワードに関するプレゼン資料を特定してもよい。プレゼン特定実行部は、送信部18を介して特定されたプレゼン資料に関する情報をスピーカ装置20に送信する。そして、プレゼン資料に記載されているテキスト情報を音声情報に変換し、送信部18を介して該音声情報をスピーカ装置20に送信する。これにより応答サーバ装置10において会議の目的に適したプレゼン資料を自動的に特定されるため、会議を円滑に進行できる。
応答内容特定部16は、例えばスピーカ装置20を介してプレゼン実行中におけるユーザの質問に応答する応答内容を特定する機能を有していてもよい。まず、応答内容特定部16は質問に関する音声情報をテキスト情報に変換する。次に、応答内容特定部16は該テキスト情報に対応する応答内容を応答内容テーブル11eから取得する。具体的に述べると、例えばテキスト情報を解析してキーワードを抽出する。抽出されたキーワードに基づいて、応答内容テーブル11eを検索するとともに、質問の種別(人名、地名、数量など)を特定する。検索により応答内容テーブル11eから抽出された応答内容の中から、特定された質問の種別に対応する言葉を特定することで、回答を特定する。これにより応答サーバ装置10は能動的にプレゼンを実行するとともに、ユーザの質問に対する回答をも行うため会議を円滑に進行できる。
応答サーバ装置10は、例えば会議の議事録を作成する議事録作成部(不図示)の機能をさらに有していてもよい。議事録作成部は、例えばスピーカ装置20を介して取得したユーザの音声情報をテキスト情報に変換し、所定の様式に議事録として該テキスト情報を入力する。テキスト情報が入力された所定の様式を示す情報をユーザ端末装置30に送信するよう、処理を実行させる。これによりユーザにおいて議事録作成にかかる作業を軽減できる。
応答サーバ装置10は、例えばユーザ端末装置30からユーザ情報を取得することに代えてスピーカ装置20で取得するユーザの音声をユーザ情報として取得してもよい。この場合、応答サーバ装置10はユーザごとの声紋に関する声紋情報を格納する声紋情報データベース(不図示)を備え、取得した音声情報と声紋情報とを照合してユーザを特定する。これによりユーザ端末装置30を所持していないユーザを認識できるため、音声通知システム1の確実な運用を実現できる。
応答サーバ装置10は、例えばユーザ端末装置30からユーザ情報を取得することに代えてカメラ装置(不図示)から取得するユーザの顔に関する顔情報をユーザ情報として取得してもよい。この場合、応答サーバ装置10はユーザごとの顔情報を格納する顔情報データベース(不図示)を備え、取得した顔情報と顔情報データベースに格納されている顔情報とを照合してユーザを特定する。これによりユーザ端末装置30を所持していないユーザを認識できるため、音声通知システム1の確実な運用を実現できる。
応答サーバ装置10は、例えば各種機能を実行するタイミングを計る計時部(不図示)をさらに有していてもよい。計時部において所定の時間や所定の時間経過を計ることで、応答サーバ装置10は所定の時間に所定の機能を実行し所定の時間経過時に所定の機能を実行することができる。これにより応答サーバ装置10は適切なタイミングで能動的に機能を発揮できるため、会議を円滑に進行できる。
上記において、スピーカ装置20は会議室に設置されているものとして説明したがこれに限定されない。スピーカ装置20を不特定多数のユーザが利用する場所に設置できる。これにより、音声通知システム1は、例えば、個人宅、集合住宅のエントランス、お店、集会場など様々な場所において、能動的にユーザに対して発話する。様々な場所でユーザに対して能動的に音声出力することで、ユーザの発言を促すことができる。
なお、述した実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得るとともに、本発明にはその等価物も含まれる。
1…音声通知システム、10…応答サーバ装置、11…記憶部、12a…スピーカ情報取得部、12b…ユーザ情報取得部、12c…予約情報取得部、13…認識部、14…議事録特定部、15…画像特定部、16…応答内容特定部、17…分析部、18…送信部、20…スピーカ装置、30…ユーザ端末装置

Claims (12)

  1. マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得する取得部と、
    前記取得部で取得された前記ユーザ情報に基づいて、所定の応答内容を特定する応答内容特定部と、
    前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、前記応答内容特定部で特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信する送信部と、
    を備えることを特徴とする情報処理システム。
  2. 前記取得部は、前記ユーザの端末装置から、前記ユーザ情報を取得する
    ことを特徴とする請求項1に記載の情報処理システム。
  3. 前記取得部は、前記スピーカ装置から、前記スピーカ装置にアクセスした、前記ユーザの端末装置に関する前記ユーザ情報を取得する
    ことを特徴とする請求項1に記載の情報処理システム。
  4. 前記取得部は、前記スピーカ装置から、前記ユーザの音声に関する前記ユーザ情報を取得する
    ことを特徴とする請求項1乃至請求項3のいずれか一項に記載の情報処理システム。
  5. 前記ユーザの音声に関する前記ユーザ情報に基づいて、前記ユーザの発言を分析する分析部と、
    前記送信部は、前記分析部で分析された結果に関する分析情報を、前記スピーカ装置に送信する
    ことを特徴とする請求項4に記載の情報処理システム。
  6. 前記応答内容特定部で特定された前記所定の応答内容に基づいて、所定の画像を特定する画像特定部をさらに備え、
    前記送信部は、前記スピーカ装置に、前記スピーカ装置に接続された表示装置に前記所定の画像を出力させるべく、前記所定の画像に関する画像情報を送信する
    ことを特徴とする請求項1乃至請求項5の何れか一項に記載の情報処理システム。
  7. 前記取得部は、前記ユーザ情報に基づいて、会議の予約を管理する予約管理システムから、前記会議の予約状況に関する予約情報を取得し、
    前記応答内容特定部は、前記予約情報に基づいて、所定の応答内容を特定する
    ことを特徴とする請求項1乃至請求項6の何れか一項に記載の情報処理システム。
  8. 前記応答内容特定部で特定された応答内容に基づいて、過去の議事録に関する議事録情報を保持する過去データベースから、所定の議事録情報を特定する議事録特定部をさらに備え、
    前記送信部は、前記スピーカ装置に、前記スピーカ装置に接続された表示装置に前記議事録を出力させるべく、前記議事録情報を送信する
    ことを特徴とする請求項1乃至請求項7の何れか一項に記載の情報処理システム。
  9. 前記取得部は、前記ユーザの音声に関する前記ユーザ情報を取得し、
    前記応答内容特定部は、前記ユーザ情報に基づいて、所定の応答内容を特定し、
    前記所定の応答内容に基づいて、所定のデータベースから、プレゼン資料を示すプレゼン資料情報を特定するプレゼン特定実行部
    をさらに備え、
    前記送信部は、前記スピーカ装置に、前記スピーカ装置に接続された表示装置に前記プレゼン資料を出力させるべく、前記プレゼン資料情報を送信する
    ことを特徴とする請求項1乃至請求項8の何れか一項に記載の情報処理システム。
  10. 前記スピーカ装置
    をさらに備えることを特徴とする請求項1乃至請求項9に記載の情報処理システム。
  11. コンピュータが、
    マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得する取得ステップと、
    前記取得ステップで取得された前記ユーザ情報に基づいて、所定の応答内容を特定する応答内容特定ステップと、
    前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、前記応答内容特定ステップで特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信する送信ステップと、
    を実現する情報処理方法。
  12. コンピュータに、
    マイクロフォンとスピーカとを備えるスピーカ装置を使用するユーザに関するユーザ情報を取得させることと、
    前記ユーザ情報に基づいて、所定の応答内容を特定させることと、
    前記スピーカ装置に前記所定の応答内容に沿って音声出力させるべく、特定された前記所定の応答内容に基づく音声情報を、前記スピーカ装置に送信させることと、
    を実現させるプログラム。
JP2019134713A 2019-07-22 2019-07-22 情報処理システム、情報処理方法、及びプログラム Active JP7258686B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019134713A JP7258686B2 (ja) 2019-07-22 2019-07-22 情報処理システム、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019134713A JP7258686B2 (ja) 2019-07-22 2019-07-22 情報処理システム、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2021018664A true JP2021018664A (ja) 2021-02-15
JP7258686B2 JP7258686B2 (ja) 2023-04-17

Family

ID=74564307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019134713A Active JP7258686B2 (ja) 2019-07-22 2019-07-22 情報処理システム、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7258686B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7349206B1 (ja) 2022-06-30 2023-09-22 株式会社大正スカイビル 問合せ対応の管理システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029932A (ja) * 1998-07-08 2000-01-28 Nippon Telegr & Teleph Corp <Ntt> 利用者検知機能を用いた情報案内方法及び利用者検知機能を有する情報案内システム及び情報案内プログラムを格納した記憶媒体
JP2009086871A (ja) * 2007-09-28 2009-04-23 Fuji Xerox Co Ltd 情報処理システム及び情報処理プログラム
WO2016157662A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム
JP2017174237A (ja) * 2016-03-24 2017-09-28 富士通株式会社 スケジュール案内装置、スケジュール案内方法、およびスケジュール案内プログラム
WO2019026617A1 (ja) * 2017-08-01 2019-02-07 ソニー株式会社 情報処理装置、及び情報処理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029932A (ja) * 1998-07-08 2000-01-28 Nippon Telegr & Teleph Corp <Ntt> 利用者検知機能を用いた情報案内方法及び利用者検知機能を有する情報案内システム及び情報案内プログラムを格納した記憶媒体
JP2009086871A (ja) * 2007-09-28 2009-04-23 Fuji Xerox Co Ltd 情報処理システム及び情報処理プログラム
WO2016157662A1 (ja) * 2015-03-31 2016-10-06 ソニー株式会社 情報処理装置、制御方法、およびプログラム
JP2017174237A (ja) * 2016-03-24 2017-09-28 富士通株式会社 スケジュール案内装置、スケジュール案内方法、およびスケジュール案内プログラム
WO2019026617A1 (ja) * 2017-08-01 2019-02-07 ソニー株式会社 情報処理装置、及び情報処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
清水 圭一: "総務の引き出し ICT スマートスピーカーで働き方が変わる", 月刊総務 第56巻 第7号, vol. 第56巻, JPN6022004813, pages 34 - 35, ISSN: 0004698746 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7349206B1 (ja) 2022-06-30 2023-09-22 株式会社大正スカイビル 問合せ対応の管理システム
JP7361434B1 (ja) 2022-06-30 2023-10-16 株式会社大正スカイビル 問合せ対応の管理システム
WO2024004131A1 (ja) * 2022-06-30 2024-01-04 株式会社大正スカイビル 問合せ対応の管理システム

Also Published As

Publication number Publication date
JP7258686B2 (ja) 2023-04-17

Similar Documents

Publication Publication Date Title
CN110741433B (zh) 使用多个计算设备的对讲式通信
US10498673B2 (en) Device and method for providing user-customized content
KR102619621B1 (ko) 챗봇과 대화하기 위한 전자 장치 및 그의 동작 방법
TWI536365B (zh) 聲紋辨識
US9053096B2 (en) Language translation based on speaker-related information
KR102343084B1 (ko) 전자 장치 및 전자 장치의 기능 실행 방법
KR102472010B1 (ko) 전자 장치 및 전자 장치의 기능 실행 방법
JP2013109106A (ja) 議事録作成システム、議事録作成装置、議事録作成プログラム、議事録作成端末及び議事録作成端末プログラム
KR20190068133A (ko) 오디오 데이터에 포함된 음소 정보를 이용하여 어플리케이션을 실행하기 위한 전자 장치 및 그의 동작 방법
KR102476099B1 (ko) 회의록 열람 문서 생성 방법 및 그 장치
JP4469867B2 (ja) コミュニケーションの状況を管理する装置、方法およびプログラム
KR20170126667A (ko) 회의 기록 자동 생성 방법 및 그 장치
JP6973380B2 (ja) 情報処理装置、および情報処理方法
JPWO2020003785A1 (ja) 音声処理装置、音声処理方法及び記録媒体
KR102417029B1 (ko) 자연어 표현 생성 방법 및 전자 장치
JP7258686B2 (ja) 情報処理システム、情報処理方法、及びプログラム
JP2019220067A (ja) 会議システム、会議サーバ及びプログラム
US20200202738A1 (en) Robot and method of controlling the same
KR102519635B1 (ko) 음성 명령을 처리하기 위한 전자 문서 표시 방법 및 그 전자 장치
WO2019187521A1 (ja) 音声情報送信装置、音声情報送信方法、音声情報送信プログラム、音声情報解析システム及び音声情報解析サーバ
EP3040915A1 (en) Method and apparatus for identifying trends
JP2021009434A (ja) ブラウザ装置、情報出力方法及び情報出力プログラム
JP2015173857A (ja) 電子機器及び情報処理方法
US11568866B2 (en) Audio processing system, conferencing system, and audio processing method
US20220013128A1 (en) Conversation support system, conversation support method and computer readable storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220203

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230405

R150 Certificate of patent or registration of utility model

Ref document number: 7258686

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150