JP2020086027A - 音声再生システムおよびプログラム - Google Patents

音声再生システムおよびプログラム Download PDF

Info

Publication number
JP2020086027A
JP2020086027A JP2018217272A JP2018217272A JP2020086027A JP 2020086027 A JP2020086027 A JP 2020086027A JP 2018217272 A JP2018217272 A JP 2018217272A JP 2018217272 A JP2018217272 A JP 2018217272A JP 2020086027 A JP2020086027 A JP 2020086027A
Authority
JP
Japan
Prior art keywords
voice
reproduction
sound
unit
listener
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018217272A
Other languages
English (en)
Other versions
JP7284570B2 (ja
Inventor
遥香 松本
Haruka Matsumoto
遥香 松本
智治 町田
Tomoharu Machida
智治 町田
宮本 登
Noboru Miyamoto
登 宮本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Gas Co Ltd
Original Assignee
Tokyo Gas Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Gas Co Ltd filed Critical Tokyo Gas Co Ltd
Priority to JP2018217272A priority Critical patent/JP7284570B2/ja
Publication of JP2020086027A publication Critical patent/JP2020086027A/ja
Application granted granted Critical
Publication of JP7284570B2 publication Critical patent/JP7284570B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

【課題】聞き手の身体状態や周囲の状況を加味して音声の再生条件を決定する音声再生システム等を提供する。【解決手段】音声を取得する取得部33と、送信された音声の再生を行う再生部34と、音声の聞き手の状態と、再生部34により音声の再生を行うときの自装置の周囲の状態と、を分析する分析部35と、分析部35による分析の結果から、再生部34で音声の再生を行う条件である再生条件を決定する決定部36と、を有する音声再生システム。【選択図】図4

Description

本発明は、音声再生システム、プログラムに関する。
音声を録音し、録音した音声を別の人物が再生することでコミュニケーションを図る装置が存在する。
特許文献1に記載の情報処理装置では、変化判定部は、キー情報と、再生対象である楽曲データの楽曲テンポとに基づいて、再生対象である楽曲データの再生テンポを変更するかどうかを判定する。テンポ変更予告部は、変化判定部により再生テンポを変更すると判定された場合、その変更をユーザに予告する。検索結果出力部は、再生対象である楽曲データの再生テンポを、いまの再生テンポから、キー情報が表す再生テンポに変更し、その再生テンポで再生対象である楽曲データを再生する。
また、特許文献2に記載の音響再生装置は、撮像部に設けられたカメラにおいて観覧者の聴取空間を撮像し、このカメラにおいて撮像された画像データに基づいて観覧者の聴取位置を検出する。そして、検出結果に基づいて信号処理部において信号処理を行う際のフィルタ係数を算出し、算出されたフィルタ係数により音響データに信号処理を施して、SPアレイシステムに出力する。また、観覧者の聴取位置の変化を検出し、変化に合わせてフィルタ係数を変更する。
特開2007−58048号公報 国際公開第2006/057131号
音声の再生を行う際に、この音声を聞く聞き手の聴力が弱かったり、周囲が騒がしい場合など、聞き取りにくい場合がある。ところがこのような、聞き手の身体状態や周囲の状況は現状では考慮されていない。
本発明の目的は、聞き手の身体状態や周囲の状況を加味して音声の再生条件を決定する音声再生システム等を提供することを目的とする。
かくして本発明によれば、音声を取得する取得手段と、送信された音声の再生を行う再生手段と、音声の聞き手の状態と、再生手段により音声の再生を行うときの自装置の周囲の状態と、を分析する分析手段と、分析手段による分析の結果から、再生手段で音声の再生を行う条件である再生条件を決定する決定手段と、を有する音声再生システムが提供される。
ここで、分析手段は、音声の取得時に取得手段が取得した聞き手の音声から、音声の聞き手の状態として、聞き手の年齢を推定し、決定手段は、推定された年齢に応じて再生条件を変更するようにすることができる。この場合、年齢に応じた声質や形式で再生を行うことができる。
また、分析手段は、音声の再生時に取得手段が取得した聞き手の音声の意味から、音声の聞き手の状態を分析するようにすることができる。この場合、聞き手の状態をより容易に把握することができる。
さらに、聞き手の状態は、聞き手の聴力であるようにすることができる。この場合、音声を聞く上で重要な情報を得ることができる。
またさらに、分析手段は、音声の取得時および/または音声の再生時に、取得手段が取得した聞き手の健康状態に関する音を識別し、決定手段は、識別された音に応じて再生条件を変更するようにすることができる。そして、分析手段は、自装置の周囲の状態として、音声の取得時および/または音声の再生時に取得された自装置の周囲の環境音を識別し、決定手段は、環境音に応じて再生条件を変更するようにすることができる。この場合、聞き手が音声を聞きやすくなる。
さらに、再生条件は、音量の調整、再生の速度および周波数変換の少なくとも一つであるようにすることができる。この場合、聞き手が音声を聞きやすくなるために、重要なパラメータを変更することができる。
そして、決定手段は、自装置の周辺の状況を把握し、把握した状況に基づき、設定を行うようにすることができる。この場合、周囲の状況も加えて送信情報の再生を行うことができる。
さらに、本発明によれば、コンピュータに、音声を取得する取得機能と、送信された音声の再生を行う再生機能と、音声の聞き手の状態と、再生機能により音声の再生を行うときの自装置の周囲の状態と、を分析する分析機能と、分析機能による分析の結果から、再生機能で音声の再生を行う条件である再生条件を決定する決定機能と、を実現させるためのプログラムが提供される。
本発明によれば、聞き手の身体状態や周囲の状況を加味して音声の再生条件を決定する音声再生システム等を提供することができる。
本実施の形態における音声再生システムの構成例を示す図である。 端末装置をロボットとした場合について説明した図である。 音声再生システムの概略動作の例について示した図である。 音声再生システムの機能構成例を示したブロック図である。 本実施形態の音声再生システムの動作の例について説明したフローチャートである。 ユーザの年齢を推定する方法の一例を示した図である。 (a)〜(b)は、音声の周波数変換について示した図である。 (a)〜(b)は、ユーザの健康状態を推定する方法の第1の例を示した図である。 (a)〜(c)は、ユーザの健康状態を推定する方法の第2の例を示した図である。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
<音声再生システム1全体の説明>
図1は、本実施の形態における音声再生システム1の構成例を示す図である。
図示するように本実施の形態の音声再生システム1は、携帯端末20と、端末装置30とが、ネットワーク70およびアクセスポイント90を介して接続されることにより構成されている。図1では、携帯端末20は、1つのみ示したが、個数はいくつでもよい。
携帯端末20は、例えば、モバイルコンピュータ、携帯電話、スマートフォン、タブレット等のモバイル端末である。携帯端末20は、無線通信を行うためにアクセスポイント90に接続する。そして、携帯端末20は、アクセスポイント90を介して、有線で通信を行うネットワーク70に接続する。
携帯端末20は、演算手段であるCPU(Central Processing Unit)と、記憶手段であるメインメモリを備える。ここで、CPUは、OS(基本ソフトウェア)やアプリ(応用ソフトウェア)等の各種ソフトウェアを実行する。また、メインメモリは、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域である。さらに、携帯端末20は、外部との通信を行うための通信インタフェース(以下、「通信I/F」と表記する)と、ビデオメモリやディスプレイ等からなる表示機構と、入力ボタン、タッチパネル、キーボード等の入力機構とを備える。そして、携帯端末20は、音声の出力を行うスピーカと、音声の入力を行うマイクロフォンとを備える。
端末装置30は、例えば、ロボットとすることができる。このロボットは、ロボットを所有するユーザの住居に置かれる。
図2は、端末装置30をロボットとした場合について説明した図である。
図2に示した、ロボットとしての端末装置30は、歩行等を行うことで移動する機能を有する移動式としてもよいが、移動しない非移動式としてもよい。
端末装置30は、送信情報の送信および受信を行う通信アンテナ301と、音声を取得するマイクロフォン302と、音声等の音を出力するスピーカ303と、ユーザが操作を行う操作ボタン304と、端末装置30の全体の制御を行う制御部305とを備える。また、操作ボタン304は、録音を行う録音ボタン304aと、送られた送信情報を再生する再生ボタン304bと、端末装置30の設定などを行うためのメニューボタン304cとを備える。
ネットワーク70は、携帯端末20および端末装置30の情報通信に用いられる通信手段であり、例えば、インターネットである。
アクセスポイント90は、有線で通信を行うネットワーク70に対して、無線通信回線を利用して無線通信を行う機器である。アクセスポイント90は、携帯端末20や端末装置30とネットワーク70との間の情報の送受信を媒介する。
無線通信回線の種類としては、携帯電話回線、PHS(Personal Handy-phone System)回線、Wi−Fi(Wireless Fidelity)、Bluetooth(登録商標)、ZigBee、UWB(Ultra Wideband)等の各回線が使用可能である。
<音声再生システム1の動作の概略説明>
図3は、音声再生システム1の概略動作の例について示した図である。
まず、端末装置30を所有するユーザAが、送信情報を作成する(1A)。送信情報は、端末装置30と携帯端末20との間で、やりとりを行う際に用いられる電子情報である。送信情報は、詳しくは後述するが、音声の情報である。ユーザAは、携帯端末20を所有するユーザBへのメッセージを、音声により作成する。なお、ユーザAとユーザBとは、予め定められた人物であり、所定の交友関係がある。例えば、親子の関係であったり、友人同士の関係である。
音声の情報は、ユーザAが、端末装置30に向かって話しかけ、この際に、マイクロフォン302により音声を取得し、録音を行うことで、作成することができる。具体的には、ユーザAは、例えば、端末装置30に対し相対する位置に自らの顔を向ける。そして、ユーザAが、操作ボタン304の録音ボタン304aを押下すると、押下している間だけマイクロフォン302により、録音が行われる。録音を停止したい場合は、録音ボタン304aから手を離せばよい。そして、ユーザAは、録音ボタン304aを押下している間に、自らの音声によりユーザBに対し伝えたい内容を話す。録音した音声の情報は、制御部305のメモリに保存される。
そして、制御部305は、この音声の情報を送信情報として、携帯端末20に対し送信する。送信情報は、通信アンテナ301、アクセスポイント90、ネットワーク70を介し、携帯端末20に送られる(1B)。
携帯端末20では、音声再生システム1を実現するための専用のアプリが動作しており、この送信情報を、通信I/Fが取得する。CPUは、この送信情報をメモリに保存する(1C)。またこのとき、ロボットにLEDなどからなる発光源を別途設け、この発光源を点滅等させることで、ユーザAから送信情報が到着した旨を、ユーザBに対し知らせてもよい。また、ユーザAから送信情報が到着した旨の案内を、着信音や音声等で出力してもよい。
ユーザBは、送信情報の再生を行うことができる。具体的には、ユーザBが、携帯端末20のタッチパネル等の入力機構において、再生ボタン等を押下する。これにより、ユーザAから送信された音声が、メモリから読み出され、スピーカから出力される(1D)。これにより、ユーザBは、ユーザAから送信されたメッセージを聞くことができる。
そして、ユーザBは、ユーザAへ返信を行うための送信情報を作成する(1E)。この送信情報の作成方法は、上述したユーザAの場合で説明した方法と同様である。
そして、携帯端末20のCPUは、この音声の情報を送信情報として、端末装置30に対し送信する(1F)。送信情報は、通信I/F、アクセスポイント90、ネットワーク70を介し、端末装置30に送られる。
端末装置30では、この送信情報を、通信アンテナ301で受け、制御部305が取得して、メモリに記憶する(1G)。ユーザAの操作により、ユーザBから送られた送信情報をメモリから読み出し、再生を行う(1H)。
そして、以下、同様の動作が繰り返される。即ち、ユーザAとユーザBとの間で、送信情報のやりとりが行われる。
次に、本実施の形態の音声再生システム1の詳細な機能構成および動作について説明する。
<音声再生システム1の機能構成の説明>
図4は、音声再生システム1の機能構成例を示したブロック図である。
なおここでは、音声再生システム1が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
音声再生システム1において、携帯端末20は、情報の送受信を行う送受信部21と、画像の表示を行う表示部22と、情報を入力する入力部23と、音声を取得する音声出力部24とを備える。
送受信部21は、例えば、通信I/Fであり、アクセスポイント90およびネットワーク70を介し、端末装置30と情報の送受信を行う。
表示部22は、各種情報が表示される表示機構であり、例えば、タッチパネル等のディスプレイである。
入力部23は、テキストや音声等の入力を行う入力機構であり、例えば、上述したタッチパネルや、入力ボタン・キーボード等である。また、入力部23は、ユーザBの音声を入力する入力機構であり、例えば、マイクロフォンである。
音声出力部24は、音声の出力を行うスピーカである。
端末装置30は、送信情報の送受信を行う送受信部31と、送信情報を記憶する記憶部32と、音声の取得を行う取得部33と、音声を再生する再生部34と、音の分析を行う分析部35と、音声の再生の条件を決定する決定部36と、ユーザAの操作を受け付ける操作部37と、音声の再生の制御を行う再生制御部38とを備える。
送受信部31は、携帯端末20を所有するユーザBからの送信情報を受信する。また、送受信部31は、ユーザAからユーザBへの送信情報を送信する。送受信部31は、例えば、通信I/Fであり、制御部305に含まれる。また、通信アンテナ301もこれに含まれる。送受信部31は、アクセスポイント90およびネットワーク70を介し、端末装置30および携帯端末20の間で送信情報の送受信を行う。
記憶部32は、受信された送信情報を記憶する。また、記憶部32は、必要な場合にこれを出力する。記憶部32は、例えば、メモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)などであり、制御部305に含まれる。
取得部33は、取得手段の一例であり、音声等の音を取得する。取得部33は、マイクロフォン302に対応する。マイクロフォンの種類としては、ダイナミック型、コンデンサ型等、既存の種々のものを用いてよい。また、マイクロフォンとして、無指向性のMEMS(Micro Electro Mechanical Systems)型マイクロフォンであることが好ましい。
再生部34は、再生手段の一例であり、ユーザBから送信された音声の再生を行う。再生部34は、スピーカ303に対応する。
分析部35は、分析手段の一例であり、音声の聞き手の状態と、再生部34により音声の再生を行うときの自装置の周囲の状態と、を分析する。この場合、分析部35は、音声の聞き手の状態として、ユーザAの状態を分析する。
決定部36は、決定手段の一例であり、分析部35による分析の結果から、再生部34で音声の再生を行う条件である再生条件を決定する。再生条件は、詳しくは後述するが、音量の調整、再生の速度および周波数変換の少なくとも一つである。
分析部35および決定部36は、例えば、CPUであり、制御部305に含まれる。
操作部37は、録音や再生を行うためのユーザAによる操作を受け付ける。操作部37は、操作ボタン304に対応する。また、操作部37は、キーボードやマウス等で構成されていてもよい。
再生制御部38は、再生部34で音声の再生を行う際に、決定部36により決定された再生条件により、音声の再生の制御を行う。再生制御部38は、例えば、CPUであり、制御部305に含まれる。
<音声再生システム1の動作の説明>
次に、本実施の形態の音声再生システム1の動作について、より詳細に説明を行う。
図5は、本実施形態の音声再生システム1の動作の例について説明したフローチャートである。
まず、ユーザAが、端末装置30の操作部37を操作し、取得部33を使用して、音声の録音を行う(ステップ101)。音声の情報は、送信情報として記憶部32に記憶される(ステップ102)。さらに、送受信部31が、送信情報を携帯端末20に向け、送信する(ステップ103)。なお、送信情報には、送信情報を作成した際の日時の情報等を含めてもよい。
端末装置30から送信された送信情報は、アクセスポイント90およびネットワーク70を介して、携帯端末20に送られる。携帯端末20では、送信情報を、送受信部21が取得する(ステップ104)。そして、携帯端末20のCPUは、この送信情報をメモリに保存する(ステップ105)。
一方、ユーザBは、携帯端末20の表示部22および入力部23に対応するタッチパネル等の入力機構において、専用アプリから再生ボタン等を押下する。その結果、携帯端末20の音声出力部24であるスピーカにより、ユーザAから送信された音声が、再生される(ステップ106)。
そして、ユーザBは、ユーザAへ返信を行うための送信情報を作成する(ステップ107)。この送信情報の作成方法は、ユーザAの場合で上述した方法と同様であり、入力部23に対応するマイクロフォンを使用して、ユーザBの音声を録音することで行う。録音した音声は、送信情報としてメモリに保存される(ステップ108)。
そして、携帯端末20の送受信部21は、この音声の情報を送信情報として、端末装置30に対し送信する(ステップ109)。送信情報は、携帯端末20の送受信部21、アクセスポイント90、ネットワーク70を介し、端末装置30に送られる。
端末装置30では、送受信部31が、この送信情報を受信する(ステップ110)。そして、送られた送信情報は、記憶部32が記憶する(ステップ111)。
さらに、端末装置30では、ユーザAが、操作部37を操作し、再生部34によりユーザBから返信された音声の再生を行う(ステップ112)。このとき、音声の再生の制御は、再生制御部38が行う。
そして、再生の際に、取得部33が、自装置の周囲の音を取得する(ステップ113)。さらに、分析部35が、自装置の周囲の音を基に、ユーザAの状態と、再生部34により音声の再生を行うときの自装置の周囲の状態とを分析する(ステップ114)。
そして、決定部36は、分析部35による分析の結果から、再生部34で音声の再生を行う条件である再生条件を決定する(ステップ115)。これにより、次に再生部34で音声の再生を行う際に、この再生条件が適用される。
なお、詳しくは後述するが、ステップ114〜ステップ115の処理は、ユーザAが録音した音声に基づき、ステップ102とステップ103の間で行われることがある。
<分析部35および決定部36の動作の詳細説明>
次に、分析部35が、自装置の周囲の音を基に、ユーザAの状態と、再生部34により音声の再生を行うときの自装置の周囲の状態とを分析する方法について、詳細に説明を行う。また併せて、分析部35が分析した結果に応じて、決定部36が決定する再生条件について説明を行う。決定部36が決定する再生条件は、音量の調整、再生の速度および周波数変換の少なくとも一つである。
(ユーザAの年齢の分析)
ここでは、分析部35は、ユーザAの音声の取得時に取得部33が取得したユーザAの音声から、ユーザAの状態として、ユーザAの年齢を推定する。そして、決定部36は、推定された年齢に応じて再生条件を変更する。
図6は、ユーザAの年齢を推定する方法の一例を示した図である。
図6は、音声の周波数スペクトルについて示している。ここで、横軸は、周波数を表し、縦軸は、スペクトル強度を表す。即ち、周波数スペクトルは、音声に含まれる周波数成分について、周波数とその強度との関係を示している。
ここでは、音声について、40歳、50歳、60歳、70歳の人物の周波数スペクトルの一例を示している。図示するように、年齢が上昇するに従い、4kHz以上のスペクトル強度が増加することがわかる。実際には、4kHz以上のスペクトル強度が増加することで、音声が、よりかれた状態となる嗄声(させい)となる。
よって、分析部35は、周波数スペクトルのうち、4kHz以上のスペクトル強度を見ることで、ユーザAの年齢を推定することができる。
そして、決定部36は、例えば、ユーザAの年齢が高いほど、再生する際の音量を大きくする。また、決定部36は、例えば、年齢が60歳以上と推定された場合は、再生の速度を遅くする。
さらに、決定部36は、例えば、年齢が60歳以上と推定された場合は、音声の周波数変換を行ってもよい。つまり、高齢者の場合は、低音域および中音域は聞こえるが、高音域が聞こえにくくなることが多い。そのため高音域の音について、中音域への周波数変換を行い、音声に高音域の音が含まれていても、聞こえるようにする。
図7(a)〜(b)は、音声の周波数変換について示した図である。
ここで、横軸は、周波数を示し、縦軸は、強度を示す。
このうち、図7(a)は、音声の周波数変換として、周波数の圧縮を行った場合を示している。この場合、実線で示した音声の波形について、高音域として、4000Hz以上の周波数領域について、圧縮し、点線で示す波形にしている。
また、図7(b)は、音声の周波数変換として、周波数の移行を行った場合を示している。この場合、実線で示した音声の波形について、高音域として、4000Hz以上の周波数領域について、中音域にスライド(移行)させ、点線で示す波形にしている。
このような音声の周波数変換を行うことで、本来聞こえない領域の音も聞こえるようになり、音声をより聞きやすくなる。
(再生時におけるユーザAの音声の分析)
ここでは、分析部35は、音声の再生時に取得部33が取得した聞き手の音声の意味から、音声の聞き手の状態を分析する。そして、決定部36は、分析の結果に応じて再生条件を決定する。
ユーザBの音声を再生する際に、ユーザAの発話する音声を取得部33で取得する。つまり、再生される音声の音量が小さいような場合、ユーザAは、例えば、「えっ?」、「今、なんて言ったの?」等の音声を無意識に発することがある。また、ユーザAの聴力が弱くなっている場合も同様である。分析部35は、取得部33で取得したユーザAの音声から、このような聞き返すような意味を含む発話がなかったか否かを分析する。具体的には、分析部35は、取得部33で取得した音から、ユーザBの音声をできるだけ消去する。さらに、分析部35は、残った音にユーザAの音声が含まれる場合、聞き返すような意味を含む発話があるか否かを判断する。
そして、決定部36は、このような発話があった場合は、再生する際の音量を大きくしたり、再生の速度を遅くする。さらに、決定部36は、音声の周波数変換を行ってもよい。
(ユーザAの健康状態の分析)
ここでは、分析部35は、音声の取得時および/または音声の再生時に、取得部33が取得したユーザAの健康状態に関する音を識別し、決定部36は、識別された音に応じて再生条件を変更する。
図8(a)〜(b)は、ユーザAの健康状態を推定する方法の第1の例を示した図である。
図8(a)は、ユーザAが咳をしたときの音の波形を示している。また、図8(b)は、ユーザAがくしゃみをしたときの音の波形を示している。両図は、ともに横軸が時間を表し、縦軸が、音に含まれる周波数成分を示している。
図8(a)に示す咳の場合、30kHz付近までの周波数成分を含み、そして、この周波数成分が含まれる時間は、約0.1sと短い。また、図8(b)に示すくしゃみの場合、45kHz付近までの周波数成分を含み、そして、この周波数成分が含まれる時間は、同様に約0.1sと短い。
よって、この特徴により、分析部35は、ユーザAが、咳やくしゃみをしたか否かを判断できる。そして、この回数が、予め定められた時間内で予め定められた回数以上検出されたときは、分析部35は、ユーザAが風邪等に罹患していると判断する。つまり、この場合、分析部35は、健康状態に関する音として、咳およびくしゃみの音を識別する。
図9(a)〜(c)は、ユーザAの健康状態を推定する方法の第2の例を示した図である。
ここで、横軸は、時間を示し、縦軸は、強さを示す。
図9(a)で示す音声の信号は、図9(b)で示す基本周波数と、図9(c)で示す非周期成分の2つに分けることができる。基本周波数は、声の高さを表す。例えば、男声の基本周波数は、100Hz〜200Hzであり、女声の基本周波数は、250Hz〜500Hzである。また、非周期成分は、声色を表す。また、非周期成分は、声のかすれについて表し、非周期成分が小さいほどかすれは小さく、大きいほどかすれが大きくなる。
よって、分析部35は、取得した音声を基本周波数と非周期成分の2つに分け、非周期成分の大きさを分析し、ユーザAの音声にかすれがあるか否かを判断する。そして、分析部35は、かすれが大きいと判断したときは、ユーザAが風邪等に罹患していると判断する。つまり、この場合、分析部35は、健康状態に関する音として、音声のかすれを識別する。
そして、決定部36は、ユーザAが風邪等に罹患していると判断された場合は、再生する際の音量を大きくしたり、再生の速度を遅くする。さらに、決定部36は、音声の周波数変換を行ってもよい。
(環境音の分析)
ここでは、分析部35は、自装置の周囲の状態として、音声の取得時および/または音声の再生時に取得された自装置の周囲の環境音を識別し、決定部36は、環境音に応じて再生条件を変更する。
この環境音は、ユーザAの周囲から聞こえる音であり、雨の音、波の音、風の音、鳥や蝉の鳴き声、雑踏の音、自動車、電車、飛行機が通過する音等である。そして、この環境音が大きい場合、ユーザAは、音声を聞き取りにくくなる。
よって、分析部35は、環境音の音圧を分析する。
そして、決定部36は、環境音の音圧が大きいと判断された場合は、それに応じて再生する際の音量を大きくしたり、再生の速度を遅くする。
<変形例>
本実施の形態では、決定部36は、取得部33が取得した音声に基づき、自装置の周辺の状況を把握し、把握した状況に基づき、設定を行う。
例えば、決定部36は、時間帯に合わせ、音声を再生する際の音量を設定する。例えば、夜間には、音量を小さくする。
また、決定部36は、取得部33が取得した音声に基づき、自装置の周辺の状況を把握し、把握した状況に基づき、設定を行ってもよい。例えば、自装置の周辺が騒がしいときは、音量を大きくする。
以上詳述した音声再生システム1によれば、聞き手の身体状態や周囲の状況を加味して音声の再生条件を決定する。そのため、聞き手にとって、音声が、より聞き取りやすい音声再生システム1を提供することができる。
また、以上詳述した形態では、音声再生システム1は、携帯端末20および端末装置30が、ネットワーク70、アクセスポイント90を介して接続されることにより構成されていたが、端末装置30だけでも音声再生システムであるとして捉えることができる。また端末装置30で行う処理は、携帯端末20でも同様のことができる。よって携帯端末20を音声再生システムとして捉えることもできる。
さらに、上述した例では、端末装置30は、ロボットである例を示したが、これに限られるものではない。例えば、モバイルコンピュータ、携帯電話、スマートフォン、タブレット等のモバイル端末であってもよく、デスクトップコンピュータであってもよい。
さらに、上述した例では、端末装置30と携帯端末20とは、ネットワーク70、アクセスポイント90を介してピアツーピア接続していたが、これに限られるものではなく、サーバを介して接続していてもよい。なおこの場合、端末装置30で行う処理は、サーバでも同様のことができる。よって、このサーバを再生システムとして捉えることもできる。
<プログラムの説明>
ここで、以上説明を行った本実施の形態における端末装置30が行う処理は、例えば、アプリケーションソフトウェア等のプログラムとして用意される。そして、この処理は、ソフトウェアとハードウェア資源とが協働することにより実現される。即ち、端末装置30に設けられたコンピュータ内部の図示しないCPUが、上述した各機能を実現するプログラムを実行し、これらの各機能を実現させる。
よって、本実施の形態で、端末装置30が行う処理は、コンピュータに、音声を取得する取得機能と、送信された音声の再生を行う再生機能と、音声の聞き手の状態と、再生機能により音声の再生を行うときの自装置の周囲の状態と、を分析する分析機能と、分析機能による分析の結果から、再生機能で音声の再生を行う条件である再生条件を決定する決定機能と、を実現させるためのプログラムとして捉えることもできる。
なお、本実施の形態を実現するプログラムは、通信手段により提供することはもちろんCD−ROM等の記録媒体に格納して提供することも可能である。
以上、本実施の形態について説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
1…音声再生システム、20…携帯端末、30…端末装置、31…送受信部、32…記憶部、33…取得部、34…再生部、35…分析部、36…決定部、37…操作部、38…再生制御部

Claims (9)

  1. 音声を取得する取得手段と、
    送信された音声の再生を行う再生手段と、
    音声の聞き手の状態と、前記再生手段により音声の再生を行うときの自装置の周囲の状態と、を分析する分析手段と、
    前記分析手段による分析の結果から、前記再生手段で音声の再生を行う条件である再生条件を決定する決定手段と、
    を有する音声再生システム。
  2. 前記分析手段は、音声の取得時に前記取得手段が取得した聞き手の音声から、音声の聞き手の状態として、聞き手の年齢を推定し、
    前記決定手段は、推定された年齢に応じて前記再生条件を変更することを特徴とする請求項1に記載の音声再生システム。
  3. 前記分析手段は、音声の再生時に前記取得手段が取得した聞き手の音声の意味から、音声の聞き手の状態を分析することを特徴とする請求項1に記載の音声再生システム。
  4. 聞き手の状態は、聞き手の聴力であることを特徴とする請求項3に記載の音声再生システム。
  5. 前記分析手段は、音声の取得時および/または音声の再生時に、前記取得手段が取得した聞き手の健康状態に関する音を識別し、
    前記決定手段は、識別された音に応じて前記再生条件を変更することを特徴とする請求項1に記載の音声再生システム。
  6. 前記分析手段は、自装置の周囲の状態として、音声の取得時および/または音声の再生時に取得された自装置の周囲の環境音を識別し、
    前記決定手段は、前記環境音に応じて前記再生条件を変更することを特徴とする請求項1に記載の音声再生システム。
  7. 前記再生条件は、音量の調整、再生の速度および周波数変換の少なくとも一つであることを特徴とする請求項1に記載の音声再生システム。
  8. 前記決定手段は、自装置の周辺の状況を把握し、把握した状況に基づき、設定を行うことを特徴とする請求項1に記載の音声再生システム。
  9. コンピュータに、
    音声を取得する取得機能と、
    送信された音声の再生を行う再生機能と、
    音声の聞き手の状態と、前記再生機能により音声の再生を行うときの自装置の周囲の状態と、を分析する分析機能と、
    前記分析機能による分析の結果から、前記再生機能で音声の再生を行う条件である再生条件を決定する決定機能と、
    を実現させるためのプログラム。
JP2018217272A 2018-11-20 2018-11-20 音声再生システムおよびプログラム Active JP7284570B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018217272A JP7284570B2 (ja) 2018-11-20 2018-11-20 音声再生システムおよびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018217272A JP7284570B2 (ja) 2018-11-20 2018-11-20 音声再生システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2020086027A true JP2020086027A (ja) 2020-06-04
JP7284570B2 JP7284570B2 (ja) 2023-05-31

Family

ID=70907759

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018217272A Active JP7284570B2 (ja) 2018-11-20 2018-11-20 音声再生システムおよびプログラム

Country Status (1)

Country Link
JP (1) JP7284570B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021229888A1 (ja) 2020-05-15 2021-11-18 株式会社Ihi 電動機の固定子、及び、電動機
JP7469211B2 (ja) 2020-10-21 2024-04-16 東京瓦斯株式会社 対話型コミュニケーション装置、コミュニケーションシステム及びプログラム

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06334457A (ja) * 1993-05-20 1994-12-02 Mitsubishi Electric Corp 自動音量制御装置
JP2003345375A (ja) * 2002-05-24 2003-12-03 Matsushita Electric Ind Co Ltd 音声再生装置および音声再生システム
JP2003345399A (ja) * 2002-05-24 2003-12-03 Matsushita Electric Ind Co Ltd 音声再生装置
JP2006038705A (ja) * 2004-07-28 2006-02-09 Denso Corp 音声出力装置
JP2007003835A (ja) * 2005-06-23 2007-01-11 Nippon Telegr & Teleph Corp <Ntt> 疲労状態推定方法、疲労状態推定装置及びそのプログラム
JP2007327993A (ja) * 2006-06-06 2007-12-20 Konica Minolta Medical & Graphic Inc 音声モニタシステム、音声モニタ方法、プログラム、咳検出システム
JP2010028515A (ja) * 2008-07-22 2010-02-04 Nec Saitama Ltd 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
JP2012029099A (ja) * 2010-07-23 2012-02-09 Nec Casio Mobile Communications Ltd 音響機器
JP2013034057A (ja) * 2011-08-01 2013-02-14 Nec Casio Mobile Communications Ltd 電子機器、音響再生方法、及びプログラム
JP2014064093A (ja) * 2012-09-20 2014-04-10 Sony Corp 信号処理装置およびプログラム
JP2017192457A (ja) * 2016-04-18 2017-10-26 株式会社ブリコルールホールディングス 音声診断装置、音声診断システム及び音声診断プログラム
JP2020064151A (ja) * 2018-10-16 2020-04-23 東京瓦斯株式会社 再生システムおよびプログラム

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06334457A (ja) * 1993-05-20 1994-12-02 Mitsubishi Electric Corp 自動音量制御装置
JP2003345375A (ja) * 2002-05-24 2003-12-03 Matsushita Electric Ind Co Ltd 音声再生装置および音声再生システム
JP2003345399A (ja) * 2002-05-24 2003-12-03 Matsushita Electric Ind Co Ltd 音声再生装置
JP2006038705A (ja) * 2004-07-28 2006-02-09 Denso Corp 音声出力装置
JP2007003835A (ja) * 2005-06-23 2007-01-11 Nippon Telegr & Teleph Corp <Ntt> 疲労状態推定方法、疲労状態推定装置及びそのプログラム
JP2007327993A (ja) * 2006-06-06 2007-12-20 Konica Minolta Medical & Graphic Inc 音声モニタシステム、音声モニタ方法、プログラム、咳検出システム
JP2010028515A (ja) * 2008-07-22 2010-02-04 Nec Saitama Ltd 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
JP2012029099A (ja) * 2010-07-23 2012-02-09 Nec Casio Mobile Communications Ltd 音響機器
JP2013034057A (ja) * 2011-08-01 2013-02-14 Nec Casio Mobile Communications Ltd 電子機器、音響再生方法、及びプログラム
JP2014064093A (ja) * 2012-09-20 2014-04-10 Sony Corp 信号処理装置およびプログラム
JP2017192457A (ja) * 2016-04-18 2017-10-26 株式会社ブリコルールホールディングス 音声診断装置、音声診断システム及び音声診断プログラム
JP2020064151A (ja) * 2018-10-16 2020-04-23 東京瓦斯株式会社 再生システムおよびプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
小暮計貴 他: ""周囲の雑音やユーザーの聞き返しに基づいて音量調節を行う音声対話システム"", 情報処理学会研究報告, vol. Vol.2017-MUS-103, No.28, JPN6022052521, 17 May 2014 (2014-05-17), pages 1 - 5, ISSN: 0004942231 *
山崎信行 他: ""パーソナルロボットのためのアクティブインタフェースの設計と実装"", 日本ロボット学会誌, vol. 14, no. 3, JPN6022052520, 15 April 1996 (1996-04-15), pages 141 - 149, ISSN: 0004942230 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021229888A1 (ja) 2020-05-15 2021-11-18 株式会社Ihi 電動機の固定子、及び、電動機
JP7469211B2 (ja) 2020-10-21 2024-04-16 東京瓦斯株式会社 対話型コミュニケーション装置、コミュニケーションシステム及びプログラム

Also Published As

Publication number Publication date
JP7284570B2 (ja) 2023-05-31

Similar Documents

Publication Publication Date Title
US10817251B2 (en) Dynamic capability demonstration in wearable audio device
EP2911149B1 (en) Determination of an operational directive based at least in part on a spatial audio property
JP6248930B2 (ja) 情報処理システムおよびプログラム
US20070112563A1 (en) Determination of audio device quality
JP2016146547A (ja) 収音システム及び収音方法
US10922044B2 (en) Wearable audio device capability demonstration
CN106982286B (zh) 一种录音方法、设备和计算机可读存储介质
WO2021244056A1 (zh) 一种数据处理方法、装置和可读介质
CN115482830B (zh) 语音增强方法及相关设备
WO2019228329A1 (zh) 个人听力装置、外部声音处理装置及相关计算机程序产品
JP2023542968A (ja) 定位されたフィードバックによる聴力増強及びウェアラブルシステム
JP2009178783A (ja) コミュニケーションロボット及びその制御方法
JP7284570B2 (ja) 音声再生システムおよびプログラム
JP2018191145A (ja) 収音装置、収音方法、収音プログラム及びディクテーション方法
WO2022253003A1 (zh) 语音增强方法及相关设备
CN114640938A (zh) 一种基于蓝牙耳机芯片的助听功能实现方法及蓝牙耳机
WO2016157993A1 (ja) 情報処理装置、情報処理方法およびプログラム
JP7218143B2 (ja) 再生システムおよびプログラム
US11081136B2 (en) Information processing apparatus, information processing system, and program
JPWO2018193826A1 (ja) 情報処理装置、情報処理方法、音声出力装置、および音声出力方法
JP7293863B2 (ja) 音声処理装置、音声処理方法およびプログラム
JP3227725U (ja) 文字表示機能付き補聴システム
US20240087597A1 (en) Source speech modification based on an input speech characteristic
US20240029754A1 (en) Audio source separation for audio devices
JP2018084843A (ja) 入出力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210727

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230519

R150 Certificate of patent or registration of utility model

Ref document number: 7284570

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150