WO2023181404A1

WO2023181404A1 - 印象形成制御装置、方法およびプログラム

Info

Publication number: WO2023181404A1
Application number: PCT/JP2022/014642
Authority: WO
Inventors: 直紀萩山; 真奈笹川; 文香佐野; 俊一瀬古; 理香望月; 雄貴蔵内; 晴美齋藤; 隆二山本
Original assignee: 日本電信電話株式会社
Priority date: 2022-03-25
Filing date: 2022-03-25
Publication date: 2023-09-28

Abstract

この発明の一態様は、発話者に対する受話者の印象形成を制御する際に、前記発話者の発話音声信号を取得してこの発話音声信号から音声特徴量を抽出し、抽出された前記音声特徴量に基づいて、前記発話音声信号により前記受話者に生じる印象に対するバイアスを判定し、前記バイアスの判定結果と予め設定された前記バイアスの制御方向を表す情報とに基づいて、前記バイアスを制御するためのバイアス制御信号を生成し、前記バイアス制御信号に従い、前記受話者に対し外部刺激を与えるための刺激制御信号を生成し出力するようにしたものである。

Description

印象形成制御装置、方法およびプログラム

　この発明の一態様は、例えば発話者に対する受話者の印象形成を制御する印象形成制御装置、方法およびプログラムに関する。

　発話者の声は、当該発話者に対する信頼度や好感度といった受話者の印象形成に影響することが知られている。例えば非特許文献１では、発話者である政治家の印象形成に政治家の声の高さが関係することが報告されている。具体的には、政治家の音声の基本周波数が低いほど、政治家に対する好感度・信頼度を受話者がより高く評価（評価に正のバイアスが発生）し、政治家の音声の基本周波数が高いほど、政治家に対する好感度・信頼度を受話者がより低く評価（評価に負のバイアスが発生）することが報告されている。そして、非特許文献１には、音声合成技術を用いた声の操作によって、政治家に対する受話者の印象形成を制御可能であることが記載されている。

岡田陽介, "政治家の印象形成における声の高低の影響: 音声合成ソフトを用いた女声による実験研究", 応用社会学研究, vol.58, pp.53-66, 2016.

　ところが、非特許文献１のように合成音声を用いて発話者に対する受話者の印象形成を制御すると、音声特徴量が改変されるため、発話者の意図が受話者に正しく伝わらなくなる可能性がある。

　この発明は上記事情に着目してなされたもので、発話者の意図を改変することなく発話者に対する受話者の印象形成を制御できるようにする技術を提供しようとするものである。

　上記課題を解決するためにこの発明に係る印象形成制御装置又は方法の一態様は、発話者に対する受話者の印象形成を制御する際に、前記発話者の発話音声信号を取得し、取得された前記発話音声信号から音声特徴量を抽出し、抽出された前記音声特徴量に基づいて、前記発話音声信号により前記受話者に生じる印象に対するバイアスを判定し、前記バイアスの判定結果と、予め設定された前記バイアスの制御方向を表す情報とに基づいて、前記バイアスを制御するためのバイアス制御信号を生成し、前記バイアス制御信号に従い、前記受話者に対し外部刺激を与えるための刺激制御信号を生成し出力するようにしたものである。

　この発明の一態様によれば、発話者の意図を改変することなく発話者に対する受話者の印象形成を制御できるようにした技術を提供することができる。

図１は、この発明の一実施形態に係る印象形成制御装置を備えるシステムの構成の一例を示す図である。図２は、この発明の一実施形態に係る印象形成制御装置のハードウェア構成の一例を示すブロック図である。図３は、この発明の一実施形態に係る印象形成制御装置のソフトウェア構成の一例を示すブロック図である。図４は、図３に示した印象形成制御装置の制御部が実行する印象形成制御処理の処理手順と処理内容の一例を示すフローチャートである。図５は、図４に示した処理手順のうちバイアス判定処理の第１の実施例の処理手順と処理内容の一例を示すフローチャートである。図６は、図４に示した処理手順のうちバイアス判定処理の第２の実施例の処理手順と処理内容の一例を示すフローチャートである。図７は、図４に示した処理手順のうちバイアス制御信号生成処理の処理手順と処理内容の一例を示すフローチャートである。

　以下、図面を参照してこの発明に係わる実施形態を説明する。

　［一実施形態］
　（構成例）
　この発明の一実施形態では、講演会やセミナー等をネットワークを介して行う場合を例にとって説明を行う。

　（１）システム
　図１は、この発明の一実施形態に係る印象形成制御装置ＳＶを備えるシステムの構成の一例を示す図である。

　一実施形態のシステムは、例えば、講演会またはセミナーにおける講師（以後発話者とも云う）ＵＳ１が、マイクロフォンＭＣを備える講演用の端末ＴＭ１を使用して、受講者（以後受話者とも云う）ＵＳ２が使用する受講用の端末ＴＭ２に向け、ネットワークＮＷおよび印象形成制御装置ＳＶを介して発話音声信号を送信する。ネットワークＮＷは、インターネット等の公衆ＩＰネットワークを備える広域ネットワークからなる。

　講演用の端末ＴＭ１および受講用の端末ＴＭ２は、いずれも例えばパーソナルコンピュータからなり、これらの端末ＴＭ１，ＴＭ２は例えばＬＡＮ（Local Area Network）等のアクセスネットワークを介してネットワークＮＷに接続される。

　なお、端末ＴＭ１，ＴＭ２は、例えばスマートフォンやタブレット型端末等の携帯端末であってもよく、またアクセスネットワークとしては無線ＬＡＮや公衆移動通信ネットワークが用いられてもよい。また、マイクロフォンＭＣは、端末ＴＭ１に対し外付けのタイプでもよいし、内蔵タイプでもよい。

　（２）装置
　（２－１）印象形成制御装置ＳＶ
　図２および図３は、それぞれ印象形成制御装置ＳＶのハードウェアおよびソフトウェアの構成の一例を示すブロック図である。

　印象形成制御装置ＳＶは、例えばクラウド上またはＷｅｂ上に配置されるサーバコンピュータからなり、中央処理ユニット（Central Processing Unit：ＣＰＵ）等のハードウェアプロセッサを使用した制御部１を備える。そして、この制御部１に対し、バス５を介して、プログラム記憶部２およびデータ記憶部３を有する記憶ユニットと、通信インタフェース（以後インタフェースをＩ／Ｆと略称する）部４を接続したものとなっている。

　通信Ｉ／Ｆ部４は、制御部１の制御の下、ネットワークＮＷにより定義される通信プロトコルを使用して、講演用の端末ＴＭ１および受講用の端末ＴＭ２との間で、それぞれ音声データ等の送受信を行う。

　プログラム記憶部２は、例えば、記憶媒体としてＨＤＤ（Hard Disk Drive）またはＳＳＤ（Solid State Drive）等の随時書込みおよび読出しが可能な不揮発性メモリと、ＲＯＭ（Read Only Memory）等の不揮発性メモリとを組み合わせて構成したもので、ＯＳ（Operating System）等のミドルウェアに加えて、この発明の一実施形態に係る各種制御処理を実行するために必要なアプリケーション・プログラムを格納する。

　データ記憶部３は、例えば、記憶媒体としてＨＤＤまたはＳＳＤ等の随時書込みおよび読出しが可能な不揮発性メモリとＲＡＭ（Random Access Memory）等の揮発性メモリと組み合わせたもので、一実施形態に係る記憶領域として、音声信号記憶部３１と、制御方向設定情報記憶部３２とを備えている。

　音声信号記憶部３１は、講演用の端末ＴＭ１から送信される発話者の発話音声信号を、印象形成制御処理のために一時保存する。

　制御方向設定情報記憶部３２は、印象形成を制御する際のバイアス制御方向を設定する情報を記憶する。バイアスとは、講演を行っている発話者ＵＳ１に対して受講側の受話者ＵＳ２が感じる印象の物理量を表すもので、上記制御方向の設定情報は上記バイアスの制御方向を定義する情報である。

　制御部１は、この発明の一実施形態に係る処理機能として、発話音声信号取得処理部１１と、音声特徴量抽出処理部１２と、バイアス判定処理部１３と、バイアス制御信号生成処理部１４と、提示内容決定処理部１５とを備えている。これらの処理部１１～１５は、何れもプログラム記憶部２に格納されたアプリケーション・プログラムを制御部１のハードウェアプロセッサに実行させることにより実現される。

　なお、上記処理部１１～１５の一部または全部は、ＬＳＩ（Large Scale Integration）やＡＳＩＣ（Application Specific Integrated Circuit）等のハードウェアを用いて実現されてもよい。

　発話音声信号取得処理部１１は、講演用の端末ＴＭ１から送信された発話者ＵＳ１の発話音声信号を通信Ｉ／Ｆ部４を介して受信し、受信した上記発話音声信号を音声信号記憶部３１に一時保存する。

　音声特徴量抽出処理部１２は、上記音声信号記憶部３１から上記発話音声信号を読み込んで入力とし、読み込んだ上記発話音声信号から音声特徴量を抽出し、出力する。音声特徴量としては、例えば基本周波数、発話速度および抑揚のうち少なくとも１つが抽出される。

　バイアス判定処理部１３は、上記音声特徴量抽出処理部１２により抽出された上記発話音声信号の音声特徴量を入力とし、上記発話音声信号の音声特徴量をもとに、受話者ＵＳ２に生じると推定されるバイアスを判定し、バイアスの判定結果を出力する。判定処理の一例は動作例において詳しく説明する。

　バイアス制御信号生成処理部１４は、上記バイアス判定処理部１３から上記バイアスの判定結果を入力とすると共に、制御方向設定情報記憶部３２から制御方向の設定情報を読み込んで入力とする。そして、バイアス制御信号生成処理部１４は、上記バイアスの判定結果および上記制御方向の設定情報に基づいて、受話者ＵＳ２に生じるバイアスを制御するためのバイアス制御信号を生成し、出力する。

　提示内容決定処理部１５は、上記バイアス制御信号生成処理部１４により生成された上記バイアス制御信号を入力とし、上記バイアス制御信号に基づいて、受話者ＵＳ２に与える物理的な外部刺激の内容を決定する。物理的な外部刺激としては、例えば温度または硬度が変化する触覚刺激が用いられる。なお、バイアス制御信号の生成処理の一例についても動作例において詳しく説明する。
　そして、提示内容決定処理部１５は、上記外部刺激の内容に対応する刺激制御信号を生成し、生成した上記刺激制御信号を通信Ｉ／Ｆ部４から受話者ＵＳ２の端末ＴＭ２へ送信する。

　（２－２）受講側の端末ＴＭ２
　受講側の端末ＴＭ２には、受話者ＵＳ２に対し物理的な外部刺激を与えるための提示デバイスＶＢが接続されている。提示デバイスＶＢとしては、例えば、ペルチェ素子を内蔵して温度の提示を可能にしたマウスや、伸縮により硬度の提示を可能にした弾性体等が用いられる。受講用の端末ＴＭ２は、受信した上記刺激制御信号を入力とし、上記刺激制御信号に応じて上記提示デバイスＶＢを駆動し、これにより例えば上記温度または硬度を変化させる。上記温度または硬度を変化させることによって、受話者ＵＳ２に生じるバイアスを変化させる効果が期待できる。

　なお、受話者ＵＳ２に与える物理的な外部刺激としては、上記温度または硬度の変化といった触覚刺激以外に、例えば風圧や振動が加わる触覚刺激、発光の有無や強弱または発光色の変化といった視覚刺激、香りの有無や変化といった嗅覚刺激等が用いられてもよい。これらの物理的な外部刺激は、提示デバイスＶＢとして、例えば扇風機、バイブレータ、ディスプレイ、アロマディフューザ等を用いることで、受話者ＵＳ２に与えることができる。

　（動作例）
　次に、以上のように構成された印象形成制御装置ＳＶの動作例を説明する。　
　図４は、印象形成制御装置ＳＶの制御部１が実行する印象形成制御処理の処理手順と処理内容の一例を示すフローチャートである。

　（１）制御方向の設定
　印象形成制御の開始に先立ち、印象形成制御装置ＳＶの制御部１は、例えばシステム管理者の入力に応じて制御方向の設定処理を行う。制御方向とは、受講者である受話者に提示するバイアスの制御方向を設定するもので、例えば、“正”、“負”、“抑制”の３種類が設定される。印象形成制御装置ＳＶの制御部１は、設定した上記制御方向を表す情報を制御方向設定情報記憶部３２に記憶させる。
　バイアスの例としては、信頼度、親密度、好感度等が挙げられる。バイアスが正の方向とは、例えば信頼度であれば信頼が深まる方向、親密度であれば親密さが深まる方向、好感度であれば好感度が高まる方向を表し、バイアスが負の方向は逆の方向を表す。バイアスを抑制する方向とは、バイアス自体が変化しないようにすることを表す。なお、以下でもバイアスとしては、信頼度、親密度、好感度、などの例で説明していくが、これらはあくまでもバイアスの一例である。バイアスとしては、物理的な外部刺激により影響を受けるものであれば何でもよく、信頼度、親密度、好感度に限るものではない。

　なお、制御方向は、講師である発話者により設定されるようにしてもよいし、受講者である受話者により設定されるようにしてもよい。

　（２）発話音声信号の取得
　講演会またはセミナーに参加する場合に、受講者である受話者ＵＳ２は、例えば主催者から事前に通知されたサイトのＵＲＬ（Uniform Resource Locator）に対しアクセスする。そうすると、例えば講演用の端末ＴＭ１と受講用の端末ＴＭ２との間に、印象形成制御装置ＳＶを経由する回線が設定される。

　この状態で、印象形成制御装置ＳＶの制御部１は、ステップＳ１において、講演用の端末ＴＭ１から送信される発話音声信号をもとに、講師である発話者ＵＳ１の発話開始を判定する。そして、発話が開始されると印象形成制御装置ＳＶの制御部１は、発話音声信号取得処理部１１の制御の下、ステップＳ２において、以後講演用の端末ＴＭ１から送信される発話者ＵＳ１の発話音声信号を通信Ｉ／Ｆ部４を介して受信し、受信した上記発話音声信号を音声信号記憶部３１に一時保存させる。

　なお、発話音声信号の取得タイミングは任意に設定すればよく、また取得時間長についても、音声特徴量を抽出可能な長さであればどのような長さに設定してもよい。例えば、発話音声信号の取得タイミングは、発話者の切り替わり時や受話者が発話者の印象を形成するのにかかる時間に基づいて定まる所定時間としてもよいし、発話音声信号の取得時間長は、話者の印象推定に受話者が必要な時間に基づいて定める時間、例えば１０秒程度に設定するとよい。

　また、発話音声信号の取得回数は１回でもよいが、講演中に所定長分ずつ複数回取得されるように設定してもよい。発話音声信号を定期的に複数回取得すると、講演中に発話者ＵＳ１の発話音声信号の音声特徴量が変化して受話者に生じる印象が変化した場合でも、この印象の変化に応じて受話者ＵＳ２に提示するバイアスを制御し直すことが可能となる。

　（３）音声特徴量の抽出
　発話音声信号が取得されると印象形成制御装置ＳＶの制御部１は、ステップＳ３において、音声特徴量抽出処理部１２の制御の下、音声信号記憶部３１から上記発話音声信号を読み込み、読み込んだ上記発話音声信号から音声特徴量を抽出する。音声特徴量としては、例えば基本周波数、発話速度および抑揚のうち少なくとも１つが抽出される。

　なお、音声特徴量の抽出手法には、例えば以下の参考文献１に記載された周知の手法を用いることができるが、参考文献１に記載された手法に限定されるものではない。　
　［参考文献１］　F. Eyben, M. Wo¨llmer, and B. Schuller, “OpenSMILE-The Munich versatile and fast open-source audio feature extractor,” MM’10-Proc. ACM Multimed. 2010 Int. Conf., pp. 1459-1462, 2010.

　（４）バイアス判定
　印象形成制御装置ＳＶの制御部１は、次にステップＳ４において、バイアス判定処理部１３の制御の下、上記音声特徴量をもとに発話者ＵＳ１の発話音声信号により受話者ＵＳ２に生じると推定されるバイアスを判定する。

　バイアスの判定手法には、音声特徴量の種類に応じて以下のような手法が使用される。　
　（４－１）基本周波数の場合
　図５は、音声特徴量が「基本周波数」の場合に、バイアス判定処理部１３が実行するバイアス判定処理の処理手順と処理内容の一例を示すフローチャートである。

　バイアス判定処理部１３は、先ずステップＳ４１１により、上記音声特徴量抽出処理部１２から音声特徴量として抽出された「基本周波数」を受け取り、この基本周波数の高低に基づいて、受話者ＵＳ２に生じると推定されるバイアスを判定する。

　ここで、基本周波数の高低とバイアスとの関係は、非特許文献１に例示されるように、低い声は「信頼度」、「親密度」、「好感度」の評価が高く、逆に高い声は評価が低くなる傾向があることが知られている。

　そこで、バイアス判定処理部１３は、ステップＳ４１２において、上記基本周波数ｆ_Bが例えば３００Hz以下であるか否かを判定すると共に、ステップＳ４１４において、上記基本周波数ｆ_Bが例えば６００Hz以上であるか否かを判定する。

　上記判定の結果、基本周波数ｆ_Bが３００Hz以下であれば、バイアス判定処理部１３はステップＳ４１３において、受話者ＵＳ２に生じると推定されるバイアスは“正”と判定する。一方、基本周波数ｆ_Bが６００Hz以上であれば、バイアス判定処理部１３はステップＳ４１５において、受話者ＵＳ２に生じると推定されるバイアスは“負”と判定する。なお、基本周波数ｆ_Bが上記３００Hzより高く上記６００Hz未満であれば、バイアス判定処理部１３はステップＳ４１６により、受話者ＵＳ２にバイアスは生じない、つまりバイアス“無”と判定する。

　なお、発話者ＵＳ１と受話者ＵＳ２との関係により「信頼度」、「親密度」、「好感度」の評価は異なる。このため、基本周波数ｆ_Bの高低を判定するしきい値は、上記３００Hz、６００Hzに限らず任意に設定できるようにすることが望ましい。

　バイアス判定処理部１３は、最後にステップＳ４１７において、上記ステップＳ４１３、Ｓ４１５またはＳ４１６により得られた判定結果を、バイアス制御信号生成処理部１４へ出力する。

　（４－２）発話速度の場合
　図６は、音声特徴量が「発話速度」の場合に、バイアス判定処理部１３が実行するバイアス判定処理の処理手順と処理内容の一例を示すフローチャートである。

　バイアス判定処理部１３は、先ずステップＳ４２１により、上記音声特徴量抽出処理部１２から音声特徴量として抽出された「発話速度」を受け取り、この発話速度が速いか遅いかに基づいて、受話者ＵＳ２に生じると推定されるバイアスを判定する。
　発話速度が速いか遅いかとバイアスとの間に関係があることは周知である。例えば、発話速度が比較的速いと「外交的」な評価が高くなる傾向があり、逆に発話速度が遅い場合は「外交的」な評価が低くなる傾向があるなどの知見は、以下の参考文献２に記載されている。

　［参考文献２］　内田照久, “音声の発話速度が話者の性格印象に与える影響”,心理学研究,vol.73,no.2,pp.131-139,2002.

　ここで、例えばバイアスを「信頼度」、「親密度」、「好感度」とすると、発話速度が比較的速い場合は「信頼度」、「親密度」、「好感度」の評価が高く、逆に発話速度が遅い場合は「信頼度」、「親密度」、「好感度」の評価が低くなる。

　そこで、バイアス判定処理部１３は、ステップＳ４２２において、上記発話速度が例えば１０．８モーラ／sec以上であるか否かを判定すると共に、ステップＳ４２４において、上記発話速度が例えば６．９６モーラ／sec以下であるか否かを判定する。なお、モーラとは、五十音の「かな」と「長音」、「促音」、「撥音」の数を表す単位である。

　上記判定の結果、発話速度が１０．８モーラ／sec以上であれば、バイアス判定処理部１３はステップＳ４２３において、受話者ＵＳ２に生じると推定されるバイアスは“正”と判定する。一方、発話速度が６．９６モーラ／sec以下であれば、バイアス判定処理部１３はステップＳ４２５において、受話者ＵＳ２に生じると推定されるバイアスは“負”と判定する。なお、発話速度が上記６．９６モーラ／secより高く上記１０．８モーラ／sec未満であれば、バイアス判定処理部１３はステップＳ４２６により、バイアス“無”と判定する。

　なお、この場合も、発話者ＵＳ１と受話者ＵＳ２との関係により「信頼度」、「親密度」、「好感度」は異なる。このため、発話速度を判定するしきい値は、上記１０．８モーラ／sec、６．９６モーラ／secに限らず任意に設定できるようにすることが望ましい。

　バイアス判定処理部１３は、最後にステップＳ４２７において、上記ステップＳ４２３、Ｓ４２５またはＳ４２６により得られた判定結果を、バイアス制御信号生成処理部１４へ出力する。

　（４－３）抑揚の場合
　一般に、発話の抑揚の大小とバイアスとの間に関係があることは周知である。例えば、抑揚が大きいと「外交的」な評価が高くなる傾向があり、逆に抑揚が小さいと「外交的」な評価が低くなる傾向があるなどの知見は、以下の参考文献３に記載されている。

　［参考文献３］　内田照久, “音声中の抑揚の大きさと変化パターンが話者の性格印象に与える影響”,心理学研究, vol.76,no.4,pp.382-390,2005.

　上記バイアスを「信頼度」、「親密度」、「好感度」とすると、抑揚が大きいと「信頼度」、「親密度」、「好感度」の評価が高く、逆に抑揚が小さいと「信頼度」、「親密度」、「好感度」の評価が低くなる。

　そこで、バイアス判定処理部１３は、図５に示した基本周波数の判定処理手順と同様に、「抑揚」を表す基本周波数の標準偏差が例えば４０Hz以上であるか否かを判定すると共に、上記基本周波数の標準偏差が例えば２０Hz以下であるか否かを判定する。そして、この判定の結果、基本周波数の標準偏差が例えば４０Hz以上であれば、バイアス判定処理部１３は、受話者ＵＳ２に生じると推定されるバイアスは“正”と判定する。一方、基本周波数の標準偏差が例えば２０Hz以下であれば、バイアス判定処理部１３は、受話者ＵＳ２に生じると推定されるバイアスは“負”と判定する。なお、基本周波数の標準偏差が上記２０Hzより高く上記４０Hz未満であれば、バイアス判定処理部１３は、受話者にバイアスは“無”と判定する。

　なお、この場合も、発話者ＵＳ１と受話者ＵＳ２との関係により「信頼度」、「親密度」、「好感度」の評価が異なるため、基本周波数の標準偏差を判定するしきい値は、上記４０Hz、２０Hzに限らず任意に設定するとよい。

　バイアス判定処理部１３は、最後に上記判定結果をバイアス制御信号生成処理部１４へ出力する。

　（５）バイアス制御信号の生成
　印象形成制御装置ＳＶの制御部１は、次にステップＳ５において、バイアス制御信号生成処理部１４の制御の下、受話者ＵＳ２に対し物理的な外部刺激を提示するためのバイアス制御信号を生成する処理を、以下のように実行する。

　図７は、バイアス制御信号生成処理部１４が実行するバイアス制御信号生成処理の処理手順と処理内容の一例を示すフローチャートである。

　バイアス制御信号生成処理部１４は、先ずステップＳ５１により制御方向設定情報記憶部３２から制御方向の設定情報を読み込むと共に、ステップＳ５２により上記バイアス判定処理部１３からバイアスの判定結果を受け取る。

　バイアス制御信号生成処理部１４は、次にステップＳ５３において読み込まれた上記制御方向の設定情報が“正”、“負”、“抑制”のいずれであるかを判定する。この判定の結果、“正”であればステップＳ５４において、受話者ＵＳ２に“正”のバイアスを生じさせるためのバイアス制御信号「positive」を生成する。

　上記バイアス制御信号「positive」は、上記音声特徴量から判定されたバイアスの判定結果が“正”の場合に、この“正”のバイアスをさらに高めるための外部刺激を発生させる機能を有する。これにより受話者ＵＳ２に生じる“正”のバイアスを増幅させる効果が期待できる。また、上記バイアス制御信号「positive」は、上記音声特徴量から判定されたバイアスの判定結果が“負”の場合に、この“負”のバイアスを打ち消すための外部刺激を発生させる機能を有する。これにより受話者ＵＳ２に“正”のバイアスを生じさせる効果が期待できる。さらに、上記バイアス制御信号「positive」は、上記音声特徴量から判定されたバイアスの判定結果が“無”の場合に、受話者ＵＳ２に“正”のバイアスを生じさせるための外部刺激を発生させる機能を有する。

　一方、上記ステップＳ５３による制御方向の判定の結果、制御方向が“負”だったとする。この場合、バイアス制御信号生成処理部１４は、ステップＳ５５において、受話者ＵＳ２に“負”のバイアスを生じせるためのバイアス制御信号「negative」を生成する。

　上記バイアス制御信号「negative」は、上記音声特徴量から判定されたバイアスの判定結果が“正”の場合に、この“正”のバイアスを打ち消すための外部刺激を発生させる機能を有する。これにより受話者ＵＳ２に“負”のバイアスを生じさせる効果が期待できる。また、上記バイアス制御信号「negative」は、上記音声特徴量から判定されたバイアスの判定結果が“負”の場合に、この“負”のバイアスをさらに高めるための外部刺激を発生させる機能を有する。これにより受話者ＵＳ２の“負”のバイアスを増幅させる効果が期待できる。さらに、上記バイアス制御信号「negative」は、上記音声特徴量から判定されたバイアスの判定結果が“無”の場合に、受話者ＵＳ２に“負”のバイアスを生じさせるための外部刺激を発生させる機能を有する。

　最後に、上記ステップＳ５３による制御方向の判定の結果、制御方向が“抑制”だったとする。この場合、バイアス制御信号生成処理部１４は、ステップＳ５６において、上記音声特徴量から判定されたバイアスの判定結果が“正”、“負”、“無”のいずれであるかを判定する。

　この判定の結果、上記音声特徴量から判定されたバイアスが“正”だったとする。この場合、バイアス制御信号生成処理部１４は、ステップＳ５７において、受話者ＵＳ２に“正”のバイアスを打ち消すためのバイアス制御信号「n-negative」を生成する。このバイアス制御信号「n-negative」は、受話者ＵＳ２のバイアスを“無”の方向に変化させるための外部刺激を発生させるための信号である。

　一方、上記ステップＳ５６による判定の結果、音声特徴量から判定されたバイアスが“負”だったとする。この場合、バイアス制御信号生成処理部１４は、ステップＳ５８において、上記音声特徴量から判定された“負”のバイアスを“正”方向に変化させるためのバイアス制御信号「n-positive」を生成する。このバイアス制御信号「n-positive」は、受話者ＵＳ２に対し“正”方向のバイアスを与えるように外部刺激を発生させるための信号である。受話者ＵＳ２に対し“正”方向のバイアスを与えるように外部刺激を発生させることで受話者ＵＳ２のバイアスを“無”の方向に変化させる効果が期待できる。

　また、上記ステップＳ５６による判定の結果、音声特徴量から判定されたバイアスが“無”だったとする。この場合、バイアス制御信号生成処理部１４は、バイアス制御信号を生成せずにそのままバイアス制御信号の生成処理を終了する。

　（６）提示内容の決定と刺激制御信号の送信
　印象形成制御装置ＳＶの制御部１は、最後にステップＳ６において、提示内容決定処理部１５の制御の下、受話者ＵＳ２に対し提示する外部刺激の内容を決定して、刺激制御信号を送信する処理を、以下のように実行する。

　すなわち、提示内容決定処理部１５は、上記バイアス制御信号生成処理部１４から上記バイアス制御信号を受け取り、受け取った上記バイアス制御信号に基づいて、受話者ＵＳ２に与える外部刺激の内容を決定する。そして、決定された上記外部刺激の内容に応じて、提示デバイスＶＢを動作させるための刺激制御信号を生成する。

　（６－１）外部刺激に「温度」を使用する場合
　一般に、人は、手に温かい物を持ったときや室内が温かいときのほうが、冷たい物を持ったときや室内が寒いときに比べて、知人や実験者との間柄を「近しい」と感じる傾向がある。この知見は、例えば参考文献４で報告されている。

　［参考文献４］　H. Ijzerman and G. R. Semin, “The thermometer of social relations: Mapping social proximity on temperature: Research article,” Psychol. Sci., vol. 20, no. 10, pp. 1214-1220, 2009.

　そこで、例えば提示デバイスＶＢとして、温度提示が可能なペルチェ素子を内蔵したマウスを使用する。この場合提示内容決定処理部１５は、外部刺激の提示内容を以下のように決定する。

　(1) バイアス制御信号が「positive」の場合には、提示内容を、一般的に人が温かいと感じる温度である「40度」に設定する。
　(2) バイアス制御信号が「n-positive」の場合には、提示内容を、上記「positive」の場合よりも低い温度でかつ人が温かいと感じる温度である「35度」に設定する。
　(3) バイアス制御信号が「n-negative」の場合には、提示内容を、上記「n-positive」の場合よりも低い温度でかつ人が冷たいと感じる温度である「30度」に設定する。
　(4) バイアス制御信号が「negative」の場合には、提示内容を、上記「n-negative」よりも低い温度でかつ人が冷たいと感じる温度である「25度」に設定する。

　なお、温度の提示内容は上記例に限ることはなく、受話者ＵＳ２の温感の個人差等に応じて任意に設定できるようにするとよい。

　提示内容決定処理部１５は、決定された上記提示内容の温度を提示デバイスＶＢに発生させるための刺激制御信号を生成する。そして、提示内容決定処理部１５は、生成した上記刺激制御信号を通信Ｉ／Ｆ部４から、受話者が使用している受講用の端末ＴＭ２に向け送信する。

　受講用の端末ＴＭ２は、上記刺激制御信号を受信すると、受信した上記刺激制御信号に従い提示デバイスＶＢを駆動し、上記刺激制御信号により指定された温度を発生させる。従って、このとき受話者ＵＳ２が上記提示デバイスＶＢとしてのマウスを把持していれば、受話者ＵＳ２に対し上記「温度」による外部刺激を与えることができ、これにより講師である発話者ＵＳ１に対する受話者ＵＳ２の印象を制御することができるという効果が期待できる。

　（６－２）外部刺激に「硬度」を使用する場合
　一般に、人は固い物を触った場合、柔らかい物を触った場合と比べ、相手人物を厳しく非感情的と評価する傾向がある。この知見は、例えば以下の参考文献５で報告されている。

　［参考文献５］　J. M. Ackerman, C. C. Nocera, and J. A. Bargh, “Incidental Haptic Sensations Influence Social Judgments and Decisions,” Science (80-. )., vol. 328, no. 5986, pp. 1712-1715, Jun. 2010.

　そこで、例えば圧力を加えることで硬度が変化する風船を提示デバイスＶＢとして使用する。この風船を用いて硬度を提示するデバイスについては、例えば以下の参考文献６に示されている。なお、風船の代わりに、例えば伸縮により硬度の提示を可能にした弾性体を使用することも可能である。

　［参考文献６］　笹川真奈, et al. “ジャミング転移による硬さおよび形状の提示が可能な食感提示システムの提案”，情報処理学会論文誌，vol.60，no.2，pp.376-384，2019.

　提示デバイスＶＢとして上記風船を使用する場合、提示内容決定処理部１５は外部刺激の提示内容を以下のように決定する。

　(1) バイアス制御信号が「positive」の場合には、提示内容を、一般的に人が柔らかいと感じる硬度である「-10kPa」に設定する。
　(2) バイアス制御信号が「n-positive」の場合には、提示内容を、上記「positive」の場合よりも低い硬度でかつ人が硬いと感じる硬度である「-30kPa」に設定する。
　(3) バイアス制御信号が「n-negative」の場合には、提示内容を、上記「n-positive」の場合よりも低い硬度でかつ人が硬いと感じる硬度である「-50kPa」に設定する。
　(4) バイアス制御信号が「negative」の場合には、提示内容を、上記「n-negative」よりも低い硬度でかつ人が硬いと感じる硬度である「-70kPa」に設定する。

　なお、硬度の提示内容は上記例に限ることはなく、例えば受話者ＵＳ２の硬さに対する感じ方の個人差に応じて任意に設定できるようにするとよい。

　提示内容決定処理部１５は、決定した上記提示内容の硬度を提示デバイスＶＢに発生させるための刺激制御信号を生成する。そして、提示内容決定処理部１５は、生成した上記刺激制御信号を通信Ｉ／Ｆ部４から、受話者が使用している受講用の端末ＴＭ２に向け送信する。

　受講用の端末ＴＭ２は、上記刺激制御信号を受信すると、受信した上記刺激制御信号に従い提示デバイスＶＢを駆動して、上記刺激制御信号により指定された硬度を発生させる。従って、このとき受話者ＵＳ２が上記提示デバイスＶＢとしての風船を把持していれば、受話者ＵＳ２に対し上記「硬度」による外部刺激を与えることができ、これにより講師である発話者ＵＳ１に対する受話者ＵＳ２の印象を制御することができるという効果が期待できる。

　（作用・効果）
　以上述べたように一実施形態では、印象形成制御装置ＳＶにおいて、先ず講師である発話者ＵＳ１の発話音声信号を取得してその音声特徴量を抽出し、抽出した上記音声特徴量をもとに受講者である受話者ＵＳ２に生じると推定されるバイアスを判定する。次に、このバイアスの判定結果と、事前に設定されたバイアスの制御方向を表す情報とに基づいて、受話者ＵＳ２に対し物理的な外部刺激を提示するためのバイアス制御信号を生成し、生成した上記バイアス制御信号に基づいて受話者ＵＳ２に与える外部刺激の内容を決定して、この外部刺激の内容に対応する刺激制御信号を受話者ＵＳ２の端末ＴＭ２へ送信する。そして、上記刺激制御信号により提示デバイスＶＢを駆動して上記受話者ＵＳ２に対し物理的な外部刺激をバイアスとして与え、これにより発話者ＵＳ１に対する受話者ＵＳ２の印象を変化させるようにしている。

　従って、例えば受講者である受話者ＰＳ２が、講師である発話者ＰＳ１に対しその発話音声信号によりネガティブな印象を生じたとしても、受話者ＰＳ２に対し温度や硬度を用いた外部刺激によりバイアスを与えることで、受話者ＰＳ２に生じている上記ネガティブな印象を打ち消すかまたは緩和させることが可能となる。また、発話者ＰＳ１から発せられる発話音声信号の音声特徴量を改変しないので、受話者ＰＳ２に対し発話者ＰＳ１の意図を正確に伝えることが可能となる。

　［その他の実施形態］
　（１）前記一実施形態では、受講者たる受話者ＰＳ２が講師である発話者ＰＳ１の講演をネットワークを介して受講する場合を例にとって説明した。しかし、それに限らず、発話者ＰＳ１の講演を受話者ＰＳ２が対面で受講する場合にもこの発明は適用可能である。この場合も一実施形態と同様の構成により実施可能である。

　例えば、発話者ＰＳ１の発話音声信号を講演用の端末ＴＭ１から印象形成制御装置ＳＶへ送信する。そして、印象形成制御装置ＳＶにより、上記発話音声信号の音声特徴量から受話者ＰＳ２に生じると推定されるバイアスを判定し、その判定結果に基づいて受話者ＰＳ２のバイアスを制御するための制御信号を生成して受講用の端末ＴＭ２へ送信する。端末ＴＭ２は、上記制御信号に従い提示デバイスＶＢを駆動して受話者ＰＳ２に対し外部刺激を与え、これにより上記受話者ＰＳ２に生じるバイアスを制御することができるという効果が期待できる。

　（２）前記一実施形態では、クラウド上またはＷｅｂ上に配置されたサーバコンピュータに印象形成制御装置ＳＶの処理機能を持たせた場合を例にとって説明した。しかし、これに限らず、例えば講演用の端末ＴＭ１或いは受講用の端末ＴＭ２に印象形成制御装置ＳＶの処理機能を持たせるようにしてもよい。さらには、印象形成制御装置ＳＶの処理機能を、講演用の端末ＴＭ１と、受講用の端末ＴＭ２と、クラウド上またはＷｅｂ上に配置されたサーバコンピュータに分散配置するようにしてもよい。

　（３）その他、印象形成制御装置ＳＶの構成、処理手順と処理内容、外部刺激の発生タイミング、外部刺激の種類とその提示手段、印象形成制御装置ＳＶの利用シーン等についても、この発明の要旨を逸脱しない範囲で種々変形して実施可能である。

　以上、この発明の実施形態を詳細に説明してきたが、前述までの説明はあらゆる点においてこの発明の例示に過ぎない。この発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、この発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。

　要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。

　ＳＶ…印象形成制御装置
　ＵＳ１…発話者
　ＵＳ２…受話者
　ＴＭ１…講演用の端末
　ＴＭ２…受講用の端末
　ＮＷ…ネットワーク
　ＭＣ…マイクロフォン
　ＶＢ…提示デバイス
　１…制御部
　２…プログラム記憶部
　３…データ記憶部
　４…通信Ｉ／Ｆ部
　５…バス
　１１…発話音声信号取得処理部
　１２…音声特徴量抽出処理部
　１３…バイアス判定処理部
　１４…バイアス制御信号生成処理部
　１５…提示内容決定処理部
　３１…音声信号記憶部
　３２…制御方向設定情報記憶部

Claims

　発話者に対する受話者の印象形成を制御する印象形成制御装置であって、
　前記発話者の発話音声信号を取得する第１の処理部と、
　前記発話音声信号から音声特徴量を抽出する第２の処理部と、
　前記音声特徴量に基づいて、前記発話音声信号により前記受話者に生じる印象に対するバイアスを判定する第３の処理部と、
　前記バイアスの判定結果と、予め設定された前記バイアスの制御方向を表す情報とに基づいて、前記バイアスを制御するためのバイアス制御信号を生成する第４の処理部と、
　前記バイアス制御信号に従い、前記受話者に対し外部刺激を与えるための刺激制御信号を生成し、生成された前記刺激制御信号を出力する第５の処理部と
　を具備する印象形成制御装置。
　前記第２の処理部は、前記音声特徴量として前記発話音声信号から基本周波数、発話速度および抑揚のうちの少なくとも１つを抽出し、
　前記第３の処理部は、抽出された前記音声特徴量を予め設定された判定条件と比較し、その比較結果に基づいて前記受話者に生じる前記バイアスを判定する、
　請求項１に記載の印象形成制御装置。
　前記第４の処理部は、前記外部刺激が温度の場合に、前記バイアスの判定結果と、予め設定された前記バイアスの制御方向を表す情報とに基づいて、前記温度の制御方向と制御量を指定する前記バイアス制御信号を生成し、
　前記第５の処理部は、前記バイアス制御信号に従い、前記受話者に対し前記温度の変化による前記外部刺激を与えるための前記刺激制御信号を生成し、生成された前記刺激制御信号を出力する、
　請求項１に記載の印象形成制御装置。
　前記第４の処理部は、前記外部刺激が硬度の場合に、前記バイアスの判定結果と、予め設定された前記バイアスの制御方向を表す情報とに基づいて、前記硬度の制御方向と制御量を指定する前記バイアス制御信号を生成し、
　前記第５の処理部は、前記バイアス制御信号に従い、前記受話者に対し前記硬度の変化による前記外部刺激を与えるための前記刺激制御信号を生成し、生成された前記刺激制御信号を出力する、
　請求項１に記載の印象形成制御装置。
　情報処理装置により実行される、発話者に対する受話者の印象形成を制御する印象形成制御方法であって、
　前記発話者の発話音声信号を取得する過程と、
　前記発話音声信号から音声特徴量を抽出する過程と、
　前記音声特徴量に基づいて、前記発話音声信号により前記受話者に生じる印象に対するバイアスを判定する過程と、
　前記バイアスの判定結果と、予め設定された前記バイアスの制御方向を表す情報とに基づいて、前記バイアスを制御するためのバイアス制御信号を生成する過程と、
　前記バイアス制御信号に従い、前記受話者に対し外部刺激を与えるための刺激制御信号を生成し、生成された前記刺激制御信号を出力する過程と
　を具備する印象形成制御方法。
　請求項１乃至請求項４のいずれかに記載の印象形成制御装置において、前記第１の処理部乃至前記第５の処理部の少なくとも１つの処理を、前記印象形成制御装置が備えるプロセッサに実行させるプログラム。