JP2008256857A - 形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラム - Google Patents

形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラム Download PDF

Info

Publication number
JP2008256857A
JP2008256857A JP2007097608A JP2007097608A JP2008256857A JP 2008256857 A JP2008256857 A JP 2008256857A JP 2007097608 A JP2007097608 A JP 2007097608A JP 2007097608 A JP2007097608 A JP 2007097608A JP 2008256857 A JP2008256857 A JP 2008256857A
Authority
JP
Japan
Prior art keywords
keyword
appearance
setting
unit
turning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007097608A
Other languages
English (en)
Inventor
Hitoshi Morikawa
仁志 森川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SKY Co Ltd
Original Assignee
SKY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SKY Co Ltd filed Critical SKY Co Ltd
Priority to JP2007097608A priority Critical patent/JP2008256857A/ja
Publication of JP2008256857A publication Critical patent/JP2008256857A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Toys (AREA)

Abstract

【課題】プレゼンターの説明に合わせて、身体の向きを変えることができる形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラムを得ることを目的とする。
【解決手段】音声入力部7から出力された音声信号を解析して、キーワード設定部1により設定されたキーワードの出現を検出するキーワード出現検出部8を設け、身体制御部9がキーワード出現検出部8によるキーワードの出現検出状況に応じて身体の振り向きを制御する。
【選択図】図1

Description

この発明は、資料説明者であるプレゼンターの説明に合わせて、身体の向きを変えることができる形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラムに関するものである。
以下の特許文献1には、例えば、顔や腕などを回転させることにより、訪問者に対して正面を向けるモードと、訪問者に対して背面を向けるモードとを有するサービスロボットが開示されている。
ただし、このサービスロボットは、プレゼンターがキーワードを発話したときに身体の向きを変えるものではないため、例えば、展示会や講習会におけるプレゼンターの説明に合わせて、所定のアクションを行うプレゼンロボットには適用することができない。
特開2006−297531号公報(段落番号[0015]から[0016]、図3)
従来のサービスロボットは以上のように構成されているので、顔や腕などを回転して、訪問者に対して正面を向けたり、訪問者に対して背面を向けたりすることができる。しかし、プレゼンターの発話を検知することができないため、プレゼンターの説明に合わせて、身体の向きを変えることができないなどの課題があった。
この発明は上記のような課題を解決するためになされたもので、プレゼンターの説明に合わせて、身体の向きを変えることができる形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラムを得ることを目的とする。
請求項1記載の発明に係る形態模写プレゼンロボットは、説明資料から名詞を抽出し、その名詞をキーワードに設定するキーワード設定手段と、資料説明者の音声を入力する音声入力手段と、音声入力手段により入力された音声を解析して、キーワード設定手段により設定されたキーワードの出現を検出するキーワード出現検出手段と、キーワード出現検出手段によるキーワードの出現検出状況に応じて身体の振り向きを制御する身体制御手段とを備えるようにしたものである。
請求項1記載の発明によれば、プレゼンターの説明に合わせて、身体の向きを変えることができる効果が得られる。
請求項2記載の発明に係る形態模写プレゼンロボットは、キーワード設定手段により設定されたキーワードの重要度を判別する重要度判別手段を設けるようにしたものである。
請求項2記載の発明によれば、重要度が高いキーワードの出現が検出されたとき、身体の向きを変えることができる効果が得られる。
請求項3記載の発明に係る形態模写プレゼンロボットは、重要度判別手段により判別されたキーワードの重要度に応じて、そのキーワードに対応する振り向き時間を設定する振り向き時間設定手段を設け、キーワード出現検出手段がキーワードの出現を検出すると、身体制御手段が振り向き時間設定手段により設定されている上記キーワードに対応する振り向き時間だけ、身体を振り向けるようにしたものである。
請求項3記載の発明によれば、ロボットによるプレゼンテーションの臨場感を高めることができる効果が得られる。
請求項4記載の発明に係る形態模写プレゼンロボットは、重要度判別手段が、説明資料に含まれている名詞であるキーワードの出現回数、文字サイズ又は文字色から、キーワードの重要度を判別するようにしたものである。
請求項4記載の発明によれば、キーワードの重要度に応じて、キーワードに対応する振り向き時間を設定することができる効果が得られる。
請求項5記載の発明に係る形態模写プレゼンロボットは、キーワード設定手段により設定されたキーワードに対応する振り向き方向を設定する振り向き方向設定手段を設け、キーワード出現検出手段がキーワードの出現を検出すると、身体制御手段が振り向き方向設定手段により設定されている上記キーワードに対応する振り向き方向に、身体を振り向けるようにしたものである。
請求項5記載の発明によれば、資料説明者が発話しているキーワードに応じて身体の振り向き方向を変えることができるようになり、あたかもロボットが説明を行っているように見せることができる効果が得られる。
請求項6記載の発明に係る形態模写プレゼンロボットは、キーワード設定手段が説明資料から名詞の抽出処理を実施し、抽出回数が予め設定された回数以上の名詞をキーワードに設定するようにしたものである。
請求項6記載の発明によれば、重要性が高い名詞をキーワードに設定することができる効果が得られる。
請求項7記載の発明に係る形態模写プレゼンロボットは、音声入力手段により入力された音声の音量を測定する音量測定手段を設け、音量測定手段により測定された音量が基準音量より高い場合に限り、身体制御手段がキーワード出現検出手段によるキーワードの出現検出状況に応じて身体の振り向きを制御するようにしたものである。
請求項7記載の発明によれば、プレゼンターの音声が大きいときだけ、身体の向きを変えることができる効果が得られる。
請求項8記載の発明に係る形態模写プレゼンロボットは、身体制御手段が、キーワード出現検出手段によりキーワードの出現が検出されると、上記キーワードの重要度に応じて基準音量を変更するようにしたものである。
請求項8記載の発明によれば、例えば、重要度が高いキーワードの出現が検出された場合には、音量が低くても、身体の向きを変えることができる効果が得られる。
請求項9記載の発明に係る形態模写プレゼンロボットは、身体制御手段が、キーワードの出現回数が多いほど、基準音量を下げるようにしたものである。
請求項9記載の発明によれば、出現回数が多いキーワードの出現が検出された場合には、音量が低くても、身体の向きを変えることができる効果が得られる。
請求項10記載の発明に係る形態模写プレゼンロボットは、音声の音量に応じて振り向き時間を設定する振り向き時間設定手段を設け、身体制御手段が振り向き時間設定手段により設定されている上記音量に対応する振り向き時間だけ、身体を振り向けるようにしたものである。
請求項10記載の発明によれば、ロボットによるプレゼンテーションの臨場感を高めることができる効果が得られる。
請求項11記載の発明に係る形態模写プレゼンロボットは、身体を振り向ける振り向き回数が単位時間当りの上限回数を超える場合、身体制御手段が一定時間以上、身体の振り向きを中止するようにしたものである。
請求項11記載の発明によれば、例えば、振り向き時間が短いキーワードが連続するような場合でも、ロボットの挙動が不自然になるのを防止することができる効果が得られる。
請求項12記載の発明に係る形態模写プレゼンロボットの制御方法は、キーワード設定手段が説明資料から名詞を抽出し、その名詞をキーワードに設定するキーワード設定ステップと、音声入力手段が資料説明者の音声を入力する音声入力ステップと、キーワード出現検出手段が音声入力手段により入力された音声を解析して、キーワード設定手段により設定されたキーワードの出現を検出するキーワード出現検出ステップと、身体制御手段がキーワード出現検出手段によるキーワードの出現検出状況に応じて身体の振り向きを制御する身体制御ステップとを備えるようにしたものである。
請求項12記載の発明によれば、プレゼンターの説明に合わせて、身体の向きを変えることができる効果が得られる。
請求項13記載の発明に係る形態模写プレゼンロボットの制御プログラムは、説明資料から名詞を抽出し、その名詞をキーワードに設定するキーワード設定処理手順と、資料説明者の音声を入力する音声入力処理手順と、音声入力処理手順により入力された音声を解析して、キーワード設定処理手順により設定されたキーワードの出現を検出するキーワード出現検出処理手順と、キーワード出現検出処理手順によるキーワードの出現検出状況に応じて身体の振り向きを制御する身体制御処理手順とを備えるようにしたものである。
請求項13記載の発明によれば、プレゼンターの説明に合わせて、身体の向きを変えることができる効果が得られる。
この発明によれば、音声入力手段により入力された音声を解析して、キーワード設定手段により設定されたキーワードの出現を検出するキーワード出現検出手段を設け、身体制御手段がキーワード出現検出手段によるキーワードの出現検出状況に応じて身体の振り向きを制御するように構成したので、プレゼンターの説明に合わせて、身体の向きを変えることができる効果がある。
実施の形態1.
図1はこの発明の実施の形態1による形態模写プレゼンロボットを示す構成図であり、図1において、キーワード設定部1は例えば例えばスキャナ装置やOCR装置などから構成されており、説明資料の記述内容を解析して、その説明資料から名詞を抽出して、その名詞をキーワードに設定する処理を実施する。ただし、説明資料は紙などに印刷されているものに限るものではなく、電子化されているデジタルデータであってもよい。説明資料がデジタルデータである場合には、キーワード設定部1がデジタルデータを解析して、名詞を抽出する。なお、キーワード設定部1はキーワード設定手段を構成している。
キーワード格納部2はキーワード設定部1により設定されたキーワードを記録するメモリである。
重要度判別部3は例えばCPUなどを実装している半導体集積回路基板から構成されており、キーワード設定部1により設定されたキーワードの重要度を判別する処理を実施する。なお、重要度判別部3は重要度判別手段を構成している。
振り向き時間設定部4は例えばCPUなどを実装している半導体集積回路基板から構成されており、重要度判別部3により判別されたキーワードの重要度に応じて、そのキーワードに対応する振り向き時間を設定する処理を実施する。なお、振り向き時間設定部4は振り向き時間設定手段を構成している。
振り向き時間格納部5は振り向き時間設定部4の設定内容(キーワードの出現回数と振り向き時間の対応関係を示すテーブル)を記憶しているメモリである。
マイク6はプレゼンターが発している音声を集音する。
音声入力部7はマイク6により集音された音声の音声信号をキーワード出現検出部8に出力する処理を実施する。なお、マイク6及び音声入力部7から音声入力手段が構成されている。
キーワード出現検出部8は例えばCPUなどを実装している半導体集積回路基板から構成されており、音声入力部7から出力された音声信号を解析して、キーワード設定部1により設定されたキーワードの出現を検出する処理を実施する。なお、キーワード出現検出部8はキーワード出現検出手段を構成している。
身体制御部9は例えばCPUなどを実装している半導体集積回路基板から構成されており、キーワード出現検出部8によるキーワードの出現検出状況に応じて身体の振り向きを制御する処理を実施する。即ち、キーワード出現検出部8によりキーワードの出現が検出されていない状況下では、ロボットの身体を資料の説明を受けている来場者側に向ける制御信号をロボットのアクチュエータに出力し、キーワード出現検出部8によりキーワードの出現が検出されると、ロボットの身体を説明資料が表示されているスクリーン側に振り向ける制御信号をロボットのアクチュエータに出力する処理を実施する。ただし、ロボットの身体をスクリーン側に振り向ける振り向き時間は、振り向き時間格納部5に格納されている各キーワードに対応する振り向き時間である。
なお、身体制御部9は身体制御手段を構成している。
図1の例では、形態模写プレゼンロボットの構成要素であるキーワード設定部1、振り向き時間設定部4、マイク6、音声入力部7、キーワード出現検出部8及び身体制御部9がそれぞれ専用のハードウェアで構成されているものを想定しているが、形態模写プレゼンロボットがコンピュータで構成されている場合、キーワード設定部1、振り向き時間設定部4、マイク6、音声入力部7、キーワード出現検出部8及び身体制御部9の処理内容(キーワード設定処理手順、振り向き時間設定処理手順、音声入力処理手順、キーワード出現検出処理手順、身体制御処理手順)を示す制御プログラムをコンピュータのメモリに格納し、コンピュータのCPUが当該メモリに格納されている制御プログラムを実行するようにしてもよい。
図1の例では、キーワード設定部1、振り向き時間設定部4及び振り向き時間格納部5が形態模写プレゼンロボットに内蔵されているものを示したが、キーワード設定部1、振り向き時間設定部4及び振り向き時間格納部5が形態模写プレゼンロボットの外部に設けられていてもよい。
図2はこの発明の実施の形態1による形態模写プレゼンロボットの制御方法を示すフローチャートである。
次に動作について説明する。
この実施の形態1では、プレゼンターが資料説明を実施しているとき、プレゼンターがキーワードを発話していない状況下では、形態模写プレゼンロボットの身体を資料の説明を受けている来場者側に向けており、プレゼンターがキーワードを発話すると、形態模写プレゼンロボットの身体を説明資料が表示されているスクリーン側に振り向けるものについて説明する。
ここで、図3は形態模写プレゼンロボットが来場者側又はスクリーン側を向いている状態を示す説明図である。
なお、形態模写プレゼンロボットの図示せぬ台座又は脚部には回転ローラなどの移動機構が実装されており、移動機構が後述する身体制御部9から制御信号を受けると、その制御信号にしたがって形態模写プレゼンロボットを来場者側又はスクリーン側に向けるように動作する。
キーワード設定部1は、説明資料の記述内容を解析して、その説明資料から名詞を抽出し、その名詞をキーワードに設定する(ステップST1)。
即ち、キーワード設定部1は、例えば、説明資料から名詞として「進歩性」と「従来技術」を抽出すると、「進歩性」と「従来技術」をキーワードに設定して、「進歩性」と「従来技術」をキーワード出現検出部8に出力する。
また、キーワード設定部1は、説明資料から新たな名詞を抽出する毎に、その名詞をキーワードとしてキーワード格納部2に記録し、説明資料における同じ名詞(キーワード)の出現回数を計数して、当該キーワードの出現回数を身体制御部9に通知する(ステップST2)。
図4の説明資料の場合、「進歩性」の出現回数は4回、「従来技術」の出現回数は2回であるので、「進歩性」の出現回数が“4回”、「従来技術」の出現回数が“2回”である旨を身体制御部9に通知する。
重要度判別部3は、キーワード設定部1がキーワードを設定すると、そのキーワードの重要度を判別する。
即ち、重要度判別部3は、キーワード設定部1から説明資料における各キーワード(名詞)の出現回数を取得し、出現回数が多いキーワードほど、当該キーワードの重要度が高いものと判別する。
ここでは、重要度判別部3がキーワードの出現回数から、当該キーワードの重要度を判別するものについて示したが、キーワードの出現回数に限るものではなく、例えば、キーワードの文字サイズや文字色などから、当該キーワードの重要度を判別するようにしてもよい。
例えば、キーワードの文字サイズが大きいほど、当該キーワードの重要度が高いものと判別する。また、文字色が例えば赤色や黄色のキーワードは、黒色のキーワードより重要度が高いものと判別する。
振り向き時間設定部4は、重要度判別部3がキーワードの重要度を判別すると、そのキーワードの重要度に応じて、そのキーワードに対応する振り向き時間を設定し、そのキーワードに対応する振り向き時間を振り向き時間格納部5に格納する。
即ち、出現回数が多いキーワードほど、重要度が高いので、出現回数が多いキーワードほど振り向き時間を長めに設定する。例えば、図5に示すように、図4の説明資料における出現回数が1回のキーワードの振り向き時間は0.5秒、出現回数が2回のキーワードの振り向き時間は1.0秒、出現回数が3回のキーワードの振り向き時間は1.5秒、出現回数が4回のキーワードの振り向き時間は2.0秒のように設定する。
したがって、「進歩性」は、図4の説明資料における出現回数が4回であるため、後述するキーワード出現検出部8により「進歩性」の発話が検出されると、身体制御部9が振り向き時間格納部5から「進歩性」に対応する振り向き時間として“2.0秒”を取得する。
マイク6は、プレゼンターが資料の説明を開始すると、プレゼンターの音声を集音する(ステップST3)。
音声入力部7は、マイク6により集音された音声の音声信号をキーワード出現検出部8に出力する(ステップST4)。
キーワード出現検出部8は、音声入力部7から音声信号を受けると、その音声信号を解析して、キーワード設定部1により設定されたキーワードの出現の検出処理を実施する(ステップST5)。
ここで、図6はキーワード出現検出部8の内部を示す構成図である。
以下、図6を参照して、キーワード出現検出部8の処理内容を具体的に説明する。
キーワード出現検出部8の特徴抽出部21は、音声入力部7から音声信号を受けると、その音声信号に対して、例えば、LPC分析を実行することにより、その音声信号の対数パワー、16次ケプストラム係数、Δ対数パワー及びΔ16次ケプストラム係数を含む34次元の特徴パラメータを抽出する。
キーワード出現検出部8の音素照合部22は、特徴抽出部21が特徴パラメータを抽出すると、HMMメモリ23に格納されている隠れマルコフモデル(隠れマルコフモデルは、複数の状態と、各状態間の遷移を示す弧とから構成されており、各弧には状態間の遷移確率と入力コード(特徴パラメータ)に対する出力確率が格納されている)を用いて音素照合処理を実施することにより、その特徴パラメータから音素データを生成する。
キーワード出現検出部8の音声認識部24は、音素照合部22が音素データを生成すると、言語モデル格納部25に格納されている統計的言語モデルを参照して、例えば、“One Pass DPアルゴリズム”を実行する。
即ち、音声認識部24は、その音素データについて左から右方向に、後戻りなしに処理して、より高い生起確率の単語を音声認識結果(プレゼンターの発話)に決定する音声認識処理を実施する。
キーワード出現検出部8の比較処理部26は、音声認識部24の音声認識結果である単語と、キーワード設定部1により設定されたキーワード「進歩性」「従来技術」を比較する。
キーワード出現検出部8の比較処理部26は、音声認識部24の音声認識結果である単語が「進歩性」であれば、「進歩性」の出現を検出した旨を身体制御部9に通知し、音声認識部24の音声認識結果である単語が「従来技術」であれば、「従来技術」の出現を検出した旨を身体制御部9に通知する。
ここでは、キーワード出現検出部8が図6のように構成されている例を示したが、これはあくまでも一例であり、他の音声認識処理方法を用いて、キーワードの出現を検出するようにしてもよいことは言うまでもない。
身体制御部9は、キーワード出現検出部8によりキーワードの出現が検出されていない状況下では(ステップST6)、ロボットの身体を来場者側に向ける制御信号をロボットの移動機構に出力することにより、ロボットの身体を来場者側に向ける(ステップST7)。
身体制御部9は、キーワード出現検出部8によりキーワードの出現が検出されると(ステップST6)、ロボットの身体をスクリーン側に振り向ける制御信号をロボットの移動機構に出力することにより、ロボットの身体をスクリーン側に振り向ける(ステップST8)。
ただし、身体制御部9は、キーワード出現検出部8により検出されたキーワードが「進歩性」である場合、キーワード設定部1から「進歩性」の出現回数が“4回”である旨の通知を受けているので、振り向き時間格納部5から出現回数“4回”に対応する振り向き時間“2.0秒”を取得し、ロボットの身体を2.0秒間だけスクリーン側に振り向けるようにする。
したがって、ロボットの身体をスクリーン側に振り向けてから2.0秒が経過すると、ロボットの身体を来場者側に向ける制御信号をロボットの移動機構に出力することにより、ロボットの身体を来場者側に向けるようにする(ステップST9)。
また、キーワード出現検出部8により検出されたキーワードが「従来技術」である場合、キーワード設定部1から「従来技術」の出現回数が“2回”である旨の通知を受けているので、振り向き時間格納部5から出現回数“2回”に対応する振り向き時間“1.0秒”を取得し、ロボットの身体を1.0秒間だけスクリーン側に振り向けるようにする。
したがって、ロボットの身体をスクリーン側に振り向けてから1.0秒が経過すると、ロボットの身体を来場者側に向ける制御信号をロボットの移動機構に出力することにより、ロボットの身体を来場者側に向けるようにする。(ステップST9)
以上で明らかなように、この実施の形態1によれば、音声入力部7から出力された音声信号を解析して、キーワード設定部1により設定されたキーワードの出現を検出するキーワード出現検出部8を設け、身体制御部9がキーワード出現検出部8によるキーワードの出現検出状況に応じて身体の振り向きを制御するように構成したので、プレゼンターの説明に合わせて、身体の向きを変えることができる効果を奏する。
即ち、身体制御部9がキーワード出現検出部8によりキーワードの出現が検出されていない状況下では、身体を来場者側に向け、キーワード出現検出部8によりキーワードの出現が検出されると、身体をスクリーン側に振り向けるように構成したので、資料説明者がキーワードを発話すれば、身体をスクリーン側に振り向けることができるようになり、あたかもロボットが説明を行っているように見せることができる効果を奏する。
また、この実施の形態1によれば、説明資料に含まれている各キーワードの出現回数に応じて各キーワードに対応する振り向き時間を設定する振り向き時間設定部4を設け、キーワード出現検出部8がキーワードの出現を検出すると、身体制御部9が振り向き時間設定部4により設定されている上記キーワードに対応する振り向き時間だけ、身体を振り向けるように構成したので、ロボットによるプレゼンテーションの臨場感を高めることができる効果を奏する。
なお、この実施の形態1では、プレゼンターが資料説明を実施しているとき、プレゼンターがキーワードを発話していない状況下では、ロボットの身体を来場者側に向けており、プレゼンターがキーワードを発話すると、ロボットの身体をスクリーン側に振り向けるものについて示したが、ロボットの振り向き方向を逆にしてもよい。
即ち、プレゼンターがキーワードを発話していない状況下(キーワード出現検出部8によりキーワードの出現が検出されていない状況下)では、身体制御部9がロボットの身体をスクリーン側に向け、プレゼンターがキーワードを発話すると(キーワード出現検出部8によりキーワードの出現が検出された場合)、身体制御部9がロボットの身体を来場者側に振り向けるようにしてもよい。
この場合も、あたかもロボットが説明を行っているように見せることができる効果を奏する。
また、この実施の形態1では、キーワード設定部1が説明資料から名詞を抽出し、その名詞をキーワードとして設定するものについて示したが、説明資料から抽出した名詞の中で、予め設定された回数(例えば、5回)以上抽出した名詞(例えば、“特許”)をキーワードとして設定するようにしてもよい。
この場合、重要性が高い名詞をキーワードに設定することができる効果を奏する。
実施の形態2.
図7はこの発明の実施の形態2による形態模写プレゼンロボットを示す構成図であり、図7において、図1と同一符号は同一または相当部分を示すので説明を省略する。
振り向き方向設定受付部10は例えばキーボードやマウスなどのマンマシンインタフェースから構成されており、説明資料に含まれている各キーワードに対応する振り向き方向の設定を受け付ける処理を実施する。なお、振り向き方向設定受付部10は振り向き方向設定手段を構成している。
振り向き方向格納部11は振り向き方向設定受付部10の設定内容(キーワードと振り向き方向の対応関係を示すテーブル)を記憶しているメモリである。
次に動作について説明する。
上記実施の形態1では、例えば、プレゼンターが資料説明を実施しているとき、プレゼンターがキーワードを発話していない状況下では、ロボットの身体を来場者側に向けており、プレゼンターがキーワードを発話すると、ロボットの身体をスクリーン側に振り向けるものについて示したが、キーワード出現検出部8がキーワードの出現を検出すると、身体制御部9が振り向き方向設定受付部10により設定されている上記キーワードに対応する振り向き方向に、身体を振り向けるようにしてもよい。
具体的には、下記の通りである。
振り向き方向設定受付部10は、形態模写プレゼンロボットの初期設定に際して、説明資料に含まれている各キーワードに対応する振り向き方向の設定を受け付ける処理を実施する。
即ち、プレゼンターや他の関係者等が、振り向き方向設定受付部10を使用して、各キーワードに対応する振り向き方向を設定し、その設定内容を振り向き方向格納部11に格納する。
例えば、図8に示すように、キーワード「特許」の振り向き方向は「来場者の左端」、キーワード「進歩性」の振り向き方向は「来場者の右端」、キーワード「従来技術」の振り向き方向は「スクリーン」のように設定する。
なお、キーワードが検出されない場合の振り向き方向についても、デフォルトの方向として、例えば、「来場者の中央」のように設定する。
この場合、身体制御部9は、例えば、キーワード出現検出部8がキーワード「特許」の発話を検出すると、振り向き方向格納部11から「特許」に対応する振り向き方向として「来場者の左端」を取得し、ロボットの身体を来場者の左端に向ける。
同様に、例えば、キーワード出現検出部8がキーワード「進歩性」の発話を検出すると、振り向き方向格納部11から「進歩性」に対応する振り向き方向として「来場者の右端」を取得し、ロボットの身体を来場者の右端に向ける。
以上で明らかなように、この実施の形態2によれば、キーワード出現検出部8がキーワードの出現を検出すると、身体制御部9が振り向き方向設定受付部10により設定されている上記キーワードに対応する振り向き方向に、身体を振り向けるように構成したので、資料説明者が発話しているキーワードに応じて身体の振り向き方向を変えることができるようになり、あたかもロボットが説明を行っているように見せることができる効果を奏する。
実施の形態3.
図9はこの発明の実施の形態3による形態模写プレゼンロボットを示す構成図であり、図9において、図1と同一符号は同一または相当部分を示すので説明を省略する。
音量測定部12は例えば音量センサなどから構成されており、音声入力部7から出力された音声信号の信号レベルを観測して、プレゼンターが発している音声の音量を測定する処理を実施する。なお、音量測定部12は音量測定手段を構成している。
身体制御部13は例えばCPUなどを実装している半導体集積回路基板から構成されており、音量測定部12により測定された音量が基準音量より高い場合に限り、キーワード出現検出部8によるキーワードの出現検出状況に応じて身体の振り向きを制御する処理を実施する。なお、身体制御部13は身体制御手段を構成している。
上記実施の形態1,2では、キーワード出現検出部8がキーワードの出現を検出すると、身体制御部9が身体をスクリーン側に振り向けるものについて示したが、音量測定部12により測定された音量が基準音量より高い場合に限り、身体制御部13がキーワード出現検出部8によるキーワードの出現検出状況に応じて身体の振り向きを制御するようにしてもよい。
具体的には、以下の通りである。
音量測定部12は、音声入力部7から音声信号を受けると、その音声信号の信号レベルを観測して、プレゼンターが発している音声の音量を測定する。
身体制御部13は、音量測定部12により測定された音量が基準音量より低い状況下では、キーワード出現検出部8によるキーワードの出現の検出の有無にかかわらず、身体の振り向き制御を実施しない。
身体制御部13は、音量測定部12により測定された音量が基準音量より高い状況下では、図1の身体制御部9と同様に、キーワード出現検出部8がキーワードの出現を検出しなければ、ロボットの身体を来場者側に向ける制御信号をロボットのアクチュエータに出力し、キーワード出現検出部8がキーワードの出現を検出すると、ロボットの身体をスクリーン側に振り向ける制御信号をロボットのアクチュエータに出力する。
以上で明らかなように、この実施の形態3によれば、音量測定部12により測定された音量が基準音量より高い場合に限り、身体制御部13がキーワード出現検出部8によるキーワードの出現検出状況に応じて身体の振り向きを制御するように構成したので、プレゼンターが大きな声を出せば、身体をスクリーン側に振り向けることができるようになり、あたかもロボットが説明を行っているように見せることができる効果を奏する。
なお、この実施の形態3では、閾値である基準音量が固定されているものについて示したが、キーワード出現検出部8によりキーワードの出現が検出されると、身体制御部13が、重要度判別部3により判別された当該キーワードの重要度に応じて基準音量を変更するようにしてもよい。具体的には、キーワードの重要度が高いほど(例えば、キーワードの出現回数が多いほど)、基準音量が小さくなるように変更する。
これにより、例えば、重要度が高いキーワードの出現が検出された場合には、音量が低くても、身体の向きを変えることができる効果を奏する。
実施の形態4.
図10はこの発明の実施の形態4による形態模写プレゼンロボットを示す構成図であり、図10において、図9と同一符号は同一または相当部分を示すので説明を省略する。
振り向き時間設定受付部14は例えばキーボードやマウスなどのマンマシンインタフェースから構成されており、プレゼンターが発する音声の音量に応じた振り向き時間の設定を受け付ける処理を実施する。なお、振り向き時間設定受付部14は振り向き時間設定手段を構成している。
振り向き時間格納部15は振り向き時間設定受付部14の設定内容(音量と振り向き時間の対応関係を示すテーブル)を記憶しているメモリである。
身体制御部16は例えばCPUなどを実装している半導体集積回路基板から構成されており、音量測定部12により測定された音量が基準音量より高いとき、キーワード出現検出部8がキーワードの出現を検出すると、振り向き時間格納部15に格納されている音量に応じた振り向き時間だけロボットの身体をスクリーン側に振り向ける処理を実施する。
なお、身体制御部16は身体制御手段を構成している。
図10の例では、振り向き時間設定受付部14及び振り向き時間格納部15が形態模写プレゼンロボットに内蔵されているものを示したが、振り向き時間設定受付部14及び振り向き時間格納部15が形態模写プレゼンロボットの外部に設けられていてもよい。
次に動作について説明する。
振り向き時間設定受付部14は、形態模写プレゼンロボットの初期設定に際して、プレゼンターが発する音声の音量に応じた振り向き時間の設定を受け付ける処理を実施する。
即ち、プレゼンターや他の関係者等が、振り向き時間設定受付部14を使用して、音声の音量に応じた振り向き時間を設定し、その設定内容を振り向き時間格納部15に格納する。
例えば、図11に示すように、音量tが30db(基準音量)以下であれば振り向き時間は0秒、音量tが30dbより高く、40db以下であれば振り向き時間は1秒、音量tが40dbより高く、50db以下であれば振り向き時間は2秒のように設定する。
音量測定部12は、音声入力部7から音声信号を受けると、上記実施の形態3と同様に、その音声信号の信号レベルを観測して、プレゼンターが発している音声の音量を測定する。
身体制御部16は、音量測定部12により測定された音量が基準音量より低い状況下では、図9の身体制御部13と同様に、キーワード出現検出部8によるキーワードの出現の検出の有無にかかわらず、身体の振り向き制御を実施しない。
身体制御部16は、音量測定部12により測定された音量が基準音量より高い状況下では、図1の身体制御部9と同様に、キーワード出現検出部8がキーワードの出現を検出しなければ、ロボットの身体を来場者側に向ける制御信号をロボットのアクチュエータに出力し、キーワード出現検出部8がキーワードの出現を検出すると、ロボットの身体をスクリーン側に振り向ける制御信号をロボットのアクチュエータに出力する。
ただし、身体制御部16は、音量測定部12により測定された音量が、例えば“35db”であれば、振り向き時間格納部15から音量“35db”に対応する振り向き時間“1秒”を取得して、ロボットの身体を1秒間だけスクリーン側に振り向けるようにする。
したがって、ロボットの身体をスクリーン側に振り向けてから振り向き時間“1秒”が経過すると、ロボットの身体を来場者側に向ける制御信号をロボットの移動機構に出力することにより、ロボットの身体を来場者側に向けるようにする。
以上で明らかなように、この実施の形態4によれば、音量測定部12により測定された音量が基準音量より高いとき、キーワード出現検出部8がキーワードの出現を検出すると、振り向き時間格納部12に格納されている音量に応じた振り向き時間だけロボットの身体をスクリーン側に振り向けるように構成したので、ロボットによるプレゼンテーションの臨場感を高めることができる効果を奏する。
実施の形態5.
上記実施の形態1〜4では、身体制御部9,13,16がキーワードの出現を検出すると、ロボットの身体をスクリーン側又は来場者側に振り向けるものについて示したが、例えば、振り向き時間が短い身体の振り向きが連続すると、ロボットの挙動が不自然になることがある。
そこで、この実施の形態5では、身体制御部9,13,16が単位時間当りの振り向き回数を計数し、身体を振り向ける振り向き回数が、単位時間当りの上限回数を超える場合、一定時間以上、身体の振り向きを中止するようにする。
これにより、例えば、振り向き時間が短いキーワードが連続するような場合でも、身体の振り向き回数が減るため、ロボットの挙動が不自然になるのを防止することができる効果を奏する。
実施の形態6.
図12はこの発明の実施の形態6による形態模写プレゼンロボットを示す構成図であり、図12において、図1と同一符号は同一または相当部分を示すので説明を省略する。
目制御部17は音声入力部7から出力された音声信号や、キーワード出現検出部8により検出されたキーワードや、そのキーワードの重要度に応じてロボットの目の表情を変える処理を実施する。なお、目制御部17は目制御手段を構成している。
次に動作について説明する。
形態模写プレゼンロボットの目には、図13(a)に示すように、数多くのLEDランプが実装されている。
目制御部17は、音声入力部7から音声信号を受けると、その音声信号を解析して、例えば、音声の抑揚や音域などを測定する。
目制御部17は、例えば、音声の抑揚が基準レベルより大きい場合や、音域が基準レベルより高い場合、プレゼンターの気分が高揚している可能性が高いので、図13(b)に示すように、嬉しい表情に見えるようにLEDランプを点灯する。
一方、音声の抑揚が基準レベルより小さい場合や、音域が基準レベルより低い場合、プレゼンターの気分が落ち込んでいる可能性が高いので、図13(c)に示すように、寂しげな表情に見えるようにLEDランプを点灯する。
なお、図13(b)(c)は、一例に過ぎず、音声に応じて他の表情を表すようにしてもよいことは言うまでもない。
ここでは、目制御部17が音声入力部7から出力された音声信号に応じてロボットの目の表情を変えるものについて示したが、キーワード出現検出部8により検出されたキーワードや、そのキーワードの重要度に応じてロボットの目の表情を変えるようにしてもよい。
例えば、キーワード出現検出部8により検出されたキーワードが「特許」であれば、「特」の字を表すようにLEDランプを点灯し、また、キーワードが「従来技術」であれば、「従」の字を表すようにLEDランプを点灯する。
例えば、キーワード出現検出部8により検出されたキーワード「進歩性」の重要度が高ければ、「進」の字を大きく表すようにLEDランプを点灯し、また、キーワード「従来技術」の重要度が低ければ、「従」の字を小さく表すようにLEDランプを点灯する。
以上で明らかなように、この実施の形態6によれば、音声入力部7から出力された音声信号に応じてロボットの目の表情を変えるように構成したので、ロボットによるプレゼンテーションの臨場感を高めることができる効果を奏する。
なお、この実施の形態6では、図1の形態模写プレゼンロボットに目制御部17を付加する例を示したが、図14に示すように、図10の形態模写プレゼンロボットに目制御部17を付加するようにしてよく、同様の効果を奏することができる。
この発明の実施の形態1による形態模写プレゼンロボットを示す構成図である。 この発明の実施の形態1による形態模写プレゼンロボットの制御方法を示すフローチャートである。 形態模写プレゼンロボットが来場者側又はスクリーン側を向いている状態を示す説明図である。 説明資料の一例を示す説明図である。 振り向き時間設定部4の設定内容(キーワードの出現回数と振り向き時間の対応関係を示すテーブル)を示す説明図である。 キーワード出現検出部8の内部を示す構成図である。 この発明の実施の形態2による形態模写プレゼンロボットを示す構成図である。 振り向き方向設定受付部10の設定内容(キーワードと振り向き方向の対応関係を示すテーブル)を示す説明図である。 この発明の実施の形態3による形態模写プレゼンロボットを示す構成図である。 この発明の実施の形態4による形態模写プレゼンロボットを示す構成図である。 振り向き時間設定受付部14の設定内容(音量と振り向き時間の対応関係を示すテーブル)を示す説明図である。 この発明の実施の形態6による形態模写プレゼンロボットを示す構成図である。 形態模写プレゼンロボットの目の表情を示す説明図である。 この発明の実施の形態6による形態模写プレゼンロボットを示す構成図である。
符号の説明
1 キーワード設定部(キーワード設定手段)
2 キーワード格納部
3 重要度判別部(重要度判別手段)
4 振り向き時間設定部(振り向き時間設定手段)
5 振り向き時間格納部
6 マイク(音声入力手段)
7 音声入力部(音声入力手段)
8 キーワード出現検出部(キーワード出現検出手段)
9 身体制御部(身体制御手段)
10 振り向き方向設定受付部(振り向き方向設定手段)
11 振り向き方向格納部
12 音量測定部(音量測定手段)
13 身体制御部(身体制御手段)
14 振り向き時間受付設定部(振り向き時間設定手段)
15 振り向き時間格納部
16 身体制御部(身体制御手段)
17 目制御部(目制御手段)
21 特徴抽出部
22 音素照合部
23 HMMメモリ
24 音声認識部
25 言語モデル格納部
26 比較処理部

Claims (13)

  1. 説明資料から名詞を抽出し、その名詞をキーワードに設定するキーワード設定手段と、
    資料説明者の音声を入力する音声入力手段と、
    上記音声入力手段により入力された音声を解析して、上記キーワード設定手段により設定されたキーワードの出現を検出するキーワード出現検出手段と、
    上記キーワード出現検出手段によるキーワードの出現検出状況に応じて身体の振り向きを制御する身体制御手段と
    を備えた形態模写プレゼンロボット。
  2. キーワード設定手段により設定されたキーワードの重要度を判別する重要度判別手段を設けたことを特徴とする請求項1記載の形態模写プレゼンロボット。
  3. 重要度判別手段により判別されたキーワードの重要度に応じて、上記キーワードに対応する振り向き時間を設定する振り向き時間設定手段を設け、キーワード出現検出手段がキーワードの出現を検出すると、身体制御手段が上記振り向き時間設定手段により設定されている上記キーワードに対応する振り向き時間だけ、身体を振り向けることを特徴とする請求項2記載の形態模写プレゼンロボット。
  4. 重要度判別手段は、説明資料に含まれている名詞であるキーワードの出現回数、文字サイズ又は文字色から、上記キーワードの重要度を判別することを特徴とする請求項2または請求項3記載の形態模写プレゼンロボット。
  5. キーワード設定手段により設定されたキーワードに対応する振り向き方向を設定する振り向き方向設定手段を設け、キーワード出現検出手段がキーワードの出現を検出すると、身体制御手段が上記振り向き方向設定手段により設定されている上記キーワードに対応する振り向き方向に、身体を振り向けることを特徴とする請求項1から請求項4のうちのいずれか1項記載の形態模写プレゼンロボット。
  6. キーワード設定手段は、説明資料から名詞の抽出処理を実施し、抽出回数が予め設定された回数以上の名詞をキーワードに設定することを特徴とする請求項1から請求項5のうちのいずれか1項記載の形態模写プレゼンロボット。
  7. 音声入力手段により入力された音声の音量を測定する音量測定手段を設け、
    上記音量測定手段により測定された音量が基準音量より高い場合に限り、身体制御手段がキーワード出現検出手段によるキーワードの出現検出状況に応じて身体の振り向きを制御することを特徴とする請求項1から請求項6のうちのいずれか1項記載の形態模写プレゼンロボット。
  8. 身体制御手段は、キーワード出現検出手段によりキーワードの出現が検出されると、上記キーワードの重要度に応じて基準音量を変更することを特徴とする請求項7記載の形態模写プレゼンロボット。
  9. 身体制御手段は、キーワードの出現回数が多いほど、基準音量を下げることを特徴とする請求項8記載の形態模写プレゼンロボット。
  10. 音声の音量に応じて振り向き時間を設定する振り向き時間設定手段を設け、身体制御手段が上記振り向き時間設定手段により設定されている上記音量に対応する振り向き時間だけ、身体を振り向けることを特徴とする請求項7から請求項9のうちのいずれか1項記載の形態模写プレゼンロボット。
  11. 身体制御手段は、身体を振り向ける振り向き回数が、単位時間当りの上限回数を超える場合、一定時間以上、身体の振り向きを中止することを特徴とする請求項1から請求項10のうちのいずれか1項記載の形態模写プレゼンロボット。
  12. キーワード設定手段が説明資料から名詞を抽出し、その名詞をキーワードに設定するキーワード設定ステップと、
    音声入力手段が資料説明者の音声を入力する音声入力ステップと、
    キーワード出現検出手段が上記音声入力手段により入力された音声を解析して、上記キーワード設定手段により設定されたキーワードの出現を検出するキーワード出現検出ステップと、
    身体制御手段が上記キーワード出現検出手段によるキーワードの出現検出状況に応じて身体の振り向きを制御する身体制御ステップと
    を備えた形態模写プレゼンロボットの制御方法。
  13. 説明資料から名詞を抽出し、その名詞をキーワードに設定するキーワード設定処理手順と、
    資料説明者の音声を入力する音声入力処理手順と、
    上記音声入力処理手順により入力された音声を解析して、上記キーワード設定処理手順により設定されたキーワードの出現を検出するキーワード出現検出処理手順と、
    上記キーワード出現検出処理手順によるキーワードの出現検出状況に応じて身体の振り向きを制御する身体制御処理手順と
    をコンピュータに実行させるための形態模写プレゼンロボットの制御プログラム。
JP2007097608A 2007-04-03 2007-04-03 形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラム Pending JP2008256857A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007097608A JP2008256857A (ja) 2007-04-03 2007-04-03 形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007097608A JP2008256857A (ja) 2007-04-03 2007-04-03 形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラム

Publications (1)

Publication Number Publication Date
JP2008256857A true JP2008256857A (ja) 2008-10-23

Family

ID=39980503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007097608A Pending JP2008256857A (ja) 2007-04-03 2007-04-03 形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラム

Country Status (1)

Country Link
JP (1) JP2008256857A (ja)

Similar Documents

Publication Publication Date Title
US20230019649A1 (en) Post-speech recognition request surplus detection and prevention
US11657804B2 (en) Wake word detection modeling
US20210174785A1 (en) Training and testing utterance-based frameworks
US10515640B2 (en) Generating dialogue based on verification scores
US9728188B1 (en) Methods and devices for ignoring similar audio being received by a system
US8762144B2 (en) Method and apparatus for voice activity detection
CN112739253B (zh) 用于肺部状况监测与分析的系统和方法
WO2020176179A1 (en) Linguistic style matching agent
US10147423B2 (en) Context-aware query recognition for electronic devices
KR102628211B1 (ko) 전자 장치 및 그 제어 방법
EP3210205A1 (en) Sound sample verification for generating sound detection model
WO2020244411A1 (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN112700782A (zh) 语音处理方法和电子设备
KR20210042523A (ko) 전자 장치 및 이의 제어 방법
CN106531148A (zh) 一种基于语音合成的漫画配音方法和装置
JP2008256857A (ja) 形態模写プレゼンロボット、形態模写プレゼンロボットの制御方法及び制御プログラム
WO2019187543A1 (ja) 情報処理装置および情報処理方法
Yuan et al. Design and implementation of voice controlled Tetris game based on Microsoft SDK
US10657956B2 (en) Information processing device and information processing method
WO2024019759A1 (en) Controlling head-mounted devices by voiced nasal consonants
JP2016080980A (ja) 応答生成装置、応答生成方法及び応答生成プログラム
KR20210109722A (ko) 사용자의 발화 상태에 기초하여 제어 정보를 생성하는 디바이스 및 그 제어 방법
KR20220036097A (ko) 분절에 의한 문맥 소실을 방지하는 신경망 기반 실시간 자동통역 방법
CN115273825A (zh) 语音指令识别方法、装置、电子设备和存储介质