JP2019144790A

JP2019144790A - 情報処理装置及びプログラム

Info

Publication number: JP2019144790A
Application number: JP2018027739A
Authority: JP
Inventors: 賢吾得地; Kengo Tokuchi
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2018-02-20
Filing date: 2018-02-20
Publication date: 2019-08-29
Also published as: US20190259389A1; US11031004B2

Abstract

【課題】受け付けた会話の相手に応じて会話の内容に対処する。【解決手段】情報処理装置１０は、ユーザからの会話の内容を受け付ける受付部１１と、受け付けた会話の内容を解析することによって会話の内容を認識し、会話の相手となるモノ（ロボット、植物、鳥等）を特定する解析部１２と、会話の相手となるモノ、モノへの伝達手段を含むモノ関連情報を参照することで、会話の相手に会話の内容を伝達するための伝達手段を特定する制御部１４と、制御部１４からの指示に従って、特定された伝達手段に従って会話の内容を会話の相手に伝える出力部１３と、を有する。【選択図】図２

Description

本発明は、情報処理装置及びプログラムに関する。

近年、あらゆるデバイスがインターネットに接続されて情報のやり取りを行うモノのインターネット（ＩｏＴ：ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ）の発展がめざましい。スマートフォン等の情報端末に所定のアプリケーションをインストールすれば、情報端末からＩｏＴ機器が利用可能となる。

ユーザは、例えばスマートスピーカーと会話をしながら、すなわち音声によりスマートスピーカーあるいはスマートスピーカーを介してＩｏＴ機器に処理の実行を指示することができるが、近年では、スマートスピーカー及びＩｏＴ機器と同様に動植物等の生物との会話を期待する声が聞かれる。

特開２００４−２３４６３１号公報特表２０１６−５２４１９０号公報

本発明は、受け付けた会話の相手に応じて会話の内容に対処することを目的とする。

本発明に係る情報処理装置は、会話の内容を受け付ける受付手段と、会話の相手を認識する認識手段と、会話の相手に応じて、会話の内容を伝達する伝達手段又は会話の内容を実現させる実現手段を特定する特定手段と、を有する。

また、前記特定手段により前記実現手段が特定された場合、前記実現手段に会話の内容が実現させるよう指示する指示手段を有することを特徴とする。

また、前記特定手段は、会話を発したユーザと会話の相手の位置関係に応じた前記伝達手段又は前記実現手段を特定することを特徴とする。

また、前記特定手段は、会話の相手が存在する環境に応じた前記伝達手段又は前記実現手段を特定することを特徴とする。

また、前記特定手段は、会話を発したユーザが存在する環境に応じた前記伝達手段又は前記実現手段を特定することを特徴とする。

また、前記特定手段は、予め設定されている情報を取得し、その取得した情報に基づき前記伝達手段を特定することを特徴とする。

また、前記特定手段は、前記会話の相手から前記情報を取得することを特徴とする。

また、前記認識手段は、会話を発したユーザから得られる情報に基づき会話の相手を認識することを特徴とする。

また、前記認識手段は、前記ユーザの動作又は発声の少なくとも一方に基づき前記会話の相手を認識することを特徴とする。

また、前記実現手段は、会話の内容を処理するソフトウェア又は会話の内容を実行するよう指示する手段であることを特徴とする。

また、前記会話の相手は、生物であることを特徴とする。

本発明に係るプログラムは、コンピュータを、会話の内容を受け付ける受付手段、会話の相手を認識する認識手段、会話の相手に応じて、会話の内容を伝達する伝達手段又は会話の内容を実現させる実現手段を特定する特定手段、として機能させる。

請求項１に記載の発明によれば、受け付けた会話の相手に応じて会話の内容に対処することができる。

請求項２に記載の発明によれば、会話の相手に対して会話の内容に従った行動又は作用を実現することができる。

請求項３に記載の発明によれば、ユーザと会話の相手の位置関係によって異なる伝達手段又は実現手段を選択することができる。

請求項４に記載の発明によれば、会話の相手が存在する位置によって異なる伝達手段又は実現手段を選択することができる。

請求項５に記載の発明によれば、会話を発したユーザが存在する位置によって異なる伝達手段又は実現手段を選択することができる。

請求項６に記載の発明によれば、既存の情報を参照して伝達手段を特定することができる。

請求項７に記載の発明によれば、会話の相手から会話の相手に依存した情報を取得することができる。

請求項８に記載の発明によれば、会話の相手を認識するための情報をユーザから取得することができる。

請求項９に記載の発明によれば、ユーザの動作又は発声に基づき会話の相手を認識することができる。

請求項１０に記載の発明によれば、会話によって指示された内容を実現することができる。

請求項１１に記載の発明によれば、会話の相手が生物の場合でも会話の内容を伝達することができる。

請求項１２に記載の発明によれば、受け付けた会話の相手に応じて会話の内容に対処することができる。

本発明に係る情報処理装置の一形態である携帯端末及び携帯端末のユーザが会話の対象とするモノを示す概念図である。本実施の形態における携帯端末のブロック構成図である。本実施の形態におけるモノ関連情報の一例をテーブル形式にて示す図である。本実施の形態における情報処理装置が実施する処理を示すフローチャートである。

以下、図面に基づいて、本発明の好適な実施の形態について説明する。

人間の会話の相手として、人間はもちろんのこと、犬や鳥、イルカ等の動物、植物、またコンピュータ等が考えられる。コンピュータに電子的な情報を与えたり、コンピュータに搭載される音声認識ソフトウェアが人間の発言を解釈したりすれば、人間とコンピュータとの間での会話は、成立しうると考えられる。動物においてもペットなどは人間の言葉を理解できる能力がある場合があるが、基本的にはそのような能力がない。しかしながら、例えば、鳥に対して苦手な音を出力することで所定の領域の所定の物（例えば、畑等の農作物）に寄せ付けないことが可能である。つまり、音及び音の種類や周波数等によって会話の内容とはいかないまでも、近付くなという人間の意思を伝えることは可能である。また、植物にクラシック等の音楽を聴かせると元気になるとも言われている。このことは、媒体として音を利用すれば、少なくとも一方向、すなわち人間側から鳥や植物側に刺激を与え、人間の意思を伝えられる可能性があると考えられる。このように、動物等の種類に応じて音、光、超音波等の媒体を出力する伝達手段を駆使すれば、動物等との間で会話が成立する可能性があると考えられる。

本実施の形態において特徴的なことは、人間の発話内容から会話の相手を特定し、その特定した相手に応じて、発話内容（会話の内容）を伝達する伝達手段を特定することである。これにより、特定した伝達手段を利用することでユーザの会話の相手に対してユーザの意思を伝達することが可能となる。また、会話により伝達したい内容が何らかの動作や処理を実行させるような指示の場合、会話の内容を実現させる実現手段を特定できるようにしたことを特徴としている。

ところで、「会話」とは、２人以上が互いに話したり聞いたりして共通の話を進めることをいう。本実施の形態では、「会話」を広義に解釈し、必ずしも双方向に限らず、人間側から動物等の相手への一方向への意思伝達を含めることにする。

図１は、本発明に係る情報処理装置の一形態である携帯端末及び携帯端末のユーザが会話の相手とするモノを示す概念図である。図１には、ユーザが使用する情報処理装置１０と、ユーザが情報処理装置１０を使用して会話を実現したいモノとして、ＰＣ（パーソナルコンピュータ）、複合機、ロボット、カメラ、スピーカー、ライト、車が示されている。これらのモノは、電子的な情報（データ、制御等の信号）を与えることで会話が可能となる。情報処理装置１０は、これらのモノと直接又は通信機器やネットワークを介して通信可能である。情報処理装置１０と通信可能な機器としてＩｏＴ機器がある。ＩｏＴ機器としては、プロジェクタ、液晶ディスプレイ等の表示装置、記録装置、再生装置、カメラ等の撮像装置、時計、監視カメラ、自動車、二輪車、航空機（例えば無人航空機（いわゆるドローン））、ゲーム機、ロボット（人型ロボット、人以外の動物型ロボット、それら以外のロボット等）、各種のセンシング機器（例えば温度センサ、湿度センサ、電圧センサ、電流センサ、ドアセンサ等）等の装置、また、冷蔵庫、炊飯器、電子レンジ、コーヒーメーカー、掃除機、洗濯機、空調機、照明機器等の家電等がある。

図１には、更に、鳥、イルカ等の動物及び植物が示されている。これらのモノは、基本的には言語を用いて人間と会話を行うことはできない。つまり、これらのモノには、言語（音声や文字）以外の伝達手段によって会話の内容を伝える必要がある。なお、本実施の形態では、ユーザとの会話の相手となるＩｏＴ機器や動植物等を「モノ」と総称することにする。

ここで、「伝達手段」というのは、音、光等の媒体そのもの、又は会話の内容を会話の相手に伝えるために媒体を利用する機器等の手段のことをいう。「実現手段」というのは、会話の内容が何らかの動作や処理が生じる指示の場合、その指示を実行する手段、若しくはその指示の実行を指示する手段のことをいう。例えば、ユーザが「メールをＡさんに送信して。」と発話（発声）した場合、「メールをＡさんに送信して。」という意味内容を会話の相手に伝えるのが伝達手段であり、メールをＡさんに送信する処理を実行するのが実現手段である。

本実施の形態における情報処理装置１０は、ＰＣ、タブレットＰＣ、スマートフォン、携帯電話、スマートスピーカー等の情報処理装置又は情報処理装置を搭載したＩｏＴ機器をはじめとする各種機器である。なお、スマートスピーカーは、一般に屋内に設置され、ユーザからの音声による問いかけに対し、ネットワークを介して種々の情報を得て回答したり、ＩｏＴ機器の動作を制御したりすることのできる音声アシスタント機能付きスピーカーである。つまり、音声だけで操作できるスピーカーである。「ＡＩスピーカー」とも呼ばれる場合もある。

情報処理装置１０は、ＣＰＵ、ＲＯＭ、ＲＡＭ、ハードディスクドライブ（ＨＤＤ）やソリッドステートドライブ（ＳＳＤ）等の記憶手段、ディスプレイ等の表示部及び液晶パネル等の操作部を有するユーザインタフェース、他の機器との間でデータ通信を行う通信手段、マイク等の音入力手段、スピーカー等の音出力手段を有する。また、情報処理装置１０の現在位置を取得できるようにＧＰＳ機能等の位置測定手段を搭載するのが望ましい。

図２は、図１に示す情報処理装置１０のブロック構成図である。情報処理装置１０は、受付部１１、解析部１２、出力部１３、制御部１４及び記憶部１５を有している。なお、説明に用いない構成要素については図２から省略している。受付部１１は、会話の内容、すなわちユーザの発話内容を受け付ける。解析部１２は、受付部１１が受け付けた会話の内容を解析することで、会話の内容から会話の相手を認識する。また、会話の内容（会話の意味内容）を認識する。出力部１３は、モノへ会話の内容を伝達するために、また会話の内容を実現するためにデータ等を出力する。制御部１４は、各構成要素１１〜１３の動作を制御する。また、制御部１４は、解析部１２が認識した会話の相手や内容に応じて、会話の内容を伝達する伝達手段又は会話の内容を実現させる実現手段を特定する。記憶部１５には、制御部１４が伝達手段又は実現手段を特定する際に参照する情報が保存されている。

図３は、記憶部１５に設定登録されているモノ関連情報をテーブル形式にて示す図である。モノ関連情報は、ユーザによって必要な項目に対して事前に設定登録される情報である。換言すると、ユーザが会話をしたいモノを「会話相手」として選出し、選出した各モノに対して必要な項目データをモノ関連情報に設定する。

モノ関連情報には、「会話相手」、「ユーザとの位置関係」、「周囲の環境」、「伝達手段」、「機器の言語」、「会話で実現したい内容」及び「実現手段」の各項目が対応付けして設定される。これらの項目のうち「会話相手」及び「伝達手段」以外の項目の設定は任意である。「会話相手」には、ユーザとの会話の相手となるモノが設定される。「ユーザとの位置関係」には、ユーザと当該会話相手との位置関係を示す情報が設定される。「周囲の環境」には、当該会話相手の周囲の環境が設定される。「伝達手段」には、会話の内容の当該会話相手への伝達手段が設定される。「機器の言語」には、会話相手が電子情報（データ信号や制御信号）を取り扱い可能な機器の場合、当該機器に伝達する際に用いる言語が設定される。「会話で実現したい内容」には、会話相手に何らかの動作や処理が伴う指示等会話相手に対する要望に相当する会話の内容が設定される。「実現手段」には、会話で実現したい内容を実現させる実現手段が設定される。図３に例示したように、１つのモノに対して複数のモノ関連情報（レコード）を設定することが可能である。また、図３には、“ＰＣ”、“車”などのようにモノの種類を設定しているが、モノ毎に設定してもよい。そのためにモノ関連情報（レコード）にモノの識別情報を付加する。例えば、ＰＣにおいてはＩＰアドレス等、ＰＣを個々に識別しうる情報をモノ関連情報に設定することで、ＰＣ単体毎にモノ関連情報（レコード）を設定してもよい。

図３におけるモノ関連情報には、項目データの設定例として、“近い”、“静か”などの主観的な用語が設定されている。例えば、「ユーザとの位置関係」における項目データは、“近い”、“遠い”という語で表されている。このような主観的な表現で示されているユーザとモノとの位置関係を判断するためには、まずユーザ及びモノそれぞれの位置を特定する必要がある。ユーザにより会話の相手として指定されたモノの位置が固定されている場合、その位置を所定のデータベース等から取得する。あるいはモノにＧＰＳ等の測位手段が搭載されている場合は、その測位された位置をモノから取得する。あるいは、モノの位置検出手段から当該モノの位置情報を取得する。また、ユーザにより会話の相手として指定されたモノが移動可能な場合、モノにＧＰＳ等の測位手段が搭載されている場合は、その測位された位置をモノから取得する。あるいは、モノの位置検出手段から当該モノの位置情報を取得する。このように、情報処理装置１０がモノの位置情報を取得するためには、通信手段が必要となる場合がある。情報処理装置１０においてもモノの場合と同様にして現在位置を特定する。

そして、相対的に近い位置かそうでない位置かは、予め決められた条件に従って判断してよい。例えば、ユーザとモノとの位置関係（距離）と所定の閾値との比較でもよい。所定の閾値は、モノの種類毎、あるいはモノ毎に設定してもよい。また、ネットワークを介して通信するモノの場合、通信規格や利用形態によって通信可能な範囲は制限されるので、その通信範囲を考慮して“近い”、“遠い”を判断するようにしてもよい。

また、「周囲の環境」も基本的には同様である。例えば、音に関わる周辺環境に関しては、騒音計等の音量測定手段（音センサ）がモノの近傍に設置されており、その音量測定手段により測定された音量と、所定の閾値とを比較して、“静か”、 “賑やか”、あるいは“普通”を判断するようにしてもよい。 “暗い”等の明るさに関しても同様で照度測定手段（光センサ）等によって照度等を測定し、明るさを判断してよい。

また、伝達手段としてネットワークを利用する場合、情報処理装置１０には、通信規格に従ったネットワーク通信を行うための通信インタフェースが用意されている必要がある。また、通信規格によっては、通信相手となる機器又は通信を中継する機器を特定するための情報（アドレス情報や識別情報（ＳＳＩＤ、暗号化キー）等）が必要となってくるが、情報処理装置１０は、ユーザがモノ関連情報に設定する機器に関しては、それら通信を可能とするための情報を取得している、若しくは取得可能であるものとする。

情報処理装置１０における各構成要素１１〜１４は、情報処理装置１０を形成するコンピュータと、コンピュータに搭載されたＣＰＵで動作するプログラムとの協調動作により実現される。また、記憶部１５は、情報処理装置１０に搭載されたＨＤＤにて実現される。あるいは、ＲＡＭ又は外部にある記憶手段をネットワーク経由で利用してもよい。

本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、ＣＤ−ＲＯＭやＵＳＢメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのＣＰＵがプログラムを順次実行することで各種処理が実現される。

次に、本実施の形態における情報処理装置１０の動作について、図４に示すフローチャートを用いて説明する。

ユーザが会話の相手に伝達したい内容（「会話の内容」）を音声により情報処理装置１０に入力すると、受付部１１は、マイクにより集音された会話の内容を受け付ける（ステップ１０１）。なお、本実施の形態では、会話の内容を音声により入力することを想定して説明するが、必ずしも音声に限定する必要はなく、受付部１１は、例えば文字により入力された情報を受け付けるようにしてもよい。

受付部１１が会話の内容を受け付けると、続いて、解析部１２は、受け付けた会話の内容の音声認識及び意味解析を行うことで会話の内容を認識する（ステップ１０２）。そして、受け付けた会話の内容から会話の相手を特定する（ステップ１０３）。例えば、会話の内容を解析した結果、会話の内容に「ロボット」、「鳥」など会話の相手（モノ）を特定する単語が含まれていれば、その会話の内容から会話の相手を特定できる。

また、会話の内容に会話の相手を特定する単語が含まれていなくても、例えば、「コピー」とあれば、コピー機能が搭載された機器、具体的には会話の相手を複合機と特定してもよい。

ユーザの周囲に複数の複合機が存在する場合、最も近くにある複合機を会話の相手と特定してもよい。この場合には、複合機及びユーザの位置情報を取得する手段が必要となる。解析部１２は、複合機が設置されている施設が有するデータベースにアクセスすることによって複合機の位置情報を取得してもよいし、各複合機と通信して各複合機の位置情報を取得してもよい。

また、情報処理装置１０にカメラ等の撮影手段が搭載されている場合、ユーザは、会話の相手としたいモノを撮影手段により撮影することによって会話の相手を特定するようにしてもよい。この場合、解析部１２は、撮像データを画像解析することでモノを特定する。

また、ユーザが会話の相手を指定する語として「これ」と発言している場合、解析部１２は、撮像データを解析して、ユーザに近いモノを会話の相手と特定してもよい。同様に、ユーザが会話の相手を「あれ」と発言している場合、解析部１２は、ユーザから遠い位置にあるモノを会話の相手を特定してもよい。

また、ユーザの所在位置にカメラが設定されていて、そのカメラの撮影範囲にユーザ及び会話の相手となるモノが存在する場合、ユーザは、会話の相手に顔を向ける、あるいは視線を向けるようにしてもよい。解析部１２は、カメラによる撮像データにおけるユーザの向いている方向を解析して、会話の相手を特定する。

上記例示したように、解析部１２は、会話を発したユーザから得られる情報、すなわち受付部１１が受け付けた会話の内容（ユーザによる発声）、あるいはユーザの顔や視線の動き等のユーザの動作から会話の相手を認識する。本実施の形態では、会話の相手を認識するいくつかのパターンを例示したが、これらのパターンのいずれかを採用するのではなくいくつかのパターンを組み合わせて会話の相手を認識するようにしてもよい。

続いて、制御部１４は、認識された会話の内容から会話の内容を伝達する伝達手段を特定する（ステップ１０４）。本実施の形態では、記憶部１５に予め設定登録されているモノ関連情報に基づき特定する。なお、ここでは、特に断らない限り、会話の内容が、いずれかのモノに何らかの動作をさせたり、処理を実行させたりするような指示でない場合（ステップ１０５でＮ）、すなわち会話の内容を会話の相手に単に伝達する場合であることとして説明する。この場合、制御部１４は、会話の内容を伝達する伝達手段を以下のようにして特定する（ステップ１０６）。

例えば、会話の相手が複合機と特定されている場合、モノ関連情報を参照すると伝達手段としてネットワーク通信（Ｗｉ−Ｆｉ(登録商標)）が対応付けられている。従って、制御部１４は、複合機への伝達手段をネットワーク通信（Ｗｉ−Ｆｉ）と特定する。これにより、出力部１３は、制御部１４からの指示に従い、会話の内容を、Ｗｉ−Ｆｉの通信規格に従ったネットワークを介して複合機へ送信する。

また、会話の相手がロボットと特定されている場合、モノ関連情報を参照すると伝達手段としてネットワーク通信（ＢＬＥ（Ｂｌｕｅｔｏｏｔｈ（登録商標）ＬｏｗＥｎｅｒｇｙ））とネットワーク通信（Ｗｉ−Ｆｉ）が対応付けられている。このように、一のモノに対して複数の情報（レコード）が存在する場合、制御部１４は、例えば、特定したロボットとの位置関係を参照し、ユーザとロボットの間の距離に応じて伝達手段を特定する。具体的には、ロボットがユーザと相対的に近い位置にあれば、ロボットへの伝達手段をネットワーク通信（ＢＬＥ）と特定する。相対的に近い位置かそうでない位置かは、前述したように予め決められた条件に従って判断してよい。これにより、出力部１３は、制御部１４からの指示に従い、会話の内容を、ＢＬＥの通信規格に従ったネットワークを介してロボットへ送信する。一方、ロボットがユーザと相対的に遠い位置にあれば、ロボットへの伝達手段をネットワーク通信（Ｗｉ−Ｆｉ）と特定する。これにより、出力部１３は、制御部１４からの指示に従い、会話の内容を、Ｗｉ−Ｆｉの通信規格に従ったネットワークを介してロボットへ送信する。

また、会話の相手が植物と特定されている場合、モノ関連情報を参照すると音声、スピーカー及び光と、複数の伝達手段が対応付けられている。この場合、制御部１４は、例えば、特定した植物の周囲の環境を参照し、植物の周囲の環境に応じて伝達手段を特定する。具体的には、植物の周囲の環境が、特に特徴的な環境になく普通の場合、伝達手段を音声、すなわちユーザによる発声で伝達することに特定する。この場合、制御部１４は、出力部１３に指示し、情報処理装置１０の表示部にその旨を表示させたり、スピーカーから音出力したりすることでユーザに伝える。ユーザは、この出力に応じて会話の内容を再度発声する。あるいは、出力部１３は、情報処理装置１０に内蔵されたスピーカーから受付部１１が受け付けた音声を出力してもよい。

また、植物の周囲の環境が賑やかな場合、伝達手段としてスピーカーと特定する。この場合、出力部１３は、制御部１４からの指示に従い、会話の内容を、スピーカーから音出力する。この際の音量は、賑やかな状況でも植物に音は届くように音声より大きくする。あるいは、植物の近傍にスピーカーが設置されていれば、そのスピーカーから音出力させてもよい。

また、植物の周囲の環境が暗い場合、伝達手段として光と特定する。出力部１３は、植物の近傍のライトの点灯（点滅）を制御して、会話の内容を伝達する。なお、伝達先とするモノによっては、点灯（点滅）、色、照度等を調整して会話の内容を伝えるようにしてもよい。

以上説明したように、本実施の形態においては、モノ関連情報を参照し、特定された会話の相手に対応付けられている伝達手段を、その会話の相手に伝達する伝達手段として特定する。そして、特定した伝達手段を利用して会話の内容を会話の相手に伝達する。また、会話の相手に対してユーザとモノとの位置関係やモノの周囲の環境（モノが存在する環境）のような項目に伝達手段の選択条件（項目データ）が設定されている場合には、その項目データに合致する伝達手段を選出する。

本実施の形態においては、伝達手段の選択条件として、ユーザとモノとの位置関係及びモノの周囲の環境（モノが存在する環境）を例にして説明したが、伝達手段を選択する条件（項目）は、この例に限定する必要はない。例えば、ユーザが存在する周囲の環境に応じて伝達手段を特定するようにしてもよい。

なお、モノ関連情報への設定内容によっては、複数の選択条件に合致する場合がある。例えば、会話の相手が植物の場合、植物の周囲の環境が賑やかでかつ暗い場合がある。また、植物の周囲の環境が普通でもユーザとの位置関係は遠い場合がある。このように、複数のレコードに合致するような場合、伝達手段の特定に参照する項目に優先順位を付けたり、同じモノのレコードの中で優先順位を付けたりして伝達手段が一意に特定できるようにする。あるいは、一の会話の相手に対し、１つの伝達手段のみに特定するのではなく複数の伝達手段を用いて複数の経路から会話の内容を伝えるようにしてもよい。

上記説明においては、会話の内容が、いずれかのモノに何らかの動作をさせたり、処理を実行させたりするような指示でない場合（ステップ１０５でＮ）を前提として説明したが、以降では、会話の内容がこのような指示に該当する場合（ステップ１０５でＹ）について説明する。この場合、制御部１４は、会話の内容を実現させる実現手段を次のようにして特定する（ステップ１０７）。

すなわち、制御部１４は、前述したように会話の相手及び伝達手段が特定されると、これに対応してモノ関連情報に設定されている「会話で実現したい内容」（項目データ）を取得する。そして、取得した会話で実現したい内容と、解析部１２により会話の内容を意味解析して得た内容とを照合する。そして、合致する場合は、会話で実現したい内容に対応する実現手段をモノ関連情報から取得する。制御部１４は、このようにして会話の内容を実現する実現手段を特定する。

例えば、会話の内容が「領収書を集計して。」の場合、解析部１２は、会話の相手をＰＣと特定し、更にその会話の内容の意味を認識する。そして、制御部１４は、伝達手段がＰＣに対応する情報の中に、解析部１２が解析した内容と意味が合致する「会話で実現したい内容」が設定されている場合、それに対応する実現手段を取り出し、特定する。

実現手段が特定されると、「領収書を集計して。」を実現するために、出力部１３は、制御部１４からの指示に従い、有線ＬＡＮを介してＰＣに処理の内容を伝え、リモートアプリに処理するよう指示する（ステップ１０８）。この際に必要な領収書データを送信したり、領収書データの格納先を知らせたりする。

本実施の形態では、リモートアプリ自体に会話の内容を処理させる場合を想定して説明した。つまり、実現手段であるリモートアプリは、処理を実施することで会話の内容を実現するソフトウェアに相当する。ただ、実現手段として特定されたリモートアプリを実行するＰＣ等の情報処理装置が、会話の内容を実現するために必要な他のモノ（ハードウェア）へのアクセス権限やソフトウェアの利用権限等が付与されていない場合も想定しうる。したがって、実現手段は、会話の内容を実現するために必要な権限を有する他のモノやソフトウェアに会話の内容を実行するよう指示する手段であってもよい。なお、情報処理装置１０がモノ関連情報に設定されている実現手段に対する権限を有していない場合も想定できるので、この場合も同様に、実現手段に対して権限を有するモノに依頼することによって実現手段に対して間接的に会話の内容を実現させるようにしてもよい。

以上説明したように、本実施の形態においては、会話の内容から会話の相手を特定し、その特定した会話の相手に適した伝達手段により会話の内容を会話の相手に伝えることができる。会話は、情報処理が可能な装置に限らず、動植物等の生物が解釈可能な伝達手段を利用することで生物との会話も可能とする。そして、会話の内容が動作や処理の指示等の場合は、その会話の内容を実現できるように実現手段を特定できるようにした。本実施の形態では、モノ関連情報に基づき伝達手段及び実現手段を特定したが、これに限る必要はない。例えば、会話の相手となるモノ若しくはそのモノに関連する記憶領域に伝達手段や実現手段を特定する情報が格納されている場合、制御部１４は、そのモノや記憶領域から伝達手段や実現手段を特定する情報を取得し、伝達手段や実現手段を特定するようにしてもよい。モノに依存した記憶領域から伝達手段及び実現手段を得ることによって、ユーザがモノ関連情報に設定した内容と比較して、確度の高い情報を得ることができる。

記憶領域としては、モノがコンピュータ等記憶手段を内蔵するモノであれば、そのメモリでもよい。あるいは、例えばモノの内部に組み込まれた、あるいは、例えばペット(モノ)の首輪等、モノに取り付けられている物に組み込まれている記憶手段でもよい。このように、会話の相手から伝達手段や実現手段を特定する情報を取得してもよい。あるいは、過去の実績情報や学習により伝達手段や実現手段を特定してもよい。

１０情報処理装置、１１受付部、１２解析部、１３出力部、１４制御部、１５記憶部。

Claims

会話の内容を受け付ける受付手段と、
会話の相手を認識する認識手段と、
会話の相手に応じて、会話の内容を伝達する伝達手段又は会話の内容を実現させる実現手段を特定する特定手段と、
を有する情報処理装置。
前記特定手段により前記実現手段が特定された場合、前記実現手段に会話の内容が実現させるよう指示する指示手段を有することを特徴とする請求項１に記載の情報処理装置。
前記特定手段は、会話を発したユーザと会話の相手の位置関係に応じた前記伝達手段又は前記実現手段を特定することを特徴とする請求項１に記載の情報処理装置。
前記特定手段は、会話の相手が存在する環境に応じた前記伝達手段又は前記実現手段を特定することを特徴とする請求項１に記載の情報処理装置。
前記特定手段は、会話を発したユーザが存在する環境に応じた前記伝達手段又は前記実現手段を特定することを特徴とする請求項１に記載の情報処理装置。
前記特定手段は、予め設定されている情報を取得し、その取得した情報に基づき前記伝達手段を特定することを特徴とする請求項１に記載の情報処理装置。
前記特定手段は、前記会話の相手から前記情報を取得することを特徴とする請求項６に記載の情報処理装置。
前記認識手段は、会話を発したユーザから得られる情報に基づき会話の相手を認識することを特徴とする請求項１に記載の情報処理装置。
前記認識手段は、前記ユーザの動作又は発声の少なくとも一方に基づき前記会話の相手を認識することを特徴とする請求項８に記載の情報処理装置。
前記実現手段は、会話の内容を処理するソフトウェア又は会話の内容を実行するよう指示する手段であることを特徴とする請求項１に記載の情報処理装置。
前記会話の相手は、生物であることを特徴とする請求項１乃至１０のいずれか１項に記載の情報処理装置。
コンピュータを、
会話の内容を受け付ける受付手段、
会話の相手を認識する認識手段、
会話の相手に応じて、会話の内容を伝達する伝達手段又は会話の内容を実現させる実現手段を特定する特定手段、
として機能させるためのプログラム。