JPWO2014103568A1

JPWO2014103568A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: JPWO2014103568A1
Application number: JP2014554243A
Authority: JP
Inventors: 知昭武村; 慎哉桝永; 藤田　孝次; 孝次藤田; 石綿　克利; 克利石綿; 健一池永; 克敏楠元
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-12-28
Filing date: 2013-11-20
Publication date: 2017-01-12
Also published as: EP2940683A1; US10424291B2; JP2018170015A; US11100919B2; US11676578B2; BR112015014830B1; US20230267920A1; BR112015014830A2; WO2014103568A1; US20190348024A1; US20150310854A1; JP6603754B2; EP2940683A4; CN104871240A; CN110889265B; EP3896596A1; US20210358480A1; CN110889265A

Abstract

音声認識の結果得られる発話内容を示す文字列を解析する解析部と、発話内容を示す文字列と解析の結果とを、表示画面に表示させる表示制御部と、を備える、情報処理装置が提供される。【選択図】図９

Description

本開示は、情報処理装置、情報処理方法、およびプログラムに関する。

音声を認識して処理を行うことが可能な装置が登場している。また、音声入力を用いる技術も開発されている。音声入力と他の入力とを併用する技術としては、例えば、下記の特許文献１に記載の技術が挙げられる。

特開２００１−１６６９１４号公報

例えば上記特許文献１に記載の技術が用いられる場合を含め、音声を認識して処理を行うことが可能な既存の装置（以下、単に「既存の装置」と示す場合がある。）では、発話内容のどの部分が認識されて処理が行われたのかを、ユーザは知ることができない。そのため、既存の装置が用いられる場合には、例えば“当該装置における音声発話によるその後の挙動が、ユーザに十分に伝わらない”など、ユーザの利便性を低下させうる事態が起こりうる。

本開示では、ユーザの利便性の向上を図ることが可能な、新規かつ改良された情報処理装置、情報処理方法、およびプログラムを提案する。

本開示によれば、音声認識の結果得られる発話内容を示す文字列を解析する解析部と、上記発話内容を示す文字列と解析の結果とを、表示画面に表示させる表示制御部と、を備える、情報処理装置が提供される。

また、本開示によれば、音声認識の結果得られる発話内容を示す文字列を解析するステップと、上記発話内容を示す文字列と解析の結果とを、表示画面に表示させるステップと、を有する、情報処理方法が提供される。

また、本開示によれば、音声認識の結果得られる発話内容を示す文字列を解析するステップ、上記発話内容を示す文字列と、解析の結果とを表示画面に表示させるステップ、をコンピュータに実行させるためのプログラムが提供される。

本開示によれば、ユーザの利便性の向上を図ることができる。

本実施形態に係る情報処理方法に係る処理の概要を説明するための説明図である。本実施形態に係る情報処理方法に係る処理の第１の例を示す流れ図である。本実施形態に係る情報処理方法に係る処理の第２の例を示す流れ図である。本実施形態に係る動作解析用の辞書の一例を示す説明図である。本実施形態に係る解析結果と対応するアプリケーションやサービスの一例を示す説明図である。本実施形態に係る情報処理方法に係る処理の第３の例を示す流れ図である。本実施形態に係るスコア調整用の辞書の一例を示す説明図である。本実施形態に係る時制解析用の辞書の一例を示す説明図である。本実施形態に係る情報処理装置の構成の一例を示すブロック図である。本実施形態に係る情報処理装置のハードウェア構成の一例を示す説明図である。本実施形態に係る情報処理システムの一例を示す説明図である。本実施形態に係る情報処理システムにおける処理の一例を示す説明図である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

また、以下では、下記に示す順序で説明を行う。
１．本実施形態に係る情報処理方法
２．本実施形態に係る情報処理装置
３．本実施形態に係る情報処理システム
４．本実施形態に係るプログラム

（本実施形態に係る情報処理方法）
本実施形態に係る情報処理装置の構成について説明する前に、まず、本実施形態に係る情報処理方法について説明する。以下では、本実施形態に係る情報処理装置が、本実施形態に係る情報処理方法に係る処理を行う場合を例に挙げて、本実施形態に係る情報処理方法について説明する。

［１］本実施形態に係る情報処理方法の概要
上述したように、既存の装置が用いられる場合には、発話内容のどの部分が認識されて処理が行われたのかを、ユーザは知ることができない。そのため、既存の装置が用いられる場合には、例えば“当該装置における音声発話によるその後の挙動が、ユーザに十分に伝わらない”など、ユーザの利便性を低下させうる事態が起こりうる。

そこで、本実施形態に係る情報処理装置は、音声認識の結果得られる発話内容の文字列（以下、単に「発話内容の文字列」と示す場合がある。）を解析する（解析処理）。そして、本実施形態に係る情報処理装置は、発話内容の文字列と解析の結果とを、表示画面に表示させる（表示制御処理）。

ここで、本実施形態に係る情報処理装置は、例えば、発話内容を示す音声データに対して音声認識に係る処理を行うことによって、処理対象となる発話内容の文字列を得るが、本実施形態に係る処理対象となる発話内容の文字列の取得方法は、上記に限られない。例えば、本実施形態に係る情報処理装置は、サーバなどの外部装置において音声認識に係る処理が行われた結果得られる発話内容の文字列を示すデータを、当該外部装置から取得することによって、処理対象となる発話内容の文字列を得てもよい。

また、本実施形態に係る音声認識に係る処理としては、例えば、統計的手法を用いた処理や、隠れマルコフモデルを利用した処理などが挙げられるが、本実施形態に係る音声認識に係る処理は、上記に限られない。例えば、本実施形態に係る情報処理装置、または、サーバなどの外部装置は、発話内容を示す音声データから発話内容の文字列を得ることが可能な、任意の処理を用いることが可能である。

また、本実施形態に係る情報処理装置が発話内容の文字列と解析の結果とを表示させる表示画面としては、例えば、自装置（本実施形態に係る情報処理装置）が備える表示部（後述する）が挙げられるが、本実施形態に係る情報処理装置が発話内容の文字列と解析の結果とを表示させる表示画面は、上記に限られない。例えば、本実施形態に係る情報処理装置は、有線または無線で接続された外部装置が備える表示デバイスの表示画面に、発話内容の文字列と解析の結果とを表示させてもよい。

本実施形態に係る情報処理装置が、音声認識の結果得られる発話内容の文字列を表示画面に表示させることによって、発話を行ったユーザは、発話がどのように音声認識されたかを視覚的に把握することができる。

また、本実施形態に係る情報処理装置が、発話内容の文字列に対する解析の結果を、発話内容の文字列と共に併せて表示させることによって、発話を行ったユーザは、発話がどのように解析されたかを視覚的に把握することができる。よって、発話を行ったユーザは、発話によってその後に行われた、装置（例えば、本実施形態に係る情報処理装置や、本実施形態に係る情報処理装置によって動作が制御される装置など）における処理が、発話内容のどの部分が認識されて行われたのかを、把握することが可能となる。

したがって、本実施形態に係る情報処理装置が、本実施形態に係る情報処理方法に係る処理として、（１）解析処理、および（２）表示制御処理、を行うことによって、ユーザの利便性の向上を図ることができる。

図１は、本実施形態に係る情報処理方法に係る処理の概要を説明するための説明図であり、本実施形態に係る情報処理装置が表示画面に表示させる画面の一例を示している。

図１に示すＡは、テレビ受像機を対象としたアプリケーションの選択画面の一例を示しており、図１に示すＡ１は、ユーザが音声認識を行わせるためのアプリケーションを選択するためのアイコンの一例を示している。

図１のＡに示す画面において、例えばユーザ操作により図１のＡ１に示すアイコンが選択された場合には、例えば図１のＢに示すような、ユーザが音声認識を行わせるためのアプリケーションの実行画面が表示される。

図１のＢに示す画面において、ユーザが、マイクロホンなどの音声入力デバイスに対して発話を行うと、本実施形態に係る情報処理装置は、発話内容の文字列を示すデータに基づいて、本実施形態に係る情報処理方法に係る上記（１）の処理（解析処理）を行う。そして、本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る上記（２）の処理（表示制御処理）を行うことによって、例えば図１のＣに示すような、発話内容の文字列と解析の結果とが併せて表示される画面を表示させる。

ここで、図１のＣでは、ユーザが「明日のＸＸＸが見たい」と発話した場合に表示される画面の一例を示している。図１のＣ１に示すように、本実施形態に係る情報処理装置は、例えば、「明日のＸＸＸが見たい」という発話内容を示す文字列を表示させ、さらに、解析の結果を表示させる。

図１のＣでは、本実施形態に係る情報処理装置が、発話内容を示す文字列の解析の結果を、クォーテーションマークで強調して示す例を示しているが、本実施形態に係る解析の結果の表示方法は、上記に限られない。例えば、本実施形態に係る情報処理装置は、文字に下線を引くことや、文字の色やフォントを変えることなど、視覚的な変化を文字に与えることが可能な任意の方法によって、発話内容を示す文字列の解析の結果を強調して表示してもよい。

また、本実施形態に係る情報処理装置は、例えば図１のＣのＣ２に示すように、本実施形態に係る情報処理方法に係る上記（２）の処理（表示制御処理）を行うことによって、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、表示画面に表示させてもよい。

ここで、本実施形態に係る発話内容に対応するアプリケーションとしては、例えば、テレビジョン放送の番組表を表示させるアプリケーションや、テレビジョン放送の視聴に係るアプリケーション、録画されているコンテンツのリストを表示させるアプリケーション、記録媒体に記憶されているコンテンツの再生に係るアプリケーション、ホームネットワークなどのネットワークに接続するためのアプリケーションなど、様々なアプリケーションが挙げられる。また、本実施形態に係る発話内容に対応するサービスとしては、例えば、ビデオサービスや、ミュージックサービス、画像投稿Ｗｅｂサイトで提供されるサービス、検索サイトなどで提供される検索サービスなど、様々なサービスが挙げられる。

例えば図１のＣのＣ２に示す“ＴＶ番組”が選択されると、例えば図１のＤに示すような、選択されたアプリケーションや選択されたサービスに対応する画面が表示される。

例えば図１のＣのＣ１に示すように、本実施形態に係る情報処理装置は、発話内容を示す文字列と、解析の結果とを表示画面に表示させる。よって、例えば図１のＣに示す画面を見たユーザは、発話内容を示す文字列によって、発話がどのように音声認識されたかを視覚的に把握することができ、また、クォーテーションマークのように強調表示されることによって、発話がどのように解析されたかを視覚的に把握することができる。

したがって、本実施形態に係る情報処理装置は、ユーザの利便性の向上を図ることができる。なお、本実施形態に係る情報処理装置が、本実施形態に係る情報処理方法に係る処理によって表示させる画面が、図１のＣに示す例に限られず、また、本実施形態に係る情報処理装置が表示させる画面が、図１のＡ、図１のＢ、図１のＤに示す例に限られないことは、言うまでもない。

［２］本実施形態に係る情報処理方法に係る処理の一例
次に、本実施形態に係る情報処理装置における、本実施形態に係る情報処理方法に係る処理について、より具体的に説明する。上述したように、本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る処理として、例えば、上記（１）の処理（解析処理）および上記（２）の処理（表示制御処理）を行う。

（１）解析処理
本実施形態に係る情報処理装置は、音声認識の結果得られる発話内容を示す文字列を解析する。

本実施形態に係る情報処理装置は、例えば、記憶部（後述する）や外部記録媒体に記憶されている構文解析用の辞書を用いて、形態素解析を行うことによって、発話内容を示す文字列を、名詞や動詞などの単語に分割する。ここで、本実施形態に係る辞書は、例えば、データベース形式のデータであってもよいし、テーブル形式のデータであってもよい。

また、本実施形態に係る情報処理装置は、例えば、さらに、記憶部（後述する）や外部記録媒体に記憶されている意味解析用の辞書を用いて、発話内容を示す文字列に対して意味解析（または意図解析）を行ってもよい。

なお、本実施形態に係る（１）の処理（解析処理）は、上記に限られない。

例えば、本実施形態に係る情報処理装置は、発話内容を示す文字列に対する構文解析の結果、または、構文解析の結果および発話内容を示す文字列に対する意味解析の結果に基づいて、発話内容を示す文字列にスコアを設定してもよい。

ここで、本実施形態に係る情報処理装置は、例えば、形態素解析などによって分割された単語ごとにスコアを設定する。より具体的には、本実施形態に係る情報処理装置は、例えば、分割された単語それぞれに対して基準スコアを設定し、分割された単語それぞれに設定されたスコアを調整することによって、分割された単語それぞれに対応するスコアを設定する。本実施形態に係るスコアの設定に係る処理の一例については、後述する。

（１）の処理（解析処理）において設定されたスコアは、例えば、後述する本実施形態に係る実行処理において用いられる。本実施形態に係るスコアの設定に係る処理の一例、および設定されたスコアが利用される処理の一例については、後述する。

また、本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列に対して動作を解析してもよい。本実施形態に係る情報処理装置は、例えば、記憶部（後述する）や外部記録媒体に記憶されている動作解析用の辞書を用いて、形態素解析などによって分割された単語の中に、動作解析用の辞書に登録されている動作を示す単語が含まれているか否かを判定することによって、発話内容を示す文字列に対して動作を解析する。

（１）の処理（解析処理）における動作の解析結果は、例えば（２）の処理（表示制御処理）において用いられる。（２）の処理（表示制御処理）における動作の解析結果が利用される処理の一例については、後述する。

また、本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列に対して時制を解析してもよい。本実施形態に係る情報処理装置は、例えば、記憶部（後述する）や外部記録媒体に記憶されている時制解析用の辞書を用いて、形態素解析などによって分割された単語の中に、時制解析用の辞書に登録されている時制を示す単語が含まれているか否かを判定することによって、発話内容を示す文字列に対して時制を解析する。

（１）の処理（解析処理）における時制の解析結果は、例えば、後述する本実施形態に係る実行処理において用いられる。後述する本実施形態に係る実行処理における時制の解析結果が利用される処理の一例については、後述する。

また、形態素解析などによって分割された単語には、音声認識のゆらぎが存在する場合がある。本実施形態に係る音声認識のゆらぎとは、例えば、“特定の漢字で表される単語が、平仮名で表されてしまうこと”や、“正式名称ではなく略称で発話された場合に、分割された単語が、当該略称となること”などが挙げられる。上記のような音声認識のゆらぎが生じた場合には、例えば後述する本実施形態に係る実行処理などにおいて、正常に処理が行えないことや、ユーザが所望する処理結果を得ることができないことなどが生じる可能性がある。

そこで、本実施形態に係る情報処理装置は、例えば、上記のような正常に処理が行えないことなどを防止するために、音声認識のゆらぎを補正してもよい。本実施形態に係る情報処理装置は、例えば、記憶部（後述する）や外部記録媒体に記憶されているゆらぎ吸収用の辞書を用いて、形態素解析などによって分割された単語を置換することによって、音声認識のゆらぎを補正する。

本実施形態に係る情報処理装置が、（１）の処理（解析処理）において音声認識のゆらぎを補正する場合には、（２）の処理（表示制御処理）において表示される画面には、音声認識のゆらぎが補正された発話内容を示す文字列が、表示される。

本実施形態に係る情報処理装置は、例えば、上記のような処理のうちの１または２以上の処理を、本実施形態に係る解析処理として行う。なお、本実施形態に係る解析処理が、上記に示す処理の例に限られないことは、言うまでもない。

（２）表示制御処理
本実施形態に係る情報処理装置は、発話内容を示す文字列と、上記（１）の処理（解析処理）における解析の結果とを、表示画面に表示させる。ここで、本実施形態に係る情報処理装置は、例えば図１のＣのＣ１に示すように、解析の結果が強調表示されるように、発話内容を示す文字列と解析の結果とを表示させる。

また、本実施形態に係る情報処理装置は、例えば、表示画面に表示させる発話内容を示す文字列を、編集することが可能な状態で表示させてもよい。本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列の全体、または、発話内容を示す文字列における、形態素解析などによって分割された単語ごとに、文字列を編集可能とする。

ここで、本実施形態に係る情報処理装置は、例えば、キーボードなどの入力デバイスや、ソフトウェアキーボードなどの仮想的な入力デバイスを用いた入力操作によって、ユーザによる発話内容を示す文字列の編集を可能とする。なお、本実施形態に係る発話内容を示す文字列の編集方法は、上記に限られない。例えば、本実施形態に係る情報処理装置は、ユーザによる発話によって、ユーザによる発話内容を示す文字列の編集を可能としてもよい。

例えば、音声認識に係る処理が行われる場合、誤認識により、音声認識の結果に誤りが存在することが起こりうる。ここで、既存の装置では、誤認識された結果に基づいてそのまま処理を行うため、処理の再試行が必要となり、また、再試行時にはユーザが再度発話をやり直さなければならない。また、既存の装置が用いられる場合には、上述したように、発話内容のどの部分が認識されて処理が行われたのかを、ユーザは知ることができない。さらには、既存の装置では、再度発話が行われたとしても、再度誤認識が生じうることから、ユーザが何度も発話をやり直さなければユーザが所望する動作が実現されないなど、ユーザの利便性の低下が生じる事態が発生しうる。

これに対して、本実施形態に係る情報処理装置は、上述したように、発話内容を示す文字列を表示画面に表示させるので、発話を行ったユーザは、音声認識における誤認識を視覚的に把握することができる。また、本実施形態に係る情報処理装置が、表示画面に表示させる発話内容を示す文字列を編集することが可能な状態で表示させることによって、仮に、音声認識の結果得られる発話内容の文字列に誤りが存在する場合であっても、ユーザは、当該誤り部分を修正して、例えば後述する実行処理を、本実施形態に係る情報処理装置（または、外部装置）に行わせることができる。

したがって、発話内容を示す文字列を編集することが可能な状態で表示させることによって、本実施形態に係る情報処理装置は、例えば、ユーザに発話内容の修正を促すことを可能とし、より精度の高い処理を、自装置（本実施形態に係る情報処理装置）または外部装置に行わせることができる。また、発話内容を示す文字列を編集することが可能な状態で表示させることによって、ユーザは、例えば、ユーザが何度も発話をやり直さなければユーザが所望する動作が実現されないことなどが防止されるので、ユーザの利便性をより向上させることができる。

また、本実施形態に係る情報処理装置は、例えば図１のＣのＣ２に示すように、上記（１）の処理（解析処理）における解析の結果に基づいて、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、さらに表示画面に表示させてもよい。

ここで、本実施形態に係る情報処理装置は、例えば、能力情報に基づいて、表示画面に表示させるアプリケーションの候補、および／または、表示画面に表示させるサービスの候補を決定する。そして、本実施形態に係る情報処理装置は、例えば、決定されたアプリケーションの候補および／またはサービスの候補の中から、上記（１）の処理（解析処理）における解析の結果に対応するアプリケーション、サービスを選択して、選択されたアプリケーション、サービスを、表示画面に表示させる。

本実施形態に係る能力情報としては、例えば、装置が有する能力を示すデータ（例えば、装置が有する機能を示すデータや、各機能の能力を示すデータなど）が挙げられる。ここで、本実施形態に係る情報処理装置が処理に用いる能力情報としては、例えば、自装置（本実施形態に係る情報処理装置）の能力情報や、本実施形態に係る情報処理装置が機能の制御を行う外部装置が挙げられる。以下では、本実施形態に係る情報処理装置が処理に用いる能力情報に対応する装置、すなわち、本実施形態に係る情報処理装置が機能の制御を行う対象の装置を、「制御対象装置」と示す場合がある。

また、本実施形態に係る情報処理装置は、例えば、上記（１）の処理（解析処理）における解析の結果に対応するアプリケーションおよび／またはサービスの一覧の中から、能力情報に基づいて、表示画面に表示させるアプリケーションの候補、および／または、表示画面に表示させるサービスの候補を決定してもよい。上記の場合には、本実施形態に係る情報処理装置は、決定されたアプリケーションの候補、サービスの候補を、表示画面に表示させる。

また、例えば図１のＣのＣ２に示すように、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを表示させる場合には、本実施形態に係る情報処理装置は、アプリケーション、サービスを強調して表示させてもよい。

ここで、本実施形態に係るアプリケーションやサービスの強調表示の方法としては、例えば、図１のＣのＣ２に示すようなアプリケーション、サービスの一覧表示において、強調するアプリケーションやサービスをより上に配置するなどの、アプリケーションやサービスの表示順序を調整することが挙げられる。なお、本実施形態に係るアプリケーションやサービスの強調表示の方法は、上記に限られない。例えば、本実施形態に係る情報処理装置は、発話内容の解析結果に係るアプリケーションやサービスであることを示すアイコン（例えば、マイクアイコン）を付与することや、レコメンドを示すアイコンを付すこと、文字の色やフォントを変えることなど、視覚的な変化をアプリケーションやサービスに対して与えることが可能な任意の方法によって、アプリケーションやサービスを強調して表示してもよい。

例えば、上記（１）の処理（解析処理）において発話内容を示す文字列に対して動作の解析が行われた場合には、本実施形態に係る情報処理装置は、解析の結果に含まれる動作の解析結果に基づいて、表示画面に表示させるアプリケーション、サービスを強調して表示させる。

より具体的には、発話内容を示す文字列に対する動作の解析結果が、“見たい”などの見る動作を示す場合には、本実施形態に係る情報処理装置は、例えば、テレビジョン放送の番組表を表示させるアプリケーションや、テレビジョン放送の視聴に係るアプリケーション、録画されているコンテンツのリストを表示させるアプリケーション、記録媒体に記憶されているコンテンツの再生に係るアプリケーション、ビデオサービス、画像投稿Ｗｅｂサイトで提供されるサービスなど、視聴に係るアプリケーションやサービスを強調表示する。また、発話内容を示す文字列に対する動作の解析結果が、“聞きたい”などの聞く動作を示す場合には、本実施形態に係る情報処理装置は、例えば、記録媒体に記憶されているコンテンツの再生に係るアプリケーションや、ミュージックサービスなど、音声（音楽も含む。）の再生に係るアプリケーションやサービスを強調表示する。

また、発話内容を示す文字列に対する動作の解析結果が、特定の動作を示していない場合には、本実施形態に係る情報処理装置は、例えば、検索サイトなどで提供される検索サービスなど、設定されているアプリケーションやサービスを強調表示してもよい。

本実施形態に係る情報処理装置は、例えば上記のように、表示画面に表示させるアプリケーション、サービスを強調して表示させる。

なお、本実施形態に係るアプリケーションやサービスの強調表示に係る処理は、上記に限られない。例えば、本実施形態に係るアプリケーションやサービスそれぞれには、優先度が設定されている場合には、本実施形態に係る情報処理装置は、強調表示を行うアプリケーションやサービスのうち、より優先度が高いアプリケーションやサービスを、より強調して表示してもよい。

本実施形態に係る情報処理装置は、例えば、上記のような処理を、本実施形態に係る表示制御処理として行う。なお、本実施形態に係る表示制御処理が、上記に示す処理の例に限られないことは、言うまでもない。

本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る処理として、例えば上記に示すような、（１）の処理（解析処理）および（２）の処理（表示制御処理）を行う。

なお、本実施形態に係る情報処理方法に係る処理は、上記（１）の処理（解析処理）および上記（２）の処理（表示制御処理）に限られない。

例えば、本実施形態に係る情報処理装置は、図１のＣに示す画面など、発話内容に対応するアプリケーションや発話内容に対応するサービスが表示される画面において選択された、発話内容に対応するアプリケーション、または、発話内容に対応するサービスに関する処理を実行してもよい（実行処理）。

より具体的には、本実施形態に係る情報処理装置は、例えば、下記に示す（ａ）の処理、（ｂ）に示す処理、または（ｃ）に示す処理を、本実施形態に係る実行処理として行う。なお、本実施形態に係る実行処理の具体例については、後述する。

（ａ）本実施形態に係る実行処理の第１の例
例えば、上記（１）の処理（解析処理）において発話内容を示す文字列に対するスコアの設定が行われた場合には、本実施形態に係る情報処理装置は、設定されている基準値と、設定されたスコアとの比較結果に基づいて、発話内容を示す文字列の一部、または全部を、発話内容に対応するアプリケーションの実行や、発話内容に対応するサービスに関する処理の実行に用いる文字列として決定する。そして、本実施形態に係る情報処理装置は、決定された文字列を用いて、発話内容に対応するアプリケーションや、発話内容に対応するサービスに関する処理を実行する。

ここで、本実施形態に係る基準値は、例えば、予め設定された固定値であってもよいし、ユーザ操作などに基づいて変更可能な可変値であってもよい。

より具体的には、例えば、発話内容を示す文字列において、基準値よりも大きなスコア（または、基準値以上のスコア。以下、同様とする。）がない場合には、本実施形態に係る情報処理装置は、発話内容を示す文字列全体を処理に用いる。また、例えば、発話内容を示す文字列において、基準値よりも大きなスコアがある場合には、本実施形態に係る情報処理装置は、発話内容を示す文字列のうちの、スコアが大きい１または２以上の一部の文字列を、処理に用いる。

（ｂ）本実施形態に係る実行処理の第２の例
例えば、上記（１）の処理（解析処理）において発話内容を示す文字列に対して時制が解析された場合には、本実施形態に係る情報処理装置は、時制の解析結果に基づいて、発話内容を示す文字列に含まれる時制を示す文言を処理に選択的に用いる。より具体的には、上記の場合には、本実施形態に係る情報処理装置は、時制の解析結果が、発話内容を示す文字列に時制を示す文言が含まれることを示す場合に、発話内容を示す文字列に含まれる時制を示す文言を処理に用いる。

（ｃ）本実施形態に係る実行処理の第３の例
本実施形態に係る情報処理装置は、例えば、上記第１の例に係る処理と、上記第２の例に係る処理とを組み合わせた処理を行うことも可能である。

本実施形態に係る情報処理装置は、例えば、上記に示す（ａ）の処理、（ｂ）に示す処理、または（ｃ）に示す処理を、本実施形態に係る実行処理として行う。

また、本実施形態に係る情報処理方法に係る処理は、“上記（１）の処理（解析処理）および上記（２）の処理（表示制御処理）”や、“上記（１）の処理（解析処理）、上記（２）の処理（表示制御処理）、および上記実行処理”に限られない。

本実施形態に係る情報処理装置は、例えば、上記（１）の処理（解析処理）における解析の結果を、ログとして記録させてもよい（ログ記録制御処理）。

ここで、本実施形態に係る情報処理装置がログを記録させる対象としては、例えば、記憶部（後述する）や、本実施形態に係る情報処理装置に接続されている外部記録媒体、ネットワークを介して（または直接的に）通信可能な外部装置などが挙げられる。本実施形態に係るネットワークとしては、例えば、ＬＡＮ（Local Area Network）やＷＡＮ（Wide Area Network）などの有線ネットワーク、無線ＬＡＮ（ＷＬＡＮ：Wireless Local Area Network）や基地局を介した無線ＷＡＮ（ＷＷＡＮ：Wireless Wide Area Network）などの無線ネットワーク、あるいは、ＴＣＰ／ＩＰ（Transmission Control Protocol/Internet Protocol）などの通信プロトコルを用いたインターネットなどが挙げられる。

本実施形態に係る情報処理装置が、解析の結果をログとして記録させることによって、音声認識に係る処理を行う装置（例えば、本実施形態に係る情報処理装置や、サーバなどの外部装置）は、当該ログを、例えば、音声認識の精度の向上や、アプリケーションの挙動の改善などに用いることが可能となる。

［３］本実施形態に係る情報処理方法に係る処理の具体例
次に、本実施形態に係る情報処理方法に係る処理の具体例を説明する。以下では、本実施形態に係る情報処理方法に係る処理を、本実施形態に係る情報処理装置が行うものとして説明する。

（Ａ）本実施形態に係る情報処理方法に係る処理の第１の例
図２は、本実施形態に係る情報処理方法に係る処理の第１の例を示す流れ図である。ここで、例えば、図２に示すステップＳ１０４、Ｓ１０６の処理が、上記（１）の処理（解析処理）に該当し、図２に示すステップＳ１０８の処理が、上記（２）の処理（表示制御処理）に該当する。また、図２では、本実施形態に係る情報処理装置が、発話内容を示す音声データに対する音声認識に係る処理を行う例を示している。なお、上述したように、発話内容を示す音声データに対する音声認識に係る処理は、サーバなどの外部装置において行われてもよい。

本実施形態に係る情報処理装置は、音声が検出されたか否かを判定する（Ｓ１００）。本実施形態に係る情報処理装置は、例えば、マイクロホンなどの音声入力デバイスなどから送信された発話内容を示す音声データが受信された場合に、音声が検出されたと判定する。

ステップＳ１００において音声が検出されたと判定されない場合には、本実施形態に係る情報処理装置は、音声が検出されたと判定されるまで処理を進めない。

また、ステップＳ１００において音声が検出されたと判定された場合には、本実施形態に係る情報処理装置は、音声データに対して音声認識に係る処理を行う（Ｓ１０２）。本実施形態に係る情報処理装置は、例えば、統計的手法を用いた処理や、隠れマルコフモデルを利用した処理を、音声認識に係る処理として行う。

本実施形態に係る情報処理装置は、ステップＳ１０２の処理により得られた発話内容を示す文字列を解析する（Ｓ１０４）。ここで、本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列に対して、構文解析や、意味解析を行う。

ステップＳ１０４の処理を行うと、本実施形態に係る情報処理装置は、音声認識のゆらぎを補正する（Ｓ１０６）。本実施形態に係る情報処理装置は、例えば、記憶部（後述する）などに記憶されているゆらぎ吸収用の辞書を用いて、形態素解析などによって分割された単語を置換することによって、音声認識のゆらぎを補正する。

ステップＳ１０６の処理を行うと、本実施形態に係る情報処理装置は、発話内容を示す文字列と、ステップＳ１０４における解析の結果とを表示画面に表示させる（Ｓ１０８）。本実施形態に係る情報処理装置は、例えば図１のＣのＣ１に示すように、発話内容を示す文字列に対して、発話内容を示す文字列の解析の結果を強調して表示する。

本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る処理として、例えば図２に示す処理を行う。例えば図２に示す処理が行われることによって、本実施形態に係る情報処理方法に係る、上記（１）の処理（解析処理）および上記（２）の処理（表示制御処理）が実現される。

したがって、例えば図２に示す処理を行うことによって、本実施形態に係る情報処理装置は、ユーザの利便性の向上を図ることができる。

なお、本実施形態に係る第１の例に係る情報処理方法に係る処理は、図２に示す例に限られない。

例えば、本実施形態に係る情報処理装置は、図２に示すステップＳ１０６の処理を行わなくてもよい。例えばステップＳ１０６の処理を行わない場合であっても、本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る、上記（１）の処理（解析処理）および上記（２）の処理（表示制御処理）を行うことが可能である。よって、例えばステップＳ１０６の処理を行わない場合であっても、本実施形態に係る情報処理装置は、ユーザの利便性の向上を図ることができる。

（Ｂ）本実施形態に係る情報処理方法に係る処理の第２の例
なお、本実施形態に係る情報処理方法に係る処理は、上記第１の例に係る処理に限られない。例えば、本実施形態に係る情報処理装置は、例えば図１のＣのＣ２に示すように、本実施形態に係る上記（２）の処理（表示制御処理）において、上記（１）の処理（解析処理）における解析の結果に基づいて、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、さらに表示画面に表示させることも可能である。

図３は、本実施形態に係る情報処理方法に係る処理の第２の例を示す流れ図である。図３は、本実施形態に係る情報処理装置が、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、さらに表示画面に表示させる場合の処理の一例を示している。ここで、例えば、図３に示すステップＳ２０８の処理が、上記（１）の処理（解析処理）に該当し、図３に示すステップＳ２１０の処理が、上記（２）の処理（表示制御処理）に該当する。また、例えば、図３に示す第２の例に係る処理は、図２に示す第１の例に係る処理と並列に行われてもよいし、図２に示す第１の例に係る処理が行われた後に行われてもよい。

本実施形態に係る情報処理装置は、制御対象装置の能力情報が取得されているか否かを判定する（Ｓ２００）。ステップＳ２００において制御対象装置の能力情報が取得されていると判定された場合には、本実施形態に係る情報処理装置は、後述するステップＳ２０４の処理を行う。

また、ステップＳ２００において制御対象装置の能力情報が取得されていると判定されない場合には、本実施形態に係る情報処理装置は、制御対象装置から能力情報を取得する（Ｓ２０２）。例えば、本実施形態に係る制御対象装置が、自装置（本実施形態に係る情報処理装置）である場合には、本実施形態に係る情報処理装置は、能力情報を生成することによって、能力情報を取得する。また、例えば、本実施形態に係る制御対象装置が、外部装置である場合には、能力情報を送信させる送信命令を含む能力情報送信要求を、当該外部装置へ送信することによって、能力情報を取得する。

ステップＳ２００において制御対象装置の能力情報が取得されていると判定された場合、または、ステップＳ２０２の処理により制御対象装置の能力情報が取得された場合には、本実施形態に係る情報処理装置は、例えば、能力情報に基づいて、アプリケーション、サービスの一覧の中から、制御対象装置に対応するアプリケーション、サービスを特定する（Ｓ２０４）。

本実施形態に係る情報処理装置は、発話内容を示す文字列が取得されているか否かを判定する（Ｓ２０６）。ステップＳ２０６において発話内容を示す文字列が取得されていると判定されない場合には、本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列が取得されていると判定されるまで、処理を進めない。

また、ステップＳ２０６において発話内容を示す文字列が取得されていると判定された場合には、本実施形態に係る情報処理装置は、発話内容を示す文字列に対して、動作を解析する（Ｓ２０８）。本実施形態に係る情報処理装置は、例えば、記憶部（後述する）などに記憶されている動作解析用の辞書を用いて、図２のステップＳ１０４の処理における形態素解析などによって分割された単語の中に、動作解析用の辞書に登録されている動作を示す単語が含まれているか否かを判定することによって、発話内容を示す文字列に対して動作を解析する。

図４は、本実施形態に係る動作解析用の辞書の一例を示す説明図である。ここで、図４では、単語を「Ｋｅｙｗｏｒｄ」と示し、動作を「Ｔｙｐｅ」と示している。また、図４に示すＡは、英語の単語と動作とが対応付けられたテーブル形式の動作解析用の辞書の一例を示しており、図４に示すＢは、日本語の単語と動作とが対応付けられたテーブル形式の動作解析用の辞書の一例を示している。また、図４では、動作解析用の辞書の各単語に、品詞を示す情報が対応付けられている例を示している。

本実施形態に係る情報処理装置は、例えば形態素解析などによって分割された単語の中に、図４に示す動作解析用の辞書に登録されている動作を示す単語が含まれているか否かを判定する。そして、単語が含まれていると判定された場合には、当該単語に対応する動作を、発話内容を示す文字列が示す動作として特定することによって、発話内容を示す文字列における動作を解析する。

なお、本実施形態に係る発話内容を示す文字列に対する動作の解析に係る処理が、上記に示す例に限られないこと、および、本実施形態に係る動作解析用の辞書が、図４に示す例に限られないことは、言うまでもない。

再度図３を参照して、本実施形態に係る情報処理方法に係る処理の第２の例について説明する。ステップＳ２０８の処理が行われると、本実施形態に係る情報処理装置は、ステップＳ２０８の処理における動作の解析結果に基づいて、対応するアプリケーションやサービスを強調して表示させる（Ｓ２１０）。

例えば、ステップＳ２０８における発話内容を示す文字列に対する動作の解析結果が、“見たい”などの見る動作を示す場合には、本実施形態に係る情報処理装置は、例えば、テレビジョン放送の番組表を表示させるアプリケーションなど、視聴に係るアプリケーションやサービスを強調表示する。また、ステップＳ２０８における発話内容を示す文字列に対する動作の解析結果が、“聞きたい”などの聞く動作を示す場合には、本実施形態に係る情報処理装置は、例えば、記録媒体に記憶されているコンテンツの再生に係るアプリケーションなど、音声（音楽も含む。）の再生に係るアプリケーションやサービスを強調表示する。また、ステップＳ２０８における発話内容を示す文字列に対する動作の解析結果が、特定の動作を示していない場合には、本実施形態に係る情報処理装置は、例えば、検索サイトなどで提供される検索サービスなど、設定されているアプリケーションやサービスを強調表示してもよい。

また、例えば、ステップＳ２０８における発話内容を示す文字列に対する動作の解析結果には、優先して表示されるアプリケーションやサービスが設定されていてもよい。

図５は、本実施形態に係る解析結果と対応するアプリケーションやサービスの一例を示す説明図である。ここで、図５では、解析結果を「ＴｅｎｓｅｏｒＡｃｔｉｏｎＴｙｐｅ」と示し、対応するアプリケーションやサービスを「ＨｉｇｈＰｒｉｏｒｉｔｙＣａｔｅｇｏｒｙ」と示している。また、図５は、解析結果と、アプリケーションやサービスとが対応付けられているテーブルの一例を示している。図５に示すＡは、時制の解析結果と、時制の解析結果に対応するアプリケーションやサービスとの一例を示しており、図５に示すＢは、動作の解析結果と、動作の解析結果に対応するアプリケーションやサービスとの一例を示している。また、図５に示すＣは、時制の解析および動作の解析の結果、時制および動作が発話内容を示す文字列に含まれない場合における、対応するアプリケーションやサービスの一例を示している。

本実施形態に係る情報処理装置は、例えば図５に示すテーブルを参照することによって、ステップＳ２０８における発話内容を示す文字列に対する動作の解析結果に対応する、アプリケーションやサービスを特定する。そして、本実施形態に係る情報処理装置は、例えば、特定されたアプリケーションやサービスを、優先して表示画面に表示させる。

本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る処理として、例えば図３に示す処理を、図２に示す第１の例に係る処理と並列に、または、図２に示す第１の例に係る処理が行われた後に行う。

したがって、例えば図３に示す処理を行うことによって、本実施形態に係る情報処理装置は、例えば図１のＣのＣ２に示すように、上記（１）の処理（解析処理）における解析の結果に基づいて、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、さらに表示画面に表示させることができる。なお、本実施形態に係る第２の例に係る情報処理方法に係る処理が、図３に示す例に限られないことは、言うまでもない。

（Ｃ）本実施形態に係る情報処理方法に係る処理の第３の例
なお、本実施形態に係る情報処理方法に係る処理は、上記第１の例に係る処理や、上記第２の例に係る処理に限られない。例えば、本実施形態に係る情報処理装置は、さらに、上述した本実施形態に係る実行処理を行うことも可能である。

図６は、本実施形態に係る情報処理方法に係る処理の第３の例を示す流れ図である。図６は、本実施形態に係る情報処理装置が、本実施形態に係る実行処理として、発話内容を示す文字列を利用したコンテンツの検索に係る処理を行う場合の例を示している。図６において本実施形態に係る情報処理装置が検索するコンテンツとしては、例えば、光ディスクや磁気ディスクなどの記録媒体に記憶されている画像データや音声データなどのコンテンツデータや、テレビジョン放送の番組、Ｗｅｂの検索サービスを介して得られる各種情報やデータなどが挙げられる。

ここで、例えば、図６に示すステップＳ３０８〜Ｓ３１８の処理が、上記（１）の処理（解析処理）に該当し、図６に示すステップＳ３１４、Ｓ３２０〜Ｓ３２４の処理が、上記実行処理に該当する。また、例えば、図６に示す第３の例に係る処理は、図２に示す第１の例に係る処理と並列に行われてもよいし、図２に示す第１の例に係る処理が行われた後に行われてもよい。また、例えば、図６に示す第３の例に係る処理は、図３に示す第２の例に係る処理と並列に行われてもよい。

本実施形態に係る情報処理装置は、制御対象装置の能力情報が取得されているか否かを判定する（Ｓ３００）。ステップＳ３００において制御対象装置の能力情報が取得されていると判定された場合には、本実施形態に係る情報処理装置は、後述するステップＳ３０４の処理を行う。

また、ステップＳ３００において制御対象装置の能力情報が取得されていると判定されない場合には、本実施形態に係る情報処理装置は、図３のステップＳ２０２と同様に、制御対象装置から能力情報を取得する（Ｓ３０２）。

ステップＳ３００において制御対象装置の能力情報が取得されていると判定された場合、または、ステップＳ３０２の処理により制御対象装置の能力情報が取得された場合には、本実施形態に係る情報処理装置は、能力情報に基づいて、アプリケーション、サービスの一覧の中から、制御対象装置に対応するアプリケーション、サービスを特定する（Ｓ３０４）。

本実施形態に係る情報処理装置は、発話内容を示す文字列が取得されているか否かを判定する（Ｓ３０６）。ステップＳ３０６において発話内容を示す文字列が取得されていると判定されない場合には、本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列が取得されていると判定されるまで、処理を進めない。

また、ステップＳ３０６において発話内容を示す文字列が取得されていると判定された場合には、本実施形態に係る情報処理装置は、発話内容を示す文字列に対して、基準スコアを設定する（Ｓ３０８）。ここで、本実施形態に係る情報処理装置は、例えば、図２のステップＳ１０４の処理における形態素解析などによって分割された単語それぞれに対して、基準スコア“１”を設定する。例えば、発話内容を示す文字列（または、音声認識のゆらぎが補正された文字列）が、図１のＣに示す「明日のＸＸＸが見たい」である場合には、本実施形態に係る情報処理装置は、「明日」／「の」／「ＸＸＸ」／「が」／「見」／「た」／「い」それぞれに対して、基準スコア“１”を設定する。なお、本実施形態に係る基準スコアが“１”に限られないことは、言うまでもない。

ステップＳ３０８において基準スコアが設定されると、本実施形態に係る情報処理装置は、設定された基準スコアを調整する（Ｓ３１０）。本実施形態に係る情報処理装置は、例えば、記憶部（後述する）や外部記録媒体に記憶されているスコア調整用の辞書を用いて、設定された基準スコアを調整する。

図７は、本実施形態に係るスコア調整用の辞書の一例を示す説明図である。ここで、図７では、単語を「Ｋｅｙｗｏｒｄ」と示し、スコアを調整するための調整値を「ＡｄｄｉｔｉｏｎａｌＶａｌｕｅ」と示している。また、図７に示すＡは、英語の単語と調整値とが対応付けられたテーブル形式のスコア調整用の辞書の一例を示しており、図７に示すＢは、日本語の単語と調整値とが対応付けられたテーブル形式のスコア調整用の辞書の一例を示している。

本実施形態に係る情報処理装置は、例えば、図７に示すようなスコア調整用の辞書を参照して、図２のステップＳ１０４の処理における形態素解析などによって分割された単語それぞれに対応する調整値を特定する。そして、本実施形態に係る情報処理装置は、例えば、特定された各単語に対応する調整値を、対応する単語の基準スコアに加算することによって、設定された基準スコアを調整する。

例えば、発話内容を示す文字列（または、音声認識のゆらぎが補正された文字列）が、図１のＣに示す「明日のＸＸＸが見たい」である場合には、本実施形態に係る情報処理装置は、「明日」／「の」／「ＸＸＸ」／「が」／「見」／「た」／「い」それぞれのスコアを調整する。調整後のスコアとしては、例えば下記に示す例が挙げられる。なお、調整後のスコアが、下記に示す例に限られないことは、言うまでもない。
・「明日」のスコア：“１．３”
・「の」のスコア：“１”
・「ＸＸＸ」のスコア：“２”
・「が」のスコア：“１”
・「見」のスコア：“０．５”
・「た」のスコア：“１”
・「い」のスコア：“１”

なお、本実施形態に係る発話内容を示す文字列に設定されたスコアの調整に係る処理が、上記に示す例に限られないこと、および、本実施形態に係るスコア調整用の辞書が、図７に示す例に限られないことは、言うまでもない。

再度図６を参照して、本実施形態に係る情報処理方法に係る処理の第３の例について説明する。ステップＳ３１０の処理が行われると、本実施形態に係る情報処理装置は、発話内容を示す文字列に、設定されている基準値よりも大きなスコアが存在するか否かを判定する（Ｓ３１４）。

ステップＳ３１４において設定されている基準値よりも大きなスコアが存在すると判定されない場合には、本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列全体を用いて、コンテンツを検索する（Ｓ３１４）。

また、ステップＳ３１４において設定されている基準値よりも大きなスコアが存在すると判定された場合には、本実施形態に係る情報処理装置は、例えば、設定されているスコアに基づいて、検索ワードを決定する（Ｓ３１６）。

本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列のうちの、スコアが最も大きい一部の文字列を、検索ワードとして決定する。例えば、発話内容を示す文字列（または、音声認識のゆらぎが補正された文字列）が、図１のＣに示す「明日のＸＸＸが見たい」である場合における、上記に示す調整後のスコアの例では、調整後のスコアの中で「ＸＸＸ」のスコアが最も大きい。よって、上記の場合には、本実施形態に係る情報処理装置は、例えば、「ＸＸＸ」を検索ワードとして決定する。ここで、ステップＳ３１６において検索ワードとして「ＸＸＸ」が決定された後に、後述するＳ３１８以降の処理が行われた場合に表示画面に表示される画面の一例が、例えば図１のＣに示す画面である。なお、ステップＳ３１６において検索ワードとして「ＸＸＸ」が決定された後に、後述するＳ３１８以降の処理が行われた場合に表示画面に表示される画面が、図１のＣに示す画面に限られないことは、言うまでもない。

また、本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列のうちのスコアが大きい複数の文字列を、検索ワードとして決定してもよい。複数の文字列が用いられる場合、本実施形態に係る情報処理装置は、例えば、複数の文字列のＡＮＤ検索や、複数の文字列のＯＲ検索によって、コンテンツを検索する。

ステップＳ３１６の処理が行われると、本実施形態に係る情報処理装置は、発話内容を示す文字列に対して時制を解析する（Ｓ３１８）。本実施形態に係る情報処理装置は、例えば、記憶部（後述する）などに記憶されている時制解析用の辞書を用いて、形態素解析などによって分割された単語の中に、時制解析用の辞書に登録されている時制を示す単語が含まれているか否かを判定することによって、発話内容を示す文字列に対して時制を解析する。

図８は、本実施形態に係る時制解析用の辞書の一例を示す説明図である。ここで、図８では、単語を「Ｋｅｙｗｏｒｄ」と示し、対応する時制を「Ｔｙｐｅ」と示している。また、図８に示すＡは、英語の単語と対応する時制とが対応付けられたテーブル形式の時制解析用の辞書の一例を示しており、図８に示すＢは、日本語の単語と対応する時制とが対応付けられたテーブル形式の時制解析用の辞書の一例を示している。

本実施形態に係る情報処理装置は、例えば、図８に示すような時制解析用の辞書を参照して、図２のステップＳ１０４の処理における形態素解析などによって分割された単語の中に、時制解析用の辞書に登録されている時制を示す単語が含まれているかを判定する。形態素解析などによって分割された単語の中に時制を示す単語が含まれている場合には、本実施形態に係る情報処理装置は、例えば、当該単語に対応する時制を、発話内容を示す文字列に含まれる時制として決定する。また、形態素解析などによって分割された単語の中に時制を示す単語が含まれていない場合には、本実施形態に係る情報処理装置は、例えば、発話内容を示す文字列に時制を示す文字列が含まれていないと判定する。

なお、本実施形態に係る発話内容を示す文字列に対する時制の解析に係る処理が、上記に示す例に限られないこと、および、本実施形態に係る時制解析用の辞書が、図８に示す例に限られないことは、言うまでもない。

再度図６を参照して、本実施形態に係る情報処理方法に係る処理の第３の例について説明する。ステップＳ３１８の処理が行われると、本実施形態に係る情報処理装置は、発話内容を示す文字列に時制を示す文字列が存在するか否かを判定する（Ｓ３２０）。本実施形態に係る情報処理装置は、例えば、ステップＳ３１８において発話内容を示す文字列に含まれる時制が決定された場合に、発話内容を示す文字列に時制を示す文字列が存在すると判定する。

ステップＳ３２０において発話内容を示す文字列に時制を示す文字列が存在すると判定されない場合には、本実施形態に係る情報処理装置は、ステップＳ３１６において決定された検索ワードを用いて、コンテンツを検索する（Ｓ３２２）。

また、ステップＳ３２０において発話内容を示す文字列に時制を示す文字列が存在すると判定された場合には、本実施形態に係る情報処理装置は、ステップＳ３１８において決定された時制をパラメータとして、ステップＳ３１６において決定された検索ワードを用いて、コンテンツを検索する（Ｓ３２４）。

例えば、決定された時制が過去である場合には、本実施形態に係る情報処理装置は、光ディスクや磁気ディスクなどの記録媒体に記憶されている画像データや音声データなどのコンテンツデータ（コンテンツの一例）を検索する。また、例えば、決定された時制が未来である場合には、本実施形態に係る情報処理装置は、テレビジョン放送の番組（コンテンツの一例）を検索する。

本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る処理として、例えば図６に示す処理を、図２に示す第１の例に係る処理と並列に、または、図２に示す第１の例に係る処理が行われた後に、あるいは、さらに図３に示す第２の例に係る処理と並列に行う。

したがって、例えば図６に示す処理を行うことによって、本実施形態に係る情報処理装置は、図１のＣに示す画面など、発話内容に対応するアプリケーションや発話内容に対応するサービスが表示される画面において選択された、発話内容に対応するアプリケーション、または、発話内容に対応するサービスに関する処理を実行することができる。

なお、本実施形態に係る第３の例に係る情報処理方法に係る処理は、図６に示す例に限られない。例えば、本実施形態に係る情報処理装置は、図６に示すステップＳ３１８、Ｓ３１２、Ｓ３２４に示す、時制に係る処理を行わないことも可能である。

本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る処理として、例えば、上記（Ａ）に示す第１の例に係る処理や、上記（Ｂ）に示す第２の例に係る処理、上記（Ｃ）に示す第３の例に係る処理を行う。なお、本実施形態に係る情報処理方法に係る処理が、上記に示す処理に限られないことは、言うまでもない。

（本実施形態に係る情報処理装置）
次に、上述した本実施形態に係る情報処理方法に係る処理を行うことが可能な、本実施形態に係る情報処理装置の構成の一例について、説明する。

図９は、本実施形態に係る情報処理装置１００の構成の一例を示すブロック図である。情報処理装置１００は、例えば、通信部１０２と、制御部１０４とを備える。

また、情報処理装置１００は、例えば、ＲＯＭ（Read Only Memory。図示せず）や、ＲＡＭ（Random Access Memory。図示せず）、記憶部（図示せず）、ユーザが操作可能な操作部（図示せず）、様々な画面を表示画面に表示する表示部（図示せず）などを備えていてもよい。情報処理装置１００は、例えば、データの伝送路としてのバス（bus）により上記各構成要素間を接続する。

ここで、ＲＯＭ（図示せず）は、制御部１０４が使用するプログラムや演算パラメータなどの制御用データを記憶する。ＲＡＭ（図示せず）は、制御部１０４により実行されるプログラムなどを一時的に記憶する。

記憶部（図示せず）は、情報処理装置１００が備える記憶手段であり、例えば、各種辞書や、アプリケーションなど様々なデータを記憶する。ここで、記憶部（図示せず）としては、例えば、ハードディスク（Hard Disk）などの磁気記録媒体や、フラッシュメモリ（flash memory）などの不揮発性メモリ（nonvolatile memory）などが挙げられる。また、記憶部（図示せず）は、情報処理装置１００から着脱可能であってもよい。

また、操作部（図示せず）としては、後述する操作入力デバイスが挙げられ、表示部（図示せず）としては、後述する表示デバイスが挙げられる。

［情報処理装置１００のハードウェア構成例］
図１０は、本実施形態に係る情報処理装置１００のハードウェア構成の一例を示す説明図である。情報処理装置１００は、例えば、ＭＰＵ１５０と、ＲＯＭ１５２と、ＲＡＭ１５４と、記録媒体１５６と、入出力インタフェース１５８と、操作入力デバイス１６０と、表示デバイス１６２と、通信インタフェース１６４とを備える。また、情報処理装置１００は、例えば、データの伝送路としてのバス１６６で各構成要素間を接続する。

ＭＰＵ１５０は、例えば、ＭＰＵ（Micro Processing Unit）や各種処理回路などで構成され、情報処理装置１００全体を制御する制御部１０４として機能する。また、ＭＰＵ１５０は、情報処理装置１００において、例えば、後述する解析部１１０、表示制御部１１２、ログ記録制御部１１４、および処理部１１６の役目を果たす。

ＲＯＭ１５２は、ＭＰＵ１５０が使用するプログラムや演算パラメータなどの制御用データなどを記憶する。ＲＡＭ１５４は、例えば、ＭＰＵ１５０により実行されるプログラムなどを一時的に記憶する。

記録媒体１５６は、記憶部（図示せず）として機能し、例えば、各種辞書や、アプリケーションなど様々なデータを記憶する。ここで、記録媒体１５６としては、例えば、ハードディスクなどの磁気記録媒体や、フラッシュメモリなどの不揮発性メモリが挙げられる。また、記録媒体１５６は、情報処理装置１００から着脱可能であってもよい。

入出力インタフェース１５８は、例えば、操作入力デバイス１６０や、表示デバイス１６２を接続する。操作入力デバイス１６０は、操作部（図示せず）として機能し、また、表示デバイス１６２は、表示部（図示せず）として機能する。ここで、入出力インタフェース１５８としては、例えば、ＵＳＢ（Universal Serial Bus）端子や、ＤＶＩ（Digital Visual Interface）端子、ＨＤＭＩ（High-Definition Multimedia Interface）（登録商標）端子、各種処理回路などが挙げられる。また、操作入力デバイス１６０は、例えば、情報処理装置１００上に備えられ、情報処理装置１００の内部で入出力インタフェース１５８と接続される。操作入力デバイス１６０としては、例えば、ボタン、方向キー、ジョグダイヤルなどの回転型セレクター、あるいは、これらの組み合わせなどが挙げられる。また、表示デバイス１６２は、例えば、情報処理装置１００上に備えられ、情報処理装置１００の内部で入出力インタフェース１５８と接続される。表示デバイス１６２としては、例えば、液晶ディスプレイ（Liquid Crystal Display；ＬＣＤ）や有機ＥＬディスプレイ（Organic ElectroLuminescence display。または、ＯＬＥＤディスプレイ（Organic Light Emitting Diode display）ともよばれる。）などが挙げられる。

なお、入出力インタフェース１５８が、情報処理装置１００の外部装置としての操作入力デバイス（例えば、キーボードやマウスなど）や表示デバイスなどの、外部デバイスと接続することもできることは、言うまでもない。また、表示デバイス１６２は、例えばタッチスクリーンなど、表示とユーザ操作とが可能なデバイスであってもよい。

通信インタフェース１６４は、情報処理装置１００が備える通信手段であり、ネットワークを介して（あるいは、直接的に）、制御対象装置やサーバなどの外部装置と無線／有線で通信を行うための通信部１０２として機能する。ここで、通信インタフェース１６４としては、例えば、通信アンテナおよびＲＦ（Radio Frequency）回路（無線通信）や、ＩＥＥＥ８０２．１５．１ポートおよび送受信回路（無線通信）、ＩＥＥＥ８０２．１１ｂポートおよび送受信回路（無線通信）、あるいはＬＡＮ端子および送受信回路（有線通信）などが挙げられる。

情報処理装置１００は、例えば図１０に示す構成によって、本実施形態に係る情報処理方法に係る処理を行う。なお、本実施形態に係る情報処理装置１００のハードウェア構成は、図１０に示す構成に限られない。

例えば、情報処理装置１００が、例えば、入出力インタフェース１５８などを介して接続される外部通信デバイスを介して、制御対象装置やサーバなどの外部装置と通信を行う場合には、情報処理装置１００は、通信インタフェース１６４を備えていなくてもよい。

また、情報処理装置１００は、例えば、操作デバイス１６０や表示デバイス１６２を備えない構成をとることも可能である。

また、情報処理装置１００は、例えば、マイクロホンなどの音声入力デバイスや、音声入力デバイスから伝達される音声信号を増幅する増幅回路などをさらに備えていてもよい。

再度図９を参照して、情報処理装置１００の構成の一例について説明する。通信部１０２は、情報処理装置１００が備える通信手段であり、ネットワークを介して（あるいは、直接的に）、制御対象装置やサーバなどの外部装置と無線／有線で通信を行う。また、通信部１０２は、例えば制御部１０４により通信が制御される。

ここで、通信部１０２としては、例えば、通信アンテナおよびＲＦ回路や、ＬＡＮ端子および送受信回路などが挙げられるが、通信部１０２の構成は、上記に限られない。例えば、通信部１０２は、ＵＳＢ端子および送受信回路など通信を行うことが可能な任意の規格に対応する構成や、ネットワークを介して外部装置と通信可能な任意の構成をとることができる。

制御部１０４は、例えばＭＰＵなどで構成され、情報処理装置１００全体を制御する役目を果たす。また、制御部１０４は、例えば、解析部１１０と、表示制御部１１２と、ログ記録制御部１１４と、処理部１１６とを備え、本実施形態に係る情報処理方法に係る処理を主導的に行う役目を果たす。

解析部１１０は、上記（１）の処理（解析処理）を主導的に行う役目を果たし、音声認識の結果得られる発話内容を示す文字列を解析する。ここで、本実施形態に係る処理対象となる発話内容を示す文字列は、例えば、制御部１０４など情報処理装置１００が備える構成要素が、発話内容を示す音声データに対して音声認識に係る処理を行うことによって、得られるが、本実施形態に係る処理対象となる発話内容の文字列の取得方法は、上記に限られない。例えば、上述したように、情報処理装置１００は、サーバなどの外部装置において音声認識に係る処理が行われた結果得られる発話内容の文字列を示すデータを、当該外部装置から取得することによって、処理対象となる発話内容の文字列を得てもよい。

また、解析部１１０は、例えば、記憶部（図示せず）などに記憶されているゆらぎ吸収用の辞書を用いて、形態素解析などによって分割された単語を置換することによって、音声認識のゆらぎを補正してもよい。

また、解析部１１０は、発話内容を示す文字列に対して、例えば辞書を用いることによって、動作や時制を解析してもよい。

さらに、解析部１１０は、例えば、解析の結果に基づいて発話内容を示す文字列にスコアを設定することも可能である。解析部１１０は、例えば、図６に示すステップＳ３０８、Ｓ３１０の処理を行うことによって、スコアを設定する。

表示制御部１１２は、上記（２）の処理（表示制御処理）を主導的に行う役目を果たし、発話内容を示す文字列と、解析部１１０における解析の結果とを、表示画面に表示させる。

また、表示制御部１１２は、例えば、発話内容を示す文字列の全体、または、発話内容を示す文字列における、形態素解析などによって分割された単語ごとに、発話内容を示す文字列を、編集することが可能な状態で表示させてもよい。

また、解析部１１０において音声認識のゆらぎが補正された場合には、表示制御部１１２は、例えば、音声認識のゆらぎが補正された発話内容を示す文字列を表示させる。

また、表示制御部１１２は、例えば図１のＣのＣ２に示すように、解析部１１０における解析の結果に基づいて、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、表示画面に強調して表示させてもよい。

より具体的には、例えば、解析部１１０において発話内容を示す文字列に対して動作が解析された場合には、表示制御部１１２は、例えば、解析部１１０における解析の結果に含まれる動作の解析結果に基づいて、表示画面に表示させるアプリケーション、サービスを強調して表示させる。

また、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、表示画面に表示させる場合には、表示制御部１１２は、例えば、制御対象装置の能力情報に基づいて、表示画面に表示させるアプリケーションの候補、および／または、表示画面に表示させるサービスの候補を決定してもよい。

ログ記録制御部１１４は、上記ログ記録制御処理を主導的に行う役目を果たし、解析部１１０における解析の結果をログとして記録させる。ログ記録制御部１１４がログを記録させる対象としては、例えば、記憶部（図示せず）や、外部記録媒体、ネットワークを介して（または直接的に）通信可能な外部装置などが挙げられる。外部装置にログを記録させる場合、ログ記録制御部１１４は、例えば、通信部１０２に、当該外部装置へとログデータを送信させる。

処理部１１６は、上記実行処理を主導的に行う役目を果たし、選択された発話内容に対応するアプリケーション、または、選択された発話内容に対応するサービスに関する処理を実行する。

また、例えば、解析部１１０においてスコアが設定された場合には、処理部１１６は、設定されている基準値と、設定されたスコアとの比較結果に基づいて、発話内容に対応するアプリケーションの実行や、発話内容に対応するサービスに関する処理の実行に用いる文字列を決定して、処理を行ってもよい。より具体的には、処理部１１６は、例えば、基準値よりも大きなスコアがない場合には、発話内容を示す文字列全体を処理に用い、また、基準値よりも大きなスコアがある場合には、発話内容を示す文字列のうちの、スコアが大きい１または２以上の一部の文字列を、処理に用いる。

また、例えば、解析部１１０において時制が解析されている場合、処理部１１６は、解析部１１０における時制の解析結果が発話内容を示す文字列に時制を示す文言が含まれることを示すときには、例えば図６のステップＳ３２４に示すように、発話内容を示す文字列に含まれる時制を示す文言を処理に用いてもよい。

制御部１０４は、例えば、解析部１１０、表示制御部１１２、ログ記録制御部１１４、および処理部１１６を備えることによって、本実施形態に係る情報処理方法に係る処理を主導的に行う。

情報処理装置１００は、例えば図９に示す構成によって、本実施形態に係る情報処理方法に係る処理（例えば、上記（１）の処理（解析処理）、上記（２）の処理（表示制御処理）、上記実行処理、および上記ログ記録制御処理）を行う。

したがって、情報処理装置１００は、例えば図９に示す構成によって、ユーザの利便性の向上を図ることができる。また、情報処理装置１００は、例えば図９に示す構成によって、上述した本実施形態に係る情報処理方法に係る処理が行われることによる効果を奏することができる。

なお、本実施形態に係る情報処理装置１００の構成は、図９に示す構成に限られない。

例えば、本実施形態に係る情報処理装置１００は、ログ記録制御部１１４、および／または、処理部１１６を備えていなくてもよい。ログ記録制御部１１４、および／または、処理部１１６を備えない構成であっても、本実施形態に係る情報処理装置１００は、本実施形態に係る情報処理方法に係る、上記（１）の処理（解析処理）および上記（２）の処理（表示制御処理）を主導的に行うことが可能である。

よって、ログ記録制御部１１４、および／または、処理部１１６を備えない構成であっても、本実施形態に係る情報処理装置１００は、ユーザの利便性の向上を図ることができる。

また、例えば、本実施形態に係る情報処理装置１００は、図９に示す解析部１１０、表示制御部１１２、ログ記録制御部１１４、および処理部１１６のうちの１または２以上を、制御部１０４とは個別に備える（例えば、個別の処理回路で実現する）ことができる。

また、例えば、本実施形態に係る情報処理装置１００が、外部通信デバイスを介して、制御対象装置やサーバなどの外部装置と通信を行う場合には、情報処理装置１００は、通信部１０２を備えていなくてもよい。

以上のように、本実施形態に係る情報処理装置は、本実施形態に係る情報処理方法に係る処理として、例えば、上記（１）の処理（解析処理）、および上記（２）の処理（表示制御処理）を行う。

ここで、本実施形態に係る情報処理装置が、上記（２）の処理（表示制御処理）において、音声認識の結果得られる発話内容の文字列を表示画面に表示させることによって、発話を行ったユーザは、発話がどのように音声認識されたかを視覚的に把握することが可能となる。また、本実施形態に係る情報処理装置が、上記（２）の処理（表示制御処理）において、上記（１）の処理（解析処理）における発話内容の文字列に対する解析の結果を、発話内容の文字列と共に併せて表示させることによって、発話を行ったユーザは、発話がどのように解析されたかを視覚的に把握することが可能となる。

したがって、本実施形態に係る情報処理装置は、ユーザの利便性の向上を図ることができる。

また、本実施形態に係る情報処理装置は、例えば、上記（２）の処理（表示制御処理）において、表示画面に表示させる発話内容を示す文字列を、編集することが可能な状態で表示させる。

上記（２）の処理（表示制御処理）において、発話内容を示す文字列を編集することが可能な状態で表示させることによって、本実施形態に係る情報処理装置は、例えば、ユーザに発話内容の修正を促すことを可能とし、より精度の高い処理を、自装置（本実施形態に係る情報処理装置）または外部装置に行わせることができる。また、上記（２）の処理（表示制御処理）において、発話内容を示す文字列を編集することが可能な状態で表示させることによって、ユーザは、例えば、ユーザが何度も発話をやり直さなければユーザが所望する動作が実現されないことなどが防止される。

したがって、上記（２）の処理（表示制御処理）において、発話内容を示す文字列を編集することが可能な状態で表示させることによって、本実施形態に係る情報処理装置は、ユーザの利便性の向上をさらに図ることができる。

また、本実施形態に係る情報処理装置は、上記（２）の処理（表示制御処理）において、例えば図１のＣのＣ２に示すように、上記（１）の処理（解析処理）における解析の結果に基づいて、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、表示画面に表示させる。また、本実施形態に係る情報処理装置は、例えば、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、表示画面において強調して表示させる。

上記のように、解析の結果に基づいて、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスが、表示画面に表示されることによって、例えば、制御対象装置により適した表示を実現することができる。また、本実施形態に係る情報処理装置が、発話内容の解析結果を一つではなく、より適した形で表示することによって、発話のあいまいさの吸収と、ユーザによる新たなコンテンツの発見とが可能となる。

したがって、上記（２）の処理（表示制御処理）において、解析の結果に基づいて、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスが、表示画面に表示されることによって、本実施形態に係る情報処理装置は、ユーザの利便性の向上をさらに図ることができる。

以上、本実施形態として情報処理装置を挙げて説明したが、本実施形態は、かかる形態に限られない。本実施形態は、例えば、タブレット型の装置や、携帯電話やスマートフォンなどの通信装置、映像／音楽再生装置（または映像／音楽記録再生装置）、ゲーム機、ＰＣ（Personal Computer）などのコンピュータ、リモート・コントローラなど、様々な機器に適用することができる。また、本実施形態は、例えば、上記のような機器に組み込むことが可能な、処理ＩＣ（Integrated Circuit）に適用することもできる。

（本実施形態に係る情報処理システム）
上述したように、本実施形態に係る情報処理装置は、サーバなどの外部装置において音声認識の処理が行われた結果得られる発話内容を示す文字列を、処理することも可能である。そこで、次に、本実施形態に係る情報処理装置が、外部装置において音声認識の処理が行われた結果得られる発話内容を示す文字列を処理することが可能な、本実施形態に係る情報処理システムの一例について説明する。

図１１は、本実施形態に係る情報処理システム１０００の一例を示す説明図である。

情報処理システム１０００は、例えば、情報処理装置１００と、音声認識処理装置２００と、情報処理装置１００が機能の制御を行う対象の装置である制御対象装置３００Ａ、３００Ｂ、…（以下、総称して「制御対象装置３００」と示す場合がある。）とを有する。また、情報処理装置１００と、音声認識処理装置２００とは、例えば、ネットワーク４００を介して通信を行う。ネットワーク４００としては、例えば、ＬＡＮやＷＡＮなどの有線ネットワーク、無線ＬＡＮや基地局を介した無線ＷＡＮなどの無線ネットワーク、あるいは、ＴＣＰ／ＩＰなどの通信プロトコルを用いたインターネットなどが挙げられる。

なお、図１１では、情報処理システム１０００が、複数の制御対象装置３００を有する例を示しているが、本実施形態に係る情報処理システムは、上記に限られない。例えば、本実施形態に係る情報処理システムは、１つの制御対象装置３００を有する構成であってもよい。また、情報処理装置１００が機能の制御を行う対象が自装置（情報処理装置１００）である場合には、本実施形態に係る情報処理システムは、例えば、図１１に示す制御対象装置３００Ａ、３００Ｂ、…を有さない構成であってもよい。

音声認識処理装置２００は、発話内容を示す音声データに対して、例えば、統計的手法を用いた処理や、隠れマルコフモデルを利用した処理など、音声認識に係る処理を行う。また、音声認識処理装置２００は、音声データに対する音声認識に係る処理の結果得られる、発話内容の文字列を示すデータを、情報処理装置１００へ送信する。

また、音声認識処理装置２００は、例えば、本実施形態に係る辞書に係るデータ（以下「辞書データ」と示す。）を管理する。なお、本実施形態に係る情報処理システムでは、サーバなどの他の装置が、辞書データを管理してもよい。音声認識処理装置２００などの外部装置において辞書が管理されることによって、例えば、情報処理装置１００における上記（１）の処理（解析処理）における挙動を、より容易に変更することが可能となる。以下では、音声認識処理装置２００が辞書データを管理する場合を例に挙げる。

また、音声認識処理装置２００は、例えば、ログデータを管理する。なお、本実施形態に係る情報処理システムでは、サーバなどの他の装置が、ログデータを管理してもよく、情報処理装置１００がログデータを管理してもよい。以下では、音声認識処理装置２００がログデータを管理する場合を例に挙げる。

ここで、音声認識処理装置２００は、例えば図１０に示すハードウェア構成をとるが、音声認識処理装置２００のハードウェア構成は、上記に限られない。

情報処理装置１００は、音声認識処理装置２００から送信された発話内容の文字列を示すデータに対して、上述した本実施形態に係る情報処理方法に係る処理を行う。

制御対象装置３００は、例えば、情報処理装置１００から送信される制御命令に基づいて処理を行い、情報処理装置１００により機能が制御される。ここで、制御対象装置３００は、例えば図１０に示すハードウェア構成をとるが、制御対象装置３００のハードウェア構成は、上記に限られない。

例えば図１１に示す構成によって、情報処理装置１００が、音声認識処理装置２００（外部装置の一例）において音声認識の処理が行われた結果得られる発話内容を示す文字列を処理することが可能な、情報処理システムが実現される。

次に、情報処理システム１０００における処理の一例について説明する。図１２は、本実施形態に係る情報処理システム１０００における処理の一例を示す説明図である。ここで、図１２に示すステップＳ４１４の処理が、上記（１）の処理（解析処理）に該当し、図１２に示すステップＳ４１８の処理が、上記（２）の処理（表示制御処理）に該当する。また、図１２に示すステップＳ４１６、Ｓ４２０は、本実施形態に係る実行処理の一例を示しており、図１２に示すステップＳ４２２が、本実施形態に係るログ記録制御処理に該当する。

情報処理装置１００と制御対象装置３００とは、接続処理を行う（Ｓ４００）。ここで、ステップＳ４００の処理は、例えば、情報処理装置１００が、ユーザの接続操作に基づいて、制御対象装置３００に対して接続要求を送信することによって行われる。

ステップＳ４００において情報処理装置１００と制御対象装置３００とが接続されると、情報処理装置１００は、制御対象装置３００の能力を特定する（Ｓ４０２）。情報処理装置１００は、例えば、能力情報を送信させる能力情報送信要求を制御対象装置３００に送信し、当該能力情報送信要求に応じて制御対象装置３００から送信される能力情報に基づいて、制御対象装置３００の能力を特定する。

情報処理装置１００は、例えば、音声認識処理装置２００に、辞書アップデート確認要求を送信する（Ｓ４０４）。

ステップＳ４０４において情報処理装置１００から送信された辞書アップデート確認要求を受信した音声認識処理装置２００は、記録媒体１５６などに記憶されている辞書データを確認し、辞書データが更新されている場合には、辞書データを情報処理装置１００へ送信する（Ｓ４０６）。ステップＳ４０６の処理により、例えば情報処理装置１００が備える記憶部（図示せず）などに記憶されている本実施形態に係る辞書は、更新される。ここで、音声認識処理装置２００は、例えば、辞書全体を示す辞書データを送信してもよいし、辞書における更新部分に対応するデータのみを辞書データとして送信してもよい。

発話による音声データが得られると、情報処理装置１００は、音声認識処理装置２００に、音声データを送信する（Ｓ４０８）。

ステップＳ４０８において情報処理装置１００から送信された音声データを受信した音声認識処理装置２００は、音声データに対して音声認識に係る処理を行う（Ｓ４１０）。そして、音声認識処理装置２００は、音声認識に係る処理の結果得られる発話内容の文字列を示すデータを、情報処理装置１００へ送信する（Ｓ４１２）。

ステップＳ４１２において音声認識処理装置２００から送信された発話内容の文字列を示すデータを受信した情報処理装置１００は、発話内容の文字列を示すデータに対して解析処理を行う（Ｓ４１４）。

また、情報処理装置１００は、ステップＳ４１４における解析結果に基づいて、コンテンツを検索する（Ｓ４１６）。ここで、情報処理装置１００がコンテンツを検索する対象としては、例えば、記憶部（図示せず）や、光ディスクなどの外部記録媒体、音声認識処理装置２００などの外部装置などが挙げられる。

具体例を挙げると、情報処理装置１００は、例えば、音声認識処理装置２００などの外部装置におけるコンテンツ検索エンジンと連携して、接続されているテレビ受像機（制御対象装置３００の一例）における番組検索や、インターネット上の連携サービスの動画、音楽検索などを行う。また、情報処理装置１００は、例えば、接続されているテレビ受像機（制御対象装置３００の一例）と通信を行い、テレビ受像機における録画タイトルコンテンツやテレビ受像機のアプリケーションなどを検索する。また、情報処理装置１００は、例えば、ホームネットワーク内のＰＣ（制御対象装置３００の一例）と通信を行い、ＰＣが備える記録媒体に記憶されている画像データ（動画像、静止画像を示すデータ）や、音楽データなどを検索する。また、情報処理装置１００は、例えば、Ｗｅｂ検索を行う。また、情報処理装置１００は、例えば、ディスクプレイヤー（制御対象装置３００の一例）に挿入されているディスクを検索してもよい。

情報処理装置１００は、発話内容の文字列と、ステップＳ４１４における解析結果とを表示画面に表示させる（Ｓ４１８）。また、情報処理装置１００は、例えば、ステップＳ４１４における解析結果と、ステップＳ４１６における検索結果とに基づいて、図１のＣのＣ２に示すように、発話内容に対応するアプリケーション、および／または、発話内容に対応するサービスを、表示画面に表示させてもよい。

例えば、ステップＳ４１８において表示させた画面において、アプリケーションやサービスに対する操作（制御対象装置３００に動作を行わせるための操作）が検出された場合には、情報処理装置１００は、当該操作に応じた制御命令を、制御対象装置３００へ送信する（Ｓ４２０）。

また、情報処理装置１００は、例えば、ステップＳ４１４における解析結果のログや、各処理におけるログを示すログデータを、音声認識処理装置２００へ送信する（Ｓ４２２）。

情報処理システム１０００では、例えば図１２に示す処理が行われる。ここで、図１２に示す処理が行われる場合であっても、情報処理装置１００は、上述した本実施形態に係る情報処理方法に係る処理を行うことが可能である。よって、例えば図１２に示す処理が行われることによって、ユーザの利便性の向上を図ることが可能な情報処理システムが実現される。なお、本実施形態に係る情報処理システム１０００における処理が、図１２に示す処理に限られないことは、言うまでもない。

上記では、本実施形態に係る情報処理システムの構成要素として音声認識処理装置２００を挙げて説明したが、本実施形態は、かかる形態に限られない。本実施形態は、例えば、ＰＣやサーバなどのコンピュータなど、様々な機器に適用することができる。また、本実施形態は、例えば、上記のような機器に組み込むことが可能な、処理ＩＣに適用することもできる。

また、本実施形態に係る音声認識処理装置２００に係る処理は、例えばクラウドコンピューティングなどのように、ネットワークへの接続（または各装置間の通信）を前提とした、複数の装置からなるシステムにより実現されてもよい。

また、上記では、本実施形態に係る情報処理システムの構成要素として制御対象装置３００を挙げて説明したが、本実施形態は、かかる形態に限られない。本実施形態は、例えば、テレビ受像機や、ＰＣやサーバなどのコンピュータ、映像／音楽再生装置（または映像／音楽記録再生装置）、ゲーム機など、様々な機器に適用することができる。また、本実施形態は、例えば、上記のような機器に組み込むことが可能な、処理ＩＣに適用することもできる。

（本実施形態に係るプログラム）
コンピュータを、本実施形態に係る情報処理装置として機能させるためのプログラム（例えば、“上記（１）の処理（解析処理）、および上記（２）の処理（表示制御処理）”や、“上記（１）の処理（解析処理）、上記（２）の処理（表示制御処理）、および上記実行処理”、“上記（１）の処理（解析処理）、上記（２）の処理（表示制御処理）、および上記ログ記録制御処理”、“上記（１）の処理（解析処理）、上記（２）の処理（表示制御処理）、上記実行処理、および上記ログ記録制御処理”など、本実施形態に係る情報処理方法に係る処理を実行することが可能なプログラム）が、コンピュータにおいて実行されることによって、ユーザの利便性の向上を図ることができる。また、コンピュータを、本実施形態に係る情報処理装置として機能させるためのプログラムが、コンピュータにおいて実行されることによって、上述した本実施形態に係る情報処理方法に係る処理が行われることによる効果を奏することができる。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

例えば、上記では、コンピュータを、本実施形態に係る情報処理装置として機能させるためのプログラム（コンピュータプログラム）が提供されることを示したが、本実施形態は、さらに、上記プログラムを記憶させた記録媒体も併せて提供することができる。

上述した構成は、本実施形態の一例を示すものであり、当然に、本開示の技術的範囲に属するものである。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
音声認識の結果得られる発話内容を示す文字列を解析する解析部と、
前記発話内容を示す文字列と解析の結果とを、表示画面に表示させる表示制御部と、
を備える、情報処理装置。
（２）
前記表示制御部は、前記発話内容を示す文字列を、編集することが可能な状態で表示させる、（１）に記載の情報処理装置。
（３）
前記解析部は、音声認識のゆらぎを補正し、
前記表示制御部は、前記ゆらぎが補正された発話内容を示す文字列を表示させる、（１）、または（２）に記載の情報処理装置。
（４）
前記表示制御部は、前記解析の結果に基づいて、前記発話内容に対応するアプリケーション、および／または、前記発話内容に対応するサービスを、表示画面に強調して表示させる、（１）〜（３）のいずれか１つに記載の情報処理装置。
（５）
前記解析部は、前記発話内容を示す文字列に対して動作を解析し、
前記表示制御部は、前記解析の結果に含まれる動作の解析結果に基づいて、表示画面に表示させる前記アプリケーション、前記サービスを強調して表示させる、（４）に記載の情報処理装置。
（６）
前記表示制御部は、装置が有する能力を示す能力情報に基づいて、表示画面に表示させる前記アプリケーションの候補、および／または、表示画面に表示させる前記サービスの候補を決定する、（４）、または（５）に記載の情報処理装置。
（７）
選択された前記発話内容に対応するアプリケーション、または、選択された前記発話内容に対応するサービスに関する処理を実行する処理部をさらに備える、（４）〜（６）のいずれか１つに記載の情報処理装置。
（８）
前記解析部は、前記発話内容を示す文字列に対する構文解析の結果、または、前記構文解析の結果および前記発話内容を示す文字列に対する意味解析の結果に基づいて、前記発話内容を示す文字列にスコアを設定し、
前記処理部は、
基準値よりも大きな前記スコア、または、前記基準値以上の前記スコアがない場合には、前記発話内容を示す文字列全体を処理に用い、
前記基準値よりも大きな前記スコア、または、前記基準値以上の前記スコアがある場合には、前記発話内容を示す文字列のうちの、前記スコアが大きい１または２以上の一部の文字列を、処理に用いる、（７）に記載の情報処理装置。
（９）
前記解析部は、前記発話内容を示す文字列に対して時制を解析し、
前記処理部は、時制の解析結果が前記発話内容を示す文字列に時制を示す文言が含まれることを示す場合には、前記発話内容を示す文字列に含まれる時制を示す文言を処理に用いる、（７）、または（８）に記載の情報処理装置。
（１０）
前記解析の結果をログとして記録させるログ記録制御部をさらに備える、（１）〜（９）のいずれか１つに記載の情報処理装置。
（１１）
音声認識の結果得られる発話内容を示す文字列を解析するステップと、
前記発話内容を示す文字列と解析の結果とを、表示画面に表示させるステップと、
を有する、情報処理方法。
（１２）
音声認識の結果得られる発話内容を示す文字列を解析するステップ、
前記発話内容を示す文字列と、解析の結果とを表示画面に表示させるステップ、
をコンピュータに実行させるためのプログラム。

１００情報処理装置
１０２通信部
１０４制御部
１１０解析部
１１２表示制御部
１１４ログ記録制御部
１１６処理部
２００音声認識処理装置
３００、３００Ａ、３００Ｂ制御対象装置
４００ネットワーク
１０００情報処理システム

Claims

音声認識の結果得られる発話内容を示す文字列を解析する解析部と、
前記発話内容を示す文字列と解析の結果とを、表示画面に表示させる表示制御部と、
を備える、情報処理装置。
前記表示制御部は、前記発話内容を示す文字列を、編集することが可能な状態で表示させる、請求項１に記載の情報処理装置。
前記解析部は、音声認識のゆらぎを補正し、
前記表示制御部は、前記ゆらぎが補正された発話内容を示す文字列を表示させる、請求項１に記載の情報処理装置。
前記表示制御部は、前記解析の結果に基づいて、前記発話内容に対応するアプリケーション、および／または、前記発話内容に対応するサービスを、表示画面に強調して表示させる、請求項１に記載の情報処理装置。
前記解析部は、前記発話内容を示す文字列に対して動作を解析し、
前記表示制御部は、前記解析の結果に含まれる動作の解析結果に基づいて、表示画面に表示させる前記アプリケーション、前記サービスを強調して表示させる、請求項４に記載の情報処理装置。
前記表示制御部は、装置が有する能力を示す能力情報に基づいて、表示画面に表示させる前記アプリケーションの候補、および／または、表示画面に表示させる前記サービスの候補を決定する、請求項４に記載の情報処理装置。
選択された前記発話内容に対応するアプリケーション、または、選択された前記発話内容に対応するサービスに関する処理を実行する処理部をさらに備える、請求項４に記載の情報処理装置。
前記解析部は、前記発話内容を示す文字列に対する構文解析の結果、または、前記構文解析の結果および前記発話内容を示す文字列に対する意味解析の結果に基づいて、前記発話内容を示す文字列にスコアを設定し、
前記処理部は、
基準値よりも大きな前記スコア、または、前記基準値以上の前記スコアがない場合には、前記発話内容を示す文字列全体を処理に用い、
前記基準値よりも大きな前記スコア、または、前記基準値以上の前記スコアがある場合には、前記発話内容を示す文字列のうちの、前記スコアが大きい１または２以上の一部の文字列を、処理に用いる、請求項７に記載の情報処理装置。
前記解析部は、前記発話内容を示す文字列に対して時制を解析し、
前記処理部は、時制の解析結果が前記発話内容を示す文字列に時制を示す文言が含まれることを示す場合には、前記発話内容を示す文字列に含まれる時制を示す文言を処理に用いる、請求項７に記載の情報処理装置。
前記解析の結果をログとして記録させるログ記録制御部をさらに備える、請求項１に記載の情報処理装置。
音声認識の結果得られる発話内容を示す文字列を解析するステップと、
前記発話内容を示す文字列と解析の結果とを、表示画面に表示させるステップと、
を有する、情報処理方法。
音声認識の結果得られる発話内容を示す文字列を解析するステップ、
前記発話内容を示す文字列と、解析の結果とを表示画面に表示させるステップ、
をコンピュータに実行させるためのプログラム。