JP6393219B2

JP6393219B2 - 音声入力装置及びコンピュータプログラム

Info

Publication number: JP6393219B2
Application number: JP2015049076A
Authority: JP
Inventors: 文彦青山
Original assignee: Alpine Electronics Inc
Current assignee: Alpine Electronics Inc
Priority date: 2015-03-12
Filing date: 2015-03-12
Publication date: 2018-09-19
Anticipated expiration: 2035-03-12
Also published as: JP2016170238A

Description

本発明は、発話音声による入力を受け付ける音声入力の技術に関するものである。

発話音声による入力を受け付ける音声入力の技術としては、音声入力を受け付け可能な発話例として、音声認識辞書に登録された音声認識可能な単語を用いた発話例を表示する技術が知られている（たとえば、特許文献１）。

特開2010-128144号公報

上述のように音声認識辞書に登録された単語を用いた発話例を表示する場合、音声入力の各回において同じ発話例を表示することは、既にユーザが音声入力可能であることを認知している発話内容を繰り返しユーザに提示することになるため、発話例を提示する意義が希薄となる。
一方、たとえば、音声入力の各回において、音声認識辞書に登録された単語をランダムに選定し、選定した単語を用いた発話例を表示することも考えられるが、このようにした場合には、数多くの単語が音声認識辞書に登録されているときには、ユーザにとって興味のない単語、すなわち、ユーザがおよそ音声入力することのない単語を用いた発話例も高い頻度で表示されることとなるため、提示される発話例は充分にユーザにとって有用なものとはならない。
そこで、本発明は、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することを課題とする。

前記課題達成のために、本発明は、楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置に、複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを備えたものである。ただし、前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うものである。

ここで、以上の音声入力装置は、前記楽曲再生手段において、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、前記再生履歴管理手段において、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理するように構成してもよい。

または、以上の音声入力装置は、前記楽曲再生手段において、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、前記再生履歴管理手段において、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値は管理せず、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値のみを管理するように構成してもよい。

ここで、このような音声入力装置は、前記発話例提示手段において、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うように構成してもよい。
また、以上のような音声入力装置は、当該音声入力装置に、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を設け、前記発話例提示手段において、前記発話例表示処理で、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないように構成してもよい。

また、この場合には、前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であってよい。
ここで、以上の音声入力装置は、前記再生履歴管理手段において、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、前記発話例提示手段において、前記発話例表示処理で、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示するように構成してもよい。

また、以上の音声入力装置において、前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも２つの属性を含むものとすることが好ましい。

以上のような音声入力装置によれば、楽曲の属性値で、操作対象とする楽曲を指定する音声入力の発話例として、過去に再生出力した楽曲と属性値と同じ属性値をもつ楽曲、すなわち、過去に再生出力した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致したユーザが興味ある楽曲である蓋然性が大きい。したがって、本発明によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができ、発話例の表示のユーザにとっての有用性を向上することができる。

以上のように、本発明によれば、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することができる。

本発明の実施形態に係るＡＶシステムの構成を示すブロック図である。本発明の実施形態に係る認識履歴テーブルと再生頻度テーブルを示す図である。本発明の実施形態に係る発話例提示処理を示すフローチャートである。本発明の実施形態に係る音声入力案内ウインドウを示す図である。

以下、本発明の実施形態を、自動車に搭載されるＡＶシステムへの適用を例にとり説明する。
図１に、本実施形態に係るＡＶシステムの構成を示す。
図示するように、ＡＶシステム１は、マイクロフォン１０１、音声認識エンジン１０２、音声認識辞書１０３、辞書作成部１０４、音声入力制御部１０５、認識履歴テーブル１０６、ディスプレイ１０７、入力装置１０８、スピーカ等を備えた音声出力装置１０９、楽曲データベース１１０、再生履歴テーブル１１１、楽曲管理部１１２、メディアプレイヤ１１３、ＨＤＤ１１４（ハードディスク１１４）、外部インタフェース１１５、デジタルラジオ受信機１１６、移動通信装置１１７を備えている。

ただし、ＡＶシステム１は、ＣＰＵやメモリやその他の周辺デバイスを備えたコンピュータを用いて構成されるものであって良く、また、この場合、音声認識エンジン１０２、辞書作成部１０４、音声入力制御部１０５、楽曲管理部１１２、メディアプレイヤ１１３などは、ＣＰＵが所定のコンピュータプログラムを実行することにより実現されるものであってよい。

さて、このようなＡＶシステム１の構成において、ＨＤＤ１１４には、楽曲のオーディオファイルが格納されている。また、外部インタフェース１１５には、楽曲のオーディオファイルを格納したポータブルプレイヤ２を接続することができる。また、デジタルラジオ受信機１１６はデジタルラジオ局３が放送するデジタルラジオ放送を受信する。また、移動通信装置１１７は、移動通信を介してインターネット４に接続することができる。

次に、楽曲管理部１１２は、ＨＤＤ１１４とポータブルプレイヤ２を参照し、ＨＤＤ１１４に格納された楽曲のオーディオファイルとポータブルプレイヤ２に格納されている楽曲のオーディオファイルの情報を楽曲データベース１１０に登録する。楽曲データベース１１０に登録する各オーディオファイルの情報としては、オーディオファイルのロケーションや、オーディオファイルの楽曲の属性値を登録する。楽曲データベース１１０に属性値を登録する楽曲の属性としては、楽曲のソング名（タイトル）、アルバム名、アーティスト名、ジャンル名、コンポーザ名などを用いる。また、楽曲データベース１１０には、各属性の属性値毎に作成したリストも登録する。ここで、属性Ａの属性値Ｂについて作成したリストは、属性Ａの属性値がＢであるオーディオファイルをリストアップしたリストである。なお、各オーディオファイルの楽曲の各属性の属性値は、ＨＤＤ１１４やポータブルプレイヤ２に登録されており、楽曲管理部１１２は、ＨＤＤ１１４やポータブルプレイヤ２から、各オーディオファイルの楽曲の各属性の属性値を取得して楽曲データベース１１０に登録する。

次に、辞書作成部１０４は、楽曲データベース１１０を参照し、楽曲データベース１１０にオーディオファイルが登録されている楽曲の属性値として用いられている語彙（ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など）を抽出し、抽出した各語彙を認識するための辞書データを作成し、音声認識辞書１０３に登録する。ここで、音声認識辞書１０３には、上記語彙を認識するための辞書データの他に、音声入力制御部１０５が音声入力を受け付ける各種コマンドを表す語彙を認識するための辞書データも格納されている。

次に、音声認識エンジン１０２は音声認識辞書１０３を用いて、マイクロフォン１０１から入力するユーザの発話音声を認識し、音声入力制御部１０５は、音声認識エンジン１０２の音声認識結果を音声入力として受け付ける。

一方、メディアプレイヤ１１３は、音声入力制御部１０５がユーザから受け付けた音声入力や入力装置１０８で受け付けたユーザの操作に応じて、ＨＤＤ１１４やポータブルプレイヤ２にオーディオファイルが格納されている楽曲を音声出力装置１０９から再生出力したり、デジタルラジオ受信機１１６にデジタルラジオ放送を受信させてデジタルラジオ放送で受信した楽曲を音声出力装置１０９から再生出力したり、移動通信装置１１７を介してインターネット４上のインターネットラジオサービス５にアクセスして、ユーザが選択したインターネットラジオステーションから配信される楽曲を音声出力装置１０９から再生出力したり、移動通信装置１１７を介してインターネット４上の動画共有サービス６にアクセスして、ユーザが選択した楽曲ビデオの配信を動画共有サービス６から受けディスプレイ１０７と音声出力装置１０９から再生出力する処理などを行う。

また、メディアプレイヤ１１３は、以上のように、ＨＤＤ１１４、ポータブルプレイヤ２、デジタルラジオ放送、インターネットラジオサービス５の楽曲や、動画共有サービス６の楽曲ビデオの再生出力を行ったならば、再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の情報を再生履歴テーブル１１１に登録する。

ここで、図２ａに再生履歴テーブル１１１の内容を示すように、再生履歴テーブル１１１は、メディアプレイヤ１１３が再生出力したことのある楽曲、または、再生出力したことのある楽曲ビデオの楽曲毎のエントリ(図の各行)を有し、メディアプレイヤ１１３は、各楽曲のエントリに、その楽曲の情報として、その楽曲の各属性の属性値（ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など）と、その楽曲をメディアプレイヤ１１３が再生出力した回数を登録する。すなわち、メディアプレイヤ１１３は、ＨＤＤ１１４、ポータブルプレイヤ２、デジタルラジオ放送、インターネットラジオサービス５の楽曲や、動画共有サービス６の楽曲ビデオの再生出力を行ったならば、再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の各属性の属性値が登録されているエントリが再生履歴テーブル１１１に存在すかどうかを調べ、存在していれば、そのエントリの再生回数を１増加し、存在していない場合には新たなエントリを再生履歴テーブル１１１に作成し、作成したエントリに、再生出力した再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の各属性の属性値を登録すると共に、当該作成したエントリの再生回数に１を登録する。

ただし、メディアプレイヤ１１３は、ＨＤＤ１１４、ポータブルプレイヤ２の楽曲の再生出力については、再生出力した楽曲の情報の再生履歴テーブル１１１への登録を行わないようにしてもよい。すなわち、メディアプレイヤ１１３は、デジタルラジオ放送、インターネットラジオサービス５の楽曲や、動画共有サービス６の楽曲ビデオの再生出力を行った場合にのみ、再生出力した楽曲の情報の再生履歴テーブル１１１への登録を行うようにしてもよい。

なお、ＨＤＤ１１４、ポータブルプレイヤ２の楽曲の各属性の属性値は楽曲データベース１１０から取得することができ、デジタルラジオ放送、インターネットラジオサービス５の楽曲の各属性の属性値は、楽曲の放送時に楽曲と共に配信される楽曲の属性情報から取得することができ、動画共有サイトの楽曲ビデオの楽曲の各属性の属性値は、楽曲ビデオと共に動画共有サイトに公開されている楽曲ビデオのタイトルや基本情報(動画の説明)から取得することができる。

次に、認識履歴テーブル１０６には、音声入力制御部１０５によって、音声入力制御部１０５が音声入力を受け付けたことのある音声入力内容が登録される。
ここで、いま、音声入力制御部１０５が音声入力受け付けるユーザの発話のフォーマットが
「プレイ“楽曲の属性値”」と、「リスト“楽曲の属性値”」であるものとする。

ここで、“プレイ”と“リスト”は音声入力コマンドであり、“楽曲の属性値”はコマンドのパラメータである。そして、「プレイ“楽曲の属性値”」は“楽曲の属性値”と等しい属性値を持つ楽曲の再生を要求する音声入力であり、「リスト“楽曲の属性値”」は、“楽曲の属性値”と等しい属性値を持つ楽曲のリストの表示を要求する音声入力である。すなわち、Ｘがソング名であれば、「プレイＸ」は、ソング名Ｘの楽曲の再生を要求する音声入力であり、Ｙがアーティスト名であれば「リストＹ」は、アーティスト名Ｙの楽曲のリストの表示を要求する音声入力である。

そして、図２ｂに示すように、認識履歴テーブル１０６は、音声入力制御部１０５が音声入力を受け付けるコマンド毎のエントリ(図の各行)を有し、音声入力制御部１０５は、音声入力を受け付ける度に、音声入力を受け付けたコマンドに対応するエントリに、音声入力を受け付けたコマンドのパラメータ（楽曲の属性値）が登録されていない場合には、当該パラメータを登録する。

以下、音声入力制御部１０５における音声入力受付動作について説明する。
音声入力制御部１０５は、入力装置１０８の操作を介して、または、所定の発話音声による音声入力を介して、ユーザから音声入力による楽曲選択操作開始の指示を受け付けたならば、発話例提示処理を行って、音声入力受付可能な発話例をディスプレイ１０７に表示する。ここで、音声入力制御部１０５は、発話例提示処理において、上述した“プレイ”コマンドの音声入力「プレイ“楽曲の属性値”」の発話例と、“リスト”コマンドの音声入力「リスト“楽曲の属性値”」の発話例を表示する。

図３に、この発話例提示処理の手順を示す。
図示するように発話例提示処理において、音声入力制御部１０５は、“プレイ”コマンドの発話例に用いる属性を、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの楽曲の各属性のうちからランダムに第１属性として選択する（ステップ３０２）。

次に、“リスト”コマンドの発話例に用いる属性を、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの、ソングを除く楽曲の各属性のうちからランダムに第２属性として選択する（ステップ３０４）。

次に、再生履歴テーブル１１１に登録されている楽曲のうちの再生回数が上位の楽曲の内からランダムに一つの楽曲を参照楽曲として選択する（ステップ３０６）。そして、参照楽曲に関連する楽曲を、楽曲データベース１１０に登録されている楽曲のうちからランダムに選定し、選定した楽曲の第１属性の属性値を第１提示属性値として選定する（ステップ３０８）。

ここで、参照楽曲に関連する楽曲とは、参照楽曲と、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの属性のうちの予め定めたいずれか一つの属性または予め定めた複数の属性の属性値が一致する楽曲である。

そして、第１提示属性値が認識履歴テーブル１０６の“プレイ”コマンドのエントリに登録されているかどうかを調べ（ステップ３１０）、登録されていればステップ３０８からの処理に戻り、登録されていなければステップ３１２の処理に進む。なお、ステップ３１０は、第１提示属性値が認識履歴テーブル１０６の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ３０８からの処理に戻り、いずれにも登録されていなければステップ３１２の処理に進むステップとしてもよい。

さて、第１提示属性値が認識履歴テーブル１０６の“プレイ”コマンドのエントリに登録されておらず（ステップ３１０）、ステップ３１２に進んだならば、当該ステップ３１２において、再度、参照楽曲に関連する楽曲を、楽曲データベース１１０に登録されている楽曲のうちからランダムに選定し、選定した楽曲の第２属性の属性値を第２提示属性値として選定する。
そして、第２提示属性値が認識履歴テーブル１０６の“リスト”コマンドのエントリに登録されているかどうかを調べ（ステップ３１４）、登録されていれば、ステップ３１２からの処理に戻り、登録されていなければステップ３１６の処理に進む。なお、ステップ３１４は、第２提示属性値が認識履歴テーブル１０６の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ３１２からの処理に戻り、いずれにも登録されていなければステップ３１６の処理に進むステップとしてもよい。

さて、第２提示属性値が認識履歴テーブル１０６の“リスト”コマンドのエントリに登録されておらず（ステップ３１４）、ステップ３１６に進んだ場合には、当該ステップ３１６において、図４ａに示すような、第１提示属性値を用いた“プレイ”コマンドの発話例４０１と、第２提示属性値を用いた“リスト”コマンドの発話例４０２とを表した音声入力案内ウインドウをディスプレイ１０７に表示する（ステップ３１６）。

ここで、“プレイ”コマンドの発話例４０１は、「プレイ “第１提示属性値”」とする。すなわち、第１属性がソング名で、第１提示属性値がソング名「ビリージェーン」であれば、「プレイビリージェーン」を“プレイ”コマンドの発話例４０１とする。また、“リスト" コマンドの発話例４０２は、「リスト “第２提示属性値”」とする。すなわち、第２属性がアーティスト名で、第２提示属性値がアーティスト名「マイケルジャックであれば」であれば、「リストマイケルジャック」を“リスト” コマンドの発話例４０２とする。

そして、このように音声入力案内ウインドウを表示したならば、所定のタイムアウト時間（たとえば、３秒）を設定したタイマをスタートし（ステップ３１８）、音声入力案内ウインドウに設けた終了ボタン４０３の操作による終了指示の発生と（ステップ３２０）、音声入力の終了と（ステップ３２２）、タイマのタイムアウトの発生（ステップ３２４）とを監視する。

そして、終了指示の発生（ステップ３２０）、または、音声入力の終了（ステップ３２２）が発生した場合には、発話例提示処理を終了する。なお、音声入力の終了については後述する。

一方、タイマのタイムアウトが発生した場合には（ステップ３２４）、ステップ３０２からの処理に戻り、以上の処理を繰り返す。
ここで、このように、終了指示が発生するか音声入力が終了するまで、タイマのタイムアウトが発生する度に、ステップ３０２からの処理を繰り返すことにより、音声入力案内ウインドウに表示する発話例を、定期的に、順次、図４ａ、図４ｂ、...に示すように更新することができ、ユーザにより多くの発話例を提示できるようになる。

なお、ステップ３０２からの処理の繰り返しの各回において行われるステップ３０８の第１提示属性値の選定は、前回以前の回のステップ３０８で既に第１提示属性値として選定した属性値は、今回の第１提示属性値として選定しないように行い、ステップ３０２からの処理の繰り返しの各回において行われるステップ３１２の第２提示属性値の選定は、前回以前の回のステップ３１２で既に第２提示属性値として選定した属性値は、今回の第１提示属性値として選定しないように行う。より具体的には、ステップ３０８では、参照楽曲に関連する楽曲を、楽曲データベース１１０に登録されている楽曲のうちからランダムに選定する処理を、選定した楽曲の第１属性の属性値が前回以前の回のステップ３０８で既に第１提示属性値として選定した属性値と異なる属性値となるまで行い、異なる属性値となったならば当該異なる属性値を第１提示属性値として選定する。また、同様に、ステップ３１２では、参照楽曲に関連する楽曲を、楽曲データベース１１０に登録されている楽曲のうちからランダムに選定する処理を、選定した楽曲の第２属性の属性値が前回以前の回のステップ３１２で既に第２提示属性値として選定した属性値と異なる属性値となるまで行い、異なる属性値となったならば当該異なる属性値を第２提示属性値として選定する。

以上、音声入力制御部１０５が行う発話例提示処理について説明した。
さて、音声入力制御部１０５は、以上の発話例提示処理と並行して、入力装置１０８に設けられた「発話」ボタンの操作の発生を監視する。
そして、入力装置１０８に設けられた「発話」ボタンが操作されたならば、音声入力制御部１０５はマイクロフォン１０１から入力するユーザの発話音声の音声認識を音声認識エンジン１０２に開始させ、音声認識エンジン１０２は音声認識辞書１０３を用いた音声認識を行い、音声認識結果を音声入力制御部１０５に出力し、音声入力制御部１０５は音声認識結果を正常に取得できたならば音声認識結果を音声入力内容として受け付けて音声入力を終了し、上述のように発話例提示処理を終了した上で、音声認識エンジン１０２の受け付けた音声入力内容に応じた処理を行う。

すなわち、音声入力制御部１０５は、音声認識結果が、「プレイＸ」（ただし、Ｘは楽曲の属性値）であれば、メディアプレイヤ１１３にＸを属性値としてもつ楽曲の再生を要求し、メディアプレイヤ１１３は、楽曲データベース１１０を参照してＸを属性値としてもつ楽曲のオーディオファイルの情報を抽出し、ＨＤＤ１１４とポータブルプレイヤ２に格納されているＸを属性値としてもつ楽曲を音声出力装置１０９に順次再生出力する。

なお、再生出力される楽曲は、Ｘがソング名であればソング名がＸの楽曲となり、Ｘがアルバム名であればアルバム名がＸの各楽曲となり、Ｘがアーティスト名であればアーティスト名がＸの各楽曲、Ｘがジャンル名であればジャンル名がＸの各楽曲となる。

また、音声認識結果が、「リストＹ」（ただし、Yは楽曲の属性値）であれば、メディアプレイヤ１１３にＹを属性値としてもつ楽曲のリストの表示を要求し、メディアプレイヤ１１３は、楽曲データベース１１０を参照してＹを属性値としてもつ楽曲のリストを抽出し、抽出したリストをディスプレイ１０７に表示する。なお、Ｙがアルバム名であれば、表示するリストはアルバム名がＹのソング名のリストとなり、Ｙがアーティスト名であれば表示するリストはアーティスト名がＹの楽曲のアルバム名のリストとなり、Ｙがジャンル名であれば表示するリストはジャンル名がＹの楽曲のアーティスト名のリストとなる。

以上、本発明の実施形態について説明した。
以上のように本実施形態では、楽曲の属性値（ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など）で、操作対象とする楽曲を指定する音声入力の発話例として、ユーザが過去に再生した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致しユーザが興味ある楽曲である蓋然性が大きい。したがって、本実施形態によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができる。

１…ＡＶシステム、２…ポータブルプレイヤ、３…デジタルラジオ局、４…インターネット、５…インターネットラジオサービス、６…動画共有サービス、１０１…マイクロフォン、１０２…音声認識エンジン、１０３…音声認識辞書、１０４…辞書作成部、１０５…音声入力制御部、１０６…認識履歴テーブル、１０７…ディスプレイ、１０８…入力装置、１０９…音声出力装置、１１０…楽曲データベース、１１１…再生履歴テーブル、１１２…楽曲管理部、１１３…メディアプレイヤ、１１４…ＨＤＤ、１１５…外部インタフェース、１１６…デジタルラジオ受信機、１１７…移動通信装置。

Claims

楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。
請求項１記載の音声入力装置であって、
前記楽曲再生手段は、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、
前記再生履歴管理手段は、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理することを特徴とする音声入力装置。
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。
請求項２または３記載の音声入力装置であって、
前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であることを特徴とする音声入力装置。
請求項１、２、３または４記載の音声入力装置であって、
前記発話例提示手段は、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うことを特徴とする音声入力装置。
請求項１、２、３、４または５記載の音声入力装置であって、
受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を有し、
前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とする音声入力装置。
請求項１、２、３、４、５または６記載の音声入力装置であって、
前記再生履歴管理手段は、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、
前記発話例提示手段は、前記発話例表示処理において、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示することを特徴とする音声入力装置。
請求項１、２、３、４、５、６または７記載の音声入力装置であって、
前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも２つの属性を含むことを特徴とする音声入力装置。
コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。
コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。
請求項９または１０記載のコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段として機能させ、
前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とするコンピュータプログラム。