JP6393219B2 - 音声入力装置及びコンピュータプログラム - Google Patents

音声入力装置及びコンピュータプログラム Download PDF

Info

Publication number
JP6393219B2
JP6393219B2 JP2015049076A JP2015049076A JP6393219B2 JP 6393219 B2 JP6393219 B2 JP 6393219B2 JP 2015049076 A JP2015049076 A JP 2015049076A JP 2015049076 A JP2015049076 A JP 2015049076A JP 6393219 B2 JP6393219 B2 JP 6393219B2
Authority
JP
Japan
Prior art keywords
music
attribute value
voice input
attribute
utterance example
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015049076A
Other languages
English (en)
Other versions
JP2016170238A (ja
Inventor
文彦 青山
文彦 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2015049076A priority Critical patent/JP6393219B2/ja
Publication of JP2016170238A publication Critical patent/JP2016170238A/ja
Application granted granted Critical
Publication of JP6393219B2 publication Critical patent/JP6393219B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、発話音声による入力を受け付ける音声入力の技術に関するものである。
発話音声による入力を受け付ける音声入力の技術としては、音声入力を受け付け可能な発話例として、音声認識辞書に登録された音声認識可能な単語を用いた発話例を表示する技術が知られている(たとえば、特許文献1)。
特開2010-128144号公報
上述のように音声認識辞書に登録された単語を用いた発話例を表示する場合、音声入力の各回において同じ発話例を表示することは、既にユーザが音声入力可能であることを認知している発話内容を繰り返しユーザに提示することになるため、発話例を提示する意義が希薄となる。
一方、たとえば、音声入力の各回において、音声認識辞書に登録された単語をランダムに選定し、選定した単語を用いた発話例を表示することも考えられるが、このようにした場合には、数多くの単語が音声認識辞書に登録されているときには、ユーザにとって興味のない単語、すなわち、ユーザがおよそ音声入力することのない単語を用いた発話例も高い頻度で表示されることとなるため、提示される発話例は充分にユーザにとって有用なものとはならない。
そこで、本発明は、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することを課題とする。
前記課題達成のために、本発明は、楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置に、複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを備えたものである。ただし、前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うものである。
ここで、以上の音声入力装置は、前記楽曲再生手段において、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、前記再生履歴管理手段において、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理するように構成してもよい。
または、以上の音声入力装置は、前記楽曲再生手段において、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、前記再生履歴管理手段において、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値は管理せず、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値のみを管理するように構成してもよい。
ここで、このような音声入力装置は、前記発話例提示手段において、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うように構成してもよい。
また、以上のような音声入力装置は、当該音声入力装置に、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を設け、前記発話例提示手段において、前記発話例表示処理で、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないように構成してもよい。
また、この場合には、前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であってよい。
ここで、以上の音声入力装置は、前記再生履歴管理手段において、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、前記発話例提示手段において、前記発話例表示処理で、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示するように構成してもよい。
また、以上の音声入力装置において、前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも2つの属性を含むものとすることが好ましい。
以上のような音声入力装置によれば、楽曲の属性値で、操作対象とする楽曲を指定する音声入力の発話例として、過去に再生出力した楽曲と属性値と同じ属性値をもつ楽曲、すなわち、過去に再生出力した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致したユーザが興味ある楽曲である蓋然性が大きい。したがって、本発明によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができ、発話例の表示のユーザにとっての有用性を向上することができる。
以上のように、本発明によれば、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することができる。
本発明の実施形態に係るAVシステムの構成を示すブロック図である。 本発明の実施形態に係る認識履歴テーブルと再生頻度テーブルを示す図である。 本発明の実施形態に係る発話例提示処理を示すフローチャートである。 本発明の実施形態に係る音声入力案内ウインドウを示す図である。
以下、本発明の実施形態を、自動車に搭載されるAVシステムへの適用を例にとり説明する。
図1に、本実施形態に係るAVシステムの構成を示す。
図示するように、AVシステム1は、マイクロフォン101、音声認識エンジン102、音声認識辞書103、辞書作成部104、音声入力制御部105、認識履歴テーブル106、ディスプレイ107、入力装置108、スピーカ等を備えた音声出力装置109、楽曲データベース110、再生履歴テーブル111、楽曲管理部112、メディアプレイヤ113、HDD114(ハードディスク114)、外部インタフェース115、デジタルラジオ受信機116、移動通信装置117を備えている。
ただし、AVシステム1は、CPUやメモリやその他の周辺デバイスを備えたコンピュータを用いて構成されるものであって良く、また、この場合、音声認識エンジン102、辞書作成部104、音声入力制御部105、楽曲管理部112、メディアプレイヤ113などは、CPUが所定のコンピュータプログラムを実行することにより実現されるものであってよい。
さて、このようなAVシステム1の構成において、HDD114には、楽曲のオーディオファイルが格納されている。また、外部インタフェース115には、楽曲のオーディオファイルを格納したポータブルプレイヤ2を接続することができる。また、デジタルラジオ受信機116はデジタルラジオ局3が放送するデジタルラジオ放送を受信する。また、移動通信装置117は、移動通信を介してインターネット4に接続することができる。
次に、楽曲管理部112は、HDD114とポータブルプレイヤ2を参照し、HDD114に格納された楽曲のオーディオファイルとポータブルプレイヤ2に格納されている楽曲のオーディオファイルの情報を楽曲データベース110に登録する。楽曲データベース110に登録する各オーディオファイルの情報としては、オーディオファイルのロケーションや、オーディオファイルの楽曲の属性値を登録する。楽曲データベース110に属性値を登録する楽曲の属性としては、楽曲のソング名(タイトル)、アルバム名、アーティスト名、ジャンル名、コンポーザ名などを用いる。また、楽曲データベース110には、各属性の属性値毎に作成したリストも登録する。ここで、属性Aの属性値Bについて作成したリストは、属性Aの属性値がBであるオーディオファイルをリストアップしたリストである。なお、各オーディオファイルの楽曲の各属性の属性値は、HDD114やポータブルプレイヤ2に登録されており、楽曲管理部112は、HDD114やポータブルプレイヤ2から、各オーディオファイルの楽曲の各属性の属性値を取得して楽曲データベース110に登録する。
次に、辞書作成部104は、楽曲データベース110を参照し、楽曲データベース110にオーディオファイルが登録されている楽曲の属性値として用いられている語彙(ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など)を抽出し、抽出した各語彙を認識するための辞書データを作成し、音声認識辞書103に登録する。ここで、音声認識辞書103には、上記語彙を認識するための辞書データの他に、音声入力制御部105が音声入力を受け付ける各種コマンドを表す語彙を認識するための辞書データも格納されている。
次に、音声認識エンジン102は音声認識辞書103を用いて、マイクロフォン101から入力するユーザの発話音声を認識し、音声入力制御部105は、音声認識エンジン102の音声認識結果を音声入力として受け付ける。
一方、メディアプレイヤ113は、音声入力制御部105がユーザから受け付けた音声入力や入力装置108で受け付けたユーザの操作に応じて、HDD114やポータブルプレイヤ2にオーディオファイルが格納されている楽曲を音声出力装置109から再生出力したり、デジタルラジオ受信機116にデジタルラジオ放送を受信させてデジタルラジオ放送で受信した楽曲を音声出力装置109から再生出力したり、移動通信装置117を介してインターネット4上のインターネットラジオサービス5にアクセスして、ユーザが選択したインターネットラジオステーションから配信される楽曲を音声出力装置109から再生出力したり、移動通信装置117を介してインターネット4上の動画共有サービス6にアクセスして、ユーザが選択した楽曲ビデオの配信を動画共有サービス6から受けディスプレイ107と音声出力装置109から再生出力する処理などを行う。
また、メディアプレイヤ113は、以上のように、HDD114、ポータブルプレイヤ2、デジタルラジオ放送、インターネットラジオサービス5の楽曲や、動画共有サービス6の楽曲ビデオの再生出力を行ったならば、再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の情報を再生履歴テーブル111に登録する。
ここで、図2aに再生履歴テーブル111の内容を示すように、再生履歴テーブル111は、メディアプレイヤ113が再生出力したことのある楽曲、または、再生出力したことのある楽曲ビデオの楽曲毎のエントリ(図の各行)を有し、メディアプレイヤ113は、各楽曲のエントリに、その楽曲の情報として、その楽曲の各属性の属性値(ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など)と、その楽曲をメディアプレイヤ113が再生出力した回数を登録する。すなわち、メディアプレイヤ113は、HDD114、ポータブルプレイヤ2、デジタルラジオ放送、インターネットラジオサービス5の楽曲や、動画共有サービス6の楽曲ビデオの再生出力を行ったならば、再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の各属性の属性値が登録されているエントリが再生履歴テーブル111に存在すかどうかを調べ、存在していれば、そのエントリの再生回数を1増加し、存在していない場合には新たなエントリを再生履歴テーブル111に作成し、作成したエントリに、再生出力した再生出力した楽曲、または、再生出力した楽曲ビデオの楽曲の各属性の属性値を登録すると共に、当該作成したエントリの再生回数に1を登録する。
ただし、メディアプレイヤ113は、HDD114、ポータブルプレイヤ2の楽曲の再生出力については、再生出力した楽曲の情報の再生履歴テーブル111への登録を行わないようにしてもよい。すなわち、メディアプレイヤ113は、デジタルラジオ放送、インターネットラジオサービス5の楽曲や、動画共有サービス6の楽曲ビデオの再生出力を行った場合にのみ、再生出力した楽曲の情報の再生履歴テーブル111への登録を行うようにしてもよい。
なお、HDD114、ポータブルプレイヤ2の楽曲の各属性の属性値は楽曲データベース110から取得することができ、デジタルラジオ放送、インターネットラジオサービス5の楽曲の各属性の属性値は、楽曲の放送時に楽曲と共に配信される楽曲の属性情報から取得することができ、動画共有サイトの楽曲ビデオの楽曲の各属性の属性値は、楽曲ビデオと共に動画共有サイトに公開されている楽曲ビデオのタイトルや基本情報(動画の説明)から取得することができる。
次に、認識履歴テーブル106には、音声入力制御部105によって、音声入力制御部105が音声入力を受け付けたことのある音声入力内容が登録される。
ここで、いま、音声入力制御部105が音声入力受け付けるユーザの発話のフォーマットが
「プレイ“楽曲の属性値”」 と、「リスト“楽曲の属性値”」であるものとする。
ここで、“プレイ”と“リスト”は音声入力コマンドであり、“楽曲の属性値”はコマンドのパラメータである。そして、「プレイ“楽曲の属性値”」は“楽曲の属性値”と等しい属性値を持つ楽曲の再生を要求する音声入力であり、「リスト“楽曲の属性値”」は、“楽曲の属性値”と等しい属性値を持つ楽曲のリストの表示を要求する音声入力である。すなわち、Xがソング名であれば、「プレイ X」は、ソング名Xの楽曲の再生を要求する音声入力であり、Yがアーティスト名であれば「リスト Y」は、アーティスト名Yの楽曲のリストの表示を要求する音声入力である。
そして、図2bに示すように、認識履歴テーブル106は、音声入力制御部105が音声入力を受け付けるコマンド毎のエントリ(図の各行)を有し、音声入力制御部105は、音声入力を受け付ける度に、音声入力を受け付けたコマンドに対応するエントリに、音声入力を受け付けたコマンドのパラメータ(楽曲の属性値)が登録されていない場合には、当該パラメータを登録する。
以下、音声入力制御部105における音声入力受付動作について説明する。
音声入力制御部105は、入力装置108の操作を介して、または、所定の発話音声による音声入力を介して、ユーザから音声入力による楽曲選択操作開始の指示を受け付けたならば、発話例提示処理を行って、音声入力受付可能な発話例をディスプレイ107に表示する。ここで、音声入力制御部105は、発話例提示処理において、上述した“プレイ”コマンドの音声入力「プレイ“楽曲の属性値”」 の発話例と、“リスト”コマンドの音声入力「リスト“楽曲の属性値”」の発話例を表示する。
図3に、この発話例提示処理の手順を示す。
図示するように発話例提示処理において、音声入力制御部105は、“プレイ”コマンドの発話例に用いる属性を、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの楽曲の各属性のうちからランダムに第1属性として選択する(ステップ302)。
次に、“リスト”コマンドの発話例に用いる属性を、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの、ソングを除く楽曲の各属性のうちからランダムに第2属性として選択する(ステップ304)。
次に、再生履歴テーブル111に登録されている楽曲のうちの再生回数が上位の楽曲の内からランダムに一つの楽曲を参照楽曲として選択する(ステップ306)。そして、参照楽曲に関連する楽曲を、楽曲データベース110に登録されている楽曲のうちからランダムに選定し、選定した楽曲の第1属性の属性値を第1提示属性値として選定する(ステップ308)。
ここで、参照楽曲に関連する楽曲とは、参照楽曲と、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの属性のうちの予め定めたいずれか一つの属性または予め定めた複数の属性の属性値が一致する楽曲である。
そして、第1提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリに登録されているかどうかを調べ(ステップ310)、登録されていればステップ308からの処理に戻り、登録されていなければステップ312の処理に進む。なお、ステップ310は、第1提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ308からの処理に戻り、いずれにも登録されていなければステップ312の処理に進むステップとしてもよい。
さて、第1提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリに登録されておらず(ステップ310)、ステップ312に進んだならば、当該ステップ312において、再度、参照楽曲に関連する楽曲を、楽曲データベース110に登録されている楽曲のうちからランダムに選定し、選定した楽曲の第2属性の属性値を第2提示属性値として選定する。
そして、第2提示属性値が認識履歴テーブル106の“リスト”コマンドのエントリに登録されているかどうかを調べ(ステップ314)、登録されていれば、ステップ312からの処理に戻り、登録されていなければステップ316の処理に進む。なお、ステップ314は、第2提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ312からの処理に戻り、いずれにも登録されていなければステップ316の処理に進むステップとしてもよい。
さて、第2提示属性値が認識履歴テーブル106の“リスト”コマンドのエントリに登録されておらず(ステップ314)、ステップ316に進んだ場合には、当該ステップ316において、図4aに示すような、第1提示属性値を用いた“プレイ”コマンドの発話例401と、第2提示属性値を用いた“リスト”コマンドの発話例402とを表した音声入力案内ウインドウをディスプレイ107に表示する(ステップ316)。
ここで、“プレイ”コマンドの発話例401は、「プレイ “第1提示属性値”」とする。すなわち、第1属性がソング名で、第1提示属性値がソング名「ビリー ジェーン」であれば、「プレイ ビリー ジェーン」を“プレイ”コマンドの発話例401とする。また、“リスト" コマンドの発話例402は、「リスト “第2提示属性値”」とする。すなわち、第2属性がアーティスト名で、第2提示属性値がアーティスト名「マイケル ジャックであれば」であれば、「リスト マイケル ジャック」を“リスト” コマンドの発話例402とする。
そして、このように音声入力案内ウインドウを表示したならば、所定のタイムアウト時間(たとえば、3秒)を設定したタイマをスタートし(ステップ318)、音声入力案内ウインドウに設けた終了ボタン403の操作による終了指示の発生と(ステップ320)、音声入力の終了と(ステップ322)、タイマのタイムアウトの発生(ステップ324)とを監視する。
そして、終了指示の発生(ステップ320)、または、音声入力の終了(ステップ322)が発生した場合には、発話例提示処理を終了する。なお、音声入力の終了については後述する。
一方、タイマのタイムアウトが発生した場合には(ステップ324)、ステップ302からの処理に戻り、以上の処理を繰り返す。
ここで、このように、終了指示が発生するか音声入力が終了するまで、タイマのタイムアウトが発生する度に、ステップ302からの処理を繰り返すことにより、音声入力案内ウインドウに表示する発話例を、定期的に、順次、図4a、図4b、...に示すように更新することができ、ユーザにより多くの発話例を提示できるようになる。
なお、ステップ302からの処理の繰り返しの各回において行われるステップ308の第1提示属性値の選定は、前回以前の回のステップ308で既に第1提示属性値として選定した属性値は、今回の第1提示属性値として選定しないように行い、ステップ302からの処理の繰り返しの各回において行われるステップ312の第2提示属性値の選定は、前回以前の回のステップ312で既に第2提示属性値として選定した属性値は、今回の第1提示属性値として選定しないように行う。より具体的には、ステップ308では、参照楽曲に関連する楽曲を、楽曲データベース110に登録されている楽曲のうちからランダムに選定する処理を、選定した楽曲の第1属性の属性値が前回以前の回のステップ308で既に第1提示属性値として選定した属性値と異なる属性値となるまで行い、異なる属性値となったならば当該異なる属性値を第1提示属性値として選定する。また、同様に、ステップ312では、参照楽曲に関連する楽曲を、楽曲データベース110に登録されている楽曲のうちからランダムに選定する処理を、選定した楽曲の第2属性の属性値が前回以前の回のステップ312で既に第2提示属性値として選定した属性値と異なる属性値となるまで行い、異なる属性値となったならば当該異なる属性値を第2提示属性値として選定する。
以上、音声入力制御部105が行う発話例提示処理について説明した。
さて、音声入力制御部105は、以上の発話例提示処理と並行して、入力装置108に設けられた「発話」ボタンの操作の発生を監視する。
そして、入力装置108に設けられた「発話」ボタンが操作されたならば、音声入力制御部105はマイクロフォン101から入力するユーザの発話音声の音声認識を音声認識エンジン102に開始させ、音声認識エンジン102は音声認識辞書103を用いた音声認識を行い、音声認識結果を音声入力制御部105に出力し、音声入力制御部105は音声認識結果を正常に取得できたならば音声認識結果を音声入力内容として受け付けて音声入力を終了し、上述のように発話例提示処理を終了した上で、音声認識エンジン102の受け付けた音声入力内容に応じた処理を行う。
すなわち、音声入力制御部105は、音声認識結果が、「プレイX」(ただし、Xは楽曲の属性値)であれば、メディアプレイヤ113にXを属性値としてもつ楽曲の再生を要求し、メディアプレイヤ113は、楽曲データベース110を参照してXを属性値としてもつ楽曲のオーディオファイルの情報を抽出し、HDD114とポータブルプレイヤ2に格納されているXを属性値としてもつ楽曲を音声出力装置109に順次再生出力する。
なお、再生出力される楽曲は、Xがソング名であればソング名がXの楽曲となり、Xがアルバム名であればアルバム名がXの各楽曲となり、Xがアーティスト名であればアーティスト名がXの各楽曲、Xがジャンル名であればジャンル名がXの各楽曲となる。
また、音声認識結果が、「リスト Y」(ただし、Yは楽曲の属性値)であれば、メディアプレイヤ113にYを属性値としてもつ楽曲のリストの表示を要求し、メディアプレイヤ113は、楽曲データベース110を参照してYを属性値としてもつ楽曲のリストを抽出し、抽出したリストをディスプレイ107に表示する。なお、Yがアルバム名であれば、表示するリストはアルバム名がYのソング名のリストとなり、Yがアーティスト名であれば表示するリストはアーティスト名がYの楽曲のアルバム名のリストとなり、Yがジャンル名であれば表示するリストはジャンル名がYの楽曲のアーティスト名のリストとなる。
以上、本発明の実施形態について説明した。
以上のように本実施形態では、楽曲の属性値(ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など)で、操作対象とする楽曲を指定する音声入力の発話例として、ユーザが過去に再生した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致しユーザが興味ある楽曲である蓋然性が大きい。したがって、本実施形態によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができる。
1…AVシステム、2…ポータブルプレイヤ、3…デジタルラジオ局、4…インターネット、5…インターネットラジオサービス、6…動画共有サービス、101…マイクロフォン、102…音声認識エンジン、103…音声認識辞書、104…辞書作成部、105…音声入力制御部、106…認識履歴テーブル、107…ディスプレイ、108…入力装置、109…音声出力装置、110…楽曲データベース、111…再生履歴テーブル、112…楽曲管理部、113…メディアプレイヤ、114…HDD、115…外部インタフェース、116…デジタルラジオ受信機、117…移動通信装置。

Claims (11)

  1. 楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
    複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
    前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
    前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
    ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
    前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。
  2. 請求項1記載の音声入力装置であって、
    前記楽曲再生手段は、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、
    前記再生履歴管理手段は、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理することを特徴とする音声入力装置。
  3. 楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
    複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
    前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
    通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
    ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
    前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。
  4. 請求項2または3記載の音声入力装置であって、
    前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であることを特徴とする音声入力装置。
  5. 請求項1、2、3または4記載の音声入力装置であって、
    前記発話例提示手段は、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うことを特徴とする音声入力装置。
  6. 請求項1、2、3、4または5記載の音声入力装置であって、
    受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を有し、
    前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とする音声入力装置。
  7. 請求項1、2、3、4、5または6記載の音声入力装置であって、
    前記再生履歴管理手段は、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、
    前記発話例提示手段は、前記発話例表示処理において、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示することを特徴とする音声入力装置。
  8. 請求項1、2、3、4、5、6または7記載の音声入力装置であって、
    前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも2つの属性を含むことを特徴とする音声入力装置。
  9. コンピュータによって読み取られ実行されるコンピュータプログラムであって、
    当該コンピュータプログラムは、前記コンピュータを、
    楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
    複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
    前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
    前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
    ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
    前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。
  10. コンピュータによって読み取られ実行されるコンピュータプログラムであって、
    当該コンピュータプログラムは、前記コンピュータを、
    楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
    複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
    前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
    通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
    ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
    前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。
  11. 請求項9または10記載のコンピュータプログラムであって、
    当該コンピュータプログラムは、前記コンピュータを、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段として機能させ、
    前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とするコンピュータプログラム。
JP2015049076A 2015-03-12 2015-03-12 音声入力装置及びコンピュータプログラム Active JP6393219B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015049076A JP6393219B2 (ja) 2015-03-12 2015-03-12 音声入力装置及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015049076A JP6393219B2 (ja) 2015-03-12 2015-03-12 音声入力装置及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2016170238A JP2016170238A (ja) 2016-09-23
JP6393219B2 true JP6393219B2 (ja) 2018-09-19

Family

ID=56983627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015049076A Active JP6393219B2 (ja) 2015-03-12 2015-03-12 音声入力装置及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6393219B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227954A (ja) * 2005-02-18 2006-08-31 Pioneer Electronic Corp 情報処理装置及び情報処理方法等
JP2008076766A (ja) * 2006-09-21 2008-04-03 Xing Inc 電子早見本装置
JP5455355B2 (ja) * 2008-11-27 2014-03-26 トヨタ自動車株式会社 音声認識装置及びプログラム
JP2011043710A (ja) * 2009-08-21 2011-03-03 Sony Corp 音声処理装置、音声処理方法及びプログラム

Also Published As

Publication number Publication date
JP2016170238A (ja) 2016-09-23

Similar Documents

Publication Publication Date Title
US8751238B2 (en) Systems and methods for determining the language to use for speech generated by a text to speech engine
US20090076821A1 (en) Method and apparatus to control operation of a playback device
US20070156410A1 (en) Digital audio file search method and apparatus using text-to-speech processing
JP2014219614A (ja) オーディオ装置、ビデオ装置及びコンピュータプログラム
WO2014161282A1 (zh) 视频文件播放进度的调整方法及装置
JP2019091014A (ja) マルチメディアを再生するための方法及び装置
US11574627B2 (en) Masking systems and methods
CN109241329A (zh) 用于ar场景的音乐检索方法、装置、设备及存储介质
JP5034599B2 (ja) 楽曲紹介文生成装置、ナレーション付加装置およびプログラム
JP6393219B2 (ja) 音声入力装置及びコンピュータプログラム
JP5173380B2 (ja) パーソナルメディアの楽曲作品集合に基づいてカラオケ選曲予約を行えるカラオケ装置
JP2013092912A (ja) 情報処理装置、情報処理方法、並びにプログラム
JP2005285285A (ja) コンテンツ読出装置及び楽曲再生装置
EP3648106B1 (en) Media content steering
WO2021080971A1 (en) Device and method for creating a sharable clip of a podcast
KR20080049438A (ko) 음성 출력 장치 및 방법
JP6587459B2 (ja) カラオケイントロにおける曲紹介システム
KR101576683B1 (ko) 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법
KR102433344B1 (ko) 사용자와 뮤지션의 팀 결성을 지원하는 방법 및 디바이스
US11886486B2 (en) Apparatus, systems and methods for providing segues to contextualize media content
KR100655802B1 (ko) 오디오 녹음파일을 생성하는 방법
JP5426913B2 (ja) 音声認識辞書編集装置及び音声認識装置
JP2007316830A (ja) 情報処理装置及びコンテンツ検索プログラム
JP2007241941A (ja) コンテンツ検索装置及びコンテンツ検索プログラム
JP2008158048A (ja) カラオケシステム及びデジタル再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180821

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180824

R150 Certificate of patent or registration of utility model

Ref document number: 6393219

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150