JP6393219B2 - 音声入力装置及びコンピュータプログラム - Google Patents
音声入力装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP6393219B2 JP6393219B2 JP2015049076A JP2015049076A JP6393219B2 JP 6393219 B2 JP6393219 B2 JP 6393219B2 JP 2015049076 A JP2015049076 A JP 2015049076A JP 2015049076 A JP2015049076 A JP 2015049076A JP 6393219 B2 JP6393219 B2 JP 6393219B2
- Authority
- JP
- Japan
- Prior art keywords
- music
- attribute value
- voice input
- attribute
- utterance example
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
一方、たとえば、音声入力の各回において、音声認識辞書に登録された単語をランダムに選定し、選定した単語を用いた発話例を表示することも考えられるが、このようにした場合には、数多くの単語が音声認識辞書に登録されているときには、ユーザにとって興味のない単語、すなわち、ユーザがおよそ音声入力することのない単語を用いた発話例も高い頻度で表示されることとなるため、提示される発話例は充分にユーザにとって有用なものとはならない。
そこで、本発明は、音声入力を受け付け可能な発話例を表示する音声入力装置において、よりユーザにとって有用な形態で発話例を提示することを課題とする。
また、以上のような音声入力装置は、当該音声入力装置に、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を設け、前記発話例提示手段において、前記発話例表示処理で、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないように構成してもよい。
ここで、以上の音声入力装置は、前記再生履歴管理手段において、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、前記発話例提示手段において、前記発話例表示処理で、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示するように構成してもよい。
図1に、本実施形態に係るAVシステムの構成を示す。
図示するように、AVシステム1は、マイクロフォン101、音声認識エンジン102、音声認識辞書103、辞書作成部104、音声入力制御部105、認識履歴テーブル106、ディスプレイ107、入力装置108、スピーカ等を備えた音声出力装置109、楽曲データベース110、再生履歴テーブル111、楽曲管理部112、メディアプレイヤ113、HDD114(ハードディスク114)、外部インタフェース115、デジタルラジオ受信機116、移動通信装置117を備えている。
ここで、いま、音声入力制御部105が音声入力受け付けるユーザの発話のフォーマットが
「プレイ“楽曲の属性値”」 と、「リスト“楽曲の属性値”」であるものとする。
音声入力制御部105は、入力装置108の操作を介して、または、所定の発話音声による音声入力を介して、ユーザから音声入力による楽曲選択操作開始の指示を受け付けたならば、発話例提示処理を行って、音声入力受付可能な発話例をディスプレイ107に表示する。ここで、音声入力制御部105は、発話例提示処理において、上述した“プレイ”コマンドの音声入力「プレイ“楽曲の属性値”」 の発話例と、“リスト”コマンドの音声入力「リスト“楽曲の属性値”」の発話例を表示する。
図示するように発話例提示処理において、音声入力制御部105は、“プレイ”コマンドの発話例に用いる属性を、ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名などの楽曲の各属性のうちからランダムに第1属性として選択する(ステップ302)。
そして、第2提示属性値が認識履歴テーブル106の“リスト”コマンドのエントリに登録されているかどうかを調べ(ステップ314)、登録されていれば、ステップ312からの処理に戻り、登録されていなければステップ316の処理に進む。なお、ステップ314は、第2提示属性値が認識履歴テーブル106の“プレイ”コマンドのエントリと“リスト”コマンドのエントリのいずれかに登録されているかどうかを調べ、いずれかに登録されていればステップ312からの処理に戻り、いずれにも登録されていなければステップ316の処理に進むステップとしてもよい。
ここで、このように、終了指示が発生するか音声入力が終了するまで、タイマのタイムアウトが発生する度に、ステップ302からの処理を繰り返すことにより、音声入力案内ウインドウに表示する発話例を、定期的に、順次、図4a、図4b、...に示すように更新することができ、ユーザにより多くの発話例を提示できるようになる。
さて、音声入力制御部105は、以上の発話例提示処理と並行して、入力装置108に設けられた「発話」ボタンの操作の発生を監視する。
そして、入力装置108に設けられた「発話」ボタンが操作されたならば、音声入力制御部105はマイクロフォン101から入力するユーザの発話音声の音声認識を音声認識エンジン102に開始させ、音声認識エンジン102は音声認識辞書103を用いた音声認識を行い、音声認識結果を音声入力制御部105に出力し、音声入力制御部105は音声認識結果を正常に取得できたならば音声認識結果を音声入力内容として受け付けて音声入力を終了し、上述のように発話例提示処理を終了した上で、音声認識エンジン102の受け付けた音声入力内容に応じた処理を行う。
以上のように本実施形態では、楽曲の属性値(ソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名など)で、操作対象とする楽曲を指定する音声入力の発話例として、ユーザが過去に再生した楽曲に関連する楽曲の属性値を用いた発話例を表示する。ここで、ユーザが過去に再生した楽曲に関連する楽曲の属性値によって指定される楽曲は、ユーザが過去に再生した楽曲に関連する楽曲であり、ユーザの嗜好に合致しユーザが興味ある楽曲である蓋然性が大きい。したがって、本実施形態によれば、音声入力の発話例として、ユーザにとって有用な、ユーザが興味ある楽曲を操作対象とする発話例を表示することができる。
Claims (11)
- 楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。 - 請求項1記載の音声入力装置であって、
前記楽曲再生手段は、前記楽曲記憶手段に記憶された楽曲に加え、通信を介して配信される楽曲を再生出力し、
前記再生履歴管理手段は、前記楽曲記憶手段に記憶された楽曲のうちの前記楽曲再生手段が再生出力した楽曲の各属性の属性値と、通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値とを管理することを特徴とする音声入力装置。 - 楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力装置であって、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段とを有し、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とする音声入力装置。 - 請求項2または3記載の音声入力装置であって、
前記通信を介して配信される楽曲は、ラジオ放送とインターネットラジオと動画共有サイトのうちの少なくとも一つから配信される楽曲であることを特徴とする音声入力装置。 - 請求項1、2、3または4記載の音声入力装置であって、
前記発話例提示手段は、ユーザの発話による音声入力を受け付けるまで、前記発話例表示処理を、各回の発話例表示処理において前記提示属性値として異なる属性値が選定されるように行うことにより、表示する文字列が表す前記発話例の更新を行うことを特徴とする音声入力装置。 - 請求項1、2、3、4または5記載の音声入力装置であって、
受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段を有し、
前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とする音声入力装置。 - 請求項1、2、3、4、5または6記載の音声入力装置であって、
前記再生履歴管理手段は、前記楽曲再生手段が再生出力した楽曲の、当該楽曲を再生出力した回数も管理し、
前記発話例提示手段は、前記発話例表示処理において、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲であって前記再生履歴管理手段が管理している再生出力した回数が所定のレベル以上である楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示することを特徴とする音声入力装置。 - 請求項1、2、3、4、5、6または7記載の音声入力装置であって、
前記複数の属性は、楽曲のソング名、アルバム名、アーティスト名、ジャンル名、コンポーザ名のうちの少なくとも2つの属性を含むことを特徴とする音声入力装置。 - コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲を再生出力する楽曲再生手段と、
前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。 - コンピュータによって読み取られ実行されるコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、
楽曲の属性値で操作対象とする楽曲を指定する音声入力を受け付ける音声入力手段と、
複数の属性について各属性の属性値をもつ楽曲を記憶した楽曲記憶手段と、
前記楽曲記憶手段に記憶された楽曲と、通信を介して配信される楽曲を再生出力する楽曲再生手段と、
通信を介して配信され前記楽曲再生手段が再生出力した楽曲の各属性の属性値を管理する再生履歴管理手段と、
ユーザの発話による音声入力を受け付ける際に、音声入力を受け付け可能な発話例を提示する発話例提示手段として機能させ、
前記発話例提示手段は、前記楽曲記憶手段に記憶されている楽曲のうちの、再生履歴管理手段が管理している楽曲の属性値と同じ属性値をもつ楽曲の前記複数の属性のうちのいずれかの属性の属性値を提示属性値として選定し、当該提示属性値を操作対象とする楽曲を指定する属性値として含む発話例を表す文字列を表示する発話例表示処理を行うことを特徴とするコンピュータプログラム。 - 請求項9または10記載のコンピュータプログラムであって、
当該コンピュータプログラムは、前記コンピュータを、さらに、受け付けた音声入力において操作対象とする楽曲を指定している属性値を管理する入力履歴管理手段として機能させ、
前記発話例提示手段は、前記発話例表示処理において、前記入力履歴管理手段が管理している属性値を、前記提示属性値として選定しないことを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015049076A JP6393219B2 (ja) | 2015-03-12 | 2015-03-12 | 音声入力装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015049076A JP6393219B2 (ja) | 2015-03-12 | 2015-03-12 | 音声入力装置及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016170238A JP2016170238A (ja) | 2016-09-23 |
JP6393219B2 true JP6393219B2 (ja) | 2018-09-19 |
Family
ID=56983627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015049076A Active JP6393219B2 (ja) | 2015-03-12 | 2015-03-12 | 音声入力装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6393219B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006227954A (ja) * | 2005-02-18 | 2006-08-31 | Pioneer Electronic Corp | 情報処理装置及び情報処理方法等 |
JP2008076766A (ja) * | 2006-09-21 | 2008-04-03 | Xing Inc | 電子早見本装置 |
JP5455355B2 (ja) * | 2008-11-27 | 2014-03-26 | トヨタ自動車株式会社 | 音声認識装置及びプログラム |
JP2011043710A (ja) * | 2009-08-21 | 2011-03-03 | Sony Corp | 音声処理装置、音声処理方法及びプログラム |
-
2015
- 2015-03-12 JP JP2015049076A patent/JP6393219B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016170238A (ja) | 2016-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8751238B2 (en) | Systems and methods for determining the language to use for speech generated by a text to speech engine | |
US20090076821A1 (en) | Method and apparatus to control operation of a playback device | |
US20070156410A1 (en) | Digital audio file search method and apparatus using text-to-speech processing | |
JP2014219614A (ja) | オーディオ装置、ビデオ装置及びコンピュータプログラム | |
WO2014161282A1 (zh) | 视频文件播放进度的调整方法及装置 | |
JP2019091014A (ja) | マルチメディアを再生するための方法及び装置 | |
US11574627B2 (en) | Masking systems and methods | |
CN109241329A (zh) | 用于ar场景的音乐检索方法、装置、设备及存储介质 | |
JP5034599B2 (ja) | 楽曲紹介文生成装置、ナレーション付加装置およびプログラム | |
JP6393219B2 (ja) | 音声入力装置及びコンピュータプログラム | |
JP5173380B2 (ja) | パーソナルメディアの楽曲作品集合に基づいてカラオケ選曲予約を行えるカラオケ装置 | |
JP2013092912A (ja) | 情報処理装置、情報処理方法、並びにプログラム | |
JP2005285285A (ja) | コンテンツ読出装置及び楽曲再生装置 | |
EP3648106B1 (en) | Media content steering | |
WO2021080971A1 (en) | Device and method for creating a sharable clip of a podcast | |
KR20080049438A (ko) | 음성 출력 장치 및 방법 | |
JP6587459B2 (ja) | カラオケイントロにおける曲紹介システム | |
KR101576683B1 (ko) | 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법 | |
KR102433344B1 (ko) | 사용자와 뮤지션의 팀 결성을 지원하는 방법 및 디바이스 | |
US11886486B2 (en) | Apparatus, systems and methods for providing segues to contextualize media content | |
KR100655802B1 (ko) | 오디오 녹음파일을 생성하는 방법 | |
JP5426913B2 (ja) | 音声認識辞書編集装置及び音声認識装置 | |
JP2007316830A (ja) | 情報処理装置及びコンテンツ検索プログラム | |
JP2007241941A (ja) | コンテンツ検索装置及びコンテンツ検索プログラム | |
JP2008158048A (ja) | カラオケシステム及びデジタル再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170914 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180821 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180824 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6393219 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |