JP2008033017A - データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両 - Google Patents

データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両 Download PDF

Info

Publication number
JP2008033017A
JP2008033017A JP2006206485A JP2006206485A JP2008033017A JP 2008033017 A JP2008033017 A JP 2008033017A JP 2006206485 A JP2006206485 A JP 2006206485A JP 2006206485 A JP2006206485 A JP 2006206485A JP 2008033017 A JP2008033017 A JP 2008033017A
Authority
JP
Japan
Prior art keywords
data
tag
voice
category
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006206485A
Other languages
English (en)
Other versions
JP4722787B2 (ja
Inventor
Shinichiro Goto
紳一郎 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2006206485A priority Critical patent/JP4722787B2/ja
Publication of JP2008033017A publication Critical patent/JP2008033017A/ja
Application granted granted Critical
Publication of JP4722787B2 publication Critical patent/JP4722787B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】予め決められた識別情報をユーザが記憶する必要がなく、容易に外部記憶端末に記憶されているデータの呼出を可能にする。
【解決手段】複数のデータのうち、再生装置によって再生中のデータに付随したタグを取得するタグ取得部10と、ユーザからのボイスタグの登録要求を検出する登録要求検出部13と、登録要求検出部13により登録要求が検出された場合に、タグを構成する複数のカテゴリのうち、ボイスタグを登録するカテゴリを判定するカテゴリ判定部14と、カテゴリ判定部14で判定されたカテゴリの識別情報に対して音声認識部12で認識されたボイスタグを対応付けて登録するボイスタグ登録部15と、ボイスタグ登録部15によって登録したボイスタグと当該ボイスタグが対応付けされたカテゴリの識別情報とを記憶する記憶部18とを具備することを特徴とする。
【選択図】図2

Description

この発明は、データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両に関するものである。
近年、メモリやハードディスク等の記憶媒体に記憶された音楽、動画等のデータを再生する携帯型のプレーヤーが好評を得ている。この携帯型のプレーヤーにおいては、年々、記憶容量を増加させたものが製品化されており、記憶可能なデータ数も増加の一途を辿っている。通常、この種の音楽データや動画データには識別情報を含むタグが付随しており、例えば音楽データの場合、タグにはアーティスト名、アルバム名、曲名、ジャンル等のカテゴリ毎の識別情報が含まれている。そして、このタグの識別情報を携帯型のプレーヤーの液晶ディスプレイ等に表示することで、ユーザが再生中の音楽データを識別することができるようになっている。また、このような携帯型のプレーヤーの中には、記憶媒体に記憶されている複数のデータに付随したタグの識別情報に基づいて特定のデータを検索して呼び出す機能を備えたものもある。この機能によって呼び出されたデータはプレイリストに登録され、ユーザが再生操作をすることで、プレイリスト内に登録されたデータが順次再生されるようになっている。
さらに近年、車載オーディオユニットやナビゲーションユニットなどの再生機能を備えた装置に対して上述した携帯型のプレーヤーを接続し、この携帯型のプレーヤーの記憶媒体に記憶されている音声データを呼び出して再生する車載用のデータ呼出装置が提案されている。このデータ呼出装置では、携帯型のプレーヤーが有している検索・呼出機能を利用するように構成されており、車載オーディオユニットやナビゲーションユニット側の操作系を操作することによって携帯型のプレーヤーのデータ検索や呼出を行うことができるようになっている。
他方、従来より、車載装置においては、楽曲名の一部分を発声することでその楽曲を複数の楽曲データの中から検索する音声検索システムがある(例えば、特許文献1参照)。
特開2005−84422号公報
しかしながら、前者の携帯型のプレーヤーから所望のデータを呼び出すデータ呼出装置では、車載装置の画面上に表示されたタグのカテゴリを順次選択して絞込み操作を行う必要があるため、操作が煩雑であり、例えば、利用者が運転中の場合に容易に携帯型プレーヤーからデータを呼び出すことができない。そのため、後者の音声検索システムを利用すると、利用者の音声に基づいて運転中でもデータを呼び出すことができるが、この音声検索システムでは、楽曲名など予め決められた識別情報を利用者が記憶していることを前提としているため、例えば、利用者が識別情報を忘れてしまい、音声検索システムで間違った識別情報に基づいてデータの呼び出しを行った場合、携帯型のプレーヤーに記憶されている膨大なデータの全てにアクセスしてから初めて識別情報が含まれていないことが判明するので、呼び出したいデータに辿り着くまでに時間がかかる場合があるという課題がある。
そこで、この発明は、予め決められた識別情報をユーザが記憶する必要がなく、容易に外部記憶端末に記憶されているデータの呼び出しを可能にするデータ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両を提供するものである。
上記の課題を解決するために、請求項1に記載した発明は、携帯可能な外部記憶端末(例えば、実施の形態におけるマルチメディアプレーヤー2)が接続可能に構成されるとともに、外部入力されたデータを再生可能な再生装置(例えば、実施の形態におけるナビゲーションユニット4、オーディオヘッドユニット4´)に接続され、音声の認識を行う音声認識手段(例えば、実施の形態における音声認識部12)の認識結果に基づいて前記外部記憶端末に記憶されている複数のデータから特定のデータを呼び出し、当該特定のデータを順次前記再生装置に送信するデータ呼出制御装置であって、前記複数のデータのうち、前記再生装置によって再生中のデータに付随した、データを識別するための情報が記述されたタグを取得するタグ取得手段(例えば、実施の形態におけるタグ取得部10)と、利用者からの音声認識語彙の登録要求を検出する登録要求検出手段(例えば、実施の形態における登録要求検出部13)と、該登録要求検出手段により登録要求が検出された場合に、前記タグを構成する複数のカテゴリのうち、前記音声認識語彙を登録するカテゴリを判定する登録カテゴリ判定手段(例えば、実施の形態におけるカテゴリ判定部14)と、該登録カテゴリ判定手段で判定されたカテゴリの識別情報に対して前記音声認識手段で認識された前記音声認識語彙を対応付けて登録する音声認識語彙登録手段(例えば、実施の形態におけるボイスタグ登録部15)と、該音声認識語彙登録手段によって登録した前記音声認識語彙と当該音声認識語彙が対応付けされたカテゴリの識別情報とを記憶する内部記憶手段(例えば、実施の形態における記憶部18)とを具備することを特徴とする。
このように構成することで、外部記憶端末内に記憶されているデータが再生装置によって再生されているときに、当該データのタグをタグ取得手段によって取得し、登録要求検出手段において利用者からの音声認識語彙の登録要求が検出されると、音声認識語彙を登録するタグのカテゴリを登録カテゴリ判定手段で判定し、音声認識語彙登録手段で当該カテゴリの識別情報に対して利用者からの音声認識語彙を対応付けて登録して、この音声認識語彙を対応する識別情報とともに記憶手段に記憶することができる。
請求項2に記載した発明は、請求項1に記載の発明において、前記登録カテゴリ判定手段が、前記音声認識手段の認識結果に基づいて音声認識語彙の登録を行うカテゴリを判定することを特徴とする。
このように構成することで、利用者が音声認識語彙の登録を行うカテゴリを音声で選択することができる。
請求項3に記載した発明は、請求項1又は2に記載の発明において、前記再生装置で再生可能な音声データを出力する音声出力手段(例えば、実施の形態における音声出力部17)を備え、該音声出力手段が、前記音声認識語彙を登録する対象となるカテゴリの候補名に応じて、予め登録された音声データを前記再生装置に送信することを特徴とする。
このように構成することで、利用者が選択可能なカテゴリ名を音声出力手段で出力して再生装置で再生することができる。
請求項4に記載した発明は、請求項1〜3のいずれかに記載の発明において、前記タグのカテゴリが、当該タグが付された前記データのタイトル、アーティスト名、アルバム名、ジャンル、予め登録したコメントに含まれる語句、リリース年月日、データ作成年月日のうち少なくともいずれかを含み、前記タグの各カテゴリの識別情報がテキスト情報であることを特徴とする。
このように構成することで、データのタイトル、アーティスト名、アルバム名、ジャンル、予め登録したコメントに含まれる語句、リリース年月日、データ作成年月日のうち少なくともいずれかの識別情報に対して音声認識語彙を登録することができる。
請求項5に記載した発明は、前記外部記憶端末に対して検索指示を行う検索指示手段(例えば、実施の形態における検索指示部16)を備え、該検索指示手段は、前記内部記憶手段に記憶されている前記音声認識語彙が前記音声認識手段により認識された場合、当該音声認識語彙に対応付けて記憶された前記タグの前記カテゴリの識別情報に基づいて前記外部記憶端末に記憶されたデータを検索する指示を、前記外部記憶端末に対して送出することを特徴とする。
このように構成することで、外部記憶端末自体の検索機能を用いて特定のデータを呼出すことができる。
請求項6に記載した発明は、携帯可能な外部記憶端末と、外部入力されたデータを再生可能な再生装置と、請求項1〜5のいずれかに記載されたデータ呼出制御装置とを備えたことを特徴とする。
請求項7に記載した発明は、携帯可能な外部記憶端末に着脱可能に接続されるとともに、外部入力されたデータを再生する再生装置に接続され、音声の認識を行う音声認識手段の認識結果に基づき、前記外部記憶端末に記憶された複数のデータから特定のデータを呼び出して、当該特定のデータを順次前記再生装置に送信するデータ呼出制御装置の音声認識語彙登録方法であって、前記再生装置で再生中のデータに付随するタグを前記外部記憶端末から取得するタグ取得処理と、利用者からの音声認識語彙の登録要求を検出する登録要求検出処理と、該登録要求検出手段によって登録要求が検出された場合に、前記タグを構成する複数のカテゴリのうち、前記音声認識語彙を登録するカテゴリを判定する登録カテゴリ判定処理と、該登録カテゴリ判定手段で判定されたカテゴリ内の識別情報に対して前記音声認識語彙を対応付けて登録する音声認識語彙登録処理と、を実行することを特徴とする。
請求項8に記載した発明は、請求項6に記載のデータ呼出システムが搭載されていることを特徴とする。
請求項1に記載した発明によれば、外部記憶端末内に記憶されているデータが再生装置によって再生されているときに、当該データのタグをタグ取得手段によって取得し、登録要求検出手段において利用者からの音声認識語彙の登録要求が検出されると、音声認識語彙を登録するタグのカテゴリを登録カテゴリ判定手段で判定し、音声認識語彙登録手段で当該カテゴリの識別情報に対して利用者からの音声認識語彙を登録して、この音声認識語彙を対応する識別情報とともに記憶手段に記憶することができる。すなわち利用者自らがデータ再生中に登録する音声認識語彙は、予め決められた識別情報と比較して忘れ難いため、データを呼び出す際に該当する識別情報がないなどのエラーによってデータの呼び出しに時間がかかるのを抑制することができ、この結果、外部記憶端末内に記憶された所望のデータを迅速かつ容易に呼び出すことができるという効果がある。
また、外部記憶端末内の複数のデータを呼び出す際に、まず音声認識語彙が記憶手段に記憶されているか否かを検索すればよいため、例えば、該当する音声認識語彙が未登録の場合に、外部記憶端末の全データにアクセスする必要がないため、該当する音声認識語彙が登録されていないことを迅速に判別することができ、したがって、迅速なデータの呼び出しを実現することができる効果がある。
さらに、利用者が登録したデータに対応付けられた音声認識語彙のみが検索対象となるため検索数が絞られ、音声認識語彙の認識率が向上する。
請求項2に記載した発明によれば、請求項1の効果に加え、利用者が音声認識語彙の登録を行うカテゴリを音声で選択することができるため、運転中であっても容易に音声認識語彙の登録を行うことができる。
請求項3に記載した発明によれば、請求項1又は2の効果に加え、利用者が選択可能なカテゴリ名を音声出力手段で出力して再生装置によって再生することができるため、登録対象のカテゴリとして選択可能なカテゴリを利用者に認識させることができるとともに、選択されたカテゴリ名を音声で確認することができる効果がある。
請求項4に記載した発明によれば、請求項1〜3のいずれかの効果に加え、データのタイトル、アーティスト名、アルバム名、ジャンル、予め登録したコメントに含まれる語句、リリース年月日、データ作成年月日のうち少なくともいずれかの識別情報に対して音声認識語彙を登録することができるため、データを呼び出す際の検索の自由度が向上する効果がある。
請求項5に記載した発明によれば、請求項1〜4のいずれかの効果に加え、外部記憶端末が認識可能な形式で検索指示を送出することができるため、外部記憶端末自体の検索機能を用いて特定のデータを呼出すことができる効果がある。
以下、この発明の実施の形態を図面に基づいて説明する。
図1は、この発明の実施の形態におけるデータ呼出システム1の全体構成を示したものである。このデータ呼出システム1は自動車等の車両に搭載されたものであり、携帯型のマルチメディアプレーヤー(外部記憶端末)2と、近距離無線であるBluetooth(登録商標)等のインターフェースを介してマルチメディアプレーヤー2が着脱可能に構成された車載器3と、当該車載器3が接続されたナビゲーションユニット(再生装置)4又はオーディオヘッドユニット(再生装置)4´とで構成されている。
マルチメディアプレーヤー2は、いわゆるポータブルプレーヤーとして利用されるものであり、車載器3に接続されていないときには、通常、ヘッドフォンをアナログ端子に接続して外出先などで音楽や動画を楽しむことができるようになっている。また、このマルチメディアプレーヤー2は、USB(Universal Serial Bus)等のインターフェースを介して図示しないPC(Personal Computer)やサーバ等の端末と双方向通信可能に構成されており、この端末によってマルチメディアプレーヤー2内蔵のHDD(Hard Disk Drive)やRAM(Random Access Memory)等の記憶媒体(図示せず)に対する音楽データおよび動画データの転送、編集などのデータ管理が可能となっている。なお、マルチメディアプレーヤー2と車載器3との接続は、上述したPCとの接続同様、USB等の有線インターフェースを介して接続するようにしてもよい。
上記記憶媒体に記憶される複数の音楽データや動画データには、これら音楽データおよび動画データを識別するためのタグが付随している。ユーザはマルチメディアプレーヤー2のディスプレイ5に表示されるタグの識別情報を確認しながら、音楽データまたは動画データの選択、再生および停止等を操作部6で操作することで、所望の音楽データや動画データを呼び出して再生できるようになっている。ここで、上記タグは、複数のカテゴリ毎、例えば、「タイトル(曲名)」、「アーティスト」、「アルバム」、「ジャンル」、「予め登録したコメントに含まれる語句」、「リリース年月日」、「データ作成年月日」などの識別情報が例えばテキスト情報として付与されており、マルチメディアプレーヤー2では、これら識別情報に基づいて、音楽データや動画データを検索する機能を備えている。
一方、ナビゲーションユニット4は、画面上に写し出された地図上に自車位置を表示したり、音声による経路案内などを行うものであり、音楽データおよび動画データを再生する機能も備えている。例えば、ナビゲーションユニット4で音楽データを再生する場合には、ナビゲーションユニット4の画面7上に再生中の音楽データおよび動画データに含まれるアルバムのジャケット画像や、その他タグに含まれるアーティスト、アルバム名等の識別情報を表示しつつ、音声データを再生して車室内に配置されたスピーカ8を駆動するようになっている。一方、動画データを再生する場合には、画面7上に再生した動画を表示しつつ、動画データに音声データが付随していた場合には、この音声データを再生してスピーカ8を駆動するようになっている。
さらにナビゲーションユニット4は、上述したマルチメディアプレーヤー2が車載器3に接続されているときに、マルチメディアプレーヤー2の操作部6が有する操作を遠隔操作できるように構成されている。つまり、音楽データおよび動画データのうち所望のデータを呼び出す場合や、再生、停止、早送りなどの操作を行う場合に、ナビゲーションユニット4の操作系を操作することで、マルチメディアプレーヤー2の機能を利用することができる。なお、音楽データのみを扱う場合は、図1の破線で示すように、ナビゲーションユニット4に替えて音声データのみ再生可能なオーディオヘッドユニット4´を接続するように構成してもよい。
車載器3は、上述したナビゲーションユニット4とマルチメディアプレーヤー2の間に介在されるものである。図2に示すように、この車載器3は、前述したインターフェースの一部を構成する通信部9を備えており、この通信部9に、マルチメディアプレーヤー2とナビゲーションユニット4とがそれぞれ接続されている。通信部9は車載器3内のタグ取得部10に接続されており、このタグ取得部10においてナビゲーションユニット4で再生されている音楽データおよび動画データに付随するタグが取得可能になっている。このタグ取得部10は、音楽データおよび動画データのタグを取得すると、この取得したタグを一時的に保存する。なお、上述したタグは、必ず音楽データや動画データとともに送受信されるため、タグ取得部10で取得可能なタグは、ナビゲーションユニット4で再生中の音楽データおよび動画データのタグに限られる。
一方、車載器3にはユーザの音声を入力するマイク11が接続されている。このマイク11から入力された音声は音声認識部(音声認識手段)12によって認識され、例えばテキストデータなどの音声認識データに変換される。そして、認識された音声認識データは、この音声認識部12に接続された登録要求検出部13、カテゴリ判定部14、ボイスタグ登録部15、検索指示部16にそれぞれ送信されるようになっている。
登録要求検出部(登録要求検出手段)13は、上記音声認識部12から送信されてくる音声認識データに基づいてユーザによるボイスタグの登録要求を検出するものである。より具体的には、マイク11からボイスタグの入力要求を示す音声として、例えば、「音声登録」という音声が音声認識部12で認識されると、登録要求検出部13にその音声認識データが入力され、ボイスタグの登録要求があったとことが検出される。ここで、ボイスタグとは、音楽データや動画データを呼び出す際に利用される、いわゆる音声認識のための語彙であり、ユーザが任意に設定するものである。なお、登録要求を示す音声は上述した「音声登録」に限られるものではなく、登録要求検出部13において適宜設定すればよい。
カテゴリ判定部(登録カテゴリ判定手段)14は、ユーザがタグのどのカテゴリを選択したかを判定するものである。より具体的には、カテゴリ判定部14では、登録要求検出部13から登録要求がなされた旨の情報が入力されると、このカテゴリ判定部14に接続されている音声出力部(音声出力手段)17に対してカテゴリ選択を促す音声を出力する指令を出力するように構成されている。
ここで、上記音声出力部17は、ナビゲーションユニット4で再生可能な音声データを出力するものであり、この出力された音声データは通信部9を介して、ナビゲーションユニット4に送信されるようになっている。そして、ナビゲーションユニット4では、音声出力部17から音声データが送信されてくると、この音声データを再生するように設定されており、例えば、上述したカテゴリ判定部14からの指令に基づいた音声データが送信されてきた場合には、スピーカ8から「曲名、アーティスト、アルバム・・・どれにしますか?」等のタグのカテゴリを列挙するとともにこれらカテゴリの中から選択するように促す音声が出力される。
さらに、カテゴリ判定部14は、音声出力部17に音声を出力する指令を出力した後に、音声認識部12から音声認識データとしてカテゴリ名である例えば「アーティスト」等の音声認識データが入力されると、この音声認識データに基づいて、タグ取得部10に一時的に保存されたタグのカテゴリを検索するようになっている。そして、このタグのカテゴリに音声認識データと一致するものが含まれている場合、このカテゴリをボイスタグの登録を行うカテゴリと判定し、さらに、判定されたカテゴリの情報をボイスタグ登録部15に向けて送信するようになっている。
ボイスタグ登録部(音声認識語彙登録手段)15は、カテゴリ判定部14で判定されたカテゴリに対応する識別情報にボイスタグを登録するものである。より具体的には、カテゴリ判定部14で判定されたカテゴリに対応する識別情報(例えば、カテゴリ「アーティスト」の識別情報「発明太郎」)をタグ取得部10から読み込むとともに、音声出力部17に対してボイスタグの入力を促す音声を出力する指令を出力するようになっている。ここで、ボイスタグ登録部15から音声出力部17に対して音声を出力する指令が出力されると、音声出力部17は、音声データを出力して、通信部9経由でナビゲーションユニット4に送信するようになっている。ナビゲーションユニット4では出力された音声データが再生されて、スピーカ8から、例えば、「どのような名前にしますか?」等の音声が出力されることとなる。
また、ボイスタグ登録部15は、音声を出力する指令を出力した後に、音声認識部12から音声認識データが送信されてくると、この音声認識データ(例えば、「イッパツヤ」等)をボイスタグであると判定して、このボイスタグをタグ取得部10で取得した上述の識別情報(例えば「発明太郎」)と対応付けて、ボイスタグ登録部15に接続されている記憶部(内部記憶手段)18に送信するようになっている。記憶部18には、データベースが構築されており、当該データベースに対して上述した識別情報に対応付けられたボイスタグが登録されるようになっている。
検索指示部(検索指示手段)16は、ユーザによってボイスタグが入力されると、音楽データおよび動画データの検索、プレイリストの作成および呼び出し等をマルチメディアプレーヤー2に対して指示するものである。より具体的には、検索指示部16は、音声認識部12から送信されてくる音声認識データ(例えば「プレイイッパツヤ」)に基づいて、ユーザによる検索指示の有無を判定し、ユーザからの検索指示(例えば「プレイ」)があったと判定された場合には、前記音声認識データからボイスタグ(例えば「イッパツヤ」)を抽出してこのボイスタグを記憶部18のデータベース上で検索する。そして、このボイスタグがデータベース上に存在する場合には、ボイスタグが登録されているカテゴリの識別情報(例えば「発明太郎」)を抽出し、このカテゴリの中から前記識別情報と同じ識別情報を含むタグを備えた音楽データおよび動画データの検索、プレイリストの作成および呼び出し等を行うように、通信部9を介してマルチメディアプレーヤー2に指示を行う。なお、音声認識データからのボイスタグの抽出方法としては、例えば、音声認識データの頭の部分を検索指示部分とし、この検索指示部分以降をボイスタグであると推定して抽出できるが、種々の抽出方法からユーザの使い勝手を考慮して適宜設定してもよい。
次に、図3のフローチャートに基づいて車載器3におけるボイスタグの登録処理を説明する。
まず、ステップS1では、音楽データ又は動画データが再生中か否かを判定する。すなわち、マルチメディアプレーヤー2から音楽データ又は動画データがナビゲーションユニット4に送信されて再生中か否かを判定する。判定結果が「YES」(再生中)である場合はステップS2に進み、判定結果が「NO」(再生中ではない)である場合はステップS1の処理を繰り返す。ここで、例えば、図5は、マルチメディアプレーヤー2の音楽データ1〜nのうち、音楽データ3が送信される場合を示しており、再生される音楽データ3のみがナビゲーションユニット4に送信されることとなる。
ステップS2では、登録要求検出部13においてユーザよりボイスタグの登録要求が有るか否かを判定する。この判定結果が「YES」(登録要求あり)である場合はステップS3に進み、判定結果が「NO」(登録要求なし)である場合はステップS1に戻り上述した処理を繰り返す。
ステップS3では、音楽データ又は動画データの再生を一時停止してステップS4に進む。このステップS3は、ユーザからの音声認識を行う際に、音声認識がナビゲーションユニット4からの音声出力によって阻害されないように再生を一時停止させる処理である。
次にステップS4では、一時停止中の音楽データ又は動画データに付随するタグをタグ取得部によって取得する。ここで、図6は、再生中の音楽データ又は動画データから取得されるタグの一例を示している。図6に示すようにタグには、例えば「アルバム」、「アーティスト」、「タイトル」等のカテゴリが設けられており、「アルバム」に対して「アイウエオ」、「アーティスト」に対して「発明太郎」、「タイトル」に「カキクケコ」という識別情報がそれぞれ付与されている。
ステップS5では、ユーザの音声に基づいてカテゴリ判定部14にてボイスタグを登録するカテゴリを選択する。具体的には、音声認識部12から、例えば図6に示す「アルバム」、「アーティスト」、「タイトル」等のカテゴリ名と一致する音声認識データが送信されてきた場合にそのカテゴリを選択する。なお、図6では図示都合上、「アルバム」、「アーティスト」、「タイトル」以外の他のカテゴリである「予め登録したコメントに含まれる語句」、「リリース年月日」、「データ作成年月日」等の図示を省略している。
さらにステップS6では、ボイスタグ登録部15において、ステップS5で判定したカテゴリの識別情報に音声認識部12で認識されたボイスタグを対応付けて記憶部のデータベースに登録する。具体的には、ステップS5でカテゴリの「アーティスト」が選択されたと仮定すると、例えば図6に示す「アーティスト」のカテゴリの「発明太郎」という識別情報にボイスタグ「イッパツヤ」を対応付けて図7に示す識別情報とボイスタグとのデータベースDBに登録することとなる。そして、最後にステップS7にて、音楽データ又は動画データの一時停止を解除して再生を再開して、ステップS1にリターンする。
次に、図8に基づいて、ユーザによるボイスタグの登録手順の一例を説明する。
まず、音楽や動画の再生中に、ユーザが「音声登録」と発声すると(ステップS100)、再生が一時停止されてスピーカから音声で「アルバム、アーティスト、タイトル・・・のどれにしますか?」と聞き返してくる(ステップS110)。これに対してユーザが、「アーティスト」とカテゴリ名を発声すると(ステップS120)、今度はスピーカから「どのような名前にしますか?」と聞き返してくる(ステップS130)。これに対してユーザが、「イッパツヤ」と発声すると(ステップS140)、スピーカから「イッパツヤで登録しました」と音声が出力されて(ステップS150)ボイスタグの登録が終了する。ここで、トークバック(聞き返し)をする音声としては、予め車載機3に記憶されたメッセージにユーザが発声した音声を組合せ、登録されたボイスタグの復唱を行う。なお、図8の説明ではカテゴリ名として「アーティスト」をユーザが選択した一例を説明したが、「アルバム」、「タイトル」、「予め登録したコメントに含まれる語句」、「リリース年月日」、「データ作成年月日」等、他のカテゴリ名を選択した場合は、上述した「アーティスト」を「アルバム」、「タイトル」、「予め登録したコメントに含まれる語句」、「リリース年月日」、「データ作成年月日」という音声に置き替えればよい。よって、「アーティスト」の他のカテゴリを選択した場合の説明は重複となるため省略する。
以下、図4のフローチャートに基づいて登録したボイスタグを用いて音楽データおよび動画データをマルチメディアプレーヤー2から呼び出す際の検索指示処理を説明する。
まず、ステップS11では、アクセサリー電源(ACC)がONになっているか否かを判定する。判定結果が「YES」(ACCがON)である場合はステップS12に進み、判定結果が「NO」(ACCがOFF)である場合はステップS11に戻る。
ステップS12では、外部記憶端末であるマルチメディアプレーヤー2が認証済み、つまり車載器3の通信部9に接続されているか否かを判定する。判定結果が「YES」(認証済み)である場合はステップS13に進み、判定結果が「NO」(未認証)である場合はステップS11に戻り上述した処理を繰り返す。
ステップS13では、ユーザによる検索指示およびボイスタグの音声入力が有るか否かを判定する。具体的には、検索指示部16において、音声認識部12から送信されてきた音声認識データにユーザからの検索指示(例えば「プレイ」等)とボイスタグ(例えば「イッパツヤ」等)とが含まれているか否かを判定する。判定結果が「YES」(音声入力あり)である場合はステップS14に進み、判定結果が「NO」(音声入力なし)である場合はステップS13の処理を繰り返す。
ステップS14では入力された音声認識データから検索指示とボイスタグとを認識してステップS15に進む。ステップS15では、ステップS14で認識されたボイスタグがデータベース(例えば、図7のデータベースDB)に登録されているか、すなわち登録済みか否かを判定する。判定結果が「YES」(登録済み)である場合はステップS16に進み、判定結果が「NO」(未登録)である場合はステップS17に進みエラーメッセージの音声データを例えば音声出力部17によって出力して出力したのちステップS13に戻り上述した処理を繰り返す。
一方、ステップS16では、登録済みのボイスタグに対応付けられた識別情報と、この識別情報が登録されたカテゴリに基づいて、マルチメディアプレーヤー2に対して音楽データおよび動画データの検索指示を出力する。なお、マルチメディアプレーヤー2では、車載器3から送信された識別情報とそのカテゴリに基づいて、音楽データおよび動画データのタグを検索し、当該識別情報を含むタグを有した音楽データおよび動画データのプレイリストを作成して、このプレイリスト順に音楽データおよび動画データをナビゲーションユニット4に出力する。
次に、図9に基づいて、ユーザによるボイスタグを用いた呼び出し手順の一例を説明する。
まず、ユーザが、予め設定された検索指示を意味する音声、例えば「プレイ」という音声に、ボイスタグである例えば「イッパツヤ」という音声が付随した「プレイイッパツヤ」という音声を発声する(ステップS200)。すると、スピーカから「イッパツヤを再生しますか?」と聞き返してくる(ステップS210)。そして、ユーザが「ハイ」と答えると(ステップS220)、「アーティスト」の識別情報が「発明太郎」であるタグを備えた音楽データおよび動画データのプレイリストがマルチメディアプレーヤー2で作成される。なお、ユーザがステップS220で「イイエ」と応えた場合には、再度ステップS200に戻る。
そして、マルチメディアプレーヤー2では、作成されたプレイリスト順に音楽データおよび動画データをナビゲーションユニット4に送信するように設定され、ボイスタグによる呼び出しが終了する。なお、図9の説明ではボイスタグとして図7に示すボイスタグである「イッパツヤ」をユーザが選択した場合を一例に説明したが、他のカテゴリ「アルバム」、「タイトル」等に設定されているボイスタグを用いても同様な手順となる。例えば、これら他のカテゴリのボイスタグで検索する場合は図9の「イッパツヤ」の音声を他のボイスタグに置き換えればよく、呼び出し手順は上記手順と同様な手順となる。よって、他のボイスタグを選択した場合の詳細説明は重複となるため省略する。
したがって、上述の実施の形態によれば、マルチメディアプレーヤー2の記憶媒体に記憶されている音楽データ又は動画データがナビゲーションユニット4によって再生されているときに、当該音楽データ又は動画データに付随するタグを、タグ取得部10によって取得し、登録要求検出部13においてユーザからのボイスタグの登録要求が検出されると、ボイスタグを登録するタグのカテゴリをカテゴリ判定部14で判定し、ボイスタグ登録部15で当該カテゴリの識別情報に対してユーザからのボイスタグを対応付けて登録して、このボイスタグを対応する識別情報とともに記憶部18に登録することができる。
すなわちユーザ自らがデータ再生中に登録するボイスタグは、従来の予め決められた識別情報と比較して忘れ難いため、データを呼び出す際に該当する識別情報がないなどのエラーによってデータの呼び出しに時間がかかるのを抑制することができ、この結果、マルチメディアプレーヤー2内に記憶された所望のデータを迅速かつ容易に呼び出すことができる。
さらに、利用者が登録したデータに対応付けられたボイスタグのみが検索対象となるため検索数が絞られ、ボイスタグの認識率が向上する。
また、マルチメディアプレーヤー2内に記憶された複数の音楽データおよび動画データを呼び出す際に、まずボイスタグが記憶部18に登録されているか否かを記憶部18のデータベース内で検索すればよいため、例えば、該当するボイスタグが登録されていなくても、マルチメディアプレーヤー2内の全データにアクセスする必要がないため、該当するボイスタグが登録されていないことを迅速に判別することができ、この結果、音楽データおよび動画データの呼び出しを迅速に行うことができる。
さらに、ボイスタグの登録を行うタグのカテゴリを判定するカテゴリ判定部14において、ユーザの音声に基づいてカテゴリの選択を行うことができるため、ユーザが運転中であっても容易にボイスタグの登録を行うことができる。
そして、ユーザが選択可能なカテゴリ名を音声出力部17から出力された音声データをナビゲーションユニット4によって再生することができるため、登録対象のカテゴリとして選択可能なカテゴリを利用者に認識させることができるとともに、ユーザによって選択されたカテゴリ名をスピーカ8から出力される音声で確認することができる。
また、音楽データおよび動画データの「タイトル」、「アーティスト」、「アルバム」、「ジャンル」、「予め登録したコメントに含まれる語句」、「リリース年月日」、「データ作成年月日」など複数のカテゴリの識別情報に対してボイスタグを登録することができるため、呼び出しの選択自由度が向上する。
さらに、マルチメディアプレーヤー2が認識可能な形式で検索指示を送出することができるため、マルチメディアプレーヤー2自体の検索機能を用いて特定の音楽データおよび動画データを呼出すことができる。
尚、この発明は上述した実施の形態では、識別情報から連想できるボイスタグを用いたが、例えば、「イチ」、「ニ」、「サン」など、識別情報とは無関係のボイスタグを用いてもよい。
また、上記実施の形態ではタグを含んだ音楽データ、つまり、デジタルの音声データをナビゲーションユニット4に送信してナビゲーションユニット4でこの音声データ再生するようにしているが、例えば、マルチメディアプレーヤー2側で再生して、ヘッドフォンなどで用いられるアナログ信号をナビゲーションユニット4に入力し、単にナビゲーションユニット4でアナログ信号を増幅したものをスピーカから出力するように構成してもよい。この場合は、マルチメディアプレーヤー2で再生されている音楽データ又は動画データをマルチメディアプレーヤー2から車載器3に送信してボイスタグを登録するように設定すればよい。
本発明の実施の形態におけるデータ呼出システムの全体構成図である。 本発明の実施の形態における車載器3の機能構成図である。 本発明の実施の形態におけるボイスタグの登録処理のフローチャートである。 本発明の実施の形態におけるボイスタグによるデータ呼出処理のフローチャートである。 本発明の実施の形態における音楽データとタグの説明図である。 本発明の実施の形態におけるタグのカテゴリと識別情報との説明図である。 本発明の実施の形態における記憶部18のデータベースDBの説明図である。 本発明の実施の形態におけるボイスタグの登録手順を示す説明図である。 本発明の実施の形態におけるボイスタグによる呼び出し手順を示す説明図である。
符号の説明
2 マルチメディアプレーヤー(外部記憶端末)
4 ナビゲーションユニット(再生装置)
4´ オーディオヘッドユニット(再生装置)
12 音声認識部(音声認識手段)
13 登録要求検出部(登録要求検出手段)
14 カテゴリ判定部(登録カテゴリ判定手段)
15 ボイスタグ登録部(音声認識語彙登録手段)
16 検索指示部(検索指示手段)
17 音声出力部(音声出力手段)
18 記憶部(内部記憶手段)

Claims (8)

  1. 携帯可能な外部記憶端末が接続可能に構成されるとともに、
    外部入力されたデータを再生可能な再生装置に接続され、
    音声の認識を行う音声認識手段の認識結果に基づいて前記外部記憶端末に記憶されている複数のデータから特定のデータを呼び出し、当該特定のデータを順次前記再生装置に送信するデータ呼出制御装置であって、
    前記複数のデータのうち、前記再生装置によって再生中のデータに付随した、データを識別するための情報が記述されたタグを取得するタグ取得手段と、
    利用者からの音声認識語彙の登録要求を検出する登録要求検出手段と、
    該登録要求検出手段により登録要求が検出された場合に、前記タグを構成する複数のカテゴリのうち、前記音声認識語彙を登録するカテゴリを判定する登録カテゴリ判定手段と、
    該登録カテゴリ判定手段で判定されたカテゴリの識別情報に対して前記音声認識手段で認識された前記音声認識語彙を対応付けて登録する音声認識語彙登録手段と、
    該音声認識語彙登録手段によって登録した前記音声認識語彙と当該音声認識語彙が対応付けされたカテゴリの識別情報とを記憶する内部記憶手段と
    を具備することを特徴とするデータ呼出制御装置。
  2. 前記登録カテゴリ判定手段は、前記音声認識手段の認識結果に基づいて音声認識語彙の登録を行うカテゴリを判定することを特徴とする請求項1に記載のデータ呼出制御装置。
  3. 前記再生装置で再生可能な音声データを出力する音声出力手段を備え、
    該音声出力手段は、前記音声認識語彙を登録する対象となるカテゴリの候補名に応じて、予め登録された音声データを前記再生装置に送信することを特徴とする請求項1又は2に記載のデータ呼出制御装置。
  4. 前記タグのカテゴリは、当該タグが付された前記データのタイトル、アーティスト名、アルバム名、ジャンル、予め登録したコメントに含まれる語句、リリース年月日、データ作成年月日のうち少なくともいずれかを含み、前記タグの各カテゴリの識別情報はテキスト情報であることを特徴とする請求項1〜3のいずれかに記載のデータ呼出制御装置。
  5. 前記外部記憶端末に対して検索指示を行う検索指示手段を備え、
    該検索指示手段は、前記内部記憶手段に記憶されている前記音声認識語彙が前記音声認識手段により認識された場合、当該音声認識語彙に対応付けて記憶された前記タグの前記カテゴリの識別情報に基づいて前記外部記憶端末に記憶されたデータを検索する指示を、前記外部記憶端末が認識可能な形式で送出することを特徴とする請求項1〜4のいずれかに記載のデータ呼出制御装置。
  6. 携帯可能な外部記憶端末と、
    外部入力されたデータを再生可能な再生装置と、
    請求項1〜5のいずれかに記載されたデータ呼出制御装置とを備えたことを特徴とするデータ呼出システム。
  7. 携帯可能な外部記憶端末に着脱可能に接続されるとともに、
    外部入力されたデータを再生する再生装置に接続され、
    音声の認識を行う音声認識手段の認識結果に基づき、前記外部記憶端末に記憶された複数のデータから特定のデータを呼び出して、当該特定のデータを順次前記再生装置に送信するデータ呼出制御装置の音声認識語彙登録方法であって、
    前記再生装置で再生中のデータに付随するタグを前記外部記憶端末から取得するタグ取得処理と、
    利用者からの音声認識語彙の登録要求を検出する登録要求検出処理と、
    該登録要求検出手段によって登録要求が検出された場合に、前記タグを構成する複数のカテゴリのうち、前記音声認識語彙を登録するカテゴリを判定する登録カテゴリ判定処理と、
    該登録カテゴリ判定手段で判定されたカテゴリの識別情報に対して前記音声認識語彙を対応付けて登録する音声認識語彙登録処理と、
    を実行することを特徴とするデータ呼出制御装置の音声語彙登録方法。
  8. 請求項6に記載のデータ呼出システムが搭載されていることを特徴とする車両。
JP2006206485A 2006-07-28 2006-07-28 データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両 Expired - Fee Related JP4722787B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006206485A JP4722787B2 (ja) 2006-07-28 2006-07-28 データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006206485A JP4722787B2 (ja) 2006-07-28 2006-07-28 データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両

Publications (2)

Publication Number Publication Date
JP2008033017A true JP2008033017A (ja) 2008-02-14
JP4722787B2 JP4722787B2 (ja) 2011-07-13

Family

ID=39122514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006206485A Expired - Fee Related JP4722787B2 (ja) 2006-07-28 2006-07-28 データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両

Country Status (1)

Country Link
JP (1) JP4722787B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012067140A1 (ja) * 2010-11-19 2012-05-24 三菱重工業株式会社 運転支援サービス提供機器、処理装置、及び制御方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102172149B1 (ko) * 2013-12-03 2020-11-02 주식회사 케이티 컨텐츠 재생 방법, 대사 구간 데이터 제공 방법 및 동영상 컨텐츠 재생 단말

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04247380A (ja) * 1991-02-01 1992-09-03 Alpine Electron Inc 記録媒体演奏装置
JPH05159541A (ja) * 1991-12-03 1993-06-25 Mitsubishi Electric Corp 音楽自動再生装置
JPH05249996A (ja) * 1992-03-06 1993-09-28 Nippondenso Co Ltd 音声認識装置
JPH1124685A (ja) * 1997-07-02 1999-01-29 Ricoh Co Ltd カラオケ装置
JPH1195788A (ja) * 1997-09-16 1999-04-09 Ricoh Co Ltd 音楽再生装置
JPH11296182A (ja) * 1998-04-08 1999-10-29 Matsushita Electric Ind Co Ltd カラオケ装置
JP2001013984A (ja) * 1999-06-30 2001-01-19 Pioneer Electronic Corp 音声操作装置
JP2001297527A (ja) * 2000-04-11 2001-10-26 Mazda Motor Corp 音響機器、音楽データ再生方法及び自動車用音響システム及びそのプログラム記憶媒体
JP2003091540A (ja) * 2001-09-17 2003-03-28 Clarion Co Ltd 音響情報機器
JP2003140664A (ja) * 2001-11-07 2003-05-16 Fujitsu Ten Ltd 音声再生装置、情報提供装置及び音声再生プログラム、情報提供プログラム
JP2004309795A (ja) * 2003-04-07 2004-11-04 Mitsubishi Electric Corp 音楽提供システム
JP2005043654A (ja) * 2003-07-22 2005-02-17 Denso Corp 楽曲情報配信システム
JP2005085433A (ja) * 2003-09-11 2005-03-31 Xanavi Informatics Corp 音声認識による再生装置および再生方法
JP2005266198A (ja) * 2004-03-18 2005-09-29 Pioneer Electronic Corp 音響情報再生装置および音楽データのキーワード作成方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04247380A (ja) * 1991-02-01 1992-09-03 Alpine Electron Inc 記録媒体演奏装置
JPH05159541A (ja) * 1991-12-03 1993-06-25 Mitsubishi Electric Corp 音楽自動再生装置
JPH05249996A (ja) * 1992-03-06 1993-09-28 Nippondenso Co Ltd 音声認識装置
JPH1124685A (ja) * 1997-07-02 1999-01-29 Ricoh Co Ltd カラオケ装置
JPH1195788A (ja) * 1997-09-16 1999-04-09 Ricoh Co Ltd 音楽再生装置
JPH11296182A (ja) * 1998-04-08 1999-10-29 Matsushita Electric Ind Co Ltd カラオケ装置
JP2001013984A (ja) * 1999-06-30 2001-01-19 Pioneer Electronic Corp 音声操作装置
JP2001297527A (ja) * 2000-04-11 2001-10-26 Mazda Motor Corp 音響機器、音楽データ再生方法及び自動車用音響システム及びそのプログラム記憶媒体
JP2003091540A (ja) * 2001-09-17 2003-03-28 Clarion Co Ltd 音響情報機器
JP2003140664A (ja) * 2001-11-07 2003-05-16 Fujitsu Ten Ltd 音声再生装置、情報提供装置及び音声再生プログラム、情報提供プログラム
JP2004309795A (ja) * 2003-04-07 2004-11-04 Mitsubishi Electric Corp 音楽提供システム
JP2005043654A (ja) * 2003-07-22 2005-02-17 Denso Corp 楽曲情報配信システム
JP2005085433A (ja) * 2003-09-11 2005-03-31 Xanavi Informatics Corp 音声認識による再生装置および再生方法
JP2005266198A (ja) * 2004-03-18 2005-09-29 Pioneer Electronic Corp 音響情報再生装置および音楽データのキーワード作成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012067140A1 (ja) * 2010-11-19 2012-05-24 三菱重工業株式会社 運転支援サービス提供機器、処理装置、及び制御方法
JP2012113342A (ja) * 2010-11-19 2012-06-14 Mitsubishi Heavy Ind Ltd 運転支援サービス提供機器、処理装置、及び制御方法

Also Published As

Publication number Publication date
JP4722787B2 (ja) 2011-07-13

Similar Documents

Publication Publication Date Title
US20220277743A1 (en) Voice recognition system for use with a personal media streaming appliance
US10991374B2 (en) Request-response procedure based voice control method, voice control device and computer readable storage medium
EP3567588A1 (en) Voice recognition system for use with a personal media streaming appliance
JP2016151608A (ja) 電子装置、情報端末システム、音声認識機能の起動プログラムおよび音声認識機能の起動方法
JP6128146B2 (ja) 音声検索装置、音声検索方法及びプログラム
JP3892410B2 (ja) 音楽データ選曲装置、音楽データ選曲方法、並びに、音楽データの選曲プログラムおよびそれを記録した情報記録媒体
JP2008077819A (ja) 音楽情報表示方法及びインターフェース装置
JP2008021337A (ja) 車載用音響システム
JP2008039573A (ja) 思い出情報提示システム
JP4722787B2 (ja) データ呼出制御装置、データ呼出システム、データ呼出制御装置の音声認識語彙登録方法および車両
JP6443205B2 (ja) コンテンツ再生システム、コンテンツ再生装置、コンテンツ関連情報配信装置、コンテンツ再生方法、及びコンテンツ再生プログラム
JP2008027345A (ja) オーディオ装置
JP2005135518A (ja) 音楽再生装置
JP7100466B2 (ja) コンテンツ再生装置、コンテンツ再生方法
KR101576683B1 (ko) 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법
JPH11242496A (ja) 情報再生装置
JP5295699B2 (ja) 車載用オーディオ装置
JP2007263994A (ja) カラオケ再生装置
JP2008052843A (ja) カーオーディオにおける歌詞表示システム
JP2008158048A (ja) カラオケシステム及びデジタル再生装置
JP2009092977A (ja) 車載装置および楽曲検索システム
JP6908169B2 (ja) 端末装置
JP5242856B1 (ja) 音楽再生プログラム及び音楽再生システム
JP2000268545A (ja) 音声再生装置
JP2012128240A (ja) 音声認識システム及び辞書生成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110406

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140415

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees