JP2010060720A - 音声認識装置、端末機器、音声認識装置用プログラム及び端末機器用プログラム - Google Patents
音声認識装置、端末機器、音声認識装置用プログラム及び端末機器用プログラム Download PDFInfo
- Publication number
- JP2010060720A JP2010060720A JP2008224974A JP2008224974A JP2010060720A JP 2010060720 A JP2010060720 A JP 2010060720A JP 2008224974 A JP2008224974 A JP 2008224974A JP 2008224974 A JP2008224974 A JP 2008224974A JP 2010060720 A JP2010060720 A JP 2010060720A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- dictionary
- terminal device
- stored
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】S100で、外部オーディオ機器2に音声認識辞書が記憶されていれば(S100:YES)、S110に進み、S110でナビゲーション装置1が有する音声認識エンジン情報と外部オーディオ機器2に記憶されている音声認識エンジン情報とが同一であれば(S110:YES)、S120に進む。S120で、外部オーディオ機器2に記憶されている楽曲などに対応して、全ての音声認識辞書が記憶されている場合(S120:全て有り)、S130に進み、外部オーディオ機器2に記憶されている全ての音声認識辞書を受信し、ナビゲーション装置1のメモリ17に記憶して、処理を終了する。
【選択図】図5
Description
本発明は、かかる問題を解決するためになされたものであり、端末機器と音声認識装置とがデータ通信可能な状態になった後、短時間で端末機器を音声認識により操作可能な状態とすることを目的とする。
請求項5記載の発明は、請求項4記載の端末装置において、特定情報取得手段を更に備える。特定情報取得手段は、音声認識装置が有する音声認識エンジンの種類を特定可能な特定情報を音声認識装置から取得する。そして、辞書送信手段は、特定情報取得手段により取得された特定情報に基づいて内部又は外部で作成された音声認識辞書を音声認識装置に送信する。
請求項6記載の発明は、請求項5記載の端末機器において、ツール取得手段と辞書作成手段とを備える。ツール取得手段は、特定情報取得手段により取得された特定情報をもとに音声認識辞書を作成するためのツールを外部から取得し、辞書作成手段は、ツール取得手段により取得されたツールを用いて内部に記憶されたコンテンツデータを特定可能な音声認識辞書を作成する。
かかる請求項7記載の端末装置によれば、請求項3記載の発明と同様の効果を得ることができる。
請求項9記載の発明は、内部の記憶装置にコンテンツデータが記憶された端末機器としてコンピュータを機能させる端末機器用プログラムであり、ユーザの発話音声を入力し、内部の記憶装置に記憶された音声認識辞書を参照することによりその入力した発話音声の音声認識を行うとともに、当該端末機器とデータ通信可能な状態において当該端末機器をユーザの発話音声により操作可能とする音声認識装置とデータ通信可能になったことを条件として、コンテンツデータを発話音声で特定可能とする音声認識辞書をその音声認識装置に送信する辞書送信手段としてコンピュータを機能させる。
[1 構成]
図1は、本発明の実施形態としての音声認識システムの全体構成を示すブロック図である。図示するように、この音声認識システムは、車両に搭載されるナビゲーション装置1、ユーザが携帯可能な外部オーディオ機器2、ユーザが外部オーディオ機器2にデータをダウンロードするために用いるパーソナルコンピュータ(以下「PC」という。)3、楽曲やツールなど各種データが記憶されているサーバ4を備える。
外部オーディオ機器2は、予め記憶された楽曲や動画などのコンテンツデータをタイトル、アーティスト、アルバム、ジャンルといった項目からユーザの操作により選択して特定し、再生することが可能となっている。
サーバ4は、PC3と通信することにより各種データの送受信を行なうためのサーバ装置である。
操作スイッチ群12は、表示装置18と一体に構成され表示画面上に設置されるタッチパネル及び表示装置18の周囲に設けられたメカニカルなキースイッチ等が用いられる。なお、タッチパネルと表示装置18とは積層一体化されており、タッチパネルには、感圧方式、電磁誘導方式、静電容量方式、あるいはこれらを組み合わせた方式など各種の方式があるが、その何れを用いてもよい。
マイク15は、運転者などユーザの発話音声を入力するための機器である。
メモリ17は、ナビゲーション装置1で利用する各種データを記憶するための記憶装置であり、音声認識エンジン(音認エンジン)に関する情報が予め記憶されている。また、メモリ17は、例えば、楽曲を検索するための音声認識辞書(音認辞書)を外部オーディオ機器2から受信して記憶することができる。
図3は、外部オーディオ機器2の内部構成を示すブロック図である。外部オーディオ機器2は、操作スイッチ群21、外部機器接続I/F22、制御回路23、メモリ24、表示装置25を備える。
外部機器接続I/F22は、外部オーディオ機器2をナビゲーション装置1やPC3と通信可能に接続するためのUSB(Universal・Serial・Bus)インターフェースである。
図4は、PC3の内部構成を示すブロック図である。PC3は、操作スイッチ群31、外部機器接続I/F32、ネットワーク接続I/F33、制御回路34、メモリ35、表示装置36を備える。
[2 処理]
以下、本実施形態のナビゲーション装置1、外部オーディオ機器2、PC3、サーバ4が実行する処理につき、順に説明する。
S170では、外部オーディオ機器2に記憶されている楽曲の情報を取得して、ナビゲーション装置1の制御回路16が楽曲に対応する音声認識辞書を作成して、処理を終了する。
S210で、メモリ24が楽曲などに対応する全ての音声認識辞書を記憶している場合(S210:全て有り)、S220に進み、S220でメモリ24が記憶している音声認識辞書を全てナビゲーション装置1に送信して、処理を終了する。
S230では、メモリ24に記憶されている音声認識辞書をナビゲーション装置1に送信し、S240に進む。
S260では、外部オーディオ機器2のメモリ24に記憶されている楽曲などの情報をナビゲーション装置1に送信して、処理を終了する。
一方、S320では、メモリ24に記憶されている音声認識エンジン情報に対応したツールがメモリ24に記憶されているか否かを判断する。具体的には、メモリ24に記憶されているツールのバージョンデータを参照するなどの方法で、メモリ24に記憶されている音声認識エンジン情報との対応を確認する。ツールが記憶されていない場合は、対応するツールが記憶されていないと判断される。対応したツールが記憶されている場合(S320:YES)、S330に進み、対応したツールが記憶されていない場合(S320:NO)、S340に進む。
S420では、サーバ4より音声認識エンジン情報から、最新のバージョンのツールをダウンロードして、S430に進む。
S470では、サーバ4から全ての音声認識エンジンについてのツールをダウンロードし、S480に進む。
図9は、サーバ4の制御回路(図示せず)が、PC3との通信を行なう際に実行する処理を示すフローチャートである。サーバ4の制御回路は、PC3からのアクセスがあって処理を開始する。
S510で、PC3からナビゲーション装置1の音声認識エンジン情報を取得できたか否かを判断する。音声認識エンジン情報を取得できれば(S510:YES)、S520に進み、音声認識エンジン情報を取得できなければ(S510:NO)、S540に進む。
S540では、サーバ4から全ての音声認識エンジンに対応できる全てのツールをPC3に配信し、処理を終了する。
以上説明したとおり本実施形態の音声認識システムによれば、音声認識辞書をナビゲーション装置1内部で作成するのではなく外部オーディオ機器2内部で作成してから取得するので、外部オーディオ機器2が発話音声により操作可能となるまでの時間を短縮することができる。
また、ナビゲーション装置1が記憶している音声認識エンジン情報が外部オーディオ機器2に送られ、音声認識エンジンに適合したツールを用いて音声認識辞書を作成するので、この操作がなされた場合は不要な音声認識辞書が作成されることなく、効率のよい準備が可能となる。
なお、本実施形態のナビゲーション装置1につき、S130及びS140を実行する制御回路16が辞書取得手段に相当し、S160を実行する制御回路16が辞書送信手段に相当する。
以上、本発明の一実施形態について説明したが、本発明は、種々の形態を採り得ることは言うまでもない。
Claims (9)
- ユーザの発話音声を入力し、内部の記憶装置に記憶された音声認識辞書を参照することによりその入力した発話音声の音声認識を行う音声認識装置であって、
コンテンツデータが記憶され、当該音声認識装置とデータ通信可能な状態においてユーザの発話音声により操作可能となる端末機器とデータ通信可能になったことを条件として、前記コンテンツデータを発話音声で特定可能とする音声認識辞書をその端末装置から取得する辞書取得手段を備えたこと
を特徴とする音声認識装置。 - 当該音声認識装置が有する音声認識エンジンの種類を特定可能な特定情報を前記端末機器に送信する特定情報送信手段を備えたこと
を特徴とする請求項1記載の音声認識装置。 - 前記辞書取得手段は、楽曲及び動画の少なくとも一方を内容とするコンテンツデータを発話音声で特定可能とする音声認識辞書を取得することを特徴とする請求項1又は2記載の音声認識装置。
- 内部の記憶装置にコンテンツデータが記憶された端末機器であって、
ユーザの発話音声を入力し、内部の記憶装置に記憶された音声認識辞書を参照することによりその入力した発話音声の音声認識を行うとともに、当該端末機器とデータ通信可能な状態において当該端末機器をユーザの発話音声により操作可能とする音声認識装置とデータ通信可能になったことを条件として、前記コンテンツデータを発話音声で特定可能とする音声認識辞書をその音声認識装置に送信する辞書送信手段を備えたこと
を特徴とする端末機器。 - 前記音声認識装置が有する音声認識エンジンの種類を特定可能な特定情報を前記音声認識装置から取得する特定情報取得手段を備え、
前記辞書送信手段は、前記特定情報取得手段により取得された特定情報に基づいて内部又は外部で作成された音声認識辞書を前記音声認識装置に送信すること
を特徴とする請求項4記載の端末機器。 - 前記特定情報取得手段により取得された特定情報をもとに音声認識辞書を作成するためのツールを外部から取得するツール取得手段と、
前記ツール取得手段により取得されたツールを用いて前記コンテンツデータを特定可能な音声認識辞書を作成する辞書作成手段と
を備えたことを特徴とする請求項5記載の端末機器。 - 当該端末機器は、その内部の記憶装置に楽曲及び動画の少なくとも一方を内容とするコンテンツデータとして記憶していることを特徴とする請求項4乃至6のいずれか記載の端末機器。
- ユーザの発話音声を入力し、内部の記憶装置に記憶された音声認識辞書を参照することによりその入力した発話音声の音声認識を行う音声認識装置としてコンピュータを機能させる音声認識装置用プログラムであって、
コンテンツデータが記憶され、当該音声認識装置とデータ通信可能な状態においてユーザの発話音声により操作可能となる端末機器とデータ通信可能になったことを条件として、前記コンテンツデータを発話音声で特定可能とする音声認識辞書をその端末装置から取得する辞書取得手段としてコンピュータを機能させることを特徴とする音声認識装置用プログラム。 - 内部の記憶装置にコンテンツデータが記憶された端末機器としてコンピュータを機能させる端末機器用プログラムであって、
ユーザの発話音声を入力し、内部の記憶装置に記憶された音声認識辞書を参照することによりその入力した発話音声の音声認識を行うとともに、当該端末機器とデータ通信可能な状態において当該端末機器をユーザの発話音声により操作可能とする音声認識装置とデータ通信可能になったことを条件として、前記コンテンツデータを発話音声で特定可能とする音声認識辞書をその音声認識装置に送信する辞書送信手段としてコンピュータを機能させることを特徴とする端末機器用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008224974A JP5120158B2 (ja) | 2008-09-02 | 2008-09-02 | 音声認識装置、端末機器、音声認識装置用プログラム及び端末機器用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008224974A JP5120158B2 (ja) | 2008-09-02 | 2008-09-02 | 音声認識装置、端末機器、音声認識装置用プログラム及び端末機器用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010060720A true JP2010060720A (ja) | 2010-03-18 |
JP5120158B2 JP5120158B2 (ja) | 2013-01-16 |
Family
ID=42187608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008224974A Expired - Fee Related JP5120158B2 (ja) | 2008-09-02 | 2008-09-02 | 音声認識装置、端末機器、音声認識装置用プログラム及び端末機器用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5120158B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11317063A (ja) * | 1998-04-30 | 1999-11-16 | Clarion Co Ltd | カーオーディオシステム及びその制御方法並びにカーオーディオシステム制御用プログラムを記録した記録媒体 |
WO2002001550A1 (fr) * | 2000-06-26 | 2002-01-03 | Mitsubishi Denki Kabushiki Kaisha | Procede et systeme de commande d'un dispositif |
JP2006276460A (ja) * | 2005-03-29 | 2006-10-12 | Nec Corp | 音声認識用辞書配信システム、音声認識用辞書配信方法及び音声認識用辞書配信プログラム |
JP2008139438A (ja) * | 2006-11-30 | 2008-06-19 | Fujitsu Ltd | 音声処理装置、端末装置、音声情報管理装置、および、プログラム |
-
2008
- 2008-09-02 JP JP2008224974A patent/JP5120158B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11317063A (ja) * | 1998-04-30 | 1999-11-16 | Clarion Co Ltd | カーオーディオシステム及びその制御方法並びにカーオーディオシステム制御用プログラムを記録した記録媒体 |
WO2002001550A1 (fr) * | 2000-06-26 | 2002-01-03 | Mitsubishi Denki Kabushiki Kaisha | Procede et systeme de commande d'un dispositif |
JP2006276460A (ja) * | 2005-03-29 | 2006-10-12 | Nec Corp | 音声認識用辞書配信システム、音声認識用辞書配信方法及び音声認識用辞書配信プログラム |
JP2008139438A (ja) * | 2006-11-30 | 2008-06-19 | Fujitsu Ltd | 音声処理装置、端末装置、音声情報管理装置、および、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5120158B2 (ja) | 2013-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11900936B2 (en) | Electronic devices with voice command and contextual data processing capabilities | |
US9587958B2 (en) | Mobile device gateway systems and methods | |
JP6501217B2 (ja) | 情報端末システム | |
JP5821639B2 (ja) | 音声認識装置 | |
US20070233725A1 (en) | Text to grammar enhancements for media files | |
RU2425329C2 (ru) | Навигационное устройство и способ для приема и воспроизведения звуковых образцов | |
CN102024013A (zh) | 启动包括第一功能和第二功能的多个功能的系统和方法 | |
CN104205038A (zh) | 信息处理设备,信息处理方法,信息处理程序和终端设备 | |
JP2009300537A (ja) | 音声作動システム、音声作動方法および車載装置 | |
EP2750026B1 (en) | Audio device | |
CN107341158A (zh) | 多媒体文件的信息获取方法、装置和设备 | |
JP2009276081A (ja) | ナビゲーション装置及び情報提供方法 | |
CN110767219B (zh) | 语义更新方法、装置、服务器和存储介质 | |
Tashev et al. | Commute UX: Voice enabled in-car infotainment system | |
JP5986468B2 (ja) | 表示制御装置、表示システム及び表示制御方法 | |
JP5120158B2 (ja) | 音声認識装置、端末機器、音声認識装置用プログラム及び端末機器用プログラム | |
JP5626794B2 (ja) | 車載機器システム及び該車載機器システムを構成する車載機器及び携帯端末 | |
JP6710460B2 (ja) | 電子装置および楽曲再生システム | |
JP2011095498A (ja) | 車載情報処理装置及び車載情報処理方法 | |
JP2021156992A (ja) | 起動語登録の支援方法、支援装置、音声認識装置、およびプログラム | |
JP2006284677A (ja) | 音声案内装置、音声案内装置の制御方法及び制御プログラム | |
JP6733751B2 (ja) | 車載装置、車載装置の制御方法および制御プログラム | |
US20110093545A1 (en) | Voice-activated acquisition of non-local content | |
JP2006338323A (ja) | オーディオ装置、電子メール送信方法及びプログラム | |
JP2008152417A (ja) | 情報取得装置及び情報取得プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120925 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121008 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151102 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151102 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |