JP2006317722A - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP2006317722A JP2006317722A JP2005140582A JP2005140582A JP2006317722A JP 2006317722 A JP2006317722 A JP 2006317722A JP 2005140582 A JP2005140582 A JP 2005140582A JP 2005140582 A JP2005140582 A JP 2005140582A JP 2006317722 A JP2006317722 A JP 2006317722A
- Authority
- JP
- Japan
- Prior art keywords
- command
- voice
- data
- unit
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】シナリオデータから抽出されたコマンド候補語彙、および、そのコマンドが起動された状況を履歴情報として保存しておき、その履歴情報をもとに、現在の状況に適合したコマンドの集合を動的に決定する。
【選択図】図1
Description
複数の音声対話型アプリケーションを記録する記録部と、これらの音声対話型アプリケーションを起動するコマンドを記録する記録部と、音声入力部と、入力される音声に基づいて上記音声対話型アプリケーションを起動するコマンド起動部と、センサーから取得される情報と上記起動されるコマンドの履歴を管理する履歴管理部と、上記管理される履歴に基づいて上記記録されるコマンドの認識優先順位を決定するメインコマンド設定部とを有する音声処理装置。特にメインコマンド決定部は音声対話型アプリケーションを構成する対話スクリプトから単語を抽出し、該単語を該音声対話型アプリケーションと対応づけて上記コマンド記録部に記録する。
図1は、本発明の音声対話型端末装置の一実施例を示す構成図である。この実施例では、本発明を、コマンドの表示データと認識語彙を自動推定する音声対話型端末装置として実施した装置について説明する。この実施例1では、コマンドを起動するために、画面にメニュー表示される表示データ400、および、音声入力する際に発声する内容である認識語彙410を、コマンド実行の際の音声対話スクリプトデータをもとに自動推定する機能を有する音声対話型端末装置を提供する。これにより、新しいシナリオデータが、例えば、ネットワークからダウンロードされた場合であっても、表示データ400や認識語彙410が固定のままではなく、利用者が記憶しやすく利用しやすい音声対話型端末装置を提供することが可能となる。
次に、メインコマンドDB190は、各時点で実行可能な機能に対応するコマンド(メインコマンド)のリストを格納する記憶装置である。
センサ群230は、現在がどのような状況であるかに関する状況情報を取得するセンサの集まりである。これらのセンサとしては、例えば、現在時刻を取得する時計や、現在位置を取得するGPS(Global Positioning System)装置などが考えられる。
以上のように構成された実施形態1の音声対話型端末装置について、以下にその動作を説明する。
実施形態1の機能が動作を開始すると、まず、初期設定処理300によりシステム全体の初期化が行われる。次にメインコマンド表示部160により、メインコマンド表示処理310が実行される。この処理は、メインコマンドDB190に格納されているメインコマンド情報をもとに、入力可能なコマンド(メインコマンド)のすべて、もしくは一部を音声対話型端末装置の表示装置に表示するものである。例えば、メインコマンドDB190にメインコマンド情報として、図4のようなものが格納されている場合、メインコマンド表示部160は、そのうち表示データが設定されている項目について、その上位のいくつかを、音声対話型情報端末装置の表示画面に図4のようにメニューとして表示する。このメニューは文字であってもよいし、また、図4のデータに付随するアイコンデータを持たせて、アイコンとして表示してもよい。
このメインコマンド設定部200内で実行されるメインコマンド設定処理370の動作を、フローチャート図7を用いて説明する。フローチャート図7の処理はすべて、メインコマンド設定部200が実行する処理である。
まず、履歴データ取得処理430が、履歴情報DB220から履歴情報全体を取得する。
ここで、認識語彙データが登録されていないメインコマンドデータが存在しない場合は、認識語彙変換処理を行う必要がないため、認識語彙変換処理600を終了する。
こうして、メインコマンド設定部200において、認識語彙変換処理600が終了すると、次に、表示データ変換処理590が実行される。この表示データ変換処理590は、対話スクリプトデータから、音声認識用の認識語彙データを抽出するか、画面表示用の文字列表示データを抽出するかの違いであり、実質、図12に示す認識語彙変換処理600と同様の処理で実現可能である。この表示データ変換処理590で抽出された特徴単語データは、メインコマンド情報(図4、図11)の表示データ400として登録されるとともに、コマンド機能を起動するためのメニューとして表示される。
以下、構成図図2にしたがい、実施例2の構成について、実施例1の構成図図1と異なる部分のみを説明する。
コマンド音声登録部520が起動されると、まず、音声未登録コマンド検索処理530が実行される。この処理では、メインコマンドDB190に格納されているメインコマンド情報(図4、図11)の中から、対応するコマンド音声データがコマンド音声DB510にまだ登録されていないものを検索する。この処理は、コマンド音声DB510に格納されているデータ(図16)と、メインコマンドDB190に格納されているデータ(図4、図11)を比較するだけでよい。
ここで、コマンド音声データが登録されていないメインコマンドデータが存在しない場合は、コマンド音声登録を行う必要がないため、コマンド音声登録部を終了する。
次に、入力された音声データを実際にコマンド音声として登録するかどうかを利用者に確認する確認プロンプト提示処理560が実行される。この提示処理も、図17と同様に表示装置に文字またはグラフィックで表示してもよいし、確認入力を促す音声を流してもよい。
115…対話スクリプトDB
120…音声認識部
130…認識語彙DB
140…認識語彙変換部
150…メインコマンド入力部
155…表示データ変換部
160…メインコマンド表示部
170…コマンド起動部
180…コマンド機能群
190…メインコマンドDB
200…メインコマンド設定部
210…履歴管理部
220…履歴情報DB
230…センサ群
300…初期設定処理
310…メインコマンド表示処理
320…コマンド入力処理
330…コマンド起動処理
340…状況情報取得処理
350…履歴データ作成処理
360…履歴データ登録処理
370…メインコマンド設定処理
380…メインコマンド登録処理
400…表示データ
410…認識語彙
420…起動アプリ
430…履歴データ取得処理
440…状況データ比較・スコア化処理
450…スコア加算処理
460…スコアでの並び替え処理
470…表示データ決定処理
480…認識語彙決定処理
500…音声マッチ部
510…コマンド音声DB
520…コマンド音声登録部
530…音声未登録コマンド検索処理
540…音声登録プロンプト提示処理
550…音声入力処理
560…確認プロンプト提示処理
570…確認入力処理
580…コマンド音声登録処理
590…表示データ変換処理
600…認識語彙変換処理
610…認識語彙未登録コマンド検索処理
620…対話スクリプト取得処理
630…特徴単語抽出処理
640…認識語彙登録処理。
Claims (4)
- 複数の音声対話型アプリケーションを記録する記録部と、
複数の上記音声対話型アプリケーションを起動するコマンドを記録する記録部と、
音声入力部と、
上記音声入力部を介して入力される音声に基づいて上記音声対話型アプリケーションを起動するコマンド起動部と、
センサーから取得される情報と上記起動されるコマンドの履歴を管理する履歴管理部と、
上記管理される履歴に基づいて上記記録されるコマンドの認識優先順位を決定するメインコマンド設定部とを有し
上記メインコマンド決定部は音声対話型アプリケーションを構成する対話スクリプトから単語を抽出し、該単語を該音声対話型アプリケーションと対応づけて上記コマンド記録部に記録することを特徴とする音声処理装置。 - 上記単語は該音声対話型アプリケーションの頻出単語であることを特徴とする請求項1記載の音声処理装置。
- 上記決定された優先順位とともに上記コマンドを表示手段に表示させることを特徴とする請求項1又は2に記載の音声処理装置。
- 上記抽出された単語を表示部に表示させ、
上記音声入力部を介して入力された音声も上記単語と対応づけて上記コマンド記録部に記録することを特徴とする請求項1乃至3の何れかに記載の音声処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005140582A JP4684739B2 (ja) | 2005-05-13 | 2005-05-13 | 音声処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005140582A JP4684739B2 (ja) | 2005-05-13 | 2005-05-13 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006317722A true JP2006317722A (ja) | 2006-11-24 |
JP4684739B2 JP4684739B2 (ja) | 2011-05-18 |
Family
ID=37538450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005140582A Expired - Fee Related JP4684739B2 (ja) | 2005-05-13 | 2005-05-13 | 音声処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4684739B2 (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010078851A (ja) * | 2008-09-25 | 2010-04-08 | Nissan Motor Co Ltd | 音声入力装置及び音声入力方法 |
JP2012093508A (ja) * | 2010-10-26 | 2012-05-17 | Nec Corp | 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム |
JP2015206909A (ja) * | 2014-04-21 | 2015-11-19 | 株式会社デンソー | 音声認識装置 |
JPWO2016002406A1 (ja) * | 2014-07-04 | 2017-04-27 | クラリオン株式会社 | 車載対話型システム、及び車載情報機器 |
KR20180084591A (ko) * | 2017-01-16 | 2018-07-25 | 주식회사 케이티 | 음성 명령에 기반하여 서비스를 제공하는 서버 및 단말 |
JP2018173522A (ja) * | 2017-03-31 | 2018-11-08 | 大日本印刷株式会社 | 音声認識装置、音声認識方法、及びプログラム |
US10311877B2 (en) | 2016-07-04 | 2019-06-04 | Kt Corporation | Performing tasks and returning audio and visual answers based on voice command |
US10650816B2 (en) | 2017-01-16 | 2020-05-12 | Kt Corporation | Performing tasks and returning audio and visual feedbacks based on voice command |
US10726836B2 (en) | 2016-08-12 | 2020-07-28 | Kt Corporation | Providing audio and video feedback with character based on voice command |
WO2020165933A1 (ja) * | 2019-02-12 | 2020-08-20 | 三菱電機株式会社 | 機器制御装置、機器制御システム、機器制御方法、及び機器制御プログラム |
JP2020530581A (ja) * | 2017-10-03 | 2020-10-22 | グーグル エルエルシー | 自動アシスタントのためのコマンドバンドル提案の提供 |
US11398231B2 (en) | 2018-05-07 | 2022-07-26 | Google Llc | Recommending automated assistant action for inclusion in automated assistant routine |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0823369A (ja) * | 1994-07-08 | 1996-01-23 | Nakayo Telecommun Inc | 音声操作電話装置およびその音声による操作指示受付方法 |
JP2005004501A (ja) * | 2003-06-12 | 2005-01-06 | Will Being:Kk | 電子計算機による対話方法及び対話システム |
JP2005030982A (ja) * | 2003-07-09 | 2005-02-03 | Matsushita Electric Ind Co Ltd | 音声入力方法及び、車載装置 |
WO2005022511A1 (de) * | 2003-08-22 | 2005-03-10 | Daimlerchrysler Ag | Unterstützungsverfahren für sprachdialoge zur bedienung von kraftfahrzeugfunktionen |
-
2005
- 2005-05-13 JP JP2005140582A patent/JP4684739B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0823369A (ja) * | 1994-07-08 | 1996-01-23 | Nakayo Telecommun Inc | 音声操作電話装置およびその音声による操作指示受付方法 |
JP2005004501A (ja) * | 2003-06-12 | 2005-01-06 | Will Being:Kk | 電子計算機による対話方法及び対話システム |
JP2005030982A (ja) * | 2003-07-09 | 2005-02-03 | Matsushita Electric Ind Co Ltd | 音声入力方法及び、車載装置 |
WO2005022511A1 (de) * | 2003-08-22 | 2005-03-10 | Daimlerchrysler Ag | Unterstützungsverfahren für sprachdialoge zur bedienung von kraftfahrzeugfunktionen |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010078851A (ja) * | 2008-09-25 | 2010-04-08 | Nissan Motor Co Ltd | 音声入力装置及び音声入力方法 |
JP2012093508A (ja) * | 2010-10-26 | 2012-05-17 | Nec Corp | 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム |
JP2015206909A (ja) * | 2014-04-21 | 2015-11-19 | 株式会社デンソー | 音声認識装置 |
JPWO2016002406A1 (ja) * | 2014-07-04 | 2017-04-27 | クラリオン株式会社 | 車載対話型システム、及び車載情報機器 |
US10311877B2 (en) | 2016-07-04 | 2019-06-04 | Kt Corporation | Performing tasks and returning audio and visual answers based on voice command |
US10726836B2 (en) | 2016-08-12 | 2020-07-28 | Kt Corporation | Providing audio and video feedback with character based on voice command |
US10650816B2 (en) | 2017-01-16 | 2020-05-12 | Kt Corporation | Performing tasks and returning audio and visual feedbacks based on voice command |
KR101889280B1 (ko) * | 2017-01-16 | 2018-08-21 | 주식회사 케이티 | 음성 명령에 기반하여 서비스를 제공하는 서버 및 단말 |
KR20180084591A (ko) * | 2017-01-16 | 2018-07-25 | 주식회사 케이티 | 음성 명령에 기반하여 서비스를 제공하는 서버 및 단말 |
JP2018173522A (ja) * | 2017-03-31 | 2018-11-08 | 大日本印刷株式会社 | 音声認識装置、音声認識方法、及びプログラム |
JP2020530581A (ja) * | 2017-10-03 | 2020-10-22 | グーグル エルエルシー | 自動アシスタントのためのコマンドバンドル提案の提供 |
US11232155B2 (en) | 2017-10-03 | 2022-01-25 | Google Llc | Providing command bundle suggestions for an automated assistant |
US20220148595A1 (en) | 2017-10-03 | 2022-05-12 | Google Llc | Providing command bundle suggestions for an automated assistant |
US11720635B2 (en) | 2017-10-03 | 2023-08-08 | Google Llc | Providing command bundle suggestions for an automated assistant |
US11398231B2 (en) | 2018-05-07 | 2022-07-26 | Google Llc | Recommending automated assistant action for inclusion in automated assistant routine |
US11749278B2 (en) | 2018-05-07 | 2023-09-05 | Google Llc | Recommending automated assistant action for inclusion in automated assistant routine |
WO2020165933A1 (ja) * | 2019-02-12 | 2020-08-20 | 三菱電機株式会社 | 機器制御装置、機器制御システム、機器制御方法、及び機器制御プログラム |
JPWO2020165933A1 (ja) * | 2019-02-12 | 2021-03-25 | 三菱電機株式会社 | 機器制御装置、機器制御システム、機器制御方法、及び機器制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4684739B2 (ja) | 2011-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4684739B2 (ja) | 音声処理装置 | |
JP5158174B2 (ja) | 音声認識装置 | |
US8279171B2 (en) | Voice input device | |
US8818816B2 (en) | Voice recognition device | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
US8340958B2 (en) | Text and speech recognition system using navigation information | |
US7826945B2 (en) | Automobile speech-recognition interface | |
EP2005689B1 (en) | Meta data enhancements for speech recognition | |
US20170148436A1 (en) | Speech processing system and terminal | |
US20080177541A1 (en) | Voice recognition device, voice recognition method, and voice recognition program | |
US20120173574A1 (en) | Information Retrieving Apparatus, Information Retrieving Method and Navigation System | |
US9715877B2 (en) | Systems and methods for a navigation system utilizing dictation and partial match search | |
JP2014106927A (ja) | 情報処理システム | |
EP2863385B1 (en) | Function execution instruction system, function execution instruction method, and function execution instruction program | |
JP5434731B2 (ja) | 音声認識システム及び自動検索システム | |
JP2010231433A (ja) | 検索装置 | |
JP2010039099A (ja) | 音声認識および車載装置 | |
US20170301349A1 (en) | Speech recognition system | |
JPH07319383A (ja) | 地図表示装置 | |
JP4268325B2 (ja) | 音声操作語句の提示装置及び提示方法 | |
US10832675B2 (en) | Speech recognition system with interactive spelling function | |
JP4645708B2 (ja) | コード認識装置および経路探索装置 | |
JP2007193184A (ja) | 音声住所認識装置 | |
JP2003150192A (ja) | 音声認識装置 | |
JP2003022092A (ja) | 対話システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080512 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20080512 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101209 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110209 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140218 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4684739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |