JP4684739B2 - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP4684739B2 JP4684739B2 JP2005140582A JP2005140582A JP4684739B2 JP 4684739 B2 JP4684739 B2 JP 4684739B2 JP 2005140582 A JP2005140582 A JP 2005140582A JP 2005140582 A JP2005140582 A JP 2005140582A JP 4684739 B2 JP4684739 B2 JP 4684739B2
- Authority
- JP
- Japan
- Prior art keywords
- command
- voice
- data
- unit
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
ダウンロードされた対話スクリプトデータを記録する対話スクリプト記録部と、音声対話型アプリケーションを記録するアプリケーション記録部と、音声対話型アプリケーションを起動するための認識語彙と音声対話型アプリケーションとを対応付けるコマンド情報を記録するコマンド記録部と、対話スクリプト記録部に記録された対話スクリプトデータから出現頻度に応じて特定される特徴的な単語を抽出し、該単語を認識語彙として登録し、該認識語彙と該対話スクリプトデータに対応する音声対話型アプリケーションとを対応付けるコマンド情報をコマンド記録部に記録するコマンド登録部と、音声入力部と、音声入力部を介して入力される音声に基づいて認識語彙を音声認識する音声認識部と、コマンド記録部に記録されたコマンド情報に基づいて、音声認識部により音声認識された認識語彙に対応する音声対話型アプリケーションを起動するコマンド起動部とを有する音声処理装置。
図1は、本発明の音声対話型端末装置の一実施例を示す構成図である。この実施例では、本発明を、コマンドの表示データと認識語彙を自動推定する音声対話型端末装置として実施した装置について説明する。この実施例1では、コマンドを起動するために、画面にメニュー表示される表示データ400、および、音声入力する際に発声する内容である認識語彙410を、コマンド実行の際の音声対話スクリプトデータをもとに自動推定する機能を有する音声対話型端末装置を提供する。これにより、新しいシナリオデータが、例えば、ネットワークからダウンロードされた場合であっても、表示データ400や認識語彙410が固定のままではなく、利用者が記憶しやすく利用しやすい音声対話型端末装置を提供することが可能となる。
次に、メインコマンドDB190は、各時点で実行可能な機能に対応するコマンド(メインコマンド)のリストを格納する記憶装置である。
センサ群230は、現在がどのような状況であるかに関する状況情報を取得するセンサの集まりである。これらのセンサとしては、例えば、現在時刻を取得する時計や、現在位置を取得するGPS(Global Positioning System)装置などが考えられる。
以上のように構成された実施形態1の音声対話型端末装置について、以下にその動作を説明する。
実施形態1の機能が動作を開始すると、まず、初期設定処理300によりシステム全体の初期化が行われる。次にメインコマンド表示部160により、メインコマンド表示処理310が実行される。この処理は、メインコマンドDB190に格納されているメインコマンド情報をもとに、入力可能なコマンド(メインコマンド)のすべて、もしくは一部を音声対話型端末装置の表示装置に表示するものである。例えば、メインコマンドDB190にメインコマンド情報として、図4のようなものが格納されている場合、メインコマンド表示部160は、そのうち表示データが設定されている項目について、その上位のいくつかを、音声対話型情報端末装置の表示画面に図5のようにメニューとして表示する。このメニューは文字であってもよいし、また、図4のデータに付随するアイコンデータを持たせて、アイコンとして表示してもよい。
このメインコマンド設定部200内で実行されるメインコマンド設定処理370の動作を、フローチャート図7を用いて説明する。フローチャート図7の処理はすべて、メインコマンド設定部200が実行する処理である。
まず、履歴データ取得処理430が、履歴情報DB220から履歴情報全体を取得する。
ここで、認識語彙データが登録されていないメインコマンドデータが存在しない場合は、認識語彙変換処理を行う必要がないため、認識語彙変換処理600を終了する。
こうして、メインコマンド設定部200において、認識語彙変換処理600が終了すると、次に、表示データ変換処理590が実行される。この表示データ変換処理590は、対話スクリプトデータから、音声認識用の認識語彙データを抽出するか、画面表示用の文字列表示データを抽出するかの違いであり、実質、図12に示す認識語彙変換処理600と同様の処理で実現可能である。この表示データ変換処理590で抽出された特徴単語データは、メインコマンド情報(図4、図11)の表示データ400として登録されるとともに、コマンド機能を起動するためのメニューとして表示される。
以下、構成図図2にしたがい、実施例2の構成について、実施例1の構成図図1と異なる部分のみを説明する。
コマンド音声登録部520が起動されると、まず、音声未登録コマンド検索処理530が実行される。この処理では、メインコマンドDB190に格納されているメインコマンド情報(図4、図11)の中から、対応するコマンド音声データがコマンド音声DB510にまだ登録されていないものを検索する。この処理は、コマンド音声DB510に格納されているデータ(図16)と、メインコマンドDB190に格納されているデータ(図4、図11)を比較するだけでよい。
ここで、コマンド音声データが登録されていないメインコマンドデータが存在しない場合は、コマンド音声登録を行う必要がないため、コマンド音声登録部を終了する。
次に、入力された音声データを実際にコマンド音声として登録するかどうかを利用者に確認する確認プロンプト提示処理560が実行される。この提示処理も、図17と同様に表示装置に文字またはグラフィックで表示してもよいし、確認入力を促す音声を流してもよい。
115…対話スクリプトDB
120…音声認識部
130…認識語彙DB
140…認識語彙変換部
150…メインコマンド入力部
155…表示データ変換部
160…メインコマンド表示部
170…コマンド起動部
180…コマンド機能群
190…メインコマンドDB
200…メインコマンド設定部
210…履歴管理部
220…履歴情報DB
230…センサ群
300…初期設定処理
310…メインコマンド表示処理
320…コマンド入力処理
330…コマンド起動処理
340…状況情報取得処理
350…履歴データ作成処理
360…履歴データ登録処理
370…メインコマンド設定処理
380…メインコマンド登録処理
400…表示データ
410…認識語彙
420…起動アプリ
430…履歴データ取得処理
440…状況データ比較・スコア化処理
450…スコア加算処理
460…スコアでの並び替え処理
470…表示データ決定処理
480…認識語彙決定処理
500…音声マッチ部
510…コマンド音声DB
520…コマンド音声登録部
530…音声未登録コマンド検索処理
540…音声登録プロンプト提示処理
550…音声入力処理
560…確認プロンプト提示処理
570…確認入力処理
580…コマンド音声登録処理
590…表示データ変換処理
600…認識語彙変換処理
610…認識語彙未登録コマンド検索処理
620…対話スクリプト取得処理
630…特徴単語抽出処理
640…認識語彙登録処理。
Claims (4)
- ダウンロードされた対話スクリプトデータを記録する対話スクリプト記録部と、
音声対話型アプリケーションを記録するアプリケーション記録部と、
前記音声対話型アプリケーションを起動するための認識語彙と前記音声対話型アプリケーションとを対応付けるコマンド情報を記録するコマンド記録部と、
前記対話スクリプト記録部に記録された対話スクリプトデータからその出現頻度に応じて特定される特徴的な単語を抽出し、該単語を認識語彙として登録し、該認識語彙と該対話スクリプトデータに対応する音声対話型アプリケーションとを対応付けるコマンド情報を前記コマンド記録部に記録するコマンド登録部と、
音声入力部と、
前記音声入力部を介して入力される音声に基づいて前記認識語彙を音声認識する音声認識部と、
前記コマンド記録部に記録されたコマンド情報に基づいて、前記音声認識部により音声認識された認識語彙に対応する音声対話型アプリケーションを起動するコマンド起動部とを有することを特徴とする音声処理装置。 - 請求項1に記載の音声処理装置において、
前記コマンド記録部には、互いに異なる認識語彙と音声対話型アプリケーションとをそれぞれ対応付ける複数のコマンド情報が記録されており、
前記音声対話型アプリケーションが起動された時刻および場所のいずれか少なくとも1つと該音声対話型アプリケーションに対応するコマンド情報とを対応付ける履歴情報を記録する履歴情報記録部と、
現在の時刻および場所のいずれか少なくとも1つと前記履歴情報とに基づいて、前記コマンド記録部に記録された各コマンド情報の優先順位を決定するコマンド設定部とをさらに有し、
前記音声認識部は、前記コマンド設定部により決定された各コマンド情報の優先順位に応じた順序で前記認識語彙を音声認識することを特徴とする音声処理装置。 - 請求項2に記載の音声処理装置において、
前記複数のコマンド情報には、さらに互いに異なる表示データがそれぞれ対応付けられており、
前記コマンド設定部により決定された各コマンド情報の優先順位に応じた順序で各表示データを表示手段に表示することを特徴とする音声処理装置。 - 請求項3に記載の音声処理装置において、
前記対話スクリプト記録部に記録された対話スクリプトデータからその出現頻度に応じて特定される特徴的な単語を抽出し、該単語を表示データとして登録し、前記コマンド情報において該表示データを前記認識語彙および前記音声対話型アプリケーションとさらに対応づけて記録する表示データ登録部をさらに有することを特徴とする音声処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005140582A JP4684739B2 (ja) | 2005-05-13 | 2005-05-13 | 音声処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005140582A JP4684739B2 (ja) | 2005-05-13 | 2005-05-13 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006317722A JP2006317722A (ja) | 2006-11-24 |
JP4684739B2 true JP4684739B2 (ja) | 2011-05-18 |
Family
ID=37538450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005140582A Expired - Fee Related JP4684739B2 (ja) | 2005-05-13 | 2005-05-13 | 音声処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4684739B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010078851A (ja) * | 2008-09-25 | 2010-04-08 | Nissan Motor Co Ltd | 音声入力装置及び音声入力方法 |
JP5370335B2 (ja) * | 2010-10-26 | 2013-12-18 | 日本電気株式会社 | 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム |
JP2015206909A (ja) * | 2014-04-21 | 2015-11-19 | 株式会社デンソー | 音声認識装置 |
EP3166023A4 (en) * | 2014-07-04 | 2018-01-24 | Clarion Co., Ltd. | In-vehicle interactive system and in-vehicle information appliance |
KR101777392B1 (ko) | 2016-07-04 | 2017-09-11 | 주식회사 케이티 | 중앙 서버 및 이에 의한 사용자 음성 처리 방법 |
US10726836B2 (en) | 2016-08-12 | 2020-07-28 | Kt Corporation | Providing audio and video feedback with character based on voice command |
KR101889280B1 (ko) * | 2017-01-16 | 2018-08-21 | 주식회사 케이티 | 음성 명령에 기반하여 서비스를 제공하는 서버 및 단말 |
KR101889279B1 (ko) | 2017-01-16 | 2018-08-21 | 주식회사 케이티 | 음성 명령에 기반하여 서비스를 제공하는 시스템 및 방법 |
JP6866731B2 (ja) * | 2017-03-31 | 2021-04-28 | 大日本印刷株式会社 | 音声認識装置、音声認識方法、及びプログラム |
US10546023B2 (en) | 2017-10-03 | 2020-01-28 | Google Llc | Providing command bundle suggestions for an automated assistant |
US11398231B2 (en) | 2018-05-07 | 2022-07-26 | Google Llc | Recommending automated assistant action for inclusion in automated assistant routine |
WO2020165933A1 (ja) * | 2019-02-12 | 2020-08-20 | 三菱電機株式会社 | 機器制御装置、機器制御システム、機器制御方法、及び機器制御プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005004501A (ja) * | 2003-06-12 | 2005-01-06 | Will Being:Kk | 電子計算機による対話方法及び対話システム |
JP2005030982A (ja) * | 2003-07-09 | 2005-02-03 | Matsushita Electric Ind Co Ltd | 音声入力方法及び、車載装置 |
WO2005022511A1 (de) * | 2003-08-22 | 2005-03-10 | Daimlerchrysler Ag | Unterstützungsverfahren für sprachdialoge zur bedienung von kraftfahrzeugfunktionen |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0823369A (ja) * | 1994-07-08 | 1996-01-23 | Nakayo Telecommun Inc | 音声操作電話装置およびその音声による操作指示受付方法 |
-
2005
- 2005-05-13 JP JP2005140582A patent/JP4684739B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005004501A (ja) * | 2003-06-12 | 2005-01-06 | Will Being:Kk | 電子計算機による対話方法及び対話システム |
JP2005030982A (ja) * | 2003-07-09 | 2005-02-03 | Matsushita Electric Ind Co Ltd | 音声入力方法及び、車載装置 |
WO2005022511A1 (de) * | 2003-08-22 | 2005-03-10 | Daimlerchrysler Ag | Unterstützungsverfahren für sprachdialoge zur bedienung von kraftfahrzeugfunktionen |
Also Published As
Publication number | Publication date |
---|---|
JP2006317722A (ja) | 2006-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4684739B2 (ja) | 音声処理装置 | |
JP5158174B2 (ja) | 音声認識装置 | |
US8818816B2 (en) | Voice recognition device | |
US9824687B2 (en) | System and terminal for presenting recommended utterance candidates | |
KR101881985B1 (ko) | 컨텍스트에 기초한 음성 인식 문법 선택 | |
US8279171B2 (en) | Voice input device | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
US8340958B2 (en) | Text and speech recognition system using navigation information | |
US20080262848A1 (en) | Applications Server and Method | |
US20080177541A1 (en) | Voice recognition device, voice recognition method, and voice recognition program | |
US20120272177A1 (en) | System and method of fixing mistakes by going back in an electronic device | |
US20120173574A1 (en) | Information Retrieving Apparatus, Information Retrieving Method and Navigation System | |
JP2014106927A (ja) | 情報処理システム | |
EP2863385B1 (en) | Function execution instruction system, function execution instruction method, and function execution instruction program | |
CN105222797B (zh) | 利用口授和部分匹配搜索的导航系统的系统和方法 | |
EP2309492A1 (en) | System and method for activating plurality of functions based on speech input | |
JP2006195576A (ja) | 車載音声認識装置 | |
US20130275134A1 (en) | Information equipment | |
CN1892818A (zh) | 从语音识别系统的词汇表中确定假设列表的方法 | |
JP5434731B2 (ja) | 音声認識システム及び自動検索システム | |
JP5364412B2 (ja) | 検索装置 | |
US7295923B2 (en) | Navigation device and address input method thereof | |
JP2010039099A (ja) | 音声認識および車載装置 | |
JPH07319383A (ja) | 地図表示装置 | |
US10832675B2 (en) | Speech recognition system with interactive spelling function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080512 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20080512 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101209 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110209 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140218 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4684739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |