JP4483428B2 - 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 - Google Patents
音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 Download PDFInfo
- Publication number
- JP4483428B2 JP4483428B2 JP2004188408A JP2004188408A JP4483428B2 JP 4483428 B2 JP4483428 B2 JP 4483428B2 JP 2004188408 A JP2004188408 A JP 2004188408A JP 2004188408 A JP2004188408 A JP 2004188408A JP 4483428 B2 JP4483428 B2 JP 4483428B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- data
- processing
- speech
- control command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
実施の形態1.
図1は、本発明の第1の実施の形態における音声認識/合成システム100の構成例を示すブロック図である。
図2は、本例の音声認識/合成システム100による音声認識処理の例を示すタイムチャートである。
次に、本発明の第2の実施の形態について図面を参照して説明する。
図3は、本発明の第2の実施の形態における音声認識/合成システム300の構成例を示すブロック図である。
図4は、本例の音声認識/合成システム300による音声認識処理の例を示すタイムチャートである。
次に、本発明の第3の実施の形態について図面を参照して説明する。
図5は、本発明の第3の実施の形態における音声認識/合成システム500の構成例を示すブロック図である。
の代わりに、上述した第2の実施の形態における複数の音声認識手段302a〜302nの集合302を用いることもできる。
図6は、本例の音声認識/合成システム500による音声認識処理の例を示すタイムチャートである。
次に、本発明の第4の実施の形態について図面を参照して説明する。
図7は、本発明の第4の実施の形態における音声認識/合成システム700の構成例を示すブロック図である。
図8は、本例の音声認識/合成システム700による音声合成処理の例を示すタイムチャートである。
次に、本発明の第5の実施の形態について図面を参照して説明する。
図9は、本発明の第5の実施の形態における音声認識/合成システム900の構成例を示すブロック図である。
以下に説明する実施例は、上述した第5の実施の形態に対応するものである。
101,301,501 音声入力手段
102,302,302a,302b,302n 音声認識手段
103,303,504,703 制御手段
104,304,505,704 伝送手段
101a 音声入力制御手段
101b 音声入力処理手段
101c,701c パケット分割手段
101d,701d 識別子付与手段
101e,102d,502d,701e,702d パケット保持手段
101f,701f パケット送信手段
102a,502a 音声認識制御手段
102b,502b 音声認識処理手段
102c,502c,702c,904b 識別子判別手段
102e,502e,702e パケット受信手段
103a,303a ユーザインタフェース手段
103b,303b 対話管理手段
303c,502f 結果統合手段
502 第1の音声認識手段
503 第2の音声認識手段
701 音声生成手段
702 音声出力手段
701a 音声生成制御手段
701b 音声生成処理手段
702a 音声出力制御手段
702b 音声出力処理手段
1001 音声対話管理サーバ
1002 入出力端末装置
1003 音声入出力サーバ
1004 音声認識サーバ
1005 音声合成サーバ
Claims (23)
- 入力した音声データを解析する音声認識処理または/および音声データを生成する音声合成処理を行う音声認識/合成システムであって、
音声データが複数の区間に分割された各音声分割データのうち処理対象の音声分割データを特定するための識別情報として前記音声分割データの順序を識別する情報を設定した制御指令を発行する制御指令手段と、
前記制御指令手段からの前記制御指令に従って、当該制御指令に識別情報として設定された前記順序を識別する情報によって特定される音声分割データ以降の音声データに対して音声認識処理または/および音声合成処理を行う音声処理手段とを備えた
ことを特徴とする音声認識/合成システム。 - 入力した音声データが複数の区間に分割された各音声分割データに、システム内で一意に識別される識別情報として順序を識別する情報をそれぞれ付加する識別情報付加手段を備えた
請求項1記載の音声認識/合成システム。 - 音声データの入力処理を行う音声入力処理手段と、
前記音声入力処理手段によって入力された音声データを複数の区間に分割した音声分割データを生成する音声データ分割手段と、を備えた
請求項1または請求項2記載の音声認識/合成システム。 - 制御指令手段は、音声認識処理または/および音声合成処理の実行時刻を設定した制御指令を発行し、
音声処理手段は、前記制御指令手段からの前記制御指令に従って、当該制御指令に設定されている実行時刻となったときに、当該制御指令に設定されている識別情報によって特定される音声分割データに対して音声認識処理または/および音声合成処理を行う
請求項1から請求項3のうちいずれかに記載の音声認識/合成システム。 - 複数の音声処理手段を備えるとともに、
前記複数の音声処理手段それぞれの音声認識処理または/および音声合成処理の処理結果を統合する処理結果統合手段を備えた
請求項1から請求項4のうちいずれかに記載の音声認識/合成システム。 - 制御指令手段は、複数の音声処理手段のうちの一の音声処理手段に対して制御指令を発行し、
前記一の音声処理手段は、前記制御指令手段からの制御指令の一部または全部を他の音声処理手段に転送する制御指令転送手段を有する
請求項5記載の音声認識/合成システム。 - 一の音声処理手段は、制御指令手段からの制御指令によって指示された処理対象の音声データの一区間または全区間を他の音声処理手段に転送する音声データ転送手段を有する
請求項6記載の音声認識/合成システム。 - 識別情報付加手段は、識別情報として、タイムスタンプ、シリアル番号、音声認識処理または/および音声合成処理による音声対話の処理シーケンス番号、またはこれらの組み合わせを、各音声分割データそれぞれに付加する
請求項1から請求項7のうちいずれかに記載の音声認識/合成システム。 - 識別情報の時間順序性を管理する機能を提供する識別情報管理手段を備えた
請求項1から請求項8のうちいずれかに記載の音声認識/合成システム。 - 識別情報管理手段は、システムを構成する各構成要素でそれぞれ用いられる絶対時刻を同期させ、かつ、識別情報に特定の絶対時刻を対応させることで、各識別情報の時間順序性を管理する
請求項9記載の音声認識/合成システム。 - 入力した音声データを解析する音声認識処理または/および音声データを生成する音声合成処理を行う音声認識/合成システムにおける同期制御方法であって、
音声データが複数の区間に分割された各音声分割データのうち処理対象の音声分割データを特定するための識別情報として前記音声分割データの順序を識別する情報を設定した制御指令を発行し、
前記制御指令に従って、当該制御指令に識別情報として設定された前記順序を識別する情報によって特定される音声分割データ以降の音声データに対して音声認識処理または/および音声合成処理を行う
ことを特徴とする同期制御方法。 - 入力した音声データが複数の区間に分割された各音声分割データに、システム内で一意に識別される識別情報として順序を識別する情報をそれぞれ付加する
請求項11記載の同期制御方法。 - 音声データの入力処理を行い、
前記入力処理によって入力された音声データを複数の区間に分割した音声分割データを生成する
請求項11または請求項12記載の同期制御方法。 - 音声認識処理または/および音声合成処理の実行時刻を設定した制御指令を発行し、
前記制御指令に従って、当該制御指令に設定されている実行時刻となったときに、当該制御指令に設定されている識別情報によって特定される音声分割データに対して音声認識処理または/および音声合成処理を行う
請求項11から請求項13のうちいずれかに記載の同期制御方法。 - 制御指令に従って異なる処理手段で行われた複数の音声認識処理または/および音声合成処理の処理結果を統合する
請求項11から請求項14のうちいずれかに記載の同期制御方法。 - 制御指令に従って音声認識処理または/および音声合成処理を行ったあと、前記制御指令の一部または全部を他の処理手段に転送し、
前記転送された制御指令に従って前記他の処理手段にて音声認識処理または/および音声合成処理を行う
請求項15記載の同期制御方法。 - 制御指令手段からの制御指令によって指示された処理対象の音声データの一区間または全区間を他の処理手段に転送する
請求項16記載の同期制御方法。 - 各音声分割データそれぞれに付加する識別情報として、タイムスタンプ、シリアル番号、音声認識処理または/および音声合成処理による音声対話の処理シーケンス番号、またはこれらの組み合わせのいずれかを用いる
請求項11から請求項17のうちいずれかに記載の同期制御方法。 - 入力した音声データを解析する音声認識処理または/および音声データを生成する音声合成処理を行う音声認識/合成システムに同期制御を実行させる同期制御プログラムであって、
前記音声認識/合成システムを構成するコンピュータに、
音声データが複数の区間に分割された各音声分割データのうち処理対象の音声分割データを特定するための識別情報として前記音声分割データの順序を識別する情報を設定した制御指令を発行するステップと、
前記制御指令に従って、当該制御指令に識別情報として設定された前記順序を識別する情報によって特定される音声分割データ以降の音声データに対して音声認識処理または/および音声合成処理を行うステップとを
実行させるための同期制御プログラム。 - コンピュータに、
さらに、入力した音声データが複数の区間に分割された各音声分割データに、システム内で一意に識別される識別情報として順序を識別する情報をそれぞれ付加するステップを
実行させる請求項19記載の同期制御プログラム。 - コンピュータに、
さらに、音声データの入力処理を行うステップと、
前記入力処理によって入力された音声データを複数の区間に分割した音声分割データを生成するステップとを
実行させる請求項19または請求項20記載の同期制御プログラム。 - 各音声分割データそれぞれに付加する識別情報として、タイムスタンプ、シリアル番号、音声認識処理または/および音声合成処理による音声対話の処理シーケンス番号、またはこれらの組み合わせのいずれかを用いる
請求項19から請求項21のうちいずれかに記載の同期制御プログラム。 - 音声データの入力処理を行う音声入力処理手段と、
前記音声入力処理手段によって入力された音声データを複数の区間に分割した音声分割データを生成する音声データ分割手段と、
前記音声データ分割手段によって分割された各音声分割データに、システム内で一意に識別される識別情報として前記音声分割データの順序を識別する情報をそれぞれ付加する識別情報付加手段と、
前記音声入力処理手段によって入力された音声データのうち、前記順序を識別する情報によって特定される音声分割データ以降の音声データを解析する音声認識処理または/および音声データを生成する音声合成処理を行う音声処理手段に対して、処理対象の音声分割データを特定するための識別情報として前記順序を識別する情報を設定した制御指令を発行する制御指令手段と、を備えた
ことを特徴とする同期制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004188408A JP4483428B2 (ja) | 2004-06-25 | 2004-06-25 | 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004188408A JP4483428B2 (ja) | 2004-06-25 | 2004-06-25 | 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006011066A JP2006011066A (ja) | 2006-01-12 |
JP4483428B2 true JP4483428B2 (ja) | 2010-06-16 |
Family
ID=35778402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004188408A Expired - Fee Related JP4483428B2 (ja) | 2004-06-25 | 2004-06-25 | 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4483428B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2881867A1 (fr) * | 2005-02-04 | 2006-08-11 | France Telecom | Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole |
US9245525B2 (en) | 2011-01-05 | 2016-01-26 | Interactions Llc | Automated speech recognition proxy system for natural language understanding |
US9472185B1 (en) | 2011-01-05 | 2016-10-18 | Interactions Llc | Automated recognition system for natural language understanding |
JP2012181307A (ja) * | 2011-03-01 | 2012-09-20 | Nec Software Hokkaido Ltd | 音声処理装置、音声処理方法及び音声処理プログラム |
JP6025785B2 (ja) * | 2013-07-08 | 2016-11-16 | インタラクションズ リミテッド ライアビリティ カンパニー | 自然言語理解のための自動音声認識プロキシシステム |
WO2015041892A1 (en) * | 2013-09-20 | 2015-03-26 | Rawles Llc | Local and remote speech processing |
JP5901694B2 (ja) * | 2014-04-01 | 2016-04-13 | ソフトバンク株式会社 | 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム |
CN106537494B (zh) * | 2014-07-23 | 2018-01-23 | 三菱电机株式会社 | 语音识别装置和语音识别方法 |
JP6429294B2 (ja) * | 2015-02-10 | 2018-11-28 | Necソリューションイノベータ株式会社 | 音声認識処理装置、音声認識処理方法およびプログラム |
US10515637B1 (en) | 2017-09-19 | 2019-12-24 | Amazon Technologies, Inc. | Dynamic speech processing |
-
2004
- 2004-06-25 JP JP2004188408A patent/JP4483428B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006011066A (ja) | 2006-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230053350A1 (en) | Encapsulating and synchronizing state interactions between devices | |
US9454961B2 (en) | Speech recognition using loosely coupled components | |
CN108228131B (zh) | 自然语言虚拟助理中的全双工话语处理 | |
EP2321821B1 (en) | Distributed speech recognition using one way communication | |
US6970935B1 (en) | Conversational networking via transport, coding and control conversational protocols | |
JP5039024B2 (ja) | 多モード音声及びウェブ・サービスのための方法及び装置 | |
TWI249729B (en) | Voice browser dialog enabler for a communication system | |
JP4483428B2 (ja) | 音声認識/合成システム、同期制御方法、同期制御プログラム、および同期制御装置 | |
CN108184135A (zh) | 字幕生成方法及装置、存储介质及电子终端 | |
WO2002080144A1 (en) | Text editing for recognized speech during synchronous playback | |
EP1374225A1 (en) | Synchronise an audio cursor and a text cursor during editing | |
WO2017014721A1 (en) | Reduced latency speech recognition system using multiple recognizers | |
JP7448672B2 (ja) | 情報処理方法、システム、装置、電子機器及び記憶媒体 | |
JP5244663B2 (ja) | 音声によってテキストを入力する音声認識処理方法及びシステム | |
WO2007023683A1 (ja) | メディア処理方法、メディア処理プログラム | |
JP2006210973A (ja) | 通信端末装置およびそのセッション接続方法 | |
KR100755374B1 (ko) | 음성 시나리오 연출 시스템 및 그 방법 | |
US20210399913A1 (en) | Information processing apparatus and information processing method | |
CN117956241A (zh) | 字幕处理方法、装置、设备和存储介质 | |
JP2018207400A (ja) | ロボット制御システム | |
JP2015012407A (ja) | 音声出力装置、音声再生システム及び音声出力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051121 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20051121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100302 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100315 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4483428 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130402 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130402 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140402 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |