JP2014021475A - 音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム - Google Patents
音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム Download PDFInfo
- Publication number
- JP2014021475A JP2014021475A JP2012163465A JP2012163465A JP2014021475A JP 2014021475 A JP2014021475 A JP 2014021475A JP 2012163465 A JP2012163465 A JP 2012163465A JP 2012163465 A JP2012163465 A JP 2012163465A JP 2014021475 A JP2014021475 A JP 2014021475A
- Authority
- JP
- Japan
- Prior art keywords
- command control
- continuous
- phonetic
- voice command
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】デコード処理部15が、コード辞書データを用いて入力音声の音声認識処理結果を単語単位でコードに変換し、その変換による複数のコードを連続させたコード列を生成し、変換文解析部17が、そのコード列に含まれる一部又は全部のコード連続順序がシーケンス辞書データのシーケンスコードで定めたコード連続順序に合致する場合のみ、その連続順序のシーケンスコードに対応するコマンドを操作対象装置700に出力する。
【選択図】図1
Description
図1は、音声コマンド制御装置100の機能ブロック構成を示す図である。音声コマンド制御装置100は、通信ネットワークを介して他の装置と通信可能であって、音声入力装置500から入力された音声を操作対象装置700で解釈可能なコマンドに変換する装置である。
図5は、音声コマンド制御システムの機能ブロック構成を示す図である。本実施の形態では、シーケンス辞書データを生成して音声コマンド制御装置100に登録するシーケンス辞書生成装置300を更に備えている。これにより、利用者は、特別に言語モデルを考慮することなく、新たなコマンドを簡易に追加することができる。
11…単語辞書記憶部
12…音響モデル処理部
13…簡易言語モデル処理部
14…コード辞書記憶部(第1記憶手段)
15…デコード処理部
16…シーケンス辞書記憶部(第2記憶手段)
17…変換文解析部
300…シーケンス辞書生成装置
500…音声入力装置
700…操作対象装置
S101〜S106、S201〜S208…ステップ
Claims (7)
- 単語単位の表音文字と、前記表音文字を識別する表音単語識別子とを関連付けた第1対応関係を記憶しておく第1記憶手段と、
前記表音文字間の接続が意味的に連鎖するように前記表音単語識別子を複数連続させた連続表音単語識別子と、前記意味内容の操作を操作対象装置に実行させるための操作命令情報とを関連付けた第2対応関係を記憶しておく第2記憶手段と、
前記第1対応関係を用いて入力音声の音声認識処理結果を単語単位で前記表音単語識別子に変換し、当該変換による複数の表音単語識別子を連続させた連続データを生成する手段と、
前記第2記憶手段から前記第2対応関係を読み出して、前記連続データに含まれる一部又は全部の表音単語識別子の連続順序が前記連続表音単語識別子で定めた表音単語識別子の連続順序に合致する場合のみ、当該連続順序の連続表音単語識別子に対応する前記操作命令情報を前記操作対象装置に出力する手段と、
を有することを特徴とする音声コマンド制御装置。 - 前記音声認識処理は、
単語間の意味的な連鎖度を一定とする簡易言語モデルを用いて行われることを特徴とする請求項1記載の音声コマンド制御装置。 - 前記第1対応関係と前記第2対応関係は、
前記音声コマンド制御装置に通信可能に接続された他の装置により生成されることを特徴とする請求項1又は2記載の音声コマンド制御装置。 - コンピュータにより、
単語単位の表音文字と、前記表音文字を識別する表音単語識別子とを関連付けた第1対応関係を第1記憶手段に記憶しておくステップと、
前記表音文字間の接続が意味的に連鎖するように前記表音単語識別子を複数連続させた連続表音単語識別子と、前記意味内容の操作を操作対象装置に実行させるための操作命令情報とを関連付けた第2対応関係を第2記憶手段に記憶しておくステップと、
前記第1対応関係を用いて入力音声の音声認識処理結果を単語単位で前記表音単語識別子に変換し、当該変換による複数の表音単語識別子を連続させた連続データを生成するステップと、
前記第2記憶手段から前記第2対応関係を読み出して、前記連続データに含まれる一部又は全部の表音単語識別子の連続順序が前記連続表音単語識別子で定めた表音単語識別子の連続順序に合致する場合のみ、当該連続順序の連続表音単語識別子に対応する前記操作命令情報を前記操作対象装置に出力するステップと、
を有することを特徴とする音声コマンド制御方法。 - 前記音声認識処理は、
単語間の意味的な連鎖度を一定とする簡易言語モデルを用いて行われることを特徴とする請求項4記載の音声コマンド制御方法。 - 前記第1対応関係と前記第2対応関係は、
前記音声コマンド制御装置に通信可能に接続された他の装置により生成されることを特徴とする請求項4又は5記載の音声コマンド制御方法。 - 請求項4乃至6のいずれかに記載の音声コマンド制御方法をコンピュータに実行させることを特徴とする音声コマンド制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012163465A JP6001944B2 (ja) | 2012-07-24 | 2012-07-24 | 音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012163465A JP6001944B2 (ja) | 2012-07-24 | 2012-07-24 | 音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014021475A true JP2014021475A (ja) | 2014-02-03 |
JP6001944B2 JP6001944B2 (ja) | 2016-10-05 |
Family
ID=50196357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012163465A Expired - Fee Related JP6001944B2 (ja) | 2012-07-24 | 2012-07-24 | 音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6001944B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200006566A (ko) * | 2017-10-03 | 2020-01-20 | 구글 엘엘씨 | 사용자 프로그래머블 자동화 어시스턴트 |
US10546574B2 (en) | 2016-09-01 | 2020-01-28 | Samsung Electronics Co., Ltd. | Voice recognition apparatus and method |
JP2021182068A (ja) * | 2020-05-19 | 2021-11-25 | Necパーソナルコンピュータ株式会社 | 映像表示装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0215573A1 (en) * | 1985-08-20 | 1987-03-25 | National Research Development Corporation | Apparatus and methods for speech recognition |
JPS62111296A (ja) * | 1985-08-20 | 1987-05-22 | ブリティッシュ・テクノロジー・グループ・リミテッド | 音声認識方法およびその装置 |
JPH06295198A (ja) * | 1993-03-03 | 1994-10-21 | Philips Electron Nv | 音声信号の所定の語彙のワードシーケンスを決める方法 |
JPH0792994A (ja) * | 1993-09-28 | 1995-04-07 | Nippon Telegr & Teleph Corp <Ntt> | 認識候補抽出処理装置 |
JPH07219587A (ja) * | 1994-01-28 | 1995-08-18 | Canon Inc | 音声処理装置および方法 |
JP2003140685A (ja) * | 2001-10-30 | 2003-05-16 | Nippon Hoso Kyokai <Nhk> | 連続音声認識装置およびそのプログラム |
JP2010145930A (ja) * | 2008-12-22 | 2010-07-01 | Nissan Motor Co Ltd | 音声認識装置及び方法 |
JP2011144034A (ja) * | 2010-01-18 | 2011-07-28 | Mitsubishi Electric Building Techno Service Co Ltd | 音声認識によるエレベータの操作装置 |
-
2012
- 2012-07-24 JP JP2012163465A patent/JP6001944B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0215573A1 (en) * | 1985-08-20 | 1987-03-25 | National Research Development Corporation | Apparatus and methods for speech recognition |
JPS62111296A (ja) * | 1985-08-20 | 1987-05-22 | ブリティッシュ・テクノロジー・グループ・リミテッド | 音声認識方法およびその装置 |
JPH06295198A (ja) * | 1993-03-03 | 1994-10-21 | Philips Electron Nv | 音声信号の所定の語彙のワードシーケンスを決める方法 |
JPH0792994A (ja) * | 1993-09-28 | 1995-04-07 | Nippon Telegr & Teleph Corp <Ntt> | 認識候補抽出処理装置 |
JPH07219587A (ja) * | 1994-01-28 | 1995-08-18 | Canon Inc | 音声処理装置および方法 |
JP2003140685A (ja) * | 2001-10-30 | 2003-05-16 | Nippon Hoso Kyokai <Nhk> | 連続音声認識装置およびそのプログラム |
JP2010145930A (ja) * | 2008-12-22 | 2010-07-01 | Nissan Motor Co Ltd | 音声認識装置及び方法 |
JP2011144034A (ja) * | 2010-01-18 | 2011-07-28 | Mitsubishi Electric Building Techno Service Co Ltd | 音声認識によるエレベータの操作装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10546574B2 (en) | 2016-09-01 | 2020-01-28 | Samsung Electronics Co., Ltd. | Voice recognition apparatus and method |
KR20210150622A (ko) * | 2017-10-03 | 2021-12-10 | 구글 엘엘씨 | 사용자 프로그래머블 자동화 어시스턴트 |
JP2020535452A (ja) * | 2017-10-03 | 2020-12-03 | グーグル エルエルシー | ユーザプログラマブル自動アシスタント |
JP2021144228A (ja) * | 2017-10-03 | 2021-09-24 | グーグル エルエルシーGoogle LLC | ユーザプログラマブル自動アシスタント |
KR102337820B1 (ko) | 2017-10-03 | 2021-12-09 | 구글 엘엘씨 | 사용자 프로그래머블 자동화 어시스턴트 |
KR20200006566A (ko) * | 2017-10-03 | 2020-01-20 | 구글 엘엘씨 | 사용자 프로그래머블 자동화 어시스턴트 |
US11276400B2 (en) | 2017-10-03 | 2022-03-15 | Google Llc | User-programmable automated assistant |
KR20220103187A (ko) * | 2017-10-03 | 2022-07-21 | 구글 엘엘씨 | 사용자 프로그래머블 자동화 어시스턴트 |
KR102424261B1 (ko) | 2017-10-03 | 2022-07-25 | 구글 엘엘씨 | 사용자 프로그래머블 자동화 어시스턴트 |
KR102625761B1 (ko) | 2017-10-03 | 2024-01-16 | 구글 엘엘씨 | 사용자 프로그래머블 자동화 어시스턴트 |
US11887595B2 (en) | 2017-10-03 | 2024-01-30 | Google Llc | User-programmable automated assistant |
JP2021182068A (ja) * | 2020-05-19 | 2021-11-25 | Necパーソナルコンピュータ株式会社 | 映像表示装置 |
JP7132974B2 (ja) | 2020-05-19 | 2022-09-07 | Necパーソナルコンピュータ株式会社 | 映像表示装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6001944B2 (ja) | 2016-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10210862B1 (en) | Lattice decoding and result confirmation using recurrent neural networks | |
US10121467B1 (en) | Automatic speech recognition incorporating word usage information | |
Czech | A System for Recognizing Natural Spelling of English Words | |
JP5040909B2 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
Jelinek | Statistical methods for speech recognition | |
JP4301102B2 (ja) | 音声処理装置および音声処理方法、プログラム、並びに記録媒体 | |
US8423351B2 (en) | Speech correction for typed input | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
CN107705787A (zh) | 一种语音识别方法及装置 | |
JP2001100781A (ja) | 音声処理装置および音声処理方法、並びに記録媒体 | |
Neubig et al. | Bayesian learning of a language model from continuous speech | |
US20150179169A1 (en) | Speech Recognition By Post Processing Using Phonetic and Semantic Information | |
Droppo et al. | Context dependent phonetic string edit distance for automatic speech recognition | |
KR101424193B1 (ko) | 타 언어권 화자음성에 대한 음성인식 시스템의 성능 향상을위한 비직접적 데이터 기반 발음변이 모델링 시스템 및방법 | |
Neubig et al. | Learning a language model from continuous speech | |
JP6001944B2 (ja) | 音声コマンド制御装置、音声コマンド制御方法及び音声コマンド制御プログラム | |
JP4089861B2 (ja) | 音声認識文章入力装置 | |
JP4595415B2 (ja) | 音声検索システムおよび方法ならびにプログラム | |
KR102637025B1 (ko) | 자동 음성 인식을 위한 다언어 리스코어링 모델들 | |
JP2011007862A (ja) | 音声認識装置、音声認識プログラム、および音声認識方法 | |
JP2012255867A (ja) | 音声認識装置 | |
KR20050101695A (ko) | 인식 결과를 이용한 통계적인 음성 인식 시스템 및 그 방법 | |
JP4733436B2 (ja) | 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体 | |
JPH11143493A (ja) | 音声言語理解装置及び音声言語理解システム | |
KR20110119478A (ko) | 음성 인식 장치 및 음성 인식 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141017 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160902 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6001944 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |