JP2010066360A - 分散型音声認識システム - Google Patents
分散型音声認識システム Download PDFInfo
- Publication number
- JP2010066360A JP2010066360A JP2008230693A JP2008230693A JP2010066360A JP 2010066360 A JP2010066360 A JP 2010066360A JP 2008230693 A JP2008230693 A JP 2008230693A JP 2008230693 A JP2008230693 A JP 2008230693A JP 2010066360 A JP2010066360 A JP 2010066360A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- control device
- control
- audio signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】音声出力部1から入力した音声を音声信号に変換して認識し、その音声に、補機9に対する指令が含まれていれば、前記指令に応じた制御用データを補機9に出力する制御部と、補機9に対する指令と、前記制御用データを求めるアルゴリズムとを対応付けて記憶する記憶部とを有する制御装置2を複数備えた分散型音声認識システムにおいて、各制御装置2において、音声信号に対して当該音声が入力された時刻を示す時刻データを付加し、一方の制御装置2は、その制御装置2が有する時刻データが付加された音声信号と、他方の制御装置2から取得した音声信号のうち時刻データが示す時刻が略一致するものを比較することで入力した音声信号が正常であるか否かを判断する。
【選択図】図2
Description
以下、本発明の実施の形態(以下、「実施形態」という。)を、図を用いて説明する。
図1は、本実施形態による分散型音声認識システムが使用されるネットワークの構成を示したブロック図である。
また、特徴量が抽出された音声信号において、後記する重要音声テーブル(A6、B6)に登録された音声と一致するものがあれば、その音声に重要音声が含まれているものとして処理し、当該音声信号が時刻印加部(A3、B3)に出力される。なお、重要音声については、後記する。
図3は、重要音声テーブル(A6、B6)のデータ構造を図示したものである。この重要音声テーブル(A6またはB6)は、当該レコードを識別する番号が登録される識別番号(No)フィールド301と、重要と規定された音声が登録される重要音声フィールド302とを備えたデータベースである。入力された音声信号の音声において、重要音声フィールド302に登録された音声と一致する部分が存在したときは、その部分を重要音声と定めるフラグ処理がなされる。
図4は、認識音声テーブル(A7、B7)のデータ構造を図示したものである。この認識音声テーブル(A7、B7)は、当該レコードを識別する番号が登録される識別番号(No)フィールド401と、時刻データが示す時刻が登録される時刻フィールド402と、音声信号が示す音声のうち重要音声でない部分が登録される音声フィールド403と、音声信号が示す音声のうち重要音声である部分が登録される重要音声フィールド404とを備えたデータベースである。当該音声信号に対する補機9の制御が済んだ後は、認識音声テーブル(A7、B7)内の当該レコードは破棄される。
なお、音声正常判断部(A4、B4)は、重要音声でない部分については、音声信号に若干量(例えば、30%程度)のノイズが混入し、音声信号に乱れが生じたと判断した場合であっても正常と判断する。ただ、重要音声である部分については、音声信号に混入したノイズが微少量(例えば、1%程度)以下であるときに正常と判断するようにして認識の精度に差を設けるようにする。
図5は、指令メッセージテーブル(A8、B8)のデータ構造を図示したものである。この指令メッセージテーブル(A8、B8)は、当該レコードを識別する番号が登録される識別番号(No)フィールド501と、指令対象となる設備、つまりプラントを識別する値が登録される対象設備番号フィールド502と、制御装置2の指令対象として、プラントを構成する補機9を識別する値が登録される指令対象フィールド503と、制御装置2からの指令内容を識別する値が登録される指令フィールド504と、前記指令内容を論理回路で表現したロジックシート(アルゴリズム)が登録されるロジックシートフィールド505と、指令内容に応じた制御を実現するためにロジックシートに入力される音声命令を識別する番号が登録される音声命令番号フィールド506とを備えたデータベースである。音声命令番号フィールド506に登録される番号は、指令フィールド504に登録される値と1対1に対応する。
ロジックシートは各制御装置2の記憶部に記憶されており、入力される音声信号に一致するレコードが抽出されたときに、そのレコードに登録されているロジックシートが読み出される。また、ロジックシートには、音声命令番号フィールド506に登録された番号が入力される、論理回路としての領域を備えている。
次に、本実施形態による分散型音声認識システムによる処理動作について説明する。図6は、本実施形態による分散型音声認識システムによる処理動作を示すフローチャートである。この処理動作の主体は、各制御装置2の制御部である。
また、この処理動作が、現場にいる検査員3と工場で監視している監視員5とによる制御装置2の検査(主に、補機9に対する制御装置2の制御(取り合いも含む。)が正常に行われているか否かを確認する検査)において実行されているものとして説明する。ちなみに、検査員3と監視員5とはトランシーバで検査に関する連絡をやり取りしている。例えば、検査員3は監視員5に対し、
「盤No.5 端子台No.X11 1番、2番ジャンパーします」
とか、
「盤No.5 端子台No.X11 チャンネルNo.1 2.5V入力します」
といった、制御装置2の検査をするために、所定の信号入力を確認するための作業内容を報告する。
一方、監視員5は、前記した検査員3の作業に応じて補機9の稼働状態を変更するために、
「1号給水ポンプA起動します」
といった、補機9のテストに必要な指令を音声出力部1から音声により出力する。この音声は音量の大小は様々であるが、すべての制御装置2に入力される。
なお、本実施形態では、指令対象フィールド503に登録される値は、重要音声でない音声であり、指令フィールド504に登録される値は、重要音声であるとする。「1号給水ポンプA起動します」という音声が入力された場合、「イチゴウキュウスイポンプエイ」という部分がNo1と番号付けられたレコードの指令対象フィールド503の値と一致し、「キドウ」という部分が、指令フィールド504の値と一致する。
以上で、分散型音声認識システムによる処理動作の説明を終了する。
本実施形態により、以下の効果を奏する。すなわち、発電等のプラントの制御装置において音声認識を行う際に、入力された音声の音声信号が各制御装置同士で一致するか否かを判断するので、発電等のプラントの制御装置に入力される音声の認識の精度を高めることができる。音声認識の精度を上げるときには、システム「単体」でいかに精度良く認識するかという考えが主流であるが、発電等のプラントの制御装置に用いる場合には、既に記したような困難が生じるので、音声認識する箇所を「複数」備えるようにして所望の認識精度を実現する。制御装置が元々複数備わっているハードウェア構成であるため、分散型音声認識システムを複数備えることによる、資源の減少、インタフェースの追加等といった負担は少ない。
なお、前記形態は、本発明を実施するための最良のものであるが、その実施形式はこれに限定するものではない。したがって、本発明の要旨を変更しない範囲において、その実施形式を種々変形することが可能である。
2 制御装置(第1の制御装置、第2の制御装置を含む。)
3 検査員
4 現場用サーバ
5 監視員
6 工場用端末
7 マイク
8 工場用サーバ
9 補機
A1、B1 音声入力部
A2、B2 音声認識部
A3、B3 時刻印加部
A4、B4 音声正常判断部
A5、B5 メッセージ処理部
A6、B6 重要音声テーブル
A7、B7 認識音声テーブル
A8、B8 指令メッセージテーブル
Claims (3)
- 外部から入力した音声を第1の音声信号に変換し、前記第1の音声信号から音声の特徴量を抽出することにより音声を認識し、前記認識がなされた音声に、制御対象となる装置に対する指令が含まれていれば、前記指令に応じた制御用データを前記装置に出力するように制御する第1の制御部と、
制御対象となる装置に対する指令と、前記制御用データを求めるアルゴリズムとを対応付けて記憶する第1の記憶部と、
を備える第1の制御装置と、
外部から入力した音声を第2の音声信号に変換し、前記第2の音声信号から音声の特徴量を抽出することにより音声を認識し、前記認識がなされた音声に、制御対象となる装置に対する指令が含まれていれば、前記指令に応じた制御用データを前記装置に出力するように制御する第2の制御部と、
制御対象となる装置に対する指令と、前記制御用データを求めるアルゴリズムとを対応付けて記憶する第2の記憶部と、
を備える第2の制御装置と、
を少なくとも含み、前記第1の制御装置および前記第2の制御装置が通信可能に接続された分散型音声認識システムにおいて、
前記第1の制御部により前記第1の音声信号に対して当該音声が入力された時刻を示す第1の時刻データを付加するとともに、前記第2の制御部により前記第2の音声信号に対して当該音声が入力された時刻を示す第2の時刻データを付加し、
前記第1の制御部は、
前記第1の時刻データが付加された前記第1の音声信号と、前記第2の制御装置から取得した、前記第2の時刻データが付加された前記第2の音声信号のうち、前記第2の時刻データが示す時刻と前記第1の時刻データが示す時刻とが略一致するものを比較することで前記第1の音声信号が正常であるか否かを判断する
ことを特徴とする分散型音声認識システム。 - 前記第1の記憶部は、
前記比較により前記第1の音声信号と前記第2の音声信号との一致する割合が第1の閾値以上であるときに前記第1の音声信号が正常であると判断し、この音声を重要音声として記憶し、
前記第1の制御部は、
前記重要音声でない音声に対する前記比較において、前記第1の閾値を下回る第2の閾値以上の割合で一致すれば、前記第1の閾値以上の割合で一致することがなくとも前記第1の音声信号が正常であると判断する
ことを特徴とする請求項1に記載の分散型音声認識システム。 - 前記第1の記憶部は、
前記比較により前記第1の音声信号と前記第2の音声信号との一致する割合が第1の閾値以上であるときに前記第1の音声信号が正常であると判断し、この音声を重要音声として記憶し、
前記第1の制御部は、
前記重要音声に対する前記比較において、前記第1の閾値を下回る第2の閾値以上の割合で一致しても、前記第1の閾値以上の割合で一致することがなければ前記第1の音声信号が正常でないと判断する
ことを特徴とする請求項1に記載の分散型音声認識システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008230693A JP5049930B2 (ja) | 2008-09-09 | 2008-09-09 | 分散型音声認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008230693A JP5049930B2 (ja) | 2008-09-09 | 2008-09-09 | 分散型音声認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010066360A true JP2010066360A (ja) | 2010-03-25 |
JP5049930B2 JP5049930B2 (ja) | 2012-10-17 |
Family
ID=42192024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008230693A Active JP5049930B2 (ja) | 2008-09-09 | 2008-09-09 | 分散型音声認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5049930B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316641A (zh) * | 2017-06-30 | 2017-11-03 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02178699A (ja) * | 1988-12-28 | 1990-07-11 | Nec Corp | 音声認識装置 |
JPH04318900A (ja) * | 1991-04-18 | 1992-11-10 | Oki Electric Ind Co Ltd | 多方向同時収音式音声認識方法 |
JPH07199985A (ja) * | 1993-11-24 | 1995-08-04 | At & T Corp | 音声認識方法 |
-
2008
- 2008-09-09 JP JP2008230693A patent/JP5049930B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02178699A (ja) * | 1988-12-28 | 1990-07-11 | Nec Corp | 音声認識装置 |
JPH04318900A (ja) * | 1991-04-18 | 1992-11-10 | Oki Electric Ind Co Ltd | 多方向同時収音式音声認識方法 |
JPH07199985A (ja) * | 1993-11-24 | 1995-08-04 | At & T Corp | 音声認識方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316641A (zh) * | 2017-06-30 | 2017-11-03 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP5049930B2 (ja) | 2012-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10546585B2 (en) | Localizing and verifying utterances by audio fingerprinting | |
JP6630765B2 (ja) | 個別化されたホットワード検出モデル | |
US9053704B2 (en) | System and method for standardized speech recognition infrastructure | |
US20200090647A1 (en) | Keyword Detection In The Presence Of Media Output | |
JP6276400B2 (ja) | 制御装置およびメッセージ出力制御システム | |
JP3967952B2 (ja) | 文法更新システム及び方法 | |
WO2015163774A1 (en) | Methods and apparatus to enhance security of authentication | |
CN107680613A (zh) | 一种声控设备语音识别能力测试方法及设备 | |
US9298811B2 (en) | Automated confirmation and disambiguation modules in voice applications | |
CN101208739A (zh) | 用于安全信息的语音识别系统 | |
CN103578468A (zh) | 一种语音识别中置信度阈值的调整方法及电子设备 | |
US20170178632A1 (en) | Multi-user unlocking method and apparatus | |
US20080154596A1 (en) | Solution that integrates voice enrollment with other types of recognition operations performed by a speech recognition engine using a layered grammar stack | |
WO2022083969A1 (en) | Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium | |
KR20230116886A (ko) | 페이크 오디오 검출을 위한 자기 지도형 음성 표현 | |
CN112767939A (zh) | 一种智能设备唤醒方法、装置、计算机设备及存储介质 | |
CN110716843B (zh) | 系统故障分析处理方法、装置、存储介质及电子设备 | |
JP6775563B2 (ja) | 人工知能機器の自動不良検出のための方法およびシステム | |
JP5049930B2 (ja) | 分散型音声認識システム | |
US20190121610A1 (en) | User Interface For Hands Free Interaction | |
KR20210054246A (ko) | 전자장치 및 그 제어방법 | |
KR20200053242A (ko) | 차량용 음성 인식 시스템 및 그 제어 방법 | |
EP4372547A1 (en) | Configuration of audio for voice test system automation | |
WO2023182015A1 (ja) | 音声認証装置および音声認証方法 | |
CN114090685A (zh) | 门禁人员的生物识别数据的同步及确认校验方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100426 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120710 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120723 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150727 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5049930 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |