JPWO2018088534A1 - 電子機器、電子機器の制御方法及び電子機器の制御プログラム - Google Patents

電子機器、電子機器の制御方法及び電子機器の制御プログラム Download PDF

Info

Publication number
JPWO2018088534A1
JPWO2018088534A1 JP2018550285A JP2018550285A JPWO2018088534A1 JP WO2018088534 A1 JPWO2018088534 A1 JP WO2018088534A1 JP 2018550285 A JP2018550285 A JP 2018550285A JP 2018550285 A JP2018550285 A JP 2018550285A JP WO2018088534 A1 JPWO2018088534 A1 JP WO2018088534A1
Authority
JP
Japan
Prior art keywords
command
data
unit
recognition
authentication score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018550285A
Other languages
English (en)
Other versions
JP6682007B2 (ja
Inventor
敏幸 宮崎
敏幸 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asahi Kasei Corp
Original Assignee
Asahi Kasei Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahi Kasei Corp filed Critical Asahi Kasei Corp
Publication of JPWO2018088534A1 publication Critical patent/JPWO2018088534A1/ja
Application granted granted Critical
Publication of JP6682007B2 publication Critical patent/JP6682007B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本発明は、ユーザ認証によって保護された機能を起動するための操作が煩雑になることを防止できる電子機器、電子機器の制御方法及び電子機器の制御プログラムを目的とする。電子機器(1)は、登録者の識別情報及登録キーワードを関連づけて記憶するキーワード管理DB(14)と、コマンド及び必要認証スコアを関連づけて記憶するコマンド管理DB(15)と、登録キーワード及びコマンドを有するグラマーデータを作成するデータ作成部(16)と、グラマーデータ及び使用者の発話から抽出された抽出データを照合して認識認証スコア及び認識コマンドを取得する照合取得部(17)と、認識コマンドと同一と判定されたコマンドに関連づけられた必要認証スコアと認識認証スコアとを比較してコマンドの認識を判定する判定部(18)とを備える。

Description

本発明は、電子機器、電子機器の制御方法及び電子機器の制御プログラムに関する。
スマートフォンなど個人が所有する電子機器においてセキュリティーを確保するためには、パスコード入力や指紋認証など、一旦ユーザ認証によりロックを解除し、その後、手動または音声コマンドでアプリケーションを起動する方法が用いられている。例えば、特許文献1には、入力音声とテキスト独立型ボイスプリントとを比較してユーザ認証が実行され、ユーザの正常な認証がなされると、デバイスの機能へのユーザアクセスが許可されることが開示されている。
電子機器には様々なアプリケーションが搭載されているが、このようなアプリケーションに要求されるセキュリティーレベルは様々である。例えば、アドレスブックなど個人の情報をハンドルするアプリケーションは高いセキュリティーを必要とする。一方、時刻を知るためのアプリケーションや照明装置を点灯させるアプリケーションなどは、個人情報が含まれるアプリケーションと比較して低いレベルのセキュリティーで十分と考えられる。
また、家庭用の機器など、複数のユーザによって共有する機器においては、アプリケーションを起動するためのセキュリティーレベルは、ユーザごとに望まれるセキュリティーレベルが異なることも考えられる。電子機器の簡便な操作を行う上で音声操作は一つの有望な方法であるが、ユーザ認証のロックを解除して話者認証を行い、認証後に引き続き独立した音声コマンドを発話してアプリケーションを起動すると操作が煩雑になるという問題が生じる。
特開2016−129011号公報
本発明の目的は、ユーザ認証によって保護された機能を起動するための操作が煩雑になることを防止できる電子機器、電子機器の制御方法及び電子機器の制御プログラムを提供することにある。
上記目的を達成するために、本発明の一態様による電子機器は、登録者を識別する識別情報及び該登録者の発話に基づく登録キーワードを関連づけて記憶するキーワード記憶部と、異なる前記識別情報に対応付けられた複数の必要認証スコアを一のコマンドに関連づけて記憶可能に構成されて動作内容を規定するコマンド及び該コマンドで規定された動作を実行するか否かの判定に用いられる必要認証スコアを関連づけて記憶するコマンド記憶部と、前記キーワード記憶部から取得された登録キーワード及び前記コマンド記憶部から取得されたコマンドを有するグラマーデータを作成するデータ作成部と、前記データ作成部で作成されたグラマーデータ及び使用者の発話から抽出された抽出データを照合し、該グラマーデータに含まれる登録キーワードと該抽出データの一部との一致度を示す認識認証スコア及び該抽出データの残部の少なくとも一部から認識された認識コマンドを取得する照合取得部と、前記照合取得部で取得された認識コマンドと同一と判定されたコマンドに関連づけられた必要認証スコアが前記照合取得部で取得された認識認証スコア以下である場合には該コマンドが認識されたと判定し、該必要認証スコアが該認識認証スコアよりも大きい場合には該コマンドが認識されなかったと判定する判定部とを備えることを特徴とする。
また、上記目的を達成するために、本発明の一態様による電子機器の制御方法は、登録者を識別する識別情報及び該登録者の発話に基づく登録キーワードを関連づけてキーワード記憶部に記憶し、異なる前記識別情報に対応付けられた複数の必要認証スコアを一のコマンドに関連づけて記憶可能に構成されて動作内容を規定するコマンド及び該コマンドで規定された動作を実行するか否かの判定に用いられる必要認証スコアを関連づけてコマンド記憶部に記憶し、前記キーワード記憶部から取得された登録キーワード及び前記コマンド記憶部から取得されたコマンドを有するグラマーデータをデータ作成部が作成し、前記データ作成部で作成されたグラマーデータ及び使用者の発話から抽出された抽出データを照合し、該グラマーデータに含まれる登録キーワードと該抽出データの一部との一致度を示す認識認証スコア及び該抽出データの残部の少なくとも一部から認識された認識コマンドを照合取得部が取得し、前記照合取得部で取得された認識コマンドと同一と判定されたコマンドに関連づけられた必要認証スコアが前記照合取得部で取得された認識認証スコア以下である場合には該コマンドが認識されたと判定し、該必要認証スコアが該認識認証スコアよりも大きい場合には該コマンドが認識されなかったと判定することを特徴とする。
また、上記目的を達成するために、本発明の一態様による電子機器の制御プログラムは、コンピュータを、登録者を識別する識別情報及び該登録者の発話に基づく登録キーワードを関連づけて記憶するキーワード記憶部、異なる前記識別情報に対応付けられた複数の必要認証スコアを一のコマンドに関連づけて記憶可能に構成されて動作内容を規定するコマンド及び該コマンドで規定された動作を実行するか否かの判定に用いられる必要認証スコアを関連づけて記憶するコマンド記憶部、前記キーワード記憶部から取得された登録キーワード及び前記コマンド記憶部から取得されたコマンドを有するグラマーデータを作成するデータ作成部、前記データ作成部で作成されたグラマーデータ及び使用者の発話から抽出された抽出データを照合し、該グラマーデータに含まれる登録キーワードと該抽出データの一部との一致度を示す認識認証スコア及び該抽出データの残部の少なくとも一部から認識された認識コマンドを取得する照合取得部、及び前記照合取得部で取得された認識コマンドと同一と判定されたコマンドに関連づけられた必要認証スコアが前記照合取得部で取得された認識認証スコア以下である場合には該コマンドが認識されたと判定し、該必要認証スコアが該認識認証スコアよりも大きい場合には該コマンドが認識されなかったと判定する判定部として機能させることを特徴とする。
本発明の一態様によれば、ユーザ認証によって保護された機能を起動するための操作が煩雑になることを防止できる。
本発明の一実施形態による電子機器1の概略構成を示すブロック図である。 本発明の一実施形態による電子機器1に備えられた音響解析生成部13の概略構成を示すブロック図である。 本発明の一実施形態による電子機器1に備えられたキーワード管理DB14のデータベース構造を示す図である。 本発明の一実施形態による電子機器1に備えられたコマンド管理DB15のデータベース構造を示す図である。 本発明の一実施形態による電子機器1に備えられたデータ作成部16の概略構成を示すブロック図である。 本発明の一実施形態による電子機器1に備えられたデータ作成部16のグラマーデータ保存部166のデータベース構造及びグラマーデータのデータ構造を示す図である。 本発明の一実施形態による電子機器1に備えられた照合取得部17の概略構成を示すブロック図である。 本発明の一実施形態による電子機器1に備えられた判定部18の概略構成を示すブロック図である。 本発明の一実施形態による電子機器1に備えられたコマンド管理DB15の他のデータベース構造を示す図である。 本発明の一実施形態による電子機器1の制御方法の流れの一例を示すフローチャートである。
本発明の一実施形態による電子機器、電子機器の制御方法及び電子機器の制御プログラムについて図1から図10を用いて説明する。まず、本実施形態による電子機器1の概略構成について図1から図9を用いて説明する。本実施形態による電子機器1は、例えば家庭用ロボット、並びにスマートフォン、携帯電話機器及びタブレットパーソナルコンピュータ、ノート型パーソナルコンピュータなどの携帯機器や据え置き型のパーソナルコンピュータなどである。
図1に示すように、電子機器1は、登録キーワード(詳細は後述する)を登録する登録者の発話や、電子機器1を使用する使用者の発話が入力される音声入力部11と、文字入力が可能なテキスト入力部12とを備えている。音声入力部11は例えばマイクロフォンで構成されている。また、テキスト入力部12は、例えばキーボードや表示画面上に設けられたタッチパネルなどで構成されている。
電子機器1は、音声入力部11から入力され登録者の発話を解析して得られた音響的特徴量で構成された第一時系列データと、音声入力部11から入力され使用者の発話を解析して得られた音響的特徴量で構成された第二時系列データとを生成する音響解析生成部13を備えている。音響解析生成部13の詳細な構成については後述する。
電子機器1は、登録者を識別する識別情報及びこの登録者の発話に基づく登録キーワードを関連づけて記憶するキーワード管理データベース(キーワード記憶部の一例)14を備えている。キーワード管理データベース(以下、データベースを「DB」と略記する)14は、音響解析生成部13及びテキスト入力部12に接続されている。キーワード管理DB14には、音響解析生成部13から登録者の発話に基づく登録キーワードが入力され、テキスト入力部12から登録者を識別する識別情報が入力されるようになっている。つまり、キーワード管理DB14は、音響解析生成部13から入力されて登録者の発話に基づく登録キーワードが含まれる時系列データ(第一時系列データの一例)を登録キーワードとして記憶するようになっている。キーワード管理DB14のデータベース構造については後述する。
電子機器1は、電子機器1の動作内容を規定するコマンド及びこのコマンドで規定された動作を実行するか否かの判定に用いられる必要認証スコアを関連づけて記憶するコマンド管理DB(コマンド記憶部の一例)15を備えている。コマンド管理DB15には、電子機器1の動作内容を規定する複数のコマンドが予め記憶されている。また、コマンド管理DB15は、テキスト入力部12から入力されたコマンドを記憶できるように構成されている。コマンド管理DB15のデータベース構造については後述する。
電子機器1は、キーワード管理DB14から取得された登録キーワード及びコマンド管理DB15から取得されたコマンドを有するグラマーデータ(詳細は後述する)を作成するデータ作成部16を備えている。データ作成部16は、音響解析生成部13で解析されて抽出された時系列データに変換された登録キーワードを取得する。データ作成部16の詳細な構成については後述する。
電子機器1は、データ作成部16で作成されたグラマーデータ及び電子機器1の使用者の発話から抽出された抽出データを照合し、このグラマーデータに含まれる登録キーワードとこの抽出データの一部との一致度を示す認識認証スコア及びこの抽出データの残部の少なくとも一部から認識された認識コマンドを取得する照合取得部17を備えている。使用者の発話から抽出された抽出データは、音響解析生成部13が使用者の発話を解析して得た音響的特徴量の時系列データ(第二時系列データ)である。つまり、照合取得部17は、音響解析生成部13から入力された第二時系列データを抽出データとして用いて認識認証スコア及び認識コマンドを取得するようになっている。照合取得部17で取得される認識コマンドは、使用者が電子機器1に対して要求する動作内容が規定されたコマンドである。また、照合取得部17で取得される認識認証スコアは、使用者が電子機器1に対して要求する動作の実行を許可するか否かを決定するためのスコアである。照合取得部17の詳細な構成については後述する。
電子機器1は、照合取得部17で取得された認識コマンドと同一と判定されたコマンド(以下、「取得コマンド」ともいう。)に関連づけられた必要認証スコアが照合取得部17で取得された認識認証スコア以下である場合にはこのコマンドが認識されたと判定し、この必要認証スコアがこの認識認証スコアよりも大きい場合にはこのコマンドが認識されなかったと判定する判定部18を備えている。照合取得部17で取得された認識認証スコアと比較される必要認証スコアは、電子機器1に対して要求された動作を実行するために必要な、使用者の一致度を示すスコアである。判定部18の詳細な構成については後述する。
電子機器1は、音声入力部11から入力された音声に基づく時系列データに含まれるコマンドを抽出する際に用いられる音響モデルデータを記憶する音響モデル記憶部10を備えている。音響モデル記憶部10は、例えば不揮発性メモリで構成されている。なお、音響モデル記憶部10は、電子機器1の外部から音響モデルデータを書込み可能に構成されたランダムアクセスメモリで構成されていてもよい。
電子機器1は、音声入力部11、テキスト入力部12、キーワード管理DB14、コマンド管理DB15、データ作成部16、照合取得部17、判定部18、音響モデル記憶部10及び電子機器1を構成するその他の構成要素(不図示)を統括的に制御する制御部19を備えている。
次に、音響解析生成部13の詳細な構成について図2を用いて説明する。図2では、理解を容易にするため、電子機器1に設けられ、音響解析生成部13に接続された音声入力部11、キーワード管理DB14、照合取得部17及び制御部19が併せて図示されている。
図2に示すように、音響解析生成部13は、音声入力部11に接続されて音声入力部11から入力された音声の音声区間を検出する音声区間検出部131を有している。音声区間検出部131は、登録キーワードを登録する登録者又は電子機器1を使用する使用者の発話に基づいて音声入力部11から音声入力された音声に対して複数の音声区間を検出する。音声区間検出部131は、音声区間検出アルゴリズムが音声終端を検出するまで音声区間を検出する。
音響解析生成部13は、音声区間検出部131から出力された音声区間から抽出した音響的特徴量の時系列データを生成する時系列データ生成部133を有している。時系列データ生成部133は、音声区間検出部131から出力される複数の音声区間のそれぞれについて音響的特徴量を抽出する。時系列データ生成部133は、音声区間から例えばMFCC(メル周波数ケプストラム係数)などの音響的特徴量を抽出する。本実施形態では、音響的特徴量の種類は特に問わない。詳細は後述するが、時系列データ生成部133で抽出される音響的特徴量は、照合取得部17での認識時に利用する音響的特徴量と一致していることが必要である。このため、本実施形態における時系列データ生成部133は、雑音を含まない静音下で入力されたキーワード音声に対して音響的特徴量を抽出することが望ましい。
音響解析生成部13は、時系列データ生成部133で生成された時系列データを出力する出力部135を有している。出力部135は、制御部19に制御されて、登録キーワードを登録する登録者の発話に基づく時系列データ(第一時系列データの一例)をキーワード管理DB14に出力し、電子機器1の使用者の発話に基づく時系列データ(第二時系列データの一例)を照合取得部17に出力する。
音響解析生成部13は、登録キーワード及びコマンドを使用者の発話から抽出するために同一の音響的特徴量パラメータを用いるように構成されていてもよい。この場合、使用者の発話から登録キーワードを抽出するための音響的特徴量パラメータと、使用者の発話からコマンドを抽出するための音響的特徴量パラメータを共通化できるため、音響解析生成部13の構成が簡略化される。また、音響解析生成部13は、登録キーワード及びコマンドを使用者の発話から抽出するために異なる音響的特徴量パラメータを用いるように構成されていてもよい。この場合、使用者の発話から登録キーワードを抽出するために最適化された音響的特徴量パラメータを用いることができ、使用者の発話からコマンドを抽出するために最適化された音響的特徴量パラメータを用いることができる。このため、使用者の発話から登録キーワード及びコマンドを高精度に抽出できる。
次に、キーワード管理DB14のデータベース構造について図1及び図2を参照しつつ図3を用いて説明する。図3では、登録者の識別情報及び音響的特徴量の時系列データの組がキーワード管理DB14に4つ保存されている状態が示されているが、キーワード管理DB14は、5つ以上の当該組を保存することができるように構成されている。
図3に示すように、キーワード管理DB14は、「ユーザID」及び「特徴量時系列」を関連づけて保存できるデータベース構造を有している。「ユーザID」は、登録キーワードを登録した登録者を識別するための識別情報を示している。「特徴量時系列」は、音響解析生成部13から入力される音響的特徴量の時系列データを示している。
制御部19(図1参照)は、テキスト入力部12から登録者に関する識別情報が入力された後に音声入力部11に音声が入力されると、登録者によるキーワード登録が実行されたと判定し、生成した音響的特徴量の時系列データをキーワード管理DB14に送信するように音響解析生成部13を制御する。キーワード管理DB14は、テキスト入力部12から入力された登録者の識別情報と、音響解析生成部13から入力された音響的特徴量の時系列データとを関連づけて保存する。
キーワード管理DB14は、入力された登録者の識別情報を「ユーザID」の格納領域に格納し、当該識別情報とほぼ同時に入力された音響的特徴量の時系列データを「特徴量時系列」の格納領域のうちの当該識別情報が格納された格納領域と関連づけられた格納領域に格納する。これにより、キーワード管理DB14は、ほぼ同時に入力される登録者の識別情報と音響的特徴量の時系列データとを関連づけて管理することができる。
図3では、識別情報の数値(図3では、1、2及び3)で登録者の異同を示し、時系列データに付加したアルファベットで音声の異同を示し、時系列データに付加した数値で発話者の異同を示している。したがって、図3では、キーワード管理DB14の1行目及び2行目の格納領域には、同一の登録者(識別情報「1」)が登録した異なる登録キーワード(時系列データA及び時系列データB)が保存されていることが示されている。また、キーワード管理DB14の3行目の格納領域には、1行目及び2行目の登録者とは異なる登録者(識別情報「2」)が登録し、1行目と同一の登録キーワード(時系列データA)が保存されていることが示されている。また、キーワード管理DB14の4行目の格納領域には、1行目から3行目の登録者とは異なる登録者(識別情報「3」)が登録し、1行目と同一の登録キーワード(時系列データA)が保存されていることが示されている。登録者ごとに声質は異なるため、登録キーワードが同一であっても、音響的特徴量の時系列データは異なる。したがって、図3中に示す時系列データA1、時系列データA2及び時系列データA3は、キーワード自体は同一でも異なるデータとなる。
具体的に、キーワード管理DB14は、ほぼ同時に入力された登録者の識別情報「1」及び音響的特徴量の時系列データ「時系列データA1」を、「ユーザID」及び「特徴量時系列」のそれぞれの1行目の格納領域に格納している。これにより、キーワード管理DB14は、識別情報「1」及び時系列データ「時系列データA1」を対応付けて管理する。
また、キーワード管理DB14は、ほぼ同時に入力された登録者の識別情報「1」及び音響的特徴量の時系列データ「時系列データB1」を、「ユーザID」及び「特徴量時系列」のそれぞれの2行目の格納領域に格納している。これにより、キーワード管理DB14は、識別情報「1」及び時系列データ「時系列データB1」を対応付けて管理する。
また、キーワード管理DB14は、ほぼ同時に入力された登録者の識別情報「2」及び音響的特徴量の時系列データ「時系列データA2」を、「ユーザID」及び「特徴量時系列」のそれぞれの3行目の格納領域に格納している。これにより、キーワード管理DB14は、識別情報「2」及び時系列データ「時系列データB1」を対応付けて管理する。
また、キーワード管理DB14は、ほぼ同時に入力された登録者の識別情報「3」及び音響的特徴量の時系列データ「時系列データA3」を、「ユーザID」及び「特徴量時系列」のそれぞれの4行目の格納領域に格納している。これにより、キーワード管理DB14は、識別情報「3」及び時系列データ「時系列データA3」を対応付けて管理する。
次に、コマンド管理DB15のデータベース構造について図1を参照しつつ図4を用いて説明する。図4では、コマンド及び必要認証スコアの組がコマンド管理DB15に4つ保存されている状態が示されているが、コマンド管理DB15は、5つ以上の当該組を保存することができるように構成されている。
図4に示すように、コマンド管理DB15は、「コマンド」及び「必要認証スコア」を関連づけて保存できるデータベース構造を有している。「コマンド」は、電子機器1に実行させる動作内容を示している。「必要認証スコア」は、電子機器1にコマンドに係る動作を実行させるために必要な使用者の認証スコアを示している。つまり、コマンド管理DB15は、電子機器1の動作に係るコマンドと当該動作を実行するために必要な使用者の認証スコアを対応付けて管理している。このため、電子機器1は、音声認識コマンドによる制御に話者認証性や話者識別性を持たせ、コマンドに係る動作を開始するためのセキュリティーレベルをコマンドごとに異なる制御を可能している。
コマンド管理DB15には、電子機器1の動作に係るコマンド及び必要認証スコアが対応付けて予め保存されている。図4に示す例では、コマンド管理DB15には、コマンド「照明点灯」に対応付けて必要認証スコア「20」が保存され、コマンド「着信履歴」に対応付けて必要認証スコア「80」が保存され、コマンド「音声メモ再生」に対応付けて必要認証スコア「80」が保存され、コマンド「音楽再生」に対応付けて必要認証スコア「40」が保存されている。「照明点灯」は、照明装置を点灯させる動作を示している。「着信履歴」は、着信履歴の一覧を電子機器1に設けられた表示装置(不図示)に表示する動作を示している。「音声メモ再生」は、電子機器1に記憶された音声メモを再生する動作を示している。「音楽再生」は、電子機器1に記憶された音楽、又は音楽再生装置に音楽を再生させる動作を示している。必要認証スコアとして格納されている数値は、数値が大きい程、コマンドに係る動作を実行するためのセキュリティーレベルが高いことを示している。このため、コマンド管理DB15では、個人情報が含まれ易い動作(例えば「着信履歴」や「音声メモ再生」)の方が個人情報が含まれ難い動作(例えば「照明点灯」)よりも個人認証の認識レベルが高くなるように、必要認証スコアが高く設定されている。必要認証スコアに格納された数値は、照合取得部17(図1参照)で取得された認証認識スコアと比較される比較数値となる。
次に、データ作成部16の具体的な構成について図5及び図6を用いて説明する。図5では、理解を容易にするため、電子機器1に設けられ、データ作成部16に接続されたキーワード管理DB14、コマンド管理DB15及び照合取得部17が併せて図示されている。
図5に示すように、データ作成部16は、キーワード管理DB14から出力される音響的特徴量の時系列データが入力される時系列データ入力部161と、コマンド管理DB15から出力されるコマンドが入力されるコマンド入力部162とを有している。時系列データ入力部161には、時系列データとともにキーワード管理DB14において当該時系列データに関連づけて保存されている登録者の識別情報も入力される。時系列データ入力部161には、キーワード管理DB14に保存されている全ての識別情報及び時系列データが関連づけられた状態で順次入力される。同様に、コマンド入力部162には、コマンド管理DB15に保存されている全てのコマンドが順次入力される。
データ作成部16は、時系列データ入力部161に入力された全ての時系列データ及び識別情報を関連づけた状態で一時的に保存する時系列データ保存部163と、コマンド入力部162に入力された全てのコマンドを一時的に保存するコマンド保存部164とを有している。
データ作成部16は、時系列データ保存部163に保存された識別情報及び時系列データと、コマンド保存部164に保存されたコマンドとを連結してグラマーデータを生成するグラマーデータ生成部165と、グラマーデータ生成部165で生成されたグラマーデータを一時的に保存するグラマーデータ保存部166とを有している。
グラマーデータ生成部165は、時系列データ保存部163に保存された時系列データ及び識別情報と、コマンド保存部164に保存されたコマンドとの全ての組み合わせについて連結してグラマーデータを生成する。グラマーデータ生成部165は、時系列データ保存部163から入力された音響的特徴量の時系列データをDTW(ダイナミックタイムワーピング)の話者照合処理を行うアルゴリズムに適した形式に変換する。また、グラマーデータ生成部165は、コマンド保存部164から入力されたコマンドを音声認識で利用されている統計的モデル(例えば、不特定話者音声認識が利用される隠れマルコフモデル(HMM))であって照合処理に適した形式に変換する。音響的特徴量の時系列データは、ダイナミックタイムワーピングの話者照合処理を行うアルゴリズムに適した形式以外の形式に変換されてもよく、コマンドは、隠れマルコフモデル以外の統計的モデルの形式に変換されてもよい。
グラマーデータ生成部165は、生成したグラマーデータをグラマーデータ保存部166に出力する。グラマーデータ保存部166は、グラマーデータ生成部165から入力されたグラマーデータに番号を付して保存する。
ここで、グラマーデータ保存部166のデータベース構造及びグラマーデータ保存部166に保存されたグラマーデータのデータ構造について図6を用いて説明する。図6には、図3中に示す識別情報及び時系列データの4つの組と、図4中に示す4つのコマンドとを組み合わせて生成された16個のグラマーデータが保存された状態が図示されている。
図6に示すように、グラマーデータ保存部166は、「番号」及び「グラマーデータ」を対応付けて保存できるデータベース構造を有している。「番号」は、グラマーデータ生成部165から入力された順に時系列に付与された番号を示している。また、「番号」は、グラマーデータ保存部166が後述する出力部167にグラマーデータを出力する順番も示している。「グラマーデータ」は、グラマーデータ生成部165から入力されてグラマーデータ保存部166で保存されているグラマーデータを示している。
図6に示すように、グラマーデータは、登録者の識別情報を含む単語グループと、登録者が登録した登録キーワードに対する音響的特徴量の時系列データをテンプレートとして含む単語グループと、識別情報及び時系列データに連結されたコマンドを含む単語グループとで構成されたデータ構造を有している。グラマーデータは、音声認識に利用される単語の連結を表している。グラマーデータでは、話者照合処理を行うアルゴリズムに適した形式の音響的特徴量の時系列データと、音声認識で利用されている統計的モデルであって照合処理に適した形式のコマンドとが連結されている。識別情報は、照合取得部17(図1参照)において音声データと照合される情報ではないため、例えばテキスト形式で時系列データ及びコマンドに連結されている。
キーワード管理DB14が関連づけられた識別情報及び登録キーワードを含む時系列データの組である第一組を複数記憶し、コマンド管理DB15がコマンド及び必要認証スコアの組である第二組を複数記憶している場合、データ作成部16は、異なる組合せの第一組及び第二組を有するグラマーデータを複数作成するようになっている。本実施形態では、キーワード管理DB14は、ユーザID及び特徴量時系列の組として、「1」及び「時系列データA1」、「1」及び「時系列データB1」、「2」及び「時系列データA2」、「3」及び「時系列データA3」の4つの第一組を記憶している(図3参照)。また、コマンド管理DB15は、コマンド及び必要認証スコアの組として、「照明点灯」及び「20」、「着信履歴」及び「80」、「音声メモ再生」及び「80」、「音楽再生」及び「40」の4つの第二組を記憶している(図4参照)。このため、データ作成部16のグラマーデータ生成部165は、異なる組合せの第一組及び第二組を有するグラマーデータを複数作成する。
より具体的には、番号「1」から「4」に対応付けて、キーワード管理DB14に保存された識別情報「1」及び時系列データ「時系列データA1」と、コマンド管理DB15に保存された4つのコマンドのそれぞれとを連結させて構成されたグラマーデータが保存されている。番号「1」に対応付けられたグラマーデータ「1/時系列データA1/照明点灯」は、識別番号「1」、時系列データ「時系列データA1」及びコマンド「照明点灯」を連結させて構成されている。ここで、グラマーデータ「1/時系列データA1/照明点灯」において、「1」で表した部分が登録者の識別情報を含む単語グループに相当し、「時系列データA1」で表した部分が登録者が登録した登録キーワードに対する音響的特徴量の時系列データをテンプレートとして含む単語グループに相当し、「照明点灯」で表した部分が識別情報及び時系列データに連結されたコマンドを含む単語グループに相当する。
また、番号「2」に対応付けられたグラマーデータ「1/時系列データA1/着信履歴」は、識別番号「1」、時系列データ「時系列データA1」及びコマンド「着信履歴」を連結させて構成されている。番号「3」に対応付けられたグラマーデータ「1/時系列データA1/音声メモ再生」は、識別番号「1」、時系列データ「時系列データA1」及びコマンド「音声メモ再生」を連結させて構成されている。番号「4」に対応付けられたグラマーデータ「1/時系列データA1/音楽再生」は、識別番号「1」、時系列データ「時系列データA1」及びコマンド「音楽再生」を連結させて構成されている。
また、番号「5」から「8」に対応付けて、キーワード管理DB14に保存された識別情報「1」及び時系列データ「時系列データB1」と、コマンド管理DB15に保存された4つのコマンドのそれぞれとを連結させて構成されたグラマーデータ「1/時系列データB1/照明点灯」などが保存されている。また、番号「9」から「12」に対応付けて、キーワード管理DB14に保存された識別情報「2」及び時系列データ「時系列データA2」と、コマンド管理DB15に保存された4つのコマンドのそれぞれとを連結させて構成されたグラマーデータ「2/時系列データA2/照明点灯」などが保存されている。また、番号「13」から「16」に対応付けて、キーワード管理DB14に保存された識別情報「3」及び時系列データ「時系列データA3」と、コマンド管理DB15に保存された4つのコマンドのそれぞれとを連結させて構成されたグラマーデータ「3/時系列データA3/照明点灯」などが保存されている。
このように、グラマーデータ生成部165は、時系列データの後にコマンドを連結してグラマーデータを作成する。グラマーデータを構成する時系列データには、登録キーワードが含まれている。したがって、データ作成部16は、登録キーワードの後にコマンドを連結してグラマーデータを作成する。登録キーワードは、例えば家庭用ロボットとしての電子機器1の所定機能(例えば「照明点灯」や「音楽再生」など)を起動させるために、使用者が電子機器1に呼びかける言葉に相当する。また、コマンドは、電子機器1で起動させたい機能に相当する。このため、一般的に使用者は、電子機器1の所定機能を起動させるために、まず電子機器1へ呼びかけた後に起動させる機能を発話する。登録キーワードの後にコマンドが連結された構成のグラマーデータは、使用者のこの一連の発話の流れに一致するため、後述する照合取得部17での照合処理の負荷を低減できる。
図5に戻って、データ作成部16は、グラマーデータ保存部166から入力されたグラマーデータを照合取得部17に出力する出力部167を有している。
次に、照合取得部17の具体的な構成について図7を用いて説明する。図7では、理解を容易にするため、電子機器1に設けられ、照合取得部17に接続されたデータ作成部16、音響解析生成部13、音響モデル記憶部10及び判定部18が併せて図示されている。
図7に示すように、照合取得部17は、データ作成部16から出力されたグラマーデータが入力されるグラマーデータ入力部171と、音響解析生成部13から出力された音響的特徴量の時系列データが入力される時系列データ入力部172と、音響モデル記憶部10から読み出された音響モデルが入力される音響モデル入力部173とを有している。
また、照合取得部17は、グラマーデータ入力部171から入力されたグラマーデータを一時的に保存するグラマーデータ保存部174を有している。グラマーデータ保存部174は、データ作成部16に設けられたグラマーデータ保存部166と同じデータベース構造を有している。また、グラマーデータ保存部166に保存された全てのグラマーデータがグラマーデータ入力部171から入力されるため、最終的にグラマーデータ保存部174には、グラマーデータ保存部166に保存されたのと同じグラマーデータが全て保存されることになる。
照合取得部17は、グラマーデータ保存部174から入力されたグラマーデータに含まれる登録キーワードに対する音響的特徴量の時系列データ(以下、「登録時系列データ」と称する場合がある)と、時系列データ入力部172から入力された音響的特徴量の時系列データ(以下、「照合対象時系列データ」と称する場合がある)とを照合するキーワード照合部175を有している。
キーワード照合部175は、グラマーデータ保存部174から入力された1つ目のグラマーデータと、時系列データ入力部172から入力された時系列データとをセットする。キーワード照合部175は、セットした登録時系列データと、セットした照合対象時系列データとの一致度を距離計算などを利用して計算する。キーワード照合部175は、音声区間検出アルゴリズムが音声終端を検出するまで登録時系列データと照合対象時系列データとの一致度を計算する。キーワード照合部175は、計算された一致度を、グラマーデータに含まれる登録キーワードと照合対象時系列データの一部(使用者の発話から抽出された抽出データの一部の一例)との一致度を示す認識認証スコアとして取得する。キーワード照合部175は、グラマーデータ保存部174に保存された全てのグラマーデータと照合対象時系列データとを照合して各グラマーデータに対して認識認証スコアを取得する。
図7に示すように、照合取得部17は、キーワード照合部175から入力された認識登録キーワード情報を保存する最高スコア保存部177を有している。認識登録キーワード情報には、照合取得部17で取得された認識認証スコアと、認識認証スコアが取得されたグラマーデータに含まれる登録者の識別情報とが対応付けて含まれている。キーワード照合部175は、認識登録キーワード情報を取得すると、取得した認識認証スコアを含む認識登録キーワード情報を最高スコア保存部177に逐次出力する。
最高スコア保存部177は、キーワード照合部175から認識登録キーワード情報が入力されると、入力された認識登録キーワード情報に含まれる認識認証スコアとすでに保存している認識登録キーワード情報に含まれた認識認証スコアとを比較する。最高スコア保存部177は、入力された認識認証スコアの方がすでに保存されている認識認証スコア以上であると判定すると、入力された認識認証スコアを最高スコアと認定し入力された認識登録キーワード情報を保存する。一方、最高スコア保存部177は、入力された認識認証スコアの方がすでに保存されている認識認証スコアよりも小さいと判定すると、入力された認識登録キーワード情報を破棄し、すでに保存されている認識認証スコアを最高スコアとして維持する。このように、照合取得部17に設けられた最高スコア保存部177は、複数のグラマーデータのうち、認識コマンドと同一と判定されるコマンドを含み、かつ取得した認識認証スコアの値が最も高いグラマーデータを選択して保存するようになっている。
本実施形態による電子機器1は、キーワード管理DB14に保存されている全てのキーワードについてグラマーデータをそれぞれ作成し、作成した全てのグラマーデータと使用者の発話に基づく時系列データとを比較して、最高スコアの認識認証スコアを選択して保存するようになっている。これにより、電子機器1は、最高スコアの認識認証スコアに関連づけられた登録者を特定できる。このように、電子機器1は、キーワード管理DB14に保存されている全てのキーワードを用いて、電子機器1の所定機能を起動させようとする使用者を話者識別により特定するようになっている。
図7に示すように、照合取得部17は、グラマーデータ保存部174から入力されたグラマーデータに含まれるコマンド(以下、「保存コマンド」と称する場合がある)と、時系列データ入力部172から入力された音響的特徴量の時系列データとを照合するコマンド照合部176を有している。
コマンド照合部176は、時系列データ入力部172から入力された時系列データをセットする。また、コマンド照合部176は、照合対象時系列データに含まれるコマンドの認識を不特定話者音声認識として行うために、必要な音響モデルデータを音響モデル記憶部10から読み出して、読み出した音響モデルデータをセットする。コマンド照合部176は、例えばコマンド管理DB15に保存されている4つのコマンド(「照明点灯」、「着信履歴」、「音声メモ再生」及び「音楽再生」)を認識するために必要な音響モデルデータを音響モデル記憶部10から読み出してセットする。
コマンド照合部176は、セットした音響モデルデータを用いて照合対象時系列データに含まれるコマンドを抽出する。つまり、照合取得部17は、音響モデルデータを用いて照合対象時系列データの少なくとも一部(抽出データの残部の少なくとも一部の一例)に含まれるコマンドの種別を判別する。ここで、コマンドの種別は、コマンド管理DB15に保存されているコマンドの種別(本例では、「照明点灯」、「着信履歴」、「音声メモ再生」及び「音楽再生」)を意味する。コマンド照合部176は、音声区間検出アルゴリズムが音声終端を検出するまでコマンドの抽出処理を実行する。コマンド照合部176は、抽出したコマンドを、使用者の発話から抽出された抽出データの残部の少なくとも一部から認識された認識コマンドとして取得する。
図7に示すように、照合取得部17は、最高スコア保存部177から入力された認識登録キーワード情報と、コマンド照合部176から入力された認識コマンドとを判定部18に出力する出力部178を有している。
次に、判定部18の具体的な構成について図8を用いて説明する。図8では、理解を容易にするため、電子機器1に設けられ、判定部18に接続されたコマンド管理DB15、照合取得部17及び制御部19が併せて図示されている。
図8に示すように、判定部18は、コマンド管理DB15、照合取得部17及び制御部19との間で所定のデータを入出力する入出力部181と、入出力部181に接続された必要認証スコア取得部183とを有している。
必要認証スコア取得部183には、照合取得部17から出力された認識登録キーワード情報及び認識コマンドが入出力部181を介して入力される。必要認証スコア取得部183は、入力された認識コマンドに対応付けてコマンド管理DB15に記憶された必要認証スコアを入出力部181を介して取得するようになっている。必要認証スコア取得部183に入力された認識コマンドが例えば「照明点灯」であるとすると、必要認証スコア取得部183は、コマンド「照明点灯」に対応付けてコマンド管理DB15に記憶された必要認証スコア「20」(図4参照)を入出力部181を介して取得する。
図8に示すように、判定部18は、必要認証スコア取得部183に接続されたスコア比較部185を有している。スコア比較部185には、必要認証スコア取得部183から出力された認識登録キーワード情報、認識コマンド及び必要認証スコアが入力される。スコア比較部185は、認識登録キーワード情報に含まれている認識認証スコアと、必要認証スコアとを比較する。つまり、判定部18は、照合取得部17の最高スコア保存部177で選択されたグラマーデータから取得された認識認証スコアと、照合取得部17のコマンド照合部176で照合対象時系列データの少なくとも一部(抽出データの残部の少なくとも一部の一例)に含まれるコマンドと同一と判定されたコマンドと同一と判定された認証コマンドに関連づけられた必要認証スコアとを比較するようになっている。
図8に示すように、判定部18は、スコア比較部185に接続された判定信号生成部187を有している。判定信号生成部187には、認識認証スコア及び必要認証スコアの比較結果と、認識コマンドがスコア比較部185から入力される。判定信号生成部187は、認識認証スコアが必要認証スコア以上であるという比較結果がスコア比較部185から入力されたと判定すると、スコア比較部185から入力された認識コマンドが認識されたことを示す判定信号を生成し、生成した判定信号を入出力部181に出力する。一方、判定信号生成部187は、認識認証スコアが必要認証スコアよりも小さいという比較結果がスコア比較部185から入力されたと判定すると、スコア比較部185から入力された認識コマンドが認識されないことを示す判定信号を生成し、生成した判定信号を入出力部181に出力する。
入出力部181に出力された判定信号は、制御部19に入力される。制御部19は、認識コマンドが認識されたことを示す判定信号が入力されたと判定すると、認識コマンドに係る動作を実行する構成要素を起動する。一方、制御部19は、認識コマンドが認識されないことを示す判定信号が入力されたと判定すると、認識コマンドに係る動作を実行する構成要素を起動しない。また、制御部19は、認識コマンドが認識されたか否かによらず判定信号が入力されたと判定すると、照合取得部17のグラマーデータ保存部174及び最高スコア保存部177並びにデータ作成部16の時系列データ保存部163、コマンド保存部164及びグラマーデータ保存部166に保存された各種データを消去する。
上述のグラマーデータはキーワード管理DB14から取得された登録キーワード及びコマンド管理DB15から取得されたコマンドに加えて、さらに登録者を識別する識別情報(以下、「登録者識別情報」と称する場合がある)を含んでいてもよい。
この場合、照合取得部17は、データ作成部16で作成されたグラマーデータ及び電子機器1の使用者の発話から抽出された抽出データを照合し、登録者識別情報を取得してもよい。
さらに、グラマーデータが登録者を識別する識別情報を含む場合であって、コマンド管理DB15が、異なる登録者識別情報に対応付けられた複数の必要認証スコアを一のコマンドに関連づけて記憶可能に構成されていてもよい。このようなコマンド管理DB15は、図9に示すように、「コマンド」、「ユーザID」及び「必要認証スコア」を関連づけて保存できるデータベース構造を有していてもよい。図9中に示す「コマンド」及び「必要認証スコア」は、図4に示すコマンド管理DB15のデータベース構造における「コマンド」及び「必要認証スコア」と同様の内容を示している。また、図9中に示す「ユーザID」は、登録者識別情報を示している。
図9に示すように、本例のコマンド管理DB15には、「コマンド」に格納された複数(図9では4つ)のコマンドのうちの一のコマンド(例えば「音楽再生」)に、「ユーザID」に格納された異なる登録者識別情報(「1」及び「2」)に対応付けられて「必要認証スコア」に格納された複数の必要認証スコア(「40」及び「60」)が関連づけられて記憶されている。
この場合、判定部18は、取得コマンドに関連づけられた必要認証スコアのうち、照合取得部17で取得された識別情報に対応付けられた必要認証スコアが照合取得部17で取得された認識認証スコア以下である場合には取得コマンドが認識されたと判定し、該必要認証スコアが該認識認証スコアよりも大きい場合には取得コマンドが認識されなかったと判定してもよい。
次に、本発明の一実施形態による電子機器の制御方法について図1、図3及び図4を参照しつつ図10を用いて説明する。
(ステップS1)
図10に示すように、電子機器1の音声認識処理では、まずステップS1において、電子機器1に備えられた制御部19は、音声入力部11に音声が入力されたか否かを判定し、音声入力部11に音声が入力されたと判定するとステップS3に処理を移行する。一方、制御部19は、音声入力部11に音声が入力されたと判定するまでステップS1の処理を繰り返し実行する。本実施形態では、制御部19は、電子機器1の電源がパワーダウン状態であっても、あるいは電源がオン状態であっても音声入力部11に音声が入力されたか否かを監視している。
(ステップS3)
ステップS3において、制御部19は、入力された音声から音声区間を検出するために音響解析生成部13を制御する。これにより、音響解析生成部13は、入力された音声から音声区間を検出する。制御部19は、音響解析生成部13が音声区間の検出を終了したと判断すると、処理をステップS5に移行する。
(ステップS5)
ステップS5において、制御部19は、検出された音声区間ごとに音響的特徴量を抽出して時系列データを生成するために音響解析生成部13を制御する。これにより、音響解析生成部13は、音声区間ごとに音響的特徴量の時系列データを生成する。制御部19は、音響解析生成部13が全ての音声区間について音響的特徴量の時系列データを生成したと判断すると、処理をステップS7に移行する。
(ステップS7)
ステップS7において、制御部19は、音声入力の直前又は音声入力の際にテキスト入力部12にテキストが入力されたか否かを判定し、テキストが入力されていると判定するとステップS9に処理を移行し、テキストが入力されていないと判定するとステップS11に処理を移行する。
(ステップS9)
ステップS9において、制御部19は、登録キーワードの登録処理を実行し、ステップS1に処理を戻す。より具体的に、制御部19は、音声入力の直前又は音声入力の際にテキスト入力があると、ステップS1での音声は登録キーワードであると判定し、生成した音響的特徴量の時系列データをキーワード管理DBに出力するように音響解析生成部13を制御する。これにより、ステップS5で生成された音響的特徴量の時系列データ及びステップS7で入力されたと判定されたテキスト(すなわち登録者の識別情報)がキーワード管理DB14で関連づけて保存される。
(ステップS11)
ステップS11において、制御部19は、グラマーデータを作成するためにデータ作成部16を制御する。これにより、データ作成部16は、キーワード管理DB14及びコマンド管理DB15からデータを取得してグラマーデータを作成し、作成した全てのグラマーデータを照合取得部17に出力する。制御部19は、データ作成部16が全てのグラマーデータを照合取得部17に出力したと判断すると、処理をステップS13に移行する。
(ステップS13)
制御部19は、音声入力の直前又は音声入力の際にテキスト入力がないと、ステップS1での音声は電子機器1の所定機能を起動させるための使用者の発話であると判定し、ステップS13において、登録キーワードを照合するために照合取得部17を制御する。これにより、照合取得部17は、入力されたグラマーデータ及び時系列データを比較して最高スコアの認識認証スコアを取得し、取得した認識認証スコア及びこの認識認証スコアに関連づけられた登録者の識別情報を含む認識登録キーワード情報を判定部18に出力する。制御部19は、照合取得部17が認識登録キーワード情報を判定部18に出力したと判断すると、処理をステップS15に移行する。
(ステップS15)
ステップS15において、制御部19は、コマンドを照合するために照合取得部17を制御する。これにより、照合取得部17は、音響モデル記憶部10から読み出した音響モデルデータを用いて入力された時系列データからコマンドを抽出し、抽出したコマンドを認識コマンドとして判定部18に出力する。制御部19は、照合取得部17が認識コマンドを判定部18に出力したと判断すると、処理をステップS17に移行する。
(ステップS17)
ステップS17において、制御部19は、認識認証スコア及び必要認証スコアを比較するために判定部18を制御する。これにより、判定部18は、入力された認識コマンドと同一のコマンドに関連づけられた必要認証スコアをコマンド管理DB15から取得し、取得した必要認証スコアと、入力された認識登録キーワード情報に含まれた認識認証スコアとを比較する。判定部18は、認識認証スコアが必要認証スコア以上であると判定すると処理をステップS19に移行し、認識認証スコアが必要認証スコアよりも小さいと判定すると処理をステップS21に移行する。
(ステップS19)
ステップS19において、判定部18は、認識コマンドを認識したことを示す「コマンド可の判定信号」を生成して制御部19に出力する。制御部19は、コマンド可の判定信号を受信すると、照合取得部17のグラマーデータ保存部174及び最高スコア保存部177並びにデータ作成部16の時系列データ保存部163、コマンド保存部164及びグラマーデータ保存部166に保存された各種データを消去して、処理をステップS1に戻す。さらに、制御部19は、認識コマンドに係る動作を実行する構成要素を起動する。
(ステップS21)
ステップS21において、判定部18は、認識コマンドを認識しないことを示す「コマンド不可の判定信号」を生成して制御部19に出力する。制御部19は、コマンド不可の判定信号を受信すると、照合取得部17のグラマーデータ保存部174及び最高スコア保存部177並びにデータ作成部16の時系列データ保存部163、コマンド保存部164及びグラマーデータ保存部166に保存された各種データを消去して、処理をステップS1に戻す。制御部19は、認識コマンドに係る動作を実行する構成要素を起動しない。なお、制御部19は、コマンド不可の判定信号を受信した場合、コマンドが受け付けられなかったことを報知するように電子機器1を制御してもよい。
次に、本発明の一実施形態による電子機器の制御プログラムについて説明する。
本実施形態による電子機器1の一部の構成は、コンピュータプログラムとして具体化することができる。例えば、音響解析生成部13、キーワード管理DB14、コマンド管理DB15、データ作成部16、照合取得部17、判定部18、制御部19及び音響モデル記憶部10の機能を電子機器の制御プログラムとして実現することができる。したがって、本発明の一部または全ては、ハードウェアまたはソフトウェア(ファームウェア、常駐ソフトウェア、マイクロコード、ステートマシン、ゲートアレイ等を含む)に組み入れることができる。さらに、本発明は、コンピュータ(電子機器に設けられた制御用中央演算処理装置を含む)によって使用可能な、またはコンピュータ可読の記憶媒体上のコンピュータプログラム製品の形態をとることができ、この媒体には、コンピュータによって使用可能な、またはコンピュータ可読のプログラムコードが組み入れられる。コンピュータによって使用可能な、またはコンピュータ可読の媒体は、命令実行システム、装置若しくはデバイスによって、またはそれらとともに使用されるプログラムを、収録する、記憶する、通信する、伝搬する、または搬送することのできる、任意の媒体とすることができる。
以上説明したように、本実施形態による電子機器、電子機器の制御方法及び電子機器の制御プログラムは、ユーザ認証で保護された電子機器の所定機能を起動させるためにユーザ認証を解除しなくても、電子機器の使用者が音声を入力するだけで、ユーザ認証を実行して所望の機能を起動させることができる。このため、本実施形態による電子機器、電子機器の制御方法及び電子機器の制御プログラムによれば、ユーザ認証によって保護された機能を起動するための操作が煩雑になることを防止できる。
また、特許文献1に記載されているようなテキスト独立型ボイスプリントを用いる場合、独立型ボイスプリントの作成負担を軽減するために、利用中の自然な発話でテキスト独立型ボイスプリントを作成すると、利用者以外の人間が発話した音声データが含まれてしまう可能性がある。このため、このように作成されたテキスト独立型ボイスプリントでは、高い認証精度を得ることができない可能性があるという問題を有している。特に、利用中の自然な発話で作成されたテキスト独立型ボイスプリントは、どの程度の認証精度を有しているのかが不明であるため、電子機器の機能にアクセスするための認証精度が得られていない場合、電子機器の使用者はどうすることもできないという問題が生じる。
これに対し、本実施形態による電子機器1は、音声認識コマンドによる電子機器1の制御に話者認証性及び話者識別性を持たせることができる。このため、本実施形態による電子機器1は、テキスト型ボイスプリントを用いる必要がないため、どの程度の認証精度を有しているのかが不明になったり電子機器1の機能にアクセスするための認証精度が得られなくなったりしないので、認証性能の向上を図ることができる。
本実施形態による電子機器1は、使用者が本人の音声で予め登録した音声キーワードと電子機器1を操作するために用意された音声認識コマンドを連続して発話することにより、一度の連続した発話で使用者を認証し、かつ電子機器1の機能の起動操作を行うことができる。音声認識コマンドは、例えば不特定話者音声認識技術によって与えられ、通常、コマンドに対する発音記号を与えることで実現できる。それぞれの音声認識コマンドには、電子機器1の操作のセキュリティーレベルに応じた、音声キーワードとの類似スコア条件(必要認証スコア)を割り当てることによって、コマンド認識にセキュリティー機能を与え、簡便でセキュアな操作が可能になる。
一般に、話者認証のために、ユーザが本人の音声を登録する場合、本人の音声の特徴量を正しく抽出することが必要であるため、静音環境下で登録作業が行われる。この音声登録は、方法にもよるが、通常1回または数回程度の発話で可能であり、ユーザの負担は非常に小さい。一方、話者認証時は、利用する環境(残響環境や雑音環境など)、発話スタイル及び声質変化などが、登録時と離れるほど、特徴量間の距離が大きくなり、話者認証における類似度が低下する。
電子機器の操作内容によっては、要求されるセキュリティーレベルが比較的低くても雑音環境で利用したいものがある。このような機器操作に対応する音声認識コマンドには、低めのキーワード類似スコア条件を付与しておけば、音声操作の利便性が向上する。一方、ユーザの情報管理など比較的高いセキュリティーが必要な場合は、比較的静音環境での利用に限定してでも、高めのキーワード類似スコア条件を付与し、セキュリティーを確保したい場合がある。
本実施形態による電子機器1は、話者認証ではなく話者識別により電子機器1の使用者の認識認証スコアを取得し、取得した認識認証スコアと、この使用者が機動開始を望む機能に係るコマンドに関連づけられた必要認証スコアとに基づいて当該機能の起動開始が可能か否かを判定することにより、当該機能のセキュリティーを確保することができる。したがって、本実施形態による電子機器1によれば、利用環境に制限されずに、所定機能の起動に対して安定したセキュリティーレベルを確保できる。
本発明は、上記実施形態に限らず種々の変形が可能である。
上記実施形態では、データ作成部16は、登録者の識別情報、音響的特徴量の時系列データ及びコマンドで構成されたグラマーデータを作成するように構成されているが、本発明はこれに限られない。例えば、データ作成部16は、コマンドに関連づけられた必要認証スコアを含めてグラマーデータを作成するように構成されていてもよい。この場合には、データ作成部16は、登録者の識別情報、音響的特徴量の時系列データ、コマンド及び必要認証スコアで構成されたグラマーデータを作成する。また、必要認証スコアがグラマーデータに含まれているので、照合取得部17は、認識コマンドに関連づけられた必要認証スコアをこの認識コマンドとともに判定部18に出力できる。このため、判定部18は、コマンド管理DB15から必要認証スコアを取得する必要がないため、必要認証スコアと認識認証スコアとの比較処理を簡略化できる。
上記実施形態では、データ作成部16は、登録キーワードに対応する時系列データの後にコマンドを連結してグラマーデータを作成するようになっているが、本発明はこれに限られない。例えば、データ作成部16は、コマンドの後に登録キーワードに対応する時系列データを連結してグラマーデータを作成してもよい。照合取得部17は、グラマーデータから登録キーワードに対応する時系列データとコマンドとをそれぞれ抽出できるので、この場合も認識認証スコアを取得できる。
上記実施形態では、一の機能に対して1つの必要認証スコアが関連づけられているが、本発明はこれに限られない。電子機器1に備えられたコマンド管理DB15は、異なる登録者の識別情報に対応付けられた複数の必要認証スコアを一のコマンドに関連づけて記憶可能に構成されていてもよい。また、電子機器1は例えば、登録者が登録キーワードを登録する際にこの必要認証スコアも登録できるように構成されていてもよい。
例えば、電子機器1としての家庭用ロボットなどに対する呼びかけをキーワードとして家族など複数のユーザが音声キーワード登録を行う場合、音声認識方法では、どのユーザが発話し、どの音声コマンドが認識されたかを知ることができる。この場合、認識された同一コマンドに対し、電子機器の動作をユーザごとに変えることができる。たとえば、音声キーワードとしてユーザ1とユーザ2がともに「ももちゃん」を登録し、コマンド「踊って」を認識された場合、ユーザ1とユーザ2では、踊る内容を過去の履歴によって変えることもできる。また、複数のユーザが音声キーワードを登録する場合、一の機能に関連づけられた必要認証スコアをユーザによって設定可能にすることは、ユーザごとのセキュリティーに対する重要性を反映することができて有用である。
1 電子機器
10 音響モデル記憶部
11 音声入力部
12 テキスト入力部
13 音響解析生成部
14 キーワード管理DB
15 コマンド管理DB
16 データ作成部
17 照合取得部
18 判定部
19 制御部
131 音声区間検出部
133 時系列データ生成部
135,167,178 出力部
161 時系列データ入力部
162 コマンド入力部
163 時系列データ保存部
164 コマンド保存部
165 グラマーデータ生成部
166,174 グラマーデータ保存部
171 グラマーデータ入力部
172 時系列データ入力部
173 音響モデル入力部
175 キーワード照合部
176 コマンド照合部
177 最高スコア保存部
181 入出力部
183 必要認証スコア取得部
185 スコア比較部
187 判定信号生成部

Claims (10)

  1. 登録者を識別する識別情報及び該登録者の発話に基づく登録キーワードを関連づけて記憶するキーワード記憶部と、
    異なる前記識別情報に対応付けられた複数の必要認証スコアを一のコマンドに関連づけて記憶可能に構成されて動作内容を規定するコマンド及び該コマンドで規定された動作を実行するか否かの判定に用いられる必要認証スコアを関連づけて記憶するコマンド記憶部と、
    前記キーワード記憶部から取得された登録キーワード及び前記コマンド記憶部から取得されたコマンドを有するグラマーデータを作成するデータ作成部と、
    前記データ作成部で作成されたグラマーデータ及び使用者の発話から抽出された抽出データを照合し、該グラマーデータに含まれる登録キーワードと該抽出データの一部との一致度を示す認識認証スコア及び該抽出データの残部の少なくとも一部から認識された認識コマンドを取得する照合取得部と、
    前記照合取得部で取得された認識コマンドと同一と判定されたコマンドに関連づけられた必要認証スコアが前記照合取得部で取得された認識認証スコア以下である場合には該コマンドが認識されたと判定し、該必要認証スコアが該認識認証スコアよりも大きい場合には該コマンドが認識されなかったと判定する判定部と
    を備える電子機器。
  2. 前記データ作成部は、前記コマンドに関連づけられた必要認証スコアを含めて前記グラマーデータを作成する
    請求項1記載の電子機器。
  3. 前記データ作成部は、前記登録キーワードの後に前記コマンドを連結して前記グラマーデータを作成する
    請求項1又は2に記載の電子機器。
  4. 前記登録者の発話を解析して得られた音響的特徴量で構成された第一時系列データと、前記使用者の発話を解析して得られた音響的特徴量で構成された第二時系列データとを生成する音響解析生成部を備え、
    前記キーワード記憶部は、前記音響解析生成部から入力された前記第一時系列データを前記登録キーワードとして記憶し、
    前記照合取得部は、前記音響解析生成部から入力された前記第二時系列データを前記抽出データとして用いて前記認識認証スコア及び前記認識コマンドを取得する
    請求項1から3までのいずれか一項に記載の電子機器。
  5. 前記音響解析生成部は、前記登録キーワード及び前記コマンドを前記使用者の発話から抽出するために同一の音響的特徴量パラメータを用いる
    請求項4記載の電子機器。
  6. 前記音響解析生成部は、前記登録キーワード及び前記コマンドを前記使用者の発話から抽出するために異なる音響的特徴量パラメータを用いる
    請求項4記載の電子機器。
  7. 前記照合取得部は、音響モデルを用いて前記抽出データの残部の少なくとも一部に含まれる前記コマンドの種別を判別する
    請求項1から6までのいずれか一項に記載の電子機器。
  8. 前記キーワード記憶部が関連づけられた前記識別情報及び前記登録キーワードの組である第一組を複数記憶し、前記コマンド記憶部が前記コマンド及び前記必要認証スコアの組である第二組を複数記憶している場合、
    前記データ作成部は、異なる組合せの前記第一組及び前記第二組を有する前記グラマーデータを複数作成し、
    前記照合取得部は、複数の前記グラマーデータのうち、前記認識コマンドと同一と判定されるコマンドを含み、かつ取得した認識認証スコアの値が最も高いグラマーデータを選択し、
    前記判定部は、選択されたグラマーデータから取得された認識認証スコアと、抽出データの残部の少なくとも一部に含まれるコマンドと同一と判定されたコマンドに関連づけられた必要認証スコアとを比較する
    請求項1から7までのいずれか一項に記載の電子機器。
  9. 登録者を識別する識別情報及び該登録者の発話に基づく登録キーワードを関連づけてキーワード記憶部に記憶し、
    異なる前記識別情報に対応付けられた複数の必要認証スコアを一のコマンドに関連づけて記憶可能に構成されて動作内容を規定するコマンド及び該コマンドで規定された動作を実行するか否かの判定に用いられる必要認証スコアを関連づけてコマンド記憶部に記憶し、
    前記キーワード記憶部から取得された登録キーワード及び前記コマンド記憶部から取得されたコマンドを有するグラマーデータをデータ作成部が作成し、
    前記データ作成部で作成されたグラマーデータ及び使用者の発話から抽出された抽出データを照合し、該グラマーデータに含まれる登録キーワードと該抽出データの一部との一致度を示す認識認証スコア及び該抽出データの残部の少なくとも一部から認識された認識コマンドを照合取得部が取得し、
    前記照合取得部で取得された認識コマンドと同一と判定されたコマンドに関連づけられた必要認証スコアが前記照合取得部で取得された認識認証スコア以下である場合には該コマンドが認識されたと判定し、該必要認証スコアが該認識認証スコアよりも大きい場合には該コマンドが認識されなかったと判定する
    電子機器の制御方法。
  10. コンピュータを、
    登録者を識別する識別情報及び該登録者の発話に基づく登録キーワードを関連づけて記憶するキーワード記憶部、
    異なる前記識別情報に対応付けられた複数の必要認証スコアを一のコマンドに関連づけて記憶可能に構成されて動作内容を規定するコマンド及び該コマンドで規定された動作を実行するか否かの判定に用いられる必要認証スコアを関連づけて記憶するコマンド記憶部、
    前記キーワード記憶部から取得された登録キーワード及び前記コマンド記憶部から取得されたコマンドを有するグラマーデータを作成するデータ作成部、
    前記データ作成部で作成されたグラマーデータ及び使用者の発話から抽出された抽出データを照合し、該グラマーデータに含まれる登録キーワードと該抽出データの一部との一致度を示す認識認証スコア及び該抽出データの残部の少なくとも一部から認識された認識コマンドを取得する照合取得部、及び
    前記照合取得部で取得された認識コマンドと同一と判定されたコマンドに関連づけられた必要認証スコアが前記照合取得部で取得された認識認証スコア以下である場合には該コマンドが認識されたと判定し、該必要認証スコアが該認識認証スコアよりも大きい場合には該コマンドが認識されなかったと判定する判定部
    として機能させる電子機器の制御プログラム。
JP2018550285A 2016-11-11 2017-11-10 電子機器、電子機器の制御方法及び電子機器の制御プログラム Active JP6682007B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016220458 2016-11-11
JP2016220458 2016-11-11
PCT/JP2017/040621 WO2018088534A1 (ja) 2016-11-11 2017-11-10 電子機器、電子機器の制御方法及び電子機器の制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2018088534A1 true JPWO2018088534A1 (ja) 2019-10-10
JP6682007B2 JP6682007B2 (ja) 2020-04-15

Family

ID=62109562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018550285A Active JP6682007B2 (ja) 2016-11-11 2017-11-10 電子機器、電子機器の制御方法及び電子機器の制御プログラム

Country Status (3)

Country Link
US (1) US11416593B2 (ja)
JP (1) JP6682007B2 (ja)
WO (1) WO2018088534A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10916243B2 (en) * 2016-12-27 2021-02-09 Amazon Technologies, Inc. Messaging from a shared device
KR20200100481A (ko) * 2019-02-18 2020-08-26 삼성전자주식회사 생체 정보를 인증하기 위한 전자 장치 및 그의 동작 방법
US11562140B2 (en) * 2021-04-29 2023-01-24 Hewlett Packard Enterprise Development Lp Dynamically configurable templates to support versatile deployment of configurations at network devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000080828A (ja) * 1998-09-07 2000-03-21 Denso Corp 車両制御装置
JP2000099076A (ja) * 1998-09-25 2000-04-07 Fujitsu Ltd 音声認識を活用した実行環境設定装置及び方法
JP2007140048A (ja) * 2005-11-17 2007-06-07 Oki Electric Ind Co Ltd 音声認識システム
WO2015038435A1 (en) * 2013-09-16 2015-03-19 Qualcomm Incorporated Method and apparatus for controlling access to applications
JP2016129011A (ja) * 2011-03-21 2016-07-14 アップル インコーポレイテッド 音声認証を用いたデバイスアクセス

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3340357B2 (ja) 1997-08-25 2002-11-05 三菱電機株式会社 情報処理装置管理システム及び情報処理装置管理方法
JP2002149181A (ja) 2000-11-15 2002-05-24 Sharp Corp 機器制御システム
JP2003228395A (ja) 2002-02-04 2003-08-15 Denso Corp 音声認識による機器制御方法及び音声認識による機器制御装置
JP4672003B2 (ja) * 2005-02-18 2011-04-20 富士通株式会社 音声認証システム
US7640160B2 (en) * 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
JP2008257566A (ja) 2007-04-06 2008-10-23 Kyocera Mita Corp 電子機器
JP5997813B2 (ja) 2015-07-09 2016-09-28 株式会社東芝 話者分類装置、話者分類方法および話者分類プログラム
US10491598B2 (en) * 2016-06-30 2019-11-26 Amazon Technologies, Inc. Multi-factor authentication to access services
US9972318B1 (en) * 2016-09-21 2018-05-15 Amazon Technologies, Inc. Interpreting voice commands
US9959861B2 (en) * 2016-09-30 2018-05-01 Robert Bosch Gmbh System and method for speech recognition
US10027662B1 (en) * 2016-12-06 2018-07-17 Amazon Technologies, Inc. Dynamic user authentication

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000080828A (ja) * 1998-09-07 2000-03-21 Denso Corp 車両制御装置
JP2000099076A (ja) * 1998-09-25 2000-04-07 Fujitsu Ltd 音声認識を活用した実行環境設定装置及び方法
JP2007140048A (ja) * 2005-11-17 2007-06-07 Oki Electric Ind Co Ltd 音声認識システム
JP2016129011A (ja) * 2011-03-21 2016-07-14 アップル インコーポレイテッド 音声認証を用いたデバイスアクセス
WO2015038435A1 (en) * 2013-09-16 2015-03-19 Qualcomm Incorporated Method and apparatus for controlling access to applications

Also Published As

Publication number Publication date
WO2018088534A1 (ja) 2018-05-17
US11416593B2 (en) 2022-08-16
US20190286799A1 (en) 2019-09-19
JP6682007B2 (ja) 2020-04-15

Similar Documents

Publication Publication Date Title
US11594230B2 (en) Speaker verification
US10255922B1 (en) Speaker identification using a text-independent model and a text-dependent model
US10332525B2 (en) Automatic speaker identification using speech recognition features
JP4213716B2 (ja) 音声認証システム
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
JP6682007B2 (ja) 電子機器、電子機器の制御方法及び電子機器の制御プログラム
US11170787B2 (en) Voice-based authentication
KR101181060B1 (ko) 음성 인식 시스템 및 이를 이용한 화자 인증 방법
JP4143541B2 (ja) 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム
US11942094B2 (en) Hybrid multilingual text-dependent and text-independent speaker verification
US11929077B2 (en) Multi-stage speaker enrollment in voice authentication and identification
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
JP4440414B2 (ja) 話者照合装置及び方法
WO2000058947A1 (en) User authentication for consumer electronics
CN117334201A (zh) 一种声音识别方法、装置、设备以及介质
JPH0441837B2 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200324

R150 Certificate of patent or registration of utility model

Ref document number: 6682007

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150