JP2020177108A - コマンド解析装置、コマンド解析方法、プログラム - Google Patents

コマンド解析装置、コマンド解析方法、プログラム Download PDF

Info

Publication number
JP2020177108A
JP2020177108A JP2019078762A JP2019078762A JP2020177108A JP 2020177108 A JP2020177108 A JP 2020177108A JP 2019078762 A JP2019078762 A JP 2019078762A JP 2019078762 A JP2019078762 A JP 2019078762A JP 2020177108 A JP2020177108 A JP 2020177108A
Authority
JP
Japan
Prior art keywords
result
command analysis
command
recognition
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019078762A
Other languages
English (en)
Other versions
JP7151606B2 (ja
Inventor
小林 和則
Kazunori Kobayashi
和則 小林
翔一郎 齊藤
Shoichiro Saito
翔一郎 齊藤
弘章 伊藤
Hiroaki Ito
弘章 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2019078762A priority Critical patent/JP7151606B2/ja
Priority to US17/603,263 priority patent/US20220199083A1/en
Priority to PCT/JP2020/015261 priority patent/WO2020213427A1/ja
Publication of JP2020177108A publication Critical patent/JP2020177108A/ja
Application granted granted Critical
Publication of JP7151606B2 publication Critical patent/JP7151606B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • G10L15/05Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】コマンド実行までの時間を短縮することができるコマンド解析装置を提供する。【解決手段】所定の単位の音声信号が入力される都度、当該音声信号を音声認識して、部分的な音声認識結果(以下、途中結果)を取得する音声認識部と、途中結果を所定の途中結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に、音声信号の入力の最中に解析結果を出力するコマンド解析部を含む。【選択図】図5

Description

本発明は、音声認識結果からどのようなコマンドが発せられたかを解析するコマンド解析装置、コマンド解析方法、プログラムに関する。
非特許文献1に示すような、自動車のインフォテイメントシステムなどの操作を音声認識を使って行うシステムでは、音声認識結果の文字列を解析して、どのようなコマンドが発せられたかを判定する。このシステムでは、定型文のコマンドの判定や、言い回しの違うコマンドの解析も行うことができる。コマンドの解析は、あらかじめ用意されたルールに従って行われる。例えば、“エアコン”、“温度”、“上げる”の組み合わせが含まれる際に、エアコンの温度を上昇させるコマンドであると判定するなどである。図1に、従来技術のコマンド解析装置の構成例を示す。同図に示すように、従来例のコマンド解析装置9は、認識ルール記憶部90aと、音声認識部91と、コマンド解析部92を含む。図2に、従来技術のコマンド解析装置の動作例を示す。音声認識部91は、音声信号を取得して、音声認識を実行し、認識結果を得る(S91)。コマンド解析部92は、認識ルール記憶部90aに記憶された認識ルールに基づいて認識結果からコマンドを解析して出力する(S92)。
西村雅史、倉田岳人、「音声インタフェースの現状とイノベーションの可能性」、情報処理、一般社団法人情報処理学会、平成22年11月、第51巻、第11号、p.1434-1439
従来のコマンド解析は音声認識結果が確定してから行われるため、発話を行ってから、実際にコマンドが実行されるまでにタイムラグが生じることがあった。
そこで本発明では、コマンド実行までの時間を短縮することができるコマンド解析装置を提供することを目的とする。
本発明のコマンド解析装置は、音声認識部と、コマンド解析部を含む。
音声認識部は、所定の単位の音声信号が入力される都度、当該音声信号を音声認識して、部分的な音声認識結果(以下、途中結果)を取得する。コマンド解析部は、途中結果を所定の途中結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に、音声信号の入力の最中に解析結果を出力する。
本発明のコマンド解析装置は、コマンド実行までの時間を短縮することができる。
従来技術のコマンド解析装置の構成例を示すブロック図。 従来技術のコマンド解析装置の動作例を示すフローチャート。 実施例1のコマンド解析装置に入力される発話音声の例1を示す図。 実施例1のコマンド解析装置に入力される発話音声の例2を示す図。 実施例1のコマンド解析装置の構成を示すブロック図。 実施例1のコマンド解析装置の動作を示すフローチャート。 実施例2のコマンド解析装置の構成を示すブロック図。 実施例2のコマンド解析装置の動作を示すフローチャート。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
以下、図3を参照して、実施例1のコマンド解析装置に入力される発話音声、その認識結果(途中結果、最終結果)、コマンドの解析例について説明する。
実施例1のコマンド解析装置は音声信号を入力とし、音声信号から音声認識結果を取得し、事前に設定されたルールに基づいて、コマンドを解析する。本実施例では、コマンド解析のためのルールを2種類、事前に準備する。1つは最終結果用認識ルール、もう1つは途中結果用認識ルールである。
途中結果用認識ルールは部分的な音声認識結果(以下、途中結果という)に対するコマンド解析に利用され、最終結果用認識ルールは、文末を含む音声認識結果(以下、最終結果という)に対してのみ利用される。
途中結果用認識ルールは、音声信号が文末まで未だ達していない(入力されていない)段階、すなわち、音声認識の途中であっても、コマンドを解析(特定)可能なルールであり、最終結果用認識ルールは音声認識の途中ではコマンドを解析(特定)できないルールであるものとする。
図3に例示するように、発話音声「エアコンの温度を22度に設定して」であれば、「えあこんのおんどをにじゅう」まで発話した段階であれば、「エアコンの温度を20…」または「エアコンの温度を2●…」と、二つの可能性が考えられる。また、「えあこんのおんどをにじゅうに」まで発話した段階であれば、「エアコンの温度を20に…」または「エアコンの温度を22…」と、二つの可能性が考えられる。
一方、「えあこんのおんどをにじゅうにど」まで発話した段階では、「エアコンの温度を22度」と確定することができるので、例えば、コマンドの実行主体である“エアコン”、コマンドの実行内容である“温度”、“*度”(ただし*は、エアコン温度の設定範囲の任意の数字とする)が含まれるルールを、途中結果用認識ルールとすることができる。
エアコンの例では、上述の例の他に「エアコンの温度を3度上げて」などの発話音声も考えられる。このような発話音声に対しコマンド解析の誤りを防ぐために、*をエアコン温度の設定範囲(例えば18〜30)に制限したルールとすれば好適である。
一方、図4に例示した発話音声「音楽のボリュームを22にして」に関しては、コマンドの実行主体である“音楽”(“音楽”と発話があった時点において楽音再生中のハードウェア)、コマンドの実行内容である“ボリューム”、“#”(#はボリュームの設定範囲の数字)が含まれるというルールとした場合、「おんがくのぼりゅーむをにじゅう」の段階で「音楽のボリュームを20」という誤ったコマンド解析が行われる可能性がある。
従って、途中結果用認識ルールを“音楽”、“ボリューム”、“#に”とするか、あるいは“音楽”、“ボリューム”、“#”を最終結果用のルールとしなければならない。
なお、上述ではコマンドの実行内容にパラメータ(“#”)が含まれる例を説明したが、これ以外の例も考えられる。例えば、音声信号が「窓をあけて」である場合、コマンドの実行主体は“窓”、コマンドの実行内容は“あけて”であるため、上述したパラメータ“#”を含まない。
以下、図5を参照して実施例1のコマンド解析装置の構成を説明する。同図に示すように本実施例のコマンド解析装置1は、最終結果用認識ルール記憶部10aと、途中結果用認識ルール記憶部10bと、音声認識部11と、コマンド解析部12と、ルール切替部13を含む。
図6を参照して本実施例のコマンド解析装置1の動作を説明する。フローチャートF1に示すように、音声認識部11は、所定の単位の音声信号が入力される都度、当該音声信号を音声認識して、部分的な音声認識結果(以下、途中結果)を取得する(S11a)。コマンド解析部12は、途中結果を、途中結果用認識ルール記憶部10bに記憶された、所定の途中結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に、音声信号の入力の最中に解析結果を出力する(S12a)。
なお、音声認識部11は、部分的な音声認識結果が文末であるか否かを判定して、文末である場合に(F2スタート)、音声認識結果(以下、最終結果)をコマンド解析部12に、文末信号をルール切替部13に出力するものとする(S11b)。ルール切替部13は、文末信号を受信した場合に、途中結果用認識ルールを最終結果用認識ルール記憶部10aに予め記憶された最終結果用認識ルールに切り替える(S13)。コマンド解析部12は、途中結果用認識ルールが最終結果用認識ルールに切り替えられた場合に、最終結果を最終結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に解析結果を出力する(S12b)。
本実施例のコマンド解析装置1によれば、部分的な音声認識結果を途中結果用認識ルールと照合してコマンド解析を実行するため、音声信号の入力の最中に解析結果を出力することができ、コマンド実行までの時間を短縮することができる。
実施例2では、コマンド解析のためのルールを3種類、事前に準備する。最終結果用認識ルール、途中結果用認識ルール、第2の途中結果用認識ルールの3つであり、最終結果用認識ルール、途中結果用認識ルールについては実施例1と同じである。第2の途中結果用認識ルールは、無音区間が検出された場合や、音声認識結果が所定時間に渡り取得されない場合に有効となるルールである。
以下、図7を参照して実施例2のコマンド解析装置の構成を説明する。同図に示すように本実施例のコマンド解析装置2は、最終結果用認識ルール記憶部10aと、途中結果用認識ルール記憶部10bと、第2の途中結果用認識ルール記憶部20cと、音声認識部21と、コマンド解析部22と、ルール切替部23を含み、最終結果用認識ルール記憶部10aと、途中結果用認識ルール記憶部10bについては実施例1と同じである。
図8を参照して本実施例のコマンド解析装置2の動作を説明する。フローチャートF3に示すように、音声認識部21は、部分的な音声認識結果が文末でない場合に、無音区間が所定時間以上継続しているか否か、あるいは新たな音声認識結果が所定時間以上に渡り取得されていないかを判定して、無音区間が所定時間以上継続している場合、あるいは新たな音声認識結果が所定時間以上に渡り取得されていない場合に、無音信号を出力する(S21)。例えば、音声認識部21は、無音区間が継続している時間をカウントして、当該時間が予め設定した閾値(例えば1〜3秒)を超えた場合に、無音信号を出力してもよい。同様に、音声認識部21は、音声認識結果が取得されていない時間をカウントして、当該時間が予め設定した閾値(例えば1〜3秒)を超えた場合に、無音信号を出力してもよい。
人がコマンド文を発話する場合、何も発音をしないポーズの時間は、それほど長くないことが想定される。よって一定時間のポーズがあった場合は、コマンドが確定できる場合がある。
例えば、「音楽のボリュームを20」という文があった場合に、本実施例では、数字の発音の後に長いポーズが入らないということを利用して、“音楽”、“ボリューム”、“#”(#はボリュームの設定範囲の数字)を第2の途中結果用認識ルールとすることで、実施例1の方法よりも早い段階でコマンドを確定できる場合がある。
ルール切替部23は、無音信号を受信した場合に、途中結果用認識ルールを、第2の途中結果用認識ルール記憶部20cに予め記憶された第2の途中結果用認識ルールに切り替える(S23)。コマンド解析部22は、途中結果用認識ルールが第2の途中結果用認識ルールに切り替えられた場合に、途中結果を第2の途中結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に解析結果を出力する(S22)。
なお、音声認識部21は、前述のステップS11a,S11bを、コマンド解析部22は、前述のステップS12a,S12bを、ルール切替部23は、前述のステップS13を場合に応じて実行するものとし、場合に応じて実施例1と同様の動作(フローチャートF1,F2)を実行するものとする。
本実施例のコマンド解析装置2によれば、実施例1の効果に加え、文末以外の状況で音声信号が途切れた場合であっても、部分的な音声認識結果を第2の途中結果用認識ルールと照合してコマンド解析を実行するため、コマンド実行までの時間を短縮することができる。
実施例1、2のコマンド解析装置1、2によれば、単語、もしくはフレーム単位で条件を充たしたか否かが判定され、コマンドが解析されるため、文章単位での構文解析を行わずに、コマンドを解析、出力することができる。
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (5)

  1. 所定の単位の音声信号が入力される都度、当該音声信号を音声認識して、部分的な音声認識結果(以下、途中結果)を取得する音声認識部と、
    前記途中結果を所定の途中結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に、前記音声信号の入力の最中に解析結果を出力するコマンド解析部を含む
    コマンド解析装置。
  2. 請求項1に記載のコマンド解析装置であって、
    前記音声認識部は、
    前記部分的な音声認識結果が文末であるか否かを判定して、文末である場合に前記音声認識結果(以下、最終結果)と文末信号を出力し、
    前記文末信号を受信した場合に、前記途中結果用認識ルールを所定の最終結果用認識ルールに切り替えるルール切替部を含み、
    前記コマンド解析部は、
    前記途中結果用認識ルールが前記最終結果用認識ルールに切り替えられた場合に、前記最終結果を前記最終結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に解析結果を出力する
    コマンド解析装置。
  3. 請求項2に記載のコマンド解析装置であって、
    前記音声認識部は、
    前記部分的な音声認識結果が文末でない場合に、無音区間が所定時間以上継続しているか否か、あるいは新たな前記音声認識結果が所定時間以上に渡り取得されていないかを判定して、前記無音区間が所定時間以上継続している場合、あるいは新たな前記音声認識結果が所定時間以上に渡り取得されていない場合に、無音信号を出力し、
    前記ルール切替部は、
    前記無音信号を受信した場合に、前記途中結果用認識ルールを、第2の途中結果用認識ルールに切り替え、
    前記コマンド解析部は、
    前記途中結果用認識ルールが前記第2の途中結果用認識ルールに切り替えられた場合に、前記途中結果を前記第2の途中結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に解析結果を出力する
    コマンド解析装置。
  4. コマンド解析装置が実行するコマンド解析方法であって、
    所定の単位の音声信号が入力される都度、当該音声信号を音声認識して、部分的な音声認識結果(以下、途中結果)を取得するステップと、
    前記途中結果を所定の途中結果用認識ルールと照合し、コマンドの実行主体および実行内容が解析された場合に、前記音声信号の入力の最中に解析結果を出力するステップを含む
    コマンド解析方法。
  5. コンピュータを請求項1から3の何れかに記載のコマンド解析装置として機能させるプログラム。
JP2019078762A 2019-04-17 2019-04-17 コマンド解析装置、コマンド解析方法、プログラム Active JP7151606B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019078762A JP7151606B2 (ja) 2019-04-17 2019-04-17 コマンド解析装置、コマンド解析方法、プログラム
US17/603,263 US20220199083A1 (en) 2019-04-17 2020-04-03 Command analysis device, command analysis method, and program
PCT/JP2020/015261 WO2020213427A1 (ja) 2019-04-17 2020-04-03 コマンド解析装置、コマンド解析方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019078762A JP7151606B2 (ja) 2019-04-17 2019-04-17 コマンド解析装置、コマンド解析方法、プログラム

Publications (2)

Publication Number Publication Date
JP2020177108A true JP2020177108A (ja) 2020-10-29
JP7151606B2 JP7151606B2 (ja) 2022-10-12

Family

ID=72837793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019078762A Active JP7151606B2 (ja) 2019-04-17 2019-04-17 コマンド解析装置、コマンド解析方法、プログラム

Country Status (3)

Country Link
US (1) US20220199083A1 (ja)
JP (1) JP7151606B2 (ja)
WO (1) WO2020213427A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022259498A1 (ja) * 2021-06-10 2022-12-15 日本電信電話株式会社 学習システム、学習方法及び学習プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160351196A1 (en) * 2015-05-26 2016-12-01 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
WO2019030810A1 (ja) * 2017-08-08 2019-02-14 三菱電機株式会社 音声認識装置および音声認識方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10186254B2 (en) * 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10339917B2 (en) * 2015-09-03 2019-07-02 Google Llc Enhanced speech endpointing
US9922647B2 (en) * 2016-01-29 2018-03-20 International Business Machines Corporation Approach to reducing the response time of a speech interface
DK201770427A1 (en) * 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
JP7229847B2 (ja) * 2019-05-13 2023-02-28 株式会社日立製作所 対話装置、対話方法、及び対話コンピュータプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160351196A1 (en) * 2015-05-26 2016-12-01 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
WO2019030810A1 (ja) * 2017-08-08 2019-02-14 三菱電機株式会社 音声認識装置および音声認識方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
松永悟 他: ""Sync/Mail:話し言葉の漸進的変換に基づく即時応答インタフェース"", 電子情報通信学会技術研究報告, vol. 98, no. 462, JPN6020022748, 10 December 1998 (1998-12-10), pages 33 - 40, ISSN: 0004861553 *
畑崎香一郎 他: ""発話同時理解による音声対話インタフェースの検討"", 日本音響学会研究発表会議講演論文集 −春I−, JPN6020022749, 17 March 1993 (1993-03-17), pages 75 - 76, ISSN: 0004861552 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022259498A1 (ja) * 2021-06-10 2022-12-15 日本電信電話株式会社 学習システム、学習方法及び学習プログラム

Also Published As

Publication number Publication date
US20220199083A1 (en) 2022-06-23
WO2020213427A1 (ja) 2020-10-22
JP7151606B2 (ja) 2022-10-12

Similar Documents

Publication Publication Date Title
JP4427530B2 (ja) 音声認識装置、プログラムおよび音声認識方法
US11430430B2 (en) System and method for determining the compliance of agent scripts
US20140148933A1 (en) Sound Feature Priority Alignment
WO2019065263A1 (ja) 発音誤り検出装置、発音誤り検出方法、プログラム
JP6305955B2 (ja) 音響特徴量変換装置、音響モデル適応装置、音響特徴量変換方法、およびプログラム
JP6280074B2 (ja) 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム
JP6495792B2 (ja) 音声認識装置、音声認識方法、プログラム
JP2017097188A (ja) 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム
JP2018072697A (ja) 音素崩れ検出モデル学習装置、音素崩れ区間検出装置、音素崩れ検出モデル学習方法、音素崩れ区間検出方法、プログラム
WO2020213427A1 (ja) コマンド解析装置、コマンド解析方法、プログラム
JP6996570B2 (ja) 緊急度推定装置、緊急度推定方法、プログラム
CN113782029B (zh) 语音识别模型的训练方法、装置、设备以及存储介质
JP4905522B2 (ja) 機器制御装置、機器制御方法及びプログラム
JP2011107650A (ja) 音声特徴量算出装置、音声特徴量算出方法及び音声特徴量算出プログラム並びに音声認識装置
JP7028203B2 (ja) 音声認識装置、音声認識方法、プログラム
CN115440192A (zh) 一种语音识别系统的测试方法、装置、设备及存储介质
JP6802145B2 (ja) Snr推定装置、snr推定方法、プログラム
WO2021044606A1 (ja) 学習装置、推定装置、それらの方法、およびプログラム
JP7176629B2 (ja) 識別モデル学習装置、識別装置、識別モデル学習方法、識別方法、プログラム
JP2017207546A (ja) 残響環境判定装置、残響環境判定方法、プログラム
JP2011002494A (ja) 音声認識装置とその方法と、プログラムと記録媒体
JP2022010410A (ja) 音声認識装置、音声認識学習装置、音声認識方法、音声認識学習方法、プログラム
CN114387950A (zh) 语音识别方法、装置、设备和存储介质
JP2021139995A (ja) 語学学習支援装置、方法及びプログラム
JPWO2018212055A1 (ja) ドキュメント識別装置、ドキュメント識別方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220912

R150 Certificate of patent or registration of utility model

Ref document number: 7151606

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150