JP2020086096A - 音声対話装置および音声対話システム - Google Patents

音声対話装置および音声対話システム Download PDF

Info

Publication number
JP2020086096A
JP2020086096A JP2018219515A JP2018219515A JP2020086096A JP 2020086096 A JP2020086096 A JP 2020086096A JP 2018219515 A JP2018219515 A JP 2018219515A JP 2018219515 A JP2018219515 A JP 2018219515A JP 2020086096 A JP2020086096 A JP 2020086096A
Authority
JP
Japan
Prior art keywords
voice
signal
response
input
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018219515A
Other languages
English (en)
Other versions
JP7106120B2 (ja
Inventor
伊藤 彰則
Akinori Ito
彰則 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
Original Assignee
Tohoku University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC filed Critical Tohoku University NUC
Priority to JP2018219515A priority Critical patent/JP7106120B2/ja
Publication of JP2020086096A publication Critical patent/JP2020086096A/ja
Application granted granted Critical
Publication of JP7106120B2 publication Critical patent/JP7106120B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】応答音声の誤認識を防止することができる音声対話装置を提供する。【解決手段】利用者の発話音声に反応して音声対話手段4により音声合成された応答音声信号に基づいて、スピーカ5から応答音声を出力する音声対話装置10であって、応答音声信号の可聴帯域外の周波数帯域に、応答音声信号であることを示す識別情報を埋め込む識別情報埋込手段1と、マイクロフォン6から入力される入力音声信号の可聴帯域外の周波数帯域に、識別情報が含まれているか否かを判別する識別情報判別手段2と、識別情報が含まれていると判別された場合に、入力音声信号から少なくとも応答音声信号を除外した音声信号を、音声対話手段4に出力する応答音声除外手段3と、を備える。【選択図】図1

Description

本発明は、音声合成された応答音声を利用者の発話音声に反応して出力する音声対話装置に関する。
近年、利用者が発話する音声を認識し、その音声に対応して音声で応答する音声対話システムが開発されている。音声対話システムは、例えばスマートフォンの情報検索、音楽を再生するスマートスピーカ、ロボット、エンタテインメントなどに利用されている。
図7は、従来の音声対話システムが有する問題点を説明するための模式図である。図7(a)に示すように、従来の音声対話システム81では、スピーカ82から発する自己の応答音声84を利用者89の発話音声85として誤って認識してしまうという問題があった。このような問題を防ぐために、従来の多くの音声対話システムでは、応答音声84を発している間は音声認識を行わず、応答音声84の再生を終了した後に、音声認識の機能を有効化している。従来の音声対話システムは、音声対話システムと利用者とが交互に発話することを想定したシステムであると言える。
一方で、このような音声対話システムを備える機器が普及するにつれ、新たな問題も生じつつある。図7(b)に示すように、例えば、音声対話システム81(81A,81B)が同じ環境に複数台存在する状況では、一方の音声対話システム81Aから発生した応答音声84を、他方の音声対話システム81Bが利用者89の発話音声85と誤認識して作動し、誤認識による誤った応答音声86を再生してしまうという新たな問題が生じる。
このような問題を解決するための技術としては、例えば特許文献1の技術が挙げられる。特許文献1には、音声認識システムを備える機器に利用者が接近したかどうかを、光などを用いる計測手段によって判別し、利用者が接近したときにのみ音声認識を行う方法が開示されている。
特開2003−44089号公報
しかしながら、特許文献1の方法には、利用者が音声対話システムに特定の方向から特定の距離まで接近した場合にしか音声認識ができないという問題がある。特に、スマートスピーカやロボットのように、利用者が発話する様々な方向からの音声を認識する必要がある場合には、スマートスピーカまたはロボットの周囲のすべての方向において認識対象物との距離を計測する必要があるという問題が生じる。これにより、機器が高価になるのみならず、距離計測装置を実装するために機器が大きくなるという問題がある。また、移動型のロボットなどの場合には、ロボットの周囲の環境が大きく変化することにより認識対象物が刻々と変化するので、認識対象物を特定し難いという問題もある。
本発明は、このような従来技術の問題点に鑑みてなされたものであり、その目的は、音声対話システムを備える様々な機器が同じ環境内で応答音声を再生している状況にあっても、応答音声の誤認識を防止することができる音声対話装置を提供することにある。
上記目的を達成するための本発明は、例えば以下に示す態様を含む。
(項1)
利用者の発話音声に反応して音声対話手段(4)により音声合成された応答音声信号に基づいて、スピーカ(5)から応答音声を出力する音声対話装置(10)であって、
応答音声信号の可聴帯域外の周波数帯域に、前記応答音声信号であることを示す識別情報を埋め込む識別情報埋込手段(1)と、
マイクロフォン(6)から入力される入力音声信号の可聴帯域外の周波数帯域に、前記識別情報が含まれているか否かを判別する識別情報判別手段(2)と、
前記識別情報が含まれていると判別された場合に、前記入力音声信号から少なくとも前記応答音声信号を除外した音声信号を、音声対話手段(4)に出力する応答音声除外手段(3)と、
を備える、音声対話装置。
(項2)
前記応答音声除外手段(3)は、前記入力音声信号に前記識別情報が含まれていない場合に、前記入力音声信号を前記音声対話手段(4)に出力する、項1に記載の音声対話装置。
(項3)
前記識別情報判別手段(2)は、
前記入力音声信号の周波数帯域を制限する第1の帯域制限手段(21,26)と、
前記入力音声信号の電力と帯域が制限された前記入力音声信号の電力とを計算する第1の電力計算手段(22,27)と、
前記入力音声信号の電力と帯域が制限された前記入力音声信号の電力との比率に基づいて、前記入力音声信号に前記識別情報が含まれているか否かを判別する判別手段(23,28)と、
を備える、項1または2に記載の音声対話装置。
(項4)
前記応答音声除外手段(3)は、前記入力音声信号に前記識別情報が含まれている場合に、前記入力音声信号をミュートする、項1から3のいずれか一項に記載の音声対話装置。
(項5)
前記応答音声除外手段(3)は、
前記入力音声信号の周波数帯域を制限して、前記入力音声信号を出力する第2の帯域制限手段(31)と、
前記識別情報の判別結果に基づいて、ミュートされた前記入力音声信号と前記入力音声信号とを切り替えて出力する第1の切替手段(32)と、
を備える、項4に記載の音声対話装置。
(項6)
前記識別情報埋込手段(1)は、
前記可聴帯域外の周波数を有する信号を前記応答音声信号に重畳する第1の重畳手段(12)
を備える、項4または5に記載の音声対話装置。
(項7)
前記応答音声除外手段(3)は、前記入力音声信号に前記識別情報が含まれている場合に、前記入力音声信号から前記応答音声信号を差し引いた音声信号を、前記音声対話手段(4)に出力する、項1から3のいずれか一項に記載の音声対話装置。
(項8)
前記応答音声除外手段(3)は、
前記入力音声信号の周波数帯域を制限して、前記入力音声信号を出力する第3の帯域制限手段(34)と、
前記入力音声信号にキャリア信号を乗算して、復調信号を生成する復調手段(35)と、
前記復調信号から応答音声信号を推定する応答音声推定手段(37)と、
推定された前記応答音声信号を前記入力音声信号から差し引く応答音声差引手段(38)と、
前記識別情報の判別結果に基づいて、前記応答音声差引手段(38)の出力と前記入力音声信号とを切り替えて出力する第2の切替手段(39)と、
を備える、項7に記載の音声対話装置。
(項9)
前記識別情報埋込手段(1)は、
前記応答音声信号の周波数帯域を制限する第4の帯域制限手段(15)と、
帯域が制限された前記応答音声信号にキャリア信号を乗算することにより、変調信号を生成する変調手段(16)と、
前記応答音声信号に前記変調信号を重畳することにより、前記応答音声信号の、前記キャリア信号のキャリア周波数を含む周波数帯域に、前記識別情報として前記変調信号を埋め込む第2の重畳手段(17)と、
を備え、
前記変調信号の周波数帯域の上限および下限の周波数が、前記可聴帯域外の周波数である、項7または8に記載の音声対話装置。
(項10)
前記可聴帯域が20Hz〜15kHzの範囲の周波数帯域である、項1から9のいずれか一項に記載の音声対話装置。
(項11)
項1から10のいずれかに記載の音声対話装置の各手段としてコンピュータを機能させるためのプログラム。
(項12)
項1から10のいずれかに記載の音声対話装置(10)と、
入力音声に基づいて、前記音声対話装置(10)に前記入力音声信号を出力するマイクロフォン(6)と、
前記音声対話装置(10)から入力される前記応答音声信号に基づいて、前記応答音声を出力するスピーカ(5)と、
を備える、音声対話システム。
本発明によると、応答音声の誤認識を防止することができる音声対話装置を提供することができる。
本発明の一実施形態に係る音声対話システム100の概略的な構成を説明するためのブロック図である。 一実施形態に係る音声対話手段4の例示的な構成を説明するためのブロック図である。 本発明の第1の実施形態に係る音声対話装置10Aの構成を説明するためのブロック図である。 本発明の第2の実施形態に係る音声対話装置10Bの構成を説明するためのブロック図である。 音声対話装置10の各手段をソフトウェアとして実現する場合の、音声対話装置10のハードウェア構成を示すブロック図である。 識別情報として変調信号を応答音声信号に埋め込んだ場合の音声信号のスペクトルの一例である。 従来の音声対話システムが有する問題点を説明するための模式図である。
以下、本発明の実施形態を、添付の図面を参照して詳細に説明する。なお、以下の説明および図面において、同じ符号は同じまたは類似の構成要素を示すこととし、よって、同じまたは類似の構成要素に関する重複した説明を省略する。
以下の説明において、発話音声とは、音声対話システムまたは音声対話装置を利用する利用者が発する音声を意味する。
応答音声とは、例えばスピーカ等の音声出力手段を介して音声対話システムまたは音声対話装置から出力される音声を意味する。応答音声は、音声対話エンジンの機能により、利用者の発話音声に対する、音声認識(Automatic Speech Recognition: ASR)、言語理解、対話管理、応答文生成、および音声合成(Text To Speech: TTS)の一連の処理がなされた音声とすることができる。
入力音声とは、例えばマイクロフォン等の音声入力手段を介して音声対話装置に入力される音声を意味する。音声対話システムまたは音声対話装置が用いられる環境または状況に応じて、入力音声には、利用者の発話音声が主に含まれる場合があれば、音声対話エンジンによる応答音声が主に含まれる場合もある。入力音声には、発話音声および応答音声の両方が混在して含まれる場合がある。
[概略構成]
図1は、本発明の一実施形態に係る音声対話システム100の概略的な構成を説明するためのブロック図である。
一実施形態に係る音声対話システム100は、音声対話装置10と、スピーカ5と、マイクロフォン6とを備える。
一実施形態に係る音声対話装置10は、利用者の発話音声に反応して応答音声を出力する装置である。応答音声は、音声対話手段4により音声合成された応答音声信号に基づいて、スピーカ5から出力される。
スピーカ5は、音声対話装置10から入力される応答音声信号に基づいて、応答音声を出力する。好ましくは、スピーカ5は、最大で22kHzまでの周波数を有する音声を出力することができる。
マイクロフォン6は、入力音声に基づいて、音声対話装置10に入力音声信号を出力する。好ましくは、マイクロフォン6から出力される入力音声信号は、少なくとも20kHzの周波数成分が含まれるように、40kHz以上のサンプリング周波数でサンプリングされている。
音声対話装置10は、識別情報埋込手段1と、識別情報判別手段2と、応答音声除外手段3と、音声対話手段4とを備える。一実施形態に係る音声対話装置10において、音声対話装置10が備える各手段は、各手段が備える各機能毎に作製された電子回路により実現される。
識別情報埋込手段1は、応答音声信号の可聴帯域外の周波数帯域に、応答音声信号であることを示す識別情報を埋め込む。識別情報は、応答音声の可聴帯域外の周波数帯域に埋め込まれているので、利用者は、識別情報の有無を気にかけることなく、スピーカ5を介して音声対話システムまたは音声対話装置からの応答音声を聞くことができる。
好ましくは、可聴帯域は、20Hz〜15kHzの範囲の周波数帯域とすることができる。好ましくは、可聴帯域外の低周波数側または高周波数側の周波数帯域のうち、高周波数側の周波数帯域に識別情報を埋め込むことが好ましい。好ましくは、識別情報を埋め込む高周波数側の周波数帯域は、15kHz〜20kHzの範囲の周波数帯域とすることができる。
識別情報判別手段2は、マイクロフォン6から入力される入力音声信号の可聴帯域外の周波数帯域に、識別情報が含まれているか否かを判別する。判別の結果、識別情報が含まれていない場合には、音声対話手段4による応答音声が入力音声信号に含まれていない、すなわち入力音声には利用者の発話音声が主に含まれている、と判断される。一方で、識別情報が含まれている場合には、音声対話手段4による応答音声が入力音声信号に含まれている、と判断される。
応答音声除外手段3は、入力音声信号に識別情報が含まれていると判別された場合には、入力音声信号から少なくとも応答音声信号を除外した音声信号を、音声対話手段4に出力する。入力音声信号から少なくとも応答音声信号を除外することは、入力音声信号をミュートすることと、入力音声信号から応答音声信号を差し引いた音声信号を生成することと、の両方を意味する。例示的には、入力音声信号をミュートすることとは、入力音声信号の全体を応答音声信号として除外することを意味する。
一方で、入力音声信号に識別情報が含まれていないと判別された場合には、応答音声除外手段3は、入力音声信号を音声対話手段4に出力する。
図2は、一実施形態に係る音声対話手段4の例示的な構成を説明するためのブロック図である。一実施形態に係る音声対話手段4は、音声認識手段41と、言語理解手段42と、対話管理手段43と、応答文生成手段44と、音声合成手段45とを備える。
音声対話手段4は、入力される音声信号に対して、音声認識(Automatic Speech Recognition: ASR)、言語理解、対話管理、応答文生成、および音声合成(Text To Speech: TTS)の一連の処理を施すことにより、応答音声を生成する。例示的には、音声対話手段4は、公知の音声対話システムにおける公知の音声対話エンジンを用いることができる。音声対話手段4は、全部または一部を人工知能として実現することもできる。
以上、一実施形態に係る音声対話装置10は、応答音声信号であることを示す識別情報に基づいて、音声対話手段4にて処理する音声信号を切り替える。音声対話装置10は、入力音声信号に識別情報が含まれていない場合には、利用者の発話音声が入力音声に主に含まれていると判断して、音声対話手段4により、入力音声に対する応答音声を生成する。一方で、入力音声信号に識別情報が含まれている場合には、音声対話装置10は、自己のまたは他の機器の音声対話手段4から出力された応答音声が入力音声に含まれていると判断して、入力音声信号から少なくとも応答音声信号を除外する。
入力音声信号に識別情報が含まれている場合には、入力音声信号がミュートされて入力音声に対する応答音声が生成されないか、または、入力音声信号から応答音声信号を差し引いた音声信号が生成されて、生成されたその音声信号に対する応答音声が生成される。これにより、音声対話装置10は、応答音声の誤認識を防止することができる。
また、音声対話装置10は、自己のまたは他の機器の音声対話手段4から出力された応答音声が入力音声に含まれていると判断する場合には、入力音声信号から少なくとも応答音声信号を除外する。これにより、音声対話装置10は、自己が発する応答音声を利用者による発話音声として誤って認識するという態様の、自己発話による誤認識を防止することができる。また、音声対話装置10は、複数台が同じ環境内に存在している状況であっても、他の機器が発する応答音声を利用者による発話音声として誤って認識するという態様の誤認識も防止することができる。
また、応答音声信号であることを示す識別情報は、応答音声の可聴帯域外の周波数帯域に埋め込まれている。これにより、利用者は、識別情報の有無に気付くことなく、スピーカ5を介して音声対話システムまたは音声対話装置からの応答音声を聞くことができる。利用者は、応答音声の誤認識に悩まされることなく、音声対話システムまたは音声対話装置を快適に利用することができる。
[第1の実施形態]
第1の実施形態では、音声対話装置10Aは、入力音声信号に識別情報が含まれている場合に、入力音声信号をミュートする。
以下において説明する第1の実施形態では、可聴帯域外の低周波数側または高周波数側の周波数帯域のうち、高周波数側の周波数帯域に識別情報を埋め込む場合を一例として説明する。また、第1の実施形態に係る音声対話装置10Aの構成のうち、一実施形態に係る音声対話装置10と共通する構成は、特に言及しない限り、一実施形態に係る音声対話装置10と同様であるので、重複する説明は省略する。
図3は、本発明の第1の実施形態に係る音声対話装置10Aの構成を説明するためのブロック図である。
第1の実施形態に係る音声対話装置10Aは、識別情報埋込手段1Aと、識別情報判別手段2と、応答音声除外手段3Aと、音声対話手段4とを備える。
識別情報埋込手段1Aは、発振手段11と、重畳手段12とを備える。発振手段11は、可聴帯域外の周波数を有する信号を発振する。重畳手段12は、発振手段11から出力される可聴帯域外の周波数を有する信号を識別情報として、音声対話手段4から出力される応答音声信号に重畳する。
発振手段11が発振する信号の周波数は、可聴帯域外の周波数であり、好ましくは、15kHz〜20kHzの範囲の周波数とすることができる。例示的には、発振手段11は、20kHzの正弦波を出力する。例示的には、発振手段11は発振器とすることができ、重畳手段12は乗算器とすることができる。
その後、可聴帯域外の周波数を有する信号が重畳された応答音声信号は、重畳手段12からスピーカ5に出力され、スピーカ5が、応答音声信号に基づいて応答音声を出力する。
識別情報判別手段2は、帯域制限手段21と、電力計算手段22(22A,22B)と、判別手段23とを備える。
帯域制限手段21は、マイクロフォン6から入力される入力音声信号の周波数帯域を制限する。これにより、重畳された識別情報の周辺の周波数成分を抽出する。好ましくは、帯域制限手段21は、入力音声信号を15kHz〜20kHzの範囲の周波数帯域に制限する。例示的には、帯域制限手段21は、帯域通過フィルタ(Band-PASS Filter)または高域通過フィルタ(High-Pass Filter)とすることができる。
電力計算手段22Aは、帯域制限手段21により帯域が制限された入力音声信号の電力を計算し、電力計算手段22Bは、マイクロフォン6から入力される入力音声信号の電力を計算する。これにより、電力計算手段22Aは、入力音声信号のうち、識別情報に対応する部分の周波数成分の電力を計算し、電力計算手段22Bは、入力音声信号全体の電力を計算する。例示的には、電力計算手段22(22A,22B)は、公知のパワースペクトル密度の計算手法に基づいて、電力を計算する。
判別手段23は、電力計算手段22Aにより計算された電力と、電力計算手段22Bにより計算された電力との比率に基づいて、入力音声信号に識別情報が含まれているか否かを判別する。好ましくは、判別手段23は、電力計算手段22Aにより計算された電力と、電力計算手段22Bにより計算された電力との比率が、所定の閾値よりも大きい場合には、入力音声信号に識別情報が重畳されていると判別する。
判別結果は、応答音声除外手段3Aに出力される。例示的には、判別結果は値「0」または値「1」のBoolean値として表すことができる。例示的には、判別結果の値「0」は、入力音声信号に識別情報が重畳されていることを意味し、判別結果の値「1」は、入力音声信号に識別情報が重畳されていないことを意味することとすることができる。例示的には、判別手段23は比較器とすることができる。
応答音声除外手段3Aは、帯域制限手段31と、切替手段32とを備える。任意の構成として、応答音声除外手段3Aは、ダウンサンプル手段33をさらに備えることができる。
帯域制限手段31は、マイクロフォン6から入力される入力音声信号の周波数帯域を制限する。これにより、入力音声信号中に含まれている識別情報を除去する。好ましくは、帯域制限手段31は、入力音声信号を15kHz以下の周波数帯域に制限する。例示的には、帯域制限手段31は、帯域阻止フィルタ(Band-Elimination Filter)または低域通過フィルタ(Low-Pass Filter)とすることができる。
切替手段32は、判別手段23から入力される識別情報の判別結果に基づいて、ミュートされた入力音声信号と、入力音声信号とを切り替えて出力する。
入力音声信号に識別情報が重畳されていない場合には、利用者の発話音声が入力音声に主に含まれているので、切替手段32は、帯域制限手段31から入力される音声信号を、音声対話手段4に出力する。
一方で、入力音声信号に識別情報が重畳されている場合には、自己のまたは他の機器の音声対話手段4から出力された応答音声が入力音声に含まれている。よって、誤認識を防止するために、切替手段32は、帯域制限手段31から入力される入力音声信号をミュートして、音声対話手段4に出力する。
例示的には、切替手段32は乗算器とすることができる。例示的には、識別情報の判別結果を上記した仕様のBoolean値として表す場合、切替手段32は、帯域制限手段31から入力される入力音声信号と、判別手段23から入力される識別情報の判別結果を表す信号とを乗算することにより、後段の音声対話手段4に適切な出力を提供することができる。
任意の構成として、ダウンサンプル手段33は、切替手段32の出力側に接続され、切替手段32から出力される音声信号を、所定のサンプリング周波数でダウンサンプルして、後段の音声対話手段4に出力する。例示的には、サンプリング周波数は16kHzとすることができる。
音声対話手段4は、一実施形態に係る音声対話装置10と同様の構成とすることができる。
以上、第1の実施形態に係る音声対話装置10Aによると、応答音声信号であることを示す識別情報に基づいて、音声対話手段4にて処理する音声信号を切り替えることができる。
入力音声信号に識別情報が含まれている場合には、入力音声信号がミュートされて入力音声に対する応答音声は生成されない。これにより、音声対話装置10Aは、応答音声の誤認識を防止することができる。
また、音声対話装置10Aは、自己発話による誤認識を防止することができるし、複数台が同じ環境内に存在している状況であっても、他の機器が発する応答音声を利用者による発話音声として誤って認識するという態様の誤認識も防止することができる。
[第2の実施形態]
第2の実施形態では、音声対話装置10Bは、入力音声信号に識別情報が含まれている場合に、入力音声信号から応答音声信号を差し引いた音声信号を、音声対話手段4に出力する。
以下において説明する第2の実施形態では、可聴帯域外の低周波数側または高周波数側の周波数帯域のうち、高周波数側の周波数帯域に識別情報を埋め込む場合を一例として説明する。また、第2の実施形態に係る音声対話装置10Bの構成のうち、一実施形態に係る音声対話装置10と共通する構成は、特に言及しない限り、一実施形態に係る音声対話装置10と同様であるので、重複する説明は省略する。
図4は、本発明の第2の実施形態に係る音声対話装置10Bの構成を説明するためのブロック図である。
第2の実施形態に係る音声対話装置10Bは、識別情報埋込手段1Bと、識別情報判別手段2と、応答音声除外手段3Bと、音声対話手段4とを備える。
識別情報埋込手段1Bは、帯域制限手段15と、変調手段16と、重畳手段17とを備える。任意の構成として、識別情報埋込手段1Bは、アップサンプル手段14をさらに備えることができる。
アップサンプル手段14は、音声対話手段4から出力される応答音声信号を、所定のサンプリング周波数でアップサンプルして、後段の帯域制限手段15および重畳手段17に出力する。例示的には、サンプリング周波数は48kHzまたは44.1kHzとすることができる。好ましくは、アップサンプルする際のサンプリング周波数は、40kHz以上のサンプリング周波数である。これは、少なくとも20kHzの周波数成分が含まれるようにするためである。
帯域制限手段15は、応答音声信号の周波数帯域を制限する。これにより、応答音声信号の周波数帯域は、可聴帯域の主要な周波数帯域に制限される。好ましくは、帯域制限手段15は、3kHz以下の周波数帯域に制限する。例示的には、帯域制限手段15は、2kHz以下の周波数帯域に制限する。例示的には、帯域制限手段15は、低域通過フィルタまたは帯域阻止フィルタとすることができる。
変調手段16は、帯域制限手段15により帯域が制限された応答音声信号にキャリア信号を乗算することにより、変調信号を生成する。好ましくは、キャリア信号のキャリア周波数は、16kHz〜20kHzの範囲の周波数とすることができる。例示的には、キャリア信号は18kHzの正弦波である。例示的には、変調手段16は、キャリア信号を発振する発振器(図示せず)と、乗算器とを用いて構成することができる。
好ましくは、変調信号の周波数帯域は可聴帯域外の周波数である。変調信号の周波数帯域は、キャリア信号のキャリア周波数と、帯域が制限された応答音声信号の周波数帯域とに基づいて定められる。例示的には、キャリア周波数が18kHzであり、応答音声信号の周波数帯域が2kHz以下である場合には、変調信号の周波数帯域は、16kHz〜20kHz(18±2kHz)となる。可聴帯域は、好ましくは20Hz〜15kHzの周波数帯域であるので、例示するこの変調信号の周波数帯域は、可聴帯域外の周波数となっている。
重畳手段17は、応答音声信号に、変調手段16から出力される変調信号を重畳する。これにより、応答音声信号に、識別情報として変調信号が埋め込まれる。変調信号が埋め込まれる周波数帯域は、応答音声信号の、キャリア周波数を含む周波数帯域である。例示的には、重畳手段17は乗算器とすることができる。
例示的には、キャリア周波数が18kHzであり、応答音声信号の周波数帯域が2kHz以下であるので、応答音声信号の16kHz〜20kHz(18±2kHz)の周波数帯域に、変調信号が埋め込まれる。
その後、可聴帯域外の周波数を有する変調信号が重畳された応答音声信号は、重畳手段17からスピーカ5に出力され、スピーカ5が応答音声信号に基づいて応答音声を出力する。
識別情報判別手段2は、第1の実施形態に係る識別情報判別手段2と同様の構成とすることができる。
応答音声除外手段3Bは、帯域制限手段34と、復調手段35と、応答音声推定手段37と、応答音声差引手段38と、切替手段39とを備える。任意の構成として、応答音声除外手段3Bは、ダウンサンプル手段36(36A,36B)をさらに備えることができる。
帯域制限手段34は、マイクロフォン6から入力される入力音声信号の周波数帯域を制限する。これにより、入力音声信号の周波数帯域は、可聴帯域の主要な周波数帯域に制限される。好ましくは、帯域制限手段34は、3kHz以下の周波数帯域に制限する。例示的には、帯域制限手段34は、2kHz以下の周波数帯域に制限する。例示的には、帯域制限手段34は、低域通過フィルタまたは帯域阻止フィルタとすることができる。
復調手段35は、マイクロフォン6から入力される入力音声信号にキャリア信号を乗算することにより、復調信号を生成する。好ましくは、キャリア信号のキャリア周波数は、16kHz〜20kHzの範囲の周波数とすることができる。例示的には、キャリア信号は18kHzの正弦波である。例示的には、復調手段35は、キャリア信号を発振する発振器(図示せず)と、乗算器と、検波器(図示せず)とを用いて構成することができる。検波器には、包絡線検波を行う検波器を用いることができる。
ダウンサンプル手段36Aは、帯域制限手段34の出力側に接続される。ダウンサンプル手段36Aは、帯域制限手段34から出力される、帯域が制限された入力音声信号を、所定のサンプリング周波数でダウンサンプルして、後段の応答音声差引手段38および切替手段39に出力する。例示的には、サンプリング周波数は16kHzとすることができる。
ダウンサンプル手段36Bは、復調手段35の出力側に接続される。ダウンサンプル手段36Bは、復調手段35から出力される復調信号を、所定のサンプリング周波数でダウンサンプルして、後段の応答音声推定手段37に出力する。例示的には、サンプリング周波数は16kHzとすることができる。
応答音声推定手段37は、復調信号から応答音声信号を推定する。自己のまたは他の機器の識別情報埋込手段1Bにおいて、変調信号は、可聴帯域の主要な周波数帯域に制限された応答音声信号に基づいて生成されている。よって、マイクロフォン6から入力される入力音声信号が、自己のまたは他の機器の識別情報埋込手段1Bから出力された応答音声信号を含んでいる場合は、応答音声推定手段37が処理対象とする復調信号も、周波数帯域が可聴帯域の主要な周波数帯域に制限されている。応答音声推定手段37は、この周波数帯域が制限された狭帯域の復調信号から、入力音声信号に含まれていると期待される応答音声信号の全体を推定する。
例示的には、復調信号は、2kHz以下の周波数帯域に制限されている。応答音声推定手段37は、この0〜2kHzの周波数帯域を有する復調信号のスペクトルから、例えば0〜8kHzの周波数帯域を有するスペクトルを推定する。
狭帯域のスペクトルから広帯域のスペクトルを推定する方法には公知の種々の方法があり、応答音声推定手段37には、これら種々の方法を適宜採用することができる。例えば、狭帯域スペクトルから広帯域スペクトルを推定する方法として、電話回線にて使用する0.3〜3.4kHzの音声周波数帯域に関する通話品質向上技術を適用することができる。
識別情報埋込手段1Bにおいて、音声対話手段4から出力される応答音声信号は、帯域制限手段15により、可聴帯域の主要な周波数帯域(例示的には、2kHz以下の周波数帯域)に制限されている。よって、マイクロフォン6から入力される入力音声信号が、自己のまたは他の機器の識別情報埋込手段1Bから出力された応答音声信号を含んでいる場合は、狭帯域のスペクトルから広帯域のスペクトルを推定する方法により、自己のまたは他の機器の音声対話手段4から出力されたと推定される、応答音声信号の全体を推定することが可能となる。
応答音声差引手段38は、応答音声推定手段37により推定された応答音声信号を、入力音声信号から差し引く。これにより、自己のまたは他の機器の音声対話手段4から出力されたと推定される応答音声信号を、入力音声信号から差し引くことができる。例示的には、応答音声差引手段38は減算器とすることができる。
推定された応答音声信号を入力音声信号から差し引いた音声信号には、利用者の発話音声に関する信号が主に含まれている。差し引いた音声信号に含まれている、利用者の発話音声以外の成分としては、例えば周囲の環境音に関する音声信号や、ノイズに関する音声信号が含まれている。
切替手段39は、判別手段23から入力される識別情報の判別結果に基づいて、応答音声差引手段38が出力する、推定された応答音声信号を入力音声信号から差し引いた音声信号と、入力音声信号とを切り替えて出力する。
入力音声信号に識別情報が重畳されていない場合には、利用者の発話音声が入力音声に主に含まれているので、切替手段39は、マイクロフォン6から入力される入力音声信号を、音声対話手段4に出力する。
一方で、入力音声信号に識別情報が重畳されている場合には、自己のまたは他の機器の音声対話手段4から出力された応答音声が入力音声に含まれている。よって、誤認識を防止するために、切替手段39は、推定された応答音声信号を入力音声信号から差し引いた音声信号を、音声対話手段4に出力する。この際に切替手段39が音声対話手段4に出力する音声信号には、利用者の発話音声に関する音声信号が主に含まれている。
音声対話手段4は、一実施形態に係る音声対話装置10と同様の構成とすることができる。
以上、第2の実施形態に係る音声対話装置10Bによると、応答音声信号であることを示す識別情報に基づいて、音声対話手段4にて処理する音声信号を切り替えることができる。
入力音声信号に識別情報が含まれている場合には、推定された応答音声信号を入力音声信号から差し引いた音声信号を、音声対話手段4に出力する。これにより、音声対話手段4には、利用者の発話音声に関する音声信号を主に含む音声信号が入力される。これにより、音声対話装置10Bは、応答音声の誤認識を防止することができる。
また、音声対話装置10Bは、自己発話による誤認識を防止することができるし、複数台が同じ環境内に存在している状況であっても、他の機器が発する応答音声を利用者による発話音声として誤って認識するという態様の誤認識も防止することができる。
そのうえ、音声対話装置10Bは、バージ・イン(barge in)と呼ばれる、音声対話装置10Bの応答と利用者の発話とが重なった場合であっても、応答音声の誤認識を防止することができる。
音声対話装置10Bは、入力音声信号に含まれていると期待される応答音声信号の全体を推定し、推定した応答音声信号を入力音声信号から差し引いて、利用者の発話音声に関する音声信号を主に含む音声信号を音声対話手段4に入力する。これにより、音声対話装置10Bは、バージ・インの状況であっても、利用者の発話音声に関する音声信号を主に含む音声信号を音声対話手段4に入力することができ、利用者の発話音声に対して適切な応答音声を返答することができる。
[第3の実施形態]
第1および第2の実施形態では、音声対話装置10(10A,10B)が備える各手段は、各手段が備える各機能毎に作製された電子回路によりハードウェアとして実現されている。第3の実施形態では、音声対話装置10(10A,10B)が備える各手段の少なくとも一部の機能を、ソフトウェアとして実現する。
図5は、音声対話装置10の各手段をソフトウェアとして実現する場合の、音声対話装置10のハードウェア構成を示すブロック図である。
図5に示すように、音声対話システム100は、音声対話装置10と、スピーカ5と、マイクロフォン6とを備える。任意の構成として、音声対話システム100は、入力部96と、出力部97とを備えることができる。例示的には、音声対話システム100はスマートフォンで構成することができる。例示的には、音声対話装置10は汎用コンピュータで構成することもできる。任意の機能として、音声対話装置10は、ネットワーク99を介して外部サーバ(図示せず)と接続することもできる。
音声対話装置10は、データ処理を行うCPU91と、データ処理の作業領域に使用するメモリ92と、処理データを記録する記録部93と、各部の間でデータを伝送するバス94と、外部機器とのデータの入出力を行うインタフェース部95(以下、I/F部と記す)とを備えている。
入力部96および出力部97は、音声対話装置10に接続されている。例示的には、入力部96はキーボードまたはマウス等の入力装置であり、出力部97は液晶ディスプレイ等の表示装置である。
音声対話装置10は、第1および第2の実施形態において図1〜図4を用いて説明した音声対話装置10の各手段が行う処理を行うためのプログラムを、例えば実行形式(例えばプログラミング言語からコンパイラにより変換されて生成される)で記録部93またはメモリ92に予め記録している。音声対話装置10は、記録部93またはメモリ92に記録したプログラムを使用して処理を行う。または、プログラムは、例えばDVD−ROMやUSBメモリ等の、コンピュータ読み取り可能であって非一時的な有形の記録媒体98から記録部93またはメモリ92にインストールされてもよいし、別所に配置された外部サーバ(図示せず)からネットワーク99を介して記録部93またはメモリ92にインストールされてもよい。
第1および第2の実施形態において音声対話装置10の各手段によって行われていた処理は、本実施形態では、記録部93またはメモリ92に格納されたプログラムに基づいて、CPU91が行う。CPU91はメモリ92を作業領域として必要なデータ(処理途中の中間データ等)を一時記憶し、記録部93に演算結果等の長期保存するデータを適宜記録する。
なお、第1および実施形態において図1〜図4を用いて説明した音声対話装置10では、各手段は電子回路によりハードウェアとして実現されているが、本実施形態では、音声対話装置10が備える各手段の少なくとも一部の機能は、CPU91によりソフトウェア的に実現されている。
[その他の形態]
以上、本発明を特定の実施形態によって説明したが、本発明は上記した実施形態に限定されるものではない。
上記実施形態では、可聴帯域外の低周波数側または高周波数側の周波数帯域のうち、高周波数側の周波数帯域に識別情報を埋め込む場合を一例として説明しているが、識別情報を埋め込む周波数帯域は、可聴帯域外の低周波数側であってもよい。
上記第1の実施形態では、ダウンサンプル手段33は切替手段32の出力側に接続されているが、ダウンサンプル手段33は、帯域制限手段31の出力側に接続されていてもよい。同様に、上記第2の実施形態では、ダウンサンプル手段36Aは帯域制限手段34の出力側に接続され、ダウンサンプル手段36Bは復調手段35の出力側に接続されているが、これら2台のダウンサンプル手段36(36A,36B)に替えて、1台のダウンサンプル手段36を切替手段39の出力側に接続してもよい。
上記実施形態では、音声対話装置10は音声対話手段4を備えているが、音声対話手段4は音声対話装置10内に備えられる必要はない。例えば、外部サーバ(図示せず)が音声対話手段4を備えており、音声対話装置10がネットワーク99を介して外部サーバの音声対話手段4と接続されていてもよい。すなわち、音声対話手段4はクラウド化されていてもよい。また、クラウド化にあたり、音声対話手段4は、音声対話手段4が備える構成の全てがクラウド化される必要はなく、全部または一部がクラウド化されてもよい。
上記実施形態では、音声対話装置10は一体の装置として実現されているが、音声対話装置10は一体の装置である必要はない。音声対話装置10の各手段が別所に配置され、これらがネットワークで接続されていてもよい。音声対話装置10の各手段をソフトウェアとして実現する場合も同様に、CPU91、メモリ92、記録部93等が別所に配置され、これらがネットワークで接続されていてもよい。
また、上記した音声対話装置10の各手段をソフトウェアとして実現する場合において、音声対話装置10の各手段が行う処理は、単一のCPU91で実行されているが、これら各手段が行う処理は、単一のCPU91で実行される必要は必ずしもなく、複数のCPUで分散して処理されてもよい。また、CPU91に代えて、FPGA(Field Programmable Gate Array)が処理を行ってもよいし、例えばGPU(Graphics Processing Unit)をアクセラレータとして用いて、CPU91が行う並列演算処理を補助してもよい。すなわちCPU91が行う処理とは、CPUまたはFPGAが、GPU等のアクセラレータを用いて行う処理も含むことを意味する。
以下に、本発明の実施例を示し、本発明の特徴をより明確にする。
図6に、識別情報として変調信号を応答音声信号に埋め込んだ場合の音声信号のスペクトルの一例を示す。
図6(a)は、音声対話エンジンが出力する応答音声信号を48kHzにアップアンプリングした信号のスペクトルである。図6(b)は、図6(a)に示す信号に情報埋込を行った信号のスペクトルである。
情報埋込は次の手順で行った。まず、2kHzのローパスフィルタにより、図6(a)に示す信号を2kH以下の周波数帯域に制限することにより、2kHz以下に帯域制限された応答音声信号を得た。次に、この2kHz以下に帯域制限された応答音声信号を、18kHzのキャリア周波数で変調することにより、変調信号を得た。最後に、この変調信号を図6(a)に示す信号に重畳することにより情報埋込を行い、図6(b)に示す信号のスペクトルを得た。
図6(b)を参照すると、キャリア周波数に対応する18kHzの周辺に、音響レベル(sound level)が高い周波数成分が存在することが確認される。
図6(b)に示されているように、18kHzの周辺の周波数成分は、ヒトの可聴帯域である20Hz〜15kHzの周波数成分と分離されている。よって、18kHzの周辺の周波数成分は、音声対話エンジンが出力する応答音声信号か否かを表す識別情報として、利用可能であることが確認された。
また、情報埋込時の変調処理により、18kHzの周辺の周波数成分は、音声対話エンジンから出力される応答音声信号に対応する周波数成分である。よって、18kHzの周辺の周波数成分を、変調処理時と同じキャリア周波数で復調することにより、音声対話エンジンから出力される応答音声信号を復元することができる。復元された応答音声信号は、2kHz以下に帯域制限された応答音声信号に対応する周波数成分を有している。よって、狭帯域スペクトルから広帯域スペクトルを推定する公知の方法に基づいて、2kHzのローパスフィルタを適用する前の、音声対話エンジンが出力する応答音声信号を推定することが可能であることが確認された。
100 音声対話システム
1(1A,1B) 識別情報埋込手段
2 識別情報判別手段
3(3A,3B) 応答音声除外手段
4 音声対話手段
5 スピーカ
6 マイクロフォン
10(10A,10B) 音声対話装置
11 発振手段
12 重畳手段
14 アップサンプル手段
15 帯域制限手段
16 変調手段
17 重畳手段
21 帯域制限手段
22(22A,22B) 電力計算手段
23 判別手段
31 帯域制限手段
32 切替手段
33 ダウンサンプル手段
34 帯域制限手段
35 復調手段
36(36A,36B) ダウンサンプル手段
37 応答音声推定手段
38 応答音声差引手段
39 切替手段
81(81A,81B) 従来の音声対話システム
82 スピーカ
83 マイクロフォン
84 応答音声
85 発話音声
86 誤認識による誤った応答音声
89 利用者

Claims (12)

  1. 利用者の発話音声に反応して音声対話手段により音声合成された応答音声信号に基づいて、スピーカから応答音声を出力する音声対話装置であって、
    応答音声信号の可聴帯域外の周波数帯域に、前記応答音声信号であることを示す識別情報を埋め込む識別情報埋込手段と、
    マイクロフォンから入力される入力音声信号の可聴帯域外の周波数帯域に、前記識別情報が含まれているか否かを判別する識別情報判別手段と、
    前記識別情報が含まれていると判別された場合に、前記入力音声信号から少なくとも前記応答音声信号を除外した音声信号を、音声対話手段に出力する応答音声除外手段と、
    を備える、音声対話装置。
  2. 前記応答音声除外手段は、前記入力音声信号に前記識別情報が含まれていない場合に、前記入力音声信号を前記音声対話手段に出力する、請求項1に記載の音声対話装置。
  3. 前記識別情報判別手段は、
    前記入力音声信号の周波数帯域を制限する第1の帯域制限手段と、
    前記入力音声信号の電力と帯域が制限された前記入力音声信号の電力とを計算する第1の電力計算手段と、
    前記入力音声信号の電力と帯域が制限された前記入力音声信号の電力との比率に基づいて、前記入力音声信号に前記識別情報が含まれているか否かを判別する判別手段と、
    を備える、請求項1または2に記載の音声対話装置。
  4. 前記応答音声除外手段は、前記入力音声信号に前記識別情報が含まれている場合に、前記入力音声信号をミュートする、請求項1から3のいずれか一項に記載の音声対話装置。
  5. 前記応答音声除外手段は、
    前記入力音声信号の周波数帯域を制限して、前記入力音声信号を出力する第2の帯域制限手段と、
    前記識別情報の判別結果に基づいて、ミュートされた前記入力音声信号と前記入力音声信号とを切り替えて出力する第1の切替手段と、
    を備える、請求項4に記載の音声対話装置。
  6. 前記識別情報埋込手段は、
    前記可聴帯域外の周波数を有する信号を前記応答音声信号に重畳する第1の重畳手段
    を備える、請求項4または5に記載の音声対話装置。
  7. 前記応答音声除外手段は、前記入力音声信号に前記識別情報が含まれている場合に、前記入力音声信号から前記応答音声信号を差し引いた音声信号を、前記音声対話手段に出力する、請求項1から3のいずれか一項に記載の音声対話装置。
  8. 前記応答音声除外手段は、
    前記入力音声信号の周波数帯域を制限して、前記入力音声信号を出力する第3の帯域制限手段と、
    前記入力音声信号にキャリア信号を乗算して、復調信号を生成する復調手段と、
    前記復調信号から応答音声信号を推定する応答音声推定手段と、
    推定された前記応答音声信号を前記入力音声信号から差し引く応答音声差引手段と、
    前記識別情報の判別結果に基づいて、前記応答音声差引手段の出力と前記入力音声信号とを切り替えて出力する第2の切替手段と、
    を備える、請求項7に記載の音声対話装置。
  9. 前記識別情報埋込手段は、
    前記応答音声信号の周波数帯域を制限する第4の帯域制限手段と、
    帯域が制限された前記応答音声信号にキャリア信号を乗算することにより、変調信号を生成する変調手段と、
    前記応答音声信号に前記変調信号を重畳することにより、前記応答音声信号の、前記キャリア信号のキャリア周波数を含む周波数帯域に、前記識別情報として前記変調信号を埋め込む第2の重畳手段と、
    を備え、
    前記変調信号の周波数帯域の上限および下限の周波数が、前記可聴帯域外の周波数である、請求項7または8に記載の音声対話装置。
  10. 前記可聴帯域が20Hz〜15kHzの範囲の周波数帯域である、請求項1から9のいずれか一項に記載の音声対話装置。
  11. 請求項1から10のいずれかに記載の音声対話装置の各手段としてコンピュータを機能させるためのプログラム。
  12. 請求項1から10のいずれかに記載の音声対話装置と、
    入力音声に基づいて、前記音声対話装置に前記入力音声信号を出力するマイクロフォンと、
    前記音声対話装置から入力される前記応答音声信号に基づいて、前記応答音声を出力するスピーカと、
    を備える、音声対話システム。
JP2018219515A 2018-11-22 2018-11-22 音声対話装置および音声対話システム Active JP7106120B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018219515A JP7106120B2 (ja) 2018-11-22 2018-11-22 音声対話装置および音声対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018219515A JP7106120B2 (ja) 2018-11-22 2018-11-22 音声対話装置および音声対話システム

Publications (2)

Publication Number Publication Date
JP2020086096A true JP2020086096A (ja) 2020-06-04
JP7106120B2 JP7106120B2 (ja) 2022-07-26

Family

ID=70907775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018219515A Active JP7106120B2 (ja) 2018-11-22 2018-11-22 音声対話装置および音声対話システム

Country Status (1)

Country Link
JP (1) JP7106120B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297199A (ja) * 2001-03-29 2002-10-11 Toshiba Corp 合成音声判別方法と装置及び音声合成装置
JP2003044069A (ja) * 2001-07-19 2003-02-14 Samsung Electronics Co Ltd 音声認識による誤動作の防止及び音声認識率の向上が可能な電子機器及び方法
JP2005338454A (ja) * 2004-05-27 2005-12-08 Toshiba Tec Corp 音声対話装置
JP2013093742A (ja) * 2011-10-26 2013-05-16 Hitachi Consumer Electronics Co Ltd 制御端末、電子機器、及び、制御端末における制御方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297199A (ja) * 2001-03-29 2002-10-11 Toshiba Corp 合成音声判別方法と装置及び音声合成装置
JP2003044069A (ja) * 2001-07-19 2003-02-14 Samsung Electronics Co Ltd 音声認識による誤動作の防止及び音声認識率の向上が可能な電子機器及び方法
JP2005338454A (ja) * 2004-05-27 2005-12-08 Toshiba Tec Corp 音声対話装置
JP2013093742A (ja) * 2011-10-26 2013-05-16 Hitachi Consumer Electronics Co Ltd 制御端末、電子機器、及び、制御端末における制御方法

Also Published As

Publication number Publication date
JP7106120B2 (ja) 2022-07-26

Similar Documents

Publication Publication Date Title
US10586534B1 (en) Voice-controlled device control using acoustic echo cancellation statistics
JP6279181B2 (ja) 音響信号強調装置
US9536540B2 (en) Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US8032364B1 (en) Distortion measurement for noise suppression system
US9293133B2 (en) Improving voice communication over a network
JP5183828B2 (ja) 雑音抑圧装置
US9570072B2 (en) System and method for noise reduction in processing speech signals by targeting speech and disregarding noise
US20120022864A1 (en) Method and device for classifying background noise contained in an audio signal
KR100745977B1 (ko) 음성 구간 검출 장치 및 방법
US20200296510A1 (en) Intelligent information capturing in sound devices
WO2014127543A1 (en) Detecting and switching between noise reduction modes in multi-microphone mobile devices
JP2011027825A (ja) 音声処理装置、音声処理方法およびプログラム
US8793128B2 (en) Speech signal processing system, speech signal processing method and speech signal processing method program using noise environment and volume of an input speech signal at a time point
JP2018132624A (ja) 音声対話装置
JP2020086096A (ja) 音声対話装置および音声対話システム
KR101547344B1 (ko) 음성복원장치 및 그 방법
US9210507B2 (en) Microphone hiss mitigation
KR20200095370A (ko) 음성 신호에서의 마찰음의 검출
JP2017216525A (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
JP2014021307A (ja) 音声信号復元装置および音声信号復元方法
KR20200116617A (ko) 주변의 환경에 기초하여 오디오의 전처리 방법을 결정하는 방법 및 장치
JP2017097160A (ja) 音声処理装置、音声処理方法、およびプログラム
CN111145770B (zh) 音频处理方法和装置
JP2017097101A (ja) 雑音除去装置、雑音除去プログラム、及び雑音除去方法
CN111145776B (zh) 音频处理方法和装置

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20181211

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220706

R150 Certificate of patent or registration of utility model

Ref document number: 7106120

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150