JP6517417B1 - 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム - Google Patents

評価システム、音声認識装置、評価プログラム、及び音声認識プログラム Download PDF

Info

Publication number
JP6517417B1
JP6517417B1 JP2018183340A JP2018183340A JP6517417B1 JP 6517417 B1 JP6517417 B1 JP 6517417B1 JP 2018183340 A JP2018183340 A JP 2018183340A JP 2018183340 A JP2018183340 A JP 2018183340A JP 6517417 B1 JP6517417 B1 JP 6517417B1
Authority
JP
Japan
Prior art keywords
language
voice
unit
syllable
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018183340A
Other languages
English (en)
Other versions
JP2020052313A (ja
Inventor
平石 明
明 平石
Original Assignee
株式会社 スプリックス
株式会社 スプリックス
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 スプリックス, 株式会社 スプリックス filed Critical 株式会社 スプリックス
Priority to JP2018183340A priority Critical patent/JP6517417B1/ja
Application granted granted Critical
Publication of JP6517417B1 publication Critical patent/JP6517417B1/ja
Publication of JP2020052313A publication Critical patent/JP2020052313A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】 ある言語(例えば、英語)で音声入力すべき語句や文章を他の言語(例えば、日本語)に存在する音で発音して音声入力した場合にも、発音の精度を厳密に要求することなく、音声入力された語句や文章を評価することができる評価システムを提供する。【解決手段】 音声で入力される語句又は文章を評価する評価システム1は、第1言語(例えば、英語)の音声を入力する音声入力部10と、第1言語の音声が表す語句又は文章を認識する音声認識装置30と、認識された語句又は文章を評価する評価部40とを備える。音声認識装置30は、第1言語の音声が第1言語とは異なる第2言語(例えば、日本語)に存在する音で発音されたものとして語句又は文章を認識する。【選択図】 図1

Description

本発明は、入力された音声を評価する評価システム及び入力された音声を認識する音声認識装置に関する。
人間の音声を聞き取ってテキスト化する音声認識の技術が知られている。この音声認識は、例えば、スマートスピーカ等における音声対話や電子機器の音声操作に利用されている。また、外国語学習の分野では、学習者が音声入力した外国語の発音の評価を行う評価システムにも音声認識の技術が用いられる。この評価システムでは、例えば、正解の発音と入力された音声の発音とのマッチングを行って、そのマッチングスコア(即ち、一致度)に従って入力された音声の発音を評価する(例えば、特許文献1及び2)。
国際公開第2018/033979号 特開2014−38264号公報
しかしながら、音声認識技術を利用した従来の評価システムでは、発音の精度の評価をするものである。したがって、かかる評価システムは、発音の精度を重視せずに外国語のスピーキングの能力を測るシステムとしては適さない。
例えば、所定のテーマについて、あるいは、所定の正解語句について、外国語を用いて口頭で回答するテストをする場合において、発音の精度を厳密に評価してしまうと、当該所定のテーマに沿った内容を伝える文章を生成できているか、あるいは、正解の語句が判っているか、といった能力を測ることはできない。
例えば、日本語を母国語とする日本人についていえば、英語の「r」と「l」とを区別して発音することが難しいと言われている。このため、被評価者の音声を従来の音声認識技術を用いて認識して、正解語句である「lamp」が音声入力されたか否かを評価する場合において、被評価者の発音が正確でないために「ramp」と認識されたときは、当該被評価者の回答は不正解となってしまう。
そこで、本発明は、ある言語(例えば、英語)で音声入力すべき語句や文章を他の言語(例えば、日本語)に存在する音で発音して音声入力した場合にも、発音の精度を厳密に要求することなく、音声入力された語句や文章を評価することができる評価システムを提供することを目的とする。
本発明の一態様の評価システムは、音声で入力される語句又は文章のテキストを評価する評価システムであって、音声を入力する音声入力部と、入力された音声が表す語句又は文章のテキストを認識する音声認識装置と、前記認識された語句又は文章のテキストを評価する評価部とを備え、前記音声認識装置は、第1言語の音声が前記第1言語とは異なる第2言語に存在する音で発音されたものとして前記語句又は文章のテキストを認識する。
この構成により、音声認識装置は、第1言語(例えば、英語)の音声が第2言語(例えば、日本語)に存在する音で発音されたものとして語句又は文章のテキストを認識するので、外国語の発音が母国語の音で発音された場合にも、当該外国語の内容を認識できる。よって、発音の精度を厳密に要求することなく、外国語で音声入力された語句や文章のテキストを評価することができる。
上記の評価システムにおいて、前記音声認識装置は、入力された音声から前記第2言語の音節列を取得する音節取得部と、前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部と、前記第1言語の音節列から前記第1言語の語句又は文章のテキストを認識する認識部とを備えていてよい。
この構成により、第1言語の音声からいったん第2言語の音節列を取得して、その第2言語の音節列を第1言語の音節列に変換するので、第1言語の音声から第1言語の音節列を取得する場合と比較して、第2言語の音で第1言語を発音した場合にも、その音声の内容を正しく認識できる可能性が高くなる。
上記の評価システムにおいて、前記音声認識装置は、入力された音声から前記第1言語の音節列を取得する第2の音節取得部をさらに備えていてよく、前記認識部は、前記第2の音節取得部にて取得された前記第1言語の音節列からも前記第1言語の語句又は文章のテキストを認識してよい。
この構成により、第1言語の音声の発音が正しい場合にも、その音声の内容を正しく認識できる可能性が高くなる。
本発明の一態様の音声認識装置は、第1言語の音声を認識する音声認識装置であって、入力された音声から前記第1言語とは異なる第2言語の音節列を取得する音節取得部と、前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部と、前記第1言語の音節列から前記第1言語の語句又は文章を認識する認識部とを備えている。
この構成により、第1言語の音声からいったん第2言語の音節列を取得して、その第2言語の音節列を第1言語の音節列に変換するので、第1言語の音声から第1言語の音節列を取得する場合と比較して、第2言語の音で第1言語を発音した場合にも、その音声の内容を正しく認識できる可能性が高くなり、発音の精度を厳密に要求することなく、外国語で音声入力された語句や文章を認識することができる。
本発明の一態様の評価システムは、音声で入力される語句又は文章を評価する評価システムであって、音声を入力する音声入力部と、入力された音声が表す語句又は文章を認識する音声認識装置と、前記認識された語句又は文章を評価する評価部とを備え、前記音声認識装置は、第1言語の音声が前記第1言語とは異なる第2言語に存在する音で発音されたものとして前記語句又は文章を認識し、前記音声認識装置は、入力された音声から前記第2言語の音節列を取得する音節取得部と、前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部と、前記第1言語の音節列から前記第1言語の語句又は文章を認識する認識部とを備えている。
本発明の一態様の評価プログラムは、音声で入力される語句又は文章のテキストを評価する評価プログラムであって、コンピュータを、音声を入力する音声入力部、入力された音声が表す語句又は文章のテキストを認識する音声認識装置、及び前記認識された語句又は文章のテキストを評価する評価部として機能させ、前記音声認識装置は、第1言語の音声が前記第1言語とは異なる第2言語に存在する音で発音されたものとして前記語句又は文章のテキストを認識する。
本発明の一態様の評価システムは、音声で入力される語句又は文章を評価する評価システムであって、音声を入力する音声入力部と、入力された音声が表す語句又は文章を認識する音声認識装置と、前記認識された語句又は文章を評価する評価部とを備え、前記音声認識装置は、第1言語の音声が前記第1言語とは異なる第2言語に存在する音で発音されたものとして前記語句又は文章を認識し、前記音声認識装置は、入力された音声から前記第2言語の音節列を取得する音節取得部と、前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部と、前記第1言語の音節列から前記第1言語の語句又は文章を認識する認識部とを備えている。
本発明の一態様の音声認識プログラムは、第1の言語の音声を認識する音声認識プログラムであって、コンピュータを、入力された音声から前記第1言語とは異なる第2言語の音節列を取得する音節取得部、前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部、及び前記第1言語の音節列から前記第1言語の語句又は文章を認識する認識部として機能させる。
本発明によれば、外国語の発音が母国語の音で発音された場合にも、当該外国語の内容を認識できるので、発音の精度を厳密に要求することなく、外国語で音声入力された語句や文章を評価することができる。
図1は、本発明の実施の形態の評価システムの構成を示すブロック図である。 図2は、本発明の実施の形態の音声入力部を示すブロック図である。 図3は、本発明の実施の形態の音声処理部を示すブロック図である。 図4は、本発明の実施の形態の音素認識部を示すブロック図である。 図5は、日本語の音素を示すである。 図6は、本発明の実施の形態の言語変換部及び言語変換辞書を示すブロック図である。 図7は、本発明の実施の形態の認識部を示すブロック図である。 図8は、本発明の実施の形態の評価部を示すブロック図である。 図9は、本発明の実施の形態の評価出力部を示すブロック図である。 図10は、本は発明の実施の形態の変形例の評価システムの構成を示すブロック図である。
以下、本発明の実施の形態の評価システムについて、図面を参照しながら説明する。なお、以下に説明する実施の形態は、本発明を実施する場合の一例を示すものであって、本発明を以下に説明する具体的構成に限定するものではない。本発明の実施にあたっては、実施の形態に応じた具体的構成が適宜採用されてよい。
図1は、本発明の実施の形態の評価システムの構成を示すブロック図である。図1に示すように、評価システム1は、音声入力部10と、音声処理部20と、音声認識装置30と、評価部40と、評価出力部50とを備えている。この評価システム1の上記の機能は、プロセッサ、メモリ、補助記憶装置、各種のインタフェース等を備えたコンピュータが、本実施の形態の評価プログラムを実行することで実現される。
本実施の形態では、評価システム1は、日本語を母国語とする被評価者が外国語である英語の文章を音声入力し、音声入力された英語の文章を評価する。なお、本発明の評価システム1は、文章を評価するシステムに限らず、語句(即ち、単語又はフレーズ)を評価するものであってもよい。また、評価システム1は、英語を評価するものに限らず、他の言語を評価するものであってもよい。更に、評価システム1は、日本語を母国語とする被評価者のためのものに限らず、第1言語の音声を第1言語以外の第2言語を母国語とする被評価者が入力して、第1言語の語句や文章を認識して評価するものであればよい。
本実施の形態では、被評価者には、所定のテーマないし問題が与えられ、被評価者はこれに答える英語の文章を音声で発する。評価システム1は、この評価者の音声を入力して、当該音声をテーマないし問題に則して評価して評価結果を出力する。この評価システム1を用いることで、例えば、被評価者に対して、説明文を与えるとともに、その説明文に関する問題を与えて口頭で答えさせるというテストを行うことができる。
図2は、本発明の実施の形態の音声入力部を示すブロック図である。音声入力部10は、評価者の音声の音波を変換して得られる音声信号を取得する。音声入力部10は、マイク等の音声入力装置を用いて被評価者の音声の音波を電気信号に変換することで音声信号(振幅音声信号)を生成する。具体的には、音声入力部10は、音波、即ち、空気の振動を、時刻を横軸とし、振幅を縦軸とするグラフで表される時系列の振幅音声信号に変換する。なお、音声入力部10は、録音機等によって録音された音声データを読み出すことで振幅音声信号を取得してもよい。
本実施の形態の評価システム1は、日本語を母国語とする被評価者が音声入力した英語の文章を評価するものであるので、音声入力部10には、日本語を母国語とする被評価者が発声した英語の文章が入力される。
図3は、本発明の実施の形態の音声処理部を示すブロック図である。音声処理部20は、音声入力部10で生成された振幅音声信号に対して、音声認識のための種々の処理を行う。例えば、音声処理部20は、音声信号からノイズを除去する処理を行。また、音声処理部20は、音声信号をフーリエ変換することで、横軸を周波数とし、縦軸をパワー(強度)とするグラフで表される電気信号(周波数音声信号)に変換する。
音声処理部20は、更に、周波数音声信号を用いて音声認識の特徴量として、メル周波数ケプストラム係数(Mel-Frequency Cepstrum Coefficients:MFCC)を算出する。音声認識装置30における音声認識では、このMFCCが入力された音声の特徴量として用いられる。
図1に示すように、音声認識装置30は、音節取得部31と、言語変換部32と、認識部33と、言語変換辞書34とを備えている。本実施の形態の音声認識装置30は、英語の音声の特徴量を英語のテキストに変換する。この際に、音声認識装置30は、英語の音声が日本語に存在する音で発音されたものとして語句又は文章を認識する。音声認識装置30の上記の機能は、プロセッサ、メモリ、補助記憶装置、各種のインタフェース等を備えたコンピュータが上記の評価プログラムを実行することで実現される評価システムの一部として実現されてもよいし、プロセッサ、メモリ、補助記憶装置、各種のインタフェース等を備えたコンピュータが、本実施の形態の音声認識プログラムを実行することで、音声認識装置30単体として実現されてもよい。
図4は、本発明の実施の形態の音節取得部を示すブロック図である。音節取得部31は、音声処理部20で生成された特徴量が表す日本語の音素を認識する。図5は、日本語の音素を示す図である。日本語には、5種類の母音、16種類の子音、及び3種類の特殊音素の合計24種類の音素が存在し、これらを組み合わせることで単位音として「ア」(a)、「コ」(ko)「ジャ」(ja)等の音節が作られる。ここで、音節とは、言語を使用する際に認識される音の最小単位をいう。
図4に示すように、音節取得部31は、音声の特徴量から日本語の音素を認識して、それらの音素に基づいて日本語の音節を取得する。即ち、本実施の形態の音節取得部31は、入力されている言語が英語であるにもかかわらず、英語の音素を認識するのではなく、被評価者の母国語の言語の音素を認識して、日本語の音節を取得する。図4の例では、母国語を日本語とする被評価者が「He ran through the hallway.」と発音した音声から、「ヒー ラ ン ス ルー ザ ホー ル ウェ イ」という音節列を取得する。
図6は、本発明の実施の形態の言語変換部及び言語変換辞書を示すブロック図である。言語変換部32は、音節取得部31で取得された日本語の音節を言語変換辞書34を参照して、英語の音節に変換する。このために、言語変換辞書には、日本語の音節に対応する英語の音節が記憶されている。
1つの日本語の音節には少なくとも1つの英語の音節が対応しており、複数の英語の音節が対応していることがある。また、1つの英語の音節が複数の日本語の音節に対応していることもある。したがって、言語変換部32において日本語の音節を英語の音節に変換することで、複数の組み合わせの音節列が生成されることになるが、言語変換部32は、すべての組み合わせの英語の音節列を生成する。
図7は、本発明の実施の形態の認識部のブロック図である。認識部33は、言語変換部32で得られた英語の音節列から、単語ないし文章を認識する。一般的には、言語変換部32によって、複数の音節列が取得されているので、認識部33は、これらの複数の音節列を入力として、それらの音節列に対応する複数の文章、即ち英語の単語列(1単語の場合もある)のテキストを出力する。
このために、認識部33は、隠れマルコフモデル(HMM)、及び/又は深層ニューラルネットモデル(例えば、LSTM(Long Short-Term Memory)等のRNN(Recurrent Neural Network))を用いて単語列の前後関係まで考慮して音節列に対応する文章を推定する。認識部33による文章認識によって、複数の文章がそのスコア(確率)とともに得られる。認識部33は、スコアが所定の閾値を超えている文章を認識結果として出力する。この結果、認識部33が複数の文章を出力することもある。図7の例では、「He ran through the hallway.」という文章と「He run slue the whole way.」という文章とが出力されている。
なお、認識部33は、語句、即ち単語又はフレーズのみを認識するものであってもよい。また、認識部33は、音節と単語との対応関係を記憶したテーブルを参照することで、単語ないし文章を認識してもよい。
図8は、本発明の実施の形態の評価部を示すブロック図である。評価部40には、音声認識装置30(の認識部33)から複数の英語の文章が入力される。評価部40は、認識部33から入力された複数の文章を評価する。本実施の形態では、評価部40は、認識部33から入力された複数の文章の各々について、良否の評価を行い、複数の文章の各々に「GOOD」又は「BAD」の評価結果を与える。この評価にも、英語の文章(テキスト列)を入力として、評価結果を出力とするニューラルネットワークモデルを用いてもよいし、ルールベースのモデルを用いてもよい。
図9は、本発明の実施の形態の評価出力部50を示すブロック図である。評価出力部50は、評価部40から評価結果を受けて、最終的な評価を出力する。評価出力部50は、複数の文章に対する複数の評価結果が入力された場合には、そのうちのもっともよい評価を出力する。即ち、本実施の形態では、評価出力部50は、評価結果の中に少なくとも1つの「GOOD」があれば、「GOOD」の評価を出力する。
以上の構成により、評価システム1は、日本語に存在する音で発声された英語の文章を認識することで、可能性のある複数の英語の文章が得た評価のうちの最も良い評価を最終的な評価として出力する。これにより、英語の発音の精度が多少低い場合にも、そのような発音精度の低さを無視して、正当な評価を与えることができる。
以上のように、本発明の実施の形態の音声認識装置30によれば、第言語を母国語とする者が発声した第言語の音声を、第言語の音節列(第言語音節列)として認識した上で、第音節列を第言語の音節列(第言語音節列)に変換して、第言語音節列に対応する第言語の語句又は文章を推定するので、入力された音声の第言語としての発音の精度が低い場合にも、入力された音声を正しく認識することができる。
また、音声認識装置30で認識結果として複数とおりの語句ないし文章が得られた場合に、評価部40は、それらのすべての語句ないし文章を評価し、評価出力部50は、複数の語句ないし文章に対する評価のうちの最も良い評価を最終的な評価結果として出力するので、語句ないし文章の内容が良くても発音が悪いために評価が下がってしまうという状況が生じる可能性を低減できる。
上記から明らかなように、本実施の形態の評価システム1では、入力される評価対象の言語(第1言語)と、当該言語を発生する被評価者の母国語の言語(第2言語)とをあらかじめ設定する必要がある。ただし、上記の実施の形態のように、第1言語は英語に限られず、第2言語が日本語は日本語に限られない。また、評価システムが多言語に対応していてもよく、その場合には、入力される言語(第1言語)と被評価者の母国語の言語(第2言語)とを複数の言語の中から選択してモードを設定した上で評価システム1を運用するようにしてよい。この場合には、音声認識装置30は、モードとして選択可能な複数の第1言語と第2言語との組み合わせに対応できるように構成されている。
図10は、本発明の実施の形態の変形例の評価システムを示すブロック図である。変形例の評価システム1´では、上記の実施の形態の評価システム1と比較すると、音声認識装置30´において、音節取得部31の代わりに、第2言語音節取得部311と第1言語音節取得部312が設けられている。
第2言語音節取得部311は、音節取得部31と同じ構成であり、入力された音声から第2言語の音節を取得する。第1言語音節取得部312は、入力された音声(第1言語)から、当該音声の言語と同じ言語(第1言語)の音節を取得する。日本語を母国語とする被評価者が入力した英語の音声を評価する場合には、第2言語音節取得部311は、上記の音節取得部31の例と同様に、英語の音声から日本語の音節を取得し、第1言語音節取得部312は、英語の音声から英語の音節を取得する。即ち、第1言語音節取得部312は、従来の音声認識における処理と同様の処理を行う。
第2言語音節取得部311で取得された音節列は、言語変換部32において第1言語に変換されて認識部33に入力される。第1言語音節取得部312で取得された音節列は、そのまま認識部33に入力される。認識部33は、言語変換部32から入力された音節列と、第1言語音節取得部312から入力された音節列のすべてについて、上記の実施の形態と同様の認識処理を行うことで、複数の語句又は文章を推定する。
変形例の認識処理部30´によれば、入力された音声の発音の精度が高い場合に、その精度の高さによって逆に認識精度が低下してしまう可能性を低減でき、評価システム1´は、入力音声として、精度の高い発音の音声が入力された場合にも精度の低い発音の音声が入力された場合にも、いずれも正しく評価をすることできる。よって、変形例の評価システム1´は、被評価者の発音の精度が不明である場合に好適に用いられる。
本発明は、外国語の発音が母国語の音で発音された場合にも、当該外国語の内容を認識できるので、発音の精度を厳密に要求することなく、外国語で音声入力された語句や文章を評価することができ、音声で入力される語句又は文章を評価する評価システム等として有用である。
1 評価システム
10 音声入力部
20 音声処理部
30 音声認識装置
31 音節取得部
32 言語変換部
33 認識部
40 評価部
50 評価出力部

Claims (8)

  1. 音声で入力される語句又は文章のテキストを評価する評価システムであって、
    音声を入力する音声入力部と、
    入力された音声が表す語句又は文章のテキストを認識する音声認識装置と、
    前記認識された語句又は文章のテキストを評価する評価部と、
    を備え、
    前記音声認識装置は、第1言語の音声が前記第1言語とは異なる第2言語に存在する音で発音されたものとして前記語句又は文章のテキストを認識する、評価システム。
  2. 前記音声認識装置は、
    入力された音声から前記第2言語の音節列を取得する音節取得部と、
    前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部と、
    前記第1言語の音節列から前記第1言語の語句又は文章のテキストを認識する認識部と、
    を備えた、請求項1に記載の評価システム。
  3. 前記音声認識装置は、入力された音声から前記第1言語の音節列を取得する第2の音節取得部をさらに備え、
    前記認識部は、前記第2の音節取得部にて取得された前記第1言語の音節列からも前記第1言語の語句又は文章のテキストを認識する、請求項2に記載の評価システム。
  4. 第1言語の音声を認識する音声認識装置であって、
    入力された音声から前記第1言語とは異なる第2言語の音節列を取得する音節取得部と、
    前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部と、
    前記第1言語の音節列から前記第1言語の語句又は文章を認識する認識部と、
    を備えた、音声認識装置。
  5. 音声で入力される語句又は文章を評価する評価システムであって、
    音声を入力する音声入力部と、
    入力された音声が表す語句又は文章を認識する音声認識装置と、
    前記認識された語句又は文章を評価する評価部と、
    を備え、
    前記音声認識装置は、第1言語の音声が前記第1言語とは異なる第2言語に存在する音で発音されたものとして前記語句又は文章を認識し、
    前記音声認識装置は、
    入力された音声から前記第2言語の音節列を取得する音節取得部と、
    前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部と、
    前記第1言語の音節列から前記第1言語の語句又は文章を認識する認識部と、
    を備えた、評価システム。
  6. 音声で入力される語句又は文章のテキストを評価する評価プログラムであって、
    コンピュータを、
    音声を入力する音声入力部、
    入力された音声が表す語句又は文章のテキストを認識する音声認識装置、及び
    前記認識された語句又は文章のテキストを評価する評価部、
    として機能させ、
    前記音声認識装置は、第1言語の音声が前記第1言語とは異なる第2言語に存在する音で発音されたものとして前記語句又は文章のテキストを認識する、評価プログラム。
  7. 音声で入力される語句又は文章を評価する評価システムであって、
    音声を入力する音声入力部と、
    入力された音声が表す語句又は文章を認識する音声認識装置と、
    前記認識された語句又は文章を評価する評価部と、
    を備え、
    前記音声認識装置は、第1言語の音声が前記第1言語とは異なる第2言語に存在する音で発音されたものとして前記語句又は文章を認識し、
    前記音声認識装置は、
    入力された音声から前記第2言語の音節列を取得する音節取得部と、
    前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部と、
    前記第1言語の音節列から前記第1言語の語句又は文章を認識する認識部と、
    を備えた、評価システム。
  8. 第1の言語の音声を認識する音声認識プログラムであって、
    コンピュータを、
    入力された音声から前記第1言語とは異なる第2言語の音節列を取得する音節取得部、
    前記第2言語の音節列を前記第1言語の音節列に変換する言語変換部、及び
    前記第1言語の音節列から前記第1言語の語句又は文章を認識する認識部、
    として機能させる、音声認識プログラム。
JP2018183340A 2018-09-28 2018-09-28 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム Active JP6517417B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018183340A JP6517417B1 (ja) 2018-09-28 2018-09-28 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018183340A JP6517417B1 (ja) 2018-09-28 2018-09-28 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム

Publications (2)

Publication Number Publication Date
JP6517417B1 true JP6517417B1 (ja) 2019-05-22
JP2020052313A JP2020052313A (ja) 2020-04-02

Family

ID=66625522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018183340A Active JP6517417B1 (ja) 2018-09-28 2018-09-28 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム

Country Status (1)

Country Link
JP (1) JP6517417B1 (ja)

Also Published As

Publication number Publication date
JP2020052313A (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
US11056097B2 (en) Method and system for generating advanced feature discrimination vectors for use in speech recognition
JP4085130B2 (ja) 感情認識装置
US10163436B1 (en) Training a speech processing system using spoken utterances
US20090182559A1 (en) Context sensitive multi-stage speech recognition
CN111862954B (zh) 一种语音识别模型的获取方法及装置
US20030069729A1 (en) Method of assessing degree of acoustic confusability, and system therefor
JPH09500223A (ja) 多言語音声認識システム
US20070239444A1 (en) Voice signal perturbation for speech recognition
Mouaz et al. Speech recognition of moroccan dialect using hidden Markov models
US20090220926A1 (en) System and Method for Correcting Speech
Ghai et al. Analysis of automatic speech recognition systems for indo-aryan languages: Punjabi a case study
KR20160122542A (ko) 발음 유사도 측정 방법 및 장치
US11676572B2 (en) Instantaneous learning in text-to-speech during dialog
US20070136060A1 (en) Recognizing entries in lexical lists
US11715472B2 (en) Speech-processing system
Kanabur et al. An extensive review of feature extraction techniques, challenges and trends in automatic speech recognition
Kabashima et al. Dnn-based scoring of language learners’ proficiency using learners’ shadowings and native listeners’ responsive shadowings
JP2010197644A (ja) 音声認識システム
KR101145440B1 (ko) 음성인식 기술을 이용한 외국어 말하기 평가 방법 및 시스템
JP6517417B1 (ja) 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム
JP2745562B2 (ja) ノイズ適応形音声認識装置
EP3718107B1 (en) Speech signal processing and evaluation
Balula et al. Automatic speech recognition (ASR) systems for learning Arabic language and Al-quran recitation: a Review
Chen et al. Automatic pronunciation assessment for mandarin chinese: Approaches and system overview
JP2011180308A (ja) 音声認識装置及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180928

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180928

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190417

R150 Certificate of patent or registration of utility model

Ref document number: 6517417

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250