JP7199264B2 - 認識装置、認識方法及びプログラム - Google Patents

認識装置、認識方法及びプログラム Download PDF

Info

Publication number
JP7199264B2
JP7199264B2 JP2019050150A JP2019050150A JP7199264B2 JP 7199264 B2 JP7199264 B2 JP 7199264B2 JP 2019050150 A JP2019050150 A JP 2019050150A JP 2019050150 A JP2019050150 A JP 2019050150A JP 7199264 B2 JP7199264 B2 JP 7199264B2
Authority
JP
Japan
Prior art keywords
score
morse code
sequence
output
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019050150A
Other languages
English (en)
Other versions
JP2020155830A (ja
Inventor
浩司 藤村
大智 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2019050150A priority Critical patent/JP7199264B2/ja
Publication of JP2020155830A publication Critical patent/JP2020155830A/ja
Application granted granted Critical
Publication of JP7199264B2 publication Critical patent/JP7199264B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明の実施形態は認識装置、認識方法及びプログラムに関する。
振幅に揺らぎのあるモールス信号を記号列に変換して、記号列を認識する自動復号技術として、モールス信号のオン・オフを決定する閾値を、モールス信号の振幅に合わせて動的に制御する技術が従来から知られている。
特許第4209374号公報
Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks, ICML2006 A time delay neural network architecture for efficient modeling of long temporal contexts, Interspeech2015 Attention-based models for speech recognition, NIPS2015 EESEN: END-to-end speech recognition using deep RNN models and WFST-based decoding, ASRU2015
しかしながら、従来の認識装置では、間隔に揺らぎのあるモールス信号の区切りを決定して、モールス信号を認識することができなかった。
実施形態の認識装置は、受付部と特徴量算出部とスコア算出部と認識部と出力部とを備える。受付部は、モールス信号を受け付ける。特徴量算出部は、前記モールス信号の特徴を示す特徴量を、所定のフレーム毎に算出する。スコア算出部は、前記特徴量から、前記モールス信号に対応する情報のスコアを示す情報スコアと、前記モールス信号の区切りのスコアを示す区切りスコアとを算出する。認識部は、前記情報スコアと前記区切りスコアとを用いて、前記モールス信号に対応する情報と、前記区切りとを含む出力系列を認識する。出力部は、前記出力系列を出力する。
実施形態の認識装置の機能構成の例を示す図。 実施形態のフレームの例を示す図。 実施形態のLSTMの例を説明するための概略図。 実施形態の出力系列の例を説明するための図。 図4Aの出力系列に対応する表示情報の例を示す図。 実施形態の認識方法の例を示すフローチャート。 実施形態の認識装置のハードウェア構成の例を示す図。
以下に添付図面を参照して、認識装置、認識方法及びプログラムの実施形態を詳細に説明する。
[機能構成の例]
図1は実施形態の復号装置の機能構成の例を示す図である。実施形態の認識装置10は、受付部1、特徴量算出部2、スコア算出部3、認識部4及び出力部5を備える。
受付部1は、モールス信号を受け付ける。受付部1は、例えば4kHzにサンプリングされたモールス信号の入力を受け付ける。
特徴量算出部2は、モールス信号の特徴を示す特徴量を、所定のフレーム毎に算出する。
図2は実施形態のフレームの例を示す図である。図2の例では、モールス信号から、フレーム101a~101cが取得されている。特徴量算出部2は、フレームの開始時刻を少しずつシフトさせながら、各フレームを取得する。
特徴量算出部2は、例えば60点のフレーム幅に対して、36点ずらしながらFFT(Fast Fourier Transform)をかける。そして、特徴量算出部2は、それぞれのフレームに対してナイキスト周波数までの周波数パワー33次元を、前後5フレーム連結し、計363(=33×11)次元の特徴量を、フレーム単位の特徴量として算出する。なお、この特徴量の算出方法は一例であり、FFTをかける前の波形そのものを、特徴量の算出に使ってもよいし、フィルタバンク特徴量など他の特徴量が用いられても良い。
スコア算出部3は、特徴量から、モールス信号に対応する情報のスコアを示す情報スコアと、モールス信号の区切りのスコアを示す区切りスコアとを算出する。
モールス信号に対応する情報は、例えば小文字アルファベットである。また例えば、モールス信号に対応する情報は、大文字アルファベットである。また例えば、モールス信号に対応する情報は、小文字と大文字の混合アルファベットである。また例えば、モールス信号に対応する情報は、数字が混ざっていても良いし、アルファベットに限らず日本語(ひながな、カタカナ及び漢字)や中国語などの表記でも良い。
また、区切りスコアは、例えば単語の区切りを示す単語区切りスコア、音節の区切りを示す音節区切りスコア、文節の区切りを示す文節区切りスコア、及び、文の区切りを示す文区切りスコアの少なくとも1つを含む。
具体的な例としては、スコア算出部3は、例えば特徴量算出部2から特徴量を受け付けると、モールス信号記号リスト内の1つ以上の記号のスコアと、空文字シンボルのスコアと、モールス信号区切りシンボルのスコアとを算出する。モールス信号記号リストは、例えば小文字アルファベット26文字を含む。
スコア算出方法については、スコア算出部3は、例えば特徴量を入力する入力層と、情報スコアと区切りスコアとを出力する出力層とを有するリカレントニューラルネットワークを用いて、情報スコアと、区切りスコアとを算出する。
具体的な例としては、スコア算出部3は、例えばリカレントニューラルネットワークの一種であるLSTM(Long Short-Term Memory)(非特許文献1)を用いる。例えばスコア算出部3は、363次元の特徴量を、モールス信号の記号に対するスコアと、空文字シンボルスコアと、単語区切りシンボルスコアと、文区切りシンボルスコアとを出力とするLSTMに入力する。
LSTMのユニットは512ユニットとし、それを3層積み重ねたものを用いる。また出力層にはSoftmaxを適用する。スコア算出部3は、入力されたフレームに含まれるアルファベット、空文字シンボル及び信号区切りシンボルに対する事後確率をスコアとして算出する。小文字英語アルファベット26文字、空文字シンボル一つ、単語区切りシンボル一つ、文区切りシンボル一つが出力される場合、最終出力はそれぞれの事後確率を表す29次元の出力となる。
ここで、スコア算出部3は、LSTM出力の区切りシンボル(例えば文区切りシンボル)のスコア(事後確率)が閾値より大きい場合にLSTMの内部状態をリセットする。これにより長時間に依存するLSTMの内部状態の影響を取り除くことができる。
なお、スコア算出方法は、ここで示したLSTMに限定されるものではなく、双方向型LSTMや、TDNN(非特許文献2)を適用してもよいし、Attentionモデルを適用してもよい(非特許文献3)。
次に、LSTMのパラメータの学習方法の例について説明する。まず学習用のモールス信号と、当該モールス信号に対応するラベルを複数用意する。単語区切りシンボルを<C>、文区切りシンボルを<S>としたとき、以下のようなラベル列を用意する。
・モールス信号1:hello ラベル:h e l l o <S>
・モールス信号2:this is a pen ラベル:t h i s <C> is <C> a <C> pen <S>
特徴量には、受付部1から出力される363次元の特徴量が用いられる。LSTMのパラメータは、学習用のモールス信号から変換された特徴量を使用して、CTC(Connectionist Temporal Classification)学習(非特許文献1)を用いて学習される。
図3は実施形態のLSTMの例を説明するための概略図である。LSTMには、各フレームの特徴量が入力される。出力系列は、アルファベット、空文字シンボル(blank)、及び、信号区切りシンボル(<区切り>)に対するスコア(事後確率)に基づいて認識される。
認識部4は、情報スコアと区切りスコアとを用いて、モールス信号に対応する情報と、区切りとを含む出力系列を認識する。
具体的には、例えば認識部4は、スコア算出部3により、フレーム毎に算出されたスコア(事後確率)のうち、各フレームで最大のスコアを有する出力対象を、各フレームの出力ラベルとする。
ここで、認識部4は、空文字シンボル(blank)は、出力対象から削除する。また、認識部4は、モールス信号に対応する情報(例えば小文字アルファベット)が連続で続いた場合はそれらを一つにして、出力する。このとき、認識部4は、連続する小文字アルファベットの間に空文字シンボルや、信号区切りシンボルが挿入された場合には一つに変更する処理は行わない。空文字シンボルをΦとし、3フレーム分の出力を処理する場合の例を以下に示す。
・abc → abc
・aaa → a
・aab → ab
・aΦa → aa
・a<C>a → a<C>a
・a<S>a → a<S>a
また、認識部4は、情報スコアと区切りスコアとを用いて、出力系列を複数の系列パターンに分けて認識する。このとき、認識部4は、複数の単語を含む単語リストから、系列パターンにより近い単語を選択することにより、系列パターンを単語に置き換えて認識してもよい。
具体的には、例えば認識部4は、単語区切り、または文区切りが検出された際に、一つ前の単語区切り、文区切り、または文頭から現在検出された区切りまでの記号列(系列パターン)を、あらかじめ用意された単語リストに存在する最も距離の近い単語に置き換える。距離の近さは、単語記号列間の編集距離で測られる。
なお、ここで用いる距離は、Word2Vec(単語をベクトル表現に変換)を単語記号列に適用し、単語記号列をベクトル表現にしてから算出されてもよい。認識部4は、例えば検出された単語記号列のベクトル表現の平均ベクトルと、単語のベクトル表現の平均ベクトルとのベクトル距離などを用いてもよい。なお、検出された単語記号列と、単語リスト内の単語の距離は、これらに限定されるものではなく、その他の距離を使うこともできる。
検出された単語記号列(系列パターン)の置き換え例を以下に示す。
例)commmunication(検出された単語記号列(mが1つ多い))
→communication(単語リスト内にある単語で最も編集距離の近い単語)
<単語リストの例>
・communication
・conversation
・converter
・concert
単語区切りが検出されたか否かの判定には、単語区切りシンボルの事後確率が、あらかじめ定められた閾値より高い場合には検出、低い場合には未検出とする。文区切りの検出についても、単語区切りの場合と同様である。
また、単語リストにある距離の近い単語候補を上位から順にいくつか出力することもできる。例えば、認識部4が、複数の単語を含む単語リストから、系列パターンに近い順に複数の単語を選択し、出力部5が、選択された複数の単語を、系列パターンの候補として出力してもよい。
また、認識部4では、スコア算出部3で得られたスコアと、WFST(非特許文献4)を使って、最終出力を用いてもよい。この時、WFST(Weighted Finite-State Transducer)の構築に使用される記号の連鎖モデルの単位として、記号3つ組の出現確率である記号3グラムなどを用いることができるし、単語3つ組の出現確率である単語3グラムなどを用いることもできる。このとき、最適記号系列を出力するためのモールス信号の時間範囲をファイル先頭または一つ前の文区切りと、次の文区切りに区切って最適なものを出力するようにする。WFSTを用いてスコアの高い複数の候補を出力することもできる。
出力部4は、出力系列を複数の系列パターンに分けて出力する。
具体的には、出力部4は、例えば区切りシンボル<C>をスペースに置き換え、<S>をピリオドに置き換えることにより、出力系列を複数の系列パターンに分けて表示する。この場合、例えば小文字アルファベットとスペースとピリオドとが表示装置に表示される。また、前述の単語リストにある距離の近い単語候補を出力として受け取った場合には、表示装置に単語候補を表示することもできる。また、WFSTを用いた複数の候補も表示することができる。なお、本出力はこれらの限定されるものではなく、表示装置に表示する以外に、テキストファイルに書き込んでもよいし、記号列を音声として出力してもよい。
図4Aは実施形態の出力系列201の例を説明するための図である。空文字スコアが最も高い場合には、ここでは表示を省略する。波形210は、モールス信号を示す。波形211は、空文字スコアを示す。波形211は、情報スコア及び区切りスコアを示す。図4Bは、図4Aの出力系列201に対応する表示情報の例を示す図である。図4Bの表示情報では、出力系列201に含まれる単語区切りシンボル<C>により、出力系列201が、系列パターン202及び系列パターン203に分けられて表示されている。文区切りシンボルはピリオドに置き換えられて表示される。また、「ン」のスコアが連続で4フレーム分、空文字スコアよりも高いため、「ンンンン」と4つ連続して出力されるが、間に空文字スコアが「ン」のスコアより高くなることがないため系列パターン202では一つの「ン」と表示される。系列パターン203の「ッ」、「オ」も同じである。
[認識方法の例]
図5は実施形態の認識方法の例を示すフローチャートである。はじめに、特徴量算出部2が、モールス信号の特徴を示す特徴量を、所定のフレーム毎に算出する(ステップS1)。次に、スコア算出部3が、特徴量から、モールス信号に対応する情報のスコアを示す情報スコアと、モールス信号の区切りのスコアを示す区切りスコアとを算出する(ステップS2)。
次に、認識部4が、情報スコアと区切りスコアとを用いて、モールス信号に対応する情報と、区切りとを含む出力系列を認識する(ステップS3)。次に、認識部4は、出力系列を複数の系列パターンに分けて認識する(ステップS4)。このとき、認識部4は、複数の単語を含む単語リストから、系列パターンにより近い単語を選択することにより、系列パターンを単語に置き換えて認識してもよい。
次に、出力部5が、複数の系列パターンを含む出力系列を出力する(ステップS5)。
以上、説明したように、実施形態の認識装置10では、受付部1が、モールス信号を受け付ける。特徴量算出部2が、モールス信号の特徴を示す特徴量を、所定のフレーム毎に算出する。スコア算出部3が、特徴量から、モールス信号に対応する情報のスコアを示す情報スコアと、モールス信号の区切りのスコアを示す区切りスコアとを算出する。認識部4が、情報スコアと区切りスコアとを用いて、モールス信号に対応する情報と、区切りとを含む出力系列を認識する。そして、出力部5が、出力系列を出力する。
これにより実施形態の認識装置10によれば、間隔に揺らぎのあるモールス信号の区切りを決定して、モールス信号を認識することができる。
具体的には、振幅の揺らぎと、間隔の揺らぎと、を有するモールス信号に、リカレントニューラルネットワークを適用することで、モールス信号の短点、長点、及び、記号区切り間隔の揺らぎを吸収する。さらに、このリカレントニューラルネットワークの出力層にモールス信号記号に対するスコアだけでなく、単語区切りシンボルのスコアを備え、単語区切りに対するスコアを算出する。これらのスコアを用いてモールス信号記号の系列スコアを算出し、最もスコアが高い記号系列を出力する。
これにより、間隔に揺らぎのあるモールス信号の復号を、意味のある単位の分かち書きで出力することができる。すなわち、間隔に揺らぎのあるモールス信号の復号と、モールス信号区切りの決定とを同時に行うことができる。従来の技術では、人が打ったモールス信号などの間隔に揺らぎのあるモールス信号に対して、モールス信号の区切りを決定する手段がなかった。
最後に、実施形態の認識装置10のハードウェア構成の例について説明する。
[ハードウェア構成の例]
図6は実施形態の認識装置10のハードウェア構成の例を示す図である。
認識装置10は、制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306を備える。制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306は、バス310を介して接続されている。
制御装置301は、補助記憶装置303から主記憶装置302に読み出されたプログラムを実行する。主記憶装置302は、ROM(Read Only Memory)、及び、RAM(Random Access Memory)等のメモリである。補助記憶装置303は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及び、メモリカード等である。
表示装置304は表示情報を表示する。表示装置304は、例えば液晶ディスプレイ等である。入力装置305は、コンピュータを操作するためのインタフェースである。入力装置305は、例えばキーボードやマウス等である。コンピュータがスマートフォン及びタブレット型端末等のスマートデバイスの場合、表示装置304及び入力装置305は、例えばタッチパネルである。通信装置306は、他の装置と通信するためのインタフェースである。
コンピュータで実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、メモリカード、CD-R及びDVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記憶媒体に記録されてコンピュータ・プログラム・プロダクトとして提供される。
またコンピュータで実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。またコンピュータで実行されるプログラムをダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。
またコンピュータで実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
コンピュータで実行されるプログラムは、上述の認識装置10の機能構成(機能ブロック)のうち、プログラムによっても実現可能な機能ブロックを含むモジュール構成となっている。当該各機能ブロックは、実際のハードウェアとしては、制御装置301が記憶媒体からプログラムを読み出して実行することにより、上記各機能ブロックが主記憶装置302上にロードされる。すなわち上記各機能ブロックは主記憶装置302上に生成される。
なお上述した各機能ブロックの一部又は全部をソフトウェアにより実現せずに、IC(Integrated Circuit)等のハードウェアにより実現してもよい。
また複数のプロセッサを用いて各機能を実現する場合、各プロセッサは、各機能のうち1つを実現してもよいし、各機能のうち2つ以上を実現してもよい。
また認識装置10を実現するコンピュータの動作形態は任意でよい。例えば、認識装置10を1台のコンピュータにより実現してもよい。また例えば、認識装置10を、ネットワーク上のクラウドシステムとして動作させてもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 受付部
2 特徴量算出部
3 スコア算出部
4 認識部
5 出力部
10 認識装置
301 制御装置
302 主記憶装置
303 補助記憶装置
304 表示装置
305 入力装置
306 通信装置
310 バス

Claims (21)

  1. モールス信号を受け付ける受付部と、
    前記モールス信号の特徴を示す特徴量を、所定のフレーム毎に算出する特徴量算出部と、
    前記特徴量から、前記モールス信号に対応する情報のスコアを示す情報スコアと、前記モールス信号の区切りのスコアを示す区切りスコアとを算出するスコア算出部と、
    前記情報スコアと前記区切りスコアとを用いて、前記モールス信号に対応する情報と、前記区切りとを含む出力系列を認識する認識部と、
    前記出力系列を出力する出力部と、
    を備える認識装置。
  2. 前記スコア算出部は、前記特徴量を入力する入力層と、前記情報スコアと前記区切りスコアとを出力する出力層と、を有するリカレントニューラルネットワークを用いて、前記情報スコアと、前記区切りスコアとを算出する、
    を備える請求項1に記載の認識装置。
  3. 前記スコア算出部は、前記区切りスコアが閾値より大きい場合、前記リカレントニューラルネットワークの内部状態をリセットする、
    請求項2に記載の認識装置。
  4. 前記区切りスコアは、単語の区切りを示す単語区切りスコア、音節の区切りを示す音節区切りスコア、文節の区切りを示す文節区切りスコア、及び、文の区切りを示す文区切りスコアの少なくとも1つを含む、
    請求項2に記載の認識装置。
  5. 前記認識部は、前記情報スコアと前記区切りスコアとを用いて、前記出力系列を複数の系列パターンに分けて認識し、
    前記出力部は、前記出力系列を前記複数の系列パターンに分けて出力する、
    請求項4に記載の認識装置。
  6. 前記認識部は、複数の単語を含む単語リストから、前記系列パターンにより近い単語を選択することにより、前記系列パターンを単語に置き換えて認識する、
    請求項5に記載の認識装置。
  7. 前記認識部は、複数の単語を含む単語リストから、前記系列パターンに近い順に複数の単語を選択し、
    前記出力部は、選択された複数の単語を、前記系列パターンの候補として出力する、
    請求項6に記載の認識装置。
  8. モールス信号を受け付けるステップと、
    前記モールス信号の特徴を示す特徴量を、所定のフレーム毎に算出するステップと、
    前記特徴量から、前記モールス信号に対応する情報のスコアを示す情報スコアと、前記モールス信号の区切りのスコアを示す区切りスコアとを算出するステップと、
    前記情報スコアと前記区切りスコアとを用いて、前記モールス信号に対応する情報と、前記区切りとを含む出力系列を認識するステップと、
    前記出力系列を出力するステップと、
    を含む認識方法。
  9. 前記特徴量から、前記モールス信号に対応する情報のスコアを示す情報スコアと、前記モールス信号の区切りのスコアを示す区切りスコアとを算出するステップは、前記特徴量を入力する入力層と、前記情報スコアと前記区切りスコアとを出力する出力層と、を有するリカレントニューラルネットワークを用いて、前記情報スコアと、前記区切りスコアとを算出する、
    請求項8に記載の認識方法。
  10. 前記区切りスコアが閾値より大きい場合、前記リカレントニューラルネットワークの内部状態をリセットするステップ、
    を更に含む請求項9に記載の認識方法。
  11. 前記区切りスコアは、単語の区切りを示す単語区切りスコア、音節の区切りを示す音節区切りスコア、文節の区切りを示す文節区切りスコア、及び、文の区切りを示す文区切りスコアの少なくとも1つを含む、
    請求項9に記載の認識方法。
  12. 前記認識するステップは、前記情報スコアと前記区切りスコアとを用いて、前記出力系列を複数の系列パターンに分けて認識し、
    前記出力するステップは、前記出力系列を前記複数の系列パターンに分けて出力する、
    請求項11に記載の認識方法。
  13. 前記認識するステップは、複数の単語を含む単語リストから、前記系列パターンにより近い単語を選択することにより、前記系列パターンを単語に置き換えて認識する、
    請求項12に記載の認識方法。
  14. 前記認識するステップは、複数の単語を含む単語リストから、前記系列パターンに近い順に複数の単語を選択し、
    前記出力するステップは、選択された複数の単語を、前記系列パターンの候補として出力する、
    請求項13に記載の認識方法。
  15. コンピュータを、
    モールス信号を受け付ける受付部と、
    前記モールス信号の特徴を示す特徴量を、所定のフレーム毎に算出する特徴量算出部と、
    前記特徴量から、前記モールス信号に対応する情報のスコアを示す情報スコアと、前記モールス信号の区切りのスコアを示す区切りスコアとを算出するスコア算出部と、
    前記情報スコアと前記区切りスコアとを用いて、前記モールス信号に対応する情報と、前記区切りとを含む出力系列を認識する認識部と、
    前記出力系列を出力する出力部、
    として機能させるためのプログラム。
  16. 前記スコア算出部は、前記特徴量を入力する入力層と、前記情報スコアと前記区切りスコアとを出力する出力層と、を有するリカレントニューラルネットワークを用いて、前記情報スコアと、前記区切りスコアとを算出する、
    を備える請求項15に記載のプログラム。
  17. 前記スコア算出部は、前記区切りスコアが閾値より大きい場合、前記リカレントニューラルネットワークの内部状態をリセットする、
    請求項16に記載のプログラム。
  18. 前記区切りスコアは、単語の区切りを示す単語区切りスコア、音節の区切りを示す音節区切りスコア、文節の区切りを示す文節区切りスコア、及び、文の区切りを示す文区切りスコアの少なくとも1つを含む、
    請求項16に記載のプログラム。
  19. 前記認識部は、前記情報スコアと前記区切りスコアとを用いて、前記出力系列を複数の系列パターンに分けて認識し、
    前記出力部は、前記出力系列を前記複数の系列パターンに分けて出力する、
    請求項18に記載のプログラム。
  20. 前記認識部は、複数の単語を含む単語リストから、前記系列パターンにより近い単語を選択することにより、前記系列パターンを単語に置き換えて認識する、
    請求項19に記載のプログラム。
  21. 前記認識部は、複数の単語を含む単語リストから、前記系列パターンに近い順に複数の単語を選択し、
    前記出力部は、選択された複数の単語を、前記系列パターンの候補として出力する、
    請求項20に記載のプログラム。
JP2019050150A 2019-03-18 2019-03-18 認識装置、認識方法及びプログラム Active JP7199264B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019050150A JP7199264B2 (ja) 2019-03-18 2019-03-18 認識装置、認識方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019050150A JP7199264B2 (ja) 2019-03-18 2019-03-18 認識装置、認識方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020155830A JP2020155830A (ja) 2020-09-24
JP7199264B2 true JP7199264B2 (ja) 2023-01-05

Family

ID=72559851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019050150A Active JP7199264B2 (ja) 2019-03-18 2019-03-18 認識装置、認識方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7199264B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113066509B (zh) * 2021-03-18 2023-05-23 芝麻云信(武汉)科技有限公司 点划信号识别方法、系统、电子设备及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003273755A (ja) 2002-03-19 2003-09-26 Toshiba Corp モールス信号判定装置、モールス信号除去装置、及びモールス信号除去装置を有する受信機
JP2004013726A (ja) 2002-06-10 2004-01-15 Sumitomo Electric Ind Ltd キーワード抽出装置および情報検索装置
JP2012502325A (ja) 2008-09-10 2012-01-26 ジュンヒュン スン デバイスインターフェイシングのための多重モード調音統合
JP2018077440A (ja) 2016-11-11 2018-05-17 株式会社東芝 音声認識装置、音声認識方法およびプログラム
JP2019165320A (ja) 2018-03-19 2019-09-26 株式会社東芝 信号諸元判定装置および方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003273755A (ja) 2002-03-19 2003-09-26 Toshiba Corp モールス信号判定装置、モールス信号除去装置、及びモールス信号除去装置を有する受信機
JP2004013726A (ja) 2002-06-10 2004-01-15 Sumitomo Electric Ind Ltd キーワード抽出装置および情報検索装置
JP2012502325A (ja) 2008-09-10 2012-01-26 ジュンヒュン スン デバイスインターフェイシングのための多重モード調音統合
JP2018077440A (ja) 2016-11-11 2018-05-17 株式会社東芝 音声認識装置、音声認識方法およびプログラム
JP2019165320A (ja) 2018-03-19 2019-09-26 株式会社東芝 信号諸元判定装置および方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Alex Graves et al.,Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks,Proceedings of the 23rd international conference on Machine learning 2006,2006年06月25日,pages 369-376,[検索日2022.05.12], インターネット<URL:https://doi.org/10.1145/1143844.1143891>

Also Published As

Publication number Publication date
JP2020155830A (ja) 2020-09-24

Similar Documents

Publication Publication Date Title
KR101259558B1 (ko) 문장경계 인식 장치 및 방법
CN106815197B (zh) 文本相似度的确定方法和装置
Monaco et al. The partially observable hidden Markov model and its application to keystroke dynamics
CN112906392B (zh) 一种文本增强方法、文本分类方法及相关装置
JP2012185722A (ja) 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
CN113254654B (zh) 模型训练、文本识别方法、装置、设备和介质
JP5809381B1 (ja) 自然言語処理システム、自然言語処理方法、および自然言語処理プログラム
KR102143745B1 (ko) 음절 기반의 벡터를 이용한 한글 오류 보정 방법 및 한글 오류 보정 시스템
KR20130058053A (ko) 중첩된 수기의 획들을 하나 이상의 그룹으로 분할하는 방법 및 장치
JP7344926B2 (ja) テキストの要約の抽出方法、装置、電子機器、記憶媒体及びコンピュータープログラム
CN113205160B (zh) 模型训练、文本识别方法、装置、电子设备和介质
US20230055233A1 (en) Method of Training Voice Recognition Model and Voice Recognition Device Trained by Using Same Method
KR20160122231A (ko) 음악 심볼들을 인식하기 위한 방법 및 장치
CN110610180A (zh) 错别字词识别集的生成方法、装置、设备及存储介质
CN110795935A (zh) 文字词向量模型的训练方法、装置、终端及存储介质
CN111914825A (zh) 文字识别方法、装置及电子设备
JP7199264B2 (ja) 認識装置、認識方法及びプログラム
US20160188970A1 (en) Computer-readable recording medium, method, and apparatus for character recognition
JP2019204214A (ja) 学習装置、学習方法、プログラム及び推定装置
CN113255331A (zh) 文本纠错方法、装置及存储介质
CN110516125A (zh) 识别异常字符串的方法、装置、设备及可读存储介质
US10789410B1 (en) Identification of source languages for terms
CN114299930A (zh) 端到端语音识别模型处理方法、语音识别方法及相关装置
CN110555431B (zh) 一种图像识别的方法和装置
CN116466830A (zh) 文本输入方法、装置、设备、介质及计算机程序产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210902

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221220

R150 Certificate of patent or registration of utility model

Ref document number: 7199264

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150