JP2015215390A - Speech recognition dictionary update device, speech recognition dictionary update method, and program - Google Patents
Speech recognition dictionary update device, speech recognition dictionary update method, and program Download PDFInfo
- Publication number
- JP2015215390A JP2015215390A JP2014096577A JP2014096577A JP2015215390A JP 2015215390 A JP2015215390 A JP 2015215390A JP 2014096577 A JP2014096577 A JP 2014096577A JP 2014096577 A JP2014096577 A JP 2014096577A JP 2015215390 A JP2015215390 A JP 2015215390A
- Authority
- JP
- Japan
- Prior art keywords
- word
- recognition dictionary
- unregistered
- excluded
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
本発明は、音声認識に用いられる音声認識辞書に単語を追加して更新する音声認識辞書更新装置、音声認識辞書更新方法、プログラムに関する。 The present invention relates to a speech recognition dictionary updating apparatus, a speech recognition dictionary updating method, and a program for updating a speech recognition dictionary used for speech recognition by adding words.
音声認識システムに用いる認識辞書に追加で登録すべき単語を自動的に選出し、選出された単語を認識辞書に追加する音声認識辞書更新装置が特許文献1に開示されている。この音声認識辞書更新装置は、音声認識システム運用者(以下、単に運用者ともいう)が入力した関連文書から認識辞書に登録されていない未登録単語を抽出し、音声認識システム運用中に蓄積された音声と認識結果を用いて未登録単語それぞれのタスク関連度と平均認識信頼度を算出し、タスク関連度と平均認識信頼度から未登録単語それぞれの登録優先度を算出し、登録優先度の高い未登録単語を追加すべき単語として選出する。 Japanese Patent Application Laid-Open No. 2004-151867 discloses a speech recognition dictionary updating apparatus that automatically selects additional words to be registered in a recognition dictionary used in the speech recognition system and adds the selected words to the recognition dictionary. This speech recognition dictionary update device extracts unregistered words that are not registered in the recognition dictionary from related documents input by a speech recognition system operator (hereinafter also referred to simply as an operator) and accumulates them during operation of the speech recognition system. The task relevance and average recognition reliability of each unregistered word are calculated using the voice and the recognition result, and the registration priority of each unregistered word is calculated from the task relevance and average recognition reliability. Select a high unregistered word to add.
以下図1、図2を参照して、特許文献1の音声認識辞書更新装置について説明する。図1は、特許文献1の音声認識辞書更新装置9の構成を示すブロック図である。図2は、特許文献1の音声認識辞書更新装置9の動作を示すフローチャートである。
Hereinafter, the speech recognition dictionary updating apparatus of
図1に示すように、特許文献1の音声認識辞書更新装置9は、関連文書記憶部710と、未登録単語抽出部110と、未登録単語記憶部810と、未登録単語特徴量抽出部210と、入力音声記憶部720と、音声認識部120と、認識結果記憶部820と、認識結果特徴量抽出部220と、タスク関連度算出部310と、認識辞書記憶部730と、暫定認識辞書登録部130と、暫定認識辞書記憶部830と、登録優先度算出部320と、暫定音声認識部140と、暫定認識結果記憶部840と、認識信頼度算出部230と、認識辞書登録部330と、追加登録単語確認除外部030と、認識辞書更新部040と、拡張認識辞書記憶部900を含む構成である。
As shown in FIG. 1, the speech recognition
音声認識システム利用者(以下、単に利用者ともいう)は音声認識辞書更新装置9に音声を入力する。入力された音声(以下、入力音声という)は入力音声記憶部720に記憶されると同時に、認識辞書記憶部730に記憶されている認識辞書を用いて音声認識部120で音声認識され、認識結果が認識結果記憶部820に記憶される。
A voice recognition system user (hereinafter also simply referred to as a user) inputs voice to the voice recognition
音声認識システム運用者は音声認識辞書更新装置9に関連文書を入力する。入力された関連文書は関連文書記憶部710に記憶される。
The voice recognition system operator inputs a related document to the voice recognition
音声認識システム運用者の単語追加指示を契機として、図2に示す手順で以下のように単語追加処理と認識辞書の更新処理が行われる。 In response to a word addition instruction from the voice recognition system operator, a word addition process and a recognition dictionary update process are performed as follows in the procedure shown in FIG.
(ア)未登録単語抽出部110が、関連文書記憶部710に記憶された関連文書と、認識辞書記憶部730に記憶された認識辞書から、関連文書に出現しているが認識辞書に登録されていない未登録単語を抽出し、未登録単語記憶部810に記憶させる(S110)。
(A) The unregistered
(イ)未登録単語特徴量抽出部210が、未登録単語それぞれについて、未登録単語が含まれる関連文書中の文とその前後n個の文(共起窓)の集合に含まれる単語である複数の単語と当該未登録単語との間の共起頻度をベクトル値とする共起頻度ベクトルを生成する(S210)。
(A) The unregistered word
(ウ)認識結果特徴量抽出部220が、認識結果記憶部820に記憶された認識結果から、認識結果をm文ごとに分割した発話窓の集合に含まれる単語の生起頻度をベクトル値とする単語頻度ベクトルを生成する(S220)。
(C) From the recognition result stored in the recognition
(エ)タスク関連度算出部310が、未登録単語それぞれの共起頻度ベクトルと単語頻度ベクトルから、未登録単語それぞれのタスク関連度を算出する。タスク関連度は共起頻度ベクトルと単語頻度ベクトルのコサイン距離から算出され、システム利用者の入力音声の内容と未登録単語との間の意味的な関連の高さを表す(S310)。
(D) The task
(オ)暫定認識辞書登録部130が、認識辞書記憶部730に記憶された認識辞書に、未登録単語記憶部810に記憶された未登録単語を全て追加した暫定認識辞書を生成し、暫定認識辞書記憶部830に記憶させる(S130)。
(E) The provisional recognition
(カ)暫定音声認識部140が、暫定認識辞書を用いて、入力音声記憶部720に記憶された音声を音声認識した暫定認識結果を生成し、暫定認識結果記憶部840に記憶させる(S140)。
(F) The provisional
(キ)認識信頼度算出部230が、暫定認識結果を用いて、未登録単語それぞれの認識結果出力の正解らしさを表す指標である認識信頼度と、当該未登録単語の出現回数をもとに、未登録単語それぞれの平均認識信頼度を算出する(S230)。
(G) The recognition
(ク)登録優先度算出部320が、未登録単語それぞれのタスク関連度と平均認識信頼度を用いて、未登録単語それぞれの登録優先度を算出する。登録優先度は、例えばタスク関連度と平均認識信頼度の重み付き和として算出される(S320)。
(H) The registration
(ケ)認識辞書登録部330が、登録優先度が事前に設定された閾値θ以上となる未登録単語を全て選出し(S3301)、選出された未登録単語を追加登録単語確認除外部030に出力する。閾値θは大きくすれば登録すべき未登録単語が選出されなくなるリスクが増加し、小さくすれば不要な未登録単語が選出されてしまうリスクが増加する。θとして通常は0.1程度の値が利用される。追加登録単語確認除外部030は入力された未登録単語の一覧を(例えばディスプレイに表示する等の方法で)音声認識システム運用者に提示し、音声認識システム運用者は登録すべきでないと判断した未登録単語をインタフェース(例えばチェックボックス等)を用いて指定する。追加登録単語確認除外部030は指定されなかった未登録単語を認識辞書登録部330に出力する(S030)。認識辞書登録部330は追加登録単語確認除外部030から入力された指定されなかった未登録単語を、認識辞書記憶部730に記憶された認識辞書に追加した拡張認識辞書を生成し、拡張認識辞書記憶部900に記憶させる(S3302)。以上のステップS3301、S030、S3302からなる手順全体をステップS330と呼ぶ。
(K) The recognition
(コ)認識辞書更新部040が、認識辞書記憶部730の内容を拡張認識辞書の内容に更新する(S040)。
(E) The recognition
以上の手順により認識辞書が更新され、それ以降に音声認識システム利用者が入力した音声は更新後の認識辞書を用いて音声認識部120で音声認識されることになる。更新後の認識辞書には、タスク関連度が高く、かつ認識信頼度が高い(=実際に入力音声において発声されている可能性が高い)単語が新たに登録されているため、更新前よりも高精度に音声認識を行うことができる。
The recognition dictionary is updated by the above procedure, and the speech input by the speech recognition system user thereafter is recognized by the
上記の手順(ケ)/(S330)において音声認識システム運用者による未登録単語の確認/除外を行うことにより、明らかに発声されないであろう不要な単語が誤って選出された場合に、当該不要な単語が認識辞書に追加され、認識結果に誤認識として出現してしまう危険性を低減することができる。 In the above procedure (K) / (S330), when an unregistered word is confirmed / excluded by the voice recognition system operator, an unnecessary word that will not be clearly spoken is selected by mistake. The risk that a simple word is added to the recognition dictionary and appears as a recognition error in the recognition result can be reduced.
なお、本発明では、以下の特許文献1の数式を利用する。
式(1)「手順(イ)共起頻度ベクトルの生成」
式(2)「手順(ウ)単語頻度ベクトルの生成」
式(3)「手順(キ)平均認識信頼度の算出」
式(4)「手順(キ)平均認識信頼度の算出に用いる単語ごとの認識信頼度の算出」
式(5)「手順(ク)登録優先度の算出」
In the present invention, the following mathematical formula of
Formula (1) “Procedure (b) Generation of co-occurrence frequency vector”
Formula (2) “Procedure (C) Generation of Word Frequency Vector”
Formula (3) "Procedure (ki) Calculation of average recognition reliability"
Formula (4) “Procedure (g) Calculation of recognition reliability for each word used for calculation of average recognition reliability”
Formula (5) "Procedure (ku) Registration priority calculation"
特許文献1のような従来技術を用いた音声認識システムを長期間に渡って運用する場合、音声認識システム運用者が単語追加指示を行うのは1度だけではない。システム運用中に新たな関連文書を入手できた場合や、入力される音声中で発声される単語が時間の経過とともに変化してきた場合には、音声認識システム運用者は、そのつど単語追加指示を行って認識辞書を更新し、音声認識精度を維持することになる。
When a speech recognition system using the conventional technology such as
従来技術において音声認識システム運用者が2回目以降に単語追加指示を行った際、1回目に従来技術の手順(ケ)/(S330)において除外した不要な単語が再度追加すべき未登録単語として選出されてしまう場合が多い。単語追加処理では1回目とは別の関連文書と入力音声が使われるものの、未登録単語の選出アルゴリズムは1回目と変わらないためである。そのため、音声認識システム運用者は単語追加指示を行うたびに、毎回毎回同じ不要な単語を除外する作業が発生し、システム運用作業の効率が低下する。2回目に新たに選出されてしまった不要な単語も存在するため、3回目、4回目と単語追加実行を繰り返すたびに不要な単語の除外作業の量は増加する傾向があり、さらなる作業効率の低下を招く。この作業で除外しそこねた不要な単語は拡張認識辞書に登録されてその後も残り続けるため、不要な単語の除外作業には慎重さが求められる。このように音声認識システム運用者は、回を負うごとに増加する不要な単語の除外作業を慎重に行わなければならないため、システム運用コストが増大してしまうという課題があった。 In the prior art, when the voice recognition system operator issues a word addition instruction for the second and subsequent times, unnecessary words excluded in the first procedure (K) / (S330) are unregistered words to be added again. In many cases, it will be elected. This is because the word addition process uses a related document and input speech different from the first time, but the algorithm for selecting unregistered words is the same as the first time. For this reason, every time a voice recognition system operator gives an instruction to add a word, an operation to exclude the same unnecessary word occurs every time, and the efficiency of the system operation operation decreases. Since there are unnecessary words that have been newly selected for the second time, the amount of unnecessary word exclusion tends to increase each time the third and fourth times and the word addition execution is repeated. Incurs a decline. Unnecessary words that are left out in this work are registered in the extended recognition dictionary and continue to remain after that, so care must be taken when removing unnecessary words. As described above, the voice recognition system operator has to carefully exclude unnecessary words that are increased every time he / she takes time, and there is a problem that the system operation cost increases.
そこで本発明は、運用者の不要な単語の選出作業を抑制することができる音声認識辞書更新装置を提供することを目的とする。 Therefore, an object of the present invention is to provide a speech recognition dictionary updating apparatus that can suppress an operator's unnecessary word selection work.
本発明の音声認識辞書更新装置は、認識辞書記憶部と、未登録単語管理部と、登録管理部と、除外単語記憶部と、未登録単語補正部を含む。 The speech recognition dictionary update device of the present invention includes a recognition dictionary storage unit, an unregistered word management unit, a registration management unit, an excluded word storage unit, and an unregistered word correction unit.
認識辞書記憶部は、認識辞書を記憶する。未登録単語管理部は、関連文書を入力とし、運用者の単語追加指示を契機として、関連文書中に出現し、認識辞書に登録されていない単語である未登録単語を抽出して記憶する。登録管理部は、未登録単語を所定の基準で選出して、選出された未登録単語を運用者に提示し、選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を除外単語として出力し、除外単語以外の未登録単語を認識辞書に追加した拡張認識辞書を新たな認識辞書として認識辞書記憶部に記憶された認識辞書を更新する。除外単語記憶部は、除外単語を記憶する。未登録単語補正部は、運用者の単語追加指示を契機として、未登録単語管理部に新たに記憶された未登録単語のうち、除外単語に一致する単語を削除する。 The recognition dictionary storage unit stores a recognition dictionary. The unregistered word management unit extracts and stores an unregistered word that is a word that appears in the related document and is not registered in the recognition dictionary with an input of the related document and an operator's word addition instruction. The registration management unit selects unregistered words based on a predetermined criterion, presents the selected unregistered words to the operator, and has received an operator instruction to exclude the selected unregistered words. The recognition dictionary stored in the recognition dictionary storage unit is updated with the extended recognition dictionary in which the unregistered word other than the excluded word is added to the recognition dictionary as a new recognition dictionary. The excluded word storage unit stores excluded words. An unregistered word correction | amendment part deletes the word which corresponds to an exclusion word among unregistered words newly memorize | stored in the unregistered word management part by an operator's word addition instruction | indication.
本発明の音声認識辞書更新装置によれば、運用者の不要な単語の選出作業を抑制することができる。 According to the speech recognition dictionary updating apparatus of the present invention, it is possible to suppress an operator's unnecessary word selection work.
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。 Hereinafter, embodiments of the present invention will be described in detail. In addition, the same number is attached | subjected to the structure part which has the same function, and duplication description is abbreviate | omitted.
以下、図3、図4を参照して、本発明の実施例1の音声認識辞書更新装置1について説明する。図3は、本実施例の音声認識辞書更新装置1の構成を示すブロック図である。図4は、本実施例の音声認識辞書更新装置1の動作を示すフローチャートである。
Hereinafter, the speech recognition
図3に示す通り、特許文献1の音声認識辞書更新装置9(図1)との違いは、特許文献1の音声認識辞書更新装置9における追加登録単語確認除外部030が追加登録単語確認除外保存部050に置き換えられている点、特許文献1の音声認識辞書更新装置9に含まれていない除外単語記憶部060と未登録単語補正部070が追加されている点である。
As shown in FIG. 3, the difference from the speech recognition dictionary update device 9 (FIG. 1) of
以下、新規な構成である追加登録単語確認除外保存部050と未登録単語補正部070の動作を図4を参照して説明する。なお図3に示された構成のうち、図1と同じ参照番号が付与されている構成の動作は前述と同じであるから適宜説明を略す。
Hereinafter, the operations of the additional registered word confirmation
<追加登録単語確認除外保存部050>
入力:認識辞書登録部330で選出された未登録単語
出力:音声認識システム運用者に指定されなかった未登録単語(認識辞書登録部330へ)、音声認識システム運用者に指定された未登録単語(除外単語記憶部060へ)
処理:追加登録単語確認除外保存部050は、認識辞書登録部330が未登録単語を選出した(S3301)後に、以下の処理を行う。
1)追加登録単語確認除外保存部050は、入力された未登録単語の一覧を(例えばディスプレイに表示する等の方法で)音声認識システム運用者に提示し、音声認識システム運用者は登録すべきでないと判断した未登録単語をインタフェース(例えばチェックボックス等)を用いて指定する。追加登録単語確認除外部050は指定されなかった未登録単語を認識辞書登録部330に出力する(S030)。
2)追加登録単語確認除外保存部050は、さらに、音声認識システム運用者に指定された未登録単語(除外単語)を除外単語記憶部060に記憶させる(S050)。
<Additional registered word confirmation
Input: Unregistered word selected by recognition
Processing: The additional registered word confirmation
1) The additional registered word confirmation
2) The additional registered word confirmation
<未登録単語補正部070>
入力:未登録単語記憶部810に記憶されている未登録単語、除外単語記憶部060に記憶されている除外単語
出力:除外単語を取り除いた未登録単語(未登録単語記憶部810へ)
処理:未登録単語補正部070は、未登録単語抽出部110が抽出した未登録単語を未登録単語記憶部810に記憶させた(S110)後に以下の処理(S070)を行う。
1)未登録単語補正部070は、未登録単語記憶部810に記憶されている未登録単語と、除外単語記憶部060に記憶されている除外単語を取得する。
2)未登録単語補正部070は、未登録単語のうち、除外単語に一致するものを取り除く。
3)未登録単語補正部070は、未登録単語記憶部810の内容を、取り除かれずに残った未登録単語に書き換える。
※1回目の実行時には除外単語記憶部060に除外単語が1つも記憶されていないため、上記の手順2)で取り除かれる単語はなく、従来技術と同じ出力となる。
<Unregistered
Input: Unregistered word stored in unregistered
Process: The unregistered
1) The unregistered
2) The unregistered
3) The unregistered
* Since no excluded word is stored in the excluded
以上の処理によって音声認識システム運用者が除外した単語を記憶し、未登録単語の抽出処理の直後に除外単語を取り除くことにより、2回目以降の単語追加実行時に、
*過去に除外した不要な未登録単語が再度選出されなくなる
*共起頻度ベクトル生成処理(S210)、タスク関連度算出処理(S310)、暫定認識結果生成処理(S140)、登録優先度算出処理(S320)の処理時間が短縮される
*S230で算出される平均認識信頼度の正確性が向上し、結果として拡張認識辞書の質が向上し、音声認識精度の改善効果が大きくなる
という効果が得られる。
By storing the words excluded by the voice recognition system operator through the above process, and removing the excluded words immediately after the unregistered word extraction process,
* Unnecessary unregistered words excluded in the past will not be selected again * Co-occurrence frequency vector generation processing (S210), task relevance calculation processing (S310), provisional recognition result generation processing (S140), registration priority calculation processing ( The processing time of S320) is shortened. * Accuracy of the average recognition reliability calculated in S230 is improved. As a result, the quality of the extended recognition dictionary is improved, and the effect of improving the speech recognition accuracy is obtained. It is done.
以下、図5、図6を参照して、本発明の実施例2の音声認識辞書更新装置2について説明する。図5は、本実施例の音声認識辞書更新装置2の構成を示すブロック図である。図6は、本実施例の音声認識辞書更新装置2の動作を示すフローチャートである。 Hereinafter, the speech recognition dictionary updating apparatus 2 according to the second embodiment of the present invention will be described with reference to FIGS. 5 and 6. FIG. 5 is a block diagram illustrating the configuration of the speech recognition dictionary updating apparatus 2 according to the present embodiment. FIG. 6 is a flowchart showing the operation of the speech recognition dictionary updating apparatus 2 of the present embodiment.
図5に示す通り、実施例1の音声認識辞書更新装置1との違いは、実施例1における未登録単語補正部070が、本実施例において不要単語推定除去部080に置き換えられている点のみである。実施例1の未登録単語補正部070では過去に音声認識システム運用者によって除外された除外単語と一致する未登録単語のみを取り除いていたが、それに加えて実施例2の不要単語推定除外部080では除外単語から推定した(必ずしも除外単語と一致するとは限らない)不要単語も取り除く。実施例2では実施例1よりも多くの不要単語が取り除かれるため、音声認識システム運用者の不要単語除外作業量の削減効果、単語追加の処理時間削減効果、平均認識信頼度の正確性向上による音声認識精度の改善効果がより大きなものとなる。
As shown in FIG. 5, the only difference from the speech recognition
以下、新規な構成である不要単語推定除去部080の動作を図6を参照して説明する。なお図5に示された構成のうち、図3や図1と同じ参照番号が付与されている構成の動作は前述と同じであるから適宜説明を略す。
Hereinafter, the operation of the unnecessary word
<不要単語推定除去部080>
入力:未登録単語記憶部810に記憶されている未登録単語、除外単語記憶部060に記憶されている除外単語
出力:除外単語を取り除いた未登録単語(未登録単語記憶部810へ)
処理:不要単語推定除去部080は、未登録単語抽出部110が抽出した未登録単語を、未登録単語記憶部810に記憶させた(S110)後に以下の処理(S080)を行う。
1)不要単語推定除去部080は、未登録単語記憶部810に記憶されている未登録単語と、除外単語記憶部060に記憶されている除外単語を取得する。
2)不要単語推定除去部080は、以下のルールで推定除外単語を求める。
(ア)不要単語推定除去部080は、未登録単語のうち、除外単語と一致するものは推定除外単語とする。
(イ)不要単語推定除去部080は、除外単語のうち記号(ひらがな・カタカナ・漢字・アルファベット以外の文字)のみで構成されている記号除外単語を集め、記号除外単語中に現れる全ての記号の集合(除外記号集合)を生成する。未登録単語のうち、除外記号集合に含まれる記号のみで構成されているものは推定除外単語とする。
3)不要単語推定除去部080は、未登録単語のうち、推定除外単語に一致するものを取り除く。
4)不要単語推定除去部080は、未登録単語記憶部810の内容を、取り除かれずに残った未登録単語に書き換える。
※実施例1と同様に、1回目の実行時には除外単語記憶部060に除外単語が1つも記憶されていないため、上記の手順2)で推定除外単語は一つも得られず、従来技術と同じ出力となる。
<Unnecessary word
Input: Unregistered word stored in unregistered
Process: The unnecessary word
1) The unnecessary word
2) The unnecessary word
(A) Unnecessary word
(B) The unnecessary word
3) The unnecessary word
4) The unnecessary word
* Similar to Example 1, since no excluded word is stored in the excluded
本技術分野では、関連文書としてWebから収集した文書などが入力されるため、関連文書には思わぬ記号が含まれている場合が多い。 In this technical field, since a document collected from the Web is input as a related document, the related document often includes an unexpected symbol.
記号には、音声認識システムの利用用途次第で重要な記号と不要な記号が存在する。例えば音楽に関する内容の音声を認識するシステムでは「#」(シャープ)や「♭」(フラット)は重要な記号だが、音楽以外の内容ではこれらの記号は不要な場合が多い。完全に自動で重要な記号と不要な記号を区別することは難しいため、実施例2では利用用途を熟知した音声認識システム運用者が除外した単語を活用することで不要な記号を特定している。例えば上記手順2)のルール(イ)の第1文で不要な記号の特定を行っている。 There are important symbols and unnecessary symbols depending on the application of the speech recognition system. For example, “#” (sharp) and “♭” (flat) are important symbols in a system that recognizes audio related to music, but these symbols are often unnecessary for content other than music. Since it is difficult to distinguish important symbols from unnecessary symbols completely automatically, in Example 2, unnecessary symbols are identified by using words excluded by a voice recognition system operator who is familiar with the usage. . For example, unnecessary symbols are specified in the first sentence of the rule (b) in the procedure 2).
また、ある記号が不要でも、その記号が特殊な単語の一部として現れているときには重要となる場合もある(例えば認識辞書に「#」は不要だが、プログラミング言語の「C#」は登録したいと音声認識システム運用者が考える場合)。上記手順2)のルール(イ)の第2文では、不要な記号のみから構成される単語を除去している。これによって、「#」を音声認識システム運用者が除外したとき、次回以降の単語追加実行時に「##」は除外記号集合に含まれる記号のみで構成されているため自動的に除去されるが「C#」は除外記号集合に含まれない文字(アルファベットのC)を単語の記述に含むため、除去されずに未登録単語の選出処理に渡されることになり、重要な単語が誤って除去される事態を防いでいる。 Even if a symbol is unnecessary, it may be important when the symbol appears as part of a special word (for example, “#” is not necessary in the recognition dictionary, but “C #” in the programming language is desired to be registered. Voice recognition system operator). In the second sentence of the rule (b) in the procedure 2), a word composed only of unnecessary symbols is removed. As a result, when the operator of the speech recognition system excludes “#”, “##” is automatically removed because it is composed only of symbols included in the excluded symbol set when the next word addition is executed. Since “C #” includes a character (alphabet C) that is not included in the exclusion symbol set in the word description, it is passed to the selection process of unregistered words without being removed, and important words are erroneously removed. The situation is prevented.
手順2)のルール(イ)の追加により、不要単語推定除去部080では実施例1の未登録単語補正部070よりも多くの単語が取り除かれることになり、
*過去に除外した不要な未登録単語が再度選出されなくなるのに加えて、不要な記号のみからなる不要な未登録単語も選出されなくなるので、実施例1より大きく作業効率が改善する
*共起頻度ベクトル生成処理(S210)、タスク関連度算出処理(S310)、暫定認識結果生成処理(S140)、登録優先度算出処理(S320)の処理時間が実施例1より大きく短縮される
*S230で算出される平均認識信頼度の正確性が実施例1より大きく向上し、結果として音声認識精度の改善効果がより大きくなる
という効果を得られる。
By adding the rule (b) in step 2), the unnecessary word
* Unnecessary unregistered words excluded in the past will not be selected again, and unnecessary unregistered words consisting only of unnecessary symbols will not be selected, so work efficiency will be greatly improved compared to Example 1. * Co-occurrence The processing time of the frequency vector generation process (S210), the task relevance calculation process (S310), the provisional recognition result generation process (S140), and the registration priority calculation process (S320) is greatly shortened compared to the first embodiment * calculated in S230 The accuracy of the average recognition reliability is greatly improved as compared with the first embodiment, and as a result, the effect of improving the speech recognition accuracy can be obtained.
以下、図7、図8を参照して、本発明の実施例3の音声認識辞書更新装置3について説明する。図7は、本実施例の音声認識辞書更新装置3の構成を示すブロック図である。図8は、本実施例の音声認識辞書更新装置3の動作を示すフローチャートである。 Hereinafter, the speech recognition dictionary updating apparatus 3 according to the third embodiment of the present invention will be described with reference to FIGS. FIG. 7 is a block diagram illustrating the configuration of the speech recognition dictionary updating device 3 according to the present embodiment. FIG. 8 is a flowchart showing the operation of the speech recognition dictionary updating apparatus 3 of the present embodiment.
図7に示す通り、実施例1または2の音声認識辞書更新装置1、2との違いは、実施例1および2における追加登録単語確認除外保存部050が登録優先度保存部090に置き換えられている点、実施例1および2の音声認識辞書更新装置1、2に含まれない除外登録優先度記憶部091と登録優先度閾値算出部092が追加されている点である。なお、本実施例では、実施例2の構成をベースに上述の変更(050を090に置換、091、092を追加する変更)を加えているが、これに限定されず、実施例1の構成に、同様の変更(050を090に置換、091、092を追加する変更)を加えた構成としてもよい。
As shown in FIG. 7, the difference from the speech recognition
認識辞書登録部330は、事前に設定された閾値以上の登録優先度を持つ未登録単語を選出する。本実施例では、音声認識システム運用者が除外した未登録単語それぞれの登録優先度(除外登録優先度)を保存し、次回以降の単語追加実行時には除外登録優先度から算出した閾値を認識辞書登録部330に設定することにより、不要な未登録単語の選出を実施例1または2よりも大きく抑制する。
The recognition
以下、新規な構成である登録優先度保存部090と登録優先度閾値算出部092の動作を図8を参照して説明する。なお図7に示された構成のうち、図5、図3、図1と同じ参照番号が付与されている構成の動作は前述と同じであるから適宜説明を略す。
The operations of the registration
<登録優先度保存部090>
入力:認識辞書登録部330で選出された未登録単語
出力:音声認識システム運用者に指定されなかった未登録単語(認識辞書登録部330へ)、音声認識システム運用者に指定された未登録単語(除外単語記憶部060へ)、音声認識システム運用者に指定された未登録単語の登録優先度(除外登録優先度記憶部091へ)
処理:登録優先度保存部090は、認識辞書登録部330が未登録単語を選出した(S3301)後に、以下の処理を行う。
1)登録優先度保存部090は、入力された未登録単語の一覧を(例えばディスプレイに表示する等の方法で)音声認識システム運用者に提示し、音声認識システム運用者は登録すべきでないと判断した未登録単語をインタフェース(例えばチェックボックス等)を用いて指定する。登録優先度保存部090は、指定されなかった未登録単語を認識辞書登録部330に出力する(従来技術のS030と同じ処理)。
2)登録優先度保存部090は、さらに、音声認識システム運用者に指定された未登録単語(除外単語)を除外単語記憶部060に記憶させるとともに、除外単語の登録優先度を除外登録優先度記憶部091に記憶させる(S090)。このとき、過去の単語追加実行時に記憶されていた除外登録優先度は消去してから、今回の除外登録優先度を記憶させる。除外登録優先度は複数個(音声認識システム運用者によって除外された未登録単語の個数と同じ数)存在し、N_allはその個数を指す。
<Registration
Input: Unregistered word selected by recognition
Processing: The registration
1) The registration
2) The registration
<登録優先度閾値算出部092>
入力:除外登録優先度記憶部091に記憶されている除外登録優先度
出力:登録優先度閾値(認識辞書登録部330へ)
処理:登録優先度閾値算出部092は、登録優先度算出部320が未登録単語それぞれの登録優先度を算出した(S320)後に、以下の処理を行う。
1)登録優先度閾値算出部092は、認識辞書登録部330に設定されている登録優先度閾値θを取得する。
2)登録優先度閾値算出部092は、除外登録優先度記憶部091に記憶されている除外登録優先度を全て取得する。
3)登録優先度閾値算出部092は、除外登録優先度の個数(N_all)が所定の値Nよりも小さい場合、手順1で取得した登録優先度閾値θをそのまま認識辞書登録部330に設定して処理を終了する。Nは登録優先度閾値の変更判断をするために必要な除外登録優先度の個数を表し、50程度の値が用いられる。
4)登録優先度閾値算出部092は、除外登録優先度の個数がN以上となっている場合、登録優先度閾値θに、登録優先度閾値最大上昇幅Δθを加えたθ+Δθを計算し、除外登録優先度のうち値がθ+Δθ以下となっている低登録優先度の個数(N_small)をカウントする。Δθを大きくすれば登録優先度閾値の上昇量が大きくなって未登録単語が選出されにくくなり、小さくすれば登録優先度の閾値の上昇量が小さくなって不要単語の選出を抑制しにくくなる。Δθには通常0.05〜0.1程度の値が用いられる。
5)登録優先度閾値算出部092は、除外登録優先度の総数(N_all)のうち、低登録優先度の個数(N_small)の割合(N_small / N_all)が所定の値R以上となっている場合、低登録優先度の中での最大の登録優先度を、登録優先度閾値θの更新値として認識辞書登録部330に設定する。N_small / N_allがR未満となっていた場合は、手順1で取得した登録優先度閾値θをそのまま認識辞書登録部330に設定する。Rは、除外登録優先度が閾値付近にどの程度密集している場合に閾値上昇の判断をするかを表すパラメータであり、通常は0.8程度の値が用いられる。
※1回目の実行時には除外登録優先度記憶部091に除外登録優先度が1つも記憶されていないため、上記の手順3でN_allがN以上とならず、登録優先度閾値の変更は行われない。
<Registration priority
Input: Exclusion registration priority stored in exclusion registration
Process: The registration priority
1) The registration priority threshold
2) The registration priority threshold
3) When the number of excluded registration priorities (N_all) is smaller than a predetermined value N, the registration priority threshold
4) The registration priority
5) The registration priority
* At the first execution, since no exclusion registration priority is stored in the exclusion registration
認識辞書登録部330は登録優先度が閾値θ以上となっている未登録単語を選出する。このとき、登録優先度が閾値θを少しだけ上回る未登録単語は、選出された未登録単語の中では低めの登録優先度を持ち、不要単語である可能性が比較的高い。
The recognition
音声認識システム運用者が不要単語を除外した時、閾値θを少しだけ上回る未登録単語が数多く除外されていた場合、閾値を上昇させるべきだと考えられる。実施例3はこの考えに基づき、音声認識システム運用者が除外した不要単語の登録優先度(除外登録優先度)を活用して、次回以降の単語追加実行時に不要単語が選出されにくくなるように閾値θを上昇させるかどうかを判断する。 When the speech recognition system operator excludes unnecessary words, if many unregistered words slightly exceeding the threshold θ are excluded, it is considered that the threshold should be increased. Example 3 is based on this idea, and uses the registration priority (exclusion registration priority) of unnecessary words excluded by the voice recognition system operator so that unnecessary words are not easily selected at the next and subsequent word addition executions. It is determined whether or not the threshold value θ is increased.
上記の手順3〜5により、以下のように登録優先度閾値が設定される。
*音声認識システム運用者が一定数N以上の未登録単語を除外したとき、
*登録優先度閾値を少しだけ(Δθだけ)上回る未登録単語が数多く(割合R以上)除外されていた場合、
*次回の単語追加実行時に、それら登録優先度閾値θを少しだけ上回る未登録単語を全て除外するように(低登録優先度の最大値に)登録優先度閾値を設定し直す。
By the above steps 3 to 5, the registration priority threshold is set as follows.
* When the voice recognition system operator excludes a certain number of unregistered words,
* If many unregistered words (ratio R or more) that slightly exceed the registration priority threshold (by Δθ) are excluded,
* When the next word addition is executed, the registration priority threshold is reset so that all unregistered words that slightly exceed the registration priority threshold θ are excluded (to the maximum value of the low registration priority).
実施例3では、以上のように、前回実行時に音声認識システム運用者が閾値付近の未登録単語を数多く除外した場合、それらが再度選出されないように閾値を変更する。これにより、実施例1や2の効果に加えて不要単語の選出を抑制し、音声認識システム運用者の不要単語除外作業をさらに削減することができる。 In the third embodiment, as described above, when the speech recognition system operator excludes many unregistered words near the threshold at the previous execution, the threshold is changed so that they are not selected again. Thereby, in addition to the effect of Example 1 and 2, selection of an unnecessary word can be suppressed and the unnecessary word exclusion operation | work of a speech recognition system operator can further be reduced.
以下、図9、図10を参照して、本発明の実施例4の音声認識辞書更新装置4について説明する。図9は、本実施例の音声認識辞書更新装置4の構成を示すブロック図である。図10は、本実施例の音声認識辞書更新装置4の動作を示すフローチャートである。
Hereinafter, the speech recognition
図9に示す通り、実施例1の音声認識辞書更新装置1との違いは、実施例1における未登録単語補正部070が類似未登録単語除外部095に置き換えられている点である。
As shown in FIG. 9, the difference from the speech recognition
音声認識システム運用者が過去に除外した不要な単語と文字列として類似した単語は不要である可能性が高い(例えば「PC−9801」が不要な場合は、「PC−8801」や「PC−9801F」も不要と考えられる)。実施例4の音声認識辞書更新装置4は、この考えに基づき、不要な単語の選出を実施例1の音声認識辞書更新装置1よりも大きく抑制する。
There is a high possibility that a word similar to an unnecessary word excluded by the voice recognition system operator in the past is unnecessary (for example, when “PC-9801” is unnecessary, “PC-8801” or “PC-”). 9801F "is also considered unnecessary). Based on this idea, the speech recognition
実施例1の未登録単語補正部070は、過去に音声認識システム運用者に除外された単語(除外単語)と完全に一致する単語のみを未登録単語から取り除いていたが、実施例4の類似未登録単語除外部095はそれに加えて、除外単語と類似した単語(除外単語と編集距離の近い単語)も未登録単語から取り除く。これにより、不要な未登録単語の選出を実施例1よりも大きく抑制する。
The unregistered
以下、類似未登録単語除外部095の動作を図10を参照して説明する。なお図9に示された構成のうち、図3と同じ参照番号が付与されている構成の動作は前述した実施例1と同じであるから適宜説明を略す。
Hereinafter, the operation of the similar unregistered
<類似未登録単語除外部095>
入力:未登録単語記憶部810に記憶されている未登録単語、除外単語記憶部060に記憶されている除外単語
出力:除外単語と同一の単語、および類似する単語を取り除いた未登録単語(未登録単語記憶部810へ)
処理:類似未登録単語除外部095は、未登録単語抽出部110が抽出した未登録単語を未登録単語記憶部810に記憶させた(S110)後に以下の処理(S095)を行う。
1)類似未登録単語除外部095は、未登録単語記憶部810に記憶されている未登録単語と、除外単語記憶部060に記憶されている除外単語を取得する。
2)類似未登録単語除外部095は、未登録単語それぞれについて、以下の処理を行う。
2−1)類似未登録単語除外部095は、当該未登録単語と除外単語それぞれとの間の編集距離を算出し、それぞれの編集距離を当該未登録単語の文字数で除した正規化編集距離を算出する。編集距離は例えば参考非特許文献1などに開示されている既存の方法で算出する。正規化編集距離は、当該未登録単語を構成する文字列のうち除外単語と異なっている部分がどの程度あるかを表す実数値であり、当該未登録単語が除外単語と完全に一致する場合は0となり、異なる部分が増加するにしたがって値は大きくなる(例えば、4文字の未登録単語と4文字の除外単語があり、一致する文字が1文字もない場合、編集距離=4、正規化編集距離=4÷4=1.0、となる)。
2−2)類似未登録単語除外部095は、正規化編集距離のうち一つでも所定の正規化編集距離閾値τ以下となる場合、当該未登録単語を取り除く。τ=0と設定した場合は除外単語と完全一致する未登録単語のみが取り除かれるため、実施例1と同じ出力となる。通常はτ=0.2程度の値に設定する。τ=0.2と設定すると、例えば5文字の未登録単語のうち4文字以上が除外単語と一致する場合に取り除かれることになる。
3)類似未登録単語除外部095は、未登録単語記憶部810の内容を、取り除かれずに残った未登録単語に書き換える。
※1回目の実行時には除外単語記憶部060に除外単語が1つも記憶されていないため、上記の手順3で取り除かれる単語はなく、従来技術と同じ出力となる。
<Similar Unregistered
Input: Unregistered word stored in the unregistered
Process: The similar unregistered
1) The similar unregistered
2) The similar unregistered
2-1) The similar unregistered
2-2) The similar unregistered
3) The similar unregistered
* Since no excluded word is stored in the excluded
以上の処理によって音声認識システム運用者が除外した単語(除外単語)を記憶し、未登録単語の抽出処理の直後に除外単語に類似した単語を取り除くことにより、2回目以降の単語追加実行時に、
*過去に除外した不要な未登録単語が再度選出されなくなるのに加えて、過去に除外した未登録単語に類似した不要な未登録単語も選出されなくなるので、実施例1より大きく作業効率が改善する
*共起頻度ベクトル生成処理(S210)、タスク関連度算出処理(S310)、暫定認識結果生成処理(S140)、登録優先度算出処理(S320)の処理時間が実施例1より大きく短縮される
*S230で算出される平均認識信頼度の正確性が実施例1より大きく向上し、結果として音声認識精度の改善効果がより大きくなる
という効果を得られる。
(参考非特許文献1:Daniel Jurafsky and James H. Martin: “Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition”, Prentice Hall, 2009)
The words (excluded words) excluded by the voice recognition system operator by the above process are stored, and words similar to the excluded words are removed immediately after the unregistered word extraction process.
* Unnecessary unregistered words excluded in the past are not selected again, and unnecessary unregistered words similar to unregistered words excluded in the past are also not selected, so work efficiency is greatly improved compared to the first embodiment. * Co-occurrence frequency vector generation processing (S210), task relevance calculation processing (S310), provisional recognition result generation processing (S140), registration priority calculation processing (S320) processing time is greatly shortened compared to the first embodiment. * The accuracy of the average recognition reliability calculated in S230 is greatly improved as compared with the first embodiment, and as a result, the effect of improving the speech recognition accuracy can be obtained.
(Reference Non-Patent Document 1: Daniel Jurafsky and James H. Martin: “Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition”, Prentice Hall, 2009)
<発明の効果>
本発明によって2回目以降の単語追加実行時に不要な単語の選出が抑制されるため、音声認識システム運用者が除外すべき単語が減少し、運用作業の効率が向上する。結果として、音声認識システム運用中の認識辞書メンテナンスコストが低減される。
<Effect of the invention>
According to the present invention, selection of unnecessary words at the second and subsequent word addition executions is suppressed, so that the number of words that should be excluded by the voice recognition system operator is reduced and the efficiency of operation work is improved. As a result, the recognition dictionary maintenance cost during operation of the speech recognition system is reduced.
さらに本発明では、未登録単語の選出処理の前(従来技術の手順(ア)の直後、手順(イ)の直前のタイミング)に不要な単語の除外を行うため、従来技術での未登録単語それぞれに対して行う処理(手順(イ)の共起頻度ベクトル生成処理、手順(エ)のタスク関連度算出処理、手順(ク)の登録優先度算出処理)にかかる時間が短縮される。加えて、暫定認識辞書からも不要な単語が除外されるため暫定認識辞書のサイズが小さくなり、手順(カ)の暫定認識結果生成処理(暫定認識辞書による音声認識処理)にかかる時間も短縮される。これらの処理時間削減効果により、音声認識システム運用者が単語追加実行指示を行ってから単語追加処理が完了するまで待つ時間が短縮され、2回目以降の単語追加時のさらなる作業効率向上につながる。 Furthermore, in the present invention, unnecessary words are excluded before the selection process of unregistered words (immediately after the prior art procedure (A) and immediately before the procedure (A)). The time required for each of the processes (procedure (b) co-occurrence frequency vector generation process, procedure (d) task relevance calculation process, and procedure (c) registration priority calculation process) is reduced. In addition, since unnecessary words are also excluded from the temporary recognition dictionary, the size of the temporary recognition dictionary is reduced, and the time taken for the temporary recognition result generation processing (voice recognition processing by the temporary recognition dictionary) of the procedure (f) is shortened. The Due to these processing time reduction effects, the time for the voice recognition system operator to wait until the word addition processing is completed after issuing the word addition execution instruction is reduced, and the work efficiency is further improved at the second and subsequent word addition.
さらに、暫定認識辞書から不要な単語が削減されると、手順(キ)で算出される平均認識信頼度の正確性が向上する。特許文献1の段落[0037]に記載されている通り、認識信頼度は、算出される。以下に、特許文献1の段落[0037]を引用する。
Furthermore, when unnecessary words are reduced from the provisional recognition dictionary, the accuracy of the average recognition reliability calculated in the procedure (g) is improved. As described in paragraph [0037] of
<特許文献1の段落[0037]>
認識信頼度の算出方法は既知のいかなる方法も用いることができるが、例えば以下のように算出することができる(より詳しくは、「李, 河原, 鹿野, “2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法”, 情報処理学会研究報告, Vol.2003, No.124, pp.281-286」参照)。音声認識システムは入力音声に対する音響モデルおよび言語モデルの尤度が一番高い単語列を認識結果として出力する。しかし、もし入力音声の発音が曖昧であったり、単語列の繋がりが不自然でない単語が複数あったりしたときには、尤度が同程度の対立候補が多数現れ、音声認識システムが最適な認識結果の識別に困難をきたすことがある。音声認識システムが出力を決定するときに有力な対立候補が多数存在すれば認識信頼度は低くなり、逆に対立候補がほとんど存在しなければ認識信頼度は高くなる。
<
Any known method can be used to calculate the recognition reliability. For example, it can be calculated as follows (for more details, see “Li, Kawahara, Shikano,“ Fast word posterior in the two-pass search algorithm. Probability calculation method based on probability ", Information Processing Society of Japan, Vol.2003, No.124, pp.281-286)). The speech recognition system outputs a word string having the highest likelihood of the acoustic model and the language model for the input speech as a recognition result. However, if the pronunciation of the input speech is ambiguous, or if there are multiple words that are not unnaturally connected, a large number of conflicting candidates with the same likelihood appear, and the speech recognition system It can be difficult to identify. If there are many influential conflict candidates when the speech recognition system determines the output, the recognition reliability is low. Conversely, if there are few conflict candidates, the recognition reliability is high.
<特許文献1の段落[0037]終わり>
暫定認識辞書に不要な単語が多いと、それらの単語が暫定音声認識処理中に上記「有力な対立候補」となってしまう可能性が高くなり、本来高い平均認識信頼度が付与されるべき単語の平均認識信頼度が低くなってしまうケースが増加する。暫定認識辞書から不要な単語を事前に削減しておくことで認識信頼度の正確性が向上するため、平均認識信頼度を用いて算出される登録優先度の正確性も向上し、その結果、追加すべき未登録単語がより正確に選出されるようになる。本来追加すべき単語が選出されないケースや追加すべきでない単語が選出されてしまうケースが減少するため、最終的に生成される拡張認識辞書の質が向上し、認識辞書更新後により大きな音声認識精度の向上効果が得られる。
<End of paragraph [0037] of
If there are many unnecessary words in the provisional recognition dictionary, there is a high possibility that these words will become the above-mentioned “potential conflict candidates” during the provisional speech recognition processing, and words that should originally be given a high average recognition reliability. The number of cases where the average recognition reliability of the is reduced. Since the accuracy of recognition reliability is improved by reducing unnecessary words from the provisional recognition dictionary in advance, the accuracy of registration priority calculated using the average recognition reliability is also improved. Unregistered words to be added are selected more accurately. The number of cases where words that should originally be added are not selected and cases where words that should not be added are reduced is reduced, so the quality of the extended recognition dictionary that is finally generated is improved and the speech recognition accuracy is increased after the recognition dictionary is updated. The improvement effect is obtained.
<本発明のポイント>
本発明は、「音声認識システム運用者によって除外された単語は確実に不要単語である」との考えに基づき、2回目以降の単語追加実行時に不要単語が選出されてしまうことを防ぐ。具体的には、従来技術の手順(ケ)において音声認識システム運用者によって除外された不要単語を記憶しておき、2回目以降の単語追加実行時に、従来技術の未登録単語の抽出処理(手順(ア)、S110)の直後のタイミングで不要単語の除外を行う。
<Points of the present invention>
The present invention prevents an unnecessary word from being selected during the second and subsequent word addition execution based on the idea that “the word excluded by the voice recognition system operator is definitely an unnecessary word”. Specifically, unnecessary words excluded by the speech recognition system operator in the prior art procedure (K) are stored, and prior art unregistered word extraction processing (procedure) (A) Unnecessary words are excluded at the timing immediately after S110).
このタイミングで不要単語の除外処理を行うことにより、それ以降の様々な処理にかかる時間の削減効果(<発明の効果>の第2段落)および、追加すべき未登録単語の選出の正確性を向上させる効果(<発明の効果>の第3段落)を得る。 By performing unnecessary word exclusion processing at this timing, it is possible to reduce the time required for various subsequent processing (the second paragraph of <Effects of the invention>) and the accuracy of selecting unregistered words to be added. The effect to improve (the third paragraph of <Effect of invention>) is obtained.
[変形例1]
以下、図11、図12を参照して、本発明の要部に注目するために従来技術の構成要素の一部を集約して実現した、実施例1の変形例(変形例1)である音声認識辞書更新装置5について説明する。図11は、本変形例の音声認識辞書更新装置5の構成を示すブロック図である。図12は、本変形例の音声認識辞書更新装置5の動作を示すフローチャートである。
[Modification 1]
Hereinafter, with reference to FIG. 11 and FIG. 12, a modification of the first embodiment (modification 1) realized by consolidating some of the constituent elements of the prior art to focus on the main part of the present invention. The speech recognition dictionary update device 5 will be described. FIG. 11 is a block diagram showing the configuration of the speech recognition dictionary update device 5 of this modification. FIG. 12 is a flowchart showing the operation of the speech recognition dictionary update device 5 of this modification.
図11に示すように本変形例の音声認識辞書更新装置5は、実施例1に含まれる構成要件を全て過不足なく含んでいる。ただし、関連文書記憶部710と、未登録単語抽出部110と、未登録単語記憶部810は、未登録単語管理部5100に含まれる。また、未登録単語特徴量抽出部210と、入力音声記憶部720と、音声認識部120と、認識結果記憶部820と、認識結果特徴量抽出部220と、タスク関連度算出部310は、タスク関連度管理部5210に含まれる構成である。また、暫定認識辞書登録部130と、暫定認識辞書記憶部830と、暫定音声認識部140と、暫定認識結果記憶部840と、認識信頼度算出部230は、平均認識信頼度管理部5220に含まれる構成である。また、音声認識辞書更新装置5は、タスク関連度管理部5210、平均認識信頼度管理部5220、登録優先度算出部320の三つの構成要件をさらに集約した登録優先度管理部5200を含む。また、認識辞書登録部330と、追加登録単語確認除外保存部050と、認識辞書更新部040と、拡張認識辞書記憶部900は、登録管理部5300に含まれる構成である。本変形例の音声認識辞書更新装置5は、上述の新たな構成要件に加え、認識辞書記憶部730と、除外単語記憶部060と、未登録単語補正部070を含む。本変形例の音声認識辞書更新装置5は実施例1と同じ動作を実行するが、実施例1に存在する各構成要件が、これらを含む新たな構成要件内に集約されているため、各構成要件を集約してなる新たな構成要件の動作について、異なる表現でその動作例を開示するものとする。
As shown in FIG. 11, the speech recognition dictionary update device 5 according to the present modification includes all the constituent elements included in the first embodiment without excess or deficiency. However, the related
前述同様、認識辞書記憶部730は、認識辞書を記憶している。未登録単語管理部5100は、関連文書を入力とし、運用者の単語追加指示を契機として、関連文書中に出現し、認識辞書に登録されていない単語である未登録単語を抽出して記憶する(S5100)。
As described above, the recognition
登録優先度管理部5200は、各未登録単語の登録優先度を算出する(S5200)。より詳細には、タスク関連度管理部5210は、利用者の入力音声を入力とし、利用者の入力音声の内容と未登録単語それぞれとの間の意味的な関連の高さを表すタスク関連度を、未登録単語ごとに算出する(S5210)。平均認識信頼度管理部5220は、認識辞書に未登録単語を追加した暫定認識辞書を用いて、利用者の入力音声を音声認識した結果である暫定認識結果を生成し、暫定認識結果に基づいて各未登録単語の認識結果出力の正解らしさを表す指標の出現回数平均である平均認識信頼度を算出する(S5220)。登録優先度算出部320は、実施例1と同様に、各未登録単語のタスク関連度と平均認識信頼度に基づいて、各未登録単語の登録優先度を算出する。
The registration
登録管理部5300は、未登録単語を所定の基準(例えば前述の登録優先度とその閾値)で選出して、選出された未登録単語を運用者に提示し、選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を除外単語として出力し、除外単語以外の未登録単語を認識辞書に追加した拡張認識辞書を新たな認識辞書として認識辞書記憶部730に記憶された認識辞書を更新する(S5300)。除外単語記憶部060は、除外単語を記憶する(S060)。未登録単語補正部070は、運用者の単語追加指示を契機として、未登録単語管理部5100に新たに記憶された未登録単語のうち、除外単語に一致する単語を削除する(S070)。
The
このように、本変形例の音声認識辞書更新装置5によれば、実施例1の音声認識辞書更新装置1と同様に、運用者の不要な単語の選出作業を抑制することができる。
As described above, according to the speech recognition dictionary update device 5 of the present modification, it is possible to suppress unnecessary word selection work by the operator, as with the speech recognition
[変形例2]
以下、図13、図14を参照して、本発明の要部に注目するために従来技術の構成要素の一部を集約して実現した、実施例2の変形例(変形例2)である音声認識辞書更新装置6について説明する。図13は、本変形例の音声認識辞書更新装置6の構成を示すブロック図である。図14は、本変形例の音声認識辞書更新装置6の動作を示すフローチャートである。
[Modification 2]
Hereinafter, with reference to FIG. 13 and FIG. 14, a modification of the second embodiment (modification 2) realized by consolidating some of the constituent elements of the prior art in order to focus on the main part of the present invention. The speech recognition dictionary update device 6 will be described. FIG. 13 is a block diagram showing the configuration of the speech recognition dictionary update device 6 of this modification. FIG. 14 is a flowchart showing the operation of the speech recognition dictionary update device 6 of this modification.
図13に示すように本変形例の音声認識辞書更新装置6は、実施例2に含まれる構成要件を全て過不足なく含んでいる。ただし、本変形例の音声認識辞書更新装置6は、変形例1と同様に、実施例2に存在する構成要件を集約した新たな構成要件である、未登録単語管理部5100、登録優先度管理部5200、登録管理部5300を含む。これらの構成は、変形例1と同様であるから説明を略す。本変形例の音声認識辞書更新装置6は、上述の新たな構成要件に加え、認識辞書記憶部730と、除外単語記憶部060と、不要単語推定除去部080を含む。
As shown in FIG. 13, the speech recognition dictionary updating apparatus 6 of this modification includes all the constituent elements included in the second embodiment without excess or deficiency. However, the speech recognition dictionary update device 6 according to the present modification, like the first modification, is a new configuration requirement in which the configuration requirements existing in the second embodiment are aggregated, the unregistered
ステップS5100、S5200、S5300、S060は変形例1と同様に実行される。不要単語推定除去部080は、運用者の単語追加指示を契機として、未登録単語管理部に新たに記憶された未登録単語のうち、除外単語に一致する単語、および除外単語に類似する単語を削除する(S080)。前述したように、例えば不要単語推定除去部080は、除外単語のうち記号のみで構成されている単語である記号除外単語の集合を除外記号集合として生成し、未登録単語管理部5100に新たに記憶された未登録単語のうち、除外記号集合に含まれる記号のみで構成される未登録単語を削除する(S080)。
Steps S5100, S5200, S5300, and S060 are executed in the same manner as in the first modification. Unnecessary word
このように、本変形例の音声認識辞書更新装置6によれば、実施例2の音声認識辞書更新装置2と同様の効果を得ることが出来る。 Thus, according to the speech recognition dictionary update device 6 of this modification, the same effect as the speech recognition dictionary update device 2 of Example 2 can be obtained.
[変形例3]
以下、図15、図16を参照して、本発明の要部に注目するために従来技術の構成要素の一部を集約して実現した、実施例3の変形例(変形例3)である音声認識辞書更新装置7について説明する。図15は、本変形例の音声認識辞書更新装置7の構成を示すブロック図である。図16は、本変形例の音声認識辞書更新装置7の動作を示すフローチャートである。
[Modification 3]
Hereinafter, with reference to FIG. 15 and FIG. 16, it is the modification (modification 3) of Example 3 implement | achieved by integrating some components of a prior art in order to pay attention to the principal part of this invention. The speech recognition
図15に示すように本変形例の音声認識辞書更新装置7は、実施例3に含まれる構成要件を全て過不足なく含んでいる。ただし、本変形例の音声認識辞書更新装置7は、変形例1、2と同様に、実施例3に存在する構成要件を集約した新たな構成要件である、未登録単語管理部5100、登録優先度管理部5200を含む。これらの構成は、変形例1、2と同様であるから説明を略す。また、本変形例の音声認識辞書更新装置7は、上述の構成要件に加え、認識辞書登録部330、認識辞書更新部040、拡張認識辞書記憶部900、登録優先度保存部090、除外登録優先度記憶部091、登録優先度閾値算出部092を集約した登録管理部7300を含む。さらに、本変形例の音声認識辞書更新装置5は、認識辞書記憶部730と、除外単語記憶部060と、不要単語推定除去部080を含む。
As shown in FIG. 15, the speech recognition
ステップS5100、S5200、S060、S080は変形例2と同様に実行される。登録管理部7300は、出力した除外単語の登録優先度に基づいて登録優先度閾値を設定および更新し、登録優先度閾値を前記所定の基準として前記未登録単語を選出する(S7300)。
Steps S5100, S5200, S060, and S080 are executed in the same manner as in the second modification. The
このように、本変形例の音声認識辞書更新装置7によれば、実施例3の音声認識辞書更新装置3と同様の効果を得ることが出来る。
Thus, according to the speech recognition
[変形例4]
以下、図17、図18を参照して、本発明の要部に注目するために従来技術の構成要素の一部を集約して実現した、実施例4の変形例(変形例4)である音声認識辞書更新装置8について説明する。図17は、本変形例の音声認識辞書更新装置8の構成を示すブロック図である。図18は、本変形例の音声認識辞書更新装置8の動作を示すフローチャートである。
[Modification 4]
Hereinafter, with reference to FIG. 17 and FIG. 18, a modified example (modified example 4) of the fourth embodiment realized by consolidating some of the constituent elements of the prior art in order to pay attention to the main part of the present invention. The speech recognition dictionary update device 8 will be described. FIG. 17 is a block diagram showing a configuration of the speech recognition dictionary update device 8 of the present modification. FIG. 18 is a flowchart showing the operation of the speech recognition dictionary update device 8 of the present modification.
図17に示すように本変形例の音声認識辞書更新装置8は、実施例4に含まれる構成要件を全て過不足なく含んでいる。本変形例の音声認識辞書更新装置8は、変形例1の音声認識辞書更新装置5の構成とほとんど同じであるが、変形例1における未登録単語補正部070が、本変形例において類似未登録単語除外部095に変更されている点のみ異なる。
As shown in FIG. 17, the speech recognition dictionary update device 8 of the present modification includes all the constituent requirements included in the fourth embodiment without excess or deficiency. The voice recognition dictionary update device 8 of the present modification is almost the same as the configuration of the voice recognition dictionary update device 5 of the first modification, but the unregistered
ステップS5100、S5200、S5300、S060は変形例1と同様に実行される。次に、類似未登録単語除外部095は、運用者の単語追加指示を契機として、未登録単語管理部に新たに記憶された未登録単語を構成する文字列のうち除外単語と異なっている部分の程度を表す値である正規化編集距離を算出し、正規化編集距離に基づいて、新たに記憶された未登録単語を削除する(S095)。
Steps S5100, S5200, S5300, and S060 are executed in the same manner as in the first modification. Next, the similar unregistered
このように、本変形例の音声認識辞書更新装置8によれば、実施例4の音声認識辞書更新装置4と同様の効果を得ることが出来る。
Thus, according to the speech recognition dictionary update device 8 of this modification, the same effect as the speech recognition
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。 The various processes described above are not only executed in time series according to the description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. Needless to say, other modifications are possible without departing from the spirit of the present invention.
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。 Further, when the above-described configuration is realized by a computer, processing contents of functions that each device should have are described by a program. The processing functions are realized on the computer by executing the program on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In this embodiment, the present apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
Claims (8)
関連文書を入力とし、運用者の単語追加指示を契機として、前記関連文書中に出現し、前記認識辞書に登録されていない単語である未登録単語を抽出して記憶する未登録単語管理部と、
前記未登録単語を所定の基準で選出して、前記選出された未登録単語を前記運用者に提示し、前記選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を除外単語として出力し、前記除外単語以外の未登録単語を前記認識辞書に追加した拡張認識辞書を新たな認識辞書として前記認識辞書記憶部に記憶された認識辞書を更新する登録管理部と、
前記除外単語を記憶する除外単語記憶部と、
前記運用者の単語追加指示を契機として、前記未登録単語管理部に新たに記憶された未登録単語のうち、前記除外単語に一致する単語を削除する未登録単語補正部と、
を含む音声認識辞書更新装置。 A recognition dictionary storage unit for storing the recognition dictionary;
An unregistered word management unit that extracts and stores an unregistered word that is a word that appears in the related document and is not registered in the recognition dictionary, with an input of the related document and triggered by an operator's word addition instruction; ,
The unregistered word is selected based on a predetermined criterion, the selected unregistered word is presented to the operator, and an operator instruction is given to exclude the selected unregistered word. A registration management unit that updates the recognition dictionary stored in the recognition dictionary storage unit as a new recognition dictionary with an extended recognition dictionary added to the recognition dictionary as an unregistered word other than the excluded word,
An excluded word storage unit for storing the excluded word;
Triggered by the operator's word addition instruction, among unregistered words newly stored in the unregistered word management unit, an unregistered word correction unit that deletes a word that matches the excluded word;
A speech recognition dictionary update device including:
関連文書を入力とし、運用者の単語追加指示を契機として、前記関連文書中に出現し、前記認識辞書に登録されていない単語である未登録単語を抽出して記憶する未登録単語管理部と、
前記未登録単語を所定の基準で選出して、前記選出された未登録単語を前記運用者に提示し、前記選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を除外単語として出力し、前記除外単語以外の未登録単語を前記認識辞書に追加した拡張認識辞書を新たな認識辞書として前記認識辞書記憶部に記憶された認識辞書を更新する登録管理部と、
前記除外単語を記憶する除外単語記憶部と、
前記運用者の単語追加指示を契機として、前記未登録単語管理部に新たに記憶された未登録単語のうち、前記除外単語に一致する単語、および前記除外単語に類似する単語を削除する不要単語推定除去部と、
を含む音声認識辞書更新装置。 A recognition dictionary storage unit for storing the recognition dictionary;
An unregistered word management unit that extracts and stores an unregistered word that is a word that appears in the related document and is not registered in the recognition dictionary, with an input of the related document and triggered by an operator's word addition instruction; ,
The unregistered word is selected based on a predetermined criterion, the selected unregistered word is presented to the operator, and an operator instruction is given to exclude the selected unregistered word. A registration management unit that updates the recognition dictionary stored in the recognition dictionary storage unit as a new recognition dictionary with an extended recognition dictionary added to the recognition dictionary as an unregistered word other than the excluded word,
An excluded word storage unit for storing the excluded word;
An unnecessary word that deletes a word that matches the excluded word and a word that is similar to the excluded word among unregistered words newly stored in the unregistered word management unit, triggered by the operator's word addition instruction An estimation removal unit;
A speech recognition dictionary update device including:
前記不要単語推定除去部が、
前記除外単語のうち記号のみで構成されている単語である記号除外単語の集合を除外記号集合として生成し、前記未登録単語管理部に新たに記憶された未登録単語のうち、前記除外記号集合に含まれる記号のみで構成される未登録単語を削除する
音声認識辞書更新装置。 The speech recognition dictionary update device according to claim 2,
The unnecessary word estimation removing unit
A set of symbol excluded words that are words composed only of symbols among the excluded words is generated as an excluded symbol set, and the excluded symbol set among the unregistered words newly stored in the unregistered word management unit The speech recognition dictionary update apparatus which deletes the unregistered word comprised only by the symbol contained in.
関連文書を入力とし、運用者の単語追加指示を契機として、前記関連文書中に出現し、前記認識辞書に登録されていない単語である未登録単語を抽出して記憶する未登録単語管理部と、
前記未登録単語を所定の基準で選出して、前記選出された未登録単語を前記運用者に提示し、前記選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を除外単語として出力し、前記除外単語以外の未登録単語を前記認識辞書に追加した拡張認識辞書を新たな認識辞書として前記認識辞書記憶部に記憶された認識辞書を更新する登録管理部と、
前記除外単語を記憶する除外単語記憶部と、
前記運用者の単語追加指示を契機として、前記未登録単語管理部に新たに記憶された未登録単語を構成する文字列のうち前記除外単語と異なっている部分の程度を表す値である正規化編集距離を算出し、前記正規化編集距離に基づいて、前記新たに記憶された未登録単語を削除する類似未登録単語除外部と、
を含む音声認識辞書更新装置。 A recognition dictionary storage unit for storing the recognition dictionary;
An unregistered word management unit that extracts and stores an unregistered word that is a word that appears in the related document and is not registered in the recognition dictionary, with an input of the related document and triggered by an operator's word addition instruction; ,
The unregistered word is selected based on a predetermined criterion, the selected unregistered word is presented to the operator, and an operator instruction is given to exclude the selected unregistered word. A registration management unit that updates the recognition dictionary stored in the recognition dictionary storage unit as a new recognition dictionary with an extended recognition dictionary added to the recognition dictionary as an unregistered word other than the excluded word,
An excluded word storage unit for storing the excluded word;
Normalization that is a value representing the degree of a portion that is different from the excluded word in the character string constituting the unregistered word newly stored in the unregistered word management unit, triggered by the operator's word addition instruction A similar unregistered word excluding unit that calculates an edit distance and deletes the newly stored unregistered word based on the normalized edit distance;
A speech recognition dictionary update device including:
平均認識信頼度を、前記各未登録単語の認識結果出力の正解らしさを表す指標の出現回数平均であるものとし、
タスク関連度を、利用者の入力音声の内容と前記未登録単語それぞれとの間の意味的な関連の高さを表すものとし、
登録優先度を、前記タスク関連度と前記平均認識信頼度に基づく指標であるものとし、
前記登録管理部が、
前記出力した除外単語の前記登録優先度に基づいて登録優先度閾値を設定および更新し、前記登録優先度閾値を前記所定の基準として前記未登録単語を選出する
音声認識辞書更新装置。 The speech recognition dictionary update device according to any one of claims 1 to 4,
The average recognition reliability is assumed to be the average number of appearances of an index representing the correctness of the recognition result output of each unregistered word,
The task relevance level represents the height of the semantic relevance between the content of the user's input speech and each of the unregistered words,
The registration priority is an index based on the task relevance and the average recognition reliability,
The registration management unit
A speech recognition dictionary updating apparatus that sets and updates a registration priority threshold based on the registration priority of the output excluded word, and selects the unregistered word using the registration priority threshold as the predetermined reference.
関連文書を入力とし、運用者の単語追加指示を契機として、前記関連文書中に出現し、前記認識辞書に登録されていない単語である未登録単語を抽出して記憶する未登録単語管理ステップと、
前記未登録単語を所定の基準で選出して、前記選出された未登録単語を前記運用者に提示し、前記選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を前記除外単語として出力し、前記除外単語以外の未登録単語を前記認識辞書に追加した拡張認識辞書を新たな認識辞書として前記認識辞書記憶部に記憶された認識辞書を更新する登録管理ステップと、
前記運用者の単語追加指示を契機として、前記未登録単語管理ステップにおいて新たに記憶された未登録単語のうち、前記除外単語に一致する単語を削除する未登録単語補正ステップと、
を含む音声認識辞書更新方法。 A speech recognition dictionary update method executed by a speech recognition dictionary update device including a recognition dictionary storage unit that stores a recognition dictionary and an excluded word storage unit that stores an excluded word,
An unregistered word management step for extracting and storing an unregistered word that appears in the related document and is not registered in the recognition dictionary, with an input of the related document and triggered by an operator's word addition instruction; ,
The unregistered word is selected based on a predetermined criterion, the selected unregistered word is presented to the operator, and an operator instruction is given to exclude the selected unregistered word. A registration management step of updating the recognition dictionary stored in the recognition dictionary storage unit as a new recognition dictionary using an extended recognition dictionary in which unregistered words other than the exclusion word are added to the recognition dictionary as a new recognition dictionary; ,
Triggered by the operator's word addition instruction, an unregistered word correction step of deleting a word that matches the excluded word among the unregistered words newly stored in the unregistered word management step;
A speech recognition dictionary update method including:
関連文書を入力とし、運用者の単語追加指示を契機として、前記関連文書中に出現し、前記認識辞書に登録されていない単語である未登録単語を抽出して記憶する未登録単語管理ステップと、
前記未登録単語を所定の基準で選出して、前記選出された未登録単語を前記運用者に提示し、前記選出された未登録単語のうち除外する旨の運用者指示があった未登録単語を前記除外単語として出力し、前記除外単語以外の未登録単語を前記認識辞書に追加した拡張認識辞書を新たな認識辞書として前記認識辞書記憶部に記憶された認識辞書を更新する登録管理ステップと、
前記運用者の単語追加指示を契機として、前記未登録単語管理ステップにおいて新たに記憶された未登録単語のうち、前記除外単語に一致する単語、および前記除外単語に類似する単語を削除する不要単語推定除去ステップと、
を含む音声認識辞書更新方法。 A speech recognition dictionary update method executed by a speech recognition dictionary update device including a recognition dictionary storage unit that stores a recognition dictionary and an excluded word storage unit that stores an excluded word,
An unregistered word management step for extracting and storing an unregistered word that appears in the related document and is not registered in the recognition dictionary, with an input of the related document and triggered by an operator's word addition instruction; ,
The unregistered word is selected based on a predetermined criterion, the selected unregistered word is presented to the operator, and an operator instruction is given to exclude the selected unregistered word. A registration management step of updating the recognition dictionary stored in the recognition dictionary storage unit as a new recognition dictionary using an extended recognition dictionary in which unregistered words other than the exclusion word are added to the recognition dictionary as a new recognition dictionary; ,
An unnecessary word that deletes a word that matches the excluded word and a word that is similar to the excluded word among unregistered words newly stored in the unregistered word management step, triggered by the operator's word addition instruction An estimated removal step;
A speech recognition dictionary update method including:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014096577A JP5921601B2 (en) | 2014-05-08 | 2014-05-08 | Speech recognition dictionary update device, speech recognition dictionary update method, program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014096577A JP5921601B2 (en) | 2014-05-08 | 2014-05-08 | Speech recognition dictionary update device, speech recognition dictionary update method, program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015215390A true JP2015215390A (en) | 2015-12-03 |
JP5921601B2 JP5921601B2 (en) | 2016-05-24 |
Family
ID=54752352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014096577A Active JP5921601B2 (en) | 2014-05-08 | 2014-05-08 | Speech recognition dictionary update device, speech recognition dictionary update method, program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5921601B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020160118A (en) * | 2019-03-25 | 2020-10-01 | 株式会社エヌ・ティ・ティ・データ | Information processing device, information processing method and program |
CN112735428A (en) * | 2020-12-27 | 2021-04-30 | 科大讯飞(上海)科技有限公司 | Hot word acquisition method, voice recognition method and related equipment |
US11314810B2 (en) * | 2019-01-09 | 2022-04-26 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316376A (en) * | 2002-04-22 | 2003-11-07 | Toshiba Corp | Device and method for registering unknown word |
JPWO2005122144A1 (en) * | 2004-06-10 | 2008-04-10 | 松下電器産業株式会社 | Speech recognition apparatus, speech recognition method, and program |
JP2013109125A (en) * | 2011-11-21 | 2013-06-06 | Nippon Telegr & Teleph Corp <Ntt> | Word addition device, word addition method and program |
JP2013171222A (en) * | 2012-02-22 | 2013-09-02 | Nippon Telegr & Teleph Corp <Ntt> | Word adding device, word adding method, and program |
JP2014002237A (en) * | 2012-06-18 | 2014-01-09 | Nippon Telegr & Teleph Corp <Ntt> | Speech recognition word addition device, and method and program thereof |
-
2014
- 2014-05-08 JP JP2014096577A patent/JP5921601B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316376A (en) * | 2002-04-22 | 2003-11-07 | Toshiba Corp | Device and method for registering unknown word |
JPWO2005122144A1 (en) * | 2004-06-10 | 2008-04-10 | 松下電器産業株式会社 | Speech recognition apparatus, speech recognition method, and program |
JP2013109125A (en) * | 2011-11-21 | 2013-06-06 | Nippon Telegr & Teleph Corp <Ntt> | Word addition device, word addition method and program |
JP2013171222A (en) * | 2012-02-22 | 2013-09-02 | Nippon Telegr & Teleph Corp <Ntt> | Word adding device, word adding method, and program |
JP2014002237A (en) * | 2012-06-18 | 2014-01-09 | Nippon Telegr & Teleph Corp <Ntt> | Speech recognition word addition device, and method and program thereof |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11314810B2 (en) * | 2019-01-09 | 2022-04-26 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
JP2020160118A (en) * | 2019-03-25 | 2020-10-01 | 株式会社エヌ・ティ・ティ・データ | Information processing device, information processing method and program |
JP7406921B2 (en) | 2019-03-25 | 2023-12-28 | 株式会社Nttデータグループ | Information processing device, information processing method and program |
CN112735428A (en) * | 2020-12-27 | 2021-04-30 | 科大讯飞(上海)科技有限公司 | Hot word acquisition method, voice recognition method and related equipment |
Also Published As
Publication number | Publication date |
---|---|
JP5921601B2 (en) | 2016-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10460029B2 (en) | Reply information recommendation method and apparatus | |
TWI664540B (en) | Search word error correction method and device, and weighted edit distance calculation method and device | |
US10783171B2 (en) | Address search method and device | |
JP6335898B2 (en) | Information classification based on product recognition | |
US20160117405A1 (en) | Information Processing Method and Apparatus | |
US11366840B2 (en) | Log-aided automatic query expansion approach based on topic modeling | |
WO2017177809A1 (en) | Word segmentation method and system for language text | |
US8719025B2 (en) | Contextual voice query dilation to improve spoken web searching | |
CN106445915B (en) | New word discovery method and device | |
US10410632B2 (en) | Input support apparatus and computer program product | |
JP6495792B2 (en) | Speech recognition apparatus, speech recognition method, and program | |
CN113204667B (en) | Method and device for training audio annotation model and audio annotation | |
KR101944274B1 (en) | Appratus and method for classfying situation based on text | |
CN113935339A (en) | Translation method, translation device, electronic equipment and storage medium | |
CN111782892B (en) | Similar character recognition method, device, apparatus and storage medium based on prefix tree | |
JP5921601B2 (en) | Speech recognition dictionary update device, speech recognition dictionary update method, program | |
CN108182173A (en) | A kind of method, apparatus and electronic equipment for extracting keyword | |
JP7093292B2 (en) | Systems and methods for segmenting dialogue session text | |
CN113408280A (en) | Negative example construction method, device, equipment and storage medium | |
JP5546565B2 (en) | Word addition device, word addition method, and program | |
CN107562715B (en) | Word vector processing method and device and electronic equipment | |
JP5670293B2 (en) | Word addition device, word addition method, and program | |
JP6486789B2 (en) | Speech recognition apparatus, speech recognition method, and program | |
JP2016095399A (en) | Voice recognition result shaping device, method, and program | |
CN110569498A (en) | Compound word recognition method and related device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151006 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5921601 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |