JP2012155272A - Speech recognition dictionary extension device, system, method and program - Google Patents
Speech recognition dictionary extension device, system, method and program Download PDFInfo
- Publication number
- JP2012155272A JP2012155272A JP2011016562A JP2011016562A JP2012155272A JP 2012155272 A JP2012155272 A JP 2012155272A JP 2011016562 A JP2011016562 A JP 2011016562A JP 2011016562 A JP2011016562 A JP 2011016562A JP 2012155272 A JP2012155272 A JP 2012155272A
- Authority
- JP
- Japan
- Prior art keywords
- term
- speech recognition
- list
- dictionary
- recognition dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、通信ネットワーク上に設けられた装置が音声認識を行う際に用いる音声認識辞書を拡張する音声認識辞書拡張装置、音声認識辞書拡張システム、音声認識辞書拡張方法および音声認識辞書拡張プログラムに関する。 The present invention relates to a speech recognition dictionary expansion device, a speech recognition dictionary expansion system, a speech recognition dictionary expansion method, and a speech recognition dictionary expansion program for expanding a speech recognition dictionary used when a device provided on a communication network performs speech recognition. .
特許文献1には、ユーザの個別辞書に登録された情報を他のユーザにも利用可能にする辞書流通方法が記載されている。特許文献1に記載された方法では、各ユーザのユーザ辞書が公開辞書として登録されると、他のユーザは、公開辞書に登録されているユーザ辞書の中から自身が利用したい辞書を選択し、必要に応じてそのユーザ辞書をインポートする。 Patent Literature 1 describes a dictionary distribution method that makes information registered in a user's individual dictionary available to other users. In the method described in Patent Literature 1, when the user dictionary of each user is registered as a public dictionary, other users select a dictionary that the user wants to use from the user dictionaries registered in the public dictionary, Import the user dictionary as needed.
現在、クラウドコンピューティングにおいて提供される業務アプリケーションが普及している。また、スマートホンをはじめとした情報端末も普及しているが、このような情報端末を活用して業務アプリケーションを構築するには、情報入力が煩わしいといった課題がある。そこで、情報端末の音声認識機能を活用して情報入力を行う取り組みがなされている。 Currently, business applications provided in cloud computing are widespread. In addition, information terminals such as smart phones are widely used. However, in order to construct a business application using such information terminals, there is a problem that it is troublesome to input information. Thus, efforts are being made to input information by utilizing the voice recognition function of the information terminal.
音声認識を行う場合、認識精度を上げるために多くの用語を登録する必要がある。しかし、運用側だけでは専門的な用語を網羅することは難しく、認識精度を上げることができない。そこで、このような用語をユーザに登録してもらうため、ユーザによる多くの利用を促進する仕組みが必要である。 When performing speech recognition, it is necessary to register many terms in order to improve recognition accuracy. However, it is difficult for the operation side alone to cover technical terms, and the recognition accuracy cannot be improved. Therefore, in order to have the user register such terms, a mechanism that promotes many uses by the user is necessary.
特許文献1に記載された辞書流通方法により、各ユーザは文字入力を行う際の辞書として選択した辞書を扱うことができるようになる。 According to the dictionary distribution method described in Patent Document 1, each user can handle a dictionary selected as a dictionary when inputting characters.
しかし、特許文献1に記載された辞書流通方法は、複数のユーザに対する音声認識を単一の辞書(音声認識辞書)で行う処理モデルには適用できない。また、特許文献1に記載された辞書流通方法では、複数の辞書を制御する機構が必要になる。 However, the dictionary distribution method described in Patent Document 1 cannot be applied to a processing model in which speech recognition for a plurality of users is performed using a single dictionary (speech recognition dictionary). Further, the dictionary distribution method described in Patent Document 1 requires a mechanism for controlling a plurality of dictionaries.
上述の通り、音声認識の精度を上げるためには、単一の音声認識辞書に多くの用語を登録する必要がある。そのためには、各ユーザの作成したユーザ辞書を活用できることが望ましい。 As described above, in order to increase the accuracy of speech recognition, it is necessary to register many terms in a single speech recognition dictionary. For that purpose, it is desirable to be able to utilize a user dictionary created by each user.
そこで、本発明は、各ユーザが作成するユーザ辞書に登録された用語を音声認識に用いる用語として活用できる音声認識辞書拡張装置、音声認識辞書拡張システム、音声認識辞書拡張方法および音声認識辞書拡張プログラムを提供することを目的とする。 Therefore, the present invention provides a speech recognition dictionary expansion device, a speech recognition dictionary expansion system, a speech recognition dictionary expansion method, and a speech recognition dictionary expansion program that can use terms registered in a user dictionary created by each user as terms used for speech recognition. The purpose is to provide.
本発明による音声認識辞書拡張装置は、音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段と、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから、音声認識辞書に存在しない用語を抽出し、抽出した用語をその音声認識辞書に追加する未登録用語抽出手段と、音声認識辞書に基づいて音声認識を行う音声認識手段とを備えたことを特徴とする。 A speech recognition dictionary expansion device according to the present invention is created by associating speech recognition dictionary storage means for storing a speech recognition dictionary including a term to be speech-recognized, and a term to be speech-recognized and a reading of the term. A term that is not included in the speech recognition dictionary, and an unregistered term extraction unit that adds the extracted term to the speech recognition dictionary, and speech recognition that performs speech recognition based on the speech recognition dictionary Means.
本発明による音声認識辞書拡張システムは、音声認識を行う音声認識サーバと、音声認識サーバに音声を送信して音声認識を要求する要求端末とを備え、音声認識サーバが、音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段と、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから音声認識辞書に存在しない用語を抽出し、抽出した用語を音声認識辞書に追加する未登録用語抽出手段と、音声認識辞書に基づいて、要求端末から受信した音声の音声認識を行う音声認識手段とを含むことを特徴とする。 A speech recognition dictionary expansion system according to the present invention includes a speech recognition server that performs speech recognition, and a request terminal that transmits speech to the speech recognition server and requests speech recognition, and the speech recognition server is a target of speech recognition. A speech recognition dictionary storage means for storing a speech recognition dictionary including terms, and a term that does not exist in the speech recognition dictionary from a term list that is a list created by associating a term that is a target of speech recognition with a reading of the term An unregistered term extracting unit that extracts and adds the extracted term to the speech recognition dictionary, and a speech recognition unit that performs speech recognition of the speech received from the requesting terminal based on the speech recognition dictionary.
本発明による音声認識辞書拡張方法は、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから、音声認識の対象とする用語を含む音声認識辞書に存在しない用語を抽出し、抽出された用語を音声認識辞書に追加し、音声認識辞書に基づいて、音声認識を要求する要求端末から受信した音声の音声認識を行うことを特徴とする。 A speech recognition dictionary expansion method according to the present invention converts a term that is a target of speech recognition into a speech recognition dictionary that includes a term that is a target of speech recognition, from a term list that is a list that is created by associating a term that is subject to speech recognition with reading of the term A term that does not exist is extracted, the extracted term is added to a speech recognition dictionary, and speech received from a requesting terminal that requests speech recognition is recognized based on the speech recognition dictionary.
本発明による音声認識辞書拡張プログラムは、音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段を備えたコンピュータに適用される音声認識辞書拡張プログラムであって、コンピュータに、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから、音声認識辞書に存在しない用語を抽出し、抽出した用語をその音声認識辞書に追加する未登録用語抽出処理、および、音声認識辞書に基づいて音声認識を行う音声認識処理を実行させることを特徴とする。 A speech recognition dictionary expansion program according to the present invention is a speech recognition dictionary expansion program applied to a computer provided with speech recognition dictionary storage means for storing a speech recognition dictionary including a term to be a target of speech recognition. A term that does not exist in the speech recognition dictionary is extracted from the term list, which is a list that is created by associating the terms that are subject to speech recognition and the readings of the terms, and the extracted terms are not added to the speech recognition dictionary. A registered term extraction process and a speech recognition process for performing speech recognition based on a speech recognition dictionary are executed.
本発明によれば、各ユーザが作成するユーザ辞書に登録された用語を音声認識に用いる用語として活用できる。 According to the present invention, terms registered in a user dictionary created by each user can be utilized as terms used for speech recognition.
以下、本発明の実施形態を図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明による音声認識辞書拡張システムの一実施形態を示すブロック図である。本発明における音声認識辞書拡張システムは、サービス提供サーバ10と、情報端末20と、登録端末30とを備えている。サービス提供サーバ10、情報端末20および登録端末30は、プログラム制御により動作し、インターネット等の通信ネットワーク100を介して相互に接続される。
FIG. 1 is a block diagram showing an embodiment of a speech recognition dictionary expansion system according to the present invention. The speech recognition dictionary expansion system according to the present invention includes a
情報端末20は、小型パーソナルコンピュータ等の情報処理装置である。情報端末20は、音声送受信部21を備えている。また、情報端末20には、マイクロホン22と、表示部23とが接続される。音声送受信部21は、マイクロホン22で録音された音声を、通信ネットワーク100を介してサービス提供サーバ10に送信することで音声認識を依頼する。また、音声送受信部21は、サービス提供サーバ10からの音声認識結果を受信すると、その結果を表示部23に表示させる。
The
サービス提供サーバ10は、インターネット上に設置されているワークステーションサーバなどの情報処理装置である。サービス提供サーバ10は、ID管理部11と、業務サービス提供部12と、音声認識辞書管理部13と、音声認識部14と、貢献度管理部15とを備えている。
The
ID管理部11は、サービス提供サーバ10の利用者を識別するためのユーザ情報を記憶する。また、業務サービス提供部12は、利用者に対して提供する各種の業務サービスを行う。例えば、音声認識の結果を電子メールにて利用者に送信する場合、業務サービス提供部12は、音声認識結果を電子メールで送信可能な形式に編集する。また、例えば、利用者が所属するグループ内で音声認識結果を共有するような場合、業務サービス提供部12は、グループ内のメンバが利用するグループウェアで利用できる形式に音声認識結果を編集してもよい。ただし、業務サービス提供部12が提供する業務サービスは、上記内容に限定されない。
The
音声認識辞書管理部13は、辞書制御部16と、辞書記憶部17とを含む。
The voice recognition
辞書記憶部17は、後述する音声認識部14が音声認識を行う際に用いる音声認識辞書(以下、既存辞書と記すこともある。)を記憶する。既存辞書とは、具体的には、音声認識サービスで音声データから音声認識結果を導き出すために利用される用語の辞書である。音声認識辞書には、音声認識の対象とする用語とその用語の読みとが含まれる。ただし、音声認識辞書に含まれる情報は、用語および用語の読みに限定されない。
The
辞書制御部16は、後述する登録端末30から用語リストを受信すると、受信した用語リストに含まれる用語のうち、既存辞書(音声認識辞書)に未登録の用語を抽出し、抽出した用語を既存辞書(音声認識辞書)に追加する。ここで、用語リストとは、音声認識の対象とする用語とその用語の読みとを対にしたリストのことである。すなわち、用語リストはユーザ辞書に対応する。図2は、用語リストの例を示す説明図である。図2に示す例では、例えば、用語「証券」と、その用語の読み「しょうけん」とが対応することを示す。なお、辞書制御部16は、受信した用語リストに含まれる全ての用語を音声認識辞書に追加してもよい。
When the
貢献度管理部15は、貢献度制御部18と、貢献度記憶部19とを含む。
The
貢献度記憶部19は、辞書制御部16が抽出した既存辞書に未登録の用語のリストを記憶する。このリストは、音声認識に貢献する用語のリストであることから、以下の説明では、このリストのことを貢献単語リストと記す。すなわち、貢献単語リストとは、「既存辞書に存在しない用語をその既存辞書に登録することで用語を登録したユーザが辞書拡張に貢献した」という判定を行うために、そのユーザが用語を登録したという情報を含めた用語リストであるということができる。貢献単語リストには、未登録の用語が抽出された用語リストの作成元ユーザを含んでいてもよい。
The
貢献度記憶部19は、ユーザごとに付与される所定のポイントを記憶する。具体的には、貢献度記憶部19は、音声認識辞書に登録された用語のうち各ユーザの用語リストから登録された用語が音声認識に利用された際に付与されるポイントを記憶する。このように付与されるポイントは、音声認識に貢献した際に付与されるポイントであることから、以下の説明では、このポイントのことを貢献度ポイントと記す。
The
図3は、貢献度ポイントを含む貢献単語リストの例を示す説明図である。図3に示す例では、例えば、用語「投資信託」がユーザ「Aさん」の用語リストから登録されたものであり、その用語には貢献度ポイントが20ポイント付与されていることを示す。 FIG. 3 is an explanatory diagram illustrating an example of a contribution word list including contribution degree points. In the example illustrated in FIG. 3, for example, the term “investment trust” is registered from the term list of the user “Mr. A”, and the term is given 20 contribution points.
貢献度制御部18は、音声認識辞書管理部13が抽出した既存辞書に未登録の用語から貢献単語リストを生成する。貢献度制御部18は、例えば、図3に例示するように、用語と用語リストの作成元ユーザとを対応付けて貢献単語リストを生成してもよい。
The contribution
また、貢献度制御部18は、後述する音声認識部14が音声認識した音声に含まれる用語が用語リストから抽出された用語か否かを判定し、用語リストから抽出された用語と判定された場合には、そのユーザに貢献度ポイントを付与する。具体的には、貢献度制御部18は、音声認識に用いられた用語が貢献単語リストに存在する単語である場合、その単語を登録したユーザに貢献度ポイントを付与する。貢献度制御部18は、貢献度ポイントとして、一定の値を付与してもよく、他の要因に基づいて変化させたポイントを付与してもよい。
Further, the
なお、貢献度制御部18は、音声認識部14が音声認識した音声に含まれる用語を拡張された音声認識辞書に含まれる用語全体を対象として集計してもよい。そして、貢献度制御部18は、この集計結果と貢献単語リストとを照合し、集計結果から貢献単語リストに含まれる用語の利用数を集計してもよい。管理者は、このように集計された利用数や、貢献度ポイントに応じて、業務サービスに対する利用料の割引や特典をユーザに与えることが可能になる。
The
また、貢献度制御部18は、登録端末30から貢献度ポイントの照会要求を受信すると、指定されたユーザの貢献度ポイントを貢献度記憶部19から抽出し、抽出結果を登録端末30に送信する。
When the
音声認識部14は、既存辞書に基づいて情報端末20から送信される音声の音声認識を行い、認識結果を情報端末20に返信する。音声認識の方法は特に限定されず、現在知られている方法のいずれを用いてもよい。
The
音声認識部14と、辞書制御部16と、貢献度制御部18とは、プログラム(音声認識辞書拡張プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、サービス提供サーバ10の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、音声認識部14、辞書制御部16および貢献度制御部18として動作してもよい。また、音声認識部14と、辞書制御部16と、貢献度制御部18とは、それぞれが専用のハードウェアで実現されていてもよい。
The
また、辞書記憶部17および貢献度記憶部19は、例えば、磁気ディスク等により実現される。
The
登録端末30は、小型パーソナルコンピュータ等の情報処理装置である。登録端末30は、利用者が作成した用語リストを、通信ネットワーク100を介してサービス提供サーバ10に送信する。また、登録端末30は、サービス提供サーバ10から受信したデータを、表示装置(図示せず)に表示させる。
The
なお、上記説明では、登録端末30から用語リストを登録する場合を例示しているが、用語リストの登録元は、登録端末30に限定されず、他の装置であってもよい。例えば、情報端末20が備える登録手段(図示せず)が、音声認識サーバ10に用語リストを登録するようにしてもよい。また、用語リストを登録するユーザは、1人であってもよく、複数であってもよい。なお、以下の説明では、用語リストの作成者と登録者とが同一のユーザであるものとする。
In the above description, the case where the term list is registered from the
次に、動作について説明する。図4は、本実施形態における音声認識辞書拡張システムの動作の例を示すフローチャートである。以下の説明では、ユーザ「Aさん」が登録した用語リストに記載された用語をユーザ「Bさん」が利用した場合を例に説明する。 Next, the operation will be described. FIG. 4 is a flowchart showing an example of the operation of the speech recognition dictionary expansion system according to this embodiment. In the following description, a case where the user “Mr. B” uses a term described in the term list registered by the user “Mr. A” will be described as an example.
まずAさんが登録端末30に用語リストを登録すると、登録端末30は、登録された用語リストをサービス提供サーバ10へ送信する(ステップA1)。上述の通り、用語リストとは、図2に例示するように、用語と読みとを対にしたリストのことである。
First, when Mr. A registers a term list in the
次に、サービス提供サーバ10が用語リストを受け取ると、音声認識辞書管理部13(より具体的には、辞書制御部16)は、用語リストに記載された各用語が既存辞書に存在するか否かを判定する(ステップA2)。既存辞書に存在しない用語が用語リストに含まれている場合、貢献度管理部15(より具体的には、貢献度制御部18)は、その用語を貢献単語リストに抽出する(ステップA3)。また、辞書制御部16は、用語リストに含まれる用語を既存辞書に取り込み、既存辞書を拡張する(ステップA4)。
Next, when the
ここで、用語リストに記載された各用語が既存辞書に存在するか否かを判定する方法について具体的に説明する。用語リストに含まれる用語には、読みが同じで表記(例えば、漢字)が異なるもの、表記が同じで読みが異なるものが存在する。読みが同じで表記が異なる用語の例として、例えば、読みが「はし」であり、表記が「橋」または「箸」の場合が挙げられる。また、表記が同じで読みが異なる用語の例として、例えば、表記が「神戸」であり、読みが「こうべ」、「かんど」または「ごうど」の場合が挙げられる。 Here, a method for determining whether or not each term described in the term list exists in the existing dictionary will be specifically described. Terms included in the term list include those with the same reading and different notation (for example, kanji), and those with the same notation and different readings. Examples of terms that have the same reading but different notation include, for example, a case where the reading is “Hashi” and the notation is “bridge” or “chopsticks”. Examples of terms that have the same notation but different readings include, for example, the case where the notation is “Kobe” and the reading is “Kobe”, “Kando”, or “Godo”.
そこで、辞書制御部16は、サービス提供サーバ10が用語リストを受け取ると、既存辞書を検索し、用語リストの表記に対応する部分(例えば、漢字)が含まれているか否かを判定する。既存辞書に該当する表記が含まれていない場合、辞書制御部16は、新規の用語と判定し、その用語を既存辞書に取り込む。
Therefore, when the
一方、既存辞書に該当する表記が含まれている場合、辞書制御部16は、その表記に対する用語リストの読みと、既存辞書の読みとが一致するか否かを判定する。両者の読みが一致しなかった場合、辞書制御部16は、新規の用語と判定し、その用語を既存辞書に取り込む。一方、両者の読みが一致した場合、辞書制御部16は、既存の用語と判定し、既存辞書への取り込みは行わない。
On the other hand, when a notation corresponding to the existing dictionary is included, the
このように、辞書制御部16は、用語リストに含まれる用語の表記と既存辞書における用語の表記とが一致しない用語、または、用語リストにおける用語の読みと既存辞書における用語の読みとが一致しない用語を、既存辞書に存在しない用語(新規の用語)として抽出する。
As described above, the
次に、Bさんによるサービス利用開始を示す操作が行われると、情報端末20は、サービス提供サーバ10にアクセスする。このとき、Bさんは、業務サービスの入力に音声認識を利用するものとする(ステップA5)。具体的には、Bさんがマイクロホン22を介して情報端末20に音声を入力すると、音声送受信部21は、入力された音声データをサービス提供サーバ10に送信する。
Next, when an operation indicating the start of service use by Mr. B is performed, the
サービス提供サーバ10が音声データを受け取ると、音声認識部14は、音声認識を実行し、音声認識結果を情報端末20へ送信する(ステップA6)。情報端末20は、受け取った音声認識結果を表示部23に表示させる(ステップA7)。
When the
次に、サービス提供サーバ10では、貢献度制御部18が音声認識に利用された用語が貢献単語リストに存在するか否かを判定する(ステップA9)。音声認識に利用された用語が貢献単語リストに存在した場合、貢献度制御部18は、貢献度記憶部19に貢献度ポイントを記憶させる。具体的には、その用語が抽出された用語リストの作成元ユーザに、貢献度ポイントを付与する。このように、貢献度ポイントは、既存辞書に登録された用語が利用されるごとに蓄積され、利用度を示すランキングの表示や、一定数に達した際に業務サービスに対する利用料を割り引くサービスなどに活用される。
Next, in the
その後、Aさんによって自身の貢献度ポイントを確認する旨の操作が行われると、登録端末30は、その操作に応じてサービス提供サーバ10に貢献度ポイントを要求する(ステップA10)。そして、貢献度制御部18は、貢献度記憶部19から抽出したAさんの貢献度ポイントを登録端末30に通知する(ステップA11)。
Thereafter, when an operation for confirming his / her own contribution point is performed by Mr. A, the
以上のように、本実施形態によれば、辞書制御部16が、音声認識辞書に存在しない用語を用語リストから抽出し、抽出した用語を音声認識辞書に追加する。そして、音声認識部14が音声認識辞書に基づいて情報端末20から受信した音声の音声認識を行う。以上のような構成により、各ユーザが作成する用語リスト(ユーザ辞書)に登録された用語を音声認識に用いる用語として活用できる。
As described above, according to this embodiment, the
また、貢献度制御部18は、音声認識された音声に含まれる用語が用語リストから抽出された用語である場合に、その用語リストの作成元ユーザに貢献度ポイントを付与してもよい。このような構成を含むことで、各ユーザに対してユーザ辞書を積極的に提供させることができる。
In addition, when the term included in the speech that has been speech-recognized is a term extracted from the term list, the contribution
具体的には、辞書制御部16が、登録された用語リストと既存辞書との差分を抽出し、貢献度制御部18が貢献単語リストを生成する。そして、音声認識部14が音声認識を行うたびに、貢献度制御部18が音声認識された音声に含まれる用語が貢献単語リストに存在するか否かを判定し、用語が存在する場合には、貢献度制御部18が用語リストの作成元ユーザに貢献度ポイントを付与するようにしている。そのため、利用者に対して用語を登録させる動機づけを行うことが出来る。
Specifically, the
さらに、辞書制御部16が、登録された用語リストを既存辞書に取り込むことで、拡張した辞書を作成する。そのため、利用者に意識させることなく辞書を拡張でき、また、運用者の手間をかけずに音声認識の精度を上げることができる。
Further, the
また、例えば、特許文献1に記載された辞書流通方法では、他のユーザが登録したユーザ辞書を利用する場合、その利用に伴って課金されることが考えられる。しかし、既存辞書を単一化し、提供される通常のサービス内で(すなわち、特別に課金されることなく)他のユーザが登録した用語を利用できるのであれば、システムの利用が促進され、音声認識辞書の更なる精度向上が期待できる。さらに、本発明を利用して、登録した用語が多く利用されるほど料金が割安になるような課金を行うクラウドサービスを提供することで、用語の登録を促し、音声認識の精度を向上させることができる。 Further, for example, in the dictionary distribution method described in Patent Document 1, when a user dictionary registered by another user is used, it is considered that the user is charged for using the user dictionary. However, if the existing dictionary can be unified and the terms registered by other users can be used within the normal service provided (ie, without special charge), the use of the system is facilitated and the voice Further improvement of the accuracy of the recognition dictionary can be expected. Furthermore, by using the present invention to provide a cloud service that charges so that the more the registered terms are used, the cheaper the fee, the registration of terms is promoted and the accuracy of speech recognition is improved. Can do.
次に、本発明の最小構成について説明する。図5は、本発明による音声認識辞書拡張装置の最小構成の例を示すブロック図である。本発明による音声認識辞書拡張装置は、音声認識の対象とする用語を含む音声認識辞書(例えば、既存辞書)を記憶する音声認識辞書記憶手段81(例えば、辞書記憶部17)と、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから音声認識辞書に存在しない用語を抽出し、抽出した用語を音声認識辞書に追加する未登録用語抽出手段82(例えば、辞書制御部16)と、音声認識辞書に基づいて音声認識を行う音声認識手段83(例えば、音声認識部14)とを備えている。 Next, the minimum configuration of the present invention will be described. FIG. 5 is a block diagram showing an example of the minimum configuration of the speech recognition dictionary expansion apparatus according to the present invention. The speech recognition dictionary expansion apparatus according to the present invention includes a speech recognition dictionary storage unit 81 (for example, dictionary storage unit 17) that stores a speech recognition dictionary (for example, an existing dictionary) that includes a term that is a target of speech recognition, and a speech recognition dictionary. Unregistered term extraction means 82 for extracting a term that does not exist in the speech recognition dictionary from a term list that is a list created by associating the target term with the reading of the term, and adding the extracted term to the speech recognition dictionary (For example, dictionary control unit 16) and speech recognition means 83 (for example, speech recognition unit 14) for performing speech recognition based on the speech recognition dictionary.
以上のような構成により、各ユーザが作成するユーザ辞書(用語リスト)に登録された用語を音声認識に用いる用語として活用できる。 With the above configuration, terms registered in a user dictionary (term list) created by each user can be used as terms used for speech recognition.
また、音声認識手段83が音声認識を行った音声に含まれる用語が用語リストから抽出された用語である場合に、その用語リストの作成元ユーザに所定のポイント(例えば、貢献度ポイント)を付与するポイント付与手段(例えば、貢献度制御部18)を備えていてもよい。このような構成を含むことで、各ユーザに対してユーザ辞書(用語リスト)を積極的に提供させることができる。
In addition, when the term included in the speech recognized by the
また、ポイント付与手段は、未登録用語抽出手段82が抽出した用語とその用語の作成元ユーザとを対応付けたリストである用語抽出リスト(例えば、貢献単語リスト)を作成し、音声認識手段83が音声認識を行った音声に含まれる用語が用語抽出リストに含まれている場合、その用語に対応する作成元ユーザに所定のポイントを付与してもよい。
The point granting unit creates a term extraction list (for example, a contribution word list) that is a list in which the term extracted by the unregistered
また、図6は、本発明による音声認識辞書拡張システムの最小構成の例を示すブロック図である。本発明による音声認識辞書拡張システムは、音声認識を行う音声認識サーバ70(例えば、サービス提供サーバ10)と、音声認識サーバ70に音声を送信して音声認識を要求する要求端末90(例えば、情報端末20)とを備えている。 FIG. 6 is a block diagram showing an example of the minimum configuration of the speech recognition dictionary expansion system according to the present invention. The speech recognition dictionary expansion system according to the present invention includes a speech recognition server 70 (for example, service providing server 10) that performs speech recognition, and a request terminal 90 (for example, information that requests speech recognition by transmitting speech to the speech recognition server 70). Terminal 20).
音声認識サーバ70は、音声認識辞書記憶手段71と、未登録用語抽出手段72と、音声認識手段73とを含む。
The
音声認識手段73(例えば、音声認識部14)は、音声認識辞書に基づいて要求端末90から受信した音声の音声認識を行う。なお、音声認識辞書記憶手段71および未登録用語抽出手段72、それぞれ、図5に例示する声認識辞書記憶手段81および未登録用語抽出手段82と同様である。
The voice recognition unit 73 (for example, the voice recognition unit 14) performs voice recognition of the voice received from the
このような構成であっても、各ユーザが作成するユーザ辞書(用語リスト)に登録された用語を音声認識に用いる用語として活用できる。 Even with such a configuration, terms registered in a user dictionary (term list) created by each user can be used as terms used for speech recognition.
また、音声認識サーバ70は、音声認識手段73が音声認識を行った音声に含まれる用語が用語リストから抽出された用語である場合に、その用語リストの作成元ユーザに所定のポイントを付与するポイント付与手段(例えば、貢献度制御部18)とを含んでいてもよい。
The
また、ポイント付与手段は、未登録用語抽出手段72が抽出した用語とその用語の作成元ユーザとを対応付けたリストである用語抽出リストを作成し、音声認識手段73が音声認識を行った音声に含まれる用語が用語抽出リストに含まれている場合、その用語に対応する作成元ユーザに所定のポイントを付与してもよい。
In addition, the point granting unit creates a term extraction list that is a list in which the term extracted by the unregistered
また、音声認識辞書拡張システムは、用語リストを登録する登録手段(例えば、登録端末30や、情報端末20の登録手段)を備えていてもよい。そして、未登録用語抽出手段72は、登録手段が登録した用語リストから音声認識辞書に存在しない用語を抽出し、抽出した用語をその音声認識辞書に追加してもよい。
Further, the speech recognition dictionary expansion system may include a registration unit (for example,
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。 A part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.
(付記1)音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから、音声認識の対象とする用語を含む音声認識辞書に存在しない用語を抽出し、抽出された用語を前記音声認識辞書に追加し、前記音声認識辞書に基づいて、音声認識を要求する要求端末から受信した音声の音声認識を行うことを特徴とする音声認識辞書拡張方法。 (Supplementary Note 1) Extracting a term that is not present in the speech recognition dictionary including a term that is a target of speech recognition from a term list that is a list that is created by associating a term that is a target of speech recognition with a reading of the term A speech recognition dictionary expansion method comprising: adding an extracted term to the speech recognition dictionary and performing speech recognition of a speech received from a requesting terminal that requests speech recognition based on the speech recognition dictionary.
(付記2)音声認識された音声に含まれる用語が前記用語リストから抽出された用語である場合に、当該用語リストの作成元ユーザに所定のポイントを付与する付記1記載の音声認識辞書拡張方法。 (Supplementary note 2) The speech recognition dictionary expansion method according to supplementary note 1, wherein, when a term included in speech-recognized speech is a term extracted from the term list, a predetermined point is given to a user who creates the term list .
(付記3)音声認識辞書に存在しない用語として用語リストから抽出された用語と当該用語の作成元ユーザとを対応付けたリストである用語抽出リストを作成し、音声認識された音声に含まれる用語が前記用語抽出リストに含まれている場合、当該用語に対応する作成元ユーザに所定のポイントを付与する付記2記載の音声認識辞書拡張方法。 (Supplementary Note 3) Terms included in speech that has been speech-recognized by creating a term extraction list that is a list in which terms extracted from the term list as terms that do not exist in the speech recognition dictionary are associated with the user who created the term The speech recognition dictionary expansion method according to appendix 2, wherein a predetermined point is given to a creation source user corresponding to the term when the term extraction list is included in the term extraction list.
(付記4)音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段を備えたコンピュータに適用される音声認識辞書拡張プログラムであって、前記コンピュータに、音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから、前記音声認識辞書に存在しない用語を抽出し、抽出した用語を当該音声認識辞書に追加する未登録用語抽出処理、および、前記音声認識辞書に基づいて音声認識を行う音声認識処理を実行させるための音声認識辞書拡張プログラム。 (Supplementary note 4) A speech recognition dictionary expansion program applied to a computer having speech recognition dictionary storage means for storing a speech recognition dictionary including a term to be speech recognition target. Unregistered term extraction processing for extracting a term that does not exist in the speech recognition dictionary from a term list that is a list created by associating a term to be read and a reading of the term, and adding the extracted term to the speech recognition dictionary And a speech recognition dictionary expansion program for executing speech recognition processing for performing speech recognition based on the speech recognition dictionary.
(付記5)コンピュータに、音声認識処理で音声認識が行われた音声に含まれる用語が、前記用語リストから抽出された用語である場合に、当該用語リストの作成元ユーザに所定のポイントを付与するポイント付与処理を実行させる付記4記載の音声認識辞書拡張プログラム。 (Additional remark 5) When the term contained in the audio | voice with which speech recognition was performed by the speech recognition process is a term extracted from the said term list to a computer, a predetermined point is given to the creation origin user of the said term list The speech recognition dictionary expansion program according to appendix 4, which executes a point giving process.
(付記6)コンピュータに、ポイント付与処理で、未登録用語抽出処理で抽出された用語と当該用語の作成元ユーザとを対応付けたリストである用語抽出リストを作成させ、音声認識処理で音声認識された音声に含まれる用語が前記用語抽出リストに含まれている場合、当該用語に対応する作成元ユーザに所定のポイントを付与させる付記5記載の音声認識辞書拡張プログラム。 (Additional remark 6) Let a computer create the term extraction list | wrist which is the list | wrist which matched the term extracted from the unregistered term extraction process, and the creation origin user of the said term by point provision processing, and performs speech recognition by speech recognition processing. The speech recognition dictionary expansion program according to appendix 5, which gives a predetermined point to a creation source user corresponding to the term when the term included in the speech is included in the term extraction list.
本発明は、通信ネットワーク上に設置される装置が音声認識を行う際に用いる音声認識辞書を拡張する音声認識辞書拡張装置に好適に適用される。また、グループウェアなどの情報共有サービスや、業務情報管理サービスなどにも本発明を適用可能である。 The present invention is preferably applied to a speech recognition dictionary expansion device that expands a speech recognition dictionary used when a device installed on a communication network performs speech recognition. The present invention can also be applied to information sharing services such as groupware and business information management services.
10 サービス提供サーバ
11 ID管理部
12 業務サービス提供部
13 音声認識辞書管理部
14 音声認識部
15 貢献度管理部
16 辞書制御部
17 辞書記憶部
18 貢献度制御部
19 貢献度記憶部
20 情報端末
21 音声送受信部
22 マイクロホン
23 表示部
30 登録端末
100 通信ネットワーク
DESCRIPTION OF
Claims (10)
音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから前記音声認識辞書に存在しない用語を抽出し、抽出した用語を音声認識辞書に追加する未登録用語抽出手段と、
前記音声認識辞書に基づいて音声認識を行う音声認識手段とを備えた
ことを特徴とする音声認識辞書拡張装置。 Speech recognition dictionary storage means for storing a speech recognition dictionary including terms to be subjected to speech recognition;
Extract a term that does not exist in the speech recognition dictionary from a term list, which is a list that is created by associating a term that is the target of speech recognition with the reading of the term, and add the extracted term to the speech recognition dictionary Term extraction means;
A speech recognition dictionary expansion device comprising speech recognition means for performing speech recognition based on the speech recognition dictionary.
請求項1記載の音声認識辞書拡張装置。 The point granting means for giving a predetermined point to a user who created the term list when the term included in the speech subjected to the speech recognition by the voice recognition unit is a term extracted from the term list. The speech recognition dictionary expansion device described.
請求項2記載の音声認識辞書拡張装置。 The point granting unit creates a term extraction list that is a list in which the term extracted by the unregistered term extracting unit and the user who created the term are associated with each other, and the term included in the speech that the speech recognition unit has performed speech recognition 3. The speech recognition dictionary expansion device according to claim 2, wherein when a word is included in the term extraction list, a predetermined point is given to a creation user corresponding to the term.
請求項1から請求項3のうちのいずれか1項に記載の音声認識辞書拡張装置。 Unregistered term extraction means that terms that are included in the term list do not match the terms in the speech recognition dictionary or terms that do not match the terms in the term list and terms in the speech recognition dictionary The speech recognition dictionary expansion device according to any one of claims 1 to 3, wherein: is extracted as a term that does not exist in the speech recognition dictionary.
前記音声認識サーバに音声を送信して音声認識を要求する要求端末とを備え、
前記音声認識サーバは、
音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段と、
音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから前記音声認識辞書に存在しない用語を抽出し、抽出した用語を前記音声認識辞書に追加する未登録用語抽出手段と、
前記音声認識辞書に基づいて、前記要求端末から受信した音声の音声認識を行う音声認識手段とを含む
ことを特徴とする音声認識辞書拡張システム。 A voice recognition server for voice recognition;
A requesting terminal that transmits voice to the voice recognition server and requests voice recognition;
The voice recognition server
Speech recognition dictionary storage means for storing a speech recognition dictionary including terms to be subjected to speech recognition;
A term that does not exist in the speech recognition dictionary is extracted from a term list that is a list that is created by associating a term that is a target of speech recognition with a reading of the term, and the extracted term is not added to the speech recognition dictionary. Registered term extraction means;
A speech recognition dictionary expansion system comprising speech recognition means for performing speech recognition of speech received from the requesting terminal based on the speech recognition dictionary.
請求項5記載の音声認識辞書拡張システム。 6. A point granting unit for granting a predetermined point to a user who created the term list when the term included in the speech that has been voice-recognized by the voice recognition unit is a term extracted from the term list. The speech recognition dictionary expansion system described.
請求項6記載の音声認識辞書拡張システム。 The point granting unit creates a term extraction list that is a list in which the term extracted by the unregistered term extracting unit and the user who created the term are associated with each other, and the term included in the speech that the speech recognition unit has performed speech recognition 7. The speech recognition dictionary expansion system according to claim 6, wherein a predetermined point is given to a creation source user corresponding to the term when the is included in the term extraction list.
未登録用語抽出手段は、前記登録手段が登録した用語リストから音声認識辞書に存在しない用語を抽出し、抽出した用語を当該音声認識辞書に追加する
請求項5から請求項7のうちのいずれか1項に記載の音声認識辞書拡張システム。 A registration means for registering a term list;
The unregistered term extraction unit extracts a term that does not exist in the speech recognition dictionary from the term list registered by the registration unit, and adds the extracted term to the speech recognition dictionary. The speech recognition dictionary expansion system according to item 1.
抽出された用語を前記音声認識辞書に追加し、
前記音声認識辞書に基づいて、音声認識を要求する要求端末から受信した音声の音声認識を行う
ことを特徴とする音声認識辞書拡張方法。 Extract a term that does not exist in the speech recognition dictionary that includes the term that is subject to speech recognition from the term list that is a list that is created by associating the term that is subject to speech recognition and the reading of the term,
Adding the extracted terms to the speech recognition dictionary;
A speech recognition dictionary expansion method, wherein speech recognition of speech received from a requesting terminal that requests speech recognition is performed based on the speech recognition dictionary.
前記コンピュータに、
音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから、前記音声認識辞書に存在しない用語を抽出し、抽出した用語を当該音声認識辞書に追加する未登録用語抽出処理、および、
前記音声認識辞書に基づいて音声認識を行う音声認識処理
を実行させるための音声認識辞書拡張プログラム。 A speech recognition dictionary expansion program applied to a computer provided with speech recognition dictionary storage means for storing a speech recognition dictionary including a term to be a target of speech recognition,
In the computer,
A term that does not exist in the speech recognition dictionary is extracted from a term list that is a list that is created by associating a term that is a target of speech recognition with a reading of the term, and the extracted term is added to the speech recognition dictionary. Unregistered term extraction process, and
A speech recognition dictionary expansion program for executing speech recognition processing for performing speech recognition based on the speech recognition dictionary.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011016562A JP2012155272A (en) | 2011-01-28 | 2011-01-28 | Speech recognition dictionary extension device, system, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011016562A JP2012155272A (en) | 2011-01-28 | 2011-01-28 | Speech recognition dictionary extension device, system, method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012155272A true JP2012155272A (en) | 2012-08-16 |
Family
ID=46837014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011016562A Pending JP2012155272A (en) | 2011-01-28 | 2011-01-28 | Speech recognition dictionary extension device, system, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012155272A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018059961A (en) * | 2016-09-30 | 2018-04-12 | 株式会社リコー | Language processing system, language processing device, language processing program and language processing method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010146532A (en) * | 2008-12-16 | 2010-07-01 | Yahoo Japan Corp | Voice retrieval device, voice retrieval method, and voice retrieval program |
-
2011
- 2011-01-28 JP JP2011016562A patent/JP2012155272A/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010146532A (en) * | 2008-12-16 | 2010-07-01 | Yahoo Japan Corp | Voice retrieval device, voice retrieval method, and voice retrieval program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018059961A (en) * | 2016-09-30 | 2018-04-12 | 株式会社リコー | Language processing system, language processing device, language processing program and language processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107251006B (en) | Gallery of messages with shared interests | |
AU2019265827B2 (en) | Blockchain-based music originality analysis method and apparatus | |
US9047868B1 (en) | Language model data collection | |
US8429099B1 (en) | Dynamic gazetteers for entity recognition and fact association | |
US11934394B2 (en) | Data query method supporting natural language, open platform, and user terminal | |
US20170249934A1 (en) | Electronic device and method for operating the same | |
CN111566638B (en) | Adding descriptive metadata to an application programming interface for use by intelligent agents | |
CN113268498A (en) | Service recommendation method and device with intelligent assistant | |
TW201209804A (en) | Digital media voice tags in social networks | |
TW200947234A (en) | Techniques for input recognition and completion | |
JP5088096B2 (en) | Information extraction program and information extraction apparatus | |
CN113516961B (en) | Note generation method, related device, storage medium and program product | |
CN108900612A (en) | Method and apparatus for pushed information | |
CN110245298A (en) | Method and apparatus for pushed information | |
KR20150041592A (en) | Method for updating contact information in callee electronic device, and the electronic device | |
JP2019191975A (en) | Talent selection device, talent selection system, talent selection method, and program | |
CN110895587B (en) | Method and device for determining target user | |
JP5757208B2 (en) | Keyword extraction system, keyword extraction method and program | |
US10681402B2 (en) | Providing relevant and authentic channel content to users based on user persona and interest | |
JP6554517B2 (en) | Apparatus and method for providing social network service using sound | |
CN106663112A (en) | Presenting information cards for events associated with entities | |
JP2012155272A (en) | Speech recognition dictionary extension device, system, method and program | |
US20220100785A1 (en) | Entity search system | |
JP4109091B2 (en) | Schedule management apparatus and method, program | |
WO2020245887A1 (en) | Text generation device, text generation method and text generation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121218 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130416 |