JP2012155272A - Speech recognition dictionary extension device, system, method and program - Google Patents

Speech recognition dictionary extension device, system, method and program Download PDF

Info

Publication number
JP2012155272A
JP2012155272A JP2011016562A JP2011016562A JP2012155272A JP 2012155272 A JP2012155272 A JP 2012155272A JP 2011016562 A JP2011016562 A JP 2011016562A JP 2011016562 A JP2011016562 A JP 2011016562A JP 2012155272 A JP2012155272 A JP 2012155272A
Authority
JP
Japan
Prior art keywords
term
speech recognition
list
dictionary
recognition dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011016562A
Other languages
Japanese (ja)
Inventor
Takehiro Yamamoto
武洋 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011016562A priority Critical patent/JP2012155272A/en
Publication of JP2012155272A publication Critical patent/JP2012155272A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a speech recognition dictionary extension device which can utilize a term which is registered in a user dictionary created by each user as a term to be used for speech recognition.SOLUTION: A speech recognition dictionary storage means 81 stores a speech recognition dictionary including terms which are objects of the speech recognition. An unregistered term extraction means 82 extracts a term which is not present in the speech recognition dictionary from a term list that is a list created by associating terms which are speech recognition objects with the readings of the terms and adds the extracted term to the speech recognition dictionary. A speech recognition means 83 performs speech recognition based on the speech recognition dictionary.

Description

本発明は、通信ネットワーク上に設けられた装置が音声認識を行う際に用いる音声認識辞書を拡張する音声認識辞書拡張装置、音声認識辞書拡張システム、音声認識辞書拡張方法および音声認識辞書拡張プログラムに関する。   The present invention relates to a speech recognition dictionary expansion device, a speech recognition dictionary expansion system, a speech recognition dictionary expansion method, and a speech recognition dictionary expansion program for expanding a speech recognition dictionary used when a device provided on a communication network performs speech recognition. .

特許文献1には、ユーザの個別辞書に登録された情報を他のユーザにも利用可能にする辞書流通方法が記載されている。特許文献1に記載された方法では、各ユーザのユーザ辞書が公開辞書として登録されると、他のユーザは、公開辞書に登録されているユーザ辞書の中から自身が利用したい辞書を選択し、必要に応じてそのユーザ辞書をインポートする。   Patent Literature 1 describes a dictionary distribution method that makes information registered in a user's individual dictionary available to other users. In the method described in Patent Literature 1, when the user dictionary of each user is registered as a public dictionary, other users select a dictionary that the user wants to use from the user dictionaries registered in the public dictionary, Import the user dictionary as needed.

特許第3464881号明細書Japanese Patent No. 3648881

現在、クラウドコンピューティングにおいて提供される業務アプリケーションが普及している。また、スマートホンをはじめとした情報端末も普及しているが、このような情報端末を活用して業務アプリケーションを構築するには、情報入力が煩わしいといった課題がある。そこで、情報端末の音声認識機能を活用して情報入力を行う取り組みがなされている。   Currently, business applications provided in cloud computing are widespread. In addition, information terminals such as smart phones are widely used. However, in order to construct a business application using such information terminals, there is a problem that it is troublesome to input information. Thus, efforts are being made to input information by utilizing the voice recognition function of the information terminal.

音声認識を行う場合、認識精度を上げるために多くの用語を登録する必要がある。しかし、運用側だけでは専門的な用語を網羅することは難しく、認識精度を上げることができない。そこで、このような用語をユーザに登録してもらうため、ユーザによる多くの利用を促進する仕組みが必要である。   When performing speech recognition, it is necessary to register many terms in order to improve recognition accuracy. However, it is difficult for the operation side alone to cover technical terms, and the recognition accuracy cannot be improved. Therefore, in order to have the user register such terms, a mechanism that promotes many uses by the user is necessary.

特許文献1に記載された辞書流通方法により、各ユーザは文字入力を行う際の辞書として選択した辞書を扱うことができるようになる。   According to the dictionary distribution method described in Patent Document 1, each user can handle a dictionary selected as a dictionary when inputting characters.

しかし、特許文献1に記載された辞書流通方法は、複数のユーザに対する音声認識を単一の辞書(音声認識辞書)で行う処理モデルには適用できない。また、特許文献1に記載された辞書流通方法では、複数の辞書を制御する機構が必要になる。   However, the dictionary distribution method described in Patent Document 1 cannot be applied to a processing model in which speech recognition for a plurality of users is performed using a single dictionary (speech recognition dictionary). Further, the dictionary distribution method described in Patent Document 1 requires a mechanism for controlling a plurality of dictionaries.

上述の通り、音声認識の精度を上げるためには、単一の音声認識辞書に多くの用語を登録する必要がある。そのためには、各ユーザの作成したユーザ辞書を活用できることが望ましい。   As described above, in order to increase the accuracy of speech recognition, it is necessary to register many terms in a single speech recognition dictionary. For that purpose, it is desirable to be able to utilize a user dictionary created by each user.

そこで、本発明は、各ユーザが作成するユーザ辞書に登録された用語を音声認識に用いる用語として活用できる音声認識辞書拡張装置、音声認識辞書拡張システム、音声認識辞書拡張方法および音声認識辞書拡張プログラムを提供することを目的とする。   Therefore, the present invention provides a speech recognition dictionary expansion device, a speech recognition dictionary expansion system, a speech recognition dictionary expansion method, and a speech recognition dictionary expansion program that can use terms registered in a user dictionary created by each user as terms used for speech recognition. The purpose is to provide.

本発明による音声認識辞書拡張装置は、音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段と、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから、音声認識辞書に存在しない用語を抽出し、抽出した用語をその音声認識辞書に追加する未登録用語抽出手段と、音声認識辞書に基づいて音声認識を行う音声認識手段とを備えたことを特徴とする。   A speech recognition dictionary expansion device according to the present invention is created by associating speech recognition dictionary storage means for storing a speech recognition dictionary including a term to be speech-recognized, and a term to be speech-recognized and a reading of the term. A term that is not included in the speech recognition dictionary, and an unregistered term extraction unit that adds the extracted term to the speech recognition dictionary, and speech recognition that performs speech recognition based on the speech recognition dictionary Means.

本発明による音声認識辞書拡張システムは、音声認識を行う音声認識サーバと、音声認識サーバに音声を送信して音声認識を要求する要求端末とを備え、音声認識サーバが、音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段と、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから音声認識辞書に存在しない用語を抽出し、抽出した用語を音声認識辞書に追加する未登録用語抽出手段と、音声認識辞書に基づいて、要求端末から受信した音声の音声認識を行う音声認識手段とを含むことを特徴とする。   A speech recognition dictionary expansion system according to the present invention includes a speech recognition server that performs speech recognition, and a request terminal that transmits speech to the speech recognition server and requests speech recognition, and the speech recognition server is a target of speech recognition. A speech recognition dictionary storage means for storing a speech recognition dictionary including terms, and a term that does not exist in the speech recognition dictionary from a term list that is a list created by associating a term that is a target of speech recognition with a reading of the term An unregistered term extracting unit that extracts and adds the extracted term to the speech recognition dictionary, and a speech recognition unit that performs speech recognition of the speech received from the requesting terminal based on the speech recognition dictionary.

本発明による音声認識辞書拡張方法は、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから、音声認識の対象とする用語を含む音声認識辞書に存在しない用語を抽出し、抽出された用語を音声認識辞書に追加し、音声認識辞書に基づいて、音声認識を要求する要求端末から受信した音声の音声認識を行うことを特徴とする。   A speech recognition dictionary expansion method according to the present invention converts a term that is a target of speech recognition into a speech recognition dictionary that includes a term that is a target of speech recognition, from a term list that is a list that is created by associating a term that is subject to speech recognition with reading of the term A term that does not exist is extracted, the extracted term is added to a speech recognition dictionary, and speech received from a requesting terminal that requests speech recognition is recognized based on the speech recognition dictionary.

本発明による音声認識辞書拡張プログラムは、音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段を備えたコンピュータに適用される音声認識辞書拡張プログラムであって、コンピュータに、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから、音声認識辞書に存在しない用語を抽出し、抽出した用語をその音声認識辞書に追加する未登録用語抽出処理、および、音声認識辞書に基づいて音声認識を行う音声認識処理を実行させることを特徴とする。   A speech recognition dictionary expansion program according to the present invention is a speech recognition dictionary expansion program applied to a computer provided with speech recognition dictionary storage means for storing a speech recognition dictionary including a term to be a target of speech recognition. A term that does not exist in the speech recognition dictionary is extracted from the term list, which is a list that is created by associating the terms that are subject to speech recognition and the readings of the terms, and the extracted terms are not added to the speech recognition dictionary. A registered term extraction process and a speech recognition process for performing speech recognition based on a speech recognition dictionary are executed.

本発明によれば、各ユーザが作成するユーザ辞書に登録された用語を音声認識に用いる用語として活用できる。   According to the present invention, terms registered in a user dictionary created by each user can be utilized as terms used for speech recognition.

本発明による音声認識辞書拡張システムの一実施形態を示すブロック図である。It is a block diagram which shows one Embodiment of the speech recognition dictionary expansion system by this invention. 用語リストの例を示す説明図である。It is explanatory drawing which shows the example of a term list. 貢献度ポイントを含む貢献単語リストの例を示す説明図である。It is explanatory drawing which shows the example of the contribution word list | wrist containing a contribution degree point. 本実施形態における音声認識辞書拡張システムの動作の例を示すフローチャートである。It is a flowchart which shows the example of operation | movement of the speech recognition dictionary expansion system in this embodiment. 本発明による音声認識辞書拡張装置の最小構成の例を示すブロック図である。It is a block diagram which shows the example of the minimum structure of the speech recognition dictionary expansion apparatus by this invention. 本発明による音声認識辞書拡張システムの最小構成の例を示すブロック図である。It is a block diagram which shows the example of the minimum structure of the speech recognition dictionary expansion system by this invention.

以下、本発明の実施形態を図面を参照して説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明による音声認識辞書拡張システムの一実施形態を示すブロック図である。本発明における音声認識辞書拡張システムは、サービス提供サーバ10と、情報端末20と、登録端末30とを備えている。サービス提供サーバ10、情報端末20および登録端末30は、プログラム制御により動作し、インターネット等の通信ネットワーク100を介して相互に接続される。   FIG. 1 is a block diagram showing an embodiment of a speech recognition dictionary expansion system according to the present invention. The speech recognition dictionary expansion system according to the present invention includes a service providing server 10, an information terminal 20, and a registration terminal 30. The service providing server 10, the information terminal 20, and the registration terminal 30 operate under program control and are connected to each other via a communication network 100 such as the Internet.

情報端末20は、小型パーソナルコンピュータ等の情報処理装置である。情報端末20は、音声送受信部21を備えている。また、情報端末20には、マイクロホン22と、表示部23とが接続される。音声送受信部21は、マイクロホン22で録音された音声を、通信ネットワーク100を介してサービス提供サーバ10に送信することで音声認識を依頼する。また、音声送受信部21は、サービス提供サーバ10からの音声認識結果を受信すると、その結果を表示部23に表示させる。   The information terminal 20 is an information processing apparatus such as a small personal computer. The information terminal 20 includes a voice transmission / reception unit 21. Further, a microphone 22 and a display unit 23 are connected to the information terminal 20. The voice transmitting / receiving unit 21 requests voice recognition by transmitting the voice recorded by the microphone 22 to the service providing server 10 via the communication network 100. In addition, when the voice transmitting / receiving unit 21 receives the voice recognition result from the service providing server 10, the voice transmitting / receiving unit 21 displays the result on the display unit 23.

サービス提供サーバ10は、インターネット上に設置されているワークステーションサーバなどの情報処理装置である。サービス提供サーバ10は、ID管理部11と、業務サービス提供部12と、音声認識辞書管理部13と、音声認識部14と、貢献度管理部15とを備えている。   The service providing server 10 is an information processing apparatus such as a workstation server installed on the Internet. The service providing server 10 includes an ID management unit 11, a business service providing unit 12, a speech recognition dictionary management unit 13, a speech recognition unit 14, and a contribution management unit 15.

ID管理部11は、サービス提供サーバ10の利用者を識別するためのユーザ情報を記憶する。また、業務サービス提供部12は、利用者に対して提供する各種の業務サービスを行う。例えば、音声認識の結果を電子メールにて利用者に送信する場合、業務サービス提供部12は、音声認識結果を電子メールで送信可能な形式に編集する。また、例えば、利用者が所属するグループ内で音声認識結果を共有するような場合、業務サービス提供部12は、グループ内のメンバが利用するグループウェアで利用できる形式に音声認識結果を編集してもよい。ただし、業務サービス提供部12が提供する業務サービスは、上記内容に限定されない。   The ID management unit 11 stores user information for identifying a user of the service providing server 10. Further, the business service providing unit 12 performs various business services provided to the user. For example, when the result of speech recognition is transmitted to the user by electronic mail, the business service providing unit 12 edits the result of speech recognition into a format that can be transmitted by electronic mail. Also, for example, when the voice recognition result is shared within the group to which the user belongs, the business service providing unit 12 edits the voice recognition result into a format that can be used by the groupware used by the members of the group. Also good. However, the business service provided by the business service providing unit 12 is not limited to the above content.

音声認識辞書管理部13は、辞書制御部16と、辞書記憶部17とを含む。   The voice recognition dictionary management unit 13 includes a dictionary control unit 16 and a dictionary storage unit 17.

辞書記憶部17は、後述する音声認識部14が音声認識を行う際に用いる音声認識辞書(以下、既存辞書と記すこともある。)を記憶する。既存辞書とは、具体的には、音声認識サービスで音声データから音声認識結果を導き出すために利用される用語の辞書である。音声認識辞書には、音声認識の対象とする用語とその用語の読みとが含まれる。ただし、音声認識辞書に含まれる情報は、用語および用語の読みに限定されない。   The dictionary storage unit 17 stores a speech recognition dictionary (hereinafter also referred to as an existing dictionary) used when the speech recognition unit 14 described later performs speech recognition. Specifically, the existing dictionary is a dictionary of terms used for deriving a speech recognition result from speech data in a speech recognition service. The speech recognition dictionary includes terms that are subject to speech recognition and reading of the terms. However, the information included in the speech recognition dictionary is not limited to terms and reading of terms.

辞書制御部16は、後述する登録端末30から用語リストを受信すると、受信した用語リストに含まれる用語のうち、既存辞書(音声認識辞書)に未登録の用語を抽出し、抽出した用語を既存辞書(音声認識辞書)に追加する。ここで、用語リストとは、音声認識の対象とする用語とその用語の読みとを対にしたリストのことである。すなわち、用語リストはユーザ辞書に対応する。図2は、用語リストの例を示す説明図である。図2に示す例では、例えば、用語「証券」と、その用語の読み「しょうけん」とが対応することを示す。なお、辞書制御部16は、受信した用語リストに含まれる全ての用語を音声認識辞書に追加してもよい。   When the dictionary control unit 16 receives a term list from the registration terminal 30 described later, the dictionary control unit 16 extracts terms that are not registered in the existing dictionary (speech recognition dictionary) from the terms included in the received term list, and the extracted terms Add to dictionary (voice recognition dictionary). Here, the term list is a list in which a term to be subjected to speech recognition and a reading of the term are paired. That is, the term list corresponds to the user dictionary. FIG. 2 is an explanatory diagram illustrating an example of a term list. In the example shown in FIG. 2, for example, the term “securities” corresponds to the reading of the term “Shoken”. The dictionary control unit 16 may add all the terms included in the received term list to the speech recognition dictionary.

貢献度管理部15は、貢献度制御部18と、貢献度記憶部19とを含む。   The contribution management unit 15 includes a contribution control unit 18 and a contribution storage unit 19.

貢献度記憶部19は、辞書制御部16が抽出した既存辞書に未登録の用語のリストを記憶する。このリストは、音声認識に貢献する用語のリストであることから、以下の説明では、このリストのことを貢献単語リストと記す。すなわち、貢献単語リストとは、「既存辞書に存在しない用語をその既存辞書に登録することで用語を登録したユーザが辞書拡張に貢献した」という判定を行うために、そのユーザが用語を登録したという情報を含めた用語リストであるということができる。貢献単語リストには、未登録の用語が抽出された用語リストの作成元ユーザを含んでいてもよい。   The contribution storage unit 19 stores a list of unregistered terms in the existing dictionary extracted by the dictionary control unit 16. Since this list is a list of terms that contribute to speech recognition, in the following description, this list is referred to as a contribution word list. In other words, the contribution word list means that a user registered a term in order to make a determination that "the user who registered the term contributed to dictionary expansion by registering a term that does not exist in the existing dictionary in the existing dictionary". It can be said that it is a term list including the information. The contribution word list may include a creation source user of a term list from which unregistered terms are extracted.

貢献度記憶部19は、ユーザごとに付与される所定のポイントを記憶する。具体的には、貢献度記憶部19は、音声認識辞書に登録された用語のうち各ユーザの用語リストから登録された用語が音声認識に利用された際に付与されるポイントを記憶する。このように付与されるポイントは、音声認識に貢献した際に付与されるポイントであることから、以下の説明では、このポイントのことを貢献度ポイントと記す。   The contribution storage unit 19 stores predetermined points given to each user. Specifically, the contribution storage unit 19 stores points given when terms registered from the term list of each user among terms registered in the speech recognition dictionary are used for speech recognition. Since the points given in this way are points given when contributing to voice recognition, in the following description, these points are referred to as contribution points.

図3は、貢献度ポイントを含む貢献単語リストの例を示す説明図である。図3に示す例では、例えば、用語「投資信託」がユーザ「Aさん」の用語リストから登録されたものであり、その用語には貢献度ポイントが20ポイント付与されていることを示す。   FIG. 3 is an explanatory diagram illustrating an example of a contribution word list including contribution degree points. In the example illustrated in FIG. 3, for example, the term “investment trust” is registered from the term list of the user “Mr. A”, and the term is given 20 contribution points.

貢献度制御部18は、音声認識辞書管理部13が抽出した既存辞書に未登録の用語から貢献単語リストを生成する。貢献度制御部18は、例えば、図3に例示するように、用語と用語リストの作成元ユーザとを対応付けて貢献単語リストを生成してもよい。   The contribution degree control unit 18 generates a contribution word list from terms not registered in the existing dictionary extracted by the speech recognition dictionary management unit 13. For example, as illustrated in FIG. 3, the contribution degree control unit 18 may generate a contribution word list by associating a term with a user who created the term list.

また、貢献度制御部18は、後述する音声認識部14が音声認識した音声に含まれる用語が用語リストから抽出された用語か否かを判定し、用語リストから抽出された用語と判定された場合には、そのユーザに貢献度ポイントを付与する。具体的には、貢献度制御部18は、音声認識に用いられた用語が貢献単語リストに存在する単語である場合、その単語を登録したユーザに貢献度ポイントを付与する。貢献度制御部18は、貢献度ポイントとして、一定の値を付与してもよく、他の要因に基づいて変化させたポイントを付与してもよい。   Further, the contribution control unit 18 determines whether or not a term included in the speech recognized by the speech recognition unit 14 described later is a term extracted from the term list, and is determined to be a term extracted from the term list. In that case, contribution points are given to the user. Specifically, when the term used for speech recognition is a word existing in the contribution word list, the contribution degree control unit 18 gives a contribution point to the user who registered the word. The contribution control unit 18 may give a fixed value as the contribution point, or may give a point changed based on other factors.

なお、貢献度制御部18は、音声認識部14が音声認識した音声に含まれる用語を拡張された音声認識辞書に含まれる用語全体を対象として集計してもよい。そして、貢献度制御部18は、この集計結果と貢献単語リストとを照合し、集計結果から貢献単語リストに含まれる用語の利用数を集計してもよい。管理者は、このように集計された利用数や、貢献度ポイントに応じて、業務サービスに対する利用料の割引や特典をユーザに与えることが可能になる。   The contribution control unit 18 may total the terms included in the expanded speech recognition dictionary for the terms included in the speech recognized by the speech recognition unit 14. Then, the contribution level control unit 18 may collate the total result with the contribution word list and total the number of terms used in the contribution word list from the total result. The administrator can give the user a discount on the usage fee for the business service and a privilege according to the number of usages and the contribution points thus collected.

また、貢献度制御部18は、登録端末30から貢献度ポイントの照会要求を受信すると、指定されたユーザの貢献度ポイントを貢献度記憶部19から抽出し、抽出結果を登録端末30に送信する。   When the contribution control unit 18 receives a contribution point inquiry request from the registration terminal 30, the contribution control unit 18 extracts the contribution point of the designated user from the contribution storage unit 19 and transmits the extraction result to the registration terminal 30. .

音声認識部14は、既存辞書に基づいて情報端末20から送信される音声の音声認識を行い、認識結果を情報端末20に返信する。音声認識の方法は特に限定されず、現在知られている方法のいずれを用いてもよい。   The voice recognition unit 14 performs voice recognition of the voice transmitted from the information terminal 20 based on the existing dictionary, and returns a recognition result to the information terminal 20. The method for speech recognition is not particularly limited, and any of currently known methods may be used.

音声認識部14と、辞書制御部16と、貢献度制御部18とは、プログラム(音声認識辞書拡張プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、サービス提供サーバ10の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、音声認識部14、辞書制御部16および貢献度制御部18として動作してもよい。また、音声認識部14と、辞書制御部16と、貢献度制御部18とは、それぞれが専用のハードウェアで実現されていてもよい。   The speech recognition unit 14, the dictionary control unit 16, and the contribution control unit 18 are realized by a CPU of a computer that operates according to a program (speech recognition dictionary expansion program). For example, the program is stored in a storage unit (not shown) of the service providing server 10, and the CPU reads the program and operates as the voice recognition unit 14, the dictionary control unit 16, and the contribution control unit 18 according to the program. May be. Further, each of the speech recognition unit 14, the dictionary control unit 16, and the contribution control unit 18 may be realized by dedicated hardware.

また、辞書記憶部17および貢献度記憶部19は、例えば、磁気ディスク等により実現される。   The dictionary storage unit 17 and the contribution degree storage unit 19 are realized by, for example, a magnetic disk.

登録端末30は、小型パーソナルコンピュータ等の情報処理装置である。登録端末30は、利用者が作成した用語リストを、通信ネットワーク100を介してサービス提供サーバ10に送信する。また、登録端末30は、サービス提供サーバ10から受信したデータを、表示装置(図示せず)に表示させる。   The registration terminal 30 is an information processing apparatus such as a small personal computer. The registration terminal 30 transmits the term list created by the user to the service providing server 10 via the communication network 100. In addition, the registration terminal 30 displays the data received from the service providing server 10 on a display device (not shown).

なお、上記説明では、登録端末30から用語リストを登録する場合を例示しているが、用語リストの登録元は、登録端末30に限定されず、他の装置であってもよい。例えば、情報端末20が備える登録手段(図示せず)が、音声認識サーバ10に用語リストを登録するようにしてもよい。また、用語リストを登録するユーザは、1人であってもよく、複数であってもよい。なお、以下の説明では、用語リストの作成者と登録者とが同一のユーザであるものとする。   In the above description, the case where the term list is registered from the registration terminal 30 is illustrated, but the registration source of the term list is not limited to the registration terminal 30 and may be another device. For example, registration means (not shown) provided in the information terminal 20 may register the term list in the voice recognition server 10. Moreover, the user who registers a term list may be one person, and plural may be sufficient as it. In the following description, it is assumed that the creator of the term list and the registrant are the same user.

次に、動作について説明する。図4は、本実施形態における音声認識辞書拡張システムの動作の例を示すフローチャートである。以下の説明では、ユーザ「Aさん」が登録した用語リストに記載された用語をユーザ「Bさん」が利用した場合を例に説明する。   Next, the operation will be described. FIG. 4 is a flowchart showing an example of the operation of the speech recognition dictionary expansion system according to this embodiment. In the following description, a case where the user “Mr. B” uses a term described in the term list registered by the user “Mr. A” will be described as an example.

まずAさんが登録端末30に用語リストを登録すると、登録端末30は、登録された用語リストをサービス提供サーバ10へ送信する(ステップA1)。上述の通り、用語リストとは、図2に例示するように、用語と読みとを対にしたリストのことである。   First, when Mr. A registers a term list in the registration terminal 30, the registration terminal 30 transmits the registered term list to the service providing server 10 (step A1). As described above, the term list is a list in which terms and readings are paired as illustrated in FIG.

次に、サービス提供サーバ10が用語リストを受け取ると、音声認識辞書管理部13(より具体的には、辞書制御部16)は、用語リストに記載された各用語が既存辞書に存在するか否かを判定する(ステップA2)。既存辞書に存在しない用語が用語リストに含まれている場合、貢献度管理部15(より具体的には、貢献度制御部18)は、その用語を貢献単語リストに抽出する(ステップA3)。また、辞書制御部16は、用語リストに含まれる用語を既存辞書に取り込み、既存辞書を拡張する(ステップA4)。   Next, when the service providing server 10 receives the term list, the speech recognition dictionary management unit 13 (more specifically, the dictionary control unit 16) determines whether each term described in the term list exists in the existing dictionary. Is determined (step A2). If a term that does not exist in the existing dictionary is included in the term list, the contribution management unit 15 (more specifically, the contribution control unit 18) extracts the term into the contribution word list (step A3). Further, the dictionary control unit 16 takes the terms included in the term list into the existing dictionary and expands the existing dictionary (step A4).

ここで、用語リストに記載された各用語が既存辞書に存在するか否かを判定する方法について具体的に説明する。用語リストに含まれる用語には、読みが同じで表記(例えば、漢字)が異なるもの、表記が同じで読みが異なるものが存在する。読みが同じで表記が異なる用語の例として、例えば、読みが「はし」であり、表記が「橋」または「箸」の場合が挙げられる。また、表記が同じで読みが異なる用語の例として、例えば、表記が「神戸」であり、読みが「こうべ」、「かんど」または「ごうど」の場合が挙げられる。   Here, a method for determining whether or not each term described in the term list exists in the existing dictionary will be specifically described. Terms included in the term list include those with the same reading and different notation (for example, kanji), and those with the same notation and different readings. Examples of terms that have the same reading but different notation include, for example, a case where the reading is “Hashi” and the notation is “bridge” or “chopsticks”. Examples of terms that have the same notation but different readings include, for example, the case where the notation is “Kobe” and the reading is “Kobe”, “Kando”, or “Godo”.

そこで、辞書制御部16は、サービス提供サーバ10が用語リストを受け取ると、既存辞書を検索し、用語リストの表記に対応する部分(例えば、漢字)が含まれているか否かを判定する。既存辞書に該当する表記が含まれていない場合、辞書制御部16は、新規の用語と判定し、その用語を既存辞書に取り込む。   Therefore, when the service providing server 10 receives the term list, the dictionary control unit 16 searches the existing dictionary and determines whether or not a portion (for example, kanji) corresponding to the notation of the term list is included. If the existing dictionary does not include the corresponding notation, the dictionary control unit 16 determines that the term is a new term and imports the term into the existing dictionary.

一方、既存辞書に該当する表記が含まれている場合、辞書制御部16は、その表記に対する用語リストの読みと、既存辞書の読みとが一致するか否かを判定する。両者の読みが一致しなかった場合、辞書制御部16は、新規の用語と判定し、その用語を既存辞書に取り込む。一方、両者の読みが一致した場合、辞書制御部16は、既存の用語と判定し、既存辞書への取り込みは行わない。   On the other hand, when a notation corresponding to the existing dictionary is included, the dictionary control unit 16 determines whether the reading of the term list corresponding to the notation matches the reading of the existing dictionary. If the readings do not match, the dictionary control unit 16 determines that the term is a new term, and imports the term into the existing dictionary. On the other hand, if both readings match, the dictionary control unit 16 determines that the term is an existing term and does not import the existing dictionary.

このように、辞書制御部16は、用語リストに含まれる用語の表記と既存辞書における用語の表記とが一致しない用語、または、用語リストにおける用語の読みと既存辞書における用語の読みとが一致しない用語を、既存辞書に存在しない用語(新規の用語)として抽出する。   As described above, the dictionary control unit 16 does not match the term notation included in the term list with the term notation in the existing dictionary, or does not match the term reading in the term list with the term reading in the existing dictionary. A term is extracted as a term (new term) that does not exist in the existing dictionary.

次に、Bさんによるサービス利用開始を示す操作が行われると、情報端末20は、サービス提供サーバ10にアクセスする。このとき、Bさんは、業務サービスの入力に音声認識を利用するものとする(ステップA5)。具体的には、Bさんがマイクロホン22を介して情報端末20に音声を入力すると、音声送受信部21は、入力された音声データをサービス提供サーバ10に送信する。   Next, when an operation indicating the start of service use by Mr. B is performed, the information terminal 20 accesses the service providing server 10. At this time, Mr. B is assumed to use voice recognition for the input of the business service (step A5). Specifically, when Mr. B inputs sound to the information terminal 20 via the microphone 22, the sound transmitting / receiving unit 21 transmits the input sound data to the service providing server 10.

サービス提供サーバ10が音声データを受け取ると、音声認識部14は、音声認識を実行し、音声認識結果を情報端末20へ送信する(ステップA6)。情報端末20は、受け取った音声認識結果を表示部23に表示させる(ステップA7)。   When the service providing server 10 receives the voice data, the voice recognition unit 14 executes voice recognition and transmits a voice recognition result to the information terminal 20 (step A6). The information terminal 20 displays the received voice recognition result on the display unit 23 (step A7).

次に、サービス提供サーバ10では、貢献度制御部18が音声認識に利用された用語が貢献単語リストに存在するか否かを判定する(ステップA9)。音声認識に利用された用語が貢献単語リストに存在した場合、貢献度制御部18は、貢献度記憶部19に貢献度ポイントを記憶させる。具体的には、その用語が抽出された用語リストの作成元ユーザに、貢献度ポイントを付与する。このように、貢献度ポイントは、既存辞書に登録された用語が利用されるごとに蓄積され、利用度を示すランキングの表示や、一定数に達した際に業務サービスに対する利用料を割り引くサービスなどに活用される。   Next, in the service providing server 10, the contribution degree control unit 18 determines whether or not the term used for speech recognition is present in the contribution word list (step A9). When the term used for speech recognition is present in the contribution word list, the contribution degree control unit 18 causes the contribution degree storage unit 19 to store contribution degree points. Specifically, a contribution point is given to the user who created the term list from which the term is extracted. In this way, contribution points are accumulated each time a term registered in an existing dictionary is used, a ranking display showing the degree of use, a service that discounts the usage fee for business services when a certain number is reached, etc. To be used.

その後、Aさんによって自身の貢献度ポイントを確認する旨の操作が行われると、登録端末30は、その操作に応じてサービス提供サーバ10に貢献度ポイントを要求する(ステップA10)。そして、貢献度制御部18は、貢献度記憶部19から抽出したAさんの貢献度ポイントを登録端末30に通知する(ステップA11)。   Thereafter, when an operation for confirming his / her own contribution point is performed by Mr. A, the registration terminal 30 requests the contribution point from the service providing server 10 in accordance with the operation (step A10). Then, the contribution control unit 18 notifies the registration terminal 30 of Mr. A's contribution points extracted from the contribution storage unit 19 (step A11).

以上のように、本実施形態によれば、辞書制御部16が、音声認識辞書に存在しない用語を用語リストから抽出し、抽出した用語を音声認識辞書に追加する。そして、音声認識部14が音声認識辞書に基づいて情報端末20から受信した音声の音声認識を行う。以上のような構成により、各ユーザが作成する用語リスト(ユーザ辞書)に登録された用語を音声認識に用いる用語として活用できる。   As described above, according to this embodiment, the dictionary control unit 16 extracts terms that do not exist in the speech recognition dictionary from the term list, and adds the extracted terms to the speech recognition dictionary. Then, the voice recognition unit 14 performs voice recognition of the voice received from the information terminal 20 based on the voice recognition dictionary. With the configuration as described above, the terms registered in the term list (user dictionary) created by each user can be utilized as terms used for speech recognition.

また、貢献度制御部18は、音声認識された音声に含まれる用語が用語リストから抽出された用語である場合に、その用語リストの作成元ユーザに貢献度ポイントを付与してもよい。このような構成を含むことで、各ユーザに対してユーザ辞書を積極的に提供させることができる。   In addition, when the term included in the speech that has been speech-recognized is a term extracted from the term list, the contribution level control unit 18 may give a contribution point to the user who created the term list. By including such a configuration, a user dictionary can be actively provided to each user.

具体的には、辞書制御部16が、登録された用語リストと既存辞書との差分を抽出し、貢献度制御部18が貢献単語リストを生成する。そして、音声認識部14が音声認識を行うたびに、貢献度制御部18が音声認識された音声に含まれる用語が貢献単語リストに存在するか否かを判定し、用語が存在する場合には、貢献度制御部18が用語リストの作成元ユーザに貢献度ポイントを付与するようにしている。そのため、利用者に対して用語を登録させる動機づけを行うことが出来る。   Specifically, the dictionary control unit 16 extracts a difference between the registered term list and the existing dictionary, and the contribution degree control unit 18 generates a contribution word list. Each time the speech recognition unit 14 performs speech recognition, the contribution control unit 18 determines whether or not a term included in the speech that has been speech-recognized exists in the contribution word list. The contribution degree control unit 18 gives contribution degree points to the user who created the term list. Therefore, it is possible to motivate the user to register the term.

さらに、辞書制御部16が、登録された用語リストを既存辞書に取り込むことで、拡張した辞書を作成する。そのため、利用者に意識させることなく辞書を拡張でき、また、運用者の手間をかけずに音声認識の精度を上げることができる。   Further, the dictionary control unit 16 creates an expanded dictionary by taking the registered term list into the existing dictionary. As a result, the dictionary can be expanded without making the user aware of it, and the accuracy of voice recognition can be improved without the effort of the operator.

また、例えば、特許文献1に記載された辞書流通方法では、他のユーザが登録したユーザ辞書を利用する場合、その利用に伴って課金されることが考えられる。しかし、既存辞書を単一化し、提供される通常のサービス内で(すなわち、特別に課金されることなく)他のユーザが登録した用語を利用できるのであれば、システムの利用が促進され、音声認識辞書の更なる精度向上が期待できる。さらに、本発明を利用して、登録した用語が多く利用されるほど料金が割安になるような課金を行うクラウドサービスを提供することで、用語の登録を促し、音声認識の精度を向上させることができる。   Further, for example, in the dictionary distribution method described in Patent Document 1, when a user dictionary registered by another user is used, it is considered that the user is charged for using the user dictionary. However, if the existing dictionary can be unified and the terms registered by other users can be used within the normal service provided (ie, without special charge), the use of the system is facilitated and the voice Further improvement of the accuracy of the recognition dictionary can be expected. Furthermore, by using the present invention to provide a cloud service that charges so that the more the registered terms are used, the cheaper the fee, the registration of terms is promoted and the accuracy of speech recognition is improved. Can do.

次に、本発明の最小構成について説明する。図5は、本発明による音声認識辞書拡張装置の最小構成の例を示すブロック図である。本発明による音声認識辞書拡張装置は、音声認識の対象とする用語を含む音声認識辞書(例えば、既存辞書)を記憶する音声認識辞書記憶手段81(例えば、辞書記憶部17)と、音声認識の対象とする用語とその用語の読みとを対応付けて作成されるリストである用語リストから音声認識辞書に存在しない用語を抽出し、抽出した用語を音声認識辞書に追加する未登録用語抽出手段82(例えば、辞書制御部16)と、音声認識辞書に基づいて音声認識を行う音声認識手段83(例えば、音声認識部14)とを備えている。   Next, the minimum configuration of the present invention will be described. FIG. 5 is a block diagram showing an example of the minimum configuration of the speech recognition dictionary expansion apparatus according to the present invention. The speech recognition dictionary expansion apparatus according to the present invention includes a speech recognition dictionary storage unit 81 (for example, dictionary storage unit 17) that stores a speech recognition dictionary (for example, an existing dictionary) that includes a term that is a target of speech recognition, and a speech recognition dictionary. Unregistered term extraction means 82 for extracting a term that does not exist in the speech recognition dictionary from a term list that is a list created by associating the target term with the reading of the term, and adding the extracted term to the speech recognition dictionary (For example, dictionary control unit 16) and speech recognition means 83 (for example, speech recognition unit 14) for performing speech recognition based on the speech recognition dictionary.

以上のような構成により、各ユーザが作成するユーザ辞書(用語リスト)に登録された用語を音声認識に用いる用語として活用できる。   With the above configuration, terms registered in a user dictionary (term list) created by each user can be used as terms used for speech recognition.

また、音声認識手段83が音声認識を行った音声に含まれる用語が用語リストから抽出された用語である場合に、その用語リストの作成元ユーザに所定のポイント(例えば、貢献度ポイント)を付与するポイント付与手段(例えば、貢献度制御部18)を備えていてもよい。このような構成を含むことで、各ユーザに対してユーザ辞書(用語リスト)を積極的に提供させることができる。   In addition, when the term included in the speech recognized by the speech recognition unit 83 is a term extracted from the term list, a predetermined point (for example, contribution point) is given to the user who created the term list Point giving means (for example, a contribution degree control unit 18) may be provided. By including such a configuration, it is possible to actively provide a user dictionary (term list) to each user.

また、ポイント付与手段は、未登録用語抽出手段82が抽出した用語とその用語の作成元ユーザとを対応付けたリストである用語抽出リスト(例えば、貢献単語リスト)を作成し、音声認識手段83が音声認識を行った音声に含まれる用語が用語抽出リストに含まれている場合、その用語に対応する作成元ユーザに所定のポイントを付与してもよい。   The point granting unit creates a term extraction list (for example, a contribution word list) that is a list in which the term extracted by the unregistered term extracting unit 82 is associated with the user who created the term, and the voice recognition unit 83. When the term included in the speech subjected to speech recognition is included in the term extraction list, a predetermined point may be given to the creation source user corresponding to the term.

また、図6は、本発明による音声認識辞書拡張システムの最小構成の例を示すブロック図である。本発明による音声認識辞書拡張システムは、音声認識を行う音声認識サーバ70(例えば、サービス提供サーバ10)と、音声認識サーバ70に音声を送信して音声認識を要求する要求端末90(例えば、情報端末20)とを備えている。   FIG. 6 is a block diagram showing an example of the minimum configuration of the speech recognition dictionary expansion system according to the present invention. The speech recognition dictionary expansion system according to the present invention includes a speech recognition server 70 (for example, service providing server 10) that performs speech recognition, and a request terminal 90 (for example, information that requests speech recognition by transmitting speech to the speech recognition server 70). Terminal 20).

音声認識サーバ70は、音声認識辞書記憶手段71と、未登録用語抽出手段72と、音声認識手段73とを含む。   The voice recognition server 70 includes a voice recognition dictionary storage means 71, an unregistered term extraction means 72, and a voice recognition means 73.

音声認識手段73(例えば、音声認識部14)は、音声認識辞書に基づいて要求端末90から受信した音声の音声認識を行う。なお、音声認識辞書記憶手段71および未登録用語抽出手段72、それぞれ、図5に例示する声認識辞書記憶手段81および未登録用語抽出手段82と同様である。   The voice recognition unit 73 (for example, the voice recognition unit 14) performs voice recognition of the voice received from the request terminal 90 based on the voice recognition dictionary. The speech recognition dictionary storage unit 71 and the unregistered term extraction unit 72 are the same as the voice recognition dictionary storage unit 81 and the unregistered term extraction unit 82 illustrated in FIG.

このような構成であっても、各ユーザが作成するユーザ辞書(用語リスト)に登録された用語を音声認識に用いる用語として活用できる。   Even with such a configuration, terms registered in a user dictionary (term list) created by each user can be used as terms used for speech recognition.

また、音声認識サーバ70は、音声認識手段73が音声認識を行った音声に含まれる用語が用語リストから抽出された用語である場合に、その用語リストの作成元ユーザに所定のポイントを付与するポイント付与手段(例えば、貢献度制御部18)とを含んでいてもよい。   The speech recognition server 70 gives a predetermined point to the user who created the term list when the term included in the speech that the speech recognition unit 73 performed speech recognition is a term extracted from the term list. Point granting means (for example, contribution degree control unit 18) may be included.

また、ポイント付与手段は、未登録用語抽出手段72が抽出した用語とその用語の作成元ユーザとを対応付けたリストである用語抽出リストを作成し、音声認識手段73が音声認識を行った音声に含まれる用語が用語抽出リストに含まれている場合、その用語に対応する作成元ユーザに所定のポイントを付与してもよい。   In addition, the point granting unit creates a term extraction list that is a list in which the term extracted by the unregistered term extracting unit 72 is associated with the user who created the term, and the voice recognition unit 73 performs the voice recognition. When a term included in the term extraction list is included in the term extraction list, a predetermined point may be given to the creation source user corresponding to the term.

また、音声認識辞書拡張システムは、用語リストを登録する登録手段(例えば、登録端末30や、情報端末20の登録手段)を備えていてもよい。そして、未登録用語抽出手段72は、登録手段が登録した用語リストから音声認識辞書に存在しない用語を抽出し、抽出した用語をその音声認識辞書に追加してもよい。   Further, the speech recognition dictionary expansion system may include a registration unit (for example, registration unit 30 or registration unit of the information terminal 20) that registers a term list. Then, the unregistered term extraction unit 72 may extract a term that does not exist in the speech recognition dictionary from the term list registered by the registration unit, and add the extracted term to the speech recognition dictionary.

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。   A part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.

(付記1)音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから、音声認識の対象とする用語を含む音声認識辞書に存在しない用語を抽出し、抽出された用語を前記音声認識辞書に追加し、前記音声認識辞書に基づいて、音声認識を要求する要求端末から受信した音声の音声認識を行うことを特徴とする音声認識辞書拡張方法。 (Supplementary Note 1) Extracting a term that is not present in the speech recognition dictionary including a term that is a target of speech recognition from a term list that is a list that is created by associating a term that is a target of speech recognition with a reading of the term A speech recognition dictionary expansion method comprising: adding an extracted term to the speech recognition dictionary and performing speech recognition of a speech received from a requesting terminal that requests speech recognition based on the speech recognition dictionary.

(付記2)音声認識された音声に含まれる用語が前記用語リストから抽出された用語である場合に、当該用語リストの作成元ユーザに所定のポイントを付与する付記1記載の音声認識辞書拡張方法。 (Supplementary note 2) The speech recognition dictionary expansion method according to supplementary note 1, wherein, when a term included in speech-recognized speech is a term extracted from the term list, a predetermined point is given to a user who creates the term list .

(付記3)音声認識辞書に存在しない用語として用語リストから抽出された用語と当該用語の作成元ユーザとを対応付けたリストである用語抽出リストを作成し、音声認識された音声に含まれる用語が前記用語抽出リストに含まれている場合、当該用語に対応する作成元ユーザに所定のポイントを付与する付記2記載の音声認識辞書拡張方法。 (Supplementary Note 3) Terms included in speech that has been speech-recognized by creating a term extraction list that is a list in which terms extracted from the term list as terms that do not exist in the speech recognition dictionary are associated with the user who created the term The speech recognition dictionary expansion method according to appendix 2, wherein a predetermined point is given to a creation source user corresponding to the term when the term extraction list is included in the term extraction list.

(付記4)音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段を備えたコンピュータに適用される音声認識辞書拡張プログラムであって、前記コンピュータに、音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから、前記音声認識辞書に存在しない用語を抽出し、抽出した用語を当該音声認識辞書に追加する未登録用語抽出処理、および、前記音声認識辞書に基づいて音声認識を行う音声認識処理を実行させるための音声認識辞書拡張プログラム。 (Supplementary note 4) A speech recognition dictionary expansion program applied to a computer having speech recognition dictionary storage means for storing a speech recognition dictionary including a term to be speech recognition target. Unregistered term extraction processing for extracting a term that does not exist in the speech recognition dictionary from a term list that is a list created by associating a term to be read and a reading of the term, and adding the extracted term to the speech recognition dictionary And a speech recognition dictionary expansion program for executing speech recognition processing for performing speech recognition based on the speech recognition dictionary.

(付記5)コンピュータに、音声認識処理で音声認識が行われた音声に含まれる用語が、前記用語リストから抽出された用語である場合に、当該用語リストの作成元ユーザに所定のポイントを付与するポイント付与処理を実行させる付記4記載の音声認識辞書拡張プログラム。 (Additional remark 5) When the term contained in the audio | voice with which speech recognition was performed by the speech recognition process is a term extracted from the said term list to a computer, a predetermined point is given to the creation origin user of the said term list The speech recognition dictionary expansion program according to appendix 4, which executes a point giving process.

(付記6)コンピュータに、ポイント付与処理で、未登録用語抽出処理で抽出された用語と当該用語の作成元ユーザとを対応付けたリストである用語抽出リストを作成させ、音声認識処理で音声認識された音声に含まれる用語が前記用語抽出リストに含まれている場合、当該用語に対応する作成元ユーザに所定のポイントを付与させる付記5記載の音声認識辞書拡張プログラム。 (Additional remark 6) Let a computer create the term extraction list | wrist which is the list | wrist which matched the term extracted from the unregistered term extraction process, and the creation origin user of the said term by point provision processing, and performs speech recognition by speech recognition processing. The speech recognition dictionary expansion program according to appendix 5, which gives a predetermined point to a creation source user corresponding to the term when the term included in the speech is included in the term extraction list.

本発明は、通信ネットワーク上に設置される装置が音声認識を行う際に用いる音声認識辞書を拡張する音声認識辞書拡張装置に好適に適用される。また、グループウェアなどの情報共有サービスや、業務情報管理サービスなどにも本発明を適用可能である。   The present invention is preferably applied to a speech recognition dictionary expansion device that expands a speech recognition dictionary used when a device installed on a communication network performs speech recognition. The present invention can also be applied to information sharing services such as groupware and business information management services.

10 サービス提供サーバ
11 ID管理部
12 業務サービス提供部
13 音声認識辞書管理部
14 音声認識部
15 貢献度管理部
16 辞書制御部
17 辞書記憶部
18 貢献度制御部
19 貢献度記憶部
20 情報端末
21 音声送受信部
22 マイクロホン
23 表示部
30 登録端末
100 通信ネットワーク
DESCRIPTION OF SYMBOLS 10 Service provision server 11 ID management part 12 Business service provision part 13 Speech recognition dictionary management part 14 Speech recognition part 15 Contribution management part 16 Dictionary control part 17 Dictionary storage part 18 Contribution control part 19 Contribution storage part 20 Information terminal 21 Audio transmission / reception unit 22 Microphone 23 Display unit 30 Registration terminal 100 Communication network

Claims (10)

音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段と、
音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから前記音声認識辞書に存在しない用語を抽出し、抽出した用語を音声認識辞書に追加する未登録用語抽出手段と、
前記音声認識辞書に基づいて音声認識を行う音声認識手段とを備えた
ことを特徴とする音声認識辞書拡張装置。
Speech recognition dictionary storage means for storing a speech recognition dictionary including terms to be subjected to speech recognition;
Extract a term that does not exist in the speech recognition dictionary from a term list, which is a list that is created by associating a term that is the target of speech recognition with the reading of the term, and add the extracted term to the speech recognition dictionary Term extraction means;
A speech recognition dictionary expansion device comprising speech recognition means for performing speech recognition based on the speech recognition dictionary.
音声認識手段が音声認識を行った音声に含まれる用語が用語リストから抽出された用語である場合に、当該用語リストの作成元ユーザに所定のポイントを付与するポイント付与手段を備えた
請求項1記載の音声認識辞書拡張装置。
The point granting means for giving a predetermined point to a user who created the term list when the term included in the speech subjected to the speech recognition by the voice recognition unit is a term extracted from the term list. The speech recognition dictionary expansion device described.
ポイント付与手段は、未登録用語抽出手段が抽出した用語と当該用語の作成元ユーザとを対応付けたリストである用語抽出リストを作成し、音声認識手段が音声認識を行った音声に含まれる用語が前記用語抽出リストに含まれている場合、当該用語に対応する作成元ユーザに所定のポイントを付与する
請求項2記載の音声認識辞書拡張装置。
The point granting unit creates a term extraction list that is a list in which the term extracted by the unregistered term extracting unit and the user who created the term are associated with each other, and the term included in the speech that the speech recognition unit has performed speech recognition 3. The speech recognition dictionary expansion device according to claim 2, wherein when a word is included in the term extraction list, a predetermined point is given to a creation user corresponding to the term.
未登録用語抽出手段は、用語リストに含まれる用語の表記と音声認識辞書における用語の表記とが一致しない用語、または、用語リストにおける用語の読みと音声認識辞書における用語の読みとが一致しない用語を、音声認識辞書に存在しない用語として抽出する
請求項1から請求項3のうちのいずれか1項に記載の音声認識辞書拡張装置。
Unregistered term extraction means that terms that are included in the term list do not match the terms in the speech recognition dictionary or terms that do not match the terms in the term list and terms in the speech recognition dictionary The speech recognition dictionary expansion device according to any one of claims 1 to 3, wherein: is extracted as a term that does not exist in the speech recognition dictionary.
音声認識を行う音声認識サーバと、
前記音声認識サーバに音声を送信して音声認識を要求する要求端末とを備え、
前記音声認識サーバは、
音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段と、
音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから前記音声認識辞書に存在しない用語を抽出し、抽出した用語を前記音声認識辞書に追加する未登録用語抽出手段と、
前記音声認識辞書に基づいて、前記要求端末から受信した音声の音声認識を行う音声認識手段とを含む
ことを特徴とする音声認識辞書拡張システム。
A voice recognition server for voice recognition;
A requesting terminal that transmits voice to the voice recognition server and requests voice recognition;
The voice recognition server
Speech recognition dictionary storage means for storing a speech recognition dictionary including terms to be subjected to speech recognition;
A term that does not exist in the speech recognition dictionary is extracted from a term list that is a list that is created by associating a term that is a target of speech recognition with a reading of the term, and the extracted term is not added to the speech recognition dictionary. Registered term extraction means;
A speech recognition dictionary expansion system comprising speech recognition means for performing speech recognition of speech received from the requesting terminal based on the speech recognition dictionary.
音声認識手段が音声認識を行った音声に含まれる用語が用語リストから抽出された用語である場合に、当該用語リストの作成元ユーザに所定のポイントを付与するポイント付与手段とを含む
請求項5記載の音声認識辞書拡張システム。
6. A point granting unit for granting a predetermined point to a user who created the term list when the term included in the speech that has been voice-recognized by the voice recognition unit is a term extracted from the term list. The speech recognition dictionary expansion system described.
ポイント付与手段は、未登録用語抽出手段が抽出した用語と当該用語の作成元ユーザとを対応付けたリストである用語抽出リストを作成し、音声認識手段が音声認識を行った音声に含まれる用語が前記用語抽出リストに含まれている場合、当該用語に対応する作成元ユーザに所定のポイントを付与する
請求項6記載の音声認識辞書拡張システム。
The point granting unit creates a term extraction list that is a list in which the term extracted by the unregistered term extracting unit and the user who created the term are associated with each other, and the term included in the speech that the speech recognition unit has performed speech recognition 7. The speech recognition dictionary expansion system according to claim 6, wherein a predetermined point is given to a creation source user corresponding to the term when the is included in the term extraction list.
用語リストを登録する登録手段を備え、
未登録用語抽出手段は、前記登録手段が登録した用語リストから音声認識辞書に存在しない用語を抽出し、抽出した用語を当該音声認識辞書に追加する
請求項5から請求項7のうちのいずれか1項に記載の音声認識辞書拡張システム。
A registration means for registering a term list;
The unregistered term extraction unit extracts a term that does not exist in the speech recognition dictionary from the term list registered by the registration unit, and adds the extracted term to the speech recognition dictionary. The speech recognition dictionary expansion system according to item 1.
音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから、音声認識の対象とする用語を含む音声認識辞書に存在しない用語を抽出し、
抽出された用語を前記音声認識辞書に追加し、
前記音声認識辞書に基づいて、音声認識を要求する要求端末から受信した音声の音声認識を行う
ことを特徴とする音声認識辞書拡張方法。
Extract a term that does not exist in the speech recognition dictionary that includes the term that is subject to speech recognition from the term list that is a list that is created by associating the term that is subject to speech recognition and the reading of the term,
Adding the extracted terms to the speech recognition dictionary;
A speech recognition dictionary expansion method, wherein speech recognition of speech received from a requesting terminal that requests speech recognition is performed based on the speech recognition dictionary.
音声認識の対象とする用語を含む音声認識辞書を記憶する音声認識辞書記憶手段を備えたコンピュータに適用される音声認識辞書拡張プログラムであって、
前記コンピュータに、
音声認識の対象とする用語と当該用語の読みとを対応付けて作成されるリストである用語リストから、前記音声認識辞書に存在しない用語を抽出し、抽出した用語を当該音声認識辞書に追加する未登録用語抽出処理、および、
前記音声認識辞書に基づいて音声認識を行う音声認識処理
を実行させるための音声認識辞書拡張プログラム。
A speech recognition dictionary expansion program applied to a computer provided with speech recognition dictionary storage means for storing a speech recognition dictionary including a term to be a target of speech recognition,
In the computer,
A term that does not exist in the speech recognition dictionary is extracted from a term list that is a list that is created by associating a term that is a target of speech recognition with a reading of the term, and the extracted term is added to the speech recognition dictionary. Unregistered term extraction process, and
A speech recognition dictionary expansion program for executing speech recognition processing for performing speech recognition based on the speech recognition dictionary.
JP2011016562A 2011-01-28 2011-01-28 Speech recognition dictionary extension device, system, method and program Pending JP2012155272A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011016562A JP2012155272A (en) 2011-01-28 2011-01-28 Speech recognition dictionary extension device, system, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011016562A JP2012155272A (en) 2011-01-28 2011-01-28 Speech recognition dictionary extension device, system, method and program

Publications (1)

Publication Number Publication Date
JP2012155272A true JP2012155272A (en) 2012-08-16

Family

ID=46837014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011016562A Pending JP2012155272A (en) 2011-01-28 2011-01-28 Speech recognition dictionary extension device, system, method and program

Country Status (1)

Country Link
JP (1) JP2012155272A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018059961A (en) * 2016-09-30 2018-04-12 株式会社リコー Language processing system, language processing device, language processing program and language processing method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146532A (en) * 2008-12-16 2010-07-01 Yahoo Japan Corp Voice retrieval device, voice retrieval method, and voice retrieval program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146532A (en) * 2008-12-16 2010-07-01 Yahoo Japan Corp Voice retrieval device, voice retrieval method, and voice retrieval program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018059961A (en) * 2016-09-30 2018-04-12 株式会社リコー Language processing system, language processing device, language processing program and language processing method

Similar Documents

Publication Publication Date Title
CN107251006B (en) Gallery of messages with shared interests
AU2019265827B2 (en) Blockchain-based music originality analysis method and apparatus
US9047868B1 (en) Language model data collection
US8429099B1 (en) Dynamic gazetteers for entity recognition and fact association
US11934394B2 (en) Data query method supporting natural language, open platform, and user terminal
US20170249934A1 (en) Electronic device and method for operating the same
CN111566638B (en) Adding descriptive metadata to an application programming interface for use by intelligent agents
CN113268498A (en) Service recommendation method and device with intelligent assistant
TW201209804A (en) Digital media voice tags in social networks
TW200947234A (en) Techniques for input recognition and completion
JP5088096B2 (en) Information extraction program and information extraction apparatus
CN113516961B (en) Note generation method, related device, storage medium and program product
CN108900612A (en) Method and apparatus for pushed information
CN110245298A (en) Method and apparatus for pushed information
KR20150041592A (en) Method for updating contact information in callee electronic device, and the electronic device
JP2019191975A (en) Talent selection device, talent selection system, talent selection method, and program
CN110895587B (en) Method and device for determining target user
JP5757208B2 (en) Keyword extraction system, keyword extraction method and program
US10681402B2 (en) Providing relevant and authentic channel content to users based on user persona and interest
JP6554517B2 (en) Apparatus and method for providing social network service using sound
CN106663112A (en) Presenting information cards for events associated with entities
JP2012155272A (en) Speech recognition dictionary extension device, system, method and program
US20220100785A1 (en) Entity search system
JP4109091B2 (en) Schedule management apparatus and method, program
WO2020245887A1 (en) Text generation device, text generation method and text generation program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121218

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130416