JP2002268684A - Sound model distributing method for voice recognition - Google Patents
Sound model distributing method for voice recognitionInfo
- Publication number
- JP2002268684A JP2002268684A JP2001072521A JP2001072521A JP2002268684A JP 2002268684 A JP2002268684 A JP 2002268684A JP 2001072521 A JP2001072521 A JP 2001072521A JP 2001072521 A JP2001072521 A JP 2001072521A JP 2002268684 A JP2002268684 A JP 2002268684A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic model
- provider
- acoustic
- server
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、音声認識用音響モ
デル配信方法に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an acoustic model distribution method for speech recognition.
【0002】[0002]
【従来の技術】近年、携帯電話やパソコンなどの音声認
識を利用した情報入力が本格的に実用化され始めてい
る。通常これらの機器は、初期状態においていわゆる
「不特定話者向け音響モデル」を有している。2. Description of the Related Art In recent years, information input using voice recognition of mobile phones, personal computers, and the like has begun to be put into practical use. Normally, these devices have a so-called “unspecified speaker acoustic model” in an initial state.
【0003】ただし、不特定話者向け音響モデルとは言
え、真に万人の音声に対して高い認識率を示すわけでは
なく、認識し易い話者と認識し難い話者が存在してしま
う。また、認識し易い話者にとっても、その話者がさら
に自分用にチューニングした音響モデルと比較すると、
不特定話者向け音響モデルは認識の性能が劣るのが普通
である。そこで、不特定話者向け音響モデルをベース
に、数十〜数百語程度の学習用音声を利用者に発声して
もらうことで、音響モデルのチューニングを行う機能
(話者適応機能)を設けている装置も少なくない。[0003] However, although this is an acoustic model for unspecified speakers, it does not show a high recognition rate for truly every voice, and some speakers are easy to recognize and some speakers are difficult to recognize. . Also, for a speaker who is easy to recognize, when the speaker is compared with an acoustic model tuned for himself,
In general, acoustic models for unspecified speakers have poor recognition performance. Therefore, a function (speaker adaptation function) for tuning the acoustic model is provided by having the user utter a learning voice of about several tens to several hundred words based on the acoustic model for unspecified speakers. There are not a few devices.
【0004】この学習用音声の数は、一般に多ければ多
いほど高い認識性能が期待できるが、実際に数百語もの
単語や文章を発声するには、利用者に相当の労力を強い
ることとなる。そこで、利用者に対して事前に要求され
る話者適応のための労力を省くために、自分と声質や話
し方の特徴が似ている他のユーザが提供した音響モデル
を利用する音響モデルの配信方法が考えられる。In general, the higher the number of learning voices, the higher the recognition performance can be expected. However, in order to actually utter words or sentences of several hundred words, a considerable amount of labor is required for the user. . Therefore, in order to save the user's effort for speaker adaptation required in advance, the distribution of an acoustic model using an acoustic model provided by another user who has similar voice quality and speech characteristics to the user. A method is conceivable.
【0005】[0005]
【発明が解決しようとする課題】しかしながら、この方
法がうまく機能するためには、様々なバリエーションを
持つ大量の音響モデルを用意する必要があるが、同一提
供者が自分の音声で学習した音響モデルを数多く登録し
たとしても、音響モデルのバリエーションは増えず、多
様な音響モデルの購入者に対応することができない。However, in order for this method to work well, it is necessary to prepare a large number of acoustic models having various variations. Even if many are registered, the variation of the acoustic model does not increase, and it is impossible to respond to purchasers of various acoustic models.
【0006】本発明は以上のような従来技術の問題点を
解消するためになされたもので、同一提供者からの音響
モデルの重複登録を制限することで、音響モデルのバリ
エーションを増やすことができる、音声認識用音響モデ
ル配信方法を提供することを目的とする。SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems of the prior art, and it is possible to increase the number of variations of acoustic models by restricting duplicate registration of acoustic models from the same provider. It is another object of the present invention to provide an acoustic model distribution method for speech recognition.
【0007】[0007]
【課題を解決するための手段】請求項1記載の発明は、
提供者から音響モデルを収集して上記提供者の識別情報
と共に登録しておき、購入者からの要求に応じて上記音
響モデルを配信する方法であって、提供者の識別情報と
共に音響モデルのパラメータ情報をサーバに入力するス
テップと、上記サーバが、上記音響モデルを登録する際
に上記提供者の識別情報を調べることで音響モデルの重
複登録を制限するステップ、とを有することを特徴とす
る。According to the first aspect of the present invention,
A method of collecting an acoustic model from a provider, registering the acoustic model together with the identification information of the provider, and distributing the acoustic model in response to a request from the purchaser. Inputting information to a server; and restricting duplicate registration of the acoustic model by examining the provider's identification information when registering the acoustic model.
【0008】請求項2記載の発明は、請求項1記載の発
明において、音響モデルのパラメータ情報と共に学習時
の情報も併せてサーバに入力するようにしたことを特徴
とする。According to a second aspect of the present invention, in the first aspect of the present invention, the learning information is input to the server together with the acoustic model parameter information.
【0009】請求項3記載の発明は、請求項1または2
記載の発明において、音響モデルの重複登録は、音響モ
デルの学習スコアを比較して制限するようにしたことを
特徴とする。The invention described in claim 3 is the first or second invention.
In the invention described above, overlapping registration of acoustic models is characterized in that learning scores of acoustic models are compared and limited.
【0010】請求項4記載の発明は、請求項1または2
記載の発明において、音響モデルの重複登録は、上記音
響モデルの提供者が選択することで制限するようにした
ことを特徴とする。[0010] The invention according to claim 4 is the invention according to claim 1 or 2.
In the described invention, overlapping registration of acoustic models is limited by selection by a provider of the acoustic model.
【0011】請求項5記載の発明は、請求項4記載の発
明において、提供者が音響モデルを選択する際に、上記
提供者に対して指標を提示するようにしたことを特徴と
する。According to a fifth aspect of the present invention, in the fourth aspect, an index is presented to the provider when the provider selects an acoustic model.
【0012】[0012]
【発明の実施の形態】以下、図面を参照しながら本発明
にかかる音声認識用音響モデル配信方法の実施の形態に
ついて説明する。図1は、本発明にかかる音声認識用音
響モデル配信方法の実施の形態を示したシステム構成図
である。符号1は音響モデルの提供者の端末(以下、
「端末1」という)、2は音響モデルの購入者の端末
(以下、「端末2」という)、7は通信ネットワーク、
8は音響モデル配信用ホストコンピュータ(以下、「サ
ーバ8」という)、を示す。BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing a configuration of an audio model distribution method for speech recognition according to the present invention. FIG. 1 is a system configuration diagram showing an embodiment of a speech recognition acoustic model distribution method according to the present invention. Reference numeral 1 denotes an acoustic model provider terminal (hereinafter, referred to as a terminal).
"Terminal 1"), 2 is a terminal of a purchaser of the acoustic model (hereinafter, "Terminal 2"), 7 is a communication network,
Reference numeral 8 denotes an acoustic model distribution host computer (hereinafter, referred to as “server 8”).
【0013】端末1は、通信ネットワーク7を介してサ
ーバ8と通信することができる情報処理装置であり、音
声認識機能を有する。音響モデルの提供者Aは、端末1
を用いて、定められた話者適応用の発話リストの内容
(数十〜数百発話程度)を入力することで、話者適応が
行われ、提供者用の音響モデルを構築し、サーバ8に入
力する。サーバ8へは、音響モデルのみでなく、話者適
応用に発話された音声の一部(例えば最初の単語。この
例では「はちのへ」)も併せて入力する。The terminal 1 is an information processing device capable of communicating with the server 8 via the communication network 7 and has a voice recognition function. The provider A of the acoustic model is the terminal 1
By inputting the contents (about several tens to several hundreds of utterances) of the determined utterance list for speaker adaptation using, the speaker adaptation is performed, an acoustic model for the provider is constructed, and the server 8 To enter. Not only the acoustic model but also a part of the speech uttered for speaker adaptation (for example, the first word, “Hachinohe” in this example) is input to the server 8.
【0014】端末2は、通信ネットワーク7を介してサ
ーバ8と通信することができる情報処理装置であり、音
声認識機能を有する。音響モデルの購入者Bは、端末2
を用いて、定められたモデル検索用の発話リストの内容
(1〜数発話程度)をサーバ8に入力する。サーバ8へ
は、音響モデル予備選択用の音声(例えば「はちの
へ」)も併せて入力する。The terminal 2 is an information processing device capable of communicating with the server 8 via the communication network 7, and has a voice recognition function. The purchaser B of the acoustic model uses the terminal 2
Is input to the server 8 with the contents of the determined utterance list for model search (one to several utterances). The sound for preliminary selection of the acoustic model (for example, “Hachinohe”) is also input to the server 8.
【0015】通信ネットワーク7の例としては、インタ
ーネットやLANに代表されるコンピュータネットワー
クがあり、端末1,2、及びサーバ8は、それぞれ公衆
交換電話網(PSTN)、無線電話網、CATV網、衛
星通信網などの通信回線を介して通信ネットワーク7に
接続している。Examples of the communication network 7 include a computer network represented by the Internet and a LAN. The terminals 1 and 2 and the server 8 are respectively connected to a public switched telephone network (PSTN), a wireless telephone network, a CATV network, and a satellite. It is connected to a communication network 7 via a communication line such as a communication network.
【0016】サーバ8は、提供者Aから収集した音響モ
デルを購入者Bに配信する業者、すなわち音響モデルの
提供者Aと購入者Bとを仲介するための仲介業者が管理
・運営する情報処理装置である。サーバ8はその内部
に、重複登録の調査・対応部3、購入者のための処理部
4、音響モデルデータベース5、音響モデル検索用発話
リスト6、とを有してなる。The server 8 distributes the acoustic model collected from the provider A to the purchaser B, that is, information processing managed and operated by an intermediary for mediating between the acoustic model provider A and the purchaser B. Device. The server 8 includes therein a survey / correspondence unit 3 for duplicate registration, a processing unit 4 for a purchaser, an acoustic model database 5, and an utterance list 6 for acoustic model search.
【0017】重複登録の調査・対応部3は、同一提供者
の音響モデルが既に登録されているか否かを音響モデル
データベース5上で検索し、登録されている場合には、
重複を解消するための処理を行う。The duplicate registration investigation / correspondence unit 3 searches the acoustic model database 5 to determine whether or not the acoustic model of the same provider has already been registered.
Perform processing to eliminate duplication.
【0018】購入者のための処理部4は、「音響モデル
の予備選択機能」、「最適モデルの検索機能」、「認識
精度計算機能」、「課金処理機能」、の各機能を提供す
る。以下、各機能について説明する。The processing unit 4 for the purchaser provides each function of "preliminary acoustic model selection function", "optimal model search function", "recognition accuracy calculation function", and "billing processing function". Hereinafter, each function will be described.
【0019】音響モデルの予備選択機能は、購入者Bの
性別や年齢、および購入者Bからアップロード(提出)
されたモデル検索用音声サンプル中の予備選択用の音声
などの情報を、提供者Aから既にアップロードされてい
る情報と比較するという単純な処理によって、登録され
ている膨大な音響モデルの中から、購入者Bに相応しい
と思われる音響モデル候補の絞り込みを行う。The preselection function of the acoustic model is performed by uploading (submitting) the sex and age of the buyer B and the buyer B.
By a simple process of comparing information such as voice for preliminary selection in the obtained voice sample for model search with information already uploaded from the provider A, from among a huge number of registered acoustic models, A narrowing down of acoustic model candidates considered to be suitable for the purchaser B is performed.
【0020】最適モデルの検索機能は、予備選択によっ
て絞り込まれた少数の音響モデルを購入者Bの音声に適
用し、各モデルに対するスコア(尤度など)を計算し、
その値が大きい順にソートすることによって、購入者B
の音声に最適なモデルを第n位候補まで求める。The search function of the optimal model is to apply a small number of acoustic models narrowed down by the preliminary selection to the voice of Buyer B, calculate a score (likelihood, etc.) for each model,
By sorting the values in descending order, the purchaser B
The most suitable model for the voice is obtained up to the n-th candidate.
【0021】認識精度計算機能は、自動的に検索された
音響モデルの性能を最終確認するために、購入者Bから
アップロードされる評価試験用の音声サンプルを用い
て、オンラインで音声認識実験を行う。文法は予め用意
されているが、購入者Bから文法情報がアップロードさ
れている場合には、それを用いることもできる。The recognition accuracy calculation function performs an online speech recognition experiment using a speech sample for an evaluation test uploaded from the purchaser B in order to finally confirm the performance of the automatically searched acoustic model. . Although the grammar is prepared in advance, if grammar information is uploaded from the purchaser B, it can be used.
【0022】課金処理機能は、購入者Bが最終的に特定
の音響モデルの購入を決定し、その音響モデルが購入者
Bの端末2に向けて配信された時点で、購入者Bの情
報、および購入者Bに提供された音響モデルの提供者A
の情報を対にして記憶し、後日、購入者Bへの課金、あ
るいは提供者Aへの報酬支払いを行う。The billing function is such that when the purchaser B finally decides to purchase a specific acoustic model and the acoustic model is distributed to the terminal 2 of the purchaser B, information on the purchaser B, And the provider A of the acoustic model provided to the buyer B
Is stored as a pair, and the purchaser B is paid or the provider A is paid later.
【0023】音響モデルデータベース5は、提供者Aか
ら提供された音響モデルをその付加情報と共に保存す
る。The acoustic model database 5 stores the acoustic model provided by the provider A together with its additional information.
【0024】音響モデル検索用発話リスト6は、提供者
A、購入者Bおよびサーバ8で共有される情報である。
これによって購入者Bに適した音響モデルの自動検索
(予備選択も含む)が可能になる。The utterance list 6 for acoustic model search is information shared by the provider A, the purchaser B, and the server 8.
This enables automatic search (including preliminary selection) of an acoustic model suitable for purchaser B.
【0025】以下、サーバ8への音響モデルの重複登録
を制限する方法について説明する。なお、ここでは、端
末1を利用している提供者Aが、自分の音声で話者適応
用の指定された単語、あるいは文章などを実際に発話
し、自分の音声にチューニングした音響モデルを既に構
築しているものとする。Hereinafter, a method for restricting the duplicate registration of the acoustic model to the server 8 will be described. Note that, here, the provider A using the terminal 1 actually utters a specified word or sentence for speaker adaptation in his / her own voice, and has already created an acoustic model tuned to his / her own voice. Assume that you are building.
【0026】音響モデルの提供者Aは、端末1を用いて
通信ネットワーク7を介してサーバ8に接続し、音響モ
デルのパラメータ情報をアップロードする。その際音響
モデルのパラメータ情報以外に、端末の識別情報、ある
いは提供者の性別や年齢を特定するための情報、端末内
に保存されている音響モデル学習時の情報(学習単語数
や学習スコア)を同時にアップロードする。The acoustic model provider A uses the terminal 1 to connect to the server 8 via the communication network 7 and uploads the acoustic model parameter information. At this time, in addition to the acoustic model parameter information, terminal identification information, information for specifying the sex and age of the provider, and information on acoustic model learning stored in the terminal (number of learning words and learning score) Upload at the same time.
【0027】サーバ8は、端末1から受信した提供者A
の個人情報に基づいてユニークな提供者の識別情報(提
供者ID)を設け、この提供者IDとアップロードされ
た音響モデルのパラメータ情報、および学習時の情報を
音響モデルデータベース5上で一元管理する。The server 8 stores the provider A received from the terminal 1
And unique provider identification information (provider ID) is provided based on the personal information described above, and the provider ID, parameter information of the uploaded acoustic model, and information at the time of learning are centrally managed on the acoustic model database 5. .
【0028】サーバ8は、音響モデルを受信する度に、
提供者IDを調べ、同一提供者からアップロードされた
音響モデルが既に登録されている場合には、以下の2つ
のいずれかの方法によって、重複登録を制限する。Each time the server 8 receives an acoustic model,
The provider ID is checked, and if the acoustic model uploaded from the same provider has already been registered, duplicate registration is restricted by one of the following two methods.
【0029】1つの方法は、既に登録された音響モデル
と新たにアップロードされた音響モデルのうちから、一
方を自動的に選択して正式に採用する方法である。その
際、既に登録された音響モデルの学習スコアと、新たに
アップロードされた音響モデルの学習スコアを比較し、
その値が大きい方を正式に採用する。すなわち、既に登
録された音響モデルが採用される場合には、そのときの
アップロードの処理自体を無効にし、一方、新たにアッ
プロードされた音響モデルが採用される場合には、既に
登録された音響モデルのパラメータ情報や学習情報を新
たにアップロードされたものと置きかえる。One method is to automatically select one of an already registered acoustic model and a newly uploaded acoustic model and formally adopt it. At that time, the learning score of the already registered acoustic model is compared with the learning score of the newly uploaded acoustic model,
The one with the larger value is officially adopted. That is, when the already registered acoustic model is adopted, the uploading process itself at that time is invalidated. On the other hand, when the newly uploaded acoustic model is adopted, the already registered acoustic model is used. The parameter information and the learning information of are replaced with newly uploaded ones.
【0030】別の方法は、既に登録された音響モデルと
新たにアップロードされた音響モデルのうちから、一方
を提供者Aに選択させて正式に採用する方法である。既
に登録された音響モデルと新たにアップロードされた音
響モデルのうち、提供者Aがどちらを正式に登録したい
かを端末1から指定することで、最終的に1つの音響モ
デルのみを残す。Another method is a method in which the provider A selects one of an already registered acoustic model and a newly uploaded acoustic model, and formally adopts the selected acoustic model. From the terminal 1, the provider A designates which one of the already registered acoustic model and the newly uploaded acoustic model is to be officially registered, so that only one acoustic model is finally left.
【0031】その際サーバ8は、既に登録された音響モ
デルのアップロードの受付日や学習時の情報、その音響
モデルの過去の実績(購入者の音声に適合した頻度、あ
るいはN―best候補に残った頻度など)を端末1に
送信し、提供者Aが、より的確な判断を促すための指標
を提示するようにしてよい。At this time, the server 8 receives the upload date of the acoustic model already registered and the information at the time of learning, the past performance of the acoustic model (the frequency suitable for the voice of the purchaser, or the N-best candidate May be transmitted to the terminal 1, and the provider A may present an index for prompting a more accurate determination.
【0032】以上説明した実施の形態によれば、提供者
Aから音響モデルを収集して上記提供者Aの識別情報と
共に登録しておき、購入者Bからの要求に応じて上記音
響モデルを配信する方法であって、提供者Aの識別情報
と共に音響モデルのパラメータ情報をサーバ8に入力す
るステップと、上記サーバ8が、上記音響モデルを登録
する際に上記提供者Aの識別情報を調べることで音響モ
デルの重複登録を制限するステップ、とを有することに
より、収集する音響モデルを重複して登録するのを防ぐ
ことができるため、多様な音響モデルのバリエーション
を増やすことができる。その結果、多様な音響モデルの
購入者に対応することができる。According to the embodiment described above, an acoustic model is collected from the provider A, registered with the identification information of the provider A, and distributed in response to a request from the purchaser B. Inputting the parameter information of the acoustic model together with the identification information of the provider A to the server 8, wherein the server 8 checks the identification information of the provider A when registering the acoustic model. Restricting the duplicate registration of acoustic models, it is possible to prevent the acoustic models to be collected from being registered in duplicate, thereby increasing variations of various acoustic models. As a result, it is possible to respond to purchasers of various acoustic models.
【0033】また、提供者Aが音響モデルを選択する際
に、上記提供者Aに対して指標を提示するようにしたこ
とにより、提供者Aがより的確な判断を行うことができ
るため、登録された音響モデルの品質の向上を実現する
ことができる。When the provider A selects the acoustic model, the index is presented to the provider A, so that the provider A can make a more accurate determination. It is possible to realize improvement of the quality of the acoustic model obtained.
【0034】[0034]
【発明の効果】請求項1記載の発明によれば、収集する
音響モデルが重複して登録するのを防ぐことできるた
め、多様な音響モデルのバリエーションを増やすことが
でき、多様な音響モデルの購入者に対応することができ
る。According to the first aspect of the present invention, it is possible to prevent the acoustic models to be collected from being registered repeatedly, so that it is possible to increase the variations of various acoustic models and to purchase various acoustic models. Can respond to people.
【0035】請求項5記載の発明によれば、提供者が音
響モデルを選択することで重複登録を制限する方法の場
合に、提供者がより的確な判断を行うことができるた
め、登録された音響モデルの品質の向上を実現すること
ができる。According to the fifth aspect of the present invention, when the provider selects an acoustic model to restrict duplicate registration, the provider can make a more accurate determination, and the registered It is possible to improve the quality of the acoustic model.
【図1】本発明にかかる音声認識用音響モデルの実施の
形態を示すシステム構成図である。FIG. 1 is a system configuration diagram showing an embodiment of a speech recognition acoustic model according to the present invention.
1 音響モデル提供者の端末(端末1) 2 音響モデル購入者の端末(端末2) 7 通信ネットワーク 8 音響モデル配信用ホストコンピュータ(サーバ) Reference Signs List 1 acoustic model provider terminal (terminal 1) 2 acoustic model purchaser terminal (terminal 2) 7 communication network 8 acoustic model distribution host computer (server)
Claims (5)
供者の識別情報と共に登録しておき、購入者からの要求
に応じて上記音響モデルを配信する方法であって、 提供者の識別情報と共に音響モデルのパラメータ情報を
サーバに入力するステップと、 上記サーバが、上記音響モデルを登録する際に上記提供
者の識別情報を調べることで音響モデルの重複登録を制
限するステップ、とを有することを特徴とする音声認識
用音響モデル配信方法。1. A method of collecting an acoustic model from a provider, registering the acoustic model together with the identification information of the provider, and distributing the acoustic model in response to a request from a purchaser, comprising the steps of: Together with inputting parameter information of the acoustic model to the server, and the server restricting duplicate registration of the acoustic model by examining the identification information of the provider when registering the acoustic model. An acoustic model distribution method for speech recognition characterized by the following.
時の情報も併せてサーバに入力するようにした請求項1
記載の音声認識用音響モデル配信方法。2. The server according to claim 1, wherein the learning information is input to the server together with the acoustic model parameter information.
The described acoustic model distribution method for speech recognition.
学習スコアを比較して制限するようにした請求項1また
は2記載の音声認識用音響モデル配信方法。3. The acoustic model distribution method for speech recognition according to claim 1, wherein the duplicate registration of acoustic models is limited by comparing learning scores of acoustic models.
ルの提供者が選択することで制限するようにした請求項
1または2記載の音声認識用音響モデル配信方法。4. The acoustic model distribution method for speech recognition according to claim 1, wherein the duplicate registration of the acoustic model is restricted by selecting the acoustic model provider.
記提供者に対して指標を提示するようにした請求項4記
載の音声認識用音響モデル配信方法。5. The acoustic model distribution method for speech recognition according to claim 4, wherein when the provider selects an acoustic model, an index is presented to the provider.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001072521A JP2002268684A (en) | 2001-03-14 | 2001-03-14 | Sound model distributing method for voice recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001072521A JP2002268684A (en) | 2001-03-14 | 2001-03-14 | Sound model distributing method for voice recognition |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002268684A true JP2002268684A (en) | 2002-09-20 |
Family
ID=18930091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001072521A Pending JP2002268684A (en) | 2001-03-14 | 2001-03-14 | Sound model distributing method for voice recognition |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002268684A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6118887B1 (en) * | 2015-12-24 | 2017-04-19 | エヌ・ティ・ティ・コムウェア株式会社 | Artificial intelligence training system, artificial intelligence training method, and program |
WO2018142766A1 (en) * | 2017-02-03 | 2018-08-09 | パナソニックIpマネジメント株式会社 | Learned model provision method and learned model provision device |
WO2018142765A1 (en) * | 2017-02-03 | 2018-08-09 | パナソニックIpマネジメント株式会社 | Learned model provision method, and learned model provision device |
US11375019B2 (en) | 2017-03-21 | 2022-06-28 | Preferred Networks, Inc. | Server device, learned model providing program, learned model providing method, and learned model providing system |
WO2024075638A1 (en) * | 2022-10-04 | 2024-04-11 | ヤマハ株式会社 | Acoustic model training method |
-
2001
- 2001-03-14 JP JP2001072521A patent/JP2002268684A/en active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6118887B1 (en) * | 2015-12-24 | 2017-04-19 | エヌ・ティ・ティ・コムウェア株式会社 | Artificial intelligence training system, artificial intelligence training method, and program |
JP2017117226A (en) * | 2015-12-24 | 2017-06-29 | エヌ・ティ・ティ・コムウェア株式会社 | Artificial intelligence upbringing system, artificial intelligence upbringing method, and program |
WO2018142766A1 (en) * | 2017-02-03 | 2018-08-09 | パナソニックIpマネジメント株式会社 | Learned model provision method and learned model provision device |
WO2018142765A1 (en) * | 2017-02-03 | 2018-08-09 | パナソニックIpマネジメント株式会社 | Learned model provision method, and learned model provision device |
JPWO2018142766A1 (en) * | 2017-02-03 | 2019-11-21 | パナソニックIpマネジメント株式会社 | Learned model providing method and learned model providing apparatus |
US10803407B2 (en) | 2017-02-03 | 2020-10-13 | Panasonic Intellectual Property Management Co., Ltd. | Method for selecting learned model corresponding to sensing data and provisioning selected learned model, and learned model provision device |
JP7065266B2 (en) | 2017-02-03 | 2022-05-12 | パナソニックIpマネジメント株式会社 | Trained model providing method and trained model providing device |
US11375019B2 (en) | 2017-03-21 | 2022-06-28 | Preferred Networks, Inc. | Server device, learned model providing program, learned model providing method, and learned model providing system |
WO2024075638A1 (en) * | 2022-10-04 | 2024-04-11 | ヤマハ株式会社 | Acoustic model training method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6945695B2 (en) | Utterance classifier | |
US10832686B2 (en) | Method and apparatus for pushing information | |
WO2021232725A1 (en) | Voice interaction-based information verification method and apparatus, and device and computer storage medium | |
US11087739B1 (en) | On-device learning in a hybrid speech processing system | |
JP5042799B2 (en) | Voice chat system, information processing apparatus and program | |
US9020819B2 (en) | Recognition dictionary system and recognition dictionary system updating method | |
US9626959B2 (en) | System and method of supporting adaptive misrecognition in conversational speech | |
WO2021017612A1 (en) | Question and answer method and apparatus based on speech analysis, device and storage medium | |
JP2002540478A (en) | Parallel recognition engine | |
US7940915B2 (en) | Apparatus and method for determining part of elicitation from spoken dialogue data | |
US8626506B2 (en) | Method and system for dynamic nametag scoring | |
KR20050098839A (en) | Intermediary for speech processing in network environments | |
US20030078777A1 (en) | Speech recognition system for mobile Internet/Intranet communication | |
KR20160030168A (en) | Voice recognition method, apparatus, and system | |
CN107710192A (en) | Measurement for the automatic Evaluation of conversational response | |
CN107967916A (en) | Determine voice relation | |
US8428241B2 (en) | Semi-supervised training of destination map for call handling applications | |
CN109378006A (en) | A kind of striding equipment method for recognizing sound-groove and system | |
WO2023221345A1 (en) | Emotional speech synthesis method and apparatus | |
US20180357269A1 (en) | Address Book Management Apparatus Using Speech Recognition, Vehicle, System and Method Thereof | |
JP5068225B2 (en) | Audio file search system, method and program | |
JP2004294755A (en) | Device and program for speaker authentication | |
CN107170447B (en) | Sound processing system and sound processing method | |
JP2002268684A (en) | Sound model distributing method for voice recognition | |
JP5185807B2 (en) | Voice search device, voice search method, and voice search program |