JPH06214590A - Connecting method of telephone exchange and voice recognition method - Google Patents

Connecting method of telephone exchange and voice recognition method

Info

Publication number
JPH06214590A
JPH06214590A JP739593A JP739593A JPH06214590A JP H06214590 A JPH06214590 A JP H06214590A JP 739593 A JP739593 A JP 739593A JP 739593 A JP739593 A JP 739593A JP H06214590 A JPH06214590 A JP H06214590A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
similarity
standard
classification
recognition
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP739593A
Other languages
Japanese (ja)
Inventor
Shingo Kuroiwa
Kunihiko Owa
Makoto Shosakai
Kazuya Takeda
邦彦 尾和
誠 庄境
一哉 武田
眞吾 黒岩
Original Assignee
Asahi Chem Ind Co Ltd
Kokusai Denshin Denwa Co Ltd <Kdd>
国際電信電話株式会社
旭化成工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

PURPOSE: To reduce voice recognition and telephone exchange processes by performing voice recognition in accordance with prescribed procedures and employing standard patterns corresponding to various kinds.
CONSTITUTION: Standard patterns are classified into large, medium and small classifications and are stored in a memory 100. The standard patterns classified in the large classification are the standard patterns related to dapartments. Next, as the standards for the medium classification, the standards are stored for the names of the persons who belong to the dapartments of the large classification. As to the small classification, standard patterns are classified for the subjects related to the words connected to the words of the person's names. In order to understand the relationships between these classifications, a table 110, which indicates the medium classification standard patterns related to the standard patterns of the large classification by storage addresses and a table 120 which indicates the small classification standard patterns related to the standard patterns of the medium classification by storage addresses are provided. Thus, by relating the standard patterns used for pattern collation to the various kinds of words, unrelated pattern collation is eliminated and the amount of voice recognition processes are reduced.
COPYRIGHT: (C)1994,JPO&Japio

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【産業上の利用分野】本発明は、文章認識結果を用いて、接続回線を選択する電話交換機の接続方法およびその電話交換機に好適な音声認識方法に関する。 The present invention relates to using a text recognition result, connection of the telephone exchange to select the connection line and to a suitable speech recognition method to the telephone exchange.

【0002】 [0002]

【従来の技術】電話交換機に音声認識装置を設置し、公衆回線で伝送される送話者の音声信号を受信し、音声信号を音声認識し、呼出し先を内容分析して、公衆回線を呼出し先の内部回線に接続するという提案(平成3年9 Established a voice recognition device of the Prior Art Telephone exchange receives the talker speech signal transmitted by a public line, a voice signal is voice recognition, the callee by content analysis, calls the public line proposal that is connected to the tip of the internal line (1991 9
月20日出願 単語予測機能付対話理解装置)がなされている。 Month 20 days application word prediction function with dialogue understanding device) have been made. このような電話交換機に用いられている、文章認識用の音声認識装置の回路構成を図6に示す。 Such are used in telephone exchange, a circuit configuration of a speech recognition apparatus for sentence recognition shown in FIG.

【0003】図6において、入力回路1から入力された音声信号は、特徴パラメータ変換回路2でフーリエ解析や線形予測分析、ケプストラム分析などにより順次、特徴パラメータに変換される。 [0003] In FIG. 6, the audio signal inputted from the input circuit 1, Fourier analysis and linear prediction analysis in the characteristic parameter conversion circuit 2 sequentially by cepstrum analysis, are converted into characteristic parameters. 変換されたパラメータ系列と、単語について予め用意された、標準パラメータ系列(以下、標準パターンと称す)の各々との距離計算(類似度計算とも称す)が照合回路4において、行われる。 A transformed parameter sequence, prepared in advance for the word, the standard parameter sequence (hereinafter, referred to as standard pattern) (also referred to as a similarity calculation) distance calculation between each of the collation circuit 4 is performed.
この結果、変換されたパラメータ系列に最も類似する単語、より具体的には単語を示す文字コード列もしくは単語に割当てた識別ラベルが認識結果として照合回路4から出力される。 As a result, the word most similar to the transformed parameter sequence, identification label assigned to the character code string or words indicating the word and more specifically is output from the verification circuit 4 as the recognition result. 文章認識や単語認識を行う場合、標準パターンの長さ(文字列の長さ)が標準パターン毎に異なるので、認識対象と標準パターンとの照合所要時間は常に一定になるとは限らないという第1の不具合がある。 When performing text recognition and word recognition, since the length of the reference pattern (the length of the string) is different for each standard pattern, the that match the time required for the recognition target and the standard pattern is not always constant 1 there is a problem of.

【0004】また、ビタビアルゴリズムを用いて音声認識を行う音声認識方法ではフレーム(単語)の照合を行った後、次のフレームの照合を行うまでには間隔が空いてしまうという不具合があった。 [0004] In the speech recognition method for performing speech recognition using the Viterbi algorithm after verification of frame (word) to until the collation of the next frame had trouble arises in that spaced apart.

【0005】この点について詳しく説明する。 [0005] This point will be described in detail. 音声認識手法として、図9のような複数の状態(以後セルとも呼ぶ)からなり、特徴パラメータが得られる毎に1回ずつ状態間をある所定の確率に従って遷移する確率モデルを標準パターンとして用いる方法法がよく知られている。 As speech recognition method, a method using as a standard pattern a probability model for transition in accordance with a predetermined probability that a plurality of states (also referred to hereinafter as cells), there between states once each time the characteristic parameter obtained as shown in FIG. 9 law is well known.
同じ状態から同じ状態への遷移であっても、特徴パラメータが異なれば確率値も異なる。 Even transition from the same state to the same state, it varies probability values ​​Different characteristic parameters. 状態間の遷移に伴う確率値はForward−Backwardアルゴリズムなどの公知の手法により予め計算され、求めておくことができる。 Probability values ​​associated with the transitions between states are precalculated by a known method such as Forward-Backward algorithm may have been sought. この手法における音声認識とは、複数の標準パターンの中から、ある特徴パラメータ系列を生成する確率が最大になるような状態間の遷移系列を生成する標準パターンを選択し、そのラベルを出力することである。 The voice recognition in this method, from among a plurality of standard patterns, select the standard pattern the probability of generating a feature parameter sequence to produce a transition sequence between such a state becomes maximum, and outputs the label that it is. 最大の確率値を持つ状態遷移系列を求める方法としてはビタビアルゴリズムがよく知られている。 As a method for determining the state transition sequence having a maximum probability value is well known Viterbi algorithm. 上記の確率モデル、Forward−Backwardアルゴリズム、ビタビアルゴリズムについては、例えば中川聖一著「確率モデルにおける音声認識」に記載されているように公知技術であるが、以下ビタビアルゴリズムについて簡単に説明しておく。 The above probability model, Forward-Backward algorithm, for Viterbi algorithm is a known technique as described in "Speech Recognition in the probability model" eg Seiichi Nakagawa al, it will be briefly described below Viterbi algorithm .

【0006】図7の(a)は、ビタビアルゴリズムの概念を示す図で、時刻tにおいて滞在する状態が時刻t− [0006] (a) in FIG. 7 is a diagram showing the concept of the Viterbi algorithm, the state of stay at the time t the time t-
1において滞在した状態と変化しないことを水平の矢印で示し、時刻t−1から時刻tへの遷移において状態が右隣に1つ遷移することを斜めの矢印で示している。 Indicates that no change staying state in one horizontal arrows, state in the transition from time t-1 to time t have been shown to transition one to the right at an oblique arrows. 時刻tにおいては、この2つの遷移の内、確率値の大きい方を選択する。 At time t, of the two transitions, selecting a larger probability value. この選択を行うために次式を用いている。 It is used following equation in order to perform this selection.

【0007】 [0007]

【数1】 [Number 1]

【0008】ここでP(t,i)はある標準パターンの時刻tにおいて、セルiが有する累積類似度を示す。 [0008] Here, P (t, i) at time t of the standard patterns in shows the cumulative similarity with the cell i. Q
(t,i,i)は図7(a)のように時刻tにセルiからセルiへ遷移する確率の対数値、Q(t,i−1, (T, i, i) is the logarithm of the probability of transition from cell i to cell i at time t as shown in FIG. 7 (a), Q (t, i-1,
i)は時刻tにセルi−1からセルiへ遷移する確率の対数値を示す。 i) denotes the logarithm of the probability of transition from cell i-1 to cell i at time t. maxは{ }部の2つの加算結果の内、大きい値を示す。 max is the two addition result {} part, showing a large value.

【0009】このようにi=1,2…と順に累積類似度Pを求めて行く。 [0009] go this way determine the cumulative similarity P to i = 1,2 ... and order.

【0010】図7(b)の例では説明の都合上、1つのセルに1つの音韻ラベルを付加しているが、実用上は1 [0010] FIG. 7 (b) of convenience of explanation, in the example, although the addition of one phoneme label in one cell, practically 1
つの音韻ラベルを1つまたは複数のセルで表現する。 One of the phoneme label representing one or more cell.

【0011】上記の処理を行うと、図7(b)の例では認識対象の音声が“ソー”と途中まで発声されている場合は、“SOUMUNO”という標準パターンの中の図(b)の認識ラベル列SOについての累積類似度が高くなる。 [0011] performing the above processing, Figure in the standard pattern of Fig. 7 when in the example of (b) the speech to be recognized is uttered halfway and "saw" is, "SOUMUNO" of (b) cumulative similarity for recognition label string SO becomes high.

【0012】また、“ソウムノ”と完全に発声された場合は最終セルに対応の認識ラベル列“SOUMUNO” [0012] In addition, "Soumuno" and fully voiced recognized label column corresponding to the last cell in the case "SOUMUNO"
についての累積類似度が高くなる。 The cumulative degree of similarity for the increases.

【0013】以上のようなビタビ演算アルゴリズムを用いた累積類似度の計算を標準パターンの全てについて実行すると、各標準パターンの中から最高の類似度を持つ標準パターンが音声の認識候補として選択される。 [0013] When performed for all the reference patterns the cumulative degree of similarity calculated using a Viterbi arithmetic algorithm as described above, a standard pattern having the highest similarity from among the reference pattern is selected as a recognition candidate of the speech . 音声“ソウムノ”に続いて発声された“スズキサンハ”を認識する場合は、前に接続の音声との接続を考慮するために、前に接続の音声の認識結果として選択された標準パターンの累積類似度を上記数1式のP(t−1,i− If recognizing been "Suzukisanha" utterance Following voice "Soumuno", in order to consider the connection between the speech before the connection, the cumulative similar standard pattern selected as the recognition result of the speech before the connection degrees of the equation (1) P (t-1, i-
1)としてビタビ演算を開始して行く。 1) I am going to start the Viterbi operation as.

【0014】このため、連続音声の中の2番目以降の単語(フレーム)についてのビタビ演算は、前の単語に対応の標準パターンの最適候補を決定しないと開始できないという第2の不具合があった。 [0014] Therefore, the Viterbi operation on words the second and subsequent in continuous speech (frames), there was a second problem can not be started and before the word does not determine the best candidate of the standard pattern corresponding .

【0015】 [0015]

【発明が解決しようとする課題】 [Problems that the Invention is to Solve

<第1課題>第1の不具合を解決するために、図6のような直列のパイプライン系では各回路の処理を同期して実行させるために、実行周期を照合回路3の最大所要処理時間に設定して行う。 To solve the <first challenge> first failure, series to the to synchronously execute processing of each circuit in the pipeline system, the maximum required processing time of the execution period matching circuit 3 shown in FIG. 6 set to carried out. また、認識すべき文章もしくは単語が長くなればなる程、照合回路3の最大所要処理時間も長くなる。 In addition, as the sentence or word to be recognized is the longer, the maximum required processing time of the matching circuit 3 becomes longer. このため、音声を入力してから認識結果を出力するまでの応答時間が長くなってしまうという不具合が生じる。 Therefore, a problem that the response time until outputting the recognition result from the input voice becomes longer occurs.

【0016】そこで、本発明の第1目的は、上述の点に鑑みて、音声認識処理を短縮し、電話交換処理を従来よりも短縮することの可能な電話交換機の接続方法を提供することとする。 [0016] Therefore, a first object of the present invention are that in view of the above, to shorten the speech recognition process provides a connection method of possible telephone exchange of shortening than the conventional telephone exchange to.

【0017】<第2課題>第2の不具合を解消するために、従来では、各標準パターンについてのビタビ演算と、最適候補の標準パターンの選択処理とを各々複数の演算処理装置(D.S.P)で行って音声認識処理時間全体の短縮を図っている。 [0017] To solve the <second object> second problem, conventionally, each plurality of processing units and the Viterbi computation, a process of selecting a standard pattern of the best candidate for each standard pattern (D.S thereby shortening the overall speech recognition processing time performed by .P). しかしながら、上述のように第1のフレームの最適候補およびその類似度が定まらないと第2フレームのビタビ演算を開始できないことから、図8に示すようにビタビ演算を行う演算装置が第2 However, since not initiate Viterbi calculation of the first frame best candidate and the degree of similarity is not determined second frames as described above, is a calculation device for performing Viterbi computation, as shown in FIG. 8 second
フレームを実行するまでは、最適候補を決定する演算装置(第2DSP)から類似度を受けるまでの間、待機しなければならない。 Until you run the frame, between the computing device to determine the best candidate (a 2DSP) until it receives the similarity, it must wait.

【0018】そこで、本発明の第2目的は、ビタビアルゴリズムを用いて複数の演算装置で音声認識を行う際にビタビ演算を中断させず連続的に実行可能とすることにより従来よりも多数の標準パターンを認識候補として用意することの可能な音声認識方法を提供することにある。 [0018] Therefore, a second object of the present invention, a number of standard than before by continuous feasible without interrupting Viterbi calculation when performing speech recognition in multiple computing devices using a Viterbi algorithm it is desirable to provide a speech recognition method providing a pattern as a recognition candidate.

【0019】 [0019]

【課題を解決するための手段】このような目的を達成するために、請求項1の発明は、第1の回線で伝送される音声を認識し、その認識結果の示す内容を分析することにより、前記第1の回線を第2の回線に選択接続する電話交換機の接続方法において、音声認識に用いる標準パターンを、音声の示す種類内容毎に記憶しておき、前記音声の示す内容を前記種類毎に予め定めた順序で発声させ、前記第1の回線で伝送される音声を認識する際には、前記予め定めた順序に従って、前記種類毎に、その種類に対応する前記標準パターンを用いて音声認識することを特徴とする。 Means for Solving the Problems] In order to achieve this object, the invention of claim 1 recognizes the voice to be transmitted by the first line, by analyzing the contents indicated by the recognition result in connection of the telephone exchange to select connecting the first line to the second line, the standard pattern used in the speech recognition, is stored for each type content indicated by voice, the types of contents indicated by the voice It is uttered in a predetermined order for each, when recognizing speech transmitted on said first line, in the order in which the predetermined, for each of the types, using the standard pattern corresponding to the type and recognizes the speech.

【0020】請求項2の発明は、請求項1の発明に加えて、前記種類内容は、部署、人名であって、当該部署、 [0020] According to a second aspect of the invention, in addition to the invention of claim 1, wherein the type contents, department, a person's name, the department,
および人名に相互関連性を持たせ、前記部署に関する音声内容が認識された場合は、前記人名に関する標準パターンの中の、前記部署に関する認識結果に対応する人名についての標準パターンを、前記人名についての音声認識に用いることを特徴とする。 And to have a mutual relationship in names, if audio content related to the department is recognized, in the standard pattern for the names, the standard pattern for personal names corresponding to the recognition result relating to the department for the names It is characterized by using the speech recognition.

【0021】請求項3の発明は、同時刻に音声として発声する可能性のある複数の標準パターンを1つの集合としてまとめ標準パターンの時系列的な複数の集合を予め作成しておき、集合間の標準パターン同士の接続関係を予め定めておき、連続音声の認識を行う際には、最初の集合の中の各標準パターンと前記連続音声との間の第1 [0021] The invention according to claim 3, advance to create a series of a plurality of sets when Summary standard pattern a plurality of standard patterns which may be uttered as a voice at the same time as one set beforehand, between sets is determined in advance standard patterns of the connection relationships in advance, when performing recognition of continuous speech, the first between the successive speech and the standard pattern in the first set
の類似度を求め、該第1の類似度により前記最初の集合の中から音声の認識結果とする標準パターンの候補を選択している間に前記接続関係に基づき、前記最初の集合の標準パターンおよび隣接する集合の標準パターンを接続した標準パターン系列と、連続音声との第2の類似度を求め、前記第1の類似度により選択された標準パターンの候補に関連する前記第2の類似度を選択し、以後、 Standard pattern of the basis of the connection relation, the first set while seeking the similarity, and selects a candidate of the standard patterns as a recognition result of the speech by the first similarity from among the first set of and a reference pattern sequence of connecting the standard pattern of the adjacent set, obtains a second degree of similarity between the continuous speech, the second degree of similarity associated with the candidate of the standard pattern selected by said first similarity select, thereafter,
当該選択された第2の類似度を前記第1の類似度とみなして、該第1の類似度により複数の集合それぞれの音声認識候補を限定して行くことを特徴とする。 The second similarity degree to which the selected regarded as the first degree of similarity, characterized in that going to limit the speech recognition candidates for each plurality of sets by the first similarity.

【0022】請求項4の発明は、請求項2の発明に加えて、前記時系列的な複数の集合は前記部署に関する標準パターンの集合および前記人名に関する標準パターンの集合であって、請求項4に記載の音声認識方法により前記部署についての標準パターンの認識候補および人名に関する認識候補を選択することを特徴とする。 [0022] A fourth aspect of the present invention, in addition to the invention of claim 2, wherein the time-series multiple sets is a set of standard patterns for a set, and the names of standard patterns for the department, claim 4 and selecting the recognition candidate on the recognition candidates and names of standard patterns for the division by the speech recognition method according to.

【0023】 [0023]

【作用】請求項1の発明では、音声をたとえば、部署、 [Action] In the present invention of claim 1, the voice for example, department,
人名、要件の順序で発声された音声に対して、所属に関する音声部分についてはこの所属についての標準パターンのみを用いて、音声認識を行う。 Author, the speech uttered by the order requirements, the audio portion relating belongs by using only standard pattern for this affiliation, performs speech recognition.

【0024】請求項2の発明では、たとえば上記人名を部署毎に限定し、認識された結果の示す対応の部署に関する人名の標準パターンのみを用いて音声の中の人名部分の音声認識を行なう。 [0024] In the present invention of claim 2, for example, limit the person's name for each department, perform voice recognition of the names part in the speech using only standard pattern of names for the corresponding departments indicated by the recognized result.

【0025】請求項3,4の発明では、接続関係が判明している2つの標準パターン系列は第1の集合、たとえば部署に関する集合の中の最適認識候補が判らなくてもその系列について音声に対する類似計算(ビタビ演算) [0025] In the present invention of claim 3 and 4, two standard patterns series connection relationship is known in for the voice for the first set, for example, the sequence may not know the best recognition candidates in the set relating departments similar calculation (Viterbi operation)
が可能となる。 It is possible. そこで、第1の集合から最適候補を選択する処理と並行して上記部署の標準パターンと第2の集合たとえば人名の標準パターンを組み合わせた標準パターン系列と音声との間の第2の類似度(生起率とも言う)を求める。 Therefore, a second similarity between the processing in parallel with the standard patterns and the standard pattern sequence and voice that combines standard pattern of the second set for example names of the departments to select the best candidate from the first set ( seek also referred to) and the occurrence rate. 部署の認識候補が定まると、この認識候補に関連する第2の類似度を選び出し、第2の類似度を第1の類似度とみなして第3番目の集合たとえば接尾語を含めた標準パターン系列の第2の類似度を求めることによって、連続音声の認識候補が限定されて行く。 When a recognition candidate of the department determined, picks the second degree of similarity associated with the recognition candidate, a standard pattern sequence including a third set for example suffix a second similarity is regarded as the first degree of similarity by finding a second degree of similarity, the recognition candidates continuous speech goes limited.

【0026】 [0026]

【実施例】以下、図面を参照して本発明実施例を詳細に説明する。 EXAMPLES Hereinafter, with reference to the drawings illustrating the present invention examples in detail.

【0027】<第1実施例>電話交換機に用いる音声認識装置の照合回路(図6参照)の具体的な回路構成を図2に示す。 [0027] Figure 2 shows a specific circuit configuration of the matching circuit of the speech recognition device used in the <First embodiment> telephone exchange (see FIG. 6).

【0028】演算装置10は第1Aのデジタル演算プロセッサ(DSP)10Aと第1Bのデジタル演算プロセッサ10Bから構成される。 The arithmetic unit 10 consists of digital arithmetic processor 10B of the digital processors (DSP) 10A and a second 1B of the 1A. 演算装置10は、不図示のメモリに格納された標準単語パターンと送話者の連続音声の中から抽出されたパラメータ系列との照合を行って、1以上の認識候補を設定して、類似度と共に後述の第2DSP30に送る。 Arithmetic unit 10 performs the matching of the extracted parameter sequence from the talker continuous speech with a standard word pattern stored in a memory (not shown), by setting one or more of the recognition candidate, the similarity and it sends to the 2DSP30 described below. 照合時の類似度の計算においては、第1の演算装置10は後述の第2DSP30から引き渡された選択された最適な単語の類似度とそれに連結する単語の類似度を累積する。 In the calculation of the similarity of the time of verification, the first arithmetic unit 10 accumulates the similarity of words connected thereto and similarity optimal word selected was handed over from the first 2DSP30 below.

【0029】第1A DSP10Aおよび第1B DS [0029] The 1A DSP10A and the 1B DS
P10Bは演算装置10の処理を分担して実行する。 P10B is shared and executed by the process of the arithmetic unit 10.

【0030】第2のDSP30は、演算装置10から出力される単語認識候補およびその単語の類似度を転送制御手段20を介して順次に受信し、上記類似度に基づき最適な単語候補を選択し、演算装置10に引渡す。 The second DSP30 is a word recognition candidates and similarity of the word is output from the arithmetic unit 10 receives sequentially through the transfer control means 20, to select the best word candidate based on the degree of similarity and it passes to the arithmetic unit 10. 転送制御装置20では、バッファ22A〜22D,23A〜 The transfer controller 20, a buffer 22A to 22D,. 23A to
23Bに対してCPU21が転送データを読み/書きすることにより2つのDSP間のデータ転送に関する制御を行なう。 CPU21 performs control relating to data transfer between the two DSP by read / write transfer data to 23B.

【0031】本実施例の特徴の一部をなす標準パターンの格納内容を図1を参照して説明する。 [0031] The contents stored in the standard pattern forming part of the features of this embodiment will be described with reference to FIG.

【0032】本実施例では標準パターンを大分類,中分類,小分類に分類分けしてメモリ100に格納する。 [0032] In this embodiment the major classification standard pattern, middle class, stored in the memory 100 and classified into subcategories. より具体的には、大分類の標準パターンは部署に関する標準パターンである。 More specifically, the standard pattern of the major classification is a standard pattern for division.

【0033】図1の例では大分類の標準パターンとして片仮名で内容を表記すると、“ソウムノ”および“ジンジノ”の標準パターンが用意されていることを示している。 In the example of FIG. 1 shows that the standard pattern would be written contents in katakana as the standard pattern of the major classification, "Soumuno" and "Jinjino" are prepared.

【0034】次に、中分類の標準として大分類の部署に属する人名に関する標準パターンを収納する。 [0034] Next, to accommodate the standard pattern for the person's name that belongs as a standard of the middle classification in large classification of the department. 図3の例ではたとえば大分類“ソウムノ”に属する中分類に関して4つの人名に関する標準パターンが存在していることを示している。 In the example of FIG. 3 shows that the standard pattern exists for the four names with respect to middle classification belonging to the large classification "Soumuno" example.

【0035】小分類の標準パターンとしては、人名の単語に接続する単語について本例では要件の標準パターンを分類する。 [0035] as a standard pattern of the small classification is for the word to be connected to the word names in this example classifies the standard pattern requirements. 図1の例では、たとえば中分類“スズキサンハ”に対して接続可能な小分類の単語として“イラッシャイマスカ”と“オラレマスカ”等が用意されていることを示す。 In the example of FIG. 1, indicating that the "Welcome masker" and "Oraremasuka" such as words connectable subcategories are prepared for middle classification "Suzukisanha" example.

【0036】このようにパターン照合に用いる標準パターンを単語の種類毎に関連付けることにより、本実施例では関係のないパターン照合をなくし、音声認識処理の短縮化を図る。 [0036] By associating this way the standard pattern used in the pattern matching for each type of word, eliminating pattern matching not relevant in the present embodiment, to shorten the speech recognition process.

【0037】以上のような分類の相互の関連を知るために、大分類の標準パターンに関連する中分類の標準パターンを格納アドレスで示すテーブル110と中分類の標準パターンに関連する小分類の標準パターンとを格納アドレスで示すテーブル120とを用意している(図1参照)。 [0037] In order to know the related mutual above classification, small classification standards related to the standard pattern of the medium category and table 110 showing a standard pattern of classified storage address in associated with the standard pattern of the large classification It is prepared and a table 120 showing the pattern storage address (see FIG. 1).

【0038】演算装置10は、入力パターンをローマ字で表記するとSOUMUNO,SUZUKISANH The arithmetic unit 10, when referred to the input pattern in romaji SOUMUNO, SUZUKISANH
A,IRASSHAIMASUKAに対して順次に単語認識を行なう。 A, in order to carry out the word recognition against IRASSHAIMASUKA. まず、演算装置10の第1A DSP1 First, 1A DSP 1 arithmetic unit 10
0Aは入力パターンSOUMUNOと大分類の標準パターン“ソウムノ”“ジンジノ”…との照合を行なって、 0A is carried out verification of the standard pattern of the input pattern SOUMUNO and the large classification "Soumuno" "Jinjino" ...,
第1候補としてのソウムノに対して類似度80,第2候補としての“ジンジノ”に対して類似度10,他の候補に対しては類似度0が得られたとする。 Similarity 80 against Soumuno as the first candidate for the similarity 10, another candidate for the "Jinjino" as the second candidate to the similarity 0 was obtained.

【0039】第1A DSP10Aは転送制御回路を介して第2DSP30へ全ての候補単語のラベルおよび類似度を第2DSP30へ転送する。 [0039] The 1A DSP10A transfers labels and similarity of all candidate words to the first 2DSP30 via the transfer control circuit to the first 2DSP30. このとき、第1AのDSP10Aが照合する標準パターンは図1に示すメモリ100のアドレスA0〜ALの大分類パターン領域のパターンのみである。 In this case, standard patterns DSP10A of the 1A collates is only the pattern of major classification pattern area address A0~AL the memory 100 shown in FIG.

【0040】第2DSPは第1A DSP10Aから送られた類似度に基づいて高い類似度を持つ単語ラベルを複数選択する。 [0040] The 2DSP to select multiple words label with a high degree of similarity based on the degree of similarity transmitted from the 1A DSP10A. 例えば“ソウムノ”と“ジンジノ”を選択し、“ソウムノ”を第1A DSP10Aに、“ジンジノ”を第1B DSP10Bへ類似度込みでそれぞれ送り出す。 For example, select "Soumuno" and "Jinjino", the "Soumuno" to a 1A DSP10A, sends "Jinjino" respectively inclusive similarity to the first 1B DSP10B.

【0041】次に演算装置10の第1A DSP10A [0041] the next arithmetic unit 10 first 1A DSP10A
では次の入力パターンSUZUKISANHAと照合する中分類の標準パターンを決定する。 In determining the standard pattern classification in to match the next input pattern SUZUKISANHA. すなわち、第2D That is, the 2D
SPより送られた第1候補単語“ソウムノ”に関連する中分類の標準パターンを図1のテーブル110により見つけ出し、図1のメモリ100のB1〜BNに格納の標準パターン、すなわち、大分類“ソウムノ”に属する中分類の人名単語パターンと照合(類似度計算)する。 The standard pattern of the middle classification associated with the first candidate word "Soumuno" sent from the SP finds the table 110 of FIG. 1, the standard pattern stored in the B1~BN memory 100 of FIG. 1, i.e., the large classification "Soumuno a personal name word pattern classification in belonging to "match (similarity calculation). 第1AのDSP10Aは類似度がしきい値以上を持つ単語候補を選択すると、転送制御回路20を介して第2DS When DSP10A of the 1A is similarity to select a word candidate having the above threshold, the through transfer control circuit 20 2DS
P30へ転送する。 And transfers it to the P30.

【0042】同様に、第1B DSP10Bでは、第2 [0042] Similarly, in the 1B DSP10B, second
DSPより送られたジンジノに関連する中分類の標準パターン(図1のメモリ100のアドレスC1〜CMの標準パターン)と照合を行なう。 Standard pattern classification in associated Jinjino sent from DSP performs a matching (standard pattern address C1~CM memory 100 of FIG. 1). 照合の結果として一定の類似度を有する標準パターンおよびその類似度が第2D Standard patterns and the degree of similarity is the 2D have certain similarities as a result of the collation
SP30へ転送される。 It is transferred to the SP30.

【0043】第1A DSP10Aおよび第1B DS [0043] The 1A DSP10A and the second 1B DS
P10Bでは第2DSPから転送された大分類の候補単語の類似度に中分類の候補単語の類度を累積し、その結果を第2DSPへ転送する。 Accumulating the candidate word classes of the middle classification in P10B from the 2DSP similarity of the candidate word transferred rough classification, and transfers the result to second 2DSP. なお、この累積計算に用いられる類似度は相互に関連のある大分類および中分類についての類似度である。 Incidentally, the similarity used in the cumulative calculation is similarity of major classification and middle classification of interrelated. この累積結果の一例を図3に示している。 It shows an example of the accumulation result in FIG. 第2DSP30は第1A DSP10Aおよび第1B DSP10Bから送られた累積結果の中で最高値を有する累積結果に対応の中分類の候補単語(図3 The 2DSP30 Part 1A DSP10A and candidate word classification in the corresponding accumulation result having the highest value among the first 1B accumulation result sent from DSP10B (Figure 3
の例では“スズキサンオ”を検出する。 In the example to detect the "Suzukisan'o". 次にこの中分類に関連する大分類の単語(図3の例のソウムノ)を部署に関する最適候補単語として決定する。 Then determines the words in rough classification (Soumuno example of FIG. 3) associated with the classification herein as the best candidate words about department.

【0044】第2DSP30は、この決定結果を演算装置10側に転送する。 [0044] The 2DSP30 transfers the determination result to the arithmetic unit 10 side. 演算装置10側では、上記決定結果に基づき、“ソウムノ”に関連する小分類の標準パターンと3番目の入力パターン“IRASSHAIMAS The arithmetic unit 10 side, based on the determined result, "Soumuno" standard pattern and the third input pattern of the relevant sub-classified as "IRASSHAIMAS
UKA”と照合を行なうことになる。より具体的には、 UKA "and would perform verification. More specifically,
まず、“ソウム”のに関連する中分類の候補単語“スズキサンハ”に属する小分類の2つの標準パターンが図1 First, the two standard patterns of small classification belonging to the candidate word "Suzukisanha" classification among related to "bilateral" Figure 1
のテーブル120に基づき、メモリ100から読み出され、入力パターンと照合される。 Based on the table 120, read from the memory 100, it is collated with the input pattern. 同様に、中分類の次の候補単語“スズキサンオ”に属する小分類の標準パターンが読出され、入力パターンと照合される(図3参照)。 Similarly, the standard pattern of the small classification belonging to the next candidate word "Suzukisan'o" middle classification is read and collated with the input pattern (see FIG. 3).

【0045】このような照合結果として得られた小分類についての候補単語および累積された類似度が演算装置10から第2DSP30へ送られる。 The candidate words and accumulated similarity for such verification resulting small classification is sent from the arithmetic unit 10 to the 2DSP30.

【0046】この累積結果の中で最高値を有する大分類の候補単語、中分類の候補単語および小分類の候補単語の組み合せ(最適パスと呼ばれる、図3の例では、“ソウムノ”“スズキサンハ”“イラッシャイマスカ”)を最適候補単語として選択し、最適候補単語列を回線接続回路(不図示)に引渡す。 [0046] The candidate words rough classification having the highest value among the accumulated results, called candidate word candidate words and small classification of middle classification combination (optimal path, in the example of FIG. 3, "Soumuno" "Suzukisanha" "Welcome masker") is selected as the best candidate words, it passes the best candidate word string in the line connection circuit (not shown).

【0047】回線接続回路では、部署および所属氏名に関する単語から接続すべき内部回線(第2の回線)を変換テーブル等を用いて選択し、認識対象の音声を取得した外部回線(第1の回線)と、選択の内部回線を接続する。 [0047] In line connection circuit, departments and internal lines to be connected from the word (the second line) selected using the conversion table concerning affiliation name, external line that has acquired the speech recognition target (first line ) and to connect the internal circuit of the selection.

【0048】外部回線から送られる送話者の接続依頼は、所属→人名→要件の順序で行われることが多い。 [0048] talker of the connection request sent from the external line are often performed in the order of affiliation → Author → requirements. そこで、本実施例では、単語の音声認識順も所属→人名→ Therefore, in the present embodiment, the words of the speech recognition order also belongs → Author →
要件の順で認識して行く。 Going to recognize in the order of requirements. また、認識に用いる標準パターンを認識対象の項目に限定するようにしたので、関連のない単語についての照合が行なわれず単語認識時間が短縮される。 Also, since to limit the standard pattern used for recognizing the entry of the recognition target, word recognition time verification is not performed for the word unrelated is shortened.

【0049】本実施例の他、次の例を実現できる。 [0049] Another embodiment can be realized in the following example.

【0050】1) 本実施例では、認識対象の音声の内容が、所属→人名→要件の順で並んでいることが必要である。 [0050] 1) In the present embodiment, the content of the speech to be recognized is, it is necessary that are arranged in the order of affiliation → Author → requirements. このために、電話交換機が外線から着信したときに、案内メッセージ、たとえば、“部署、氏名、用件の順でお話下さい”を送話者に送るとよい。 For this reason, when the phone exchange has arrived from an outside line, guidance message, for example, "department, name, in the order of business should talk" may send to the talker.

【0051】案内メッセージは音声合成器等で作成すればよく、案内メッセージの応答のための回路は周知回路を用いるとよい。 The guidance message may be created by voice synthesis or the like, a circuit for the response of the guidance message may be used well-known circuit.

【0052】2) 本実施例では演算処理装置10と第2DSP30の2つの演算処理手段の間で音声認識に関わるデータの授受を行なう。 [0052] 2) In the present embodiment transmits and receives data relating to speech recognition between the two computing means of the arithmetic processing unit 10 first 2DSP30. そこで、単語(フレーム) Therefore, the word (frame)
毎に2つの演算手段の処理を並行的に実行すると、音声認識処理を効率よく実行できる。 The processing of the two computing means when concurrently be executed, it can be executed efficiently speech recognition processing for each. この場合の演算処理装置10,転送制御装置20,第2DSP30の処理順序およびその処理の対象となったフレームの順を図4に示しておく。 Arithmetic processing unit 10 in this case, the transfer control unit 20, previously show the order of frames for which the 2DSP30 processing order and subject to the processing in FIG.

【0053】<第2実施例>第1実施例において演算装置10が実行するビタビ演算処理の内容を図5に示す。 [0053] <Second Embodiment> The contents of the Viterbi processing by the arithmetic unit 10 executes in the first embodiment shown in FIG.

【0054】本実施例では第1実施例と同様の入力音声の第1フレーム“SOUMUNO”に対しては従来と同様1フレーム周期で演算装置10がビタビ演算を実行し、各標準パターンについての類似度を計算する。 [0054] computing device 10 in this embodiment in the same one frame period and the conventional relative to the first frame "SOUMUNO" similar of the input speech and the first embodiment executes the Viterbi computation, similar for each standard pattern degree is calculated. この計算された類似度は第2DSP30に図8のような転送順序で転送される。 This calculated similarity is transferred in the transfer order as shown in FIG. 8 to the 2DSP30.

【0055】このとき、第1A DSP10A,第1B [0055] At this time, the 1A DSP10A, the 1B
DSP10Bは図1の大分類パターンを分担してビタビ演算する。 DSP10B the Viterbi operation by sharing a large classification pattern of FIG. これらDSP10A,10Bは1フレームに相当する大分類の標準パターンのビタビ演算を終了すると、従来と異なり次のフレーム周期(図5の時刻t− These DSP10A, when 10B ends the Viterbi calculation of the standard pattern of major classification corresponding to one frame, the conventional unlike the next frame period (in FIG. 5 times t-
2)で入力パターンの第2フレーム“SUZUKISA The second frame of the input pattern in the 2) "SUZUKISA
NHA”に対するビタビ演算を開始する。 To start the Viterbi operation on NHA ".

【0056】大分類の標準パターン“ソウムノ”に接続する中分類標準パターンは一義的に定まるので、第2フレームで中分類標準パターンについてビタビ演算を行う際は、第1フレームで既に計算されているビタビ演算結果を用いることができる。 [0056] Since the classification standard patterns in connecting to a standard pattern "Soumuno" large classification determined uniquely, when performing Viterbi operation for middle classification standard pattern in the second frame is already calculated in the first frame it can be used Viterbi calculation results. たとえば大分類の標準パターン“ソウムノ”に接続する中分類パターンは“スズキサンハ”,“スズキサンオ”等(図1参照)なので、これらの中分類の標準パターンのビタビ演算を開始するときには、“ソウム”についてのビタビ演算結果(最終セルの累積類似度)を数1式の初期値として用いる。 For example and the classification patterns in connecting to a standard pattern "Soumuno" large classification "Suzukisanha", "Suzukisan'o" etc. (see Fig. 1), when starting the Viterbi calculation of the standard pattern classification of these, the "bilateral" Viterbi calculation results (cumulative similarity last cell) used as the initial value of the equation (1).

【0057】このようにして、t−2〜t+1の複数のフレーム周期をかけて第2フレームについてのビタビ演算を行い、その結果が得られた時点(図8のt+3に相当)で第1フレームについての大分類の2つの最適候補結果“ソウムノ”,“ジンジノ”が得られるので、この2つの最適候補に関連する中分類の標準パターンについてのビタビ演算結果が(図8の時刻t+3)で第2DS [0057] In this way, it performs a Viterbi operation for the second frame over a plurality of frame period of t-2~t + 1, the first frame at the time the result is obtained (corresponding to t + 3 in FIG. 8) two best candidate result of the large classification for "Soumuno", since "Jinjino" is obtained, the Viterbi calculation result for the standard pattern of the middle classification associated with the two best candidates (time t + 3 in FIG. 8) 2DS
P30に転送開始される。 P30 is initiated transfer to. 以下、演算装置10では、決定された2つの中分類に接続する小分類の標準パターンを続行することになる。 Hereinafter, we will continue standard pattern of small classification to be connected to the arithmetic unit 10, two of which are determined classification.

【0058】以上、述べたように、第2実施例では時系列的な接続関係が明らかな標準パターン系列、たとえば大分類と中分類の標準パターンについてのビタビ演算を演算装置10で実行してしまい、大分類の標準パターンの候補が決定した後、その候補に関連する分類についてのビタビ演算結果のみを第2DSP30へ送る類似度として選択する。 [0058] Thus, as noted, will be executed by the operation unit 10 a Viterbi operation for the standard pattern in the second embodiment the time-series connection relationship is obvious standard pattern sequence, for example, the large classification and middle classification after the candidate standard pattern of the large classification determines, it selects as the similarity only send the Viterbi calculation results for the classification associated with the candidate to the first 2DSP30.

【0059】このような方法を用いることによって第2 [0059] The second by using such a method
実施例では中分類標準パターン以降のビタビ演算を複数フレーム周期で、連続的に実行するので、1フレーム周期で実行しなければならない従来例に比べて多数の標準パターンを用意できることになる。 A plurality frame period Viterbi calculation of middle classification standard pattern later in the embodiment, since the run continuously, will be able to prepare a number of standard patterns as compared with the prior art which must be executed in one frame period. また、第2DSP1 In addition, the 2DSP1
0へビタビ演算結果を転送するタイミングは従来例と同じタイミングであり、音声認識処理時間は同じままである。 Timing of transfer of Viterbi operation result to 0 is the same timing as the conventional example, the voice recognition processing time remains the same. 換言すると、従来例と同じ個数の標準パターンを用意するとフレーム周期を短くすることができる。 In other words, it is possible to shorten the frame period when preparing a standard pattern having the same number of the conventional example.

【0060】第2実施例では以下の例を実施できる。 [0060] In the second embodiment can implement the following examples.

【0061】1) 本実施例では全ての中分類標準パターンのビタビ演算結果が終了した時点で中分類の標準パターンの選択に供する中分類標準パターンを選択しているが、大分類の候補選択の応答が遅い場合には小分類の標準パターンまでのビタビ演算処理を実行してもよいこと勿論である。 [0061] 1) In the present embodiment selects the classification standard pattern among subjected to selection of standard patterns of middle classification when the Viterbi operation result is finished classification standard patterns of all, the candidate selection in the large classification If the response is slow, as a matter of course that may perform Viterbi processing to the reference pattern of the small classification.

【0062】2) 本実施例で用いた音声認識方法は電話交換機に限らず、定型の入力音声を認識する場合に適用でき、特に定型の複数の文章の中から発声に用いられた文章を認識する装置に好適である。 [0062] 2) the speech recognition method used in this embodiment is not limited to telephone exchange, can be applied to the case of recognizing the input speech of the standard, in particular recognizing the text used in the utterance from a plurality of sentences fixed it is suitable for devices that.

【0063】 [0063]

【発明の効果】以上、説明したように本発明によれば、 Effect of the Invention] According to the present invention, as described,
音声認識に際し、全ての標準パターンについて照合する必要がないので、音声認識処理時間が短縮され、その結果、電話交換処理も短縮される。 Upon speech recognition, there is no need to match all of the standard pattern, is shortened speech recognition processing time, as a result, the telephone exchange processing is shortened.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】第1実施例で用いる標準パターンの内容と相互関係を示す説明図である。 FIG. 1 is an explanatory diagram showing the interrelationship and contents of the standard pattern used in the first embodiment.

【図2】第1実施例の音声認識装置の照合回路の回路構成を示すブロック図である。 2 is a block diagram showing a circuit configuration of a matching circuit of a speech recognition apparatus of the first embodiment.

【図3】第1実施例の音声認識処理の内容を示す説明図である。 3 is an explanatory diagram showing the contents of the speech recognition process of the first embodiment.

【図4】第1実施例のデータ転送例を示す説明図である。 4 is an explanatory diagram showing the data transfer of the first embodiment.

【図5】第2実施例のビタビ演算処理順を示す説明図である。 5 is an explanatory diagram showing a Viterbi calculation processing order of the second embodiment.

【図6】従来の音声認識装置の概略構成を示すブロック図である。 6 is a block diagram showing a schematic configuration of a conventional speech recognition device.

【図7】従来のビタビ演算処理の順序を示す説明図である。 7 is an explanatory diagram showing the order of the conventional Viterbi processing.

【図8】従来のビタビ演算結果の転送タイミングを示す説明図である。 8 is an explanatory view showing the transfer timing of the conventional Viterbi calculation results.

【図9】従来の標準パターンを表わす確率モデルを示す説明図である。 9 is an explanatory diagram showing a probability model representing the conventional standard pattern.

【符号の説明】 DESCRIPTION OF SYMBOLS

10 演算(処理)装置 10A,10B,30 デジタル演算プロセッサ(DS 10 operation (processing) unit 10A, 10B, 30 digital arithmetic processor (DS
P) 20 転送制御装置 21 中央演算処理装置(CPU) P) 20 transfer control device 21 a central processing unit (CPU)

───────────────────────────────────────────────────── フロントページの続き (72)発明者 武田 一哉 東京都新宿区西新宿2丁目3番2号 国際 電信電話株式会社内 (72)発明者 黒岩 眞吾 東京都新宿区西新宿2丁目3番2号 国際 電信電話株式会社内 ────────────────────────────────────────────────── ─── of the front page continued (72) inventor Kazuya Takeda, Shinjuku-ku, Tokyo Nishi 2-chome No. 3 No. 2 International telegraph and telephone within Co., Ltd. (72) inventor Kuroiwa Shingo, Shinjuku-ku, Tokyo Nishi 2-chome 3 No. 2 International Patent telegraph and telephone in the Corporation

Claims (4)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 第1の回線で伝送される音声を認識し、 1. A recognizes a voice that is transmitted in the first line,
    その認識結果の示す内容を分析することにより、前記第1の回線を第2の回線に選択接続する電話交換機の接続方法において、 音声認識に用いる標準パターンを、音声の示す種類内容毎に記憶しておき、 前記音声の示す内容を前記種類毎に予め定めた順序で発声させ、 前記第1の回線で伝送される音声を認識する際には、前記予め定めた順序に従って、前記種類毎に、その種類に対応する前記標準パターンを用いて音声認識することを特徴とする電話交換機の接続方法。 By analyzing the contents indicated by the recognition result, the method for connecting telephone switch for selective connection of the first line to the second line, a standard pattern used for speech recognition, and stores for each type content indicated by the voice advance, the contents indicated by the voice is uttered in a predetermined order for each of the types, in recognizing the sound to be transmitted in the first line, in the order in which the predetermined, for each of the types, connection of the telephone exchange, characterized in that the speech recognition using the standard pattern corresponding to the type.
  2. 【請求項2】 前記種類内容は、部署、人名であって、 当該部署、および人名に相互関連性を持たせ、前記部署に関する音声内容が認識された場合は、前記人名に関する標準パターンの中の、前記部署に関する認識結果に対応する人名についての標準パターンを、前記人名についての音声認識に用いることを特徴とする請求項1に記載の電話交換機の接続方法。 Wherein said type content, department, a person's name, the department, and to have a mutual relationship in names, if audio content related to the department is recognized, in the standard pattern for the names method of connecting a telephone exchange according to claim 1, the standard pattern for personal names corresponding to the recognized result for the department, is characterized by using the speech recognition of the person's name.
  3. 【請求項3】 同時刻に音声として発声する可能性のある複数の標準パターンを1つの集合としてまとめ標準パターンの時系列的な複数の集合を予め作成しておき、 集合間の標準パターン同士の接続関係を予め定めておき、 連続音声の認識を行う際には、最初の集合の中の各標準パターンと前記連続音声との間の第1の類似度を求め、 該第1の類似度により前記最初の集合の中から音声の認識結果とする標準パターンの候補を選択している間に前記接続関係に基づき、前記最初の集合の標準パターンおよび隣接する集合の標準パターンを接続した標準パターン系列と、連続音声との第2の類似度を求め、 前記第1の類似度により選択された標準パターンの候補に関連する前記第2の類似度を選択し、 以後、当該選択された第2の類似度を前 3. Leave creating series a plurality of sets when Summary standard pattern a plurality of standard patterns as one set that may be uttered as a voice at the same time advance, the standard patterns of the inter-set is determined in advance the connection relationship in advance, when performing recognition of continuous speech, the first search of similarity, first similarity between the continuous speech and the standard pattern in the first set based on the connection relationship while selecting the candidate of the standard patterns as a recognition result of the speech from among the first set, said first reference pattern and the reference pattern sequence standard pattern connected adjacent sets of sets When obtains the second degree of similarity between the continuous speech, then selects the second degree of similarity associated with the candidate of the standard pattern selected by said first similarity, thereafter, a second, which is the selected before the similarity 第1の類似度とみなして、該第1の類似度により複数の集合それぞれの音声認識候補を限定して行くことを特徴とする音声認識方法。 Speech recognition method characterized in that is regarded as the first degree of similarity, go to define a plurality of sets each of the speech recognition candidate by the similarity of the first.
  4. 【請求項4】 前記時系列的な複数の集合は前記部署に関する標準パターンの集合および前記人名に関する標準パターンの集合であって、請求項4に記載の音声認識方法により前記部署についての標準パターンの認識候補および人名に関する認識候補を選択することを特徴とする請求項2に記載の電話交換機の接続方法。 Wherein the said time-series a plurality of sets in a set of standard patterns for a set, and the names of standard patterns for the division, the standard pattern for the department by the voice recognition method according to claim 4 connection of the telephone exchange according to claim 2, characterized in that selecting a recognition candidate on the recognition candidates and names.
JP739593A 1993-01-20 1993-01-20 Connecting method of telephone exchange and voice recognition method Pending JPH06214590A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP739593A JPH06214590A (en) 1993-01-20 1993-01-20 Connecting method of telephone exchange and voice recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP739593A JPH06214590A (en) 1993-01-20 1993-01-20 Connecting method of telephone exchange and voice recognition method

Publications (1)

Publication Number Publication Date
JPH06214590A true true JPH06214590A (en) 1994-08-05

Family

ID=11664723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP739593A Pending JPH06214590A (en) 1993-01-20 1993-01-20 Connecting method of telephone exchange and voice recognition method

Country Status (1)

Country Link
JP (1) JPH06214590A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6298325B1 (en) 1997-08-08 2001-10-02 Fujitsu Limited Speech recognition system for sequence data
JP2006301102A (en) * 2005-04-18 2006-11-02 Mitsubishi Electric Corp Voice recognition device and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0225897A (en) * 1988-07-14 1990-01-29 Ricoh Co Ltd Voice dialing device
JPH0345840A (en) * 1989-07-12 1991-02-27 Matsushita Electric Ind Co Ltd Outdoor device in air conditioning equipment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0225897A (en) * 1988-07-14 1990-01-29 Ricoh Co Ltd Voice dialing device
JPH0345840A (en) * 1989-07-12 1991-02-27 Matsushita Electric Ind Co Ltd Outdoor device in air conditioning equipment

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6298325B1 (en) 1997-08-08 2001-10-02 Fujitsu Limited Speech recognition system for sequence data
JP2006301102A (en) * 2005-04-18 2006-11-02 Mitsubishi Electric Corp Voice recognition device and program

Similar Documents

Publication Publication Date Title
US7263488B2 (en) Method and apparatus for identifying prosodic word boundaries
US5602960A (en) Continuous mandarin chinese speech recognition system having an integrated tone classifier
US5524169A (en) Method and system for location-specific speech recognition
US7072835B2 (en) Method and apparatus for speech recognition
US20030195739A1 (en) Grammar update system and method
US7043422B2 (en) Method and apparatus for distribution-based language model adaptation
US6839667B2 (en) Method of speech recognition by presenting N-best word candidates
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US5388183A (en) Speech recognition providing multiple outputs
US5680510A (en) System and method for generating and using context dependent sub-syllable models to recognize a tonal language
US20060080098A1 (en) Apparatus and method for speech processing using paralinguistic information in vector form
US20020147581A1 (en) Method and apparatus for performing prosody-based endpointing of a speech signal
US20100082326A1 (en) System and method for enriching spoken language translation with prosodic information
JP2004523004A (en) Hierarchical language models
US7401019B2 (en) Phonetic fragment search in speech data
US5987409A (en) Method of and apparatus for deriving a plurality of sequences of words from a speech signal
US20020184016A1 (en) Method of speech recognition using empirically determined word candidates
US20050197838A1 (en) Method for text-to-pronunciation conversion capable of increasing the accuracy by re-scoring graphemes likely to be tagged erroneously
US7143035B2 (en) Methods and apparatus for generating dialog state conditioned language models
US20100100380A1 (en) Multitask Learning for Spoken Language Understanding
Daland et al. Learning diphone‐based segmentation
US20080294433A1 (en) Automatic Text-Speech Mapping Tool
JP2003140691A (en) Voice recognition device
JPH08248971A (en) Text reading aloud and reading device
JP2003186494A (en) Voice recognition device and method, recording medium and program