JPS63173100A - Keyword extractor - Google Patents
Keyword extractorInfo
- Publication number
- JPS63173100A JPS63173100A JP62006724A JP672487A JPS63173100A JP S63173100 A JPS63173100 A JP S63173100A JP 62006724 A JP62006724 A JP 62006724A JP 672487 A JP672487 A JP 672487A JP S63173100 A JPS63173100 A JP S63173100A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- pitch
- matching
- keywords
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 3
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- NCEXYHBECQHGNR-UHFFFAOYSA-N chembl421 Chemical compound C1=C(O)C(C(=O)O)=CC(N=NC=2C=CC(=CC=2)S(=O)(=O)NC=2N=CC=CC=2)=C1 NCEXYHBECQHGNR-UHFFFAOYSA-N 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は連続発声された音声からキーワードを抽出する
装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a device for extracting keywords from continuously uttered speech.
太閤が話を聞く場合には”話題”を推定することにより
、相手の発声内容を予測していると考えられる。音声認
識装置においても話題が推定できれば、発声内容の予測
までは出来なくとも、複数の単語セットの中からその話
題にあった単語セットを選択することで単語の予備選択
を行うことができるので、高い認識率の認識装置が実現
できる。When Taiko listens to a conversation, it is thought to predict the content of the other person's utterances by estimating the ``topic''. If the speech recognition device can also estimate the topic, even if it is not possible to predict the content of the utterance, it will be possible to make a preliminary selection of words by selecting a word set that matches the topic from among multiple word sets. A recognition device with a high recognition rate can be realized.
話題を推定するためには文中に話題を特定できるような
単語(以降この様な単語をキーワードと呼ぶ)を検出す
れば良い。In order to estimate the topic, it is sufficient to detect words (hereinafter such words will be referred to as keywords) that can specify the topic in the sentence.
文中のある特定の単語を検出して位置決めを行う技術は
ワードスポツティングと呼ばれる。ワードスポツティン
グの方法としては連続DP法(”・連続DPを用いた連
続単語認識”岡 隆−1音声研究会資料578−20)
が知られている。第2因に連続DP法の例を示す、同図
において、11は連続発声された入力音声のパターン、
12はキーワードのパターン、13は連続DPの結果得
られるキーワードパターンと入力音声パターンの間の距
離、14はマツチング平面を示す、連続DP法では定め
られた閾値以下の距離を与える点から、マツチング千回
14上のパスを逆にたどることによってワードスポツテ
ィングを行うことができる。The technology for detecting and positioning specific words in a sentence is called word spotting. The method for word spotting is the continuous DP method ("Continuous word recognition using continuous DP" Takashi Oka-1 Speech Research Group Material 578-20)
It has been known. The second factor shows an example of the continuous DP method. In the figure, 11 is a pattern of continuously uttered input speech,
12 is the keyword pattern, 13 is the distance between the keyword pattern obtained as a result of continuous DP and the input speech pattern, and 14 is the matching plane. Word spotting can be done by retracing the path above step 14.
しかし、連続DP法では入力の1フレームごとに距離計
算が行われるため計算量が多い、そこで文中でキーワー
ドのある区間を特定できれば計算量を削減することがで
き、効率よくキーワードを捜すことができる。However, in the continuous DP method, distance calculation is performed for each frame of input, which requires a large amount of calculation. Therefore, if the section in which a keyword is located in a sentence can be identified, the amount of calculation can be reduced and keywords can be searched efficiently. .
本発明のキーワード抽出装置は連続発声された入力音声
からピッチ情報を抽出するピッチ抽出手段と、話題を推
定するためのキーワードの標準パターンと前記キーワー
ドが強調されたことを示すピッチ変化パターンとを記憶
する記憶手段と、前記ピッチ情報と前記ピッチ変化パタ
ーンとを比較し前記キーワードが含まれる区間を抽出す
る区間抽出手段と、前記入力音声を特徴ベクトルの系列
に変換する特徴抽出手段と、前記抽出された区間におい
て前記標準パターンとのマツチングを行うマツチング手
段と、前記マツチングの結果から前記キーワードを決定
する決定手段とを備える。The keyword extraction device of the present invention stores pitch extraction means for extracting pitch information from continuously uttered input speech, a standard pattern of keywords for estimating a topic, and a pitch change pattern indicating that the keyword is emphasized. a storage means for comparing the pitch information and the pitch change pattern to extract a section including the keyword; a feature extraction means for converting the input speech into a sequence of feature vectors; and a determining means that determines the keyword from the result of the matching.
人間が文章を発声する場合には、伝達したい情報に関す
る単語が強調される。したがって、文中で強調されてい
る単語はその文の話題を特定する語、つまりキーワード
である場合が多いと考えられる。そこで文中において強
調されている部分を抽出できればキーワードを効率よく
捜すことができる0日本語においては、文中のある単語
が強調された場合にピッチパターンが変化することが報
告されている(”会話文章における基本周波数パターン
の制御規則について”岩1)相席、音声研究会資料58
5−42参照)、岩田はピッチパターンの変化は強調さ
れる単語および前後の単語のアクセント型(単語のどの
音節にアクセントがあるか)に依存すると述べているが
、基本的には強調される単語においてピッチが上昇する
。したがってピッチの変化パターンを捕らえることによ
り、文中で強調されている部分を抽出することができる
。When humans utter sentences, words related to the information they want to convey are emphasized. Therefore, it is considered that the words emphasized in a sentence are often words that specify the topic of the sentence, that is, keywords. Therefore, if you can extract the emphasized parts of a sentence, you can search for keywords efficiently. In Japanese, it has been reported that the pitch pattern changes when a certain word in a sentence is emphasized ("Conversation Sentences"). Regarding the control rules for fundamental frequency patterns in ``Iwa 1) Aiseki, Speech Study Group Material 58
5-42), Iwata states that changes in pitch patterns depend on the word being emphasized and the accent type of the words before and after (which syllable of the word is accented), but basically Pitch rises in words. Therefore, by capturing the pitch change pattern, it is possible to extract the emphasized part of the sentence.
次に、本発明の実施例について図面を参照して説明する
。Next, embodiments of the present invention will be described with reference to the drawings.
第1図は本発明の一実施例を示す構成図である。FIG. 1 is a block diagram showing an embodiment of the present invention.
また、第3図、第4図及び第5図は本発明の一実施例の
動作を説明するための図である。Further, FIGS. 3, 4, and 5 are diagrams for explaining the operation of an embodiment of the present invention.
各図を参照すると、あらかじめキーワードの標準パター
ンと各キーワードが強調されたことを示すピッチの変化
パターンとをキーワード辞書(記憶部)3に登録してお
く、標準パターンである特徴パラメータはバンドパスフ
ィルタの出力、メルケプストラム係数等の直接音響的な
特徴を示すものに限らず、ベクトル量子化等によってシ
ンボル化されたパターンでも良い、キーワードは各話題
について1つ以上登録するものとする。いま、話題”時
節”のキーワードを一つとして”今日”が登録されてお
り、”今日”のピッチパターンは強調を受けると上昇す
るということが記憶されているものとする。第3図(a
>は入力音声”今日はとてもよい天気です”のエネルギ
ーを示す、音声が入力されるとまずピッチ抽出部1にお
いてピッチが抽出される。ピッチ抽出の方法としては様
々な方法が利用できる1例えば、線形予測分析の誤差信
号の自己相関から求める方法である。第3図(b)はピ
ッチ抽出の結果であり、実線は単語”今日”を強調しな
いで発声した場合、かつ点線は強調して発声した場合で
ある。したがって”今日は”においてピッチが上がって
いる0次に、区間抽出部2は抽出されたピッチの変化パ
ターンをキーワード辞書3に登録されている”今日”の
ピッチ変化パターンと比較し、ピッチの上昇している区
間、”今日は”をキーワード候補区間として抽出する0
次に、特徴抽出部4では入力音声の上記特徴パラメータ
を求める。マツチング部5はキーワード辞書3から”今
日”の標準パターンを取り出し、抽出されたキーワード
候補区間とのマツチングを行う、マツチングの手段とし
ては様々な方法が利用できる0例えば、上記連続DP法
である。Referring to each figure, a standard pattern of keywords and a pitch change pattern indicating that each keyword is emphasized are registered in advance in the keyword dictionary (storage unit) 3, and the characteristic parameters of the standard pattern are filtered by a bandpass filter. The keywords are not limited to those indicating direct acoustic features such as the output of , mel-cepstral coefficients, etc., but may also be patterns symbolized by vector quantization, etc. One or more keywords shall be registered for each topic. It is now assumed that "Today" is registered as one of the keywords of the topic "Season", and that it is remembered that the pitch pattern of "Today" rises when it is emphasized. Figure 3 (a
> indicates the energy of the input voice "It's very nice weather today." When the voice is input, the pitch is first extracted in the pitch extraction unit 1. Various methods can be used for pitch extraction. For example, there is a method of obtaining the pitch from autocorrelation of an error signal of linear predictive analysis. FIG. 3(b) shows the results of pitch extraction, where the solid line shows the case when the word "Today" is uttered without emphasis, and the dotted line shows the case when it is uttered with emphasis. Therefore, the interval extraction unit 2 compares the extracted pitch change pattern with the pitch change pattern of "Today" registered in the keyword dictionary 3, and detects the rise in pitch. 0 to extract “Today” as a keyword candidate interval.
Next, the feature extraction section 4 obtains the above-mentioned feature parameters of the input voice. The matching unit 5 extracts the standard pattern of "Today" from the keyword dictionary 3 and performs matching with the extracted keyword candidate section. Various methods can be used as a matching means, such as the continuous DP method described above.
第4図及び第5図は連続DP法によるマツチングの一例
である。第4図は第5図に示すキーワード候補区間21
と標準パターン22との連続DPの結果から得られる距
離である。決定部6はマツチングの結果、閾値αよりも
小さい値が得られればキーワード”今日”が存在すると
判断する。また、距離が最小値を取る時点をtとすると
、マツチング平面23上で終端が時点tを通るパスをた
どることでキーワード“今日”の位置を決定できる。FIGS. 4 and 5 are examples of matching using the continuous DP method. Figure 4 shows the keyword candidate section 21 shown in Figure 5.
This is the distance obtained from the result of continuous DP between the standard pattern 22 and the standard pattern 22. The determining unit 6 determines that the keyword "today" exists if a value smaller than the threshold α is obtained as a result of matching. Further, assuming that the time point at which the distance takes the minimum value is t, the position of the keyword "today" can be determined by tracing a path on the matching plane 23 whose end passes through time t.
以上のように本発明によれば、文中で強調されている区
間でキーワードの探索を行うことにより、計算量を削減
して効率よくキーワードを捜すことができる。したがっ
て、連続音声認識装置においては話題や場面の推定等に
利用でき、高精度の認識を行うことができる。As described above, according to the present invention, by searching for a keyword in the highlighted section in a sentence, the amount of calculation can be reduced and the keyword can be searched efficiently. Therefore, the continuous speech recognition device can be used for estimating topics and scenes, and can perform highly accurate recognition.
第1図は本発明の一実施例を示す構成図、第2図は従来
技術を説明する図、第3図、第4図及び第5図は本発明
の一実施例の動作を説明するための図である。
1・・・ピッチ抽出部、2・・・区間抽出部、3・・・
キーワード辞書、4・・・特徴抽出部、5・・・マツチ
ング部、6・・・決定部、21・・・キーワード候補区
間、22・・・標準パターン、23・・・マツチング平
面。
第 1 回FIG. 1 is a block diagram showing an embodiment of the present invention, FIG. 2 is a diagram for explaining the prior art, and FIGS. 3, 4, and 5 are for explaining the operation of an embodiment of the present invention. This is a diagram. 1... Pitch extractor, 2... Section extractor, 3...
Keyword dictionary, 4...Feature extraction unit, 5...Matching unit, 6...Determination unit, 21...Keyword candidate section, 22...Standard pattern, 23...Matching plane. 1st
Claims (1)
チ抽出手段と、話題を推定するためのキーワードの標準
パターンと前記キーワードが強調されたことを示すピッ
チ変化パターンとを記憶する記憶手段と、前記ピッチ情
報と前記ピッチ変化パターンとを比較し前記キーワード
が含まれる区間を抽出する区間抽出手段と、前記入力音
声を特徴ベクトルの系列に変換する特徴抽出手段と、前
記抽出された区間において前記標準パターンとのマッチ
ングを行うマッチング手段と、前記マッチングの結果か
ら前記キーワードを決定する決定手段とを備えることを
特徴とするキーワード抽出装置。pitch extraction means for extracting pitch information from continuously uttered input speech; storage means for storing a standard pattern of keywords for estimating a topic; and a pitch change pattern indicating that the keyword has been emphasized; a section extraction means for comparing information with the pitch change pattern and extracting a section including the keyword; a feature extraction means for converting the input voice into a series of feature vectors; What is claimed is: 1. A keyword extraction device comprising: a matching means for performing matching; and a determining means for determining the keyword from the result of the matching.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62006724A JPH0634193B2 (en) | 1987-01-13 | 1987-01-13 | Keyword extractor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62006724A JPH0634193B2 (en) | 1987-01-13 | 1987-01-13 | Keyword extractor |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63173100A true JPS63173100A (en) | 1988-07-16 |
JPH0634193B2 JPH0634193B2 (en) | 1994-05-02 |
Family
ID=11646202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62006724A Expired - Lifetime JPH0634193B2 (en) | 1987-01-13 | 1987-01-13 | Keyword extractor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0634193B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019124897A (en) * | 2018-01-19 | 2019-07-25 | 富士ゼロックス株式会社 | Speech analysis apparatus, speech analysis system, and program |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
-
1987
- 1987-01-13 JP JP62006724A patent/JPH0634193B2/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019124897A (en) * | 2018-01-19 | 2019-07-25 | 富士ゼロックス株式会社 | Speech analysis apparatus, speech analysis system, and program |
Also Published As
Publication number | Publication date |
---|---|
JPH0634193B2 (en) | 1994-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62217295A (en) | Voice recognition system | |
KR101122591B1 (en) | Apparatus and method for speech recognition by keyword recognition | |
JPS6138479B2 (en) | ||
JPS63173100A (en) | Keyword extractor | |
JP2813209B2 (en) | Large vocabulary speech recognition device | |
JP3061292B2 (en) | Accent phrase boundary detection device | |
JP3039453B2 (en) | Voice recognition device | |
JP2664136B2 (en) | Voice recognition device | |
JP2757356B2 (en) | Word speech recognition method and apparatus | |
JPS6131880B2 (en) | ||
JP3063855B2 (en) | Finding the minimum value of matching distance value in speech recognition | |
JPH10254478A (en) | Device and method for optimally voice manuscript | |
JP2594916B2 (en) | Voice recognition device | |
JP3033132B2 (en) | Language processor | |
JP2655637B2 (en) | Voice pattern matching method | |
JPH09212190A (en) | Speech recognition device and sentence recognition device | |
JP3473704B2 (en) | Voice recognition device | |
KR200208810Y1 (en) | Artificial Intelligence Information Search System using Voice Recognition Technology | |
JP2002341891A (en) | Speech recognition device and speech recognition method | |
JPH0695684A (en) | Sound recognizing system | |
JPS60159798A (en) | Voice recognition equipment | |
JPS63223694A (en) | Monosyllable registration/recognition system | |
JPS62111295A (en) | Voice recognition equipment | |
JPS6136798A (en) | Voice segmentation | |
JPH0689099A (en) | Continuous speech recognition method |