JPS63173100A - Keyword extractor - Google Patents

Keyword extractor

Info

Publication number
JPS63173100A
JPS63173100A JP62006724A JP672487A JPS63173100A JP S63173100 A JPS63173100 A JP S63173100A JP 62006724 A JP62006724 A JP 62006724A JP 672487 A JP672487 A JP 672487A JP S63173100 A JPS63173100 A JP S63173100A
Authority
JP
Japan
Prior art keywords
keyword
pitch
matching
keywords
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62006724A
Other languages
Japanese (ja)
Other versions
JPH0634193B2 (en
Inventor
浩明 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62006724A priority Critical patent/JPH0634193B2/en
Publication of JPS63173100A publication Critical patent/JPS63173100A/en
Publication of JPH0634193B2 publication Critical patent/JPH0634193B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は連続発声された音声からキーワードを抽出する
装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a device for extracting keywords from continuously uttered speech.

〔従来の技術〕[Conventional technology]

太閤が話を聞く場合には”話題”を推定することにより
、相手の発声内容を予測していると考えられる。音声認
識装置においても話題が推定できれば、発声内容の予測
までは出来なくとも、複数の単語セットの中からその話
題にあった単語セットを選択することで単語の予備選択
を行うことができるので、高い認識率の認識装置が実現
できる。
When Taiko listens to a conversation, it is thought to predict the content of the other person's utterances by estimating the ``topic''. If the speech recognition device can also estimate the topic, even if it is not possible to predict the content of the utterance, it will be possible to make a preliminary selection of words by selecting a word set that matches the topic from among multiple word sets. A recognition device with a high recognition rate can be realized.

話題を推定するためには文中に話題を特定できるような
単語(以降この様な単語をキーワードと呼ぶ)を検出す
れば良い。
In order to estimate the topic, it is sufficient to detect words (hereinafter such words will be referred to as keywords) that can specify the topic in the sentence.

文中のある特定の単語を検出して位置決めを行う技術は
ワードスポツティングと呼ばれる。ワードスポツティン
グの方法としては連続DP法(”・連続DPを用いた連
続単語認識”岡 隆−1音声研究会資料578−20)
が知られている。第2因に連続DP法の例を示す、同図
において、11は連続発声された入力音声のパターン、
12はキーワードのパターン、13は連続DPの結果得
られるキーワードパターンと入力音声パターンの間の距
離、14はマツチング平面を示す、連続DP法では定め
られた閾値以下の距離を与える点から、マツチング千回
14上のパスを逆にたどることによってワードスポツテ
ィングを行うことができる。
The technology for detecting and positioning specific words in a sentence is called word spotting. The method for word spotting is the continuous DP method ("Continuous word recognition using continuous DP" Takashi Oka-1 Speech Research Group Material 578-20)
It has been known. The second factor shows an example of the continuous DP method. In the figure, 11 is a pattern of continuously uttered input speech,
12 is the keyword pattern, 13 is the distance between the keyword pattern obtained as a result of continuous DP and the input speech pattern, and 14 is the matching plane. Word spotting can be done by retracing the path above step 14.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

しかし、連続DP法では入力の1フレームごとに距離計
算が行われるため計算量が多い、そこで文中でキーワー
ドのある区間を特定できれば計算量を削減することがで
き、効率よくキーワードを捜すことができる。
However, in the continuous DP method, distance calculation is performed for each frame of input, which requires a large amount of calculation. Therefore, if the section in which a keyword is located in a sentence can be identified, the amount of calculation can be reduced and keywords can be searched efficiently. .

〔問題点を解決するための手段〕[Means for solving problems]

本発明のキーワード抽出装置は連続発声された入力音声
からピッチ情報を抽出するピッチ抽出手段と、話題を推
定するためのキーワードの標準パターンと前記キーワー
ドが強調されたことを示すピッチ変化パターンとを記憶
する記憶手段と、前記ピッチ情報と前記ピッチ変化パタ
ーンとを比較し前記キーワードが含まれる区間を抽出す
る区間抽出手段と、前記入力音声を特徴ベクトルの系列
に変換する特徴抽出手段と、前記抽出された区間におい
て前記標準パターンとのマツチングを行うマツチング手
段と、前記マツチングの結果から前記キーワードを決定
する決定手段とを備える。
The keyword extraction device of the present invention stores pitch extraction means for extracting pitch information from continuously uttered input speech, a standard pattern of keywords for estimating a topic, and a pitch change pattern indicating that the keyword is emphasized. a storage means for comparing the pitch information and the pitch change pattern to extract a section including the keyword; a feature extraction means for converting the input speech into a sequence of feature vectors; and a determining means that determines the keyword from the result of the matching.

〔作用〕[Effect]

人間が文章を発声する場合には、伝達したい情報に関す
る単語が強調される。したがって、文中で強調されてい
る単語はその文の話題を特定する語、つまりキーワード
である場合が多いと考えられる。そこで文中において強
調されている部分を抽出できればキーワードを効率よく
捜すことができる0日本語においては、文中のある単語
が強調された場合にピッチパターンが変化することが報
告されている(”会話文章における基本周波数パターン
の制御規則について”岩1)相席、音声研究会資料58
5−42参照)、岩田はピッチパターンの変化は強調さ
れる単語および前後の単語のアクセント型(単語のどの
音節にアクセントがあるか)に依存すると述べているが
、基本的には強調される単語においてピッチが上昇する
。したがってピッチの変化パターンを捕らえることによ
り、文中で強調されている部分を抽出することができる
When humans utter sentences, words related to the information they want to convey are emphasized. Therefore, it is considered that the words emphasized in a sentence are often words that specify the topic of the sentence, that is, keywords. Therefore, if you can extract the emphasized parts of a sentence, you can search for keywords efficiently. In Japanese, it has been reported that the pitch pattern changes when a certain word in a sentence is emphasized ("Conversation Sentences"). Regarding the control rules for fundamental frequency patterns in ``Iwa 1) Aiseki, Speech Study Group Material 58
5-42), Iwata states that changes in pitch patterns depend on the word being emphasized and the accent type of the words before and after (which syllable of the word is accented), but basically Pitch rises in words. Therefore, by capturing the pitch change pattern, it is possible to extract the emphasized part of the sentence.

〔実施例〕〔Example〕

次に、本発明の実施例について図面を参照して説明する
Next, embodiments of the present invention will be described with reference to the drawings.

第1図は本発明の一実施例を示す構成図である。FIG. 1 is a block diagram showing an embodiment of the present invention.

また、第3図、第4図及び第5図は本発明の一実施例の
動作を説明するための図である。
Further, FIGS. 3, 4, and 5 are diagrams for explaining the operation of an embodiment of the present invention.

各図を参照すると、あらかじめキーワードの標準パター
ンと各キーワードが強調されたことを示すピッチの変化
パターンとをキーワード辞書(記憶部)3に登録してお
く、標準パターンである特徴パラメータはバンドパスフ
ィルタの出力、メルケプストラム係数等の直接音響的な
特徴を示すものに限らず、ベクトル量子化等によってシ
ンボル化されたパターンでも良い、キーワードは各話題
について1つ以上登録するものとする。いま、話題”時
節”のキーワードを一つとして”今日”が登録されてお
り、”今日”のピッチパターンは強調を受けると上昇す
るということが記憶されているものとする。第3図(a
>は入力音声”今日はとてもよい天気です”のエネルギ
ーを示す、音声が入力されるとまずピッチ抽出部1にお
いてピッチが抽出される。ピッチ抽出の方法としては様
々な方法が利用できる1例えば、線形予測分析の誤差信
号の自己相関から求める方法である。第3図(b)はピ
ッチ抽出の結果であり、実線は単語”今日”を強調しな
いで発声した場合、かつ点線は強調して発声した場合で
ある。したがって”今日は”においてピッチが上がって
いる0次に、区間抽出部2は抽出されたピッチの変化パ
ターンをキーワード辞書3に登録されている”今日”の
ピッチ変化パターンと比較し、ピッチの上昇している区
間、”今日は”をキーワード候補区間として抽出する0
次に、特徴抽出部4では入力音声の上記特徴パラメータ
を求める。マツチング部5はキーワード辞書3から”今
日”の標準パターンを取り出し、抽出されたキーワード
候補区間とのマツチングを行う、マツチングの手段とし
ては様々な方法が利用できる0例えば、上記連続DP法
である。
Referring to each figure, a standard pattern of keywords and a pitch change pattern indicating that each keyword is emphasized are registered in advance in the keyword dictionary (storage unit) 3, and the characteristic parameters of the standard pattern are filtered by a bandpass filter. The keywords are not limited to those indicating direct acoustic features such as the output of , mel-cepstral coefficients, etc., but may also be patterns symbolized by vector quantization, etc. One or more keywords shall be registered for each topic. It is now assumed that "Today" is registered as one of the keywords of the topic "Season", and that it is remembered that the pitch pattern of "Today" rises when it is emphasized. Figure 3 (a
> indicates the energy of the input voice "It's very nice weather today." When the voice is input, the pitch is first extracted in the pitch extraction unit 1. Various methods can be used for pitch extraction. For example, there is a method of obtaining the pitch from autocorrelation of an error signal of linear predictive analysis. FIG. 3(b) shows the results of pitch extraction, where the solid line shows the case when the word "Today" is uttered without emphasis, and the dotted line shows the case when it is uttered with emphasis. Therefore, the interval extraction unit 2 compares the extracted pitch change pattern with the pitch change pattern of "Today" registered in the keyword dictionary 3, and detects the rise in pitch. 0 to extract “Today” as a keyword candidate interval.
Next, the feature extraction section 4 obtains the above-mentioned feature parameters of the input voice. The matching unit 5 extracts the standard pattern of "Today" from the keyword dictionary 3 and performs matching with the extracted keyword candidate section. Various methods can be used as a matching means, such as the continuous DP method described above.

第4図及び第5図は連続DP法によるマツチングの一例
である。第4図は第5図に示すキーワード候補区間21
と標準パターン22との連続DPの結果から得られる距
離である。決定部6はマツチングの結果、閾値αよりも
小さい値が得られればキーワード”今日”が存在すると
判断する。また、距離が最小値を取る時点をtとすると
、マツチング平面23上で終端が時点tを通るパスをた
どることでキーワード“今日”の位置を決定できる。
FIGS. 4 and 5 are examples of matching using the continuous DP method. Figure 4 shows the keyword candidate section 21 shown in Figure 5.
This is the distance obtained from the result of continuous DP between the standard pattern 22 and the standard pattern 22. The determining unit 6 determines that the keyword "today" exists if a value smaller than the threshold α is obtained as a result of matching. Further, assuming that the time point at which the distance takes the minimum value is t, the position of the keyword "today" can be determined by tracing a path on the matching plane 23 whose end passes through time t.

〔発明の効果〕〔Effect of the invention〕

以上のように本発明によれば、文中で強調されている区
間でキーワードの探索を行うことにより、計算量を削減
して効率よくキーワードを捜すことができる。したがっ
て、連続音声認識装置においては話題や場面の推定等に
利用でき、高精度の認識を行うことができる。
As described above, according to the present invention, by searching for a keyword in the highlighted section in a sentence, the amount of calculation can be reduced and the keyword can be searched efficiently. Therefore, the continuous speech recognition device can be used for estimating topics and scenes, and can perform highly accurate recognition.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例を示す構成図、第2図は従来
技術を説明する図、第3図、第4図及び第5図は本発明
の一実施例の動作を説明するための図である。 1・・・ピッチ抽出部、2・・・区間抽出部、3・・・
キーワード辞書、4・・・特徴抽出部、5・・・マツチ
ング部、6・・・決定部、21・・・キーワード候補区
間、22・・・標準パターン、23・・・マツチング平
面。 第 1 回
FIG. 1 is a block diagram showing an embodiment of the present invention, FIG. 2 is a diagram for explaining the prior art, and FIGS. 3, 4, and 5 are for explaining the operation of an embodiment of the present invention. This is a diagram. 1... Pitch extractor, 2... Section extractor, 3...
Keyword dictionary, 4...Feature extraction unit, 5...Matching unit, 6...Determination unit, 21...Keyword candidate section, 22...Standard pattern, 23...Matching plane. 1st

Claims (1)

【特許請求の範囲】[Claims] 連続発声された入力音声からピッチ情報を抽出するピッ
チ抽出手段と、話題を推定するためのキーワードの標準
パターンと前記キーワードが強調されたことを示すピッ
チ変化パターンとを記憶する記憶手段と、前記ピッチ情
報と前記ピッチ変化パターンとを比較し前記キーワード
が含まれる区間を抽出する区間抽出手段と、前記入力音
声を特徴ベクトルの系列に変換する特徴抽出手段と、前
記抽出された区間において前記標準パターンとのマッチ
ングを行うマッチング手段と、前記マッチングの結果か
ら前記キーワードを決定する決定手段とを備えることを
特徴とするキーワード抽出装置。
pitch extraction means for extracting pitch information from continuously uttered input speech; storage means for storing a standard pattern of keywords for estimating a topic; and a pitch change pattern indicating that the keyword has been emphasized; a section extraction means for comparing information with the pitch change pattern and extracting a section including the keyword; a feature extraction means for converting the input voice into a series of feature vectors; What is claimed is: 1. A keyword extraction device comprising: a matching means for performing matching; and a determining means for determining the keyword from the result of the matching.
JP62006724A 1987-01-13 1987-01-13 Keyword extractor Expired - Lifetime JPH0634193B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62006724A JPH0634193B2 (en) 1987-01-13 1987-01-13 Keyword extractor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62006724A JPH0634193B2 (en) 1987-01-13 1987-01-13 Keyword extractor

Publications (2)

Publication Number Publication Date
JPS63173100A true JPS63173100A (en) 1988-07-16
JPH0634193B2 JPH0634193B2 (en) 1994-05-02

Family

ID=11646202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62006724A Expired - Lifetime JPH0634193B2 (en) 1987-01-13 1987-01-13 Keyword extractor

Country Status (1)

Country Link
JP (1) JPH0634193B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019124897A (en) * 2018-01-19 2019-07-25 富士ゼロックス株式会社 Speech analysis apparatus, speech analysis system, and program

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10311874B2 (en) 2017-09-01 2019-06-04 4Q Catalyst, LLC Methods and systems for voice-based programming of a voice-controlled device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019124897A (en) * 2018-01-19 2019-07-25 富士ゼロックス株式会社 Speech analysis apparatus, speech analysis system, and program

Also Published As

Publication number Publication date
JPH0634193B2 (en) 1994-05-02

Similar Documents

Publication Publication Date Title
JPS62217295A (en) Voice recognition system
KR101122591B1 (en) Apparatus and method for speech recognition by keyword recognition
JPS6138479B2 (en)
JPS63173100A (en) Keyword extractor
JP2813209B2 (en) Large vocabulary speech recognition device
JP3061292B2 (en) Accent phrase boundary detection device
JP3039453B2 (en) Voice recognition device
JP2664136B2 (en) Voice recognition device
JP2757356B2 (en) Word speech recognition method and apparatus
JPS6131880B2 (en)
JP3063855B2 (en) Finding the minimum value of matching distance value in speech recognition
JPH10254478A (en) Device and method for optimally voice manuscript
JP2594916B2 (en) Voice recognition device
JP3033132B2 (en) Language processor
JP2655637B2 (en) Voice pattern matching method
JPH09212190A (en) Speech recognition device and sentence recognition device
JP3473704B2 (en) Voice recognition device
KR200208810Y1 (en) Artificial Intelligence Information Search System using Voice Recognition Technology
JP2002341891A (en) Speech recognition device and speech recognition method
JPH0695684A (en) Sound recognizing system
JPS60159798A (en) Voice recognition equipment
JPS63223694A (en) Monosyllable registration/recognition system
JPS62111295A (en) Voice recognition equipment
JPS6136798A (en) Voice segmentation
JPH0689099A (en) Continuous speech recognition method