JP4941495B2 - User dictionary creation system, method, and program - Google Patents

User dictionary creation system, method, and program Download PDF

Info

Publication number
JP4941495B2
JP4941495B2 JP2009084096A JP2009084096A JP4941495B2 JP 4941495 B2 JP4941495 B2 JP 4941495B2 JP 2009084096 A JP2009084096 A JP 2009084096A JP 2009084096 A JP2009084096 A JP 2009084096A JP 4941495 B2 JP4941495 B2 JP 4941495B2
Authority
JP
Japan
Prior art keywords
word
registered
unknown
dictionary
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009084096A
Other languages
Japanese (ja)
Other versions
JP2010237351A (en
Inventor
敬子 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009084096A priority Critical patent/JP4941495B2/en
Publication of JP2010237351A publication Critical patent/JP2010237351A/en
Application granted granted Critical
Publication of JP4941495B2 publication Critical patent/JP4941495B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a system, a method, and a program for user dictionary registration for improving the efficiency of the registration while preventing the erroneous recognition when registering a new word into a user dictionary. <P>SOLUTION: The user dictionary preparing system includes a text inputting means 11 for inputting a character string, an unknown-word extracting means 22 for extracting an unknown word from the inputted character string, a similarity calculating means 32 for calculating similarity between the extracted unknown word and the registered word already registered in the dictionary, an environmental information extracting means 33 for extracting environmental information including the information of words in front and rear of the unknown word when the similarity exceeds a predetermined value, and a registering means 41 for registering the unknown word and the environmental information into the dictionary. <P>COPYRIGHT: (C)2011,JPO&amp;INPIT

Description

本発明は、ユーザ辞書作成システム、方法、及び、プログラムに関し、更に詳しくは、音声認識システムに好適に用いられるユーザ辞書作成システム、ユーザ辞書作成方法、及び、プログラムに関する。   The present invention relates to a user dictionary creation system, method, and program, and more particularly to a user dictionary creation system, a user dictionary creation method, and a program that are preferably used in a speech recognition system.

音声認識装置を利用して、音声で読み上げられた文章から文書を作成する音声認識システムが知られている。音声認識システムは、音声認識装置と、音声認識装置側で予め用意されている音声認識用辞書と、音声認識辞書に含まれていない単語をユーザ側で登録するためのユーザ辞書作成機能とを有する。   2. Description of the Related Art A voice recognition system that creates a document from a sentence read out by voice using a voice recognition device is known. The speech recognition system has a speech recognition device, a speech recognition dictionary prepared in advance on the speech recognition device side, and a user dictionary creation function for registering words not included in the speech recognition dictionary on the user side. .

ところで、音声認識用辞書で認識しない単語を、ユーザ辞書作成機能を利用して、その読みと形態素情報とを正しく付与して辞書に登録する作業は、ユーザに多大の負担を強いるという問題があった。また、音声認識辞書で認識しない単語を無条件に登録すると、同じ読みを含む単語や、類似する読みを持つ単語が既に辞書に登録されている場合には、双方の単語を区別することができなくなり、類似性の高い単語に誤って出力する誤認識を誘発するという問題もあった。   By the way, using a user dictionary creation function to register words that are not recognized by the speech recognition dictionary with the correct reading and morpheme information and registering them in the dictionary has the problem of imposing a heavy burden on the user. It was. In addition, if you unconditionally register a word that is not recognized by the speech recognition dictionary, you can distinguish both words if a word that contains the same reading or a word that has a similar reading is already registered in the dictionary. There was also a problem of inducing misrecognition that erroneously output words with high similarity.

特許文献1には、上記問題を解決するユーザ辞書作成システムが記載されている。図7は、このユーザ辞書作成システムのブロック図である。ユーザ辞書作成システムは、音声入力部701と、音声認識部702と、類似度算出部703と、辞書登録部704と、音声認識用辞書705と、ユーザ辞書706とから構成されている。ユーザ辞書作成システム700は次のように動作する。まず、予め単語音声を音声入力部701より入力し、音声認識部702において文字列に変換し、その文字列を音声認識用辞書705に登録しておく。ユーザが新しい単語を入力すると、類似度算出部703は、音声認識用辞書705と入力音声とを比較し、類似している場合には、ユーザ辞書706への登録を却下する。   Patent Document 1 describes a user dictionary creation system that solves the above problem. FIG. 7 is a block diagram of the user dictionary creation system. The user dictionary creation system includes a voice input unit 701, a voice recognition unit 702, a similarity calculation unit 703, a dictionary registration unit 704, a voice recognition dictionary 705, and a user dictionary 706. The user dictionary creation system 700 operates as follows. First, word speech is input in advance from the speech input unit 701, converted into a character string by the speech recognition unit 702, and the character string is registered in the speech recognition dictionary 705. When the user inputs a new word, the similarity calculation unit 703 compares the speech recognition dictionary 705 and the input speech, and if they are similar, rejects registration in the user dictionary 706.

特許文献1に記載のユーザ辞書作成システムでは、辞書内の単語と新たに登録しようとする単語との類似性を判定し、類似性が高い場合には、一律に登録できないという方式を採用している。しかし、この方式を採用すると、登録できない単語については、その認識率を改善することができなかった。   In the user dictionary creation system described in Patent Document 1, the similarity between a word in the dictionary and a word to be newly registered is determined, and if the similarity is high, a system that cannot be uniformly registered is adopted. Yes. However, when this method is adopted, the recognition rate of words that cannot be registered cannot be improved.

特許文献2には、辞書作成時に、登録したい単語と識別させたい単語の音声パターンを比較し、類似していることが判明すると、ユーザに誤認識をする可能性がある旨を提示するユーザ辞書作成システムが記載されている。ユーザは、問い合わせを受けると、その単語の登録の可否を判断する。この方法では、特許文献1とは異なり、登録できない単語はなくなるが、ユーザの誤った判断に起因して、誤認識の発生が考えられる。   Patent Document 2 discloses a user dictionary that indicates that there is a possibility of misrecognition to a user when comparing a speech pattern of a word to be registered with a word to be identified and finding that they are similar when creating a dictionary. The creation system is described. When receiving the inquiry, the user determines whether or not the word can be registered. In this method, unlike Patent Document 1, there are no words that cannot be registered, but it is possible that erroneous recognition occurs due to an erroneous determination by the user.

特許文献3には、ユーザ辞書に登録したい単語と、既に登録されている単語との類似度を判定し、双方の単語の類似度が所定以上の場合には、個々のユーザが自身の辞書に登録するか否かを判断する辞書登録装置を有する音声認識システムが記載されている。このユーザ辞書作成システムでは、登録可と判断したユーザのID番号がその登録した単語と共に登録され、他のユーザにはその登録の効果を及ばない。このため、ユーザ各自の判断で登録が可能となり、また、他のユーザに誤認識を発生させるおそれが除かれる。   In Patent Document 3, the degree of similarity between a word to be registered in the user dictionary and a word that has already been registered is determined. A speech recognition system having a dictionary registration device for determining whether or not to register is described. In this user dictionary creation system, the ID number of the user determined to be registered is registered together with the registered word, and the effect of the registration is not exerted on other users. For this reason, registration becomes possible at the discretion of each user, and the possibility of causing misrecognition to other users is eliminated.

特許文献4には、ワードプロセッサにおいて、ユーザ辞書に登録したい単語に同音異義語があると、その登録したい単語の前後に付属する単語やその品詞などを付加して登録する旨が記載されている。   Patent Document 4 describes that, in a word processor, if a word to be registered in a user dictionary has a homonym, a word attached to the front and back of the word to be registered, its part of speech, and the like are registered.

特開平8−110790号公報JP-A-8-110790 特開平7−44188号公報Japanese Patent Laid-Open No. 7-44188 特開2000−259172号公報JP 2000-259172 A 特開平2−297247号公報JP-A-2-297247

特許文献3の音声認識システムでは、ユーザが登録した単語の効果はユーザ自身にのみ及ぶので、他のユーザに誤認識が発生する可能性がなくなる。しかし、ユーザがそれぞれ単独に同じ単語を登録する必要が生じ、ユーザ辞書作成における効率が低下する。   In the voice recognition system of Patent Document 3, the effect of the word registered by the user only affects the user himself / herself, so that there is no possibility that misrecognition occurs in other users. However, it is necessary for each user to register the same word independently, and the efficiency in creating the user dictionary is reduced.

また、特許文献4のワードプロセッサでは、同音異義語がある単語について、その前後に付属する単語やその品詞が付加されるものの、音声認識システムでは、誤認識が発生するのは、同音異義語の単語間ばかりではなく、同じような発音を有する単語間でも発生する。   In addition, in the word processor of Patent Document 4, although words attached to the front and back of words having homonyms are added and parts of speech thereof, in the speech recognition system, misrecognition is caused by words of homonyms. It occurs not only between words but also between words with similar pronunciation.

本発明は、上述の点に鑑み、新たな単語をユーザ辞書に登録する際に、誤認識の発生を回避しつつ且つ登録の効率が高いユーザ辞書登録システム、及び、そのようなユーザ辞書登録システムで用いられる辞書登録方法、及び、プログラムを提供することを目的とする。   In view of the above-described points, the present invention provides a user dictionary registration system that avoids the occurrence of misrecognition and has high registration efficiency when registering a new word in a user dictionary, and such a user dictionary registration system. An object of the present invention is to provide a dictionary registration method and a program used in the above.

本発明は、上記目的を達成するために、文字列を入力するテキスト入力手段と、入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、前記類似度が所定値以上のときに、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の品詞を示す環境情報を抽出する環境情報抽出手段と、前記類似度が所定値以上のときに、前記未知語及び前記環境情報抽出手段が抽出した環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システムを提供する。 To achieve the above object, the present invention provides a text input means for inputting a character string, an unknown word extraction means for extracting a word not registered in the dictionary from the input character string as an unknown word, and the extracted a similarity calculation means for calculating a similarity between the registered word already registered in the unknown word and dictionary, when the similarity is equal to or higher than the predetermined value, the unknown words surrounding text form in the character string Based on the analysis, the environment information extraction means for extracting environment information indicating the part of speech of the word before and after the unknown word, and the unknown word and the environment information extraction means when the similarity is equal to or greater than a predetermined value There is provided a user dictionary creation system comprising registration means for registering environmental information in a dictionary.

本発明のユーザ辞書作成システム、方法、及び、プログラムは、既知語との間で類似性が高い未知語を登録する際に、効率が高い登録を可能にしつつ、その後に未知語と既知語との間で発生しがちな誤認識を抑制できる効果がある。   The user dictionary creation system, method, and program according to the present invention enable an efficient registration when registering an unknown word having a high similarity with a known word, and thereafter, an unknown word and a known word are registered. It is possible to suppress misrecognition that tends to occur between

本発明の第1の実施形態に係るユーザ辞書作成システムを含む音声認識システムのブロック図。1 is a block diagram of a voice recognition system including a user dictionary creation system according to a first embodiment of the present invention. 本発明の第2の実施形態に係るユーザ辞書作成システムのブロック図。The block diagram of the user dictionary creation system which concerns on the 2nd Embodiment of this invention. 本発明の第3の実施形態に係るユーザ辞書作成システムのブロック図。The block diagram of the user dictionary creation system which concerns on the 3rd Embodiment of this invention. 本発明の第4の実施形態に係るユーザ辞書作成システムのブロック図。The block diagram of the user dictionary creation system which concerns on the 4th Embodiment of this invention. 類似語間で誤りが発生しやすい例を示すグラフ。A graph showing an example in which an error is likely to occur between similar words. 第1の実施形態で採用される登録例を示すグラフ。The graph which shows the registration example employ | adopted by 1st Embodiment. 特許文献1に記載のユーザ辞書作成システムのブロック図。The block diagram of the user dictionary creation system of patent document 1. FIG.

本発明の最小構成のユーザ辞書作成システムは、文字列を入力するテキスト入力手段と、入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、前記類似度が所定値以上のときに、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の品詞を示す環境情報を抽出する環境情報抽出手段と、前記類似度が所定値以上のときに、前記未知語及び前記環境情報抽出手段が抽出した環境情報を辞書に登録する登録手段と、を備える。 Minimum configuration user dictionary creation system of the present invention, the unknown word extracting means for extracting a text input means for inputting a character string, a word from the input string is not registered in the dictionary as unknown words, said extracted a similarity calculation means for calculating a similarity between the registered word already registered in the unknown word and dictionary, when the similarity is equal to or higher than the predetermined value, the unknown words surrounding text form in the character string based on the analysis, and environmental information extraction means for extracting environmental information indicating a before and after the word part of speech of the unknown word, when the similarity is equal to or greater than a predetermined value, the unknown word and the environmental information extracting means has extracted Registration means for registering environmental information in a dictionary.

本発明のユーザ辞書作成システムでは、辞書に既に登録されている登録語と所定の類似度以上の類似性を有する未知語が抽出されると、入力文字列中の未知語の前後の文章から未知語の環境情報を抽出し、その環境情報を未知語と共に辞書に登録する構成を採用する。本構成を採用することにより、その後の辞書参照の際に発生しがちな誤認識の発生を防止する。   In the user dictionary creation system of the present invention, when an unknown word having a similarity equal to or higher than a predetermined similarity with a registered word already registered in the dictionary is extracted, it is unknown from sentences before and after the unknown word in the input character string. A configuration is adopted in which environmental information of words is extracted and the environmental information is registered in a dictionary together with unknown words. By adopting this configuration, it is possible to prevent the occurrence of misrecognition that tends to occur when referring to the dictionary thereafter.

本発明のユーザ辞書作成システムでは、前記未知語の読みを決定する未知語読み付け手段を更に有する構成を採用できる。この場合、未知語を選択する際に、その判定が容易になる。また、実際に登録する際の処理も簡素化できる。   In the user dictionary creation system of the present invention, a configuration further including an unknown word reading means for determining reading of the unknown word can be adopted. In this case, when an unknown word is selected, the determination becomes easy. Also, the process for actual registration can be simplified.

本発明のユーザ辞書作成システムでは、入力された文字列から辞書に既に登録されている登録単語を抽出し、抽出した登録単語の環境情報が前記辞書に登録されていない場合に、前記登録単語の前後の文章の形態解析結果に基づいて前記登録単語の前後の単語の品詞を示す環境情報を抽出し、前記登録単語に前記抽出された環境情報を付加して前記登録単語を更新する登録単語抽出手段を更に有する構成を採用することが出来る。この場合、既に作成された辞書の登録語の認識率の向上が可能となる。 In the user dictionary creation system of the present invention, a registered word that is already registered in the dictionary is extracted from the input character string , and when the environment information of the extracted registered word is not registered in the dictionary, the registered word extracting environmental information indicating a before and after the word part of speech of the previous SL registered word on the basis of the morphological analysis results before and after the text, updating the registration word by adding the extracted environmental information to the registered words registered word It is possible to adopt a configuration that further includes an extracting means . In this case, it is possible to improve the recognition rate of the registered words in the already created dictionary.

本発明のユーザ辞書作成システムでは、前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報が抽出された前記未知語の前後の単語よりも前及び/又は後ろに1語ずつ多い単語から環境情報を抽出する構成を採用することが出来る。この場合には、新たに登録される未知語の環境情報をよりきめ細かに登録することで、誤認識の低減が可能になる。 In the user dictionary creation system of the present invention, the environmental information extracting unit, when the unknown word and the determined registered word to have a predetermined or more similarity already contains environmental information, the included environment information was is extracted In addition, it is possible to adopt a configuration in which environment information is extracted from words that are one word before and / or behind words before and after the unknown word . In this case, it is possible to reduce misrecognition by registering environment information of newly registered unknown words more finely.

以下、本発明の例示的な実施形態について図面を参照して詳細に説明する。図1は、本発明の第1の実施形態に係るユーザ辞書作成システムを含む音声認識システムを示している。ユーザ辞書作成システムは、テキスト入力部10と、入力したテキストに音声認識用辞書50とユーザ辞書60を用いて未知語を抽出する未知語抽出部20と、抽出した未知語の中からユーザ辞書に登録する単語を抽出する未知語選択部30と、未知語を登録するユーザ辞書登録部40とを有する。音声認識システムは、このユーザ辞書作成システムと、音声認識用辞書50と、ユーザ辞書60と、音声認識手段70と、文書作成手段80とを含む。   Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a speech recognition system including a user dictionary creation system according to the first embodiment of the present invention. The user dictionary creation system includes a text input unit 10, an unknown word extraction unit 20 that extracts an unknown word from the input text using the speech recognition dictionary 50 and the user dictionary 60, and a user dictionary from the extracted unknown words. It has the unknown word selection part 30 which extracts the word to register, and the user dictionary registration part 40 which registers an unknown word. The speech recognition system includes the user dictionary creation system, a speech recognition dictionary 50, a user dictionary 60, speech recognition means 70, and document creation means 80.

テキスト入力部10は、過去の議事録や発言録、報告書などのデジタル化されたファイルを入力するとテキスト情報のみを抽出し、出力するテキスト入力手段11を備えている。   The text input unit 10 includes text input means 11 that extracts and outputs only text information when a digitized file such as past minutes, memorandums, and reports is input.

未知語抽出部20は、形態素解析手段21と、未知語抽出手段22とを含む。形態素解析手段21は、テキスト入力部10より入力されたテキストに対し、音声認識用辞書50とユーザ辞書60とを用いて形態素解析を行い、品詞を付与する。未知語抽出手段22では、形態素解析手段21で、品詞を付与できなかった単語を未知語として抽出し、未知語と該当する未知語を含む文章を保存しリスト化して、未知語選択部30に供給する。   The unknown word extraction unit 20 includes a morphological analysis unit 21 and an unknown word extraction unit 22. The morpheme analyzing means 21 performs morphological analysis on the text input from the text input unit 10 using the speech recognition dictionary 50 and the user dictionary 60, and gives parts of speech. In the unknown word extraction means 22, the morpheme analysis means 21 extracts words that could not be given parts of speech as unknown words, saves sentences including unknown words and corresponding unknown words, stores them in a list, and stores them in the unknown word selection unit 30. Supply.

未知語選択部30は、未知語選択手段31と、類似度算出手段32と、環境情報抽出手段33とを含む。これらの手段はそれぞれ概略、次のように動作する。未知語選択手段31は、未知語抽出手段22で作成された未知語のリストを参照しながら、登録するか否かのユーザの判断を受け付ける。ユーザが登録すると判断した未知語には、その読みと品詞の付与をユーザ自身が行う。   The unknown word selection unit 30 includes an unknown word selection unit 31, a similarity calculation unit 32, and an environment information extraction unit 33. Each of these means generally operates as follows. The unknown word selection means 31 accepts the user's judgment as to whether or not to register while referring to the list of unknown words created by the unknown word extraction means 22. The user himself / herself performs reading and part-of-speech assignment for unknown words determined to be registered by the user.

類似度算出手段32では、未知語の読みと辞書中の単語の読みの音響的特長の類似度を音素間の距離を定義したテーブルを用いて計算する。また、類似度算出手段32は、未知語の品詞と音響的特長が類似する辞書中の単語(既知語)の品詞の類似度を形態素間の距離を定義したテーブルを用いて類似度を計算する。環境情報抽出手段33では、辞書中に類似度が高い既知語が存在する未知語のみに、未知語選択手段31で付与した品詞を用いて、未知語が含まれている文の形態素解析を再度行い、未知語の前後の単語の品詞など、未知語の前後の環境条件を求める。   The similarity calculation means 32 calculates the similarity between the acoustic features of the unknown word reading and the word reading in the dictionary using a table defining the distance between phonemes. Further, the similarity calculation means 32 calculates the similarity using a table in which the distance between morphemes is defined as the similarity of the part of speech of a word (known word) in a dictionary whose acoustic features are similar to the part of speech of the unknown word. . In the environment information extraction means 33, the morphological analysis of the sentence containing the unknown word is performed again using only the part of speech given by the unknown word selection means 31 for the unknown word having a known word with high similarity in the dictionary. And determine the environmental conditions before and after the unknown word, such as the part of speech of the word before and after the unknown word.

ユーザ辞書登録部40は、未知語の登録手段41を含む。登録手段41は、未知語選択部30でユーザが選択した未知語をユーザ辞書60に登録する。ユーザ辞書登録部40は、未知語を登録する際に、辞書に類似度の高い単語があるものは、未知語の品詞と読み以外に、環境情報抽出手段33で求めた未知語の前後の品詞を環境情報としてユーザ辞書60に登録する。   The user dictionary registration unit 40 includes unknown word registration means 41. The registration unit 41 registers the unknown word selected by the user in the unknown word selection unit 30 in the user dictionary 60. When registering an unknown word, the user dictionary registration unit 40 includes words with high similarity in the dictionary, parts of speech before and after the unknown word obtained by the environment information extraction means 33, in addition to the part of speech and reading of the unknown word. Is registered in the user dictionary 60 as environment information.

音声認識手段70は、音声をリアルタイムに入力して記録し、その記録した音声から50音やアルファベットなどの表音文字を認識する機能を有する。文書作成手段80は、音声認識手段70から表音文字を入力し、音声認識用辞書50及びユーザ辞書60に基づいて、表音文字から文書を作成する。   The voice recognition means 70 has a function of inputting and recording voice in real time and recognizing phonetic characters such as 50 tones and alphabets from the recorded voice. The document creation unit 80 inputs phonograms from the speech recognition unit 70 and creates a document from phonograms based on the speech recognition dictionary 50 and the user dictionary 60.

文書作成手段80は、ユーザ辞書60を参照して文書を作成する際に、ユーザ辞書中の単語が選択されるのは、環境情報まで一致した場合のみとすることで、ユーザ辞書に類似度の高い単語を登録したことによる悪影響を極力抑えることができる。   When the document creation unit 80 creates a document with reference to the user dictionary 60, the word in the user dictionary is selected only when the environment information is matched, and the similarity to the user dictionary is thus determined. The adverse effect of registering a high word can be suppressed as much as possible.

以下、上記第1の実施形態に係るユーザ辞書作成装置の具体的動作について詳細に説明する。まず、ユーザは、図1のテキスト入力部10のテキスト入力手段11から、認識させたい単語を含むテキストや話題が近いテキストを大量に入力する。未知語抽出部20は、形態素解析手段21にて入力されたテキストに対し音声認識用辞書50とユーザ辞書60を用いて形態素解析を行い、未知語抽出手段22で未知語を抽出し、未知語リストを作成する。   Hereinafter, a specific operation of the user dictionary creation device according to the first embodiment will be described in detail. First, the user inputs a large amount of text including a word to be recognized or text close to a topic from the text input unit 11 of the text input unit 10 in FIG. The unknown word extraction unit 20 performs morphological analysis on the text input by the morpheme analysis unit 21 using the speech recognition dictionary 50 and the user dictionary 60, extracts the unknown word by the unknown word extraction unit 22, and extracts the unknown word Create a list.

作成された未知語リストは、未知語選択部30の未知語選択手段31を用いて、ユーザが登録の有無を選択する。登録が決まった未知語は、辞書に類似する単語があるか否かの判断を類似度算出手段32にて行う。類似する単語が発見された場合には、環境情報抽出手段33が、登録する単語の前後の品詞情報を取得する。ユーザ辞書登録部40では、未知語選択部30で選択された単語の情報をユーザ辞書60に登録する。   In the created unknown word list, the user selects whether or not to register using the unknown word selection means 31 of the unknown word selection unit 30. For the unknown word that has been registered, the similarity calculation means 32 determines whether there is a word similar to the dictionary. When a similar word is found, the environment information extraction unit 33 acquires part-of-speech information before and after the word to be registered. The user dictionary registration unit 40 registers information on the word selected by the unknown word selection unit 30 in the user dictionary 60.

図5に、環境制限を加えないで未知語を登録する際に発生しがちな誤り例を示す。図5は、ユーザが未知語“Sun”(読み:サン)を登録すると、入力された“佐藤さん。”の“さん”を“Sun”と誤認識し、“佐藤Sun。”という認識結果が出ることを示す。同様に、ユーザが未知語“ARIS”(読み:アリス)を登録すると、入力された“そうであります”の“あります”を、“ARIS”と誤認識し、“そうでARIS。”となることを示している。   FIG. 5 shows an example of an error that tends to occur when an unknown word is registered without adding environmental restrictions. FIG. 5 shows that when the user registers the unknown word “Sun” (reading: Sun), “san” in the input “san” is misrecognized as “sun”, and the recognition result “sato sun.” Indicates exiting. Similarly, when the user registers the unknown word “ARIS” (reading: Alice), “Yes” in the input “Yes” is misrecognized as “ARIS” and becomes “Yes ARIS.” Is shown.

図6は、本実施形態において、既に辞書に類似度の高い単語があった場合に、登録される単語の環境情報を考慮して行われた未知語のユーザ辞書への登録内容のサンプルを示している。図6では、未知語“Sun”を登録する際には、“Sun”を固有名詞として、その読みと、記号−固有名詞−記号とを登録する旨が示されている。つまり、単語“Sun”の前後に環境情報を考慮して記号(句点)を登録することが示されている。また、語頭−固有名詞−助詞と登録する旨が示されており、未知語“Sun”が語頭にあった場合には、環境情報を考慮して、その固有名詞の後ろの助詞“が”が登録される旨が示されている。   FIG. 6 shows a sample of contents registered in the user dictionary of unknown words, which are performed in consideration of environment information of registered words when there is already a word with high similarity in the dictionary in this embodiment. ing. FIG. 6 shows that when registering the unknown word “Sun”, “Sun” is regarded as a proper noun and its reading and symbol-proper noun-symbol are registered. That is, it is indicated that symbols (punctuation points) are registered before and after the word “Sun” in consideration of environmental information. In addition, it is indicated that the initial word-proprietary noun-particle is registered. When the unknown word "Sun" is at the beginning of the word, the particle "ga" after the proper noun is considered in consideration of environmental information. It indicates that it will be registered.

図6には、更に、未知語“ARIS”の登録の際には、その読みに加えて、記号−固有名詞−記号、語頭−固有名詞−助詞、又は、語頭−固有名詞−名詞が登録する旨が示されている。“ARIS”を登録する際には、このルールに従って環境情報の登録を行い、その後に“ARIS”が入力された際に、その前後の環境を調べることで、“あります”などとの間で発生する誤認識を防止する。   Further, in FIG. 6, when the unknown word “ARIS” is registered, in addition to the reading, a symbol-proper noun-symbol, initial-proper noun-particle, or initial-proper noun-noun is registered. The effect is shown. When "ARIS" is registered, environment information is registered according to this rule, and when "ARIS" is entered after that, the environment before and after it is checked and it occurs between "Yes" and others Prevent misrecognition.

第1の実施形態では、未知語を登録する際には、その登録すべき未知語と類似度の高い単語が既に辞書に登録されているか否かを判定する。次いで、既に登録されている登録後と類似度が高いと判定された未知語を登録する際には、未知語の表記、読み、品詞情報だけでなく、その未知語が出現しうる前後の品詞の環境を登録している。この構成を採用することで、未知語と類似する単語との区別を図り、認識結果に悪影響を及ぼさないように図っている。   In the first embodiment, when registering an unknown word, it is determined whether or not a word having a high similarity to the unknown word to be registered is already registered in the dictionary. Next, when registering an unknown word that has been determined to have a high degree of similarity after registration, not only the notation of the unknown word, reading, part of speech information, but also the part of speech before and after the unknown word can appear The environment is registered. By adopting this configuration, an unknown word and a similar word are distinguished from each other so that the recognition result is not adversely affected.

次に、本発明の第2の実施形態について説明する。図2を参照すると、本発明の第2の実施形態に係るユーザ辞書作成システムは、第1の実施形態のユーザ辞書作成システムとは未知語抽出手段の構成が異なっている。詳しくは、第2の実施形態の未知語抽出部20Aは、第1の実施形態における未知語抽出部20の構成に加えて、未知語読み付け手段23と未知語読み付け辞書90とを有する。その他の構成、動作については、第1の実施形態と同様である。   Next, a second embodiment of the present invention will be described. Referring to FIG. 2, the user dictionary creation system according to the second embodiment of the present invention is different from the user dictionary creation system according to the first embodiment in the configuration of the unknown word extraction means. Specifically, the unknown word extraction unit 20A of the second embodiment includes an unknown word reading unit 23 and an unknown word reading dictionary 90 in addition to the configuration of the unknown word extraction unit 20 of the first embodiment. Other configurations and operations are the same as those in the first embodiment.

未知語読み付け手段23は、未知語抽出手段22で抽出された未知語に対し、未知語読み付け辞書90を用いて未知語の読みを自動的に付与する。未知語読み付け辞書90は、1文字ごとに読みを定義したテーブルで、未知語の先頭から順にこのテーブルにある読みを付与していく。例えば、文字列“ABC”が未知語として抽出された場合には、“ABC”を1文字ずつに分割し、未知語読み付け辞書90にある“A(えー)”、“B(びー)”、“C(しー)”の読みを付与する。   The unknown word reading means 23 automatically gives an unknown word reading to the unknown words extracted by the unknown word extraction means 22 using the unknown word reading dictionary 90. The unknown word reading dictionary 90 is a table in which readings are defined for each character, and readings in this table are given in order from the top of the unknown words. For example, when the character string “ABC” is extracted as an unknown word, “ABC” is divided into characters and “A (e)” and “B (b)” in the unknown word reading dictionary 90 are divided. , “C” is given.

上記構成により、ユーザが未知語選択手段31で、登録する未知語を選んだ時には、既になんらかの読みがその未知語に付与された状態である。このため、最初から全ての読みを登録する場合に比べ、登録する手間を軽減することができる。   With the above configuration, when the user selects an unknown word to be registered by the unknown word selection means 31, some reading has already been given to the unknown word. For this reason, compared with the case where all readings are registered from the beginning, the trouble of registering can be reduced.

次に、本発明の第3の実施形態について図面を参照して詳細に説明する。図3を参照すると、本発明の第3の実施形態に係るユーザ辞書作成システムは、第1の実施形態におけるユーザ辞書作成システムとは、未知語選択部の構成が異なる。詳しくは、本実施形態の未知語選択部30Aは、未知語選択手段31と、類似度算出手段34と、環境情報抽出手段35とを有する。未知語選択手段31の構成及び動作は、第1の実施形態の未知語選択手段と同様である。   Next, a third embodiment of the present invention will be described in detail with reference to the drawings. Referring to FIG. 3, the user dictionary creation system according to the third embodiment of the present invention differs from the user dictionary creation system according to the first embodiment in the configuration of the unknown word selection unit. Specifically, the unknown word selection unit 30A according to the present embodiment includes an unknown word selection unit 31, a similarity calculation unit 34, and an environment information extraction unit 35. The configuration and operation of the unknown word selection unit 31 are the same as those of the unknown word selection unit of the first embodiment.

本実施形態では、類似度算出手段34は、第1の実施形態における類似度算出手段32と同様に類似度を算出する機能を有し、且つ、辞書中に類似する単語が見つかったときには、その単語が音声認識用辞書50とユーザ辞書60のどちらに存在しているかを判別する。環境情報抽出手段35は、類似度算出手段34により類似する単語がユーザ辞書60に登録されていると判定されると、新しく登録する単語はユーザ辞書に登録されている類似する単語の環境情報よりも前及び/又は後に、1語ずつ多くの環境情報を保持させるようにする。   In the present embodiment, the similarity calculation unit 34 has a function of calculating a similarity in the same manner as the similarity calculation unit 32 in the first embodiment, and when a similar word is found in the dictionary, It is determined whether the word exists in the voice recognition dictionary 50 or the user dictionary 60. When it is determined by the similarity calculation unit 34 that the similar word is registered in the user dictionary 60, the environmental information extraction unit 35 determines that the newly registered word is based on the environmental information of the similar word registered in the user dictionary. Before and / or after, a large amount of environmental information is retained one word at a time.

第3の実施形態では、登録したい単語が、音声認識用辞書ではなく、ユーザ辞書に既に登録された単語との間で類似性が高い場合でも、誤認識の発生を低減することができる。   In the third embodiment, it is possible to reduce the occurrence of misrecognition even when the word to be registered is not a speech recognition dictionary but has a high similarity with a word already registered in the user dictionary.

次に、本発明の第4の実施形態について説明する。図4を参照すると、第4の実施形態に係るユーザ辞書作成システムでは、未知語抽出部20Bが、第1の実施形態の未知語抽出部20の構成に加えて、登録単語抽出手段24を有する。本実施形態における他の構成および動作については第1の実施形態と同様である。   Next, a fourth embodiment of the present invention will be described. Referring to FIG. 4, in the user dictionary creation system according to the fourth embodiment, the unknown word extraction unit 20B includes a registered word extraction unit 24 in addition to the configuration of the unknown word extraction unit 20 of the first embodiment. . Other configurations and operations in the present embodiment are the same as those in the first embodiment.

登録単語抽出手段24は、ユーザ辞書60に登録されている単語の環境情報を追加するための手段である。登録単語抽出手段24は、形態素解析手段21により解析された文字列中にユーザ辞書に既に登録された単語が含まれていると、ユーザ辞書60の中身を検索し当該単語の環境情報を確認し、登録されていない環境情報である場合には、ユーザ辞書登録部40を介してユーザ辞書60に登録する。また、環境情報が登録されていても、識別が充分でない場合には、登録されている環境情報に加えて、又は、これに代えて、新たに環境情報を登録する。   The registered word extraction unit 24 is a unit for adding environment information of words registered in the user dictionary 60. If the word string already analyzed in the user dictionary is included in the character string analyzed by the morpheme analyzing means 21, the registered word extracting means 24 searches the contents of the user dictionary 60 and confirms the environment information of the word. If the environment information is not registered, it is registered in the user dictionary 60 via the user dictionary registration unit 40. If the environmental information is registered but the identification is not sufficient, the environmental information is newly registered in addition to or instead of the registered environmental information.

第4の実施形態では、既にユーザ辞書に登録された単語の環境情報を、その後の情報に基づいて、後からでも拡充又は変更することが出来る。このため、更なる認識率の向上が期待できる。   In the fourth embodiment, the environment information of words already registered in the user dictionary can be expanded or changed later on the basis of the subsequent information. For this reason, further improvement of the recognition rate can be expected.

本発明を特別に示し且つ例示的な実施形態を参照して説明したが、本発明は、その実施形態及びその変形に限定されるものではない。当業者に明らかなように、本発明は、添付の特許請求の範囲に規定される本発明の精神及び範囲を逸脱することなく、種々の変更が可能である。   Although the invention has been particularly shown and described with reference to illustrative embodiments, the invention is not limited to these embodiments and variations thereof. It will be apparent to those skilled in the art that various modifications can be made to the present invention without departing from the spirit and scope of the invention as defined in the appended claims.

本発明は、ユーザ辞書を用いてシステム構築後もユーザの用途に合わせて必要な単語を随時登録することができる高精度な音声認識性能が要求される音声認識システム、及び、その辞書登録装置に適している。   The present invention relates to a speech recognition system that requires a highly accurate speech recognition performance capable of registering necessary words at any time even after system construction using a user dictionary, and a dictionary registration apparatus thereof. Is suitable.

10:テキスト入力部
11:テキスト入力手段
20、20A、20B:未知語抽出部
21:形態素解析手段
22:未知語抽出手段
23:未知語読み付け手段
24:登録単語抽出手段
30、30A:未知語選択部
31:未知語選択手段
32、34:類似度算出手段
33、35:環境情報抽出手段
40:ユーザ辞書登録部
41:登録手段
50:音声認識用辞書
60:ユーザ辞書
70:音声認識手段
80:文章作成手段
90:未知語読み付け辞書
10: Text input unit 11: Text input unit 20, 20A, 20B: Unknown word extraction unit 21: Morphological analysis unit 22: Unknown word extraction unit 23: Unknown word reading unit 24: Registered word extraction unit 30, 30A: Unknown word Selection unit 31: unknown word selection unit 32, 34: similarity calculation unit 33, 35: environment information extraction unit 40: user dictionary registration unit 41: registration unit 50: voice recognition dictionary 60: user dictionary 70: voice recognition unit 80 : Sentence creation means 90: unknown word reading dictionary

Claims (6)

文字列を入力するテキスト入力手段と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、
前記類似度が所定値以上のときに、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の品詞を示す環境情報を抽出する環境情報抽出手段と、
前記類似度が所定値以上のときに、前記未知語及び前記環境情報抽出手段が抽出した環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システム。
A text input means for inputting a character string;
An unknown word extraction means for extracting a word that is not registered in the dictionary as an unknown word from the input character string;
Similarity calculating means for calculating the similarity between the extracted unknown word and a registered word already registered in the dictionary;
When the similarity is greater than a predetermined value, based on the morphological analysis of the surrounding text in an unknown language in the character string, and the environmental information extraction means for extracting environmental information indicating a before and after the word part of speech of the unknown word ,
A user dictionary creation system comprising: registration means for registering the unknown word and the environment information extracted by the environment information extraction means in a dictionary when the similarity is equal to or greater than a predetermined value .
前記未知語の読みを決定する未知語読み付け手段を更に有する、請求項1に記載のユーザ辞書作成システム。   The user dictionary creation system according to claim 1, further comprising unknown word reading means for determining reading of the unknown word. 入力された文字列から辞書に既に登録されている登録単語を抽出し、抽出した登録単語の環境情報が前記辞書に登録されていない場合に、前記登録単語の前後の文章の形態解析結果に基づいて前記登録単語の前後の単語の品詞を示す環境情報を抽出し、前記登録単語に前記抽出された環境情報を付加して前記登録単語を更新する登録単語抽出手段を更に有する、請求項1又は2に記載のユーザ辞書作成システム。 When a registered word already registered in the dictionary is extracted from the input character string and the environment information of the extracted registered word is not registered in the dictionary , based on the form analysis result of the sentence before and after the registered word extracting environmental information indicating a before and after the word part of speech of the previous SL registered word Te, further comprising a registration word extracting means for updating the registration word by adding the extracted environmental information to the registration word claim 1 Or the user dictionary creation system of 2. 前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報が抽出された前記未知語の前後の単語よりも前及び/又は後ろに1語ずつ多い単語から環境情報を抽出する、請求項1〜の何れか一に記載のユーザ辞書作成システム。 When the registered word determined to have a predetermined degree of similarity or higher with the unknown word already includes the environmental information, the environmental information extracting means uses the words before and after the unknown word from which the included environmental information is extracted. The user dictionary creation system according to any one of claims 1 to 3 , wherein the environment information is extracted from words having one word before and / or behind . 文字列を入力する処理と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
前記類似度が所定値以上のときに、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の品詞を示す環境情報を抽出する処理と、
前記類似度が所定値以上のときに、前記未知語及び前記抽出された環境情報を辞書に登録する処理と、を有するユーザ辞書作成方法。
The process of entering a string,
Processing to extract words not registered in the dictionary as unknown words from the input character string;
A process of calculating the similarity between the extracted unknown word and a registered word already registered in the dictionary;
When the similarity is greater than a predetermined value, the processing on the basis of the character form analysis of the surrounding text in an unknown language in a column, and extracts the environment information indicating the front and rear of a word part of speech of the unknown word,
And a process of registering the unknown word and the extracted environment information in a dictionary when the similarity is equal to or greater than a predetermined value .
コンピュータに、
文字列を入力する処理と、
入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
前記類似度が所定値以上のときに、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の品詞を示す環境情報を抽出する処理と、
前記類似度が所定値以上のときに、前記未知語及び前記抽出された環境情報を辞書に登録する処理と、を実行させるユーザ辞書作成プログラム。
On the computer,
The process of entering a string,
Processing to extract words not registered in the dictionary as unknown words from the input character string;
A process of calculating the similarity between the extracted unknown word and a registered word already registered in the dictionary;
When the similarity is greater than a predetermined value, the processing on the basis of the character form analysis of the surrounding text in an unknown language in a column, and extracts the environment information indicating the front and rear of a word part of speech of the unknown word,
A user dictionary creation program for executing processing for registering the unknown word and the extracted environment information in a dictionary when the similarity is equal to or greater than a predetermined value .
JP2009084096A 2009-03-31 2009-03-31 User dictionary creation system, method, and program Expired - Fee Related JP4941495B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009084096A JP4941495B2 (en) 2009-03-31 2009-03-31 User dictionary creation system, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009084096A JP4941495B2 (en) 2009-03-31 2009-03-31 User dictionary creation system, method, and program

Publications (2)

Publication Number Publication Date
JP2010237351A JP2010237351A (en) 2010-10-21
JP4941495B2 true JP4941495B2 (en) 2012-05-30

Family

ID=43091742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009084096A Expired - Fee Related JP4941495B2 (en) 2009-03-31 2009-03-31 User dictionary creation system, method, and program

Country Status (1)

Country Link
JP (1) JP4941495B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6115202B2 (en) * 2013-03-12 2017-04-19 アイシン・エィ・ダブリュ株式会社 Speech recognition system, method and program
CN115410558A (en) * 2022-08-26 2022-11-29 思必驰科技股份有限公司 Out-of-set word processing method, electronic device and storage medium

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6011897A (en) * 1983-06-30 1985-01-22 富士通株式会社 Voice recognition equipment
JP2000112491A (en) * 1998-09-30 2000-04-21 Nec Saitama Ltd Device and method for judging character similarity, and device and method for recognizing voice
JP3976959B2 (en) * 1999-09-24 2007-09-19 三菱電機株式会社 Speech recognition apparatus, speech recognition method, and speech recognition program recording medium
JP2003099087A (en) * 2001-09-25 2003-04-04 Canon Inc Device, method and program of preparing analysis dictionary for natural language processing
JP2004029354A (en) * 2002-06-25 2004-01-29 Toshiba Corp Speech recognition device, speech recognition method, and speech recognition program
JP4236597B2 (en) * 2004-02-16 2009-03-11 シャープ株式会社 Speech recognition apparatus, speech recognition program, and recording medium.
JP2005275348A (en) * 2004-02-23 2005-10-06 Nippon Telegr & Teleph Corp <Ntt> Speech recognition method, device, program and recording medium for executing the method
JP4820240B2 (en) * 2006-08-29 2011-11-24 日本放送協会 Word classification device, speech recognition device, and word classification program
JP5238395B2 (en) * 2008-07-31 2013-07-17 株式会社エヌ・ティ・ティ・ドコモ Language model creation apparatus and language model creation method

Also Published As

Publication number Publication date
JP2010237351A (en) 2010-10-21

Similar Documents

Publication Publication Date Title
JP5599662B2 (en) System and method for converting kanji into native language pronunciation sequence using statistical methods
JP5997217B2 (en) A method to remove ambiguity of multiple readings in language conversion
US5930746A (en) Parsing and translating natural language sentences automatically
Rashel et al. Building an Indonesian rule-based part-of-speech tagger
CN108140019B (en) Language model generation device, language model generation method, and recording medium
US9484034B2 (en) Voice conversation support apparatus, voice conversation support method, and computer readable medium
KR101279676B1 (en) Method and apparatus for creating a language model and kana-kanji conversion
Harrat et al. Building resources for algerian arabic dialects
Sitaram et al. Speech synthesis of code-mixed text
JP6778655B2 (en) Word concatenation discriminative model learning device, word concatenation detection device, method, and program
Aqlan et al. Arabic–Chinese neural machine translation: Romanized Arabic as subword unit for Arabic-sourced translation
Scherrer et al. Word-based dialect identification with georeferenced rules
JP2002117027A (en) Feeling information extracting method and recording medium for feeling information extracting program
JP4089861B2 (en) Voice recognition text input device
JP2011008784A (en) System and method for automatically recommending japanese word by using roman alphabet conversion
JP4941495B2 (en) User dictionary creation system, method, and program
JP5611270B2 (en) Word dividing device and word dividing method
JP5642037B2 (en) SEARCH DEVICE, SEARCH METHOD, AND PROGRAM
KR101757222B1 (en) Paraphrase sentence generation method for a korean language sentence
JP5954836B2 (en) Ununderstood sentence determination model learning method, ununderstood sentence determination method, apparatus, and program
Huang et al. Error detection and correction based on Chinese phonemic alphabet in Chinese text
JP5795302B2 (en) Morphological analyzer, method, and program
JP2018077698A (en) Speech sentence extraction apparatus, inadequate topic word list generation apparatus, method, and program
JP6055267B2 (en) Character string dividing device, model file learning device, and character string dividing system
JP2003162524A (en) Language processor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120131

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120213

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees