JP2010237351A - ユーザ辞書作成システム、方法、及び、プログラム - Google Patents

ユーザ辞書作成システム、方法、及び、プログラム Download PDF

Info

Publication number
JP2010237351A
JP2010237351A JP2009084096A JP2009084096A JP2010237351A JP 2010237351 A JP2010237351 A JP 2010237351A JP 2009084096 A JP2009084096 A JP 2009084096A JP 2009084096 A JP2009084096 A JP 2009084096A JP 2010237351 A JP2010237351 A JP 2010237351A
Authority
JP
Japan
Prior art keywords
word
registered
dictionary
unknown
unknown word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009084096A
Other languages
English (en)
Other versions
JP4941495B2 (ja
Inventor
Keiko Inagaki
敬子 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009084096A priority Critical patent/JP4941495B2/ja
Publication of JP2010237351A publication Critical patent/JP2010237351A/ja
Application granted granted Critical
Publication of JP4941495B2 publication Critical patent/JP4941495B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】新たな単語をユーザ辞書に登録する際に、誤認識の発生を回避しつつ、登録の効率が高い、ユーザ辞書登録に関するシステム、方法およびプログラムを提供する。
【解決手段】ユーザ辞書作成システムは、文字列を入力するテキスト入力手段11と、入力された文字列から未知語を抽出する未知語抽出手段22と、抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段32と、類似度が所定値以上のときには、未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段33と、未知語及び環境情報を辞書に登録する登録手段41とを備える。
【選択図】図1

Description

本発明は、ユーザ辞書作成システム、方法、及び、プログラムに関し、更に詳しくは、音声認識システムに好適に用いられるユーザ辞書作成システム、ユーザ辞書作成方法、及び、プログラムに関する。
音声認識装置を利用して、音声で読み上げられた文章から文書を作成する音声認識システムが知られている。音声認識システムは、音声認識装置と、音声認識装置側で予め用意されている音声認識用辞書と、音声認識辞書に含まれていない単語をユーザ側で登録するためのユーザ辞書作成機能とを有する。
ところで、音声認識用辞書で認識しない単語を、ユーザ辞書作成機能を利用して、その読みと形態素情報とを正しく付与して辞書に登録する作業は、ユーザに多大の負担を強いるという問題があった。また、音声認識辞書で認識しない単語を無条件に登録すると、同じ読みを含む単語や、類似する読みを持つ単語が既に辞書に登録されている場合には、双方の単語を区別することができなくなり、類似性の高い単語に誤って出力する誤認識を誘発するという問題もあった。
特許文献1には、上記問題を解決するユーザ辞書作成システムが記載されている。図7は、このユーザ辞書作成システムのブロック図である。ユーザ辞書作成システムは、音声入力部701と、音声認識部702と、類似度算出部703と、辞書登録部704と、音声認識用辞書705と、ユーザ辞書706とから構成されている。ユーザ辞書作成システム700は次のように動作する。まず、予め単語音声を音声入力部701より入力し、音声認識部702において文字列に変換し、その文字列を音声認識用辞書705に登録しておく。ユーザが新しい単語を入力すると、類似度算出部703は、音声認識用辞書705と入力音声とを比較し、類似している場合には、ユーザ辞書706への登録を却下する。
特許文献1に記載のユーザ辞書作成システムでは、辞書内の単語と新たに登録しようとする単語との類似性を判定し、類似性が高い場合には、一律に登録できないという方式を採用している。しかし、この方式を採用すると、登録できない単語については、その認識率を改善することができなかった。
特許文献2には、辞書作成時に、登録したい単語と識別させたい単語の音声パターンを比較し、類似していることが判明すると、ユーザに誤認識をする可能性がある旨を提示するユーザ辞書作成システムが記載されている。ユーザは、問い合わせを受けると、その単語の登録の可否を判断する。この方法では、特許文献1とは異なり、登録できない単語はなくなるが、ユーザの誤った判断に起因して、誤認識の発生が考えられる。
特許文献3には、ユーザ辞書に登録したい単語と、既に登録されている単語との類似度を判定し、双方の単語の類似度が所定以上の場合には、個々のユーザが自身の辞書に登録するか否かを判断する辞書登録装置を有する音声認識システムが記載されている。このユーザ辞書作成システムでは、登録可と判断したユーザのID番号がその登録した単語と共に登録され、他のユーザにはその登録の効果を及ばない。このため、ユーザ各自の判断で登録が可能となり、また、他のユーザに誤認識を発生させるおそれが除かれる。
特許文献4には、ワードプロセッサにおいて、ユーザ辞書に登録したい単語に同音異義語があると、その登録したい単語の前後に付属する単語やその品詞などを付加して登録する旨が記載されている。
特開平8−110790号公報 特開平7−44188号公報 特開2000−259172号公報 特開平2−297247号公報
特許文献3の音声認識システムでは、ユーザが登録した単語の効果はユーザ自身にのみ及ぶので、他のユーザに誤認識が発生する可能性がなくなる。しかし、ユーザがそれぞれ単独に同じ単語を登録する必要が生じ、ユーザ辞書作成における効率が低下する。
また、特許文献4のワードプロセッサでは、同音異義語がある単語について、その前後に付属する単語やその品詞が付加されるものの、音声認識システムでは、誤認識が発生するのは、同音異義語の単語間ばかりではなく、同じような発音を有する単語間でも発生する。
本発明は、上述の点に鑑み、新たな単語をユーザ辞書に登録する際に、誤認識の発生を回避しつつ且つ登録の効率が高いユーザ辞書登録システム、及び、そのようなユーザ辞書登録システムで用いられる辞書登録方法、及び、プログラムを提供することを目的とする。
本発明は、上記目的を達成するために、文字列を入力するテキスト入力手段と、入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、前記未知語及び環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システムを提供する。
本発明のユーザ辞書作成システム、方法、及び、プログラムは、既知語との間で類似性が高い未知語を登録する際に、効率が高い登録を可能にしつつ、その後に未知語と既知語との間で発生しがちな誤認識を抑制できる効果がある。
本発明の第1の実施形態に係るユーザ辞書作成システムを含む音声認識システムのブロック図。 本発明の第2の実施形態に係るユーザ辞書作成システムのブロック図。 本発明の第3の実施形態に係るユーザ辞書作成システムのブロック図。 本発明の第4の実施形態に係るユーザ辞書作成システムのブロック図。 類似語間で誤りが発生しやすい例を示すグラフ。 第1の実施形態で採用される登録例を示すグラフ。 特許文献1に記載のユーザ辞書作成システムのブロック図。
本発明の最小構成のユーザ辞書作成システムは、文字列を入力するテキスト入力手段と、入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、算出された類似度が所定値以上のときには、文字列中の未知語の前後の文章の形態解析に基づいて、未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、未知語及び環境情報を辞書に登録する登録手段と、を備える。
本発明のユーザ辞書作成システムでは、辞書に既に登録されている登録語と所定の類似度以上の類似性を有する未知語が抽出されると、入力文字列中の未知語の前後の文章から未知語の環境情報を抽出し、その環境情報を未知語と共に辞書に登録する構成を採用する。本構成を採用することにより、その後の辞書参照の際に発生しがちな誤認識の発生を防止する。
本発明のユーザ辞書作成システムでは、前記未知語の読みを決定する未知語読み付け手段を更に有する構成を採用できる。この場合、未知語を選択する際に、その判定が容易になる。また、実際に登録する際の処理も簡素化できる。
本発明のユーザ辞書作成システムでは、入力された文字列から辞書に既に登録されている登録単語を抽出する登録単語抽出手段を更に備え、前記環境情報抽出手段は、前記文字列中の登録単語の前後の文章の形態解析結果に基づいて、前記登録単語の前後の単語の情報を含む環境情報を抽出し、前記登録手段は、前記登録されている登録単語に前記抽出された環境情報を付加して前記登録単語を更新する構成を採用することが出来る。この場合、既に作成された辞書の登録語の認識率の向上が可能となる。
本発明のユーザ辞書作成システムでは、前記更新すべき登録単語は、前記未知語と所定以上の類似度があると過去に判定された登録単語である構成も採用できる。未知語を登録した際に類似度が高いと判定された登録語が次に出現すると、その登録語について環境情報が付加できるので、登録語についても認識率が向上する。
本発明のユーザ辞書作成システムでは、前記登録される環境情報が前記未知語の品詞に依存する構成を採用することが出来る。品詞によって未知語の環境が異なるため、認識率の向上が可能となる。
本発明のユーザ辞書作成システムでは、前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報よりも前記未知語と共に登録すべき環境情報を少なくとも1語だけ長くする構成を採用することが出来る。この場合には、新たに登録される未知語の環境情報をよりきめ細かに登録することで、誤認識の低減が可能になる。
以下、本発明の例示的な実施形態について図面を参照して詳細に説明する。図1は、本発明の第1の実施形態に係るユーザ辞書作成システムを含む音声認識システムを示している。ユーザ辞書作成システムは、テキスト入力部10と、入力したテキストに音声認識用辞書50とユーザ辞書60を用いて未知語を抽出する未知語抽出部20と、抽出した未知語の中からユーザ辞書に登録する単語を抽出する未知語選択部30と、未知語を登録するユーザ辞書登録部40とを有する。音声認識システムは、このユーザ辞書作成システムと、音声認識用辞書50と、ユーザ辞書60と、音声認識手段70と、文書作成手段80とを含む。
テキスト入力部10は、過去の議事録や発言録、報告書などのデジタル化されたファイルを入力するとテキスト情報のみを抽出し、出力するテキスト入力手段11を備えている。
未知語抽出部20は、形態素解析手段21と、未知語抽出手段22とを含む。形態素解析手段21は、テキスト入力部10より入力されたテキストに対し、音声認識用辞書50とユーザ辞書60とを用いて形態素解析を行い、品詞を付与する。未知語抽出手段22では、形態素解析手段21で、品詞を付与できなかった単語を未知語として抽出し、未知語と該当する未知語を含む文章を保存しリスト化して、未知語選択部30に供給する。
未知語選択部30は、未知語選択手段31と、類似度算出手段32と、環境情報抽出手段33とを含む。これらの手段はそれぞれ概略、次のように動作する。未知語選択手段31は、未知語抽出手段22で作成された未知語のリストを参照しながら、登録するか否かのユーザの判断を受け付ける。ユーザが登録すると判断した未知語には、その読みと品詞の付与をユーザ自身が行う。
類似度算出手段32では、未知語の読みと辞書中の単語の読みの音響的特長の類似度を音素間の距離を定義したテーブルを用いて計算する。また、類似度算出手段32は、未知語の品詞と音響的特長が類似する辞書中の単語(既知語)の品詞の類似度を形態素間の距離を定義したテーブルを用いて類似度を計算する。環境情報抽出手段33では、辞書中に類似度が高い既知語が存在する未知語のみに、未知語選択手段31で付与した品詞を用いて、未知語が含まれている文の形態素解析を再度行い、未知語の前後の単語の品詞など、未知語の前後の環境条件を求める。
ユーザ辞書登録部40は、未知語の登録手段41を含む。登録手段41は、未知語選択部30でユーザが選択した未知語をユーザ辞書60に登録する。ユーザ辞書登録部40は、未知語を登録する際に、辞書に類似度の高い単語があるものは、未知語の品詞と読み以外に、環境情報抽出手段33で求めた未知語の前後の品詞を環境情報としてユーザ辞書60に登録する。
音声認識手段70は、音声をリアルタイムに入力して記録し、その記録した音声から50音やアルファベットなどの表音文字を認識する機能を有する。文書作成手段80は、音声認識手段70から表音文字を入力し、音声認識用辞書50及びユーザ辞書60に基づいて、表音文字から文書を作成する。
文書作成手段80は、ユーザ辞書60を参照して文書を作成する際に、ユーザ辞書中の単語が選択されるのは、環境情報まで一致した場合のみとすることで、ユーザ辞書に類似度の高い単語を登録したことによる悪影響を極力抑えることができる。
以下、上記第1の実施形態に係るユーザ辞書作成装置の具体的動作について詳細に説明する。まず、ユーザは、図1のテキスト入力部10のテキスト入力手段11から、認識させたい単語を含むテキストや話題が近いテキストを大量に入力する。未知語抽出部20は、形態素解析手段21にて入力されたテキストに対し音声認識用辞書50とユーザ辞書60を用いて形態素解析を行い、未知語抽出手段22で未知語を抽出し、未知語リストを作成する。
作成された未知語リストは、未知語選択部30の未知語選択手段31を用いて、ユーザが登録の有無を選択する。登録が決まった未知語は、辞書に類似する単語があるか否かの判断を類似度算出手段32にて行う。類似する単語が発見された場合には、環境情報抽出手段33が、登録する単語の前後の品詞情報を取得する。ユーザ辞書登録部40では、未知語選択部30で選択された単語の情報をユーザ辞書60に登録する。
図5に、環境制限を加えないで未知語を登録する際に発生しがちな誤り例を示す。図5は、ユーザが未知語“Sun”(読み:サン)を登録すると、入力された“佐藤さん。”の“さん”を“Sun”と誤認識し、“佐藤Sun。”という認識結果が出ることを示す。同様に、ユーザが未知語“ARIS”(読み:アリス)を登録すると、入力された“そうであります”の“あります”を、“ARIS”と誤認識し、“そうでARIS。”となることを示している。
図6は、本実施形態において、既に辞書に類似度の高い単語があった場合に、登録される単語の環境情報を考慮して行われた未知語のユーザ辞書への登録内容のサンプルを示している。図6では、未知語“Sun”を登録する際には、“Sun”を固有名詞として、その読みと、記号−固有名詞−記号とを登録する旨が示されている。つまり、単語“Sun”の前後に環境情報を考慮して記号(句点)を登録することが示されている。また、語頭−固有名詞−助詞と登録する旨が示されており、未知語“Sun”が語頭にあった場合には、環境情報を考慮して、その固有名詞の後ろの助詞“が”が登録される旨が示されている。
図6には、更に、未知語“ARIS”の登録の際には、その読みに加えて、記号−固有名詞−記号、語頭−固有名詞−助詞、又は、語頭−固有名詞−名詞が登録する旨が示されている。“ARIS”を登録する際には、このルールに従って環境情報の登録を行い、その後に“ARIS”が入力された際に、その前後の環境を調べることで、“あります”などとの間で発生する誤認識を防止する。
第1の実施形態では、未知語を登録する際には、その登録すべき未知語と類似度の高い単語が既に辞書に登録されているか否かを判定する。次いで、既に登録されている登録後と類似度が高いと判定された未知語を登録する際には、未知語の表記、読み、品詞情報だけでなく、その未知語が出現しうる前後の品詞の環境を登録している。この構成を採用することで、未知語と類似する単語との区別を図り、認識結果に悪影響を及ぼさないように図っている。
次に、本発明の第2の実施形態について説明する。図2を参照すると、本発明の第2の実施形態に係るユーザ辞書作成システムは、第1の実施形態のユーザ辞書作成システムとは未知語抽出手段の構成が異なっている。詳しくは、第2の実施形態の未知語抽出部20Aは、第1の実施形態における未知語抽出部20の構成に加えて、未知語読み付け手段23と未知語読み付け辞書90とを有する。その他の構成、動作については、第1の実施形態と同様である。
未知語読み付け手段23は、未知語抽出手段22で抽出された未知語に対し、未知語読み付け辞書90を用いて未知語の読みを自動的に付与する。未知語読み付け辞書90は、1文字ごとに読みを定義したテーブルで、未知語の先頭から順にこのテーブルにある読みを付与していく。例えば、文字列“ABC”が未知語として抽出された場合には、“ABC”を1文字ずつに分割し、未知語読み付け辞書90にある“A(えー)”、“B(びー)”、“C(しー)”の読みを付与する。
上記構成により、ユーザが未知語選択手段31で、登録する未知語を選んだ時には、既になんらかの読みがその未知語に付与された状態である。このため、最初から全ての読みを登録する場合に比べ、登録する手間を軽減することができる。
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。図3を参照すると、本発明の第3の実施形態に係るユーザ辞書作成システムは、第1の実施形態におけるユーザ辞書作成システムとは、未知語選択部の構成が異なる。詳しくは、本実施形態の未知語選択部30Aは、未知語選択手段31と、類似度算出手段34と、環境情報抽出手段35とを有する。未知語選択手段31の構成及び動作は、第1の実施形態の未知語選択手段と同様である。
本実施形態では、類似度算出手段34は、第1の実施形態における類似度算出手段32と同様に類似度を算出する機能を有し、且つ、辞書中に類似する単語が見つかったときには、その単語が音声認識用辞書50とユーザ辞書60のどちらに存在しているかを判別する。環境情報抽出手段35は、類似度算出手段34により類似する単語がユーザ辞書60に登録されていると判定されると、新しく登録する単語はユーザ辞書に登録されている類似する単語の環境情報よりも前及び/又は後に、1語ずつ多くの環境情報を保持させるようにする。
第3の実施形態では、登録したい単語が、音声認識用辞書ではなく、ユーザ辞書に既に登録された単語との間で類似性が高い場合でも、誤認識の発生を低減することができる。
次に、本発明の第4の実施形態について説明する。図4を参照すると、第4の実施形態に係るユーザ辞書作成システムでは、未知語抽出部20Bが、第1の実施形態の未知語抽出部20の構成に加えて、登録単語抽出手段24を有する。本実施形態における他の構成および動作については第1の実施形態と同様である。
登録単語抽出手段24は、ユーザ辞書60に登録されている単語の環境情報を追加するための手段である。登録単語抽出手段24は、形態素解析手段21により解析された文字列中にユーザ辞書に既に登録された単語が含まれていると、ユーザ辞書60の中身を検索し当該単語の環境情報を確認し、登録されていない環境情報である場合には、ユーザ辞書登録部40を介してユーザ辞書60に登録する。また、環境情報が登録されていても、識別が充分でない場合には、登録されている環境情報に加えて、又は、これに代えて、新たに環境情報を登録する。
第4の実施形態では、既にユーザ辞書に登録された単語の環境情報を、その後の情報に基づいて、後からでも拡充又は変更することが出来る。このため、更なる認識率の向上が期待できる。
本発明を特別に示し且つ例示的な実施形態を参照して説明したが、本発明は、その実施形態及びその変形に限定されるものではない。当業者に明らかなように、本発明は、添付の特許請求の範囲に規定される本発明の精神及び範囲を逸脱することなく、種々の変更が可能である。
本発明は、ユーザ辞書を用いてシステム構築後もユーザの用途に合わせて必要な単語を随時登録することができる高精度な音声認識性能が要求される音声認識システム、及び、その辞書登録装置に適している。
10:テキスト入力部
11:テキスト入力手段
20、20A、20B:未知語抽出部
21:形態素解析手段
22:未知語抽出手段
23:未知語読み付け手段
24:登録単語抽出手段
30、30A:未知語選択部
31:未知語選択手段
32、34:類似度算出手段
33、35:環境情報抽出手段
40:ユーザ辞書登録部
41:登録手段
50:音声認識用辞書
60:ユーザ辞書
70:音声認識手段
80:文章作成手段
90:未知語読み付け辞書

Claims (8)

  1. 文字列を入力するテキスト入力手段と、
    入力された文字列から辞書に登録されていない単語を未知語として抽出する未知語抽出手段と、
    前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する類似度算出手段と、
    前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する環境情報抽出手段と、
    前記未知語及び環境情報を辞書に登録する登録手段と、を備えるユーザ辞書作成システム。
  2. 前記未知語の読みを決定する未知語読み付け手段を更に有する、請求項1に記載のユーザ辞書作成システム。
  3. 入力された文字列から辞書に既に登録されている登録単語を抽出する登録単語抽出手段を更に備え、
    前記環境情報抽出手段は、前記文字列中の登録単語の前後の文章の形態解析結果に基づいて、前記登録単語の前後の単語の情報を含む環境情報を抽出し、
    前記登録手段は、前記登録されている登録単語に前記抽出された環境情報を付加して前記登録単語を更新する、請求項1又は2に記載のユーザ辞書作成システム。
  4. 前記更新すべき登録単語は、前記未知語と所定以上の類似度があると過去に判定された登録単語である、請求項3に記載のユーザ辞書作成システム。
  5. 前記登録される環境情報が前記未知語の品詞に依存する、請求項1〜4の何れか一に記載のユーザ辞書作成システム。
  6. 前記環境情報抽出手段は、前記未知語と所定以上の類似度を有すると判定された登録語が既に環境情報を含むときには、該含まれた環境情報よりも前記未知語と共に登録すべき環境情報を少なくとも1語だけ長くする、請求項1〜5の何れか一に記載のユーザ辞書作成システム。
  7. 文字列を入力する処理と、
    入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
    前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
    前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する処理と、
    前記未知語及び環境情報を辞書に登録する処理と、を有するユーザ辞書作成方法。
  8. コンピュータに、
    文字列を入力する処理と、
    入力された文字列から辞書に登録されていない単語を未知語として抽出する処理と、
    前記抽出された未知語と辞書に既に登録されている登録単語との類似度を算出する処理と、
    前記類似度が所定値以上のときには、前記文字列中の未知語の前後の文章の形態解析に基づいて、前記未知語の前後の単語の情報を含む環境情報を抽出する処理と、
    前記未知語及び環境情報を辞書に登録する処理と、を実行させるユーザ辞書作成プログラム。
JP2009084096A 2009-03-31 2009-03-31 ユーザ辞書作成システム、方法、及び、プログラム Expired - Fee Related JP4941495B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009084096A JP4941495B2 (ja) 2009-03-31 2009-03-31 ユーザ辞書作成システム、方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009084096A JP4941495B2 (ja) 2009-03-31 2009-03-31 ユーザ辞書作成システム、方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2010237351A true JP2010237351A (ja) 2010-10-21
JP4941495B2 JP4941495B2 (ja) 2012-05-30

Family

ID=43091742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009084096A Expired - Fee Related JP4941495B2 (ja) 2009-03-31 2009-03-31 ユーザ辞書作成システム、方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP4941495B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014174423A (ja) * 2013-03-12 2014-09-22 Aisin Aw Co Ltd 音声認識システム、方法およびプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6011897A (ja) * 1983-06-30 1985-01-22 富士通株式会社 音声認識装置
JP2000112491A (ja) * 1998-09-30 2000-04-21 Nec Saitama Ltd 文字類似度判定装置およびその方法並びに音声認識装置およびその方法
JP2001092494A (ja) * 1999-09-24 2001-04-06 Mitsubishi Electric Corp 音声認識装置、音声認識方法および音声認識プログラム記録媒体
JP2003099087A (ja) * 2001-09-25 2003-04-04 Canon Inc 自然言語処理のための解析用辞書作成装置および方法、ならびにプログラム
JP2004029354A (ja) * 2002-06-25 2004-01-29 Toshiba Corp 音声認識装置、音声認識方法及び音声認識プログラム
JP2005227686A (ja) * 2004-02-16 2005-08-25 Sharp Corp 音声認識装置、音声認識プログラムおよび記録媒体。
JP2005275348A (ja) * 2004-02-23 2005-10-06 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP2008058341A (ja) * 2006-08-29 2008-03-13 Nippon Hoso Kyokai <Nhk> 単語分類装置及び音声認識装置及び単語分類プログラム
JP2010039539A (ja) * 2008-07-31 2010-02-18 Ntt Docomo Inc 言語モデル作成装置および言語モデル作成方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6011897A (ja) * 1983-06-30 1985-01-22 富士通株式会社 音声認識装置
JP2000112491A (ja) * 1998-09-30 2000-04-21 Nec Saitama Ltd 文字類似度判定装置およびその方法並びに音声認識装置およびその方法
JP2001092494A (ja) * 1999-09-24 2001-04-06 Mitsubishi Electric Corp 音声認識装置、音声認識方法および音声認識プログラム記録媒体
JP2003099087A (ja) * 2001-09-25 2003-04-04 Canon Inc 自然言語処理のための解析用辞書作成装置および方法、ならびにプログラム
JP2004029354A (ja) * 2002-06-25 2004-01-29 Toshiba Corp 音声認識装置、音声認識方法及び音声認識プログラム
JP2005227686A (ja) * 2004-02-16 2005-08-25 Sharp Corp 音声認識装置、音声認識プログラムおよび記録媒体。
JP2005275348A (ja) * 2004-02-23 2005-10-06 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP2008058341A (ja) * 2006-08-29 2008-03-13 Nippon Hoso Kyokai <Nhk> 単語分類装置及び音声認識装置及び単語分類プログラム
JP2010039539A (ja) * 2008-07-31 2010-02-18 Ntt Docomo Inc 言語モデル作成装置および言語モデル作成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014174423A (ja) * 2013-03-12 2014-09-22 Aisin Aw Co Ltd 音声認識システム、方法およびプログラム

Also Published As

Publication number Publication date
JP4941495B2 (ja) 2012-05-30

Similar Documents

Publication Publication Date Title
JP5599662B2 (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
JP5997217B2 (ja) 言語変換において複数の読み方の曖昧性を除去する方法
US5930746A (en) Parsing and translating natural language sentences automatically
CN108140019B (zh) 语言模型生成装置、语言模型生成方法以及记录介质
KR101279676B1 (ko) 언어 모델을 생성하기 위한 방법, 가나-간지 변환 방법 및그 장치
US9484034B2 (en) Voice conversation support apparatus, voice conversation support method, and computer readable medium
JP6778655B2 (ja) 単語連接識別モデル学習装置、単語連接検出装置、方法、及びプログラム
Scherrer et al. Word-based dialect identification with georeferenced rules
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP4089861B2 (ja) 音声認識文章入力装置
JP5097802B2 (ja) ローマ字変換を用いる日本語自動推薦システムおよび方法
KR101483947B1 (ko) 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체
JP4941495B2 (ja) ユーザ辞書作成システム、方法、及び、プログラム
JP5611270B2 (ja) 単語分割装置、及び単語分割方法
JP5795302B2 (ja) 形態素解析装置、方法、及びプログラム
JP2018077698A (ja) 発話文抽出装置、不適切話題語リスト生成装置、方法、及びプログラム
Huang et al. Error detection and correction based on Chinese phonemic alphabet in Chinese text
JP6055267B2 (ja) 文字列分割装置、モデルファイル学習装置および文字列分割システム
JP2009176148A (ja) 未知語判定システム、方法及びプログラム
Walentynowicz et al. Tagger for polish computer mediated communication texts
JP2007264858A (ja) 人名性別判定プログラム、機械翻訳プログラム、人名性別判定装置、機械翻訳装置、人名性別判定処理方法および機械翻訳処理方法
KR101869016B1 (ko) 등장인물 추출 방법 및 장치
US20180033425A1 (en) Evaluation device and evaluation method
JP2006343405A (ja) 音声理解装置、音声理解方法、単語・意味表現組データベースの作成方法、そのプログラムおよび記憶媒体
JP2014215970A (ja) 誤り検出装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120131

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120213

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees