JP2004139530A

JP2004139530A - 読み修正プログラム

Info

Publication number: JP2004139530A
Application number: JP2002305923A
Authority: JP
Inventors: Shigeru Nonami; 野波　成; Takahiko Izuno; 伊津野　貴彦; Itaru Tamura; 田村　至
Original assignee: Osaka Gas Co Ltd
Current assignee: Osaka Gas Co Ltd
Priority date: 2002-10-21
Filing date: 2002-10-21
Publication date: 2004-05-13

Abstract

【課題】本発明は、拗促音文字に対応する直音文字を拗促音文字に修正する読み修正プログラムを実現することを目的とする。
【解決手段】漢字とその読みとが対応付けされ、且つ、読みに拗促音文字が含まれる場合には、読みの拗促音文字を対応する直音文字に置き換えて登録されたデータ２０を用いる読み修正プログラムであって、データ２０から読みを検索し、拗促音文字に対応する直音文字が含まれる場合に修正対象とし、漢字と共に抽出する抽出手段１１と、漢字毎に１または複数の読みが記載された辞書１２を用い、読みの修正候補を取得する取得手段１３と、修正対象と修正候補とを、拗促音文字と対応する直音文字とを同一とみなして比較し、修正候補を特定する特定手段１４と、修正対象と前記特定された修正候補とを置き換える修正手段１５とを有する。
【選択図】　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、拗促音文字を対応する直音文字を用いて登録されたデータに対し、拗促音文字に対応する直音文字を拗促音文字に修正するプログラム及び装置に関する。
【０００２】
【従来の技術】
近年、自動車に搭載されるカーナビゲーションシステムや、ＩＶＲ（Ｉｎｔｅｒａｃｔｉｖｅ　Ｖｏｉｃｅ　Ｒｅｓｐｏｎｓｅ、音声自動応答装置）等に於いて、音声認識・合成技術を用いたシステムが開発されている。主に電話サービス系で使われる自動応答システムであるＩＶＲは、旧来の音声ガイドに従ったプッシュ・ボタンの操作に代えて、特定の単語についての発信者の入力音声の認識や、音声の合成を行う音声処理装置を用いており、発信者がより利用し易いものとなっている。
【０００３】
ここで、音声処理装置における音声認識は、一般的に、情報データベースに予め登録されている単語より、入力音声のパターンに最も類似する単語を検索・抽出して行われている。従来の音声認識に係る技術としては、例えば、文字列と音声パターンの対応を登録しておき、入力音声と類似度が高い音声パターンを有する文字列を入力音声の文字列であると認識する音声認識方法において、入力音声と類似度が高い音声パターンを有する複数の文字列の候補を求め、各候補文字列に促音文字又は拗音文字が含まれているか調べ、含まれている場合には、促音文字又は拗音文字が大きければ小さくして仮想の候補文字列を作成し、仮想候補文字列を音素に分解し、各音素に応じた音素パターンを合成して該仮想候補文字列の音声パターンを作成し、候補文字列及び仮想候補文字列の中から前記入力音声と最も類似度の高い文字列を求め、該文字列に基づいて入力音声を認識する音声認識方法がある。（特許文献１参照）
【０００４】
【特許文献１】
特開２００１−３２４９９５号公報（第１−５頁、第１図）
【０００５】
【発明が解決しようとする課題】
しかしながら、旧来の漢字とその読みとを対応付けて格納しているデータベースシステムには、システム上の制約、例えば、記憶容量の制約等から、データベースへの登録に仮名を用いる際、拗促音文字（「ァィゥェォャュョヮ」等のようにふつうの仮名より小さく表示する拗音文字、及び、促音文字「ッ」）を対応する直音文字（拗促音文字を除く普通の大きさで表示される仮名）を用いて登録する構成になっているものもあり、例えば、人名を登録する場合に「リョウコ」を「リヨウコ」として登録している。上記のようなデータベースは、音声認識・合成装置の「読み」データソースとして用いることができず、直音文字を用いて記載された拗促音文字を拗促音文字に修正する必要があった。
【０００６】
本発明は上記の問題に鑑みてなされたものであり、その目的は、拗促音文字を対応する直音文字に置き換えて登録されたデータに対し、拗促音文字に対応する直音文字を拗促音文字に修正する装置を実現し、更に、誤修正の減少、処理時間の短縮等を図る点にある。
【０００７】
【課題を解決するための手段】
この目的を達成するための本発明に係る読み修正プログラムの第一特徴構成は、特許請求の範囲の欄の請求項１に記載した如く、漢字とその読みとが対応付けされ、且つ、前記読みに拗促音文字が含まれる場合には、前記読みの拗促音文字を対応する直音文字に置き換えて登録されたデータを用いる読み修正プログラムであって、前記データから読みを検索し、少なくとも一字の拗促音文字に対応する直音文字が含まれる場合に修正対象とし、対応する漢字と共に抽出する抽出手段と、漢字毎に対応する１または複数の読みが記載された辞書を用い、前記修正対象に対応する漢字を検索し、読みの修正候補を取得する取得手段と、前記修正対象と前記修正候補とを、拗促音文字と対応する直音文字とを同一とみなして比較し、前記修正対象に対応する前記修正候補を特定する特定手段と、前記修正対象と前記特定された前記修正候補とを置き換える修正手段と、を有する点にある。
【０００８】
即ち、本発明に係る読み修正プログラムの上記第一特徴構成によれば、拗促音文字に対応する直音文字が含まれる読みを修正対象として抽出し、辞書より取得した修正候補の中から表示の大小のみ異なる修正候補を選択することにより、修正対象を拗促音文字を用いた読みに修正する。
【０００９】
直音文字のみを用いて記載されたデータの修正は、具体的には、データ内で用いられている読みについて、単文字若しくは複数文字で検索して拗促音文字に対応する直音文字が含まれるか否かを判別し、拗促音文字に対応する直音文字が含まれる場合には拗促音文字に修正する。例えば、銀行や企業等で用いられる人名データベースは、扱われる人名の数が極めて多いために、そのデータ容量が膨大なものとなっており、全ての人名（姓、名）について検索・比較等を含む修正処理を実施する場合には、人名の数に比例して処理時間の相当の長時間化が予想される。このため、データ内の読みを検索し、少なくとも一字の拗促音文字に対応する直音文字が含まれる場合に修正対象とし、修正処理を行う語句の数を限定することにより、処理回数を減らし、本発明プログラムを実行するコンピュータへの負荷を軽減する。
【００１０】
尚、拗促音文字に対応する直音文字の修正は、漢字毎に対応する１または複数の読みを記載した辞書を用い、辞書に記載された読みの修正候補の中から選択することにより行う。このような構成にすることにより、誤修正を防止することが可能になる。
【００１１】
従って、拗促音文字を対応する直音文字に置き換えて登録されたデータについて、拗促音文字を含む可能性のある読みを抽出して修正することにより、処理時間の短縮化が可能になり、修正候補を記載した辞書を用いて修正を実施することにより、より正確に修正を行うことができる読み修正プログラムを実現することができる。
【００１２】
尚、本発明に係る読み修正プログラムにより、予めデータを他のシステムに転用可能に修正しておくことにより、転用先のシステムに対し、処理の煩雑化や、記憶装置の過度の占有等、処理性能に影響を与えることなく利用可能なデータを提供することが可能になる。また、本発明プログラムは、ＣＤ−ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等のコンピュータ読み取り可能な記録媒体やインターネット等のデータ伝送媒体を介し、コンピュータがアクセス可能な記憶装置内にインストールして実行することができる。
【００１３】
同第二特徴構成は、特許請求の範囲の欄の請求項２に記載した如く、上記第一特徴構成に加えて、直音文字及び拗促音文字の組合せが登録された修正候補データベースを有し、前記抽出手段は、前記修正候補データベースに登録されている前記組合せが含まれる読みを修正対象とする点にある。
【００１４】
即ち、同第二特徴構成によれば、修正対象を抽出する際、複数文字による検索を実施して、抽出される修正対象を更に限定する。
本発明装置で用いられるデータの容量は極めて大きいことが想定されることから、修正処理の実施回数が非常に多く、処理時間が相当長期間化することが予想される。このため、修正処理（比較・修正）の実施回数を減らし、処理の短縮化を図ることが望ましい。ここで、一般的に、拗促音文字を付帯させられる直音文字は限られている。例えば、「ャ」「ュ」「ョ」は、「シャ」「シュ」「ショ」等のように、イを除くイ段等には付帯するが、ア段の文字には付帯しない。このため、直音文字と拗促音文字との組合わせを予め登録した修正候補データベースを用いることにより、修正処理を実施する修正対象を更に限定することができる。
【００１５】
従って、修正候補データベースを用いて抽出される修正対象を限定することにより、修正処理を実行する修正対象をできる限り限定して修正処理の実施回数の減少させ、本発明に係る読み修正プログラムの処理時間を短縮させる事が可能になる。
【００１６】
同第三特徴構成は、特許請求の範囲の欄の請求項３に記載した如く、上記第一特徴構成から上記第二特徴構成に加えて、前記データは人名データベースであり、前記辞書は人名辞書である点にある。
【００１７】
同第三特徴構成によれば、人名の漢字とその読みとが登録された人名データベースの読みを、拗促音文字を用いたデータに修正する。
例えば、銀行や企業等で用いられる従来のシステムでは、社員名簿等、人名の漢字及びその読みを登録した人名データベースが利用されているが、これらの人名データベースには、システム上の制約等から、読みに含まれる拗促音文字を対応する直音文字を用いて登録しているものが数多くある。近年の技術の発展に伴って、システム上の制約が解消されてきたことや、電話の自動応答システム（音声認識・合成装置）へ転用するために、人名の読みを逆修正して、拗促音文字を用いた表記に修正することが必要となっており、本発明に係る読み修正プログラムの利用性は高いと言える。また、人名辞書は、一般的に公開されていて取得が容易であり、本発明装置に組合わせることで、容易に読みの修正を実施可能になる。
【００１８】
同第四特徴構成は、特許請求の範囲の欄の請求項４に記載した如く、上記第一特徴構成から上記第三特徴構成に加えて、前記修正手段に於いて置き換えられた修正候補は、音声処理装置で用いられる点にある。
【００１９】
即ち、同第四特徴構成によれば、上記第一特徴構成から上記第三特徴構成の読み修正プログラムを用いて、拗促音文字を対応する直音文字で登録されたデータを音声処理装置で利用可能なデータに修正して提供する。
【００２０】
音声処理装置では、音声認識用の情報データベースを用い、情報データベース内の語句のパターンと入力音声のパターンとを比較して音声認識を行い、情報データベース内の語句を用いて音声合成を行う。このため、音声認識・合成を正しく行うために、情報データベース内の語句は正しい読みが記載されていることが必要であり、拗促音文字を対応する直音文字で登録されているデータは、そのままでは情報データベースとして利用できないため、正しい読みに修正する必要がある。従って、読み修正プログラムを用いることにより、簡易に、且つ、容易に、音声処理装置に於いて利用可能にデータを修正する事が可能になる。
【００２１】
上記目的を達成するための本発明に係る読み修正装置は、特許請求の範囲の欄の請求項５に記載した如く、読み修正プログラムを含む上記第一特徴構成から上記第四特徴構成のいずれかに記載の各手段を実装しており、上述した全ての作用・効果を得ることができる。
【００２２】
そのプログラム実装の具体的として、コンピュータ上で上記読み修正プログラムを実行する構成や、上記読み修正プログラムに含まれる各手段に対応する機能を有するＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等のＬＳＩによるハードウェア的な構成等が考えられる。
【００２３】
【発明の実施の形態】
本発明に係る読み修正プログラム（以下、適宜「本発明プログラム」と略称する）の実施の形態について、図面に基づいて説明する。
【００２４】
図１は本発明プログラムの第一実施構成を示しており、本発明プログラムの各手段は読み修正装置１０によって実行される。
ここで、読み修正装置１０は、本発明プログラムをインストールされたパーソナルコンピュータであり、本体、表示画面、記憶装置（ハードディスク等の記憶媒体）を備え、ＣＤ−Ｒ（Ｃｏｍｐａｃｔ　Ｄｉｓｋ　Ｒｅｃｏｒｄａｂｌｅ）やＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｋ）等の所定の記憶媒体を読み取り可能に構成されている。また、本実施構成のデータ２０は、読み修正装置１０が読み取り可能な所定の記憶媒体（記憶装置）内に格納されており、漢字とその読みとが関連づけられて登録されている。データ２０内の読みは、直音文字のみを用いて登録され、拗促音文字については対応する直音文字を用いて記載されている。尚、読み修正装置１０がＬＡＮやイントラネット等の通信ネットワークに接続可能に構成され、通信ネットワークを介してデータ２０を取得する構成になっている場合には、データ２０は、本発明プログラムの実施前に、予め読み修正装置１０の記憶装置内に格納される。
【００２５】
図１に示すように、読み修正装置１０は、抽出手段１１、取得手段１３、辞書１２、特定手段１４、修正手段１５を備えて構成される。ここで、本実施構成のデータ２０は人名データベースであり、辞書１２は人名辞書である。データ２０には、人名についての漢字とその読みとが対応付けて登録され、例えば、漢字「田中　良子」と読み「タナカ　リョウコ」とが対応付けて登録されている。
【００２６】
抽出手段１１は、所定の記憶媒体にアクセスして、データ２０から読みを検索し、少なくとも一字の拗促音文字に対応する直音文字が含まれる場合に修正対象とし、対応する漢字と共に抽出する。
【００２７】
具体的には、データ２０の読み夫々について、「ァィゥェォャュョヮ」「ッ」等の拗促音文字に対応する直音文字ａ「アイウエオヤユヨワ」「ツ」が含まれるか否かを検索する。尚、本実施構成では、データ２０は人名データベースであるので、拗促音文字に対応する直音文字が含まれるか否かの判定は姓名個別に実施される。例えば、図１のデータ２０のレコード「田中　良子：タナカ　リヨウコ」であれば、「タナカ」と「リヨウコ」とを個別に検索する。「リヨウコ」には拗音文字「ョ」に対応する直音文字「ヨ」が含まれるので、「リヨウコ」を修正対象とする。尚、拗促音文字は直音文字に付帯して使用されることから、単文字で検索を実施する場合に、読みの２文字目から検索を開始してもよい。このような構成にすることにより、データ２０の読みの数に比例して検索処理の短縮を図ることができる。
【００２８】
続いて、抽出手段１１は、読み（姓名の何れか若しくは両方）に直音文字ａが含まれる場合には、後述する取得手段１３に対し、漢字とその読みとを提供し、姓名の何れか若しくは両方が修正対象であることを示す通知を行う。具体的には、例えば、図１のレコード「田中　良子：タナカ　リヨウコ」であれば、漢字「田中　良子」とその読み「タナカ　リヨウコ」とを提供し、名が修正対象であることを通知する。また、読み（姓名両方）に直音文字ａが含まれない場合には、後述する修正手段１５に対し、漢字とその読みとを提供する。
【００２９】
取得手段１３は、漢字毎に対応する１または複数の読みが記載された辞書１２を用い、修正対象に対応する漢字を検索し、読みの修正候補を取得する。ここで、本実施構成の辞書１２は人名辞書であり、苗字や名前についての漢字に対し、１または複数の読みが記載されている。具体的には、漢字「良子」に対し、読み「リョウコ」「ヨシコ」が、漢字「順子」に対し、読み「ジュンコ」が登録されている。
【００３０】
取得手段１３は、抽出手段１１から修正対象「リヨウコ」と対応する漢字「良子」とが提供されると、辞書１２から「良子」を検索し、登録されている読み「リョウコ」と「ヨシコ」とを取得して修正候補とする。続いて、取得手段１３は、特定手段１４に対し、修正前のデータ２０のレコード及び修正候補の提供と、姓名の何れか若しくは両方が修正対象であることを示す通知とを行う。上記例では、特定手段１４に対し、レコード「田中　良子：タナカ　リヨウコ」及び修正候補「リョウコ」「ヨシコ」を提供し、名が修正対象であることを通知する。
【００３１】
特定手段１４は、修正対象と修正候補とを、拗促音文字と対応する直音文字とを同一とみなして比較し、修正対象に対応する修正候補を特定する。具体的には、拗促音文字「ァィゥェォャュョヮ」「ッ」に対応する直音文字「アイウエオヤユヨワ」「ツ」を夫々同一の文字として検索する。例えば、漢字「良子」に対する修正対象「リヨウコ」と修正候補「リョウコ」「ヨシコ」を比較し、表示の大小、ここでは「ョ」及び「ヨ」のみ異なる「リョウコ」を漢字「良子」の読みとして特定する。
【００３２】
修正手段１５は、修正対象と特定手段１４に於いて特定された修正候補とを置き換える。具体的には、漢字「良子」に対する修正対象「リヨウコ」を修正候補「リョウコ」に置き換える。尚、本実施構成では、抽出手段１１に於いて、読みに拗促音文字に対応する直音文字が含まれていない場合には、修正手段１５に対しレコード（漢字とその読み）をそのまま出力する構成になっている。本実施構成の修正手段１５は、抽出手段１１から提供されたレコードと、特定手段１４から提供された漢字及び特定手段１４に於いて特定された修正候補とを、データ２０の記憶順との整合性を図りながら、所定の記憶媒体に出力する。尚、修正後のデータの出力は、修正前のデータ２０の格納されている記憶媒体と同種の記憶媒体に登録される構成、或いは、任意の記憶媒体に選択的に登録可能な構成であることが望ましい。本実施構成では、更に、データ２０の修正後のデータを表示画面に出力する。尚、表示画面には修正個所のみ出力する構成であってもよい。
【００３３】
本発明プログラムに於ける読み修正装置１０の処理の流れは図２に示す通りであり、データ取得工程（＃１０１）、修正対象抽出工程（＃１０３）、修正候補取得工程（＃１０５）、修正候補特定工程（＃１０６）、結果出力工程（＃１０７）の５つの処理工程から成る。尚、本実施構成では、修正対象抽出工程（＃１０３）、修正候補取得工程（＃１０５）、修正候補特定工程（＃１０６）、結果出力工程（＃１０７）の４つの処理工程を一連の修正工程（＃１０２）とし、データ２０のレコード毎に修正工程（＃１０２）を繰り返すことにより、データ２０の修正を実施する。
【００３４】
データ取得工程（＃１０１）に於いて読み修正装置１０は、先ず、データ２０を取得する。ここで、本実施構成では、データ２０は読み修正装置１０のアクセス可能な所定の記憶媒体内に格納されていることから、工程＃１０１では記憶媒体へのアクセスを行う。尚、読み修正装置１０が通信ネットワークに接続可能に構成され、データ２０が前記通信ネットワークを介して提供される構成である場合には、抽出手段１１は、データ２０を通信ネットワークを介して取得し、読み修正装置１０の記憶装置（記憶媒体）に記憶する。
【００３５】
修正対象抽出工程（＃１０３）に於いて抽出手段１１は、データ２０から漢字とその読みとを１レコードづつ読み出して、読みに拗促音文字に対応する直音文字が含まれるか否かを検索する（工程＃１０３）。拗促音文字に対応する直音文字が含まれる読みが検索された場合には、その読みを修正対象として対応する漢字と共に取得手段１３に提供し、拗促音文字に対応する直音文字が含まれない読みの場合には、修正手段１５に提供する（工程＃１０４）。
【００３６】
修正候補取得工程（＃１０５）に於いて取得手段１３は、抽出手段１１から漢字とその読み（修正対象）とが提供されると、提供された漢字を用いて辞書１２を検索し、前記漢字の読みを取得する。続いて、辞書１２から取得した読みを修正候補とし、前記漢字と共に特定手段１４に提供する。尚、本実施構成では、読みの修正対象についても前記漢字と修正候補と共に特定手段１４に提供する。
【００３７】
修正候補特定工程（＃１０６）に於いて特定手段１４は、取得手段１３から漢字と修正対象と修正候補とが提供されると、修正対象と修正候補とを拗促音文字及び対応する直音文字を同一とみなして比較する。続いて、特定手段１４は、修正対象と修正候補との差が文字の大小の違いのみである修正候補を、前記漢字の正しい読みとみなして、修正手段１５に対し、前記漢字と共に提供する。尚、本実施構成では、修正対象と修正候補との差が文字の大小の違いのみである修正候補が特定されない場合には、修正手段１５に対し漢字と修正対象とを提供すると共にその旨の通知を行う。
【００３８】
結果出力工程（＃１０７）に於いて修正手段１５は、抽出手段１１から漢字とその読みとが提供されるか、若しくは、特定手段１４から漢字とその修正候補（読み）とが提供されると、所定の記憶媒体に、漢字とその読み（修正候補）とを対応づけして登録する。更に、修正手段１５は、読み修正装置１０の表示画面上に修正後の漢字とその読みとを順次表示する。尚、特定手段１４から修正候補が特定されない旨の通知を受け取った場合には、その旨を表示画面上に表示する。
【００３９】
尚、本実施構成では、データ２０の１レコード毎に修正工程（＃１０２）を繰り返して実施する構成になっているが、読み取り装置１０の記憶装置の容量が十分にある場合には、先ず、データ２０内の全ての読みを検索して修正対象を抽出し、その後に修正対象の修正を実施する構成になっていてもよい。また、読み修正装置１０が複数の演算処理装置を有する場合や、ハードウェア的に構成されている場合等には、複数のデータ２０のレコードに対し修正工程（＃１０２）を平行して実施する構成であってもよい。但し、この場合には、修正前のデータ２０のレコードの記憶順序と修正後のデータの記憶順序が異ならないように、例えば登録順を付す等して、整合性を図る必要がある。
【００４０】
次に、本発明プログラムの第二実施構成について図３を基に説明する。
図３は本発明プログラムの第二実施構成を示しており、第一実施構成と同様、本発明プログラムの各工程は読み修正装置１０によって実行される。
本実施構成の読み修正装置１０は、第一実施構成の各手段に加えて、直音文字及び拗促音文字の組合せが登録された修正候補データベース１６を有し、抽出手段１１は、修正候補データベース１６に登録されている組合せが含まれる読みを修正対象とする。第一実施構成では、拗促音文字に対応する直音文字を単文字で検索したが、本実施構成では複数文字による検索を行う。修正候補データベース１６には、「ャ」「ュ」「ョ」に対する「シャ」「シュ」「ショ」等、直音文字と拗促音文字との組合わせが記載されており、抽出手段１１は、図２の修正対象抽出工程（＃１０３）に於いて読みの検索を実施する際に、修正候補データベース１６に登録されている文字が含まれる読みを修正対象とする。このような構成にすることにより、修正対象の数を限定して修正処理に係る時間の短縮を図ることができる。
【００４１】
尚、第一実施構成及び第二実施構成では、本発明プログラムをインストールされたパーソナルコンピュータを例に説明したが、これに限るものではなく、サーバ装置等、本発明プログラムを実行可能なコンピュータであればよい。また、ファームウェアやＦＰＧＡ等を用い、本発明プログラムに含まれる各手段をハードウェア的に実現する構成であってもよい。
【００４２】
更に、第一実施構成及び第二実施構成では、データ２０は人名データベースであるが、これに限るものではない。例えば、住所等が記載されたデータベースであってもよく、漢字とその読みとが対応付けされ、拗促音文字を対応する直音文字に置き換えられた１以上のレコード（漢字とその読み）が登録されていればよい。辞書１２は、第一実施構成及び第二実施構成ではデータ２０が人名データベースであるのに合わせて人名辞書としているが、これに限るものではなく、データ２０に対応して適切な辞書を用いることが望ましい。
【００４３】
また、本発明プログラムは、一のプログラムで実現される必要はなく、任意の手段について、別のプログラム（若しくは既存のプログラム）で構成されていてもよい。同様に、読み修正装置１０についても、読み修正装置１０の各手段は同一の装置内に構成される必要はなく、例えば、通信ネットワークを介して利用可能な任意の場所に構成されていて良い。更に、読み修正装置１０の各手段は、ハードウェア及びソフトウェアのいずれで実現されていてもよい。
【００４４】
本発明プログラム或いは読み修正装置１０は、拗促音文字を対応する直音文字に置き換えられて登録されたデータ２０を容易に修正することが可能であり、且つ、データ２０の提供の形態が所定の形態にとらわれないことから、様々な利用者（顧客）の利用形態に対応する事ができる。
【図面の簡単な説明】
【図１】本発明に係る読み修正プログラムの一実施構成を示す図
【図２】本発明に係る読み修正プログラムの処理の流れを示す図
【図３】本発明に係る読み修正プログラムの一実施構成を示す図
【符号の説明】
１０　読み修正装置
１１　抽出手段
１２　辞書
１３　取得手段
１４　特定手段
１５　修正手段
１６　修正候補データベース
２０　データ

Claims

漢字とその読みとが対応付けされ、且つ、前記読みに拗促音文字が含まれる場合には、前記読みの拗促音文字を対応する直音文字に置き換えて登録されたデータを用いる読み修正プログラムであって、
前記データから読みを検索し、少なくとも一字の拗促音文字に対応する直音文字が含まれる場合に修正対象とし、対応する漢字と共に抽出する抽出手段と、
漢字毎に対応する１または複数の読みが記載された辞書を用い、前記修正対象に対応する漢字を検索し、読みの修正候補を取得する取得手段と、
前記修正対象と前記修正候補とを、拗促音文字と対応する直音文字とを同一とみなして比較し、前記修正対象に対応する前記修正候補を特定する特定手段と、
前記修正対象と前記特定された前記修正候補とを置き換える修正手段と、を有することを特徴とする読み修正プログラム。
直音文字及び拗促音文字の組合せが登録された修正候補データベースを有し、
前記抽出手段は、前記修正候補データベースに登録されている前記組合せが含まれる読みを修正対象とすることを特徴とする請求項１に記載の読み修正プログラム。
前記データは人名データベースであり、前記辞書は人名辞書であることを特徴とする請求項１または請求項２に記載の読み修正プログラム。
前記修正手段に於いて置き換えられた修正候補は、音声処理装置で用いられることを特徴とする請求項１から請求項３の何れか一項に記載の読み修正プログラム。
請求項１から請求項４の何れか一項に記載の読み修正プログラムを実装した読み修正装置。