JP2004139530A - 読み修正プログラム - Google Patents

読み修正プログラム Download PDF

Info

Publication number
JP2004139530A
JP2004139530A JP2002305923A JP2002305923A JP2004139530A JP 2004139530 A JP2004139530 A JP 2004139530A JP 2002305923 A JP2002305923 A JP 2002305923A JP 2002305923 A JP2002305923 A JP 2002305923A JP 2004139530 A JP2004139530 A JP 2004139530A
Authority
JP
Japan
Prior art keywords
correction
reading
character
characters
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002305923A
Other languages
English (en)
Inventor
Shigeru Nonami
野波 成
Takahiko Izuno
伊津野 貴彦
Itaru Tamura
田村 至
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka Gas Co Ltd
Original Assignee
Osaka Gas Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka Gas Co Ltd filed Critical Osaka Gas Co Ltd
Priority to JP2002305923A priority Critical patent/JP2004139530A/ja
Publication of JP2004139530A publication Critical patent/JP2004139530A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】本発明は、拗促音文字に対応する直音文字を拗促音文字に修正する読み修正プログラムを実現することを目的とする。
【解決手段】漢字とその読みとが対応付けされ、且つ、読みに拗促音文字が含まれる場合には、読みの拗促音文字を対応する直音文字に置き換えて登録されたデータ20を用いる読み修正プログラムであって、データ20から読みを検索し、拗促音文字に対応する直音文字が含まれる場合に修正対象とし、漢字と共に抽出する抽出手段11と、漢字毎に1または複数の読みが記載された辞書12を用い、読みの修正候補を取得する取得手段13と、修正対象と修正候補とを、拗促音文字と対応する直音文字とを同一とみなして比較し、修正候補を特定する特定手段14と、修正対象と前記特定された修正候補とを置き換える修正手段15とを有する。
【選択図】  図1

Description

【0001】
【発明の属する技術分野】
本発明は、拗促音文字を対応する直音文字を用いて登録されたデータに対し、拗促音文字に対応する直音文字を拗促音文字に修正するプログラム及び装置に関する。
【0002】
【従来の技術】
近年、自動車に搭載されるカーナビゲーションシステムや、IVR(Interactive Voice Response、音声自動応答装置)等に於いて、音声認識・合成技術を用いたシステムが開発されている。主に電話サービス系で使われる自動応答システムであるIVRは、旧来の音声ガイドに従ったプッシュ・ボタンの操作に代えて、特定の単語についての発信者の入力音声の認識や、音声の合成を行う音声処理装置を用いており、発信者がより利用し易いものとなっている。
【0003】
ここで、音声処理装置における音声認識は、一般的に、情報データベースに予め登録されている単語より、入力音声のパターンに最も類似する単語を検索・抽出して行われている。従来の音声認識に係る技術としては、例えば、文字列と音声パターンの対応を登録しておき、入力音声と類似度が高い音声パターンを有する文字列を入力音声の文字列であると認識する音声認識方法において、入力音声と類似度が高い音声パターンを有する複数の文字列の候補を求め、各候補文字列に促音文字又は拗音文字が含まれているか調べ、含まれている場合には、促音文字又は拗音文字が大きければ小さくして仮想の候補文字列を作成し、仮想候補文字列を音素に分解し、各音素に応じた音素パターンを合成して該仮想候補文字列の音声パターンを作成し、候補文字列及び仮想候補文字列の中から前記入力音声と最も類似度の高い文字列を求め、該文字列に基づいて入力音声を認識する音声認識方法がある。(特許文献1参照)
【0004】
【特許文献1】
特開2001−324995号公報(第1−5頁、第1図)
【0005】
【発明が解決しようとする課題】
しかしながら、旧来の漢字とその読みとを対応付けて格納しているデータベースシステムには、システム上の制約、例えば、記憶容量の制約等から、データベースへの登録に仮名を用いる際、拗促音文字(「ァィゥェォャュョヮ」等のようにふつうの仮名より小さく表示する拗音文字、及び、促音文字「ッ」)を対応する直音文字(拗促音文字を除く普通の大きさで表示される仮名)を用いて登録する構成になっているものもあり、例えば、人名を登録する場合に「リョウコ」を「リヨウコ」として登録している。上記のようなデータベースは、音声認識・合成装置の「読み」データソースとして用いることができず、直音文字を用いて記載された拗促音文字を拗促音文字に修正する必要があった。
【0006】
本発明は上記の問題に鑑みてなされたものであり、その目的は、拗促音文字を対応する直音文字に置き換えて登録されたデータに対し、拗促音文字に対応する直音文字を拗促音文字に修正する装置を実現し、更に、誤修正の減少、処理時間の短縮等を図る点にある。
【0007】
【課題を解決するための手段】
この目的を達成するための本発明に係る読み修正プログラムの第一特徴構成は、特許請求の範囲の欄の請求項1に記載した如く、漢字とその読みとが対応付けされ、且つ、前記読みに拗促音文字が含まれる場合には、前記読みの拗促音文字を対応する直音文字に置き換えて登録されたデータを用いる読み修正プログラムであって、前記データから読みを検索し、少なくとも一字の拗促音文字に対応する直音文字が含まれる場合に修正対象とし、対応する漢字と共に抽出する抽出手段と、漢字毎に対応する1または複数の読みが記載された辞書を用い、前記修正対象に対応する漢字を検索し、読みの修正候補を取得する取得手段と、前記修正対象と前記修正候補とを、拗促音文字と対応する直音文字とを同一とみなして比較し、前記修正対象に対応する前記修正候補を特定する特定手段と、前記修正対象と前記特定された前記修正候補とを置き換える修正手段と、を有する点にある。
【0008】
即ち、本発明に係る読み修正プログラムの上記第一特徴構成によれば、拗促音文字に対応する直音文字が含まれる読みを修正対象として抽出し、辞書より取得した修正候補の中から表示の大小のみ異なる修正候補を選択することにより、修正対象を拗促音文字を用いた読みに修正する。
【0009】
直音文字のみを用いて記載されたデータの修正は、具体的には、データ内で用いられている読みについて、単文字若しくは複数文字で検索して拗促音文字に対応する直音文字が含まれるか否かを判別し、拗促音文字に対応する直音文字が含まれる場合には拗促音文字に修正する。例えば、銀行や企業等で用いられる人名データベースは、扱われる人名の数が極めて多いために、そのデータ容量が膨大なものとなっており、全ての人名(姓、名)について検索・比較等を含む修正処理を実施する場合には、人名の数に比例して処理時間の相当の長時間化が予想される。このため、データ内の読みを検索し、少なくとも一字の拗促音文字に対応する直音文字が含まれる場合に修正対象とし、修正処理を行う語句の数を限定することにより、処理回数を減らし、本発明プログラムを実行するコンピュータへの負荷を軽減する。
【0010】
尚、拗促音文字に対応する直音文字の修正は、漢字毎に対応する1または複数の読みを記載した辞書を用い、辞書に記載された読みの修正候補の中から選択することにより行う。このような構成にすることにより、誤修正を防止することが可能になる。
【0011】
従って、拗促音文字を対応する直音文字に置き換えて登録されたデータについて、拗促音文字を含む可能性のある読みを抽出して修正することにより、処理時間の短縮化が可能になり、修正候補を記載した辞書を用いて修正を実施することにより、より正確に修正を行うことができる読み修正プログラムを実現することができる。
【0012】
尚、本発明に係る読み修正プログラムにより、予めデータを他のシステムに転用可能に修正しておくことにより、転用先のシステムに対し、処理の煩雑化や、記憶装置の過度の占有等、処理性能に影響を与えることなく利用可能なデータを提供することが可能になる。また、本発明プログラムは、CD−ROM(Compact Disk Read Only Memory)等のコンピュータ読み取り可能な記録媒体やインターネット等のデータ伝送媒体を介し、コンピュータがアクセス可能な記憶装置内にインストールして実行することができる。
【0013】
同第二特徴構成は、特許請求の範囲の欄の請求項2に記載した如く、上記第一特徴構成に加えて、直音文字及び拗促音文字の組合せが登録された修正候補データベースを有し、前記抽出手段は、前記修正候補データベースに登録されている前記組合せが含まれる読みを修正対象とする点にある。
【0014】
即ち、同第二特徴構成によれば、修正対象を抽出する際、複数文字による検索を実施して、抽出される修正対象を更に限定する。
本発明装置で用いられるデータの容量は極めて大きいことが想定されることから、修正処理の実施回数が非常に多く、処理時間が相当長期間化することが予想される。このため、修正処理(比較・修正)の実施回数を減らし、処理の短縮化を図ることが望ましい。ここで、一般的に、拗促音文字を付帯させられる直音文字は限られている。例えば、「ャ」「ュ」「ョ」は、「シャ」「シュ」「ショ」等のように、イを除くイ段等には付帯するが、ア段の文字には付帯しない。このため、直音文字と拗促音文字との組合わせを予め登録した修正候補データベースを用いることにより、修正処理を実施する修正対象を更に限定することができる。
【0015】
従って、修正候補データベースを用いて抽出される修正対象を限定することにより、修正処理を実行する修正対象をできる限り限定して修正処理の実施回数の減少させ、本発明に係る読み修正プログラムの処理時間を短縮させる事が可能になる。
【0016】
同第三特徴構成は、特許請求の範囲の欄の請求項3に記載した如く、上記第一特徴構成から上記第二特徴構成に加えて、前記データは人名データベースであり、前記辞書は人名辞書である点にある。
【0017】
同第三特徴構成によれば、人名の漢字とその読みとが登録された人名データベースの読みを、拗促音文字を用いたデータに修正する。
例えば、銀行や企業等で用いられる従来のシステムでは、社員名簿等、人名の漢字及びその読みを登録した人名データベースが利用されているが、これらの人名データベースには、システム上の制約等から、読みに含まれる拗促音文字を対応する直音文字を用いて登録しているものが数多くある。近年の技術の発展に伴って、システム上の制約が解消されてきたことや、電話の自動応答システム(音声認識・合成装置)へ転用するために、人名の読みを逆修正して、拗促音文字を用いた表記に修正することが必要となっており、本発明に係る読み修正プログラムの利用性は高いと言える。また、人名辞書は、一般的に公開されていて取得が容易であり、本発明装置に組合わせることで、容易に読みの修正を実施可能になる。
【0018】
同第四特徴構成は、特許請求の範囲の欄の請求項4に記載した如く、上記第一特徴構成から上記第三特徴構成に加えて、前記修正手段に於いて置き換えられた修正候補は、音声処理装置で用いられる点にある。
【0019】
即ち、同第四特徴構成によれば、上記第一特徴構成から上記第三特徴構成の読み修正プログラムを用いて、拗促音文字を対応する直音文字で登録されたデータを音声処理装置で利用可能なデータに修正して提供する。
【0020】
音声処理装置では、音声認識用の情報データベースを用い、情報データベース内の語句のパターンと入力音声のパターンとを比較して音声認識を行い、情報データベース内の語句を用いて音声合成を行う。このため、音声認識・合成を正しく行うために、情報データベース内の語句は正しい読みが記載されていることが必要であり、拗促音文字を対応する直音文字で登録されているデータは、そのままでは情報データベースとして利用できないため、正しい読みに修正する必要がある。従って、読み修正プログラムを用いることにより、簡易に、且つ、容易に、音声処理装置に於いて利用可能にデータを修正する事が可能になる。
【0021】
上記目的を達成するための本発明に係る読み修正装置は、特許請求の範囲の欄の請求項5に記載した如く、読み修正プログラムを含む上記第一特徴構成から上記第四特徴構成のいずれかに記載の各手段を実装しており、上述した全ての作用・効果を得ることができる。
【0022】
そのプログラム実装の具体的として、コンピュータ上で上記読み修正プログラムを実行する構成や、上記読み修正プログラムに含まれる各手段に対応する機能を有するFPGA(Field Programmable Gate Array)等のLSIによるハードウェア的な構成等が考えられる。
【0023】
【発明の実施の形態】
本発明に係る読み修正プログラム(以下、適宜「本発明プログラム」と略称する)の実施の形態について、図面に基づいて説明する。
【0024】
図1は本発明プログラムの第一実施構成を示しており、本発明プログラムの各手段は読み修正装置10によって実行される。
ここで、読み修正装置10は、本発明プログラムをインストールされたパーソナルコンピュータであり、本体、表示画面、記憶装置(ハードディスク等の記憶媒体)を備え、CD−R(Compact Disk Recordable)やDVD(Digital Versatile Disk)等の所定の記憶媒体を読み取り可能に構成されている。また、本実施構成のデータ20は、読み修正装置10が読み取り可能な所定の記憶媒体(記憶装置)内に格納されており、漢字とその読みとが関連づけられて登録されている。データ20内の読みは、直音文字のみを用いて登録され、拗促音文字については対応する直音文字を用いて記載されている。尚、読み修正装置10がLANやイントラネット等の通信ネットワークに接続可能に構成され、通信ネットワークを介してデータ20を取得する構成になっている場合には、データ20は、本発明プログラムの実施前に、予め読み修正装置10の記憶装置内に格納される。
【0025】
図1に示すように、読み修正装置10は、抽出手段11、取得手段13、辞書12、特定手段14、修正手段15を備えて構成される。ここで、本実施構成のデータ20は人名データベースであり、辞書12は人名辞書である。データ20には、人名についての漢字とその読みとが対応付けて登録され、例えば、漢字「田中 良子」と読み「タナカ リョウコ」とが対応付けて登録されている。
【0026】
抽出手段11は、所定の記憶媒体にアクセスして、データ20から読みを検索し、少なくとも一字の拗促音文字に対応する直音文字が含まれる場合に修正対象とし、対応する漢字と共に抽出する。
【0027】
具体的には、データ20の読み夫々について、「ァィゥェォャュョヮ」「ッ」等の拗促音文字に対応する直音文字a「アイウエオヤユヨワ」「ツ」が含まれるか否かを検索する。尚、本実施構成では、データ20は人名データベースであるので、拗促音文字に対応する直音文字が含まれるか否かの判定は姓名個別に実施される。例えば、図1のデータ20のレコード「田中 良子:タナカ リヨウコ」であれば、「タナカ」と「リヨウコ」とを個別に検索する。「リヨウコ」には拗音文字「ョ」に対応する直音文字「ヨ」が含まれるので、「リヨウコ」を修正対象とする。尚、拗促音文字は直音文字に付帯して使用されることから、単文字で検索を実施する場合に、読みの2文字目から検索を開始してもよい。このような構成にすることにより、データ20の読みの数に比例して検索処理の短縮を図ることができる。
【0028】
続いて、抽出手段11は、読み(姓名の何れか若しくは両方)に直音文字aが含まれる場合には、後述する取得手段13に対し、漢字とその読みとを提供し、姓名の何れか若しくは両方が修正対象であることを示す通知を行う。具体的には、例えば、図1のレコード「田中 良子:タナカ リヨウコ」であれば、漢字「田中 良子」とその読み「タナカ リヨウコ」とを提供し、名が修正対象であることを通知する。また、読み(姓名両方)に直音文字aが含まれない場合には、後述する修正手段15に対し、漢字とその読みとを提供する。
【0029】
取得手段13は、漢字毎に対応する1または複数の読みが記載された辞書12を用い、修正対象に対応する漢字を検索し、読みの修正候補を取得する。ここで、本実施構成の辞書12は人名辞書であり、苗字や名前についての漢字に対し、1または複数の読みが記載されている。具体的には、漢字「良子」に対し、読み「リョウコ」「ヨシコ」が、漢字「順子」に対し、読み「ジュンコ」が登録されている。
【0030】
取得手段13は、抽出手段11から修正対象「リヨウコ」と対応する漢字「良子」とが提供されると、辞書12から「良子」を検索し、登録されている読み「リョウコ」と「ヨシコ」とを取得して修正候補とする。続いて、取得手段13は、特定手段14に対し、修正前のデータ20のレコード及び修正候補の提供と、姓名の何れか若しくは両方が修正対象であることを示す通知とを行う。上記例では、特定手段14に対し、レコード「田中 良子:タナカ リヨウコ」及び修正候補「リョウコ」「ヨシコ」を提供し、名が修正対象であることを通知する。
【0031】
特定手段14は、修正対象と修正候補とを、拗促音文字と対応する直音文字とを同一とみなして比較し、修正対象に対応する修正候補を特定する。具体的には、拗促音文字「ァィゥェォャュョヮ」「ッ」に対応する直音文字「アイウエオヤユヨワ」「ツ」を夫々同一の文字として検索する。例えば、漢字「良子」に対する修正対象「リヨウコ」と修正候補「リョウコ」「ヨシコ」を比較し、表示の大小、ここでは「ョ」及び「ヨ」のみ異なる「リョウコ」を漢字「良子」の読みとして特定する。
【0032】
修正手段15は、修正対象と特定手段14に於いて特定された修正候補とを置き換える。具体的には、漢字「良子」に対する修正対象「リヨウコ」を修正候補「リョウコ」に置き換える。尚、本実施構成では、抽出手段11に於いて、読みに拗促音文字に対応する直音文字が含まれていない場合には、修正手段15に対しレコード(漢字とその読み)をそのまま出力する構成になっている。本実施構成の修正手段15は、抽出手段11から提供されたレコードと、特定手段14から提供された漢字及び特定手段14に於いて特定された修正候補とを、データ20の記憶順との整合性を図りながら、所定の記憶媒体に出力する。尚、修正後のデータの出力は、修正前のデータ20の格納されている記憶媒体と同種の記憶媒体に登録される構成、或いは、任意の記憶媒体に選択的に登録可能な構成であることが望ましい。本実施構成では、更に、データ20の修正後のデータを表示画面に出力する。尚、表示画面には修正個所のみ出力する構成であってもよい。
【0033】
本発明プログラムに於ける読み修正装置10の処理の流れは図2に示す通りであり、データ取得工程(#101)、修正対象抽出工程(#103)、修正候補取得工程(#105)、修正候補特定工程(#106)、結果出力工程(#107)の5つの処理工程から成る。尚、本実施構成では、修正対象抽出工程(#103)、修正候補取得工程(#105)、修正候補特定工程(#106)、結果出力工程(#107)の4つの処理工程を一連の修正工程(#102)とし、データ20のレコード毎に修正工程(#102)を繰り返すことにより、データ20の修正を実施する。
【0034】
データ取得工程(#101)に於いて読み修正装置10は、先ず、データ20を取得する。ここで、本実施構成では、データ20は読み修正装置10のアクセス可能な所定の記憶媒体内に格納されていることから、工程#101では記憶媒体へのアクセスを行う。尚、読み修正装置10が通信ネットワークに接続可能に構成され、データ20が前記通信ネットワークを介して提供される構成である場合には、抽出手段11は、データ20を通信ネットワークを介して取得し、読み修正装置10の記憶装置(記憶媒体)に記憶する。
【0035】
修正対象抽出工程(#103)に於いて抽出手段11は、データ20から漢字とその読みとを1レコードづつ読み出して、読みに拗促音文字に対応する直音文字が含まれるか否かを検索する(工程#103)。拗促音文字に対応する直音文字が含まれる読みが検索された場合には、その読みを修正対象として対応する漢字と共に取得手段13に提供し、拗促音文字に対応する直音文字が含まれない読みの場合には、修正手段15に提供する(工程#104)。
【0036】
修正候補取得工程(#105)に於いて取得手段13は、抽出手段11から漢字とその読み(修正対象)とが提供されると、提供された漢字を用いて辞書12を検索し、前記漢字の読みを取得する。続いて、辞書12から取得した読みを修正候補とし、前記漢字と共に特定手段14に提供する。尚、本実施構成では、読みの修正対象についても前記漢字と修正候補と共に特定手段14に提供する。
【0037】
修正候補特定工程(#106)に於いて特定手段14は、取得手段13から漢字と修正対象と修正候補とが提供されると、修正対象と修正候補とを拗促音文字及び対応する直音文字を同一とみなして比較する。続いて、特定手段14は、修正対象と修正候補との差が文字の大小の違いのみである修正候補を、前記漢字の正しい読みとみなして、修正手段15に対し、前記漢字と共に提供する。尚、本実施構成では、修正対象と修正候補との差が文字の大小の違いのみである修正候補が特定されない場合には、修正手段15に対し漢字と修正対象とを提供すると共にその旨の通知を行う。
【0038】
結果出力工程(#107)に於いて修正手段15は、抽出手段11から漢字とその読みとが提供されるか、若しくは、特定手段14から漢字とその修正候補(読み)とが提供されると、所定の記憶媒体に、漢字とその読み(修正候補)とを対応づけして登録する。更に、修正手段15は、読み修正装置10の表示画面上に修正後の漢字とその読みとを順次表示する。尚、特定手段14から修正候補が特定されない旨の通知を受け取った場合には、その旨を表示画面上に表示する。
【0039】
尚、本実施構成では、データ20の1レコード毎に修正工程(#102)を繰り返して実施する構成になっているが、読み取り装置10の記憶装置の容量が十分にある場合には、先ず、データ20内の全ての読みを検索して修正対象を抽出し、その後に修正対象の修正を実施する構成になっていてもよい。また、読み修正装置10が複数の演算処理装置を有する場合や、ハードウェア的に構成されている場合等には、複数のデータ20のレコードに対し修正工程(#102)を平行して実施する構成であってもよい。但し、この場合には、修正前のデータ20のレコードの記憶順序と修正後のデータの記憶順序が異ならないように、例えば登録順を付す等して、整合性を図る必要がある。
【0040】
次に、本発明プログラムの第二実施構成について図3を基に説明する。
図3は本発明プログラムの第二実施構成を示しており、第一実施構成と同様、本発明プログラムの各工程は読み修正装置10によって実行される。
本実施構成の読み修正装置10は、第一実施構成の各手段に加えて、直音文字及び拗促音文字の組合せが登録された修正候補データベース16を有し、抽出手段11は、修正候補データベース16に登録されている組合せが含まれる読みを修正対象とする。第一実施構成では、拗促音文字に対応する直音文字を単文字で検索したが、本実施構成では複数文字による検索を行う。修正候補データベース16には、「ャ」「ュ」「ョ」に対する「シャ」「シュ」「ショ」等、直音文字と拗促音文字との組合わせが記載されており、抽出手段11は、図2の修正対象抽出工程(#103)に於いて読みの検索を実施する際に、修正候補データベース16に登録されている文字が含まれる読みを修正対象とする。このような構成にすることにより、修正対象の数を限定して修正処理に係る時間の短縮を図ることができる。
【0041】
尚、第一実施構成及び第二実施構成では、本発明プログラムをインストールされたパーソナルコンピュータを例に説明したが、これに限るものではなく、サーバ装置等、本発明プログラムを実行可能なコンピュータであればよい。また、ファームウェアやFPGA等を用い、本発明プログラムに含まれる各手段をハードウェア的に実現する構成であってもよい。
【0042】
更に、第一実施構成及び第二実施構成では、データ20は人名データベースであるが、これに限るものではない。例えば、住所等が記載されたデータベースであってもよく、漢字とその読みとが対応付けされ、拗促音文字を対応する直音文字に置き換えられた1以上のレコード(漢字とその読み)が登録されていればよい。辞書12は、第一実施構成及び第二実施構成ではデータ20が人名データベースであるのに合わせて人名辞書としているが、これに限るものではなく、データ20に対応して適切な辞書を用いることが望ましい。
【0043】
また、本発明プログラムは、一のプログラムで実現される必要はなく、任意の手段について、別のプログラム(若しくは既存のプログラム)で構成されていてもよい。同様に、読み修正装置10についても、読み修正装置10の各手段は同一の装置内に構成される必要はなく、例えば、通信ネットワークを介して利用可能な任意の場所に構成されていて良い。更に、読み修正装置10の各手段は、ハードウェア及びソフトウェアのいずれで実現されていてもよい。
【0044】
本発明プログラム或いは読み修正装置10は、拗促音文字を対応する直音文字に置き換えられて登録されたデータ20を容易に修正することが可能であり、且つ、データ20の提供の形態が所定の形態にとらわれないことから、様々な利用者(顧客)の利用形態に対応する事ができる。
【図面の簡単な説明】
【図1】本発明に係る読み修正プログラムの一実施構成を示す図
【図2】本発明に係る読み修正プログラムの処理の流れを示す図
【図3】本発明に係る読み修正プログラムの一実施構成を示す図
【符号の説明】
10 読み修正装置
11 抽出手段
12 辞書
13 取得手段
14 特定手段
15 修正手段
16 修正候補データベース
20 データ

Claims (5)

  1. 漢字とその読みとが対応付けされ、且つ、前記読みに拗促音文字が含まれる場合には、前記読みの拗促音文字を対応する直音文字に置き換えて登録されたデータを用いる読み修正プログラムであって、
    前記データから読みを検索し、少なくとも一字の拗促音文字に対応する直音文字が含まれる場合に修正対象とし、対応する漢字と共に抽出する抽出手段と、
    漢字毎に対応する1または複数の読みが記載された辞書を用い、前記修正対象に対応する漢字を検索し、読みの修正候補を取得する取得手段と、
    前記修正対象と前記修正候補とを、拗促音文字と対応する直音文字とを同一とみなして比較し、前記修正対象に対応する前記修正候補を特定する特定手段と、
    前記修正対象と前記特定された前記修正候補とを置き換える修正手段と、を有することを特徴とする読み修正プログラム。
  2. 直音文字及び拗促音文字の組合せが登録された修正候補データベースを有し、
    前記抽出手段は、前記修正候補データベースに登録されている前記組合せが含まれる読みを修正対象とすることを特徴とする請求項1に記載の読み修正プログラム。
  3. 前記データは人名データベースであり、前記辞書は人名辞書であることを特徴とする請求項1または請求項2に記載の読み修正プログラム。
  4. 前記修正手段に於いて置き換えられた修正候補は、音声処理装置で用いられることを特徴とする請求項1から請求項3の何れか一項に記載の読み修正プログラム。
  5. 請求項1から請求項4の何れか一項に記載の読み修正プログラムを実装した読み修正装置。
JP2002305923A 2002-10-21 2002-10-21 読み修正プログラム Pending JP2004139530A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002305923A JP2004139530A (ja) 2002-10-21 2002-10-21 読み修正プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002305923A JP2004139530A (ja) 2002-10-21 2002-10-21 読み修正プログラム

Publications (1)

Publication Number Publication Date
JP2004139530A true JP2004139530A (ja) 2004-05-13

Family

ID=32452878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002305923A Pending JP2004139530A (ja) 2002-10-21 2002-10-21 読み修正プログラム

Country Status (1)

Country Link
JP (1) JP2004139530A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007199410A (ja) * 2006-01-26 2007-08-09 Internatl Business Mach Corp <Ibm> テキストに付与する発音情報の編集を支援するシステム
JP2012194264A (ja) * 2011-03-15 2012-10-11 Fujitsu Frontech Ltd 自動取引装置、音声読み上げ方法及び音声読み上げプログラム
JP2014075005A (ja) * 2012-10-03 2014-04-24 Zenrin Datacom Co Ltd 情報処理装置、情報処理方法、及びプログラム
JP2015170218A (ja) * 2014-03-07 2015-09-28 富士通株式会社 拗促音判定装置、拗促音判定方法及び拗促音判定用コンピュータプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007199410A (ja) * 2006-01-26 2007-08-09 Internatl Business Mach Corp <Ibm> テキストに付与する発音情報の編集を支援するシステム
JP2012194264A (ja) * 2011-03-15 2012-10-11 Fujitsu Frontech Ltd 自動取引装置、音声読み上げ方法及び音声読み上げプログラム
JP2014075005A (ja) * 2012-10-03 2014-04-24 Zenrin Datacom Co Ltd 情報処理装置、情報処理方法、及びプログラム
JP2015170218A (ja) * 2014-03-07 2015-09-28 富士通株式会社 拗促音判定装置、拗促音判定方法及び拗促音判定用コンピュータプログラム

Similar Documents

Publication Publication Date Title
JP4559946B2 (ja) 入力装置、入力方法および入力プログラム
US6347300B1 (en) Speech correction apparatus and method
US8364487B2 (en) Speech recognition system with display information
US7177795B1 (en) Methods and apparatus for semantic unit based automatic indexing and searching in data archive systems
US6208968B1 (en) Computer method and apparatus for text-to-speech synthesizer dictionary reduction
US20150179173A1 (en) Communication support apparatus, communication support method, and computer program product
JP4859101B2 (ja) テキストに付与する発音情報の編集を支援するシステム
JP5106608B2 (ja) 読み上げ支援装置、方法、およびプログラム
US10403265B2 (en) Voice recognition apparatus and voice recognition method
JP5025759B2 (ja) 発音矯正装置、発音矯正方法および記録媒体
JP2006243673A (ja) データ検索装置および方法
JP2010009446A (ja) 音声ファイルの検索システム、方法及びプログラム
JP2004139530A (ja) 読み修正プログラム
JP2004326367A (ja) テキスト解析装置及びテキスト解析方法、ならびにテキスト音声合成装置
JP6664466B2 (ja) 処理実行装置、処理実行装置の制御方法、および制御プログラム
JP2005339347A (ja) 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
JP6879521B1 (ja) 多言語音声認識およびテーマ−意義素解析方法および装置
JP5976255B2 (ja) 情報提供装置および情報提供方法
KR101553469B1 (ko) 다언어 어휘 음성 인식 장치 및 방법
JPS61184683A (ja) 認識結果選択方式
JPS6083136A (ja) プログラム読上装置
JP2004301968A (ja) 発話処理装置、発話処理方法及び発話処理用プログラム
JP5252209B2 (ja) 読み生成装置
JP4319851B2 (ja) 読み上げ装置、読み上げ方法及び読み上げ処理用プログラム
JP2006098552A (ja) 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法