JP2008191492A - 原稿校正システム - Google Patents

原稿校正システム Download PDF

Info

Publication number
JP2008191492A
JP2008191492A JP2007026991A JP2007026991A JP2008191492A JP 2008191492 A JP2008191492 A JP 2008191492A JP 2007026991 A JP2007026991 A JP 2007026991A JP 2007026991 A JP2007026991 A JP 2007026991A JP 2008191492 A JP2008191492 A JP 2008191492A
Authority
JP
Japan
Prior art keywords
voice
document
text
character
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007026991A
Other languages
English (en)
Inventor
Junko Kitahara
純子 北原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007026991A priority Critical patent/JP2008191492A/ja
Publication of JP2008191492A publication Critical patent/JP2008191492A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】漢字以外の種別の文字を含む原稿においても音声にて確実に校正する。
【解決手段】複数の種別の文字からなる原稿を音声にて出力して校正するための原稿校正システムであって、文字毎に、種別と、種別が漢字である場合にその音読み及び訓読みとが対応づけて記憶された辞書ファイル301と、原稿を音声にて出力する場合、辞書ファイル301を参照し、原稿を構成する文字のそれぞれについて、種別と、文字の種別が漢字である場合にその音読み及び訓読みとを含めて音声にて出力する音声テキスト生成手段231とを有する。
【選択図】図1

Description

本発明は、電子化されたテキストデータからなる原稿を校正するための原稿校正システムに関し、特に、原稿を音声にて出力して校正する技術に関する。
従来、音声入力による原稿作成を行う場合、原稿の入力は可能であるものの、入力された原稿の修正は視覚による確認が必要となるため、視覚障害等で視覚による原稿確認ができないような場合、一人で校正までを行うことは難しく、人を介しての原稿校正となってしまっている。
また、音声認識による原稿の修正においては、IBM ViaVoice、ドラゴンスピーチ、NEC SmartVoice等が既に製品化されているが、これらのいずれも、原稿の修正箇所を特定するためには視覚が必要となる。
また、特許文献1には、作成された文章を音声で出力することにより、音声で原稿のチェックを行うことができる文章編集装置が記載されているが、作成された文章が音声で出力されるだけであるため、入力された文字の誤変換は、視覚によらなければ確認することができない。
ここで、特許文献2に、作成された日本語文章のうち固有名詞について、1漢字毎に音読みと訓読みとを与えて合成音声で読み上げることにより、固有名詞の校正を可能とする技術が記載されている。この技術を用いれば、固有名詞について入力された文字の漢字への誤変換も確認することができるようになる。
特開平7−78149号公報 特開昭63−249261号公報
しかしながら、特許文献2に記載された技術を用いた場合、固有名詞の漢字については校正できるものの、固有名詞以外の文章について、漢字以外の平仮名、片仮名、アルファベットの種別が区別されず、作成された原稿を確実に校正できるとは言い難い。また、特許文献2には、漢字以外の文字については、音声によってどのように出力されるかが記載されていないため、漢字を含む単語について送り仮名が正しいかどうかを確認することができない虞れがある。
本発明は、上述したような従来の技術が有する問題点に鑑みてなされたものであって、漢字以外の種別の文字を含む原稿においても音声にて確実に校正することができる原稿校正システムを提供することを目的とする。
上記目的を達成するために本発明は、
複数の種別の文字からなる原稿を音声にて出力して校正するための原稿校正システムであって、
前記文字毎に、前記種別と、該種別が漢字である場合にその音読み及び訓読みとが対応づけて記憶された辞書ファイルと、
前記原稿を音声にて出力する場合、前記辞書ファイルを参照し、前記原稿を構成する文字のそれぞれについて、前記種別と、当該文字の種別が漢字である場合にその音読み及び訓読みとを含めて音声にて出力する音声テキスト生成手段とを有する。
上記のように構成された本発明においては、複数の種別の文字毎に、種別と、その種別が漢字である場合にその音読み及び訓読みとが対応づけて辞書ファイルに記憶されており、音声テキスト生成手段において原稿が音声にて出力される場合、辞書ファイルが参照され、原稿を構成する文字のそれぞれについて、種別と、文字の種別が漢字である場合にその音読み及び訓読みとを含めて音声にて出力される。
このように、原稿の音声出力にその原稿を構成する文字の種別が含まれるので、漢字以外の種別の文字を含む原稿においても、視覚にたよらない原稿校正が可能となる。
なお、本発明でいう文字の種別とは、漢字、平仮名、片仮名、アルファベットといった文字を表現する種類である。
以上説明したように本発明においては、複数の種別の文字毎に、種別と、その種別が漢字である場合にその音読み及び訓読みとが対応づけて辞書ファイルに記憶されており、音声テキスト生成手段において原稿が音声にて出力される場合、辞書ファイルが参照され、原稿を構成する文字のそれぞれについて、種別と、文字の種別が漢字である場合にその音読み及び訓読みとを含めて音声にて出力される構成としたため、漢字以外の種別の文字を含む原稿においても音声にて確実に校正することができる。
以下に、本発明の実施の形態について図面を参照して説明する。
図1は、本発明の原稿校正システムの実施の一形態を示す図である。
本形態は図1に示すように、マイク等の音声入力装置100と、本体装置200と、記憶装置300と、スピーカ等の音声テキスト出力装置400とから構成されており、本体装置200は、操作指定部220と、原稿入力部210と、再生箇所特定部230と、テキスト修正部240とから構成されている。操作指定部220は操作指定手段221からなり、原稿入力部210は音声認識テキスト化手段211からなり、再生箇所特定部230は音声テキスト生成手段231からなる。また、テキスト修正部240は、変更箇所指定手段241と修正箇所音声認識テキスト修正手段242とからなる。記憶装置300には、辞書ファイル301と、入力されたテキストからなる原稿ファイル302とが格納されている。
操作指定手段221は、音声入力装置100を介して入力された音声を元に、原稿入力を行うのか、原稿の音声再生を行うのか、原稿の校正を行うのかを指定する。
音声認識テキスト化手段211は、音声入力装置100を介して音声によって入力された原稿を音声認識によって電子テキスト化し、記憶装置300に原稿ファイル302として記憶する。
音声テキスト生成手段231は、原稿ファイル302として記憶された原稿を音声テキストとして再生するが、その際、辞書ファイル301を参照し、原稿を構成する文字のそれぞれについて、その文字が漢字なのか平仮名なのか片仮名なのかアルファベットなのかを示す種別と、その文字の種別が漢字である場合にその音読み及び訓読みとを含めて音声再生する。
変更箇所指定手段241は、音声認識で修正したい箇所の文章を入力することで、音声テキスト生成手段231にて再生された原稿のうち、校正したい箇所を特定する。
修正箇所音声認識テキスト修正手段242は、変更箇所指定手段241で特定された文節に対して、音声入力装置100を介して音声入力された文章を電子テキスト化して、記憶装置300の原稿ファイル302の修正を行う。
以下に、上記のように構成された原稿校正システムの動作について説明する。
まず、操作指定手段221は、音声入力装置100を介して入力された音声に基づいて、原稿入力部210による原稿入力を行うのか、再生箇所特定部230による原稿の音声再生を行うのか、テキスト修正部240による原稿の校正を行うのかを指定する。
操作指定手段221により、原稿入力が選択された場合、原稿入力部210が動作する。原稿入力部210の音声認識テキスト化手段211では、複数の音声認識ソフトウェアを備え、音声入力装置100を介して入力された原稿を音声認識して電子テキスト化し、記憶装置300に原稿ファイル302として記憶する。
また、操作指定手段221により、原稿の校正が選択された場合は、再生箇所特定部230とテキスト修正部240が動作する。
音声テキスト生成手段231では、複数の音声認識ソフトウェアを備え、かつ、あいまい検索機能を備え、音声テキスト再生時の再生方法や再生開始箇所の指定ができる。
図2は、図1に示した原稿校正システムにおける音声テキスト生成手段231の処理を示す図である。
音声テキスト生成手段231においては、「文章のみの再生」と「文章に文字の属性を付加して再生」とのいずれかを音声テキスト再生時の再生方法として選択し(ステップS1)、また、音声入力装置100を介して入力された音声によって再生箇所の指定を受け付け、その再生箇所を原稿ファイル302から検索する(ステップS2)。
そして、音声テキスト生成手段231は、ステップS1にて指定された再生方法によって、ステップS2にて指定された箇所から原稿の音声による再生を行い(ステップS3)、音声テキスト出力装置400から出力される。
図3は、図1に示した辞書ファイル301の一例を示す図である。
図1に示した辞書ファイル301としては、例えば図3に示すように、複数の種別の文字のそれぞれについて、その文字の種別(漢字/平仮名/片仮名/アルファベット)と、種別が漢字である場合にその音読み及び訓読みとが対応づけられて記憶されたものが考えられる。
ステップS1にて「文章に文字の属性を付加して再生」が選択された場合は、音声テキスト生成手段231は、このような辞書ファイル301を参照して、各文字について、種別(漢字/平仮名/片仮名/アルファベット)と、その種別が漢字の場合には、原稿中に使用されている漢字を、音読み/訓読みの情報を含めて再生することにより、文字に種別を明確にした再生を行い、音声による文字の確認を可能とする。また、1つの読みで執筆者あるいは校正者が判別できないような場合には、再度別の読みでの再生を可能とすることで、音声のみによる文字の正当性判断が可能となる。
例えば、図3に示した辞書ファイル301を用いて、「今日は、」を再生した場合は、『「きょうはてん」、もじかくにん「かんじくんよみ:いま」「かんじくんよみ:にち」「ひらがな:は」「くとうてん」』と出力される。また、音声入力装置100を介して「音読みで」と指定された場合は、『「きょうはてん」、もじかくにん「かんじおんよみ:こん」「かんじおんよみ:ひ」「ひらがな:は」「くとうてん」』と出力される。
また、各再生方法による再生中に、予め設定したキーワードを音声入力装置100を介して音声入力することにより、ステップS1における再生方法の選択と、ステップS2における再生箇所の指定により、再生開始箇所を変更して再生させることができる(ステップS4)。
図4は、図1に示した辞書ファイル301の他の例を示す図である。
図1に示した辞書ファイル301としては、図3に示したものに加えて、図4に示すように、文字が平仮名である場合、1つの意味を持つ文字群として記憶されたものを用いることも考えられる。その場合、音声テキスト生成手段231は、文字を文字群毎に音声にて出力することになる。例えば、図4に示した例においては、「すべきである」という文章を音声再生する場合、『「ひらがな:すべき」「ひらがな:である」』というように出力される。
テキスト修正部240の変更箇所指定手段241では、複数の音声認識ソフトウェアを備え、かつ、あいまい検索機能を備え、音声認識により修正箇所を指定できる。
図5は、図1に示した原稿校正システムにおける変更箇所指定手段241の処理を示す図である。
原稿ファイル302に記憶されたテキストデータのうち特定された箇所が、音声テキスト生成手段231によって音声再生されている際に(ステップS11)、音声入力装置100を介して修正箇所が音声にて入力されると(ステップS12)、変更箇所指定手段241は、再生されている範囲の後ろから遡って、ステップS12にて音声入力によって指定された単語を、類似単語の検索により修正箇所の候補としてあげる(ステップS13)。
そして、ステップS13にて候補としてあげられた修正箇所が入力者の意図した箇所かどうかの確認を行い(ステップS14)、候補としてあげた箇所が正しくない場合は、検索対象を次に進めるかどうかの指示に応じて(ステップS15)、ステップS12における音声入力もしくは、ステップS13における類似単語の検索により、更に前の文章を遡って検索し、修正箇所の候補をあげることで、修正箇所の特定をする。
修正箇所音声認識テキスト修正手段242は、変更箇所指定手段241で特定された箇所に対して、音声入力装置100を介して音声入力された文章を電子テキスト化して、記憶装置300の原稿ファイル302の修正を行う。
(他の実施の形態)
図6は、本発明の原稿校正システムの他の実施の形態を示す図である。
本形態は図6に示したように、図1に示したものに対して、音声入力装置100を介して音声にて入力された原稿が取り込まれるのではなく、記憶装置500に記憶された電子テキスト501が原稿入力部210にて取り込まれる点のみが異なり、そのために、原稿入力部210が、電子テキスト化済み文章を取り込む文章取込手段212により構成されている。
本形態においては、電子テキスト501が格納された記憶装置500から、文章取込手段212により電子テキストを取り込むことにより、既に電子テキスト化された文章も、音声入力による校正が可能となる。
本発明によれば、身体障害者の原稿作成/校正における自立支援といった用途に適用できる。また、高齢者等のコンピュータ操作に不慣れな人であっても、簡単に原稿作成/校正が行える。
本発明の原稿校正システムの実施の一形態を示す図である。 図1に示した原稿校正システムにおける音声テキスト生成手段の処理を示す図である。 図1に示した辞書ファイルの一例を示す図である。 図1に示した辞書ファイルの他の例を示す図である。 図1に示した原稿校正システムにおける変更箇所指定手段の処理を示す図である。 本発明の原稿校正システムの他の実施の形態を示す図である。
符号の説明
100 音声入力装置
200 本体装置
210 原稿入力部
211 音声認識テキスト化手段
212 文章取込手段
220 操作指定部
221 操作指定手段
230 テキスト修正部
231 音声テキスト生成手段
240 テキスト修正部
241 変更箇所指定手段
242 修正箇所音声認識テキスト修正手段
300,500 記憶装置
301 辞書ファイル
302 原稿ファイル
400 音声テキスト出力装置
501 電子テキスト

Claims (4)

  1. 複数の種別の文字からなる原稿を音声にて出力して校正するための原稿校正システムであって、
    前記文字毎に、前記種別と、該種別が漢字である場合にその音読み及び訓読みとが対応づけて記憶された辞書ファイルと、
    前記原稿を音声にて出力する場合、前記辞書ファイルを参照し、前記原稿を構成する文字のそれぞれについて、前記種別と、当該文字の種別が漢字である場合にその音読み及び訓読みとを含めて音声にて出力する音声テキスト生成手段とを有する原稿校正システム。
  2. 請求項1に記載の原稿校正システムにおいて、
    前記原稿が記憶された原稿ファイルを有し、
    前記音声テキスト生成手段は、音声にて指定された情報に基づいて、前記原稿のうち音声にて出力する箇所を前記原稿ファイルから検索して出力することを特徴とする原稿構成システム。
  3. 請求項2に記載の原稿校正システムにおいて、
    前記音声テキスト生成手段によって音声にて出力された文字を、音声にて指定された文字に修正して前記原稿ファイルに記憶するテキスト修正手段を有することを特徴とする原稿校正システム。
  4. 請求項1乃至3のいずれか1項に記載の原稿校正システムにおいて、
    前記辞書ファイルには、前記文字が平仮名である場合、1つの意味を持つ文字群として記憶され、
    前記音声テキスト生成手段は、前記文字を前記文字群毎に音声にて出力することを特徴とする原稿校正システム。
JP2007026991A 2007-02-06 2007-02-06 原稿校正システム Pending JP2008191492A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007026991A JP2008191492A (ja) 2007-02-06 2007-02-06 原稿校正システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007026991A JP2008191492A (ja) 2007-02-06 2007-02-06 原稿校正システム

Publications (1)

Publication Number Publication Date
JP2008191492A true JP2008191492A (ja) 2008-08-21

Family

ID=39751636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007026991A Pending JP2008191492A (ja) 2007-02-06 2007-02-06 原稿校正システム

Country Status (1)

Country Link
JP (1) JP2008191492A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011247941A (ja) * 2010-05-24 2011-12-08 Nakayo Telecommun Inc 文書校正支援装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011247941A (ja) * 2010-05-24 2011-12-08 Nakayo Telecommun Inc 文書校正支援装置

Similar Documents

Publication Publication Date Title
JP4728905B2 (ja) 音声対話装置および音声対話プログラム
JP6251958B2 (ja) 発話解析装置、音声対話制御装置、方法、及びプログラム
US20070198245A1 (en) Apparatus, method, and computer program product for supporting in communication through translation between different languages
WO2003025904A1 (en) Correcting a text recognized by speech recognition through comparison of phonetic sequences in the recognized text with a phonetic transcription of a manually input correction word
JP2001188777A (ja) 音声をテキストに関連付ける方法、音声をテキストに関連付けるコンピュータ、コンピュータで文書を生成し読み上げる方法、文書を生成し読み上げるコンピュータ、コンピュータでテキスト文書の音声再生を行う方法、テキスト文書の音声再生を行うコンピュータ、及び、文書内のテキストを編集し評価する方法
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
JP2001296880A (ja) 固有名の複数のもっともらしい発音を生成する方法および装置
JP5106608B2 (ja) 読み上げ支援装置、方法、およびプログラム
JP2008243080A (ja) 音声を翻訳する装置、方法およびプログラム
JP3104661B2 (ja) 日本語文章作成装置
JP2006243673A (ja) データ検索装置および方法
JP2009258293A (ja) 音声認識語彙辞書作成装置
JP2005241829A (ja) 音声情報処理システム、音声情報処理方法及びプログラム
JP2008191492A (ja) 原稿校正システム
JP2004271895A (ja) 複数言語音声認識システムおよび発音学習システム
US8438005B1 (en) Generating modified phonetic representations of indic words
JP2003162524A (ja) 言語処理装置
JP6411015B2 (ja) 音声合成装置、音声合成方法、およびプログラム
JP3589972B2 (ja) 音声合成装置
JP2007086404A (ja) 音声合成装置
JP4677869B2 (ja) 音声出力機能付き情報表示制御装置およびその制御プログラム
JP2006018028A (ja) 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体
JP2004309928A (ja) 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム
JP4407510B2 (ja) 音声合成装置及び音声合成プログラム