JP4811557B2 - 音声再生装置及び発話支援装置 - Google Patents
音声再生装置及び発話支援装置 Download PDFInfo
- Publication number
- JP4811557B2 JP4811557B2 JP2005042916A JP2005042916A JP4811557B2 JP 4811557 B2 JP4811557 B2 JP 4811557B2 JP 2005042916 A JP2005042916 A JP 2005042916A JP 2005042916 A JP2005042916 A JP 2005042916A JP 4811557 B2 JP4811557 B2 JP 4811557B2
- Authority
- JP
- Japan
- Prior art keywords
- word string
- word
- replacement
- pronunciation
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
外国語学習において周知のように、たとえば日本人が英語のLとRを適切に区別して発音することは困難である。これは日本語においてLとRに対応する発音の区別がなく、いずれも「ラリルレロ」で発音していることに起因していると考えられる。
評価部で用いられる尺度として、言い換え語句間での類似度や長さ、頻度等様々な尺度があることが紹介されている。
また、頻度を尺度にして、より頻度の高い単語に言い換えるようにすると、難解な文章を平易な単語で表現するように言い換えることができる。
具体的には、変形処理部が、変換対象文を入力すると変形規則記憶部中の変形規則を用いて多くの変換の候補を生成する。評価処理部は、生成された変換の候補について、文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価するための複数の評価尺度を用いて評価し、評価結果のよい表現の文字列を選択する。その評価の高い文字列を変換結果文として出力する。
評価尺度は、評価尺度選択部によって選択することができ、また選択した評価尺度の重要度は評価重要度設定部によって設定することができる。
具体的には、テキスト変換部の発音パターン抽出部が、発音規則テーブル内に該当する発音パターンが存在するかをサーチし、読み上げた際に聞きづらいと推定される部分を抽出する。次に、テキスト変換処理部が、テキスト変換規則テーブルを用いて、抽出された部分を、読み上げを前提としたテキストに変換する。文書を音読する際の音の組み合わせという、新規な観点から広く聞きづらい表現をサーチするので、複合語単位の表現でも適切な表現に置換できる、としている。
このような従来の方法では、機械的な用語の置き換え作業を行ったのと変わりがなく、好適な言い換えによる発話支援を実現できない問題がある。
本発明は、発話者にとって発音が困難な語句を、好適な言い換えによって表現し、聴衆への意思疎通を促すための発話支援方法及び装置を提供することを目的とする。
該装置には、原稿テキストデータを装置内に取得する入力手段と、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出手段を備える。
さらに、単語列に対する同義語句を備えた同義語データベースを記憶媒体に格納し、単語列抽出手段により抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索手段を有する。
また、予め各単語列中の所定の文字又は発音記号の数に応じて困難度を記録した発音困難度データベースを記憶媒体に格納し、置換前の単語列と置換候補の単語列とについて、各単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出して、該発音困難度が最小の単語列を選択し置換する単語列置換手段と、上記手段により単語列が置換された口述用テキストを出力する出力手段とを備える。
本構成において、単語列置換手段が、置換前の単語列と置換候補の単語列とについて、該いずれかの構成する数に対して重み付け値を乗じ、その総和をとる計算を行って該発音困難度を算出し、該発音困難度が最小の単語列を選択し置換することができる。
すなわち、原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援方法であって、入力手段が、原稿テキストデータを装置内に取得する入力ステップ、単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップを有する。
そして、単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、予め各単語列中の所定の文字又は発音記号の数に応じて困難度を記録した発音困難度データベースを用いて単語列置換手段が、置換前の単語列と置換候補の単語列とについて、各単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出して、該発音困難度が最小の単語列を選択し置換する単語列置換ステップ、出力手段が、上記各ステップにより単語列が置換された口述用テキストを出力する出力ステップを少なくとも含んだ発話支援方法を提供する。
そして、単語列置換ステップにおいて、置換前の単語列と置換候補の単語列とについて、該いずれかの構成する数に対して重み付け値を乗じ、その総和をとる計算を行って該発音困難度を算出し、該発音困難度が最小の単語列を選択し置換することができる。
すなわち、コンピュータ上で、ワードプロセッサプログラムと共に用いられ、原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力するようにコンピュータを機能させる発話支援プログラムを提供する。
そして、ワードプロセッサ処理手段において編集状態の原稿テキストデータを取得する原稿テキストデータ読み出しステップ、単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップを有し、作成中の文書から単語列を抽出する。
その上で、置換単語列呈示手段が、ワードプロセッサ処理手段において編集状態の原稿テキストデータと共に、単語列選択ステップで選択された置換する単語列を呈示し、ユーザに置換の有無の入力を促す置換単語列呈示ステップ、単語列置換手段が、ユーザの入力に応じて、単語列の置換を行う単語列置換ステップを含み、以上の各ステップをコンピュータに機能させることを特徴とする、ワードプロセッサプログラムと共に用いられる発話支援プログラムを提供するものである。
そして、置換単語列呈示ステップにおいて、置換前の単語列と置換候補の単語列とについて、該いずれかの構成する数に対して重み付け値を乗じ、その総和をとる計算を行って該発音困難度を算出する構成でもよい。
特に、前後の単語列との配列がコーパス中に出現するか否かを調べることによって、不自然な置換を行わないようにすることができる。
図1は本発明における発話支援装置(1)の構成図である。本装置(1)は周知のパーソナルコンピュータ等によって構成することが望ましい。これらには、演算処理やテキスト処理を司るCPU(10)と共に、処理中のデータや、処理に用いるデータベースを格納するハードディスク(11)や、表示を行うディスプレイ、CPU(10)と協働するメモリ(13)などが備えられている。
入力された原稿テキストは、次の単語列抽出部(22)で抽出処理される。
本実施例では原稿テキストとして英文の発表用原稿を例に挙げて以下説述する。
したがって、本発明のように発音に着目する場合、空白で区切られた単語を抽出するのが簡便であり合理的である。
単語列抽出部(22)は空白コードを参照しながらテキストデータから単語を抽出していく。その際、ハードディスクに辞書データなどを備えるか、後述する同義語データベースやコーパスに含まれる情報を用いて、複数の単語で1つの意味を持つ熟語などの単語列を抽出してもよい。
形態素解析処理は周知のさまざまな手法を用いることができるが、例えば形態素解析プログラムであるJUMANを用いて形態素解析して、形態素列に分解することができる。なお、本発明の実施においては文法的に厳密な形態素解析は特に必要ではない。発音の単位毎に分割することが主な目的であるから、単に辞書データを参照して、記載される文字数の多い単語毎に抽出するといった方法でもよい。
すなわち、置換候補単語列検索部(23)はハードディスク内(11)に格納された同義語データベース(24)を参照して、抽出単語列に同義語(置換候補単語列)があるか否か検索する。
http://wordnet.princeton.edu/ ,Princeton University, Wordnet 2.0.2003年
単語列置換部(25)では置換候補単語列に言い換えを行うのが良いか、発音困難度データベース(26)を参照して演算により決定する。
困難度は例えば欄(30)のようにrightという単語の困難度13と各単語に対して個別に設定しても良い。しかし、全ての発音困難な単語を抽出するのは膨大な作業を必要とするため、欄(31)〜(33)のように単語の特性から単語列置換部(25)で算出するのが望ましい。
計算式は任意に設定することができるが、本実施例では文字・発音記号の数と、重み付け値を乗算する簡便な手法を用いている。
次に、第2段(32)では、単語列中の第1アクセントの音にL又はRが含まれる個数に着目している。一般的に第1アクセントの発音は重要であり、母国語として聞き取る者はこの音及び全体の韻律で単語を判断することも多い。そこで、第1アクセントにL又はRが含まれた場合の困難度はその個数×5と定義する。上記の困難度に加算する方法をとると、leftの困難度は1+5=6となる。
そこで、この個数×7を困難度として定義する。以上によると、rightの困難度は、いずれの条件にも1個ずつ合致するため、1+5+7=13として定義される。
また、発話者が特に発音が苦手な単語列を手動で追加して言い換えるように構成してもよい。
なお、同義語データベース中に置換候補とならない単語列(置換するとかえってLとRが増える場合など)を予め含まないように除去してある場合には、置換候補単語列は必ず抽出された単語列よりも発音困難度が小さいので、発音困難度の比較は置換候補単語列間のみで行えばよい。
図3は上記単語列置換部(25)の追加実施形態を説明する説明図である。該単語列置換部(25)以外の構成は上記と同様である。
本実施例では、言い換えにより単語列を置換しても自然な文となっているか否かを判定することを可能にする。
まず抽出された単語列(50)に対して、置換候補単語列検索部(23)で置換候補単語列が抽出(51)されると、元の原稿テキストデータからその前後k-gramの単語列を抽出(52)する。これには前後k-gram抽出部(40)が作用する。
なお抽出するのは形態素が原則であるが、本実施例では空白で区切られた単語でよい。
kは定数であって、前後独立して任意に設定できるが、本実施例では前後とも2-gram(k=2)としている。
これにより、前後k-gramは同一で置換対象の単語列のみを入れ替えた配列が生成される。
コーパスは周知のように文章とともにその品詞情報、構文情報などを付したものである。出現頻度の計数を目的とするだけであれば、コーパスに限らず一定の文章量を有するテキストデータベースを用いてもよい。
これによると、「R+母音」「L+母音」が抽出された単語列及び該置換候補単語列に含まれる頻度fb1を求め(56)、その値が最小の置換候補単語列を選べばよい。これはすなわち、発音困難度が最小の単語列を選択したことに他ならない。
この選択方法によれば、「R+母音」等の発音困難度が高い要素を含む単語列を極力置き換えることができると同時に、正しい外国語文中において出現頻度の大きな配列を抽出することができるので、自然な言い回しに寄与する。
これは、機能語だけの文脈から言い換えした表現がコーパス等に出現したとしても、必ずしもその言い換えが正しいと判断するのは困難であるが、内容語まで含めて比較することで、その判断をより正しく行えるからである。
本構成によると、言い換えたものが自然な文になっているかの検証において、言い換えた表現の周りの表現として効果的に内容語を使用できるので、確実な言い換えに寄与することができる。
発音記号は表1に示すように母音及び子音が規定されており、さらにアクセントが表示される。これらの記号は辞書データにより簡単に単語から発音記号への置き換えが可能であり、原稿テキストを一旦発音記号の表記にCPU(10)の発音記号変換部(図示しない)で変換することができる。
発音記号を用いる場合にも、発音困難度データベースには発音記号に対する困難度をそれぞれ設定した情報を備えておけばよい。
図5はそのブロック図であり、CPU(60)にはワープロを動作させる処理部であるワードプロセッサ処理部(61)を有している。ここでは公知のワープロソフトが動作し、テキストの編集、読み込み、書き出しなどを行うことができる。
各単語列に対して置換候補単語列検索部(65)が同義語データベース(66)を用いて置換候補単語列の検索を行う。
呈示にはディスプレイ(70)を用いるのが簡便であり、例えばワープロソフト上の当該単語列上に重複して置換を勧める単語列を表示する。呈示と同時に、置換をするか否かをユーザに促す表示を行う。
以上の方法によると、ユーザがワープロソフト上で口述用のテキストをタイピングしながら随時に発音しにくい単語を呈示し、承諾動作だけで言い換えを行うことができる。
本発明のシステムを実施する際には情報量の豊富な同義語データベース・コーパス等を用いることが好ましいが、情報量が少なくともユーザに呈示して、ユーザがその都度判断する本実施例のシステムであれば、十分に利用性が高い。
"approach"を"way"に書き換えたり、"length"を"size"に書き換えるなど、発音しやすい単語に書き換えられることがわかる。一方で、現在のシステムでは微妙なニュアンスの違いを言い換えられない場合もある。これには同義語データベースの内容の見直しなどにより精度を高めることが考えられる。
また、第3実施例と同じように他の実施例でも候補をユーザに対して呈示し、ユーザが言い換えを行うかいなか判断するようにしてもよい。
従来、音声合成処理技術が周知であり、音声合成手段により、テキストデータから音声波形を生成し、スピーカ等から音声再生する技術が知られている。この際、一部の発音について完全に再生することが難しく、聞き取りにくい場合がある。上記した特許文献2はこの点を解消することを目的としたものであり、助詞やポーズを補ったり、機械的に言い換えすることで解決を図っている。
これに対して本発明の技術は、上述したように規則に基づいて発音しにくい(聞き取りにくい)か否かを判定しながら新しい語句にも対応できる。
原稿テキストデータ(81)をCPU(82)にテキストデータ入力手段(83)によって入力する。該テキストデータ入力部(83)はCPUにテキストを入力する様々な手段を総称したものであり、例えばキーボードなどの直接入力する手段や、磁気ディスクなどの読み出し手段、ネットワークからの情報取得手段などを含む。
さらに、抽出された単語列と、置換候補の単語列との間で音声再現困難度データベース(87)を参照して、単語列置換部(88)で音声再現困難度を算出する。
すなわち、日本語では50音における特定の音や、促音などを定義する。例えば、音声合成部(89)で促音が不得意として、促音「っ」に音声再現困難度が5と定義されていたとする。やや不得意な場合としてすべての濁音には音声再現困難度が1と定義されていたとする。
このとき、「さっそく」の語句について、同義語データベース(86)から「すぐに」が抽出される。「すぐに」の困難度は1つの濁音を含んで1と算出されるから、困難度が5の「さっそく」は「すぐに」に置き換えられる。
一例として原稿テキストデータが日本語テキストの場合を説明すると、単語列抽出部(84)において、公知の形態素解析技術や辞書との照合によって単語列を抽出し、さらにハードディスク(91)に蓄積した表音文字対応データベースに基づいて単語の読み及びアクセント(韻律情報)を定義する。
そして、音声合成部(89)において表音文字列を音声波形に変換する。ハードディスク(91)内の波形辞書データベースから各音素の波形を読み出し、音声波形を生成する。
従って、音声合成部(89)にはすでに上記明瞭度が高まるようなテキストが与えられ、生成された音声波形は音声出力部(90)に入力される。
より一般的に発音記号で比較を行い、類似した発音を持つ発音記号を多く含む単語を言い換えることもできる。例えば類似した発音を持つ発音記号を予め音声再現困難度データベースに備えて困難度を設定することで、紛らわしい発音を多く含む単語列は言い換えるようにする。これによって、外国語に堪能でない聞き手に聴き取りやすい音声再生装置を提供することもできる。
しかし、本発明では音声合成部(89)における発音の不得意な音についての情報(発音記号が望ましい)を与えておけば、複数の言語においても各言語の同義語データベースから単語列の置換を行うことで、明瞭度の高い音声再生を実現することができる。
10 CPU
11 ハードディスク
12 ディスプレイ
13 メモリ
20 原稿テキスト
21 原稿テキスト取得部
22 単語列抽出部
23 置換候補単語列検索部
24 同義語データベース
25 単語列置換部
26 発音困難度データベース
27 口述用テキスト
Claims (9)
- 原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援装置であって、
原稿テキストデータを装置内に取得する入力手段と、
該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出手段と、
単語列に対する同義語句を備えた同義語データベースと、
単語列抽出手段により抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索手段と、
予め単語列中の所定の文字又は発音記号の数に応じて困難度を記録した発音困難度データベースと、
置換前の単語列と置換候補の単語列とについて、各単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出して、該発音困難度が最小の単語列を選択し置換する単語列置換手段と、
上記手段により単語列が置換された口述用テキストを出力する出力手段と
を備えたことを特徴とする発話支援装置。 - 原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援装置であって、
原稿テキストデータを装置内に取得する入力手段と、
該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出手段と、
単語列に対する同義語句を備えた同義語データベースと、
単語列抽出手段により抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索手段と、
2つ以上の発音の区別の困難な文字又は発音記号に関して、いずれかの所定の文字又は発音記号が単語列中に含まれる数、又はいずれかの所定の文字又は発音記号が単語列中の第1アクセントの音を構成する数、単語列中のいずれかの所定の文字又は発音記号を他方の文字又は発音記号に入れ替えたときに有意な単語列を構成する数、の少なくともいずれかの情報を備えると共に、それらの数に対して所定の重み付け値を定義した発音困難度データベースと、
置換前の単語列と置換候補の単語列とについて、該いずれかの構成する数に対して重み付け値を乗じ、その総和をとる計算を行って該発音困難度を算出し、該発音困難度が最小の単語列を選択し置換する単語列置換手段と、
上記手段により単語列が置換された口述用テキストを出力する出力手段と
を備えたことを特徴とする発話支援装置。 - 前記発話支援装置が、前記原稿テキストと同一言語のコーパスデータベースを備え、
前記単語列置換手段が、
該置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中で出現する頻度を計数する頻度計数部と、
該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列に置換する発音困難度比較置換部と
を備えたことを特徴とする
請求項1又は2に記載の発話支援装置。 - 原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援方法であって、
入力手段が、原稿テキストデータを装置内に取得する入力ステップ、
単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップ、
単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、
予め単語列中の所定の文字又は発音記号の数に応じて困難度を定めた発音困難度データベースを用い、単語列置換手段が、置換前の単語列と置換候補の単語列とについて、各単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出して、該発音困難度が最小の単語列を選択し置換する単語列置換ステップ、
出力手段が、上記各ステップにより単語列が置換された口述用テキストを出力する出力ステップ
を少なくとも含むことを特徴とする発話支援方法。 - 原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援方法であって、
入力手段が、原稿テキストデータを装置内に取得する入力ステップ、
単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップ、
単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、
予め2つ以上の発音の区別の困難な文字又は発音記号に関して、いずれかの所定の文字又は発音記号が単語列中に含まれる数、又はいずれかの所定の文字又は発音記号が単語列中の第1アクセントの音を構成する数、単語列中のいずれかの所定の文字又は発音記号を他方の文字又は発音記号に入れ替えたときに有意な単語列を構成する数、の少なくともいずれかの情報を備えると共に、それらの数に対して所定の重み付け値を定義した発音困難度データベースを用い、単語列置換手段が、置換前の単語列と置換候補の単語列とについて、該いずれかの構成する数に対して重み付け値を乗じ、その総和をとる計算を行って該発音困難度を算出し、該発音困難度が最小の単語列を選択し置換する単語列置換ステップ、
出力手段が、上記各ステップにより単語列が置換された口述用テキストを出力する出力ステップ
を少なくとも含むことを特徴とする発話支援方法。 - 前記発話支援方法の単語列置換ステップにおいて、
前記原稿テキストと同一言語のコーパスデータベースを用い、単語列置換手段が、
該置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中で出現する頻度を計数し、
該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列に置換する
請求項4又は5に記載の発話支援方法。 - コンピュータ上で、ワードプロセッサプログラムと共に用いられ、原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力するようにコンピュータを機能させる発話支援プログラムであって、
ワードプロセッサ処理手段において編集状態の原稿テキストデータを取得する原稿テキストデータ読み出しステップ、
単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップ、
単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、
予め単語列中の所定の文字又は発音記号の数に応じて困難度を定めた発音困難度データベースを用い、単語列選択手段が、置換前の単語列と置換候補の単語列とについて、各単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出して、該発音困難度が最小の単語列を選択する単語列選択ステップ、
置換単語列呈示手段が、ワードプロセッサ処理手段において編集状態の原稿テキストデータと共に、単語列選択ステップで選択された置換する単語列を呈示し、ユーザに置換の有無の入力を促す置換単語列呈示ステップ、
単語列置換手段が、ユーザの入力に応じて、単語列の置換を行う単語列置換ステップ、
の各ステップをコンピュータに機能させることを特徴とするワードプロセッサプログラムと共に用いられる発話支援プログラム。 - コンピュータ上で、ワードプロセッサプログラムと共に用いられ、原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力するようにコンピュータを機能させる発話支援プログラムであって、
ワードプロセッサ処理手段において編集状態の原稿テキストデータを取得する原稿テキストデータ読み出しステップ、
単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップ、
単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、
予め2つ以上の発音の区別の困難な文字又は発音記号に関して、いずれかの所定の文字又は発音記号が単語列中に含まれる数、又はいずれかの所定の文字又は発音記号が単語列中の第1アクセントの音を構成する数、単語列中のいずれかの所定の文字又は発音記号を他方の文字又は発音記号に入れ替えたときに有意な単語列を構成する数、の少なくともいずれかの情報を備えると共に、それらの数に対して所定の重み付け値を定義した発音困難度データベースを用い、単語列選択手段が、置換前の単語列と置換候補の単語列とについて、該いずれかの構成する数に対して重み付け値を乗じ、その総和をとる計算を行って該発音困難度を算出し、該発音困難度が最小の単語列を選択する単語列選択ステップ、
置換単語列呈示手段が、ワードプロセッサ処理手段において編集状態の原稿テキストデータと共に、単語列選択ステップで選択された置換する単語列を呈示し、ユーザに置換の有無の入力を促す置換単語列呈示ステップ、
単語列置換手段が、ユーザの入力に応じて、単語列の置換を行う単語列置換ステップ、
の各ステップをコンピュータに機能させることを特徴とするワードプロセッサプログラムと共に用いられる発話支援プログラム。 - 前記発話支援プログラムがコンピュータに機能させる置換単語列呈示ステップにおいて、
前記原稿テキストと同一言語のコーパスデータベースを用い、
置換単語列呈示手段が、該置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中で出現する頻度を計数し、該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列を呈示する
請求項7又は8のいずれかに記載のワードプロセッサプログラムと共に用いられる発話支援プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005042916A JP4811557B2 (ja) | 2005-02-18 | 2005-02-18 | 音声再生装置及び発話支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005042916A JP4811557B2 (ja) | 2005-02-18 | 2005-02-18 | 音声再生装置及び発話支援装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006227425A JP2006227425A (ja) | 2006-08-31 |
JP4811557B2 true JP4811557B2 (ja) | 2011-11-09 |
Family
ID=36988833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005042916A Expired - Fee Related JP4811557B2 (ja) | 2005-02-18 | 2005-02-18 | 音声再生装置及び発話支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4811557B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008056590A1 (fr) * | 2006-11-08 | 2008-05-15 | Nec Corporation | Dispositif de synthèse texte-parole, programme et procédé de synthèse texte-parole |
JP5120148B2 (ja) * | 2008-08-27 | 2013-01-16 | 富士通株式会社 | 確認支援装置、確認支援方法、およびコンピュータプログラム |
JP6172491B2 (ja) * | 2012-08-27 | 2017-08-02 | 株式会社アニモ | テキスト整形プログラム、方法及び装置 |
JP6171476B2 (ja) * | 2013-03-28 | 2017-08-02 | 富士通株式会社 | ドキュメント作成支援装置,ドキュメント作成支援プログラム及びドキュメント作成支援方法 |
WO2019198667A1 (ja) * | 2018-04-10 | 2019-10-17 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN110619866A (zh) * | 2018-06-19 | 2019-12-27 | 普天信息技术有限公司 | 语音合成方法及装置 |
US11120219B2 (en) | 2019-10-28 | 2021-09-14 | International Business Machines Corporation | User-customized computer-automated translation |
US20220188525A1 (en) * | 2020-12-14 | 2022-06-16 | International Business Machines Corporation | Dynamic, real-time collaboration enhancement |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0335296A (ja) * | 1989-06-30 | 1991-02-15 | Sharp Corp | テキスト音声合成装置 |
JPH03214197A (ja) * | 1990-01-18 | 1991-09-19 | Ricoh Co Ltd | 音声合成装置 |
JPH07121537A (ja) * | 1993-10-26 | 1995-05-12 | Canon Inc | 文書処理装置及びその方法 |
JP3566977B2 (ja) * | 1993-12-27 | 2004-09-15 | 株式会社東芝 | 自然言語処理装置及びその方法 |
JP3706758B2 (ja) * | 1998-12-02 | 2005-10-19 | 松下電器産業株式会社 | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 |
JP2001042883A (ja) * | 1999-07-30 | 2001-02-16 | Nec Corp | テキスト音声合成装置 |
JP2003302993A (ja) * | 2002-04-10 | 2003-10-24 | Canon Inc | 音声合成装置、音声合成方法、プログラム、記憶媒体 |
JP4004376B2 (ja) * | 2002-10-02 | 2007-11-07 | 日本電信電話株式会社 | 音声合成装置、音声合成プログラム |
JP2005283646A (ja) * | 2004-03-26 | 2005-10-13 | Matsushita Electric Ind Co Ltd | 音声認識率推定装置 |
-
2005
- 2005-02-18 JP JP2005042916A patent/JP4811557B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006227425A (ja) | 2006-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4791984B2 (ja) | 入力された音声を処理する装置、方法およびプログラム | |
US6751592B1 (en) | Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically | |
US6990450B2 (en) | System and method for converting text-to-voice | |
US20080195391A1 (en) | Hybrid Speech Synthesizer, Method and Use | |
Kumar et al. | Development of Indian language speech databases for large vocabulary speech recognition systems | |
JP4811557B2 (ja) | 音声再生装置及び発話支援装置 | |
US20070255567A1 (en) | System and method for generating a pronunciation dictionary | |
Watts | Unsupervised learning for text-to-speech synthesis | |
JP4038211B2 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
US20080120093A1 (en) | System for creating dictionary for speech synthesis, semiconductor integrated circuit device, and method for manufacturing semiconductor integrated circuit device | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
US20020103648A1 (en) | System and method for converting text-to-voice | |
US20070168193A1 (en) | Autonomous system and method for creating readable scripts for concatenative text-to-speech synthesis (TTS) corpora | |
Bettayeb et al. | Speech synthesis system for the holy quran recitation. | |
Raza et al. | Design and development of phonetically rich Urdu speech corpus | |
Kayte et al. | Implementation of Marathi Language Speech Databases for Large Dictionary | |
Demenko et al. | JURISDIC: Polish Speech Database for Taking Dictation of Legal Texts. | |
Aida–Zade et al. | The main principles of text-to-speech synthesis system | |
Raghavendra et al. | A multilingual screen reader in Indian languages | |
US20020077821A1 (en) | System and method for converting text-to-voice | |
Maamouri et al. | Dialectal Arabic telephone speech corpus: Principles, tool design, and transcription conventions | |
Labied et al. | Moroccan dialect “Darija” automatic speech recognition: a survey | |
JP2000172289A (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
Thatphithakkul et al. | LOTUS-BI: A Thai-English code-mixing speech corpus | |
Janyoi et al. | An Isarn dialect HMM-based text-to-speech system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100702 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110802 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110809 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140902 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |