JP6172491B2

JP6172491B2 - テキスト整形プログラム、方法及び装置

Info

Publication number: JP6172491B2
Application number: JP2012186302A
Authority: JP
Inventors: 晋太木村; 修滝澤
Original assignee: National Institute of Information and Communications Technology
Current assignee: National Institute of Information and Communications Technology
Priority date: 2012-08-27
Filing date: 2012-08-27
Publication date: 2017-08-02
Anticipated expiration: 2032-08-27
Also published as: JP2014044289A

Description

本発明は、音声合成技術に関する。

テキスト（すなわち文字列）を入力し、その合成音声（人工音声）を出力するテキスト音声合成システムでは、入力したテキストをそのまま読み上げる仕組みになっている。

一般にテキストは見てわかりやすい形で書かれている場合が多い。そのテキストをそのままテキスト音声合成システムの入力とした場合、必ずしも聴いてわかりやすく違和感のない音声に変換されるとは限らない。

このため、音の組み合わせパターンに着目して、聞きづらい発音パターンを検出した場合には、当該発音パターンを含む部分についての単語又は複合語を他の単語又は複合語に置換する処理、あるいは複合語を構成する単語間に助詞又はポーズを挿入する処理を実行するという技術が存在している。

しかしながら、実際にテキスト音声合成システムの出力が聞きづらいのは、聞きづらい発音パターンだけが原因ではない。

特開２００５−６５９０４号公報特開２００５−３０４９４２号公報特開２００７−２３６８３９号公報

従って、本発明の目的は、一側面によれば、テキスト音声合成システムの出力を聞きやすくするための技術を提供することである。

本発明に係るテキスト整形方法は、（Ａ）データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、（Ｂ）入力テキストに含まれる各単語について、（１）聞き馴染み度合いと（２）当該単語を含む文全体の属性との一致度合いと（３）使用するテキスト音声合成における忌避度合いとのうち少なくともいずれかを含む判定要素に基づき、当該単語について抽出された同義異音語のうち置換候補を特定する特定ステップとを含む。

このような観点は、テキスト音声合成システムの出力を聞きづらくする要素であり、これらの要素を考慮に入れて同義異音語を採用すれば、テキスト音声合成システムの出力を聞きやすくすることができるようになる。

また、上記テキスト整形方法は、（Ｃ）特定ステップにおいて特定された置換候補をユーザに提示するステップと、（Ｄ）ユーザにより選択された置換候補を、入力テキスト内において、対応する単語と置換するステップとをさらに含むようにしても良い。このようにユーザに確認の上置換しても良いし、場合によっては自動的に置換してしまっても良い。なお、置換候補を採用せずとも良い。

上で述べた特定ステップが、入力テキストに含まれる各単語と当該単語について抽出された同義異音語との各々について、第２のデータ格納部に格納されている出現頻度に応じたスコアを算出するステップとを含むようにしても良い。例えば聞き馴染み度合いは、出現頻度が高いほど高いので、出現頻度に応じてスコアを算出するものである。なお、例えばスコアが小さいほど良いスコアである場合には、入力テキストに含まれる各単語について、当該単語のスコアより小さいスコアが算出された同義異音語を置換候補として特定するようにしても良い。

さらに、上で述べた特定ステップが、入力テキストに含まれる文について、第２のデータ格納部に格納されており且つ当該文に含まれる単語について設定されている１又は複数の属性の属性値を読み出して、当該文の属性値を算出するステップと、入力テキストに含まれる各単語及び当該単語について抽出された同義異音語との各々について、第２のデータ格納部に格納されている１又は複数の属性の属性値を読み出して、上記文の属性値との一致度合いに応じたスコア（例えば距離）を算出するステップとを含むようにしても良い。このようにすれば、テキスト音声合成システムの出力が違和感なく聞き取ることができるようになる。

また、上で述べた特定ステップが、入力テキストに含まれる各単語と当該単語について抽出された同義異音語との各々について、第２のデータ格納部に格納されている忌避すべき単語に一致するか否かを判断し、判断結果に応じたスコアを設定するステップを含むようにしても良い。使用するテキスト音声合成アルゴリズムによって得手不得手があるので、これに対処するものであり、これによりテキスト音声合成システムの出力が聞きやすくなる。

さらに、上で述べた判定要素が、音韻的な聞き取りにくさの度合いと意味の取りにくさの度合いと出力忌避度合いとのうち少なくともいずれかをさらに含むようにしても良い。これらも、聞きやすさに影響する要素であるためである。

また、上記テキスト整形方法は、特定ステップで特定された置換候補のうち少なくともいずれかが置換された入力テキストに対して、韻律コマンドを挿入するステップをさらに含むようにしても良い。これによって、防災放送の山彦対応などを行うことができるようになる。

なお、上記テキスト整形方法をコンピュータに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、ＣＤ−ＲＯＭ、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。

一側面によれば、テキスト音声合成システムの出力を聞きやすくすることができるようになる。

図１は、実施の形態に係る情報処理装置の機能ブロック図である。図２は、単語辞書格納部に格納されるデータの一例を示す図である。図３は、実施の形態に係るメインフローを示す図である。図４は、同義異音語ラティスの一例を示す図である。図５は、スコア計算処理の処理フローを示す図である。図６は、文属性との一致度を算出するための処理フローを示す図である。図７は、スコアの計算例を示す図である。図８は、ソート後の同義異音語ラティスの一例を示す図である。図９は、整形後テキストの一例を示す図である。図１０は、実施の形態に係るメインフローを示す図である。図１１は、情報処理装置の変形例を示す図である。図１２は、情報処理装置の変形例を示す図である。図１３は、情報処理装置の変形例を示す図である。図１４は、コンピュータの機能ブロック図である。

図１に、本発明の実施の形態に係る情報処理装置１の機能ブロック図を示す。本実施の形態に係る情報処理装置１は、入力テキスト格納部１１と、単語分割部１２と、発音決定部１３と、ラティス生成部１４と、ラティス格納部１５と、スコア計算部１６と、単語辞書格納部１７と、候補抽出部１８と、提示部１９と、韻律コマンド挿入部２０と、入力部２１と、出力データ格納部２２と、音声合成部２３と、スピーカ２４とを有する。

入力テキスト格納部１１には、音声合成で出力すべき当初テキストが格納されている。単語分割部１２は、単語辞書格納部１７に格納されているデータを用いて、テキストに含まれる文章に対して形態素解析を実施して、文章を単語に分割する。発音決定部１３は、単語辞書格納部１７に格納されているデータを用いて、各単語の発音を決定する。ラティス生成部１４は、単語辞書格納部１７に格納されているデータを用いて、各単語について同義異音語を抽出して、同義異音語ラティスを生成し、ラティス格納部１５に格納する。スコア計算部１６は、単語辞書格納部１７に格納されているデータを用いて、同義異音語ラティスに含まれる各単語（元の単語及び同義異音語）についてスコアを算出し、ラティス格納部１５に格納する。

候補抽出部１８は、ラティス格納部１５に格納されているデータに基づき、入力テキストに含まれる各単語について、置換すべき同義異音語を抽出し、提示部１９によりユーザに対して提示する。ユーザは、提示内容に応じて、同義異音語の選択などを入力部２１に対して行う。入力部２１は、ユーザによる入力を受け付けて、当該入力についてのデータを候補抽出部１８と場合によっては韻律コマンド挿入部２０とに出力する。候補抽出部１８は、入力部２１からの入力データに従って、出力テキストを構成する単語列を特定し、韻律コマンド挿入部２０に出力する。韻律コマンド挿入部２０は、候補抽出部１８は、出力テキストを構成する単語列に対して、文節毎にポーズを挿入する処理などを実施し、処理結果を出力テキスト格納部２２に格納する。音声合成部２３は、出力データ格納部２２に格納されているデータを用いて、音声合成を行ってスピーカ２４から音声を出力する。

なお、ユーザは、このスピーカ２４から出力された音声に基づき、再度同義異音語の選択を行ったり、元の単語に戻したりする指示を入力部２１に対して行って、以下、上で述べたような処理が、適切な音声合成が行われるまで繰り返される。

単語辞書格納部１７に格納されるデータの一例を図２に示す。図２の例では、各単語について、表記と、読みと、同義異音語と、一般的な文章における出現頻度と、属性（例えば属性Ａ乃至Ｆ）とが登録されるようになっている。例えば、属性Ａは、楽しさの度合い、属性Ｂは、お悔やみの度合い、属性Ｃは、子供向けの度合い、属性Ｄは、高齢者向けの度合い、属性Ｅは、非常通報の度合い、属性Ｆは、格調の高さの度合いをそれぞれ表す。

また、単語辞書格納部１７は、このほかに、放送禁止単語のリストと、音声合成部２３が苦手とする単語のリストとを別途格納している。

次に、図３乃至図１０を用いて、図１に示した情報処理装置１の処理内容を説明する。

まず、単語分割部１２は、単語辞書格納部１７に格納されているデータを用いて、入力テキスト格納部１１に格納されている入力テキストを単語に分割し、処理結果を発音決定部１３に出力する（図３：ステップＳ１）。発音決定部１３は、単語辞書格納部１７に格納されているデータを用いて、入力テキストに含まれる各単語について、発音を決定し、処理結果をラティス生成部１４に出力する（ステップＳ３）。ここまでの処理については、従来と変わらないのでこれ以上の説明を省略する。なお、以下の処理については、１文毎に処理するものとする。

そして、ラティス生成部１４は、単語辞書格納部１７から、入力テキストに格納されている各単語について同義異音語を抽出して、同義異音語ラティスを生成し、ラティス格納部１５に格納する（ステップＳ５）。例えば図４に示すような同義異音語ラティスが生成される。図４の例では、入力テキストには、単語１乃至５が含まれており、同義異音語ラティスは、各単語について、自単語と同義異音語とを含む単語列が含まれるようになっている。同義異音語ラティスに含まれる各単語については、以下の処理においてスコアが算出される。なお、入力テキストに含まれる単語は、同義異音語とは区別できるようにする。

そして、スコア計算部１６は、ラティス格納部１５に格納されている同義異音語ラティスに含まれる各単語について、単語辞書格納部１７に格納されているデータを用いてスコアを算出するスコア計算処理を実施し、ラティス格納部１５に格納する（ステップＳ７）。スコア計算処理については、図５及び図６を用いて説明する。

本実施の形態におけるスコア計算処理では、以下の観点にてスコアを算出する。

（Ａ）聞き馴染み度合い
文字を読む場合には読めても、聞き馴染みのない単語は、可能な限り使用しない方が好ましい。

（Ｂ）音韻的な聞き取りにくさの度合い
「木」や「気」といった短い単語、母音の「イ」や「エ」を多く含む単語等、母音の無声化が多い単語等については、音韻的に聞き取りにくいので、可能な限り使用しない方が好ましい。

（Ｃ）意味の取りにくさの度合い
同音異義語が多い単語等、複数の意味を有する単語等、曖昧性が多い単語等、漢語や音読みの単語等は、意味が取りにくいので、可能な限り使用しない方が好ましい。

（Ｄ）放送禁止単語等
公に出力されることが禁止されている単語等は、可能な限り使用しないようにする。出力忌避度合いとも呼ぶものとする。

（Ｅ）文全体の属性との一致度合い
文全体の属性と、当該文に含まれる単語の属性とが異なっていると、聞き手は違和感を感ずるので、できる限り文全体の属性と、当該文に含まれる単語の属性とは一致することが好ましい。一致しない場合には、違和感を感じて意味を理解しづらくなる。上で述べた例では、楽しさの度合い、お悔やみの度合い、子供向けの度合い、高齢者向けの度合い、非常通報の度合い、格調の高さの度合いによって属性の一致度合いを評価する。

（Ｆ）使用する音声合成部２３が不得意な単語等
使用する音声合成部２３毎に、得手不得手があり、不得意な単語については、可能な限り出力回避すべきである。このような音声合成部２３における単語の忌避度合いも、聞き取りやすさという点においては重要となる。なお、忌避するか否かの２段階だけではなく、さらに多い段階にて忌避度合いを表すようにしても良い。

以上のような観点にて、本実施の形態では、より大きな値の場合に、優先度が低くなるようなスコアを算出する。但し、より小さな値の場合に、優先度が低くなるようなスコアを算出するようにしても良い。

まず、スコア計算部１６は、同義異音語ラティスにおける各単語について、頻度に基づくスコアを算出し、ラティス格納部１５に格納する（図５：ステップＳ２１）。例えば、単語辞書格納部１７に格納されている各単語の頻度の値を読み出して、例えば頻度の逆数に比例するようなスコアを算出する。頻度が高いほど聞き馴染みのある度合いが高く、頻度が低いほど聞き馴染みのある度合いが低くなるためである。

また、スコア計算部１６は、同義異音語ラティスにおける各単語について、音韻的な聞き取りにくさの度合いに基づくスコアを算出し、ラティス格納部１５に格納する（ステップＳ２３）。例えば、単語に含まれる音の長さ、母音の「イ」及び「エ」の数、無声化される母音の数を計数して、単語に含まれる音の長さの逆数に比例する値、母音の「イ」及び「エ」の数、無声化される母音の数の総和などによってスコアを算出する。

さらに、スコア計算部１６は、同義異音語ラティスにおける各単語について、意味の取りにくさの度合いに基づくスコアを算出し、ラティス格納部１５に格納する（ステップＳ２５）。例えば、同音異義語の数等に応じたスコアを算出する。単語辞書格納部１７に、意味の数、曖昧度合い、漢語又は音読みか否かについてのデータを含めておき、このような値を用いてスコアを算出するようにしても良い。

また、スコア計算部１６は、同義異音語ラティスにおける各単語について、放送禁止単語リストに含まれているか否かを判断し、放送禁止単語リストに含まれている単語については、予め定められたスコアを設定する（ステップＳ２７）。なお、他の処理で用いるため、放送禁止単語リストに含まれている単語については特定できるようなフラグなどをセットしておく。

さらに、スコア計算部１６は、同義異音語ラティスにおける各単語について、文属性とのマッチングに対するスコアを算出する（ステップＳ２９）。このステップＳ２９については、図６を用いて説明する。

まず、スコア計算部１６は、入力テキストに含まれる文について、特性ベクトルを算出する（ステップＳ４１）。例えば、文に含まれる各単語について、各属性の属性値の平均値を算出して、当該属性値の平均値を含むベクトルを特性ベクトルとする。

そして、スコア計算部１６は、同義異音語ラティスにおける未処理の単語を１つ特定する（ステップＳ４３）。そして、スコア計算部１６は、入力テキストの文の特性ベクトルと、特定された単語の特性ベクトルとの距離をスコアとして算出する（ステップＳ４５）。単語の特性ベクトルは、単語辞書格納部１７に格納されている各属性の属性値を含む。文の特性ベクトルａと単語の特性ベクトルｂとの距離Ｄについては、以下のように算出する。なお属性は６つあるものとする。ａnは文の特性ベクトルのｎ番目の要素であり、ｂnは単語の特性ベクトルのｎ番目の要素とする。
Ｄ＝｛（ａ１−ｂ１）²＋（ａ２−ｂ２）²＋（ａ３−ｂ３）²＋（ａ４−ｂ４）²＋（ａ５−ｂ５）²＋（ａ６−ｂ６）²｝^1/2

そして、スコア計算部１６は、同義異音語ラティスにおいて未処理の単語が存在するか判断する（ステップＳ４７）。同義異音語ラティスにおいて未処理の単語が存在する場合にはステップＳ４３に戻る。同義異音語ラティスにおいて未処理の単語が存在しない場合には、呼出元の処理に戻る。

距離Ｄが長い、すなわち文属性との一致度が低い単語については大きな値のスコアが設定され、距離Ｄが短い、すなわち文属性との一致度が高い単語については小さな値のスコアが設定される。

図５の処理の説明に戻って、スコア計算部１６は、同義異音語ラティスにおける各単語について、単語辞書格納部１７に格納されている、音声合成部２３において不得手な単語のリストに含まれるか否かを判断し、リストに含まれる単語については、予め定められたスコアを設定する（ステップＳ３１）。なお、他の処理でも用いるため、音声合成部２３において不得手な単語のリストに含まれる単語については特定できるようなフラグなどをセットしておく。

その後、スコア計算部１６は、同義異音語ラティスに含まれる各単語について、これまでに計算したスコアの合計値を算出し、ラティス格納部１５に格納する（ステップＳ３３）。

例えば、図４に示すような同義異音語ラティスであれば、図７に示すようなスコアの合計値が得られる。同義異音語ラティスに含まれる各単語について、スコアＳ₁乃至Ｓ₅₂が算出されている。

そして、スコア計算部１６は、入力テキストに含まれる単語毎に、自単語及び同義異音語をスコアの昇順でソートする（ステップＳ３５）。例えば、図４に示すような同義異音語ラティスであれば、スコアの値に基づき、図８に示すようなソート結果が得られる。図８の例では、ソート後の同義異音語ラティスにおいて、単語２及び３の列について、単語２よりもスコアの良い単語２１、単語３よりもスコアの良い単語３２及び３３が存在することが分かる。

なお、本実施の形態では、図５に示したように、上で述べた全ての観点について各単語を評価していたが、上記観点の少なくともいずれかについて評価するようにしても良い。また、図５の処理フローの評価の順番は一例であって、各単語について、スコアを合計するので、スコアの計算順番も任意である。

図３の処理の説明に戻って、候補抽出部１８は、ステップＳ３５で得られたソート後の同義異音語ラティスから、置換候補単語を抽出する（ステップＳ９）。例えば、入力テキストに含まれる単語よりスコアが良い同義異音語が存在していれば、それを置換候補単語として抽出する。図８の例では、単語２に対して単語２１並びに単語３に対して単語３２及び３３が抽出される。単語３については単語３２のみを抽出しても良い。

そして、候補抽出部１８は、置換候補単語等を提示部１９によりユーザに提示する（ステップＳ１１）。図８の例では、単語２に対して単語２１を提示し、単語３に対して単語３２及び３３を提示しても良いし、図８そのものを提示するようにしても良い。なお、この段階で、放送禁止単語リストに含まれている単語、音声合成部２３が不得意な単語のリストに含まれる単語については、識別可能な態様でユーザに提示するようにしても良い。

ユーザは音声合成を行う上で不適切部分を把握でき、ユーザに修正の候補が提示されることになる。

候補抽出部１８は、ユーザから入力部２１を介して置換指示を受け付けると、置換指示に係る単語（すなわち同義異音語）で、入力テキストに含まれる単語を置換する（ステップＳ１３）。例えば、単語２を単語２１で置換し、単語３を単語３２で置換するように指示された場合には、図９に示すような整形後テキストが得られる。なお、置換候補単語を採用せずに元の単語をそのまま使用するように指示しても良い。この場合には、その単語の前後にポーズを入れるようにする。すなわち、単語２をそのまま採用するような指示があった場合には、単語２の前後にポーズを入れる指示となる。すなわち、ポーズ挿入指示入力が入力部２１から韻律コマンド挿入部２０に出力されることになる。

その後、韻律コマンド挿入部２０は、置換候補単語を採用しないことに相当するポーズ挿入指示入力、防災無線などのように山彦対応が必要か否かを指示する入力を入力部２１から受け付けると、前者であれば該当する単語の前後にポーズを挿入するための韻律コマンドを挿入し、山彦対応が必要である旨の入力指示があった場合には整形後テキストに対して文節毎にポーズを挿入するための韻律コマンドを挿入する（ステップＳ１５）。韻律コマンド挿入部２０の処理結果は、整形後テキストのデータと挿入された場合には韻律コマンドとが含まれ、出力データ格納部２２に格納される。処理は端子Ａを介して図１０の処理に移行する。

その後、提示部１９は、出力データ格納部２２に格納されている整形後テキストをユーザに対して提示する（ステップＳ５１）。また、音声合成部２３は、出力データ格納部２２に格納されている整形後テキスト及び韻律コマンドに従って、スピーカ２４を介して整形後テキストについての音声を出力する（ステップＳ５３）。ここでユーザは、全体としての音声合成結果を確認できるようになる。

そして、候補抽出部１８は、ユーザから入力部２１を介して変更が指示されたか判断する（ステップＳ５５）。ユーザから変更が指示された場合には、処理は端子Ｂを介して図３のステップＳ１３に戻る。一方、変更が指示されない又は確定が指示された場合には、処理を終了する。

以上のような処理を実施すれば、上で述べた観点において音声合成を行うのに適切な単語に確認の上置換して、音声合成で出力できるようになる。すなわち、聞きやすさが向上した音声出力を行うことができるようになる。

以上本発明の実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、図１１に示すように、情報処理装置１ｂにおいて、韻律コマンド挿入部２０を省略することも可能である。

さらに、例えば図１２に示すように、情報処理装置１ｃにおいて、韻律コマンド挿入部２０、提示部１９、入力部２１、音声合成部２３及びスピーカ２４を省略し、スコアに基づき置換すべきとして抽出された同義異音語を、入力テキスト内の対応する単語と自動的に置換してしまうようにしても良い。さらに、図１３に示すように、提示部１９、入力部２１、音声合成部２３及びスピーカ２４を省略し、スコアに基づき置換すべきとして抽出された同義異音語を、入力テキスト内の対応する単語と自動的に置換してしまい、文節毎にポーズを入れるような処理を行うようにしても良い。

さらに、処理フローについても処理結果が変わらない限り、処理順番を入れ替えたり、処理ステップを並列実行するようにしても良い。

なお、上で述べた情報処理装置は、コンピュータ装置であって、図１４に示すように、メモリ２５０１とＣＰＵ（Central Processing Unit）２５０３とハードディスク・ドライブ（ＨＤＤ：Hard Disk Drive）２５０５と表示装置２５０９に接続される表示制御部２５０７とリムーバブル・ディスク２５１１用のドライブ装置２５１３と入力装置２５１５とネットワークに接続するための通信制御部２５１７とスピーカ２５１８とがバス２５１９で接続されている。オペレーティング・システム（ＯＳ：Operating System）及び本実施例における処理を実施するためのアプリケーション・プログラムは、ＨＤＤ２５０５に格納されており、ＣＰＵ２５０３により実行される際にはＨＤＤ２５０５からメモリ２５０１に読み出される。ＣＰＵ２５０３は、アプリケーション・プログラムの処理内容に応じて表示制御部２５０７、通信制御部２５１７、ドライブ装置２５１３を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ２５０１に格納されるが、ＨＤＤ２５０５に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク２５１１に格納されて頒布され、ドライブ装置２５１３からＨＤＤ２５０５にインストールされる。インターネットなどのネットワーク及び通信制御部２５１７を経由して、ＨＤＤ２５０５にインストールされる場合もある。このようなコンピュータ装置は、上で述べたＣＰＵ２５０３、メモリ２５０１などのハードウエアとＯＳ及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。

１情報処理装置
１１入力テキスト格納部
１２単語分割部
１３発音決定部
１４ラティス生成部
１５ラティス格納部
１６スコア計算部
１７単語辞書格納部
１８候補抽出部
１９提示部
２０韻律コマンド挿入部
２１入力部
２２出力データ格納部
２３音声合成部
２４スピーカ

Claims

データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、
前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する特定ステップと、
を、コンピュータに実行させるためのテキスト整形プログラム。
前記特定ステップが、
前記入力テキストに含まれる文について、第２のデータ格納部に格納されており且つ当該文に含まれる単語について設定されている１又は複数の属性の属性値を読み出して、当該文の属性値を算出するステップと、
前記入力テキストに含まれ且つ同義異音語が抽出された各単語及び当該単語について抽出された前記同義異音語との各々について、前記第２のデータ格納部に格納されている１又は複数の属性の属性値を読み出して、前記文の属性値との一致度合いに応じたスコアを算出するステップと、
を含む請求項１記載のテキスト整形プログラム。
前記判定要素が、
（１）聞き馴染み度合いと、（２）使用するテキスト音声合成における忌避度合いと、（３）音韻的な聞き取りにくさの度合いと、（４）意味の取りにくさの度合いと、（５）予め定められた出力禁止単語であるか否かとのうち少なくともいずれかをさらに含む
請求項１又は２記載のテキスト整形プログラム。
前記特定ステップで特定された置換候補を採用しないと指示された場合、採用されなかった前記置換候補の元の単語について、ポーズを挿入するコマンドを前記入力テキストに挿入するステップ
をさらに前記コンピュータに実行させる請求項１乃至３のいずれか１つ記載のテキスト整形プログラム。
データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、
前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する特定ステップと、
を含み、コンピュータに実行させるテキスト整形方法。
データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出する手段と、
前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する手段と、
を有する情報処理装置。