JP6172491B2 - テキスト整形プログラム、方法及び装置 - Google Patents

テキスト整形プログラム、方法及び装置 Download PDF

Info

Publication number
JP6172491B2
JP6172491B2 JP2012186302A JP2012186302A JP6172491B2 JP 6172491 B2 JP6172491 B2 JP 6172491B2 JP 2012186302 A JP2012186302 A JP 2012186302A JP 2012186302 A JP2012186302 A JP 2012186302A JP 6172491 B2 JP6172491 B2 JP 6172491B2
Authority
JP
Japan
Prior art keywords
word
attribute
text
synonym
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012186302A
Other languages
English (en)
Other versions
JP2014044289A (ja
Inventor
晋太 木村
晋太 木村
修 滝澤
修 滝澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2012186302A priority Critical patent/JP6172491B2/ja
Publication of JP2014044289A publication Critical patent/JP2014044289A/ja
Application granted granted Critical
Publication of JP6172491B2 publication Critical patent/JP6172491B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、音声合成技術に関する。
テキスト(すなわち文字列)を入力し、その合成音声(人工音声)を出力するテキスト音声合成システムでは、入力したテキストをそのまま読み上げる仕組みになっている。
一般にテキストは見てわかりやすい形で書かれている場合が多い。そのテキストをそのままテキスト音声合成システムの入力とした場合、必ずしも聴いてわかりやすく違和感のない音声に変換されるとは限らない。
このため、音の組み合わせパターンに着目して、聞きづらい発音パターンを検出した場合には、当該発音パターンを含む部分についての単語又は複合語を他の単語又は複合語に置換する処理、あるいは複合語を構成する単語間に助詞又はポーズを挿入する処理を実行するという技術が存在している。
しかしながら、実際にテキスト音声合成システムの出力が聞きづらいのは、聞きづらい発音パターンだけが原因ではない。
特開2005−65904号公報 特開2005−304942号公報 特開2007−236839号公報
従って、本発明の目的は、一側面によれば、テキスト音声合成システムの出力を聞きやすくするための技術を提供することである。
本発明に係るテキスト整形方法は、(A)データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、(B)入力テキストに含まれる各単語について、(1)聞き馴染み度合いと(2)当該単語を含む文全体の属性との一致度合いと(3)使用するテキスト音声合成における忌避度合いとのうち少なくともいずれかを含む判定要素に基づき、当該単語について抽出された同義異音語のうち置換候補を特定する特定ステップとを含む。
このような観点は、テキスト音声合成システムの出力を聞きづらくする要素であり、これらの要素を考慮に入れて同義異音語を採用すれば、テキスト音声合成システムの出力を聞きやすくすることができるようになる。
また、上記テキスト整形方法は、(C)特定ステップにおいて特定された置換候補をユーザに提示するステップと、(D)ユーザにより選択された置換候補を、入力テキスト内において、対応する単語と置換するステップとをさらに含むようにしても良い。このようにユーザに確認の上置換しても良いし、場合によっては自動的に置換してしまっても良い。なお、置換候補を採用せずとも良い。
上で述べた特定ステップが、入力テキストに含まれる各単語と当該単語について抽出された同義異音語との各々について、第2のデータ格納部に格納されている出現頻度に応じたスコアを算出するステップとを含むようにしても良い。例えば聞き馴染み度合いは、出現頻度が高いほど高いので、出現頻度に応じてスコアを算出するものである。なお、例えばスコアが小さいほど良いスコアである場合には、入力テキストに含まれる各単語について、当該単語のスコアより小さいスコアが算出された同義異音語を置換候補として特定するようにしても良い。
さらに、上で述べた特定ステップが、入力テキストに含まれる文について、第2のデータ格納部に格納されており且つ当該文に含まれる単語について設定されている1又は複数の属性の属性値を読み出して、当該文の属性値を算出するステップと、入力テキストに含まれる各単語及び当該単語について抽出された同義異音語との各々について、第2のデータ格納部に格納されている1又は複数の属性の属性値を読み出して、上記文の属性値との一致度合いに応じたスコア(例えば距離)を算出するステップとを含むようにしても良い。このようにすれば、テキスト音声合成システムの出力が違和感なく聞き取ることができるようになる。
また、上で述べた特定ステップが、入力テキストに含まれる各単語と当該単語について抽出された同義異音語との各々について、第2のデータ格納部に格納されている忌避すべき単語に一致するか否かを判断し、判断結果に応じたスコアを設定するステップを含むようにしても良い。使用するテキスト音声合成アルゴリズムによって得手不得手があるので、これに対処するものであり、これによりテキスト音声合成システムの出力が聞きやすくなる。
さらに、上で述べた判定要素が、音韻的な聞き取りにくさの度合いと意味の取りにくさの度合いと出力忌避度合いとのうち少なくともいずれかをさらに含むようにしても良い。これらも、聞きやすさに影響する要素であるためである。
また、上記テキスト整形方法は、特定ステップで特定された置換候補のうち少なくともいずれかが置換された入力テキストに対して、韻律コマンドを挿入するステップをさらに含むようにしても良い。これによって、防災放送の山彦対応などを行うことができるようになる。
なお、上記テキスト整形方法をコンピュータに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
一側面によれば、テキスト音声合成システムの出力を聞きやすくすることができるようになる。
図1は、実施の形態に係る情報処理装置の機能ブロック図である。 図2は、単語辞書格納部に格納されるデータの一例を示す図である。 図3は、実施の形態に係るメインフローを示す図である。 図4は、同義異音語ラティスの一例を示す図である。 図5は、スコア計算処理の処理フローを示す図である。 図6は、文属性との一致度を算出するための処理フローを示す図である。 図7は、スコアの計算例を示す図である。 図8は、ソート後の同義異音語ラティスの一例を示す図である。 図9は、整形後テキストの一例を示す図である。 図10は、実施の形態に係るメインフローを示す図である。 図11は、情報処理装置の変形例を示す図である。 図12は、情報処理装置の変形例を示す図である。 図13は、情報処理装置の変形例を示す図である。 図14は、コンピュータの機能ブロック図である。
図1に、本発明の実施の形態に係る情報処理装置1の機能ブロック図を示す。本実施の形態に係る情報処理装置1は、入力テキスト格納部11と、単語分割部12と、発音決定部13と、ラティス生成部14と、ラティス格納部15と、スコア計算部16と、単語辞書格納部17と、候補抽出部18と、提示部19と、韻律コマンド挿入部20と、入力部21と、出力データ格納部22と、音声合成部23と、スピーカ24とを有する。
入力テキスト格納部11には、音声合成で出力すべき当初テキストが格納されている。単語分割部12は、単語辞書格納部17に格納されているデータを用いて、テキストに含まれる文章に対して形態素解析を実施して、文章を単語に分割する。発音決定部13は、単語辞書格納部17に格納されているデータを用いて、各単語の発音を決定する。ラティス生成部14は、単語辞書格納部17に格納されているデータを用いて、各単語について同義異音語を抽出して、同義異音語ラティスを生成し、ラティス格納部15に格納する。スコア計算部16は、単語辞書格納部17に格納されているデータを用いて、同義異音語ラティスに含まれる各単語(元の単語及び同義異音語)についてスコアを算出し、ラティス格納部15に格納する。
候補抽出部18は、ラティス格納部15に格納されているデータに基づき、入力テキストに含まれる各単語について、置換すべき同義異音語を抽出し、提示部19によりユーザに対して提示する。ユーザは、提示内容に応じて、同義異音語の選択などを入力部21に対して行う。入力部21は、ユーザによる入力を受け付けて、当該入力についてのデータを候補抽出部18と場合によっては韻律コマンド挿入部20とに出力する。候補抽出部18は、入力部21からの入力データに従って、出力テキストを構成する単語列を特定し、韻律コマンド挿入部20に出力する。韻律コマンド挿入部20は、候補抽出部18は、出力テキストを構成する単語列に対して、文節毎にポーズを挿入する処理などを実施し、処理結果を出力テキスト格納部22に格納する。音声合成部23は、出力データ格納部22に格納されているデータを用いて、音声合成を行ってスピーカ24から音声を出力する。
なお、ユーザは、このスピーカ24から出力された音声に基づき、再度同義異音語の選択を行ったり、元の単語に戻したりする指示を入力部21に対して行って、以下、上で述べたような処理が、適切な音声合成が行われるまで繰り返される。
単語辞書格納部17に格納されるデータの一例を図2に示す。図2の例では、各単語について、表記と、読みと、同義異音語と、一般的な文章における出現頻度と、属性(例えば属性A乃至F)とが登録されるようになっている。例えば、属性Aは、楽しさの度合い、属性Bは、お悔やみの度合い、属性Cは、子供向けの度合い、属性Dは、高齢者向けの度合い、属性Eは、非常通報の度合い、属性Fは、格調の高さの度合いをそれぞれ表す。
また、単語辞書格納部17は、このほかに、放送禁止単語のリストと、音声合成部23が苦手とする単語のリストとを別途格納している。
次に、図3乃至図10を用いて、図1に示した情報処理装置1の処理内容を説明する。
まず、単語分割部12は、単語辞書格納部17に格納されているデータを用いて、入力テキスト格納部11に格納されている入力テキストを単語に分割し、処理結果を発音決定部13に出力する(図3:ステップS1)。発音決定部13は、単語辞書格納部17に格納されているデータを用いて、入力テキストに含まれる各単語について、発音を決定し、処理結果をラティス生成部14に出力する(ステップS3)。ここまでの処理については、従来と変わらないのでこれ以上の説明を省略する。なお、以下の処理については、1文毎に処理するものとする。
そして、ラティス生成部14は、単語辞書格納部17から、入力テキストに格納されている各単語について同義異音語を抽出して、同義異音語ラティスを生成し、ラティス格納部15に格納する(ステップS5)。例えば図4に示すような同義異音語ラティスが生成される。図4の例では、入力テキストには、単語1乃至5が含まれており、同義異音語ラティスは、各単語について、自単語と同義異音語とを含む単語列が含まれるようになっている。同義異音語ラティスに含まれる各単語については、以下の処理においてスコアが算出される。なお、入力テキストに含まれる単語は、同義異音語とは区別できるようにする。
そして、スコア計算部16は、ラティス格納部15に格納されている同義異音語ラティスに含まれる各単語について、単語辞書格納部17に格納されているデータを用いてスコアを算出するスコア計算処理を実施し、ラティス格納部15に格納する(ステップS7)。スコア計算処理については、図5及び図6を用いて説明する。
本実施の形態におけるスコア計算処理では、以下の観点にてスコアを算出する。
(A)聞き馴染み度合い
文字を読む場合には読めても、聞き馴染みのない単語は、可能な限り使用しない方が好ましい。
(B)音韻的な聞き取りにくさの度合い
「木」や「気」といった短い単語、母音の「イ」や「エ」を多く含む単語等、母音の無声化が多い単語等については、音韻的に聞き取りにくいので、可能な限り使用しない方が好ましい。
(C)意味の取りにくさの度合い
同音異義語が多い単語等、複数の意味を有する単語等、曖昧性が多い単語等、漢語や音読みの単語等は、意味が取りにくいので、可能な限り使用しない方が好ましい。
(D)放送禁止単語等
公に出力されることが禁止されている単語等は、可能な限り使用しないようにする。出力忌避度合いとも呼ぶものとする。
(E)文全体の属性との一致度合い
文全体の属性と、当該文に含まれる単語の属性とが異なっていると、聞き手は違和感を感ずるので、できる限り文全体の属性と、当該文に含まれる単語の属性とは一致することが好ましい。一致しない場合には、違和感を感じて意味を理解しづらくなる。上で述べた例では、楽しさの度合い、お悔やみの度合い、子供向けの度合い、高齢者向けの度合い、非常通報の度合い、格調の高さの度合いによって属性の一致度合いを評価する。
(F)使用する音声合成部23が不得意な単語等
使用する音声合成部23毎に、得手不得手があり、不得意な単語については、可能な限り出力回避すべきである。このような音声合成部23における単語の忌避度合いも、聞き取りやすさという点においては重要となる。なお、忌避するか否かの2段階だけではなく、さらに多い段階にて忌避度合いを表すようにしても良い。
以上のような観点にて、本実施の形態では、より大きな値の場合に、優先度が低くなるようなスコアを算出する。但し、より小さな値の場合に、優先度が低くなるようなスコアを算出するようにしても良い。
まず、スコア計算部16は、同義異音語ラティスにおける各単語について、頻度に基づくスコアを算出し、ラティス格納部15に格納する(図5:ステップS21)。例えば、単語辞書格納部17に格納されている各単語の頻度の値を読み出して、例えば頻度の逆数に比例するようなスコアを算出する。頻度が高いほど聞き馴染みのある度合いが高く、頻度が低いほど聞き馴染みのある度合いが低くなるためである。
また、スコア計算部16は、同義異音語ラティスにおける各単語について、音韻的な聞き取りにくさの度合いに基づくスコアを算出し、ラティス格納部15に格納する(ステップS23)。例えば、単語に含まれる音の長さ、母音の「イ」及び「エ」の数、無声化される母音の数を計数して、単語に含まれる音の長さの逆数に比例する値、母音の「イ」及び「エ」の数、無声化される母音の数の総和などによってスコアを算出する。
さらに、スコア計算部16は、同義異音語ラティスにおける各単語について、意味の取りにくさの度合いに基づくスコアを算出し、ラティス格納部15に格納する(ステップS25)。例えば、同音異義語の数等に応じたスコアを算出する。単語辞書格納部17に、意味の数、曖昧度合い、漢語又は音読みか否かについてのデータを含めておき、このような値を用いてスコアを算出するようにしても良い。
また、スコア計算部16は、同義異音語ラティスにおける各単語について、放送禁止単語リストに含まれているか否かを判断し、放送禁止単語リストに含まれている単語については、予め定められたスコアを設定する(ステップS27)。なお、他の処理で用いるため、放送禁止単語リストに含まれている単語については特定できるようなフラグなどをセットしておく。
さらに、スコア計算部16は、同義異音語ラティスにおける各単語について、文属性とのマッチングに対するスコアを算出する(ステップS29)。このステップS29については、図6を用いて説明する。
まず、スコア計算部16は、入力テキストに含まれる文について、特性ベクトルを算出する(ステップS41)。例えば、文に含まれる各単語について、各属性の属性値の平均値を算出して、当該属性値の平均値を含むベクトルを特性ベクトルとする。
そして、スコア計算部16は、同義異音語ラティスにおける未処理の単語を1つ特定する(ステップS43)。そして、スコア計算部16は、入力テキストの文の特性ベクトルと、特定された単語の特性ベクトルとの距離をスコアとして算出する(ステップS45)。単語の特性ベクトルは、単語辞書格納部17に格納されている各属性の属性値を含む。文の特性ベクトルaと単語の特性ベクトルbとの距離Dについては、以下のように算出する。なお属性は6つあるものとする。anは文の特性ベクトルのn番目の要素であり、bnは単語の特性ベクトルのn番目の要素とする。
D={(a1−b1)2+(a2−b2)2+(a3−b3)2+(a4−b4)2+(a5−b5)2+(a6−b6)21/2
そして、スコア計算部16は、同義異音語ラティスにおいて未処理の単語が存在するか判断する(ステップS47)。同義異音語ラティスにおいて未処理の単語が存在する場合にはステップS43に戻る。同義異音語ラティスにおいて未処理の単語が存在しない場合には、呼出元の処理に戻る。
距離Dが長い、すなわち文属性との一致度が低い単語については大きな値のスコアが設定され、距離Dが短い、すなわち文属性との一致度が高い単語については小さな値のスコアが設定される。
図5の処理の説明に戻って、スコア計算部16は、同義異音語ラティスにおける各単語について、単語辞書格納部17に格納されている、音声合成部23において不得手な単語のリストに含まれるか否かを判断し、リストに含まれる単語については、予め定められたスコアを設定する(ステップS31)。なお、他の処理でも用いるため、音声合成部23において不得手な単語のリストに含まれる単語については特定できるようなフラグなどをセットしておく。
その後、スコア計算部16は、同義異音語ラティスに含まれる各単語について、これまでに計算したスコアの合計値を算出し、ラティス格納部15に格納する(ステップS33)。
例えば、図4に示すような同義異音語ラティスであれば、図7に示すようなスコアの合計値が得られる。同義異音語ラティスに含まれる各単語について、スコアS1乃至S52が算出されている。
そして、スコア計算部16は、入力テキストに含まれる単語毎に、自単語及び同義異音語をスコアの昇順でソートする(ステップS35)。例えば、図4に示すような同義異音語ラティスであれば、スコアの値に基づき、図8に示すようなソート結果が得られる。図8の例では、ソート後の同義異音語ラティスにおいて、単語2及び3の列について、単語2よりもスコアの良い単語21、単語3よりもスコアの良い単語32及び33が存在することが分かる。
なお、本実施の形態では、図5に示したように、上で述べた全ての観点について各単語を評価していたが、上記観点の少なくともいずれかについて評価するようにしても良い。また、図5の処理フローの評価の順番は一例であって、各単語について、スコアを合計するので、スコアの計算順番も任意である。
図3の処理の説明に戻って、候補抽出部18は、ステップS35で得られたソート後の同義異音語ラティスから、置換候補単語を抽出する(ステップS9)。例えば、入力テキストに含まれる単語よりスコアが良い同義異音語が存在していれば、それを置換候補単語として抽出する。図8の例では、単語2に対して単語21並びに単語3に対して単語32及び33が抽出される。単語3については単語32のみを抽出しても良い。
そして、候補抽出部18は、置換候補単語等を提示部19によりユーザに提示する(ステップS11)。図8の例では、単語2に対して単語21を提示し、単語3に対して単語32及び33を提示しても良いし、図8そのものを提示するようにしても良い。なお、この段階で、放送禁止単語リストに含まれている単語、音声合成部23が不得意な単語のリストに含まれる単語については、識別可能な態様でユーザに提示するようにしても良い。
ユーザは音声合成を行う上で不適切部分を把握でき、ユーザに修正の候補が提示されることになる。
候補抽出部18は、ユーザから入力部21を介して置換指示を受け付けると、置換指示に係る単語(すなわち同義異音語)で、入力テキストに含まれる単語を置換する(ステップS13)。例えば、単語2を単語21で置換し、単語3を単語32で置換するように指示された場合には、図9に示すような整形後テキストが得られる。なお、置換候補単語を採用せずに元の単語をそのまま使用するように指示しても良い。この場合には、その単語の前後にポーズを入れるようにする。すなわち、単語2をそのまま採用するような指示があった場合には、単語2の前後にポーズを入れる指示となる。すなわち、ポーズ挿入指示入力が入力部21から韻律コマンド挿入部20に出力されることになる。
その後、韻律コマンド挿入部20は、置換候補単語を採用しないことに相当するポーズ挿入指示入力、防災無線などのように山彦対応が必要か否かを指示する入力を入力部21から受け付けると、前者であれば該当する単語の前後にポーズを挿入するための韻律コマンドを挿入し、山彦対応が必要である旨の入力指示があった場合には整形後テキストに対して文節毎にポーズを挿入するための韻律コマンドを挿入する(ステップS15)。韻律コマンド挿入部20の処理結果は、整形後テキストのデータと挿入された場合には韻律コマンドとが含まれ、出力データ格納部22に格納される。処理は端子Aを介して図10の処理に移行する。
その後、提示部19は、出力データ格納部22に格納されている整形後テキストをユーザに対して提示する(ステップS51)。また、音声合成部23は、出力データ格納部22に格納されている整形後テキスト及び韻律コマンドに従って、スピーカ24を介して整形後テキストについての音声を出力する(ステップS53)。ここでユーザは、全体としての音声合成結果を確認できるようになる。
そして、候補抽出部18は、ユーザから入力部21を介して変更が指示されたか判断する(ステップS55)。ユーザから変更が指示された場合には、処理は端子Bを介して図3のステップS13に戻る。一方、変更が指示されない又は確定が指示された場合には、処理を終了する。
以上のような処理を実施すれば、上で述べた観点において音声合成を行うのに適切な単語に確認の上置換して、音声合成で出力できるようになる。すなわち、聞きやすさが向上した音声出力を行うことができるようになる。
以上本発明の実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、図11に示すように、情報処理装置1bにおいて、韻律コマンド挿入部20を省略することも可能である。
さらに、例えば図12に示すように、情報処理装置1cにおいて、韻律コマンド挿入部20、提示部19、入力部21、音声合成部23及びスピーカ24を省略し、スコアに基づき置換すべきとして抽出された同義異音語を、入力テキスト内の対応する単語と自動的に置換してしまうようにしても良い。さらに、図13に示すように、提示部19、入力部21、音声合成部23及びスピーカ24を省略し、スコアに基づき置換すべきとして抽出された同義異音語を、入力テキスト内の対応する単語と自動的に置換してしまい、文節毎にポーズを入れるような処理を行うようにしても良い。
さらに、処理フローについても処理結果が変わらない限り、処理順番を入れ替えたり、処理ステップを並列実行するようにしても良い。
なお、上で述べた情報処理装置は、コンピュータ装置であって、図14に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とスピーカ2518とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
1 情報処理装置
11 入力テキスト格納部
12 単語分割部
13 発音決定部
14 ラティス生成部
15 ラティス格納部
16 スコア計算部
17 単語辞書格納部
18 候補抽出部
19 提示部
20 韻律コマンド挿入部
21 入力部
22 出力データ格納部
23 音声合成部
24 スピーカ

Claims (6)

  1. データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、
    前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する特定ステップと、
    を、コンピュータに実行させるためのテキスト整形プログラム。
  2. 前記特定ステップが、
    前記入力テキストに含まれる文について、第2のデータ格納部に格納されており且つ当該文に含まれる単語について設定されている1又は複数の属性の属性値を読み出して、当該文の属性値を算出するステップと、
    前記入力テキストに含まれ且つ同義異音語が抽出された各単語及び当該単語について抽出された前記同義異音語との各々について、前記第2のデータ格納部に格納されている1又は複数の属性の属性値を読み出して、前記文の属性値との一致度合いに応じたスコアを算出するステップと、
    を含む請求項記載のテキスト整形プログラム。
  3. 前記判定要素が、
    (1)聞き馴染み度合いと、(2)使用するテキスト音声合成における忌避度合いと、(3)音韻的な聞き取りにくさの度合いと、(4)意味の取りにくさの度合いと、(5)予め定められた出力禁止単語であるか否かとのうち少なくともいずれかをさらに含む
    請求項1又は2記載のテキスト整形プログラム。
  4. 前記特定ステップで特定された置換候補を採用しないと指示された場合、採用されなかった前記置換候補の元の単語について、ポーズを挿入するコマンドを前記入力テキストに挿入するステップ
    をさらに前記コンピュータに実行させる請求項1乃至のいずれか1つ記載のテキスト整形プログラム。
  5. データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、
    前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する特定ステップと、
    を含み、コンピュータに実行させるテキスト整形方法。
  6. データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出する手段と、
    前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する手段と、
    を有する情報処理装置。
JP2012186302A 2012-08-27 2012-08-27 テキスト整形プログラム、方法及び装置 Active JP6172491B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012186302A JP6172491B2 (ja) 2012-08-27 2012-08-27 テキスト整形プログラム、方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012186302A JP6172491B2 (ja) 2012-08-27 2012-08-27 テキスト整形プログラム、方法及び装置

Publications (2)

Publication Number Publication Date
JP2014044289A JP2014044289A (ja) 2014-03-13
JP6172491B2 true JP6172491B2 (ja) 2017-08-02

Family

ID=50395600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012186302A Active JP6172491B2 (ja) 2012-08-27 2012-08-27 テキスト整形プログラム、方法及び装置

Country Status (1)

Country Link
JP (1) JP6172491B2 (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334089A (ja) * 1997-06-05 1998-12-18 Fujitsu Ltd 文字入力装置
JP4636673B2 (ja) * 2000-11-16 2011-02-23 パナソニック株式会社 音声合成装置および音声合成方法
JP4811557B2 (ja) * 2005-02-18 2011-11-09 独立行政法人情報通信研究機構 音声再生装置及び発話支援装置
JP2008083239A (ja) * 2006-09-26 2008-04-10 Toshiba Corp 中間言語編集装置、中間言語編集方法および中間言語編集プログラム
WO2008056590A1 (fr) * 2006-11-08 2008-05-15 Nec Corporation Dispositif de synthèse texte-parole, programme et procédé de synthèse texte-parole
JP2009139390A (ja) * 2007-12-03 2009-06-25 Nec Corp 情報処理システム、処理方法及びプログラム
JP2010287020A (ja) * 2009-06-11 2010-12-24 Hitachi Ltd 同義語展開システム及び同義語展開方法
JP2011247928A (ja) * 2010-05-24 2011-12-08 Nec Corp 読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム
JP5106608B2 (ja) * 2010-09-29 2012-12-26 株式会社東芝 読み上げ支援装置、方法、およびプログラム

Also Published As

Publication number Publication date
JP2014044289A (ja) 2014-03-13

Similar Documents

Publication Publication Date Title
US10789290B2 (en) Audio data processing method and apparatus, and computer storage medium
US10037758B2 (en) Device and method for understanding user intent
US9548052B2 (en) Ebook interaction using speech recognition
JP6471074B2 (ja) 機械翻訳装置、方法及びプログラム
KR20150146373A (ko) 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치
CN106710585B (zh) 语音交互过程中的多音字播报方法及系统
CN111369974B (zh) 一种方言发音标注方法、语言识别方法及相关装置
KR20170035529A (ko) 전자 기기 및 그의 음성 인식 방법
JP2013109061A (ja) 音声データ検索システムおよびそのためのプログラム
KR20170057623A (ko) 언어장애인을 위한 다언어 어휘의 발음 합성 및 문자화 장치
US11176943B2 (en) Voice recognition device, voice recognition method, and computer program product
JP5079718B2 (ja) 外国語学習支援システム、及びプログラム
JP4964695B2 (ja) 音声合成装置及び音声合成方法並びにプログラム
CN113851106B (zh) 音频播放方法、装置、电子设备和可读存储介质
JP6172491B2 (ja) テキスト整形プログラム、方法及び装置
JP2013061591A (ja) 音声合成装置、音声合成方法およびプログラム
JP5975033B2 (ja) 音声合成装置、音声合成方法および音声合成プログラム
JP2017198790A (ja) 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム
JP2017015823A (ja) 発話練習装置、表示制御方法、及びプログラム
JP2021089300A (ja) 多言語音声認識およびテーマ−意義素解析方法および装置
JP2016142936A (ja) 音声合成用データ作成方法、及び音声合成用データ作成装置
JP4173404B2 (ja) 文セット自動生成装置、文セット自動生成プログラム、記憶媒体
JPH10228471A (ja) 音声合成システム,音声用テキスト生成システム及び記録媒体
WO2023047623A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
KR101030777B1 (ko) 스크립트 데이터 생성 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150813

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170621

R150 Certificate of patent or registration of utility model

Ref document number: 6172491

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250