JP2007199410A - テキストに付与する発音情報の編集を支援するシステム - Google Patents

テキストに付与する発音情報の編集を支援するシステム Download PDF

Info

Publication number
JP2007199410A
JP2007199410A JP2006018063A JP2006018063A JP2007199410A JP 2007199410 A JP2007199410 A JP 2007199410A JP 2006018063 A JP2006018063 A JP 2006018063A JP 2006018063 A JP2006018063 A JP 2006018063A JP 2007199410 A JP2007199410 A JP 2007199410A
Authority
JP
Japan
Prior art keywords
pronunciation information
target text
phrase
pronunciation
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006018063A
Other languages
English (en)
Other versions
JP4859101B2 (ja
Inventor
Tetsuya Uda
哲也 宇田
Yusuke Kitagawa
北川 裕介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2006018063A priority Critical patent/JP4859101B2/ja
Priority to CN2007100044550A priority patent/CN101009094B/zh
Publication of JP2007199410A publication Critical patent/JP2007199410A/ja
Application granted granted Critical
Publication of JP4859101B2 publication Critical patent/JP4859101B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】テキストの読みを効率的に生成する。
【解決手段】テキストの発音を示す発音情報の編集を支援するシステムであって、発音情報を生成する対象となる対象テキスト、対象テキストの表層表現に基づいて生成された発音情報、および、対象テキストに含まれる語句の品詞の候補を取得する取得部と、品詞の候補として固有名詞を含む語句の発音情報を他の語句の発音情報よりも優先して、対象テキストに対応付けて表示する表示制御部と、表示された発音情報を利用者の指示に応じて修正し、修正された発音情報を対象テキストに対応付けて記録装置に記録する修正処理部とを備えるシステム。
【選択図】図1

Description

本発明は、編集を支援するシステムに関する。特に、本発明は、テキストに付与する発音情報の編集を支援するシステムに関する。
近年、コンピュータによってテキストに基づいて発音情報を生成する技術が用いられている。この技術は、テキストの読み上げのみならず、字幕付きテレビ放送の支援など、応用範囲が広い。しかしながら、従来は、テキストに含まれる全ての語句に対して誤り無く発音情報を生成することは困難であった。例えば、「東」という漢字に敬称の「さん」を付した人名は、「ひがしさん」と読まれる場合や、「あずまさん」と読まれる場合がある。このような人名の読みは、従来の形態素解析や文脈解析によっても区別することが困難である。そのうえ、人名の読み間違いは聞き手に不快感や違和感を与え易い場合が多い。
特開平9−171392号公報
したがって、従来、校正者が、コンピュータによって生成された発音情報を確認し、必要な修正を施している。例えば、特許文献1では、発音情報の修正のために、コンピュータとの対話的なユーザインターフェイスを校正者に提供する技術が提案されている。しかしながら、この技術では、テキストの量が多い場合には、校正者の作業負担が膨大となってしまっていた。また、人名の誤りを正確に修正するためには、この校正者が、充分なスキル・背景知識を有していなければならなかった。
そこで本発明は、上記の課題を解決することのできるシステム、プログラムおよび方法を提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
上記課題を解決するために、本発明の第1の形態においては、テキストの発音を示す発音情報の編集を支援するシステムであって、発音情報を生成する対象となる対象テキスト、対象テキストの表層表現に基づいて生成された発音情報、および、対象テキストに含まれる語句の品詞の候補を取得する取得部と、品詞の候補として固有名詞を含む語句の発音情報を他の語句の発音情報よりも優先して、対象テキストに対応付けて表示する表示制御部と、表示された発音情報を利用者の指示に応じて修正し、修正された発音情報を対象テキストに対応付けて記録装置に記録する修正処理部とを備えるシステム、当該システムとして情報処理装置を機能させるプログラム、および、当該システムによって発音情報の編集を支援する方法を提供する。
上記課題を解決するために、本発明の第2の形態においては、テキストの発音を示す発音情報の編集を支援するシステムであって、発音情報を生成する対象となる対象テキスト、対象テキストの表層表現に基づいて生成された発音情報、および、対象テキストに含まれる語句毎に算出された当該発音情報の確度を取得する取得部と、確度がより低い語句の発音情報を、確度がより高い語句の発音情報よりも優先して、対象テキストに対応付けて表示する表示制御部と、表示された発音情報を利用者の指示に応じて修正し、修正された発音情報を対象テキストに対応付けて記録装置に記録する修正処理部とを備えるシステム、当該システムとして情報処理装置を機能させるプログラム、および、当該システムによって発音情報の編集を支援する方法を提供する。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本発明によれば、テキストの読みを、これまでより効率的に生成することができる。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、編集支援システム10の全体構成を示す。編集支援システム10は、発音情報編集装置30と、発音情報記録装置35と、言語処理部40と、辞書格納部50とを備え、テキストの発音を示す発音情報の編集を支援することを目的とする。発音情報編集装置30は、発音情報を生成する対象となる対象テキスト20を取得する。言語処理部40は、形態素解析などの言語処理によって、対象テキスト20の表層表現に基づいて発音情報を生成する。発音情報とは、テキストの読み方を示す情報であり、母音や子音などの音のみならずアクセントを含んでよい。発音情報を生成するためには辞書格納部50が用いられる。辞書格納部50は、複数の語句のそれぞれについて、当該語句の表層表現、発音情報、および、品詞を対応付けて記録した辞書を格納する。言語処理部40は、対象テキスト20の表層表現を先頭側から走査することによって、表層表現が対象テキスト20の一部と一致する複数の語句を辞書格納部50から順次検索する。
同一の表層表現を有する複数の語句が辞書に登録されている場合や、語句の区切りの候補が複数ある場合には、対象テキスト20が、複数通りの語句の組み合わせに一致する場合がある。このような場合には、言語処理部40は、ある品詞の語句の次にそれぞれの品詞の語句が配列される確率などに基づいて、尤もらしい語句の組み合わせを選択する。尤もらしい語句の組み合わせを選択するために、言語処理部40は、それぞれの語句について、当該語句の発音情報の確度を算出してもよい。この場合、言語処理部40は、算出された確度の合計や平均の最も高い語句の組み合わせを選択してもよい。そして、言語処理部40は、選択された語句の組み合わせに対応する発音情報の組み合わせを発音情報編集装置30に対し出力する。
発音情報編集装置30は、取得部300と、表示制御部310と、修正処理部320とを有する。取得部300は、対象テキスト20を外部から取得して言語処理部40に出力し、言語処理部40によって対象テキスト20の発音情報を生成させる。そして、取得部300は、生成された発音情報を言語処理部40から取得する。また、取得部300は、発音情報が生成される過程で生成された、対象テキスト20に含まれるそれぞれの語句の品詞の候補を言語処理部40から取得する。更に、取得部300は、発音情報が生成される過程で生成された、対象テキスト20に含まれるそれぞれの語句について複数の発音情報の候補を言語処理部40から取得してもよい。また、取得部300は、それぞれの語句の発音情報の確度を言語処理部40から取得してもよい。更に、取得部300は、対象テキスト20に、品詞を解析した結果文の区切りと判断された箇所に挿入された読点を含めて取得してもよい。
表示制御部310は、対象テキスト20に含まれるそれぞれの語句の発音情報を、対象テキスト20に対応付けて利用者に表示する。また、表示制御部310は、品詞の候補として固有名詞(特に人名名詞)を含む語句の発音情報を他の語句の発音情報よりも優先して表示する。例えば、表示制御部310は、品詞の候補として固有名詞を含む語句の発音情報に、下線を付して表示し、他の語句には下線を付さないで表示してもよい。また、表示制御部310は、発音情報の確度がより低い語句の発音情報を、当該確度がより高い語句の発音情報よりも優先して表示してもよい。例えば、表示制御部310は、確度が予め定められた基準値よりも低い語句に下線を付して表示してもよい。
修正処理部320は、表示された発音情報を利用者の指示に応じて修正し、修正された発音情報を対象テキスト20に対応付けて発音情報記録装置35に記録する。また、表示制御部310は、修正処理部320が発音情報を修正したことに応じ、修正前の発音情報に代えて修正後の発音情報を利用者に表示する。
図2は、対象テキスト20の一例を示す。対象テキスト20は、発音情報を生成する対象であり、文字や句読点などの記号を配列したデータである。具体的には、対象テキスト20は、鈴木秀喜外野手に関するニュース記事であり、当該外野手がいつどこでどのような行動をし、その結果どのようなことが判明したかを示している。そして、対象テキスト20は、例えば「鈴木秀喜外野手」のような固有名詞の表層表現のみを含み、その固有名詞の発音を示す情報は含んでいない。また、対象テキスト20は、「指名打者」のような一般名詞の表層表現のみを含み、その一般名詞の発音を示す情報は含んでいない。更に、対象テキスト20は、野球のスコアボードなどの図表を含んでもよい。なお、対象テキスト20は、インターネット等の外部の通信ネットワークから取得されてもよいし、利用者によって入力されてもよい。
図3は、辞書格納部50のデータ構造の一例を示す。辞書格納部50は、表層表現に基づいて発音情報を生成するための辞書を格納している。この辞書は、予め登録された複数の語句のそれぞれについて、当該語句の表層表現、当該語句の発音情報、および、当該語句の品詞を対応付けて記録している。例えば、「秀喜」という表層表現は、「ひでき」という発音情報と、「ひでよし」という発音情報と、「ひでのぶ」という発音情報と、「しゅーき」という発音情報とに対応付けて登録されている。また、「秀喜」という表層表現および「ひでき」という発音情報の組は、固有名詞の中の人名名詞に対応付けて登録されている。一方、「秀喜」という表層表現および「しゅーき」という発音情報の組は、一般名詞に対応付けて登録されている。このように、この辞書は、ある表層表現を、互いに異なる複数の発音情報に対応付けて記録していてもよいし、互いに異なる複数の品詞に対応付けて記録していてもよい。
また、この辞書において、「島」という語句の表層表現は、「しま」という発音情報に対応付けて記録されており、他の発音情報には対応付けて記録されていない。このように、この辞書は、ある表層表現を1つのみの発音情報に対応付けて記録していてもよい。また、「監督」という語句の表層表現は、一般名詞に対応付けて記録されており、「受け」という語句の表層表現は動詞に対応付けて記録されている。このように、この辞書は、固有名詞のみならず様々な品詞に対応付けて表層表現を記録していてもよい。
なお、図3では発音情報を、日本語のひらがなのような表音文字によって示したが、発音情報とは表音文字のみならず所定の発音記号やアクセント記号によって構成されるものであってもよい。
図4は、表示制御部310による第1の表示例を示す。表示制御部310は、発音情報「すずき」を語句「鈴木」に対応付けて表示する。また、表示制御部310は、語句「鈴木」が品詞の候補として固有名詞を含むので、当該語句に2重下線を付すことにより発音情報「すずき」を他の語句の発音情報より優先して表示する。また、表示制御部310は、発音情報「しゅーき」を語句「秀喜」に対応付けて表示する。発音情報「しゅーき」は一般名詞に対応付けて登録されているが、表層表現「秀喜」は固有名詞にも対応付けて登録されている。このように、語句「秀喜」が品詞の候補として固有名詞を含むので、表示制御部310は、語句「秀喜」に2重下線を付すことにより、発音情報「しゅーき」を他の語句の発音情報より優先して表示する。
なお、優先した表示とは、図4の例のように下線を付した表示の他、目に付き易い色彩による表示であってもよい。これに代えて、表示制御部310は、優先すべき語句の発音情報のみを一覧表示し、他の語句の発音情報を表示しなくてもよい。何れの場合でも、誤っている可能性の高い発音情報のみを目立たせて表示することができ、利用者の作業負担を軽減できる。
また、好ましくは、表示制御部310は、辞書に複数の発音情報が登録された語句の発音情報を、辞書に1つのみの発音情報が登録された語句の発音情報よりも優先して表示する。例えば、表示制御部310は、語句「秀喜」には複数の発音情報が対応付けて登録されているので、発音情報「しゅーき」に文字囲いを付すことにより、発音情報「しゅーき」を優先して表示してもよい。一方で、表示制御部310は、語句「鈴木」には1つの発音情報のみが対応付けて登録されているので、文字囲いを付さずに発音情報「すずき」を表示する。これにより、誤っている可能性の更に高い発音情報を更に目立たせて表示することができる。
また、表示制御部310は、辞書に登録されていない語句(以下、未知語と呼ぶ)の発音情報を、辞書に登録されている語句の発音情報よりも優先して表示してもよい。例えば、表示制御部310は、語句「MRI」が辞書に登録されていないので、当該語句に下線を付して表示する。この結果、当該語句の発音情報「えむあーるあい」は、下線の付されていない語句の発音情報「びょーいん」などより優先して表示される。また、語句「MRI」には、語句「秀喜」や「鈴木」の2重下線とは異なり1重下線を付すことにより、表示制御部310は、未知語の発音情報と、品詞の候補として固有名詞を含む語句の発音情報とを識別可能に表示する。これにより、利用者は、発音情報に誤りが生じ易い理由を直感的に認識することができる。
更に、表示制御部310は、発音情報の確度がより低い語句の発音情報を、当該確度がより高い語句の発音情報よりも優先して表示してもよい。例えば、語句「1日」の発音情報「ついたち」の確度が基準値より低いので、表示制御部310は、語句「1日」に点線の下線を付すことにより、当該発音情報を優先して表示する。一方で、表示制御部310は、語句「病院」の発音情報「びょーいん」の確度が基準値より高いので、語句「病院」には下線を付さないで表示する。これにより、発音情報の確度が低い語句を目立たせて表示することができる。
また、図4の3行目の後尾に表示された「良ければ」と「指名打者」との間には、言語処理部40によって読点が挿入されている。この読点は、言語処理部40によって意味の区切りと判断された箇所に挿入される場合がある。言語処理部40は、対象テキスト20において、句読点を含まずに連続する語句の数が多い場合に、意味の区切りに読点を挿入することにより、対象テキスト20の読み上げ音声を聞き易くする。この読点の位置は、対象テキスト20の作成者によって決定されたものではないので、当該作成者の意図とは異なっていて不自然な場合がある。即ち、読点の位置の誤りは、言語処理部40による解析の誤りを示唆しており、発音情報の誤りに関連している場合が多い。このため、表示制御部310は、読点に隣接する語句の発音情報を、他の語句の発音情報よりも優先して表示する。図4の例では、表示制御部310は、この読点に隣接する語句「良ければ」と語句「指名打者」とに波線を付して表示する。
また、表示制御部310は、野球のスコアボードなどの予め定められたフォーマットと一致する定型データの発音情報を他の語句の発音情報よりも優先して表示してもよい。このような定型データは、文字をそのまま読み上げても意味の分かりづらい発音となる場合がある。このような定型データには、波線などを付して目立たせることにより、利用者の注意を喚起できる。
図5は、表示制御部310による第2の表示例を示す。表示制御部310は、利用者の操作に応じて表示面上を移動するカーソルを表示する。このカーソルは、マウスなどのポインティングデバイスの操作によって表示面上を移動してもよい。利用者は、例えば、語句の発音情報にこのカーソルを重ねて、クリック操作やキー操作を行うことにより、当該語句の発音情報を操作の対象とする。表示制御部310は、修正処理部320が利用者から修正のための操作を受け付けたことに応じ、当該操作の対象となる語句の発音情報の候補を表示してもよい。図5の例では、利用者が語句「秀喜」を選択したので、表示制御部310は、語句「秀喜」に対応する発音情報の全ての候補を一覧表示する。即ち、表示制御部310は、発音情報「しゅーき」の他、その候補として辞書格納部50に登録された「ひでき」、「ひでよし」、および、「ひでのぶ」を表示する。
図6は、表示制御部310による第3の表示例を示す。修正処理部320が利用者の指示に応じて発音情報を修正したことに応じ、表示制御部310は、修正前の発音情報に代えて修正後の発音情報を表示する。図6の例において、修正処理部320は3行目の語句「秀喜」の発音情報を「ひでき」に修正したので、表示制御部310は、修正前の発音情報「しゅーき」に代えて修正後の発音情報「ひでき」を表示する。更に、修正処理部320は、ある語句の発音情報の修正に応じ、対象テキスト20中で当該語句と同一の表層表現を有する他の語句の発音情報を、当該語句の発音情報と同一となるように修正してもよい。図6の例において、修正処理部320は、3行目の語句「秀喜」の発音情報の修正に応じ、1行目の語句「秀喜」の発音情報を「ひでき」に修正する。この場合、表示制御部310は、1行目の語句「秀喜」の発音情報を、3行目の語句「秀喜」の発音情報と同一となるように修正して表示してもよい。
なお、対象テキスト20が複数のトピックを含む場合には、修正処理部320は、同一のトピック内にある語句のみに修正結果を反映し、他のトピック内にある語句には修正結果を反映させなくてもよい。即ち、修正処理部320は、ある語句の発音情報の修正に応じ、当該語句と同一のトピック内で当該語句と同一の表層表現を有する他の語句の発音情報を、当該語句の発音情報と同一となるように修正してもよい。トピックの区切りは、トピックの区切りを示す所定の記号などが対象テキスト20に埋め込まれていれば容易に判別可能である。
図7は、編集支援システム10によって発音情報が生成される処理のフローチャートである。言語処理部40は、対象テキスト20の表層表現に基づいて発音情報を生成する(S700)。取得部300は、生成された発音情報のみならず、辞書格納部50に登録された各語句の発音情報の候補、および、品詞の候補などを取得する(S710)。表示制御部310および修正処理部320は、発音情報を表示し、利用者の指示に応じて当該発音情報を修正して発音情報記録装置35に記録する(S720)。
図8は、図7のS720における処理の詳細を示す。表示制御部310は、発音情報を表示する(S800)。修正処理部320が利用者から操作を受けていなければ(S810:NO)、表示制御部310は同一の発音情報を表示し続ける(S800)。修正処理部320は、利用者から操作を受けたことに応じ(S810:YES)、操作の対象となる語句が複数の発音情報の候補を有するかを判断する(S820)。複数の発音情報の候補を有することを条件に(S820:YES)、修正処理部320は、複数の発音情報の候補を表示する(S830)。
続いて、修正処理部320は、操作の対象となる語句に対し、新たな発音情報の入力を受けたかを判断する(S840)。新たな発音情報の入力を受けたことに応じ(S840:YES)、修正処理部320は、その入力に基づいて発音情報を修正し、発音情報記録装置35に記録する(S850)。また、修正処理部320は、当該語句と同一の表層表現を有する他の語句の発音情報を、当該語句の発音情報と同一となるように修正する(S860)。修正処理部320は、修正を完了する操作を受けたことを条件に(S870:YES)、S720の処理を終了する。一方で、修正を完了する操作を受けていなければ(S870:NO)、修正処理部320は、S800に処理を戻して修正後の発音情報を表示させる。
図9は、図8のS800における処理の詳細を示す。表示制御部310は、ある語句が品詞の候補として人名名詞を含むことを条件に(S900:YES)、その語句に2重下線を付して表示する(S910)。なお、ある語句が品詞の候補として人名名詞を含むか否かは、本実施例では言語処理部40によって判断されるが、これに代えて発音情報編集装置30によって判断されてもよい。具体的には、発音情報編集装置30は、「さん」、「選手」、「容疑者」、「社」または「駅」などの、固有名詞の接尾語を対象テキスト20から検出し、その直前の語句が、品詞の候補として人名名詞を含むと判断してもよい。
また、表示制御部310は、ある語句が未知語であることを条件に(S920:YES)、その語句に下線を付して表示する(S930)。未知語には、具体的には、アルファベットと数字や記号との連続から成る製品名などが含まれる。また、表示制御部310は、ある語句について言語処理部40によって生成された発音情報の確度が基準値以下であることを条件に(S940:YES)、その語句に点線の下線を付して表示する(S950)。また、表示制御部310は、ある語句が、発音情報が誤り易い所定の条件を満たすことを条件に(S960:YES)、その語句に波線の下線を付して表示する(S970)。
所定の条件とは、言語処理部40によって生成された読点に連続して配列されていること、または、予め定められたフォーマットと一致する定型データであることなどである。更に、所定の条件とは、発音情報を誤り易いとして予め定められた語句と表層表現が一致することであってもよい。具体的には、「行った」という表層表現は、「いった」とも読めるし「おこなった」とも読める。また、「降り」という表層表現は、「ふり」とも読めるし「おり」とも読める。このような発音情報の誤り易い語句の表層表現を発音情報編集装置30が予め記憶しておき、表示制御部310は、これらの何れかと表層表現の一致する語句に下線を付して表示してよい。
図10は、図9に続く処理の詳細を示す。続いて、表示制御部310は、ある語句の発音情報の候補が辞書格納部50に複数登録されていることを条件に(S1000:YES)、その語句の発音情報に文字囲いを付して表示する(S1010)。なお、辞書格納部50は、複合語として予め定められた語句の発音情報を登録している場合がある。複合語は、例えば、「山田首相」や「佐藤法相」などであり、その発音は「やまだしゅしょう」や「さとうほうしょう」などである。複合語は、登録された発音以外の発音を有しない場合が多い。このため、表示制御部310は、下線などを付して優先表示をした語句がその複合語として登録されていることを条件に(S1020:YES)、当該優先表示を解除する(S1030)。これにより、発音の誤り易い語句のみを一層目立たせることができる。
図11は、編集支援システム10として機能する情報処理装置600のハードウェア構成の一例を示す。情報処理装置600は、ホストコントローラ1082により相互に接続されるCPU1000、RAM1020、及びグラフィックコントローラ1075を有するCPU周辺部と、入出力コントローラ1084によりホストコントローラ1082に接続される通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を有する入出力部と、入出力コントローラ1084に接続されるBIOS1010、フレキシブルディスクドライブ1050、及び入出力チップ1070を有するレガシー入出力部とを備える。
ホストコントローラ1082は、RAM1020と、高い転送レートでRAM1020をアクセスするCPU1000及びグラフィックコントローラ1075とを接続する。CPU1000は、BIOS1010及びRAM1020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィックコントローラ1075は、CPU1000等がRAM1020内に設けたフレームバッファ上に生成する画像データを取得し、表示装置1080上に表示させる。これに代えて、グラフィックコントローラ1075は、CPU1000等が生成する画像データを格納するフレームバッファを、内部に含んでもよい。
入出力コントローラ1084は、ホストコントローラ1082と、比較的高速な入出力装置である通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を接続する。通信インターフェイス1030は、ネットワークを介して外部の装置と通信する。ハードディスクドライブ1040は、情報処理装置600が使用するプログラム及びデータを格納する。CD−ROMドライブ1060は、CD−ROM1095からプログラム又はデータを読み取り、RAM1020又はハードディスクドライブ1040に提供する。
また、入出力コントローラ1084には、BIOS1010と、フレキシブルディスクドライブ1050や入出力チップ1070等の比較的低速な入出力装置とが接続される。BIOS1010は、情報処理装置600の起動時にCPU1000が実行するブートプログラムや、情報処理装置600のハードウェアに依存するプログラム等を格納する。フレキシブルディスクドライブ1050は、フレキシブルディスク1090からプログラム又はデータを読み取り、入出力チップ1070を介してRAM1020またはハードディスクドライブ1040に提供する。入出力チップ1070は、フレキシブルディスク1090や、例えばパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して各種の入出力装置を接続する。
情報処理装置600に提供されるプログラムは、フレキシブルディスク1090、CD−ROM1095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、入出力チップ1070及び/又は入出力コントローラ1084を介して、記録媒体から読み出され情報処理装置600にインストールされて実行される。プログラムが情報処理装置600等に働きかけて行わせる動作は、図1から図10において説明した編集支援システム10における動作と同一であるから、説明を省略する。
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1090、CD−ROM1095の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムを情報処理装置600に提供してもよい。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
図1は、編集支援システム10の全体構成を示す。 図2は、対象テキスト20の一例を示す。 図3は、辞書格納部50のデータ構造の一例を示す。 図4は、表示制御部310による第1の表示例を示す。 図5は、表示制御部310による第2の表示例を示す。 図6は、表示制御部310による第3の表示例を示す。 図7は、編集支援システム10によって発音情報が生成される処理のフローチャートである。 図8は、図7のS720における処理の詳細を示す。 図9は、図8のS800における処理の詳細を示す。 図10は、図9に続く処理の詳細を示す。 図11は、編集支援システム10として機能する情報処理装置600のハードウェア構成の一例を示す。
符号の説明
10 編集支援システム
20 対象テキスト
30 発音情報編集装置
35 発音情報記録装置
40 言語処理部
50 辞書格納部
300 取得部
310 表示制御部
320 修正処理部
600 情報処理装置

Claims (14)

  1. テキストの発音を示す発音情報の編集を支援するシステムであって、
    発音情報を生成する対象となる対象テキスト、前記対象テキストの表層表現に基づいて生成された発音情報、および、前記対象テキストに含まれる語句の品詞の候補を取得する取得部と、
    品詞の候補として固有名詞を含む語句の発音情報を他の語句の発音情報よりも優先して、前記対象テキストに対応付けて表示する表示制御部と、
    表示された前記発音情報を利用者の指示に応じて修正し、修正された前記発音情報を前記対象テキストに対応付けて記録装置に記録する修正処理部と
    を備えるシステム。
  2. 前記取得部は、前記対象テキストの表層表現に基づいて生成された、前記発音情報の候補を、それぞれの語句について少なくとも1つ取得し、
    前記表示制御部は、前記修正処理部が利用者から修正のための操作を受け付けたことに応じ、前記操作の対象となる語句の発音情報の候補を表示する
    請求項1に記載のシステム。
  3. 前記対象テキストの表層表現に基づいて前記発音情報を生成するために、語句の表層表現および発音情報を対応付けて記録した辞書を格納する辞書格納部を更に備え、
    前記取得部は、前記発音情報の候補を前記辞書から取得し、
    前記表示制御部は、前記辞書に複数の発音情報が登録された語句の発音情報を、前記辞書に1つの発音情報が登録された語句の発音情報よりも優先して表示する
    請求項2に記載のシステム。
  4. 前記表示制御部は、品詞の候補として人名を含むことを条件に、当該語句の発音情報を他の語句の発音情報よりも更に優先して表示する
    請求項1に記載のシステム。
  5. 前記対象テキストの表層表現に基づいて前記発音情報を生成するために、語句の表層表現および発音情報を対応付けて記録した辞書を格納する辞書格納部を更に備え、
    前記表示制御部は、前記辞書に登録されていない語句の発音情報を、前記辞書に登録されている語句の発音情報よりも優先して更に表示する
    請求項1に記載のシステム。
  6. 前記表示制御部は、辞書に登録されていない語句の発音情報と、品詞の候補として固有名詞を含む語句の発音情報とを識別可能に表示する
    請求項5に記載のシステム。
  7. 前記辞書は、複合語として予め定められた語句の発音情報を更に登録し、
    前記表示制御部は、複合語として登録された語句の発音情報よりも、他の語句の発音情報を優先して更に表示する
    請求項1に記載のシステム。
  8. 前記修正処理部は、ある語句の発音情報の修正に応じ、前記対象テキスト中で当該語句と同一の表層表現を有する他の語句の発音情報を、当該語句の発音情報と同一となるように修正して前記記録装置に記録し、
    前記表示制御部は、当該語句の発音情報の修正に応じ、前記対象テキスト中で当該語句と同一の表層表現を有する他の語句の発音情報を、当該語句の発音情報と同一となるように修正して表示する
    請求項1に記載のシステム。
  9. 前記取得部は、前記対象テキストに、品詞を解析した結果文の区切りと判断された箇所に挿入された読点を含めて取得し、
    前記表示制御部は、前記読点に隣接する語句の発音情報を、他の語句の発音情報よりも優先して更に表示する
    請求項1に記載のシステム。
  10. 前記表示制御部は、予め定められたフォーマットと一致する定型データの発音情報を、他の語句の発音情報よりも優先して更に表示する
    請求項1に記載のシステム。
  11. 前記取得部は、前記対象テキストに含まれる語句毎に算出された当該発音情報の確度を更に取得し、
    前記表示制御部は、前記確度がより低い語句の発音情報を、前記確度がより高い語句の発音情報よりも優先して、前記対象テキストに対応付けて表示する
    請求項1に記載のシステム。
  12. テキストの発音を示す発音情報の編集を支援するシステムであって、
    発音情報を生成する対象となる対象テキスト、前記対象テキストの表層表現に基づいて生成された発音情報、および、前記対象テキストに含まれる語句毎に算出された当該発音情報の確度を取得する取得部と、
    前記確度がより低い語句の発音情報を、前記確度がより高い語句の発音情報よりも優先して、前記対象テキストに対応付けて表示する表示制御部と、
    表示された前記発音情報を利用者の指示に応じて修正し、修正された前記発音情報を前記対象テキストに対応付けて記録装置に記録する修正処理部と
    を備えるシステム。
  13. テキストの発音を示す発音情報の編集を支援するシステムとして、情報処理装置を機能させるプログラムであって、
    前記情報処理装置を、
    発音情報を生成する対象となる対象テキスト、前記対象テキストの表層表現に基づいて生成された発音情報、および、前記対象テキストに含まれる語句の品詞の候補を取得する取得部と、
    品詞の候補として固有名詞を含む語句の発音情報を他の語句の発音情報よりも優先して、前記対象テキストに対応付けて表示する表示制御部と、
    表示された前記発音情報を利用者の指示に応じて修正し、修正された前記発音情報を前記対象テキストに対応付けて記録装置に記録する修正処理部と
    して機能させるプログラム。
  14. テキストの発音を示す発音情報の編集を支援する方法であって、
    発音情報を生成する対象となる対象テキスト、前記対象テキストの表層表現に基づいて生成された発音情報、および、前記対象テキストに含まれる語句の品詞の候補を取得するステップと、
    品詞の候補として固有名詞を含む語句の発音情報を他の語句の発音情報よりも優先して、前記対象テキストに対応付けて表示するステップと、
    表示された前記発音情報を利用者の指示に応じて修正し、修正された前記発音情報を前記対象テキストに対応付けて記録装置に記録するステップと
    を備える方法。
JP2006018063A 2006-01-26 2006-01-26 テキストに付与する発音情報の編集を支援するシステム Expired - Fee Related JP4859101B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006018063A JP4859101B2 (ja) 2006-01-26 2006-01-26 テキストに付与する発音情報の編集を支援するシステム
CN2007100044550A CN101009094B (zh) 2006-01-26 2007-01-23 支持发音信息编辑的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006018063A JP4859101B2 (ja) 2006-01-26 2006-01-26 テキストに付与する発音情報の編集を支援するシステム

Publications (2)

Publication Number Publication Date
JP2007199410A true JP2007199410A (ja) 2007-08-09
JP4859101B2 JP4859101B2 (ja) 2012-01-25

Family

ID=38454084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006018063A Expired - Fee Related JP4859101B2 (ja) 2006-01-26 2006-01-26 テキストに付与する発音情報の編集を支援するシステム

Country Status (2)

Country Link
JP (1) JP4859101B2 (ja)
CN (1) CN101009094B (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013130904A (ja) * 2011-12-20 2013-07-04 Fujitsu Ltd 複合語読み表示方法及びプログラム,並びに読み生成装置
JP2014191587A (ja) * 2013-03-27 2014-10-06 Fujitsu Ltd プログラム、変換方法及び情報処理装置
JP2015118222A (ja) * 2013-12-18 2015-06-25 株式会社日立超エル・エス・アイ・システムズ 音声合成システム及び音声合成方法
US9928828B2 (en) 2013-10-10 2018-03-27 Kabushiki Kaisha Toshiba Transliteration work support device, transliteration work support method, and computer program product
US10089975B2 (en) 2014-04-23 2018-10-02 Kabushiki Kaisha Toshiba Transliteration work support device, transliteration work support method, and computer program product
JP2020177137A (ja) * 2019-04-18 2020-10-29 株式会社河合楽器製作所 歌詞編集装置及び歌詞編集プログラム
WO2023149644A1 (ko) * 2022-02-03 2023-08-10 삼성전자주식회사 전자 장치 및 사용자 언어 모델 생성 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909993A (zh) * 2017-11-27 2018-04-13 安徽经邦软件技术有限公司 一种智能语音报告生成系统
CN110767209B (zh) * 2019-10-31 2022-03-15 标贝(北京)科技有限公司 语音合成方法、装置、系统和存储介质
CN115470753B (zh) * 2022-09-27 2024-01-02 广州优谷信息技术有限公司 导读文本显示方法、系统、装置及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202685A (ja) * 1992-12-28 1994-07-22 Ricoh Co Ltd 音声合成装置
JPH06223058A (ja) * 1993-01-26 1994-08-12 Sharp Corp 日本語処理装置
JPH06308998A (ja) * 1993-04-26 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 音声読み上げ装置
JPH0773174A (ja) * 1993-06-29 1995-03-17 Texas Instr Inc <Ti> 日本語処理システム
JPH09171392A (ja) * 1995-10-20 1997-06-30 Ricoh Co Ltd 発音情報作成方法およびその装置
JPH11305987A (ja) * 1998-04-27 1999-11-05 Matsushita Electric Ind Co Ltd テキスト音声変換装置
JP2002207728A (ja) * 2001-01-12 2002-07-26 Fujitsu Ltd 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP2002304388A (ja) * 2001-01-22 2002-10-18 Sun Microsyst Inc ルビ表示判定方法
JP2003140679A (ja) * 2001-11-06 2003-05-16 Mitsubishi Electric Corp 音声合成装置及び方法、並びに音声合成処理をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004054794A (ja) * 2002-07-23 2004-02-19 Nec Access Technica Ltd 携帯型移動通信端末器および同端末器のメール文字変換方法
JP2004139530A (ja) * 2002-10-21 2004-05-13 Osaka Gas Co Ltd 読み修正プログラム
JP2004170983A (ja) * 2002-11-15 2004-06-17 Samsung Electronics Co Ltd 付加情報提供機能付きのテキスト/音声変換装置及びその方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06202685A (ja) * 1992-12-28 1994-07-22 Ricoh Co Ltd 音声合成装置
JPH06223058A (ja) * 1993-01-26 1994-08-12 Sharp Corp 日本語処理装置
JPH06308998A (ja) * 1993-04-26 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 音声読み上げ装置
JPH0773174A (ja) * 1993-06-29 1995-03-17 Texas Instr Inc <Ti> 日本語処理システム
JPH09171392A (ja) * 1995-10-20 1997-06-30 Ricoh Co Ltd 発音情報作成方法およびその装置
JPH11305987A (ja) * 1998-04-27 1999-11-05 Matsushita Electric Ind Co Ltd テキスト音声変換装置
JP2002207728A (ja) * 2001-01-12 2002-07-26 Fujitsu Ltd 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP2002304388A (ja) * 2001-01-22 2002-10-18 Sun Microsyst Inc ルビ表示判定方法
JP2003140679A (ja) * 2001-11-06 2003-05-16 Mitsubishi Electric Corp 音声合成装置及び方法、並びに音声合成処理をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004054794A (ja) * 2002-07-23 2004-02-19 Nec Access Technica Ltd 携帯型移動通信端末器および同端末器のメール文字変換方法
JP2004139530A (ja) * 2002-10-21 2004-05-13 Osaka Gas Co Ltd 読み修正プログラム
JP2004170983A (ja) * 2002-11-15 2004-06-17 Samsung Electronics Co Ltd 付加情報提供機能付きのテキスト/音声変換装置及びその方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013130904A (ja) * 2011-12-20 2013-07-04 Fujitsu Ltd 複合語読み表示方法及びプログラム,並びに読み生成装置
JP2014191587A (ja) * 2013-03-27 2014-10-06 Fujitsu Ltd プログラム、変換方法及び情報処理装置
US9928828B2 (en) 2013-10-10 2018-03-27 Kabushiki Kaisha Toshiba Transliteration work support device, transliteration work support method, and computer program product
JP2015118222A (ja) * 2013-12-18 2015-06-25 株式会社日立超エル・エス・アイ・システムズ 音声合成システム及び音声合成方法
US10089975B2 (en) 2014-04-23 2018-10-02 Kabushiki Kaisha Toshiba Transliteration work support device, transliteration work support method, and computer program product
JP2020177137A (ja) * 2019-04-18 2020-10-29 株式会社河合楽器製作所 歌詞編集装置及び歌詞編集プログラム
JP7320976B2 (ja) 2019-04-18 2023-08-04 株式会社河合楽器製作所 歌詞編集装置及び歌詞編集プログラム
WO2023149644A1 (ko) * 2022-02-03 2023-08-10 삼성전자주식회사 전자 장치 및 사용자 언어 모델 생성 방법

Also Published As

Publication number Publication date
CN101009094B (zh) 2011-06-29
JP4859101B2 (ja) 2012-01-25
CN101009094A (zh) 2007-08-01

Similar Documents

Publication Publication Date Title
JP4859101B2 (ja) テキストに付与する発音情報の編集を支援するシステム
JP3945778B2 (ja) 設定装置、プログラム、記録媒体、及び設定方法
JP4559946B2 (ja) 入力装置、入力方法および入力プログラム
JP4218758B2 (ja) 字幕生成装置、字幕生成方法、及びプログラム
KR20080031357A (ko) 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP2006277677A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP5787780B2 (ja) 書き起こし支援システムおよび書き起こし支援方法
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
JP2002117026A (ja) 確率的入力方法によって生成された候補リストからフィルタリングおよび選択を行うための方法およびシステム
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
JP2008209717A (ja) 入力された音声を処理する装置、方法およびプログラム
EP1611570B1 (en) System for correction of speech recognition results with confidence level indication
JP5106608B2 (ja) 読み上げ支援装置、方法、およびプログラム
US20200394258A1 (en) Generation of edited transcription for speech audio
JPWO2018110096A1 (ja) 翻訳装置および翻訳方法
JP4738847B2 (ja) データ検索装置および方法
JP2000298667A (ja) 構文情報による漢字変換装置
US20130080163A1 (en) Information processing apparatus, information processing method and computer program product
JP2009059159A (ja) 情報処理装置と情報処理方法とプログラム
JP5629543B2 (ja) 文字列変換装置、文字列変換方法、コンピュータプログラムおよび記録媒体
JP2006031725A (ja) 文字処理装置
JP2006309469A (ja) 検索装置、検索方法、プログラム、及びコンピュータ読み取り可能な記録媒体
JP2008269122A (ja) 処理単位分割装置、処理単位分割方法、及びプログラム
CN112151024B (zh) 用于生成语音音频的经编辑的转录的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20111019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111028

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees