JP2014044289A - テキスト整形プログラム、方法及び装置 - Google Patents
テキスト整形プログラム、方法及び装置 Download PDFInfo
- Publication number
- JP2014044289A JP2014044289A JP2012186302A JP2012186302A JP2014044289A JP 2014044289 A JP2014044289 A JP 2014044289A JP 2012186302 A JP2012186302 A JP 2012186302A JP 2012186302 A JP2012186302 A JP 2012186302A JP 2014044289 A JP2014044289 A JP 2014044289A
- Authority
- JP
- Japan
- Prior art keywords
- word
- text
- degree
- storage unit
- input text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 30
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 30
- 238000013500 data storage Methods 0.000 claims abstract description 19
- 230000010365 information processing Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 description 30
- 238000004364 calculation method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 15
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000000605 extraction Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】本方法は、データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、入力テキストに含まれる各単語について、(1)聞き馴染み度合いと(2)当該単語を含む文全体の属性との一致度合いと(3)使用するテキスト音声合成における忌避度合いとのうち少なくともいずれかを含む判定要素に基づき、当該単語について抽出された同義異音語のうち置換候補を特定する特定ステップとを含む。
【選択図】図1
Description
文字を読む場合には読めても、聞き馴染みのない単語は、可能な限り使用しない方が好ましい。
「木」や「気」といった短い単語、母音の「イ」や「エ」を多く含む単語等、母音の無声化が多い単語等については、音韻的に聞き取りにくいので、可能な限り使用しない方が好ましい。
同音異義語が多い単語等、複数の意味を有する単語等、曖昧性が多い単語等、漢語や音読みの単語等は、意味が取りにくいので、可能な限り使用しない方が好ましい。
公に出力されることが禁止されている単語等は、可能な限り使用しないようにする。出力忌避度合いとも呼ぶものとする。
文全体の属性と、当該文に含まれる単語の属性とが異なっていると、聞き手は違和感を感ずるので、できる限り文全体の属性と、当該文に含まれる単語の属性とは一致することが好ましい。一致しない場合には、違和感を感じて意味を理解しづらくなる。上で述べた例では、楽しさの度合い、お悔やみの度合い、子供向けの度合い、高齢者向けの度合い、非常通報の度合い、格調の高さの度合いによって属性の一致度合いを評価する。
使用する音声合成部23毎に、得手不得手があり、不得意な単語については、可能な限り出力回避すべきである。このような音声合成部23における単語の忌避度合いも、聞き取りやすさという点においては重要となる。なお、忌避するか否かの2段階だけではなく、さらに多い段階にて忌避度合いを表すようにしても良い。
D={(a1−b1)2+(a2−b2)2+(a3−b3)2+(a4−b4)2+(a5−b5)2+(a6−b6)2}1/2
11 入力テキスト格納部
12 単語分割部
13 発音決定部
14 ラティス生成部
15 ラティス格納部
16 スコア計算部
17 単語辞書格納部
18 候補抽出部
19 提示部
20 韻律コマンド挿入部
21 入力部
22 出力データ格納部
23 音声合成部
24 スピーカ
Claims (9)
- データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、
前記入力テキストに含まれる各単語について、(1)聞き馴染み度合いと(2)当該単語を含む文全体の属性との一致度合いと(3)使用するテキスト音声合成における忌避度合いとのうち少なくともいずれかを含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する特定ステップと、
を、コンピュータに実行させるためのテキスト整形プログラム。 - 前記特定ステップにおいて特定された置換候補をユーザに提示するステップと、
前記ユーザにより選択された置換候補を、前記入力テキスト内において、対応する単語と置換するステップと、
をさらに前記コンピュータに実行させるための請求項1記載のテキスト整形プログラム。 - 前記特定ステップが、
前記入力テキストに含まれる各単語と当該単語について抽出された前記同義異音語との各々について、第2のデータ格納部に格納されている出現頻度に応じたスコアを算出するステップと、
を含む請求項1又は2記載のテキスト整形プログラム。 - 前記特定ステップが、
前記入力テキストに含まれる文について、第2のデータ格納部に格納されており且つ当該文に含まれる単語について設定されている1又は複数の属性の属性値を読み出して、当該文の属性値を算出するステップと、
前記入力テキストに含まれる各単語及び当該単語について抽出された前記同義異音語との各々について、前記第2のデータ格納部に格納されている1又は複数の属性の属性値を読み出して、前記文の属性値との一致度合いに応じたスコアを算出するステップと、
を含む請求項1又は2記載のテキスト整形プログラム。 - 前記特定ステップが、
前記入力テキストに含まれる各単語と当該単語について抽出された前記同義異音語との各々について、第2のデータ格納部に格納されている忌避すべき単語に一致するか否かを判断し、判断結果に応じたスコアを設定するステップ
を含む請求項1又は2記載のテキスト整形プログラム。 - 前記判定要素が、
音韻的な聞き取りにくさの度合いと意味の取りにくさの度合いと出力忌避度合いとのうち少なくともいずれかをさらに含む
請求項1乃至5のいずれか1つ記載のテキスト整形プログラム。 - 前記特定ステップで特定された置換候補のうち少なくともいずれかが置換された前記入力テキストに対して、韻律コマンドを挿入するステップ
をさらに前記コンピュータに実行させる請求項1乃至6のいずれか1つ記載のテキスト整形プログラム。 - データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、
前記入力テキストに含まれる各単語について、(1)聞き馴染み度合いと(2)当該単語を含む文全体の属性との一致度合いと(3)使用するテキスト音声合成における忌避度合いとのうち少なくともいずれかを含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する特定ステップと、
を含み、コンピュータに実行させるテキスト整形方法。 - データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出する手段と、
前記入力テキストに含まれる各単語について、(1)聞き馴染み度合いと(2)当該単語を含む文全体の属性との一致度合いと(3)使用するテキスト音声合成における忌避度合いとのうち少なくともいずれかを含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する手段と、
を有する情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186302A JP6172491B2 (ja) | 2012-08-27 | 2012-08-27 | テキスト整形プログラム、方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186302A JP6172491B2 (ja) | 2012-08-27 | 2012-08-27 | テキスト整形プログラム、方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014044289A true JP2014044289A (ja) | 2014-03-13 |
JP6172491B2 JP6172491B2 (ja) | 2017-08-02 |
Family
ID=50395600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012186302A Active JP6172491B2 (ja) | 2012-08-27 | 2012-08-27 | テキスト整形プログラム、方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6172491B2 (ja) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10334089A (ja) * | 1997-06-05 | 1998-12-18 | Fujitsu Ltd | 文字入力装置 |
JP2002149180A (ja) * | 2000-11-16 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
JP2006227425A (ja) * | 2005-02-18 | 2006-08-31 | National Institute Of Information & Communication Technology | 音声再生装置及び発話支援装置 |
JP2008083239A (ja) * | 2006-09-26 | 2008-04-10 | Toshiba Corp | 中間言語編集装置、中間言語編集方法および中間言語編集プログラム |
WO2008056590A1 (fr) * | 2006-11-08 | 2008-05-15 | Nec Corporation | Dispositif de synthèse texte-parole, programme et procédé de synthèse texte-parole |
JP2009139390A (ja) * | 2007-12-03 | 2009-06-25 | Nec Corp | 情報処理システム、処理方法及びプログラム |
JP2010287020A (ja) * | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2011247928A (ja) * | 2010-05-24 | 2011-12-08 | Nec Corp | 読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム |
JP2012073519A (ja) * | 2010-09-29 | 2012-04-12 | Toshiba Corp | 読み上げ支援装置、方法、およびプログラム |
-
2012
- 2012-08-27 JP JP2012186302A patent/JP6172491B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10334089A (ja) * | 1997-06-05 | 1998-12-18 | Fujitsu Ltd | 文字入力装置 |
JP2002149180A (ja) * | 2000-11-16 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
JP2006227425A (ja) * | 2005-02-18 | 2006-08-31 | National Institute Of Information & Communication Technology | 音声再生装置及び発話支援装置 |
JP2008083239A (ja) * | 2006-09-26 | 2008-04-10 | Toshiba Corp | 中間言語編集装置、中間言語編集方法および中間言語編集プログラム |
WO2008056590A1 (fr) * | 2006-11-08 | 2008-05-15 | Nec Corporation | Dispositif de synthèse texte-parole, programme et procédé de synthèse texte-parole |
JP2009139390A (ja) * | 2007-12-03 | 2009-06-25 | Nec Corp | 情報処理システム、処理方法及びプログラム |
JP2010287020A (ja) * | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2011247928A (ja) * | 2010-05-24 | 2011-12-08 | Nec Corp | 読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム |
JP2012073519A (ja) * | 2010-09-29 | 2012-04-12 | Toshiba Corp | 読み上げ支援装置、方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6172491B2 (ja) | 2017-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
US7809572B2 (en) | Voice quality change portion locating apparatus | |
CN103714048B (zh) | 用于校正文本的方法和系统 | |
CN109616096B (zh) | 多语种语音解码图的构建方法、装置、服务器和介质 | |
US9548052B2 (en) | Ebook interaction using speech recognition | |
JP6471074B2 (ja) | 機械翻訳装置、方法及びプログラム | |
CN111369974B (zh) | 一种方言发音标注方法、语言识别方法及相关装置 | |
KR20150146373A (ko) | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 | |
CN106710585B (zh) | 语音交互过程中的多音字播报方法及系统 | |
KR20170035529A (ko) | 전자 기기 및 그의 음성 인식 방법 | |
JP2013109061A (ja) | 音声データ検索システムおよびそのためのプログラム | |
KR20170057623A (ko) | 언어장애인을 위한 다언어 어휘의 발음 합성 및 문자화 장치 | |
US11176943B2 (en) | Voice recognition device, voice recognition method, and computer program product | |
JP5079718B2 (ja) | 外国語学習支援システム、及びプログラム | |
CN113851106B (zh) | 音频播放方法、装置、电子设备和可读存储介质 | |
CN113409761B (zh) | 语音合成方法、装置、电子设备以及计算机可读存储介质 | |
JP6172491B2 (ja) | テキスト整形プログラム、方法及び装置 | |
JP2016142936A (ja) | 音声合成用データ作成方法、及び音声合成用データ作成装置 | |
JP5975033B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2017198790A (ja) | 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム | |
JP2017015823A (ja) | 発話練習装置、表示制御方法、及びプログラム | |
JP2021089300A (ja) | 多言語音声認識およびテーマ−意義素解析方法および装置 | |
JPH10228471A (ja) | 音声合成システム,音声用テキスト生成システム及び記録媒体 | |
JP6538399B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
WO2023047623A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150813 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150813 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6172491 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |