JP5976255B2 - 情報提供装置および情報提供方法 - Google Patents
情報提供装置および情報提供方法 Download PDFInfo
- Publication number
- JP5976255B2 JP5976255B2 JP2016513527A JP2016513527A JP5976255B2 JP 5976255 B2 JP5976255 B2 JP 5976255B2 JP 2016513527 A JP2016513527 A JP 2016513527A JP 2016513527 A JP2016513527 A JP 2016513527A JP 5976255 B2 JP5976255 B2 JP 5976255B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- text information
- word
- synonym
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 9
- 238000001514 detection method Methods 0.000 claims description 37
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000003786 synthesis reaction Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 description 29
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 11
- 229910052709 silver Inorganic materials 0.000 description 11
- 239000004332 silver Substances 0.000 description 11
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 9
- 229910052737 gold Inorganic materials 0.000 description 9
- 239000010931 gold Substances 0.000 description 9
- 239000004575 stone Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 3
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
特許文献1には、音声合成の対象となるテキスト中に発音的に類似した単語が存在する場合に、その単語の合成音声を生成する際に明瞭度の高い音声素片を用いることで了解性を向上させることが記載されている。しかし、この場合、明瞭度が高くなるだけであるため、騒音が大きくなる等した場合、聞き間違えてしまう可能性があった。
実施の形態1.
図1は、実施の形態1に係る情報提供装置1と、当該情報提供装置1から出力された音声合成用テキスト情報を用いて合成音声を生成する音声合成装置10の構成を示すブロック図である。この情報提供装置1は、ナビゲーション装置またはサーバ装置に適用してもよいし、タブレットPC(パーソナルコンピュータ)、携帯電話等の携帯情報端末にインストールされるアプリケーションプログラムであってもよい。
取得部2は、この情報提供装置1が行う処理の対象となるテキスト情報を外部から取得する。
図2に、記憶部6が記憶している単語と同義語の例を示す。例えば、単語「添削」と同義語「訂正」および「手直し」とが対応付けられている。
なお、選択部7は、上述した条件を満たす同義語の候補が複数ある場合に、音素数が少ないものを選択してもよい。音素数が少ない同義語は発音が短いので、合成音声として出力したときに騒音の中でも聞き取りやすく、了解性が良い。
さらに、選択部7は、検出部5により検出されたすべての単語について同義語を選択する必要はない。例えば、検出部5により類似する二つの単語が検出された場合、一方の単語に対する同義語を選択し、他方の単語については同義語の選択を行わなくてもよい。また例えば、類似する二つの単語に対応する二つの同義語のうち、音素数が少ない方の同義語を選択し、音素数が多い方の同義語は選択しなくてもよい。
出力部9は、置換部8により置換された後のテキスト情報を音声合成用テキスト情報として音声合成装置10に出力する。
音声合成部11は、情報提供装置1が提供した音声合成用テキスト情報から合成音声を生成する。音声合成については周知の技術を用いればよいため説明を省略する。
音声出力部12は、音声合成部11により生成された合成音声を出力するよう、不図示のスピーカに対して指示する。
ここでは、情報提供装置1による処理対象となるテキスト情報を「添削の際は、平成を検索して、昭和に置換してください。」とし、記憶部6は図2に示したデータを格納しているものとして説明する。
具体的には、検出部5は、音響的に類似している単語「添削(てんさく)」と「検索(けんさく)」を検出する。
ここでは、単語「添削」の同義語の候補は「訂正」と「手直し」であるが、同義語「訂正(ていせい)」とテキスト情報中の他の単語「平成(へいせい)」が音響的に類似していると判断し、選択部7は同義語「手直し」を選択する。
具体的には、置換部8は、テキスト情報「添削の際は、平成を検索して、昭和に置換してください。」の中の「添削」を「手直し」に置換し、置換後のテキスト情報「手直しの際は、平成を検索して、昭和に置換してください。」を生成する。
また、情報提供装置1による処理対象となるテキスト情報が1文であったが、2文以上であってもよい。同義語を選択する際に、2文以上の文章のまとまりの中で音響的な類似度の判断を行うことにより、文章間での了解性と整合性を高めた合成音声用テキスト情報を生成することができる。
図4は、実施の形態2に係る情報提供装置1の構成を示すブロック図である。図4において、図1および図2と同一または相当の部分については同一の符号を付し説明を省略する。実施の形態2の情報提供装置1は、新たに、取得部2が取得したテキスト情報を所定範囲毎に区切る区切部20を備えている。ここで、所定範囲とは、文単位、段落単位、ファイル単位などであり、区切部20は、取得部2により取得されたテキスト情報に付加されている付加情報に基づいて区切る。付加情報は、文の区切り、段落の区切りなどを示す情報である。
具体的には、検出部5は、解析部3による解析結果を用いて、テキスト情報の所定範囲の中から音響的に類似する単語を検出する。選択部7は、検出部5により検出された単語に対応する同義語を記憶部6から選択する際、テキスト情報の所定範囲の中に音響的に同一または類似する単語が存在しない同義語を選択する。置換部8は、テキスト情報の所定範囲に存在する検出部5により検出された単語を、選択部7により選択された同義語に置換する。出力部9は、置換された後のテキスト情報の所定範囲を、音声合成用テキスト情報として音声合成装置10に出力する。
まず、取得部2は、処理の対象となるテキスト情報を取得する(ステップST1)。区切部20は、テキスト情報をその付加情報に基づいて、例えば2文ごとのまとまりに区切る(ステップST20)。ここでは、区切部20により2文に区切られたテキスト情報を「金色の石が5個、銀色の石が1個必要です。金色は英語でゴールド、銀色は英語でシルバーです。」とし、記憶部6は図2に示したデータを格納しているものとして説明する。
具体的には、検出部5は、音響的に類似している単語「金色(きんいろ)」と「銀色(ぎんいろ)」を検出する。
ここでは、単語「金色」の同義語の候補は「ゴールド」と「こがね色」であるが、テキスト情報の2文中に単語「ゴールド」が存在するため、選択部7は同義語「こがね色」を選択する。同様にして選択部7は、単語「銀色」の同義語として「しろがね色」を選択する。
具体的には、置換部8は、テキスト情報の2文「金色の石が5個、銀色の石が1個必要です。金色は英語でゴールド、銀色は英語でシルバーです。」の中の「金色」を「こがね色」に置換し、「銀色」を「しろがね色」に置換し、置換後のテキスト情報「こがね色の石が5個、しろがね色の石が1個必要です。こがね色は英語でゴールド、しろがね色は英語でシルバーです。」を生成する。
Claims (5)
- 音声合成用テキスト情報を音声合成装置に提供する情報提供装置において、
テキスト情報を取得する取得部と、
前記テキスト情報の中から音響的に類似する単語を検出する検出部と、
単語毎に予め対応付けた同義語を記憶した記憶部と、
前記検出部が検出した単語に対応する同義語であって前記テキスト情報の中に音響的に同一または類似する単語が存在しない同義語を、前記記憶部から選択する選択部と、
前記検出部が検出した単語を前記選択部が選択した同義語に置換する置換部と、
前記置換部が置換した後の前記テキスト情報を前記音声合成用テキスト情報として出力する出力部とを備えることを特徴とする情報提供装置。 - 前記取得部が取得したテキスト情報を2文以上のまとまり毎に区切る区切部を備え、
前記検出部は、前記区切部が区切ったまとまりの中から音響的に類似する単語を検出し、
前記選択部は、前記検出部が検出した単語に対応する同義語であって前記区切部が区切ったまとまりの中に音響的に同一または類似する単語が存在しない同義語を、前記記憶部から選択することを特徴とする請求項1記載の情報提供装置。 - 前記区切部は、前記テキスト情報に付加されている付加情報に基づいて区切ることを特徴とする請求項2記載の情報提供装置。
- 前記選択部は、同義語の候補が複数存在する場合、音素数が少ない同義語を選択することを特徴とする請求項1記載の情報提供装置。
- 情報提供装置が、音声合成用テキスト情報を音声合成装置に提供する情報提供方法において、
取得部が、テキスト情報を取得する取得ステップと、
検出部が、前記テキスト情報の中から音響的に類似する単語を検出する検出ステップと、
選択部が、単語毎に予め対応付けた同義語の中から、前記検出ステップで検出した単語に対応する同義語であって前記テキスト情報の中に音響的に同一または類似する単語が存在しない同義語を選択する選択ステップと、
置換部が、前記検出ステップで検出した単語を前記選択ステップで選択した同義語に置換する置換ステップと、
出力部が、前記置換ステップで置換した後の前記テキスト情報を前記音声合成用テキスト情報として出力する出力ステップとを備えることを特徴とする情報提供方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/060710 WO2015159363A1 (ja) | 2014-04-15 | 2014-04-15 | 情報提供装置および情報提供方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5976255B2 true JP5976255B2 (ja) | 2016-08-23 |
JPWO2015159363A1 JPWO2015159363A1 (ja) | 2017-04-13 |
Family
ID=54323610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016513527A Expired - Fee Related JP5976255B2 (ja) | 2014-04-15 | 2014-04-15 | 情報提供装置および情報提供方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9734818B2 (ja) |
JP (1) | JP5976255B2 (ja) |
CN (1) | CN106233373B (ja) |
DE (1) | DE112014006591B4 (ja) |
WO (1) | WO2015159363A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10593135B2 (en) * | 2016-04-11 | 2020-03-17 | Olivier Noyelle | Methods and systems for collecting and evaluating vehicle status |
US10748526B2 (en) * | 2018-08-28 | 2020-08-18 | Accenture Global Solutions Limited | Automated data cartridge for conversational AI bots |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0335296A (ja) * | 1989-06-30 | 1991-02-15 | Sharp Corp | テキスト音声合成装置 |
JP2000172289A (ja) * | 1998-12-02 | 2000-06-23 | Matsushita Electric Ind Co Ltd | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 |
JP2000206982A (ja) * | 1999-01-12 | 2000-07-28 | Toshiba Corp | 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体 |
JP2003302993A (ja) * | 2002-04-10 | 2003-10-24 | Canon Inc | 音声合成装置、音声合成方法、プログラム、記憶媒体 |
JP2005063257A (ja) * | 2003-08-18 | 2005-03-10 | Canon Inc | 情報処理方法、情報処理装置 |
JP2010181562A (ja) * | 2009-02-04 | 2010-08-19 | Fujitsu Ltd | 音声合成装置、音声合成方法及びコンピュータプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020120451A1 (en) | 2000-05-31 | 2002-08-29 | Yumiko Kato | Apparatus and method for providing information by speech |
JP2008185805A (ja) * | 2007-01-30 | 2008-08-14 | Internatl Business Mach Corp <Ibm> | 高品質の合成音声を生成する技術 |
JP4213755B2 (ja) * | 2007-03-28 | 2009-01-21 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
CN101819469A (zh) | 2009-11-06 | 2010-09-01 | 无敌科技(西安)有限公司 | 中文内容拼写校正的方法 |
CN102201233A (zh) * | 2011-05-20 | 2011-09-28 | 北京捷通华声语音技术有限公司 | 一种混搭语音合成方法和系统 |
-
2014
- 2014-04-15 DE DE112014006591.9T patent/DE112014006591B4/de not_active Expired - Fee Related
- 2014-04-15 WO PCT/JP2014/060710 patent/WO2015159363A1/ja active Application Filing
- 2014-04-15 US US15/120,966 patent/US9734818B2/en active Active
- 2014-04-15 JP JP2016513527A patent/JP5976255B2/ja not_active Expired - Fee Related
- 2014-04-15 CN CN201480078015.8A patent/CN106233373B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0335296A (ja) * | 1989-06-30 | 1991-02-15 | Sharp Corp | テキスト音声合成装置 |
JP2000172289A (ja) * | 1998-12-02 | 2000-06-23 | Matsushita Electric Ind Co Ltd | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 |
JP2000206982A (ja) * | 1999-01-12 | 2000-07-28 | Toshiba Corp | 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体 |
JP2003302993A (ja) * | 2002-04-10 | 2003-10-24 | Canon Inc | 音声合成装置、音声合成方法、プログラム、記憶媒体 |
JP2005063257A (ja) * | 2003-08-18 | 2005-03-10 | Canon Inc | 情報処理方法、情報処理装置 |
JP2010181562A (ja) * | 2009-02-04 | 2010-08-19 | Fujitsu Ltd | 音声合成装置、音声合成方法及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20160365086A1 (en) | 2016-12-15 |
JPWO2015159363A1 (ja) | 2017-04-13 |
WO2015159363A1 (ja) | 2015-10-22 |
CN106233373B (zh) | 2017-07-07 |
DE112014006591B4 (de) | 2018-06-14 |
DE112014006591T5 (de) | 2017-03-23 |
US9734818B2 (en) | 2017-08-15 |
CN106233373A (zh) | 2016-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9099091B2 (en) | Method and apparatus of adaptive textual prediction of voice data | |
US10403265B2 (en) | Voice recognition apparatus and voice recognition method | |
JP2009258293A (ja) | 音声認識語彙辞書作成装置 | |
JP5976255B2 (ja) | 情報提供装置および情報提供方法 | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP2004326367A (ja) | テキスト解析装置及びテキスト解析方法、ならびにテキスト音声合成装置 | |
US8438005B1 (en) | Generating modified phonetic representations of indic words | |
JP2004271895A (ja) | 複数言語音声認識システムおよび発音学習システム | |
WO2017159207A1 (ja) | 処理実行装置、処理実行装置の制御方法、および制御プログラム | |
WO2007088902A1 (ja) | 文字処理装置、方法、プログラムおよび記録媒体 | |
JP5701348B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
JP5795985B2 (ja) | 形態素解析装置、形態素解析方法および形態素解析プログラム | |
JP6003127B2 (ja) | 言語モデル作成プログラム及び言語モデル作成装置 | |
JP2007334144A (ja) | 音声合成方法、音声合成装置及び音声合成プログラム | |
US11514899B2 (en) | Using multiple languages during speech to text input | |
JP2006243104A (ja) | 音声合成方法 | |
KR102369923B1 (ko) | 음성 합성 시스템 및 이의 방법 | |
JP2004301968A (ja) | 発話処理装置、発話処理方法及び発話処理用プログラム | |
JP2004139530A (ja) | 読み修正プログラム | |
JP2006133478A (ja) | 音声処理システム及び方法並びに音声処理用プログラム | |
JP2005292346A (ja) | 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム | |
JP5252209B2 (ja) | 読み生成装置 | |
JP4445371B2 (ja) | 認識語彙の登録装置と音声認識装置および方法 | |
JP2013068667A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4319851B2 (ja) | 読み上げ装置、読み上げ方法及び読み上げ処理用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160614 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160719 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5976255 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |