JP4570509B2 - 読み生成装置、読み生成方法及びコンピュータプログラム - Google Patents

読み生成装置、読み生成方法及びコンピュータプログラム Download PDF

Info

Publication number
JP4570509B2
JP4570509B2 JP2005125699A JP2005125699A JP4570509B2 JP 4570509 B2 JP4570509 B2 JP 4570509B2 JP 2005125699 A JP2005125699 A JP 2005125699A JP 2005125699 A JP2005125699 A JP 2005125699A JP 4570509 B2 JP4570509 B2 JP 4570509B2
Authority
JP
Japan
Prior art keywords
reading
word
words
string
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005125699A
Other languages
English (en)
Other versions
JP2006301446A (ja
Inventor
伸之 片江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005125699A priority Critical patent/JP4570509B2/ja
Priority to US11/244,075 priority patent/US20060241936A1/en
Publication of JP2006301446A publication Critical patent/JP2006301446A/ja
Application granted granted Critical
Publication of JP4570509B2 publication Critical patent/JP4570509B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、数字列を含む文字列データについて、単語辞書の記憶容量を増大させずに適切な読みを生成することができる読み生成装置、読み生成方法及びコンピュータプログラムに関する。
近年、音声認識装置(ASR:Auto Speech Recognition)、音声合成装置(TTS:Text-To-Speech)等を用いたボイスポータルのような音声対話システム(IVR:Interactive Voice Response)が普及し始めている。音声対話システムでは、音声認識装置により利用者の音声を認識し、認識した結果に対応した応答を音声合成装置による合成音声により行うことで、利用者との対話を行っている。
ここで、音声合成装置が合成音声を生成する対象となる文字列は数字列を含むことが多い。しかし、文字列に含まれる数字列を読み上げる場合、利用者の使用目的に応じて様々な読み上げ方が存在する。例えば、数字列を構成している数字ごとに順次読み上げる音声を合成する棒読み方式、数字列を構成している数字に万、千、百、十等の桁を付与して読み上げる音声を合成する桁読み方式、あるいは0(ゼロ)を「マル」と読み上げる、0(ゼロ)を「オー」と読み上げる等を使い分ける必要がある。
数字列を適切な読み上げ方で読み上げるために、例えば特許文献1では、数字列の読み上げ方として、棒読み方式及び桁読み方式を属性として記憶しておき、読み上げた場合の読み上げ文字数の大小、音節数の大小、音声時間長の長短等に応じて、いずれの読み上げ方を選択するか判定する音声合成装置が開示されている。
また、特許文献2及び3では、数字列に先行する文字、先行する文字の種別、後続する文字、後続する文字の種類等の選択条件に基づいて、棒読み方式及び桁読み方式のいずれを選択するかを判定する音声合成装置が開示されている。
特開平8−146984号公報 特開平9−006379号公報 特開平4−199195号公報
しかし、特許文献1では、数字列を構成している数字ごとに順次読み上げる音声を合成する棒読み方式、又は数字列を構成している数字に万、千、百、十等の桁を付与して読み上げる音声を合成する桁読み方式を選択することはできるが、例えば0(ゼロ)を「マル」と読み上げる、0(ゼロ)を「オー」と読み上げる等を使い分けることができず、特に商品名、サービス名等の固有名詞を読み上げる場合に誤った読みで合成音声を生成するおそれがあり、場合によっては利用者が理解不能となり音声対話が継続できないという問題点があった。
また、特許文献2及び3では、選択条件を多数設定しておくことにより、棒読み方式、桁読み方式だけでなく、0(ゼロ)を「マル」と読み上げる、0(ゼロ)を「オー」と読み上げる等の読み上げ方を用いることができるが、選択条件を適用するアプリケーションごとに多数設定する必要が有り、利用者にとって設定処理が煩雑である。また、選択条件によっては複数の読み上げ方が選択される可能性があるが、いずれの読み上げ方を優先すべきか選択する基準が無いという問題点があった。
さらに、数字列のあらゆる選択条件、全ての数字列の読み等を記憶手段に記憶しておくことにより、あらゆる状況に対応した適切な読み上げ方で数字列の合成音声を生成することができるが、記憶手段には物理的な容量の制限があるとともに、全ての数字列の読みを事前に記憶しておくことは検索レスポンスの劣化を伴う等実用的でなく、実現可能性に乏しいという問題が残されている。
本発明は斯かる事情に鑑みてなされたものであり、数字列を含む文字列データであっても、利用者の状況に応じた適切な読みを生成することができる読み生成装置、読み生成方法及びコンピュータプログラムを提供することを目的とする。
上記目的を達成するために本発明に係る読み生成装置は、複数の単語の表記及び読みを記憶してある単語辞書を備え、数字列を含む文字列データを読み上げるための読みを生成する読み生成装置において、数字列を含む文字列データを受け付ける手段と、受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出する一致単語抽出手段と、該一致単語抽出手段で、受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列が存在するか否かを判断する判断手段と、該判断手段で部分一致する単語を抽出できない数字列が存在すると判断した場合、前記単語辞書に記憶されている単語のうち、部分一致する単語を抽出できない数字列に対して先行する文字、又は部分一致する単語を抽出できない数字列に対して後続する文字の少なくとも一方に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出する類似単語抽出手段と、前記一致単語抽出手段及び前記類似単語抽出手段で抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定する単語特定手段と、該単語特定手段で特定した単語のうち、前記一致単語抽出手段で抽出した複数の単語の読みを設定する単語読み設定手段と、前記単語特定手段で特定した単語のうち、前記類似単語抽出手段で抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成する規則生成手段と、該規則生成手段で生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定する数字列読み設定手段と、前記単語読み設定手段で設定した単語の読み、及び前記数字列読み設定手段で設定した数字列の読みに基づいて、前記文字列データの読みを設定する文字列読み設定手段とを備えたことを特徴とする。
また、本発明に係る読み生成装置は、前記規則生成手段は、抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成するようにしてあることを特徴とする。
また、本発明に係る読み生成装置は、前記規則生成手段で生成した前記数字読み規則を記憶手段に記憶する数字読み規則記憶手段を備えていることを特徴とする。
また、本発明に係る読み生成装置は、前記数字列読み設定手段で設定した数字列の表記及び読みを、前記単語辞書に記憶する数字列読み記憶手段を備えることを特徴とする。
また、本発明に係る読み生成方法は、複数の単語の表記及び読みを記憶してある単語辞書を用い、数字列を含む文字列データを読み上げるための読みを生成する読み生成方法において、数字列を含む文字列データを受け付け、受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出し、受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列が存在するか否かを判断し、部分一致する単語を抽出できない数字列が存在すると判断した場合、前記単語辞書に記憶されている単語のうち、部分一致する単語を抽出できない数字列に対して先行する文字、又は部分一致する単語を抽出できない数字列に対して後続する文字の少なくとも一方に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出し、抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定し、特定した単語のうち、抽出した複数の単語の読みを設定し、抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成し、生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定し、設定した単語の読み及び設定した数字列の読みに基づいて、前記文字列データの読みを設定することを特徴とする。
また、本発明に係る読み生成方法は、抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成することを特徴とする。
なお、本発明に係る読み生成方法において、生成した数字読み規則を記憶手段に記憶することも可能である。また、本発明に係る読み生成方法において、設定した数字列の表記及び読みを単語辞書に記憶することも可能である。
また、本発明に係るコンピュータプログラムは、複数の単語の表記及び読みを記憶してある単語辞書を照会することが可能なコンピュータを、数字列を含む文字列データを読み上げるための読みを生成する読み生成装置として機能させるコンピュータプログラムにおいて、前記コンピュータを、数字列を含む文字列データを受け付ける手段、受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出する一致単語抽出手段、該一致単語抽出手段で、受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列が存在するか否かを判断する判断手段、該判断手段で部分一致する単語を抽出できない数字列が存在すると判断した場合、前記単語辞書に記憶されている単語のうち、部分一致する単語を抽出できない数字列に対して先行する文字、又は部分一致する単語を抽出できない数字列に対して後続する文字の少なくとも一方に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出する類似単語抽出手段、前記一致単語抽出手段及び前記類似単語抽出手段で抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定する単語特定手段、該単語特定手段で特定した単語のうち、前記一致単語抽出手段で抽出した複数の単語の読みを設定する単語読み設定手段、前記単語特定手段で特定した単語のうち、前記類似単語抽出手段で抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成する規則生成手段、該規則生成手段で生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定する数字列読み設定手段、及び前記単語読み設定手段で設定した単語の読み、及び前記数字列読み設定手段で設定した数字列の読みに基づいて、前記文字列データの読みを設定する文字列読み設定手段として機能させることを特徴とする。
なお、本発明に係るコンピュータプログラムの類似単語抽出手段において、単語辞書に記憶してある単語のうち、所定の数字列に対して先行する文字、文字の種別、及び文字の数、並びに後続する文字、文字の種別、及び文字の数、数字列の文字数、及び数字列の数値のうち一又は複数に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出しても良い。
また、本発明に係るコンピュータプログラムの規則生成手段において、抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成しても良い。
さらに、本発明に係るコンピュータプログラムは、生成した数字読み規則を記憶手段に記憶させても良いし、設定した数字列の表記及び読みを単語辞書に記憶させても良い。
本発明では、数字列を含む文字列データを受け付け、受け付けた文字列データに部分一致する複数の単語を、単語辞書に記憶してある複数の単語から抽出し、受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列が存在するか否かを判断する。部分一致する単語を抽出できない数字列が存在する場合、抽出できない数字列に類似する類似単語を単語辞書から抽出し、抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定し、特定した単語のうち、抽出した複数の単語の読みを設定し、複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成し、生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定する。設定した単語の読み、及び特定した数字列の読みに基づいて、文字列データの読みを設定する。これにより、数字列が単語辞書に記憶されていない場合であっても、単語辞書に記憶されている類似の数字列の読みに基づいて、単語辞書に記憶されていない数字列の読みを容易に設定することができ、数字列の適切な読みを生成することが可能となる。また、全ての数字列について、読みの選択条件及び読み情報を記憶しておく必要がないことから、計算機資源を圧迫することが無く、読みを選択する時間を短縮することができ、読みを生成するレスポンスの劣化を未然に防止することが可能となる。
本発明では、単語辞書に記憶されている単語のうち、部分一致する単語を抽出できない数字列に対して先行する文字、又は部分一致する単語を抽出できない数字列に対して後続する文字の少なくとも一方に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出する。これにより、数字列に先行する文字及び/又は後続する文字に関する情報に基づいて、単語辞書から最も類似している単語を確実に抽出することができ、抽出した単語の読みに従って数字列の読みを設定することが可能となる。
本発明では、抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成する。これにより、抽出された類似単語から生成した数字読み規則を受け付けた文字列に含まれる数字列に容易に適用することができ、利用者の用途に応じた数字の読みを生成することが可能となる。
本発明では、生成した数字読み規則を記憶手段に記憶する。これにより、次回以降に同種の数字列を含む文字列データを受け付けた場合、より精度良く数字列の読み上げ方を設定することができ、読みを生成するまでのレスポンスを向上させることも可能となる。
本発明では、設定した数字列の表記及び読みを、単語辞書に記憶する。これにより、特に数字列が固有名詞の全部又は一部である場合、次回以降に同種の数字列を含む文字列データを受け付けたときに、単語辞書に記憶されている単語を用いることができ、類似単語を抽出する必要がなくなることから、より精度良く、かつより速いレスポンスで読みを生成することが可能となる。
本発明によれば、数字列が単語辞書に記憶されていない場合であっても、単語辞書に記憶されている類似の数字列の読みに基づいて、単語辞書に記憶されていない数字列の読みを容易に設定することができ、数字列の適切な読みを生成することが可能となる。また、全ての数字列について、読みの選択条件及び読み情報を記憶しておく必要がないことから、計算機資源を圧迫することが無く、読みを選択する時間を短縮することができ、読みを生成するレスポンスの劣化を未然に防止することが可能となる。
本発明によれば、数字列に先行する文字及び/又は後続する文字に関する情報に基づいて、単語辞書から最も類似している単語を確実に抽出することができ、抽出した単語の読みに従って数字列の読みを設定することが可能となる。
本発明によれば、抽出された類似単語から生成した数字読み規則を受け付けた文字列に含まれる数字列に容易に適用することができ、利用者の用途に応じた数字の読みを生成することが可能となる。
本発明によれば、次回以降に同種の数字列を含む文字列データを受け付けた場合、より精度良く数字列の読み上げ方を設定することができ、読みを生成するまでのレスポンスを向上させることも可能となる。
本発明によれば、特に数字列が固有名詞の全部又は一部である場合、次回以降に同種の数字列を含む文字列データを受け付けたときに、単語辞書に記憶されている単語を用いることができ、類似単語を抽出する必要がなくなることから、より精度良く、かつより速いレスポンスで読みを生成することが可能となる。
以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。本実施の形態では、本発明に係る読み生成装置を音声合成装置に適用した場合について説明する。
(実施の形態1)
以下、本発明の実施の形態1に係る読み生成装置を用いた音声合成装置について図面に基づいて具体的に説明する。図1は、本発明の実施の形態1に係る音声合成装置の構成を示すブロック図である。図1に示すように音声合成装置1は、少なくとも、CPU(中央演算装置)11、記憶手段12、RAM13、外部の通信手段と接続する通信インタフェース14、入力手段15、出力手段16及びDVD、CD等の可搬型記憶媒体18を用いる補助記憶手段17で構成される。
CPU11は、内部バス19を介して音声合成装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部を制御するとともに、記憶手段12に記憶されている処理プログラム、例えば数字列を含む文字列を解析するプログラム、単語辞書を照会するプログラム、類似単語を抽出するプログラム、類似単語の読みの規則に従って読みを設定するプログラム等に従って、種々のソフトウェア的機能を実行する。
記憶手段12は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成され、通信インタフェース14を介した外部のコンピュータ、又はDVD、CD−ROM等の可搬型記憶媒体18から取得した、音声合成装置1として機能させるために必要な処理プログラムを記憶している。記憶手段12は、処理プログラムだけではなく、合成音声を生成するための単語の表記、読み、品詞等を記憶してある単語辞書として、汎用的な単語辞書である基本単語辞書121及びユーザ別の単語辞書であるユーザ別単語辞書122、122、・・・も記憶している。
RAM13は、DRAM等で構成され、ソフトウェアの実行時に発生する一時的なデータを記憶する。通信インタフェース14は内部バス19に接続されており、外部のネットワーク網と通信することができるよう接続することにより、処理に必要なデータを送受信することができる。
入力手段15は、読み上げる対象となる数字列を含む文字列の入力を受け付けるキーボードである。なお入力手段15はキーボードに限定されるものではなく、文字列を入力することができる他の入力媒体であっても良い。出力手段16は、設定した読みに基づいて生成された合成音声を出力するスピーカである。
補助記憶手段17は、CD、DVD等の可搬型記憶媒体18を用い、記憶手段12へ、CPU11が処理するプログラム、データ等をダウンロードする。また、CPU11が処理したデータをバックアップすべく書き込むことも可能である。
なお、本実施の形態1では、音声合成装置1と入力手段15及び出力手段16とが一体となっている場合について説明するが、特にこれに限定されるものではなく、1つの音声合成装置1が、外部の入力装置又は出力装置と接続されているものであっても良い。
以下、上述した構成の音声合成装置1の動作を、文字列データ「本日M901iを発売しました」を合成音声で出力する場合に、基本単語辞書121又はユーザ別単語辞書122、122、・・・に「F900i」が記憶されているのに対して「M901i」が記憶されていない場合を例として説明する。図2は、本発明の実施の形態1に係る音声合成装置1のCPU11の処理手順を示すフローチャートである。
音声合成装置1のCPU11は、入力手段15を介して数字列「901」を含む文字列データ「本日M901iを発売しました」を受け付ける(ステップS201)。CPU11は、基本単語辞書121及び利用者ごとのユーザ別単語辞書122を照会して、受け付けた文字列データと部分一致する単語を抽出する(ステップS202)。なお、ユーザ別単語辞書122は、利用者を識別する情報である識別情報(例えばユーザID)に対応付けて記憶してあり、利用者のログイン情報に基づいて選択される。
また、部分一致する単語として抽出した複数の単語を組み合わせて、数字列でない部分の構成を特定することができない場合、文字列を読み上げることができないことから、エラーメッセージを出力して再入力を促す等のエラー処理が必要である。ただし図2では、数字列でない部分の読みを設定することができたものと仮定し、エラー処理に関する記述を省略している。
図3は、基本単語辞書121及びユーザ別単語辞書122、122、・・・のデータ構成の一例を示す図である。図3に示すように、基本単語辞書121及びユーザ別単語辞書122、122、・・・は、単語の表記ごとに、少なくとも読み、品詞等を記憶しておく。文字列データに含まれる単語ごとにその表記をキー情報として、読み及び品詞を抽出することができる。
CPU11は、部分一致する複数の単語を組み合わせて、文字列データに含まれている数字列の構成を特定することができるか否かを判断する(ステップS203)。CPU11が、文字列データに含まれている数字列の構成を特定することができると判断した場合(ステップS203:YES)、CPU11は、ステップS205へスキップする。
CPU11が、文字列データに含まれている数字列の構成を特定することができないと判断した場合(ステップS203:NO)、CPU11は、部分一致する単語により数字列の構成が特定されていない部分に類似する類似単語を基本単語辞書121及び利用者ごとのユーザ別単語辞書122から抽出する(ステップS204)。
類似単語を抽出する場合、まずCPU11は、単語辞書に記憶されている単語のうち、構成が特定されていない部分の数字列に対して先行する文字、文字の種別、及び文字の数、並びに後続する文字、文字の種別、及び文字の数、数字列の文字数、及び数字列の数値のうち一又は複数に基づいて類似度合の評価値である類似度を算出する。類似度の算出方法は特に限定されるものではなく、例えば(数1)に基づいて算出する。なお、(数1)で、文字の種別とは、アルファベット、平仮名、片仮名、漢字、記号等の文字の分類を意味している。
(数1)
類似度 = 先行する文字の一致数 × 100
+先行する文字の種別の一致数
+後続する文字の一致数 × 100
+後続する文字の種別の一致数
−数字列の文字数の差
−数字列が示す数値の差
例えば文字列データ「本日M901iを発売しました」に含まれる数字列「901」に対して、ユーザ別単語辞書122に「F900i」が記憶してある場合について、(数1)に従って類似度を算出する。この場合、先行する文字の一致数=0、先行する文字の種別の一致数=1、後続する文字の一致数=1、後続する文字の種別の一致数=1、数字列の文字数の差=0、数字列が示す数値の差=1となることから、類似度は‘101’と算出される。
算出した類似度に基づいて、例えば類似度が最大である単語を類似単語として抽出する。もちろん、類似度が最大である単語を抽出する方法に限定されるものではなく、類似度の高い順に複数の候補単語を抽出して、利用者による選択を受け付けても良いし、所定の閾値(例えば閾値=100)を超えた単語を候補単語として抽出する方法であっても良い。
図4は、音声合成装置1のCPU11が受け付けた文字列データに基づいて、基本単語辞書121及びユーザ別単語辞書122から抽出した単語群を示す図であり、図5は、其れに加えて、数字列について類似単語を抽出した結果を示す図である。図4及び図5では、四角で囲まれた単語が、基本単語辞書121及びユーザ別単語辞書122から抽出した一単語を示している。また、図5では、四角の二重線で囲まれた単語が、基本単語辞書121及びユーザ別単語辞書122から抽出した数字列を含む類似単語を示している。
図4に示すように、数字列は特殊な固有名詞以外、基本単語辞書121及びユーザ別単語辞書122には記憶されていない場合が多い。図4の例でも、「901」という数字列は記憶されていないことを示している。
CPU11は、抽出した複数の単語から、受け付けた文字列データを構成する単語を特定する(ステップS205)。単語を特定する方法は特に限定されるものではなく、例えば単語間の接続容易度の高い単語を優先する、長さの長い単語を優先する等の複数の指標に基づいて特定する。図6は、単語特定の結果を示す図である。図6において、太実線で囲まれている単語は、文字列データを構成する単語として特定された単語を示している。
そして、CPU11は、特定した単語ごとの読みを設定する。具体的には、CPU11は、読みを設定する対象となる単語を、特定した単語の先頭に配置し(ステップS206)、全ての単語の読みを設定したか否かを判断する(ステップS207)。CPU11が、単語の読みを設定していない単語があると判断した場合(ステップS207:NO)、CPU11は、読みを設定する対象である単語が抽出した類似単語と同一であるか否かを判断する(ステップS208)。
CPU11が、読みを設定する対象である単語が抽出した類似単語と同一でないと判断した場合(ステップS208:NO)、CPU11は、読みを設定する対象となる単語には、単語辞書から抽出した単語の読みを設定する(ステップS209)。CPU11が、読みを設定する対象である単語が抽出した類似単語と同一であると判断した場合(ステップS208:YES)、CPU11は、類似単語に基づいて受け付けた文字列に相当する読みを生成する必要がある。例えば、「M901i」の類似単語として「F900i」が抽出された場合、図6に示すように類似単語の数字列の前後の文字である「F」、「i」と、「M901i」の数字列の前後の文字である「M」、「i」との関係から、数字列「901」の読みを決定する。
すなわち、CPU11は、抽出した類似単語に基づいて、文字列データに含まれる数字列の読みに関する規則である数字読み規則を生成する(ステップS210)。そして、生成した数字読み規則に基づいて、読みが設定されていない数字列部分を含む単語の読みを設定する(ステップS211)。
数字読み規則は、少なくとも規則を識別する情報、数字列に先行する文字、後続する文字、数値、及び読み上げ方に関する情報で構成される。例えば図6に示す類似単語「F900i」からは、棒読み、0(ゼロ)は「マル」と読み上げる等の数字読み規則を生成する。数字読み規則は、これらに限定されるものではなく、例えば桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報等を数字読み規則として生成しても良い。
類似単語「F900i」から生成した数字読み規則に従って、「M901i」の読みを設定する。したがって、類似単語「F900i」の読み「エフキューマルマルアイ」と同様に、読みを「エムキューマルイチアイ」と設定することができる。
CPU11は、読みを設定する対象となる単語を一単語進めて(ステップS212)、ステップS207へ戻る。CPU11が、全ての単語の読みを設定したと判断した場合(ステップS207:YES)、CPU11は、設定された複数の単語の読みを表記順に接続することにより、文字列データの読みを設定する(ステップS213)。図7は、数字列部分を含めた文字列データ全体の読みを設定した結果を示す図である。図7に示すように、文字列データの読みは、「ホンジツエムキューマルイチアイオハツバイシマシタ。」となる。CPU11は、設定した文字列データの読みに基づいて合成音声を生成し(ステップS214)、出力手段16から合成音声を出力する。
以上のように本実施の形態1によれば、数字列が基本単語辞書121及びユーザ別単語辞書122に記憶されていない場合であっても、基本単語辞書121及びユーザ別単語辞書122に記憶されている類似の数字列の読みに基づいて、基本単語辞書121及びユーザ別単語辞書122に記憶されていない数字列の読みを容易に設定することができ、数字列を適切な読みで合成音声を生成することが可能となる。また、全ての数字列について、読みの選択条件及び読み情報を記憶しておく必要がないことから、計算機資源を圧迫することが無く、読みを選択する時間を短縮することができ、合成音声を生成して出力するレスポンスの劣化を未然に防止することが可能となる。
なお、類似単語を求めるために必要な類似度の算出は、上述した実施例では、文字列データを受け付け、受け付けた文字列データに数字列が含まれている都度行っているが、毎回算出することによる演算処理負荷を軽減すべく、類似単語の表記、生成された読み、品詞等を一時的に記憶する一時単語辞書123を記憶手段12に設けても良い。図8は、一時単語辞書123を設けた場合の、本実施の形態1に係る音声合成装置1の構成を示すブロック図である。
図8に示すように、記憶手段12に一時単語辞書123を設けておくことにより、利用者から文字列データを受け付けた場合、基本単語辞書121及びユーザ別単語辞書122に加えて、一時単語辞書も照会する。一時単語辞書123も照会対象とすることにより、一致する単語を検出する確率が高くなり、類似度の算出回数を減少させることができることから、演算処理負荷を軽減することが可能となる。
(実施の形態2)
以下、本発明の実施の形態2に係る音声合成装置について図面に基づいて具体的に説明する。図9は、本発明の実施の形態2に係る音声合成装置の構成を示すブロック図である。本実施の形態2に係る音声合成装置1は、実施の形態1と基本的な構成が同一であることから、同一の機能を有する構成については同一の符号を付することで詳細な説明を省略する。本実施の形態2は、記憶手段12に数字の読み上げ方の規則を記憶する数字読み規則記憶部124を備えることを特徴とする。すなわち基本単語辞書121及びユーザ別単語辞書122、122、・・・に記憶してある数字列を含む単語に基づいて数字読み規則を生成し、数字読み規則記憶部124に記憶している。
図10は、数字読み規則記憶部124に記憶してあるデータ構成の一例を示す図である。図10に示すように、数字読み規則記憶部124は、規則を識別する情報、例えば規則番号に対応付けて、先行する文字、後続する文字、数値、読み上げ規則等を記憶している。「F900i」に基づいて数字読み規則を生成する場合、例えば規則番号‘1’のように棒読みであり、0(ゼロ)を「マル」と読み上げる等の読み上げ規則が生成され、数字読み規則記憶部124に記憶される。
以下、上述した構成の音声合成装置1の動作を、文字列データ「本日M901iを発売しました」を合成音声で出力する場合に、基本単語辞書121又はユーザ別単語辞書122、122、・・・に「F900i」が記憶されているのに対して「M901i」が記憶されていない場合を例として説明する。図11は、本発明の実施の形態2に係る音声合成装置1のCPU11の処理手順を示すフローチャートである。
音声合成装置1のCPU11は、入力手段15を介して数字列「901」を含む文字列データ「本日M901iを発売しました」を受け付ける(ステップS1101)。CPU11は、基本単語辞書121及び利用者ごとのユーザ別単語辞書122を照会して、受け付けた文字列データと部分一致する複数の単語を抽出する(ステップS1102)。
なお、部分一致する単語として抽出した複数の単語を組み合わせて、数字列でない部分の構成を特定することができない場合、文字列を読み上げることができないことから、エラーメッセージを出力して再入力を促す等のエラー処理が必要である。ただし図11では、数字列でない部分の読みを設定することができたものと仮定し、エラー処理に関する記述を省略している。
CPU11は、抽出した複数の単語から、受け付けた文字列データを構成する単語を特定する(ステップS1103)。単語を特定する方法は特に限定されるものではなく、例えば単語間の接続容易度の高い単語を優先する、長さの長い単語を優先する等の複数の指標に基づいて特定する。
また、抽出した複数の単語では、数字列の読みを設定できない部分が残る場合、当該部分を単語未特定部分とし、その他の部分の単語を特定する。図12は、単語特定の結果を示す図である。図12において、太実線で囲まれている単語は、文字列データを構成する単語として特定された単語を示しており、数字部分、すなわち「901」の部分が単語未特定部分となっている。
そして、CPU11は、特定した単語ごとの読みを設定する。具体的には、CPU11は、単語未特定部分も一単語として取り扱い、読みを設定する対象となる単語を、特定した単語の先頭に配置し(ステップS1104)、全ての単語の読みを設定したか否かを判断する(ステップS1105)。CPU11が、単語の読みを設定していない単語があると判断した場合(ステップS1105:NO)、CPU11は、読みを設定する対象である単語が単語未特定部分であるか否かを判断する(ステップS1106)。
CPU11が、読みを設定する対象である単語が単語未特定部分でないと判断した場合(ステップS1106:NO)、CPU11は、読みを設定する対象となる単語には、単語辞書から抽出した単語の読みを設定する(ステップS1107)。CPU11が、読みを設定する対象である単語が単語未特定部分であると判断した場合(ステップS1106:YES)、CPU11は、記憶して有る数字読み規則に基づいて読みを生成する必要がある。
すなわち、CPU11は、数字読み規則記憶部124に複数記憶されている数字読み規則から、最適な規則を、例えば実施の形態1の類似度と同様の指標値を算出することにより選択する(ステップS1108)。そして、CPU11は、選択した数字読み規則に基づいて単語未特定部分の数字列の読みを設定する(ステップS1109)。
CPU11は、読みを設定する対象となる単語を一単語進めて(ステップS1110)、ステップS1105へ戻る。CPU11が、全ての単語の読みを設定したと判断した場合(ステップS1105:YES)、CPU11は、設定された複数の単語の読みを表記順に接続することにより、文字列データの読みを設定する(ステップS1111)。図13は、数字列部分を含めた文字列データ全体の読みを設定した結果を示す図である。図13に示すように、文字列データの読みは、「ホンジツエムキューマルイチアイオハツバイシマシタ。」となる。CPU11は、設定した文字列データの読みに基づいて合成音声を生成し(ステップS1112)、出力手段16から合成音声を出力する。
なお、数字読み規則の選択方法は、上述した指標値の算出により選択する方法に限定されるものではなく、例えば単語の出現頻度に応じて規則番号ごとに重要度を付与し、付与された重要度に応じて数字読み規則を選択しても良い。図14は、重要度を付与した場合の数字読み規則記憶部124に記憶してあるデータの構成の一例を示す図である。
図14に示すように、数字読み規則記憶部124は、規則番号ごとに重要度を記憶してある。重要度は、例えば数字読み規則の適用回数の累計値であり、数字の読み上げ規則として抽出される都度、重要度の値をインクリメントする。数字読み規則の選択時には、重要度が高い規則番号から順に選択する。
以上のように本実施の形態2によれば、数字列が基本単語辞書121及びユーザ別単語辞書122に記憶されていない場合であっても、数字読み規則記憶部124に記憶されている規則に基づいて、基本単語辞書121及びユーザ別単語辞書122に記憶されていない数字列の読みを容易に設定することができ、数字列を適切な読みで合成音声を生成することが可能となる。また、全ての数字列について、読みの選択条件及び読み情報を記憶しておく必要がないことから、計算機資源を圧迫することが無く、読みを選択する時間を短縮することができ、合成音声を生成して出力するレスポンスの劣化を未然に防止することが可能となる。
なお、実施の形態1と併用して、類似単語に基づいて生成した数字読み規則を記憶手段12の数字読み規則記憶部124に記憶しても良い。これにより、次回以降に同種の数字列を含む文字列データを受け付けた場合、類似単語を抽出することなく、数字読み規則記憶部124を照会することにより最適な数字読み規則を適用することができ、合成音声を生成するまでのレスポンスを向上させることも可能となる。
また、上述した実施の形態1及び2で設定した数字列の表記及び読みを、ユーザ別単語辞書122に記憶しても良い。これにより、特に数字列が固有名詞の全部又は一部である場合、次回以降に同種の数字列を含む文字列データを受け付けたときに、ユーザ別単語辞書122に記憶した数字列に基づいて数字列の読み上げ方を設定することができ、より精度良く、かつより速いレスポンスで合成音声を生成することが可能となる。
以上の実施の形態1及び2に関し、さらに以下の付記を開示する。
(付記1)
複数の単語の表記及び読みを記憶してある単語辞書を備え、数字列を含む文字列データを読み上げるための読みを生成する読み生成装置において、
数字列を含む文字列データを受け付ける手段と、
受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出する一致単語抽出手段と、
該一致単語抽出手段で、受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列部分が存在するか否かを判断する判断手段と、
該判断手段で部分一致する単語を抽出できない数字列部分が存在すると判断した場合、抽出できない数字列部分に類似する類似単語を前記単語辞書から抽出する類似単語抽出手段と、
前記一致単語抽出手段及び前記類似単語抽出手段で抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定する単語特定手段と、
該単語特定手段で特定した単語のうち、前記一致単語抽出手段で抽出した複数の単語の読みを設定する単語読み設定手段と、
前記単語特定手段で特定した単語のうち、前記類似単語抽出手段で抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成する規則生成手段と、
該規則生成手段で生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定する数字列読み設定手段と、
前記単語読み設定手段で設定した単語の読み、及び前記数字列読み設定手段で設定した数字列の読みに基づいて、前記文字列データの読みを設定する文字列読み設定手段と
を備えたことを特徴とする読み生成装置。
(付記2)
前記類似単語抽出手段は、
前記単語辞書に記憶されている単語のうち、所定の数字列に対して先行する文字、文字の種別、及び文字の数、並びに後続する文字、文字の種別、及び文字の数、数字列の文字数、及び数字列の数値のうち一又は複数に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出するようにしてあることを特徴とする付記1記載の読み生成装置。
(付記3)
前記規則生成手段は、抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成するようにしてあることを特徴とする付記1又は2記載の読み生成装置。
(付記4)
前記規則生成手段で生成した前記数字読み規則を記憶手段に記憶する数字読み規則記憶手段を備えていることを特徴とする付記1乃至3のいずれか一項に記載の読み生成装置。
(付記5)
前記数字列読み設定手段で設定した数字列の表記及び読みを、前記単語辞書に記憶する数字列読み記憶手段を備えることを特徴とする付記1乃至4のいずれか一項に記載の読み生成装置。
(付記6)
複数の単語の表記及び読みを記憶してある単語辞書を用い、数字列を含む文字列データを読み上げるための読みを生成する読み生成方法において、
数字列を含む文字列データを受け付け、
受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出し、
受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列部分が存在するか否かを判断し、
部分一致する単語を抽出できない数字列部分が存在すると判断した場合、抽出できない数字列部分に類似する類似単語を前記単語辞書から抽出し、
抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定し、
特定した単語のうち、抽出した複数の単語の読みを設定し、抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成し、
生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定し、
設定した単語の読み及び設定した数字列の読みに基づいて、前記文字列データの読みを設定することを特徴とする読み生成方法。
(付記7)
前記単語辞書に記憶されている単語のうち、所定の数字列に対して先行する文字、文字の種別、及び文字の数、並びに後続する文字、文字の種別、及び文字の数、数字列の文字数、及び数字列の数値のうち一又は複数に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出することを特徴とする付記6記載の読み生成方法。
(付記8)
抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成することを特徴とする付記6又は7記載の読み生成方法。
(付記9)
生成した前記数字読み規則を記憶手段に記憶することを特徴とする付記6乃至8のいずれか一項に記載の読み生成方法。
(付記10)
設定した数字列の表記及び読みを、前記単語辞書に記憶することを特徴とする付記6乃至9のいずれか一項に記載の読み生成方法。
(付記11)
複数の単語の表記及び読みを記憶してある単語辞書を照会することが可能なコンピュータを、数字列を含む文字列データを読み上げるための読みを生成する読み生成装置として機能させるコンピュータプログラムにおいて、
前記コンピュータを、
数字列を含む文字列データを受け付ける手段、
受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出する一致単語抽出手段、
該一致単語抽出手段で、受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列部分が存在するか否かを判断する判断手段、
該判断手段で部分一致する単語を抽出できない数字列部分が存在すると判断した場合、抽出できない数字列部分に類似する類似単語を前記単語辞書から抽出する類似単語抽出手段、
前記一致単語抽出手段及び前記類似単語抽出手段で抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定する単語特定手段、
該単語特定手段で特定した単語のうち、前記一致単語抽出手段で抽出した複数の単語の読みを設定する単語読み設定手段、
前記単語特定手段で特定した単語のうち、前記類似単語抽出手段で抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成する規則生成手段、
該規則生成手段で生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定する数字列読み設定手段、及び
前記単語読み設定手段で設定した単語の読み、及び前記数字列読み設定手段で設定した数字列の読みに基づいて、前記文字列データの読みを設定する文字列読み設定手段
として機能させることを特徴とするコンピュータプログラム。
(付記12)
前記類似単語抽出手段を、
前記単語辞書に記憶されている単語のうち、所定の数字列に対して先行する文字、文字の種別、及び文字の数、並びに後続する文字、文字の種別、及び文字の数、数字列の文字数、及び数字列の数値のうち一又は複数に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出する手段
として機能させることを特徴とする付記11記載のコンピュータプログラム。
(付記13)
前記規則生成手段を、
抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成する手段
として機能させることを特徴とする付記11又は12記載のコンピュータプログラム。
(付記14)
前記コンピュータを、
前記規則生成手段で生成した前記数字読み規則を記憶手段に記憶する数字読み規則記憶手段
として機能させることを特徴とする付記11乃至13のいずれか一項に記載のコンピュータプログラム。
(付記15)
前記コンピュータを、
前記数字列読み設定手段で設定した数字列の表記及び読みを、前記単語辞書に記憶する数字列読み記憶手段
として機能させることを特徴とする付記11乃至14のいずれか一項に記載のコンピュータプログラム。
本発明の実施の形態1に係る音声合成装置の構成を示すブロック図である。 本発明の実施の形態1に係る音声合成装置のCPUの処理手順を示すフローチャートである。 基本単語辞書及びユーザ別単語辞書のデータ構成の一例を示す図である。 音声合成装置のCPUが受け付けた文字列データに基づいて、基本単語辞書及びユーザ別単語辞書から抽出した単語群を示す図である。 数字列について抽出した類似単語を示す図である。 単語特定の結果を示す図である。 数字列部分を含めた文字列データ全体の読みを設定した結果を示す図である。 一時単語辞書を設けた場合の、本実施の形態1に係る音声合成装置の構成を示すブロック図である。 本発明の実施の形態2に係る音声合成装置の構成を示すブロック図である。 数字読み規則記憶部に記憶されているデータ構成の一例を示す図である。 本発明の実施の形態2に係る音声合成装置のCPUの処理手順を示すフローチャートである。 単語特定の結果を示す図である。 数字列部分を含めた文字列データ全体の読みを設定した結果を示す図である。 重要度を付与した場合の数字読み規則記憶部に記憶してあるデータの構成の一例を示す図である。
符号の説明
1 音声合成装置
11 CPU
12 記憶手段
13 RAM
14 通信インタフェース
15 入力手段
16 出力手段
17 補助記憶手段
18 可搬型記憶媒体
20 音声入出力部
121 基本単語辞書
122 ユーザ別単語辞書
123 一時単語辞書
124 数字読み規則記憶部

Claims (7)

  1. 複数の単語の表記及び読みを記憶してある単語辞書を備え、数字列を含む文字列データを読み上げるための読みを生成する読み生成装置において、
    数字列を含む文字列データを受け付ける手段と、
    受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出する一致単語抽出手段と、
    該一致単語抽出手段で、受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列が存在するか否かを判断する判断手段と、
    該判断手段で部分一致する単語を抽出できない数字列が存在すると判断した場合、前記単語辞書に記憶されている単語のうち、部分一致する単語を抽出できない数字列に対して先行する文字、又は部分一致する単語を抽出できない数字列に対して後続する文字の少なくとも一方に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出する類似単語抽出手段と、
    前記一致単語抽出手段及び前記類似単語抽出手段で抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定する単語特定手段と、
    該単語特定手段で特定した単語のうち、前記一致単語抽出手段で抽出した複数の単語の読みを設定する単語読み設定手段と、
    前記単語特定手段で特定した単語のうち、前記類似単語抽出手段で抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成する規則生成手段と、
    該規則生成手段で生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定する数字列読み設定手段と、
    前記単語読み設定手段で設定した単語の読み、及び前記数字列読み設定手段で設定した数字列の読みに基づいて、前記文字列データの読みを設定する文字列読み設定手段と
    を備えたことを特徴とする読み生成装置。
  2. 前記規則生成手段は、抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成するようにしてあることを特徴とする請求項1記載の読み生成装置。
  3. 前記規則生成手段で生成した前記数字読み規則を記憶手段に記憶する数字読み規則記憶手段を備えていることを特徴とする請求項1又は2記載の読み生成装置。
  4. 前記数字列読み設定手段で設定した数字列の表記及び読みを、前記単語辞書に記憶する数字列読み記憶手段を備えることを特徴とする請求項1乃至のいずれか一項に記載の読み生成装置。
  5. 複数の単語の表記及び読みを記憶してある単語辞書を用い、数字列を含む文字列データを読み上げるための読みを生成する読み生成方法において、
    数字列を含む文字列データを受け付け、
    受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出し、
    受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列が存在するか否かを判断し、
    部分一致する単語を抽出できない数字列が存在すると判断した場合、前記単語辞書に記憶されている単語のうち、部分一致する単語を抽出できない数字列に対して先行する文字、又は部分一致する単語を抽出できない数字列に対して後続する文字の少なくとも一方に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出し、
    抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定し、
    特定した単語のうち、抽出した複数の単語の読みを設定し、抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成し、
    生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定し、
    設定した単語の読み及び設定した数字列の読みに基づいて、前記文字列データの読みを設定することを特徴とする読み生成方法。
  6. 抽出した類似単語に対応付けて記憶してある読みに基づいて、桁読みであるか棒読みであるかの区別に関する情報、日本語読みであるか英語読みであるかの区別に関する情報、及び個々の数字の読み方に関する情報の一又は複数の数字読み規則を生成することを特徴とする請求項記載の読み生成方法。
  7. 複数の単語の表記及び読みを記憶してある単語辞書を照会することが可能なコンピュータを、数字列を含む文字列データを読み上げるための読みを生成する読み生成装置として機能させるコンピュータプログラムにおいて、
    前記コンピュータを、
    数字列を含む文字列データを受け付ける手段、
    受け付けた文字列データに部分一致する複数の単語を、前記単語辞書に記憶してある複数の単語から抽出する一致単語抽出手段、
    該一致単語抽出手段で、受け付けた文字列データに含まれる数字列に対して、部分一致する単語を抽出できない数字列が存在するか否かを判断する判断手段、
    該判断手段で部分一致する単語を抽出できない数字列が存在すると判断した場合、前記単語辞書に記憶されている単語のうち、部分一致する単語を抽出できない数字列に対して先行する文字、又は部分一致する単語を抽出できない数字列に対して後続する文字の少なくとも一方に基づいて類似度合の評価値である類似度を計算し、計算した類似度が最も高い単語を類似単語として抽出する類似単語抽出手段、
    前記一致単語抽出手段及び前記類似単語抽出手段で抽出した複数の単語及び類似単語に基づいて、受け付けた文字列データを構成する単語を特定する単語特定手段、
    該単語特定手段で特定した単語のうち、前記一致単語抽出手段で抽出した複数の単語の読みを設定する単語読み設定手段、
    前記単語特定手段で特定した単語のうち、前記類似単語抽出手段で抽出した複数の類似単語に含まれる数字列の読みに関する規則である数字読み規則を生成する規則生成手段、
    該規則生成手段で生成した数字読み規則に基づいて、文字列データに含まれる数字列の読みを設定する数字列読み設定手段、及び
    前記単語読み設定手段で設定した単語の読み、及び前記数字列読み設定手段で設定した数字列の読みに基づいて、前記文字列データの読みを設定する文字列読み設定手段
    として機能させることを特徴とするコンピュータプログラム。
JP2005125699A 2005-04-22 2005-04-22 読み生成装置、読み生成方法及びコンピュータプログラム Expired - Fee Related JP4570509B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005125699A JP4570509B2 (ja) 2005-04-22 2005-04-22 読み生成装置、読み生成方法及びコンピュータプログラム
US11/244,075 US20060241936A1 (en) 2005-04-22 2005-10-06 Pronunciation specifying apparatus, pronunciation specifying method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005125699A JP4570509B2 (ja) 2005-04-22 2005-04-22 読み生成装置、読み生成方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2006301446A JP2006301446A (ja) 2006-11-02
JP4570509B2 true JP4570509B2 (ja) 2010-10-27

Family

ID=37188146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005125699A Expired - Fee Related JP4570509B2 (ja) 2005-04-22 2005-04-22 読み生成装置、読み生成方法及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US20060241936A1 (ja)
JP (1) JP4570509B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9575953B2 (en) * 2006-09-07 2017-02-21 Nec Corporation Natural-language processing system and dictionary registration system
JP2009244639A (ja) * 2008-03-31 2009-10-22 Sanyo Electric Co Ltd 発話装置、発話制御プログラムおよび発話制御方法
JP2010140256A (ja) * 2008-12-11 2010-06-24 Toshiba Corp 情報処理装置および診断結果通知方法
KR101255557B1 (ko) * 2008-12-22 2013-04-17 한국전자통신연구원 음절 분리에 기반한 문자열 검색 시스템 및 그 방법
CN102117614B (zh) * 2010-01-05 2013-01-02 索尼爱立信移动通讯有限公司 个性化文本语音合成和个性化语音特征提取
JP2013072957A (ja) * 2011-09-27 2013-04-22 Toshiba Corp 文書読み上げ支援装置、方法及びプログラム
JP5787794B2 (ja) * 2012-03-05 2015-09-30 株式会社東芝 音声合成システム、音声変換支援装置および音声変換支援方法
US20140278403A1 (en) * 2013-03-14 2014-09-18 Toytalk, Inc. Systems and methods for interactive synthetic character dialogue
US11023689B1 (en) 2018-01-17 2021-06-01 Narrative Science Inc. Applied artificial intelligence technology for narrative generation using an invocable analysis service with analysis libraries
US10706236B1 (en) 2018-06-28 2020-07-07 Narrative Science Inc. Applied artificial intelligence technology for using natural language processing and concept expression templates to train a natural language generation system
CN112542154B (zh) * 2019-09-05 2024-03-19 北京地平线机器人技术研发有限公司 文本转换方法、装置、计算机可读存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置
JP2001013983A (ja) * 1999-06-25 2001-01-19 Nec Corp 音声合成を用いた音声認識装置および音声認識方法
JP2002049386A (ja) * 2000-08-01 2002-02-15 Sharp Corp テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
JP2004206659A (ja) * 2002-11-07 2004-07-22 Nippon Telegr & Teleph Corp <Ntt> 読み情報決定方法及び装置及びプログラム

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5323316A (en) * 1991-02-01 1994-06-21 Wang Laboratories, Inc. Morphological analyzer
US5283833A (en) * 1991-09-19 1994-02-01 At&T Bell Laboratories Method and apparatus for speech processing using morphology and rhyming
US5384893A (en) * 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis
CA2119397C (en) * 1993-03-19 2007-10-02 Kim E.A. Silverman Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation
JPH08146984A (ja) * 1994-11-24 1996-06-07 Fujitsu Ltd 音声合成装置
US5887120A (en) * 1995-05-31 1999-03-23 Oracle Corporation Method and apparatus for determining theme for discourse
JPH096379A (ja) * 1995-06-26 1997-01-10 Canon Inc 音声合成装置及び方法
US5878393A (en) * 1996-09-09 1999-03-02 Matsushita Electric Industrial Co., Ltd. High quality concatenative reading system
US6230131B1 (en) * 1998-04-29 2001-05-08 Matsushita Electric Industrial Co., Ltd. Method for generating spelling-to-pronunciation decision tree
AU772874B2 (en) * 1998-11-13 2004-05-13 Scansoft, Inc. Speech synthesis using concatenation of speech waveforms
JP2000206982A (ja) * 1999-01-12 2000-07-28 Toshiba Corp 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体
US6570964B1 (en) * 1999-04-16 2003-05-27 Nuance Communications Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system
US7181399B1 (en) * 1999-05-19 2007-02-20 At&T Corp. Recognizing the numeric language in natural spoken dialogue
US7149690B2 (en) * 1999-09-09 2006-12-12 Lucent Technologies Inc. Method and apparatus for interactive language instruction
DE19963812A1 (de) * 1999-12-30 2001-07-05 Nokia Mobile Phones Ltd Verfahren zum Erkennen einer Sprache und zum Steuern einer Sprachsyntheseeinheit sowie Kommunikationsvorrichtung
US6847931B2 (en) * 2002-01-29 2005-01-25 Lessac Technology, Inc. Expressive parsing in computerized conversion of text to speech
JP3542026B2 (ja) * 2000-05-02 2004-07-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
US6871178B2 (en) * 2000-10-19 2005-03-22 Qwest Communications International, Inc. System and method for converting text-to-voice
GB0113587D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus
US20040030554A1 (en) * 2002-01-09 2004-02-12 Samya Boxberger-Oberoi System and method for providing locale-specific interpretation of text data
US20030216920A1 (en) * 2002-05-16 2003-11-20 Jianghua Bao Method and apparatus for processing number in a text to speech (TTS) application
JP4064748B2 (ja) * 2002-07-22 2008-03-19 アルパイン株式会社 音声発生装置、音声発生方法及びナビゲーション装置
US7174191B2 (en) * 2002-09-10 2007-02-06 Motorola, Inc. Processing of telephone numbers in audio streams
US7047193B1 (en) * 2002-09-13 2006-05-16 Apple Computer, Inc. Unsupervised data-driven pronunciation modeling
US7558732B2 (en) * 2002-09-23 2009-07-07 Infineon Technologies Ag Method and system for computer-aided speech synthesis
US20050096909A1 (en) * 2003-10-29 2005-05-05 Raimo Bakis Systems and methods for expressive text-to-speech
US7567896B2 (en) * 2004-01-16 2009-07-28 Nuance Communications, Inc. Corpus-based speech synthesis based on segment recombination
US7558389B2 (en) * 2004-10-01 2009-07-07 At&T Intellectual Property Ii, L.P. Method and system of generating a speech signal with overlayed random frequency signal
TWI250509B (en) * 2004-10-05 2006-03-01 Inventec Corp Speech-synthesizing system and method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置
JP2001013983A (ja) * 1999-06-25 2001-01-19 Nec Corp 音声合成を用いた音声認識装置および音声認識方法
JP2002049386A (ja) * 2000-08-01 2002-02-15 Sharp Corp テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
JP2004206659A (ja) * 2002-11-07 2004-07-22 Nippon Telegr & Teleph Corp <Ntt> 読み情報決定方法及び装置及びプログラム

Also Published As

Publication number Publication date
JP2006301446A (ja) 2006-11-02
US20060241936A1 (en) 2006-10-26

Similar Documents

Publication Publication Date Title
JP4570509B2 (ja) 読み生成装置、読み生成方法及びコンピュータプログラム
JP5599662B2 (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
US20110131038A1 (en) Exception dictionary creating unit, exception dictionary creating method, and program therefor, as well as speech recognition unit and speech recognition method
JP4930379B2 (ja) 類似文検索方法、類似文検索システム及び類似文検索用プログラム
JP6599219B2 (ja) 読み付与装置、読み付与方法、およびプログラム
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
KR100542757B1 (ko) 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치
KR100288144B1 (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
CN117669553A (zh) 关键字检测装置、关键字检测方法以及存储介质
JP4084515B2 (ja) アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
US11080488B2 (en) Information processing apparatus, output control method, and computer-readable recording medium
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP5583230B2 (ja) 情報検索装置及び情報検索方法
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
JP2004309928A (ja) 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム
KR102278288B1 (ko) 음소 기반 텍스트 검색 장치 및 방법
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
JPH11338498A (ja) 音声合成装置
US20240037129A1 (en) Search device, search method, and recording medium
JP3548372B2 (ja) 文字認識装置
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
KR100960490B1 (ko) 동의어를 이용한 검색 서비스 제공 방법 및 시스템
JPS61122781A (ja) 音声ワ−ドプロセツサ
JP2001166790A (ja) 書き起こしテキスト自動生成装置、音声認識装置および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100810

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100810

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130820

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees