JP4539097B2 - Sentence reading system and method - Google Patents
Sentence reading system and method Download PDFInfo
- Publication number
- JP4539097B2 JP4539097B2 JP2004016099A JP2004016099A JP4539097B2 JP 4539097 B2 JP4539097 B2 JP 4539097B2 JP 2004016099 A JP2004016099 A JP 2004016099A JP 2004016099 A JP2004016099 A JP 2004016099A JP 4539097 B2 JP4539097 B2 JP 4539097B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- language analysis
- processing unit
- synthesis processing
- speech synthesis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Navigation (AREA)
Abstract
Description
本発明は、文章読み上げシステム及び方法に関するものである。 The present invention relates to a text reading system and method.
従来、自動車等の車両に搭載されたナビゲーション装置においては、運転者等の操作者が所定の入力部を操作して目的地を設定すると、該目的地、及び、現在位置検出処理部によって検出された車両の現在位置に基づいて、該現在位置から目的地までの経路が探索され、探索された経路が案内される。また、近年では、情報センタから配信されるニュース等の文字データを取得して表示するとともに、必要に応じて前記ニュース等を音声出力して読み上げるナビゲーション装置が提案されている(例えば、特許文献1参照。)。これにより、操作者は、ナビゲーション装置の表示画面を注視することなく、読み上げられた音声を聞き取ることによって、ニュース等を把握することができる。
しかしながら、前記従来のナビゲーション装置においては、前記ニュース等の文字データが漢字かな混じり文なので、前記ニュース等の内容を音声出力して読み上げるためには、読み上げ専用にひらがなやカタカナのような表音文字のデータが必要とされる。そのため、前記情報センタは、漢字かな混じり文の文字データとともに表音文字のデータも配信する必要があり、負担が大きくなってしまう。また、配信されるデータ量が大きくなってしまい、通信時間が長くなるとともに、通信費用が高くなってしまう。さらに、音声データを配信することも考えられるが、音声データは文字データよりもデータ量が大きいので、通信時間がさらに長くなるとともに、通信費用がさらに高くなってしまう。 However, in the conventional navigation device, since the character data such as the news is a kana-kana mixed sentence, the phonetic characters such as hiragana and katakana are read-only for reading out the contents of the news etc. Data is required. Therefore, it is necessary for the information center to distribute the phonetic character data together with the character data of the kana-kana mixed sentence, which increases the burden. In addition, the amount of data to be distributed is increased, the communication time is increased, and the communication cost is increased. Furthermore, although it is conceivable to distribute voice data, the voice data has a larger data amount than the character data, so that the communication time is further increased and the communication cost is further increased.
もっとも、最近では、漢字かな混じり文の文章を解析して、漢字の読み方を割り当てるシステムが開発されている。しかし、該システムにおいては、文章解析用辞書等の大きな記憶容量を必要とする辞書が使用されており、ナビゲーション装置のように記憶容量に制限のある装置に適用することが困難であった。また、前記システムをナビゲーション装置のように記憶容量に制限のある装置に適用するためには、文章解析用辞書等の辞書の容量を制限する必要があるが、この場合、解析精度が低下して頻繁に間違えて読み上げられるので、聞き取ることができなくなってしまう。 Recently, however, a system has been developed that analyzes kanji-kana mixed sentences and assigns how to read kanji. However, in this system, a dictionary that requires a large storage capacity such as a dictionary for sentence analysis is used, and it has been difficult to apply to a device having a limited storage capacity such as a navigation device. In addition, in order to apply the system to a device having a limited storage capacity such as a navigation device, it is necessary to limit the capacity of a dictionary such as a sentence analysis dictionary. Because they are often mistakenly read out, they cannot be heard.
本発明は、前記従来の問題点を解決して、言語解析サーバが情報提供サーバから配信された文字データを解析して、文書読み上げ装置において読み間違いが発生する形態素を抽出し、該形態素の読み方を示すデータを前記文書読み上げ装置に送信することによって、該文書読み上げ装置は、容量の制限された辞書を参照しながらも、配信された文字データを適切に解析して、該文字データを間違いなく読み上げることができる文章読み上げシステム及び方法を提供することを目的とする。 The present invention solves the above-mentioned conventional problems, the linguistic analysis server analyzes the character data distributed from the information providing server, extracts the morpheme in which the reading error occurs in the document reading device, and reads the morpheme Is transmitted to the document reading device, the document reading device properly analyzes the distributed character data while referring to the dictionary having a limited capacity, and is surely analyzing the character data. An object is to provide a text-to-speech reading system and method that can be read aloud.
そのために、本発明の文章読み上げシステムにおいては、漢字かな混じりの文字データを配信する情報提供サーバと、言語解析用辞書を参照して前記文字データを解析して読み上げる音声合成処理部を備える文書読み上げ装置と、前記言語解析用辞書よりも豊富な辞書内容を備えるサーバ用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成するサーバ用音声合成処理部であって、前記音声合成処理部よりも高い処理能力を備えるサーバ用音声合成処理部と、前記言語解析用辞書と同等の辞書内容を備える比較用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成する比較用音声合成処理部であって、前記音声合成処理部と同等の処理能力を備える比較用音声合成処理部とを備え、前記サーバ用音声合成処理部が作成した表音文字列と前記比較用音声合成処理部が作成した表音文字列とを比較して読み方が相違する形態素を抽出し、該形態素の読み方を示すデータを前記文書読み上げ装置に送信する言語解析サーバとを有し、前記文書読み上げ装置は、前記形態素の読み方を示すデータを使用して前記文字データを解析して読み上げる。 Therefore, in the text-to-speech reading system according to the present invention, the text-to-speech system includes an information providing server that delivers character data mixed with kanji and kana , and a speech synthesis processing unit that analyzes and reads out the character data with reference to a language analysis dictionary A phonetic character string is created by decomposing the character data into morphemes with reference to a device and a server language analysis dictionary having abundant dictionary contents than the language analysis dictionary and assigning readings to each morpheme Refer to the server speech synthesis processing unit, which is a server speech synthesis processing unit having higher processing capability than the speech synthesis processing unit, and a comparative language analysis dictionary having the same dictionary contents as the language analysis dictionary A speech synthesis processing unit for comparison, which generates a phonetic character string by decomposing the character data into morphemes and assigning readings to the morphemes. A phonetic character string created by the server voice synthesis processing unit and a phonetic character created by the comparison voice synthesis processing unit. And a linguistic analysis server that extracts morphemes having different readings by comparing with columns and transmits data indicating how to read the morphemes to the document reading device, and the document reading device indicates how to read the morphemes. Using the data, the character data is analyzed and read out.
本発明の更に他の文章読み上げシステムにおいては、さらに、前記形態素の読み方を示すデータは、前記読み方が相違する形態素及び該形態素の読み方の一覧データである。 In yet another sentence reading system of the present invention, further, data indicating the reading of the morpheme is a list data reading morpheme and the morpheme said read way is different.
本発明の更に他の文章読み上げシステムにおいては、さらに、前記形態素の読み方を示すデータは、前記文字データにおける前記読み方が相違する形態素に該当する文字を前記形態素の読み方を表す表音文字で置換した文字データである。 In yet another sentence reading system of the present invention, further, data indicating the reading of the morphemes, replaces the character corresponding to morpheme the read how in the character data is different from phonetic character for reading the morpheme Character data.
本発明の文章読み上げ方法においては、情報提供サーバは漢字かな混じりの文字データを配信し、言語解析サーバは、サーバ用音声合成処理部が、サーバ用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成し、前記サーバ用音声合成処理部よりも低い処理能力を備える比較用音声合成処理部が、前記サーバ用言語解析用辞書よりも豊富でない辞書内容を備える比較用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成し、前記サーバ用音声合成処理部が作成した表音文字列と前記比較用音声合成処理部が作成した表音文字列とを比較して読み方が相違する形態素を抽出し、該形態素の読み方を示すデータを文書読み上げ装置に送信し、該文書読み上げ装置は、前記比較用音声合成処理部と同等の処理能力を備える音声合成処理部が、前記形態素の読み方を示すデータを使用し、前記比較用言語解析用辞書と同等の辞書内容を備える言語解析用辞書を参照して前記文字データを解析して読み上げる。 In the text-to-speech reading method of the present invention, the information providing server delivers kanji-kana mixed character data, and the language analysis server has the server speech synthesis processing unit refer to the server language analysis dictionary to read the character data. A speech synthesis processing unit for comparison, which has a processing capability lower than that of the server speech synthesis processing unit, generates a phonetic character string by decomposing into morphemes and assigning readings to each morpheme, and the server language analysis dictionary The server speech synthesis processing unit creates a phonetic character string by decomposing the character data into morphemes with reference to a comparative language analysis dictionary having less rich dictionary contents, and assigning a reading to each morpheme There was extracted reading by comparing the phonetic character string in which the comparative speech synthesis processing unit and the phonetic character string created is created morphemes different, indicating the reading of the morpheme Sends over data to the document reading apparatus, the document reading apparatus, the speech synthesis processing unit comprising the same processing power and the comparison for speech synthesis processing unit uses the data indicating the reading of the morphemes, the comparison The character data is analyzed and read aloud with reference to a language analysis dictionary having a dictionary content equivalent to that of a language analysis dictionary .
本発明の言語解析サーバにおいては、言語解析用辞書を参照して漢字かな混じりの文字データを読み上げる文書読み上げ装置に対して前記文字データに含まれる形態素の読み方を示すデータを送信する言語解析サーバであって、前記言語解析用辞書よりも豊富な辞書内容を備えるサーバ用言語解析用辞書と、前記言語解析用辞書と同等の辞書内容を備える比較用言語解析用辞書と、前記サーバ用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成するサーバ用音声合成処理部と、前記比較用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成する比較用音声合成処理部であって、前記サーバ用音声合成処理部よりも低い処理能力を備える比較用音声合成処理部とを有し、前記サーバ用音声合成処理部が作成した表音文字列と前記比較用音声合成処理部が作成した表音文字列とを比較して読み方が相違する形態素を抽出し、該形態素の読み方を示すデータを作成して送信する。 The language analysis server of the present invention is a language analysis server that transmits data indicating how to read a morpheme included in the character data to a document reading device that reads out character data mixed with kanji by referring to the language analysis dictionary. A server language analysis dictionary having a richer dictionary content than the language analysis dictionary, a comparative language analysis dictionary having a dictionary content equivalent to the language analysis dictionary, and the server language analysis The character data is decomposed into morphemes with reference to a dictionary, and a speech synthesis processing unit for a server that creates a phonetic character string by assigning a reading to each morpheme, and the characters with reference to the comparative language analysis dictionary decomposing the data into morphemes, a comparative speech synthesis processing unit for creating a phonetic character string by assigning reading the morphemes, voice multiplexer for said server And a comparator for speech synthesis processing unit including a lower processing capacity than the processing unit, and a phonetic character string in which the comparative speech synthesis processing unit and the phonetic character string speech synthesis unit for the server has created created Are extracted, morphemes with different readings are extracted, and data indicating how to read the morphemes is created and transmitted .
本発明の文章読み上げ装置においては、情報提供サーバが配信した漢字かな混じりの文字データ、及び、言語解析サーバが送信した前記文字データに含まれる形態素の読み方を示すデータを受信する受信部と、言語解析用辞書を参照し、前記形態素の読み方を示すデータを使用して前記文字データを解析する言語解析部と、前記文字データを読み上げるための音声波形データを作成する音声波形生成部とを有する文章読み上げ装置であって、前記形態素の読み方を示すデータは、前記言語解析サーバにおいて、サーバ用音声合成処理部が、サーバ用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成し、前記サーバ用音声合成処理部よりも低い処理能力を備える比較用音声合成処理部が、前記サーバ用言語解析用辞書よりも豊富でなく、前記言語解析用辞書と同等の辞書内容を備える比較用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成し、前記サーバ用音声合成処理部が作成した表音文字列と前記比較用音声合成処理部が作成した表音文字列とを比較することにより抽出された、読み方が相違する形態素の読み方を示すデータである。 In the text-to-speech reading apparatus of the present invention, a receiving unit that receives character data mixed with kanji and kana distributed by the information providing server, and data indicating how to read morphemes included in the character data transmitted by the language analysis server, and a language A sentence having a language analysis unit that analyzes the character data using data indicating how to read the morpheme with reference to an analysis dictionary, and a speech waveform generation unit that creates speech waveform data for reading the character data In the speech reading apparatus, the data indicating how to read the morpheme is stored in the language analysis server by the server speech synthesis processing unit, decomposing the character data into morphemes with reference to the server language analysis dictionary. A phonetic character string is created by assigning a reading to the voice, and a comparative sound having a processing capability lower than that of the server speech synthesis processing unit The composition processing unit is not more abundant than the server language analysis dictionary, and decomposes the character data into morphemes with reference to a comparative language analysis dictionary having dictionary contents equivalent to the language analysis dictionary, By creating a phonetic character string by assigning readings to morphemes, and comparing the phonetic character string created by the server speech synthesis processing unit with the phonetic character string created by the comparison speech synthesis processing unit This is data indicating how to read the extracted morphemes with different readings .
本発明によれば、文書読み上げ装置は、容量の制限された辞書を参照しながらも、配信された文字データを適切に解析して、該文字データを間違いなく読み上げることができる。 According to the present invention, the document reading device can properly analyze the distributed character data and read the character data without fail while referring to a dictionary with a limited capacity.
以下、本発明の実施の形態について図面を参照しながら詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は本発明の第1の実施の形態における文章読み上げシステムの構成を示す概念図である。 FIG. 1 is a conceptual diagram showing the configuration of a text-to-speech system according to the first embodiment of the present invention.
図において、10は文章読み上げシステムである。そして、21は情報提供サーバであり、CPU、MPU等の演算手段、半導体メモリ、磁気ディスク、光ディスク等の記憶手段、通信インターフェイス等を備えるコンピュータである。なお、前記情報提供サーバ21は単一のコンピュータでなく、複数のコンピュータが有機的に結合された、いわゆる、分散型サーバであってもよい。また、前記情報提供サーバ21の中に他のシステムが構築されていてもよい。さらに、前記情報提供サーバ21は、他のコンピュータの中に構築されたシステムの一つであってもよい。
In the figure, 10 is a text reading system.
そして、11は、操作者によって操作される文書読み上げ装置としての車載装置であり、例えば、乗用車、トラック、バス、オートバイ等の車両12に搭載されている。車載装置は、実際には多数であるが、本実施の形態においては、説明の都合上、車載装置11で代表する。また、前記操作者は、車両12の運転者、同乗者等である。
なお、前記車載装置11は、CPU、MPU等の演算装置、半導体メモリ、磁気ディスク、光ディスク等の記憶装置、液晶ディスプレイ、LED(Light Emitting Diode)ディスプレイ、CRT等の表示装置、キーボード、ジョイスティック、十字キー、押しボタン、リモートコントローラ、タッチパネル等の入力装置、後述されるスピーカ11a等の音声出力装置、及び、通信インターフェイス、無線LAN(Local Area Network)装置等の送受信装置を備える。前記車載装置11は、例えば、車両12に搭載されるナビゲーション装置であるが、据置電話機、携帯電話機、PHS(Personal Handy−Phone System)電話機、携帯情報端末、PDA(Personal Digital Assistant)、パーソナルコンピュータ、ゲーム機、デジタルテレビ等いかなるものであってもよい。そして、前記車載装置11は、必ずしも車両12に搭載されるものでなくてもよいが、ここでは、車両12に搭載されるものとして説明する。
The in-
さらに、前記車載装置11は、図示されない現在位置検出装置を有するものであってもよい。該現在位置検出装置は、前記車載装置11が、例えば、ナビゲーション装置である場合、一般的には、GPS(Global Positioning System)、地磁気センサ、距離センサ、ステアリングセンサ、ビーコンセンサ、ジャイロセンサ等によって現在位置を検出する。また、例えば、携帯電話機、携帯情報端末等である場合、一般的には、該携帯電話機、携帯情報端末等が在圏する基地局との通信に基づいて、該基地局の位置を現在位置として検出する。
Further, the in-
ここで、前記情報提供サーバ21と車載装置11とはネットワーク22を介して相互に通信可能に接続される。なお、該ネットワーク22は、有線又は無線の公衆通信回線網、専用通信回線網、携帯電話回線網、インターネット、イントラネット、LAN、WAN(Wide Area Network)、衛星通信回線網等いかなる通信回線網であってもよく、これらを適宜組み合わせたものであってもよい。また、放送衛星によるCS放送やBS放送を利用して通信してもよく、地上波デジタルテレビ放送を利用して通信してもよく、FM多重放送を利用して通信してもよく、また、道路脇(わき)、道路上等に設置されている光ビーコン、電波ビーコン、アンテナ等を利用して路車通信を行ってもよい。
Here, the
本実施の形態においては、車載装置11が、ネットワーク22に接続されたアクセスポイント23との間で無線LANシステムによって通信を行うことで、前記ネットワーク22に接続するものとして説明する。前記アクセスポイント23は、例えば、無線LANアダプタであり、2.4〔GHz〕ISM帯、5.2〔GHz〕帯、19〔GHz〕帯準ミリ波等を使用したり赤外線を使用したりして、前記車載装置11との間で無線LANシステムによって通信を行うものである。この場合の無線LANシステムとしては、例えば、IEEE802.11a、IEEE802.11b、IEEE802.11e、IEEE802.11g等や、家庭内無線システムとして採用されているブルートゥース等であるが、いかなるシステムであってもよい。なお、前記アクセスポイント23は、いかなる場所に配設されたものであってもよく、操作者の住居であってもよいし、多数の者が使用可能なように、ガソリンスタンド、飲食店、駐車場等に配設されたものであってもよい。
In the present embodiment, description will be made assuming that the in-
そして、前記情報提供サーバ21は、ニュース、天気予報、企業情報、株式市況、為替市況等の各種情報をテキストデータ、すなわち、文字データとして配信する。該文字データは、本来、前記車載装置11の表示装置に各種情報を文章で表示するためのデータなので、通常、漢字かな混じり文として構成されている。文字データは、音声データに比較してデータ量が小さいので、テレビ電波を利用して送信することもできる。
The
また、本実施の形態における車載装置11は、機能の観点から、前記情報提供サーバ21や言語解析サーバ31が送信するデータを受信する受信部、音声合成処理部14、言語解析用辞書15、ユーザ定義言語解析用辞書16及び音声データ生成用辞書17を備える文書読み上げ処理部13を有する。該文書読み上げ処理部13は、前記情報提供サーバ21から受信した文字データにおける漢字かな混じり文の文章を解析して、漢字や記号の読み方を割り当てることによって、前記文字データを読み上げるようになっている。
Moreover, the vehicle-mounted
そして、前記ネットワーク22には、言語解析サーバ31が通信可能に接続されている。該言語解析サーバ31は、CPU、MPU等の演算手段、半導体メモリ、磁気ディスク、光ディスク等の記憶手段、通信インターフェイス等を備えるコンピュータである。なお、前記言語解析サーバ31は単一のコンピュータでなく、複数のコンピュータが有機的に結合された、いわゆる、分散型サーバであってもよい。また、前記言語解析サーバ31の中に他のシステムが構築されていてもよい。さらに、前記言語解析サーバ31は、他のコンピュータと一体的に構成されたものであってもよいし、他のコンピュータの中に構築されたシステムの一つであってもよい。例えば、前記言語解析サーバ31は、情報提供サーバ21と一体的に構成されたものであってもよいし、該情報提供サーバ21の中に構築されたシステムの一つであってもよい。
A language analysis server 31 is communicably connected to the
ここで、前記言語解析サーバ31は、機能の観点から、サーバ用音声合成処理部32、サーバ用言語解析用辞書33、比較用音声合成処理部としての車載装置用音声合成処理部34、及び、比較用言語解析用辞書としての車載装置用言語解析用辞書35を有する。そして、前記車載装置用音声合成処理部34は前記車載装置11の音声合成処理部14と同等の処理能力を有し、また、前記車載装置用言語解析用辞書35は前記車載装置11の言語解析用辞書15と同等の記憶容量及び同等の辞書内容を有する。また、サーバ用音声合成処理部32は前記車載装置11の音声合成処理部14よりも高い処理能力を有し、さらに、前記サーバ用言語解析用辞書33は前記車載装置11の言語解析用辞書15よりも大きな記憶容量及び豊富な辞書内容を有する。例えば、前記車載装置11の言語解析用辞書15の記憶容量が1〔MB〕以下程度であるのに対して、前記サーバ用言語解析用辞書33の記憶容量は100〔MB〕程度である。
Here, the language analysis server 31 includes a server speech
そして、前記言語解析サーバ31は、前記情報提供サーバ21から受信した文字データにおける漢字かな混じり文の文章を解析して漢字や記号の読み方を割り当てる。この場合、同一の文字データにおける漢字かな混じり文の文章を、サーバ用音声合成処理部32及び車載装置用音声合成処理部34がそれぞれ解析する。前記サーバ用音声合成処理部32は、高い処理能力を有し、しかも、大きな記憶容量及び豊富な辞書内容を有するサーバ用言語解析用辞書33を参照して前記文章を解析するので、高い精度で解析することができ、漢字の読み方を正確に割り当てることができる。これに対し、前記車載装置用音声合成処理部34は、前記車載装置11の音声合成処理部14と同等の処理能力を有し、しかも、前記車載装置11の言語解析用辞書15と同等の記憶容量及び同等の辞書内容を有する車載装置用言語解析用辞書35を参照して前記文章を解析するので、前記車載装置11の言語解析用辞書15と同等の精度でしか解析することができず、漢字の読み間違いが発生する。そこで、前記言語解析サーバ31は、前記サーバ用音声合成処理部32の解析結果と車載装置用音声合成処理部34の解析結果とを比較し、読み方の相違する形態素を抽出する。なお、形態素とは、意味を持つ最小の言語単位である。
Then, the language analysis server 31 analyzes the kanji-kana mixed sentence in the character data received from the
ここで、抽出された形態素は、車載装置11において読み間違いが発生する形態素であると考えることができるので、サーバ用音声合成処理部32が解析した前記形態素の読み方を示すデータとして、前記形態素及びその読み方の一覧データが前記車載装置11に送信されるようになっている。すると、該車載装置11は、受信した一覧データをユーザ定義言語解析用辞書16に格納する。なお、前記一覧データのデータ量は、通常、数〔KB〕程度であると考えられる。そして、車載装置11の音声合成処理部14は、言語解析用辞書15及びユーザ定義言語解析用辞書16を参照して、前記情報提供サーバ21から受信した文字データにおける漢字かな混じり文の文章を解析し、漢字や記号の読み方を割り当てる。そのため、前記文章を正確に解析することができ、漢字や記号の読み方を間違いなく割り当てることができる。このように、前記車載装置11は、前記形態素の読み方を示すデータを使用して前記情報提供サーバ21から受信した文字データを解析して読み上げるので、前記文字データを間違いなく読み上げることができる。
Here, since the extracted morpheme can be considered as a morpheme in which a reading error occurs in the in-
次に、前記車載装置11の文書読み上げ処理部13の構成を詳細に説明する。
Next, the configuration of the document
図2は本発明の第1の実施の形態における車載装置の構成を示す図である。 FIG. 2 is a diagram showing the configuration of the in-vehicle device according to the first embodiment of the present invention.
ここでは、前記車載装置11が、ネットワーク22及びアクセスポイント23を介して、情報提供サーバ21から文字データとして配信された文字ニュースを受信した場合について説明する。該文字ニュースは、「5日午前9時現在の東京外国為替市場の円相場は、1ドル=109円57〜60銭。」という漢字かな混じり文の文章である。なお、前記車載装置11の音声合成処理部14は、図2に示されるように、言語解析部14a、音声波形生成部14b及び音声波形再生部14cを備える。また、該音声波形再生部14cには、音声出力装置としてスピーカ11aが接続されている。
Here, the case where the said vehicle-mounted
そして、前記言語解析部14aは、言語解析用辞書15及びユーザ定義言語解析用辞書16の二つの言語解析用辞書を参照して、前記文字ニュースを形態素に分解する。なお、前記ユーザ定義言語解析用辞書16には、言語解析サーバ31から受信した一覧データが一時的に登録されているものとする。この場合、前記文字ニュースは、「/5/日/午前/9/時/現在/の/東京/外国/為替/市場/の/円/相場/は/、/1/ドル/=/109/円/57/〜/60/銭/。/」というように分解される。
Then, the
さらに、前記言語解析部14aは、前記二つの言語解析用辞書を参照して、各形態素の読み方の文字列を作成する。なお、一つの形態素に対して読み方が複数ある場合には、あらかじめ設定されている優先度データを参照する。この場合、前記文字ニュースの読み方の文字列は、「/いつか/ごぜん/くじ/げんざい/の/とーきょー/がいこく/かわせ/しじょう/の/えん/そーば/わ/、/いち/どる//ひゃくきゅう/えん/ごじゅうなな/から/ろくじっ/せん/。/」となる。
Further, the
そして、前記音声波形生成部14bは、音声データ生成用辞書17を参照して、前記言語解析部14aが作成した読み方の文字列から音声波形データを作成する。該音声波形データは、0と1とから構成されるバイナリーコードである。また、前記音声波形再生部14cは、前記音声波形生成部14bが作成した音声波形データを再生して、スピーカ11aから出力させる。これにより、前記文字ニュースは、「いつかごぜんくじげんざいのとーきょーがいこくかわせしじょうのえんそーばわいちどるひゃくきゅうえんごじゅうななからろくじっせん」というように読み上げられる。
Then, the speech
次に、前記構成の文章読み上げシステム10の動作について説明する。 Next, the operation of the text-to-speech reading system 10 having the above configuration will be described.
図3は本発明の第1の実施の形態における文章読み上げシステムの動作を示す第1のフローチャート、図4は本発明の第1の実施の形態における文章読み上げシステムの動作を示す第2のフローチャートである。 FIG. 3 is a first flowchart showing the operation of the text-to-speech system according to the first embodiment of the present invention. FIG. 4 is a second flowchart showing the operation of the text-to-speech system according to the first embodiment of the present invention. is there.
ここでは、操作者が車載装置11を操作して要求した文字ニュースを情報提供サーバ21から受信する場合の動作について説明する。この場合、前記操作者が車載装置11を操作して、所望のジャンルの文字ニュースを情報提供サーバ21から受信して読み上げる動作を前記車載装置11に実行させる。ここで、操作者は外国為替市況に関する文字ニュースを選択したものとする。すると、前記車載装置11は、アクセスポイント23及びネットワーク22を介して、文字ニュースの送信を要求する文字ニュース要求を情報提供サーバ21に送信する。
Here, the operation when the operator receives the text news requested by operating the in-
一方、該情報提供サーバ21は、車載装置11からの文字ニュース要求を待機している文字ニュース要求受信待ちの状態にあり、文字ニュース要求を受信したか否かを継続的に判断している。そして、前記車載装置11から文字ニュース要求を受信すると、前記情報提供サーバ21は、前記文字ニュース要求の内容に応じたジャンルの文字ニュースを選択して決定する。ここでは、外国為替市況に関する文字ニュースを送信する文字ニュースとして決定する。続いて、前記情報提供サーバ21は、ネットワーク22を介して、文字ニュースを解析することを要求する文字ニュース解析要求を言語解析サーバ31に送信する。
On the other hand, the
ここで、該言語解析サーバ31は、文字ニュース解析要求を待機している文字ニュース解析要受信求待ちの状態にあり、文字ニュース解析要求を受信したか否かを継続的に判断している。そして、前記情報提供サーバ21から文字ニュース解析要求を受信すると、前記言語解析サーバ31は、解析するべき文字ニュースの送信を要求する文字ニュース要求を情報提供サーバ21に送信する。
Here, the language analysis server 31 is waiting for a character news analysis request to be waiting for a character news analysis request, and continuously determines whether or not a character news analysis request has been received. When receiving the character news analysis request from the
この場合、該情報提供サーバ21は、文字ニュース解析要求を送信した後、言語解析サーバ31からの文字ニュース要求を待機している文字ニュース要求受信待ちの状態にあり、文字ニュース要求を受信したか否かを継続的に判断している。そして、前記言語解析サーバ31から文字ニュース要求を受信すると、前記情報提供サーバ21は、決定された前記文字ニュース、すなわち、外国為替市況に関する文字ニュースを前記言語解析サーバ31に送信する。さらに、前記情報提供サーバ21は、解析結果の送信先を前記言語解析サーバ31に通知する。この場合、前記解析結果の送信先は、前記車載装置11であり、該車載装置11のID番号、IP(Internet Protocol)アドレス、MAC(Media Access Control)アドレス等が前記言語解析サーバ31に送信される。
In this case, whether or not the
一方、該言語解析サーバ31は、文字ニュース要求を送信した後、文字ニュースを待機している文字ニュース受信待ちの状態にあり、文字ニュースを受信したか否かを継続的に判断している。そして、前記情報提供サーバ21から文字ニュースを受信すると、文字ニュース解析処理を実行する。この場合、前記文字ニュースをサーバ用音声合成処理部32及び車載装置用音声合成処理部34がそれぞれ解析する。そして、前記言語解析サーバ31は、前記サーバ用音声合成処理部32の解析結果と車載装置用音声合成処理部34の解析結果とを比較し、読み方の相違する形態素を抽出する。続いて、前記言語解析サーバ31は、抽出された形態素と、前記サーバ用音声合成処理部32が解析した前記抽出された形態素の読み方の一覧データを作成し、該一覧データを解析結果として、前記車載装置11に送信する。そして、前記言語解析サーバ31は、文字ニュース解析処理が終了した旨の解析終了通知を情報提供サーバ21に送信して、処理を終了する。
On the other hand, after transmitting the text news request, the language analysis server 31 is waiting for the text news reception waiting for the text news, and continuously determines whether or not the text news has been received. When character news is received from the
また、前記情報提供サーバ21は、解析結果の送信先を通知した後、言語解析サーバ31からの解析終了通知を待機している文字ニュース解析終了待ちの状態にあり、解析終了通知を受信したか否かを継続的に判断している。そして、前記言語解析サーバ31から解析終了通知を受信すると、前記情報提供サーバ21は、決定された前記文字ニュース、すなわち、外国為替市況に関する文字ニュースを前記車載装置11に送信して、処理を終了する。
In addition, whether the
一方、前記車載装置11は、文字ニュース要求を送信した後、解析結果及び文字ニュースを待機している文字ニュース受信終了待ちの状態にあり、解析結果を受信したか否か、及び、文字ニュースを受信したか否かを継続的に判断している。そして、前記言語解析サーバ31から解析結果を受信すると、前記車載装置11は、前記抽出された形態素とその読み方の一覧データをユーザ定義言語解析用辞書16に一時的に登録する。続いて、前記外国為替市況に関する文字ニュースを情報提供サーバ21から受信すると、前記車載装置11は、文字ニュース解析処理を実行する。この場合、前記車載装置11の言語解析部14aは、言語解析用辞書15、及び、前記一覧データが一時的に登録されているユーザ定義言語解析用辞書16を参照して、前記文字ニュースを解析する。続いて、前記車載装置11の音声波形生成部14bは、音声データ生成用辞書17を参照して、前記言語解析部14aが作成した読み方の文字列から音声波形データを生成する音声波形生成処理を実行する。続いて、前記車載装置11の音声波形再生部14cは、前記音声波形生成部14bが生成した音声波形データを再生して、スピーカ11aから出力させる音声波形再生処理を実行する。これにより、前記文字ニュースが間違いなく読み上げられる。そして、前記車載装置11は、一時的に登録されていた前記一覧データをユーザ定義言語解析用辞書16から削除して、処理を終了する。
On the other hand, after transmitting the text news request, the in-
次に、フローチャートについて説明する。
ステップS1 車載装置11は、文字ニュース要求を情報提供サーバ21に送信する。
ステップS2 情報提供サーバ21は、車載装置11からの文字ニュース要求を待機する。
ステップS3 情報提供サーバ21は、文字ニュース要求を受信したか否かを判断する。文字ニュース要求を受信した場合はステップS4に進み、文字ニュース要求を受信していない場合はステップS2に戻る。
ステップS4 情報提供サーバ21は、車載装置11に送信する文字ニュースを決定する。
ステップS5 情報提供サーバ21は、文字ニュース解析要求を送信する。
ステップS6 言語解析サーバ31は、文字ニュース解析要求を待機する。
ステップS7 言語解析サーバ31は、文字ニュース解析要求を受信したか否かを判断する。文字ニュース解析要求を受信した場合はステップS8に進み、文字ニュース解析要求を受信していない場合はステップS6に戻る。
ステップS8 言語解析サーバ31は、解析する文字ニュース要求を送信する。
ステップS9 情報提供サーバ21は、言語解析サーバ31からの文字ニュース要求を待機する。
ステップS10 情報提供サーバ21は、文字ニュース要求を受信したか否かを判断する。文字ニュース要求を受信した場合はステップS11に進み、文字ニュース要求を受信していない場合はステップS9に戻る。
ステップS11 情報提供サーバ21は、文字ニュースを送信する。
ステップS12 情報提供サーバ21は、解析結果の送信先を通知する。
ステップS13 言語解析サーバ31は、文字ニュースを待機する。
ステップS14 言語解析サーバ31は、文字ニュースを受信したか否かを判断する。文字ニュースを受信した場合はステップS15に進み、文字ニュースを受信していない場合はステップS13に戻る。
ステップS15 言語解析サーバ31は、文字ニュース解析処理を実行する。
ステップS16 言語解析サーバ31は、解析結果を送信する。
ステップS17 言語解析サーバ31は、解析終了通知を送信して処理を終了する。
ステップS18 情報提供サーバ21は、文字ニュース解析終了を待機する。
ステップS19 情報提供サーバ21は、解析終了通知を受信したか否かを判断する。解析終了通知を受信した場合はステップS20に進み、解析終了通知を受信していない場合はステップS18に戻る。
ステップS20 情報提供サーバ21は、文字ニュースを送信して処理を終了する。
ステップS21 車載装置11は、文字ニュース受信終了を待機する。
ステップS22 車載装置11は、解析結果を受信したか否かを判断する。解析結果を受信した場合はステップS23に進み、解析結果を受信していない場合はステップS24に進む。
ステップS23 車載装置11は、ユーザ定義言語解析辞書16に一覧データを一時的に登録する。
ステップS24 車載装置11は、文字ニュースを受信したか否かを判断する。文字ニュースを受信した場合はステップS25に進み、文字ニュースを受信していない場合はステップS21に戻る。
ステップS25 車載装置11は、文字ニュース解析処理を実行する。
ステップS26 車載装置11は、音声波形生成処理を実行する。
ステップS27 車載装置11は、文字ニュースを読み上げる(音声波形再生処理)。
ステップS28 車載装置11は、ユーザ定義言語解析辞書16から一覧データを削除して処理を終了する。
Next, a flowchart will be described.
Step S <b> 1 The in-
Step S2 The
Step S3 The
Step S4 The
Step S5 The
Step S6 The language analysis server 31 waits for a character news analysis request.
Step S7: The language analysis server 31 determines whether or not a character news analysis request has been received. If a character news analysis request has been received, the process proceeds to step S8. If a character news analysis request has not been received, the process returns to step S6.
Step S8: The language analysis server 31 transmits a character news request to be analyzed.
Step S9 The
Step S10: The
Step S11 The
Step S12 The
Step S13 The language analysis server 31 stands by for character news.
Step S14: The language analysis server 31 determines whether text news has been received. If character news has been received, the process proceeds to step S15. If character news has not been received, the process returns to step S13.
Step S15 The language analysis server 31 executes a character news analysis process.
Step S16: The language analysis server 31 transmits the analysis result.
Step S17 The language analysis server 31 transmits an analysis end notification and ends the process.
Step S18 The
Step S19: The
Step S20 The
Step S21 The in-
Step S22 The in-
Step S <b> 23 The in-
Step S24: The in-
Step S25 The in-
Step S26 The in-
Step S27 The in-
Step S28 The in-
次に、前記言語解析サーバ31が実行する文字ニュース解析処理について詳細に説明する。ここでは、文字ニュースが外国為替市況に関する文字ニュースであり、漢字かな混じり文の文章である場合について説明する。 Next, the character news analysis process executed by the language analysis server 31 will be described in detail. Here, a case will be described in which the text news is text news related to the foreign exchange market situation and is a sentence in a kanji-kana mixed sentence.
図5は本発明の第1の実施の形態における言語解析サーバの文字ニュース解析処理の動作を示すフローチャートである。 FIG. 5 is a flowchart showing the operation of the character news analysis process of the language analysis server in the first embodiment of the present invention.
まず、言語解析サーバ31は、解析するべき文字ニュースを情報提供サーバ21から受信する。ここで、前記文字ニュースは、外国為替市況に関する文字ニュースであり、図5(a)に示されるように、「5日午前9時現在の東京外国為替市場の円相場は、1ドル=109円57〜60銭。」という漢字かな混じり文の文章である。そして、前記言語解析サーバ31は、前記文字ニュースをサーバ用音声合成処理部32及び車載装置用音声合成処理部34にそれぞれ解析させる。
First, the language analysis server 31 receives character news to be analyzed from the
ここで、前記サーバ用音声合成処理部32は、高い処理能力を有し、しかも、大きな記憶容量及び豊富な高精度の辞書内容を有するサーバ用言語解析用辞書33及び優先度データを参照して前記文字ニュースの文章を解析するので、高い精度で解析することができ、漢字の読み方を正確に割り当てることができる。そして、前記サーバ用音声合成処理部32は、前記文字ニュースの文章を形態素に分割する。この場合、前記文字ニュースは、図5(b)に示されるように、「/5/日/午前/9/時/現在/の/東京/外国/為替/市場/の/円/相場/は/、/1/ドル/=/109/円/57/〜/60/銭/。/」と分解される。続いて、前記サーバ用音声合成処理部32は、形態素のそれぞれに読み方を割り当て、読み方の文字列としての表音文字列を作成する。該表音文字列は、図5(c)に示されるように、「/いつか/ごぜん/くじ/げんざい/の/とーきょー/がいこく/かわせ/しじょう/の/えん/そーば/わ/、/いち/どる//ひゃくきゅう/えん/ごじゅうなな/から/ろくじっ/せん/。/」となる。
Here, the server speech
また、前記車載装置用音声合成処理部34は、前記サーバ用音声合成処理部32より低い処理能力を有し、小さな記憶容量及び豊富でなく低精度の辞書内容を有するサーバ用言語解析用辞書33及び優先度データを参照して前記文字ニュースの文章を解析するので、高い精度で解析することができず、漢字の読み間違いが発生する。なお、前記車載装置用音声合成処理部34の処理能力は前記車載装置11の音声合成処理部14と同等であり、車載装置用言語解析用辞書35及び優先度データの記憶容量及び辞書内容も前記車載装置11の言語解析用辞書15及び優先度データと同等である。
Further, the on-board device speech
そして、前記車載装置用音声合成処理部34は、前記文字ニュースの文章を形態素に分割する。この場合、前記文字ニュースは、図5(d)に示されるように、「/5/日/午前/9/時/現在/の/東京/外国/為替/市場/の/円/相場/は/、/1/ドル/=/109/円/57/〜/60/銭/。/」と分解される。続いて、前記車載装置用音声合成処理部34は、形態素のそれぞれに読み方を割り当て、読み方の文字列としての表音文字列を作成する。該表音文字列は、図5(e)に示されるように、「/ご/にち/ごぜん/きゅう/じ/げんざい/の/とーきょー/がいこく/かわせ/いちば/の/えん/そーば/わ/、/いち/どる/いこーる/ひゃくきゅう/えん/ごじゅうなな//ろくじゅう/せん/。/」となる。
Then, the on-vehicle device speech
続いて、前記言語解析サーバ31は、前記サーバ用音声合成処理部32の作成した表音文字列と車載装置用音声合成処理部34の作成した表音文字列とを比較し、読み方の相違する形態素を抽出する。前記二つの表音文字列において読み方の相違する形態素は、図5(f)及び(g)において○で囲んだ形態素である。このようにして抽出された形態素は、車載装置11において読み間違いが発生する形態素であると考えることができる。そこで、前記言語解析サーバ31は、読み方の相違する形態素とその読み方の一覧データを作成する。なお、該一覧データに含まれる読み方は、正確であると考えられるサーバ用音声合成処理部32によって割り当てられた読み方である。すなわち、前記一覧データは、車載装置11において読み間違いが発生する形態素とその正しい読み方の一覧データである。該一覧データは、図5(h)に示されるように、『「5日」:/いつか、「9時」:/くじ、「市場」:/しじょう、「=」:/(無音)、「〜」:/から、「60」:ろくじっ』となる。
Subsequently, the language analysis server 31 compares the phonetic character string created by the server voice
そして、前記言語解析サーバ31は、前記一覧データを前記車載装置11に送信して処理を終了する。
Then, the language analysis server 31 transmits the list data to the in-
次に、フローチャートについて説明する。
ステップS15−1 解析する文字ニュースを情報提供サーバ21から受信する。
ステップS15−2 サーバ用音声合成処理部32は文書を形態素に分割する。
ステップS15−3 サーバ用音声合成処理部32は形態素それぞれに読み方を割り当て、表音文字列を作成する。
ステップS15−4 車載装置用音声合成処理部34は文章を形態素に分割する。
ステップS15−5 車載装置用音声合成処理部34は形態素それぞれに読み方を割り当て、表音文字列を作成する。
ステップS15−6 二つの表音文字列を比較し、異なる形態素を抽出する。
ステップS15−7 読み間違いが発生する形態素の一覧データを作成する。
ステップS15−8 一覧データを車載装置11に送信して処理を終了する。
Next, a flowchart will be described.
Step S15-1: Character news to be analyzed is received from the
Step S15-2: The server speech
Step S15-3: The server speech
Step S15-4 The on-vehicle device speech
Step S15-5: The on-vehicle device speech
Step S15-6: The two phonetic character strings are compared and different morphemes are extracted.
Step S15-7: List data of morphemes in which reading errors occur.
Step S15-8 The list data is transmitted to the in-
このように、本実施の形態においては、情報提供サーバ21から車載装置11に送信される文字データが言語解析サーバ31によって解析されるようになっている。ここで、該言語解析サーバ31は、高い処理能力を有し、大きな記憶容量及び豊富な辞書内容を有するサーバ用言語解析用辞書33を参照して文章を解析するサーバ用音声合成処理部32と、車載装置11の音声合成処理部14と同等の処理能力を有し、車載装置11の言語解析用辞書15と同等の記憶容量及び同等の辞書内容を有する車載装置用言語解析用辞書35を参照して文章を解析する車載装置用音声合成処理部34とを有する。そして、前記言語解析サーバ31は、サーバ用音声合成処理部32及び車載装置用音声合成処理部34がそれぞれ前記文字データの文章を解析した結果を比較して、車載装置11において読み間違いが発生する形態素とその正しい読み方の一覧データを作成し、該一覧データを車載装置11に送信するようになっている。そのため、前記車載装置11の音声合成処理部14は、前記一覧データを参照して前記文字データの文章を解析するので、前記文字データを間違いなく読み上げることができる。したがって、前記車載装置11は、処理能力が制限された音声合成処理部14及び容量の制限された言語解析用辞書15を使用しながらでも、配信された文字データを適切に解析して、該文字データを間違いなく読み上げることができる。
Thus, in this embodiment, the character data transmitted from the
また、情報提供サーバ21から車載装置11に送信される文字データは、漢字かな混じり文の文字データなので、ひらがなやカタカナのような表音文字だけからなる文字データよりも、データ量が小さくなる。そのため、前記情報提供サーバ21から車載装置11に送信するための通信負荷が小さく、通信時間を短くすることができ、また、通信費用を低くすることができる。さらに、前記一覧データは、データ量が小さいので、前記言語解析サーバ31から車載装置11に送信するための通信負荷が小さく、通信時間を短くすることができ、また、通信費用を低くすることができる。さらに、前記一覧データを一時的に登録する車載装置11のユーザ定義言語解析用辞書16の容量を大きくする必要がない。
Further, since the character data transmitted from the
次に、本発明の第2の実施の形態について説明する。なお、第1の実施の形態と同じ構造を有するものについては、同じ符号を付与することによってその説明を省略する。また、前記第1の実施の形態と同じ動作及び同じ効果についても、その説明を省略する。 Next, a second embodiment of the present invention will be described. In addition, about the thing which has the same structure as 1st Embodiment, the description is abbreviate | omitted by providing the same code | symbol. The description of the same operation and the same effect as those of the first embodiment is also omitted.
本実施の形態において、言語解析サーバ31は、車載装置11において読み間違いが発生する形態素とその正しい読み方の一覧データを車載装置11に送信せず、前記一覧データに含まれる形態素の正しい読み方を表す表音文字に置換した文字データを車載装置11に送信するようになっている。この場合、車載装置11におけるユーザ定義言語解析用辞書16を省略することができる。なお、他の点についての構成は前記第1の実施の形態と同様であるので、その説明を省略する。
In the present embodiment, the language analysis server 31 does not transmit a list of morphemes that cause reading errors in the in-
次に、本実施の形態における文章読み上げシステム10の動作について説明する。 Next, the operation of the text-to-speech system 10 in the present embodiment will be described.
図6は本発明の第2の実施の形態における文章読み上げシステムの動作を示す第1のフローチャート、図7は本発明の第2の実施の形態における文章読み上げシステムの動作を示す第2のフローチャートである。 FIG. 6 is a first flowchart showing the operation of the text-to-speech system in the second embodiment of the present invention, and FIG. 7 is a second flowchart showing the operation of the text-to-speech system in the second embodiment of the present invention. is there.
前記第1の実施の形態と同様に、操作者が車載装置11を操作して要求した文字ニュースを情報提供サーバ21から受信する場合の動作について説明する。なお、情報提供サーバ21が言語解析サーバ31に文字ニュースを送信して、解析結果の送信先を通知するまでの動作については、前記第1の実施の形態と同様であるので、その説明を省略する。
Similar to the first embodiment, an operation when the operator receives from the
本実施の形態において、情報提供サーバ21は、解析結果の送信先を言語解析サーバ31に通知すると処理を終了する。一方、該言語解析サーバ31は、文字ニュース要求を送信した後、文字ニュースを待機している文字ニュース受信待ちの状態にあり、文字ニュースを受信したか否かを継続的に判断している。そして、前記情報提供サーバ21から文字ニュースを受信すると、文字ニュース解析処理を実行する。この場合、前記文字ニュースをサーバ用音声合成処理部32及び車載装置用音声合成処理部34がそれぞれ解析する。そして、前記言語解析サーバ31は、前記サーバ用音声合成処理部32の解析結果と車載装置用音声合成処理部34の解析結果とを比較し、読み方の相違する形態素を抽出する。続いて、前記言語解析サーバ31は、抽出された形態素と、前記サーバ用音声合成処理部32が解析した前記抽出された形態素の読み方の一覧データを作成する。続いて、前記言語解析サーバ31は、文字ニュースにおける前記抽出された形態素に該当する文字を、前記形態素の読み方を表す表音文字に置換して、表音文字化処理を実行する。そして、表音文字化処理によって再編された文字ニュース、すなわち、表音文字化処理済み文字ニュースを解析結果として車載装置11に送信して、処理を終了する。
In the present embodiment, the
一方、前記車載装置11は、文字ニュース要求を送信した後、文字ニュースを待機している文字ニュース受信終了待ちの状態にあり、文字ニュースを受信したか否かを継続的に判断している。そして、前記言語解析サーバ31から解析結果としての表音文字化処理済み文字ニュースを受信すると、前記車載装置11は、文字ニュース解析処理を実行する。この場合、前記車載装置11の言語解析部14aは、言語解析用辞書15を参照して、前記表音文字化処理済み文字ニュースを解析する。続いて、前記車載装置11の音声波形生成部14bは、音声データ生成用辞書17を参照して、前記言語解析部14aが作成した読み方の文字列から音声波形データを生成する音声波形生成処理を実行する。続いて、前記車載装置11の音声波形再生部14cは、前記音声波形生成部14bが生成した音声波形データを再生して、スピーカ11aから出力させる音声波形再生処理を実行する。これにより、前記表音文字化処理済み文字ニュースが間違いなく読み上げられる。そして、前記車載装置11は処理を終了する。
On the other hand, after transmitting the text news request, the in-
次に、フローチャートについて説明する。
ステップS31 車載装置11は、文字ニュース要求を情報提供サーバ21に送信する。
ステップS32 情報提供サーバ21は、車載装置11からの文字ニュース要求を待機する。
ステップS33 情報提供サーバ21は、文字ニュース要求を受信したか否かを判断する。文字ニュース要求を受信した場合はステップS34に進み、文字ニュース要求を受信していない場合はステップS32に戻る。
ステップS34 情報提供サーバ21は、車載装置11に送信する文字ニュースを決定する。
ステップS35 情報提供サーバ21は、文字ニュース解析要求を送信する。
ステップS36 言語解析サーバ31は、文字ニュース要求を待機する。
ステップS37 言語解析サーバ31は、文字ニュース解析要求を受信したか否かを判断する。文字ニュース解析要求を受信した場合はステップS38に進み、文字ニュース解析要求を受信していない場合はステップS36に戻る。
ステップS38 言語解析サーバ31は、解析する文字ニュース要求を送信する。
ステップS39 情報提供サーバ21は、言語解析サーバ31からの文字ニュース要求を待機する。
ステップS40 情報提供サーバ21は、文字ニュース要求を受信したか否かを判断する。文字ニュース要求を受信した場合はステップS41に進み、文字ニュース要求を受信していない場合はステップS39に戻る。
ステップS41 情報提供サーバ21は、文字ニュースを送信する。
ステップS42 情報提供サーバ21は、解析結果の送信先を通知して処理を終了する。
ステップS43 言語解析サーバ31は、文字ニュースを待機する。
ステップS44 言語解析サーバ31は、文字ニュースを受信したか否かを判断する。文字ニュースを受信した場合はステップS45に進み、文字ニュースを受信していない場合はステップS43に戻る。
ステップS45 言語解析サーバ31は、文字ニュース解析処理を実行する。
ステップS46 言語解析サーバ31は、解析結果を送信して処理を終了する。
ステップS47 車載装置11は、文字ニュース受信終了を待機する。
ステップS48 車載装置11は、文字ニュースを受信したか否かを判断する。文字ニュースを受信した場合はステップS49に進み、文字ニュースを受信していない場合はステップS47に戻る。
ステップS49 車載装置11は、文字ニュース解析処理を実行する。
ステップS50 車載装置11は、音声波形生成処理を実行する。
ステップS51 車載装置11は、文字ニュースを読み上げて(音声波形再生処理)、処理を終了する。
Next, a flowchart will be described.
Step S31 The in-
Step S32 The
Step S33 The
Step S34 The
Step S35 The
Step S36 The language analysis server 31 waits for a text news request.
Step S37: The language analysis server 31 determines whether or not a character news analysis request has been received. If a character news analysis request has been received, the process proceeds to step S38. If a character news analysis request has not been received, the process returns to step S36.
Step S38: The language analysis server 31 transmits a character news request to be analyzed.
Step S39 The
Step S40 The
Step S41 The
Step S42: The
Step S43 The language analysis server 31 stands by for character news.
Step S44: The language analysis server 31 determines whether text news has been received. If character news has been received, the process proceeds to step S45, and if character news has not been received, the process returns to step S43.
Step S45 The language analysis server 31 executes a character news analysis process.
Step S46: The language analysis server 31 transmits the analysis result and ends the process.
Step S47 The in-
Step S48 The in-
Step S49 The in-
Step S50 The in-
Step S51 The in-
次に、前記言語解析サーバ31が実行する文字ニュース解析処理について詳細に説明する。ここでは、前記第1の実施の形態と同様に、文字ニュースが外国為替市況に関する文字ニュースであり、漢字かな混じり文の文章である場合について説明する。 Next, the character news analysis process executed by the language analysis server 31 will be described in detail. Here, as in the first embodiment, a case will be described in which the text news is text news related to foreign exchange market conditions and is a sentence in a kanji / kana mixed sentence.
図8は本発明の第2の実施の形態における言語解析サーバの文字ニュース解析処理の動作を示すフローチャートである。 FIG. 8 is a flowchart showing the operation of the character news analysis process of the language analysis server in the second embodiment of the present invention.
まず、言語解析サーバ31は、解析するべき文字ニュースを情報提供サーバ21から受信する。ここで、前記文字ニュースは、外国為替市況に関する文字ニュースであり、図8(a)に示されるように、「5日午前9時現在の東京外国為替市場の円相場は、1ドル=109円57〜60銭。」という漢字かな混じり文の文章である。なお、車載装置11において読み間違いが発生する形態素とその正しい読み方の一覧データを作成するまでの動作については、前記第1の実施の形態と同様であるので、その説明を省略する。
First, the language analysis server 31 receives character news to be analyzed from the
続いて、前記言語解析サーバ31は、前記文字ニュースにおける抽出された形態素、すなわち、読み間違いが発生する形態素に該当する文字を、前記一覧データに含まれる形態素の正しい読み方を表す表音文字で置換する表音文字化処理を実行する。この場合、前記文字ニュースは、図8(i)に示されるように、「<いつか>午前<くじ>現在の東京外国為替<しじょう>の円相場は、1ドル<−>109円57<から><ろくじっ>銭。」となる。そして、前記言語解析サーバ31は、表音文字化処理によって再編された文字ニュースとしての表音文字化処理済み文字ニュースを前記車載装置11に送信して処理を終了する。
Subsequently, the language analysis server 31 replaces the character corresponding to the extracted morpheme in the character news, that is, the character corresponding to the morpheme in which the reading error occurs, with the phonetic character representing the correct reading of the morpheme included in the list data. The phonogram conversion process is executed. In this case, as shown in FIG. 8 (i), the text news is as follows: “<someday> AM <Lottery> The current yen exchange rate of Tokyo Foreign Exchange <Shoji> is 1 dollar <-> 109 yen57 < "> <Rokuji> Sen." Then, the language analysis server 31 transmits the phonogram conversion processed character news as the character news reorganized by the phonogram conversion processing to the in-
次に、フローチャートについて説明する。
ステップS45−1 解析する文字ニュースを情報提供サーバ21から受信する。
ステップS45−2 サーバ用音声合成処理部32は文書を形態素に分割する。
ステップS45−3 サーバ用音声合成処理部32は形態素それぞれに読み方を割り当て、表音文字列を作成する。
ステップS45−4 車載装置用音声合成処理部34は文章を形態素に分割する。
ステップS45−5 車載装置用音声合成処理部34は形態素それぞれに読み方を割り当て、表音文字列を作成する。
ステップS45−6 二つの表音文字列を比較し、異なる形態素を抽出する。
ステップS45−7 読み間違いが発生する形態素の一覧データを作成する。
ステップS45−8 表音文字化処理済み文字ニュースを前記車載装置11に送信して処理を終了する。
Next, a flowchart will be described.
Step S45-1 Character news to be analyzed is received from the
Step S45-2: The server speech
Step S45-3: The server speech
Step S45-4: The on-vehicle device speech
Step S45-5: The on-vehicle device speech
Step S45-6: The two phonetic character strings are compared, and different morphemes are extracted.
Step S45-7: List data of morphemes in which reading errors occur.
Step S45-8: The phonogram conversion-processed character news is transmitted to the in-
このように、本実施の形態において、言語解析サーバ31は、車載装置11において読み間違いが発生する形態素とその正しい読み方の一覧データを作成し、文字ニュースにおける読み間違いが発生する形態素に該当する文字を、前記一覧データに含まれる形態素の正しい読み方を表す表音文字で置換する表音文字化処理を実行する。そして、表音文字化処理済み文字ニュースが車載装置11に送信されるようになっている。そのため、前記車載装置11の音声合成処理部14は、前記文字データを間違いなく読み上げることができる。また、ユーザ定義言語解析用辞書16を省略することができるので、車載装置11の構成を簡素化することができる。
As described above, in the present embodiment, the language analysis server 31 creates a list of morphemes that cause reading errors in the in-
そして、言語解析サーバ31から車載装置11に送信される文字データは、基本的に漢字かな混じり文の文字データであり、読み間違いが発生する形態素に該当する文字だけが表音文字に置換されているので、データ量を最小限にすることができる。そのため、前記言語解析サーバ31から車載装置11に送信するための通信負荷が小さく、通信時間を短くすることができ、また、通信費用を低くすることができる。
The character data transmitted from the language analysis server 31 to the in-
なお、前記第1及び第2の実施の形態においては、情報提供サーバ21から配信される文字データが、車載装置11からの要求に応じて配信される、いわゆるプル型コンテンツである場合について説明したが、前記文字データは、車載装置11からの要求がなくても情報提供サーバ21から車載装置11に対して配信される、いわゆるプッシュ型コンテンツ又は放送(ブロードキャスト)型コンテンツであってもよい。
In the first and second embodiments, the case where the character data distributed from the
また、本発明は前記実施の形態に限定されるものではなく、本発明の趣旨に基づいて種々変形させることが可能であり、それらを本発明の範囲から排除するものではない。 The present invention is not limited to the above-described embodiment, and various modifications can be made based on the spirit of the present invention, and they are not excluded from the scope of the present invention.
10 文章読み上げシステム
11 車載装置
14 音声合成処理部
15 言語解析用辞書
21 情報提供サーバ
31 言語解析サーバ
32 サーバ用音声合成処理部
33 サーバ用言語解析用辞書
34 車載装置用音声合成処理部
35 車載装置用言語解析用辞書
DESCRIPTION OF SYMBOLS 10 Text-to-
Claims (6)
(b)言語解析用辞書を参照して前記文字データを解析して読み上げる音声合成処理部を備える文書読み上げ装置と、
(c)前記言語解析用辞書よりも豊富な辞書内容を備えるサーバ用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成するサーバ用音声合成処理部であって、前記音声合成処理部よりも高い処理能力を備えるサーバ用音声合成処理部と、
前記言語解析用辞書と同等の辞書内容を備える比較用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成する比較用音声合成処理部であって、前記音声合成処理部と同等の処理能力を備える比較用音声合成処理部とを備え、
前記サーバ用音声合成処理部が作成した表音文字列と前記比較用音声合成処理部が作成した表音文字列とを比較して読み方が相違する形態素を抽出し、該形態素の読み方を示すデータを前記文書読み上げ装置に送信する言語解析サーバとを有し、
(d)前記文書読み上げ装置は、前記形態素の読み方を示すデータを使用して前記文字データを解析して読み上げることを特徴とする文章読み上げシステム。 (A) an information providing server for distributing character data mixed with kanji and kana ;
(B) a document reading device including a speech synthesis processing unit that analyzes and reads out the character data with reference to a language analysis dictionary ;
(C) Referencing a server language analysis dictionary having abundant dictionary contents than the language analysis dictionary, decomposing the character data into morphemes, and creating a phonetic character string by assigning a reading to each morpheme A speech synthesis processing unit for a server, the server speech synthesis processing unit having a higher processing capability than the speech synthesis processing unit;
Comparative speech synthesis that generates a phonetic character string by decomposing the character data into morphemes with reference to a comparative language analysis dictionary having dictionary contents equivalent to the language analysis dictionary, and assigning readings to each morpheme A processing unit comprising a comparative speech synthesis processing unit having a processing capability equivalent to that of the speech synthesis processing unit,
Data indicating how to read the morphemes by comparing the phonetic character strings created by the server speech synthesis processing unit and the phonetic character strings created by the comparison speech synthesis processing unit to extract different morphemes And a language analysis server for transmitting to the document reading device,
(D) The text-to-speech device reads out the text data by analyzing the text data using data indicating how to read the morpheme.
(b)言語解析サーバは、
サーバ用音声合成処理部が、サーバ用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成し、
前記サーバ用音声合成処理部よりも低い処理能力を備える比較用音声合成処理部が、前記サーバ用言語解析用辞書よりも豊富でない辞書内容を備える比較用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成し、
前記サーバ用音声合成処理部が作成した表音文字列と前記比較用音声合成処理部が作成した表音文字列とを比較して読み方が相違する形態素を抽出し、該形態素の読み方を示すデータを文書読み上げ装置に送信し、
(c)該文書読み上げ装置は、前記比較用音声合成処理部と同等の処理能力を備える音声合成処理部が、前記形態素の読み方を示すデータを使用し、前記比較用言語解析用辞書と同等の辞書内容を備える言語解析用辞書を参照して前記文字データを解析して読み上げることを特徴とする文章読み上げ方法。 (A) The information providing server delivers character data mixed with kanji and kana ,
(B) The language analysis server
The server speech synthesis processing unit refers to the server language analysis dictionary, decomposes the character data into morphemes, creates a phonetic character string by assigning a reading to each morpheme,
The comparison speech synthesis processing unit having a processing capability lower than that of the server speech synthesis processing unit refers to the comparison language analysis dictionary having less dictionary content than the server language analysis dictionary. Is divided into morphemes, and a phonetic string is created by assigning readings to each morpheme,
Data indicating how to read the morphemes by comparing the phonetic character strings created by the server speech synthesis processing unit and the phonetic character strings created by the comparison speech synthesis processing unit to extract different morphemes to send to the document read-aloud device,
(C) In the text-to-speech device, a speech synthesis processing unit having processing capability equivalent to that of the comparison speech synthesis processing unit uses data indicating how to read the morpheme, and is equivalent to the comparative language analysis dictionary A method of reading a sentence, wherein the character data is analyzed and read out with reference to a language analysis dictionary having dictionary contents .
(b)前記言語解析用辞書よりも豊富な辞書内容を備えるサーバ用言語解析用辞書と、
(c)前記言語解析用辞書と同等の辞書内容を備える比較用言語解析用辞書と、
(d)前記サーバ用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成するサーバ用音声合成処理部と、
(e)前記比較用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成する比較用音声合成処理部であって、前記サーバ用音声合成処理部よりも低い処理能力を備える比較用音声合成処理部とを有し、
(f)前記サーバ用音声合成処理部が作成した表音文字列と前記比較用音声合成処理部が作成した表音文字列とを比較して読み方が相違する形態素を抽出し、該形態素の読み方を示すデータを作成して送信することを特徴とする言語解析サーバ。 (A) a language analysis server that transmits data indicating how to read a morpheme included in the character data to a document reading device that reads out character data mixed with Kanji characters by referring to a language analysis dictionary;
(B) a server language analysis dictionary having abundant dictionary contents than the language analysis dictionary;
(C) a comparative language analysis dictionary having dictionary contents equivalent to the language analysis dictionary;
(D) referring to the server language analysis dictionary , decomposing the character data into morphemes, and creating a phonetic character string by assigning a reading to each morpheme ;
(E) a comparison speech synthesis processing unit that generates a phonetic character string by decomposing the character data into morphemes with reference to the comparative language analysis dictionary and assigning a reading to each morpheme, the server A comparative speech synthesis processing unit having a processing capability lower than that of the speech synthesis processing unit for
(F) Extracting morphemes that differ in how they are read by comparing the phonetic character strings created by the server speech synthesis processing unit and the phonetic character strings created by the comparison speech synthesis processing unit. A language analysis server characterized by creating and transmitting data indicating
(b)言語解析用辞書を参照し、前記形態素の読み方を示すデータを使用して前記文字データを解析する言語解析部と、
(c)前記文字データを読み上げるための音声波形データを作成する音声波形生成部とを有する文章読み上げ装置であって、
(d)前記形態素の読み方を示すデータは、前記言語解析サーバにおいて、
サーバ用音声合成処理部が、サーバ用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成し、
前記サーバ用音声合成処理部よりも低い処理能力を備える比較用音声合成処理部が、前記サーバ用言語解析用辞書よりも豊富でなく、前記言語解析用辞書と同等の辞書内容を備える比較用言語解析用辞書を参照して前記文字データを形態素に分解し、各形態素に読み方を割り当てることにより表音文字列を作成し、
前記サーバ用音声合成処理部が作成した表音文字列と前記比較用音声合成処理部が作成した表音文字列とを比較することにより抽出された、読み方が相違する形態素の読み方を示すデータであることを特徴とする文章読み上げ装置。 (A) a receiving unit that receives character data mixed with kana and kana distributed by the information providing server and data indicating how to read morphemes included in the character data transmitted by the language analysis server;
(B) a language analysis unit that references the language analysis dictionary and analyzes the character data using data indicating how to read the morpheme;
(C) a text-to-speech device having a speech waveform generator for creating speech waveform data for reading out the character data ,
(D) Data indicating how to read the morpheme is stored in the language analysis server.
The server speech synthesis processing unit refers to the server language analysis dictionary, decomposes the character data into morphemes, creates a phonetic character string by assigning a reading to each morpheme,
The comparative speech synthesis processing unit having a processing capability lower than that of the server speech synthesis processing unit is less abundant than the server language analysis dictionary and has a dictionary content equivalent to the language analysis dictionary The character data is decomposed into morphemes with reference to the analysis dictionary, and a phonetic character string is created by assigning a reading to each morpheme,
Data indicating how to read morphemes with different readings extracted by comparing the phonetic character string created by the server voice synthesis processing unit and the phonetic character string created by the comparison voice synthesis processing unit. sentence reading apparatus characterized by some.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004016099A JP4539097B2 (en) | 2004-01-23 | 2004-01-23 | Sentence reading system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004016099A JP4539097B2 (en) | 2004-01-23 | 2004-01-23 | Sentence reading system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005208421A JP2005208421A (en) | 2005-08-04 |
JP4539097B2 true JP4539097B2 (en) | 2010-09-08 |
Family
ID=34901357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004016099A Expired - Fee Related JP4539097B2 (en) | 2004-01-23 | 2004-01-23 | Sentence reading system and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4539097B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4806997B2 (en) * | 2005-08-05 | 2011-11-02 | 日産自動車株式会社 | Sentence analysis program and sentence analysis system |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0844743A (en) * | 1994-05-23 | 1996-02-16 | Oki Electric Ind Co Ltd | Morpheme analyzing device |
JPH09223143A (en) * | 1996-02-16 | 1997-08-26 | Fujitsu Ltd | Document information processor |
JPH10149361A (en) * | 1996-11-18 | 1998-06-02 | Canon Inc | Information processing method and its device, and storage medium |
JPH10171485A (en) * | 1996-12-12 | 1998-06-26 | Matsushita Electric Ind Co Ltd | Voice synthesizer |
JPH11338498A (en) * | 1998-05-21 | 1999-12-10 | Mitsubishi Electric Corp | Voice synthesizer |
JP2001521195A (en) * | 1997-10-22 | 2001-11-06 | ソニコン,インク. | System and method for aurally representing a page of SGML data |
JP2002118624A (en) * | 2000-10-10 | 2002-04-19 | Taito Corp | Generation system for sounding effect sound in portable mobile terminal |
-
2004
- 2004-01-23 JP JP2004016099A patent/JP4539097B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0844743A (en) * | 1994-05-23 | 1996-02-16 | Oki Electric Ind Co Ltd | Morpheme analyzing device |
JPH09223143A (en) * | 1996-02-16 | 1997-08-26 | Fujitsu Ltd | Document information processor |
JPH10149361A (en) * | 1996-11-18 | 1998-06-02 | Canon Inc | Information processing method and its device, and storage medium |
JPH10171485A (en) * | 1996-12-12 | 1998-06-26 | Matsushita Electric Ind Co Ltd | Voice synthesizer |
JP2001521195A (en) * | 1997-10-22 | 2001-11-06 | ソニコン,インク. | System and method for aurally representing a page of SGML data |
JPH11338498A (en) * | 1998-05-21 | 1999-12-10 | Mitsubishi Electric Corp | Voice synthesizer |
JP2002118624A (en) * | 2000-10-10 | 2002-04-19 | Taito Corp | Generation system for sounding effect sound in portable mobile terminal |
Also Published As
Publication number | Publication date |
---|---|
JP2005208421A (en) | 2005-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7895534B2 (en) | Information processing apparatus, control method therefor, and program | |
US8370143B1 (en) | Selectively processing user input | |
US7318054B2 (en) | Update system and update method for updating search data | |
US8321375B2 (en) | Search data update method and search data update system | |
US20030040341A1 (en) | Multi-modal method for browsing graphical information displayed on mobile devices | |
KR20070024771A (en) | System and method for providing automatically completed query using automatic query transform | |
US20110047456A1 (en) | Method and Apparatus for Text Input | |
JP2007010368A (en) | Navigation device, navigation method, and navigation program | |
CN1855223B (en) | Audio font output device, font database, and language input front end processor | |
US7555433B2 (en) | Voice generator, method for generating voice, and navigation apparatus | |
JP3267202B2 (en) | Vehicle navigation device | |
JP2019128374A (en) | Information processing device and information processing method | |
US20160047670A1 (en) | Method and apparatus for navigation | |
JP4364300B1 (en) | E-mail route search system, route search method, computer program | |
JP4539097B2 (en) | Sentence reading system and method | |
JP2002099531A (en) | Word registration system and word registration device, word transmission device and word registration method used therefor | |
CN110852042A (en) | Character type conversion method and device | |
JP2010117188A (en) | Navigation device and navigation method | |
JP2007018104A (en) | Global navigation system, information distribution server, portable terminal, and program | |
JP2017182251A (en) | Analyzer | |
JP2000187493A (en) | Speech output device and onboard computer | |
KR100644027B1 (en) | Voice information providing system based on text data transmission | |
JP2009266073A (en) | Address retrieval device, method and program | |
JP2006099196A (en) | Character converting device and character converting method and portable communication unit | |
JP4291874B1 (en) | E-mail route search system, route search method, computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100601 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100614 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140702 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |