JP2012194264A - Automatic transaction device, voice reading-aloud method, and voice reading-aloud program - Google Patents
Automatic transaction device, voice reading-aloud method, and voice reading-aloud program Download PDFInfo
- Publication number
- JP2012194264A JP2012194264A JP2011056852A JP2011056852A JP2012194264A JP 2012194264 A JP2012194264 A JP 2012194264A JP 2011056852 A JP2011056852 A JP 2011056852A JP 2011056852 A JP2011056852 A JP 2011056852A JP 2012194264 A JP2012194264 A JP 2012194264A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- kana
- phonetic
- sound
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
自動取引装置、音声読み上げ方法及び音声読み上げプログラムに関する。 The present invention relates to an automatic transaction apparatus, a speech reading method, and a speech reading program.
銀行等の金融機関では、全国銀行協会から全国の金融機関に関する所定のフォーマットが提供されている。当該フォーマットは、例えば、金融機関及び当該金融機関の各支店のコードと、漢字並びに当該漢字の振り仮名で表された名称と、さらに、標準通信プロトコル等を含んでいる。金融機関では、例えば、自動取引装置(ATM(Automated Teller Machine))における通帳の印字には、このフォーマットに含まれる金融機関・支店の漢字並びに当該漢字に対応する振り仮名が用いられている。 In financial institutions such as banks, the national bank association provides a predetermined format for financial institutions nationwide. The format includes, for example, a code of a financial institution and each branch of the financial institution, a name represented by kanji and a kana for the kanji, and a standard communication protocol. In a financial institution, for example, for printing a passbook in an automatic transaction device (ATM (Automated Teller Machine)), kanji of a financial institution / branch included in this format and a kana corresponding to the kanji are used.
また、金融機関等に設置されるATMは、視覚障害がある利用者でも操作できるように、音声による操作等の案内を行う機能を備えている(例えば、特許文献1参照)。
この場合でも、案内中に発せされる金融機関及び支店の名称等は、既述のフォーマットが含む金融機関及び支店の名称等の漢字並びに当該漢字に対応する振り仮名から音声合成された音声情報に基づいて読み上げられる。
An ATM installed in a financial institution or the like has a function of performing guidance such as voice operation so that even a visually impaired user can operate the ATM (for example, see Patent Document 1).
Even in this case, the name of the financial institution and the branch issued during the guidance is the voice information synthesized from the kanji such as the name of the financial institution and the branch included in the format described above and the kana corresponding to the kanji. Read based on.
なお、当該フォーマットの振り仮名は、50音の大書きの文字、即ち、清音、清音に対する濁音及び清音に対する半濁音のみにより構成されている。つまり、拗音、促音等の小書きの文字(ァ、ィ、ゥ、ェ、ォ、ャ、ュ、ョ、ヮ、ッ)は全て大書き文字(ア、イ、ウ、エ、オ、ヤ、ユ、ヨ、ワ、ツ)で表されている。 Note that the hiragana of the format is composed of 50 large letters, that is, only a clear sound, a muddy sound for a clear sound, and a semi-voiced sound for a clear sound. In other words, all the small letters (a, i, u, e, o, o, u, u, u, ヮ, t) such as stuttering and prompting sounds are overwritten letters (a, i, u, e, o, ya, Yu, Yo, Wa, Tsu).
しかし、上記のように音声合成した音声情報を利用する場合には次のような問題点があった。
金融機関及び支店の漢字で表された名称を利用する場合には、漢字を一旦振り仮名に変換する処理が行われる。しかし、このような処理では、必ずしも当該漢字に対応する正しい振り仮名に変換されるとは限らない(例えば、「国立」の「クニタチ」に対して「コクリツ」)ため、この場合は金融機関及び支店の名称等が正確に読み上げられないという問題点があった。
However, there are the following problems when using speech information synthesized as described above.
When using names represented in Chinese characters of financial institutions and branches, processing for temporarily converting the Chinese characters to kana is performed. However, in such a process, the correct kana character corresponding to the kanji is not necessarily converted (for example, “Kunitachi” for “Kunitachi” in “National”). There was a problem that the names of branches were not read out correctly.
また、このような問題に対して、金融機関及び支店の名称を表す漢字に対応する振り仮名から音声合成する方法が考えられる。しかし、当該フォーマットの振り仮名は全て大書きの文字で構成されているために、振り仮名によっては、音声合成された音声情報から正確に読み上げられない(例えば、「東京」の「トウキョウ」に対して「トウキヨウ」)という問題点があった。 Further, for such a problem, a method of synthesizing speech from a kana corresponding to a kanji representing the names of financial institutions and branches can be considered. However, since all the hiragana characters in the format are composed of large letters, some hiragana characters cannot be read out correctly from the voice information synthesized by speech (for example, for “Tokyo” in “Tokyo”). “Tokiyo”).
本発明はこのような点に鑑みてなされたものであり、不正確な読み上げの発生を抑制した自動取引装置、音声読み上げ方法及び音声読み上げプログラムを提供することを目的とする。 The present invention has been made in view of these points, and an object thereof is to provide an automatic transaction apparatus, a speech reading method, and a speech reading program that suppress the occurrence of inaccurate reading.
上記目的を達成するために、音声案内を行う自動取引装置において、漢字を含む対象文字列を前記対象文字列の表音を表す表音文字列に変換する変換手段と、変換した前記表音文字列と、前記対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき前記対象文字列を読み上げるためにいずれかの文字列を選択する比較判定手段と、を有する自動取引装置が提供される。 To achieve the above object, in an automatic transaction apparatus that performs voice guidance, conversion means for converting a target character string including kanji into a phonetic character string representing a phonetic of the target character string, and the converted phonetic character In order to read out the target character string based on a comparison result between a string and a kana character string composed of at least a clear sound of a clear sound, a muffled sound for a clear sound, and a semi-voiced sound for a clear sound. There is provided an automatic transaction apparatus having a comparison / determination means for selecting the character string.
また、上記目的を達成するために、上記の自動取引装置と同様の音声読み上げ方法及び音声読み上げプログラムが提供される。 In order to achieve the above object, a speech reading method and a speech reading program similar to those of the automatic transaction apparatus are provided.
このような自動取引装置、音声読み上げ方法及び音声読み上げプログラムにより、不正確な読み上げの発生が抑制される。 By such an automatic transaction apparatus, a speech reading method and a speech reading program, the occurrence of inaccurate reading is suppressed.
以下、図面を参照にして実施の形態について説明する。
[第1の実施の形態]
図1は、第1の実施の形態に係る自動取引装置の概念図である。
Hereinafter, embodiments will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a conceptual diagram of an automatic transaction apparatus according to the first embodiment.
自動取引装置1は、音声を読み上げる際に不正確な読み上げの発生を抑制できるものである。
このような自動取引装置1は、辞書情報格納手段2、文字列情報格納手段3及び波形情報格納手段4を備える。さらに、変換手段5、比較判定手段6、生成手段7及び音声出力手段8を備える。なお、変換手段5、比較判定手段6、生成手段7及び音声出力手段8は、自動取引装置1が備える図示しないCPU(Central Processing Unit:中央演算処理装置)によって音声読み上げプログラムが実行されることにより、その処理機能が実現される。
The automatic transaction apparatus 1 can suppress the occurrence of inaccurate reading when reading a voice.
Such an automatic transaction apparatus 1 includes dictionary information storage means 2, character string information storage means 3, and waveform information storage means 4. Furthermore, a
辞書情報格納手段2は、音声合成処理の対象となる語彙のテキスト情報の構文解析を行う際に参照する辞書を格納しており、予め語彙ごとに、その表記、仮名読み、アクセント情報、品詞情報の詳細な情報を対応付けて登録したものである。 The dictionary information storage means 2 stores a dictionary to be referred to when the text information of the vocabulary subject to speech synthesis processing is parsed, and the notation, kana reading, accent information, part of speech information for each vocabulary in advance. Are registered in association with each other.
文字列情報格納手段3は、漢字を含む対象文字列に予め設定された振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列の情報を予め格納している。文字列情報格納手段3は、例えば、全国銀行協会の金融機関に関するフォーマットの読み上げ対象である金融機関及び支店の漢字を含む名称(対象文字列)と、当該名称に対応する振り仮名を表す仮名文字列とを保持する。なお、既述の通り、当該フォーマットの振り仮名は、拗音、促音等の小書きの文字(ァ、ィ、ゥ、ェ、ォ、ャ、ュ、ョ、ヮ、ッ)は全て大書き文字(ア、イ、ウ、エ、オ、ヤ、ユ、ヨ、ワ、ツ)で表されている。したがって、当該フォーマットでは、例えば、支店名の「あざみ野(対象文字列)」に対して「アザミノ(仮名文字列)」、支店名の「虎ノ門(対象文字列)」に対して「トラノモン(仮名文字列)」、支店名の「京都(対象文字列)」に対して「キヨウト(仮名文字列)」等と表現される。 The character string information storage means 3 represents a kana character set in advance for a target character string including kanji characters, and preliminarily stores information on a kana character string composed of at least a clear sound of a clear sound, a muddy sound for a clear sound, and a semi-voice sound for a clear sound. Storing. The character string information storage means 3 includes, for example, a name (target character string) including a kanji of a financial institution and a branch to be read out in a format related to a financial institution of the National Bankers Association, and a kana character representing a kana corresponding to the name Hold the column. As mentioned above, the hiragana characters in the format are all small letters (a, i, u, e, o, ya, u, o, ヮ, tsu) such as stuttering and prompting sounds. A, i, u, d, o, ya, yu, yo, wa, tsu). Therefore, in this format, for example, “Azamino (kana character string)” for the branch name “Azamino (target character string)” and “Tranomone (kana character) for the branch name“ Toranomon (target character string) ”. Column) ”,“ Kyoto (kana character string) ”, etc., for the branch name“ Kyoto (target character string) ”.
波形情報格納手段4は、表音文字列及び仮名文字列にそれぞれ含まれる仮名文字に対応する音声波形の情報を格納している。なお、表音文字列は、例えば、仮名文字と、当該仮名文字の読み及びアクセントを表記する発音記号である特殊文字(コロン、カンマ、引用符、パーセント記号等)とで構成されている。 The waveform information storage means 4 stores speech waveform information corresponding to kana characters included in the phonetic character string and the kana character string, respectively. Note that the phonetic character string is composed of, for example, kana characters and special characters (colon, comma, quotes, percent symbols, etc.) that are phonetic symbols that indicate the reading and accent of the kana characters.
変換手段5は、漢字を含む対象文字列を当該対象文字列の表音を表す表音文字列に変換する。
比較判定手段6は、変換手段5が変換した表音文字列と、対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき対象文字列を読み上げるためにいずれかの文字列を選択する。
The conversion means 5 converts the target character string including the kanji into a phonetic character string representing the phonetic of the target character string.
The comparison determination means 6 represents a phonetic character string converted by the conversion means 5 and a kana character of the target character string, and a kana character string composed of at least a clear sound, a muddy sound for a clear sound, and a semi-voice sound for a clear sound, One of the character strings is selected to read out the target character string based on the comparison result of.
生成手段7は、比較判定手段6が選択した文字列を波形情報格納手段4に基づいて、対象文字列の音声情報を生成する。
音声出力手段8は、生成手段7で生成された音声情報に基づいて、対象文字列を読み上げる。
The
The
このような構成を有する自動取引装置1の音声読み上げ方法について説明する。
まず、変換手段5は、読み上げ対象の、漢字を含む対象文字列について、辞書情報格納手段2に基づき、当該対象文字列の表音を表す表音文字列に変換する。
A voice reading method of the automatic transaction apparatus 1 having such a configuration will be described.
First, the conversion means 5 converts a target character string including a kanji character to be read out into a phonetic character string representing a phonetic of the target character string based on the dictionary information storage means 2.
比較判定手段6は、変換された表音文字列と、文字列情報格納手段3に格納されている読み上げ対象の対象文字列の振り仮名を表す仮名文字列とを比較する。比較の際には、表音文字列と仮名文字列とを先頭から末尾まで仮名文字のみを1文字ずつ一致の条件に基づき比較する。一致の条件の具体例としては、例えば、比較対象の表音文字列が含む仮名文字が、仮名文字列の小書きの文字に対応する大書きの文字である場合、また、表音文字列の長音と、仮名文字列の「オ」または「ウ」とが比較対象である場合にはそれぞれ一致するようにする。 The comparison determination means 6 compares the converted phonetic character string with the kana character string representing the kana of the target character string to be read out stored in the character string information storage means 3. At the time of comparison, the phonetic character string and the kana character string are compared from the beginning to the end only for the kana characters one by one based on the matching condition. As a specific example of the matching condition, for example, when the kana character included in the phonetic character string to be compared is a large character corresponding to the small character of the kana character string, If the long sound and the kana character string “o” or “u” are to be compared, they match each other.
比較判定手段6は、このような比較の結果に基づいて読み上げ対象の対象文字列を読み上げるために表音文字列または仮名文字列のいずれかを選択する。例えば、比較の結果、表音文字列と仮名文字列とが一致する場合には、対象文字列の音声読み上げに表音文字列を選択する。一方、一致しない場合には、仮名文字列を選択する。 The comparison determination means 6 selects either the phonetic character string or the kana character string to read out the target character string to be read out based on the result of such comparison. For example, when the phonetic character string and the kana character string match as a result of the comparison, the phonetic character string is selected for reading out the target character string. On the other hand, if they do not match, a kana character string is selected.
生成手段7は、波形情報格納手段4が格納する音声波形に基づいて、比較判定手段6で選択された文字列から読み上げ対象の対象文字列の音声情報を生成して、音声出力手段8が、当該音声情報に基づいて、読み上げた対象の対象文字列の読み上げを実行する。
Based on the speech waveform stored in the waveform
このように自動取引装置1では、漢字を含む対象文字列から当該対象文字列の表音を表す表音文字列と、対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうち少なくとも清音で構成される仮名文字列とを比較して、当該比較結果に基づき対象文字列を読み上げるために、表音文字列または仮名文字列のいずれかを選択するようにした。つまり、このように比較して、対象文字列の表音文字列と仮名文字列とが一致すると、表音文字列が対象文字列に予め設定された振り仮名に対応していることになり、また、表音文字列と仮名文字列とが一致しない場合には、表音文字列が対象文字列に予め設定された振り仮名に対応していないことになる。このため、表音文字列と仮名文字列とが一致する場合には表音文字列を選択し、一致しない場合には仮名文字列を選択して、対象文字列を正しく読み上げるようにした。これにより、読み上げ対象の対象文字列が不自然な発音で不正確に読み上げられることが抑制されるようになる。 Thus, in the automatic transaction apparatus 1, the phonetic character string which represents the phonetic sound of the said target character string from the target character string containing a kanji character, the kana of the target character string, the muffled sound for the clear sound and the clear sound, and the semi-voice sound for the clear sound In order to compare at least a kana character string composed of a clear sound and read out the target character string based on the comparison result, either the phonetic character string or the kana character string is selected. That is, in this way, when the phonetic character string and the kana character string of the target character string match, the phonetic character string corresponds to the phonetic kana preset in the target character string, If the phonetic character string does not match the kana character string, the phonetic character string does not correspond to the phonetic name preset in the target character string. For this reason, when the phonetic character string and the kana character string match, the phonetic character string is selected, and when they do not match, the kana character string is selected and the target character string is read correctly. As a result, it is possible to prevent the target character string to be read out from being read out inaccurately with an unnatural pronunciation.
[第2の実施の形態]
第2の実施の形態では、第1の実施の形態についてより具体的に説明する。
図2は、第2の実施の形態に係るATMの外観例を示す図である。
[Second Embodiment]
In the second embodiment, the first embodiment will be described more specifically.
FIG. 2 is a diagram illustrating an external appearance example of an ATM according to the second embodiment.
ATM10は、取引等に関する画面を表示する表示手段30a、前面にカード挿入/排出口40aを有するカード処理ユニット、通帳挿入/排出口50aを有する通帳処理ユニット、紙幣挿入/放出口60aを有する紙幣処理ユニット、及び硬貨投入/放出口70aを有する硬貨処理ユニットを有する。さらに、ATM10は、視覚障害がある利用者によって利用され、当該利用者に操作手順及び操作入力の指示を音声案内する受話器80を有する。
The
次に、このような外観のATM10のハードウェア構成について説明する。
図3は、第2の実施の形態に係るATMのハードウェア構成例を示す図である。
ATM10は、ATM10で行われる振り込み、入金、送金、記帳等の金融取引に関する処理を実行する制御ユニット20、利用者からの操作入力を受け付けて、出力結果を表示する表示ユニット30を有する。さらに、ATM10には、図2で説明した、カード挿入/排出口40aを有するカード処理ユニット40、通帳挿入/排出口50aを有する通帳処理ユニット50、紙幣挿入/放出口60aを有する紙幣処理ユニット60、及び硬貨投入/放出口70aを有する硬貨処理ユニット70、さらに、視覚障害がある利用者によって利用される受話器80を有する。
Next, the hardware configuration of the
FIG. 3 is a diagram illustrating a hardware configuration example of the ATM according to the second embodiment.
The
制御ユニット20は、CPU20a、RAM(Random Access Memory)20b、HDD(Hard Disk Drive)20c、グラフィックインタフェース20d、ホスト通信制御手段20e及び入出力インタフェース20fを備えており、これらの各手段はバス20gで相互に接続されている。
The
CPU20aは、HDD20c等の記憶媒体に記憶された各種プログラムを実行することにより、このATM10全体を統括的に制御する。
RAM20bには、CPU20aに実行させるOS(Operating System)並びにプログラムの少なくとも一手段が一時的に格納される。また、RAM20bには、CPU20aによる処理に必要な各種データが格納される。
The
The
HDD20cには、ATM10上のOS及びアプリケーションのプログラムが格納される。また、HDD20cには、CPU20aによる処理に必要な各種データが格納される。
The
グラフィックインタフェース20dには、表示ユニット30が接続されている。グラフィックインタフェース20dは、CPU20aからの命令に従って、画像を表示ユニット30の表示手段30aに表示させる。また、グラフィックインタフェース20dは、表示ユニット30の入力検知手段30bで検知された操作入力に応じた情報を取得する。
A
ホスト通信制御手段20eは、様々な場所に設置したATMの管理を行う管理センターのホストコンピュータ(図示を省略)と通信可能に例えばLAN(Local Area Network)で接続されており、ホストコンピュータと送受信信号の通信を行うことができる。 The host communication control means 20e is connected to, for example, a LAN (Local Area Network) so as to be communicable with a host computer (not shown) of a management center that manages ATMs installed in various places. Can communicate.
入出力インタフェース20fには、カード処理ユニット40、通帳処理ユニット50、紙幣処理ユニット60、硬貨処理ユニット70及び受話器80が接続されている。入出力インタフェース20f、カード処理ユニット40、通帳処理ユニット50、紙幣処理ユニット60、硬貨処理ユニット70及び受話器80は、バス20gを介してCPU20aと相互に信号の送受信を行う。
A
表示ユニット30は、表示手段30aと、入力検知手段30bとを備える、例えば、タッチパネルである。
表示手段30aは、ATM10の処理に応じ画面情報に基づいて画面を表示する、例えばLCD(Liquid Crystal Display:液晶ディスプレイ)である。
The
The display means 30a is, for example, an LCD (Liquid Crystal Display) that displays a screen based on screen information in accordance with the processing of the
入力検知手段30bは、表示手段30aが表示する画面に対する利用者のタッチを検知する。具体的には、利用者のタッチによる操作入力によって赤外線ビームが遮光された赤外線LED(Light Emitting Diode)とフォトトランジスタとから操作入力の位置情報を検出して、当該位置情報を制御ユニット20に送信する。なお、制御ユニット20のCPU20aにより、検知したタッチ位置に該当する画面に表示されている処理内容を識別して、当該処理を実行する。
The input detection unit 30b detects a user's touch on the screen displayed by the
カード処理ユニット40は、カード挿入/排出口40aから挿入された利用者のカードの実行指示に応じて所定の処理の処理結果を記録する。また、カード処理ユニット40は、処理結果の記録が完了したカードを、カード挿入/排出口40aから排出して、利用者に返却する。
The
通帳処理ユニット50は、通帳挿入/排出口50aから挿入された利用者の通帳を所定位置まで搬送し、利用者からの実行指示に応じて所定の処理の処理結果を記録する。また、通帳処理ユニット50は、処理結果の記録が完了した通帳を搬送して、通帳挿入/排出口50aから排出して、利用者に返却する。
The passbook processing unit 50 transports the user's passbook inserted from the passbook insertion /
紙幣処理ユニット60及び硬貨処理ユニット70は、紙幣挿入/放出口60a及び硬貨投入/放出口70aから挿入された紙幣及び硬貨を受け入れて、紙幣及び硬貨をそれぞれ計数する。また、利用者の所定の実行指示に応じて、紙幣挿入/放出口60a及び硬貨投入/放出口70aから処理に応じた額の紙幣及び硬貨を放出することができる。
The
受話器80は、音声案内が出力されるスピーカを備え、プッシュホン式のテンキーのボタンが配列されている。視覚障害がある利用者は、この受話器80を持ち上げて、受話器80のスピーカから聞こえる音声案内にガイドされてプッシュホンのボタンを操作してプッシュホンのボタンに応じた取引処理を実行させて、暗証番号、金額等の入力を行うことができる。
The
このようなカード処理ユニット40、通帳処理ユニット50、紙幣処理ユニット60及び硬貨処理ユニット70は、利用者による表示ユニット30を介した操作入力に応じて、制御ユニット20のCPU20aによってそれぞれ制御される。また、受話器80に対する利用者のプッシュホンのボタン操作に応じて、制御ユニット20のCPU20aによって、所定の処理が実行され、カード処理ユニット40、通帳処理ユニット50、紙幣処理ユニット60及び硬貨処理ユニット70がそれぞれ制御される。
The
次いで、このようなハードウェア構成であるATM10が備える制御機能について説明する。
図4は、第2の実施の形態に係るATMが備える機能を表すブロック図である。また、図5は第2の実施の形態に係るATMが備える金融機関情報の例を示す図、図6は第2の実施の形態に係るATMが備える音声案内情報を示す図である。特に図6は、音声案内の情報の例であって、この場合は、振り込みに関する情報の入力後、振り込み内容を確認するための発話情報を表している。
Next, the control function provided in the
FIG. 4 is a block diagram showing functions provided in the ATM according to the second embodiment. FIG. 5 is a diagram illustrating an example of financial institution information included in the ATM according to the second embodiment, and FIG. 6 is a diagram illustrating voice guidance information included in the ATM according to the second embodiment. In particular, FIG. 6 shows an example of voice guidance information. In this case, after the information related to the transfer is input, the utterance information for confirming the transfer content is shown.
ATM10は、視覚障害がある利用者に対して音声案内を行う際に、不正確な音声読み上げの発生を抑制して、操作に関する案内の読み上げを実行することができるものである。
The
このようなATM10は、まず、金融機関情報格納手段21、出力文字列情報記憶手段22及び音声案内情報格納手段23を有する。
金融機関情報格納手段21は、全国銀行協会から提供されるフォーマットであって、金融機関に関する情報が格納されている。例えば、図5に示されるように、金融機関コード、金融機関コードに対応付けられた金融機関の振り仮名及び漢字で表示された名称の情報が格納されている。また、当該金融機関の支店についても同様に、支店コードと、振り仮名及び漢字で表された支店の名称との情報が格納されている。全国銀行協会から提供されるフォーマットの振り仮名は、既述の通り、拗音、促音等の小書きの文字(ァ、ィ、ゥ、ェ、ォ、ャ、ュ、ョ、ヮ、ッ)は全て大書き文字(ア、イ、ウ、エ、オ、ヤ、ユ、ヨ、ワ、ツ)で表される。具体的には、図5の場合では、金融機関「九州銀行」について、金融機関コード「0111」、金融機関名「キユシユウギンコウ(振り仮名)」・「九州銀行(漢字)」の情報が格納されている。支店名「国立支店」について、支店コード「0024」、支店名「クニタチシテン(振り仮名)」・「国立支店(漢字)」の情報が格納されている。
First, the
The financial institution information storage means 21 is a format provided by the National Bank Association, and stores information related to financial institutions. For example, as shown in FIG. 5, information on a financial institution code, a transfer name of a financial institution associated with the financial institution code, and a name displayed in kanji are stored. Similarly, for the branch of the financial institution, information on the branch code and the name of the branch represented in kana and kanji is stored. As mentioned above, all of the small letters (a, i, u, e, o, ya, u, yo, ヮ, tsu) such as stuttering and prompting sound are used for the format provided by the National Bank Association. Expressed in large letters (a, i, u, d, o, ya, yu, yo, wa, tsu). Specifically, in the case of FIG. 5, for the financial institution “Kyushu Bank”, the information of the financial institution code “0111” and the names of the financial institutions “Kyushu Yuginko (Kana)” and “Kyushu Bank (Kanji)” is stored. Has been. As for the branch name “national branch”, information of branch code “0024”, branch names “Kunitachi Shiten (shake pseudonym)” and “national branch (kanji)” is stored.
出力文字列情報記憶手段22は、後述する比較判定手段27が比較結果から選択した読み上げ対象の金融機関及び支店の名称に対応する表音文字列または仮名文字列の情報を記憶する。また、後述する変換手段26cにより数字の読み方に対応する表音文字列と、依頼人及び受取人の氏名を表す仮名文字列との情報を記憶する。
The output character string
音声案内情報格納手段23は、ATM10から視覚障害のある利用者に対して音声案内される発話内容を表す発話情報を保持する。例えば、振り込み実行前に、振り込み内容を確認するために、図6に示されるように、発話情報が識別番号ごとに対応付けられて保持されている。具体的には、識別番号「011」には、発話情報「只今、処理中です。そのままお待ち下さい。」が保持されている。また、識別番号「003」には、発話情報「支店名は(b.支店名)」が保持されている。なお、「(b.支店名)」には、ATM10で音声合成された支店名が併合される。
The voice guidance information storage means 23 holds utterance information representing the utterance contents voice-guided to the visually impaired user from the
さらに、ATM10は、カード読取手段24、検索手段25、音声合成手段26、比較判定手段27、発話情報併合手段28、数字情報通知手段29、入力受付手段31、発話情報通知手段32及び音声出力制御手段33を備える。
Further, the
カード読取手段24は、カード処理ユニット40のカード挿入/排出口40aに利用者が挿入した振り込みカードに記録されている情報を読み取る。振り込みカードとは、予め受取人及びその振込先銀行口座、依頼人の氏名及び電話番号等の振り込み情報が、例えば、磁気的に記録されているものである。なお、受取人及び依頼人の氏名は振り仮名を表す仮名文字列で記録されている。このような振り込みカードをカード処理ユニット40に挿入するだけで、記録されている振込先を指定して振り込み操作を行うことができ、振り込み操作を簡単にするものである。カード読取手段24は、このようにして読み取った受取人及び依頼人の氏名を表す仮名文字列を出力文字列情報記憶手段22に記憶させ、口座番号、電話番号等の数字に関する情報は数字情報通知手段29に通知し、その他の情報については検索手段25に通知する。
The
検索手段25は、カード読取手段24で読み取った振り込みカードに記憶されている金融機関または支店のコードに対応する、読み上げ対象の金融機関または支店名の振り仮名及び漢字で表された名称を金融機関情報格納手段21から検索する。 The search means 25 uses the name of the financial institution or branch name to be read out corresponding to the financial institution or branch code stored in the transfer card read by the card reading means 24 and the name expressed in kanji. Search from the information storage means 21.
音声合成手段26は、読み上げ対象の金融機関または支店の振り仮名及び漢字で表された名称と、数字と、受取人及び依頼人の氏名とが所定箇所に併合された、音声案内情報格納手段23が保持する発話内容から音声情報を合成する。また、音声合成手段26は、このような機能を実現するために、さらに、辞書情報格納手段26a、波形情報格納手段26b、変換手段26c及び生成手段26dを有する。
The voice synthesizing means 26 is a voice guidance information storing means 23 in which the name of the financial institution or branch to be read out and the name expressed in kanji, the numbers, and the names of the recipient and the client are merged at a predetermined location. Synthesizes speech information from the utterance content held by. Further, the
辞書情報格納手段26aは、音声合成処理の対象となる語彙及び数字のテキスト情報の構文解析を行う際に参照する辞書を格納しており、予め語彙及び数字ごとに、その表記、仮名読み、アクセント情報、品詞情報の詳細な情報を対応付けて登録したものである。 The dictionary information storage means 26a stores a dictionary to be referred to when synthesizing the text information of the vocabulary and numbers to be subjected to speech synthesis processing, and the notation, kana reading, accent, and the like for each vocabulary and numbers in advance. Information and detailed information of part-of-speech information are registered in association with each other.
波形情報格納手段26bは、既述の通り、表音文字列及び仮名文字列を構成する仮名文字に対応する音声波形の情報を格納している。なお、表音文字列は、例えば、仮名文字と、当該仮名文字の読み及びアクセントを表記する発音記号である特殊文字(コロン、カンマ、引用符、パーセント記号等)とで構成されている。
As described above, the waveform
変換手段26cは、辞書情報格納手段26aが格納する辞書情報に基づいて、金融機関または支店の漢字で表された名称と、電話番号、口座番号等の数字との表音を表す表音文字列にそれぞれ変換する。また、変換手段26cは、当該名称に対応する表音文字列は比較判定手段27に通知し、数字の表音文字列を出力文字列情報記憶手段22に記憶させる。なお、表音文字列の具体例については後述する。
Based on the dictionary information stored in the dictionary
生成手段26dは、金融機関または支店の漢字で表された名称と、口座番号及び電話番号等の数字と、受取人及び依頼人の氏名とに対応する表音文字列または仮名文字列が、金融機関または支店の名称及び数字が入る箇所(例えば、図6の(a.銀行名)、(b.支店名)、(c.口座番号)、(e.受取人名)等)に併合された発話情報について、波形情報格納手段26bに格納されている波形情報に基づき、必要に応じて、金融機関または支店の名称と、数字と、受取人及び依頼人の氏名とそれぞれを含んだ発話情報の音声情報を生成する。 The generating means 26d has a phonetic character string or a kana character string corresponding to a name expressed in Chinese characters of a financial institution or a branch, numbers such as an account number and a telephone number, and names of a recipient and a client. Utterances merged with locations where the names and numbers of institutions or branches are entered (for example, (a. Bank name), (b. Branch name), (c. Account number), (e. Recipient name), etc. in FIG. 6) About the information, based on the waveform information stored in the waveform information storage means 26b, the voice of the utterance information including the name of the financial institution or branch, the number, the name of the recipient and the client, respectively, as necessary Generate information.
そして、比較判定手段27は、音声合成手段26の変換手段26cで変換された表音文字列と、対象文字列の振り仮名を表す仮名文字列とを比較して、当該比較結果に基づいて、当該対象文字列を読み上げるために表音文字列または仮名文字列のいずれかを選択する。比較判定手段27は、選択した対象文字列に対応する表音文字列または仮名文字列を出力文字列情報記憶手段22に記憶させる。 Then, the comparison determination means 27 compares the phonetic character string converted by the conversion means 26c of the speech synthesis means 26 with the kana character string representing the kana of the target character string, and based on the comparison result, To read out the target character string, either a phonetic character string or a kana character string is selected. The comparison / determination means 27 causes the output character string information storage means 22 to store the phonetic character string or the kana character string corresponding to the selected target character string.
発話情報併合手段28は、出力文字列情報記憶手段22が記憶する金融機関または支店の名称に対応する表音文字列または仮名文字列を、音声案内情報格納手段23が保持する発話内容の金融機関または支店の名称が入る箇所に併合する。また、出力文字列情報記憶手段22が記憶する電話番号等の数字の振り仮名を表す表音文字列を音声案内情報格納手段23が保持する発話内容の電話番号等が入る箇所に併合する。さらに、出力文字列情報記憶手段22が記憶する受取人及び依頼人の氏名の振り仮名を表す仮名文字列を音声案内情報格納手段23が保持する発話内容の依頼人及び受取人が入る箇所に併合する。また、発話情報併合手段28は、ATM10で実行される取引処理の進行に応じて、出力文字列情報記憶手段22が記憶するこれらの情報を、音声案内情報格納手段23が格納する発話情報に併合して音声合成手段26の生成手段26dに通知する。例えば、ATM10が振り込み処理を実行する前に、振り込みカードから取得した振り込み情報及び振り込み金額を確認するために、これらの振り込み情報及び振り込み金額を併合した発話情報を音声合成手段26の生成手段26dに通知すること等を行う。
The utterance information merging means 28 is a financial institution of utterance contents held by the voice guidance information storage means 23, which is a phonetic character string or kana character string corresponding to the name of the financial institution or branch stored in the output character string information storage means 22. Or merge with the location where the branch name is entered. Further, the phonetic character string representing the phonetic number of the phone number and the like stored in the output character string
数字情報通知手段29は、カード読取手段24が振り込みカードから読み取った電話番号、口座番号等と、入力受付手段31が受け付けた振り込み金額等とに対応する数字を音声合成手段26の変換手段26cに通知する。 The number information notification means 29 sends the numbers corresponding to the telephone number, account number, etc. read from the transfer card by the card reading means 24 and the transfer amount received by the input receiving means 31 to the conversion means 26c of the speech synthesis means 26. Notice.
入力受付手段31は、受話器80のプッシュホンのボタンに対する操作入力を受け付ける。また、入力受付手段31は、受話器80のプッシュホンのボタンに対する操作入力による振り込み金額の情報を数字情報通知手段29に通知する。
The
発話情報通知手段32は、入力受付手段31が受け付けたプッシュホンのボタンに対する操作入力に応じた発話情報を音声案内情報格納手段23から選択して、選択した発話情報を音声合成手段26の生成手段26dに通知する。また、発話情報通知手段32は、ATM10で実行される取引処理の進行に応じて、音声案内情報格納手段23から発話情報を選択して、選択した発話情報を音声合成手段26の生成手段26dに通知する。例えば、ATM10で振り込みカードの受け付け後に、利用者の暗証番号の入力を要求する場合には暗証番号の入力を促す発話情報が、また、取引を終了した場合には終了した旨を表す発話情報等が音声案内情報格納手段23から選択される。
The utterance information notification means 32 selects the utterance information corresponding to the operation input to the button of the push phone received by the input reception means 31 from the voice guidance information storage means 23, and generates the selected utterance information by the generation means 26 d of the voice synthesis means 26. Notify Further, the utterance information notification means 32 selects the utterance information from the voice guidance information storage means 23 in accordance with the progress of the transaction processing executed by the
音声出力制御手段33は、音声合成手段26の生成手段26dから音声情報が通知されると、当該音声情報に基づいた音声の出力要求を受話器80に通知して、受話器80のスピーカから当該音声情報に基づいた音声を出力させる。
When the voice information is notified from the generating means 26d of the voice synthesizing means 26, the voice output control means 33 notifies the
このような構成を有するATM10で行われる金融機関及び支店の名称の音声読み上げ処理について説明する。
図7は、第2の実施の形態に係るATMの音声読み上げ処理手順を示すフローチャートである。なお、図7は、主として、金融機関及びその支店の名称に関する音声読み上げ処理を示す。
A voice reading process of the names of financial institutions and branches performed by the
FIG. 7 is a flowchart showing the ATM voice reading processing procedure according to the second embodiment. Note that FIG. 7 mainly shows a speech-to-speech process relating to the names of financial institutions and their branches.
まず、視覚障害がある利用者がATM10の受話器80を持ち上げると、当該利用者に所望の取引を選択させるために、受話器80の各取引の実行に対応するプッシュホンのボタンを押下するように受話器80のスピーカから音声案内が出力される。
First, when a visually impaired user lifts the
当該利用者は、例えば、受話器80の振り込み取引に対応するプッシュホンのボタンを押下すると、入力受付手段31が当該押下に応じた信号を受け付けて、発話情報通知手段32が当該信号に対応する、例えば、振り込みカードの挿入を促すような発話情報を音声案内情報格納手段23から選択する。音声合成手段26の生成手段26dが、波形情報格納手段26bに基づいて、振り込みカードの挿入を促すような発話情報から音声情報を生成する。音声出力制御手段33は、当該音声情報に基づいた音声の出力要求を受話器80に通知して、受話器80のスピーカから利用者に振り込みカードを挿入するような音声案内がされる。
For example, when the user presses a button of a push phone corresponding to a transfer transaction of the
[ステップS11] 利用者はカード処理ユニット40のカード挿入/排出口40aに振り込みカードを挿入すると、カード読取手段24は、カード処理ユニット40のカード挿入/排出口40aから利用者の振り込みカードに記録されている振込先の金融機関コード及び支店コードを読み取る。
[Step S11] When the user inserts the transfer card into the card insertion /
[ステップS12] 検索手段25は、ステップS11で読み取った金融機関コード及び支店コードに対応する、読み上げ対象の金融機関または支店の振り仮名及び漢字で表された名称を金融機関情報格納手段21から検索する。
[Step S12] The
[ステップS13] 音声合成手段26の変換手段26cは、検索手段25が検索した金融機関または支店の漢字で表された名称を、辞書情報格納手段26aが格納する辞書情報に基づいて、当該名称の表音を表す表音文字列に変換する。
[Step S13] Based on the dictionary information stored in the dictionary
[ステップS20] 比較判定手段27は、ステップS13で変換された表音文字列と、金融機関または支店の振り仮名で表される名称の振り仮名を表す仮名文字列との比較を行う。この比較の結果に基づき金融機関または支店の名称を読み上げるために、表音文字列または仮名文字列のいずれかが選択される。 [Step S20] The comparison / determination means 27 compares the phonetic character string converted in Step S13 with the kana character string representing the kana of the name represented by the kana of the financial institution or branch. In order to read out the name of the financial institution or branch based on the result of this comparison, either the phonetic character string or the kana character string is selected.
[ステップS14] 比較判定手段27はステップS20で選択した金融機関または支店の名称に対応する表音文字列または仮名文字列を出力文字列情報記憶手段22に記憶する。
[Step S14] The
[ステップS15] 検索手段25は、音声合成手段26の変換手段26cで変換する必要がある他の金融機関または支店の名称の有無を判別する。
判別の結果、変換する名称があればステップS12に進められ、なければステップS16に進められる。
[Step S15] The
If it is determined that there is a name to be converted, the process proceeds to step S12, and if not, the process proceeds to step S16.
[ステップS16] 発話情報併合手段28は、ステップS14で出力文字列情報記憶手段22に記憶された表音文字列または仮名文字列を、音声案内情報格納手段23が保持する処理内容に対応した発話内容に併合して、音声合成手段26に通知する。 [Step S16] The utterance information merging means 28 utters the utterance character string or kana character string stored in the output character string information storage means 22 in step S14 and corresponds to the processing content held by the voice guidance information storage means 23. It is merged with the contents and notified to the speech synthesis means 26.
音声合成手段26の生成手段26dは、波形情報格納手段26bに格納されている波形情報に基づき、通知された金融機関または支店の漢字で表された名称の表音文字列または、金融機関または支店の振り仮名で表された名称の仮名文字列が所定の発話位置に併合された発話情報から音声情報を生成する。
The generating
[ステップS17] 音声出力制御手段33は、音声合成手段26の生成手段26dから通知された音声情報と共に当該音声情報の出力要求を受話器80に通知して、受話器80から発話情報に基づいた音声案内を出力させる。
[Step S17] The voice output control means 33 notifies the
このような読み上げ処理に基づいて受話器80のスピーカから出力される音声案内に促されて利用者が操作を行うことができる。
さらに、ステップS20で比較判定手段27が行う文字列比較の処理について説明する。
Based on such a reading process, the user can perform an operation in response to voice guidance output from the speaker of the
Furthermore, the character string comparison process performed by the
なお、文字列比較処理では、表音文字列と仮名文字列との比較の際には、単に一致する場合に加えて、一致の条件を新たに設けている。まず、表音文字列の発音記号を表す特殊文字は比較の際には用いない。さらに、表音文字列の選択した文字が小書きであって、仮名文字列の選択した仮名文字に対応している場合、表音文字列の選択した文字が長音であって、仮名文字列が「オ」または「ウ」である場合はそれぞれ一致するものとする。このような条件により、表音文字列と仮名文字列との比較を行うものとする。 In the character string comparison process, a matching condition is newly provided in addition to the case of matching when comparing the phonetic character string and the kana character string. First, special characters representing phonetic symbols in phonetic character strings are not used for comparison. Furthermore, when the selected character of the phonetic character string is a small letter and corresponds to the selected kana character of the kana character string, the selected character of the phonetic character string is a long sound, and the kana character string is In the case of “o” or “c”, they shall match. Under such conditions, the phonetic character string and the kana character string are compared.
図8は、第2の実施の形態に係るATMの文字列比較処理手順を示すフローチャートである。
[ステップS21] 比較判定手段27は、音声合成手段26の変換手段26cから通知された金融機関または支店の漢字で表された名称から変換された表音文字列と、金融機関情報格納手段21が格納する金融機関または支店の振り仮名で表された名称の仮名文字列との先頭の仮名文字(i=1)を選択する。
FIG. 8 is a flowchart showing an ATM character string comparison processing procedure according to the second embodiment.
[Step S21] The
[ステップS22] 比較判定手段27は、表音文字列で選択した文字が特殊文字であるか否かを判定する。
判定の結果、選択した文字が特殊文字である場合にはステップS27に進められ、特殊文字でない場合にステップS23に進められる。
[Step S22] The comparison / determination means 27 determines whether or not the character selected in the phonetic character string is a special character.
If it is determined that the selected character is a special character, the process proceeds to step S27. If the selected character is not a special character, the process proceeds to step S23.
[ステップS23] 比較判定手段27は、表音文字列及び仮名文字列から選択した文字同士を比較する。
[ステップS24] ステップS23の比較の結果、選択した文字同士が一致する場合にはステップS27に進められ、一致しない場合にはステップS25に進められる。
[Step S23] The
[Step S24] As a result of the comparison in step S23, if the selected characters match, the process proceeds to step S27, and if not, the process proceeds to step S25.
[ステップS25] ステップS23の比較の結果、表音文字列の選択した文字が小書きであって、仮名文字列の選択した仮名文字に対応している場合には一致したものとしてステップS27に進められて、対応していない場合にはステップS26に進められる。 [Step S25] As a result of the comparison in Step S23, if the selected character of the phonetic character string is a small character and corresponds to the selected Kana character of the Kana character string, the process proceeds to Step S27 as a match. If not, the process proceeds to step S26.
[ステップS26] ステップS23の比較の結果、表音文字列の選択した文字が長音であって、仮名文字列が「オ」または「ウ」である場合には一致したものとしてステップS27に進められて、仮名文字列が「オ」または「ウ」ではない場合には、ステップS29bに進められる。 [Step S26] As a result of the comparison in Step S23, if the selected character of the phonetic character string is a long sound and the kana character string is “o” or “c”, the process proceeds to Step S27 as a match. If the kana character string is not “o” or “c”, the process proceeds to step S29b.
[ステップS27] 比較判定手段27は、選択した表音文字列と仮名文字列との文字が末尾の文字であるか否かを判定する。
判定の結果、末尾の文字であればステップS29aに進められ、末尾の文字ではなく比較する文字がまだあればステップS28に進められる。
[Step S27] The comparison / determination means 27 determines whether or not the characters of the selected phonetic character string and kana character string are the last character.
As a result of the determination, if it is the last character, the process proceeds to step S29a. If there is still a character to be compared instead of the last character, the process proceeds to step S28.
[ステップS28] 比較判定手段27は、選択している表音文字列及び仮名文字列の文字の末尾方向に隣接する文字(i=i+1)を新たに選択する。
[ステップS29a] 比較判定手段27は、表音文字列を選択する。
[Step S28] The comparison / determination means 27 newly selects a character (i = i + 1) adjacent in the end direction of the selected phonetic character string and kana character string.
[Step S29a] The
[ステップS29b] 比較判定手段27は、仮名文字列を選択する。
次にこのようなATM10で行われる音声読み上げ処理及び文字列比較処理の具体例を説明する。なお、以下では、ATM10に対して振り込みカードで振り込み情報及び振り込み金額の入力後、振り込み取引を実行する前に振り込み内容を確認する場合を例に挙げて説明する。
[Step S29b] The
Next, specific examples of the speech reading process and the character string comparison process performed in the
まず、視覚障害がある利用者はカード処理ユニット40のカード挿入/排出口40aに振り込みカードを挿入する。なお、振り込みカードには、例えば、振込先の口座番号と、当該口座番号に対応する金融機関である「九州銀行」の金融コード「0111」と、その支店である「国立支店」の支店コード「0024」と、受取人及び依頼人の氏名(振り仮名)と、依頼人の電話番号とが磁気的に記録されている。
First, a user who is visually impaired inserts a transfer card into the card insertion /
すると、カード読取手段24は、カード処理ユニット40のカード挿入/排出口40aから利用者の振り込みカードに記録されている振込先の金融機関コード「0111」及び支店名コード「0024」を読み取る。また、依頼人及び受取人の氏名も読み取り、出力文字列情報記憶手段22に記憶させ、振込先の口座番号及び依頼人の電話番号を数字情報通知手段29に通知する(ステップS11)。
Then, the card reading means 24 reads the transfer destination financial institution code “0111” and the branch name code “0024” recorded on the transfer card of the user from the card insertion /
検索手段25は、金融機関コード「0111」及び支店コード「0024」に対応する、金融機関及び支店の振り仮名及び漢字で表された名称(「キユシユウギンコウ」及び「九州銀行」、「クニタチシテン」及び「国立支店」)を図5の金融機関情報格納手段21から検索する(ステップS12)。 The search means 25 corresponds to the financial institution code “0111” and the branch code “0024”, and the names expressed in kanji and “Kyushu Yuginko”, “Kyushu Bank”, “Kunitachi Shiten”. And “national branch”) are searched from the financial institution information storage means 21 of FIG. 5 (step S12).
次いで、音声合成手段26の変換手段26cは、まず、金融機関の名称である「九州銀行」を、辞書情報格納手段26aが格納する辞書情報に基づいて、表音文字列に変換する。また、音声合成手段26の変換手段26cは、同様に、振込先の口座番号、依頼人の電話番号も表音文字列に変換して、出力文字列情報記憶手段22に記憶させる(ステップS13)。
Next, the converting
比較判定手段27は、「九州銀行」について、金融機関情報格納手段21に格納されている仮名文字列(「キユシユウギンコウ」)と、変換された表音文字列とを比較する(ステップS20)。 The comparison determination means 27 compares the kana character string (“Kyushuyuginko”) stored in the financial institution information storage means 21 with the converted phonetic character string for “Kyushu Bank” (step S20). .
ここで、「九州銀行」の比較処理について具体的に説明する。
図9は、第2の実施の形態に係る文字列の比較を模式的に説明するための図である。なお、図9(A)は読み上げ対象の対象文字列に対応する表音文字列を表し、図9(B)は、当該対象文字列に対応する仮名文字列を表す。
Here, the comparison process of “Kyushu Bank” will be specifically described.
FIG. 9 is a diagram for schematically explaining comparison of character strings according to the second embodiment. 9A represents a phonetic character string corresponding to the target character string to be read out, and FIG. 9B represents a kana character string corresponding to the target character string.
図9(A)に示される金融機関の漢字で表される名称(対象文字列)の「九州銀行」に対応する表音文字列である。図9(A)中の左から8文字目及び12文字目のアポストロフィ及びカンマは「ギンコー」の仮名読み、アクセントを表す発音記号の特殊文字である。 It is a phonetic character string corresponding to “Kyushu Bank” in the name (target character string) represented in Kanji of the financial institution shown in FIG. The apostrophe and comma of the eighth and twelfth characters from the left in FIG. 9A are special characters of phonetic symbols representing “Ginkgo” and phonetic symbols representing accents.
まず、比較判定手段27は、「九州銀行」の表音文字列と仮名文字列との先頭の仮名文字「キ」を選択する(ステップS21)。
両者の仮名文字は「キ」であって、特殊文字ではなく、また一致しており、仮名文字の「キ」は末尾の文字ではないことを判定する(ステップS22,S23,S24,S27)。
First, the comparison determination means 27 selects the first kana character “ki” of the phonetic character string and the kana character string of “Kyushu Bank” (step S21).
It is determined that both kana characters are “ki”, are not special characters, and match, and “k” of the kana character is not the last character (steps S22, S23, S24, S27).
次に、比較判定手段27は、表音文字列及び仮名文字列の「キ」の隣の仮名文字「ュ」と「ユ」とをそれぞれ選択する(ステップS28)。
選択した表音文字列の「ュ」は特殊文字ではなく、表音文字列「ュ」は、仮名文字列の「ユ」の小書きに対応し、表音文字列の「ュ」は末尾の文字ではないことを判定する(ステップS22,S23,S24,S25,S27)。
Next, the comparison / determination means 27 selects the kana characters “yu” and “yu” next to “ki” in the phonetic character string and the kana character string, respectively (step S28).
The selected phonetic character string “u” is not a special character, the phonetic character string “u” corresponds to the small letter “yu” in the kana character string, and the character phonetic character string “u” It is determined that it is not a character (steps S22, S23, S24, S25, S27).
次に、比較判定手段27は、表音文字列の「ュ」及び仮名文字列「ユ」の隣の長音「ー」及び「ウ」を選択する(ステップS28)。
この場合も、選択した表音文字列の「ー」は長音であって特殊文字ではなく、表音文字列「ー」は、仮名文字列の「ウ」と一致しないものの、対応しており、表音文字列の「ー」は末尾の文字ではないことを判定する(ステップS22,S23,S24,S25,S26,S27)。
Next, the comparison / determination means 27 selects the long sound “-” and “c” next to the phonetic character string “yu” and the kana character string “yu” (step S28).
In this case as well, “-” in the selected phonetic character string is a long sound and not a special character, and the phonetic character string “-” does not match the “k” in the kana character string. It is determined that “-” in the phonetic character string is not the last character (steps S22, S23, S24, S25, S26, S27).
表音文字列の4文字目〜7文字目も同様に比較して一致して、次に、比較判定手段27は、表音文字列の「‘」を選択すると、これは特殊文字であるために、当該文字を飛ばして、次の「ン」を選択する(ステップS22,S27,S28)。
The fourth to seventh characters of the phonetic character string are similarly compared and matched. Next, when the
そして、比較判定手段27は、表音文字列の末尾の「,」を選択すると、これは特殊文字であるために、当該文字を飛ばして、また、当該特殊文字は末尾文字であるために、表音文字列を選択する(ステップS22,S27,S29a)。 When the comparison determination means 27 selects “,” at the end of the phonetic character string, since it is a special character, it skips the character, and since the special character is the end character, A phonetic character string is selected (steps S22, S27, S29a).
比較判定手段27は、このようにして選択した金融機関名「九州銀行」の表音文字列を出力文字列情報記憶手段22に記憶する(ステップS14)。
検索手段25が「九州銀行」以外の読み上げ対象の「国立支店」を検索する。
The
The search means 25 searches for a “national branch” to be read out other than “Kyushu Bank”.
次いで、比較判定手段27は、図10に示すようにして、「国立支店」について、金融機関情報格納手段21に格納されている仮名文字列(「クニタチシテン」)と、変換された表音文字列とを比較する(ステップS20)。
Next, as shown in FIG. 10, the comparison /
「国立支店」の比較処理について具体的に説明する。
図10は、第2の実施の形態に係る文字列の比較を模式的に説明するための図である。なお、図10(A)は読み上げ対象の対象文字列に対応する表音文字列を表し、図10(B)は、当該対象文字列に対応する仮名文字列を表す。
The comparison process of “national branch” will be specifically described.
FIG. 10 is a diagram for schematically explaining comparison of character strings according to the second embodiment. 10A shows a phonetic character string corresponding to the target character string to be read out, and FIG. 10B shows a kana character string corresponding to the target character string.
まず、比較判定手段27は、「国立支店」の表音文字列と仮名文字列との先頭の仮名文字「コ」及び「ク」を選択する(ステップS21)。
比較判定手段27は、両者の仮名文字は「コ」及び「ク」であって、特殊文字ではないが、一致しておらず、表音文字列の「コ」は仮名文字列の「ク」の小書きに対応しておらず、表音文字列の「コ」は長音でもないことを判定して、支店名「国立支店」の仮名文字列を選択する(ステップS22〜S26,S29b)。
First, the
The comparison judging means 27 is that both of the kana characters are “ko” and “ku”, which are not special characters, but they do not match, and the phonetic character string “ko” is “k” in the kana character string. It is determined that the phonetic character string “ko” is not a long sound, and the kana character string of the branch name “National branch” is selected (steps S22 to S26, S29b).
比較判定手段27は、このようにして選択した支店名「国立支店」の仮名文字列を出力文字列情報記憶手段22に記憶する(ステップS14)。
なお、このように振り込みカードから振り込み情報の取得後、図示を省略するが、発話情報通知手段32が音声案内情報格納手段23から振り込み金額の入力を促す発話情報を選択して、生成手段26dにより当該発話情報から生成された音声情報に基づいて、利用者に受話器80のスピーカから振り込み金額の入力を案内する。
The comparison determination means 27 stores the kana character string of the branch name “national branch” selected in this way in the output character string information storage means 22 (step S14).
Although not shown after the transfer information is acquired from the transfer card in this way, the utterance
利用者は受話器80のプッシュホンのボタンにより振り込み金額を入力すると、入力受付手段31が当該振り込み金額を受け付けて、数字情報通知手段29に当該振り込み金額を通知する。変換手段26cは、数字情報通知手段29から通知された振り込み金額について、既述の方法により、表音文字列に変換して、出力文字列情報記憶手段22に記憶させる。
When the user inputs the transfer amount with the button of the push phone of the
ATM10に対してこのような振り込み情報及び振り込み金額の入力が完了すると、発話情報併合手段28は、出力文字列情報記憶手段22に記憶された「九州銀行」の表音文字列及び「国立支店」の仮名文字列と、振込先の口座番号、依頼人の電話番号、振り込み金額からそれぞれ変換された表音文字列とを、音声案内情報格納手段23が保持する処理内容に対応した発話内容に併合して、音声合成手段26に通知する。
When the input of such transfer information and transfer amount to the
音声合成手段26の生成手段26dは、波形情報格納手段26bに格納されている波形情報に基づき、金融機関及び支店の名称、依頼人の口座番号、受取人及び依頼人の氏名、依頼人の電話番号及び振り込み金額が併合された発話情報から音声情報を生成する(ステップS16)。
Based on the waveform information stored in the waveform
音声出力制御手段33は、これらの音声情報と共に当該音声情報の出力要求を受話器80に通知して、金融機関及び支店の名称、依頼人の口座番号、受取人及び依頼人の氏名、依頼人の電話番号及び振り込み金額が併合された、図6に示される発話情報に基づいた音声案内を受話器80のスピーカから出力させる(ステップS17)。
The voice output control means 33 notifies the
このようにATM10では、比較判定手段27が漢字を含む対象文字列から当該対象文字列の表音を表す表音文字列と、対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうち少なくとも清音で構成される仮名文字列とを一致の条件に基づいて比較して、当該比較結果に基づき対象文字列を読み上げるために、表音文字列または仮名文字列のいずれかを選択するようにした。このように比較して、対象文字列の表音文字列と仮名文字列とが一致すると、表音文字列が対象文字列に予め設定された振り仮名に対応していることになり、また、表音文字列と仮名文字列とが一致しない場合には、表音文字列が対象文字列に予め設定された振り仮名に対応していないことになる。このため、表音文字列と仮名文字列とが一致する場合には表音文字列を選択し、一致しない場合には仮名文字列を選択して、対象文字列を正しく読み上げるようにした。これにより、音声読み上げ対象の対象文字列が不自然な発音で不正確に読み上げられることが抑制されるようになる。
As described above, in
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、自動取引装置1及びATM10が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリ等がある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープ等がある。光ディスクには、DVD(Digital Versatile Disc)、CD(Compact Disc)−ROM(Read Only Memory)/RW(Re-Writable)等がある。光磁気記録媒体には、MO(Magneto-Optical disk)等がある。
The above processing functions can be realized by a computer. In that case, a program describing processing contents of functions that the automatic transaction apparatus 1 and the
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。 When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。 The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. In addition, each time a program is transferred from a server computer connected via a network, the computer can sequentially execute processing according to the received program.
また、上記の処理機能の少なくとも一手段を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)等の電子回路で実現することもできる。 Further, at least one means of the above processing function can be realized by an electronic circuit such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), or a PLD (Programmable Logic Device).
1 自動取引装置
2,26a 辞書情報格納手段
3 文字列情報格納手段
4,26b 波形情報格納手段
5,26c 変換手段
6,27 比較判定手段
7,26d 生成手段
8 音声出力手段
10 ATM
20 制御ユニット
20a CPU
20b RAM
20c HDD
20d グラフィックインタフェース
20e ホスト通信制御手段
20f 入出力インタフェース
20g バス
21 金融機関情報格納手段
22 出力文字列情報記憶手段
23 音声案内情報格納手段
24 カード読取手段
25 検索手段
26 音声合成手段
28 発話情報併合手段
29 数字情報通知手段
30 表示ユニット
30a 表示手段
30b 入力検知手段
31 入力受付手段
32 発話情報通知手段
33 音声出力制御手段
40 カード処理ユニット
40a カード挿入/排出口
50 通帳処理ユニット
50a 通帳挿入/排出口
60 紙幣処理ユニット
60a 紙幣投入/放出口
70 硬貨処理ユニット
70a 硬貨挿入/放出口
80 受話器
DESCRIPTION OF SYMBOLS 1
20
20b RAM
20c HDD
20d
Claims (9)
漢字を含む対象文字列を前記対象文字列の表音を表す表音文字列に変換する変換手段と、
変換した前記表音文字列と、前記対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき前記対象文字列を読み上げるためにいずれかの文字列を選択する比較判定手段と、
を有することを特徴とする自動取引装置。 In an automatic transaction apparatus that provides voice guidance,
Conversion means for converting a target character string including kanji into a phonetic character string representing a phonetic of the target character string;
Based on the comparison result between the converted phonetic character string and the kana character string that represents the kana character of the target character string and is composed of at least a clear sound, a muddy sound for a clear sound, and a semi-voice sound for a clear sound A comparison / determination means for selecting one of the character strings to read out the column;
An automatic transaction apparatus comprising:
ことを特徴とする請求項1記載の自動取引装置。 The phonetic character string is composed of kana characters and special characters representing phonetic symbols representing the pronunciation of the kana characters,
The automatic transaction apparatus according to claim 1.
ことを特徴とする請求項2記載の自動取引装置。 The comparison determination unit compares the kana characters constituting the phonetic character string and the kana character string one character at a time from the first character to the last character based on a matching condition.
The automatic transaction apparatus according to claim 2.
ことを特徴とする請求項3記載の自動取引装置。 The matching condition matches when the kana character constituting the phonetic character string is a stuttering or prompting character corresponding to the clear sound of the kana character string for the character to be compared. ,
The automatic transaction apparatus according to claim 3.
ことを特徴とする請求項3記載の自動取引装置。 The matching condition is that if the character representing the long sound of the kana character constituting the phonetic character string corresponds to “U” or “O” of the kana character string for the character to be compared, To
The automatic transaction apparatus according to claim 3.
ことを特徴とする請求項1記載の自動取引装置。 When the phonetic character string and the kana character string match, the comparison determination unit selects the phonetic character string to read out the target character string.
The automatic transaction apparatus according to claim 1.
ことを特徴とする請求項1記載の自動取引装置。 When the phonetic character string and the kana character string do not match, the comparison determination unit selects the kana character string to read out the target character string.
The automatic transaction apparatus according to claim 1.
変換手段が、漢字を含む対象文字列を前記対象文字列の表音を表す表音文字列に変換し、
比較判定手段が、変換した前記表音文字列と、前記対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき前記対象文字列を読み上げるためにいずれかの文字列を選択する、
ことを特徴とする音声読み上げ方法。 In the voice reading method for voice guidance,
The conversion means converts the target character string including kanji into a phonetic character string representing the phonetic character of the target character string,
The comparison determination means represents a comparison result between the converted phonetic character string and a kana character string that represents the kana of the target character string and is composed of at least a clear sound, a muddy sound for a clear sound, and a semi-voiced sound for a clear sound. Select any string to read the target string based on
A speech-to-speech method characterized by that.
漢字を含む対象文字列を前記対象文字列の表音を表す表音文字列に変換する変換手段、
変換した前記表音文字列と、前記対象文字列の振り仮名を表し、清音、清音に対する濁音及び清音に対する半濁音のうちの少なくとも清音で構成された仮名文字列との比較結果に基づき前記対象文字列を読み上げるためにいずれかの文字列を選択する比較判定手段、
として機能させることを特徴とする音声読み上げプログラム。 Computer
Conversion means for converting a target character string including kanji into a phonetic character string representing a phonetic of the target character string;
Based on the comparison result between the converted phonetic character string and the kana character string that represents the kana character of the target character string and is composed of at least a clear sound, a muddy sound for a clear sound, and a semi-voice sound for a clear sound A comparison / determination means for selecting one of the character strings to read out the column;
A speech-to-speech program characterized by functioning as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011056852A JP5576817B2 (en) | 2011-03-15 | 2011-03-15 | Automatic transaction apparatus, voice reading method and voice reading program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011056852A JP5576817B2 (en) | 2011-03-15 | 2011-03-15 | Automatic transaction apparatus, voice reading method and voice reading program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012194264A true JP2012194264A (en) | 2012-10-11 |
JP5576817B2 JP5576817B2 (en) | 2014-08-20 |
Family
ID=47086252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011056852A Active JP5576817B2 (en) | 2011-03-15 | 2011-03-15 | Automatic transaction apparatus, voice reading method and voice reading program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5576817B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015172852A (en) * | 2014-03-12 | 2015-10-01 | 日立オムロンターミナルソリューションズ株式会社 | Guidance phone and automatic cash transaction machine |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01163894A (en) * | 1987-12-21 | 1989-06-28 | Hitachi Ltd | Automatic cash trading machine |
JPH096378A (en) * | 1995-06-21 | 1997-01-10 | Oki Electric Ind Co Ltd | Text voice conversion device |
JP2001175273A (en) * | 1999-10-05 | 2001-06-29 | Toshiba Corp | Electronic equipment for reading book aloud, authoring system for the same, semiconductor media card and information providing system |
JP2004139530A (en) * | 2002-10-21 | 2004-05-13 | Osaka Gas Co Ltd | Reading correction program |
JP2007086309A (en) * | 2005-09-21 | 2007-04-05 | Mitsubishi Electric Corp | Voice synthesizer, voice synthesizing method, and program |
JP2008292587A (en) * | 2007-05-22 | 2008-12-04 | Fujitsu Ltd | Rhythm creating device, rhythm creating method and rhythm creating program |
-
2011
- 2011-03-15 JP JP2011056852A patent/JP5576817B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01163894A (en) * | 1987-12-21 | 1989-06-28 | Hitachi Ltd | Automatic cash trading machine |
JPH096378A (en) * | 1995-06-21 | 1997-01-10 | Oki Electric Ind Co Ltd | Text voice conversion device |
JP2001175273A (en) * | 1999-10-05 | 2001-06-29 | Toshiba Corp | Electronic equipment for reading book aloud, authoring system for the same, semiconductor media card and information providing system |
JP2004139530A (en) * | 2002-10-21 | 2004-05-13 | Osaka Gas Co Ltd | Reading correction program |
JP2007086309A (en) * | 2005-09-21 | 2007-04-05 | Mitsubishi Electric Corp | Voice synthesizer, voice synthesizing method, and program |
JP2008292587A (en) * | 2007-05-22 | 2008-12-04 | Fujitsu Ltd | Rhythm creating device, rhythm creating method and rhythm creating program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015172852A (en) * | 2014-03-12 | 2015-10-01 | 日立オムロンターミナルソリューションズ株式会社 | Guidance phone and automatic cash transaction machine |
Also Published As
Publication number | Publication date |
---|---|
JP5576817B2 (en) | 2014-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6321196B1 (en) | Phonetic spelling for speech recognition | |
TW521262B (en) | Method for enhancing dictation and command discrimination | |
US6347296B1 (en) | Correcting speech recognition without first presenting alternatives | |
US5758322A (en) | Method and apparatus for conducting point-of-sale transactions using voice recognition | |
EP2601596B1 (en) | Translating languages | |
US8825486B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
US8719028B2 (en) | Information processing apparatus and text-to-speech method | |
JP2008185805A (en) | Technology for creating high quality synthesis voice | |
JP2008164647A (en) | Method for utterance splitting, apparatus and program | |
JP2014048506A (en) | Word registering apparatus, and computer program for the same | |
JP5336805B2 (en) | Speech translation apparatus, method, and program | |
US20060095263A1 (en) | Character string input apparatus and method of controlling same | |
JP4189336B2 (en) | Audio information processing system, audio information processing method and program | |
JP6832503B2 (en) | Information presentation method, information presentation program and information presentation system | |
JP5576817B2 (en) | Automatic transaction apparatus, voice reading method and voice reading program | |
US20070215686A1 (en) | Automated teller machine voice guidance system and method | |
JP2001022370A (en) | Voice guidance device | |
JP3526101B2 (en) | Voice recognition device | |
KR20200000010A (en) | A self-banking kiosk providing selection menu list based on voice recognition and the method of providing selection menu list applied to the kiosk | |
JP3911178B2 (en) | Speech recognition dictionary creation device and speech recognition dictionary creation method, speech recognition device, portable terminal, speech recognition system, speech recognition dictionary creation program, and program recording medium | |
KR20140041204A (en) | Bank service providing apparatus for a person who is visually impaired | |
JP2011180416A (en) | Voice synthesis device, voice synthesis method and car navigation system | |
JP2017182394A (en) | Voice translating device, voice translating method, and voice translating program | |
JP2020027514A (en) | Information processing device, information processing system, information processing method, and program | |
JP6334589B2 (en) | Fixed phrase creation device and program, and conversation support device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130426 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5576817 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |