JP2002207728A - 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 - Google Patents

表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体

Info

Publication number
JP2002207728A
JP2002207728A JP2001005517A JP2001005517A JP2002207728A JP 2002207728 A JP2002207728 A JP 2002207728A JP 2001005517 A JP2001005517 A JP 2001005517A JP 2001005517 A JP2001005517 A JP 2001005517A JP 2002207728 A JP2002207728 A JP 2002207728A
Authority
JP
Japan
Prior art keywords
phonogram
reading
generation
phonetic character
generation rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001005517A
Other languages
English (en)
Inventor
Atsushi Yamamoto
篤志 山本
Yoshinori Uraminami
至徳 浦南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001005517A priority Critical patent/JP2002207728A/ja
Publication of JP2002207728A publication Critical patent/JP2002207728A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】テキストから表音文字を生成する装置におい
て、テキスト中に含まれている英数字記号をどのように
読み上げるかは、読み方が複数あるため、機械的な処理
では正確に判断出来ずに誤ってしまうことがあり、利用
者がエディタ等で修正する必要があるという問題があっ
た。 【解決手段】上記の問題点を解決するために、本発明の
表音文字生成装置は、テキスト中に含まれている英数字
記号の部分を抽出して表示装置等に出力し、抽出した英
数字記号を英字・数字・記号に分解して、アルファベッ
ト読み・ローマ字読み・英語風読み等の読み方の規則を
選択させることにより、利用者の希望しない読み方によ
って生成された誤った表音文字を修正する作業を軽減さ
せる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキストを入力し
て表音文字を生成する機能を有する表音文字生成装置と
それを実現するコンピュータプログラムが記録されてい
る記録媒体に関する。
【0002】
【従来の技術】表音文字生成装置は、主に、カーナビ・
音声対話装置・音声案内や音声ブラウザ等、音声合成を
用いてテキストを読み上げる音声読み上げ装置用に用い
られるのが一般的である。本発明の表音文字生成装置
は、それ以外にも、電子ブックやWebでの振り仮名付
きブラウザー等で振り仮名をつける場合等にも利用可能
である。
【0003】一般に、表音文字生成装置は、かな漢字・
英字・数字・記号等を含んだテキストを入力して、発音
を表す表音文字を生成する。表音文字生成装置は、音声
読み上げ装置に利用されることが多い。音声読み上げ装
置は、入力したテキストを表音文字生成装置で表音文字
に生成し、生成された表音文字を基に音声合成してテキ
ストを読み上げる。テキストから表音文字を生成するこ
とは、音声読み上げ時に行わず、その情報であるテキス
トの提供者が、事前に行うこともある。この場合、音声
合成装置の入力となるのは、テキストから生成した表音
文字であり、テキストは、表示装置に表示する場合に用
いられる。このため、一般の音声合成装置を組み込んだ
装置から、音声を聞くだけの利用者の音声合成装置に
は、表音文字生成装置は組み込まれていないものもあ
り、この場合、情報の提供者が利用する音声合成装置内
で使われる。但し、表音文字生成装置は、音声合成装置
に組み込まずに、単独で使用し、生成した表音文字のみ
音声合成装置で用いるようにしてもよい。
【0004】テキストから表音文字を生成する際に、問
題となるのは、複数の読みがある文字列が存在すること
である。
【0005】複数の読みが存在する代表的なものとして
は、漢字がある。漢字の読みを指定する規則の一例は、
特開平6−202685号公報の音声合成装置で開示さ
れている。ここで開示されている音声合成装置は、単語
辞書を備え、入力したテキスト中に漢字が現れると、単
語辞書を参照し、その漢字に複数の読み方の候補がある
場合は、その漢字とその読みの候補を表示し、その候補
の中から正しい読みの候補を利用者に選択させて音声合
成を行うものである。例えば、「生物」という漢字が現
れると、読みの候補として「せいぶつ」、「いきも
の」、「なまもの」が表示され、利用者はその中から正
しい読みをマウス等を用いて選択する。しかし、この装
置の場合、英字・数字・記号等の読み方に関しては対処
していない。この音声合成装置において、同様の方法で
英数字記号の読みに対処するには、単語辞書に考えられ
る英数字記号の組み合わせの読み方を全て登録する必要
があるが、漢字に比べ数が膨大になるため、単語辞書の
容量的に見て非常に困難である。
【0006】また、漢字以外の複数の読みがある文字列
を読み上げる装置の例として、特開平11−30598
7号公報のテキスト音声生成装置がある。このテキスト
音声生成装置では、電子メールアドレス・URL・顔文
字等を含む電子メールを読み上げることが出来る。この
テキスト音声生成装置は、入力したテキストから電子メ
ールアドレス・URL・顔文字等の部分をその形式に基
づいて抽出し、それをそれぞれのタイプに応じて、所定
の生成規則に従って読みを生成するものである。テキス
ト中の英字や記号に関しても読むことが可能だが、電子
メールアドレスやURL中の英字や記号に限られてお
り、テキスト中のどんな英数字記号でも読めるわけでは
なく、しかも、ローマ字読みするか英語風読みにするか
は固定で決まっているため、英字毎に読み方を指定出来
ない。そのため、望ましい読みと違う場合や変換出来な
い英数字記号に関しては、直接、読みを修正する必要が
あった。
【0007】
【発明が解決しようとする課題】このように、従来の方
式には、辞書に登録された読みの候補を表示・選択する
方式と、所定の形式の英数字記号を所定の基準に応じた
生成規則に従って読みを生成する方式と、読みを直接入
力する方式の3通りしかなかった。第1の方式では、読
みが正しくない場合、利用者が自分では読みを指定出来
ないという問題があり、第2の方式では、更に、特定の
形式の英数字記号しか変換出来ないという問題があり、
第3の方式では、読みを直接全部利用者が入力しないと
いけないため、非常に煩わしいという問題があった。
【0008】今日のようにコンピュータの高性能化・小
型化・低価格化が進み、音声合成を用いたシステムが普
及してくると、音声合成装置が、読み方が複数存在する
文字列を含むテキストでも正しく読み上げることが出来
るようにしたいという要望が出て来ている。
【0009】そのため、本発明は、テキスト中の複数の
読み方が存在する文字列、特に、英数字記号に関して、
その正しい読みを少ない労力で簡単に指定出来るように
する表音文字生成装置の実現を目的とするものである。
【0010】
【課題を解決するための手段】簡単に述べると本発明
は、表音文字生成装置において、英数字記号に関して、
その表音文字生成規則を複数持ち、テキストから抽出し
た英数字記号とその表音文字生成規則の候補又はその表
音文字生成規則の候補に従って生成した読みの候補を表
示し、その候補の中から適切な候補を選択させることに
より、簡単な指示だけで、英数字記号から表音文字を生
成するものである。これにより、テキスト中の全ての英
数字記号について、簡単な操作で正しい表音文字を生成
することが可能となる。
【0011】本発明にかかる表音文字生成装置は、テキ
ストを入力するテキスト入力部と、表音文字生成のため
の文字コードとその読みを予め記憶している表音辞書
と、前記テキストから英数字記号を抽出する抽出部と、
前記英数字記号と表音文字生成規則の候補を提示する生
成規則提示部と、前記英数字記号にどの表音文字生成規
則を適用するかの選択を受け付ける生成規則選択部と、
前記選択された表音文字生成規則により、前記英数字記
号から表音文字を生成・出力する表音文字生成部とを有
することを特徴とする。
【0012】かかる構成により、テキスト中の英数字記
号部分を抽出して、その文字部分の表音文字生成規則の
候補をあげ、その中から適切なものを利用者が選択する
ことにより、読み方を直接入力しなくても簡単に正しい
読みが入力出来る。
【0013】本発明にかかる表音文字生成装置は、更
に、生成された表音文字を出力する表音文字出力部を備
え、前記表音文字生成部は、前記抽出された英数字記号
の読みを、前記表音文字生成規則の候補毎に生成し、前
記生成規則提示部は、前記英数字記号と前記表音文字生
成規則の候補毎に生成した読みの候補を提示し、前記生
成規則選択部は、前記英数字記号にどの読みを選択する
かを受け付け、前記表音文字出力部は、前記選択された
読みを出力することを特徴とする。
【0014】かかる構成により、テキスト中の英数字記
号を抽出して、その英数字記号の表音文字生成規則の候
補毎に表音文字を生成して読みの候補をあげ、その中か
ら適切なものを利用者が選択することにより、読み方を
直接入力しなくても簡単に正しい読みが入力出来る。
【0015】また、本発明にかかる表音文字生成装置
は、更に、前記抽出した英数字記号にどの表音文字生成
規則を適用したらよいか判定する生成規則判定部を備
え、前記生成規則提示部は、前記生成規則判定部で判定
された表音文字生成規則又はそれにより生成された読み
を選択された状態で提示し、それ以外の候補を選択され
ていない状態で提示することを特徴とする。
【0016】かかる構成により、表音文字生成規則のデ
フォルト値を事前に自動的に判定しておくことが出来、
利用者は、自動判定が間違っている部分のみ選択し直せ
ばよいので、表音文字生成規則又はそれにより生成され
た読みを選択する手間をかなり省くことが可能となる。
【0017】また、本発明にかかる表音文字生成装置
は、更に、選択された結果を記憶しておく選択結果格納
部を有し、前記生成規則選択部が、更に、前記英数字記
号と選択された表音文字生成規則又は読みを対応づけて
前記選択結果格納部に格納し、前記表音文字生成部にお
いて、更に、抽出した英数字記号が前記選択結果格納部
に有るかどうかチェックし、有る場合は、その選択結果
に従い表音文字を生成し、無い場合は、候補を提示・選
択してから表音文字を生成することを特徴とする。
【0018】かかる構成により、1度選択した英数字記
号の表音文字生成規則の候補又はそれにより生成された
読みの対応を格納しておくことにより、それ以降同じ英
数字記号が出てきても、格納しておいた選択結果を参照
して、再度選択することなく、自動的に表音文字を生成
出来る。
【0019】また、本発明にかかるコンピュータに実行
させる表音文字生成プログラムを記録したコンピュータ
読み取り可能な記録媒体は、テキストを入力するステッ
プと、前記入力テキストから英数字記号を抽出するステ
ップと、前記英数字記号とその表音文字生成規則の候補
を提示するステップと、前記英数字記号にどの表音文字
生成規則を適用するかの選択を受け付けるステップと、
前記選択された表音文字生成規則により、前記英数字記
号から表音文字を生成・出力するステップとを含むコン
ピュータに実行させるプログラムを含むことを特徴とす
る。
【0020】記録媒体に記録されたかかる構成のプログ
ラムを、コンピュータにロードして実行することによ
り、テキスト中の複数の表音文字候補が存在する文字部
分を抽出して、その文字部分の読みの候補又は表音文字
生成規則の候補をあげ、その中から適切なものを利用者
が選択することにより、簡単に正しい読みが入力出来る
ようになる。
【0021】
【発明の実施の形態】本発明による具体的な実施形態に
ついて説明する前に、まず、本発明で使用する表音辞書
について説明する。
【0022】表音辞書には、複数の読み方がある語とそ
の読みだけでなく、読み方が1つしかないものも含め
て、その語のコードとその語の1つまたは複数の読みを
表音文字で表したものが対になって登録されている。必
要に応じて、英単語やローマ字・漢字等も登録してもよ
い。
【0023】また、本実施形態では、表音文字として平
仮名を用いるが、表音文字は、発音を表すものであれ
ば、カタカナでも他の文字でもよいし、表音文字にアク
セントやイントネーション等を表す情報を含んでもよ
い。
【0024】次に、本発明で使用する表音文字生成規則
について、英字・数字・記号に分けて説明する。
【0025】英字の場合の読み方は、「アルファベット
読み」・「英語風読み」・「ローマ字読み」の3つが考
えられる。まず、第1の読み方は、「アルファベット読
み」で、英字の1文字毎をアルファベットとして読む。
アルファベットの読みの表音文字は、大文字・小文字を
半角文字・全角文字等を含めて、その文字コードとその
読みである表音文字が対応づけて表音辞書に登録されて
いる。第2の読み方は、「ローマ字読み」である。第3
の読み方は、「英語風読み」であり、英語風の発音で読
む。「ローマ字読み」や「英語風読み」は、それぞれ、
図1の表音文字生成部5の中に、図3の(1)のローマ
字読み対応表と(2)の英語風読み対応表を持つことに
より、表音文字の生成を行う。
【0026】まず、図3の(1)のローマ字読み対応表
を用いてローマ字を表音文字に変換する方法について述
べる。このローマ字読み対応表は、「ヘボン式表記」に
準じている。使用するローマ字読み対応表は、「ヘボン
式表記」に準じたものに限定するものではなく、「訓令
式」に準じたものを用いても良い。ローマ字生成の場合
は、単純に、英字の前から1文字取り出し、それが母音
ならば、対応する表音文字に置き換え、子音ならば、も
う1文字取り出し、それがローマ字対応表にあれば、対
応する表音文字に置き換え、同じ子音が二つ続き、その
後が母音ならば、最初の子音を撥音便「っ」に置き換
え、その次の子音+母音を対応する表音文字に置き換
え、異なる子音に母音が続く場合は、対応する表音文字
に置き換える。これを繰り返す。但し、「n」の後に
「n」+母音が続くと、最初の「n」を「ん」に変換す
る。このように、ワープロで、ローマ字入力する時と同
様の処理行うものである。具体的な生成方法に関して
は、特に、ここにあげた方法に限定しない。
【0027】「英語風読み」の生成方法について、「c
hance」という単語を用いて、簡単に説明をする。
英語風読み対応表は、実際は、図3の(2)の(i)の
英字発音記号対応表と(ii)の発音記号表音文字対応
表の2つの表から成る。図3の(2)の英語風読み対応
表は、特に「chance」という語に関連する部分
を、表示している。英字発音記号対応表の見方は、表の
「英字」は英単語中の英字の母音または子音を表し、
「発音記号」は英語の発音記号を表している。「後続文
字」の「_」は、「英字」で指定した文字を表してお
り、その後に文字が書かれているのはその英字に続く文
字を表している。例えば、の「a」は、「a」の後に
「ke」が続くと、「ei」と発音する。この表は、表
の上に現れるものが優先されるため、「ake」と続く
「a」は、「ei」と発音し、それ以外の「a」は、
の発音を採用する。の後続文字には、「{e|i|
y}」と書かれているが、これは、「c」の後に「e」
か「i」か「y」が続く場合は、発音は「s」(五十音
のさ行に相当)となることを表す。つまり、その後に来
る英字により、「さしすせそ」のどれになるかが決ま
る。但し、その後に発音する母音が続かない場合は、
「す」と発音する。次に、の「e」の発音記号「−」
は、発音しないことを示し、後続文字の「_*」は、
「e」の後に英字が続かないことを示している。「ch
ance」という英単語をこの英語風対応表で表音文字
に変換すると、図3の(3)に示すように、「chan
ce」は、「ch」で始まるので、の発音記号が選択
され、次の「a」は、「ke」が続かないため、次の
「a」のの発音記号が選択される。次の「n」は、
の発音記号が選択され、次の「c」は「e」が続くの
で、発音記号はになる。最後の「e」は、語尾であ
り、語尾が「e」で終わるものは、発音しない。こうし
て変換された発音記号は、図3の(3)の(i)のよう
になる。これを、図3の(2)の(ii)の発音記号表
音文字対応表に従って変換すると、図3の(3)のよう
に、「ちゃんす」となる。
【0028】この仕組みを用いて、英単語を英語の発音
記号に変換した場合、正解率は、通常、80%前後に過
ぎない。しかし、日本語の場合は、例えば、「ei」と
発音する以外の「a」の発音は英語では3種類あるが、
日本語の発音に置き換えると「あ」の1種類になるた
め、その3種類の「a」の発音を間違えても日本語の表
音文字では正解となり、正解率は大幅に向上する。とは
いえ、正解率は100%とはならないため、実際の変換
の際には、変換した表音文字を表示し、間違っていれ
ば、正しい読みを入力出来るようにした方が好ましい。
【0029】それぞれの対応表は、図3にあげたものに
限定せず、「ローマ字読み」・「英語風読み」が出来る
仕組みならば、どのようなものでもよい。また、「英語
風読み」に関しては、表音辞書又は別途設けた英単語辞
書に英単語とその読みを登録しておいて、抽出した英字
に対応する英単語があれば、その読みを表音文字とし、
辞書にない英単語は、英語風読み対応表を用いて表音文
字に変換するか、直接入力するようにしてもよい。
【0030】それ以外の読み方として、「アルファベッ
ト+ローマ字読み」、「アルファベット+英語風読み」
が考えられる。「ローマ字読み」や「英語風読み」をす
る語の前にその語を識別するためのアルファベット読み
する部分が1文字又は複数文字入っている場合があり、
最初の部分はアルファベット読みする場合がある。
【0031】英字の読み方として、5つ例をあげたが、
ここにあげたものに限定するものではなく、他の読み方
でもよい。
【0032】次に、数字の読み方であるが、大別して2
つの読み方が考えられる。第1の読み方は、「桁読み」
であり、数字を位取りして読む方法である。例えば、
「12」という数字があると、「じゅーに」と読む。第
2の読み方は、「棒読み」であり、数字を一つずつ読む
やり方である。「12」の場合、「いちに」と読む。数
字の読みの場合、数字や桁そのものの読み以外にも図4
に示す2種類の音韻変形表を表音文字生成部5内部に持
ち(不図示)、数字から表音文字を生成する。
【0033】図4の(1)の音韻変形表は、連続する2
つの数字の前の数字の語尾の音韻をどのように変形する
かを示している。縦軸は、前方の数字を示し、横軸は、
後方の数字を示す。この表では便宜上、10以上の桁を
漢字で表記しているが、数字であらわしても構わない。
横軸の0〜9の部分は、「棒読み」の表をあらわしてお
り、百〜京(京以上の位をいれてもよい)の部分は、
「桁読み」の表を表している。「棒読み」の場合、2と
5は長音化して「にー」、「ごー」と発音するため、縦
軸の2と5の欄は、横軸の0〜9まで、長音化を示す2
が入っている。横軸の百から京の欄には、数字によって
促音化する必要があるため、該当する部分に促音化を示
す1が入っている。
【0034】図4の(2)の音韻変形表は、連続する2
つの数字の後ろの数字の頭部の音韻をどのように変形す
るかを示している。縦軸は、前方の数字を示し、横軸
は、後方の数字を示す。この表では便宜上、10以上の
桁を漢字で表記しているが、数字であらわしても構わな
い。横軸の0〜9の部分は、「棒読み」の表をあらわし
ており、十〜千の部分は、「桁読み」の表を表してい
る。「棒読み」の場合、2と5は長音化して「にー」、
「ごー」と発音するため、横軸の2と5の欄は、縦軸の
0〜9まで、長音化を示す3が入っている。横軸の十か
ら千の欄には、数字によって濁音化したり、半濁音化し
たりする必要があるため、該当する部分に濁音化を示す
1又は半濁音化を示す2が入っている。
【0035】例えば桁読みの場合、123ならば「ひゃ
くにじゅうさん」と読むが、「323」だと、図4の
(1)の音韻変形表で百の位の3は変形なしで、図4の
(2)の音韻変形表で百の位の3は濁音化なので、「さ
んびゃくにじゅうさん」と「ひゃく」が濁音化する。
「823」になると、図4の(1)の音韻変形表で百の
位の8は促音化で、図4の(2)の音韻変形表で百の位
の8は半濁音化なので、「はっぴゃくにじゅうさん」と
「はち」が促音化、「ひゃく」が半濁音化する。これ
は、その数字の位により、数字の読みや数字の位を表す
読みが変化するからである。その他にも、カウントダウ
ンの場合等は「英語風読み」をする場合等も考えられ
る。数字の読み方は、特にここにあげたものに限定する
ものではなく、他の読み方でもよい。本実施形態では、
「桁読み」と「棒読み」を使う。
【0036】次に、記号の読み方であるが、記号の場
合、単純に区切り文字として使用されているため、必ず
しも読まない場合があるので、「記号を読む」・「記号
を読まない」という2つの場合がある。記号の読み方
は、特にここにあげたものに限定するものではない。本
実施形態では、「記号を読む」・「記号を読まない」の
2種類を使う。
【0037】(実施形態1)請求項1にかかる本発明の
基本的な構成図と処理の流れを、図1と図2のフローチ
ャートを用いて説明する。
【0038】本実施の形態では、入力されるテキスト
は、既にハードディスク等の記録媒体に記録されている
ものとし、それを入力にして、英数字記号の部分のみを
抽出して、抽出された英数字記号の英字・数字・記号毎
に表音文字生成規則の候補を提示して、その表音文字生
成規則を選択することにより、選択された表音文字生成
規則に従って表音文字を生成する例について述べる。
【0039】まず、テキスト入力部1は、テキストファ
イル1−1からテキストを入力する(ステップS1)。
ここでは、テキストは、事前にハードディスク等にファ
イルとして格納されているものとしているが、通信回線
経由で入力してもよいし、キーボード等から直接入力し
てもよい。また、テキストの入力単位は、特に限定しな
い。
【0040】入力するテキストがない場合(ステップS
2:YES)は、処理を終了する。
【0041】入力するテキストがある場合(ステップS
2:NO)は、抽出部2が、テキスト中に含まれる英数
字記号の有無をチェックする(ステップS3)。チェッ
クする英字・数字・記号は、いずれも、半角文字だけで
なく全角文字も含めてチェックを行う。特に、英字は、
大文字・小文字の区別があるが、それらを含めてチェッ
クする。また、句読点は、通常、読まないため、特別に
読ませたい時以外は、記号としての処理を省略してもよ
い。
【0042】抽出部2は、英数字記号部分が無い場合
(ステップS3:NO)、ステップS1に戻り、次のテ
キストを読み出す。テキスト中に英数字記号が有る場合
(ステップS3:YES)は、連続している英字・数字
・記号の文字列を1つの英数字記号として抽出する(ス
テップS4)。
【0043】生成規則提示部3は、抽出された英数字記
号を英字・数字・記号の固まりに分解して、英字・数字
・記号毎にその表音文字生成規則の候補を対応させてデ
ィスプレイ等の表示装置3に表示する(ステップS
5)。
【0044】ここで、抽出された英数字記号とその表音
文字生成規則の候補を対応させて表示した例について説
明する。抽出された英数字記号は、英字・数字・記号の
どれか1種類で構成されている場合は、それぞれ図5の
(1)・(2)・(3)のように抽出された英数字記号
の単位に表音文字生成規則の候補を表示すればよい。表
音文字生成規則の表示を、複数並べるのではなく、図5
の(4)のように、表音文字生成規則を1つだけ表示
し、プルダウンメニュー形式とし、表示している表音文
字生成規則の隣にある記号部分をマウスでクリックした
り、その記号部分にカーソルが所定時間以上静止させる
と、他の表音文字生成規則が表示され、表音文字生成規
則を選択出来るようにしてもよい。
【0045】抽出された英数字記号に英字・数字・記号
が混在している場合は、図6の(1)のように、英字・
数字・記号に分離して、それぞれに対して表音文字生成
規則の候補を表示するようにするとよい。図6の(1)
の例は、aという会社のf研究所の第12研究室に勤務
している「鈴木二郎」さんのE−mailアドレス「j
suzuki@flab12.acompany.c
o.jp」が抽出された例である。この例では、英字・
数字・記号毎に対応する表音文字生成規則を表示してボ
タンとして機能するようにし、ボタンを選択するように
している。また、この例では、表音文字生成規則を縦に
並べて表示したが、図6の(2)のように、英数字記号
を分離する前の状態を表示し、各英字・数字・記号毎に
表音文字生成規則を横に並べて表示してもよい。
【0046】また、この表音文字生成規則では、正しい
読みが選択出来ない様な特殊な読み方をしたい場合に備
えて、表音文字生成規則の候補に、直接、正しい読みを
入力出来る様に「直接入力」という候補も設けて、この
「直接入力」ボタンを押すと、その英数字記号の読みを
入力出来るようにしてもよい。
【0047】また、表音文字生成規則を選択して表音文
字を生成した後で、生成した表音文字を表示して、正し
いか確認し、正しくない時には、直接入力出来るように
してもよい。
【0048】次に、利用者は表示された英字・数字・記
号とそれに対応する読み方の候補を見て、適切な表音文
字生成規則をマウス等の選択入力装置4−1を使って指
定する(ステップS6)。表音文字生成規則の選択は、
選択が出来る方法であれば、カーソルキーやファンクシ
ョンキー等を用いてもよく、特に限定しない。また、タ
ッチパネルとペンを用いて選択出来るようにしてもよ
い。生成規則選択部4において、各英字・数字・記号に
ついての表音文字生成規則は1つしか選べないので、そ
れぞれの英数字記号のボタンがオンになっているのに、
異なるボタンを押した場合は、最初にオンになっていた
ボタンをオフにし、新しく選択されたボタンをオンの状
態にする。
【0049】また、図5の(1),(2),(3)のよ
うに、英字・数字・記号を1つずつ画面で指定する場合
は、いずれかのボタンが指定された時点で次の英数字記
号の処理に移ればよいが、図6の(1)のように、複数
の英字・数字・記号から成る文字列の表音文字生成規則
を指定する場合は、全ての英字・数字・記号のボタンが
指定された時点で指定が完了したと見なすか、修正する
可能性があるので、指定完了のボタンを用意しておき、
完了ボタンを押した時点でその英数字記号の表音文字生
成規則の指定が完了したとみなしてもよい。
【0050】本実施形態では、抽出した英数字記号をデ
ィスプレイ等の表示装置に表示して選択するようにした
が、特に、この方法に限定するものではなく、合成音声
で読み上げたり、表音文字生成規則を音声入力で選択さ
せてもよいし、他の方法を用いてもよい。
【0051】次に、表音文字生成部5は、抽出された英
数字記号とその選択された表音文字生成規則に基づい
て、表音辞書5−1を参照しながら英数字記号から表音
文字を生成し、表音文字格納部5−2に格納する(ステ
ップS7)。ここでは、表音文字のみ格納したが、英数
字記号とその表音文字を格納するようにしてもよい。
【0052】次に、読み込んだテキスト中に英数字記号
が1つしかないとは限らないので、抽出した英数字記号
以降のテキストの中に英数字記号がまだ残っているかど
うかチェックし(ステップS8)、残っている場合(ス
テップS8:YES)はステップS4の処理に戻り、残
っていない場合(ステップS8:NO)はステップS1
の処理に戻る。
【0053】かかる構成により、テキスト中の英数字記
号部分を抽出して、その文字部分の表音文字生成規則の
候補をあげ、その中から適切なものを利用者が選択する
ことにより、読み方を直接入力しなくても簡単に正しい
読みが入力出来る。
【0054】(実施形態2)本実施形態は、請求項2に
かかる発明の実施例であり、実施形態1において、表音
文字生成規則の候補を表示するのではなく、実際に表音
文字を生成した読みを表示する例である。図7の構成図
と実施形態1のフローチャートの図2を利用して説明す
る。実施形態1と同じ部分には同じ番号を付加し、説明
を省略する。
【0055】実施形態1とは以下の点で異なる。
【0056】生成規則提示部3内に表音文字生成部5を
設け、それぞれの表音文字生成規則に従って生成した読
みを作成して表示し、生成規則選択部4において、表示
した読みの候補の中から適切な読みを選択し、表音文字
出力部6では、表音文字を出力する。
【0057】かかる構成により、テキスト中の英数字記
号部分を抽出して、その文字部分の読みの候補をあげ、
その中から適切なものを利用者が選択することにより、
読み方を直接入力しなくても簡単に正しい読みが入力出
来る。
【0058】(実施形態3)本実施形態は、請求項3に
かかる発明の実施例である。実施形態1では、全ての英
字・数字・記号の表音文字生成規則を利用者が指定する
が、全て指定するのは大変面倒である。本実施形態で
は、どの表音文字生成規則を適用するか、システムが事
前に自動的に判定して、デフォルトの表音文字生成規則
として、最初から選択された状態で表示し、間違ってい
る部分のみ、利用者が選択し直す例について述べる。図
9の構成図と実施形態1のフローチャートの図2を用い
て説明する。実施形態1と同じ部分には同じ番号を付加
し、説明を省略する。
【0059】実施形態1と構成図において異なるのは、
生成規則提示部3の中に、抽出した英字・数字・記号の
それぞれにおいて、デフォルト値の表音文字生成規則を
判定する生成規則判定部3aを持ち、英字・数字・記号
が、既に表音文字生成規則が選択された状態で、画面上
に表示されるため、利用者は、表音文字生成規則のデフ
ォルト値が間違っている部分のみ指定し直せばよい点で
ある。
【0060】まず、ステップS1からステップS4は、
実施形態1と同じなので説明を省略する。本実施形態で
は、ステップS4とステップS5の間に、英数字記号の
表音文字生成規則のデフォルト値を判定する処理が入
る。ステップS5では、そのデフォルト値が選択された
状態で表示する。ステップS6では、デフォルト値が間
違っている部分のみ、利用者が選択し直す。この時、デ
フォルト値が間違っていない場合は、選択し直す必要が
ないため、選択が終わったことを指示するために、選択
の確定ボタンを設けることが望ましい。ステップ7以降
の処理は、実施形態1と同じである。
【0061】以下に、表音文字生成規則のデフォルト値
の具体的な判定の仕方について、図8を用いて説明す
る。事前に、表音辞書に英単語とその読みを登録してお
くものとする。表音辞書とは別の英単語辞書に登録して
もよい。
【0062】まず、抽出して英字・数字・記号に分解し
た各部分を、英字か数字か記号か判断する(ステップS
11)。但し、数字に挟まれた「.」と数字3桁毎に挟
まれた「,」は、記号ではなく、数字列の一部として扱
う。
【0063】英字の場合(ステップS11:英字)は、
分解した英字が表音辞書にあれば(ステップS13:Y
ES)、その英字は「英語風読み」と見なし(ステップ
S14)、それ以外の場合(ステップS13:NO)
で、英字のn(n>1)文字目以降が表音辞書にある場
合(ステップS15:YES)は、「アルファベット+
英語風読み」と見なし(ステップS16)、更にそれ以
外の場合で、ローマ字の規則に従って書かれていれば
(ステップS17:YES)、「ローマ字読み」と見な
し(ステップS18)、更にそれ以外の場合(ステップ
S17:NO)で、n(n>1)文字目以降がローマ字
の規則に従っていれば(ステップS19:YES)、
「アルファベット+ローマ字読み」と見なし(ステップ
S20)、更にそれ以外の場合(ステップS19:N
O)は、アルファベット読みとする(ステップS21)
というように自動的に判定する。
【0064】この例では、「アルファベット+英語風読
み」と「アルファベット+ローマ字読み」の場合、n
(n>1)文字目以降の部分をチェックしているが、英
字の最後の1文字までチェックするとアルファベットに
なってしまうため意味はなく、最大抽出した英字文字列
の長さ−2文字までのどのパターンでチェックしてもよ
いが、英語と見なす部分の長さが2文字になると、ロー
マ字と同じつづりになるものも多くなるため、あまり短
くしすぎない方が好ましい。
【0065】数字の場合(ステップS11:数字)は、
抽出した数字列に3桁毎に「,」が含まれる場合(ステ
ップS22:YES)は、数字部分は「桁読み」する
(ステップS25)。この時、「,」は表音文字に変換
しない。3桁毎に「,」が含まれない場合(ステップS
22:NO)で、抽出した数字記号が、数字と演算子と
等号・不等号から成る数式の場合(ステップS23:Y
ES)は、数字部分は「桁読み」する(ステップS2
5)。それ以外の場合(ステップS23:NO)は、
「棒読み」とする(ステップS24)。但し、ステップ
S25で「桁読み」する際に、数字部分に「.」が含ま
れていると、「.」は「てん」に変換し、「.」以降の
数字は「棒読み」にする。
【0066】記号の場合(ステップS11:記号)は、
一般に読むことが多いので、「記号を読む」をデフォル
トとする。
【0067】また、それ以外に、特定の処理として、特
定の形式の文字列に関しては、表音文字生成規則を固定
的に持っていてもよい。例えば、ホームページのアドレ
ス等は、特定の形式であり、それに含まれる特定の語の
読み方も決まっている。具体的な例をあげて説明する
と、例えば、「http:」で始まる英数字記号は、ホ
ームページアドレスであり、「http」は「エッチテ
ィーティーピー」と読むので「アルファベット読み」、
「:」は「コロン」と読むので「記号を読む」、「.」
は「テン」と読むので「記号を読む」、「co」や「j
p」は「シーオー」「ジェイピー」と読むので「アルフ
ァベット読み」、「com」は「コム」と読むので「英
語風読み」のようにする。「//」は、「すらすら」と
読むのが一般的であるが、「記号を読む」とすると「す
らっしゅすらっしゅ」と読まれてしまうため、このよう
なものは、特殊な読み方として、事前に表音辞書に登録
しておくとよい。その他の部分は、アドレス中の他の英
数字記号に関しては、図8の処理に従う。
【0068】生成規則判定部3aは、URL規則等の特
定処理を記憶しておくことにより、まず、特定処理に適
合するか判定し、適合する場合は、その処理に合わせて
デフォルト値を判定し、適合しない場合は、図8の処理
を行うようにするとよい。
【0069】この規則を用いて、例えば、前述の「js
uzuki@flab12.acompany.co.
jp」を判定すると、「jsuzuki」は「アルファ
ベット+ローマ字読み」、「@」は「記号を読む」、
「flab」は「アルファベット+英語風読み」(la
bはlaboratoryの省略形として表音辞書に
「らぼ」という表音で登録されているものとする」)、
「12」は「棒読み」、「.」は全て「記号を読む」、
「acompany」は「アルファベット+英語風読
み」、「co」はアルファベット読み(ローマ字にco
はない)、「jp」はアルファベット読みとなり、ほぼ
正しい。直すとしたら、個人の好みにより、「12」を
「桁読み」にするぐらいである。ただ、「jsuzuk
i」が「isuzuki」だったりすると、「ローマ字
読み」になってしまう場合がある。図6の(2)は、デ
フォルトで表音文字生成規則が事前に選択されて表示さ
れた例である。この場合、「12」を必要に応じて、
「桁読み」に変えるだけであり、10個の英字・数字・
記号の内、1個を指定するだけで済む。
【0070】生成規則選択部4は、デフォルトとして選
択されているものを既に選択されたものと見なし、利用
者が変更した部分を新たに受け付け(ステップS5)、
次のステップS6の生成処理に移る。
【0071】生成規則選択部4は、各英数字記号につい
ての表音文字生成規則は1つしか選べないので、それぞ
れの英数字記号のボタンがオンになっているのに、異な
るボタンがオンにされた場合は、最初にオンになってい
たボタンをオフにし、新しく選択されたボタンをオンの
状態にする。
【0072】本実施形態であげた、デフォルト値の判定
方法は、あくまで一例であり、どのような判定方法を用
いてもよい。本実施形態で、英字の表音文字生成規則の
デフォルト値の判定で、抽出された英字が表音辞書に英
単語として登録されていない場合の「英語風読み」の判
定を入れていないのは、ローマ字だと「英語風読み」が
出来るため、「ローマ字読み」となるものがなくなるた
めである。英語には、ローマ字にないアルファベットの
組み合わせがあるため、図8で「アルファベット読み」
と判定する前(ステップS21の直前)に、「英語風読
み」や「アルファベット+英語風読み」が英語風読み対
応表を用いて読みをふることが出来るかどうか判定する
ロジックを追加する等してもよい。
【0073】ここでは、表音文字に英単語を登録した
が、もちろん、表音辞書に英単語を登録せずに、英語風
読み対応表のみ用いて、「英語風読み」や「アルファベ
ット+英語風読み」を判定するロジックにしてもよい。
こうすると、表音辞書の容量を小さく出来る。
【0074】この実施形態において、表音文字生成規則
のデフォルト値を決定した際に、表音文字生成規則の候
補を選択された状態で提示するのではなく、先に、表音
文字を生成して、デフォルトの読みを選択された状態で
表示するようにしてもよい。
【0075】かかる構成により、表音文字生成規則又は
それにより生成された読みのデフォルト値を事前に自動
的に判定しておくことにより、利用者は、自動判定が間
違っている部分のみ選択し直せばよいので、表音文字生
成規則又はそれにより生成された読みを選択する手間を
かなり省くことが可能となる。
【0076】実施形態2に適用する場合は、図7におい
て、生成規則提示部3内に、更に、表音文字生成部5を
設け、デフォルトの表音文字生成規則を表示前に判定
し、それぞれの表音文字生成規則の規則に従って生成し
た読みを作成し、デフォルトの表音文字生成規則に従っ
て生成した読みの候補を選択された状態で、それ以外の
読みの候補は、選択されていない状態で表示し、生成規
則選択部4において、表示した読みの候補の中から適切
な読みを選択し、表音文字出力部6では、選択した読み
を出力するだけとなる。読みの候補を表示する時、デフ
ォルトの表音文字生成規則に従って生成した読みの候補
を先頭にして読みの候補を表示するとなおよい。
【0077】かかる構成により、表音文字生成規則のデ
フォルト値を事前に自動的に判定して、その表音文字生
成規則により生成した読みを選択された状態で、それ以
外の表音文字生成規則により生成した読みを選択されて
いない状態で表示することになり、利用者は、自動判定
が間違っている場合のみ、違う読みを選択すればよいの
で、読みを選択する手間をかなり省くことが可能とな
る。
【0078】(実施形態4)本実施形態は、英数字記号
以外にも複数の読みが存在する漢字も含めて表音文字を
生成する実施例であり、実施形態1から実施形態3にお
いて、英数字記号以外にも、複数の読みが存在する漢字
についても、その読みの候補を表示・選択する例であ
る。
【0079】この実施形態においては、事前に表音辞書
5−1に漢字のコードとその読みを全て登録しておく。
表音辞書ではなく、別途、漢字辞書を設けてもよい。
【0080】まず、実施形態1にこの実施形態を適用し
た例について、図10の構成図と図2のフローチャート
を使用して説明する。他の実施形態と同じ部分には同じ
番号を付加し、説明を省略する。
【0081】ステップS1とステップS2の処理は、実
施形態1と同じであるので、説明は省略する。まず、ス
テップS3において、英数字記号の有無だけでなく、複
数の読みがある漢字の有無を表音辞書5−1を参照して
チェックする。漢字の抽出の際に、複数の語が漢字で連
続して書かれていると、語の区切りが不明確になる場合
があるが、このような場合は、形態素解析を行って、語
の区切りを明確するとよい。次に、ステップS4におい
て、テキスト中の英数字記号または複数の読みがある漢
字を抽出する。漢字に送り仮名がある場合は、それも含
めて抽出する。
【0082】抽出した文字列が英数字記号であるなら
ば、その英数字記号とその表音文字生成規則の候補を表
示し、抽出した文字列が漢字ならば、その漢字(送り仮
名がある場合は送り仮名も表示)とその複数の読み方の
規則の候補を表示する。表示例は、英数字記号の場合
は、実施形態1と同様である。漢字に関する表示例は、
図5の(5)の通りである。この例では、複数の読みが
ある漢字を、漢字とその読みだけ表示しているが、実際
には、漢字の読みを決定するには、その前後の文章が分
からないと決定出来ない場合が多いので、図5の(6)
のように、複数の読みのある漢字の前後の文章も表示す
ると、利用者が読みを決定しやすい。
【0083】ステップS6において、表示された文字列
が英数字記号の場合は、その読み方の規則の候補から選
択し、複数の読みがある漢字の場合は、その読みの候補
から選択する。ステップS7においては、英数字記号の
場合は、選択された読み方の候補に従って表音文字を生
成して出力し、複数の読みがある漢字の場合は、選択さ
れた読みをそのまま出力する。ステップS8において
は、残りのテキスト中に英数字記号または複数の読みが
ある漢字が存在するか否かチェックする。
【0084】かかる構成により、テキスト中の英数字記
号部分または複数の読みのある漢字を抽出して、英数字
記号の場合は、その文字部分の読みの規則の候補をあ
げ、漢字の場合は、その読みの候補をあげ、その中から
適切なものを利用者が選択することにより、読み方を直
接入力しなくても簡単に正しい読みが入力出来る。
【0085】次に、実施形態2にこの実施形態を適用し
た例について、実施形態2の構成図である図7を用いて
説明する。
【0086】実施形態2に適用した例は、前述の実施形
態1に適用した例において、英数字記号の表音文字生成
規則の候補を表示する代わりに、英数字記号も複数の読
みがある漢字もどちらも読みの候補を表示し、その中か
ら正しい読みを選択し、選択された読みを出力するだけ
である。
【0087】かかる構成により、テキスト中の英数字記
号部分または複数の読みのある漢字を抽出して、英数字
記号も漢字も、その読みの候補が表示され、その中から
適切なものを利用者が選択することにより、読み方を直
接入力しなくても簡単に正しい読みが入力出来る。
【0088】次に、実施形態3にこの実施形態を適用し
た例について、実施形態3の構成図である図9と実施形
態1のフローチャートの図2を用いて説明する。
【0089】実施形態2に適用した例は、前述の実施形
態1に適用した例に、実施形態2のデフォルト値の判定
機能を追加するだけである。複数の読みがある漢字のデ
フォルト値を決めるには、生成規則提示部3において、
構文解析の機能を追加する必要がある。構文解析機能
は、その漢字の前後の文章から、その漢字の読みを決め
る。例えば、図5の(6)の場合、「彼は人気がある」
という文章では、「にんき」と読んでも「ひとけ」とは
読めないので「にんき」をデフォルト値と決めることが
出来る。後の処理は、前述の実施形態1に適用した場合
と同様である。
【0090】かかる構成により、テキスト中の英数字記
号部分または複数の読みのある漢字を抽出して、英数字
記号の場合は、その文字部分の読みの規則の候補がデフ
ォルト値が選択された状態で表示され、漢字の場合は、
その読みの候補がデフォルト値が選択された状態で表示
され、その中から適切なものを利用者が選択することに
より、読み方を直接入力しなくても簡単に正しい読みが
入力出来る。
【0091】(実施形態5)本実施形態は、実施形態1
の変形パターンである。実施形態1において、抽出した
英数字記号毎に、その表音文字生成規則を表示するので
はなく、まず、表音文字生成規則の一覧を表示し、それ
と共に複数の抽出した英数字記号を同時に表示し、先に
表音文字生成規則を選択し、その表音文字生成規則に従
って表音文字を生成する英字・数字・記号を選択する例
である。
【0092】構成図は、実施形態1と同様である。フロ
ーチャートは、実施形態1のフローチャートである図2
をベースに説明する。
【0093】ステップS1〜ステップS3の処理は実施
形態1と同じである。ステップS4の処理は、テキスト
中の英数字記号部分を一度に全て抽出する。ステップS
5〜ステップS7の処理は、同時に複数の抽出した英数
字記号を処理する。但し、表示に関しては、抽出した英
数字記号がたくさんあり、1つの画面に全てを表示する
ことが出来ない時は、画面に表示出来る分だけ表示す
る。ステップS8の処理は、抽出した英数字記号の内、
画面に表示しきれない英数字記号が残っているかどうか
を判定する。ステップS8でNOの時、ステップS5に
戻り、残りの抽出した英数字記号の処理を行う。
【0094】図11は、本実施形態における画面の表示
例である。画面の左側に表音文字生成規則の一覧を表示
し、その右側に抽出した英数字記号を複数表示してい
る。(1)の例は、「桁読み」を指定し、「桁読み」す
る数字だけを選択した例である。選択した部分は、網か
けになっている。次に、「英語風読み」を選択して、対
応する英字を選択する。この場合、選択が済んだ表音文
字生成規則と選択した英数字記号は、字やボタンを同じ
色等で表示しておくことにより、指定中の表音文字生成
規則・英数字記号と識別する。図11の(2)の例で
は、指定が済んだ「桁読み」とそれに対応する数字のボ
タンには濃い網かけをし、指定中の「英語風読み」とそ
れに対応する英字は、薄い網かけをして表示を分けてい
る。表音文字生成規則毎に、表示属性を変えることによ
り、それぞれの英字・数字・記号の表音文字生成規則と
してどれが選択されたのか識別出来る様にする。このよ
うにして繰り返し、抽出された全ての英字・数字・記号
が選択されるまで繰り返す。選択が全て終わると、確定
ボタンを押して選択処理を完了する。
【0095】この場合、選択が確定した表音文字生成規
則とその対象の英数字記号を、確定した時点で画面から
見えなくすることも出来るが、指定が間違っている場合
の修正が出来ないので、あまり好ましくない。
【0096】また、抽出した英数字記号を、英字・数字
・記号毎にまとめて表示することも考えられるが、出現
順番がバラバラになるとどの表音文字生成規則で読むべ
きか判定出来なくなる可能性があるので、あまり好まし
くない。
【0097】かかる構成により、1画面で多くの英数字
記号を指定出来ると同時に、指定が間違っていても、再
度その表音文字生成規則を選択し、指定がもれている英
数字記号を指定するなり、間違って指定した英数字記号
を再度選択することにより、選択をオフにすることが出
来る。
【0098】(実施形態6)本実施形態は、請求項4に
かかる発明の実施例である。実施形態1から実施形態2
においては、全ての英数字記号の部分を表示・選択・生
成していたが、実際には、テキスト中に同じ英数字記号
が何回も出てくる場合がある。このような場合、同じ英
数字記号を何回も選択する必要があり、利用者にとって
非常に煩わしい。利用者から見れば、同じ英数字記号に
関しては、一度指定すれば、何回も指定したくないもの
である。本実施形態では、表音文字生成規則または読み
を指定した英数字記号に関しては、その選択結果を格納
しておき、英数字記号を抽出した時には、同じ英数字記
号が既に選択されているかどうか過去の選択結果をチェ
ックし、既に選択済みであれば、過去の選択結果に従っ
て表音文字を生成し、過去に同じ英数字記号が選択され
ていなければ、表示・選択するようにした例である。
【0099】図12の構成図に基づいて説明する。フロ
ーチャートに関しては、実施形態1のフローチャートの
図2を用いて説明する。他の実施形態と同じ部分には同
じ番号を付加し、説明を省略する。
【0100】ステップS1〜ステップS3までは、実施
形態1の処理と同じなので、説明を省略する。ステップ
S4において、抽出部2は、テキスト中の英数字記号を
抽出して、選択結果格納部4−2にその英数字記号が登
録されているかどうか確認する。既に登録されている場
合は、表音文字生成規則提示・選択は行う必要がないた
め、ステップS7の処理に移る。その英数字記号が登録
されていない場合は、ステップS5以下の処理を行う。
但し、ステップS6において、表音文字生成規則が選択
されると、生成規則選択部4は、その英数字記号とその
選択結果の表音文字生成規則を選択結果格納部4−2に
対応づけて格納する。選択結果を選択結果格納部4−2
に生成規則選択部4で格納するのではなく、表音文字生
成部5で、英数字記号とその読みを格納するようにして
もよい。
【0101】選択結果格納部4−2への英数字記号の登
録方法は、3つ考えられる。第1の方法は、抽出した英
数字記号とその表音文字生成規則を格納する方法であ
る。第2の方法は、英数字記号を英字・数字・記号に分
解して、各構成単位ごとに格納する方法である。これ
は、同じ読み方をする英字文字列が、複数の異なる英数
字記号文字列の一部になっている場合がよくあるため、
それに対応するためである。なお、数字と記号に関して
は、その使われ方により読み方が変わる場合があるの
で、登録しない方がよい場合がある。第3の方法は、抽
出した英数字記号とそれを英字・数字・記号に分解した
ものを、それぞれその文字列と表音文字生成規則を対応
づけて格納する方法である。もちろん、この場合も、第
2の方法と同様に、抽出した英数字記号と英字部分のみ
に限定してもよい。また、複数の読みがある漢字に関し
ては、選択結果格納部4−2に登録してもよいが、同一
テキスト中でも、漢字の使われ方により読み方が変わる
場合があるので、選択結果格納部4−2に登録しない方
がよい場合がある。このような場合は、読みを選択する
際に、登録するかどうかのボタンも表示するようにし
て、登録するかどうかの選択も一緒に行うようにしても
よい。
【0102】この例では、実施形態1をベースに説明し
たため、生成規則生成部4が選択結果として格納するの
は、英数字記号とその表音文字生成規則であったが、実
施形態2に起用する場合は、英数字記号とその読みとな
る。
【0103】また、選択結果格納部4−2は、1つであ
る必要はなく、利用者毎に作成すれば、より利用者に合
った選択結果格納部4−2となり、より使い易くなる
し、1つのテキストに限定する必要はなく、以前、別の
テキストから表音文字を生成した際に作成した選択結果
格納部4−2を、再度用いることにより、以前に選択し
た英数字記号に関しては、再度、指定する必要がなくな
る。
【0104】かかる構成により、一度、選択した英数字
記号は、テキスト中に何度現れても、最初に1回選択し
ておけば、それ以降選択する必要はなくなり、利用者の
手間を少なくすることが出来る。 (実施形態7)実施形態1から実施形態6においては、
英数字記号または複数の読みがある漢字の部分のみを生
成していたが、実際に、音声合成でテキストを読み上げ
る場合等では、テキスト全体を生成するのが普通であ
り、本実施形態は、実施形態1と実施形態4をベース
に、テキスト全体を生成するようにした例である。実施
形態1の図1と図2をベースに説明する。
【0105】ステップS1とステップS2は実施形態1
と同様なので、説明を省略する。
【0106】テキスト中に英数字記号部分又は複数の読
みがある漢字が有る場合(ステップS3:YES)は、
その部分を抽出する(ステップS4)。生成規則提示部
4は、その抽出された英数字記号部分とその表音文字生
成規則の候補を対応させてディスプレイ等の表示装置3
に表示する(ステップS5)。
【0107】ここでは、抽出された英数字項目だけを表
音文字生成規則を表示し、選択させるよう書いている
が、実際は、テキスト入力を1文章又は1句読点単位に
行った場合、抽出・提示・選択される部分とそうでない
部分が混在している場合が普通である。抽出部で抽出さ
れなかった部分に関しては、複数の読みがなく、表音文
字の生成が一意に行えるため、生成規則提示部3と生成
規則選択部4の処理を行う必要はなく、表音文字生成部
5で自動的に表音文字を生成する。
【0108】つまり、複数の読みがない部分と複数の読
みがある部分の切りわけを抽出部2が行い、複数の読み
がない部分に関しては、抽出部2から表音文字生成部5
に処理を移し、複数の読みがある部分に関しては、抽出
部2から生成規則提示部3と生成規則選択部4の処理を
経て、表音文字生成部5の処理に移る。表音文字生成部
5では、入力されたテキストが全て表音文字に変換され
ている場合は、テキスト入力部1に戻り、まだ、テキス
トで表音文字を生成されていない部分がのこっている場
合には、抽出部2に戻る。
【0109】抽出部2で英数字記号や複数の読みがある
漢字が無い場合(ステップS3:NO)は、ステップS
7の表音文字生成処理に移る。
【0110】表音文字生成部5は、英数字記号に関して
は、選択された表音文字生成規則又は選択された読みで
表音文字を生成し、複数の読みがある漢字に関しては、
選択された読みを出力し、それ以外の部分に関しては、
表音辞書に登録された固定のの読み方に従って表音文字
を生成する(ステップS7)。
【0111】その他の生成方法として、抽出された部分
と抽出されなかった部分を、入力したテキスト単位に一
括して表音文字を生成する方法があるが、この方法の場
合、抽出部2で、テキストの複数の読みがある部分に、
英字・数字・記号単位に前後に識別情報を埋め込むか、
識別情報を別データとしてテキストと一緒に生成規則提
示部3に送り、生成規則提示部3と生成規則選択部4で
は、前記識別情報がなくなるまで、生成規則規則の提示
と選択を繰り返し、テキストと選択した生成規則の情報
を表音文字生成部5に送り、表音文字生成部5は、その
情報を基に、入力したテキストを一括して表音文字の生
成を行ってもよい。
【0112】かかる構成により、英数字記号や複数の読
みを持つ漢字は、表音文字生成規則や読みを選択するだ
けで、テキスト中のそれ以外の部分も含めて、簡単な指
示でテキスト全体を表音文字に変換出来る。
【0113】(実施形態8)次に、本発明の実施の形態
にかかる表音文字生成装置を実現するプログラムを記載
した記録媒体は、図13に示す記録媒体の例のように、
CD−ROM7−1やフロッピーディスク7−2等の可
搬型記録媒体7だけでなく、通信回線の先に蓄えられた
他の記憶装置8や、コンピュータのハードディスクやR
AM等の記録媒体9のいずれでも良く、本発明にかかる
データ表示装置を利用する際に、コンピュータ10によ
り読み込まれ、主メモリ上で実行される。
【0114】この記録媒体からプログラムをコンピュー
タにローディングすることにより、テキスト中の英数字
記号部分を抽出して、その文字部分の表音文字生成規則
の候補をあげ、その中から適切なものを利用者が選択す
ることにより、読み方を直接入力しなくても簡単に正し
い読みが入力出来る表音文字生成装置を実現出来るよう
になる。
【0115】
【発明の効果】本発明の表音文字生成装置によれば、テ
キスト中の英数字記号部分または複数の読みがある漢字
を抽出して、その文字部分の表音文字生成規則または読
みの候補をあげ、その中から適切なものを利用者が選択
することにより、読み方を直接入力しなくても簡単に正
しい読みが入力出来る。
【0116】また、本発明の表音文字生成装置よれば、
表音文字生成規則または複数の読みのデフォルト値を事
前に自動的に判定しておくことにより、利用者は、自動
判定が間違っている部分のみ選択し直せばよいので、選
択する手間をかなり省くことが出来る。
【0117】また、本発明の表音文字生成装置によれ
ば、1画面で多くの英数字記号の表音文字生成規則を指
定出来ると同時に、指定が間違っていても、再度選択し
直すことが出来る。
【0118】また、本発明の表音文字生成装置によれ
ば、一度、選択した英数字記号は、テキスト中に複数回
現れても、最初に1回選択しておけば、それ以降選択す
る必要はなく、利用者の手間を少なくすることが出来
る。
【0119】また、本発明の表音文字生成装置によれ
ば、英数字記号や複数の読みを持つ漢字は、表音文字生
成規則や読みを選択するだけで、テキスト中のそれ以外
の部分も含めて、簡単な指示でテキスト全体を表音文字
に変換出来る。
【図面の簡単な説明】
【図1】 本発明の実施形態1の構成図
【図2】 本発明の実施形態1の処理の流れを示すフ
ローチャート
【図3】 対応表の例
【図4】 音韻変形表の例
【図5】 表音文字生成規則の表示例1
【図6】 表音文字生成規則の表示例2
【図7】 本発明の実施形態2の構成図
【図8】 デフォルト値の決定方法の例
【図9】 本発明の実施形態3の構成図
【図10】 本発明の実施形態4の構成図
【図11】 表音文字生成規則の表示例3
【図12】 本発明の実施形態6の構成図
【図13】 記録媒体の例示図
【符号の説明】
1 テキスト入力部 1−1 テキストファイル 2 抽出部 2−1 漢字辞書 3 生成規則提示部 3a 生成規則判定部 3−1 ディスプレイ等の表示装置 4 生成規則選択部 4−1 マウス等の選択入力装置 4−2 選択結果格納部 5 表音文字生成部 5−1 表音辞書 5−2 表音文字格納部 6 表音文字出力部 7 CD−ROMやフロッピーディスク等の可搬
型記録媒体 7−1 CD−ROM 7−2 フロッピーディスク 8 通信回線の先に蓄えられた他の記憶装置 9 コンピュータ上のRAM/ハードディスク等
の記録媒体 10 コンピュータ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 テキストから表音文字を生成する表音文
    字生成装置において、 テキストを入力するテキスト入力部と、 表音文字生成のための文字コードとその読みを予め記憶
    している表音辞書と、 前記テキストから英数字記号を抽出する抽出部と、 前記英数字記号と表音文字生成規則の候補を提示する生
    成規則提示部と、 前記英数字記号にどの表音文字生成規則を適用するかの
    選択を受け付ける生成規則選択部と、 前記選択された表音文字生成規則により、前記英数字記
    号から表音文字を生成・出力する表音文字生成部とを有
    することを特徴とする表音文字生成装置。
  2. 【請求項2】 請求項1に記載の表音文字生成装置にお
    いて、 更に、生成された表音文字を出力する表音文字出力部を
    備え、 前記表音文字生成部は、前記抽出された英数字記号の読
    みを、前記表音文字生成規則の候補毎に生成し、 前記生成規則提示部は、前記英数字記号と前記表音文字
    生成規則の候補毎に生成した読みの候補を提示し、 前記生成規則選択部は、前記英数字記号にどの読みを選
    択するかを受け付け、 前記表音文字出力部は、前記選択された読みを出力する
    ことを特徴とする表音文字生成装置。
  3. 【請求項3】 請求項1又は2に記載の表音文字生成装
    置において、 更に、前記抽出した英数字記号にどの表音文字生成規則
    を適用したらよいか判定する生成規則判定部を備え、 前記生成規則提示部は、前記生成規則判定部で判定され
    た表音文字生成規則又はそれにより生成された読みを選
    択された状態で提示し、それ以外の候補を選択されてい
    ない状態で提示することを特徴とする表音文字生成装
    置。
  4. 【請求項4】 請求項1乃至3に記載の表音文字生成装
    置において、 更に、選択された結果を記憶しておく選択結果格納部を
    有し、 前記生成規則選択部が、更に、前記英数字記号と選択さ
    れた表音文字生成規則又は読みを対応づけて前記選択結
    果格納部に格納し、 前記表音文字生成部において、更に、抽出した英数字記
    号が前記選択結果格納部に有るかどうかチェックし、有
    る場合は、その選択結果に従い表音文字を生成し、無い
    場合は、候補を提示・選択してから表音文字を生成する
    ことを特徴とする表音文字生成装置。
  5. 【請求項5】 表音文字を生成するステップをコンピュ
    ータに実行させるプログラムを記録したコンピュータ読
    み取り可能な記録媒体であって、 テキストから表音文字を生成する表音文字生成プログラ
    ムにおいて、 テキストを入力するステップと、 前記入力テキストから英数字記号を抽出するステップ
    と、 前記英数字記号とその表音文字生成規則の候補を提示す
    るステップと、 前記英数字記号にどの表音文字生成規則を適用するかの
    選択を受け付けるステップと、 前記選択された表音文字生成規則により、前記英数字記
    号から表音文字を生成・出力するステップとを含むコン
    ピュータに実行させるプログラムを記録したコンピュー
    タ読み取り可能な記録媒体。
JP2001005517A 2001-01-12 2001-01-12 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 Withdrawn JP2002207728A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001005517A JP2002207728A (ja) 2001-01-12 2001-01-12 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001005517A JP2002207728A (ja) 2001-01-12 2001-01-12 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2002207728A true JP2002207728A (ja) 2002-07-26

Family

ID=18873561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001005517A Withdrawn JP2002207728A (ja) 2001-01-12 2001-01-12 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2002207728A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007187687A (ja) * 2006-01-10 2007-07-26 Alpine Electronics Inc 音声変換処理装置
JP2007199410A (ja) * 2006-01-26 2007-08-09 Internatl Business Mach Corp <Ibm> テキストに付与する発音情報の編集を支援するシステム
WO2009122773A1 (ja) * 2008-03-31 2009-10-08 三洋電機株式会社 発話装置、発話制御プログラムおよび発話制御方法
JP2009301038A (ja) * 2009-06-12 2009-12-24 Casio Comput Co Ltd 音声表示出力制御装置、画像表示制御装置、および音声表示出力制御処理プログラム、画像表示制御処理プログラム
JP2021034012A (ja) * 2019-08-19 2021-03-01 株式会社ハフタ 英語発音変換装置、プログラム、コンピュータが読み取り可能な記憶媒体、および英語発音変換情報表示媒体
US11138965B2 (en) 2017-09-27 2021-10-05 International Business Machines Corporation Generating phonemes of loan words using two converters
WO2022215120A1 (ja) * 2021-04-05 2022-10-13 株式会社KPMG Ignition Tokyo 情報処理装置、情報処理方法、情報処理プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007187687A (ja) * 2006-01-10 2007-07-26 Alpine Electronics Inc 音声変換処理装置
JP2007199410A (ja) * 2006-01-26 2007-08-09 Internatl Business Mach Corp <Ibm> テキストに付与する発音情報の編集を支援するシステム
WO2009122773A1 (ja) * 2008-03-31 2009-10-08 三洋電機株式会社 発話装置、発話制御プログラムおよび発話制御方法
JP2009301038A (ja) * 2009-06-12 2009-12-24 Casio Comput Co Ltd 音声表示出力制御装置、画像表示制御装置、および音声表示出力制御処理プログラム、画像表示制御処理プログラム
US11138965B2 (en) 2017-09-27 2021-10-05 International Business Machines Corporation Generating phonemes of loan words using two converters
US11195513B2 (en) 2017-09-27 2021-12-07 International Business Machines Corporation Generating phonemes of loan words using two converters
JP2021034012A (ja) * 2019-08-19 2021-03-01 株式会社ハフタ 英語発音変換装置、プログラム、コンピュータが読み取り可能な記憶媒体、および英語発音変換情報表示媒体
WO2022215120A1 (ja) * 2021-04-05 2022-10-13 株式会社KPMG Ignition Tokyo 情報処理装置、情報処理方法、情報処理プログラム

Similar Documents

Publication Publication Date Title
JP4829901B2 (ja) マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置
TWI470450B (zh) 多合一中文輸入方法及其電子裝置
TWI293455B (en) System and method for disambiguating phonetic input
US8977535B2 (en) Transliterating methods between character-based and phonetic symbol-based writing systems
JP2003015803A (ja) 小型キーパッド用日本語入力メカニズム
KR20010088892A (ko) 한자입력장치 및 방법
KR101060928B1 (ko) 중국어 발음을 성조를 나타내는 소정기호를 포함하는 한글 발음기호로 표시 가능한 시스템 및 그 시스템을 이용한 중국어 발음을 성조를 나타내는 소정기호를 포함하는 한글 발음기호 표시 방법 및 중국어의 발음과 중국어 성조를 한글 발음기호로 표기하는 시스템 및 그 시스템을 이용한 중국어 발음과 중국어 성조를 한글 발음기호로 표기하는 방법
JP2004259269A (ja) 中国語表意文字をローマ字化する方法及びステム、及び、中国語表意文字をローマ字化するソフトウェアコードを有するコンピュータ記録媒体
JP2010198241A (ja) 中国語入力装置およびプログラム
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP2007317163A (ja) 電子辞書及び検索方法
JP5751537B2 (ja) 国際対応型日本語入力システム
JP2019095603A (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP2010282507A (ja) 辞書機能を備えた電子機器およびプログラム
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
JP2008083410A (ja) 音声認識装置及びその方法
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2008217770A (ja) 言語データ表示システム、言語データ表示方法、及び言語データ表示プログラム
JP4247849B2 (ja) 氏名入力装置
JP2010039864A (ja) 形態素解析装置、形態素解析方法及びコンピュータプログラム
JP2006098552A (ja) 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法
KR20140059910A (ko) 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치
Snae et al. A Framework for an Ontology-Driven Multi-Lingual Transcription System with IPA Representation

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080401