JP2002328938A - 拡張発音記号を入力とし、単語を出力とする、発音索引の作成方法 - Google Patents

拡張発音記号を入力とし、単語を出力とする、発音索引の作成方法

Info

Publication number
JP2002328938A
JP2002328938A JP2001130805A JP2001130805A JP2002328938A JP 2002328938 A JP2002328938 A JP 2002328938A JP 2001130805 A JP2001130805 A JP 2001130805A JP 2001130805 A JP2001130805 A JP 2001130805A JP 2002328938 A JP2002328938 A JP 2002328938A
Authority
JP
Japan
Prior art keywords
pronunciation
phonetic
extended
english
symbols
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001130805A
Other languages
English (en)
Inventor
Fumio Imai
文生 今井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2001130805A priority Critical patent/JP2002328938A/ja
Publication of JP2002328938A publication Critical patent/JP2002328938A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】(英)単語の発音からその単語のスペルを検索す
るための索引において、音感が近いものをより近くに配
置する統一的方法を確立すること。 【解決手段】外国語(英語)の発音記号に対し、もう1ラ
ンク上の拡張発音記号という概念を導入し、複数の音感
の近い発音記号は、まとめて1つの拡張発音記号で表記
させる。この基で、拡張発音記号ベースで、全ての単語
を、拡張発音記号を見出しとするグループに分け、さら
に、見出し単位に、拡張発音記号の文字数の順、かつ、
拡張発音記号順に昇順にSort(並び換え)をする。次に、
同一拡張発音の綴りの複数単語に関し従来の発音記号の
音感順にSortをする。こうして、索引の並びを得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、語学教育、人工知
能(自然言語)、分類学、数学(関数、集合論、順列・組
合せ)、辞書、発音学、英文速記、文字列Sorting(並び
換え)、標準化技術、抽象化技術(美術を含む)、電子辞
書利用技術の技術分野に属し、さらに、その中の、単語
の発音をキーとした分類・検索方式の技術、に関する。
【0002】
【従来の技術】従来技術において、本発明(ここで、こ
の発明とは、具体的には、主に請求項1と2を指す、そ
して、これらについて重点的に以下は記述しています)
と、その趣旨が最も近い先願発明例1として、「カナ見
出しによる英単語の検索・調査用辞書および英単語の検
索・調査装置(特開2000-127647)」がある。また、辞
書索引の従来技術としては、一般の漢和辞典1がある。
また、英単語入力において母音を省略しても所望の単語
を得る技術として、英文速記の技術を利用した米国の先
願発明例2「リアルタイム ステノグラフィック シス
テム ユーティライジング ヴォウエル オミッション
プリンシプル(Real time stenographic system utili
zing vowel omission principle) United States Paten
t: 6,041,292; on 1997」等がある。また、請求項3の
応用技術(副産物)である新しいカナ表記の提案に相当す
る従来技術は、調査しましたが、その必要性を感ずる人
すら存在しなかったと思える程に、全く存在しませんで
した。そして、請求項3の解説については、副産物の位
置付けであり、実施例の中の変化例として、項目「発明
の実施の形態」の最終パラグラフに、その具体的な記述
をするに留めることとします。
【0003】先願発明例1は、(日本人向けに、)カナ見
出しを採用し、同一英単語に対して考えられる複数の発
音に関しては、各々該当する異なるカナ見出しを重複し
て設定し、アイウエオ50音Sort(並び換え)順に、カナ
見出しおよび付帯情報を記載すること等を特徴としてい
る。そして、発音をキーにした紙をベース媒体とする索
引の発明としては、日本国内においては、唯一この1件
のみが該当する先願発明であった。また、ここでは、具
体的にその広報番号等は挙げませんが、他の先願発明
は、全て、曖昧なスペル(発音を含む)をキーボードから
入力し、該当単語を画面に出力する電子装置についてで
あり、多くの電子辞書メーカが色々と出しておられまし
た。そして、それら電子装置の技術は、全て、(余りに
も)複雑な処理を行うsoftwareのロジック処理自身の先
行技術であり、本発明が目指す、現在の外国語辞書の付
録としての索引、あるいは、発音をキーとする辞書(印
刷物)を作成するというbasicでsimpleなことを目的には
歌っていません。ロジックの内部データとして発音索引
に相当するものを備えることはあっても、その索引は、
あくまで仲介役の位置付けの傍目には見えないものでし
た。そして、それらの技術では、索引の印刷物を作るに
は概念の基盤が薄弱過ぎます、つまり、抽象化の度合い
が低すぎて使い物になりません。従いまして、先願発明
例1以外の先願発明は全て、本発明とは、直接関係しま
せんので、ここでは、触れません。これらの先行技術に
ついては、社団法人発明協会 JIII殿の先行技術調査の
結果を、私が、さらに詳細に全てチェックした結果であ
ります(本、従来の技術の最後のパラグラフにそれらの
調査結果概要を記載しました)。そして、この先願発明
例1の表示例としては、
【0004】リロウト; re・wrote; [ri:'rout]; v,
rewrite(リーライト)のpast tense
【0005】等が記載されている。しかし、この先願発
明例1は、まず第1に、教育的観点から余り好ましくな
いと、思われます。あえて、カタカナ化するならば、た
とえ見出しとしてであろうが、「(r)リ’(r)ロout」、
の様に、体裁にとらわれず、カタカナと発音記号(又
は、アルファベット)とを混ぜ、より実際の発音に近い
ものにすべきだと考えます。「t」を「ト」と表記する
のも、先生方から敬遠されると思われます。第2に、同
一英単語に対し、異なる場所に、複数のカタカナを割り
当てることは、和製カタカナを新規に作るようなもので
あり、好ましくありません。
【0006】卑近な弊害の一般的例としては、「ロボコ
ップ」という名の米国映画がありますが、cop(警官)
は、少なくとも米語では「カップ」であり、どこの誰が
カナを振ったかは知りませんが、おそらく、「コップ」
では通用しません。このように、外国語にカタカナを割
り当てること自身、無理および弊害があり、慎重に扱う
必要があります。
【0007】例えば、「ア」というカタカナ発音表記
は、いったい英語の複数個ある母音「a」の親戚の発音
のどれを指していると解釈すべきなのでしょうか。
「ア」の親戚の全てだ、というのかも知れません。それ
は、本発明と同じ考え方で筋が通っています。それで
は、「アップル」が「エプル」と聞こえてしまったら、
対応出来ているでしょうか。「コンピュータ」が、素直
に「カムピュータ」と聞こえたらどうしましょう。しか
しながら、このカナ見出し先願発明例1は、発音ベース
の英単語索引の必要性を日本の世に問うたものとして存
在意義があり、賞賛に値する。
【0008】漢和辞典1の索引技術も本発明に近い所が
ある。漢和辞典の索引には、音読みの索引、訓読みの索
引、部首による索引、部首の画数や総画数による索引、
等の種々の視点からの補助索引が付いている。本発明の
索引も、英和あるいは英英辞典の補助索引となることを
期待している点において似ている。しかし、登録単語の
発音が漢和辞典1では曖昧さがほぼ無いために、発音ベ
ースの音読み・訓読み索引の作成には困難さが伴わな
い。英単語の発音ベースの索引では、母音等の曖昧さを
克服し、しかも一般人に受け入れ易く、その表記が、幾
つもの流派を生み出すことが無い、後世に禍根を残さ無
い、統一ある一意に決まる(「発音から一意に決まる、
見出し」という概念は、非常に重要です)索引にする必
要があり、困難さが伴う。また、本発明の特徴の1つで
ある発音桁数順の表示は、総画数による索引と形式的に
は少し似ている。しかし、内容的には、拡張母音の長さ
を一律「1」とカウントする如く、少し異なる。また、
数字(画数)を見出しキーとして該当する1文字の漢字一
覧を表示しているのに対し、数字見出しを含む(必須で
は無い)、抽象化した発音文字列を見出しキーとするの
であり、少し異なる。
【0009】先願発明例2は、母音省略の技術に関連し
ます、この技術は、一見本発明とは無縁の様に見えるか
も知れませんが、そうではありません。母音を全て
「A」としてしまうことは、母音省略と非常に近い関係
にあり、触れておく必要があります。先願発明例2は、
英文速記術を支援する海外技術であり、発音・該当スペ
ルが明確に判定される条件下で、極力母音省略により如
何に速記速度を上げるか、そして、その際発生する単語
の競合(conflicts)を如何に減少・回避するか、を焦点
とし、母音省略を100%とはしない技術です。そのバ
ックグラウンドは、速記術特有の複雑なキー入力を前提
にしたエキスパート向けのものであり、参考にはなるか
もしれないが、本発明の曖昧さをも含む発音に対し、良
く似た発音の該当スペルを如何に同一視するか、競合単
語は幾らあっても良し(その方が教育的)とする方針と
は、前提・目的も異なり(むしろ逆)、請求項もなんら抵
触しない。
【0010】ここでは、「従来の技術」の最終パラグラ
フとして、「届出前自主サーチにおける検索式」、「本
発明に関連すると思われる公報の公開、公告または特許
番号」の自主詳細調査結果とコメント等を、参考として
記しておきます。以下は、平成13年、3月現在時点で
の、日本特許庁・IPDL特許庁 特許電子図書館、平
成5年以降の公開公報を対象とした『”特許・実用検索
7)公報テキスト検索、検索”、”●公報種別 公開特
許公報 (公開、公表、再公表)”、”項目選択=要約+
請求の範囲”』の検索結果である。http://www.ipdl.jp
o-miti.go.jp/PA1/---海外公開、http://www2.ipdl.jp
o.go.jp/begin/be_search.cg----初心者向け検索ページ
から入る。 一番右の件数は、サーチにヒットした件数
を示す。1.「dictionary」&「pronunciation」:11
8件---中国語に関するものが以外と多い。2.「dicti
onary」&「pronunciation」&「English」:15件。3.
辞書 & 発音 & 英語:12件。4.検索 & 発音 & 英
語:12件(3.とほぼ重複している)。5.検索 & 英
単語 :50件。6.索引 & 英語 :6件。7.「シソ
ーラス」&「発音」:0件。8.「発音」&「索引」&
「英語」:0件。解説: 本発明と近いものとして引用
した、特許公開2000−127647 「 カナ見出しによる英
単語の検索・調査用辞書および英単語の検索・調査装
置」は、上記1.、2.、5.に含まれています。他の
特許は、電子辞書関連の、音声入力、音声出力、スペル
手書き入力、学習能力を蓄積する等の内容の物が多い。
また、発音を入力とするものもあるが、何れもカタカナ
入力であった。また、発音をキーにしての索引に関連す
るものは、上記以外に2・3あったが、何れも単純な
「アイウエオ」または、「アルファベット」Sortのみで
あり、本発明の如く、文字数の少ない順(基本的なもの
から難しいものへ、との配慮のつもり)に配置するとい
う発想のものは、皆無であった。これらの中で他に、興
味を引くものとしては、6.の中で「登録実用新案第30
21724号 学習参考書 」という実用新案を三省堂の方が
索引に焦点を当てていました。しかしながら内容的に
は、大昔の旺文社の赤尾の「豆単(赤単)」の様な受験用
暗記参考書で、カラー表示化、関連重要暗記事項の配置
などのknow-howに関するものであり、本発明とは無縁の
ものでした。本発明が狙っている、非常にBasicな課題
を解決する、発音をキーにした単純な索引表の作成につ
いての系統だった建設的な0謚阡ュ明例は、以外にない
との調査結果でした。さらに、US Patent Officeのもの
に関しても、少し調べましたが、非常に数が多いです。
しかし、内容的に、本発明と競合するようなものは無
い、との感触ですが、1件のみ従来技術の前半でも触れ
たので、改めて挙げておきます。「リアルタイム ス
テノグラフィック システム ユーティライジングヴォ
ウエル オミッション プリンシプル(Real time steno
graphic system utilizing vowel omission principle)
United States Patent: 6,041,292 ; on1997」。『母
音省略英字入力原理を利用した英速記の高速化技術』。
次に、平成5年以前のものをも含むJIII殿に協力して頂
いた先行技術調査報告に挙がった中の、本発明と近い電
子装置発明についても、その公開番号と、私の寸評を参
考のために、一応以降の資料として整理しておきまし
ょう。審査の参考になれば幸いです。また、JIIIのご協
力に対し、この場を借りて、心からお礼を述べたい。→
結論は、要するに、本発明と競合する国内先願技術は、
以外にはありません、です。公開H01-76268「単語
変換処理装置」→英単語inventionをinとventionの様な
シラブルに分け、各種シラブルの一覧を保持し、入力の
発音カタカナを考えられるシラブルに分解し、前記シラ
ブル群の考えられる結合組み合わせから、入力に近いも
のを出力する。内部記憶英単語に存在しない英単語をも
可能性がある単語として出力する能力を持つ。数百のル
ールを設定し、入力スペルに近い単語を表示する技術。
→面白いが、索引をつくる技術ではない。公開H07-98
709「発音器」→複数単語の文章入力に対し、そのnativ
eライクな流暢発音情報を出力。発音記号or発音カタカ
ナを出力する。→索引をつくる技術ではない。公開H1
0-31674「データ検索装置」→入力カナ・スペルデータ
(要するにローマ字発音、カナ発音)入力で、同一英単語
に対し全ての考えられる発音を重複して内部登録してい
る。出力は、入力の発音をもつ単語および付帯情報。
の内容と近い。→単なるDB検索に過ぎないとも云える。
→索引を作る技術では無い。公開S61-265633「発音記
号による辞書検索処理装置」→従来の発音記号そのもの
を特定のキーボードボタンに割り当て、入力として辞書
レベルの発音記号を入力に要求している。内部的に、該
当する単語をchainingして管理し、記憶容量を減らして
いる。出力は、該当英単語だけでなく、意味を含む付帯
情報も出す。特徴は、発音bL号そのものの入力、内部メ
モリの削減。付帯情報も出力。→前近代的、現時点で
は、重要性を失っている、(1世代前の)発明。また、発
音の曖昧な音感の単語の配慮など全く無い。→対象外。
公開H04-10052「外国語電子辞書生成・検索装置」→
カタカナ発音入力、内部処理にその入力に対し考えられ
るすべでの変形に対し、正規化を施し、該当単語を表示
する。これは、本格的変換装置かも知れない。→但し、
発音索引を作るシンプルな技術ではない。公開H04-30
8970「単語検索装置」→例えば、入力「トーク」に対
し、内部でローマ字化「TO-KU」とする。次に、このロ
ーマ字の母音、子音の予想され得る、発音記号を全て割
り当て、考えられる、発音記号列を全て求める。そし
て、それに合致する英単語を検索し、実在するものを結
果として、出力する。→面白い。母音、子音の曖昧性
も、内部で範囲を拡大しており、マトモである。→但
し、検索技術であり、索引作成の技術では無い。公開
H05-151194「文書作成支援装置」→に少し、近い。入
力カタカナ発音に対し、該当する複数の母音の発音記号
を画面に表示させ、その中の一番近いものを選択させな
がら会話的に、最終英単語の絞り込みをしている様であ
る。→利用者が、完全な発音を知っているが、スペルが
不明な場合の支援機能に近い。→単語索引作成の技術で
は無い。(10)公開H10-31674「データ検索装置」→カナ
発音又はカナ発音のローマ字入力で、該当英単語および
付帯情報を出力。カナ漢字変換のFEP機能の一環として
行う。→索引作成の技術では無い。(11)公開H07-210571
「単語検索処理装置及び単語検索処理装置方法」→発音
入力、曖昧な発音入力を要求し、前方からのシラブル単
位で、例えば、de〜で駄目なら、di〜と順番に入力させ
る、さらに次のシラブルを追加することを利用者に要求
する、装置側に曖昧性の自動配慮の知能に欠ける?。→
当然、発音索引を作る意識も無い。(12)公開H07-36929
「情報記憶媒体および情報再生装置」→単語に近いロー
マ字発音混じりのスペルを入力。内部で、想定可能スペ
ルの組合せを洗い出し、内部辞書を、ワイルドカード機
能に準拠して、前記スペルを含む全単語を表示させる。
多分、アップルをエプルと入力したら、多分対応できな
いLogic spec. (新規性が高い発明かは、疑問)→発音索
引を作る技術では無い。(13)公開H09-160913「外国語単
語検索装置」→カナ見出し入力、内部的に、近い原単語
をchainingし、内部データの容量削減の配慮アリ1B結果
はに近い。一次元索引作成の技術では無い。(14)公開
H09-16575「発音辞書装置」→途中のシラブルの発音が
同一の単語を抽出する技術。要するにワイルドカード指
定の発音入力に対応するロジック。→索引作成とは無縁
の技術。(15)公開H06-348703「発音辞書開発装置」→日
本語の文章を入力し、漢字・ひらがな辞書にアクセント
情報を付加した内部データを持ち、流暢な日本語として
音声出力する装置。の日本語版、かつ、音声を出力す
る装置。名前(名称自身も余り的確では無い)のみが類似
し、→内容は発音索引作成とは無縁の代物。−−以上、
から(15)は、全て電子装置に対応するものであり、そ
のエッセンスを一次元の索引作成という単純明快な命題
に答えられる様にするには、より明晰な単純明快な手段
に昇化する必要があるでしょう。これら先行発明群は、
実用には供するかも知れませんが、多くの細かいruleの
連鎖で動作するものと思われます。そのようなロジック
は、発音索引作成というsimpleで基本的な概念として
は、不向きです。つまり、先行発明群は、発音を入力と
するケースにおいて、入力者に対し何も入力制限を設け
ていません。その代わりに、電子装置の方で頑張って該
当単語を時間を掛け類推する、と云う仕掛の発明ばかり
です。本発明の求めているものは、逆で、発想がそもそ
も異なります。つまり、人間サイドに入力すべき発音を
一意化させる最低限の規約の要請を課します。そして、
その要請は、許容範囲内での最大限の抽象化を期待しま
す。極度の難聴の人を想定するのも良い。しかし、その
代わり、電子処理不用の単純な単語一覧表を出力してあ
げる、と云うものです。その位の入力制限は、物事を単
純化して捉えることであり、好ましい要請だと解釈して
います。さらに、米国のInternet 検索の「Yahoo」で
も、調査しましたが、発音辞書は、人名発音を始めとす
る沢山のものが実在していることが分かります。しか
し、本発明と抵触するものは、皆無でした。さらに、日
本のweb siteの検索から、最新の各メーカの色々な電子
辞書のレビューをしているホームメージを見つけまし
た。それは、ashahi-netのフォーラムで、URLは、http:
//www.asahi-net.or.jp/~uu4k-nki/edic.htm 、です。
そして、少なくとも、2001年3月4日現在の日付がある、
「独断と偏見のIC電子辞書レビュー」と題する報告で
す。著者等は不明です。この人の報告によると、本発明
と関連する機能が既に製品化されていることが分かりま
す。その12ツは、Sharp(株)やSony(株)が出している電
子手帳の中に、「インクリメンタルサーチ機能」という
のがあり、「i」と入力すると「i」で始まる英単語一覧
が即座に表示されるそうです。「i」に続けて「n」を追
加すると、今度は、「n」にリセットされるのではな
く、「in」で始まる英単語が全て表示される、と記述さ
れています。蛇足ですが、Sharpの方がspeedがSonyのも
のよりはるかに速く、買うならSharpが良いと記載され
ていました。この内容は、今書いた様に、本発明とは異
なる次元の機能であり、発音記号相当の入力ではなく、
あくまで、単語のスペル文字そのものの入力に対し良く
似た該当英単語を全て表示しているのであり、本発明の
請求項とは抵触しない(機能的にも、全く大した機能と
は云い難い)。また、Sharpには、この他に「スペルチェ
ッカー機能」があり、うろ覚えのスペルを入力すると該
当単語一覧を出す、とありました。この機能は、本明細
書でも後で触れますが、少なくとも、拡張発音記号とい
う本発明で歌っている概念をとり入れたものではなく、
従来のスペルチェッカーそのものであり、スペルチェッ
カーの名前からも分かる如く、曖昧な単語の類推スペル
の入力に一番近い単語一覧を表示しているに過ぎませ
ん。それを裏付ける記載として、この筆者は、「Sharp
のスペルチェッカーは、非常に便利だ。しかし、speed
が遅すぎる」と述べています。本発明の電子化への変化
応用例の所で述べる予定の、拡張発音表記入力のうち条
件を強め、仮に、拡張母音省略無し・ワイルドカード無
しの入力規則を利用者に要求し、そのことを、つまり、
発音を入力したのだと言うことを意識したスペルチェッ
カーが出来たとすれば、結果表示までのspeedは、格段
に速いものとなるでしょう。原理的にそれは証明できま
す。利用者に対し、入力制限を課すことは一概に悪いこ
ととは思いません(もう少しお上品な言葉にすると、
「標準化入力」の要求、と云えます)、納得の行く理由
があり、その規約を守るならば、表示speedはもっと速
くなります、と胸を張って云えば、利用者もそれに同感
するでしょう。そして、利用者は、その見返りとして、
応答性の高速化の恩恵を得る訳です。要するに、現時点
の電子辞書は、現在の辞書の使用方法の延長線上の電子
化に過ぎないと云えます。電子化すれば、その実態はso
ftwareですから、基本的には、データ処理に関する限
り、何でも可能なはずです。電子化に際し、色々な工夫
や苦労があったと思いますが、その目的結果自身には、
現在のレベルのものは、余り新規性を感じません(ま
た、失礼な表現をしてしまったことをお許し下さい)。
しかし、世の中の人はそのレベルの電子辞書でも、非常
に多くの恩恵を受けることは確かです。本発明は、その
レベルのものは目標とはしていません、現在の辞書その
ものを改善するものであり、種々の観点から、辞書とは
本来どうあるべきものであるか、を考え抜いた末の発案
であり、そして、現状の延長線レベルでのアイデアでは
無いものを提示した、と考えています。その電子化応用
は、オマケに過ぎません(ちょっと言い過ぎですが、事
実です)。尚、「サーチのためのキーワード」として
は、発音、辞書、英語、検索、索引、単語、等を使用し
ました。また、請求項3に関しては、キーワード「発音
記号and(かなorカナ)」にて、平成4年以前も含め、2
1件の先行技術(実用新案込み)がありましたが、カナ自
身を改善しようとするものは皆無でした。
【0011】
【発明が解決しようとする課題】・英語を含む外国語の
ヒャリングにおいて、話者の発した発音のスペルをすぐ
に検索可能とする発音対応の文字列(および付帯情報)か
らなる索引を持つ本格的辞書は、少なくとも、カタカナ
ベースの索引のもの以外、日本にはまだ市販されていな
い、この状況を打開すること。 本発明は、色々な意味
で、カナ見出し索引は、良くないとの見解である。その
理由としては、教育現場の関係者から敬遠される可能性
が高い。カナは世界には通用しない。新しい、誤ったカ
タカナ用語を新規に作っているカモ知れない。等が挙げ
られる。
【0012】・また、そのカナ見出しでない索引は、如
何なる人にとっても容易にその見出しを一意に決めるこ
とが出来る特性を持つシスティマティックな科学的根拠
を持つ方式であること。その理由の例としては、カナ見
出しでは、「inexpensive」を「エネックス〜」、「イ
ネックス〜」、「イニックス〜」とするか、「enhancem
ent」を「エンハンス〜」、「インハンス〜」とする
か、「apple」を「アップル」、「エプル」とするか
は、聞こえた利用者の勝手であり、考えられる全てを想
定することすら難しい。また、「エプル」を非常識だと
排除することを利用者に強制することも宜しくない。一
意に決まらない指定が想定される索引の方式自身優れた
方式とは言えない。ここで、少し補足します。母音の中
でも「イ」は、一見曖昧で無い発音のケースが多く、他
の母音から区別しても良さそうな雰囲気がありますが、
上記例で分かる如く「エ」と区別が付きにくい。よっ
て、全ての母音は「A」と代表表記するのが良い。
【0013】・付随的に、外国語(英語)には良く似た発
音の単語が沢山あり、正しく発音をしないと外国人には
伝わらない、彼らはそれらの紛らわしい発音を正しく使
い分けて生活している、との認識を一般常識として高め
させる教育的効果があること。カナ見出し方式は、50
音Sort順に並んでいる。すると、例えば、「You, fire
(おまえは、クビだ)」を聞き間違えて「You, hire(おま
えを、雇う)」と聞こえたとき、「ファイ」と「ハイ」
は、同じハ行だとしても、だいぶ離れた所に記載されて
いるハズであり、聞き間違えているカモ、ということす
ら頭に浮かばないだろう。
【0014】・発音をキーとする単語の索引一覧におい
て、同じ単語を異なる場所に重複して記載しなくても良
い新しい観点からの単語配置の方式を確立すること。異
なる場所に重複して配置することは、そのことを知らし
めることには役立つかもしれないが(少々疑問)、紙の無
駄でもある。また、そのような結果となる方式は方式自
身に問題があると云える。
【0015】・また、その索引が、カナをベースとする
索引の様な教育関係者側から受け入れ難いものではな
く、容易に、現在の日本あるいは世界の英語教育界にも
受け入れられる形態のものであること。例えば、アイウ
エオは、日本だけである、英語圏は、少なくとも、AE
IOUである。
【0016】・また、教育的学習効果の観点から、その
索引の配列は、易しい単語から難しい単語へとモレなく
段階的に並んでいることが好ましいこと。現在の配列
は、単に、アルファベット順あるいはアイウエオ順に並
んでいるに過ぎない。
【0017】・そして、発音ベースの索引により、外国
語(英語)教育のレベルアップを図ること。例えば、大前
研一曰く、日本の現在のTOEIC,TOEFLの英語技能検定結
果のレベルは、世界の29位であり、なんと、あの閉鎖
的な北朝鮮(失礼!!)と肩を並べているとのこと(2001年0
3月のTVより)。この状況を打開する必要がある。本発明
は、若い人達が生きた外国語(英語)を効率良く習得し、
国際人として育つことへの少しの貢献をも願うものであ
る。
【0018】
【発明の目的】高速化 操作性向上 生産性向上 「ア」だか「エ」だか「オ」...だか分からない発音
は、「みんな"母音"で、イイヤ」と、抽象化して、取り
扱う。他の曖昧な良く似た発音も、同様に取り扱う。こ
の発音記号の抽象化(仮想化)により、単語群を抽象化さ
れた発音記号をキーにして、系統的に分類する。このこ
とにより、全ての単語の発音は、抽象化された発音記号
文字列の1つに、ほぼ一意にmappingされる。このこと
より、高速・高操作性・高生産性のある発音単語検索機
構を得る。すなわち、原単語の発音から、発音索引の見
出しは、一意に決まる。その見出しの中に必ず原単語は
含まれている。高速な見出し発見、該当単語の局所化さ
れた配置から得る高速操作、良く似た意味の異なる単語
の存在の認知、発音・アクセントの重要性の理解、voca
bularyの効率良い増加の支援、による高生産性を得る。
また、高生産性のある効果的語学教育を支援する。すな
わち、短い発音の単語から長いものへと並んでいること
による学習のし易さ、理解度の深さが期待できる 。
【0019】
【課題を解決するための手段】従来の発音記号による
(英)単語の発音表記において、(日本人にとって、)音感
の近いものを同一視して取り扱う。具体的には、母音は
全て同じとマクロ的にとらえる。また、子音について
も、状況によっては同一に聞こえるものは同一視して扱
う。このために、拡張発音記号という抽象化手段を導入
する。図1のの上の枠の中の分類サンプル、および図
5(フィルターというサングラスを通し、従来発音記号
を見るという概念図、尚、図5では、従来の最もオーソ
ドックスな発音記号と、コンピュータ処理向けに公開さ
れているThe Carnegie Mellon University Pronouncing
Dictionaryにて使用されている発音記号と、の対応を
も参考として示した。また、CMU発音辞典は、後半の説
明の統計値調査のためにも活用した)参照。
【0020】そして、これらの仮想の発音グループに従
い実際の(英)単語を分類・並び換えをする。この際、拡
張発音見出し単位に、仮想の発音文字列の短いものの順
に配列させる手段を持つ。現在の英和あるいは英英辞典
あるいは国語辞典の様に1つの文字に着目し、それを含
む文字列のtreeを深追いする様な発音配列手段は、あい
まいな発音を含む言語に対する発音索引方式としては適
していない、とみなす。図1の〜、および、、お
よび図6参照。
【0021】次に、上記手段によると、拡張発音文字列
が同一の綴りの異なる(英)単語群グループが発生し得
る、これらの競合する(現実の)(英)単語要素を、そのグ
ループ内で、何らかの規約(ex.音感の近い順)に基付きS
ort(並び替え)を行う手段を持つ。図1の、参照。
【0022】
【作用(効果をもたらすための手段の働き)】本方式に
よると、図1の集合定義例の如く、全ての母音と母音と
音感が近いw「ワ行、特に、固いウ」とj「ヤ行、特に、
固いイ」とは、拡張母音記号「A」として一括して扱わ
れ、良く似た紛らわしい拡張母音発音の(英)単語は物理
的に隣接して索引に記載される。そのため、よりHit率
の高い、高速な検索が可能となる。また、同様に、子音
の発音に対しても、音感の近い発音を同一視しているた
め、発音の近いものは近くに配置され、高速な検索を可
能とする。図1に、同一視した発音記号の例を記載して
いますが、「bとv」、「lとr」を同一視することは、カ
タカナ表記のケースにおいて日本にほぼ定着していま
す。しかし、本発明では、さらに「thの濁音の破擦音」
を、「d」の親戚、また「濁音でないth」の発音は、「s
とtと」の親戚(中間)とみなし、「s」および「t」の両
方の要素として扱います。この扱いは、経験的私見によ
りますが、それなりの根拠があるものとして設定したも
のです。例えば、thの濁音ですが、これは従来の日本の
英語教育での「ザ、破擦音」であるとの見解と異なりま
す。この発音は、その発音記号の形からして、濁音はd
をベースにその発音記号が作られていること、native s
peakerの発音を聴く限り、この私感は話手によります
が、ある程度正しいです。thatもdatと発音してしまっ
て通じます。また、one,two,treeとしばしば聞えます。
thausandなどは、100%「t」に聞こえます。つまり、th
はそのスペルからして「t」の変形であると云っても過
言ではありません。特に、勢いを持った強い発音のth
は、必然的に「t」に近くなります。「s」には近くなり
ません。さらに、「ング」と「ンク」と「m」の発音記
号を「n」の親戚、「dとzとヂ関連」を一括して「d」の
親戚として扱います。「v」、「thの発音」、「f」は、
歯に唇あるいは、舌を当てるという意味において(これ
は、日本語の様な発音の発想には無い)、「b」、「dあ
るいはsあるいはt」、「h」の発音から派生したものと
の根拠を同一化のベースにしています(例えば、「f」
は、「ph」のスペルの発音として使用されるという事実
も「h」の親戚を物語っています)。また、発音記号
「m」の音感は、「m+子音」は、「mpやmb」のスペルは
存在するが、「npやnb」のスペルは存在せず、もし存在
したとしてもその発音はし難く、「m」は、それらを代
替するものだと考えます。さらに、「m+母音」や「m」
自身の音感も、「n+母音」や「n自身」に近いため、
「m」は「n」の親戚2ニするに充分な論理的根拠があると
考えます。但し、「f」は、「h」に代表させても良いの
ですが、苦痛を感じる人がいる(私もその一人)と思われ
るので、この場合では、強引な同一視化はしません。そ
の代わりに(FH)という表記法を導入・適用しています
(図7参照)。そして、この発音記号の仮想同一化(ある
いは、オリジナル発音に帰属させる、との概念)という
手段によって、よりnative speakerのニュアンスを得る
と同時に、状況により紛らしい発音を無理が無い一意に
決まる代表拡張記号での表記で代表することが出来ま
す。
【0023】さらに、(拡張)発音文字列の長さが短いも
の順に索引を並べるという、辞書の横割配置手段によ
り、見出しの順序を一意に決め、さらに、先生や生徒に
とってvocabularyの習得のレベルを段階的に計画性を持
って学習・認知することができます。そして、この「拡
張発音記号」を「見出し」とする並べ方は、前にも述べ
ましたが、ほんの少しの違いで全く意味の異なるものと
なるものの存在を実感することができます。発音の重要
性・アクセントの重要性をも認識できるでしょう。そし
て、良く似た発音の単語は、物理的に近くに配置される
結果となるという特徴は、複数の発音が想定される単語
を物理的に異なる場所に重複して配置する必要を削減さ
せ、従来のカナ見出し方式の欠点をカバーし、紙面の有
効利用も図ります。これに関連して、見出しとして、拡
張発音文字列を採用する場合、通常、先頭文字を最も大
きいグルーピングの単位とすることが考えられますが、
その際、「F」と「H」、および、「S」と「T」は、それ
ぞれ「(FH)」および「(ST)」の見出し[F or Hの何れか
1文字、S or Tの何れか1文字を指すの意]を設定し、
同一グループにしてしまうことにします。また、サブ拡
張発音見出しにも適用します。この手段により、重複配
置をさらに減少させます。例えば、「fire」と「hire」
という単語のスペルは、殆ど似ており、発音も似ていま
す。しかし、動詞の意味は全く逆で「クビにする」と
「雇う」であり、この工夫[ つまり、「(FH)A」という
見出しの設定 ]により、隣接されて配置され、教育的効
果を生みます。また、「(ST)」の見出しを設定すること
で、「Θ」の発音を含む英単語も重複して異なる場所に
2回記述することをケースにより回避できます。また、
例えば、questionとnationとは、供に終わりがtionです
が、「チァン(stの並びのcaseです)」、「シァン」と発
音します。また、pinchの場合、最後の「チ」が「シ
ュ」と発音記号上「t」が省略されるケースもありま
す。この様に、「S」と「T」は、アルファベットで隣合
わせであるが如く、発音でも近い関係にあります(日本
語もアカサタナと「サ」と「タ」は、隣にあります、こ
れは偶然でしょうか?)。しかし、「F」や「H」、「S」
や「T」の拡張発音記号を単独で指定することも、支障
がないケースで、当然行います。
【0024】本方式の桁順配列手段は、従来の辞書の単
語をグローバルに横断的に舐め回した結果として、発音
を前面に出した索引であり、いわいるシソーラス(thesa
urus)の意味論的観点からの分類化ではありません。そ
の索引結果は、本当に良く似た発音の単語がほぼ隣接さ
れ、あたかも、ブレーンストーミングをしている様な所
があり、とまどうかも知れません。従って、教える側の
先生方は、その紛らわしい発音を正しく区別して発音出
来ないかも知れない、苦痛を伴うかも知れません。しか
し、生きた英語教育のレベルアップのためには、現実を
直視し、そのハードルをクリアする必要があります。そ
して、このことは、見方を変えると、先生方および生徒
にとって、本方式による索引は、vocabulary習得の飛躍
的スキルアップをもたらす学習教材になり得ると考えま
す。
【0025】
【発明の実施の形態】請求項1、2の説明で、本発明の
動作および特徴は、述べられてしまっています。ほぼ、
同じ事柄を図1として、英語を例にとり、解説を付けま
した。内容的には、何ら難しいことは云っていません。
一読すれば、理解できるはずので、簡単な解説のみ加え
ます。なお、請求項3は、請求項1、2の応用技術(副
産物)であり、本「発明の実施の形態」の項目では、一
番最後のパラグラフに解説するものとします。従いまし
て、以下の解説のメインは、請求項1、2の索引作成に
関するものであることをご承知おき下さい。
【0026】最初に、請求項1の拡張発音記号の索引の
作り方を解説します。 図1-で、拡張発音記号の定義
をしています。集合名と拡張発音記号とを同一視してい
ますが、これは方便です。実際の現在の発音記号をどの
集合に入れるべきかは、大きな決断ですが、ほぼこの例
で支障はないと考えています、しかし、最終結果ではあ
りません、あくまで、参考例です。また、小括弧してあ
る「W」と「Y」は、拡張母音の中に重複していますが、
これは、見出しとして設定するか否かは、どちらでも良
いの意味です。重複して見出しとしても、該当英単語の
数は少ないので、大きな影響は与えません。拡張発音記
号とは、実際の発音記号にフィルター(サングラス)を掛
けて得られた、より抽象化した発音記号だと解釈して下
さい。また、フィルターの概念図である図5も参照のこ
と。このフィルターとは、耳の遠いご老人だと考えて下
さっても結構です。利用者は、実際の発音記号を見て、
あるいは、発音を聴いて、この拡張発音記号に変換する
訓練が当初必要でしょう。しかし、全く難しくは無いと
思います。図9に拡張発音記号化の練習問題のサンプル
を付けました、興味のある方はtryしてみて下さい。
【0027】次に、図1−、、、で述べてい
る、拡張発音記号ベースでの英単語の(アルファベット
準拠順)グループ分け処理を行い、拡張発音を見出しの
単位にし、桁数を深さにした英単語の下方向のtreeを構
築します。次に、図1-にある、同一綴りの拡張発音
になってしまった英単語群の競合を解決する必要があり
ます。つまり、これら英単語間の最終の並びを何らかの
秩序に従って決める必要があります。通常は、拡張子音
に着目し、昇順に並べ、その後、子音を固定化した条件
下の範囲内で拡張母音に関し、昇順に並べる様なやり方
があるでしょう。図1-の下の単語群の並びは、この
やり方でSortした結果です。また、図2、図7、図8の
サンプルの並び規則の骨子もこのやり方に従っていま
す。
【0028】最後に図1-、で、2次元のtree構造
を強引に索引として、1次元化します。このやり方は、
請求項2の本発明の特徴として、桁数の順に1列化させ
ます。このことにより、多くのメリットを受けることが
出来ます。このSort法と従来のSort法の違いに関して
は、図1の最後で解説しています。また、サンプルを図
3等に記載しました。また、その結果の桁数と配置の従
来との比較図の概念図である図6も参照のこと。
【0029】ここでは、より具体化したこの索引の使い
方の分かり易い例を述べておきましょう。自分は、「コ
ーt」という発音を耳にし、その単語のスペルを知りた
い中学生だと仮定しましょう。彼は、本発明の索引を前
にして、まず、「コーt」は、拡張発音表記だと、「KA
T」になるな、と頭の中で思考する必要があります(この
一意に、拡張発音列を決められるという性質は、非常に
重要です)。そして、先頭が「K」の見出し群の中の、さ
らに、3桁の中見出し「KAT」を探します。この索引の
母音は、AEIOU順で、しかも、大元の母音の発音は
「コ:ko」の「O」なので、「KAT」の中でも、後ろから
攻めた方がイイカモとも考えるか知れません(この子は
賢い)。しかし、実際には、「KAT」の要素は高が知れて
おり、がっかりするかもしれません。そして、彼は、co
at(外套)とcaught(catchのp/pp)とcourt(裁判所・中庭)
等があることを知るでしょう。また、catやcart(手押し
車)やcutやkit(組み立て用品一式)やkite(凧)のような
日本語化してしまっている単語もその中に含まれている
ことを学ぶでしょう。この様に、ある発音の拡張発音列
が決まれば(子音の音を間違えていないとすれば)、欲し
い単語は必ずそのグループの中に絶対にあります。ここ
の所も、非常に重要です。もし、欲しい単語がそのグル
ープの中になかったとしたら、それは、辞書の作成者の
ミスか、あるいは、他の何かの特殊な事情に起因しま
す。1つ注意をしておきましょう、例えばcancelという
単語の拡張発音は、辞書ベースでは「KANSL」です。「K
ANSAL」では無いです(日本に定着してしまっているカタ
カナ言葉は良くないですね)。もし、「KANSAL」と聞こ
えてしまい、見つからなかった場合、「KANSL」かも知
れないと感じて下さい。もう1つ、例を引きましょう。
businessは、「ビジネス」だから「BADANAS」と思った
ら、大間違いです。BADANIS[ボウダニス:地名か人名?]
しか該当単語がありません。オカシイ…。「ビズネス」
の「BADNAS」の中にありました。これには、私も参りま
した。「ズーズ弁の英語発音の方が正しい」。しかも、
辞書によると「ビズナス」「ビズニス」が主流。「ビジ
ナェス or ビズヌァス」とあったのは、日本の最近の辞
書のみ。語源、綴りがbusy+nessでも、発音はそうなら
ないのですね、「ビジネスライク」も本当は、「ビズニ
スライク」となりますね。この例は、まさに、「カタカ
ナ言葉」の弊害の典型と云えます。
【0030】もう1つの例をしましょう。マドンナの曲
に「discipline(鍛錬、規律、・・の意)」というヨガ
(発音は完全に「用賀」と聞こえる)の歌があります。私
は、この題名をラジオで聞きました。そして、手帳に
「デシプリン」とメモをし、後で、英語辞典で探しまし
た。しかし、なかなか見つかりませんでした。単語自身
は記憶にある知っている単語にも係わらず、スゴイ時間
が掛かってしまいました。最終的には、「D」の欄を前
から全てナメテ発見しました。本発明によると、「DASA
PLAN」の見出しの中の固まった単語群の中に絶対存在し
ます。「de〜」か「di〜」など気にしなくて良い。「カ
ナ見出し」方式では、「デ」と「ディ」で2回引く必要
があるかも知れません。私の辞書の調査によると、「DA
SAPLAN」に該当する単語は、なんと、「discipline」の
みでした。念のため「DASAPALAN」も調べました、これ
は、ゼロでした。「しそーらす(thesaurus)」の「SASAL
AS」を調べてみましょう。この単語は、人工知能の分野
で使用されます。かなり難しいスペルと云えます。これ
も、私の持っている辞書の中で該当するのは、この1件
のみであった。少し長い発音の単語は、該当数が急激に
減り、本発明の発音索引は、かなり有効な感触がありま
す。もう少し、短いものにしましょう「コラプt(corrup
t:ex.日本のdiplomatの1人が公私混同の極みで、不正
・堕落行為をした)」の「KALAPT」は、これも1つのみ
でした。似た発音に「KALAPS」のcollapseがありまし
た。これは、Indiaの大地震で多くの建物がcollapse(崩
壊・崩れる)した、の様にラジオで使われました。思う
に、corruptとcollapseは、供に「崩れる」の意を持ち
ます。案外、親戚の言葉カモ知れません。若い、私など
よりはるかに感受性豊かな次の世をになう人達が、本発
明の余りにも単純な概念を知り、それを実際に色々身を
もって活用するならば、多くのことを学ぶと思います。
そして、本発明を越える分類体系を確立してくれること
を希望します。
【0031】最後に、請求項2の補足を、さらにしてお
きます。文字列のSorting(並び替え)において、本発明
では、通常のSortingとは異なるものを採用していま
す。それは、あるグループの中の拡張発音文字列群を桁
数(文字数)の少ない順に、そしてその基でアルファベト
準拠順(音感の近いことも配慮する)にSortingをさせる
ことを、1つの特徴として歌っています。この桁数の昇
順の並べ方は、番号(数値である、文字列ではない)の並
べ方と同じです。番号が書いてあるカードがあり、それ
らのカードを番号順に昇順に並べなさい、ということに
相当します。なんら難しいことを云ってはいません。し
かし、番号ではなく、文字列となると通常のSorting機
能は、このようにはしてくれません。例えば、1から200
までの数字の文字列を単純にSortingすると、
【0032】1,10,11,..,19,100,101,102,..,199,2,20,
21, ..となり、先頭のみを優先し、桁数を無視した予想
と異なる配置となることを理解して下さい。従って、現
状レベルのSorting機能を活用するのであれば、桁数順
に並べたい文字列の先頭に数字の桁数を付与する等によ
り、回避実現できます。しかし、これは数字が9までの
ケースのみです。現実には、各文字列を表計算データの
レコードとし、そのレコードのフィールドに桁数の欄を
設け、それをキーにしてSortingする方法が考えられま
す。
【0033】また、実施例として、図2に、最も基本で
ある1桁拡張発音「A」の通常の英語辞典での結果の英
単語とその発音記号を記載しましたが、結果は、そんな
に数が多くないことが分かるでしょう。この事実の認識
も意義があるでしょう。しかし、後で細かい数字を出し
ますが、約12万5千単語登録されているCMU(カー
ネギー・メロン・大学)発音辞典を私が調査した結果
は、「A」は、224件ありました。
【0034】図3、図7、図8に、2桁、3桁の拡張発
音に該当する英単語のサンプルを記載しました。図3で
は、該当英単語のみを、発音記号無しで、実際の発音ベ
ースのSortもせず、あえて、英語辞典の表示・出現順に
そのまま単語を並べました。この結果を見てみると分か
りますが、拡張発音記号分類の配置では、英単語群をそ
の数が、程好く許容範囲内でグルーピングされているこ
とが分かります。コンピュータ用語で表現すると、適度
なhash効果を持つ様な感触があります。これは、非常に
好ましい性質です。図7は、拡張発音「F」と「H」とを
並記、図8は、「S」と「T」と並記する工夫として発案
した拡張発音記号の選択表記記号を用いた見出しを適用
し、発音記号無しで、音感の近いものを隣接させる並べ
替えを実施した例です。発音記号の付加情報が無くと
も、スペルおよび発音がそっくりなものが並んでいるこ
とが実感できます。選択表記機能の有効性を証明するサ
ンプルと云えます。また、同一見出しの中の競合する実
単語の並べ方も、実際やってみると分かりますが、ある
種の規則性があります。紛らわしいものを隣接させる様
にしますが、母音が紛らわしいケースは、子音を固定さ
せて攻めます。子音が紛らわしいケースは、母音を固定
させて攻めます。Case by caseでやるのが良いかも知れ
ません。図8のサンプルは、そういう思考錯誤の結果例
です。もっとbetterな並べ方法則があるかも知れませ
ん。
【0035】また、英語辞書の順番のままでも充分利用
価値があることが分かります。さらに、極端なことを云
うと、索引としては、図3の如く見出し(大なり、小な
り記号で囲まれた見出しを指す)があれば、英単語自身
には、発音記号の情報が無くても、充分実用に耐えるだ
けの利用価値がある様な気もします。これは、簡易の索
引として役立ちます。例えば、図3、7、8には、実際
の発音記号を付けていません、しかし、高校生位の英語
力があれば、拡張発音記号見出しと、秩序性のある実単
語の並びを見れば、実際の発音の大半は、類推出来てし
まうでしょう(秩序性を見ぬく位の力がある、あるい
は、この索引を使ってその力を身に付けたらば、との前
提ですが)。
【0036】また、変化例を、以下に、幾つか述べて置
きます。上記請求項1の発音記号と拡張発音記号とのma
pping例として、「f」を「h」と同列とすることも、少
々異論が考えられますが、充分考えられるでしょう。同
様に、本発明例「ch」の「チ」の発音を「T」に含めて
いますが、当初は「C」として独立化していました、そ
のような変化も考えられるでしょう。しかしながら、こ
れらの変形は、拡張発音の選択表記機能により、当初の
意図は弊害無く達せられる様になりました。その点から
見ると、「M」を「N」から分けるべきかも知れませ
ん。選択表記機能の適用は、拡張発音記号のアルファベ
ットの物理的位置が隣接あるいは非常に近い場合、利用
価値が高く、従来のアルファベット順配置の延長線上に
あり、受け入れ易く、弊害が少ないです。この点からも
「M」を「N」から独立させても良いと云えます。しか
し、私は「M」を「N」の構成要素にすることになんら抵
抗を感じません。さらに、補足します。「ch」ですが、
これは、「t+母音」の外人の発音が「ch」に聞こえるca
seがザラにあります。One, two, threeのtwoを米国人の
女性は、次のthreeも含めて、調子に乗って「tju」ある
いは、「chu」と云ってしまう感触があります。また、
日本でも、teamをカタカナ言葉で「チーム」とカナを振
っています。これは、本当は誤りです。Teamを「ティ
ム」と発音する外人もいます。みんな、イイカゲンで
す。従って、「ch」は、「T」に入れるのが無難との私
の結論です。
【0037】また、上記実施例では、拡張発音記号列の
先頭文字を第1キーに、桁数を第2キーにした説明をし
ましたが、第1キーを桁数にしてしまうことも可能で
す。これは、漢和辞典の総画数一覧表に似ています。さ
らに、例えば、桁数6位までは、桁数を第1キーにし
て、同一桁数のAからYまでの該当単語を集め一望できる
様にし(つまり、1桁の「A」、2桁の「AB」から「YY」
まで、3桁の「ABA」から「YYY」まで、…と云った具合
に並べる)、桁数7からは先頭文字をキーとした上記説
明の形の索引の並びとする、なども、教育的観点からは
良いかも知れません。何故、この様なことをあえて記す
かは、個人的な印象ですが、英単語の先頭スペルのみが
異なり、残りのスペルは全く同じで、発音もそっくりと
云う単語が少なくないからです。この配置により、
「A」から「Y」迄のそっくりな英単語が沢山存在するこ
とを認識するでしょう。そして、それらの英単語を効率
良く習得出来るでしょう。
【0038】さらに、拡張発音記号としてアルファベッ
ト文字を例として割り当てましたが、これは方便です。
カナ(但し、国内限定)も含め、対応言語にふさわしい、
より効果のある記号で良いです。また、索引の英単語の
付帯情報に関しても、特に本発明では規定しません、与
えられた条件の環境の下で、適宜、実利のある情報を付
加して下されば結構です。また、従来の英語の発音記号
として、日本の英語辞書にある通常の発音記号を例に取
り解説しましたが、米国の辞書に使われている一般的な
発音記号である「ファネティック記号(phonetic symbo
l)」に対しても、容易に拡張発音記号とのmapping化が
可能です。印象ですが、phonetic記号の方が、通常の発
音記号より、綴りと発音記号とを対応付けているので、
教育的効果が大きく、もっと国内に定着させるべきかも
知れません。しかし、Microsoft co.のComputer Dictio
naryには、読み方が分からない単語に発音を付けていま
すが、その記号は、日本の従来発音記号と米国のphonet
ic記号のチャンポンのものでした(イイカゲンとも云え
ます、Microsoftは、両者のイイトコドリを勝手に自分
で定義して使用しています。これは、悪いことでは無い
と感じました)。本発明は、余り細かい所までは規定し
ません。本発明の請求範囲は、もっと上位のレベルのグ
ループ化の概念にあります。
【0039】また、電子化への変化(応用)例を述べまし
ょう。本発明の電子化応用は、非常に沢山のことが容易
に考えられます。拡張発音記号から該当する英単語を得
る装置として、ワープロ機能の英文スペルチェッカーを
想定するも良い。すなわち、ワザと拡張発音記号(母音
省略を含む)に順ずる記号を記入し、スペルチェッカー
の対象誤り単語とし、さらにそのことを配慮したスペル
チェッカーにより、考えられる修正英単語一覧を提示し
てもらう様にするニュアンスのスペルチェッカーの機能
を指します。本機能の実現は容易にできると察する。つ
まり、現在のスペルチェッカーの対象誤り綴りの一覧あ
るいは誤り綴りを見つけるロジックの中に、拡張発音記
号による文字列を追加し、その修正後の単語候補一覧の
中に、拡張発音記号対応の元の単語群を追加するだけで
良い。これは、スペルチェッカーのsoftwareの機能強化
に相当します。 例えば、1つの例ですが、先頭が「qq」
のついた単語は、その後は、拡張発音表記が指定される
と解釈すると云うような規約を設ける事とし、スペルチ
ェッカーは、拡張発音記号に該当する単語一覧を表示す
る様にすれば、現在のスペルチェッカーの大きな機能強
化の目玉となり、そのメーカのスペルチェッカーは、sh
areを伸ばすでしょう。先頭を例として「qq」としまし
たが、それは、qqを含む通常の英単語が1つも実在しな
いため、特殊な指示だと云うことが分かるからです。大
きな意味は無いです。蛇足ですが、「q」のキーボード
のボタンは、アルファベットのボタンの一番左上にあり
ます。その意味でも、「qq」は良いかも知れません。さ
らに蛇足ですが、「z」のボタンは、一番左下です。個
人的には「z」は、ワイルドカード用ボタンとして確保
しておきたい。
【0040】同様な、即、実現可能で、しかもメーカが
関与しない既存技術への本発明の電子化の変化(応用)例
について触れます。それは、日本語FEP機能のユーザに
よる「単語登録」機能において、拡張発音表記列に順ず
る文字列を実際の単語のスペル登録時の「読み」として
登録するという行為です。このとき、「読み」の先頭を
前述の如く「qq」を設定するのも良い。FEP機能に対す
るこの行為は、そのFEPメーカが作ったsoftwareに対す
る、ユーザ(購入者/利用者)としての行為であり、メー
カがsoftwareのユーザに対して許した範囲内の全く問題
の無い行為です。この行為により、本発明の電子化技術
への応用の1つの実現が簡単に達成出来ます。1個人が
本発明の「拡張発音表記」という概念の存在を知り、そ
の便利さを実感し、前述の行為をしたとき、それは、本
発明に対する特許法に従うことになるのかも知れませ
ん。発案者である私個人としては、「金銭の授受を伴わ
ない、本発明内容の知恵の授受行為は、多いに結構」と
なることを望んでいます。知恵は、万民に平等に与えら
れている(デカルト・方法序説)ものであり、隠すもので
はなく、世の中に、contributeすべきものと考えます。
大昔、ピタゴラス学派という人々がいまして、ピタゴラ
スの定理を門外不出なものとしました。しかし、今で
は、中学でピタゴラスの定理は、教えられています。ま
た、本発明の内容は、人様に隠すような内容ではありま
せん。単純過ぎて、少し恥ずかしい位です。しかし逆
に、案外、良い発明とは、本発明の様なものを指すのか
も知れません。
【0041】さらに同様な電子化応用例を述べます。そ
れは、拡張発音記号による単語群のグルーピング化の
(電子)表示技術および検索および引用についてです。メ
ーカの固有名詞を出して例を説明したい。パソコンのOS
のファイル管理に属するToolとして、ファイルに関する
softwareがあります。ユーザは、自分の作ったfileに自
分の好きな名前を付けたり、また、それらのfile群を1
つのグループとして、好きな名前を付けたfolderを作成
し、その配下に関係file群を置き、fileを階層化して管
理できます、また、その配置結果を表示することが標準
機能として提供されています。例えば、Microsoft co.
のOSであるMS-WindowsのそのTool名は、「Explorer」で
す。Explorerに対し、そのfolderやfileとして本発明内
容の拡張発音表記に順ずる名前や英単語の名前を付ける
行為を英語辞書の単語に関して行うと、本発明の図1の
tree構造に順ずる階層構造の可視化された索引(Index)
が電子装置上に具現化できます。この場合、深さを持つ
2次元の構造であり、通常の1次元のindexよりは、は
るかに使い勝手が良いIndexだと云えます。そして、表
示は通常、アルファベット順や作成時間順等に従って表
示を変更することが、Explorerの場合サポートされてい
ます。しかし、本発明の請求項2である桁数順の表示
も、桁数のfolderを中間層に作成することにより間接的
に実現可能です。このとき、最終的なtree構造の終端を
folderとするか、fileとするか、さらにfileとした場
合、そのfile名を拡張発音記号の見出し名とするか、あ
るいは、実際の単語名とするか等の色々な変化が考えら
れます。終端をfileとし、かつ、拡張発音の見出し名を
付けた場合、そのfileのdata内容として単語名やその付
帯情報の一覧を並べることになります。このとき、その
並びを音感順に並べるには、多くの時間が掛かるので、
そこまでやる人はいないかも知れません。しかし、いず
れにせよ、英語辞書とパソコンを持っている人ならば、
やる気になれば、辞書1冊分位の拡張発音記号による単
語分類をExplorerに対して本発明のレベルでmappingをf
olderとfileに対して行うことは忍耐力と時間を掛けれ
ば、なんら苦労無しに機械的に実現可能と思われます。
そして、この電子的indexは、発音indexとして充分役に
立つでしょう。この様なfolderやfileを作る行為、およ
び、それを配布する行為、および、その知的所有権の扱
いは、前述の日本語FEPに対する単語登録の行為と同様
です。そしてこれら、既存softwareを利用した本発明の
電子化の適用は、softwareの流用技術であり、むしろ、
賢くて、最も効率の良いsoftware開発手段と云えること
を付け加えておきます。ゼロからsoftwareを開発するこ
とは、客観的に見て、開発工数、品質、開発費等の観点
からも、賢くないです。従来技術として参照した先願発
明例1の「カナ見出しによる索引」には、この様な変化
例が容易に構築出きることが述べられていませんが、実
際には、その電子化の実現方法の1つとして、本発明と
同様に実施され得ます。さらに補足すると、Explorerに
は、検索機能が当然のこととして備わっています。ユー
ザは、その機能を使用し、色々な探索(explore)をする
ことができます。そして、この標準の検索機能は、現時
点で存在する単独のいわいる電子辞書の機能をはるかに
しのいでいると云っても良いです。特に、云っておきま
すが、キーボード入力の電子辞書が現状では殆どです
が、これに関し疑問をお持ちの方は少ないかも知れませ
ん。しかし、これは、本来の姿では無いと認識すべきで
す。つまり、まだ、すこぶる低レベルの異常な姿だと云
えます。例えば、Internetで米国のweb siteを見てい
て、不明な英単語に遭遇し、それを調べる際、何ゆえ
に、手による入力をする必要がありましょうか。それ
は、無駄というものです。少なくとも、マウス操作のみ
で可能であるべきであり、今述べたExplorer上の辞書で
さえ、OS標準の「copy & paste機能」を介し、容易にそ
れが可能です。また、蛇足ですが、Intelの技術者は、1
990頃、次の予言し、Intelの技術レベルの高さを自慢し
ました。「10年後の21世紀justには、パソコンは、Palm
Top(手のひらの上)がもう主流になっている。しかも、
その電源は、手のひらの熱によるものだ」と。この予言
は、1/4位当たっていた、と言えるでしょう。私も、予
言しましょう、「Palm TopのPCが本格化すれば、現在
の、いわゆる単独の電子辞書装置は、無くなり、PC上で
動く、電子辞書softwareが主流になると。何故なら、PC
の方がそのCPU性能が何十倍も速く、さらに、既に、同
じことを色々なメーカが独自に開発する様な時代では無
く、その辞書技術の乱れのベクトルを合わす為の標準化
の動きが出てくるでしょう」と。本発明は、単語分類の
新しい視点を与えている、そして、分類法の標準化関
し、新しい流れを作るベースとなる可能性を秘めてお
り、その世界標準化のトリガとなるカモ知れません。さ
らに蛇足ですが、MicrosoftのExplorerには、非常識な
仕様があります。それは、file名やfolder名を定義者の
意志に反し、勝手に大文字・小文字を修正してしまいま
す。Microsoftのセンスの無さを端的に表わしていま
す。この様な認識も必要です。ここでは、Explorerを引
き合いに出して説明しましたが、一般の表計算ソフトを
使用しても、ほぼ同様あるいは、より高度な辞書管理が
実現できます。例えば、「見出し」は、range nameとし
て各々定義する等を行うと、より人間にやさしいoperat
ion interfaceが実現出来ます。また、蛇足ですが、Mic
rosoftの表計算ソフトであるExcelでは、range名には、
使用可能な文字記号に関し、#を含む多くの特殊記号が
使用できないという非常にキツイ制限があります、ま
た、性能についても、他のメーカとは異なる特徴がある
等、の事実も把握しておく必要があるでしょう。
【0042】本発明から容易に推論される変化例の最後
として、カナ発音について触れておきましょう。本発明
では、「カナ発音は外国語の発音を記述するには現状レ
ベルのものは欠陥がある」旨のことを述べました。この
命題から、容易に推論できる命題としては、「もし、そ
うなら、外国語の発音に向くカナ表記を作れば良いでは
ないか」があります。この推論は、オカシイ(飛躍し過
ぎ)と言う人がいるかも知れません。発案者の私は、そ
うは思いません。少し、感性のある人なら感ずるハズで
す。また、この発想は、反対語(対偶)を思い浮かべるの
と同じ思考過程に似ており、容易に発想されます。この
カナ表記の改善は、単語の付帯情報としての発音記号に
使用しても良いでしょう。英語発音に対するカナ表記の
改善例を示します。A)「eの180度回転した母音発音記号
対応は、カナの右横に、半角アルファベットのtildeマ
ーク『~』を付ける。また、この長母音は、パのハを除
いた丸マークの『゜』を用いて『ー゜』と表記」、B)
「aとeの背中合せの母音発音記号対応は、カナの右横
に、パのハを除いた丸マークの『゜』を付ける。但し、
対象のカナが、『ハ』の場合は、『ハァ゜』とする」、
C)「Aの横棒が無い母音発音記号対応は、カナの右横に
半角アルファベットのhatマーク『^』を付ける」、D)
「f, r, v, thの子音発音対応のカナには、左横に半角
アルファベットの右下がり上点(grave)マーク『`』を付
ける」、E)「また、必要に応じて、アルファベットを混
ぜる。さらに、A)からC)右上のマークを付けた『ア』や
『ヤ』を明示的に付加しても良いとする」。とりあえ
ず、このA)〜E)の5つの規約を設ける。但し、状況に応
じて付けるものであり、見苦しいケースやしつこいケー
スは、強制はしない。新しい、文字を作るには、多くの
時間と現在のものとの共存性との観点から、多くの困難
が生ずる。ここでの定義例は、気まぐれでの結果ではな
い。それなりの思考と多くの例を試した上での、許容範
囲内と思われる私の帰結である。使用サンプルを示す。
Girlは、ガー゜ル(、ガ~ール、ガァ~ールも良しとす
る)。Pearlは、パー゜ル(、パ~ール、パァ~ールも良し
とする)。Centerは、センタ~、センタ。airは、エァ~、
エァ。Catは、キャ゜ッt、キャッt。handは、ハァ゜ン
d。Cutは、カ^ッt、カァ^t、カッt。Randomは、`ランダ
~ム、`ランダァ~ム、`ランダム。Foodsは、`フーズ、Wh
o'sは、フーズ。Otherは、ア^`ザ~、ア^`ダ~、ア`ザ。V
anは、`バ゜ン、`バァ゜ン、ヴ3@゜ン、ヴァン。Think
は、`シンク、`シンk。Thoughtは、`ソーt。Sortは、ソ
ーt、ソォァ~t。の様になります。より簡潔で、通常のJ
IS codeの範囲で実施可能なものがあれば、どなたか、
その改善をさらに挑戦すると良いと思います(多分、無
理の様な気が個人的にはしますが、∵キーボードのバイ
が非常に限られていますので、これよりもBetterな解を
捜すのは難しい、と思う)。この日本語の改善は、カタ
カナの英語発音の忠実な反映を試みるものとして、皆の
知恵を出し合い、解決する必要があるべきだと考えま
す。そもそも、JIS codeの中に、発音記号が含まれてい
ないこと自身、日本の文部省や通産省の怠慢を非難した
い。また、英語および国語関係者の影響力不足と、先見
性のある人材がいないこと、を非難したい。Unicodeの
中に、発音記号は、含まれていますが、Sortした場合、
そのcode番号の並びは、統一性が取れているかは、cord
表を見る限り、疑問です。つまり、Sortしてもアルファ
ベットに準じる並びとは限らないない。もう、手遅れだ
と云えます。終わってしまったことをギャアギャア云っ
ても、後の祭りです。本件に関し、蛇足でですが、重要
と思われる観察結果を述べておく、それは、catのカナ
が、「キャット」となる現象である。これは、非常に不
可解である。何故なら、元の「ア」と「エ」の背中合せ
の発音記号には、「イ」の要素が全く無いにも係わら
ず、「キ」という「イ」を含むものと、「ャ」というこ
れも「ィア」に近いものの合成の組み合せが、何ゆえca
tに近くなるのか、非常に不思議でならない。どなた
か、この辺の所も含めて研究して下さることを期待した
い。もう、こうなると、一種の学問の分野になってしま
う。それらの、研究結果を踏まえ、カナ表記による発音
記号の最も自然な表記法を確立して欲しい。さらに、関
連として、米国のCMU発音辞典の発音記号は、アとオの
長母音に関し表現が曖昧であり、少し問題があることを
付記しておきます。このパラグラフで述べた「カナ表記
の拡張」は、非常に重要なテーマですので、改めて、上
記に述べた表記例を図13として、参考に掲げておきま
す。また、この「カナ表記の拡張」提案は、本発明の変
化例として、暗黙的に、本発明に対する特許法の知的所
有権の配下に入る、のかも知れません。しかし、用心の
ため、請求項3と致しました。発案者の気持ちをお察し
下さい。
【0043】この様に、前述の実施例形態は本発明の好
適な実施の一例であり、これに限定されるものではな
く、変化例で述べた如く、本発明の要旨を逸脱しない範
囲内において種々の変形実施が可能と云えます。
【0044】
【発明の効果】本発明の概念により作成された紙を代表
とする媒体の1次元索引は、例えば、英和辞典や英英辞
典のもっともオーソドックスな付録として活用出来るで
しょう。また、独立化した書籍や電子辞書とし、さらに
より多くの付加情報を加え、学習教材としても活用出来
るでしょう。そして、その一覧は、短くて易しい発音も
のから長い発音の単語の順に配置されるため、計画的な
学習効果を得る教材として活用出来るでしょう。以上の
説明のとおり、本発明により、現在の英和辞典や英英辞
典は、さらに付加価値を高め、他の辞書との差別化を得
ることができ、辞書出版の出版社や電子辞書メーカに恩
恵をもたらすと同時に、当然のことながら、それを利用
する語学の先生、生徒、に恩恵をもたらします。さら
に、ラジオ等の英語放送を聴いてListeningの訓練をし
ている方が単語のスペルや意味を素早く入手するための
道具になります。また、本発明は、非常にシンプルな概
念をベースにしていますが、図2や図3を見れば分かる
様に、無理が無いグルーピング化に成功しています、ま
た、類似発音単語も無理無く習得できる教育的効果もあ
るといえます。そして、こんなにも良く似た発音の単語
があるなら、発音には注意しなければいけないな、とい
う気にもなり、非常に受け入れられ易い結果となってい
ます。従って、英語のみではなく、他の言語に対しても
その単純な概念が適用出来ると思われます。
【0045】カナ見出しの発音索引は、英語教育者に敬
遠されることが、容易に推定される。本発明には、それ
が無い。この意義は、大きい、教育の現場で活用され得
るものこそ、真にsurvive出来る正当な知恵だと思いま
す。また、少し失礼な表現ですが、カナ見出し方式は、
日本国内のみ通用し得るものであり、外国では、無能で
す。本方式には、その障害が無く、世界に通用するかも
知れません。
【0046】本発明の拡張発音記号表記は、一般の人で
も、簡単な規約を守る限り、実際の発音記号、あるい
は、話者の発音をベースにユニークに一意に記号化変換
できるという性質を備える世界に通用するものです。ち
なみに、カナ表記には、この性質は無い。例えば、「cu
t」の発音記号を見て、あるいは聴いて、ある人が「カ
ト」と素直に変換するかもしれない。例えば、米国のBu
sh政策の「Tax cut」のラジオを聞いて、「カト」と聞
こえてしまうかも知れない、また、そう発音する外人も
いるかもしれない。「カット」が常識であると期待し、
「カト」の見出しを作らないとするのは少し、酷の様な
気がします(日本国内の常識は、カタカナ単語に関し、
多くの間違いがあると考えた方が良い)。それに比し、
本方式は、少なくとも、話者の母音発音の曖昧性に関
し、100%近く対応可能な方式であり、色々な意味で
優れた所があると云えます。また、卑近な例を少ししま
しょう。Thank you. を「三九」と発音するのは、完全
に誤りである。ラジオを聞く限り「千九」あるいは、
「シンキュウ」、「スーサン九」である。Thの舌を歯に挟
んだ「三九」であろうが駄目かも知れません。日本人の
「三九」は、( I ) Sunk you. (sunk=sink「流し台、沈
める、落ち込む」の過去、過去分詞)に聞こえるそう
で、「感謝します」では無く、相手から見ると「おまえ
は、私を沈めた、ノカ?」と米国人は、笑っているそう
です。これは、本当の話です。大昔、小田急線の電車の
中で、ある外国人が、「新宿」のことを「チンチク、チ
ンチク」と云っていました。私は、心の中で「very goo
d」とささやきました。何故、この様なたとえ話を申し
たかと云いますと、日本の現状レベルが、客観的に見る
とそんなレベルであり、外人から見ると誤った発音をし
ていることすら、当の本人は気付いていない状況なのか
も知れない。日本人は、そのことを井の中の蛙で、理解
していない様な気がするからです。もっと、レベルを上
げる必要がある、とい云いたいのです。日本の学校の英
語教育なんて、全く駄目です、との現実を知るべきで
す。ついでに、文部省のアホ(私は、胸を張ってアホと
いう言葉を使いたい)のレベルを証明する事実を述べて
おきましょう、円周率πを「約3」と教える様にすると
云っています。それでは、2.9でもイイノカと云いた
くなっちゃう。これは、世界から見るとすごい非常識で
す。米国の小学生(?)は、円周率を10桁位はそらんず
る知識を身に付けています。そ2フための、暗記法を彼ら
は持っているのです(.√2を日本の子は、1.41421356[人
よ人よに人見頃]と暗記する技がある様に)。また、πは
数学史あるいは人類の歴史において、そんなに簡単にや
り過ごしてはいけない位に重要な位置付けにあるので
す。万事がそうです。この様な状況を少しでも改善する
必要があるのだとの意識を持ち、真剣に取り組むべきで
す。「英語なんて大した言語では無い」はずなのに、な
んで、こんなに苦労しなきゃいけないのか、疑問に思い
ます。日本の英語教育の何処かが間違っているとさえ考
えざるを得ないです(ちょっと脇道に逸れました、すい
ません)。
【0047】電子化への応用ですが、前述の実施例の変
化例で述べた電子化応用以外に、図4に示すような構成
により、拡張発音を入力とし、その際、その入力仕様
は、母音の省略と、ワイルドカードの複数個指定機能
と、拡張発音桁数情報、あるいは、拡張発音の対象範囲
を狭くする指定も可能(例えば、「A」をあえて「I」と
指定すると、「I」の母音関係のみに制限したと解釈)、
等を仮定し、入力の簡素化と、ある種特定のバラエティ
に富む発音列に対する柔軟性のある絞込と、を提供し、
単に話者の発した単語の確認の検索のみならず、長いあ
るいは難しいスペルの入力支援をする電子装置が作られ
ることが、容易に本発明の「拡張発音記号の入力」概念
の適用により類推可能です。例えば、「BAD」 or 「B
D」を入力すると、bad、bed、bid、void等、「KN*SN」
の入力では、combination, configuration, contributi
on, constitution等、「KNT*B*S」の入力では、controv
ersy(論争・話題)等、「(FH)A」の入力では、fire、hir
e、hair等、「A*EPT」では、adoptは除外され、accept,
exceptの様な該当する検索結果英単語情報の一覧を出
力する電子装置です。本発明では、このような容易に類
推可能な電子化応用に関し、その知的権利を明示的には
請求しません。仮に、今述べた様な電子辞書が開発され
たとしたら、間接的に、その装置は、本発明に抵触しま
す。色々なメーカの人々が、いわゆる電子辞書に関し、
発明を行っています。また、製品として世に出していま
す。私は、それらの発明を調べましたが、「キラリと光
るものをもつ」内容のものは、残念ながら余り多くあり
ませんでした。
【0048】本発明の概念のエッセンスは、ズバリ、一
意に決まる「見出し」の抽象化にあります。拡張発音記
号の定義および、その結果できた発音索引は、学校の数
学(算数かも)の関数、集合論、および、英語の非常に良
い教材になります。例えば、生徒に宿題として、拡張発
音記号「LAD」に該当する英単語を可能な限り調べて来
て下さい、と課すのも良いでしょう。もう少し、レベル
を上げると、「(TK)A(ST)A」の四桁の拡張発音記号の英
単語要素を洗い出せ、あるいは、色々な単語とその従来
発音記号文字列および拡張発音記号文字列とを見せ、従
来発音記号と拡張発音記号とのmappingの規則性を調べ
よ。さらに、少し趣を異にしますが、中学の美術の時間
に、教科書に載っている写真のジャコメッティ(や、ヘ
ンリームーア)の彫刻を説明する際に、この拡張発音記
号を引き合いに出し、その思想としての抽象化の意味を
違った角度から理解させる事なども非常に良いことで
す。図9に日本語と英語を拡張発音記号化する練習問題
のサンプルを付けましたので、御覧下さい。そんなに難
しくないはずです。小学生にでも、ちょっと指導してあ
げれば容易に拡張発音への変換は可能です。そして、拡
張発音に変換することに習熟したならば、英語のラジオ
(AFN米軍放送:AM 810MHz[Eagle 810])や、2カ国語放
送のTVなどを聞いたり見たりして、耳にした発音をその
場で、あるいは、発音をメモしておいて、後で、本発明
をベースとした索引で調べる訓練をすることをお勧めし
ます。
【0049】図10に、発音の「F」と「P」が唇の形の
近さから、その結果として、該当単語も似たものになる
ハズだ、の検証例を示しました。半分位、当たっていま
す。また、図5で紹介した、カーネギー・メロン・大学
発音辞典(略して、CMU発音辞典)に対して私が行った
調査結果を図11に示します。CMU発音辞典は、研究
機関からweb公開されているものであり(URLは、http://
www.speech.cs.cmu.edu/cgi-bin/cmudict/)、1998年11
月の時点で約12万5千単語が登録され、一般人からも
その登録を求めている、米語(North American English)
の単語とその発音(transcriptions)のペアのみからなる
発音辞典のデータベースです。名詞や動詞の活用形はも
ちろんのこと、日本の地名や人名までもが登録されてい
ます。この辞典の特徴は、発音のみに限定しているこ
と、と、発音記号をコンピュータ処理可能な形で定義し
ていることです。この辞典を入力とし、全単語を拡張発
音記号化したときの同一拡張発音となる単語の上位30
0のランキングを調べた結果が、図11です。私は、こ
の辞書の調査で、「HALP」という拡張発音を持つ単語
は、「help」のみであり、特異単語であることも分かり
ました(神様はユーモアをお持ちなのかも知れません)。
さらに、「ANDDA」に該当するものは、Wednesdayのみで
した。「TADDA」、「SADDA」、「SATADA」もほぼTuesda
y、Thursday、Saturdayの1つでした。「FLADA」は、Fr
idayを含め28個ありました。「ATNASFA」もatmospher
eの1つのみでした。CMD発音辞典に、拡張発音を付加し
たものは、非常に使い勝手が良いと、個人的には感じま
した。また、CMU発音表記には、スペル「its」や「read
s」の最後の発音「ts」や「dz」の専用発音記号を用意
せず、「T」と「S」や「D」と「Z」の並びとして「T
S」や「D Z」の様に離して表記しています。現在の私の
この調査は、機械的に拡張発音記号化をほどこしたレベ
ルのものであり、「T S」や「D D」となってしまいます
が、この下で統計を取りました。従って、従来の発音記
号ベースのことを加味すると、拡張発音「T」や「D」で
終わる単語数はもっと多くなります。また、CMU発音
辞典で最も数が多かった拡張発音「DANA」に該当する単
語と、そのCMU発音記号のサンプルを、図12に参考に
示しました。また、この例からCMU発音記号の使用法
をも理解すると良いと思います。
【0050】最後に、課題を述べておきます。本発明
は、カナ発音見出しを排し、極力発音記号ベースで索引
は作るべきである、との方針に従って研究・発案しまし
たが、現実は、現在の発音記号にも問題があると認識し
ています。例えば、operationという単語の発音は、私
には、100%「オポォ(ェ)(r)レイシャn [オポェ(r)レイ
シャn、では絶対ない]」と聞こえてしまいます。現在の
英語辞書は、そのニュアンスを表現出来ていません。こ
の様なものについては、さらに解説を付加する必要があ
ります(私見を述べさせて頂くならば、「発音の表示が
誤っているので、米国人と相談し、辞書本体を見直して
下さい」と云いたい)。さらに、25をtwenty-fiveと通
常発音しますが、欧米人は、twen-fiveと略して言って
しまうケースも多いそうです、この様なケースは稀では
ありません。これらの事実を付加する必要もあります。
そのためにも、native-speakerを交え、真摯に辞書その
ものの改善が必要だと思います。 また、単語発音定義
の付帯情報として、音感のニュアンスをさらに、科学的
かつ客観的に表示する手段を確立すべきだとの観点か
ら、音楽音表記の絶対的世界標準である音符記号(ドレ
ミの音、五線譜表記、強弱、長さ、高低等)相当情報
を、従来の発音記号以外に、付加表記することを考えま
したが、7音階およびその半音しかない音符では、発音
の音感は表現不可能でした。どなたか、辞書にその情報
を付加できる表現手段を研究して下さい。その技術は、
特に中国語等に適用されると良いと思います。なぜな
ら、中国語は音の微妙な上げ下げ等を強要する言語だと
聞いているからです。例えば、「しぇ〜しぇ〜」の発音
は、何通りもあり、各々意味が異なると聞いています。
さらに、既に述べましたが、本発明にて紹介したCMU
発音辞典の表記法には、一部、長母音に関してその使い
方が曖昧な所が在ります。それらに関しても、カーネー
ギー大学の研究室に対し、指摘する必要があります。
【図面の簡単な説明】
【図1】請求項1、2の拡張発音記号をキーとする索引
の作成手順と特徴を示す図である。
【図2】拡張発音記号をキーとする索引での拡張発音記
号「A」の英単語一覧サンプルである。
【図3】拡張発音記号をキーとする2桁、3桁拡張発音
の対応英単語一覧サンプルである。
【図4】電子化応用例としての検索電子装置の構成図で
ある。
【図5】請求項1の拡張発音記号と従来の実際の発音記
号とのmappingの概念図である。
【図6】請求項2の桁数順配置の索引と従来索引の特徴
の大きな違いを示す概念図である。
【図7】拡張発音記号の選択表記サブ見出しの(FH)グル
ーブの英単語一覧サンプルである。
【図8】拡張発音記号の選択表記サブ見出しの(ST)グル
ーブの英単語一覧サンプルである。
【図9】拡張発音記号化の練習問題のサンプルである。
【図10】「唇の形からFは、Pに近いはず」の単語によ
る検証サンプルである。
【図11】CMU発音辞典における拡張発音単語上位3
00
【図12】CMU発音辞典における最上位「DANA」の内
訳サンプル
【図13】「カナ表記の拡張」に関するサンプル(請求項
3の図でもある)

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 外国語(例えば、英語)の従来の発音記
    号において、全ての母音記号と母音に近い音感の子音記
    号とを同一視し、また、子音記号も音感が近いものを同
    一視し、同一視された母音および子音記号を「拡張発音
    記号」と呼ぶ集合名の要素として定義する。例えば、英
    語の日本の辞書で広く採用されている発音記号では、次
    の様な拡張発音記号と分類が考えられる。 ・拡張母音集合; A={x : x=母音記号 or 子音記号w o
    r 子音記号j or これら記号の全てを組合せた発音記号
    群} ・拡張子音集合; B={b, v}, D={d,Θ の濁音, z, d
    了,了(ヂのつもり), dz},F={f},G={g}, H={h}, K={k},
    L={l, r}, N={m, n, 勹(ングのつもり) (, 勹g, 勹k)},
    P={p},S={s,∫,Θ}, T={t∫, t, Θ, ts}, (W={w}, Y=
    {j}) さらに、「任意の文字列集合XとYとの結合集合」、およ
    び、「1文字集合XとYとのいずれか1つの選択集合」と
    いう概念を、 XY={xy:x∈X, y∈Y} 、 (XY)={x:x∈X or x∈Y}
    と表記・定義する。そして、この基で、定義した拡
    張発音記号に関し、その全ての結合集合群をアルファベ
    ット順に並べ、これを発音索引の「見出し」と定義す
    る。次に、辞書内の単語に対し、その付加情報である従
    来の発音記号文字列を拡張発音記号文字列へ変換し、そ
    の単語を、変換された拡張発音記号文字列を持つ前述の
    「見出し」の配下に配置する。この配置作業を全単語に
    ついて行う。このとき、「見出し」は、選択集合表記を
    用い、複数の「見出し」グループをまとめて1グルーブ
    とすることを含むとする。そして、同一「見出し」内の
    同一拡張発音記号文字列となる競合単語群に関しては
    (例えば、単語bad、bed、bid、voidは、共に、「BAD」
    という3桁の拡張発音記号表記となる。また、「(FH)
    A」という2桁の拡張発音記号の要素としては、単語fir
    e, hire等が含まれる)、元の従来の発音記号文字列をベ
    ースに、何らかの基準に基づき(例えば、音感の近い順
    に)、さらに並べ直すものとする。このようにして索引
    の見出し、および並び、を得ることを特徴とする発音索
    引の作成方法。
  2. 【請求項2】 前記発音索引の作成方法において、アル
    ファベット順の拡張発音記号の「見出し」の並びを、さ
    らに、ある区間単位において、拡張発音記号文字列の長
    さである桁数順に並び換える(例えば、区間単位として
    は、先頭の1文字が同一である、という単位が考えられ
    る。すると、例えば先頭がAの「見出し」については、
    A,AB,ABA,ABB,ABC,…ABY,ABAB,ABAC,…を(1),A,(2),AB,
    AD,…,AY,(3),ABA,ABB,…,AYY,(4),ABAB,…の並びとす
    る)、ことを特徴とする発音索引の作成方法。
  3. 【請求項3】 前記発音索引の作成方法を取り巻く関連
    応用技術として、英語の発音記号を忠実に表現するカナ
    表記の改善を考える、すなわち、 A) 「e の180度回転した母音発音記号」対応は、カナの
    右横に、半角アルファベットのtildeマーク『~』を付け
    る。また、この長母音は、パのハを除いた丸マークの
    『゜』を用いて『ー゜』と表記。 B) 「aとe の背中合せの母音発音記号」対応は、カナの
    右横に、パのハを除いた丸マークの『゜』を付ける。但
    し、対象のカナが、『ハ』の場合は、『ハァ゜』とす
    る。 C) 「Aの横棒が無い母音発音記号」対応は、カナの右横
    に半角アルファベットのhatマーク『^』を付ける。 D) 「f, r, v, th の子音発音」対応のカナには、左横
    に半角アルファベットの右下がり上点(grave)マーク
    『`』を付ける。 E) また、必要に応じて、アルファベットを混ぜる。さ
    らに、A)からC)右上のマークを付けた『ア』や『ヤ』を
    明示的に付加しても良いとする。 F) 但し、上記添え字は、状況に応じて付けるものであ
    り、見苦しいケースや、しつこいケースは、強制はしな
    い。 というA)〜F)の6つの「添え字文字」の規約を設ける、
    ことを特徴とする英語発音記号対応のカナ表記拡張方
    法。
JP2001130805A 2001-04-27 2001-04-27 拡張発音記号を入力とし、単語を出力とする、発音索引の作成方法 Pending JP2002328938A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001130805A JP2002328938A (ja) 2001-04-27 2001-04-27 拡張発音記号を入力とし、単語を出力とする、発音索引の作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001130805A JP2002328938A (ja) 2001-04-27 2001-04-27 拡張発音記号を入力とし、単語を出力とする、発音索引の作成方法

Publications (1)

Publication Number Publication Date
JP2002328938A true JP2002328938A (ja) 2002-11-15

Family

ID=18979110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001130805A Pending JP2002328938A (ja) 2001-04-27 2001-04-27 拡張発音記号を入力とし、単語を出力とする、発音索引の作成方法

Country Status (1)

Country Link
JP (1) JP2002328938A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010040045A (ja) * 2009-07-24 2010-02-18 Casio Comput Co Ltd 情報表示制御装置および情報表示制御プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010040045A (ja) * 2009-07-24 2010-02-18 Casio Comput Co Ltd 情報表示制御装置および情報表示制御プログラム

Similar Documents

Publication Publication Date Title
Finnegan Literacy and orality
Klammer Analyzing English Grammar, 6/e
Wray et al. Projects in linguistics and language studies
Kim Strange names of God: The missionary translation of the divine name and the Chinese responses to Matteo Ricci's" Shangti" in late Ming China, 1583-1644
Halliday Halliday in the 21st Century: Volume 11
Kelly Introducing the Eskaya writing system: A complex Messianic script from the southern Philippines
Crisostomo Bilingual education and innovations in scholarship: the Old Babylonian word list Izi
Hinton et al. A dictionary for whom? Tensions between academic and nonacademic functions of bilingual dictionaries
Anton Alphabetic print-based literacy, hermeneutic sociality, and philosophic culture
Cooley Judean Onomastic Hermeneutics in Context
Joubran-Awadie et al. Morphological distance between spoken Palestinian dialect and standard Arabic and its implications for reading acquisition
JP2002328938A (ja) 拡張発音記号を入力とし、単語を出力とする、発音索引の作成方法
Wakefield Cantonese as a second language: Issues, experiences and suggestions for teaching and learning
Krill Greek and Latin in English today
Zhong Chinese influence on the English lexicon
Kubler Basic Mandarin Chinese-Reading & Writing Textbook: An Introduction to Written Chinese for Beginners (DVD Included)
Elazar Translating culture: missionaries and linguists in contemporary Yunnan Province
Quist Resisting monolingualism in the creative writing classroom: adapting Yoko Tawada’s ‘surface translation’and ‘microscopic readings’ of script
Kubler Basic Written Chinese: Move From Complete Beginner Level to Basic Proficiency (Downloadable Audio Included)
Hinchliffe et al. Intermediate Swedish: A Grammar and Workbook
Yule Orthography and reading: spelling and society
Hung A Kaleidoscopic View of Chinese Philosophy of Education
Molenda Investigating the process of EFL lexicogrammatical consultation in the Web 2.0 environment
Bandyopadhyay Indianisation of English: Analysis of linguistic features in Selected post-1980 Indian English fiction
Micheli et al. Language and Identity. Theories and experiences in lexicography and linguistic policies in a global world

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060905