JP2007521521A - 音声識別と通しての言語学習を容易にするためのシステム,方法,コンピュータープログラム,データの集合 - Google Patents
音声識別と通しての言語学習を容易にするためのシステム,方法,コンピュータープログラム,データの集合 Download PDFInfo
- Publication number
- JP2007521521A JP2007521521A JP2006550196A JP2006550196A JP2007521521A JP 2007521521 A JP2007521521 A JP 2007521521A JP 2006550196 A JP2006550196 A JP 2006550196A JP 2006550196 A JP2006550196 A JP 2006550196A JP 2007521521 A JP2007521521 A JP 2007521521A
- Authority
- JP
- Japan
- Prior art keywords
- extraction
- language
- speech
- words
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
Abstract
Description
技術の現状と一般的な知識を確認するには,以下の文献を参考されたい.これらは,以下の説明において,適宜使われる.
[1]Anderson,S.R.,Lightfoot,D.W.(2002):“The language organ:linguistics as cognitive physiology”(言語器官:認知生理学としての言語学),New York:Cambridge University Press.
[2]Auralog:Cursos de idiomas extranjeros“Talk to me”(外国語講座「私に話しかけて」).
[3]Borden,G.J.,Harris,K.S.,Raphael,L.J.(1994):“Speech Science Primer:Physiology,Acoustics and Perception of Speech”(ことば科学入門:生理学,音響学,話しことば知覚),Williams and Wilkins.
[4]Goldsmith,J.(1995):“The Handbook of Phonological Theory”(音韻理論ハンドブック),Cambridge MA,Blackwell Publishers.
[5]Kager,R.(1995):The Metrical Theory of Word Stress(語ストレスの韻律理論),en[Goldsmith(1995)]
[6]Ladefoged,P.(2001):“Vowels and Consonants”(母音と子音),Malden,MA:Blackwell Publishers.
[7]Ohala,J.(1995):Experimental Phonology(実験音韻論),en[Goldsmith(1995)]
[8]Quilis,A.,Fernandez,J.(1975):“Curso de fonetica y fonologia espanolas:para estudiantes angloamericanos”(スペイン語音声学・音韻論講座:英米人学生のために),CSIC
[9]Tomatis,A.(1996):“The Ear and Language”(耳と言語),Moulin,Canada.
(音習得における困難)
言語の発音の学習は,2つの側面に基づく.
・音声学の習得 つまり,話者の口頭発声を構成するそれぞれの音声を特徴付ける特徴の習得.これらの特徴は,基本的に音声出力のスペクトルの輪郭と関係する.これらの特徴を習得するために,まずそれらを特定し,記憶することが必要である.
・音韻論の習得 つまり,ある単語や句の音声がどのように影響を受け,それら同士を関係付けるか,や,例えば周波数や強さのような決まった特徴の一時的発達が,どのように構造やことばの意味を伝達するのに役立っているがの習得.音韻論はその音声そのものの特徴に基づくため,音韻論の習得は音声学の習得に支えられる.
−単語を習得することが非常に困難となる.ある単語を学ぶということは,音声のある連続を学ぶということであり,それらは学ぶのが困難だからである.
一般的に,現代の科学は,単語の書かれた文字と実際の音声の間には規則や関係のまとまりが存在し,これらの関係が,話者がその単語を使用できる形に影響を与えているということを受け入れている.
(導入)
以上の分析の結果として,この技術は,発音に関する学習者の主要な問題を,書かれた文字と実際の音声の間の干渉であると位置づける.この問題をなくすために,文字化された言語が不利に働くことなく,よい効果を得られるようにしてくれる解決法を提案する.
すでに述べたように,この技術は,基本的に,早い時期に文字で書かれたテキストを使って学習することの悪い影響を被ることなく,単語を識別し,文構造を特定することを可能にする.続いて,この技術の効果をよりよく評価するために,単語識別の難しさに関するいくつかの側面を説明する.
1. 目標言語の音声をより適切に習得させる.それによって,聴覚理解をより適切にし,発音をよりよくし,単語の記憶と習得の能力を改善し,間接的に言語の完全習得を促進する.
2. 音韻的な形と書かれた文字の間のつながりを,母語話者のものと同じように作り,それによって読む能力が改善される.
望ましい利用法においては,目標言語のサンプルに関して学習者に付加的情報をもたらすために,異なる特徴を持った形式抽出が用いられる.
−特性1:「分離/結合」 分離抽出は単語の間にスペースと句読記号を示し,一方結合抽出はそれらを示すことはない.
−特性2:「個別/連続」 個別抽出では,音節構造が,独立して発音されたときの単語における実際の音節に対応し,連続抽出では,音節構造が,単語がつながって発音されたときの実際の音節に対応する.
−特性3:「構造化/非構造化」 構造化抽出では,対応する原音抽出の句構造を反映する内部体系を表示する.非構造化抽出では,その内部構造を表示しない.
分離・個別・音節の形式抽出において,チェーンは,スペースやピリオドのような原音抽出そのものに存在する句読記号の使用により,視覚的に切り離されている.表1の形式抽出は,分離・個別形式抽出である.この形式抽出の特徴は,以下である.
1.チェーンを構成する文字のひとつひとつは,そのチェーンと関連する実際の単語の音節に対応させられる.
2.単語とチェーンは一対一対応の関係にあり,そのため原音抽出にある実際の単語と同じ数だけチェーンが存在する.
3.チェーンは,そのチェーンに対応させられる単語を分けているのと同じスペースや文字によって切り離されている.
この抽出は,次のような事実を考慮に入れている.つまり,いくつかの単語がつなげて発音されたとき,そのうちのいくつかの音節の実際の発音は,個別に発音されるときのものとは違っている.それは共時調音現象や言語の韻律規則によって起こるものである.例えば,表1の原音抽出の切れ目のない発声は,表4に示される音節を含んでいる.
1.つながる別々の単語の音節にはハイフン(”‐”)を使用し,ハイフンはその音節がつながることになるチェーンの間に位置することになる.
2.それらの開で音節の一部が移動するような音節のために,矢印(”→”または”←”)を使用する.その矢印はその移動に干渉する音節の間に位置することになり,一部分を失った音節からその部分を得る音節へと向けられる.
3.消える音節は,線を引いて消す.
4.他の方法で変換される音節には,赤い文字を用いる.
結合形式抽出は,発話言語はポーズによって単語が切り離されないという事実を反映するのに役立つ.書記言語では単語はスペースと正書法記号によって明らかに切り離されているが,発話言語ではこのようなことは起こらず,別々の単語の特定は,韻律や時には単語の構造特有の特徴のおかげでなされる.
すでに述べたように,この技術には,形式抽出を通して原音抽出の句構造を示す可能性が存在する.そのために,構造化された形式抽出が用いられ,そこでは適切な句が定義されている.
本コンピューターシステムはさまざまな特徴を持つテキストを発声に変換させる発話技術のシステムを装備している.
このシステムは,抽出に用いられるさまざまな単語に関する音声学的・音韻論的情報を含む発話データベースを持っており,このデータベースは,単語が個別に発音される場合のデータと,他の語と共に現れる場合のデータの両方を含んでいる.このデータベースは,以下についての情報を有する.
1. 各々の単語の音節構造.例えば,”casa”のような単語は,単語が音節を2つ持つということを示す”ca−sa”のような情報を持つ.
2. 文脈上,連続して発話される場合の音節変換規則.例えば,”casa”という単語は,”azul”のような単語が後続する場合に”casa”の最終音節と”azul”の最初の音節がつながってひとつの音節になるというような情報を持っている.
3. 抽出の統語構造が分節の音韻論的振る舞いに対して持つ効果.例えば,”casa”という単語が,”quiero reparar el techo de la casa antes de comer”という文において”antes”という単語の直前に現れるとき,”casa”の最終音節は”antes”の最初の音節によらない.これは,両者が文の句構造の異なるレベルにあるからである.
このデータベースは発話技術のシステムにおいて利用されるデータベースと同じであるが,形式抽出を生成するために外側からもアクセス可能である.
望ましい利用法において,形式抽出は文字”X”を付加することによって作られる.文字”X”のひとつひとつは,連続抽出で何らかの方法によりつなげられたり変換されたりする音節の場合を除いて,音節の単位である.この場合,連続抽出の一音節は,後述するように,図形で示す方法によるつながった”X”2文字に相当する.
分離・個別・音節の形式抽出(ECSDS)は,各単語を一連の文字”X”に変換することを通して,形式抽出から作られる.そのため,各文字”X”はその単語の一音節に相当し,単語の音節構造に関する発話データベースにおいて存在する情報が利用されるわけではない.
本コンピューターシステムは,実際の音で原音抽出やその一節を,後述するさまざまな方法で再生するための機能性を持っている.例えば,単語や音節や特定の句を強調しながら実際の音で再生することができる.
この技術の望ましい利用法は,以下の説明のとおりである.システムを開始するにあたって,学習者は訓練モードで利用するか学習モードで利用するかを選択できる.訓練モードでは,すでに特定されている原音抽出を利用する.学習モードでは,関心のある言語サンプルに存在する原音抽出を利用する.どちらの場合でも,結果はひとつ以上の原音抽出が連続して選ばれることになる.
1.ひとつ以上の句
2.ひとつ以上の単語
3.ひとつ以上の音節
1.まず,当該構成素が音節や単語・句のいずれであっても,それらが現れ,際立たされているような他のテキストが情報として得られる.
2.次に,抽出の一部分の音声データが得られ,それは抽出全体のデータでもある.この音声データは,テキストの前の部分の例についても得ることが可能である.
3.さらに別の情報として,原音抽出やあるいはその一部についての音声データが得られるが,それは学習者が理解しやすいよういくつかの特徴を備えた形で提示される.この特別な特徴というのは,音声データ全体の速度を全体的にあるいは部分的に変更することによって得られたり,音調や音の強さ,そして/あるいは各要素の長さを変更することによって得られる.この音声データは,あらかじめ特殊に録音することによって得られたり,テキスト・音声変換装置を利用したり,それら二つを併用することによって得られる.異なるタイプの音声データは,以下のような特徴を持つと考えられる.
−当該部分を通常より遅い速度で再生する
−当該部分を音節に区切って再生する.つまり,音節を認識しやすくするために,音節を際立たせながら再生する
−当該部分を単語ごとに再生し,各々の単語を認識しやすくする
−当該部分を再生する際に,音素や音節,単語,文の要素のように,決められた単位を際立たせて再生する
−当該部分を再生する際に,2000ヘルツ辺りの周波数を増幅して再生する.そうすることで,この領域の音の区別が容易になり,このことが摩擦音どうしを区別するのに重要である[Borden et al,p.177]
4.それから,当該部分のさまざまな箇所をはっきりと目に訴える形で,音声データとシンクロさせた形か,あるいは独立した形で際立たせることによって得られる情報がある.特にシンクロさせたデータは,当該部分の決められた箇所が聴覚的に際立たせられている場合に有用である.
本技術をその他の方法で用いることは大いに可能であり,ここではそのうちのいくつかを下に紹介する.
Claims (1)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ES200400030 | 2004-01-08 | ||
PCT/ES2005/000006 WO2005066916A1 (es) | 2004-01-08 | 2005-01-07 | Sistema, procedimiento, programa de ordenador y conjunto de datos para facilitar el aprendizaje de lenguas mediante la identificación de sonidos |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007521521A true JP2007521521A (ja) | 2007-08-02 |
Family
ID=34746252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006550196A Pending JP2007521521A (ja) | 2004-01-08 | 2005-01-07 | 音声識別と通しての言語学習を容易にするためのシステム,方法,コンピュータープログラム,データの集合 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8408913B2 (ja) |
JP (1) | JP2007521521A (ja) |
WO (1) | WO2005066916A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007519943A (ja) * | 2003-12-12 | 2007-07-19 | オルエッタ、アンヘル パラシオス | 言語の理解および/または言語の学習を容易にするシステム、方法、コンピュータプログラムおよびデータ構造 |
US20070055523A1 (en) * | 2005-08-25 | 2007-03-08 | Yang George L | Pronunciation training system |
US8379801B2 (en) * | 2009-11-24 | 2013-02-19 | Sorenson Communications, Inc. | Methods and systems related to text caption error correction |
US8768697B2 (en) * | 2010-01-29 | 2014-07-01 | Rosetta Stone, Ltd. | Method for measuring speech characteristics |
US8972259B2 (en) * | 2010-09-09 | 2015-03-03 | Rosetta Stone, Ltd. | System and method for teaching non-lexical speech effects |
CN107945619A (zh) * | 2017-11-15 | 2018-04-20 | 深圳市沃特沃德股份有限公司 | 学习语言的方法、装置及学习机器人 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63225875A (ja) * | 1986-11-26 | 1988-09-20 | エロン・ギャスパー | スピーチ同期アニメーション |
JPH11153951A (ja) * | 1997-11-19 | 1999-06-08 | Norihiro Tanaka | 外国語発声学習教材及びその作成方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3724102A (en) * | 1972-05-24 | 1973-04-03 | Patten C Van | Language teaching device |
US5393236A (en) * | 1992-09-25 | 1995-02-28 | Northeastern University | Interactive speech pronunciation apparatus and method |
US5336093A (en) * | 1993-02-22 | 1994-08-09 | Cox Carla H | Reading instructions method for disabled readers |
US5651678A (en) * | 1993-12-23 | 1997-07-29 | Phillips Associates, Inc. | Educational reading aid and method for using same |
US5799267A (en) * | 1994-07-22 | 1998-08-25 | Siegel; Steven H. | Phonic engine |
US5697789A (en) * | 1994-11-22 | 1997-12-16 | Softrade International, Inc. | Method and system for aiding foreign language instruction |
US5802533A (en) * | 1996-08-07 | 1998-09-01 | Walker; Randall C. | Text processor |
US6397185B1 (en) * | 1999-03-29 | 2002-05-28 | Betteraccent, Llc | Language independent suprasegmental pronunciation tutoring system and methods |
US7149690B2 (en) * | 1999-09-09 | 2006-12-12 | Lucent Technologies Inc. | Method and apparatus for interactive language instruction |
US6963841B2 (en) * | 2000-04-21 | 2005-11-08 | Lessac Technology, Inc. | Speech training method with alternative proper pronunciation database |
US6869286B2 (en) * | 2000-06-09 | 2005-03-22 | Michael E. Furry | Language learning system |
EP1344203A1 (en) * | 2000-10-20 | 2003-09-17 | Eyehear Learning, Inc. | Automated language acquisition system and method |
US6409510B1 (en) * | 2001-03-13 | 2002-06-25 | William H. Firebaugh | Method for learning a foreign language |
US7085707B2 (en) * | 2002-04-25 | 2006-08-01 | International Business Machines Corporation | Foreign language teaching tool |
JP2004021102A (ja) * | 2002-06-19 | 2004-01-22 | Eigyotatsu Kofun Yugenkoshi | 会話練習システムおよびその方法 |
US7011525B2 (en) * | 2002-07-09 | 2006-03-14 | Literacy S.T.A.R. | Encoding system combining language elements for rapid advancement |
US7165972B1 (en) * | 2002-12-17 | 2007-01-23 | Debra Jones | System and method for second language instruction |
US7104798B2 (en) * | 2003-03-24 | 2006-09-12 | Virginia Spaventa | Language teaching method |
US7407384B2 (en) * | 2003-05-29 | 2008-08-05 | Robert Bosch Gmbh | System, method and device for language education through a voice portal server |
US8033831B2 (en) * | 2004-11-22 | 2011-10-11 | Bravobrava L.L.C. | System and method for programmatically evaluating and aiding a person learning a new language |
-
2005
- 2005-01-07 JP JP2006550196A patent/JP2007521521A/ja active Pending
- 2005-01-07 WO PCT/ES2005/000006 patent/WO2005066916A1/es active Application Filing
- 2005-01-07 US US10/596,991 patent/US8408913B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63225875A (ja) * | 1986-11-26 | 1988-09-20 | エロン・ギャスパー | スピーチ同期アニメーション |
JPH11153951A (ja) * | 1997-11-19 | 1999-06-08 | Norihiro Tanaka | 外国語発声学習教材及びその作成方法 |
Also Published As
Publication number | Publication date |
---|---|
US20070015122A1 (en) | 2007-01-18 |
US8408913B2 (en) | 2013-04-02 |
WO2005066916A1 (es) | 2005-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Roach | Phonetics | |
JP2007525702A (ja) | 音声学と音韻論の学習と理解による,言語習得を容易にするための方法,システム,プログラム,データの集合 | |
JP2007521521A (ja) | 音声識別と通しての言語学習を容易にするためのシステム,方法,コンピュータープログラム,データの集合 | |
Bedinghaus | The effect of exposure to phonological variation on perceptual categorization and lexical access in second language Spanish: The case of/s/-aspiration in Western Andalusian Spanish | |
Bird | Pronunciation among adult Indigenous language learners: The case of SENĆOŦEN/t’ | |
Nagamine | Effects of hyper-pronunciation training method on Japanese university students’ pronunciation | |
Abduazizov | ENGLIs PoNETIcs | |
Roach | Glossary–a Little Encyclopaedia of Phonetics | |
Diaz | Towards Improving Japanese EFL Learners' Pronunciation: The Impact of Teaching Suprasegmentals on Intelligibility | |
Aufderhaar | Learner views of using authentic audio to aid pronunciation:" You can just grab some feelings" | |
van Maastricht | Second Language Prosody: Intonation and rhythm in production and perception | |
Henderson et al. | “A better me”: Using acoustically modified learner voices as models | |
Thomas et al. | Advances in the Study of Bilingualism | |
Abdelgadir et al. | A Handbook on “Introduction to Phonetics & Phonology”: For Arabic students | |
Kivistö | The making of rallienglanti: Cross-linguistic influence in Finnish speakers' pronunciation of English | |
Zavyalova et al. | Lingua franca intercultural communication in Asia Pacific: Issues of phonetic competence, phonological transfer, and perceptual adaptation strategies | |
Yurtbaşı | Why should Speech Rate (Tempo) be Integrated into Pronunciation Teaching Curriculum? | |
Eva | Teach Yourself English Phonetics | |
De Iacovo et al. | Evaluating prosodic cues in Italian: the use of a Telegram chatbot as a CALL tool for Italian L2 learners | |
Melienia | Vowel Change of English Words by Filipino Speakers in “Everglow” Short Movie From COF Studios Youtube Channel | |
Çekiç | The effects of computer assisted pronunciation teaching on the listening comprehension of Intermediate learners | |
Jaiprasong | An interlanguage study of L2 perception and production of english word stress by L1 Thai learners. | |
Cheon | A Perception Study of the Korean Sibilant Fricatives in Seoul and Daegu Dialects | |
Tauber | Czenglish: Common Mistakes in English Pronunciation Made by Czech People | |
Luongová | Perception of native and non-native English accents by Czech listeners |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080313 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100720 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101018 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101117 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101118 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101214 |
|
A072 | Dismissal of procedure [no reply to invitation to correct request for examination] |
Free format text: JAPANESE INTERMEDIATE CODE: A073 Effective date: 20110517 |
|
A072 | Dismissal of procedure [no reply to invitation to correct request for examination] |
Free format text: JAPANESE INTERMEDIATE CODE: A072 Effective date: 20110830 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111018 |