JP2005301953A - 聞き手の側のペースで音声とそれに対応する文章を関連させる方法 - Google Patents
聞き手の側のペースで音声とそれに対応する文章を関連させる方法 Download PDFInfo
- Publication number
- JP2005301953A JP2005301953A JP2004142901A JP2004142901A JP2005301953A JP 2005301953 A JP2005301953 A JP 2005301953A JP 2004142901 A JP2004142901 A JP 2004142901A JP 2004142901 A JP2004142901 A JP 2004142901A JP 2005301953 A JP2005301953 A JP 2005301953A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- speech
- sentences
- voice
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【解決手段】 第一にその文章をデジタル化したうえで、その文章を句点まで、ピリオドまでと、文を最小単位に分割し、分割したものを配列を使ってまとめる。第二に音声をデジタル化し、その音声ファイル上の上記の分割した一文一文に対応する時間的位置を記録したうえでこれを配列を使ってまとめる。そしてこの両者を二次元配列を使って一つにまとめる。第三にこの二次元配列の文を見ながらそれに対応する時間的位置に従って音声ファイルから音声を再生することができるプログラムを作る。
【選択図】 図1
Description
しかし従来の字幕では理解することは困難である。なぜなら第一に音声の聞き取りは言語によって母音の数が違っていたり、日本語に原則としてない子音のみの発音があったりしてそれ自体が難しいこと。第二に聴覚による音声の認識と視覚による文字の認識を同時にやらなければならないこと。第三に話し手の話す速度で流れていき聞き手は認識できない点があっても流れてしまうため消化不良になってしまうことである。そこで本発明は聞き手の側のペースで文字、文章を介する良さを生かしつつ確実に理解していくことができるようにすることを課題とする。
▲2▼ ニュースの音声、その中の会話を文章化したものをそれぞれデジタル化する。
▲3▼ 二次元配列はエクセルを使って作る。A列にはニュースの中の会話を文章化したものを一文一文分割して入れていく。B列にはA列の理解を助けるために対訳を入れていく。C列にはA列の中のキーワードの訳を入れる(図1)。キーワードは図ではできないが色を変えて区別できるようにする。E列にはA列の一文が始まる音声ファイル上の時間的位置を入れていく。この場合はミリ秒単位である。F列には一文が終わる時間的位置を入れていく(図2)。
▲4▼ 図1符号4はE列、F列の時間的位置を読み込んでそれに従って音声を再生するプログラムのインターフェイスである。図の設定ではコマンド「一行」をクリックするとA列1行目に相当する部分の音声が再生される。コマンド「数行」をクリックするとA列1行目からA列2行目までに相当する部分の音声が再生される。
2 エクセルシートB列、対訳。
3 エクセルシートC列、キーワード訳。
4 ユーザーインターフェイス。
5 エクセルシートD列、空白。
6 エクセルシートE列、始まる時間(ミリ秒単位)。
7 エクセルシートF列、終わる時間(ミリ秒単位)。
Claims (1)
- 音声とそれに対応する文章を関連させる方法において、第一にその文章をデジタル化したうえで、その文章を句点まで、ピリオドまでと、文を最小単位に分割し、分割したものを配列を使ってまとめる。第二に音声をデジタル化し、その音声ファイル上の上記の分割した一文一文に対応する時間的位置を記録したうえでこれを配列を使ってまとめる。そしてこの両者を二次元配列を使って一つにまとめる。第三にこの二次元配列の文を見ながらそれに対応する時間的位置に従って音声ファイルから音声を聞くことができるプログラムを作る。これにより聞き手の側が任意の一文または複数の文を確認しながらそれに対応する音声を聞くことができることを特徴とする方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004142901A JP2005301953A (ja) | 2004-04-12 | 2004-04-12 | 聞き手の側のペースで音声とそれに対応する文章を関連させる方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004142901A JP2005301953A (ja) | 2004-04-12 | 2004-04-12 | 聞き手の側のペースで音声とそれに対応する文章を関連させる方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005301953A true JP2005301953A (ja) | 2005-10-27 |
JP2005301953A5 JP2005301953A5 (ja) | 2007-05-17 |
Family
ID=35333356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004142901A Pending JP2005301953A (ja) | 2004-04-12 | 2004-04-12 | 聞き手の側のペースで音声とそれに対応する文章を関連させる方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005301953A (ja) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01293428A (ja) * | 1988-05-20 | 1989-11-27 | Sanyo Electric Co Ltd | 文章作成システム |
JPH02163819A (ja) * | 1988-10-25 | 1990-06-25 | Philips Gloeilampenfab:Nv | テキスト処理装置 |
JPH08248867A (ja) * | 1994-12-07 | 1996-09-27 | M K Denshi Kk | 手帳型翻訳音声発生器 |
JPH09114361A (ja) * | 1995-10-17 | 1997-05-02 | Fuji Xerox Co Ltd | 言語情報出力装置 |
JP2001027997A (ja) * | 1999-07-13 | 2001-01-30 | Sony Corp | 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 |
JP2002297187A (ja) * | 2001-03-30 | 2002-10-11 | Konami Computer Entertainment Yokyo Inc | 音声編集装置及び音声編集プログラム |
JP2002297188A (ja) * | 2001-03-30 | 2002-10-11 | Konami Computer Entertainment Yokyo Inc | 音声編集装置及び音声編集プログラム |
JP2003067388A (ja) * | 2001-08-24 | 2003-03-07 | Japan Science & Technology Corp | 音声データ検索システム |
JP2003098944A (ja) * | 2001-09-13 | 2003-04-04 | Liu Frank | 通信回線を用いた外国語学習方法 |
JP2003131680A (ja) * | 2001-10-23 | 2003-05-09 | Kenji Hiramatsu | 表示文任意選択とその発話音声出力を行う制御方法 |
JP2003167507A (ja) * | 2001-11-30 | 2003-06-13 | Seiko Epson Corp | 携帯型の語学学習装置 |
JP2003307997A (ja) * | 2002-04-15 | 2003-10-31 | Sony Corp | 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体 |
JP2004061625A (ja) * | 2002-07-25 | 2004-02-26 | Sharp Corp | テキスト音声合成装置、テキスト音声合成方法、テキスト音声合成プログラム、および、プログラム記録媒体 |
JP2005507536A (ja) * | 2001-10-31 | 2005-03-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | テキストファイルのディクテーションを筆記するための及びテキストを修正するための方法及びシステム |
-
2004
- 2004-04-12 JP JP2004142901A patent/JP2005301953A/ja active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01293428A (ja) * | 1988-05-20 | 1989-11-27 | Sanyo Electric Co Ltd | 文章作成システム |
JPH02163819A (ja) * | 1988-10-25 | 1990-06-25 | Philips Gloeilampenfab:Nv | テキスト処理装置 |
JPH08248867A (ja) * | 1994-12-07 | 1996-09-27 | M K Denshi Kk | 手帳型翻訳音声発生器 |
JPH09114361A (ja) * | 1995-10-17 | 1997-05-02 | Fuji Xerox Co Ltd | 言語情報出力装置 |
JP2001027997A (ja) * | 1999-07-13 | 2001-01-30 | Sony Corp | 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 |
JP2002297188A (ja) * | 2001-03-30 | 2002-10-11 | Konami Computer Entertainment Yokyo Inc | 音声編集装置及び音声編集プログラム |
JP2002297187A (ja) * | 2001-03-30 | 2002-10-11 | Konami Computer Entertainment Yokyo Inc | 音声編集装置及び音声編集プログラム |
JP2003067388A (ja) * | 2001-08-24 | 2003-03-07 | Japan Science & Technology Corp | 音声データ検索システム |
JP2003098944A (ja) * | 2001-09-13 | 2003-04-04 | Liu Frank | 通信回線を用いた外国語学習方法 |
JP2003131680A (ja) * | 2001-10-23 | 2003-05-09 | Kenji Hiramatsu | 表示文任意選択とその発話音声出力を行う制御方法 |
JP2005507536A (ja) * | 2001-10-31 | 2005-03-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | テキストファイルのディクテーションを筆記するための及びテキストを修正するための方法及びシステム |
JP2003167507A (ja) * | 2001-11-30 | 2003-06-13 | Seiko Epson Corp | 携帯型の語学学習装置 |
JP2003307997A (ja) * | 2002-04-15 | 2003-10-31 | Sony Corp | 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体 |
JP2004061625A (ja) * | 2002-07-25 | 2004-02-26 | Sharp Corp | テキスト音声合成装置、テキスト音声合成方法、テキスト音声合成プログラム、および、プログラム記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Furui et al. | Toward the realization of spontaneous speech recognition | |
Huang | The interplay of perception and phonology in tone 3 sandhi in Chinese Putonghua | |
Prior et al. | Emotion in multilingual interaction | |
Mustazza | Machine-aided close listening: Prosthetic synaesthesia and the 3D phonotext. | |
Al Zahran | Structural challenges in English> Arabic simultaneous interpreting | |
Tseng | ILAS Chinese spoken language resources | |
Engdahl et al. | Preposed object pronouns in mainland Scandinavian | |
Rodero Antón | Peculiar styles when narrating the news: The intonation of radio news bulletins | |
Ernestus et al. | The Nijmegen corpus of casual Czech | |
Taheri-Ardali et al. | The perception of prosodic focus in Persian | |
JP2005301953A (ja) | 聞き手の側のペースで音声とそれに対応する文章を関連させる方法 | |
Muhlack et al. | Revisiting Recall Effects of Filler Particles in German and English. | |
Gahl et al. | That sounds unlikely”: Syntactic probabilities affect pronunciation | |
Hilmisdóttir | The present moment as an interactional resource: The case of nú and núna in Icelandic conversation | |
Goldman et al. | C-PhonoGenre: a 7-hours corpus of 7 speaking styles in French: relations between situational features and prosodic properties. | |
Hsu et al. | Interaction of prosody and syntax-semantics in Mandarin wh-indeterminates | |
Schelfhout et al. | Positions of parentheticals and interjections: A corpus-based approach | |
Yun et al. | Against Intrusive r Strategy in English Vowel Hiatus: Evidence from the Buckeye Corpus and L2 Speech | |
Chong et al. | Collection and annotation of Malay conversational speech corpus | |
Arnhold et al. | The role of syntactic flexibility and prosody in marking given/new distinctions in Finnish | |
Keskinen | Book and Radio Play Silences: Medial Pauses and Reticence in ‘Murke's Collected Silences’ by Heinrich Böll | |
Coppock et al. | ISIS: It’s Not Disfluent, but How Do We Know That? | |
Hole et al. | Linguistics of Vietnamese: An international survey | |
Tsurutani | Early acquisition of palato-alveolar consonants in Japanese: Phoneme frequencies in child-directed speech | |
JP2009163696A (ja) | 聞き手の側のペースで詩とそれに対応する音声を関連させる方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090609 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20090803 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090803 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091002 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20091111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100511 |