JPS58195900A - 音声入力式日本語文書処理装置 - Google Patents
音声入力式日本語文書処理装置Info
- Publication number
- JPS58195900A JPS58195900A JP57079599A JP7959982A JPS58195900A JP S58195900 A JPS58195900 A JP S58195900A JP 57079599 A JP57079599 A JP 57079599A JP 7959982 A JP7959982 A JP 7959982A JP S58195900 A JPS58195900 A JP S58195900A
- Authority
- JP
- Japan
- Prior art keywords
- long
- voice input
- dictionary
- voice
- tsu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は入力に音声を用い、それを自動認識してかな文
字列を作成し、その文字列を辞書等との照合を行ない、
該当した項目を認識結果とする音声人力式日本語文書処
理装置に係り2表記通りの発声では入力が困難で、従来
補助入力手段を必要としていた音節、即ち、促音の「っ
」、仮名つかいの「ち」「づ」、長音記号の「−」を補
助人力手段を用いずに特定の発声に置き換えることによ
り自動的に表記通りのかな文字あるいは該当漢字に変換
処理し得るようにした音声入力式日本語文書処理装置を
提供するものである。
字列を作成し、その文字列を辞書等との照合を行ない、
該当した項目を認識結果とする音声人力式日本語文書処
理装置に係り2表記通りの発声では入力が困難で、従来
補助入力手段を必要としていた音節、即ち、促音の「っ
」、仮名つかいの「ち」「づ」、長音記号の「−」を補
助人力手段を用いずに特定の発声に置き換えることによ
り自動的に表記通りのかな文字あるいは該当漢字に変換
処理し得るようにした音声入力式日本語文書処理装置を
提供するものである。
促音の1つ」は発声−Lは無音区間であり、完全に連続
な発声の音声を対象とする場合には休止区間として検出
することも可能であるが、確度が低く、単片節の音声入
力を対象とする場合には補助人力手段2例えばキー人力
等で小文字であることの指示操作を実行する必要かある
。また、「ぢ」「つ」は発声トは「じ」「ず」と全く同
じであるために、やはり補助入力手段で区別される必要
があった。また、長音記号の場合には音節の長さで判別
することも可能であるが、促音と同様に確度が低く、特
に単音声の音声入力では極端に長く発声しないとその判
定が困難である。更に、発音−ヒのバラツキがあり、「
メーク」という言葉は「メ)り」と発声する場合と「メ
Iり」と発声する場合とかあり、後者を長音と見なすこ
とができず。
な発声の音声を対象とする場合には休止区間として検出
することも可能であるが、確度が低く、単片節の音声入
力を対象とする場合には補助人力手段2例えばキー人力
等で小文字であることの指示操作を実行する必要かある
。また、「ぢ」「つ」は発声トは「じ」「ず」と全く同
じであるために、やはり補助入力手段で区別される必要
があった。また、長音記号の場合には音節の長さで判別
することも可能であるが、促音と同様に確度が低く、特
に単音声の音声入力では極端に長く発声しないとその判
定が困難である。更に、発音−ヒのバラツキがあり、「
メーク」という言葉は「メ)り」と発声する場合と「メ
Iり」と発声する場合とかあり、後者を長音と見なすこ
とができず。
従って辞書との照合ができない。オ段についても同様の
ことが言え、「トータル」は「トオタル」と発声する場
合と「トウタル」と発声する場合があり、長音記りの判
定が出きなかった。
ことが言え、「トータル」は「トオタル」と発声する場
合と「トウタル」と発声する場合があり、長音記りの判
定が出きなかった。
本発明はこのような点に鑑み、上記促音の「つ」、仮名
づかいの「ぢ」「づ」、長音記号「−」の発声を、特定
化した文字列で音声入力するようにしたもので、該文字
列をあらかじめ辞書に記憶させておくことによって辞書
照合させ1表記通りのかな文字あるいは該当漢字に変換
することを特徴としている。
づかいの「ぢ」「づ」、長音記号「−」の発声を、特定
化した文字列で音声入力するようにしたもので、該文字
列をあらかじめ辞書に記憶させておくことによって辞書
照合させ1表記通りのかな文字あるいは該当漢字に変換
することを特徴としている。
以上9本発明を図面を参考にして説明する。
゛ 第1図は本発明の音声入力式日本語文書処理装置
のブロック図である。これによれば1はマイクロフォン
等の音声人力手段であり、単音節ごと発ライされた音声
は単音節識別装置2で識別され、コントローラ3を介し
てメモリ4に転送されこれに記憶される。ここで、メモ
リ4は1文節をドブロックとして識別結果の音節列ある
いは音素列を記憶する。5はあらかじめ見出し語を記憶
している見出し語辞書メモリであり、コントローラ3に
よりメモリ4に記憶された認識結果の音節列あるいはき
素列との、いわゆる辞書照合時に呼び出される。
のブロック図である。これによれば1はマイクロフォン
等の音声人力手段であり、単音節ごと発ライされた音声
は単音節識別装置2で識別され、コントローラ3を介し
てメモリ4に転送されこれに記憶される。ここで、メモ
リ4は1文節をドブロックとして識別結果の音節列ある
いは音素列を記憶する。5はあらかじめ見出し語を記憶
している見出し語辞書メモリであり、コントローラ3に
よりメモリ4に記憶された認識結果の音節列あるいはき
素列との、いわゆる辞書照合時に呼び出される。
第2図は本発明装置の動作を説明するためのフローチャ
ートである。以下、音声入力の例として、文節中に(1
)促音「っJ、(2)’rぢ」「づJ、(i)長音記号
「−」が入った場合についてそれぞれ説明する。
ートである。以下、音声入力の例として、文節中に(1
)促音「っJ、(2)’rぢ」「づJ、(i)長音記号
「−」が入った場合についてそれぞれ説明する。
(1)促音「っ」の場合
この例文として、「−切」「さっき」「殺気」「五月」
を挙げる。この例文に対して見出し語辞書メモリ5には
次の見出し語とそれに対応した漢字表記か記憶されてい
る。
を挙げる。この例文に対して見出し語辞書メモリ5には
次の見出し語とそれに対応した漢字表記か記憶されてい
る。
〔見出し語〕 〔漢字表記〕
いっさい −切
さつき さっき
さつき 殺気
さつき 五月
装置を動作可能状態に設定し、オペレータは入力したい
文醒を促音の「っ」は大文字の「つ」として発声し、f
lつ音節あるいは音素単位に発声する。マイクロフォン
を通した音声入力は単音節識別装置2で識別され、この
処理は文節または単語の終Yに至るまで繰返される(ス
テップn2〜n4)。例えば“いっさい′”という文節
またはm語としての認識が終了するとフローは次の辞書
の見出し語との照合動作に移項する。即ち、コントロー
ラ3においていま音声入力された“いっさい”に該当す
る見出し語かあるか検索される(ステップn5)。もし
該当するものがなければステップn9に移項して認識結
果はリジェクトされ、メモラ3はその見出し語に対応し
た辞書メモリ5の漢字表記部から°°−切”という漢字
を認識結果として呼び出し1表示装置6にて表示させる
。このように、促音を含む文節または単語は促音の「っ
」を人文字の「っ」として発声入力することにより自動
的に辞書照合され2表記通りの該当漢字に変換される。
文醒を促音の「っ」は大文字の「つ」として発声し、f
lつ音節あるいは音素単位に発声する。マイクロフォン
を通した音声入力は単音節識別装置2で識別され、この
処理は文節または単語の終Yに至るまで繰返される(ス
テップn2〜n4)。例えば“いっさい′”という文節
またはm語としての認識が終了するとフローは次の辞書
の見出し語との照合動作に移項する。即ち、コントロー
ラ3においていま音声入力された“いっさい”に該当す
る見出し語かあるか検索される(ステップn5)。もし
該当するものがなければステップn9に移項して認識結
果はリジェクトされ、メモラ3はその見出し語に対応し
た辞書メモリ5の漢字表記部から°°−切”という漢字
を認識結果として呼び出し1表示装置6にて表示させる
。このように、促音を含む文節または単語は促音の「っ
」を人文字の「っ」として発声入力することにより自動
的に辞書照合され2表記通りの該当漢字に変換される。
(2)「ぢ」「づ」の場合
例えばつづみ、金づち、縮む、近々のように文節中に「
ぢ」あるいは「づ」を含む場合には、見出し語メモリ5
に次の見出し語、と漢字表記を記憶させておくことによ
り、上記(1)の例と同様に辞書照合処理される。
ぢ」あるいは「づ」を含む場合には、見出し語メモリ5
に次の見出し語、と漢字表記を記憶させておくことによ
り、上記(1)の例と同様に辞書照合処理される。
〔見出し語〕 〔漢字表′記〕
つずみ っづみ
かなずち 金っち
ちじむ 縮む
ちかじか 近々
即ち1例えば“金づち9を入力じたい場合にはオペレー
タは“か′”“な゛パ°ず″“ち”′と発声することに
より、見出し語辞書メモリ5に該当する語かあるか検索
がなされ、該当の漢字表記部力)ら「金つち」か呼ひ出
される。
タは“か′”“な゛パ°ず″“ち”′と発声することに
より、見出し語辞書メモリ5に該当する語かあるか検索
がなされ、該当の漢字表記部力)ら「金つち」か呼ひ出
される。
(3)長片記号「−」の場合
例えば、アース、ケーキのように文節中1こ長音記りが
入った場合には、見出し語辞書メモリ51こ記憶させて
おく見出し語を次の要領で編集しておく。「あ段」(あ
、か、さ・・・)の後の長音記りは「あ」、「い段」の
後の長音記号はIt、)J。
入った場合には、見出し語辞書メモリ51こ記憶させて
おく見出し語を次の要領で編集しておく。「あ段」(あ
、か、さ・・・)の後の長音記りは「あ」、「い段」の
後の長音記号はIt、)J。
「う段」の後の長音記号は「う」、「え段」の後の長音
記すは「い」または「え」、「お段」の後の長音記すは
「う」または「お」とする。即ち。
記すは「い」または「え」、「お段」の後の長音記すは
「う」または「お」とする。即ち。
次のようにする。
〔見出し語〕 〔漢字表記〕
アアス アース
ケイキ ケーキ
ケエキ ケーキ
例えば“ケーキ”を入力したい場合にはオペレータは“
ケ゛“イ゛1”キ″あるいは4“ケl′ ”工11“キ
゛と発声することにより、(1)の例と同様に見出し語
辞書メモリ5に該当する語かあるか検索か実行され、該
当の漢字表記部から変換結果としての「ケーキ」が呼び
出され表示装置にて表示される。
ケ゛“イ゛1”キ″あるいは4“ケl′ ”工11“キ
゛と発声することにより、(1)の例と同様に見出し語
辞書メモリ5に該当する語かあるか検索か実行され、該
当の漢字表記部から変換結果としての「ケーキ」が呼び
出され表示装置にて表示される。
以1のように本発明の音声入力式日本語文書処理装置は
、促辞の1つ」、仮名つかいの「ち」「つ」、長片記号
「−」を含む文章について、それらの発声を特定化する
と共に見出し語辞書メモリに特定化された状態で見出し
語を編集しておくことによって、音声入力に伴ない表記
通りのかな文字あるいは該当漢字に自動変換することが
でき。
、促辞の1つ」、仮名つかいの「ち」「つ」、長片記号
「−」を含む文章について、それらの発声を特定化する
と共に見出し語辞書メモリに特定化された状態で見出し
語を編集しておくことによって、音声入力に伴ない表記
通りのかな文字あるいは該当漢字に自動変換することが
でき。
従来装置で必要としていた補助入力f段およびその操作
を不要とする。
を不要とする。
第1図は本発明の音声入力式日本語文書処理装置のブロ
ック図、第2図はその動作を説明するフローチャートで
ある。 1:マイクロフォン 2:単音節識別装置3:コン
トローラ 4:メモリ 5二見出し語辞、!!メモリ 6:表示装置第1図 [2図 丁続補iE書(方式) ユ/1 !41件の
表示 特願昭57−79599 2 発明の名称 8声人力式日本語文書処理装置 3 補IFをする者 理事長 吉 山 博 吉 4代理人 住 所 〒545大阪市阿倍野区長池町22番22
号5 捕1E命令の日付 (1)委任状 (2)明細書 7、補+Eの内容 (1)委任状を別紙の通り補正致します。 (2) 明細書の浄書(内容に変更なし)以 1
−
ック図、第2図はその動作を説明するフローチャートで
ある。 1:マイクロフォン 2:単音節識別装置3:コン
トローラ 4:メモリ 5二見出し語辞、!!メモリ 6:表示装置第1図 [2図 丁続補iE書(方式) ユ/1 !41件の
表示 特願昭57−79599 2 発明の名称 8声人力式日本語文書処理装置 3 補IFをする者 理事長 吉 山 博 吉 4代理人 住 所 〒545大阪市阿倍野区長池町22番22
号5 捕1E命令の日付 (1)委任状 (2)明細書 7、補+Eの内容 (1)委任状を別紙の通り補正致します。 (2) 明細書の浄書(内容に変更なし)以 1
−
Claims (1)
- l 促音の「っ」あるいは/および仮名づかいの「ぢ」
1つ」あるいは/および長音記す「−」を含む文字列の
音声認識において1.促音は大文字の「つ」、仮名つか
いは「じ」「ず」、長音記号は「あ段」の後の長音記号
は「あ」、「い段」の後の長音記号は「い」、「う段」
の後の長音記号は「う」、「え段」の後の長音記号は「
い」または「え」、「お段」の後の長音記号は「う」ま
たは「お」との文字列としてあらかじめ辞書に登録して
おき、該文字列の音声入力によって辞書照合処理する手
段を備え2表記通りのかな文字あるいは該当漢字に変換
してなる音声人力式日本語文書処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57079599A JPS58195900A (ja) | 1982-05-11 | 1982-05-11 | 音声入力式日本語文書処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57079599A JPS58195900A (ja) | 1982-05-11 | 1982-05-11 | 音声入力式日本語文書処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58195900A true JPS58195900A (ja) | 1983-11-15 |
Family
ID=13694466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57079599A Pending JPS58195900A (ja) | 1982-05-11 | 1982-05-11 | 音声入力式日本語文書処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58195900A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60182495A (ja) * | 1984-02-29 | 1985-09-18 | 電子計算機基本技術研究組合 | 日本語音声入力装置 |
JPS61177574A (ja) * | 1985-02-04 | 1986-08-09 | Matsushita Electric Ind Co Ltd | 日本語文章作成装置 |
JPS61177575A (ja) * | 1985-02-04 | 1986-08-09 | Matsushita Electric Ind Co Ltd | 日本語文章作成装置 |
JPS61177573A (ja) * | 1985-02-04 | 1986-08-09 | Matsushita Electric Ind Co Ltd | 日本語文章作成装置 |
JPH03149598A (ja) * | 1989-11-07 | 1991-06-26 | Sharp Corp | 音声認識装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5680771A (en) * | 1979-12-04 | 1981-07-02 | Dainippon Printing Co Ltd | "kanji" (chinese character) input device for print |
JPS5852738A (ja) * | 1981-09-25 | 1983-03-29 | Oki Electric Ind Co Ltd | 音声入力和文タイプライタにおける変換方法 |
-
1982
- 1982-05-11 JP JP57079599A patent/JPS58195900A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5680771A (en) * | 1979-12-04 | 1981-07-02 | Dainippon Printing Co Ltd | "kanji" (chinese character) input device for print |
JPS5852738A (ja) * | 1981-09-25 | 1983-03-29 | Oki Electric Ind Co Ltd | 音声入力和文タイプライタにおける変換方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60182495A (ja) * | 1984-02-29 | 1985-09-18 | 電子計算機基本技術研究組合 | 日本語音声入力装置 |
JPS61177574A (ja) * | 1985-02-04 | 1986-08-09 | Matsushita Electric Ind Co Ltd | 日本語文章作成装置 |
JPS61177575A (ja) * | 1985-02-04 | 1986-08-09 | Matsushita Electric Ind Co Ltd | 日本語文章作成装置 |
JPS61177573A (ja) * | 1985-02-04 | 1986-08-09 | Matsushita Electric Ind Co Ltd | 日本語文章作成装置 |
JPH03149598A (ja) * | 1989-11-07 | 1991-06-26 | Sharp Corp | 音声認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6243680B1 (en) | Method and apparatus for obtaining a transcription of phrases through text and spoken utterances | |
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
KR970707529A (ko) | 음성 인식 장치 및 음성 인식 장치용 어휘 발생 방법(speech recognition) | |
EP1205908A3 (en) | Pronunciation of new input words for speech processing | |
US7406408B1 (en) | Method of recognizing phones in speech of any language | |
JPS58195900A (ja) | 音声入力式日本語文書処理装置 | |
US7430503B1 (en) | Method of combining corpora to achieve consistency in phonetic labeling | |
Wasala et al. | Sinhala grapheme-to-phoneme conversion and rules for schwa epenthesis | |
JPS634206B2 (ja) | ||
JP3378547B2 (ja) | 音声認識方法及び装置 | |
Iyanda et al. | Development of a Yorúbà Textto-Speech System Using Festival | |
JPS6229796B2 (ja) | ||
Tits | MUST&P-SRL: Multi-lingual and Unified Syllabification in Text and Phonetic Domains for Speech Representation Learning | |
JP2006098994A (ja) | 辞書を準備する方法、音響モデルのためのトレーニングデータを準備する方法、およびコンピュータプログラム | |
JPH03245192A (ja) | 外国語単語の発音決定方法 | |
JPH04350699A (ja) | テキスト音声合成装置 | |
Kato et al. | Multilingualization of speech processing | |
JP2737122B2 (ja) | 音声辞書作成装置 | |
JPS6027433B2 (ja) | 日本語情報入力装置 | |
JP2005534968A (ja) | 漢字語の読みの決定 | |
JPH02308194A (ja) | 外国語学習装置 | |
Singh | VOICE BASED SPEAKER IDENTIFICATION SYSTEM | |
KR100611894B1 (ko) | 음성 인식기의 단어 모델 생성 방법 | |
JPH0573039B2 (ja) | ||
JPH04127199A (ja) | 外国語単語の日本語発音決定方法 |