JPS58195900A - 音声入力式日本語文書処理装置 - Google Patents

音声入力式日本語文書処理装置

Info

Publication number
JPS58195900A
JPS58195900A JP57079599A JP7959982A JPS58195900A JP S58195900 A JPS58195900 A JP S58195900A JP 57079599 A JP57079599 A JP 57079599A JP 7959982 A JP7959982 A JP 7959982A JP S58195900 A JPS58195900 A JP S58195900A
Authority
JP
Japan
Prior art keywords
long
voice input
dictionary
voice
tsu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57079599A
Other languages
English (en)
Inventor
充宏 斗谷
岩橋 弘幸
西岡 芳樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP57079599A priority Critical patent/JPS58195900A/ja
Publication of JPS58195900A publication Critical patent/JPS58195900A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は入力に音声を用い、それを自動認識してかな文
字列を作成し、その文字列を辞書等との照合を行ない、
該当した項目を認識結果とする音声人力式日本語文書処
理装置に係り2表記通りの発声では入力が困難で、従来
補助入力手段を必要としていた音節、即ち、促音の「っ
」、仮名つかいの「ち」「づ」、長音記号の「−」を補
助人力手段を用いずに特定の発声に置き換えることによ
り自動的に表記通りのかな文字あるいは該当漢字に変換
処理し得るようにした音声入力式日本語文書処理装置を
提供するものである。
促音の1つ」は発声−Lは無音区間であり、完全に連続
な発声の音声を対象とする場合には休止区間として検出
することも可能であるが、確度が低く、単片節の音声入
力を対象とする場合には補助人力手段2例えばキー人力
等で小文字であることの指示操作を実行する必要かある
。また、「ぢ」「つ」は発声トは「じ」「ず」と全く同
じであるために、やはり補助入力手段で区別される必要
があった。また、長音記号の場合には音節の長さで判別
することも可能であるが、促音と同様に確度が低く、特
に単音声の音声入力では極端に長く発声しないとその判
定が困難である。更に、発音−ヒのバラツキがあり、「
メーク」という言葉は「メ)り」と発声する場合と「メ
Iり」と発声する場合とかあり、後者を長音と見なすこ
とができず。
従って辞書との照合ができない。オ段についても同様の
ことが言え、「トータル」は「トオタル」と発声する場
合と「トウタル」と発声する場合があり、長音記りの判
定が出きなかった。
本発明はこのような点に鑑み、上記促音の「つ」、仮名
づかいの「ぢ」「づ」、長音記号「−」の発声を、特定
化した文字列で音声入力するようにしたもので、該文字
列をあらかじめ辞書に記憶させておくことによって辞書
照合させ1表記通りのかな文字あるいは該当漢字に変換
することを特徴としている。
以上9本発明を図面を参考にして説明する。
゛  第1図は本発明の音声入力式日本語文書処理装置
のブロック図である。これによれば1はマイクロフォン
等の音声人力手段であり、単音節ごと発ライされた音声
は単音節識別装置2で識別され、コントローラ3を介し
てメモリ4に転送されこれに記憶される。ここで、メモ
リ4は1文節をドブロックとして識別結果の音節列ある
いは音素列を記憶する。5はあらかじめ見出し語を記憶
している見出し語辞書メモリであり、コントローラ3に
よりメモリ4に記憶された認識結果の音節列あるいはき
素列との、いわゆる辞書照合時に呼び出される。
第2図は本発明装置の動作を説明するためのフローチャ
ートである。以下、音声入力の例として、文節中に(1
)促音「っJ、(2)’rぢ」「づJ、(i)長音記号
「−」が入った場合についてそれぞれ説明する。
(1)促音「っ」の場合 この例文として、「−切」「さっき」「殺気」「五月」
を挙げる。この例文に対して見出し語辞書メモリ5には
次の見出し語とそれに対応した漢字表記か記憶されてい
る。
〔見出し語〕  〔漢字表記〕 いっさい    −切 さつき     さっき さつき     殺気 さつき     五月 装置を動作可能状態に設定し、オペレータは入力したい
文醒を促音の「っ」は大文字の「つ」として発声し、f
lつ音節あるいは音素単位に発声する。マイクロフォン
を通した音声入力は単音節識別装置2で識別され、この
処理は文節または単語の終Yに至るまで繰返される(ス
テップn2〜n4)。例えば“いっさい′”という文節
またはm語としての認識が終了するとフローは次の辞書
の見出し語との照合動作に移項する。即ち、コントロー
ラ3においていま音声入力された“いっさい”に該当す
る見出し語かあるか検索される(ステップn5)。もし
該当するものがなければステップn9に移項して認識結
果はリジェクトされ、メモラ3はその見出し語に対応し
た辞書メモリ5の漢字表記部から°°−切”という漢字
を認識結果として呼び出し1表示装置6にて表示させる
。このように、促音を含む文節または単語は促音の「っ
」を人文字の「っ」として発声入力することにより自動
的に辞書照合され2表記通りの該当漢字に変換される。
(2)「ぢ」「づ」の場合 例えばつづみ、金づち、縮む、近々のように文節中に「
ぢ」あるいは「づ」を含む場合には、見出し語メモリ5
に次の見出し語、と漢字表記を記憶させておくことによ
り、上記(1)の例と同様に辞書照合処理される。
〔見出し語〕    〔漢字表′記〕 つずみ      っづみ かなずち     金っち ちじむ      縮む ちかじか    近々 即ち1例えば“金づち9を入力じたい場合にはオペレー
タは“か′”“な゛パ°ず″“ち”′と発声することに
より、見出し語辞書メモリ5に該当する語かあるか検索
がなされ、該当の漢字表記部力)ら「金つち」か呼ひ出
される。
(3)長片記号「−」の場合 例えば、アース、ケーキのように文節中1こ長音記りが
入った場合には、見出し語辞書メモリ51こ記憶させて
おく見出し語を次の要領で編集しておく。「あ段」(あ
、か、さ・・・)の後の長音記りは「あ」、「い段」の
後の長音記号はIt、)J。
「う段」の後の長音記号は「う」、「え段」の後の長音
記すは「い」または「え」、「お段」の後の長音記すは
「う」または「お」とする。即ち。
次のようにする。
〔見出し語〕   〔漢字表記〕 アアス      アース ケイキ      ケーキ ケエキ      ケーキ 例えば“ケーキ”を入力したい場合にはオペレータは“
ケ゛“イ゛1”キ″あるいは4“ケl′ ”工11“キ
゛と発声することにより、(1)の例と同様に見出し語
辞書メモリ5に該当する語かあるか検索か実行され、該
当の漢字表記部から変換結果としての「ケーキ」が呼び
出され表示装置にて表示される。
以1のように本発明の音声入力式日本語文書処理装置は
、促辞の1つ」、仮名つかいの「ち」「つ」、長片記号
「−」を含む文章について、それらの発声を特定化する
と共に見出し語辞書メモリに特定化された状態で見出し
語を編集しておくことによって、音声入力に伴ない表記
通りのかな文字あるいは該当漢字に自動変換することが
でき。
従来装置で必要としていた補助入力f段およびその操作
を不要とする。
【図面の簡単な説明】
第1図は本発明の音声入力式日本語文書処理装置のブロ
ック図、第2図はその動作を説明するフローチャートで
ある。 1:マイクロフォン   2:単音節識別装置3:コン
トローラ    4:メモリ 5二見出し語辞、!!メモリ 6:表示装置第1図 [2図 丁続補iE書(方式)      ユ/1 !41件の
表示 特願昭57−79599 2 発明の名称 8声人力式日本語文書処理装置 3 補IFをする者 理事長  吉 山 博 吉 4代理人 住 所   〒545大阪市阿倍野区長池町22番22
号5 捕1E命令の日付 (1)委任状 (2)明細書 7、補+Eの内容 (1)委任状を別紙の通り補正致します。 (2)  明細書の浄書(内容に変更なし)以   1

Claims (1)

    【特許請求の範囲】
  1. l 促音の「っ」あるいは/および仮名づかいの「ぢ」
    1つ」あるいは/および長音記す「−」を含む文字列の
    音声認識において1.促音は大文字の「つ」、仮名つか
    いは「じ」「ず」、長音記号は「あ段」の後の長音記号
    は「あ」、「い段」の後の長音記号は「い」、「う段」
    の後の長音記号は「う」、「え段」の後の長音記号は「
    い」または「え」、「お段」の後の長音記号は「う」ま
    たは「お」との文字列としてあらかじめ辞書に登録して
    おき、該文字列の音声入力によって辞書照合処理する手
    段を備え2表記通りのかな文字あるいは該当漢字に変換
    してなる音声人力式日本語文書処理装置。
JP57079599A 1982-05-11 1982-05-11 音声入力式日本語文書処理装置 Pending JPS58195900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57079599A JPS58195900A (ja) 1982-05-11 1982-05-11 音声入力式日本語文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57079599A JPS58195900A (ja) 1982-05-11 1982-05-11 音声入力式日本語文書処理装置

Publications (1)

Publication Number Publication Date
JPS58195900A true JPS58195900A (ja) 1983-11-15

Family

ID=13694466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57079599A Pending JPS58195900A (ja) 1982-05-11 1982-05-11 音声入力式日本語文書処理装置

Country Status (1)

Country Link
JP (1) JPS58195900A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60182495A (ja) * 1984-02-29 1985-09-18 電子計算機基本技術研究組合 日本語音声入力装置
JPS61177574A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61177575A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61177573A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPH03149598A (ja) * 1989-11-07 1991-06-26 Sharp Corp 音声認識装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5680771A (en) * 1979-12-04 1981-07-02 Dainippon Printing Co Ltd "kanji" (chinese character) input device for print
JPS5852738A (ja) * 1981-09-25 1983-03-29 Oki Electric Ind Co Ltd 音声入力和文タイプライタにおける変換方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5680771A (en) * 1979-12-04 1981-07-02 Dainippon Printing Co Ltd "kanji" (chinese character) input device for print
JPS5852738A (ja) * 1981-09-25 1983-03-29 Oki Electric Ind Co Ltd 音声入力和文タイプライタにおける変換方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60182495A (ja) * 1984-02-29 1985-09-18 電子計算機基本技術研究組合 日本語音声入力装置
JPS61177574A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61177575A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61177573A (ja) * 1985-02-04 1986-08-09 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPH03149598A (ja) * 1989-11-07 1991-06-26 Sharp Corp 音声認識装置

Similar Documents

Publication Publication Date Title
US6243680B1 (en) Method and apparatus for obtaining a transcription of phrases through text and spoken utterances
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
KR970707529A (ko) 음성 인식 장치 및 음성 인식 장치용 어휘 발생 방법(speech recognition)
EP1205908A3 (en) Pronunciation of new input words for speech processing
US7406408B1 (en) Method of recognizing phones in speech of any language
JPS58195900A (ja) 音声入力式日本語文書処理装置
US7430503B1 (en) Method of combining corpora to achieve consistency in phonetic labeling
Wasala et al. Sinhala grapheme-to-phoneme conversion and rules for schwa epenthesis
JPS634206B2 (ja)
JP3378547B2 (ja) 音声認識方法及び装置
Iyanda et al. Development of a Yorúbà Textto-Speech System Using Festival
JPS6229796B2 (ja)
Tits MUST&P-SRL: Multi-lingual and Unified Syllabification in Text and Phonetic Domains for Speech Representation Learning
JP2006098994A (ja) 辞書を準備する方法、音響モデルのためのトレーニングデータを準備する方法、およびコンピュータプログラム
JPH03245192A (ja) 外国語単語の発音決定方法
JPH04350699A (ja) テキスト音声合成装置
Kato et al. Multilingualization of speech processing
JP2737122B2 (ja) 音声辞書作成装置
JPS6027433B2 (ja) 日本語情報入力装置
JP2005534968A (ja) 漢字語の読みの決定
JPH02308194A (ja) 外国語学習装置
Singh VOICE BASED SPEAKER IDENTIFICATION SYSTEM
KR100611894B1 (ko) 음성 인식기의 단어 모델 생성 방법
JPH0573039B2 (ja)
JPH04127199A (ja) 外国語単語の日本語発音決定方法