JPS6229796B2 - - Google Patents

Info

Publication number
JPS6229796B2
JPS6229796B2 JP55185815A JP18581580A JPS6229796B2 JP S6229796 B2 JPS6229796 B2 JP S6229796B2 JP 55185815 A JP55185815 A JP 55185815A JP 18581580 A JP18581580 A JP 18581580A JP S6229796 B2 JPS6229796 B2 JP S6229796B2
Authority
JP
Japan
Prior art keywords
section
input
phoneme
speech
symbol string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55185815A
Other languages
English (en)
Other versions
JPS57109997A (en
Inventor
Tsutomu Kawada
Kimito Takeda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP55185815A priority Critical patent/JPS57109997A/ja
Publication of JPS57109997A publication Critical patent/JPS57109997A/ja
Publication of JPS6229796B2 publication Critical patent/JPS6229796B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
本発明は音声入力された言語情報を文法的分析
により言語的に正しい形式に変換修正して入力す
ることのできる言語情報入力装置に関する。 従来、音声認識を利用した言語情報入力装置で
は、一意的に音声入力できなかつた言語情報や誤
つて入力された言語情報に対して、音声を再入力
したり、あるいはキーボード等を操作して修正情
報を入力することが行われている。然乍ら、この
ような修正の為の補助手段を備えていても、これ
を活用するには上記音声入力し解析された言語情
報をフイードバツクして操作者に指示を与える必
要があるので取扱いに困難を伴つた。しかも言語
的に正しい形式で言語情報を効率良く入力するこ
とができなかつた。 一方、文字認識にあつては、文字入力部が機械
的に判読不可能な場合、読取り対象を制限してこ
れに整合する単語、文字記号を検索することによ
つて読取り結果を修正することが行われている。
ところがこのような修正方式は、少数の限定され
た文字単語については極めて効果的ではあるが、
一般的な文章等には殆んどその利点が活かされな
いと云う不具合を有している。まして、これを音
声入力する装置に適用せんとしても、音声入力さ
れる言語情報が書き言葉型式であつたり話し言葉
形式であつたりする為、これに十分対処すること
が殆んど不可能であつた。 本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、音声入力された
言語情報を言語文法的に分析し、これによつて一
意的に決定することができなかつた音素等を自動
的に修正して、例え音声入力の認識率が低下した
場合であつても文法的に正しく表現される言語情
報を効果的に入力することのできる言語情報入力
装置を提供することにある。 即ち本発明は音声入力された言語情報を音素記
号列化し、単語辞書に登録された単語を参照して
一意的に決定することのできない音素に対してそ
の候補を選定し、しかるのちその文法的分析によ
つて音素記号列化された言語情報を修正すること
で上述した目的を効果的に達成したものである。 以下、図面を参照して本発明の一実施例につき
説明する。 図は実施例装置の概略構成を示すもので、音声
入力部1、単語辞書部2、辞書照合部3、言語分
析部4、そして表記修正部5により構成される。 音声入力される文章は、例えば音素単位、文節
単位あるいは所謂べた文として音声入力部1に入
力する。音声入力部1は、音素単位の音響分析デ
ータ等に基づく音素標準パターンと入力音声パタ
ーンとの対比等によつて音素の認識を行つてお
り、例えば仮名文字系列の音素記号列に変換して
いる。例えば、今、文章表記される“漢字など
は”なる言語情報を音声入力すると、音声入力部
1では“かんじなどわ”なる音声情報を取込むこ
とになる。この場合“ん”なる音素については
“ん”あるいは“む”と解釈することがあり、こ
れを一意的に決定することができない虞れがあ
る。従つてこの場合、“ん”と“む”の両方につ
いて認識することになる。このような音声入力に
対して音声入力部1はこれを、あいまい性を含ん
だまま仮名文字系の音素記号列に変換し、例えば
「か、〔ん、む〕、じ、な、ど、わ」なるデータと
して出力する。尚、出力データ中〔 〕で示され
る音素記号“ん”、“む”は一意的に決定すること
のできなかつたものであることを示している。 しかして単語辞書部2には、漢字および品詞の
情報を含む複数の単語が、その読み、品詞、見出
し等を開連させて、例えば次表に示すように格納
されている。
【表】 辞書照合部3は前記音声入力部1にて音声記号
例に変換された言語情報を入力し、その記号列の
冒頭から単語辞書部2に登録された「読み」との
参照対比を行う。この場合、「か、〔ん、む〕、
じ、な、ど、わ」について「か……蚊」、「かん…
…管、感」、「かむ……噛む」、「かんじ……漢字、
幹事」の6つの候補が選出される。しかして、こ
のように選出された候補を含む辞書照合部3の出
力データ(言語情報)が言語分析部4に導かれ
る。この言語分析部4では、上記辞書照合部3で
選出された候補を含む情報について、その例えば
自立語と付属語の関係のような単語レベル、文節
レベルでの文法的な分析と、その結果としての文
法的にあり得ない音素記号列の排除とを行つてい
る。即ち活用語の屈折や助詞、助動詞等の付属
語、補助用言等の相互接続関係を調べて文法的な
入力系列の解析を行つている。尚、この文法的な
解析は、従来より種々提唱されている仮名・漢字
変換アルゴリズム等の解析処理により行われる。 しかして、この例にあつては、“蚊”、“管”、
“管”“噛む”については、これらに文法的に接続
する“ん”、“じ”で始まる助詞や助動詞がないこ
とから、これらは文法的に誤つたものであると判
定されて除去される。また同時に“漢字”、“幹
事”については、これに続く格助詞“わ”が存在
することから“漢字わ”なる情報と“幹事わ”な
る情報とが言語分析結果として得られることにな
る。 ところで音声で表記される言語情報と文章とし
て記すときに表記される言語情報との間には、若
干のずれがある。例えば品詞レベルのずれとして
表われるように、格助詞“わ”を記述する場合、
格助詞“は”と表記する。このような品詞レベル
のずれは、表記修正部5にテーブルとして格納さ
れており、前記言語分析部4は上記テーブルを参
照し、文法構文的に上記格助詞の修正を行つてい
る。この結果、上記分析された情報の格助詞
“わ”が“は”に修正され、例えば“漢字は”お
よび“幹事は”として示されることになる。その
後、補助用言である“など”なるが上記分析結果
データに加えられて“漢字などは”および“幹事
などは”として出力される。これらの結果データ
の最適化判定は、このデータの前後の分析データ
の文法的接続関係より行われる。 以上のように本装置では、音声入力部1にて特
定されなかつた音素記号について、極めて効果的
に修正が加えられることになる。しかもこのよう
な修正は言語分析部4による文法的分析によつて
誤つて変換された音素記号に対しても行われるこ
とになる。従つて、ここに音声入力された言語情
報を適宜効果的に修正して正しく型式化して入力
することが可能となる。故に従来のように入力結
果をフイードバツクしてこれの修正処理を行わし
める等の煩雑な処理が全く不要となる等の絶大な
る効果を奏する。 尚、音声データをそのまま利用する場合には表
記修正部5を用いた格助詞修正を省略することも
勿論可能である。また自己学習によつて候補選出
するデータ範囲を逐次狭くしたり、あるいは優先
順位を定めるようにしてもよい。 以上説明したように本発明によれば、音声入力
された言語情報を記号列化し、これを辞書と照合
して候補を選出して、その音素記号列が単語レベ
ル或いは文節レベルで適正か否かを言語文法的分
析によつて判定しながら上記言語情報を逐次修正
して入力するので、極めて効率の良い音声による
言語情報入力を可能とする。しかも修正アルゴリ
ズムが簡易であるので、その正確性を十分確保す
ることができ、またその取扱いが非常に簡単であ
る等の優れた効果を奏する。
【図面の簡単な説明】
図は本発明の一実施例装置を示す概略構成図で
ある。 1……音声入力部、2……単語辞書部、3……
辞書照合部、4……言語分析部、5……表記修正
部。

Claims (1)

    【特許請求の範囲】
  1. 1 音声入力された言語情報をあいまい性を含ん
    だまま所定の音素記号列に変換する音声入力部
    と、音素記号に対応した漢字および品詞の情報を
    記憶した単語辞書部と、前記音声入力部で一意的
    に決定できなかつた音素記号に対して前記単語辞
    書部を参照して候補音素記号列を選出する辞書照
    合部と、この辞書照合部で選出された漢字および
    品詞を含む候補音素記号列を前記品詞に基づいて
    文法的に分析して候補音素記号列中から漢字を含
    んだ正しい音素記号列を得る言語分析部と、この
    言語分析部から得られた話し言葉形式の音素記号
    列を書き言葉形式の音素記号列に変換して出力す
    る表記修正部と備えたことを特徴とする言語情報
    入力装置。
JP55185815A 1980-12-26 1980-12-26 Word information input device Granted JPS57109997A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55185815A JPS57109997A (en) 1980-12-26 1980-12-26 Word information input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55185815A JPS57109997A (en) 1980-12-26 1980-12-26 Word information input device

Publications (2)

Publication Number Publication Date
JPS57109997A JPS57109997A (en) 1982-07-08
JPS6229796B2 true JPS6229796B2 (ja) 1987-06-29

Family

ID=16177361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55185815A Granted JPS57109997A (en) 1980-12-26 1980-12-26 Word information input device

Country Status (1)

Country Link
JP (1) JPS57109997A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS592124A (ja) * 1982-06-28 1984-01-07 Nippon Telegr & Teleph Corp <Ntt> かな漢字変換方式
JPS59116837A (ja) * 1982-12-23 1984-07-05 Comput Basic Mach Technol Res Assoc 音声入力式日本語文書処理装置
JPS60196869A (ja) * 1984-03-19 1985-10-05 Comput Basic Mach Technol Res Assoc 音声入力式日本語文書処理装置
CN108288468B (zh) * 2017-06-29 2019-07-19 腾讯科技(深圳)有限公司 语音识别方法及装置
JP7278728B2 (ja) * 2018-08-01 2023-05-22 日本ギア工業株式会社 バルブアクチュエータ

Also Published As

Publication number Publication date
JPS57109997A (en) 1982-07-08

Similar Documents

Publication Publication Date Title
US6029132A (en) Method for letter-to-sound in text-to-speech synthesis
US6233553B1 (en) Method and system for automatically determining phonetic transcriptions associated with spelled words
TW546631B (en) Disambiguation language model
JP3481497B2 (ja) 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置
US9978364B2 (en) Pronunciation accuracy in speech recognition
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
KR20230009564A (ko) 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치
JPS6229796B2 (ja)
Khorsheed A HMM-based system to diacritize Arabic text
JPS634206B2 (ja)
SE519273C2 (sv) Förbättringar av , eller med avseende på, tal-till-tal- omvandling
JP2003162524A (ja) 言語処理装置
JP2001188556A (ja) 音声認識方法及び装置
Rao et al. Word boundary hypothesization in Hindi speech
JPS58123126A (ja) 辞書検索装置
JPH11250063A (ja) 検索装置及び検索方法
JPS63153596A (ja) 音声文章入力装置
JPH04232997A (ja) 音声認識装置における認識結果表示方式
JPH04112269A (ja) 認識候補間類似度の差を利用したラティス探索方式
JPH04127199A (ja) 外国語単語の日本語発音決定方法
JPS62208169A (ja) 文章解析処理方式
JPH06289894A (ja) 日本語音声認識方法
JPS6162166A (ja) 日本語文章作成装置
JPH09281993A (ja) 発音記号生成装置
Zhang et al. Text-to-pinyin conversion based on contextual knowledge and D-tree for Mandarin