JPS61177574A - 日本語文章作成装置 - Google Patents

日本語文章作成装置

Info

Publication number
JPS61177574A
JPS61177574A JP60019467A JP1946785A JPS61177574A JP S61177574 A JPS61177574 A JP S61177574A JP 60019467 A JP60019467 A JP 60019467A JP 1946785 A JP1946785 A JP 1946785A JP S61177574 A JPS61177574 A JP S61177574A
Authority
JP
Japan
Prior art keywords
character
kana
independent word
kana character
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60019467A
Other languages
English (en)
Inventor
Hideyuki Takagi
英行 高木
Akiko Nakajima
中嶋 章子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60019467A priority Critical patent/JPS61177574A/ja
Publication of JPS61177574A publication Critical patent/JPS61177574A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声入力によって日本語文章を作成する日本
語文章作成装置に関するものである。
従来の技術 従来の日本語文章作成装置としては、例えば「101個
の単音節を認識する音声入力の日本語ワード・プロセッ
サを試作」2日経エレクトロニクス+pp66〜68,
1983.6.6に示されている。
第6図はこの従来の日本語文章作成装置の構成図を示す
ものであシ、1は音声認識部、2は音声認識部1から得
られた認識結果を一時記憶するバッファ、3はバッファ
2に一時記憶されたかな列中の自立語に対応する漢字を
検索する自立語検索部、61は自立語のよみと漢字を対
にして登録しである自立語辞書、6は、自立語辞書51
から読み出された漢字コードあるいは、入力バッファ2
に一時記憶されたかな文字列に対応する表示かな文字を
一時記憶する表示バッファ、7は表示バッフ76の内容
を表示する表示部である。
以上のように構成された従来の日本語文章作成装置につ
いて以下その動作を説明する。
音声入力によって「通り」という日本語文章を作成する
場合を考えよう。キーボード入力と異なり、音声入力の
場合は、「とおシ」「とうり」となる場合もあり得る。
また「オ」段に続く長母音化文字の発声の間開違いやす
さ、認識誤シのしやすさから考えると「とうシ」と音声
認識部が出力しても正しく「通り」が得られることが望
まれている。従って自立語辞書51には、「とうり」。
「とおり」の2種の読み方と漢字コード「通り」とが関
係付けられている。
音声で「通シ」をあいまいに発声すると音声認識部1は
「とうり」を入カパッフ72へ出力する。
自立語検索部4は入力バッファ2中の自立語部「とうり
」が自立語辞書51に読みとして登録されているかどう
かを検索する。そして読みが見つかれば、読みに対応す
る漢字コードを表示バッフ76へ格納する。表示部7は
表示バッフ76の内容「通り」を表示する。もちろん以
下同様にして、「とおり」と認識されても「通り」の漢
字が表示される。
発明が解決しようとする問題点 しかしながら上記のような構成では、オ段に続く長母音
化文字のあt/1まいな発声に対処するため1つの漢字
の読みを複数個用意して自立語辞書に登録しておかねば
ならず、自立語辞書サイズの増大すなわちコスト高をま
ねくという問題点を有していた。
本発明はかかる点に鑑み、1つの漢字に対し1種の読み
を登録するだけでもあいまいな発声に対処できる日本語
文章作成装置を提供することを目的とする。
問題点を解決するための手段 本発明は、「オ」段のかな文字に続くかな文字「う」を
捜し出し「お」を音声認識候補として当該かな文字「う
」に追加する長母音化文字変換部を備えた日本語文章作
成装置である。
作    用 本発明は前記した構成により、あいまいな発声のために
表記上「お」と認識されるべき所が「う」と認識されて
も、長母音化文字変換部で「お」の可能性をも検討する
ため自立語辞書サイズを増加させることなく日本語文章
が作成できるのである。
実施例 第1図は本発明の日本語文章作成装置の構成図を示すも
のである。第1図において、3は入力バッファ2に一時
記憶されたかな文字列中の「オ」段のかな文字に続くか
な文字「う」を捜し出し、「お」を音声認識候補として
当該かな文字「う」に追加する長母音化文字変換部、6
0は日本語自立語から構成されるか日本語自立語が中心
となって構成されている自立語辞書である。
第2図は本発明の日本語文章作成装置の一実施例におけ
る長母音化文字変換部3の構成図である。
第2図において、31は入力バッファ2中のかな文字列
中から「オ」段に続くかな文字「う」を捜し「う」と「
お」の2種類のかな文字を、その他のかな文字の時はそ
の1種類かな文字を入力順に関係付は二分木を作成する
二分木作成部、32は二分木作成部31が二分本を作成
する二分木用バッファ、33は二分木作成部31で作成
された二分木用バッファ32上の二分木をたどりかな文
字列を生成する二分木トレー3部、34は二分木トレー
ス部33で生成されたかな文字列を一時記憶するかな文
字列候補用バッファ、36はかな文字列候補用バッファ
34のかな文字列候補を順次自立語検索部4へ送る表示
文字判定部で、自立語検索部4がかな文字列に対応した
漢字コードを返して来た時はその漢字コードを表示バッ
ファ6へ出力し、また自立語検索部4へ送ったかな文字
列が自立語辞書6oに登録されていないために自立語検
索部4から漢字コードが返って来ない時はかな文字列候
補用バッファ34中の次のかな文字列を自立語検索部4
へ送シ、すべてのかな文字列候補を全て自立語検索部4
へ送っても対応する漢字コードが得られない時は、入力
バッファ2中のかな文字列を表示バッフ76へ送る。
以上のように構成された本実施例の日本語文章作成装置
について、以下その動作を説明する。
音声入力によって「通シ」という日本語文章を作成する
場合を考える。音声で「通り」の長母音\化文字をあい
まいに発声すると音声認識部1は「とうり」を入力バッ
フ72へ出力する。すると長母音化文字変換部3は以下
の処理でかな文字列候補を生成する。
この説明のために、二分木用バッファ32の構成を第3
図に示す。第3図において、二分木用バッファ32をt
reec)と表現する。二分木用バッファ32の各要素
は、3つのデータから構成される。32aはかな文字を
、32bと32cはかな文字とかな文字との連接関係を
示す。32a、32b。
32cの各データを各々trseOskana、tre
eO*1eft、tree()arightと表現しよ
う。すると、二分木作用部31は第4図の流れ図に従っ
て処理を行う。なお、第4図における各変数の説明を第
1表に示す。
第1表 第4図に従い、「とうシ」が入力バッファ2に一時記憶
されている時の二分木作成部31の処理を説明する。
つ まず、1に「とうり」の長さが代入される。
31aでは1nbuf(3)が〔す〕であり「う」では
ないので、31dへ処理が移る。そしてtree(1)
へ「シ」を登録し、圧子32bと君子32cをθにする
。31eでpleft、pright  には「シ」を
登録したtree(1)  のインデックス値1を代入
する。再び31aに処理が流れると、1nbuf(2)
は「う」であり1nbuf(1) (「と」)の母音が
「オ」であるからYへ進む。31bでtree(2)。
tree(3)  に各々「う」、「お」を登録し、圧
子32bと君子32Cには「#)」を登録したtree
(1〕のインデックス値1を代入する。最後に1nbu
f(1)(「と」)がtree(4)に登録し、圧子t
ree(4)・lef tには「う」を登録したtre
e(2)  のインデックス値2を、君子trte(4
)−rightには「お」を登録したtree(3)の
インデックス値3を代入する。
以上より、第6図に示す二分木が二分木用バッファ32
に生成される。二分木トレース部33は、この二分木を
左から順にトレースしてがな文字列候補を生成して、か
な文字列候補用バッファ34ヘ一時記憶する。すなわち
、 ■ とうり ■ とおり がかな文字列候補用バッファに一時記憶される。
表示部文字判定部は、■と■を順に自立語検索部4へ送
り、自立語検索部4が漢字コードを返して来たらその漢
字コードを表示バッファ6へ送る。
もし、かな文字列候補全てを自立語検索部へ送っても漢
字コードが返ってこない時は、認識誤りをおこしている
か、正しい自立語が得られていないと判断し、入力バッ
フ12の内容をかな文字のまま表示バッファ6へ送シ、
表示部7でかな表示をさせる。上記例の場合、■「とお
り」を自立語検索4へ送ると、自立語辞書50から漢字
コード「通シ」を読み出してくるので、表示部7で漢字
が表示される。
以上のように本実施例によれば、「オ」段のかな文字に
続くかな文字「う」に「お」を認識候補として追加する
長母音化文字変部6を設けることKよって、自立語辞書
に長母音化表記の読みを登録することなく、長母音化発
声に対応させることができる。
発明の詳細 な説明したように、本発明によれば、長母音化表記の読
みを自立語辞書に登録することなくあいまいな長母音化
発声に対応できるので、自立語辞書のだめのメモリコス
トを上げることなく操作性の高い日本語文章作成装置を
実現でき、その実用的効果には大なるものがある。
【図面の簡単な説明】
第1図は本発明の日本語文章作成装置における構成図、
第2図は本発明の一実施例における日本語文章作成装置
のうち、長母音化文字変換部の構成図、第3図は本発明
の一実施例における日本語文章作成装置のうち二分木用
バッファのデータ構造図、第4図は本発明の一実施例に
おける日本語文章作成装置のうち二分木作成部の処理流
れ図、第5図は本発明の一実施例における日本語文章作
成装置が「てえせえ」と入力音声を認識した時の二分木
作成部で生成された二分木を示す説明図、第6図は従来
の日本語文章作成装置の構成図である。 1・・・・・・音声認識部、2・・・・・・入力バッフ
ァ、3・・・・・・長母音化文字変換部、4・・・・・
・自立語検索部、6゜・・・・・・本発明の日本語文章
作成装置の自立語辞書、61・・・・・・従来の日本語
文章作成装置の自立語辞書、6・・・・・・表示バッフ
ァ、7・・・・・・表示部、31中川二分木作成部、3
2・・・・・・二分木用バッファ、33・・・・・・二
分木トレース部、34・・川・がな文字列候補用バッフ
ァ、36・・・・・・表示文字判定部。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第1
図 第2図 、? 第3図 第4図 第5図 第6図 !

Claims (1)

    【特許請求の範囲】
  1. 日本語音声を認識し認識結果をかな文字に対応するコー
    ドとして出力する音声認識手段と、前記音声認識手段か
    ら得られるかな文字列を一時記憶する入力バッファと、
    前記入力バッファ中に一時記憶された文字列の中の「オ
    」段のかな文字に続くかな文字「う」を捜し出し「お」
    を音声認識候補として前記かな文字「お」に追加しかな
    文字列候補を作成する長母音化文字変換部と、少なくと
    も日本語自立語から構成される自立語辞書と、前記長母
    音化文字変換部で作成されたかな文字列候補で前記自立
    語辞書を検索する自立語辞書検索部と、前記音声認識手
    段から出力されたかな文字列あるいは前記自立語検索部
    で検索された漢字文字を表示する表示部とを備えたこと
    を特徴とする日本語文章作成装置。
JP60019467A 1985-02-04 1985-02-04 日本語文章作成装置 Pending JPS61177574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60019467A JPS61177574A (ja) 1985-02-04 1985-02-04 日本語文章作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60019467A JPS61177574A (ja) 1985-02-04 1985-02-04 日本語文章作成装置

Publications (1)

Publication Number Publication Date
JPS61177574A true JPS61177574A (ja) 1986-08-09

Family

ID=12000123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60019467A Pending JPS61177574A (ja) 1985-02-04 1985-02-04 日本語文章作成装置

Country Status (1)

Country Link
JP (1) JPS61177574A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5464446A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information processing system for japanese word
JPS58195900A (ja) * 1982-05-11 1983-11-15 電子計算機基本技術研究組合 音声入力式日本語文書処理装置
JPS59121400A (ja) * 1982-12-28 1984-07-13 富士通株式会社 音声処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5464446A (en) * 1977-10-31 1979-05-24 Fujitsu Ltd Information processing system for japanese word
JPS58195900A (ja) * 1982-05-11 1983-11-15 電子計算機基本技術研究組合 音声入力式日本語文書処理装置
JPS59121400A (ja) * 1982-12-28 1984-07-13 富士通株式会社 音声処理装置

Similar Documents

Publication Publication Date Title
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
JP2003514304A5 (ja)
JPH01501977A (ja) 言語翻訳システム
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JPH10326275A (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
KR100369507B1 (ko) 표준 발음법 분석에 기반한 음성 인식/합성 시스템 및 방법
JP3758241B2 (ja) 音声情報検索装置
JPS58123129A (ja) 仮名漢字変換装置
JPS61177574A (ja) 日本語文章作成装置
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JP3470927B2 (ja) 自然語解析方法及び装置
JPS61177575A (ja) 日本語文章作成装置
JPH11338498A (ja) 音声合成装置
JPS61177573A (ja) 日本語文章作成装置
JP2655711B2 (ja) 同形語読み分け方式
JPS58123126A (ja) 辞書検索装置
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JP2003005776A (ja) 音声合成装置
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JP3084864B2 (ja) 文章入力装置