JPH0560880B2 - - Google Patents

Info

Publication number
JPH0560880B2
JPH0560880B2 JP8736491A JP3649187A JPH0560880B2 JP H0560880 B2 JPH0560880 B2 JP H0560880B2 JP 8736491 A JP8736491 A JP 8736491A JP 3649187 A JP3649187 A JP 3649187A JP H0560880 B2 JPH0560880 B2 JP H0560880B2
Authority
JP
Japan
Prior art keywords
tone
chinese
section
character pattern
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP8736491A
Other languages
English (en)
Other versions
JPS6312024A (ja
Inventor
Tadao Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Publication of JPS6312024A publication Critical patent/JPS6312024A/ja
Publication of JPH0560880B2 publication Critical patent/JPH0560880B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、中国語の検索方式に関し、特に、中
国語の〓音(発音)と声調(四声)とで発音し、
音声信号から発音記号と声調記号とに変換し、中
国語を検索して、中国語文字を出力する中国語の
音声認識による中国語の検索方式に関する。
〔従来の技術〕
従来、この種の中国語の漢字の検索では、タブ
レツト方式が採用されている。このタブレツト方
式とは、中国語の全漢字がタブレツト上に印刷さ
れ、印刷された漢字にコードが付けられ、タブレ
ツト上の漢字が人手により検出され、ペンタツチ
等の押下により漢字のコードが情報処理システム
に送出され、コードに合つた漢字文字パターンデ
ータがCRT上に表示されて検索する方式である。
〔発明が解決しようとする問題点〕
上述した従来の中国語の漢字の検索方式では、
タブレツト上の中国語の全漢字の内から1個の漢
字を検出しなければならないため多大な検索時間
を必要とするという欠点がある。
〔問題点を解決するための手段〕
本発明の音声認識による中国語の検索方式は、 デイスプレイとキーボードとを有し中国語をフ
アイルから検索する中国語の検索方式において、 一語ずつ発音された中国語の音声に応答して該
音声に対応した発音記号と声調記号を出力する中
国語の音声認識装置と、 中国語の漢字/数字の発音記号と声調記号とに
合わせて中国語の漢字/数字の文字パターンを記
憶する漢字文字パターンフアイルと、 前記中国語の音声認識装置からの発音記号およ
び声調記号に応答してこの発音記号および声調記
号に合つた漢字文字パターンを前記漢字文字パタ
ーンフアイルから読出して前記デイスプレイに中
国語の漢字/数字を表示するとともに、表示され
た漢字/数字の内から目的の漢字/数字を前記キ
ーボードからの入力で選択するシステムとを含
む。
〔実施例〕
以下本発明である音声認識による中国語の検索
システムについて図面を参照しながら詳細に説明
する。
第1図を参照すると、本発明の一実施例は、音
声入力をするための音声入力部2、データ入力の
ためのキーボード4、発音記号、声調、中国語の
漢字、および入力データの少なくとも1つを表示
するためのCRT3、音声符号化データ、論理ア
ドレス、発音記号および声調を北京語音表の順に
フアイルするための標準パターンフアイル6、お
よびこれらの構成要素を制御する制御部5から構
成される中国語の音声認識装置1と、情報処理シ
ステム7と、発音記号と声調からなる組の順に中
国語の漢字/数字文字パターンをフアイルするた
めの漢字文字パターンフアイル8とを備えてい
る。
次に、中国語の音声認識装置1を使用した中国
語の検索方式の動作を詳細に説明する。
例えば、“我在日本国学〓中文”という文を検
索する場合、音声入力部2に、一語ずつ発音記号
と声調に合わせて、“〓 wo zai` ri` 〓 ben guo´ xue´
x`i´ zho ̄ng we ̄n”と発音する。次にこの音声を

力し認識する中国語の音声認識装置1の構成と動
作を第1図、第2図および第3図を参照して詳細
に説明する。音声認識の前提として、標準パター
ンフアイル6の作成が必要である。この標準パタ
ーンフアイル6の作成は以下のようにして行なわ
れる。第2図を参照すると、例えば発音記号
“wo”と声調“第3声(〓)”とを合わせて音声
“〓 wo”が発音されるとき、キーボード4で発音記
号データ“wo”および声調記号データ“3”が
打鍵される。このようにして打鍵されたデータ
“wo”および“3”は、キーボード制御部58の
発音/声調記号データ部582を介してフアイル
制御部57に与えられ、発音/声調記号書込部5
72により標準パターンフアイル6の所定のアド
レス、例えば第3図に示すアドレスn7に記憶され
る。このときデータ“wo”および“3”がフア
イル制御部57に与えられるとともに、フアイル
作成処理である旨の信号が検索/フアイル作成検
出部62に与えられる。
このような状態で発音された音声“〓 wo”は、
音声入力部2で電気信号に変換され増幅されロー
パスフイルタを介してアナログ・デジタル変換さ
れる。この一例は米国特許4239936号公報第3図
および第4欄の記載を参照できる。このように変
換されたデジタル形式の音声電気信号は、音声符
号化制御部2において、例えば適応型差動パルス
符号変調(ADPCM)方式によりデジタル符号化
される。このような方式でデジタル符号化された
音声符号化データは記憶部61に記憶されたあと
読出され、検索/フアイル作成検出部62に与え
られる。検索/フアイル作成検出部62は前述の
信号でフアイル作成処理であることを検出してい
るため、与えられた音声符号化データをフアイル
制御部57の音声符号化データ書込部571に与
える。この音声符号化データ書込部571は、標
準パターンフアイル6の所定のアドレス、例えば
第3図に示すアドレスn7に音声符号化データを記
憶する。このような方式で第3図に示す「阿」、
「日」、「在」、「本」、「中」、「〓」、「国」、「
文」、
「学」、「慰」のそれぞれの音声符号化データ、発
音記号および声調の組が所定のアドレスに格納さ
れ、標準パターンフアイル6が作成される。次に
本発明の検索方式のうちの音声認識処理について
詳細に説明する。まず、発声された音声された音
声“〓 wo”は、音声入力部2でデイジタル信号に
変換され、音声符号化制御部2において、デジタ
ル符号化され、音声符号化データとして記憶部6
1に記憶される。このときはキーボード4からの
データは与えられていないため、記憶部61から
読出された音声符号化データは、検索/フアイル
作成検出部62で検索処理と検出され、比較制御
部51に与えられる。一方、標準パターンフアイ
ル6からは、音声符号化データ読出部573によ
り音声符号化データが順次読出され、比較制御部
51に与えられる。比較制御部51では、検索/
フアイル作成検出部62から与えられるデータ
と、音声符号化データ読出部573から順次与え
られるデータとが順次比較される。一致判断部5
2は比較結果データに基づいて、一致または不一
致の判断がなされる。一致と判断されない限り、
比較終了検出部53で標準パターンフアイル6の
最終データと判断されるまで比較制御部51で比
較動作が繰返される。この結果、最終データまで
不一致と判断され続けたときには、比較終了検出
部53で終了信号を発生する。エラー表示制御部
55はこの終了信号に応答してエラーメツセージ
読出部575にエラーメツセージ読出指示を送出
する。エラーメツセージ読出部575はこの指示
に応答して標準パターンフアイル6からエラーメ
ツセージを読出し、エラーメツセージ表示部56
2に送出する。エラー表示制御部55は前記終了
信号に応答してエラーメツセージ表示部562に
表示指示を出力する。エラーメツセージ表示部5
62はこの表示指示に応答して、エラーメツセー
ジ読出部575から与えられるエラーメツセージ
をCRT3に表示する。このエラーメツセージは
中国語の発音が悪く標準パターンフアイル6には
記憶されていない発音である旨が示され、発音で
検索する人はもう一度正しい中国語の発音での発
声を試みる。
一方、前記一致判断部52で一致と判断される
と、発音記号発生指示部54はフアイル制御部5
7の発音/声調記号読出部574に読出指示を出
す。この読出指示に応答して、発音/声調記号読
出部574は、標準パターンフアイル6から発音
記号“wo”と声調“3”とを読み出し通信制御
部59の送信部591を介して情報処理システム
7に送出する。これとともに、発音記号発生指示
部54は表示指示をCRT制御部56の発音/声
調記号表示部561に与え、この発音/声調記号
表示部561は発音/声調記号読出部574から
の発音記号“wo”および声調“3”をCRT3に
表示する。
次にこの発音記号“wo”および声調“3”を
与えられた情報処理システム7および漢字文字パ
ターンフアイル8の構成およびそれらの動作につ
いて第1図、第4図および第5図を参照して詳細
に説明する。第1図および第4図を参照すると、
中国語の音声認識装置1の制御部5から与えられ
る発音記号“wo”と声調“3”は情報処理シス
テム7の通信制御部71を介して記憶部72に記
憶される。発音/声調比較部73は記憶部72か
ら読出される発音記号“wo”および声調“3”
と、漢字文字パターンフアイル8の第5図に示さ
れる発音記号“A”および声調“1”とが比較さ
れる。比較結果が不一致であるため、不一致が終
了検出部74に通知される。終了検出部74は、
発音/声調比較部73で、漢字文字パターンフア
イル8の全ての発音記号/声調と記憶部72から
与えられる発音記号/声調との比較が終了したか
否かを判断し、終了していなければ終了するまで
比較動作を順次繰返すよう発音/声調比較部73
に指示する。発音/声調比較部73で、記憶部7
2から読出される発音記号“wo”および声調
“3”と、漢字文字パターンフアイル8の第5図
に示される発音記号“wo”および声調“3”と
が比較される。比較結果は一致を示すため、第5
図に示される発音記号“wo”および声調“3”
と同じ組にある漢字文字パターン“1.我”が記憶
部72に記憶される。この漢字文字パターン“1.
我”は記憶部72から通信制御部71を介して制
御部5に送られる。
発音/声調比較部73で、漢字文字パターンフ
アイル8からの全ての発音/声調が比較された結
果、一致がとられないまま、終了検出部74で終
了が検出されたときには、エラーメツセージ発生
部75はエラーメツセージを発生する。このエラ
ーメツセージは通信制御部71を介して制御部5
に与えられる。次に情報処理システム7から読出
された漢字文字パターンおよびエラーメツセージ
の選択表示処理について第1図、第2図、および
第5図を参照して詳細に説明する。
まず漢字文字パターンの表示処理について以下
説明する。第1図および第2図を参照すると、情
報処理システム7から与えられた漢字文字パター
ン「1.我」は通信制御部59の受信部592およ
びCRT制御部56の漢字文字パターン表示部5
63を介してCRT3に表示される。このとき漢
字文字パターンは「1.我」一文字のみであるため
選択処理をする必要はない。なお、CRT画面に
はこの漢字文字パターン「1.我」の他、発音/声
調記号読出部574により標準パターンフアイル
6から読出され、発音/声調記号表示部561を
介してCRT3に発音記号「wo」および声調
「3」が表示されている。従つて、CRT画面には
「wo」および「3」の他「1.我」が表示される。
次に漢字文字パターンの表示のために選択処理の
必要な例を説明する。
検索は“我在日本国学〓中文”であるため、
「我」の次にキーボード4から発音記号データ
「ZAI」および声調記号データ“4”が入力され
るとともに「za`」が発音され音声入力部2で入
力される。このあと前述と同じ方式で標準パター
ンフアイル6の論理アドレスn2から発音記号
「ZAI」および声調「3」が読出されCRT3に表
示されるとともに情報処理システム7に送られ
る。情報処理システム7では発音記号「ZAI」お
よび声調「3」と一致のとれる漢字文字パターン
「1.再、2.在、3.〓」が漢字文字パターンフアイル
7から読み出され制御部5に送出される。制御部
5では受信部592および漢字文字パターン表示
部563を介してCRT3に「1.再、2.在、3.〓」
が表示される。検索者はこのCRT3画面をみて、
キーボード4から数字データ「3」を打鍵する。
この数字データ「3」はキーボード制御部58の
数字データ部581を介してCRT制御部56の
漢字文字パターン選択部564に与えられる。漢
字文字パターン選択部564は漢字文字パターン
表示部563により表示されているパターン「1.
再、2.在、3.〓」のうち「3.〓」のみを表示する
よう選択指示を、漢字文字パターン表示部563
に与える。漢字文字パターン表示部563はこの
指示に応答して「3.〓」のみを選択し、CRT3
に表示する。
次に制御部5から情報処理システム7に与えら
れた発音記号および声調が漢字文字パターンフア
イル8にないとき発生されるエラーメツセージの
制御部5での処理について説明する。第2図を参
照すると、第1図の情報処理システム7から発生
されるエラーメツセージは通信制御部59の受信
部592およびCRT制御部56の漢字文字パタ
ーン表示部563を介してCRT3に表示される。
この時、CRT3には、発音/声調記号読出部5
74により標準パターンフアイル6から読出さ
れ、発音/声調記号表示部561を介して送られ
た発音記号および声調が表示されている。したが
つて、CRT3には発音記号、声調の他エラーメ
ツセージが合成されて表示される。この結果、検
索者は中国語の発音は良かつたが、漢字文字パタ
ーンフアイル8に発音された中国語の漢字文字パ
ターンが存在しないことを認識する。上述の方式
を利用することにより、“我在日本国学〓中文”
のうち残りの“日本国学〓中文”も1語ずつ以下
のように検索される。すなわち、音声入力部2か
ら“ri`”が入力されるとともにキーボード4から
発音記号“RI”および声調“4”が入力される。
この入力に応答して、制御部5は標準パターンフ
アイル6のアドレスn1にある発音記号「RI」お
よび声調「4」を読出し、CRT3に表示すると
ともに、情報処理システム7に送出する。情報処
理システム7はこの発音記号「RI」および声調
「4」に基づいて漢字文字パターンフアイル8か
ら漢字文字パターン「1.日」を読出し、制御部5
を介してCRT3に表示する。
次に音声入力部2から“〓 ben”が入力されると
ともにキーボード4から発音記号“BEN”およ
び声調“3”が入力される。この入力に応答して
制御部5は標準パターンフアイル6のアドレスn3
にある発音記号「BEN」および声調「3」を読
出し、CRT3に表示するとともに、情報処理シ
ステム7に送出する。情報処理システム7は、こ
の発音記号「BEN」および声調「4」に基づい
て漢字文字パターンフアイル8から漢字文字パタ
ーン「1.本、2.番、3〓」を読出し、制御部5を
介してCRT3に表示する。検索者により数字デ
ータ「1」がキーボード4に打鍵されることによ
り漢字文字パターン「1.本」のみが選択され、
CRT3に表示され、他の漢字パターン「2.番、3.
〓」はCRT3の画面から削除される。
それから、音声入力部2から“gu´o”が入力さ
れるとともにキーボードから発音記号“GUO”
および声調“2”が入力される。この入力に応答
して制御部5は標準パターンフアイル6のアドレ
スn6にある発音記号「GUO」および声調「2」
を読出し、CRT3に表示するとともに、情報処
理システム7に送出する。情報処理システム7は
この発音記号「GUO」および声調「2」に基づ
いて漢字文字パターンフアイル8から漢字文字パ
ターン「1.国、2.中国、3.掴、4.〓、5.〓、6.〓、
7〓」を読出し、制御部5を介してCRT3に表
示する。検索者により数字データ「1」がキーボ
ード4に打鍵されることにより漢字文字パターン
「1.国」のみが選択され、CRT3に表示され、他
の漢字パターン「2.〓、3.掴、4.中国、5.〓、6.
〓、7.〓」はCRT3の画面から削除される。
そのあと、音声入力部2から“xue´”が入力さ
れるとともにキーボード4から発音記号“XUE”
および声調“2”が入力される。この入力に応答
して制御部5は標準パターンフアイル6のアドレ
スn9にある発音記号「XUE」および声調「2」
を読出し、CRT3に表示するとともに、情報処
理システム7に送出する。情報処理システム7は
この発音記号「XUE」および声調「2」に基づ
いて漢字文字パターンフアイル8から漢字文字パ
ターン「1.穴、2.〓、3.〓、4.学、5.〓、6.〓、7.
〓」を読出し、制御部5を介してCRT3に表示
する。検索者により数字データ「4」がキーボー
ド4に打鍵されることにより漢字文字パターン
「4.学」のみが選択され、CRT3に表示され、他
の漢字パターン「1.穴、2.〓、3.〓、4.〓、5.〓、
6.〓、7.〓」はCRT3の画面から削除される。
次に、音声入力部2から“xi〓”が入力される
とともにキーボード4から発音記号“XI”およ
び声調“2”が入力される。この入力に応答して
制御部5は標準パターンフアイル6のアドレスn5
にある発音記号「XI」および声調「2」を読出
し、CRT3に表示するとともに情報処理システ
ム7に送出する。情報処理システム7はこの発音
記号「XI」および声調「2」に基づいて漢字文
字パターンフアイル8から漢字文字パターン「1.
〓、2.〓、3.〓、4.席、5.〓、6.〓、7.〓、8.〓、
9.〓」を読出し、制御部5を介してCRT3に表
示する。検索者により数字データ「1」がキーボ
ード4に打鍵されることにより漢字文字パターン
「1.〓」のみが選択され、CRT3に表示され、他
の漢字パターン「2.〓、3.〓、4.席、5.〓、6.〓、
7.〓、8.〓、9.〓」はCRT3の画面から削除され
る。
そのあと、音声入力部2から“zho ̄ng”が入力
されるとともにキーボード4から発音記号
「ZHONG」および声調“1”が入力される。こ
の入力に応答して制御部5は標準パターンフアイ
ル6のアドレスn4にある発音記号「ZHONG」お
よび声調「1」を読出し、CRT3に表示すると
ともに情報処理システム7に送出する。情報処理
システム7はこの発音記号「ZHONG」および声
調「1」に基づいて漢字文字パターンフアイル8
から漢字文字パターン「1.中,2.忠,3.〓、4.〓、
5.〓、6.松、7.終、8.〓」を読出し、制御部5を
介してCRT3に表示する。検索者により数字デ
ータ「1」がキーボード4に打鍵されることによ
り漢字文字パターン「1.中」のみが選択され、
CRT3に表示され、他の漢字パターン「2.忠、3.
〓、4.〓、5.〓、6.松、7終、8.〓、」はCRT3の
画面から削除される。
最後に、音声入力部2から“we ̄n”が入力され
るとともにキーボード4から発音記号“WEN”
および声調“2”が入力される。この入力に応答
して制御部5は標準パターンフアイル6のアドレ
スn8にある発音記号「WEN」および声調「2」
を読出し、CRT3に表示するとともに情報処理
システム7に送出する。情報処理システム7はこ
の発音記号「WEN」および声調「2」に基づい
て漢字文字パターンフアイル8から漢字文字パタ
ーン「1.文,2紋,3.〓、4.蚊、5.〓、6.聞、7.
〓」を読出し、制御部5を介してCRT3に表示
する。検索者により数字データ「1」がキーボー
ド4に打鍵されることにより漢字文字パターン
「1.文」のみが選択され、CRT3に表示され、他
の漢字パターン「2.紋、3.〓、4.蚊、5.〓、6.聞、
7.〓」はCRT3の画面から削除される。
〔発明の効果〕
本発明の検索方式によれば、中国国内で使用さ
れている標準語で発音すれば簡単に中国語の漢
字/数字が検索できるという効果がある。また、
従来のタブレツト方式の検索方式に比べて本発明
の方式は、2.5倍〜6倍の高速化が達成できると
いう効果もある。
【図面の簡単な説明】
第1図は本発明による検索方式の一実施例を示
す図、第2図は制御部の構成と音声入力部、
CRT、キーボードおよび標準パターンフアイル
との接続関係を示す図、第3図は標準パターンフ
アイルの記憶形式を示す図、第4図は情報処理シ
ステムの構成と中国語の音声認識装置および漢字
文字パターンフアイルとの接続関係を示す図、お
よび第5図は漢字文字パターンフアイルの記憶形
式を示す図である。 第1図から第5図において、1…中国語の音声
認識装置、2…音声入力部、3…CRT、4…キ
ーボード、5…制御部、6…標準パターンフアイ
ル、7…情報処理システム、8…漢字文字パター
ンフアイル、51…比較制御部、52…一致判断
部、53…比較終了検出部、54…発音記号発生
指示部、55…エラー表示制御部、56…CRT
制御部、57…フアイル制御部、58…キーボー
ド制御部、59…通信制御部、60…音声符号化
制御部、61…記憶部、62…検索/フアイル作
成検出部、71…通信制御部、72…記憶部、7
3…発音/声調比較部、74…終了検出部、およ
び75…エラーメツセージ発生部。

Claims (1)

  1. 【特許請求の範囲】 1 デイスプレイとキーボードとを有し中国語を
    フアイルから検索する中国語の検索方式におい
    て、 一語ずつ発音された中国語の音声に応答して該
    音声に対応した発音記号と声調記号を出力する中
    国語の音声認識装置と、 中国語の漢字/数字の発音記号と声調記号とに
    合せて中国語の漢字/数字の文字パターンを記憶
    する漢字文字パターンフアイルと、 前記中国語の音声認識装置からの発音記号およ
    び声調記号に応答してこの発音記号および声調記
    号に合つた漢字文字パターンを前記漢字文字パタ
    ーンフアイルから読出して前記デイスプレイに中
    国語の漢字/数字を表示するとともに、表示され
    た漢字/数字の内から目的の漢字/数字を前記キ
    ーボードからの入力で選択するシステムとを含む
    ことを特徴とする音声認識による中国語の検索方
    式。
JP62036491A 1986-03-12 1987-02-18 音声認識による中国語の検索方式 Granted JPS6312024A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP61-52367 1986-03-12
JP5236786 1986-03-12

Publications (2)

Publication Number Publication Date
JPS6312024A JPS6312024A (ja) 1988-01-19
JPH0560880B2 true JPH0560880B2 (ja) 1993-09-03

Family

ID=12912836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62036491A Granted JPS6312024A (ja) 1986-03-12 1987-02-18 音声認識による中国語の検索方式

Country Status (1)

Country Link
JP (1) JPS6312024A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0620192Y2 (ja) * 1988-02-09 1994-05-25 シャープ株式会社 中国語表示装置

Also Published As

Publication number Publication date
JPS6312024A (ja) 1988-01-19

Similar Documents

Publication Publication Date Title
US6321196B1 (en) Phonetic spelling for speech recognition
US20030191643A1 (en) Automatic multi-language phonetic transcribing system
JPS6238716B2 (ja)
JPH1083277A (ja) 連結型読み上げシステム及びテキストを音声に変換する方法
JPH02204827A (ja) 報告作成装置および方法
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
JP2003022089A (ja) オーディオ専用インターフェースにおけるボイス・スペリング
US4461023A (en) Registration method of registered words for use in a speech recognition system
US4831653A (en) System for registering speech information to make a voice dictionary
EP0472193A2 (en) Translation device based on voice recognition and voice synthesis
JPH0560880B2 (ja)
JPH0558555B2 (ja)
JPS6184771A (ja) 音声入力装置
EP1187431B1 (en) Portable terminal with voice dialing minimizing memory usage
JPS5816330A (ja) 日本文ワ−ドプロセツサにおける音声読合わせ方式
JP2612030B2 (ja) 文章読み上げ装置
JP2002189490A (ja) ピンイン音声入力の方法
Suen et al. The spellex system of speech aids for the blind in computer applications
JPH054676B2 (ja)
JPH1011427A (ja) 自動議事録作成装置
JPH064598A (ja) 情報格納検索装置
JP3183686B2 (ja) 言語入力装置
JPS6055434A (ja) ワ−ドプロセッサ装置
JPH0554145B2 (ja)
JPH0812664B2 (ja) 中文入力装置