WO2006097975A1 - 音声認識プログラム - Google Patents

音声認識プログラム

Info

Publication number
WO2006097975A1
WO2006097975A1 PCT/JP2005/004303 JP2005004303W WO2006097975A1 WO 2006097975 A1 WO2006097975 A1 WO 2006097975A1 JP 2005004303 W JP2005004303 W JP 2005004303W WO 2006097975 A1 WO2006097975 A1 WO 2006097975A1
Authority
WO
WIPO (PCT)
Prior art keywords
word
sentence
recognition
confirmation word
confirmation
Prior art date
Application number
PCT/JP2005/004303
Other languages
English (en)
French (fr)
Inventor
Hideo Yamamoto
Original Assignee
Gifu Service Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gifu Service Co., Ltd. filed Critical Gifu Service Co., Ltd.
Priority to JP2007507947A priority Critical patent/JP4516112B2/ja
Priority to US11/908,334 priority patent/US20080177542A1/en
Priority to PCT/JP2005/004303 priority patent/WO2006097975A1/ja
Publication of WO2006097975A1 publication Critical patent/WO2006097975A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Machine Translation (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

 音声認識プログラムは、文認識の開始確認語が音声入力されたか否か判断する開始確認語認識手順と、前記開始確認語の音声入力後に文認識の終了確認語が音声入力されたか否か判断する終了確認語認識手順と、前記開始確認語認識手順及び終了確認語認識手順で前記開始確認語及び前記終了確認語が音声入力されたと判断したとき、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させる。これにより、定形文の入力作業を簡易化し、医療用カルテ等の作成に応用することができ、PCの操作に不慣れな医師等の使用者にとっても使い勝手を良くして、医師等の入力作業の手間及び時間を大幅に削減することができる。

Description

明 細 書
音声認識プログラム
技術分野
[0001] 本発明は、医療用カルテの自動作成等に好適な音声認識プログラムに関する。
背景技術
[0002] 従来、医療機関におけるカルテの記載は、担当医師自身が、専用の用紙 (カルテ) に手書きで記入したり、パーソナルコンピュータ (PC)を使用して専用の入力画面に キーボードで入力したりしている。ここで、力かる医療用カルテ等の作成において、音 声認識技術を利用できれば、また、手書きやキーボード入力による入力ミスを効果的 に防止でき、また、医師等の手書きやキーボード入力の入力作業の手間及び時間を 大幅に削減することができると考えられる。医療用カルテに音声認識技術を利用した 技術として、例えば、特許文献 1に記載の技術がある。
特許文献 1:特開 2003—122849号公報
[0003] 特許文献 1には、診療所及びその他の医療機関において発生する診療情報を電 子的に記録する電子カルテの入力 Z管理を行なう電子カルテシステムが開示されて いる。この電子カルテシステムは、電子カルテの入力を行なう医師端末の表示画面を 、患者に関する氏名,性別'生年月日等の患者情報表示部分、患者に関するカルテ 情報を示す電子カルテ表示部分、該当患者に関する指導料実施情報を示す指導料 実施情報表示部分、その他、所定の条件によって当該患者の診療情報を検索する 手段であるショートカット表示部分とから構成する。医師は、該ショートカット機能を使 用して、該当する条件に従った内容の電子カルテ情報を画面表示させる。ここで、こ の電子カルテシステムは、前記ショートカットを、例えば 2文字程度のキーワードと関 連付けて、このキーワード内容を音声認識手段と連動させることにより、入力の簡易 化を実現することができるとして 、る。
発明の開示
発明が解決しょうとする課題
[0004] しかし、特許文献 1に記載の技術は、ショートカット機能の実現開始に音声認識手 段を利用する程度であり、その他のデータ入力は、やはり、基本的に PCのキーボー ドゃマウス等の入力装置を使用して行なう必要がある。したがって、医師等のカルテ 作成作業の省力化の点で十分ではなぐまた、 PCの操作に不慣れな医師にとって、 入力作業が困難となる可能性がある。
[0005] そこで、本発明は、定形文の入力作業を簡易化し、医療用カルテ等の作成に応用 することができ、 PCの操作に不慣れな医師等の使用者にとっても使い勝手を良くし て、医師等の入力作業の手間及び時間を大幅に削減することができる音声認識プロ グラムの提供を課題とする。
課題を解決するための手段
[0006] 請求項 1に係る音声認識プログラムは、文認識の開始確認語が音声入力されたか 否か判断する開始確認語認識手順と、前記開始確認語の音声入力後に文認識の終 了確認語が音声入力されたカゝ否か判断する終了確認語認識手順と、前記開始確認 語認識手順及び終了確認語認識手順で前記開始確認語及び前記終了確認語が音 声入力されたと判断したとき、前記開始確認語と前記終了確認語との間の中間文を 音声認識する文認識手順とをコンピュータに実行させる。
[0007] 請求項 2に係る音声認識プログラムは、一方の対話者が他方の対話者に所定内容 の情報を提示して確認するための確認文を音声認識するための音声認識プログラム であって、前記一方の対話者と他方の対話者との間の一連の対話を、音素モデル及 び単語モデルを使用した音素認識及び単語認識により音声認識し、前記対話中の 単語をモニターする単語認識手順と、前記単語認識手順でモニターした単語を、前 記確認文の直前に付加されて一連の文を構成する接続語からなる所定の開始確認 語にパターンマッチングし、前記開始確認語が音声入力された力否かを確認する開 始確認語認識手順と、前記単語認識手順でモニターした単語を、前記確認文の直 後に付加されて一連の文を構成する助動詞力もなる所定の終了確認語にパターン マッチングし、前記終了確認語が音声入力されたカゝ否かを確認する終了確認語認識 手順と、前記開始確認語が音声入力された後に前記終了確認語が音声入力された ときにのみ、前記開始確認語と前記終了確認語との間の中間文を音声認識する文 認識手順とをコンピュータに実行させる. [0008] 請求項 3に係る音声認識プログラムは、請求項 1または 2の構成において、更に、前 記文認識手順で音声認識された口語文からなる中間文を、予め記憶手段に格納さ れた文語文力もなる定形文とパターンマッチングし、前記中間文に対応する定形文 を出力する文変換手順をコンピュータに実行させる。
発明の効果
[0009] 本発明に係る音声認識プログラムは、定形文の入力作業を簡易化し、医療用カル テ等の作成に応用することができ、 PCの操作に不慣れな医師等の使用者にとっても 使い勝手を良くして、医師等の入力作業の手間及び時間を大幅に削減することがで きる。
図面の簡単な説明
[0010] [図 1]図 1は本発明の一実施の形態に係る音声認識プログラムを実行するコンビユー タの主要な機能実現手段を示す機能ブロック図である。
[図 2]図 2は本発明の一実施の形態に係る音声認識プログラムの処理手順を示すフ ローチャートである。 符号の説明
[0011] STEP7:開始確認語認識手順
STEP8:終了確認語認識手順
STEP9 :中間文認識手順
発明を実施するための最良の形態
[0012] 以下、本発明を実施するための最良の形態 (以下、実施の形態という)を説明する。
図 1は本発明の一実施の形態に係る音声認識プログラムを実行するコンピュータの 主要な機能実現手段を示す機能ブロック図である。
[0013] 本実施の形態の音声認識プログラムは、一方の対話者が他方の対話者に所定内 容の情報を提示して確認するための確認文 (定形文)を音声認識するための音声認 識プログラムに具体化される。例えば、本実施の形態の音声認識プログラムは、一方 の対話者としての医師が、他方の対話者としての外来患者や入院患者に、医療用力 ルテに記入する必要のある事項の内容を提示して確認するための確認文(定形文と してのカルテ記入文)を音声認識するための音声認識プログラムに具体ィ匕することが できる。本実施の形態の音声認識プログラムは、図 1に示すように、 CPU, ROM, R AM等の一般的な構成を備えるコンピュータ(PC、 PDA,オフコン等)からなる音声 認識装置に一連の処理手順を実行させるものである。図 1に示す音声認識装置は、 接話マイクロホン、指向性マイクロホン等力 なる音声入力手段 11により音声を電気 信号に変換する。また、音声認識装置は、周波数分析手段 12及び特徴パラメータ抽 出手段 13により、音声入力手段 11から入力された音声信号 (音声波形)を、例えば、 数 ms—" h数 msごとのフレームに分割し、それぞれのフレームにつ!/、て高速フーリエ 変換等によりスペクトルを計算すると共に、スペクトルを聴覚尺度に基づく音声パラメ ータに変換する一方、雑音除去を行なう。更に、音声認識装置は、音素認識手段 14 により、音声パラメータの時系列を表現した音素モデル記憶手段 21中の音素モデル と入力音声を照合する。なお、音素モデルは、隠れマルコフモデル (HMM)等を使 用して多数のデータから学習される。
また、音声認識装置は、単語認識手段 15により、単語辞書 22から変換した単語モ デル格納手段 23中の単語モデルと音素認識結果とを照合し、両者の一致度を計算 する。即ち、単語認識手段 15は、予め登録してある単語モデルと、入力された音声 データとを比較して、入力音声データがどの登録単語に一番似ている力を計算し、 一番似ているものを認識結果として出力する(パターンマッチング)。なお、単語モデ ルとしては、単語中の母音の無声化、長音化、鼻音化、子音の口蓋化等、音素の変 形を考慮したモデルが用意されると共に、各音素の発声タイミングの変動については 、動的計画法の原理を用いた照合法 (DPマッチング)等で対処される。また、単語認 識手段 15は、限定された個数の単語 (後述する定形文に含まれる単語)を格納した 単語辞書 22を使用し、音素認識手段 14による音素認識結果に誤りがあっても、単語 辞書 22の中からもっとも一致度の高い単語を選択することで、単語としての認識率を 向上する。このように、音声認識プログラムは、周波数分析手段 12、特徴パラメータ 抽出手段 13、音素認識手段 14及び単語認識手段 15を使用して、一方の対話者と 他方の対話者との間の一連の対話を、音素モデル及び単語モデルを使用した音素 認識及び単語認識により音声認識し、前記対話中の単語をモニターする単語認識 手順を実行する。
[0015] 音声認識装置は、文認識手段 16により、単語認識結果から言語モデル格納手段 2 4中の言語モデルに合致する単語列を選出する。また、文認識手段 16は、入力単語 列が所定の言語モデルに従って発声されているという限定を付与し、力かる文法によ り文としての認識率を向上する。一方、音声認識装置は、単語認識手段 15により認 識された単語を確認語判定手段 101に入力する。確認語判定手段 101は、所定の 対をなすキーヮドとして、一対または複数対の開始確認語及び終了確認語を格納し 、単語認識手段 15から入力された単語と、予め用意した前記開始確認語及び終了 確認語とをパターンマッチングし、開始確認語または終了確認語が音声入力された か否かを判断及び確認する。即ち、確認語判定手段 101は、単語認識手段 15でモ 二ターした単語を、確認文の直前に付加されて一連の文を構成する接続語からなる 所定の開始確認語にパターンマッチングし、開始確認語が音声入力されたカゝ否かを 確認する開始確認語認識手順を実行すると共に、単語認識手順でモニターした単 語を、確認文の直後に付加されて一連の文を構成する助動詞からなる所定の終了 確認語にパターンマッチングし、終了確認語が音声入力されたカゝ否かを確認する終 了確認語認識手順を実行する。
[0016] 確認語判定手段 101は、開始確認語の音声入力を確認したとき、その結果を文認 識開始終了指令手段 102に出力し、これに基づき、文認識開始終了指令手段 102 は、文認識手段 16に対し、言語モデルによる文認識の開始を指令する。また、確認 語判定手段 101は、終了確認語の音声入力を確認したとき、その結果を文認識開始 終了指令手段 102に出力し、これに基づき、文認識開始終了指令手段 102は、文認 識手段 16に対し、言語モデルによる文認識の終了を指令する。そして、文認識手段 16は、文認識開始終了指令手段 102からの指令があつたときのみ機能を実現し、開 始確認語が音声入力された後に前記終了確認語が音声入力されたときにのみ、前 記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順を実行 する。このとき、文認識手段は、また、指令手段は、開始確認語の直後に連続して終 了確認語が発話された場合、即ち、中間文が存在しない場合は、指令せず、開始確 認語の入力後、所定時間を経過した後に終了確認語の入力があつたときのみ、指令 を実行するよう構成することが好ましぐまた、開始確認語の直後に終了確認語以外 の単語の入力があり、その後、終了確認語の入力があつたときに、はじめて、指令を 実行するよう構成することが好ましい。なお、文認識手段 16は、音素モデル、単語モ デル、言語モデルを使用した音素認識、単語認識、文認識カゝらなる通常の音声認識 により中間文を音声認識する。
[0017] ここで、開始確認語としては、「それでは…」といった接続語等 (順接、説明、転換 等)があり、「それでは」以外にも、例えば、「では」、「じゃあ」、「それなら」、「だから」、 「ということで」、「すると」、「そうすると」、「そうしたら」、「結果」、「結局」、「つまり」、「と どのつまり」、「だから」、「よって」、「したがって」、「要するに」、「つまるところ」、「結論 として」等を使用することができる。また、終了確認語としては、「· · ·ですね」といった 付加疑問文の末尾語湘手に同意を求める語)や助動詞等があり、「ですね」以外に も、「ますね」、「だよね」、「だな」、「でしよう」、「ですか」、「でしようね」、「です」、「だ」 、「である」等を使用することができる。そして、中間文の一例としては、医療用カルテ の記載事項であるバイタルデータ、病状等を表現する文があり、例えば、「熱は 38度 」、「血圧は上が 130、下が 95」、「昨夜力も頭が痛い」、「昨日力も食欲がない」、「2 日前から下痢気味」等の文がある。よって、開始確認語、中間文及び終了確認語か らなる確認文は、例えば、「それでは熱は 38度ですね」、「それでは血圧は上が 130 、下が 95ですね」、「それでは昨夜力 頭が痛い(ん)ですね」、「昨日力も食欲がない (ん)ですね」、「2日前から下痢気味ですね」といった文になる。この場合、文認識手 段 16は、確認文中の中間文のみ、即ち、「熱は 38°C」、「血圧は上が 130、下が 95」 、「昨夜力 頭が痛い」、「昨日力 食欲がない」、「2日前から下痢気味である」のみ 音声認識して、文変換手段 103に出力する。
[0018] 音声認識装置は、文変換手段 103により、文認識手段 16で音声認識された口語 文からなる中間文を、定形文辞書 111に格納された文語文力もなる定形文とパター ンマッチングし、前記中間文に対応する定形文を出力する文変換手順を実行する。 なお、定形文辞書 111に格納する定形文は、前記中間文に対応して、例えば、「熱 は 38°Cである。」、「血圧は上が 130、下が 95である。」、「昨夜力も頭が痛い。」、「昨 日力も食欲がない。」、「2日前力も下痢気味である。」等の文語文とする。また、音声 認識装置は、文変換手段 103のパターンマッチングにより得られた定形文を、カルテ 作成手段 104に出力する。カルテ作成手段 104は、カルテ用テンプレート 112を呼 び出して電子カルテ 113 (未記入)を作成すると共に、文変換手段 103から入力され た定形文を前記電子カルテ 113の所定の記入欄に順次記入する手順を実行する。 更に、音声認識装置は、カルテ作成手段 104により、文変換手段 103からの定形文 を PCのモニタ等力もなる画面表示装置 121に出力し、画面表示装置 121にその定 形文を表示させる。更に、音声認識装置は、画面表示装置 121にチェック手段 122 を接続し、画面表示装置 121に表示された定形文を医師等のユーザが確認して、必 要な場合は、チェック手段 122により、入力した定形文の追加、削除、修正等の編集 操作を実行できるようにして ヽる。
[0019] 次に、本実施の形態に係る音声認識プログラムの処理手順について説明する。図 2は本発明の一実施の形態に係る音声認識プログラムの処理手順を示すフローチヤ ートである。
[0020] 図 2に示すように、本実施の形態に係る音声認識プログラムでは、まず、起動処理 が実行された後、 STEP1で初期化処理が実行され、カルテ作成手段 104が、カル テ用テンプレート 112を参照して、必要な形式の電子カルテ 113を準備する。次に、 STEP2で、音声入力手段 11からの音声入力があつたときは、 STEP3で、周波数分 析手段 12が周波数分析処理を実行し、 STEP4で、特徴パラメータ抽出手段 13が音 声パラメータの抽出処理を実行する。次に、 STEP5で、音素認識手段 14が、音素モ デル 21を参照し、音声パラメータに基づき音素認識処理を実行し、 STEP6で、単語 認識手段 15が、単語モデル 23を参照し、音素認識結果に基づき単語認識処理を実 行する。次に、 STEP7で、単語認識手段 15からの入力単語に基づき、確認語判定 手段 101が、開始確認語が入力されたカゝ否かを判断する。なお、 STEP7は、文認識 の開始確認語が音声入力された力否力,断する開始確認語認識手順を構成する。 次に、 STEP7が YESの場合、 STEP8で、単語認識手段 15からの入力単語に基づ き、確認語判定手段 101が、終了確認語が入力されたカゝ否かを判断する。なお、 ST EP8は、開始確認語の音声入力後に文認識の終了確認語が音声入力された力否 か判断する終了確認語認識手順を構成する。そして、 STEP7で開始確認語の入力 を確認し、かつ、 STEP8で終了確認語の入力を確認すると、 STEP9で、確認誤判 定手段 101からの入力に基づき、文認識開始終了指令手段 102が、文認識手段 16 に対して文認識を指令し、この指令に基づき、文認識手段 16が中間文の認識処理 を実行する。なお、このとき、文認識手段 16は、前記音素認識手順 (STEP5)及び 単語認識手順 (STEP6)の認識結果を利用し、言語モデルを参照して中間文を音 声認識する。なお、 STEP9は、開始確認語認識手順及び終了確認語認識手順で 開始確認語及び終了確認語が音声入力されたと判断したとき、開始確認語と終了確 認語との間(開始確認語の直後カゝら終了確認語の直前まで)の中間文を音声認識す る文認識手順を構成する。次に、 STEP10で、文変換手段 103が、文認識手段 16 力 入力された中間文を定形文辞書 111の定形文と対比してパターンマッチング処 理を実行し、中間文を対応する定形文 (文語文)に変換する。次に、 STEP11で、力 ルテ作成手段 104が、文変換手段 103から入力された定形文を、準備した電子カル テ 113の所定の記入欄に記入し、電子カルテ (記入済)を作成する。なお、 STEP11 の後、カルテ作成手段 104からの定形文が画面表示装置 121に表示され、医師によ るチェック手段 122を利用した記入内容のチェックが可能となる。
[0021] このようにして、音声認識プログラムは、上記 STEP2— STEP11を繰り返し、 STE P2— STEP6により、医師と患者との対話をモニターすると共に、 STEP7— STEP1 1により、対話中に医師が発話する複数の確認文 (確認開始後 +中間文 +終了確認 語)中の中間文に対応する定形文のみを、電子カルテ 113に順次記入して、電子力 ルテ 113の作成を完了することができる。
[0022] なお、上記処理手順では、 STEP7で開始確認語を確認し、 STEP8で終了確認語 を確認した後に、 STEP9で中間文認識を実行するようにした力 STEP7で開始確 認語を確認した直後に、 STEP9の中間文認識を実行し、次のステップで終了確認 語を確認した後に、 STEP9の中間文認識を終了するよう構成してもよい。また、 STE P10の定形文選択の際に、中間文に対応する複数候補の定形文を選択し、画面表 示装置 121にリスト表示するよう攻勢してもよい。この場合、医師が、画面表示装置 1 21に表示された複数の定形文を確認し、最も適当な定形文を選択して、電子カルテ 113に記入するようにすることができる。 [0023] 上記のように、本発明に係る音声認識プログラムによれば、医師が来院患者や入院 患者に対して行う問診において、カルテ記入事項である定形文の入力作業を簡易化 し、 PCの操作に不慣れな医師にとっても使い勝手を良くして、医師の入力作業の手 間及び時間を大幅に削減することができる。また、本発明によれば、対話中の音声認 識は、文認識の手前の段階の単語認識の段階までであり、開始確認語及び終了確 認語の入力が確認されてはじめて、文認識(中間文である定形文の認識)が開始さ れる。よって、音声認識の処理量を大幅に削減することができる。特に、中間文認識 開始終了用の指令のためには、開始確認語及び終了確認語のみ用意すれば良い ため、例えば、開始確認語及び終了確認語を「それでは」及び「ですね」とした場合、 単語認識手段 15は、第一音素が「S」または「D」である単語のみを認識すればよぐ 音素認識手段 14の処理量を大幅に削減することができる。更に、単語辞書 22及び 単語モデルも、定形文の範囲内の単語とすればよぐ処理量を軽減できる。更に、言 語モデルも、予め用意する必要のある定形文に含まれる範囲内の単語とすればよい ため、やはり、処理量を大幅に軽減することができると共に、登録単語を少なくするこ とができるため、認識誤りの発生率を減少して認識率を大幅に向上することができる 。また、一般的な連続音声認識では、人間は機械ではないために連続的にスムーズ に発話しないことから、言い誤ったり、単語と単語の間で考え込んだり(言いよどみ)、 無意識のうちに「の」を入れたりする等、種々の発話現象が発生する。一方、本発明 では、確認文として、上記(「それでは · · ·ですね」)のように、一連の文として発話され るような開始確認語、中間文、終了確認語のセットを用意することにより、連続文のう ち確認文のみを文認識することで、上記言いよどみ等の発話現象による影響を防止 することができる。
[0024] ところで、本発明では、医師等の発話者 (権限者)と受話者 (患者等)との一連の対 話 (問診等)中に、マイク等の音声入力手段 11から対話音声の波形信号 (アナログ信 号)を継続的に入力するが、このとき、発話者の音声パターンを予め入力して特定し 、前記開始確認語、中間文、終了確認語の音声が発話者のものであると判断したと きにのみ、上記処理を実行し、非権限者の発話は無視するよう構成することが好まし い。こうすると、権限者以外のものの発話を謝って入力することを防止することができ る。
産業上の利用可能性
本発明に係る音声認識プログラムは、医療用カルテ自動作成用等、定形文を書類 等に自動入力する場合の各種用途に適用できる。

Claims

請求の範囲
[1] 文認識の開始確認語が音声入力された力否力判断する開始確認語認識手順と、 前記開始確認語の音声入力後に文認識の終了確認語が音声入力されたカゝ否か 判断する終了確認語認識手順と、
前記開始確認語認識手順及び終了確認語認識手順で前記開始確認語及び前記 終了確認語が音声入力されたと判断したとき、前記開始確認語と前記終了確認語と の間の中間文を音声認識する文認識手順と
をコンピュータに実行させることを特徴とする音声認識プログラム。
[2] 一方の対話者が他方の対話者に所定内容の情報を提示して確認するための確認 文を音声認識するための音声認識プログラムであって、
前記一方の対話者と他方の対話者との間の一連の対話を、音素モデル及び単語 モデルを使用した音素認識及び単語認識により音声認識し、前記対話中の単語を モニターする単語認識手順と、
前記単語認識手順でモニターした単語を、前記確認文の直前に付加されて一連の 文を構成する接続語からなる所定の開始確認語にパターンマッチングし、前記開始 確認語が音声入力されたカゝ否かを確認する開始確認語認識手順と、
前記単語認識手順でモニターした単語を、前記確認文の直後に付加されて一連の 文を構成する助動詞力 なる所定の終了確認語にパターンマッチングし、前記終了 確認語が音声入力されたカゝ否かを確認する終了確認語認識手順と、
前記開始確認語が音声入力された後に前記終了確認語が音声入力されたときに のみ、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手 順と
をコンピュータに実行させることを特徴とする音声認識プログラム。
[3] 更に、前記文認識手順で音声認識された口語文からなる中間文を、予め記憶手段 に格納された文語文力もなる定形文とパターンマッチングし、前記中間文に対応する 定形文を出力する文変換手順をコンピュータに実行させることを特徴とする請求項 1 または 2に記載の音声認識プログラム。
PCT/JP2005/004303 2005-03-11 2005-03-11 音声認識プログラム WO2006097975A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007507947A JP4516112B2 (ja) 2005-03-11 2005-03-11 音声認識プログラム
US11/908,334 US20080177542A1 (en) 2005-03-11 2005-03-11 Voice Recognition Program
PCT/JP2005/004303 WO2006097975A1 (ja) 2005-03-11 2005-03-11 音声認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/004303 WO2006097975A1 (ja) 2005-03-11 2005-03-11 音声認識プログラム

Publications (1)

Publication Number Publication Date
WO2006097975A1 true WO2006097975A1 (ja) 2006-09-21

Family

ID=36991336

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/004303 WO2006097975A1 (ja) 2005-03-11 2005-03-11 音声認識プログラム

Country Status (3)

Country Link
US (1) US20080177542A1 (ja)
JP (1) JP4516112B2 (ja)
WO (1) WO2006097975A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011191752A (ja) * 2010-02-16 2011-09-29 Gifu Service Kk 音声認識用文法作成支援プログラム
JP2011259127A (ja) * 2010-06-08 2011-12-22 Nippon Telegr & Teleph Corp <Ntt> 通話単位検出装置、方法及びプログラム
JP2019056746A (ja) * 2017-09-20 2019-04-11 株式会社野村総合研究所 データ変換装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100717385B1 (ko) * 2006-02-09 2007-05-11 삼성전자주식회사 인식 후보의 사전적 거리를 이용한 인식 신뢰도 측정 방법및 인식 신뢰도 측정 시스템
WO2008016620A2 (en) * 2006-08-01 2008-02-07 Verilogue Llc Conversation data capture and processing platform
JP5115545B2 (ja) 2009-09-18 2013-01-09 旭硝子株式会社 ガラスおよび化学強化ガラス
WO2012131839A1 (ja) * 2011-03-25 2012-10-04 三菱電機株式会社 エレベーターの呼び登録装置
US9798799B2 (en) * 2012-11-15 2017-10-24 Sri International Vehicle personal assistant that interprets spoken natural language input based upon vehicle context
JP2016024378A (ja) * 2014-07-22 2016-02-08 Necパーソナルコンピュータ株式会社 情報処理装置、その制御方法及びプログラム
JP2016024379A (ja) * 2014-07-22 2016-02-08 Necパーソナルコンピュータ株式会社 情報処理装置、その制御方法及びプログラム
CN105653517A (zh) * 2015-11-05 2016-06-08 乐视致新电子科技(天津)有限公司 一种识别率确定方法及装置
US9837069B2 (en) 2015-12-22 2017-12-05 Intel Corporation Technologies for end-of-sentence detection using syntactic coherence
JP6857691B2 (ja) * 2019-07-17 2021-04-14 医療法人社団のう救会 医療支援システムおよび方法並びにプログラム
CN111582708A (zh) * 2020-04-30 2020-08-25 北京声智科技有限公司 医疗信息的检测方法、系统、电子设备及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0512246A (ja) * 1991-07-04 1993-01-22 Nec Corp 音声文書作成装置
JP2004053742A (ja) * 2002-07-17 2004-02-19 Matsushita Electric Ind Co Ltd 音声認識装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5832428A (en) * 1995-10-04 1998-11-03 Apple Computer, Inc. Search engine for phrase recognition based on prefix/body/suffix architecture
US5797123A (en) * 1996-10-01 1998-08-18 Lucent Technologies Inc. Method of key-phase detection and verification for flexible speech understanding
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
EP1109152A1 (en) * 1999-12-13 2001-06-20 Sony International (Europe) GmbH Method for speech recognition using semantic and pragmatic informations
JP2002132290A (ja) * 2000-10-24 2002-05-09 Kenwood Corp 車載用音声認識装置
JP2002207497A (ja) * 2001-01-05 2002-07-26 Asahi Optical Co Ltd 電子内視鏡システム
US6763331B2 (en) * 2001-02-01 2004-07-13 Matsushita Electric Industrial Co., Ltd. Sentence recognition apparatus, sentence recognition method, program, and medium
US6834264B2 (en) * 2001-03-29 2004-12-21 Provox Technologies Corporation Method and apparatus for voice dictation and document production
US20040039602A1 (en) * 2001-11-16 2004-02-26 Greenberg Robert S. Clinician's assistant system
JP2003178158A (ja) * 2001-12-07 2003-06-27 Canon Inc 第三者証拠資料保存型の調書プリントサービスシステム
JP3950957B2 (ja) * 2002-03-15 2007-08-01 独立行政法人産業技術総合研究所 言語処理装置および方法
JP3997105B2 (ja) * 2002-04-11 2007-10-24 株式会社ピートゥピーエー 会話制御システム、会話制御装置
JP2003316696A (ja) * 2002-04-22 2003-11-07 Sharp Corp 電子メール表示装置
DE60318652T2 (de) * 2002-07-11 2009-01-22 Mtd Products Inc., Valley City Vakuumbetätigter Mechanismus zur Lenk- und Geschwindigkeitskontrolle
JP3910898B2 (ja) * 2002-09-17 2007-04-25 株式会社東芝 指向性設定装置、指向性設定方法及び指向性設定プログラム
JP2004192078A (ja) * 2002-12-09 2004-07-08 Hitachi Medical Corp 医用診断レポートシステム
US7698136B1 (en) * 2003-01-28 2010-04-13 Voxify, Inc. Methods and apparatus for flexible speech recognition
JP2004279897A (ja) * 2003-03-18 2004-10-07 Nippon Telegr & Teleph Corp <Ntt> 音声通信記録生成方法、装置及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0512246A (ja) * 1991-07-04 1993-01-22 Nec Corp 音声文書作成装置
JP2004053742A (ja) * 2002-07-17 2004-02-19 Matsushita Electric Ind Co Ltd 音声認識装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MATSUNAGA S. ET AL.: "Onsei Ninshiki ni yoru Keibu X-Sen CT no Shoken Sakusei. (Continuous Speech Recognition for Medical Diagnoses)", IEICE TECHNICALREPORT UONSEI], vol. 92, no. 126, 30 June 1992 (1992-06-30), pages 77 - 82, XP003002024 *
SHINODA K. ET AL.: "Personal Computer Muke Software Renzoku Onsei Ninshiki. ( Software-only continuous speech recognition for personal computers)", THE ACOUSTICAL SOCIETY OF JAPAN (ASJ) HEISEI 6 NENDO SHUKI KENKYU HAPPYOKAI KOEN RONBUNSHU -I-, 31 October 1994 (1994-10-31), pages 43 - 44, XP003002023 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011191752A (ja) * 2010-02-16 2011-09-29 Gifu Service Kk 音声認識用文法作成支援プログラム
JP2011259127A (ja) * 2010-06-08 2011-12-22 Nippon Telegr & Teleph Corp <Ntt> 通話単位検出装置、方法及びプログラム
JP2019056746A (ja) * 2017-09-20 2019-04-11 株式会社野村総合研究所 データ変換装置
JP7088645B2 (ja) 2017-09-20 2022-06-21 株式会社野村総合研究所 データ変換装置

Also Published As

Publication number Publication date
JP4516112B2 (ja) 2010-08-04
US20080177542A1 (en) 2008-07-24
JPWO2006097975A1 (ja) 2008-08-21

Similar Documents

Publication Publication Date Title
JP4516112B2 (ja) 音声認識プログラム
US7505906B2 (en) System and method for augmenting spoken language understanding by correcting common errors in linguistic performance
US8595004B2 (en) Pronunciation variation rule extraction apparatus, pronunciation variation rule extraction method, and pronunciation variation rule extraction program
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
US11450313B2 (en) Determining phonetic relationships
CN112204653A (zh) 通过机器学习的直接的语音到语音翻译
JP2017058674A (ja) 音声認識のための装置及び方法、変換パラメータ学習のための装置及び方法、コンピュータプログラム並びに電子機器
US6934682B2 (en) Processing speech recognition errors in an embedded speech recognition system
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
US20020091520A1 (en) Method and apparatus for text input utilizing speech recognition
JP2023539888A (ja) 声変換および音声認識モデルを使用した合成データ拡大
JP7255032B2 (ja) 音声認識
Tiwari et al. A Review on Voice based E-Mail System for Blind
US20040006469A1 (en) Apparatus and method for updating lexicon
JP4103085B2 (ja) 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体
JP3378547B2 (ja) 音声認識方法及び装置
Syadida et al. Sphinx4 for indonesian continuous speech recognition system
JP2001117752A (ja) 情報処理装置および情報処理方法、並びに記録媒体
JPH09114482A (ja) 音声認識のための話者適応化方法
JP3526549B2 (ja) 音声認識装置、方法及び記録媒体
JPH06161488A (ja) 音声認識装置
JP2002323969A (ja) コミュニケーション支援方法およびこの方法を用いたシステムならびに装置
JPH0950290A (ja) 音声認識装置および該装置を用いた通信装置

Legal Events

Date Code Title Description
DPE2 Request for preliminary examination filed before expiration of 19th month from priority date (pct application filed from 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007507947

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 11908334

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

NENP Non-entry into the national phase

Ref country code: RU

WWW Wipo information: withdrawn in national office

Country of ref document: RU

122 Ep: pct application non-entry in european phase

Ref document number: 05720574

Country of ref document: EP

Kind code of ref document: A1

WWW Wipo information: withdrawn in national office

Ref document number: 5720574

Country of ref document: EP