JP2023501283A - キーボードマクロ機能を活用した自動音声認識器および音声認識方法 - Google Patents

キーボードマクロ機能を活用した自動音声認識器および音声認識方法 Download PDF

Info

Publication number
JP2023501283A
JP2023501283A JP2022525632A JP2022525632A JP2023501283A JP 2023501283 A JP2023501283 A JP 2023501283A JP 2022525632 A JP2022525632 A JP 2022525632A JP 2022525632 A JP2022525632 A JP 2022525632A JP 2023501283 A JP2023501283 A JP 2023501283A
Authority
JP
Japan
Prior art keywords
transcription data
data
macro function
transcription
keyboard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022525632A
Other languages
English (en)
Inventor
リン ジョン、ハ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Puzzle Ai Co Ltd
Original Assignee
Puzzle Ai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Puzzle Ai Co Ltd filed Critical Puzzle Ai Co Ltd
Publication of JP2023501283A publication Critical patent/JP2023501283A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0238Programmable keyboards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04886Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/63ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • User Interface Of Digital Computer (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

キーボードマクロ機能を活用した自動音声認識器および音声認識方法に関するもので、転写データ生成部がマイクで入力される音声データに基づいて転写(transcription)データを生成する段階およびラベリング部が前記生成された転写データにマクロ機能を遂行するために既設定されたラベリング対象単語が含まれると、前記生成された転写データにラベリングしセッション化して保存する段階、前記生成された転写データを仮想キーボードが入力する方式でユーティリティプログラム上のデータ入力可能な空間に表示してディスプレイする段階を含むことを特徴とする、キーボードマクロ機能を活用した自動音声認識方法によって医療現場で電子医務記録、手術記録紙の作成など、実際に患者診療時に診療記録のために手を使用し難い状況で音声をすぐにテキスト形態で記録して便利な自動音声認識器および音声認識方法を提供できる効果が導き出される。【選択図】図1

Description

本発明はキーボードマクロ機能を活用した自動音声認識器および音声認識方法に関し、より詳細には、音声データを転写してラベリング作業を遂行するキーボードマクロ機能を活用した医療用自動音声認識器および音声認識方法に関する。
既存のEMR(電子医務記録、Electronic Medical Record)システムは患者の医療記録がすべて電子的に入力されて管理されるという長所があるものの、医療スタッフの業務が患者の治療よりも記録自体に重点が置かれている。
しかし、診療の際に医師は患者ではなく医務記録を入力するコンピュータ画面を見て診療しなければならない状況が発生することになる。
特に手術室や臨床病理課のように、診療と同時に手を使えない場合にはマウス/キーボードの使用が難しいため、診療と同時に医務記録紙や患者の診療記録のためには別途の操作を遂行しなければならず、このために補助者の助けが必要となる。
一方、特許文献1:韓国登録特許10-0354365号(発明の名称:音声コマンド入力認識機能がある相互作用型コンピュータ制御ディスプレイシステムおよびそのシステムへの音声コマンド入力提供方法)には、音声コマンド入力認識機能がある相互作用型コンピュータ制御ディスプレイシステムおよびそのシステムへの音声コマンド入力提供方法に関するもので、音声コマンド入力認識(speech command input recognition)および視覚フィードバック(visual feedback)のための対話型乃至相互作用型コンピュータ制御ディスプレイシステム(interactive computer controlled display system)に関するものであって、このシステムは対応する多数のシステム動作をそれぞれ開始(initiate)させる多数の音声コマンドを事前決定する手段と、前記多数のコマンドそれぞれに関連した音声用語集合(an associated set of speech terms)を提供する手段を含む。
この時、それぞれの用語は自身に関連したコマンドに関連性(relevance)を有し、音声コマンドと音声用語を感知する手段を含み、音声コマンドの感知に応答して前記コマンドをディスプレイする手段と、前記コマンドの中の一つに関連性を有する感知された音声用語に応答してその関連コマンドをディスプレイする手段を提供する
このように、一般的に音声を認識して音声コマンドによる機能を提供する技術に関しては持続的に開発が行われている。
韓国登録特許10-0354365号(発明の名称:音声コマンド入力認識機能がある相互作用型コンピュータ制御ディスプレイシステムおよびそのシステムへの音声コマンド入力提供方法)
本発明はこのような技術的背景で導き出されたもので、医療現場で電子医務記録、手術記録紙の作成など、実際に患者診療時に診療記録のために手を使用し難い状況で音声をすぐにテキスト形態で記録して便利な自動音声認識器および音声認識方法を提供することにその目的がある。
また、医療現場で記録システムの入力欄に常時活性化されている音声認識器を通じて音声がテキストに転写され、別途のキーボードやマウスなしにキーボードマクロ入力器を通じて、音声入力だけでも必要な情報の検索や命令を遂行するようにすることができるため、情報処理の効率性が高い自動音声認識器および音声認識方法を提供しようとする。
前記の課題を達成するための本発明は次のような構成を含む。
すなわち、本発明の一実施例に係るキーボードマクロ機能を活用した自動音声認識器で遂行される医療用自動音声認識方法は、転写データ生成部がマイクで入力される音声データに基づいて転写(transcription)データを生成する段階およびラベリング部が前記生成された転写データにマクロ機能を遂行するために既設定されたラベリング対象単語が含まれると、前記生成された転写データにラベリングしセッション化して保存する段階を含むことを特徴とする、。
本発明の一様相によると、マクロ遂行部が前記生成された転写データに既設定されたラベリング対象単語が含まれると、前記セッション化して保存する段階でセッション化されて保存された転写データを呼び出してマクロ機能による動作を遂行する段階をさらに含む。
一方、キーボードマクロ機能を活用した音声認識器は、マイクで入力される音声データに基づいて転写(transcription)データを生成する転写データ生成部および前記転写データ生成部で生成された転写データにマクロ機能を遂行するために既設定されたラベリング対象単語が含まれると、前記生成された転写データにラベリングしセッション化して保存するラベリング部を含む。
本発明の一様相によると、キーボードマクロ機能を活用した自動音声認識器は、転写データ生成部で生成された転写データに既設定されたラベリング対象単語が含まれると、前記ラベリング部でセッション化された転写データを呼び出してマクロ機能による動作を遂行するマクロ遂行部をさらに含む。
本発明によると、医療現場で電子医務記録、手術記録紙の作成など、実際に患者診療時に診療記録のために手を使用し難い状況で音声をすぐにテキスト形態で記録して便利な自動音声認識器および音声認識方法を提供できる効果が導き出される。
また、本発明に係るキーボードマクロ機能を活用した自動音声認識器および音声認識方法によると、特に医療現場で記録システムの入力欄に常時活性化されている音声認識器を通じて音声がテキストに転写され、別途のキーボードやマウスなしにキーボードマクロ入力器を通じて、音声入力だけでも必要な情報の検索や命令を遂行するようにすることができるため、情報処理効率性が高い医療用自動音声認識器および音声認識方法を提供することができる。
具体的には、手術室で手術中の場合のように、別途のマウスやキーボードの操作が不可能な状況で環境にかかわらず直接音声で医療情報を記録できるため情報の正確度を高めることができ、患者の治療や手術過程に対する集中度をさらに高めることができる。
ひいては、医療環境の特性上医師が患者を診療しながら医務記録を入力する時間がさほどないため、入力方式を音声入力に代替することによって便宜性を増大させることができ、医者の時間効率性を高めることができる。
本発明の一実施例に係るキーボードマクロ機能を活用した医療用自動音声認識器の動作を説明するための例示図である。 本発明の一実施例に係るキーボードマクロ機能を活用した医療用自動音声認識器の構成を図示したブロック図である。 本発明の一実施例に係るキーボードマクロ機能を活用した医療用自動音声認識方法を図示したフローチャートである。
以下、添付された図面を参照して本発明に係る好ましい実施例を詳細に説明する。
図1は、本発明の一実施例に係るキーボードマクロ機能を活用した医療用自動音声認識器の動作を説明するための例示図である。
図1でのように、一実施例に係るキーボードマクロ機能を活用した自動音声認識器10は医療現場でマイクを通じて音声メッセージを受信する。そうすると、自動音声認識器10は音声認識器サーバー20と通信を遂行しながら音声データに基づいた転写データを生成する。
この時、音声認識器サーバー20は一実施例に係る医療用自動音声認識サービスを提供するプラットホームを含む。そして音声認識器サーバー20は自動音声認識器10に音声データを転写するために必要な基盤情報を提供することができる。
自動音声認識器10は転写データに基づいて自動でキーボード入力機能を遂行する。すなわち、一実施例に係る自動音声認識器10は実際に物理的なキーボードやマウスの操作信号が入力されなくてもキーボードマクロ入力器の機能によって転写データによる動作や機能を遂行することができる。
本発明によると、自動音声認識器10が医療現場で記録システムの入力欄に活用されている音声認識器サーバー20を通じて入力された音声をテキストに転写した後、キーボードマクロ入力器を通じて別途のマウスやキーボードの使用することなく自動で入力されて保存される。
一例として、音声内容のうち撮影位置情報などを別途にラベリングしてセッションに保存し、撮影位置や特定の情報に関して音声で要請すると、撮影位置に関連した情報をハイライトして見せてくれるか音声でフィードバックし、音声テンプレート内の空欄すなわち、変数値に対する修正および入力処理も可能である。
また、一実施例に係る自動音声認識器10は電子医務記録(EMR)プログラムだけでなく、メモ帳、チャットプログラム、ハングルやワード、エクセルのような多様なユーティリティプログラム上のデータ入力可能な空間に認識された音声を転写してテキスト形態で出力することができる。
既存には音声認識された転写されたテキスト形式の情報をマウスでスクラップしてコピーし、必要な領域に貼り付ける作業が必要であった。しかし、本発明の一実施例に係る自動音声認識器10は音声認識された内容を直接仮想のキーボードが入力される方式でテキスト変換して画面出力するため、プログラム上に直接キーボードで入力するのと同様に画面出力されることが可能である。
これに伴い、自動音声認識器10で認識される音声をテキスト形式で表示するにおいて、転写された内容を適用可能なプログラムの範囲が広いという長所がある。
したがって、一実施例に係る自動音声認識器10は医療産業内でEMRプログラムの種類にかかわらず、入力欄が存在すれば別途の連動作業なしに入力欄の中に音声認識を経て出た結果物を実際のキーボードで入力するように入力することができる。
また、一実施例に係る自動音声認識器10は電子医務記録(EMR)プログラムだけでなく、医療映像保存伝送システム(PACS)および各種医療プログラムにも適用され得る。
一実施例において、自動音声認識器10はIPが割り当てられた端末機であって、インターネット等を通じて音声認識器サーバー20とネットワーク通信を遂行する。一例として、デスクトップPC(desktop PC)、スレートPC(slate PC)、ノートパソコン(notebook computer)PMP(Portable Multimedia Player)、ウルトラブック(ultrabook)、ウェアラブルデバイス(wearable device、例えば、ウォッチ型端末機(smartwatch)、グラス型端末機(smart glass)、HMD(head mounted display))などが該当し得る。
もちろん、本発明が適用可能な端末機は前述した種類に限定されず、外部装置と通信が可能な形態の端末機をすべて含むように解釈され得る。
それだけでなく、例えば、携帯性と移動性が保障される無線通信装置として、ナビゲーション、PCS(Personal Communication System)、GSM(Global System for Mobile communications)、PDC(Personal Digital Cellular)、PHS(Personal Handyphone System)、PDA(Personal Digital Assistant)、IMT(International Mobile Telecommunication)-2000、CDMA(Code Division Multiple Access)-2000、W-CDMA(W-Code Division Multiple Access)、Wibro(Wireless Broadband Internet)端末、スマートフォン(smartphone)、スマートパッド(smartpad)、タブレットPC(Tablet PC)などのようなすべての種類のハンドヘルド(Handheld)基盤の無線通信装置をすべて含むように解釈され得る。
図2は、本発明の一実施例に係るキーボードマクロ機能を活用した自動音声認識器の構成を図示したブロック図である。
図2のように、一実施例に係るキーボードマクロ機能を活用した自動音声認識器10はマイク170で入力される音声データを受信する。そしてフットスイッチ30でオン/オフ信号が入力される。
また、ディスプレイ部40を通じて音声データで要請される動作を遂行することによって必要な情報を画面に表示することができる。
この時、ディスプレイ部40を通じて情報を画面に表示するにおいて、医療機関の電子医務記録(EMR)プログラムだけでなく、メモ帳、チャットプログラム、ハングルやワード、エクセルのような多様なユーティリティプログラム上のデータ入力可能な空間に認識された音声を転写してテキスト形態で出力することができる。
音声認識された内容を直接仮想キーボードが入力される方式でテキスト変換して画面出力してくれるので、プログラム上に直接キーボードで入力するのと同様に画面出力されることが可能である。
これに伴い、自動音声認識器10で認識される音声をテキスト形式で表示するにおいて転写した内容を適用可能なプログラムの範囲が広いという長所がある。
したがって、一実施例に係る自動音声認識器10は医療産業内でEMRプログラムの種類にかかわらず、入力欄が存在すれば別途の連動作業なしに入力欄の中に音声認識を経て出た結果物を実際のキーボードで入力するように入力することができる。
それだけでなく、自動音声認識器10は多様な映像機器や医療機器と連動することも可能である。すなわち、一実施例において、マイク170で入力される音声データまたはフットスイッチ30のオン/オフ操作により連動される映像機器や医療機器の動作を制御することもできる。
一様相において、フットスイッチ30はオンオフ操作機能を具備する。一実施例に係る自動音声認識器10は、一つのフットスイッチ30を足で踏んでいる間音声認識器内のマイク170が活性化され、足を離すとマイク170が非活性化されるように具現される。
既存には、自動音声認識器10を活性化するにはマイクに内蔵されたボタンで録音を活性化したり、マウスのクリックを通じてマイクを活性化しなければならなかった。本発明のこのような様相によると、手を使用し難い状況でフットスイッチ30で発信される信号を自動音声認識器10で駆動されるプログラムで受けて音声認識器10を活性化させるトリガーとして活用することによって便利さを提供することができる。使用者の選択によりマイクに内蔵されたボタンやマウスのクリックを通じてマイクを活性化できるように具現されてもよい。
また、他の実施例によると、フットスイッチ30が複数個備えられる。そしてフットスイッチ30が複数個となる場合、オン状態のフットスイッチ30ごとに入力する行を変えたり、保存されたテンプレートを呼び出すなど、互いに異なる機能を遂行するように設定してもよい。
さらに他の実施例によると、自動音声認識器10とマイク170が活性化された状態で自動音声認識器10はマイク170で入力される音声をセッション形態で記録しながら注視していて、特定の開始キーワード例えば「記録開始」のような既設定されたキーワードが検出されると、以降からは音声認識された結果物をキーボードマクロ基盤入力器で入力する。
すなわち、「記録開始」というキーワードによって転写したデータをキーボードで入力する形態でディスプレイ部40に表示するように具現される。
反面、特定の終了キーワード(「記録終了」)が検出されると、以降からは音声認識された結果物を再びセッション形態で記録して特定の開始キーワードが検出されるまで待機することになる。すなわち、「記録終了」のように記録を終了する意味の既設定されたキーワードが認識されると、以降には音声認識がされても転写した内容がディスプレイ部40に表示されないように具現され得る。
一様相において、本発明によると、医療現場で記録システムの入力欄に常時活性化されている自動音声認識器10を通じて入力される音声をテキストに転写し、別途のキーボードやマウスなしにキーボードマクロ入力器を通じて転写されたテキストが入力される方式の自動音声入力器を提供することができる。
一実施例に係るキーボードマクロ機能を活用した自動音声認識器10は、通信部100、保存部110、転写データ生成部120、ラベリング部130、マクロ遂行部140、テンプレート呼び出し部150およびテンプレート反映部160を含む。
通信部100は有線通信を支援するための通信モジュールと、無線通信を支援するための移動通信モジュールをすべて含むことができる。移動通信モジュールは、移動通信のための技術標準または通信方式(例えば、GSM(Global System for Mobile communication)、CDMA(Code Division Multi Access)、CDMA2000(Code Division Multi Access 2000)、EVDO(Enhanced Voice-Data Optimized or Enhanced Voice-Data Only)、WCDMA(登録商標)(Wideband CDMA)、HSDPA(High Speed Downlink Packet Access)、HSUPA(High Speed Uplink Packet Access)、LTE(Long Term Evolution)、LTE-A(Long Term Evolution-Advanced)等)により構築された移動通信網上で基地局および外部の端末のうち少なくとも一つと無線信号を送受信する。
一実施例において、通信部100は音声認識器サーバー20とデータ通信を遂行する。マイクで入力される音声データに基づいて転写データを生成する過程で必要な情報を音声認識器サーバー20から受信することができる。
また、通信部100は物理的に分離された医療測定機器または医療映像機器と通信を遂行することができる。通信部100は医療測定機器または医療映像機器から有線通信や近距離無線通信方式で医療データや映像データを受信することができる。また、医療測定機器または医療映像機器に制御信号を送信することも可能である。
保存部110は音声データに基づいて転写データを生成するためのプログラムを保存する。ここで、保存部110は電源が供給されなくても保存された情報を維持し続ける不揮発性保存装置および揮発性保存装置を通称するものである。
例えば、保存部110はコンパクトフラッシュ(登録商標)(compact flash;CF)カード、SD(secure digital)カード、メモリスティック(memory stick)、ソリッドステートドライブ(solid-state drive;SSD)およびマイクロ(micro)SDカードなどのようなNANDフラッシュメモリ(NAND flash memory)、ハードディスクドライブ(hard disk drive;HDD)などのようなマグネチックコンピュータ記憶装置およびCD-ROM、DVD-ROMなどのような光学ディスクドライブ(optical disc drive)等を含むことができる。
一実施例において、保存部110は転写データを生成するためのプログラムと転写データからマクロ機能遂行のためのラベリング対象単語を保存する。ラベリング対象単語は予め使用者によって設定されたものであり得る。
転写データ生成部120は保存部110に保存されたプログラムを実行させることによって、マイク170で入力される音声データに基づいて転写(transcription)データを生成する。
自動音声認識において、源泉データが音声である場合には必要な情報を直接抽出することが不可能であるため、転写データ生成部120はマイク170で入力される音声データの文字列を変換する転写過程が必須である。
一実施例において、転写データ生成部120はテキスト形式の転写データを生成することができる。
ラベリング部130は転写データ生成部120で生成された転写データにマクロ機能を遂行するために既設定されたラベリング対象単語が含まれると、生成された転写データにラベリングしセッション化して保存部110に保存する。
ラベリング部130は転写データにマクロ機能の遂行のためのラベリング単語対象単語が含まれたかどうかを把握する。
ラベリング対象単語は使用者またはサービス提供者によって既設定されたものである。例えば「撮影部位」、「撮影位置」、「容量」、「見せて」、「行を変えて」、「括弧をつけて」のようなキーワードで具現される。すなわち、ラベリング対象単語はマクロ機能を遂行するためのキーワードとなり得る。
例えば、マイク170を通じて「この撮影位置はascending colonである」という音声データが入力されると、ラベリング部130は「撮影位置」をラベリングしてセッションに保管することができる。
この時、ラベリング部130は「撮影位置」というラベリングに対して音声で入力される撮影位置とともに医療撮影機器から入力される撮影データを共にラベリングして保存する。撮影データは例えば超音波やMRI技法で撮影されたイメージや動画ファイルであり得る。
補助的様相において、ラベリング部130は使用者がキーワードを入力することになると、入力した検索語から単語関連性を判断して医学用語を考慮したオントロジー(Ontology)ロジックで意味の範囲を把握して、意味の範囲内にキーワード検索範囲を制限することも可能である。これに伴い、音声データを転写して処理する過程でより正確度の高い音声認識が可能となり得る。
すなわち、一実施例に係るキーボードマクロ機能を活用した自動音声認識器10は、マイク170で入力される音声データをテキスト形態に変換してセッションのように持っていることができる。したがって、医療環境の特性上手の使用が難しい場合にも現在の状況を記録し記憶する補助記憶装置としての役割をすることができる。
例えば、マイクを通じて予め約定されたコードを音声で入力した後に患者の名前や診療コードのような情報を入力すると、最近ラベリング部130でセッション化して保存された転写データに識別コードとして追加することができる。
マクロ遂行部140は転写データ生成部120で生成された転写データに既設定されたラベリング対象単語が含まれると、ラベリング部130でセッション化された転写データを呼び出してマクロ(macro instruction)機能による動作を遂行する。
すなわち、マクロ遂行部140は転写データにマクロ機能を遂行することに設定されたラベリング単語が入力されると、それにしたがって遂行するように設定された機能を遂行することができる。
例えば、「撮影位置を教えて」という音声データが入力されると、これまでラベリング部130でセッション化されて保存された記録内容のうち、「撮影位置」に関連した情報をハイライトさせて可視的なデータで区分されるように提供することができる。それだけでなく、音声を通じて撮影位置に関するデータに関する情報をフィードバックすることも可能である。
また、「撮影位置」というラベリング情報とともにマッチングされるように、保存された医療映像機器からの撮影イメージまたは撮影映像情報をさらに提供することができる。
例えば「映像撮影、Transverse colonを通ってきたし、これからascending colonに入る。」という音声が認識されると、転写データ生成部120がこれを転写データに変換し、マクロ遂行部140は「映像撮影」というラベリングを認識して医療映像機器で撮影される映像を認識される転写データとともに保存するように遂行することができる。
その後、「映像検索、Transverse colonでascending colon」という音声が認識されると、転写データ生成部120がこれを転写データに変換し、マクロ遂行部140は「映像検索」というラベリングを認識して保存された情報のうち、医療映像機器で該当部位撮影データと認識されるデータを抽出して検索結果として提供することができる。
一様相において、テンプレート呼び出し部150はマクロ機能により既設定された転写データの文章テンプレートを呼び出す。文章テンプレート形式はいずれか一つに限定されない。文章テンプレート形式は短文章形式だけでなく複数の文章を含む形式で具現されてもよい。
テンプレート呼び出し部150は例えば、「1番テンプレート呼び出し」、「1番テンプレートを呼び出して」のような音声データが入力されると、保存されたテンプレートリストから1番テンプレートに指定されたテンプレート文章を呼び出すことができる。
ここで、テンプレート呼び出し部150は遠隔保存媒体である遠隔テンプレートサーバーに記録された内容を呼び出す方法でテンプレートを呼び出してもよい。すなわち、多様で、アップデート可能なテンプレート形態を利用することができる。
この時、テンプレートの区分は一連番号で区分するか、状況別キーワードで区分するように具現されてもよい。テンプレート区分のための識別情報すなわち、一連番号や状況別キーワードは使用者によって予め設定されたものであり得る。
この時、テンプレート呼び出し部150で呼び出されるテンプレート文章は音声形態で出力されるか画面を通じて可視的な形態で出力され得る。
テンプレート反映部160はマイク170で入力される音声データに基づいて呼び出された文章テンプレートの変数値が入力されて反映する。
使用者は音声形態で出力されるか画面を通じて可視的な形態で出力されるテンプレート呼び出し部150で呼び出されたテンプレート文章を確認しながら音声で変数値を入力することができる。
例えばテンプレート呼び出し部150で呼び出されたテンプレート文章が「cimetropium 1)___注射後2)___ Lidocaneスプレーで咽頭麻酔を施行する」である場合に、使用者はマイク170を通じて音声で「変数値1番5mg」、「変数値2番10%」を入力してテンプレート文章の内容を修正したり変数値を新しく入力することができる。
すなわち、繰り返され得る状況に対しては予めテンプレート文章を設定しておいて、診療検査後に患者により変更され得る変数値のみを入力することによって、診療記録や手術進行状況を入力するにおいて便宜性を提供することができる。
この時、テンプレート呼び出し部150で呼び出されたテンプレート文章の変数値を入力することは、多様な形態で変形および適用が可能である。
テンプレート反映部160は、入力される変数値を反映して新しく生成されるテンプレート文章をラベリング部130またはマクロ遂行部140に提供してセッション化されて保存されるようにするか、それによる動作を遂行するようにする。
すなわち、マクロ遂行部140は変数値が反映された転写データを利用してその機能による必要な動作を遂行したりラベリング部130で新しいデータとして認識してセッション化して保存することができる。
本発明の追加的な様相により、一実施例に係る自動音声認識器10はオンオフ操作機能を具備したフットスイッチ30をさらに含む。
そして、転写データ生成部120はフットスイッチ30がオン(ON)状態の時、マイク170で入力される音声データに基づいて転写(transcription)データを生成する。
この様相によると、手を使用し難い状況でフットスイッチ30で発信される信号を自動音声認識器10で駆動されるプログラムで受けて音声認識器10を活性化させるトリガーとして活用することによって、便利さを提供することができる。
ひいては、フットスイッチ30が複数個備えられ得る。フットスイッチ30が複数個の場合にスイッチがオンになるフットスイッチの種類および個数によって入力する行を変えたり、保存されたテンプレートを呼び出すなどの機能をするように具現され得る。
例えば、フットスイッチa、b、cがある場合に、フットスイッチaがオンの状態であればマイクで入力される音声データから転写データを生成し、フットスイッチbのみがオンの状態であればマイクで入力される音声データから転写データを生成してそのまま保存し、フットスイッチcのみがオンの状態であればテンプレート呼び出しモードで動作するように具現される。
また、フットスイッチaとbが同時にスイッチオンの状態であれば初期状態に戻るように具現されてもよい。フットスイッチ30の操作によって遂行される機能はこれに限定されるものではなく、多様な変形例を包括するように解釈される。すなわち、複数のフットスイッチ30を利用して手を使って入力しなくてもより多様な操作信号の入力が可能となる。
本発明の一様相において、キーボードマクロ機能を活用した医療用自動音声認識器は人工知能モジュールをさらに含むことができる。
人工知能(AI)モジュールはマイク170で入力される音声データによって要請される多様な機能をさらに遂行することができる。また、人工知能モジュールはディープラーニング(Deep learnning)訓練モジュールを含んで、音声認識による動作を訓練を通じて自己学習するように具現されてもよい。一実施例において、人工知能モジュールは音声で認識される転写データによって必要な情報をウェブ検索を通じて追加で提供してもよい。
図3は、本発明の一実施例に係るキーボードマクロ機能を活用した医療用自動音声認識方法を図示したフローチャートである。
キーボードマクロ機能を活用した医療用自動音声認識器で遂行される医療用自動音声認識方法において、まず、転写データ生成部はマイクで音声データが入力されると(S300)、マイクで入力される音声データに基づいて転写(transcription)データを生成する(S320)。
この時、転写データを生成する段階は、オンオフ操作機能を具備したフットスイッチがオン(ON)の状態の時(S310)、マイクで入力される音声データに基づいて転写(transcription)データを生成する。
この様相によると、手を使用し難い状況でフットスイッチで発信される信号を医療用自動音声認識器で駆動されるプログラムで受けて音声認識器を活性化させるトリガーとして活用することによって、便利さを提供することができる。
そして、ラベリング部は転写データ生成部で生成された転写データにマクロ機能を遂行するために既設定されたラベリング対象単語が含まれると(S330)、生成された転写データにラベリングしセッション化して保存する(S340、S350)。
ラベリング部は転写データにマクロ機能の遂行のためのラベリング単語対象単語が含まれたかどうかを把握する。
ラベリング対象単語は使用者またはサービス提供者によって既設定されたものである。例えば「撮影部位」、「撮影位置」、「容量」、「見せて」のようなキーワードで具現される。すなわちラベリング対象単語はマクロ機能を遂行するためのキーワードとなり得る。
例えば、マイクを通じて「この撮影位置はascending colonである」という音声データが入力されると、ラベリング部は「撮影位置」をラベリングしてセッションに保管することができる。
すなわち、マイクで入力される音声データをテキスト形態に変換してセッションのように持っていることができる。したがって、医療環境の特性上手の使用が難しい場合にも現在の状況を記録して記憶する補助記憶装置としての役割をすることができる。
反面、マクロ遂行部は転写データ生成部で生成された転写データに既設定されたラベリング対象単語が含まれると、セッション化して保存する段階でセッション化されて保存された転写データを呼び出してマクロ機能による動作を遂行する(S360、S365)。
一実施例において、マクロ遂行部は転写データにマクロ機能を遂行することに設定されたラベリング単語が入力されると、それにより遂行するように設定された機能を遂行することができる。
例えば、「撮影位置を教えて」という音声データが入力されると、これまでラベリング部130でセッション化されて保存された記録内容のうち、「撮影位置」に関連した情報をハイライトさせて可視的なデータで提供することができる。それだけでなく、音声を通じてフィードバックすることも可能である。
本発明の一様相において、テンプレート呼び出し部がマクロ機能により既設定された転写データの文章テンプレートを呼び出すと(S370)、テンプレート反映部はマイクで入力される音声データに基づいて呼び出された文章テンプレートの変数値が入力されて反映する(S375)。
テンプレート呼び出し部は例えば、「1番テンプレート呼び出し」、「1番テンプレートを呼び出して」のような音声データが入力されると、保存されたテンプレートリストから1番テンプレートに指定されたテンプレート文章を呼びだすことができる。
この時、テンプレートの区分は一連番号で区分するか、ある状況に対するキーワードで区分可能に具現されてもよい。
テンプレート呼び出し部で呼び出されるテンプレート文章は音声形態で出力されるか画面を通じて可視的な形態で出力され得る。
そして、テンプレート反映部はマイクで入力される音声データに基づいて呼び出された文章テンプレートの変数値が入力されて反映する。
使用者は音声形態で出力されるか画面を通じて可視的な形態で出力されるテンプレート呼び出し部で呼び出されたテンプレート文章を確認して変数値を入力することができる。
例えば、テンプレート呼び出し部で呼び出されたテンプレート文章が「cimetropium 1)___注射後2)___ Lidocaneスプレーで咽頭麻酔を施行する」である場合に、変数値として「1番5mg」、「2番10%」を入力してテンプレート文章の内容を修正および新しく入力することができる。呼び出されたテンプレート文章の変数値を入力することは、多様な形態で変形および適用が可能である。
テンプレート反映部は入力される変数値を反映して新しく生成されるテンプレート文章をラベリング部またはマクロ遂行部に提供してセッション化されて保存されるようにしたり、それによる動作を遂行するようにする。
追加的に、一実施例に係るキーボードマクロ機能を活用した医療用自動音声認識方法によると、医療用自動音声認識器はラベリング単語が含まれていない一般の音声データ命令に対してもそれによる動作を遂行できる(S380)。
その後、ディスプレイ部を通じて音声データで要請される動作を遂行することによって必要な情報を画面に表示してくれる。
この時、ディスプレイ部を通じて情報を画面に表示するにおいて、医療機関の電子医務記録(EMR)プログラムだけでなく、メモ帳、チャットプログラム、ハングルやワード、エクセルのような多様なユーティリティプログラム上のデータ入力可能な空間に認識された音声を転写してテキスト形態で出力することができる(S390)。
音声認識された内容を直接仮想キーボードが入力される方式でテキスト変換して画面出力してくれるので、プログラム上に直接キーボードで入力するのと同様に画面出力されることが可能である。
前述した方法はアプリケーションで具現されるか、多様なコンピュータ構成要素を通じて遂行され得るプログラム命令語の形態で具現されてコンピュータ読み取り可能な記録媒体に記録され得る。前記コンピュータ読み取り可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。
前記コンピュータ読み取り可能な記録媒体に記録されるプログラム命令語は、本発明のために特別に設計されて構成されたものであるかコンピュータソフトウェア分野の当業者に高地になっている使用可能なものであってもよい。
コンピュータ読み取り可能な記録媒体の例には、ハードディスク、フロッピーディスクおよび磁気テープのような磁気媒体、CD-ROM、DVDのような光記録媒体、フロプティカルディスク(floptical disk)のような磁気-光媒体(magneto-optical media)、およびROM、RAM、フラッシュメモリなどのようなプログラム命令語を保存し遂行するように特別に構成されたハードウェア装置が含まれる。
プログラム命令語の例には、コンパイラによって作られるような機械語コードだけでなく、インタープリタなどを使ってコンピュータによって実行され得る高級言語コードも含まれる。前記ハードウェア装置は本発明に係る処理を遂行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その逆も同様である。

Claims (10)

  1. キーボードマクロ機能を活用した自動音声認識器で遂行される自動音声認識方法において、
    転写データ生成部がマイクで入力される音声データに基づいて転写(transcription)データを生成する段階;および、
    ラベリング部が前記生成された転写データにマクロ機能を遂行するために既設定されたラベリング対象単語が含まれると、前記生成された転写データにラベリングしセッション化して保存する段階;を含む
    ことを特徴とするキーボードマクロ機能を活用した自動音声認識方法。
  2. 前記生成された転写データを仮想キーボードが入力する方式でユーティリティプログラム上のデータ入力可能な空間に表示してディスプレイする段階;をさらに含む
    請求項1に記載のキーボードマクロ機能を活用した自動音声認識方法。
  3. マクロ遂行部が前記生成された転写データに既設定されたラベリング対象単語が含まれると、前記セッション化して保存する段階でセッション化されて保存された転写データを呼び出してマクロ機能による動作を遂行する段階;をさらに含む
    請求項1に記載のキーボードマクロ機能を活用した同音声認識方法。
  4. テンプレート呼び出し部がマクロ機能により既設定された転写データの文章テンプレートを呼び出す段階;および、
    テンプレート反映部がマイクで入力される音声データに基づいて呼び出された文章テンプレートの変数値が入力されて反映する段階;をさらに含む
    請求項1に記載のキーボードマクロ機能を活用した自動音声認識方法。
  5. 前記転写データを生成する段階は、オンオフ操作機能を具備したフットスイッチがオン(ON)の状態の時、前記マイクで入力される音声データに基づいて転写(transcription)データを生成する
    請求項1に記載のキーボードマクロ機能を活用した自動音声認識方法。
  6. マイクで入力される音声データに基づいて転写(transcription)データを生成する転写データ生成部;および、
    前記転写データ生成部で生成された転写データにマクロ機能を遂行するために既設定されたラベリング対象単語が含まれると、前記生成された転写データにラベリングしセッション化して保存するラベリング部;を含む
    ことを特徴とするキーボードマクロ機能を活用した自動音声認識器。
  7. 前記転写データ生成部で生成された転写データを仮想キーボードが入力する方式でユーティリティプログラム上のデータ入力可能な空間に表示するディスプレイ部;をさらに含む
    請求項6に記載のキーボードマクロ機能を活用した自動音声認識器。
  8. 前記転写データ生成部で生成された転写データに既設定されたラベリング対象単語が含まれると、前記ラベリング部でセッション化された転写データを呼び出してマクロ機能による動作を遂行するマクロ遂行部;をさらに含む
    請求項6に記載のキーボードマクロ機能を活用した自動音声認識器。
  9. 前記マクロ機能により既設定された転写データの文章テンプレートを呼び出すテンプレート呼び出し部;および、
    マイクで入力される音声データに基づいて呼び出された文章テンプレートの変数値が入力されて反映するテンプレート反映部;をさらに含む
    請求項6に記載のキーボードマクロ機能を活用した自動音声認識器。
  10. オンオフ操作機能を具備したフットスイッチ;をさらに含み、
    前記転写データ生成部は前記フットスイッチがオン(ON)の状態の時、前記マイクで入力される音声データに基づいて転写(transcription)データを生成する
    請求項6に記載のキーボードマクロ機能を活用した自動音声認識器。

JP2022525632A 2019-10-29 2020-08-05 キーボードマクロ機能を活用した自動音声認識器および音声認識方法 Pending JP2023501283A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2019-0135488 2019-10-29
KR1020190135488A KR102153668B1 (ko) 2019-10-29 2019-10-29 키보드 매크로 기능을 활용한 자동 음성 인식기 및 음성 인식 방법
PCT/KR2020/010359 WO2021085811A1 (ko) 2019-10-29 2020-08-05 키보드 매크로 기능을 활용한 자동 음성 인식기 및 음성 인식 방법

Publications (1)

Publication Number Publication Date
JP2023501283A true JP2023501283A (ja) 2023-01-18

Family

ID=72451540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022525632A Pending JP2023501283A (ja) 2019-10-29 2020-08-05 キーボードマクロ機能を活用した自動音声認識器および音声認識方法

Country Status (6)

Country Link
US (1) US11977812B2 (ja)
EP (1) EP4053837A4 (ja)
JP (1) JP2023501283A (ja)
KR (1) KR102153668B1 (ja)
CN (1) CN114830230A (ja)
WO (1) WO2021085811A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836039B (zh) * 2021-01-27 2023-04-21 成都网安科技发展有限公司 基于深度学习的语音数据处理方法和装置
CN113205805B (zh) * 2021-03-18 2024-02-20 福建马恒达信息科技有限公司 一种语音插件辅助的表格便捷操作方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005027978A (ja) * 2003-07-09 2005-02-03 Fujitsu Ltd 医療情報システム
JP2005192024A (ja) * 2003-12-26 2005-07-14 Fujitsu I-Network Systems Ltd コールセンタにおける通話音声データ管理方式およびそれに用いるオペレータ端末
JP2008203516A (ja) * 2007-02-20 2008-09-04 Canon Inc 情報処理装置および情報処理方法
JP2012140189A (ja) * 2010-12-28 2012-07-26 Mitsubishi Electric Building Techno Service Co Ltd エレベータ
JP2016102920A (ja) * 2014-11-28 2016-06-02 京セラドキュメントソリューションズ株式会社 文書記録システム及び文書記録プログラム
JP2017182075A (ja) * 2017-05-01 2017-10-05 株式会社ニコン 情報処理装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4436899B2 (ja) 1998-02-27 2010-03-24 株式会社ニデック 眼科手術装置
US6304848B1 (en) * 1998-08-13 2001-10-16 Medical Manager Corp. Medical record forming and storing apparatus and medical record and method related to same
US8275617B1 (en) 1998-12-17 2012-09-25 Nuance Communications, Inc. Speech command input recognition system for interactive computer display with interpretation of ancillary relevant speech query terms into commands
JP2001101162A (ja) * 1999-09-27 2001-04-13 Just Syst Corp 文書処理装置、及び文書処理プログラムが記憶された記憶媒体
US6578007B1 (en) * 2000-02-29 2003-06-10 Dictaphone Corporation Global document creation system including administrative server computer
DE60202453T2 (de) 2001-03-29 2006-01-19 Koninklijke Philips Electronics N.V. Synchronisierung eines audio- und eines text-cursors während der editierung
KR20030025507A (ko) 2001-09-21 2003-03-29 정용석 음성인식을 이용한 의료전자차트 작성시스템
JP4832770B2 (ja) 2005-02-15 2011-12-07 オリンパス株式会社 医療支援システム
CN103050117B (zh) * 2005-10-27 2015-10-28 纽昂斯奥地利通讯有限公司 用于处理口述信息的方法和系统
US8930210B2 (en) * 2007-03-29 2015-01-06 Nuance Communications, Inc. Method and system for generating a medical report and computer program product therefor
US20090089100A1 (en) * 2007-10-01 2009-04-02 Valeriy Nenov Clinical information system
US8046226B2 (en) 2008-01-18 2011-10-25 Cyberpulse, L.L.C. System and methods for reporting
KR20140061047A (ko) 2012-11-13 2014-05-21 한국전자통신연구원 음성 인식에 기반한 의료 장치 제어용 단말 장치 및 이를 위한 방법
US20160162642A1 (en) * 2012-11-14 2016-06-09 William Atkinson Integrated Medical Record System using Hologram Technology
US20140142939A1 (en) 2012-11-21 2014-05-22 Algotes Systems Ltd. Method and system for voice to text reporting for medical image software
US9514740B2 (en) * 2013-03-13 2016-12-06 Nuance Communications, Inc. Data shredding for speech recognition language model training under data retention restrictions
KR101702760B1 (ko) * 2015-07-08 2017-02-03 박남태 가상 키보드 음성입력 장치 및 방법
US10719222B2 (en) * 2017-10-23 2020-07-21 Google Llc Method and system for generating transcripts of patient-healthcare provider conversations
US11423325B2 (en) * 2017-10-25 2022-08-23 International Business Machines Corporation Regression for metric dataset
KR101955225B1 (ko) * 2017-11-03 2019-03-08 주식회사 셀바스에이아이 전자의무기록 서비스의 편집 인터페이스를 제공하는 방법 및 장치
US10467335B2 (en) 2018-02-20 2019-11-05 Dropbox, Inc. Automated outline generation of captured meeting audio in a collaborative document context
US11705226B2 (en) * 2019-09-19 2023-07-18 Tempus Labs, Inc. Data based cancer research and treatment systems and methods

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005027978A (ja) * 2003-07-09 2005-02-03 Fujitsu Ltd 医療情報システム
JP2005192024A (ja) * 2003-12-26 2005-07-14 Fujitsu I-Network Systems Ltd コールセンタにおける通話音声データ管理方式およびそれに用いるオペレータ端末
JP2008203516A (ja) * 2007-02-20 2008-09-04 Canon Inc 情報処理装置および情報処理方法
JP2012140189A (ja) * 2010-12-28 2012-07-26 Mitsubishi Electric Building Techno Service Co Ltd エレベータ
JP2016102920A (ja) * 2014-11-28 2016-06-02 京セラドキュメントソリューションズ株式会社 文書記録システム及び文書記録プログラム
JP2017182075A (ja) * 2017-05-01 2017-10-05 株式会社ニコン 情報処理装置

Also Published As

Publication number Publication date
EP4053837A1 (en) 2022-09-07
US11977812B2 (en) 2024-05-07
CN114830230A (zh) 2022-07-29
US20220391162A1 (en) 2022-12-08
EP4053837A4 (en) 2023-11-08
KR102153668B1 (ko) 2020-09-09
WO2021085811A1 (ko) 2021-05-06

Similar Documents

Publication Publication Date Title
US10318623B2 (en) Device for extracting information from a dialog
JP5421239B2 (ja) 複数モードの入力メソッドエディタ
WO2021174728A1 (zh) 分诊数据处理方法、装置、计算机设备及存储介质
US9329692B2 (en) Actionable content displayed on a touch screen
US20140316764A1 (en) Clarifying natural language input using targeted questions
US20160328205A1 (en) Method and Apparatus for Voice Operation of Mobile Applications Having Unnamed View Elements
JP2019102063A (ja) ページ制御方法および装置
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
JP2023501283A (ja) キーボードマクロ機能を活用した自動音声認識器および音声認識方法
EP2849054A1 (en) Apparatus and method for selecting a control object by voice recognition
JP2014048506A (ja) 単語登録装置及びそのためのコンピュータプログラム
JP2011180823A (ja) 機械翻訳装置、機械翻訳方法、およびプログラム
TW201225064A (en) Method and system for text to speech conversion
US10658074B1 (en) Medical transcription with dynamic language models
US20220114367A1 (en) Communication system, display apparatus, and display control method
CN112700862B (zh) 目标科室的确定方法、装置、电子设备及存储介质
JP2001154781A (ja) デスクトップ情報装置
TWI752437B (zh) 基於至少雙音素的語音輸入操作方法及電腦程式產品
CN113393831B (zh) 基于至少双音素的语音输入操作方法及计算机可读介质
JP2005018442A (ja) 表示処理装置、表示処理方法、表示処理プログラム、および記録媒体
CN110942775B (zh) 数据处理方法、装置、电子设备及存储介质
US20240106776A1 (en) Sign Language Translation Method And System Thereof
CN114556353A (zh) 数据处理方法、装置、电子设备和存储介质
CN117012361A (zh) 一种数字化手术室自动控制方法
CN114201580A (zh) 数据处理方法、装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240301

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240618