JP2007226388A - Command input device and program - Google Patents
Command input device and program Download PDFInfo
- Publication number
- JP2007226388A JP2007226388A JP2006045008A JP2006045008A JP2007226388A JP 2007226388 A JP2007226388 A JP 2007226388A JP 2006045008 A JP2006045008 A JP 2006045008A JP 2006045008 A JP2006045008 A JP 2006045008A JP 2007226388 A JP2007226388 A JP 2007226388A
- Authority
- JP
- Japan
- Prior art keywords
- command
- command name
- character information
- input
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
Description
本発明は、医用画像に関する特定処理の実行の指示命令を行うコマンド名を入力するコマンド入力装置及びプログラムに関する。 The present invention relates to a command input device and a program for inputting a command name for instructing execution of a specific process relating to a medical image.
従来から、CT(Computed Tomography)やCR(Computed Radiography)、MRI(Magnetic Resonance Imaging)、乳房撮影装置、超音波/内視鏡診断装置等といった医用画像生成装置(以下、「モダリティ」という。)によって撮影・生成された医用画像を、イメージャやビューア等の出力装置に転送する医用画像転送装置が知られている。 Conventionally, medical image generation apparatuses (hereinafter referred to as “modalities”) such as CT (Computed Tomography), CR (Computed Radiography), MRI (Magnetic Resonance Imaging), mammography apparatus, ultrasonic / endoscopic diagnosis apparatus, and the like. 2. Description of the Related Art There are known medical image transfer apparatuses that transfer medical images that have been taken and generated to an output device such as an imager or a viewer.
この医用画像転送装置は、モダリティから出力される医用画像のデータ信号(例えば、ビデオ信号やデジタルデータ)を取り込んで、例えば、DICOM(Digital Imaging and Communications in Medicine)規格に基づいて静止画像データや動画像データ(以下、これらのデータを「画像データ」と総称する。)に変換する。 This medical image transfer apparatus takes in a medical image data signal (for example, a video signal or digital data) output from a modality, for example, still image data or a moving image based on the DICOM (Digital Imaging and Communications in Medicine) standard. It is converted into image data (hereinafter, these data are collectively referred to as “image data”).
そして、その画像データに関する各種機能として、イメージャやサーバ等の外部機器に転送出力する機能、画像データを一時的に内部のメモリに記憶する機能、画像データを再生出力する機能等を実行する。撮影技師等のユーザは、これらの機能の実行を、医用画像転送装置に設けられたキースイッチやフットスイッチ等の操作することで指示する。 As various functions related to the image data, a function of transferring and outputting to an external device such as an imager or a server, a function of temporarily storing the image data in an internal memory, a function of reproducing and outputting the image data, and the like are executed. A user such as a radiographer instructs execution of these functions by operating a key switch or a foot switch provided in the medical image transfer apparatus.
例えば、ユーザが、超音波診断装置のトランスデューサを患者の腹部に当てながら超音波映像を観察し、当該超音波映像の静止画をプリント出力するとした場合には、キースイッチを押下して出力装置への転送を指示する。このとき、ユーザは、モダリティと医用画像転送装置の両方を操作しなければならない。また、医用画像転送装置の操作のために視線をモダリティから外す可能性があるため診断の妨げになる共に、様々な機器に接触することは医療衛生上にも問題である。 For example, when the user observes an ultrasound image while placing the transducer of the ultrasound diagnostic apparatus on the patient's abdomen and prints out a still image of the ultrasound image, the user presses the key switch to the output device. Instruct to transfer. At this time, the user must operate both the modality and the medical image transfer apparatus. Further, since the line of sight may be removed from the modality for the operation of the medical image transfer apparatus, the diagnosis is hindered, and contact with various devices is also a problem in medical hygiene.
このため、医用画像に関する特定処理の指示命令を行うコマンド名の音声入力により行う技術が考案され、例えば、次のような技術が知られている。即ち、マイクから音声入力したコマンド名(音声データ)が、予め登録されているコマンド名(音声データ)と完全一致しなかった場合に、音声入力されたコマンド名と類似しているものを抽出して、その抽出したコマンド名がユーザの音声入力であったか否かの確認を求める技術が知られている(例えば、特許文献1及び2参照)。
しかし、医療の現場は、人の往来が激しいと共に医療機器から発せられる音声や放送音等が多いため、外部環境のノイズの影響を受けて音声認識の認識率が低下してしまう可能性がある。このため、特許文献1及び2の技術において、音声認識に失敗した場合には、類似するとして抽出したコマンド名(音声データ)に、ユーザが発声したコマンド名が含まれず、音声入力による指示命令ができなくなる。
However, in the medical field, there is a possibility that the recognition rate of voice recognition may decrease due to the influence of noise from the external environment because there is a lot of traffic and many voices and broadcast sounds emitted from medical devices. . For this reason, in the techniques of
この場合、ユーザは、意図するコマンド名が抽出されるまでコマンド名の発声を繰り返さなければならず、医用画像転送装置への指示命令に時間がかかってしまう。特に、医用画像の取り込みは、患者に負担を与えないためにも、的確且つ迅速に行うことが望ましいが、医用画像転送装置への指示命令に時間がかってしまうと、患者への負担に与えることとなってしまった。 In this case, the user must repeat the utterance of the command name until the intended command name is extracted, and the instruction command to the medical image transfer apparatus takes time. In particular, it is desirable to capture a medical image accurately and quickly so as not to burden the patient. However, if it takes a long time to instruct the medical image transfer apparatus, it may impose a burden on the patient. It has become.
本発明は、上述したような課題に鑑みて為されたものであり、その目的とすることころは、医用画像に関する特定処理の指示命令を行うコマンド名の音声入力を、確実且つ迅速に行えるようにすることである。 The present invention has been made in view of the above-described problems, and an object of the present invention is to enable reliable and quick voice input of a command name for instructing a specific process related to a medical image. Is to do.
以上の課題を解決するために、請求項1に記載のコマンド入力装置は、
音声入力手段と、
前記音声入力手段により入力された音声の音声認識を行って文字情報に変換する音声認識手段と、
医用画像に関する特定処理の実行の指示命令を行うコマンド名と、当該コマンド名より字数が短い短縮コマンド名とを対応づけて記憶する記憶手段と、
前記音声認識手段により変換された文字情報と、前記記憶手段に記憶された短縮コマンド名とを比較する比較手段と、
前記比較手段による比較の結果が一致した場合に、当該比較した短縮コマンド名に対応づけられた前記コマンド名の指示命令を実行するコマンド実行手段と、
を備えることを特徴としている。
In order to solve the above problems, a command input device according to
Voice input means;
Voice recognition means for performing voice recognition of the voice input by the voice input means and converting it into character information;
Storage means for storing a command name for performing an instruction to execute a specific process relating to a medical image and a shortened command name having a shorter number of characters than the command name;
Comparing means for comparing the character information converted by the voice recognition means with the shortened command name stored in the storage means;
Command execution means for executing an instruction instruction of the command name associated with the compared shortened command name when the comparison result by the comparison means matches;
It is characterized by having.
請求項2に記載の発明は、請求項1に記載の発明において、
第1及び第2の音声入力モードの何れかを選択する選択手段を更に備え、
前記比較手段は、
前記選択手段により第1の音声入力モードが選択された場合、前記音声認識手段により変換された文字情報と前記コマンド名とを比較し、
前記第2の音声入力モードが選択された場合、前記音声認識手段により変換された文字情報と前記短縮コマンド名とを比較することを特徴としている。
The invention according to
And further comprising selection means for selecting one of the first and second voice input modes,
The comparison means includes
When the first voice input mode is selected by the selection means, the character information converted by the voice recognition means is compared with the command name,
When the second voice input mode is selected, the character information converted by the voice recognition means is compared with the abbreviated command name.
請求項3に記載の発明は、請求項2に記載の発明において、
前記選択手段は、
前記音声認識手段により変換された文字情報に基づいて前記第1及び第2の音声入力モードの何れかを選択することを特徴としている。
The invention according to
The selection means includes
One of the first and second voice input modes is selected based on the character information converted by the voice recognition means.
請求項4に記載のコマンド入力装置は、
音声入力手段と、
前記音声入力手段により入力された音声の音声認識を行って文字情報に変換する音声認識手段と、
医用画像に関する特定処理の実行の指示命令を行うコマンド名を複数記憶する記憶手段と、
前記記憶手段に記憶されたコマンド名の中から、前記音声認識手段により変換された文字情報に類似するコマンド名を抽出する抽出手段と、
前記コマンド名よりも字数が短い識別文字情報を、前記抽出手段により抽出されたコマンド毎に対応づけて一覧表示する一覧表示手段と、
前記音声認識手段により変換された文字情報と前記一覧表示された識別文字情報とを比較する比較手段と、
前記比較手段による比較の結果が一致した場合に、当該比較した識別文字情報に対応づけて表示された前記コマンド名の指示命令を実行するコマンド実行手段と、
を備えることを特徴としている。
The command input device according to
Voice input means;
Voice recognition means for performing voice recognition of the voice input by the voice input means and converting it into character information;
Storage means for storing a plurality of command names for instructing execution of specific processing relating to medical images;
Extracting means for extracting a command name similar to the character information converted by the voice recognition means from the command names stored in the storage means;
A list display unit that displays a list of identification character information having a shorter number of characters than the command name in association with each command extracted by the extraction unit;
Comparison means for comparing the character information converted by the voice recognition means and the identification character information displayed in the list;
Command execution means for executing an instruction command of the command name displayed in association with the compared identification character information when the comparison result by the comparison means matches;
It is characterized by having.
請求項5に記載の発明は、請求項4に記載の発明において、
前記抽出手段は、
前記記憶手段に記憶されたコマンド名の中から、前記変換された文字情報と先頭一致するコマンド名を抽出することを特徴としている。
The invention according to
The extraction means includes
A command name matching the head of the converted character information is extracted from the command names stored in the storage means.
請求項6に記載の発明は、請求項4又は5に記載の発明において、
前記一覧表示手段は、
前記抽出手段により抽出されたコマンド名をユーザの使用頻度の高い順に一覧表示する頻度順表示手段を有することを特徴としている。
The invention according to
The list display means includes:
It is characterized by having a frequency order display means for displaying a list of command names extracted by the extraction means in descending order of user use frequency.
請求項7に記載の発明は、請求項4〜6の何れか一項に記載の発明において、
前記一覧表示手段は、
前記抽出手段により抽出されたコマンド名のうち、前記コマンド実行手段が直前に実行した指示命令のコマンド名と関連性のあるコマンド名を一覧表示する関連順一覧表示手段を有することを特徴としている。
The invention according to
The list display means includes:
Among the command names extracted by the extracting means, there is provided a related order list display means for displaying a list of command names related to the command name of the instruction command executed immediately before by the command execution means.
請求項8に記載の発明は、請求項1〜7の何れか一項に記載の発明において、
医用画像に関する特定処理の実行は、外部機器への転送、記憶部への書き込み及び表示部への表示の少なくとも何れかを含むことを特徴としている。
The invention according to
The execution of the specific processing relating to the medical image includes at least one of transfer to an external device, writing to a storage unit, and display on a display unit.
請求項9に記載のプログラムは、コンピュータを、
音声入力手段により入力された音声の音声認識を行って文字情報に変換する音声認識手段、
医用画像に関する特定処理の実行の指示命令を行うコマンド名と、当該コマンド名より字数が短い短縮コマンド名とを対応づけて記憶する記憶手段、
前記音声認識手段により変換された文字情報と、前記記憶手段に記憶された短縮コマンド名とを比較する比較手段、
前記比較手段による比較の結果が一致した場合に、当該比較した短縮コマンド名に対応づけられた前記コマンド名の指示命令を実行するコマンド実行手段、
として機能させることを特徴としている。
The program according to
Speech recognition means for performing speech recognition of speech input by the speech input means and converting it into character information;
Storage means for storing a command name for performing an instruction to execute a specific process relating to a medical image and a shortened command name having a shorter number of characters than the command name;
Comparison means for comparing the character information converted by the voice recognition means with the shortened command name stored in the storage means;
Command execution means for executing an instruction instruction of the command name associated with the compared short command name when the result of comparison by the comparison means matches;
It is characterized by making it function as.
請求項10に記載のプログラムは、コンピュータを、
音声入力手段により入力された音声の音声認識を行って文字情報に変換する音声認識手段、
医用画像に関する特定処理の実行の指示命令を行うコマンド名を複数記憶する記憶手段、
前記記憶手段に記憶されたコマンド名の中から、前記音声認識手段により変換された文字情報に類似するコマンド名を抽出する抽出手段、
前記抽出手段により抽出されたコマンド名毎に識別文字情報を対応づけて一覧表示する一覧表示手段、
前記音声認識手段により変換された文字情報と前記一覧表示された識別文字情報とを比較する比較手段、
前記比較手段による比較の結果が一致した場合に、当該比較した識別文字情報に対応づけて表示された前記コマンド名の指示命令を実行するコマンド実行手段、
として機能させることを特徴としている。
The program according to
Speech recognition means for performing speech recognition of speech input by the speech input means and converting it into character information;
Storage means for storing a plurality of command names for instructing execution of specific processing relating to medical images;
Extraction means for extracting a command name similar to the character information converted by the voice recognition means from the command names stored in the storage means;
List display means for displaying a list in association with identification character information for each command name extracted by the extraction means;
Comparison means for comparing the character information converted by the voice recognition means with the identification character information displayed in the list;
Command execution means for executing an instruction command of the command name displayed in association with the compared identification character information when the result of comparison by the comparison means matches;
It is characterized by making it function as.
請求項1及び9に記載の発明によれば、音声認識して変換した文字情報と、短縮コマンド名とを比較して一致した場合に、その短縮コマンド名に対応付けられたコマンド名の指示命令を実行する。一般に、文字情報同士の比較は、その比較する字数が短い方が精度が向上する。このため、文字情報との比較は、コマンド名よりも短縮コマンド名の方が精度を高められる。従って、医用画像に関する特定処理の指示命令を行うコマンド名の音声入力を、短縮コマンド名によってより確実に行えるようにすることができる。 According to the first and ninth aspects of the present invention, when the character information converted by speech recognition and the abbreviated command name are compared and matched, a command name instruction command associated with the abbreviated command name is provided. Execute. In general, the accuracy of comparing character information is improved when the number of characters to be compared is shorter. For this reason, in comparison with character information, the accuracy of a shortened command name is higher than that of a command name. Therefore, the voice input of the command name for performing the instruction command for the specific process relating to the medical image can be more reliably performed by the shortened command name.
請求項2に記載の発明によれば、請求項1に記載の発明と同様の効果が得られるのは無論のこと、第1の音声入力モードが選択された場合は、文字情報とコマンド名とを比較し、第2の音声入力モードが選択された場合は、当該文字情報と裏コマンド名とを比較する。一般に、音声認識は、認識対象とする音声が短い程その認識率が高まる。このため、ユーザが予め第2の音声入力モードを選択して裏コマンド名を発声することで、より確実にコマンド名の指示命令を実行させることができる。 According to the second aspect of the present invention, the same effect as that of the first aspect of the invention can be obtained. When the first voice input mode is selected, the character information, the command name, If the second voice input mode is selected, the character information is compared with the reverse command name. In general, in speech recognition, the recognition rate increases as the speech to be recognized becomes shorter. For this reason, when the user selects the second voice input mode in advance and utters the back command name, the command name instruction command can be executed more reliably.
請求項3に記載の発明によれば、請求項1に記載の発明と同様の効果が得られるのは無論のこと、第1及び第2の音声入力モードの何れかを、音声認識により変換された文字情報に基づいて選択する。このため、ユーザは、音声入力モードの選択をコマンド入力装置に接触することなく行うことができる。 According to the third aspect of the invention, it is possible to obtain the same effect as the first aspect of the invention, and any one of the first and second voice input modes is converted by voice recognition. Select based on the character information. For this reason, the user can select the voice input mode without touching the command input device.
請求項4及び10に記載の発明によれば、音声認識を行って変換した文字情報に類似するコマンド名を識別文字情報と共に一覧表示する。そして、更に音声認識を行って変換した文字情報が表示した識別文字情報と一致した場合、当該識別文字情報に対応付けられたコマンド名の指示命令を実行する。このため、音声認識に失敗したとしても、音声入力に類似するコマンド名が一覧表示されるため、ユーザは、そのコマンド名の中から所望のコマンド名を選択して、コマンド名の指示命令を実行させることができる。
According to invention of
また、識別文字情報は、コマンド名よりも字数が短いため、ユーザが識別文字情報を音声入力した場合には、音声認識の認識率が高まると共に、識別文字情報との比較の精度も向上する。従って、医用画像に関する特定処理の指示命令を行うコマンド名の音声入力を、識別文字情報の音声入力によりより確実且つ迅速に行えるようにすることができる。 Further, since the identification character information has a shorter number of characters than the command name, when the user inputs the identification character information by voice, the recognition rate of voice recognition is increased and the accuracy of comparison with the identification character information is also improved. Therefore, the voice input of the command name for performing the instruction command for the specific process regarding the medical image can be performed more reliably and quickly by the voice input of the identification character information.
請求項5に記載の発明によれば、請求項4に記載の発明と同様の効果が得られるのは無論のこと、音声認識により変換した文字情報と先頭一致するコマンド名を抽出して表示する。このため、例えば、ユーザが、所望のコマンド名の先頭部分を音声入力することで、その先頭部分で始まるコマンド名が一覧表示される。従って、ユーザは、一覧表示されたコマンド名の中から所望のコマンド名を音声入力により選択できるため、音声認識に失敗した場合のように繰り返し音声入力する手間が省け、コマンド名の音声入力を迅速に行うことができる。 According to the fifth aspect of the invention, it is possible to obtain the same effect as the fourth aspect of the invention, and extract and display the command name that matches the character information converted by voice recognition. . For this reason, for example, when the user inputs the head portion of a desired command name by voice, a list of command names starting with the head portion is displayed. Therefore, since the user can select a desired command name from the command names displayed in a list by voice input, the user can save time and effort to repeatedly input voice as in the case of voice recognition failure, and promptly input voice of a command name. Can be done.
請求項6又は7に記載の発明によれば、請求項4又は5に記載の発明と同様の効果が得られるのは無論のこと、抽出したコマンド名をユーザの使用頻度の高い順に一覧表示してもよいし、直前に実行した指示命令のコマンド名と関連性のあるコマンド名を一覧表示することとしてもよい。これにより、ユーザは、その一覧表示されたコマンド名に従って、実際の使用状況に即したコマンド名の音声入力ができる。
According to the invention described in
請求項8に記載の発明によれば、請求項1〜7の何れか一項に記載の発明と同様の効果が得られるのは無論のこと、医用画像の外部機器への転送、記憶部への書き込み及び表示部への表示の少なくとも何れかをコマンド名の音声入力に従って実行する。
According to the invention described in
以下、本発明のコマンド入力装置を医用画像転送装置(以下、単に「転送装置」という。)に適用し、当該転送装置を有する医用画像出力システムの実施形態について、図1〜図10を参照して詳細に説明する。 Hereinafter, a command input device of the present invention is applied to a medical image transfer device (hereinafter simply referred to as “transfer device”), and an embodiment of a medical image output system having the transfer device is described with reference to FIGS. Will be described in detail.
〔システム構成〕
先ず、医用画像出力システムSのシステム構成について説明する。図1は、医用画像出力システムSのシステム構成の一例を示す図である。図1によれば、医用画像出力システムSは、複数のモダリティMそれぞれに接続された転送装置1と、出力装置9としてのイメージャ3、サーバ5及びカラープリンタ7とが通信ネットワークNを介して接続されて構成されている。
〔System configuration〕
First, the system configuration of the medical image output system S will be described. FIG. 1 is a diagram illustrating an example of a system configuration of the medical image output system S. As illustrated in FIG. According to FIG. 1, a medical image output system S includes a
モダリティMは、X線撮影装置や超音波診断装置、内視鏡診断装置、CT等であり、撮影・生成した医用画像のデータ信号を転送装置1に出力する。このモダリティMには、撮影した医用画像をDICOM規格に従ったデジタルデータに変換して出力するものと、当該医用画像をビデオ信号やデジタルデータのデータ信号で出力するものとがある。
The modality M is an X-ray imaging apparatus, an ultrasonic diagnostic apparatus, an endoscopic diagnostic apparatus, a CT, or the like, and outputs a data signal of a medical image captured and generated to the
イメージャ3は、転送装置1から転送されたDICOM規格に準拠した画像データに基づいて、熱感光フィルム上に医用画像の画像形成を行って出力する。熱感光フィルムは、PET(ポリエチレンテレフタレート)等の支持体上に、感光性及び感熱性の感光材料を含有する乳剤が塗布されて、感光層が形成されたものである。
The
サーバ5は、表示装置や大容量の記憶装置等を備えた一般的なコンピュータにより構成され、転送装置1から転送された画像データを記憶装置に蓄積記憶(ストレージ)したり、当該画像データに基づいて医用画像を表示装置に表示出力したりするビューワとして機能する。カラープリンタ7は、レーザープリンタ等により構成され、転送装置1から転送された画像データに基づいて記録紙上に医用画像を画像形成して出力・排紙する。
The
転送装置1は、モダリティMから出力された医用画像のデータ信号を、ユーザの指示命令に従って選択された出力装置9に応じたデータ形式の画像データに変換し、当該画像データを通信ネットワークNを介して転送する。また、転送装置1は、変換した画像データをユーザの指示命令に従って内部のメモリに一時的に記憶したり、当該画像データをモダリティMに再生表示させたりする。これらの画像データに関する様々な機能を、医用画像に関する特定処理という。
The
これらの医用画像の出力装置9への転送、転送装置1の内部メモリへの一時的な記憶、再生表示等の各種機能に関する指示命令は、コマンド名として転送装置1のディスプレイ150に表示される。
Instruction commands relating to various functions such as transfer of these medical images to the
ユーザは、ディスプレイ150に表示されたコマンド名の中から所望のコマンド名をキースイッチ120やフットスイッチ(図示略)等を押下操作することで選択して、転送装置1に当該コマンド名に対応する指示命令を行う。また、本実施形態においては、イヤーセットマイク(以下、単に「マイク」という。)15にコマンド名を発声することで、転送装置1に当該コマンド名に対応する指示命令を行うことができる。
The user selects a desired command name from among the command names displayed on the
〔転送装置の構成〕
次に、転送装置1の機能構成について図2を参照して説明する。図2は、転送装置1の機能構成の一例を示すブロック図である。図2によれば、転送装置1は、CPU(Central Processing Unit)10と、音声入力部12と、操作入力部16と、表示部19を制御するディスプレイI/F18と、ビデオアンプ21によって増幅されたデータ信号を復号するデコーダ20と、通信部22と、プログラムメモリ24と、画像メモリ26と、記憶部28とがシステムバス30に接続されて構成される。
[Configuration of transfer device]
Next, the functional configuration of the
CPU10は、各機能部の動作の制御と、機能部間のデータの入出力の制御等を行うことで転送装置1を統括的に管理・制御する制御部である。具体的には、操作入力部16から入力される操作信号に応じてプログラムメモリ24に格納されたプログラムを読み出し、当該プログラムに従った処理を実行する。そして、その処理結果に基づいて表示部19の表示内容の更新や画像データの転送、記憶部28への記憶等を行う。
The
また、CPU10は、音声認識機能11を有する。音声認識機能11は、音声入力部12から入力される音声データに音声認識処理を施して当該音声データを文字列に変換する機能であり、HHM(Hidden Markov model;隠れマルコフモデル)等の公知技術を適宜採用可能である。
Further, the
音声認識機能11の動作原理としては、公知技術であるため詳細な説明は省略するが、簡単に説明すると次のようになる。先ず、入力されたデジタルの音声データにMFCC(Mel Frequency Cepstral Coefficients )等による音声の特徴分析を行い、音声区間を検出する。そして、その検出結果に基づいて音声データの区間毎に、認識辞書と比較してパターン認識を行って、音声データを文字列に変換する。
Since the operation principle of the
CPU10は、A/D変換器13を介して入力された音声データに音声認識を施して文字列に変換し、その文字列がコマンド名と一致した場合は、そのコマンド名に対応する指示命令に従った処理を行う。このため、ユーザは、操作入力部16の押下の代わりに、コマンド名を発声してマイク15から音声入力することで、転送装置1に対する指示命令を行って、当該転送装置1を操作することができるようになる。
The
音声入力部12は、マイク端子T1に着脱可能なマイク15と、アンプ14と、A/D変換器13と備えて構成される。アンプ14は、マイク端子T1に接続されたマイク15から入力された音声信号を増幅してA/D変換器13に出力する。A/D変換器13は、アンプ14によって増幅された音声信号をA/D変換して音声データとしてCPU10に出力する。
The
操作入力部16は、カーソルキーやテンキー等のキースイッチ120と、フットスイッチ等を備えて構成され、押下されたキースイッチの操作信号をCPU10に出力する。
The
ディスプレイI/F18は、RGBインターフェイスやNTSCインターフェイス等により構成され、CPU10の制御に基づいて表示部19の表示素子のON/OFFを制御する。表示部19は、図1に示すディスプレイ150に相当し、CRT(Cathode-ray Tube)やLCD(Liquid Crystal Display)等により構成される。表示部19は、ディスプレイI/F18を介して入力されたCPU10の制御に基づいた表示画面の表示や、画像データの再生表示を行う。
The display I /
尚、画像データの再生表示は、モダリティMが有する表示部に対して行うこととしてもよく、この場合は、画像データを例えば、NTSC形式のビデオ信号に変換するエンコーダと、モダリティMにビデオ信号を出力するビデオ出力端子とを設けることで実現可能である。 The image data may be reproduced and displayed on the display unit of the modality M. In this case, an encoder that converts the image data into, for example, an NTSC format video signal, and the video signal to the modality M are displayed. This can be realized by providing a video output terminal for output.
ビデオアンプ21は、NTSC(National Television Standards Committee)/PAL(Phase Alternation by Line)コンポジットビデオ信号やY/Cコンポーネントビデオ信号、RGBセパレートビデオ信号等の入力が可能なビデオ端子T3に接続されたモダリティMから出力されるビデオ信号を増幅してデコーダ20に出力する。デコーダ20は、ビデオアンプ21によって増幅されたビデオ信号をCPU10の制御に従って、所定のデータ形式に復号して画像データを生成する。尚、復号するデータ形式としては、DICOM形式やJPEG形式、MPEG形式等があり、転送する出力装置9に応じて選択される。また、ビデオアンプ21やデコーダ20を介することなくRS422形式でデジタルデータを直接入力可能なモダリティMの場合、ビデオアンプ21やデコーダ20の代わりに、RS422レシーバを設けてもよい。
The
通信部22は、LANインターフェイス等により構成され、ネットワーク端子T5を介して通信ネットワークNに接続されて、当該通信ネットワークNを介して出力装置9のイメージャ3やサーバ5、カラープリンタ7とデータ通信する機能部である。
The
プログラムメモリ24は、ROM(Read Only Memory)やフラッシュROM等によって構成され、CPU10が実行する初期プログラムやアプリケーションプログラム等の各種プログラムを記憶するメモリ領域である。画像メモリ26は、VRAM(Video RAM)等の揮発性メモリにより構成されて、出力装置9に転送する画像データを一時的に記憶するメモリ領域である。
The
記憶部28は、HDD(Hard Disk Drive)や半導体メモリ等を備えて構成され、CPU10が実行するプログラムに係るデータや、デコーダ20によって変換された画像データ等を記憶する不揮発性の記憶領域である。
The
〔第1実施形態〕
次に、転送装置1の第1実施形態について図3〜図5を参照して説明する。第1実施形態における転送装置1は、コマンド名の音声入力モードとして、標準モードと裏モードとが設けられる。
[First Embodiment]
Next, a first embodiment of the
標準モードは、一つ又は複数の単語で表される標準コマンド名で転送装置1に対する指示命令を音声入力するモードである。標準コマンド名としては、例えば、画像データを記憶部28に記憶させる指示命令としての「キロク」、表示部19に再生表示させる指示命令としての「サイセイ」、出力装置9に転送させる指示命令としての「テンソウ」等がある。
The standard mode is a mode in which an instruction command for the
裏モードは、標準コマンド名よりも短い字数の文字列又は数字の裏コマンド名で転送装置1に対する指示命令を音声入力するモードである。裏コマンド名としては、例えば、標準コマンド名の「キロク」に対応する「ケー」、「サイセイ」に対応する「エス」、「テンソウ」に対応する「ティー」等がある。
The reverse mode is a mode in which an instruction command to the
ユーザは、操作入力部16のキースイッチ120又はフットスイッチを押下することによって、標準モード及び裏モードの何れかを選択して、その選択した音声入力モードに応じたコマンド名を発声することで、転送装置1に対する指示命令を行う。
The user selects either the standard mode or the back mode by pressing the
図3(a)は、第1実施形態における記憶部28のデータ構成の一例を示す図である。図3(a)によれば、記憶部28は、入力文字列240と、コマンドテーブル242とを記憶している。入力文字列240は、CPU10が音声データに音声認識処理を施して取得した文字列である。
FIG. 3A is a diagram illustrating an example of a data configuration of the
コマンドテーブル242は、図3(b)に示すように、標準コマンド名と裏コマンド名とを番号n順に対応づけて記憶するデータテーブルである。例えば、コマンドテーブルの先頭(n=1)には、標準コマンド名「キロク」と裏コマンド名「ケー」とが対応づけられて記憶されている。 As shown in FIG. 3B, the command table 242 is a data table that stores standard command names and back command names in association with each other in the order of number n. For example, at the head (n = 1) of the command table, the standard command name “KIROK” and the reverse command name “K” are stored in association with each other.
CPU10は、音声入力モードとして標準モードが選択されている場合には、入力文字列240と標準コマンド名とを比較し、裏モードが選択されている場合には、裏コマンド名と比較する。そして、その比較の結果、一致した標準コマンド名又は裏コマンド名の指示命令が音声入力された判定して対応する処理を実行する。
The
一般に、音声認識の対象とする音声データが短いほうがその認識率が高くなる。このため、予め音声入力モードとして裏モードを選択して、ユーザが裏コマンド名を音声入力することで、その音声認識の認識率を向上させることができる。また、文字情報同士の比較は、比較の対象となる文字列の長さが短い程その精度が高くなる。このため、標準コマンド名よりも短いの裏コマンド名で比較を行うことにより、入力文字列240との比較の精度が高くなる。
In general, the recognition rate increases as the speech data to be speech-recognized is shorter. For this reason, when the reverse mode is selected as the voice input mode in advance and the user inputs the reverse command name by voice, the recognition rate of the voice recognition can be improved. Further, the accuracy of comparing character information increases as the length of the character string to be compared becomes shorter. For this reason, the comparison with the
次に、図4のフローチャートと、図5の表示画面例とを参照して転送装置1の具体的な動作について説明する。先ず、CPU10は、操作入力部16から出力された操作信号に基づいて、ユーザが選択した音声入力モードを判定する(ステップA1)。そして、標準モードが選択されたと判定した場合は(ステップA1;標準モード)、ステップA3〜A21の処理を行い、裏モードが選択されたと判定した場合は(ステップA1;裏モード)、ステップA23〜A41の処理を行う。
Next, a specific operation of the
CPU10は、標準モードが選択されたと判定した場合は、図5(a)のようなコマンド入力画面190を表示部19に表示させて、マイク15からの音声入力によってA/D変換器13からの音声データの入力を待機する。そして、A/D変換器13から入力された音声データに音声認識処理を施して(ステップA3)、音声データを文字列に変換して入力文字列240として記憶部28に記憶する(ステップA5)。
When determining that the standard mode has been selected, the
次いで、CPU10は、コマンドテーブル242の先頭(n=1)の標準コマンド名をコマンド候補として選択し(ステップA7)、そのコマンド候補と入力文字列240とを比較する(ステップA11)。CPU10は、この比較の結果、一致したと判定した場合は(ステップA11;Yes)、コマンド候補の指示命令(コマンド)に対応する処理を実行する(ステップA17)。
Next, the
また、コマンド候補と入力文字列240とが一致しないと判定した場合(ステップA11;No)、コマンド候補として選択している標準コマンド名がコマンドテーブル242の最後尾でなければ(ステップA13;No)、次(n=n+1)の標準コマンド名をコマンド候補として順次選択する(ステップA15)。そして、ステップA19の処理に移行して、入力文字列240とコマンド候補とを比較する。
If it is determined that the command candidate and the
例えば、図5(a)のコマンド入力画面190において「キロク」という音声データが音声入力された場合には、入力文字列240としての「キロク」とコマンドテーブル242の標準コマンド名とを比較していく。図3(b)のコマンドテーブルにおいては、先頭の標準コマンド名と入力文字列240とが一致すると判定して、モダリティMから取得した画像データの記憶部28への記憶(記録)を開始し、図5(b)のメッセージ画面192を表示する。
For example, when voice data “Kiroku” is inputted by voice on the
CPU10は、ステップA13において、コマンド候補として選択している標準コマンド名がコマンドテーブル242の最後尾であると判定した場合は(ステップA13;Yes)、再度音声入力を依頼するメッセージ(例えば、「もう一度コマンドを入力して下さい」)を表示部19に表示して(ステップA19)、ステップA21に移行する。
If the
CPU10は、ステップA17及びA19の処理後、ユーザにより例えば、キースイッチ120の終了キーが押下されたと判定した場合は(ステップA21;Yes)、標準モードによる音声入力を終了し、当該終了キーが押下されずに継続すると判定した場合は(ステップA21;No)、ステップA3に移行して、ステップA3〜A19の処理を繰り返す。
For example, when the
一方、CPU10は、ステップA1において、裏モードが選択されたと判定した場合は、図5(c)のコマンド入力画面194を表示すると共に、A/D変換器13から出力された音声データに音声認識処理を施し(ステップA23)、その認識結果から入力文字列240を記憶部28に記憶する(ステップA25)。CPU10は、コマンドテーブル242の先頭(n=1)の裏コマンド名をコマンド候補として選択し(ステップA27)、そのコマンド候補と入力文字列240とを比較する(ステップA31)。
On the other hand, if the
そして、ステップA31における比較の結果、一致したと判定した場合は(ステップA31;Yes)、コマンド候補として選択した裏コマンド名の指示命令に対応する処理を実行する(ステップA37)。CPU10は、コマンド実行後、ステップA21と同様に終了キーが押下されたと判定した場合は(ステップA41;Yes)、裏モードによる音声入力を終了し、継続すると判定した場合は(ステップA41;No)、ステップA23に移行して、ステップA23〜A39の処理を繰り返す。
If it is determined as a result of comparison in step A31 (step A31; Yes), processing corresponding to the instruction command for the reverse command name selected as the command candidate is executed (step A37). When the
尚、ステップA31において選択した裏コマンド名(コマンド候補)と入力文字列240とが一致しなかった場合に行う処理(ステップA33,A35,A39)は、標準モードにおけるステップA13,A15,A19と同様であるためその説明は省略する。
The processing (steps A33, A35, A39) performed when the back command name (command candidate) selected in step A31 does not match the
例えば、音声認識を行って「ケー」という入力文字列240を取得した場合、この入力文字列240「ケー」とコマンドテーブル242の裏コマンド名とを比較していく。図3(b)のコマンドテーブルにおいては、先頭の裏コマンド名と入力文字列240とが一致すると判定する。そして、その裏コマンド名に対応づけられた標準コマンド名の「キロク」の指示命令、即ち、モダリティMから取得した画像データの記憶部28への記憶(記録)を開始し、図5(b)のメッセージ画面192を表示する。
For example, when the
このように、裏モードにおいては標準モードのコマンド名「キロク」よりも字数が小さい「ケー」という音声入力によって、画像データの記憶部28への記憶を転送装置1に指示することができる。
Thus, in the reverse mode, the
以上、第1実施形態によれば、標準コマンド名よりも短い字数の裏コマンド名を当該標準コマンド名に対応づけて記憶して、裏モードにおいて音声入力された音声が裏コマンド名と一致した場合は、その裏コマンド名に対応する標準コマンド名の指示命令を実行する。これにより、標準コマンド名よりも短い音声入力で転送装置1を操作できるようになる。
As described above, according to the first embodiment, the back command name having a shorter number of characters than the standard command name is stored in association with the standard command name, and the voice input in the back mode matches the back command name. Executes the instruction command of the standard command name corresponding to the reverse command name. As a result, the
このため、医療の現場の環境ノイズやユーザの声色の変化等の影響等を受けにくくすることができ、転送装置1に対する指示命令の音声入力をより確実に行うことができる。また、音声入力により転送装置1を操作できるため、医用画像の取り込みにおける操作が容易になると共に、ユーザの転送装置1に対する接触が減るため衛生面も改善される。
For this reason, it can be made hard to receive the influence of the environmental noise of a medical field, a user's voice color change, etc., and the voice input of the instruction command with respect to the
尚、上述した第1実施形態において、標準モードと裏モードとの選択を操作入力部16の操作によって行うこととしたが、この音声入力モードの選択を音声入力によって行うこととしてもよい。より具体的には、標準モードを選択するためのキーワード(例えば、「ヒョウジュン」)と、裏モードを選択するためのキーワード(例えば、「ウラ」)とを予め設定しておき、これらのキーワードが音声入力されたことによって標準モードと裏モードとを切り替えることとしてもよい。これにより、ユーザは、転送装置1の操作入力部16に接触することなく音声入力モードを選択することができる。
In the first embodiment described above, the selection between the standard mode and the back mode is performed by operating the
また、コマンド名を音声認識した後に、そのコマンド名の指示命令を実行することとして説明したが、そのコマンド名を一旦ユーザに確認してから実行することとしてもよい。例えば、標準モードが選択され、ステップA11においてコマンド候補と入力文字列240とが一致すると判定した場合に、図5(d)のコマンド確認画面196を表示部19に表示する。そして、「ハイ」という音声データが音声入力された場合には、コマンド名の指示命令を実行し、「イイエ」という音声データが音声入力された場合は、ステップA13に移行して、コマンドテーブル242からコマンド候補を選択して比較していく。
Further, although it has been described that the command name is instructed to be executed after voice recognition of the command name, the command name may be once confirmed with the user and executed. For example, when the standard mode is selected and it is determined in step A11 that the command candidate matches the
また、裏モードが選択された場合には、図5(e)のコマンド確認画面198を表示部19に表示する。そして、「ワイ(イエス)」という音声データが音声入力された場合に、コマンド名の指示命令を実行し、標準モードよりも字数の「エヌ(ノー)」という音声データが音声入力された場合に、ステップA33に移行する。
When the back mode is selected, the
このように、コマンド確認画面196及び198において音声認識したコマンド名を確認することで、誤った指示命令の実行を防止することができると共に、裏モードにおいては、その確認時の音声入力の認識率を高めることができる。 In this way, by confirming the command name that has been voice-recognized on the command confirmation screens 196 and 198, execution of an erroneous instruction command can be prevented, and in the back mode, the recognition rate of voice input at the time of the confirmation Can be increased.
また、裏コマンド名を、標準コマンド名をアルファベット表記した場合の頭文字に設定することとしたが、例えば、図5(f)のようなコマンド入力画面200を表示して、「イチ(1)」、「ニ(2)」、「サン(3)」、・・・、といった数字を裏コマンド名として設定することとしてもよい。この場合も、標準コマンド名よりも短い字数に裏コマンド名を設定することができるため、第1実施形態と同様の効果が得られるのは無論である。
In addition, the reverse command name is set to the initial letter when the standard command name is expressed in alphabets. For example, a
〔第2実施形態〕
次に、転送装置1の第2実施形態について図6〜図7を参照して説明する。尚、第1実施形態における転送装置1と同一の構成要素には、同一の符号を伏してその詳細な説明は適宜省略する。
[Second Embodiment]
Next, a second embodiment of the
第2実施形態における転送装置1は、音声入力モードとして標準モードと選択モードとを有して構成される。選択モードは、標準モードにおいて入力文字列240と一致する標準コマンド名とがなかった場合に、当該入力文字列240と類似するコマンド名(以下、「類似コマンド名」という。)を一覧表示して、その類似コマンド名の中からの選択を可能としたモードである。
The
図6(a)に、第2実施形態における記憶部28のデータ構成の一例を示す。図6(a)によれば、記憶部28は、入力文字列240と、コマンドテーブル244と、類似コマンドテーブル246とを記憶する。第2実施形態におけるコマンドテーブル244は、図6(b)に示すように番号(n)順に標準コマンド名を記憶するデータテーブルである。
FIG. 6A shows an example of the data configuration of the
類似コマンドテーブル246は、入力文字列240に類似するコマンド名をコマンドテーブル244から抽出して蓄積的に記憶するデータテーブルであり、図6(c)に示すように番号(m)順に類似コマンド名を記憶する。
The similar command table 246 is a data table in which command names similar to the
CPU10は、標準モードにおいて入力文字列240と一致する標準コマンド名がコマンドテーブル244に記憶されていなかった場合は、音声入力モードを選択モードに切り替える。そして、入力文字列240の先頭文字を取得し、この先頭文字から始まる標準コマンド名を類似コマンド名としてコマンドテーブル244から抽出して、類似コマンドテーブル246に蓄積記憶していく。ユーザは、類似コマンドテーブル246の番号(m)を音声入力することで、所望の類似コマンド名を選択して、当該コマンド名の指示命令を転送装置1に実行させることができる。
When the standard command name that matches the
次に、第2実施形態における転送装置1の具体的な動作について、図7のフローチャートを参照して説明する。尚、第1実施形態の図4のフローチャートと同一の処理内容には、同一のステップ番号を付してその説明を省略する。
Next, a specific operation of the
先ず、CPU10は、音声入力モードを標準モードとして、第1実施形態と同一のステップA3〜A21の処理を行うが、ステップA13において、コマンド候補がコマンドテーブル244の最後尾であると判定した場合、即ち、入力文字列240と一致する標準コマンド名がコマンドテーブル244に記憶されていなかった場合(ステップA13;Yes)、音声入力モードを標準モードから選択モードに切り替え、次の処理を行う。
First, the
具体的には、コマンドテーブル244内の先頭(n=1)の標準コマンド名をコマンド候補として選択し(ステップB23)、入力文字列240の先頭文字と、コマンド候補の先頭文字とが一致するか否かを比較する(ステップB27)。そして、比較の結果、コマンド候補と入力文字列240の先頭文字が一致した場合は(ステップS27;Yes)、その標準コマンド名を類似コマンド名としてコマンドテーブル244に追加記憶する(ステップB29)。
Specifically, the first (n = 1) standard command name in the command table 244 is selected as a command candidate (step B23), and the first character of the
また、ステップB25の比較の結果、コマンド候補と入力文字列240の先頭文字が一致しなかった場合、CPU10は、コマンド候補として選択している標準コマンド名がコマンドテーブル244の最後尾であるか否かを判定する(ステップB31)。CPU10は、最後尾ではないと判定した場合は(ステップB31;No)、次(n=n+1)の標準コマンド名をコマンドテーブル244の中から選択して(ステップB33)、ステップB25の処理に移行する。
If the command candidate does not match the first character of the
例えば、音声認識の結果、「セイガ」という入力文字列240を取得したとする。このとき、図6(b)のコマンドテーブル244に「セイガ」という標準コマンド名は記憶されていないため、「セ」で始まる標準コマンド名の「セイシガ」と「セッテイ」をコマンドテーブル244から抽出して図6(c)のデータ構成の類似コマンドテーブル246に記憶する。このようにして、入力文字列240の先頭文字で始まる標準コマンド名、即ち類似する標準コマンド名を記憶した類似コマンドテーブル246が作成される。
For example, it is assumed that an
CPU10は、ステップB31において選択している標準コマンド名がコマンドテーブル244の最後尾であると判定した場合(ステップB31;Yes)、記憶部28から類似コマンドテーブル246を読み出して、図8(a)の類似コマンド選択画面202のように番号mと類似コマンド名とを表示部19に一覧表示させる(ステップB35)。
If the
そして、例えば、「該当するコマンドの番号を数字で選択して下さい」という表示メッセージにより、選択モードに切り替わった旨を表示部19に表示させる(ステップB37)。CPU10は、A/D変換器13からの音声データの入力を待機し、出力された音声データに音声認識処理を施し(ステップB39)、その認識結果から取得した文字列を入力文字列240として記憶部28に記憶する(ステップB41)。
Then, for example, the
そして、類似コマンドテーブル246の先頭番号(m=1)を選択し、この番号と入力文字列240とを比較する(ステップB43)。CPU10は、ステップB43における比較の結果、一致すると判定した場合は(ステップB45;Yes)、ステップA17に処理を移行し、その番号mに対応する類似コマンド名の指示命令を実行する(ステップA17)。
Then, the head number (m = 1) of the similar command table 246 is selected, and this number is compared with the input character string 240 (step B43). As a result of the comparison in step B43, when it is determined that they match (step B45; Yes), the
一方、ステップB45において、一致しないと判定した場合は(ステップB45;No)、次の番号(m=m+1)を順次選択して(ステップB49)、入力文字列240と番号mとを比較する。CPU10は、この番号mの選択と比較を繰り返し、選択した番号mが類似コマンドテーブル246の最後尾であると判定した場合は(ステップB47)、再度音声入力を依頼する旨を表示部19に表示して(ステップB51)、ステップB23に処理を移行する。
On the other hand, if it is determined in step B45 that they do not match (step B45; No), the next number (m = m + 1) is sequentially selected (step B49), and the
例えば、図8(a)の類似コマンド選択画面202の表示後、音声認識の結果、「イチ」という入力文字列240を取得した場合、CPU10は、類似コマンドテーブル246において番号m=1に対応する類似コマンド名「セイシガ」の指示命令を実行する。具体的には、モダリティMから静止画の画像データを取得する静止画モードに移行して、図8(b)のようなコマンド入力画面204を表示し、静止画モードにおけるコマンド名の入力を待機する。
For example, after the display of the similar
そして、次に入力文字列240として「キ」を取得した場合、「キ」という標準コマンド名をコマンドテーブル244を記憶していないため、「キ」で始まる標準コマンド名を抽出して、図8(c)の類似コマンド選択画面206を表示する。ユーザは、この表示されたコマンド名の中から、所望のコマンド名の番号を音声で選択することで、図8(d)のように静止画の画像データの記録を開始させる。
Then, when “ki” is acquired as the
以上、第2実施形態によれば、標準モードにおいて音声認識して取得した入力文字列240と標準コマンド名とが一致しなかった場合は、コマンドテーブル244の中から類似コマンド名を抽出して一覧表示する。そして、類似コマンド名と共に表示した番号がユーザにより音声入力された際に、その番号に対応する類似コマンド名の指示命令を実行する。
As described above, according to the second embodiment, when the
これにより、音声認識の認識率が低下した場合にも、ユーザの音声入力に類似するコマンド名の中から、番号という短い字数の音声入力でコマンド名を選択できる。このため、転送装置1に対する指示命令をより確実に行うことができると共に、外部環境の悪い中でも、転送装置1に対する指示命令の音声入力をより迅速に行うことができる。
Thereby, even when the recognition rate of voice recognition is lowered, a command name can be selected by voice input of a short number of characters called a number from command names similar to the user's voice input. For this reason, the instruction command for the
尚、上述した第2実施形態では、類似コマンド名と共に番号を表示することとしたが、例えば、“A”、“B”、“C”といったアルファベット等の文字情報を類似コマンド名と共に表示し、アルファベットにより類似コマンド名を選択可能としても同様の効果が得られることは無論である。 In the second embodiment described above, the number is displayed together with the similar command name. For example, character information such as alphabet such as “A”, “B”, “C” is displayed together with the similar command name, It goes without saying that the same effect can be obtained even if similar command names can be selected by the alphabet.
また、類似コマンド名を入力文字列240の先頭文字と一致するか否かによって抽出することとしたが、例えば、入力文字列240の先頭と最後尾の文字それぞれと、コマンド名の先頭と最後尾の文字それぞれとが一致するコマンド名を類似コマンド名として抽出することとしてもよいし、入力文字列240の母音の配列と一致するコマンド名を類似コマンド名として抽出することとしてもよい。このように、類似コマンド名を抽出する条件設定を変更することで、ユーザの音声入力により近似するコマンド名を抽出することができるようになる。
Further, the similar command name is extracted depending on whether or not it matches the first character of the
また、標準コマンド名のユーザの使用頻度に応じて、類似コマンド名の表示順序を変更することとしてもよい。この場合、コマンドテーブル244の標準コマンド名に、その標準コマンド名がユーザにより選択された回数を記憶しておく。そして、抽出した類似コマンド名を一覧表示する際は、対応付けられた回数の降順に整列して表示する。これにより、ユーザは、使用頻度の高いコマンド名を容易に選択して音声入力することができるようになる。 The display order of similar command names may be changed according to the frequency of use of the standard command name by the user. In this case, the standard command name in the command table 244 stores the number of times the standard command name has been selected by the user. When the extracted similar command names are displayed as a list, they are displayed in the descending order of the associated number of times. As a result, the user can easily select and input a command name that is frequently used.
また、類似コマンドテーブル246として記憶した類似コマンド名のうち、転送装置1の処理状態に応じて実行可能な指示命令の類似コマンド名が一つだった場合は、その指示命令をそのまま実行することとしてもよい。具体的には、図8(d)のコマンド入力画面208の表示時に音声入力が為されて、「テ」という入力文字列240を取得したとする。このとき、類似コマンド名として「テンソウ」と「テイシ」を抽出する。
In addition, if the similar command name stored as the similar command table 246 has one similar command name of the instruction command that can be executed according to the processing state of the
そして、静止画の画像データの記録中に実行可能なコマンドが「テイシ」であった場合は、そのまま画像データの記録を停止して、図8(e)のようなコマンド入力画面210を表示させる。これにより、より迅速に転送装置1に対する指示命令を行えるようになる。
If the command that can be executed during the recording of the still image data is “taste”, the recording of the image data is stopped as it is, and the
また、ユーザの音声入力を待機する際には、CPU10が直前に実行したコマンドと関連性の高いコマンド名を一覧表示することとしてもよい。図9は、コマンド名の関連性を階層化して示したツリー構造の一例である。
Further, when waiting for the user's voice input, a list of command names highly relevant to the command executed immediately before by the
例えば、コマンド名「ドウガ(動画)」と関連性の高いコマンド名として、「キロク(記録)」、「サイセイ(再生)」、「テンソウ(転送)」、「ショウキョ(消去)」及び「キャンセル」があり、そのうちの「キロク」と関連性の高いコマンド名として「カイシ(開始)」と「キャンセル」とがある。これらの関連性を、図9のように予め階層化しておく。 For example, as command names that are highly related to the command name “DOGA (video)”, “KIROKU (record)”, “Saisei (playback)”, “TENSO (transfer)”, “Show (erase)”, and “Cancel” Among them, “Kishi (start)” and “Cancel” are command names highly relevant to “Kirok”. These relationships are hierarchized in advance as shown in FIG.
CPU10は、転送装置1の初期状態において、最上層のコマンド名を図10(a)のコマンド入力画面212のように表示させる。そして、入力文字列240として「セ」を取得した場合には、最上層のコマンド名のうち、「セ」で始まるコマンド名、即ち、「セイシガ(静止画)」と「セッテイ(設定)」と抽出して、図10(b)のように表示させる。
In the initial state of the
そして、例えば、「イチ」という入力文字列240を取得した際には、図10(c)のように静止画モードに移行するように、その入力文字列240に基づいて音声入力により選択された番号に対応するコマンドを実行する。このとき、選択されたコマンド名「セイシガ」の下層のコマンド名である「キロク(記録)」、「サイセイ(再生)」、「テンソウ(転送)」、「ショウキョ(消去)」及び「キャンセル」を表示させて、次の音声入力を待機する。
For example, when the
次いで、入力文字列240として「キ」を取得した際には、図10(d)のコマンド入力画面218のように「キ」で始まるコマンド名を表示する。ユーザは、このコマンド名の中から「キロク(記録)」を音声入力で選択すると、図10(e)のように更に下層のコマンド名「カイシ(開始)」及び「キャンセル」が表示される。
Next, when “ki” is acquired as the
CPU10は、入力文字列240として「カ」を取得すると、「カ」で始まるコマンド名の指示命令、即ち、静止画の画像データの記録を開始し、その下層の「テイシ(停止)」を図10(f)のように表示する。このとき、「テイシ(停止)」の下層にコマンド名はない。この場合、CPU10は、「テ」という入力文字列240を取得した際には、画像データの記録を停止すると共に、「テイシ(停止)」の上層のコマンド名「カイシ(開始)」及び「キャンセル」を図10(g)のように表示する。
When the
このように、ユーザが選択したコマンド名と関連例の高いコマンド名が表示されるため、ユーザは、表示部19に表示されていくコマンド名の中から逐次選択することで、転送装置1の実際の使用に即した順序でコマンド名を選択してくことができる。
As described above, since the command name selected by the user and the command name having a high related example are displayed, the user can sequentially select the command name displayed on the
S 医用画像出力システム
1 転送装置
9 出力装置
11 音声認識機能
12 音声入力部
13 A/D変換器
14 アンプ
15 マイク
16 操作入力部
19 表示部
22 通信部
24 プログラムメモリ
26 画像メモリ
28 記憶部
240 入力文字列
242 コマンドテーブル
244 コマンドテーブル
246 類似コマンドテーブル
S Medical
Claims (10)
前記音声入力手段により入力された音声の音声認識を行って文字情報に変換する音声認識手段と、
医用画像に関する特定処理の実行の指示命令を行うコマンド名と、当該コマンド名より字数が短い短縮コマンド名とを対応づけて記憶する記憶手段と、
前記音声認識手段により変換された文字情報と、前記記憶手段に記憶された短縮コマンド名とを比較する比較手段と、
前記比較手段による比較の結果が一致した場合に、当該比較した短縮コマンド名に対応づけられた前記コマンド名の指示命令を実行するコマンド実行手段と、
を備えることを特徴とするコマンド入力装置。 Voice input means;
Voice recognition means for performing voice recognition of the voice input by the voice input means and converting it into character information;
Storage means for storing a command name for performing an instruction to execute a specific process relating to a medical image and a shortened command name having a shorter number of characters than the command name;
Comparing means for comparing the character information converted by the voice recognition means with the shortened command name stored in the storage means;
Command execution means for executing an instruction instruction of the command name associated with the compared shortened command name when the comparison result by the comparison means matches;
A command input device comprising:
前記比較手段は、
前記選択手段により第1の音声入力モードが選択された場合、前記音声認識手段により変換された文字情報と前記コマンド名とを比較し、
前記第2の音声入力モードが選択された場合、前記音声認識手段により変換された文字情報と前記短縮コマンド名とを比較することを特徴と請求項1に記載のコマンド入力装置。 And further comprising selection means for selecting one of the first and second voice input modes,
The comparison means includes
When the first voice input mode is selected by the selection means, the character information converted by the voice recognition means is compared with the command name,
2. The command input device according to claim 1, wherein when the second voice input mode is selected, the character information converted by the voice recognition means is compared with the abbreviated command name.
前記音声認識手段により変換された文字情報に基づいて前記第1及び第2の音声入力モードの何れかを選択することを特徴とする請求項2に記載のコマンド入力装置。 The selection means includes
3. The command input device according to claim 2, wherein one of the first and second voice input modes is selected based on the character information converted by the voice recognition means.
前記音声入力手段により入力された音声の音声認識を行って文字情報に変換する音声認識手段と、
医用画像に関する特定処理の実行の指示命令を行うコマンド名を複数記憶する記憶手段と、
前記記憶手段に記憶されたコマンド名の中から、前記音声認識手段により変換された文字情報に類似するコマンド名を抽出する抽出手段と、
前記コマンド名よりも字数が短い識別文字情報を、前記抽出手段により抽出されたコマンド毎に対応づけて一覧表示する一覧表示手段と、
前記音声認識手段により変換された文字情報と前記一覧表示された識別文字情報とを比較する比較手段と、
前記比較手段による比較の結果が一致した場合に、当該比較した識別文字情報に対応づけて表示された前記コマンド名の指示命令を実行するコマンド実行手段と、
を備えることを特徴とするコマンド入力装置。 Voice input means;
Voice recognition means for performing voice recognition of the voice input by the voice input means and converting it into character information;
Storage means for storing a plurality of command names for instructing execution of specific processing relating to medical images;
Extracting means for extracting a command name similar to the character information converted by the voice recognition means from the command names stored in the storage means;
A list display unit that displays a list of identification character information having a shorter number of characters than the command name in association with each command extracted by the extraction unit;
Comparison means for comparing the character information converted by the voice recognition means and the identification character information displayed in the list;
Command execution means for executing an instruction command of the command name displayed in association with the compared identification character information when the comparison result by the comparison means matches;
A command input device comprising:
前記記憶手段に記憶されたコマンド名の中から、前記変換された文字情報と先頭一致するコマンド名を抽出することを特徴とする請求項4に記載のコマンド入力装置。 The extraction means includes
5. The command input device according to claim 4, wherein a command name that matches the head of the converted character information is extracted from command names stored in the storage means.
前記抽出手段により抽出されたコマンド名をユーザの使用頻度の高い順に一覧表示する頻度順表示手段を有することを特徴とする請求項4又は5に記載のコマンド入力装置。 The list display means includes:
6. The command input device according to claim 4, further comprising a frequency order display means for displaying a list of command names extracted by the extraction means in descending order of use frequency of the user.
前記抽出手段により抽出されたコマンド名のうち、前記コマンド実行手段が直前に実行した指示命令のコマンド名と関連性のあるコマンド名を一覧表示する関連順一覧表示手段を有することを特徴とする請求項4〜6の何れか一項に記載のコマンド入力装置。 The list display means includes:
The apparatus further comprises a related order list display means for displaying a list of command names related to the command name of the instruction command executed immediately before by the command execution means among the command names extracted by the extraction means. Item 7. The command input device according to any one of Items 4 to 6.
音声入力手段により入力された音声の音声認識を行って文字情報に変換する音声認識手段、
医用画像に関する特定処理の実行の指示命令を行うコマンド名と、当該コマンド名より字数が少ない短縮コマンド名とを対応づけて記憶する記憶手段、
前記音声認識手段により変換された文字情報と、前記記憶手段に記憶された短縮コマンド名とを比較する比較手段、
前記比較手段による比較の結果が一致した場合に、当該比較した短縮コマンド名に対応づけられた前記コマンド名の指示命令を実行するコマンド実行手段、
として機能させるためのプログラム。 Computer
Speech recognition means for performing speech recognition of speech input by the speech input means and converting it into character information;
Storage means for storing a command name for performing an instruction to execute a specific process relating to a medical image and an abbreviated command name having fewer characters than the command name;
Comparison means for comparing the character information converted by the voice recognition means with the shortened command name stored in the storage means;
Command execution means for executing an instruction instruction of the command name associated with the compared short command name when the result of comparison by the comparison means matches;
Program to function as.
音声入力手段により入力された音声の音声認識を行って文字情報に変換する音声認識手段、
医用画像に関する特定処理の実行の指示命令を行うコマンド名を複数記憶する記憶手段、
前記記憶手段に記憶されたコマンド名の中から、前記音声認識手段により変換された文字情報に類似するコマンド名を抽出する抽出手段、
前記抽出手段により抽出されたコマンド名毎に識別文字情報を対応づけて一覧表示する一覧表示手段、
前記音声認識手段により変換された文字情報と前記一覧表示された識別文字情報とを比較する比較手段、
前記比較手段による比較の結果が一致した場合に、当該比較した識別文字情報に対応づけて表示された前記コマンド名の指示命令を実行するコマンド実行手段、
として機能させるためのプログラム。 Computer
Speech recognition means for performing speech recognition of speech input by the speech input means and converting it into character information;
Storage means for storing a plurality of command names for instructing execution of specific processing relating to medical images;
Extraction means for extracting a command name similar to the character information converted by the voice recognition means from the command names stored in the storage means;
List display means for displaying a list in association with identification character information for each command name extracted by the extraction means;
Comparison means for comparing the character information converted by the voice recognition means with the identification character information displayed in the list;
Command execution means for executing an instruction command of the command name displayed in association with the compared identification character information when the result of comparison by the comparison means matches;
Program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006045008A JP2007226388A (en) | 2006-02-22 | 2006-02-22 | Command input device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006045008A JP2007226388A (en) | 2006-02-22 | 2006-02-22 | Command input device and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007226388A true JP2007226388A (en) | 2007-09-06 |
Family
ID=38548173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006045008A Pending JP2007226388A (en) | 2006-02-22 | 2006-02-22 | Command input device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007226388A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4876198B1 (en) * | 2010-11-12 | 2012-02-15 | パイオニア株式会社 | Information output device, information output method, information output program, and information system |
US10283109B2 (en) | 2015-09-09 | 2019-05-07 | Samsung Electronics Co., Ltd. | Nickname management method and apparatus |
KR20190060157A (en) * | 2017-11-24 | 2019-06-03 | 삼성전자주식회사 | Electronic apparatus and control method thereof |
WO2020090243A1 (en) * | 2018-10-31 | 2020-05-07 | ソニー株式会社 | Information processing device and program |
JP2020089641A (en) * | 2018-12-07 | 2020-06-11 | 株式会社日立製作所 | Voice recognition input device, voice recognition input program, and medical image capturing system |
EP4050599A1 (en) * | 2012-09-28 | 2022-08-31 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
JP7359008B2 (en) | 2020-01-31 | 2023-10-11 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and information processing program |
WO2024043432A1 (en) * | 2022-08-22 | 2024-02-29 | Lg Electronics Inc. | Voice recognition device operating with another device |
-
2006
- 2006-02-22 JP JP2006045008A patent/JP2007226388A/en active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4876198B1 (en) * | 2010-11-12 | 2012-02-15 | パイオニア株式会社 | Information output device, information output method, information output program, and information system |
EP4050599A1 (en) * | 2012-09-28 | 2022-08-31 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
US10283109B2 (en) | 2015-09-09 | 2019-05-07 | Samsung Electronics Co., Ltd. | Nickname management method and apparatus |
KR20190060157A (en) * | 2017-11-24 | 2019-06-03 | 삼성전자주식회사 | Electronic apparatus and control method thereof |
US11455990B2 (en) | 2017-11-24 | 2022-09-27 | Samsung Electronics Co., Ltd. | Electronic device and control method therefor |
KR102455067B1 (en) | 2017-11-24 | 2022-10-17 | 삼성전자주식회사 | Electronic apparatus and control method thereof |
WO2020090243A1 (en) * | 2018-10-31 | 2020-05-07 | ソニー株式会社 | Information processing device and program |
JP2020089641A (en) * | 2018-12-07 | 2020-06-11 | 株式会社日立製作所 | Voice recognition input device, voice recognition input program, and medical image capturing system |
JP7141938B2 (en) | 2018-12-07 | 2022-09-26 | 富士フイルムヘルスケア株式会社 | Voice recognition input device, voice recognition input program and medical imaging system |
JP7359008B2 (en) | 2020-01-31 | 2023-10-11 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and information processing program |
WO2024043432A1 (en) * | 2022-08-22 | 2024-02-29 | Lg Electronics Inc. | Voice recognition device operating with another device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007226388A (en) | Command input device and program | |
US11222716B2 (en) | System and method for review of automated clinical documentation from recorded audio | |
US6392633B1 (en) | Apparatus for audio dictation and navigation of electronic images and documents | |
US6988990B2 (en) | Automatic annotation filler system and method for use in ultrasound imaging | |
US20050259959A1 (en) | Media data play apparatus and system | |
US20120130720A1 (en) | Information providing device | |
WO2018105373A1 (en) | Information processing device, information processing method, and information processing system | |
JP2007293600A (en) | Medical-use server device, input device, proofreading device, browsing device, voice input report system, and program | |
JP2007010754A (en) | User interface device and method thereof | |
JP2023501283A (en) | Automatic Speech Recognizer and Speech Recognition Method Utilizing Keyboard Macro Function | |
JP2017102939A (en) | Authoring device, authoring method, and program | |
US20150066528A1 (en) | Computer-implemented method and system for generating a report | |
CN116824930A (en) | Intelligent ultrasonic teaching platform and equipment integrating virtual reality and large language model | |
JP5041853B2 (en) | Content generation apparatus and content generation program | |
US20040078758A1 (en) | Method for producing documented medical image information | |
JP6379609B2 (en) | Ultrasonic image display device and program | |
JP6229433B2 (en) | Operation guidance server, operation guidance system, image forming apparatus, and program | |
JP2009061040A (en) | Ultrasonic diagnostic system | |
JP2004288008A (en) | Program for presentation, and system for presentation | |
JP2006141903A (en) | Ultrasonic diagnostic apparatus | |
WO2019174026A1 (en) | Ultrasonic voice control method and ultrasonic device | |
WO2012017525A1 (en) | Processing device and command input assistance method | |
JP2009080614A (en) | Display controller, program, and display system | |
JP2011125562A (en) | Medical image diagnostic apparatus and medical image system | |
JP2009054009A (en) | Structured document drawing apparatus, structured document drawing method, program, and storage medium |