WO2021029293A1 - 医用画像処理装置、内視鏡システム、及び医用画像処理方法 - Google Patents

医用画像処理装置、内視鏡システム、及び医用画像処理方法 Download PDF

Info

Publication number
WO2021029293A1
WO2021029293A1 PCT/JP2020/029968 JP2020029968W WO2021029293A1 WO 2021029293 A1 WO2021029293 A1 WO 2021029293A1 JP 2020029968 W JP2020029968 W JP 2020029968W WO 2021029293 A1 WO2021029293 A1 WO 2021029293A1
Authority
WO
WIPO (PCT)
Prior art keywords
notification
medical image
unit
image processing
switching
Prior art date
Application number
PCT/JP2020/029968
Other languages
English (en)
French (fr)
Inventor
星矢 竹之内
Original Assignee
富士フイルム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルム株式会社 filed Critical 富士フイルム株式会社
Priority to JP2021539231A priority Critical patent/JPWO2021029293A1/ja
Publication of WO2021029293A1 publication Critical patent/WO2021029293A1/ja
Priority to US17/591,386 priority patent/US20220151461A1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • A61B1/000094Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope extracting biological structures
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00043Operational features of endoscopes provided with output arrangements
    • A61B1/00045Display arrangement
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00043Operational features of endoscopes provided with output arrangements
    • A61B1/00055Operational features of endoscopes provided with output arrangements for alerting the user
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/04Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
    • A61B1/045Control thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • A61B1/000095Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope for image enhancement
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • A61B1/000096Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope using artificial intelligence
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/04Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
    • A61B1/043Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances for fluorescence imaging
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/06Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor with illuminating arrangements
    • A61B1/0638Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor with illuminating arrangements providing two or more wavelengths

Definitions

  • the present invention relates to a medical image processing device, an endoscope system, and a medical image processing method for notifying a recognition result of a medical image.
  • Patent Document 1 describes a capsule endoscope that outputs a notification sound (notice sound, notification sound, end sound) notifying that a feature image is displayed.
  • the present invention has been made in view of such circumstances, and provides a medical image processing device, an endoscopic system, and a medical image processing method capable of sufficiently recognizing the operating state of a support function by a user.
  • the purpose is a medical image processing device, an endoscopic system, and a medical image processing method capable of sufficiently recognizing the operating state of a support function by a user. The purpose.
  • the medical image processing apparatus includes an image acquisition unit that acquires a time-series medical image, a recognition unit that recognizes a region of interest in the acquired medical image, and a recognition unit.
  • a notification unit that notifies the recognition result in at least one mode, and a notification unit that switches to a non-notification state in which notification is not performed when a predetermined condition is satisfied after the start of the notification state in which notification is performed. It is provided with a switching notification unit for notifying that the notification state is switched to the non-notification state.
  • the medical image processing device is a notification unit that notifies the recognition result in at least one aspect, and notifies when a predetermined condition is satisfied after the start of the notification state for performing notification. Since the notification unit for switching to the non-notification state is provided, the support can be terminated as needed (according to a predetermined condition). Further, since the switching notification unit for notifying the switching from the notified state to the non-notified state is provided, the user can sufficiently recognize the operating state of the support function (switching from the notified state to the non-notified state).
  • predetermined conditions can be set for the elapsed time of the notified state and the non-notified state, the presence / absence and content of the user operation, the recognition result of the region of interest, and the like.
  • the medical image processing apparatus may set conditions according to the user's operation, or may be set without the user's operation.
  • the "region of interest” may include a lesion region, a lesion candidate region, and a region after treatment
  • "recognition" of the region of interest refers to the presence, number, position, size, shape, and It may include determining the type, movement in the image, degree of lesion, etc. (detection, measurement, classification, etc.).
  • acquisition of medical image includes sequentially acquiring a plurality of medical images taken at a predetermined frame rate. The acquisition may or may not be real-time.
  • the image acquisition unit may acquire a plurality of medical images by photographing an image with an imaging device including an imaging optical system and an image sensor, or acquire a plurality of pre-recorded medical images via a network and / or a recording medium. You may.
  • the medical image processing apparatus can be realized as, for example, a processor of a medical image processing system, but is not limited to such an aspect.
  • the "medical image” refers to an image obtained as a result of photographing and measuring a living body such as a human body for the purpose of diagnosis, treatment, measurement, etc., for example, an endoscopic image, an ultrasonic image, a CT image (CT). : Computed Tomography), MRI image (MRI: Magnetic Resonance Imaging) can be mentioned.
  • CT image Computed Tomography
  • MRI image Magnetic Resonance Imaging
  • the medical image processing apparatus notifies the switching notification unit that the notification state is switched from the non-notification state to the notification state. According to the second aspect, the user can be fully aware of the change from the non-notification state to the notification state.
  • the switching notification unit notifies the switching from the notification state to the non-notification state in the first aspect, and changes from the non-notification state to the notification state. Is notified in a second aspect different from the first aspect. According to the third aspect, since the mode is different between the switching from the notification state to the non-notification state and the switching from the non-notification state to the notification state, the user can clearly grasp the change of the notification state.
  • the notification unit switches to the non-notification state after a lapse of a predetermined time from the start of the notification state, and the switching notification unit Notifies the switch from the notified state to the non-notified state. According to the fourth aspect, excessive notification can be suppressed.
  • the medical image processing apparatus is the notification unit from the non-notification state after a lapse of a predetermined time after the recognition unit recognizes the region of interest. It switches to the notification state, and the switching notification unit notifies the switching to the notification state. According to the fifth aspect, it is possible to suppress a decrease in attention to the medical image and not hinder the improvement of the ability to detect the region of interest.
  • the switching notification unit gives a notification at a time determined before the switching of the notification state.
  • the user can grasp the change of the notification state in advance.
  • the switching notification unit gives a notification at the same time as the switching of the notification state.
  • the user can grasp the change of the notification state.
  • the switching notification unit notifies by at least one signal of an audio signal, an optical signal, an image signal, and a vibration signal. Do.
  • the eighth aspect defines a specific aspect of the signal used for notification.
  • the medical image processing apparatus is in any one of the first to eighth aspects, and the switching notification unit notifies in a mode different from the notification.
  • the switching notification unit since the switching notification unit performs the "notification” for notifying the switching of the notification state in a mode different from the "notification” for notifying that the recognition unit has recognized the region of interest, the user can perform "notification” and "notification". It is possible to easily grasp which of the "notifications" is being performed.
  • the medical image processing apparatus further includes an aspect setting unit for setting an aspect of notification and / or notification in any one of the first to ninth aspects.
  • the mode setting unit can set the mode of notification and / or notification according to the operation of the user.
  • the recognition unit recognizes the region of interest regardless of the image processing of the medical image.
  • the recognition unit can recognize the region of interest by operating a device such as voice input, image recognition of a user's gesture, or a foot switch.
  • the endoscope system according to the twelfth aspect of the present invention includes a medical image processing device according to any one of the first to eleventh aspects and a display device for displaying a medical image. And an endoscopic scope that is inserted into a subject and has an imaging unit that captures a medical image. Since the endoscope system according to the twelfth aspect includes the medical image processing device according to any one of the first to eleventh aspects, the user can sufficiently recognize the operating state of the support function.
  • the medical image processing method includes an image acquisition step of acquiring a time-series medical image, a recognition step of recognizing a region of interest in the acquired medical image, and the like.
  • the user can be made to fully recognize the operating state of the assisting function as in the first aspect.
  • the medical image processing method according to the thirteenth aspect may further include the same configurations as those of the second to eleventh aspects. Further, a program for causing a medical image processing apparatus or a computer to execute the medical image processing method of these embodiments, and a non-temporary recording medium on which a computer-readable code of the program is recorded can also be mentioned as an aspect of the present invention.
  • the user can sufficiently recognize the operating state of the support function.
  • FIG. 1 is a diagram showing a configuration of an endoscope system according to a first embodiment.
  • FIG. 2 is another diagram showing the configuration of the endoscopic system.
  • FIG. 3 is a functional block diagram of the image processing unit.
  • FIG. 4 is a diagram showing a configuration example of a convolutional neural network.
  • FIG. 5 is a diagram showing a state of the convolution process by the filter.
  • FIG. 6 is a diagram showing information recorded in the recording unit.
  • FIG. 7 is a flowchart showing the procedure of the medical image processing method according to the first embodiment.
  • FIG. 8 is a diagram showing an example of a setting screen of the notification mode.
  • FIG. 9 is a diagram showing an example of a setting screen of a notification mode.
  • FIG. 8 is a diagram showing an example of a setting screen of the notification mode.
  • FIG. 10 is another diagram showing an example of a setting screen of the notification mode.
  • FIG. 11 is a diagram showing an example of switching notification.
  • FIG. 12 is a diagram showing a state of notification of the recognition result.
  • FIG. 13 is a diagram showing a timing at which switching notification is possible.
  • FIG. 1 is an external view of the endoscope system 10 (medical image processing apparatus, endoscope system), and FIG. 2 is a block diagram showing a main configuration of the endoscope system 10.
  • the endoscope system 10 includes an endoscope scope 100 (medical device, an endoscope scope, an endoscope main body), a processor 200 (medical image processing device), and a light source device 300 (light source). The device) and the monitor 400 (display device).
  • An external device (not shown) for acquiring site information by electromagnetic waves or ultrasonic waves may be connected to the endoscope system 10.
  • the endoscope scope 100 includes a hand operation unit 102 and an insertion unit 104 connected to the hand operation unit 102.
  • the operator grasps and operates the hand operation unit 102, inserts the insertion unit 104 into the body of the subject (living body), and observes it.
  • the hand operation unit 102 is provided with an air supply / water supply button 141, a suction button 142, a function button 143 to which various functions are assigned, and a shooting button 144 for receiving a shooting instruction operation (still image, moving image). ..
  • the insertion portion 104 is composed of a soft portion 112, a curved portion 114, and a tip hard portion 116 in this order from the hand operation portion 102 side.
  • the curved portion 114 is connected to the base end side of the hard tip portion 116, and the soft portion 112 is connected to the base end side of the curved portion 114.
  • the hand operation unit 102 is connected to the base end side of the insertion unit 104. The user can bend the curved portion 114 and change the direction of the hard tip portion 116 up, down, left and right by operating the hand operating portion 102.
  • the tip rigid portion 116 is provided with a photographing optical system 130, an illumination portion 123, a forceps opening 126, and the like (see FIGS. 1 and 2).
  • white light and / or narrow band light (red narrow band light, green narrow band light, etc.) are transmitted from the illumination lenses 123A and 123B of the illumination unit 123.
  • narrow band light red narrow band light, green narrow band light, etc.
  • One or more of blue narrow band light and purple narrow band light can be irradiated.
  • cleaning water is discharged from a water supply nozzle (not shown) to clean the photographing lens 132 (photographing lens, photographing unit) of the photographing optical system 130 and the illumination lenses 123A and 123B. Can be done.
  • a pipe line (not shown) communicates with the forceps opening 126 opened by the hard tip 116, and a treatment tool (not shown) for removing a tumor or the like is inserted into this pipe line, and the patient moves back and forth as appropriate to the subject. You can take the necessary measures.
  • a photographing lens 132 (photographing portion) is arranged on the tip end surface 116A of the tip rigid portion 116.
  • a CMOS (Complementary Metal-Oxide Semiconductor) type image sensor 134 (imaging element, photographing unit), a drive circuit 136, and an AFE138 (AFE: Analog Front End, photographing unit) are arranged behind the photographing lens 132.
  • the image signal is output by the element of.
  • the image sensor 134 is a color image sensor, and is composed of a plurality of light receiving elements arranged in a matrix (two-dimensional arrangement) in a specific pattern arrangement (Bayer arrangement, X-Trans (registered trademark) arrangement, honeycomb arrangement, etc.).
  • Each pixel of the image sensor 134 includes a microlens, a red (R), green (G), or blue (B) color filter and a photoelectric conversion unit (photodiode or the like).
  • the photographing optical system 130 can also generate a color image from pixel signals of three colors of red, green, and blue, and generate an image from a pixel signal of any one or two colors of red, green, and blue. You can also do it.
  • the image sensor 134 may be a CCD (Charge Coupled Device) type.
  • Each pixel of the image sensor 134 may further include a purple color filter corresponding to a purple light source 310V and / or an infrared filter corresponding to an infrared light source.
  • the optical image of the subject is imaged on the light receiving surface (imaging surface) of the image sensor 134 by the photographing lens 132, converted into an electric signal, output to the processor 200 via a signal cable (not shown), and converted into a video signal.
  • the endoscopic image is displayed on the monitor 400 connected to the processor 200.
  • the illumination lenses 123A and 123B of the illumination portion 123 are provided adjacent to the photographing lens 132.
  • An injection end of a light guide 170 which will be described later, is arranged behind the illumination lenses 123A and 123B, and the light guide 170 is inserted through an insertion portion 104, a hand operation portion 102, and a universal cable 106 to form a light guide 170.
  • the incident end is arranged within the light guide connector 108.
  • the user shoots at a predetermined frame rate while inserting or removing the endoscope scope 100 (insertion unit 104) having the above-described configuration into the living body as the subject (under the control of the imaging unit and the image acquisition unit 220). By doing so, it is possible to sequentially take images in the living body.
  • the light source device 300 includes a light source 310 for illumination, a diaphragm 330, a condenser lens 340, a light source control unit 350, and the like, and causes observation light to enter the light guide 170.
  • the light source 310 includes a red light source 310R, a green light source 310G, a blue light source 310B, and a purple light source 310V that irradiate narrow band light of red, green, blue, and purple, respectively, and narrow red, green, blue, and purple. It can irradiate band light.
  • the illuminance of the observation light by the light source 310 is controlled by the light source control unit 350, and the illuminance of the observation light can be changed (increased or decreased) and the illumination can be stopped as needed.
  • the light source 310 can emit red, green, blue, and purple narrow-band light in any combination.
  • narrow-band light of red, green, blue, and purple can be emitted at the same time to irradiate white light (normal light) as observation light, or one or two of them can be emitted to emit narrow-band light. It is also possible to irradiate light (special light).
  • the light source 310 may further include an infrared light source that irradiates infrared light (an example of narrow band light).
  • white light or narrow band light may be irradiated as observation light by a light source that irradiates white light and a filter that transmits white light and each narrow band light.
  • the light source 310 may be a light source having a white band or a light source having a plurality of wavelength bands as the light having a white band, or a light source having a specific wavelength band narrower than the white wavelength band.
  • the specific wavelength band may be a blue band or a green band in the visible region, or a red band in the visible region.
  • a specific wavelength band is a visible blue band or green band, it includes a wavelength band of 390 nm or more and 450 nm or less, or 530 nm or more and 550 nm or less, and peaks in a wavelength band of 390 nm or more and 450 nm or less or 530 nm or more and 550 nm or less. It may have a wavelength.
  • the light in the specific wavelength band includes the wavelength band of 585 nm or more and 615 nm or less, or 610 nm or more and 730 nm or less, and the light in the specific wavelength band is 585 nm or more and 615 nm or less or 610 nm or more. It may have a peak wavelength in the wavelength band of 730 nm or less.
  • the specific wavelength band includes a wavelength band of 400 ⁇ 10 nm, 440 ⁇ 10 nm, 470 ⁇ 10 nm, or 600 nm or more and 750 nm, and 400 ⁇ 10 nm, 440 ⁇ 10 nm, 470 ⁇ 10 nm, or 600 nm or more and 750 nm. It may have a peak wavelength in the following wavelength band.
  • the light generated by the light source 310 may include a wavelength band of 790 nm or more and 820 nm or less, or 905 nm or more and 970 nm or less, and may have a peak wavelength in a wavelength band of 790 nm or more and 820 nm or less or 905 nm or more and 970 nm or less.
  • the light source 310 may include a light source that irradiates excitation light having a peak of 390 nm or more and 470 nm or less.
  • a medical image medical image, in-vivo image
  • a dye for the fluorescence method fluorestin, acridine orange, etc.
  • the light source type (laser light source, xenon light source, LED light source (LED: Light-Emitting Diode), etc.), wavelength, presence / absence of filter, etc. of the light source 310 are preferably configured according to the type of subject, the part, the purpose of observation, and the like.
  • switching the wavelength for example, by rotating a disk-shaped filter (rotary color filter) arranged in front of the light source and provided with a filter that transmits or blocks light of a specific wavelength, the wavelength of the emitted light is switched. May be good.
  • the image sensor used in carrying out the present invention is not limited to the color image sensor in which the color filter is arranged for each pixel like the image sensor 134, and may be a monochrome image sensor.
  • the wavelength of the observation light can be sequentially switched to perform surface-sequential (color-sequential) imaging.
  • the wavelength of the emitted observation light may be sequentially switched between (purple, blue, green, red), or a rotary color filter (red, green, blue, purple, etc.) is irradiated with broadband light (white light). You may switch the wavelength of the observation light emitted by.
  • the wavelength of the observation light emitted by the rotary color filter may be switched by irradiating one or a plurality of narrow band lights (green, blue, purple, etc.).
  • the narrow band light may be infrared light having two or more wavelengths (first narrow band light, second narrow band light) having different wavelengths.
  • the observation light emitted from the light source device 300 is transmitted to the illumination lenses 123A and 123B via the light guide 170, and the illumination lens
  • the observation range is irradiated from 123A and 123B.
  • the configuration of the processor 200 will be described with reference to FIG.
  • the processor 200 inputs the image signal output from the endoscope scope 100 via the image input controller 202, performs necessary image processing in the image processing unit 204, and outputs the image signal via the video output unit 206.
  • the observation image (in-vivo image) is displayed on the monitor 400 (display device).
  • These processes are performed under the control of the CPU 210 (CPU: Central Processing Unit).
  • the communication control unit 205 controls communication about medical images and site information between an in-hospital system (HIS: Hospital Information System), an in-hospital LAN (Local Area Network), and / or an external system or network (not shown). I do.
  • the recording unit 207 (recording device) records information such as an image of the subject (endoscopic image, medical image, medical image), recognition result (detection, classification, measurement, etc.) (FIG. 6 and related). See the description).
  • the voice processing unit 209 (notification unit, switching notification unit) outputs a message (voice signal) related to recognition, notification, and notification of the region of interest from the speaker 209A under the control of the CPU 210 and the image processing unit 204.
  • the vibration control unit 213 (notification unit, switching notification unit) vibrates the vibrator 213A under the control of the CPU 210 and the image processing unit 204 to perform notification and notification (vibration signal output).
  • the blinking control unit 214 (notification unit, switching notification unit) turns on or off the light 214A under the control of the CPU 210 and the image processing unit 204 to perform notification and notification (optical signal output).
  • ROM 211 (ROM: Read Only Memory) is a non-volatile storage element (non-temporary recording medium), and various image processing methods are executed on the CPU 210 and / or the image processing unit 204 (medical image processing device, computer).
  • the computer-readable code of the program to be made is stored.
  • the RAM 212 (RAM: Random Access Memory) is a storage element for temporary storage during various processes, and can also be used as a buffer for image acquisition.
  • the user can specify the execution instruction of the medical image processing and the conditions necessary for the execution via the operation unit 208, and the setting unit 228, the notification unit 224, and the switching notification unit 226 display the screen at the time of these instructions. And the recognition result can be displayed on the monitor 400.
  • FIG. 3 is a functional block diagram of the image processing unit 204.
  • the image processing unit 204 includes an image acquisition unit 220 (image acquisition unit), a recognition unit 222 (recognition unit), a notification unit 224 (notification unit), a switching notification unit 226 (switching notification unit), and a setting unit 228 ( A setting unit) and a recording control unit 230 (recording control unit) are provided. Details of medical image processing using these functions will be described later.
  • the image processing unit 204 uses the above-mentioned functions to calculate the feature amount of the medical image, process to emphasize or reduce the component of a specific frequency band, and emphasize or emphasize a specific target (area of interest, blood vessel of desired depth, etc.). It is possible to perform processing that makes it inconspicuous.
  • the image processing unit 204 acquires special light having information in a specific wavelength band based on a normal light image obtained by irradiating light in a white band or light in a plurality of wavelength bands as light in the white band.
  • An image acquisition unit may be provided.
  • the signal of a specific wavelength band is used for RGB (R: red, G: green, B: blue) or CMY (C: cyan, M: magenta, Y: yellow) color information included in a normal optical image. It can be obtained by the calculation based on.
  • the image processing unit 204 includes a normal light image obtained by irradiating light in a white band or light in a plurality of wavelength bands as light in the white band, and a special light image obtained by irradiating light in a specific wavelength band.
  • a feature amount image generation unit that generates a feature amount image by an operation based on at least one of the above may be provided, and a feature amount image as a medical image (medical image) may be acquired and displayed. The above-mentioned processing is performed under the control of the CPU 210.
  • the functions of each part of the image processing unit 204 described above can be realized by using various processors and recording media.
  • the various processors include, for example, a CPU (Central Processing Unit), which is a general-purpose processor that executes software (programs) to realize various functions.
  • the various processors described above include programmable logic devices (programmable logic devices) such as GPUs (Graphics Processing Units) and FPGAs (Field Programmable Gate Arrays), which are specialized processors for image processing, whose circuit configurations can be changed after manufacturing.
  • Programmable Logic Device PLD
  • the above-mentioned various processors also include a dedicated electric circuit, which is a processor having a circuit configuration specially designed for executing a specific process such as an ASIC (Application Specific Integrated Circuit).
  • each part may be realized by one processor, or may be realized by a plurality of processors of the same type or different types (for example, a plurality of FPGAs, or a combination of a CPU and an FPGA, or a combination of a CPU and a GPU). Further, a plurality of functions may be realized by one processor. As an example of configuring a plurality of functions with one processor, first, as represented by a computer, one processor is configured by a combination of one or more CPUs and software, and this processor is used as a plurality of functions. There is a form to be realized.
  • SoC System On Chip
  • various functions are configured by using one or more of the above-mentioned various processors as a hardware structure.
  • the hardware structure of these various processors is, more specifically, an electric circuit (circuitry) in which circuit elements such as semiconductor elements are combined.
  • These electric circuits may be electric circuits that realize the above-mentioned functions by using logical sum, logical product, logical denial, exclusive logical sum, and logical operations combining these.
  • the above-mentioned processor or electric circuit executes software (program), it can be read by a computer of the software (for example, various processors and electric circuits constituting the image processing unit 204, and / or a combination thereof).
  • the code is stored in a non-temporary recording medium such as ROM 211 (ROM: Read Only Memory), and the computer refers to the software.
  • the software stored in the non-temporary recording medium is a program for executing the medical image processing method according to the present invention and data used for execution (data used for specifying image processing conditions, notification modes, notification modes, etc.). )including.
  • the code may be recorded on a non-temporary recording medium such as various optical magnetic recording devices or semiconductor memories instead of the ROM 211.
  • RAM212 Random Access Memory
  • EEPROM Electrical Erasable and Programmable Read Only Memory
  • the recording unit 207 may be used as the “non-temporary recording medium”.
  • the above-mentioned recognition unit 222 (recognition unit: detector, classifier, measuring instrument) is a trained model (image set composed of images of a living body) such as CNN (Convolutional Neural Network) and SVM (Support Vector Machine). It can be constructed using a model learned using.
  • CNN Convolutional Neural Network
  • SVM Small Vector Machine
  • FIG. 4 is a diagram showing an example of the layer structure of CNN.
  • the CNN 562 includes an input layer 562A, an intermediate layer 562B, and an output layer 562C.
  • the input layer 562A inputs an endoscopic image (medical image) acquired by the image acquisition unit 220 and outputs a feature amount.
  • the intermediate layer 562B includes a convolution layer 564 and a pooling layer 565, and the feature amount output by the input layer 562A is input to calculate other feature amounts.
  • These layers have a structure in which a plurality of "nodes" are connected by "edges" and hold a plurality of weight parameters. The value of the weight parameter changes as the learning progresses.
  • CNN562 may include a fully connected layer 566 as in the example shown in part (b) of FIG.
  • the layer structure of the CNN 562 is not limited to the case where the convolution layer 564 and the pooling layer 565 are repeated one by one, and any one layer (for example, the convolution layer 564) may be continuously included. Further, a plurality of fully bonded layers 566 may be continuously included.
  • the intermediate layer 562B calculates the feature amount by the convolution calculation and the pooling process.
  • the convolution operation performed in the convolution layer 564 is a process of acquiring a feature map by a convolution operation using a filter, and plays a role of feature extraction such as edge extraction from an image. By the convolution operation using this filter, one channel (one sheet) of "feature map” is generated for one filter. The size of the "feature map” is downscaled by convolution and becomes smaller as each layer is convolved.
  • the pooling process performed in the pooling layer 565 is a process of reducing (or enlarging) the feature map output by the convolution operation to make a new feature map so that the extracted features are not affected by translation or the like. It plays a role in giving robustness.
  • the intermediate layer 562B can be composed of one or a plurality of layers that perform these processes.
  • FIG. 5 is a schematic view showing a configuration example of the intermediate layer 562B of the CNN 562 shown in FIG.
  • a convolution operation is performed between an image set composed of a plurality of medical images (a learning image set during learning, a recognition image set during recognition) and a filter F1. It is said.
  • the image set is composed of N images (N channels) having an image size of H in the vertical direction and W in the horizontal direction.
  • the images constituting the image set are three-channel images of R (red), G (green), and B (blue).
  • the filter size is a filter of 5 ⁇ 5 ⁇ N. ..
  • the filter F2 used in the second convolution layer has a filter size of 3 ⁇ 3 ⁇ M, for example, in the case of a size 3 (3 ⁇ 3) filter.
  • the second to nth convolution layers perform convolution operations using filters F2 to Fn.
  • the size of the "feature map" in the nth convolution layer is smaller than the size of the "feature map” in the second convolution layer because it is downscaled by the convolution layer or pooling layer up to the previous stage. Is.
  • lower-order feature extraction (edge extraction, etc.) is performed in the convolution layer closer to the input side, and higher-order feature extraction (features related to the shape, structure, etc. of the object) is performed as the intermediate layer 562B approaches the output side. Extraction) is performed.
  • segmentation is performed for the purpose of measurement or the like, the convolution layer in the latter half is upscaled, and in the last convolution layer, a "feature map" having the same size as the input image set is obtained.
  • upscaling is not essential because the position information may be output.
  • the intermediate layer 562B may include a layer for batch normalization in addition to the convolution layer 564 and the pooling layer 565.
  • the batch normalization process is a process for normalizing the distribution of data in units of mini-batch when learning, and plays a role of advancing learning quickly, reducing dependence on initial values, suppressing overfitting, and the like.
  • the output layer 562C is a layer that detects the position of the region of interest reflected in the input medical image (normal light image, special light image) based on the feature amount output from the intermediate layer 562B and outputs the result. is there.
  • the output layer 562C grasps the position of the region of interest in the image at the pixel level by the "feature map" obtained from the intermediate layer 562B. That is, it is possible to detect whether or not each pixel of the endoscopic image belongs to the region of interest and output the detection result.
  • the output layer 562C outputs the position information of the object.
  • the output layer 562C may be one that executes discrimination (classification) regarding lesions and outputs the discrimination result.
  • the output layer 562C classifies endoscopic images into three categories of "neoplastic", “non-neoplastic", and “other”, and the discrimination results are “neoplastic”, “non-neoplastic", and “other”. It may be output as three scores corresponding to (the total of the three scores is 100%), or the classification result may be output when it can be clearly classified from the three scores.
  • the output layer 562C may or may not include the fully connected layer as the last one or a plurality of layers (see the portion (b) of FIG. 4). ..
  • the output layer 562C may output the measurement result of the region of interest.
  • the target region of interest can be segmented as described above, and then the image processing unit 204 or the like can measure based on the result. Further, the measured value of the target region of interest can be directly output from the recognition unit 222. When the measured value is directly output, the measured value itself is learned for the image, which becomes a regression problem of the measured value.
  • the loss is calculated by comparing the result output by the output layer 562C with the correct answer of the recognition for the image set in the learning process, and the intermediate layer 562B is reduced so that the loss is small. It is preferable to perform a process (error back propagation) in which the weight parameter in is updated from the output side layer to the input side layer.
  • the recognition unit 222 may perform recognition (detection of a region of interest, etc.) by a method other than CNN.
  • the region of interest can be detected based on the feature amount of the pixels of the acquired medical image.
  • the recognition unit 222 divides the detection target image into, for example, a plurality of rectangular regions, sets each of the divided rectangular regions as a local region, and features the pixels in the local region for each local region of the detection target image (for example,). Hue) is calculated, and a local region having a specific hue is determined as a region of interest from each local region.
  • the recognition unit 222 may perform classification and measurement based on the feature amount.
  • FIG. 6 is a diagram showing an example of information recorded in the recording unit 207.
  • the endoscopic image 260 medical image, medical image
  • the recognition result 262 recognition result: detection, classification, measurement, etc.
  • the processing condition 264 notification and notification
  • Notification conditions, modes, etc .: see, for example, FIGS. 8-10 are recorded in association with each other.
  • the recording control unit 230 may also record other information.
  • the setting unit 228 sets the conditions and / or modes of notification and / or notification (switching notification) (step S100: setting step).
  • the setting unit 228 can make this setting according to the user's operation via the operation unit 208 and the monitor 400, for example, as described below.
  • FIG. 8 is a diagram showing an example of a setting screen of the notification mode, showing a state in which the setting unit 228 displays the screen 500 on the monitor 400 (dotted lines in the figure are virtual lines indicating an area in the screen). ..
  • the screen 500 has areas 502 to 508 in which radio buttons are arranged and areas 510 to 512 in which numerical input fields are arranged.
  • the radio button By operating the radio button, the user can set whether or not to perform the notification (on or off; area 502). Further, the user can operate the radio button to "whether or not to perform notification by frame display in the image area (for example, frame 604 in FIGS. 11 and 12)" (area 504) and “frame display outside the image area (area 504)". For example, "whether or not to perform notification by the frame 606) of FIG. 12" (area 506) and "whether or not to perform notification by audio output (audio signal)” (area 508) can be set.
  • the user can enter the "elapsed time ("fixed time ”) (area 510) from the detection of the region of interest to the start of notification (from the non-notification state to the notification state) and"
  • the elapsed time from the start of the notification to the end of the notification (from the switching from the notification state to the non-notification state) (“determined time”) (area 512) can be set.
  • the notification unit 224 switches from the notification state to the non-notification state after the time (seconds) input to the area 512 has elapsed.
  • Numerical value input may be a method of selecting a predetermined numerical value from a pull-down menu. In the example of FIG.
  • the notification is on and the frame display is on, and it takes 1.0 seconds from the detection to the start of the notification and 1.0 seconds from the start to the end of the notification.
  • the above example is an example of mode setting, and other items (notification by light or vibration, etc.) may be set.
  • the setting unit 228 may change the items that can be set according to the content of "recognition" (whether detection, discrimination, or measurement). For example, when performing differentiation, the setting unit 228 determines the type of lesion, the extent of the lesion, the size of the lesion, the macroscopic shape of the lesion, the stage diagnosis of cancer, the current position in the lumen, and the reliability of the discrimination result (calculated by CNN). It is possible to set the on / off of the notification and the mode of the notification.
  • FIG. 12 A specific mode of notification is illustrated in FIG. 12, which will be described later.
  • a region for displaying the notification mode may be provided on the screen of the monitor 400 according to the operation of the user (see the notification mode display area 610 in the portion (d) of FIG. 12).
  • the user can set the mode of notification as needed, and the notification unit 224 supports (notifies) according to the set conditions.
  • the mode may be set not only at the start of the medical image processing but also at any time during the processing.
  • FIG. 9 is a diagram showing an example of a setting screen of the mode (first mode) of the switching notification from the notification state to the non-notification state, and shows a state in which the setting unit 228 displays the screen 520 on the monitor 400.
  • the screen 520 has an area 522 to 530 in which a radio button is arranged and an area 532 in which a numerical input field is arranged. By operating the radio button, the user can set whether or not to notify the switching from the notified state to the non-notified state (whether to turn it on or off; area 522).
  • the user can set whether or not to perform switching notification by an image signal, an optical signal, a vibration signal, and an audio signal (areas 524 to 530) by operating a radio button.
  • the switching notification unit 226 outputs an image to a display device such as a monitor 400, blinks the light 214A, vibrates the vibrator 213A, and outputs a sound from the speaker 209A according to the setting of the radio button. You can notify at once.
  • the user can set "how many seconds before the notification state is switched" (area 532) by inputting a numerical value.
  • the switching notification unit 226 notifies one second before the switching of the notification state (an example of "a fixed time before”).
  • the switching notification unit 226 gives a notification at the same time as the notification state is switched (step S170: switching notification step described later).
  • FIG. 9 is a diagram showing an example of a setting screen, and the setting unit 228 may accept settings in more detailed modes (vibration, voice, blinking, specific display pattern, etc.). Further, the setting unit 228 may provide an area for displaying the switching notification mode on the screen of the monitor 400 according to the user's operation (see the notification mode display area 620 of FIG. 11).
  • the operation state (switching from the notification state to the non-notification state) of the support function is set by the user while suppressing excessive support by such a setting. Can be fully recognized.
  • FIG. 10 is a diagram showing an example of a setting screen of a mode (second mode) of notification of switching from a non-notification state to a notification state, and shows a state in which the setting unit 228 displays the screen 540 on the monitor 400.
  • the screen 540 has an area 542 to 550 in which a radio button is arranged and an area 552 in which a numerical input field is arranged. By operating the radio button, the user can set whether or not to notify the switching from the non-notification state to the notification state (whether to turn on or off; area 542).
  • the user can set whether or not to perform notification by an image signal, an optical signal, a vibration signal, or an audio signal by operating a radio button (areas 544 to 550).
  • the switching notification unit 226 outputs an image to a display device such as a monitor 400, blinks the light 214A, vibrates the vibrator 213A, and outputs a sound from the speaker 209A according to the setting of the radio button. You can notify at once. Further, the user can set "how many seconds before the switching of the notification state the switching notification is given" (area 552) by inputting a numerical value.
  • the switching notification unit 226 notifies one second before the switching of the notification state (an example of "a fixed time before").
  • the switching notification unit 226 gives a notification at the same time as the notification state is switched (step S140: switching notification step described later).
  • the switching notification unit 226 may provide an area for displaying the switching notification mode on the screen of the monitor 400 according to the user's operation (see the notification mode display area 620 in FIG. 11).
  • the operation state of the support function switching from the non-notification state to the notification state
  • the operation state of the support function switching from the non-notification state to the notification state
  • the setting unit 228 has a mode of notification of switching from the notification state to the non-notification state (first mode) and a mode of notification of switching from the non-notification state to the notification state (second mode) according to the setting operation of the user. May be changed. By changing the mode, the user can clearly grasp the change of the notification state. Further, the switching notification unit 226 may perform the "notification” for notifying the change of the notification state in a mode different from the "notification” for notifying that the recognition unit has recognized the region of interest. The switching notification unit 226 may warn the user when the set modes are the same. By performing the "notification” and the "notification” in different modes, the user can easily grasp which of the "notification” and the “notification” is being performed. Note that “different aspects” includes cases where the types of signals used for notification are different, such as voice and vibration, and images and light, and cases where the signal types are the same but the output patterns are different.
  • the image acquisition unit 220 acquires a time-series endoscopic image (medical image) (step S110: image acquisition step).
  • the image acquisition unit 220 may acquire an endoscope image taken by the endoscope scope 100, or may acquire an endoscope image 260 recorded by the recording unit 207.
  • the recording control unit 230 can record the acquired image as an endoscopic image 260 in the recording unit 207.
  • the recognition unit 222 recognizes the region of interest in the endoscopic image acquired in step S110 (step S120: recognition step). As this "recognition”, the recognition unit 222 can perform one or more of detection, classification, and measurement by the above-mentioned CNN or the like. For example, when “recognition” is “detection" of the region of interest, examples of the region of interest (region of interest) to be detected include polyps, cancer, colonic diverticulum, inflammation, and treatment scars (EMR: Endoscopic Mucosal Resection).
  • ESD scar ESD: Endoscopic Submucosal Dissection
  • clip location etc.
  • bleeding point perforation
  • vascular atypia vascular atypia
  • Examples of "differentiation" of the area of interest include the type of lesion (hyperplastic polyp, adenomas, intramucosal cancer, invasive cancer, etc.), the extent of the lesion, the size of the lesion, the macroscopic shape of the lesion, and the stage diagnosis of the cancer. , Current position in the lumen (upper part, pharynx, esophagus, stomach, duodenum, etc., lower part, cecum, ascending colon, transverse colon, descending colon, sigmoid colon, rectum, etc.) it can.
  • Step S140 switching notification step
  • the notification unit 224 switches from the non-notification state to the notification state, and when the notification is on (see the area 502 in FIG. 8), the recognition result is displayed in at least one aspect (for example, the frame 604 or the frame 606 in FIG. 12).
  • Step S150 Notification step
  • the notification and notification are performed in the mode set in step S100 (the notification mode is the second mode), and there may be a time lag between the detection of the region of interest and the start of the notification (see region 510 in FIG. 8). Further, the notification of switching (step S140) and the switching of the notification state (step S150) may be performed at the same time or may have a time difference (see region 552 in FIG. 10).
  • notification and notification in steps S140 and S150 are the same as those in FIGS. 11 and 12 (switching from the notification state to the non-notification state and the switching notification at that time) described later.
  • the notification unit 224 determines whether or not the switching condition (predetermined condition) is satisfied (step S160: determination step).
  • This "switching condition” is a condition for switching from the notification state to the non-notification state. For example, the time setting in the area 512 of FIG. 8 (time from the start to the end of notification; 1.5 seconds in the example of the figure). Or "The region of interest is no longer detected” can be used.
  • Step S160 switching notification step
  • the notification unit 224 switches to a non-notification state in which notification is not performed
  • the time difference between the switching and the notification is set according to the value input in the area 532 of FIG. 9, and the notification may be before the switching, or the notification and the switching may be performed at the same time.
  • the switching notification unit 226 notifies in the manner set in FIG. 9 (combination of output signals, time difference).
  • FIG. 11 is a diagram showing an example of a notification mode.
  • Part (a) of FIG. 11 is a state in which the area of interest 602 is projected on the image display area 600 of the monitor 400, and the image signal, the optical signal, and the image signal and the optical signal are displayed in the notification mode display area 620 outside the image display area 600, respectively.
  • Icons 622A to 628A indicating the on / off state of the notification by the vibration signal and the voice signal are displayed.
  • Part (a) of FIG. 11 shows a state in which icons 622A to 628A are all on (notification by image, light, vibration, and voice is made), and part (b) of FIG. 11 shows an icon indicating notification by voice signal.
  • the switching notification unit 226 may turn on or off the display of the notification mode display area 620 according to the operation of the user or the passage of a predetermined time. Further, the switching notification unit 226 may provide a similar area for the switching notification from the non-notification state to the notification state.
  • FIG. 12 is a diagram showing an example of the notification mode.
  • the area of interest 602 is displayed in the image display area 600 of the monitor 400, but the notification is not performed (for example, the set time has elapsed. (Not in the state) is shown.
  • the part (b) in the figure shows the frame 604 surrounding the area of interest 602 (when the radio box is turned on in the area 504 in FIG. 8), and the part (c) shows the frame outside the image display area 600.
  • the state where 606 is displayed when the radio box is turned on in the area 506 of FIG. 8
  • the state where the frame 604 and the audio are output in the part (d) (the radio box is turned on in the area 504 and 508 of FIG. 8). If it is set to).
  • the notification unit 224 can display an icon indicating an on / off state of the output signal, as in the case of notification (see FIG. 11). Specifically, the notification unit 224 can display an icon 608 indicating on / off of the output by the voice signal in the notification mode display area 610 as shown in the portion (d) of FIG. 12, for example.
  • the notification unit 224 may turn off the display of the notification mode display area 610 according to the operation of the user and after a certain period of time has elapsed from the display. By turning off such a display, excessive notification can be suppressed.
  • FIG. 13 is a diagram showing a timing at which switching notification is possible.
  • the part (a) of FIG. 13 shows the state at the time of switching from the notified state to the non-notified state, and shows that the frame 604 surrounding the area of interest 602 disappears after a lapse of a predetermined time (FIG. 8). See region 512).
  • the switching notification unit 226 is set at a time t3 (“first timing” at which at least one notification state is switched) when the notification state is switched to the non-notification state, and a time determined from the time t3.
  • Switching notification is possible at an arbitrary timing (including time t2, which is intermediate between times t1 and t3) with time t1 (second timing). If the notification is given at time t3, the end of the notification (switching to the non-notification state) and the notification are performed at the same time. As described above, the user can input this time difference (how many seconds before the time t1 is notified) in the area 532 of FIG.
  • Part (b) of FIG. 13 shows a state at the time of switching from the non-notification state to the notification state, and shows that the frame 604 surrounding the area of interest 602 is displayed after a lapse of a predetermined time from the detection. (See region 510 in FIG. 8).
  • the switching notification unit 226 has a time t6 (the above-mentioned "first timing") for switching from the non-notification state to the notification state, and a time t4 (second) which is a time before the time t6. (Timing of) can be switched at any time (including time t5, which is intermediate between times t4 and t6).
  • the notification is given at time t6, the end of the notification (switching to the notification state) and the notification are performed at the same time. As described above, the user can input this time difference (how many seconds before the time t1 is notified) in the area 552 of FIG.
  • the image processing unit 204 repeats the processing of steps S110 to S180 until the processing is completed (until YES is obtained in step S190).
  • the image processing unit 204 can end the processing according to the user's operation on the hand operation unit 102 or the operation unit 208, for example.
  • the endoscope system 10 can provide support in a desired manner as needed by the user while suppressing excessive support.
  • the user can sufficiently recognize the operating state of the support function (switching from the notification state to the non-notification state and switching from the non-notification state to the notification state).
  • the recognition unit 222 may recognize the region of interest without the image processing of the medical image (step S120: recognition). Process).
  • the recognition unit 222 can recognize (detect, discriminate (classify), measure) the region of interest by, for example, voice input of the user, image recognition of gestures, or operation of a device such as a foot switch.
  • notification and notification are given as in the above-described embodiment. This makes it possible for the user to fully recognize the operating state of the support function.
  • the medical image analysis processing unit detects a region of interest, which is a region of interest, based on the feature amount of pixels of the medical image.
  • the medical image analysis result acquisition unit is a medical image processing device that acquires the analysis results of the medical image analysis processing unit.
  • the medical image analysis processing unit detects the presence or absence of a noteworthy object based on the feature amount of the pixel of the medical image.
  • the medical image analysis result acquisition unit is a medical image processing device that acquires the analysis results of the medical image analysis processing unit.
  • the medical image analysis result acquisition department Obtained from a recording device that records the analysis results of medical images
  • the analysis result is a medical image processing apparatus that is a region of interest that is a region of interest included in a medical image, or a presence or absence of an object of interest, or both.
  • a medical image is a medical image processing apparatus that is a normal light image obtained by irradiating light in a white band or light in a plurality of wavelength bands as light in a white band.
  • a medical image is an image obtained by irradiating light in a specific wavelength band.
  • a medical image processing device in which a specific wavelength band is narrower than the white wavelength band.
  • a medical image processing device in which a specific wavelength band is a blue or green band in the visible range.
  • a medical treatment in which a specific wavelength band includes a wavelength band of 390 nm or more and 450 nm or less or 530 nm or more and 550 nm or less, and light in a specific wavelength band has a peak wavelength in a wavelength band of 390 nm or more and 450 nm or less or 530 nm or more and 550 nm or less.
  • Image processing device
  • the specific wavelength band includes a wavelength band of 585 nm or more and 615 nm or less or 610 nm or more and 730 nm or less, and the light of the specific wavelength band has a peak wavelength in the wavelength band of 585 nm or more and 615 nm or less or 610 nm or more and 730 nm or less.
  • Image processing device includes a wavelength band of 585 nm or more and 615 nm or less or 610 nm or more and 730 nm or less, and the light of the specific wavelength band has a peak wavelength in the wavelength band of 585 nm or more and 615 nm or less or 610 nm or more and 730 nm or less.
  • the specific wavelength band includes a wavelength band in which the absorption coefficient differs between the oxidized hemoglobin and the reduced hemoglobin, and the light in the specific wavelength band has a peak wavelength in the wavelength band in which the absorption coefficient differs between the oxidized hemoglobin and the reduced hemoglobin.
  • Medical image processing device includes a wavelength band in which the absorption coefficient differs between the oxidized hemoglobin and the reduced hemoglobin, and the light in the specific wavelength band has a peak wavelength in the wavelength band in which the absorption coefficient differs between the oxidized hemoglobin and the reduced hemoglobin.
  • the specific wavelength band includes 400 ⁇ 10 nm, 440 ⁇ 10 nm, 470 ⁇ 10 nm, or 600 nm or more and 750 nm or less, and the light in the specific wavelength band is 400 ⁇ 10 nm, 440 ⁇ 10 nm, 470 ⁇ .
  • a medical image processing apparatus having a peak wavelength in a wavelength band of 10 nm or 600 nm or more and 750 nm or less.
  • a medical image is an in-vivo image that shows the inside of a living body.
  • An in-vivo image is a medical image processing device that has information on fluorescence emitted by a fluorescent substance in the living body.
  • Fluorescence is a medical image processing device obtained by irradiating a living body with excitation light having a peak of 390 or more and 470 nm or less.
  • a medical image is an in-vivo image that shows the inside of a living body.
  • a specific wavelength band is a medical image processing device that is a wavelength band of infrared light.
  • a medical image in which a specific wavelength band includes a wavelength band of 790 nm or more and 820 nm or less or 905 nm or more and 970 nm or less, and light in a specific wavelength band has a peak wavelength in a wavelength band of 790 nm or more and 820 nm or less or 905 nm or more and 970 nm or less. Processing equipment.
  • the medical image acquisition unit acquires a special optical image having information in a specific wavelength band based on a normal light image obtained by irradiating light in a white band or light in a plurality of wavelength bands as light in the white band. Equipped with an optical image acquisition unit
  • a medical image is a medical image processing device that is a special optical image.
  • Appendix 17 A medical image processing device that obtains a signal in a specific wavelength band by calculation based on RGB or CMY color information included in a normal optical image.
  • Appendix 18 By calculation based on at least one of a normal light image obtained by irradiating light in a white band or light in a plurality of wavelength bands as light in a white band and a special light image obtained by irradiating light in a specific wavelength band. Equipped with a feature amount image generator that generates a feature amount image A medical image is a medical image processing device that is a feature image.

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Surgery (AREA)
  • Biomedical Technology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Optics & Photonics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Signal Processing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Endoscopes (AREA)

Abstract

本発明は、支援機能の動作状態をユーザに適切に認識させることができる医用画像処理装置、内視鏡システム、及び医用画像処理方法を提供することを目的とする。本発明の第1の態様に係る医用画像処理装置は、時系列の医用画像を取得する画像取得部と、取得した医用画像における注目領域を認識する認識部と、認識の結果を少なくとも1つの態様で報知する報知部であって、報知を行う報知状態の開始後にあらかじめ決められた条件が満たされた場合は、報知を行わない非報知状態に切り替わる報知部と、報知状態から非報知状態に切り替わることを通知する切替通知部と、を備える。

Description

医用画像処理装置、内視鏡システム、及び医用画像処理方法
 本発明は医用画像の認識結果を報知する医用画像処理装置、内視鏡システム、及び医用画像処理方法に関する。
 各種の医用画像処理装置において、効率的に検査や診断を行えるようにするためにユーザを支援する技術が期待されている。例えば、観察画像における病変候補領域や病変の癌性、深達度をユーザに報知することが考えられる。例えば、特許文献1には、特徴画像が表示されることを知らせる通知音(予告音、報知音、終了音)を出力するカプセル内視鏡が記載されている。
特開2006-129950号公報
 各種の報知による支援はユーザに有益である反面、過剰な支援はユーザの集中力を欠くばかりか、検査を阻害するおそれがある。このため、必要に応じて支援を終了させることが好ましい。一方、ユーザは、検査の間は機器の操作や結果の観察に注意が向いているため、支援機能の動作状態がユーザに伝わらないおそれがある。しかしながら、上述した特許文献1のような従来の技術は、これらの点を十分考慮したものではなかった。
 本発明はこのような事情に鑑みてなされたもので、支援機能の動作状態をユーザに十分に認識させることができる医用画像処理装置、内視鏡システム、及び医用画像処理方法を提供することを目的とする。
 上述した目的を達成するため、本発明の第1の態様に係る医用画像処理装置は、時系列の医用画像を取得する画像取得部と、取得した医用画像における注目領域を認識する認識部と、認識の結果を少なくとも1つの態様で報知する報知部であって、報知を行う報知状態の開始後にあらかじめ決められた条件が満たされた場合は、報知を行わない非報知状態に切り替わる報知部と、報知状態から非報知状態に切り替わることを通知する切替通知部と、を備える。第1の態様に係る医用画像処理装置は、認識の結果を少なくとも1つの態様で報知する報知部であって、報知を行う報知状態の開始後にあらかじめ決められた条件が満たされた場合は、報知を行わない非報知状態に切り替わる報知部を備えるので、必要に応じて(あらかじめ決められた条件に応じて)支援を終了させることができる。また、報知状態から非報知状態に切り替わることを通知する切替通知部を備えるので、支援機能の動作状態(報知状態から非報知状態への切り替わり)をユーザに十分に認識させることができる。
 第1の態様では、報知状態や非報知状態の経過時間、ユーザ操作の有無及びその内容、注目領域の認識結果等について「あらかじめ決められた条件」を設定することができる。医用画像処理装置はユーザの操作に応じて条件を設定してもよいし、ユーザの操作によらずに設定してもよい。
 なお、第1の態様において「注目領域」は病変領域、病変候補領域、処置後の領域を含んでいてよく、注目領域の「認識」は注目領域の存在、数、位置、大きさ、形状、種類、画像における動き、病変の程度等を判断すること(検出、計測、分類等)を含んでいてよい。また、「医用画像の取得」は決められたフレームレートで撮影された複数の医用画像を順次取得することを含む。取得はリアルタイムでもよいし、リアルタイムでなくてもよい。画像取得部は撮影光学系及び撮像素子を含む撮像装置により画像を撮影して複数の医用画像を取得してもよいし、あらかじめ記録された複数の医用画像をネットワーク及び/または記録媒体経由で取得してもよい。
 第1の態様に係る医用画像処理装置は、例えば医用画像処理システムのプロセッサとして実現することができるが、このような態様に限定されるものではない。なお、「医用画像」とは診断、治療、計測等を目的として人体等の生体を撮影、計測等した結果として得られた画像をいい、例えば内視鏡画像、超音波画像、CT画像(CT:Computed Tomography)、MRI画像(MRI:Magnetic Resonance Imaging)を挙げることができる。また、医用画像は医療画像ともいう。
 第2の態様に係る医用画像処理装置は第1の態様において、切替通知部は、報知の状態が非報知状態から報知状態に切り替わることを通知する。第2の態様によれば、非報知状態から報知状態への切り替わりをユーザに十分に認識させることができる。
 第3の態様に係る医用画像処理装置は第1または第2の態様において、切替通知部は、報知状態から非報知状態への切り替わりを第1の態様で通知し、非報知状態から報知状態への切り替わりを第1の態様とは異なる第2の態様で通知する。第3の態様によれば、報知状態から非報知状態への切り替わりと非報知状態から報知状態への切り替わりとで態様が異なるので、ユーザは報知状態の切り替わりを明確に把握することができる。
 第4の態様に係る医用画像処理装置は第1から第3の態様のいずれか1つにおいて、報知部は報知状態の開始から決められた時間が経過した後に非報知状態に切り替わり、切替通知部は報知状態から非報知状態への切り替わりを通知する。第4の態様によれば、過度な報知を抑制することができる。
 第5の態様に係る医用画像処理装置は第1から第4の態様のいずれか1つにおいて、報知部は認識部が注目領域を認識してから決められた時間が経過した後に非報知状態から報知状態に切り替わり、切替通知部は報知状態への切り替わりを通知する。第5の態様によれば、医用画像に対する注意力の低下を抑え、注目領域発見能力の向上を妨げないようにすることができる。
 第6の態様に係る医用画像処理装置は第1から第5の態様のいずれか1つにおいて、切替通知部は、報知の状態の切り替わりより決められた時間前に通知を行う。第6の態様によれば、ユーザは報知状態の切り替わりをあらかじめ把握することができる。
 第7の態様に係る医用画像処理装置は第1から第5の態様のいずれか1つにおいて、切替通知部は、報知の状態の切り替わりと同時に通知を行う。第7の態様によれば、ユーザは報知状態の切り替わりを把握することができる。
 第8の態様に係る医用画像処理装置は第1から第7の態様のいずれか1つにおいて、切替通知部は、音声信号、光信号、画像信号、振動信号のうち少なくとも1つの信号で通知を行う。第8の態様は、通知に用いる信号の具体的態様を規定するものである。
 第9の態様に係る医用画像処理装置は第1から第8の態様のいずれか1つにおいて、切替通知部は、報知とは異なる態様で通知を行う。第9の態様では、切替通知部は、報知状態の切り替わりを知らせる「通知」を、認識部が注目領域を認識したことを知らせる「報知」と異なる態様で行うので、ユーザは「報知」と「通知」のいずれが行われているのかを容易に把握することができる。
 第10の態様に係る医用画像処理装置は第1から第9の態様のいずれか1つにおいて、報知及び/または通知の態様を設定する態様設定部をさらに備える。態様設定部は、報知及び/または通知の態様をユーザの操作に応じて設定することができる。
 第11の態様に係る医用画像処理装置は第1から第10の態様のいずれか1つにおいて、認識部は、医用画像の画像処理によらずに注目領域を認識する。認識部は、例えば音声入力、ユーザのジェスチャの画像認識、フットスイッチ等の機器操作により注目領域を認識することができる。
 上述した目的を達成するため、本発明の第12の態様に係る内視鏡システムは、第1から第11の態様のいずれか1つに係る医用画像処理装置と、医用画像を表示する表示装置と、被検体に挿入される内視鏡スコープであって、医用画像を撮影する撮影部を有する内視鏡スコープと、を備える。第12の態様に係る内視鏡システムは、第1から第11の態様のいずれか1つに係る医用画像処理装置を備えるので、支援機能の動作状態をユーザに十分に認識させることができる。
 上述した目的を達成するため、本発明の第13の態様に係る医用画像処理方法は、時系列の医用画像を取得する画像取得工程と、取得した医用画像における注目領域を認識する認識工程と、認識の結果を少なくとも1つの態様で報知する報知工程であって、報知を行う報知状態の開始後にあらかじめ決められた条件が満たされた場合は、報知を行わない非報知状態に切り替わる報知工程と、報知状態から非報知状態に切り替わることを通知する切替通知工程と、を有する。第13の態様によれば、第1の態様と同様に支援機能の動作状態をユーザに十分に認識させることができる。なお、第13の態様に係る医用画像処理方法は第2から第11の態様と同様の構成をさらに含んでいてもよい。また、これら態様の医用画像処理方法を医用画像処理装置あるいはコンピュータに実行させるプログラム、並びにそのプログラムのコンピュータ読み取り可能なコードを記録した非一時的記録媒体も本発明の態様として挙げることができる。
 以上説明したように、本発明に係る医用画像処理装置、内視鏡システム、及び医用画像処理方法によれば、支援機能の動作状態をユーザに十分に認識させることができる。
図1は、第1の実施形態に係る内視鏡システムの構成を示す図である。 図2は、内視鏡システムの構成を示す他の図である。 図3は、画像処理部の機能ブロック図である。 図4は、畳み込みニューラルネットワークの構成例を示す図である。 図5は、フィルタによる畳み込み処理の様子を示す図である。 図6は、記録部に記録される情報を示す図である。 図7は、第1の実施形態に係る医用画像処理方法の手順を示すフローチャートである。 図8は、報知態様の設定画面の例を示す図である。 図9は、通知態様の設定画面の例を示す図である。 図10は、通知態様の設定画面の例を示す他の図である。 図11は、切替通知の例を示す図である。 図12は、認識結果の報知の様子を示す図である。 図13は、切替通知が可能なタイミングを示す図である。
 以下、添付図面を参照しつつ、本発明に係る医用画像処理装置、内視鏡システム、及び医用画像処理方法の実施形態について詳細に説明する。
 <第1の実施形態>
 <内視鏡システムの構成>
 図1は、内視鏡システム10(医用画像処理装置、内視鏡システム)の外観図であり、図2は内視鏡システム10の要部構成を示すブロック図である。図1,2に示すように、内視鏡システム10は、内視鏡スコープ100(医用機器、内視鏡スコープ、内視鏡本体)、プロセッサ200(医用画像処理装置)、光源装置300(光源装置)、及びモニタ400(表示装置)から構成される。電磁波や超音波により部位情報を取得するための外部デバイス(不図示)を内視鏡システム10に接続してもよい。
 <内視鏡スコープの構成>
 内視鏡スコープ100は、手元操作部102と、この手元操作部102に連設される挿入部104とを備える。術者(ユーザ)は手元操作部102を把持して操作し、挿入部104を被検体(生体)の体内に挿入して観察する。また、手元操作部102には送気送水ボタン141、吸引ボタン142、及び各種の機能を割り付けられる機能ボタン143、及び撮影指示操作(静止画像、動画像)を受け付ける撮影ボタン144が設けられている。挿入部104は、手元操作部102側から順に、軟性部112、湾曲部114、先端硬質部116で構成されている。すなわち、先端硬質部116の基端側に湾曲部114が接続され、湾曲部114の基端側に軟性部112が接続される。挿入部104の基端側に手元操作部102が接続される。ユーザは、手元操作部102を操作することにより湾曲部114を湾曲させて先端硬質部116の向きを上下左右に変えることができる。先端硬質部116には、撮影光学系130、照明部123、鉗子口126等が設けられる(図1,2参照)。
 観察、処置の際には、操作部208(図2参照)の操作により、照明部123の照明用レンズ123A,123Bから白色光及び/または狭帯域光(赤色狭帯域光、緑色狭帯域光、青色狭帯域光、及び紫色狭帯域光のうち1つ以上)を照射することができる。また、送気送水ボタン141の操作により図示せぬ送水ノズルから洗浄水が放出されて、撮影光学系130の撮影レンズ132(撮影レンズ、撮影部)、及び照明用レンズ123A,123Bを洗浄することができる。先端硬質部116で開口する鉗子口126には不図示の管路が連通しており、この管路に腫瘍摘出等のための図示せぬ処置具が挿通されて、適宜進退して被検体に必要な処置を施せるようになっている。
 図1,2に示すように、先端硬質部116の先端側端面116Aには撮影レンズ132(撮影部)が配設されている。撮影レンズ132の奥にはCMOS(Complementary Metal-Oxide Semiconductor)型の撮像素子134(撮像素子、撮影部)、駆動回路136、AFE138(AFE:Analog Front End、撮影部)が配設されて、これらの要素により画像信号を出力する。撮像素子134はカラー撮像素子であり、特定のパターン配列(ベイヤー配列、X-Trans(登録商標)配列、ハニカム配列等)でマトリクス状に配置(2次元配列)された複数の受光素子により構成される複数の画素を備える。撮像素子134の各画素はマイクロレンズ、赤(R)、緑(G)、または青(B)のカラーフィルタ及び光電変換部(フォトダイオード等)を含んでいる。撮影光学系130は、赤,緑,青の3色の画素信号からカラー画像を生成することもできるし、赤,緑,青のうち任意の1色または2色の画素信号から画像を生成することもできる。なお、第1の実施形態では撮像素子134がCMOS型の撮像素子である場合について説明するが、撮像素子134はCCD(Charge Coupled Device)型でもよい。なお、撮像素子134の各画素は紫色光源310Vに対応した紫色カラーフィルタ、及び/または赤外光源に対応した赤外用フィルタをさらに備えていてもよい。
 被検体の光学像は撮影レンズ132により撮像素子134の受光面(撮像面)に結像されて電気信号に変換され、不図示の信号ケーブルを介してプロセッサ200に出力されて映像信号に変換される。これにより、プロセッサ200に接続されたモニタ400に内視鏡画像が表示される。
 また、先端硬質部116の先端側端面116Aには、撮影レンズ132に隣接して照明部123の照明用レンズ123A、123Bが設けられている。照明用レンズ123A,123Bの奥には、後述するライトガイド170の射出端が配設され、このライトガイド170が挿入部104、手元操作部102、及びユニバーサルケーブル106に挿通され、ライトガイド170の入射端がライトガイドコネクタ108内に配置される。
 ユーザは、上述した構成の内視鏡スコープ100(挿入部104)を被検体である生体内に挿入または抜去しながら決められたフレームレートで撮影を行う(撮影部及び画像取得部220の制御により行うことができる)ことにより、生体内の画像を順次撮影することができる。
 <光源装置の構成>
 図2に示すように、光源装置300は、照明用の光源310、絞り330、集光レンズ340、及び光源制御部350等から構成されており、観察光をライトガイド170に入射させる。光源310は、それぞれ赤色、緑色、青色、紫色の狭帯域光を照射する赤色光源310R、緑色光源310G、青色光源310B、及び紫色光源310Vを備えており、赤色、緑色、青色、及び紫色の狭帯域光を照射することができる。光源310による観察光の照度は光源制御部350により制御され、必要に応じて観察光の照度を変更する(上げる、または下げる)こと、及び照明を停止することができる。
 光源310は赤色、緑色、青色、及び紫色の狭帯域光を任意の組合せで発光させることができる。例えば、赤色、緑色、青色、及び紫色の狭帯域光を同時に発光させて白色光(通常光)を観察光として照射することもできるし、いずれか1つもしくは2つを発光させることで狭帯域光(特殊光)を照射することもできる。光源310は、赤外光(狭帯域光の一例)を照射する赤外光源をさらに備えていてもよい。また、白色光を照射する光源と、白色光及び各狭帯域光を透過させるフィルタとにより、白色光または狭帯域光を観察光として照射してもよい。
 <光源の波長帯域>
 光源310は白色帯域の光、または白色帯域の光として複数の波長帯域の光を発生する光源でもよいし、白色の波長帯域よりも狭い特定の波長帯域の光を発生する光源でもよい。特定の波長帯域は、可視域の青色帯域もしくは緑色帯域、あるいは可視域の赤色帯域であってもよい。特定の波長帯域が可視域の青色帯域もしくは緑色帯域である場合、390nm以上450nm以下、または530nm以上550nm以下の波長帯域を含み、かつ、390nm以上450nm以下または530nm以上550nm以下の波長帯域内にピーク波長を有していてもよい。また、特定の波長帯域が可視域の赤色帯域である場合、585nm以上615nm以下、または610nm以上730nm以下、の波長帯域を含み、かつ、特定の波長帯域の光は、585nm以上615nm以下または610nm以上730nm以下の波長帯域内にピーク波長を有していてもよい。
 上述した特定の波長帯域の光は、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域を含み、かつ、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域にピーク波長を有していてもよい。この場合、特定の波長帯域は、400±10nm、440±10nm、470±10nm、または、600nm以上750nmの波長帯域を含み、かつ、400±10nm、440±10nm、470±10nm、または600nm以上750nm以下の波長帯域にピーク波長を有していてもよい。
 また、光源310が発生する光は790nm以上820nm以下、または905nm以上970nm以下の波長帯域を含み、かつ、790nm以上820nm以下または905nm以上970nm以下の波長帯域にピーク波長を有していてもよい。
 また、光源310は、ピークが390nm以上470nm以下である励起光を照射する光源を備えていてもよい。この場合、被検体(生体)内の蛍光物質が発する蛍光の情報を有する医用画像(医療画像、生体内画像)を取得することができる。蛍光画像を取得する場合は、蛍光法用色素剤(フルオレスチン、アクリジンオレンジ等)を使用してもよい。
 光源310の光源種類(レーザ光源、キセノン光源、LED光源(LED:Light-Emitting Diode)等)、波長、フィルタの有無等は被写体の種類、部位、観察の目的等に応じて構成することが好ましく、また観察の際は被写体の種類、部位、観察の目的等に応じて観察光の波長を組合せ及び/または切り替えることが好ましい。波長を切り替える場合、例えば光源の前方に配置され特定波長の光を透過または遮光するフィルタが設けられた円板状のフィルタ(ロータリカラーフィルタ)を回転させることにより、照射する光の波長を切り替えてもよい。
 また、本発明を実施する際に用いる撮像素子は撮像素子134のように各画素に対しカラーフィルタが配設されたカラー撮像素子に限定されるものではなく、モノクロ撮像素子でもよい。モノクロ撮像素子を用いる場合、観察光の波長を順次切り替えて面順次(色順次)で撮像することができる。例えば出射する観察光の波長を(紫色、青色、緑色、赤色)の間で順次切り替えてもよいし、広帯域光(白色光)を照射してロータリカラーフィルタ(赤色、緑色、青色、紫色等)により出射する観察光の波長を切り替えてもよい。また、1または複数の狭帯域光(緑色、青色、紫色等)を照射してロータリカラーフィルタ(緑色、青色、紫色等)により出射する観察光の波長を切り替えてもよい。狭帯域光は波長の異なる2波長以上の赤外光(第1狭帯域光、第2狭帯域光)でもよい。
 ライトガイドコネクタ108(図1,2参照)を光源装置300に連結することにより、光源装置300から照射された観察光がライトガイド170を介して照明用レンズ123A、123Bに伝送され、照明用レンズ123A、123Bから観察範囲に照射される。
 <プロセッサの構成>
 図2に基づきプロセッサ200の構成を説明する。プロセッサ200は、内視鏡スコープ100から出力される画像信号を画像入力コントローラ202を介して入力し、画像処理部204で必要な画像処理を行ってビデオ出力部206を介して出力する。これによりモニタ400(表示装置)に観察画像(生体内画像)が表示される。これらの処理はCPU210(CPU:Central Processing Unit)の制御下で行われる。通信制御部205は、図示せぬ病院内システム(HIS:Hospital Information System)や病院内LAN(Local Area Network)、及び/または外部のシステムやネットワークとの間で医療画像や部位情報についての通信制御を行う。記録部207(記録装置)には、被検体の画像(内視鏡画像、医用画像、医療画像)、認識結果(検出、分類、計測等)を示す情報等が記録される(図6及び関連する記載を参照)。音声処理部209(報知部、切替通知部)は、CPU210及び画像処理部204の制御により、注目領域の認識、報知、通知に関するメッセージ(音声信号)をスピーカ209Aから出力する。振動制御部213(報知部、切替通知部)は、CPU210及び画像処理部204の制御によりバイブレータ213Aを振動させて報知、通知を行う(振動信号の出力)。点滅制御部214(報知部、切替通知部)は、CPU210及び画像処理部204の制御によりライト214Aを点灯または消灯させて報知、通知を行う(光信号の出力)。
 また、ROM211(ROM:Read Only Memory)は不揮発性の記憶素子(非一時的記録媒体)であり、各種の画像処理方法をCPU210及び/または画像処理部204(医療画像処理装置、コンピュータ)に実行させるプログラムのコンピュータ読み取り可能なコードが記憶されている。RAM212(RAM:Random Access Memory)は各種処理の際の一時記憶用の記憶素子であり、また画像取得時のバッファとしても使用することができる。
 なお、ユーザは操作部208を介して医用画像処理の実行指示や実行に必要な条件の指定を行うことができ、設定部228、報知部224及び切替通知部226は、これら指示の際の画面や認識の結果等をモニタ400に表示させることができる。
 <画像処理部の機能>
 図3は画像処理部204の機能ブロック図である。画像処理部204は、画像取得部220(画像取得部)と、認識部222(認識部)と、報知部224(報知部)と、切替通知部226(切替通知部)と、設定部228(設定部)と、記録制御部230(記録制御部)とを備える。これらの機能を用いた医用画像処理については、詳細を後述する。
 画像処理部204は、上述した機能により、医療画像の特徴量の算出、特定の周波数帯域の成分を強調または低減する処理、特定の対象(注目領域、所望の深さの血管等)を強調または目立たなくする処理を行うことができる。画像処理部204は、白色帯域の光、または白色帯域の光として複数の波長帯域の光を照射して得る通常光画像に基づいて特定の波長帯域の情報を有する特殊光画像を取得する特殊光画像取得部を備えていてもよい。この場合、特定の波長帯域の信号は、通常光画像に含まれるRGB(R:赤、G:緑、B:青)あるいはCMY(C:シアン、M:マゼンタ、Y:イエロー)の色情報に基づく演算により得ることができる。また、画像処理部204は、白色帯域の光、または白色帯域の光として複数の波長帯域の光を照射して得る通常光画像と、特定の波長帯域の光を照射して得る特殊光画像との少なくとも一方に基づく演算によって特徴量画像を生成する特徴量画像生成部を備え、医用画像(医療画像)としての特徴量画像を取得及び表示してもよい。なお、上述した処理はCPU210の制御下で行われる。
 <各種のプロセッサによる機能の実現>
 上述した画像処理部204の各部の機能は、各種のプロセッサ(processor)及び記録媒体を用いて実現できる。各種のプロセッサには、例えばソフトウェア(プログラム)を実行して各種の機能を実現する汎用的なプロセッサであるCPU(Central Processing Unit)が含まれる。また、上述した各種のプロセッサには、画像処理に特化したプロセッサであるGPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)も含まれる。本発明のように画像の学習や認識を行う場合は、GPUを用いた構成が効果的である。さらに、ASIC(Application Specific Integrated Circuit)などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路なども上述した各種のプロセッサに含まれる。
 各部の機能は1つのプロセッサにより実現されてもよいし、同種または異種の複数のプロセッサ(例えば、複数のFPGA、あるいはCPUとFPGAの組み合わせ、またはCPUとGPUの組み合わせ)で実現されてもよい。また、複数の機能を1つのプロセッサで実現してもよい。複数の機能を1つのプロセッサで構成する例としては、第1に、コンピュータに代表されるように、1つ以上のCPUとソフトウェアの組合せで1つのプロセッサを構成し、このプロセッサが複数の機能として実現する形態がある。第2に、システムオンチップ(System On Chip:SoC)などに代表されるように、システム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の機能は、ハードウェア的な構造として、上述した各種のプロセッサを1つ以上用いて構成される。さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)である。これらの電気回路は、論理和、論理積、論理否定、排他的論理和、及びこれらを組み合わせた論理演算を用いて上述した機能を実現する電気回路であってもよい。
 上述したプロセッサあるいは電気回路がソフトウェア(プログラム)を実行する際は、実行するソフトウェアのコンピュータ(例えば、画像処理部204を構成する各種のプロセッサや電気回路、及び/またはそれらの組み合わせ)で読み取り可能なコードをROM211(ROM:Read Only Memory)等の非一時的記録媒体に記憶しておき、コンピュータがそのソフトウェアを参照する。非一時的記録媒体に記憶しておくソフトウェアは、本発明に係る医用画像処理方法を実行するためのプログラム及び実行に際して用いられるデータ(画像処理条件、報知態様や通知態様の特定に用いられるデータ等)を含む。ROM211ではなく各種の光磁気記録装置、半導体メモリ等の非一時的記録媒体にコードを記録してもよい。ソフトウェアを用いた処理の際には例えばRAM212(RAM:Random Access Memory)が一時的記憶領域として用いられ、また例えば不図示のEEPROM(Electronically Erasable and Programmable Read Only Memory)に記憶されたデータを参照することもできる。「非一時的記録媒体」として記録部207を用いてもよい。
 <学習済みモデルによる認識部>
 上述した認識部222(認識部:検出器、分類器、計測器)は、CNN(Convolutional Neural Network)、SVM(Support Vector Machine)等の学習済みモデル(生体を撮影した画像から構成される画像セットを用いて学習したモデル)を用いて構成することができる。以下、認識部222をCNNにより構成する場合の層構成について説明する。なお、主として認識部222が検出器(注目領域の検出用)である場合について説明するが、分類(鑑別)用、計測用についても同様の層構成を採用しうる。
 <CNNの層構成の例>
 図4はCNNの層構成の例を示す図である。図4の(a)部分に示す例では、CNN562は入力層562Aと、中間層562Bと、出力層562Cとを含む。入力層562Aは画像取得部220が取得した内視鏡画像(医療画像)を入力して特徴量を出力する。中間層562Bは畳み込み層564及びプーリング層565を含み、入力層562Aが出力する特徴量を入力して他の特徴量を算出する。これらの層は複数の「ノード」が「エッジ」で結ばれた構造となっており、複数の重みパラメータを保持している。重みパラメータの値は、学習が進むにつれて変化していく。CNN562は、図4の(b)部分に示す例のように全結合層566を含んでいてもよい。CNN562の層構成は畳み込み層564とプーリング層565とが1つずつ繰り返される場合に限らず、いずれかの層(例えば、畳み込み層564)が複数連続して含まれていてもよい。また、全結合層566が複数連続して含まれていてもよい。
 <中間層における処理>
 中間層562Bは、畳み込み演算及びプーリング処理によって特徴量を算出する。畳み込み層564で行われる畳み込み演算はフィルタを使用した畳み込み演算により特徴マップを取得する処理であり、画像からのエッジ抽出等の特徴抽出の役割を担う。このフィルタを用いた畳み込み演算により、1つのフィルタに対して1チャンネル(1枚)の「特徴マップ」が生成される。「特徴マップ」のサイズは、畳み込みによりダウンスケーリングされ、各層で畳み込みが行われるにつれて小さくなって行く。プーリング層565で行われるプーリング処理は畳み込み演算により出力された特徴マップを縮小(または拡大)して新たな特徴マップとする処理であり、抽出された特徴が平行移動などによる影響を受けないようにロバスト性を与える役割を担う。中間層562Bは、これらの処理を行う1または複数の層により構成することができる。
 図5は、図4に示したCNN562の中間層562Bの構成例を示す模式図である。中間層562Bの最初(1番目)の畳み込み層では、複数の医療画像により構成される画像セット(学習時は学習用画像セット、認識時は認識用画像セット)とフィルタF1との畳み込み演算が行われる。画像セットは、縦がH、横がWの画像サイズを有するN枚(Nチャンネル)の画像により構成される。通常光画像を入力する場合、画像セットを構成する画像はR(赤色),G(緑色),B(青色)の3チャンネルの画像である。この画像セットと畳み込み演算されるフィルタF1は、画像セットがNチャンネル(N枚)であるため、例えばサイズ5(5×5)のフィルタの場合、フィルタサイズは5×5×Nのフィルタになる。このフィルタF1を用いた畳み込み演算により、1つのフィルタF1に対して1チャンネル(1枚)の「特徴マップ」が生成される。2番目の畳み込み層で使用されるフィルタF2は、例えばサイズ3(3×3)のフィルタの場合、フィルタサイズは3×3×Mになる。
 1番目の畳み込み層と同様に、2番目からn番目の畳み込み層ではフィルタF2~Fnを用いた畳み込み演算が行われる。n番目の畳み込み層における「特徴マップ」のサイズが、2番目の畳み込み層における「特徴マップ」のサイズよりも小さくなっているのは、前段までの畳み込み層またはプーリング層によりダウンスケーリングされているからである。
 中間層562Bの層のうち、入力側に近い畳み込み層では低次の特徴抽出(エッジの抽出等)が行われ、出力側に近づくにつれて高次の特徴抽出(対象物の形状、構造等に関する特徴の抽出)が行われる。なお、計測等を目的としてセグメンテーションを行う場合は後半部分の畳み込み層でアップスケーリングされ、最後の畳み込み層では、入力した画像セットと同じサイズの「特徴マップ」が得られる。一方、物体検出を行う場合は位置情報を出力すればよいのでアップスケーリングは必須ではない。
 なお、中間層562Bは畳み込み層564及びプーリング層565の他にバッチノーマライゼーションを行う層を含んでいてもよい。バッチノーマライゼーション処理は学習を行う際のミニバッチを単位としてデータの分布を正規化する処理であり、学習を速く進行させる、初期値への依存性を下げる、過学習を抑制する等の役割を担う。
 <出力層における処理>
 出力層562Cは、中間層562Bから出力された特徴量に基づき、入力された医療画像(通常光画像、特殊光画像)に映っている注目領域の位置検出を行ってその結果を出力する層である。セグメンテーションを行う場合、出力層562Cは、中間層562Bから得られる「特徴マップ」により、画像に写っている注目領域の位置を画素レベルで把握する。すなわち、内視鏡画像の画素ごとに注目領域に属するか否かを検出し、その検出結果を出力することができる。一方、物体検出を行う場合は画素レベルでの判断は必要なく、出力層562Cが対象物の位置情報を出力する。
 出力層562Cは病変に関する鑑別(分類)を実行して鑑別結果を出力するものでもよい。例えば、出力層562Cは内視鏡画像を「腫瘍性」、「非腫瘍性」、「その他」の3つのカテゴリに分類し、鑑別結果として「腫瘍性」、「非腫瘍性」及び「その他」に対応する3つのスコア(3つのスコアの合計は100%)として出力してもよいし、3つのスコアから明確に分類できる場合には分類結果を出力してもよい。なお鑑別結果を出力する場合、出力層562Cが最後の1層または複数の層として全結合層を含んでいてもよいし(図4の(b)部分を参照)、含んでいなくてもよい。
 出力層562Cは注目領域の計測結果を出力するものでもよい。CNNによって計測を行う場合は、対象となる注目領域を例えば上述のようにセグメンテーションしてからその結果を基に画像処理部204等で計測することができる。また、対象となる注目領域の計測値を認識部222から直接出力することもできる。計測値を直接出力させる場合、画像に対し計測値そのものを学習させるので、計測値の回帰問題となる。
 上述した構成のCNNを用いる場合、学習の過程において、出力層562Cが出力する結果と画像セットに対する認識の正解とを比較して損失(誤差)を計算し、損失が小さくなるように中間層562Bにおける重みパラメータを出力側の層から入力側の層に向けて更新していく処理(誤差逆伝播)を行うことが好ましい。
 <CNN以外の手法による認識>
 認識部222は、CNN以外の手法により認識(注目領域の検出等)を行ってもよい。例えば、取得した医療画像の画素の特徴量に基づいて注目領域を検出することができる。この場合、認識部222は検出対象画像を例えば複数の矩形領域に分割し、分割した各矩形領域を局所領域として設定し、検出対象画像の局所領域ごとに局所領域内の画素の特徴量(例えば色相)を算出し、各局所領域の中から特定の色相を有する局所領域を注目領域として決定する。同様に、認識部222は特徴量に基づく分類や計測を行ってもよい。
 <記録部に記録される情報>
 図6は、記録部207に記録される情報の例を示す図である。図6の例では、記録制御部230の制御により、内視鏡画像260(医用画像、医療画像)、認識結果262(認識の結果:検出、分類、計測等)、及び処理条件264(報知や通知の条件、態様等:例えば図8~10を参照)が関連付けて記録される。記録制御部230は、他の情報を併せて記録してもよい。
 <医用画像処理方法>
 上述した構成の内視鏡システム10における医用画像処理方法について、図7のフローチャートを参照しつつ説明する。なお、本実施形態では主として「注目領域の認識」が「注目領域の検出」である場合について説明するが、「注目領域の鑑別(分類)」や「注目領域の計測」の場合も同様の処理を行うことができる。
 <報知及び通知についての設定>
 設定部228は、報知及び/または通知(切替通知)の条件及び/または態様を設定する(ステップS100:設定工程)。設定部228は、例えば以下に説明するように、操作部208及びモニタ400を介したユーザの操作に応じてこの設定を行うことができる。
 <報知態様の設定>
 図8は報知態様の設定画面の一例を示す図であり、設定部228がモニタ400に画面500を表示した様子を示している(図中の点線は画面内の領域を示す仮想線である)。画面500は、ラジオボタンが配置された領域502~508と、数値入力欄が配置された領域510~512を有する。ユーザは、ラジオボタンを操作することにより、報知を行うか否か(オンするかオフするか;領域502)を設定することができる。またユーザは、ラジオボタンの操作により、「画像領域内での枠表示(例えば図11,12の枠604)による報知を行うか否か」(領域504)、「画像領域外での枠表示(例えば図12の枠606)による報知を行うか否か」(領域506)、及び「音声出力(音声信号)による報知を行うか否か」(領域508)を設定することができる。
 さらに、ユーザは、数値の入力により「注目領域を検出してから報知を開始するまで(非報知状態から報知状態に切り替わるまで)の経過時間(「決められた時間」)(領域510)及び「報知を開始してから報知を終了するまで(報知状態から非報知状態に切り替わるまで)の経過時間」(「決められた時間」)(領域512)を設定することができる。報知部224は、領域512に入力された時間(秒数)が経過した後に、報知状態から非報知状態に切り替わる。数値入力は、プルダウンメニューから決められた数値を選択する方式でもよい。図8の例では報知がオン、枠表示がオンであり、検出から報知開始までが1.0秒、報知開始から終了までが1.0秒である。このような非報知状態への切り替わりにより、ユーザの必要に応じて(あらかじめ決められた条件に応じて)支援を終了させて過剰な支援を抑制することができる。
 上述の例は態様設定の一例であり、他の項目(光や振動による報知等)を設定してもよい。また、設定部228は、「認識」の内容(検出、鑑別、計測のいずれであるか)に応じて、設定可能な項目を変えてもよい。例えば、鑑別を行う場合、設定部228は病変の病種、病変の範囲、病変のサイズ、病変の肉眼形、癌のステージ診断、管腔内の現在位置、鑑別結果の信頼度(CNNにより算出できる)等についての報知のオン/オフ及び報知の態様を設定することができる。
 具体的な報知の態様は、後述する図12に例示する。なお、ユーザの操作に応じて、モニタ400の画面に報知の態様を表示する領域を設けてもよい(図12の(d)部分の報知態様表示領域610を参照)。
 このように、内視鏡システム10(医用画像処理装置、内視鏡システム)では、ユーザは必要に応じて報知の態様を設定でき、設定された条件に応じて報知部224が支援(報知)を終了させることにより、過度な報知を抑制することができる。なお、態様の設定は医用画像処理の開始時だけでなく、処理の間に任意のタイミングで行って良い。
 <通知態様の設定>
 <報知状態から非報知状態への切替通知>
 図9は報知状態から非報知状態への切替通知の態様(第1の態様)の設定画面の一例を示す図であり、設定部228がモニタ400に画面520を表示した様子を示している。画面520は、ラジオボタンが配置された領域522~530と、数値入力欄が配置された領域532を有する。ユーザは、ラジオボタンを操作することにより、報知状態から非報知状態への切替通知を行うか否か(オンするかオフするか;領域522)を設定することができる。また、ユーザは、ラジオボタンの操作により画像信号、光信号、振動信号、音声信号による切替通知を行うか否か(領域524~530)を設定することができ、これにる。切替通知部226は、ラジオボタンの設定に応じて、モニタ400等の表示装置に画像を出力する、ライト214Aを点滅させる、バイブレータ213Aを振動させる、スピーカ209Aから音声を出力する、のうち少なくとも1つで通知を行うことができる。
 さらに、ユーザは、数値の入力により「報知状態切替の何秒前に切替通知を行うか」(領域532)を設定することができる。図9の例では、切替通知部226は報知状態の切り替わりの1秒前(「決められた時間前」の一例)に通知を行う。ユーザが秒数をゼロに設定した場合、切替通知部226は、報知状態の切り替わりと同時に通知を行う(後述するステップS170:切替通知工程)。なお、図9は設定画面の一例を示す図であり、設定部228は、さらに細かい態様(振動、音声、点滅、表示の具体的なパターン等)の設定を受け付けてもよい。また、設定部228は、ユーザの操作に応じてモニタ400の画面に切替通知の態様を表示する領域を設けてもよい(図11の通知態様表示領域620を参照)。
 内視鏡システム10(医用画像処理装置、内視鏡システム)では、このような設定により、過剰な支援を抑制しつつ、支援機能の動作状態(報知状態から非報知状態への切り替わり)をユーザに十分に認識させることができる。
 <非報知状態から報知状態への切替通知>
 図10は非報知状態から報知状態への切替通知の態様(第2の態様)の設定画面の一例を示す図であり、設定部228がモニタ400に画面540を表示した様子を示している。画面540は、ラジオボタンが配置された領域542~550と、数値入力欄が配置された領域552を有する。ユーザは、ラジオボタンを操作することにより、非報知状態から報知状態への切替通知を行うか否か(オンするかオフするか;領域542)を設定することができる。また、ユーザは、ラジオボタンの操作により画像信号、光信号、振動信号、音声信号による通知を行うか否か(領域544~550)を設定することができる。切替通知部226は、ラジオボタンの設定に応じて、モニタ400等の表示装置に画像を出力する、ライト214Aを点滅させる、バイブレータ213Aを振動させる、スピーカ209Aから音声を出力する、のうち少なくとも1つで通知を行うことができる。さらに、ユーザは、数値の入力により「報知状態切替の何秒前に切替通知を行うか」(領域552)を設定することができる。
 図10の例では、切替通知部226は報知状態の切り替わりの1秒前(「決められた時間前」の一例)に通知を行う。ユーザが秒数をゼロに設定した場合、切替通知部226は、報知状態の切り替わりと同時に通知を行う(後述するステップS140:切替通知工程)。なお、切替通知部226は、ユーザの操作に応じてモニタ400の画面に切替通知の態様を表示する領域を設けてもよい(図11の通知態様表示領域620を参照)。
 内視鏡システム10(医用画像処理装置、内視鏡システム)では、このような設定により、過剰な支援を抑制しつつ、支援機能の動作状態(非報知状態から報知状態への切り替わり)をユーザに十分に認識させることができる。
 設定部228は、ユーザの設定操作に応じて、報知状態から非報知状態への切替通知の態様(第1の態様)と非報知状態から報知状態への切替通知の態様(第2の態様)を変えてもよい。態様を変えることにより、ユーザは報知状態の切り替わりを明確に把握することができる。また、切替通知部226は、報知状態の切り替わりを知らせる「通知」を、認識部が注目領域を認識したことを知らせる「報知」と異なる態様で行ってもよい。切替通知部226は、設定された態様が同じ場合にユーザに警告してもよい。「通知」と「報知」を異なる態様で行うことにより、ユーザは「報知」と「通知」のいずれが行われているのかを容易に把握することができる。なお、「態様が異なる」は音声と振動、画像と光のように通知に用いる信号の種類が異なる場合と、信号の種類は同じであるが出力のパターンが異なる場合とを含む。
 <内視鏡画像の取得>
 画像取得部220は、時系列の内視鏡画像(医用画像)を取得する(ステップS110:画像取得工程)。画像取得部220は、内視鏡スコープ100で撮影された内視鏡画像を取得してもよいし、記録部207に記録された内視鏡画像260を取得してもよい。画像取得部220が内視鏡スコープ100で撮影された内視鏡画像を取得する場合、記録制御部230は、取得した画像を内視鏡画像260として記録部207に記録することができる。
 <注目領域の認識>
 認識部222(認識部:検出器、分類器、計測器)は、ステップS110で取得した内視鏡画像における注目領域を認識する(ステップS120:認識工程)。認識部222は、この「認識」として、上述したCNN等により検出、分類、計測のうち1つ以上を行うことができる。例えば、「認識」が注目領域の「検出」である場合、検出する注目領域(関心領域)の例としては、ポリープ、癌、大腸憩室、炎症、治療痕(EMR瘢痕(EMR:Endoscopic Mucosal Resection)、ESD瘢痕(ESD:Endoscopic Submucosal Dissection)、クリップ箇所等)、出血点、穿孔、血管異型性などを挙げることができる。また、注目領域の「鑑別」の例としては、病変の病種(過形成ポリープ、腺腫、粘膜内癌、浸潤癌など)、病変の範囲、病変のサイズ、病変の肉眼形、癌のステージ診断、管腔内の現在位置(上部であれば咽頭、食道、胃、十二指腸等、下部であれば盲腸、上行結腸、横行結腸、下行結腸、S状結腸、直腸等)等の判断を挙げることができる。
 なお、初期状態(処理の開始時)では注目領域が検出されておらず報知部224が非報知状態である場合について、以下に説明する。
 <非報知状態から報知状態への切り替わり、及び切替通知>
 認識部222が注目領域を検出した場合(ステップS130でYES)、切替通知部226は報知の状態が非報知状態から報知状態に切り替わることを通知する(ステップS140:切替通知工程)。また、報知部224は非報知状態から報知状態に切り替わり、報知がオンの場合(図8の領域502を参照)は認識の結果を少なくとも1つの態様(例えば、図12の枠604や枠606)で報知する(ステップS150:報知工程)。報知及び通知はステップS100で設定した態様(通知の態様は第2の態様)で行われ、注目領域の検出から報知開始までに時間差があってもよい(図8の領域510を参照)。また、切り替わりの通知(ステップS140)と報知状態の切り替わり(ステップS150)とは同時でもよいし、時間差があってもよい(図10の領域552を参照)。
 なお、ステップS140,S150における通知及び報知の具体例は、後述する図11,12(報知状態から非報知状態への切り替わり、及びその際の切替通知)と同様である。
 <切替条件の判定>
 報知部224は、切替条件(あらかじめ決められた条件)を満たすか否か判断する(ステップS160:判断工程)。この「切替条件」は、報知状態から非報知状態への切り替わりの条件であり、例えば、図8の領域512における時間設定(報知開始から終了までの時間;同図の例では1.5秒)や「注目領域が検出されなくなったこと」を用いることができる。
 <報知状態から非報知状態への切り替わり、及び切替通知>
 ステップS160の判断が肯定された場合、即ち「報知を行う報知状態の開始後にあらかじめ決められた条件が満たされた場合」は、切替通知部226は報知状態から非報知状態に切り替わることを通知し(ステップS170:切替通知工程)、報知部224は報知を行わない非報知状態に切り替わる(ステップS180:報知工程)。切り替わりと通知の時間差は図9の領域532に入力された値に従って設定され、通知が切り替わりより前でもよいし、通知と切り替わりが同時でもよい。切替通知部226は、図9で設定した態様(出力する信号の組み合わせ、時間差)により通知を行う。
 図11は通知態様の例を示す図である。図11の(a)部分はモニタ400の画像表示領域600に注目領域602が映っている状態であり、また、画像表示領域600の外の通知態様表示領域620に、それぞれ画像信号、光信号、振動信号、音声信号による通知のオンまたはオフの状態を示すアイコン622A~628Aが表示されている。図11の(a)部分はアイコン622A~628Aが全てオンの状態(画像、光、振動、及び音声による通知がなされる)を示し、同図の(b)部分は音声信号による通知を示すアイコン628Aのみがオンで残りがオフの状態(アイコン622B~626Bにバツ印が付されている)を示す。なお、図11の(b)部分では注目領域を囲む枠604が表示(報知の一態様)されている。切替通知部226は、ユーザの操作に応じて、あるいは決められた時間の経過に応じて通知態様表示領域620の表示をオンまたはオフしてよい。また、切替通知部226は、非報知状態から報知状態への切替通知についても同様の領域を設けてよい。
 図12は報知態様の例を示す図である。図12の(a)部分は、他の部分との比較のため、モニタ400の画像表示領域600に注目領域602が映っているが報知がされていない状態(例えば、設定された時間が経過していない状態)を示す。同図の(b)部分は注目領域602を囲む枠604が表示された状態(図8の領域504でラジオボックスがオンにされた場合)、(c)部分は画像表示領域600の外に枠606が表示された状態(図8の領域506でラジオボックスがオンにされた場合)、(d)部分は枠604と音声出力がされる状態(図8の領域504,508でラジオボックスがオンにされた場合)を示す。
 報知部224は、通知の場合(図11を参照)と同様に、出力信号のオン/オフ状態を示すアイコンを表示することができる。具体的には、報知部224は、例えば図12の(d)部分のように音声信号による出力のオン/オフを示すアイコン608を報知態様表示領域610に表示することができる。報知部224は、ユーザの操作に応じて、また表示してから一定時間経過後に報知態様表示領域610の表示をオフしてもよい。このような表示のオフにより、過剰な報知を抑制することができる。
 <切替通知が可能なタイミング>
 図13は切替通知が可能なタイミングを示す図である。図13の(a)部分は報知状態から非報知状態への切り替わり時の様子であり、注目領域602を囲む枠604が決められた時間の経過後に非表示になることを示している(図8の領域512を参照)。同図に示すように、切替通知部226は、報知状態から非報知状態に切り替わる時刻t3(報知状態が少なくとも1つ切り替わる「第1のタイミング」)と、時刻t3より決められた時間前である時刻t1(第2のタイミング)との間の任意のタイミング(時刻t1,t3の中間である時刻t2を含む)で切替通知が可能である。時刻t3で通知を行えば報知の終了(非報知状態への切り替わり)と通知とが同時に行われる。上述したように、ユーザはこの時間差(通知が時刻t1の何秒前か)を図9の領域532で入力することができる。
 図13の(b)部分は非報知状態から報知状態への切り替わり時の様子であり、注目領域602を囲む枠604が、検出から決められた時間が経過した後に表示されることを示している(図8の領域510を参照)。同図に示すように、切替通知部226は、非報知状態から報知状態に切り替わる時刻t6(上述した「第1のタイミング」)と、時刻t6より決められた時間前である時刻t4(第2のタイミング)との間の任意のタイミング(時刻t4,t6の中間である時刻t5を含む)で切替通知が可能である。時刻t6で通知を行えば、報知の終了(報知状態への切り替わり)と通知とが同時に行われる。上述したように、ユーザはこの時間差(通知が時刻t1の何秒前か)を図10の領域552で入力することができる。
 <処理の終了>
 画像処理部204は、処理が終了するまで(ステップS190でYESになるまで)ステップS110~S180の処理を繰り返す。画像処理部204は、例えば手元操作部102や操作部208に対するユーザの操作に応じて処理を終了することができる。
 <実施形態の効果>
 以上説明したように、本実施形態に係る内視鏡システム10は、過剰な支援を抑制しつつ、ユーザの必要に応じて所望の態様で支援を行うことができる。また、支援機能の動作状態(報知状態から非報知状態への切り替わり、及び非報知状態から報知状態への切り替わり)をユーザに十分に認識させることができる。
 <画像処理以外の方法による注目領域の認識>
 上述した実施形態では医用画像の画像処理により注目領域を認識する場合について説明しているが、認識部222は医用画像の画像処理によらずに注目領域を認識してもよい(ステップS120:認識工程)。認識部222は、例えば、ユーザの音声入力やジェスチャの画像認識、フットスイッチ等の機器操作により注目領域を認識(検出、鑑別(分類)、計測)することができる。また、本発明に係る医用画像処理装置、内視鏡システム、及び医用画像処理方法では、このように医用画像の処理によらずに認識を行う場合も、上述した実施形態と同様に報知及び通知を行い、これにより支援機能の動作状態をユーザに十分に認識させることができる。
 <内視鏡画像以外への適用>
 上述した実施形態では医用画像(医療画像)の一態様である内視鏡画像を用いて認識を行う場合について説明したが、本発明に係る医用画像処理装置及び医用画像処理方法は超音波画像診断装置等の内視鏡画像以外の医用画像を用いる場合にも適用することができる。
 (付記)
 上述した実施形態に加えて、以下に記載の構成も本発明の範囲に含まれる。
 (付記1)
 医療画像解析処理部は、医療画像の画素の特徴量に基づいて、注目すべき領域である注目領域を検出し、
 医療画像解析結果取得部は、医療画像解析処理部の解析結果を取得する医療画像処理装置。
 (付記2)
 医療画像解析処理部は、医療画像の画素の特徴量に基づいて、注目すべき対象の有無を検出し、
 医療画像解析結果取得部は、医療画像解析処理部の解析結果を取得する医療画像処理装置。
 (付記3)
 医療画像解析結果取得部は、
 医療画像の解析結果を記録する記録装置から取得し、
 解析結果は、医療画像に含まれる注目すべき領域である注目領域と、注目すべき対象の有無のいずれか、もしくは両方である医療画像処理装置。
 (付記4)
 医療画像は、白色帯域の光、または白色帯域の光として複数の波長帯域の光を照射して得た通常光画像である医療画像処理装置。
 (付記5)
 医療画像は、特定の波長帯域の光を照射して得た画像であり、
 特定の波長帯域は、白色の波長帯域よりも狭い帯域である医療画像処理装置。
 (付記6)
 特定の波長帯域は、可視域の青色もしくは、緑色帯域である医療画像処理装置。
 (付記7)
 特定の波長帯域は、390nm以上450nm以下または530nm以上550nm以下の波長帯域を含み、かつ、特定の波長帯域の光は、390nm以上450nm以下または530nm以上550nm以下の波長帯域内にピーク波長を有する医療画像処理装置。
 (付記8)
 特定の波長帯域は、可視域の赤色帯域である医療画像処理装置。
 (付記9)
 特定の波長帯域は、585nm以上615nm以下または610nm以上730nm以下の波長帯域を含み、かつ、特定の波長帯域の光は、585nm以上615nm以下または610nm以上730nm以下の波長帯域内にピーク波長を有する医療画像処理装置。
 (付記10)
 特定の波長帯域は、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域を含み、かつ、特定の波長帯域の光は、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域にピーク波長を有する医療画像処理装置。
 (付記11)
 特定の波長帯域は、400±10nm、440±10nm、470±10nm、または、600nm以上750nm以下の波長帯域を含み、かつ、特定の波長帯域の光は、400±10nm、440±10nm、470±10nm、または、600nm以上750nm以下の波長帯域にピーク波長を有する医療画像処理装置。
 (付記12)
 医療画像は生体内を写した生体内画像であり、
 生体内画像は、生体内の蛍光物質が発する蛍光の情報を有する医療画像処理装置。
 (付記13)
 蛍光は、ピークが390以上470nm以下である励起光を生体内に照射して得る医療画像処理装置。
 (付記14)
 医療画像は生体内を写した生体内画像であり、
 特定の波長帯域は、赤外光の波長帯域である医療画像処理装置。
 (付記15)
 特定の波長帯域は、790nm以上820nm以下または905nm以上970nm以下の波長帯域を含み、かつ、特定の波長帯域の光は、790nm以上820nm以下または905nm以上970nm以下の波長帯域にピーク波長を有する医療画像処理装置。
 (付記16)
 医療画像取得部は、白色帯域の光、または白色帯域の光として複数の波長帯域の光を照射して得る通常光画像に基づいて、特定の波長帯域の情報を有する特殊光画像を取得する特殊光画像取得部を備え、
 医療画像は特殊光画像である医療画像処理装置。
 (付記17)
 特定の波長帯域の信号は、通常光画像に含まれるRGBあるいはCMYの色情報に基づく演算により得る医療画像処理装置。
 (付記18)
 白色帯域の光、または白色帯域の光として複数の波長帯域の光を照射して得る通常光画像と、特定の波長帯域の光を照射して得る特殊光画像との少なくとも一方に基づく演算によって、特徴量画像を生成する特徴量画像生成部を備え、
 医療画像は特徴量画像である医療画像処理装置。
 (付記19)
 付記1から18のいずれか1つに記載の医療画像処理装置と、
 白色の波長帯域の光、または、特定の波長帯域の光の少なくともいずれかを照射して画像を取得する内視鏡と、
 を備える内視鏡装置。
 (付記20)
 付記1から18のいずれか1つに記載の医療画像処理装置を備える診断支援装置。
 (付記21)
 付記1から18のいずれか1つに記載の医療画像処理装置を備える医療業務支援装置。
 以上で本発明の実施形態及び他の例に関して説明してきたが、本発明は上述した態様に限定されず、本発明の精神を逸脱しない範囲で種々の変形が可能である。
10   内視鏡システム
100  内視鏡スコープ
102  手元操作部
104  挿入部
106  ユニバーサルケーブル
108  ライトガイドコネクタ
112  軟性部
114  湾曲部
116  先端硬質部
116A 先端側端面
123  照明部
123A 照明用レンズ
123B 照明用レンズ
126  鉗子口
130  撮影光学系
132  撮影レンズ
134  撮像素子
136  駆動回路
138  AFE
141  送気送水ボタン
142  吸引ボタン
143  機能ボタン
144  撮影ボタン
170  ライトガイド
200  プロセッサ
202  画像入力コントローラ
204  画像処理部
205  通信制御部
206  ビデオ出力部
207  記録部
208  操作部
209  音声処理部
209A スピーカ
210  CPU
211  ROM
212  RAM
213  振動制御部
213A バイブレータ
214  点滅制御部
214A ライト
220  画像取得部
222  認識部
224  報知部
226  切替通知部
228  設定部
230  記録制御部
260  内視鏡画像
262  認識結果
264  処理条件
300  光源装置
310  光源
310B 青色光源
310G 緑色光源
310R 赤色光源
310V 紫色光源
330  絞り
340  集光レンズ
350  光源制御部
400  モニタ
500  画面
502  領域
504  領域
506  領域
508  領域
510  領域
512  領域
520  画面
522  領域
524  領域
526  領域
528  領域
530  領域
532  領域
540  画面
542  領域
544  領域
546  領域
548  領域
550  領域
552  領域
562A 入力層
562B 中間層
562C 出力層
564  畳み込み層
565  プーリング層
566  全結合層
600  画像表示領域
602  注目領域
604  枠
606  枠
608  アイコン
610  報知態様表示領域
620  通知態様表示領域
622A アイコン
622B アイコン
624A アイコン
624B アイコン
626A アイコン
626B アイコン
628A アイコン
F1   フィルタ
F2   フィルタ
S100~S190 医用画像処理方法の各ステップ

Claims (13)

  1.  時系列の医用画像を取得する画像取得部と、
     前記取得した医用画像における注目領域を認識する認識部と、
     前記認識の結果を少なくとも1つの態様で報知する報知部であって、前記報知を行う報知状態の開始後にあらかじめ決められた条件が満たされた場合は、前記報知を行わない非報知状態に切り替わる報知部と、
     前記報知状態から前記非報知状態に切り替わることを通知する切替通知部と、
     を備える医用画像処理装置。
  2.  前記切替通知部は、前記報知の状態が前記非報知状態から前記報知状態に切り替わることを通知する請求項1に記載の医用画像処理装置。
  3.  前記切替通知部は、前記報知状態から前記非報知状態への切り替わりを第1の態様で通知し、前記非報知状態から前記報知状態への切り替わりを前記第1の態様とは異なる第2の態様で通知する請求項2に記載の医用画像処理装置。
  4.  前記報知部は前記報知状態の開始から決められた時間が経過した後に前記非報知状態に切り替わり、
     前記切替通知部は前記報知状態から前記非報知状態への切り替わりを通知する請求項1から3のいずれか1項に記載の医用画像処理装置。
  5.  前記報知部は前記認識部が前記注目領域を認識してから決められた時間が経過した後に前記非報知状態から前記報知状態に切り替わり、
     前記切替通知部は前記報知状態への切り替わりを通知する請求項1から4のいずれか1項に記載の医用画像処理装置。
  6.  前記切替通知部は、前記報知の状態の切り替わりより決められた時間前に前記通知を行う請求項1から5のいずれか1項に記載の医用画像処理装置。
  7.  前記切替通知部は、前記報知の状態の切り替わりと同時に前記通知を行う請求項1から5のいずれか1項に記載の医用画像処理装置。
  8.  前記切替通知部は、音声信号、光信号、画像信号、振動信号のうち少なくとも1つの信号で前記通知を行う請求項1から7のいずれか1項に記載の医用画像処理装置。
  9.  前記切替通知部は、前記報知とは異なる態様で前記通知を行う請求項1から8のいずれか1項に記載の医用画像処理装置。
  10.  前記報知及び/または前記通知の態様を設定する設定部をさらに備える請求項1から9のいずれか1項に記載の医用画像処理装置。
  11.  前記認識部は、前記医用画像の画像処理によらずに前記注目領域を認識する請求項1から10のいずれか1項に記載の医用画像処理装置。
  12.  請求項1から11のいずれか1項に記載の医用画像処理装置と、
     前記医用画像を表示する表示装置と、
     被検体に挿入される内視鏡スコープであって、前記医用画像を撮影する撮影部を有する内視鏡スコープと、
     を備える内視鏡システム。
  13.  時系列の医用画像を取得する画像取得工程と、
     前記取得した医用画像における注目領域を認識する認識工程と、
     前記認識の結果を少なくとも1つの態様で報知する報知工程であって、前記報知を行う報知状態の開始後にあらかじめ決められた条件が満たされた場合は、前記報知を行わない非報知状態に切り替わる報知工程と、
     前記報知状態から前記非報知状態に切り替わることを通知する切替通知工程と、
     を有する医用画像処理方法。
PCT/JP2020/029968 2019-08-13 2020-08-05 医用画像処理装置、内視鏡システム、及び医用画像処理方法 WO2021029293A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021539231A JPWO2021029293A1 (ja) 2019-08-13 2020-08-05
US17/591,386 US20220151461A1 (en) 2019-08-13 2022-02-02 Medical image processing apparatus, endoscope system, and medical image processing method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-148335 2019-08-13
JP2019148335 2019-08-13

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/591,386 Continuation US20220151461A1 (en) 2019-08-13 2022-02-02 Medical image processing apparatus, endoscope system, and medical image processing method

Publications (1)

Publication Number Publication Date
WO2021029293A1 true WO2021029293A1 (ja) 2021-02-18

Family

ID=74569292

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/029968 WO2021029293A1 (ja) 2019-08-13 2020-08-05 医用画像処理装置、内視鏡システム、及び医用画像処理方法

Country Status (3)

Country Link
US (1) US20220151461A1 (ja)
JP (1) JPWO2021029293A1 (ja)
WO (1) WO2021029293A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015112429A (ja) * 2013-12-13 2015-06-22 オリンパスメディカルシステムズ株式会社 画像処理装置
JP2016111533A (ja) * 2014-12-08 2016-06-20 ソニー・オリンパスメディカルソリューションズ株式会社 医療用立体観察装置、医療用立体観察方法、及びプログラム
WO2018198161A1 (ja) * 2017-04-24 2018-11-01 オリンパス株式会社 内視鏡画像処理装置及び内視鏡画像処理方法
WO2018221033A1 (ja) * 2017-06-02 2018-12-06 富士フイルム株式会社 医療画像処理装置、内視鏡システム、診断支援装置、並びに医療業務支援装置
WO2019082993A1 (ja) * 2017-10-26 2019-05-02 富士フイルム株式会社 医療画像処理システム、内視鏡システム、診断支援装置、及び医療業務支援装置
WO2019116592A1 (ja) * 2017-12-14 2019-06-20 オリンパス株式会社 内視鏡の表示画像の調整装置及び手術システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4751593B2 (ja) * 2004-11-02 2011-08-17 オリンパス株式会社 画像表示装置、画像表示方法および画像表示プログラム
WO2019078102A1 (ja) * 2017-10-20 2019-04-25 富士フイルム株式会社 医療画像処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015112429A (ja) * 2013-12-13 2015-06-22 オリンパスメディカルシステムズ株式会社 画像処理装置
JP2016111533A (ja) * 2014-12-08 2016-06-20 ソニー・オリンパスメディカルソリューションズ株式会社 医療用立体観察装置、医療用立体観察方法、及びプログラム
WO2018198161A1 (ja) * 2017-04-24 2018-11-01 オリンパス株式会社 内視鏡画像処理装置及び内視鏡画像処理方法
WO2018221033A1 (ja) * 2017-06-02 2018-12-06 富士フイルム株式会社 医療画像処理装置、内視鏡システム、診断支援装置、並びに医療業務支援装置
WO2019082993A1 (ja) * 2017-10-26 2019-05-02 富士フイルム株式会社 医療画像処理システム、内視鏡システム、診断支援装置、及び医療業務支援装置
WO2019116592A1 (ja) * 2017-12-14 2019-06-20 オリンパス株式会社 内視鏡の表示画像の調整装置及び手術システム

Also Published As

Publication number Publication date
JPWO2021029293A1 (ja) 2021-02-18
US20220151461A1 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
JP7346285B2 (ja) 医療画像処理装置、内視鏡システム、医療画像処理装置の作動方法及びプログラム
JP7252970B2 (ja) 医用画像処理装置、内視鏡システム、及び医用画像処理装置の作動方法
JP7038641B2 (ja) 医療診断支援装置、内視鏡システム、及び作動方法
WO2020162275A1 (ja) 医療画像処理装置、内視鏡システム、及び医療画像処理方法
JP7170032B2 (ja) 画像処理装置、内視鏡システム、及び画像処理方法
JP7125484B2 (ja) 内視鏡システム
WO2021029292A1 (ja) 画像診断支援装置、内視鏡システム、画像診断支援方法、及び画像診断支援プログラム
JP7048732B2 (ja) 画像処理装置、内視鏡システム、及び画像処理方法
JP7062068B2 (ja) 画像処理方法及び画像処理装置
JP7278202B2 (ja) 画像学習装置、画像学習方法、ニューラルネットワーク、及び画像分類装置
JP6941233B2 (ja) 画像処理装置、内視鏡システム、及び画像処理方法
WO2021149552A1 (ja) 医療画像処理装置、医療画像処理装置の作動方法、及び内視鏡システム
JP2023026480A (ja) 医療画像処理装置、内視鏡システム、及び医療画像処理装置の作動方法
JPWO2020059445A1 (ja) 画像処理装置及び画像処理方法
WO2021029293A1 (ja) 医用画像処理装置、内視鏡システム、及び医用画像処理方法
WO2022044606A1 (ja) 医療画像処理装置、医療画像処理方法、内視鏡システム、及び医療画像処理プログラム
WO2021157487A1 (ja) 医用画像処理装置、内視鏡システム、医用画像処理方法、及びプログラム
WO2022181748A1 (ja) 医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム
WO2022186109A1 (ja) 医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム
WO2021153471A1 (ja) 医療画像処理装置、医療画像処理方法、及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20852828

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2021539231

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20852828

Country of ref document: EP

Kind code of ref document: A1