WO2019049544A1 - 表示制御装置、表示制御方法及びプログラム - Google Patents

表示制御装置、表示制御方法及びプログラム Download PDF

Info

Publication number
WO2019049544A1
WO2019049544A1 PCT/JP2018/027918 JP2018027918W WO2019049544A1 WO 2019049544 A1 WO2019049544 A1 WO 2019049544A1 JP 2018027918 W JP2018027918 W JP 2018027918W WO 2019049544 A1 WO2019049544 A1 WO 2019049544A1
Authority
WO
WIPO (PCT)
Prior art keywords
display control
display
control device
audio data
sound pressure
Prior art date
Application number
PCT/JP2018/027918
Other languages
English (en)
French (fr)
Inventor
達哉 小泉
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to US16/642,112 priority Critical patent/US11601751B2/en
Priority to JP2019540817A priority patent/JP7167920B2/ja
Publication of WO2019049544A1 publication Critical patent/WO2019049544A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/008Visual indication of individual signal levels
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H3/00Measuring characteristics of vibrations by using a detector in a fluid
    • G01H3/005Testing or calibrating of detectors covered by the subgroups of G01H3/00
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H3/00Measuring characteristics of vibrations by using a detector in a fluid
    • G01H3/04Frequency
    • G01H3/06Frequency by electric means
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H3/00Measuring characteristics of vibrations by using a detector in a fluid
    • G01H3/10Amplitude; Power
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops

Definitions

  • the present disclosure relates to a display control device, a display control method, and a program.
  • a peak level meter that displays sound pressure and peak value in real time is known as one of the displays related to input speech (see, for example, Patent Document 1).
  • an object of the present disclosure is to provide a display control device, a display control method, and a program that can perform appropriate display on input voice.
  • a display control device includes a control unit that displays on a display unit a sound pressure level distribution of predetermined audio data and a recordable range corresponding to the number of quantization bits when the audio data is recorded.
  • the control unit is a display control method for displaying on the display unit a sound pressure level distribution of predetermined audio data and a recordable range corresponding to the number of quantization bits when the audio data is recorded.
  • the present disclosure is, for example, A program for causing a computer to execute a display control method, in which a control unit displays on a display unit a sound pressure level distribution of predetermined audio data and a recordable range corresponding to the number of quantization bits when recording the audio data. is there.
  • an appropriate display can be performed on input speech.
  • the effect described here is not necessarily limited, and may be any effect described in the present disclosure. Further, the contents of the present disclosure should not be interpreted as being limited by the exemplified effects.
  • FIG. 1 is a block diagram showing a configuration example of a display control device according to the embodiment.
  • FIGS. 2A and 2B are diagrams schematically showing the recordable range corresponding to the number of quantization bits.
  • FIGS. 3A and 3B are diagrams schematically showing the recordable range corresponding to the number of quantization bits and the range of the signal included in the sound source.
  • FIGS. 4A and 4B illustrate an example in which 0 dBFS corresponding to the number of quantization bits is adjusted.
  • FIG. 5 is a view showing a display example and the like according to the first embodiment.
  • FIG. 6 is a diagram referred to when describing a method of compressing a dynamic range.
  • FIG. 7 is a view showing a display example and the like according to the second embodiment.
  • FIG. 1 is a block diagram showing a configuration example of a display control apparatus (display control apparatus 1) according to the first embodiment.
  • the display control device 1 can be applied to, for example, a device capable of collecting sound, specifically, an imaging device, a smartphone, a portable recording device, a wearable device, and the like.
  • the display control device 1 includes, for example, a microphone 11, an A / D (Analog to Digital) converter 12, a DSP (Digital Signal Processor) 13, a display unit 14, a recording unit 15, a recording medium 16, and an operation input unit 17. There is.
  • a / D Analog to Digital
  • DSP Digital Signal Processor
  • the microphone 11 is for collecting surrounding sound, and may be a microphone built into the display control device 1 or a microphone (external microphone) that is detachable from the display control device 1.
  • the sound may be any sound, such as music, human voice, natural sound, and the like.
  • the microphone 11 outputs, to the A / D converter 12, predetermined analog audio data corresponding to the collected sound.
  • the A / D converter 12 converts analog audio data supplied from the microphone 11 into digital audio data.
  • the A / D converter 12 samples analog voice data with a high number of quantization bits, for example, 24 bits.
  • the sampling frequency is set to an arbitrary value (for example, 96 kHz (kilohertz)). Audio data having a sampling frequency of 96 kHz and a quantization bit number of 24 bits may be referred to as high resolution (abbreviation of high resolution).
  • the A / D converter 12 outputs digital audio data obtained by A / D conversion with a quantization bit number of 24 as digital audio data D1.
  • the DSP 13 which is an example of a control unit, controls each unit of the display control device 1.
  • the DSP 13 has, for example, a peak level detection processor 13a, a peak level integration processor 13b, an integrated value visualization processor 13c, and a digital signal processor 13d as functions.
  • the peak level detection processing unit 13a samples the digital audio data D1 at a certain unit time, and detects the peak level of the digital audio data D1 at the time of the sampling.
  • the peak level detection period can be set to an appropriate value.
  • the processing result by the peak level detection processing unit 13a is displayed on the display unit 14 as a peak level meter.
  • the peak level integration processing unit 13b integrates the occurrence frequency of the peak level per unit time of the digital audio data D1 based on the detection result by the peak level detection processing unit 13a.
  • the integrated value visualization processing unit 13c acquires a sound pressure level distribution for visualizing the occurrence frequency of peak levels based on the processing result of the peak level integration processing unit 13b. Then, the DSP 13 controls the display unit 14 to display the sound pressure level distribution on the display unit 14.
  • the digital signal processing unit 13d performs various digital signal processing on the digital audio data D1. Examples of digital signal processing include FFT (Fast Fourier Transform) processing, digital filtering processing, equalizer processing, and the like. Further, the digital signal processing unit 13d according to the present embodiment operates as a compressor and converts 24-bit digital audio data D1 into digital audio data D2 having a quantization bit number (for example, 16 bits) adapted for recording. It also operates as a converter.
  • FFT Fast Fourier Transform
  • the display unit 14 is a display that displays predetermined information according to the control of the DSP 13.
  • a display LCD (Liquid Crystal Display), organic EL (Electro Luminescence), etc. can be mentioned. Details of the information displayed on the display unit 14 will be described later.
  • the recording unit 15 records digital audio data on the recording medium 16.
  • the recording unit 15 records, for example, digital audio data D2 supplied from the DSP 13.
  • the digital audio data D2 is data obtained by converting the digital audio data D1 with a quantization bit number of 16 bits.
  • the recording medium 16 may be a hard disk or the like built in the display control device 1 or a portable memory such as a USB (Universal Serial Bus) memory, an optical disk, or an SD card, and at least corresponds to the sound collected by the microphone 11 Any audio data can be recorded as long as it can be recorded.
  • a portable memory such as a USB (Universal Serial Bus) memory, an optical disk, or an SD card
  • the operation input unit 17 is a generic name of user interfaces such as buttons provided on the display control device 1.
  • the operation input unit 17 may be a mechanical switch such as a button, a touch screen, or both of them. Further, the operation input unit 17 may be a remote control device capable of remotely operating the display control device 1, a tablet computer, a smartphone or the like. In the present embodiment, the display unit 14 functions as a touch screen.
  • the operation input unit 17 generates an operation signal according to an operation input made to the operation input unit 17 and supplies the operation signal to the DSP 13.
  • the DSP 13 performs processing according to the operation signal.
  • the peak level meter can only display the peak level at that moment. Therefore, the user can not intuitively understand, for example, the range of the sound pressure of the sound source (sound to be input) being recorded and the distribution of the occurrence frequency of the peak level.
  • the peak level meter Information is not sufficient as information to make effective settings. For this reason, it has been the case that compression is performed at a fixed ratio or correction is performed automatically by adjusting only the peak value.
  • FIG. 2A is a diagram schematically illustrating a 24-bit dynamic range by a rectangular frame.
  • FIG. 2B is a diagram schematically showing the dynamic range of 16 bits by a rectangular frame.
  • the side of the rectangular upper portion corresponds to the maximum signal level of 0 decibel full scale (hereinafter referred to as 0 dBFS as appropriate), and the base corresponds to the noise floor. It has a noise floor of -144 dBFS for 24-bit and -96 dBFS for 16-bit.
  • the longitudinal length corresponds to the dynamic range in each of FIGS. 2A and 2B. Signals outside the dynamic range, in other words below the noise floor, can not be represented (not recorded).
  • FIGS. 3A and 3B are diagrams schematically showing the range of signals included in a certain sound source with respect to the dynamic range shown in FIGS. 2A and 2B.
  • the range of the sound source is indicated by an ellipse.
  • the entire range of the sound source illustrated in FIG. 3A can be recorded.
  • signals of -96 dBFS or less can not be recorded (note that in FIG. 3B, the range which can not be recorded (range smaller than -96 dBFS, more specifically, , -96 dFS to -144 dFS) and indicated as noise).
  • Display example As described above, for example, when sampling voice data of a sound source with 24 bits and recording with 16 bits, appropriate recording of voice data is performed by setting a position of 0 dBFS according to the characteristics of the sound source. It becomes possible. Therefore, if the feature of the sound source is provided to the user by display, for example, the user can appropriately set the position of 0 dBFS with reference to the display.
  • FIG. 5 shows a display example (display 5) displayed in the first embodiment.
  • the display 5 is displayed on the display unit 14, for example.
  • the display 5 includes, for example, a rectangular frame portion 22.
  • the frame portion 22 has side portions 23a and 23b opposed in the short side direction, and side portions 24a and 24b opposed in the longitudinal direction. ing.
  • the character "FULL" is displayed on the right side of the side portion 23a.
  • the side 23 a corresponds to 0 dBFS corresponding to 24 bits.
  • “ ⁇ -” is described on the right side of the side portion 23 b and corresponds to digital 0 (in this example, a noise floor ( ⁇ 144 dBFS) corresponding to 24 bits).
  • the frame portion 22 has a divided side portion 25 extending in the longitudinal direction in the vicinity of the center.
  • the area surrounded by the frame 22 is divided into two areas in the left-right direction by the divided side 25.
  • a peak level meter 26 is displayed, which displays the volume level of the left channel (L) and the volume level of the right channel (R).
  • a sound pressure level distribution display 27 is displayed in the area on the right side.
  • the graph described on the right of FIG. 5 is a graph showing the sound pressure level distribution of a certain sound source.
  • the horizontal axis indicates the frequency of occurrence of peak levels per unit time
  • the vertical axis indicates sound pressure.
  • the peak level X1 has the highest frequency of occurrence.
  • the sound pressure level distribution display 27 according to the present embodiment represents the sound pressure level distribution shown by the graph using colors. For example, a plurality of threshold values are set for the occurrence frequency, and red, orange, yellow, green, and achromatic color are displayed in descending order of occurrence frequency, thereby representing the sound pressure level distribution.
  • the sound pressure level distribution may be represented by changing the light and shade of the color so that the color becomes darker in descending order of frequency of occurrence instead of different colors.
  • the graph shown in FIG. 5 may be displayed together with the sound pressure level distribution display 27 or may be displayed instead of the sound pressure level distribution display 27. That is, the sound pressure level distribution display 27 may be displayed by a graph.
  • the display 5 includes a rectangular frame 32.
  • the frame 32 is superimposed on the frame 22 and displayed.
  • the superposition in the present embodiment means that at least a part of the frame parts overlap or intersect with each other.
  • the frame portion 32 has side portions 33a and 33b opposed in the short side direction, and has side portions 34a and 34b opposed in the longitudinal direction.
  • Each of the side portions 33 a and 33 b intersects with the side portions 24 a and 24 b of the frame 32.
  • 0 dB is displayed on the left side of the side portion 33a. That is, the side 33a corresponds to 0 dBFS of 16 bits. Further, the side 33 b corresponds to a 16-bit noise floor (-96 dB).
  • the sound pressure level distribution display 27 and the recordable range corresponding to 16 bits, which is the number of quantization bits when recording the audio data are displayed in close proximity to each other.
  • a specific example of the close position is a position where the sound pressure level distribution display 27 and the recordable range are displayed so that at least a part of the sound pressure level distribution display 27 is included in the display of the recordable range.
  • the user moves the entire frame 32 in the vertical direction, for example, by performing an operation input on the operation input unit 17. If the frame portion 32 is moved so that, for example, all the colored portions in the sound pressure level distribution display 27 are positioned within the frame portion 32, the dynamic range is sufficient for the band of audio to be recorded. It will be. Further, even if it is not possible to fit all the colored portions in the frame portion 32, if the position of the frame portion 32 is adjusted so as to include a color (for example, red etc.) corresponding to the high occurrence frequency, It is possible to set a dynamic range suitable for the characteristics of the sound to be recorded (for example, sound pressure distribution). As described above, by displaying the sound pressure level distribution display 27 as one index and displaying the recordable range in 16 bits, it is possible to record using the recordable range in 16 bits effectively. Become.
  • the peak level detection processing unit 13a of the DSP 13 detects the peak level of the digital audio data D1.
  • the DSP 13 controls the display unit 14 in accordance with the detection result by the peak level detection processing unit 13a, and the peak level meter 26 is displayed on the display unit 14 in accordance with the control.
  • the peak level integration processing unit 13b integrates the occurrence frequency of peak levels, and according to the result, data for displaying the sound pressure level distribution display (for example, sound pressure and the like) according to the integration value visualization processing unit 13c.
  • the frequency of occurrence per unit time corresponding to the sound pressure is acquired.
  • the DSP 13 controls the display unit 14 based on the acquired data, and the sound pressure level distribution display 27 is displayed on the display unit 14 according to the control. Further, the DSP 13 displays the frame 22 and the frame 32 on the display unit 14.
  • the position of the frame 32 is adjusted by the operation by the user using the operation input unit 17. As a result of the adjustment, a dynamic range corresponding to 16 bits is set. Based on the set dynamic range, the digital signal processing unit 13d converts the digital audio data D1 again with a quantization bit number of 16 bits, and outputs the result as digital audio data D2. The digital audio data D2 is recorded on the recording medium 16 by the recording unit 15.
  • the sound pressure level distribution of the audio to be recorded may be displayed to the user when the audio is sampled with a higher number of quantization bits actually recorded on the recording medium and then recorded with a lower number of quantization bits And the recordable range can be displayed. Therefore, the user can appropriately set the recordable range corresponding to the number of quantization bits according to the feature of the sound to be recorded, and effective recording can be performed.
  • Second embodiment> Next, a second embodiment will be described. The matters described in the first embodiment can also be applied to the second embodiment unless otherwise specified. Similarly, identical constitutions are given the same reference numerals and redundant description will be omitted. As the display control device according to the second embodiment, the display control device 1 described in the first embodiment can be applied.
  • the second embodiment is an example in which the DSP 13 controls the display unit 14 to display information on the compressor.
  • a method of compressing a dynamic range by applying a compressor is known. For example, when the input exceeds a certain level, a compressor is applied to compress and record the output for the input.
  • the operation start point of the compressor is schematically shown by X2.
  • FIG. 7 A display example of information on the compressor will be described with reference to FIG.
  • the figure located at the center is a display example (display 5a) of information on the compressor.
  • display 5a since the display of the frame portion 22, the peak level meter 26, the sound pressure level distribution display 27 and the like is the same as the display 5 described above, the redundant description is omitted and a part of the reference numeral is omitted.
  • the left side of FIG. 7 shows the frame 32 when the compressor is not applied.
  • the right side of the drawing is a graph 6 showing an operation example of the compressor, in which the horizontal axis represents an input and the vertical axis represents an output. In the present embodiment, the graph 6 is not displayed on the display unit 14 but may be displayed.
  • the display 5 a includes a side portion 36 extending in the horizontal direction in the frame portion 32 as information on the compressor.
  • the display 5 a includes a colored portion 37 in which the region above the side portion 36 is colored in the region in the frame portion 32 as information on the compressor.
  • the color of the colored portion 37 can be any color such as red.
  • the colored portion 37 indicates a range in which the compressor is applied (a range to be compressed). Therefore, the side portion 36 which is the end portion of the colored portion 37 indicates the operation start point of the compressor.
  • the user moves the side portion 36 in the vertical direction to adjust the operation start point of the compressor.
  • the position of the side portion 36 is set so that the occurrence frequency of the peak level decreases, in other words, the signal component included in the colored portion 37 does not increase.
  • the digital signal processing unit 13 d performs the compressor based on the operation start point of the compressor set by the side 36.
  • the length in the vertical direction of the frame 32 changes in accordance with the position of the side 36. That is, in the present embodiment, the recordable range corresponding to 16 bits and the information regarding the compressor are displayed by the frame portion 32 whose shape changes.
  • the horizontal width of the frame portion 32 can be adjusted, for example, the compression ratio in the compressor is increased as the horizontal width increases, and the compression ratio in the compressor is decreased as the horizontal width decreases. Processing may be performed. Thereby, the setting regarding the compression rate of a compressor can also be performed easily. Further, by referring to the sound pressure level distribution display 27 and enlarging the compression rate when the distribution range of the signal component is wide, the compression rate according to the feature of the sound can be appropriately set.
  • the area corresponding to the colored portion 37 may be displayed by hatching or the like. Further, it may be a display of only the side portion 36, and the information regarding the compressor may include at least the operation start point of the compressor. Further, in the second embodiment, the same adjustment as the adjustment described in the first embodiment may be performed.
  • the timing at which the peak level integration processing unit starts integration may be any timing.
  • the timing when shooting (including recording of sound) is started the timing when the level of audio to be recorded is changed, the timing when shooting moving images, power supply
  • the peak level integration processing unit may start integration at the timing when the signal is turned on (may be before the start of recording) or the like.
  • the peak level integration processing unit may start integration after the setting regarding compression of the dynamic range is made.
  • data to be integrated can be set appropriately. For example, all data after the start of integration may be integrated, or data acquired in a period before a predetermined period from the present may be integrated.
  • the result of integration by the peak level integration processing unit may be reset according to a predetermined process. Then, from the reset timing, the peak level integration processing unit may start integration again to acquire the sound pressure level distribution again.
  • the reset is performed, for example, according to the process in which the user has performed a predetermined operation by the operation input unit 17. This makes it possible to acquire the sound pressure level distribution of the voice even when the feature of the voice to be recorded is largely changed, and in the same manner as the embodiment described above, an appropriate setting corresponding to the feature of the voice Is possible.
  • the display control device may not have the display unit.
  • the display unit may be a display unit of a terminal such as a smartphone possessed by the user, and the display in the embodiment described above may be performed on the display unit.
  • the display control device may not have the recording unit. Then, the digital audio data may be recorded in an external recording device (cloud server, personal computer, smartphone, etc.).
  • the display in the embodiment described above can be changed as appropriate.
  • the sound pressure level distribution is displayed along the vertical direction, but may be displayed along the horizontal direction.
  • the shape of the frame portion is not limited to a rectangular shape, and may be an elliptical shape or the like.
  • the peak level meter may not be displayed.
  • a frame portion automatically set in the device may be displayed for the user's reference.
  • on / off of display in the embodiment described above may be selected as a mode.
  • the number of quantization bits in the above-described embodiment is an example, and the present disclosure can be applied even when the number of quantization bits is other (for example, 32 bits).
  • each of the above-described embodiments can be realized in any form, such as a method, a program, or a recording medium recording the program. Also, the program may be downloadable. Then, the functions described in each embodiment may be realized by another apparatus (for example, an imaging apparatus or a smartphone) downloading and installing the program.
  • another apparatus for example, an imaging apparatus or a smartphone
  • a display control apparatus comprising: a control unit for displaying on a display unit a sound pressure level distribution of predetermined audio data and a recordable range corresponding to the number of quantization bits when recording the audio data.
  • the display control device according to (1) wherein the control unit acquires the sound pressure level distribution.
  • the display control device according to (2) wherein the control unit resets and reacquires the sound pressure level distribution according to a predetermined process.
  • the display control device according to any one of (1) to (3), wherein the sound pressure level distribution indicates the frequency of occurrence of peak levels per unit time of audio data.
  • the display control device (10) The display control device according to (8) or (9), wherein the control unit displays the recordable range and information on the compressor as a graphic whose shape changes.
  • (11) The display control device according to any one of (1) to (10), wherein the control unit displays the recordable range by a rectangular frame.
  • (12) The display control device according to (11), wherein the opposite sides of the frame portion correspond to a full scale and a noise floor, respectively.
  • (13) The display control device according to (11) or (12), wherein the control unit displays information related to a compressor in the frame portion.
  • the display control device according to any one of (1) to (13), further including: a recording unit that records audio data corresponding to the recording range.
  • 15) The display control device according to any one of (1) to (14), including the display unit.
  • a display control method wherein a control unit displays on a display unit a sound pressure level distribution of predetermined audio data and a recordable range corresponding to the number of quantization bits when the audio data is recorded.
  • a program for causing a computer to execute a display control method in which a control unit displays on a display unit a sound pressure level distribution of predetermined audio data and a recordable range corresponding to the number of quantization bits when recording the audio data.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

表示制御装置は、所定の音声データの音圧レベル分布と、音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する制御部を有する。 図5

Description

表示制御装置、表示制御方法及びプログラム
 本開示は、表示制御装置、表示制御方法及びプログラムに関する。
 入力される音声に関する表示の一つとして、音圧及びピーク値をリアルタイムに表示するピークレベルメータが知られている(例えば、特許文献1を参照のこと)。
特開2007-25001号公報
 ピークレベルメータによれば、ユーザは、瞬間的な最大音圧(ピークレベル)に関してしか知ることができないという問題があった。
 従って、本開示は、入力される音声に対して適切な表示を行うことができる表示制御装置、表示制御方法及びプログラムを提供することを目的の一つとする。
 本開示は、例えば、
 所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する制御部を有する
 表示制御装置である。
 本開示は、例えば、
 制御部が、所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する
 表示制御方法である。
 本開示は、例えば、
 制御部が、所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する
 表示制御方法をコンピュータに実行させるプログラムである。
 本開示の少なくとも実施形態によれば、入力される音声に対して適切な表示を行うことができる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれの効果であってもよい。また、例示された効果により本開示の内容が限定して解釈されるものではない。
図1は、実施形態に係る表示制御装置の構成例を示すブロック図である。 図2A及び図2Bは、量子化ビット数に対応する記録可能範囲を模式的に示した図である。 図3A及び図3Bは、量子化ビット数に対応する記録可能範囲と音源に含まれる信号の範囲とを模式的に示した図である。 図4A及び図4Bは、量子化ビット数に対応する0dBFSを調整した例を示す図である。 図5は、第1の実施形態に係る表示例等を示す図である。 図6は、ダイナミックレンジを圧縮する方法を説明する際に参照する図である。 図7は、第2の実施形態に係る表示例等を示す図である。
 以下、本開示の実施形態等について図面を参照しながら説明する。なお、説明は以下の順序で行う。
<1.第1の実施形態>
<2.第2の実施形態>
<3.変形例>
 以下に説明する実施形態等は本開示の好適な具体例であり、本開示の内容がこれらの実施形態等に限定されるものではない。
<1.第1の実施形態>
[表示制御装置の構成例]
 図1は、第1の実施形態に係る表示制御装置(表示制御装置1)の構成例を示すブロック図である。表示制御装置1は、例えば、音声を集音可能な機器、具体的には、撮像装置、スマートフォン、可搬型の録音機器、ウェアラブル機器等に適用され得る。
 表示制御装置1は、例えば、マイクロフォン11、A/D(Analog to Digital)コンバータ12、DSP(Digital Signal Processor)13、表示部14、記録部15、記録媒体16及び操作入力部17を有している。
 マイクロフォン11は、周囲の音声を集音するものであり、表示制御装置1に内蔵されるマイクロフォンのでも良いし、表示制御装置1に着脱自在とされるマイクロフォン(外部マイクロフォン)でも良い。音声は、音楽、人の声、自然音等、音であれば何でも良い。マイクロフォン11は、集音した音声に対応する所定のアナログ音声データをA/Dコンバータ12に出力する。
 A/Dコンバータ12は、マイクロフォン11から供給されるアナログ音声データをデジタル音声データに変換する。A/Dコンバータ12は、高い量子化ビット数、例えば24ビットでアナログ音声データをサンプリングする。なお、サンプリング周波数は、任意の値(例えば、96kHz(キロヘルツ))に設定される。サンプリング周波数96kHz、量子化ビット数24ビットの音声データは、ハイレゾ(ハイレゾルーションの略)と称されることもある。A/Dコンバータ12は、量子化ビット数24ビットでAD変換することにより得られるデジタル音声データをデジタル音声データD1として出力する。
 制御部の一例であるDSP13は、表示制御装置1の各部を制御する。DSP13は、機能として、例えば、ピークレベル検出処理部13a、ピークレベル積算処理部13b、積算値可視化処理部13c及びデジタル信号処理部13dを有している。ピークレベル検出処理部13aは、ある単位時間でデジタル音声データD1をサンプリングし、そのサンプリング時におけるデジタル音声データD1のピークレベルを検出する。ピークレベルの検出周期は、適宜な値とすることができる。ピークレベル検出処理部13aによる処理結果は、ピークレベルメータとして表示部14に表示される。
 ピークレベル積算処理部13bは、ピークレベル検出処理部13aによる検出結果に基づいて、デジタル音声データD1の単位時間当たりのピークレベルの発生頻度を積算する。積算値可視化処理部13cは、ピークレベル積算処理部13bの処理結果に基づいて、ピークレベルの発生頻度を可視化するための音圧レベル分布を取得する。そして、DSP13は、表示部14を制御し、音圧レベル分布を表示部14に表示する。
 デジタル信号処理部13dは、デジタル音声データD1に対して種々のデジタル信号処理を行う。デジタル信号処理としては、FFT(Fast Fourier Transform)処理、デジタルフィルタリング処理、イコライザ処理等を挙げることができる。また、本実施形態に係るデジタル信号処理部13dは、コンプレッサとして動作すると共に、24ビットのデジタル音声データD1を記録に適応する量子化ビット数(例えば、16ビット)のデジタル音声データD2に変換する変換部としても動作する。
 表示部14は、DSP13の制御に応じて所定の情報を表示するディスプレイである。ディスプレイとしては、LCD(Liquid Crystal Display)や有機EL(Electro Luminescence)等を挙げることができる。表示部14に表示される情報の詳細は後述する。
 記録部15は、記録媒体16にデジタル音声データを記録するものである。記録部15は、例えば、DSP13から供給されるデジタル音声データD2を記録する。デジタル音声データD2は、デジタル音声データD1が量子化ビット数16ビットで変換されたデータである。
 記録媒体16は、表示制御装置1に内蔵されるハードディスク等でも良いし、USB(Universal Serial Bus)メモリ、光ディスク、SDカード等の可搬型メモリでも良く、少なくともマイクロフォン11により集音された音に対応する音声データを記録できるものであれば何でも良い。
 操作入力部17は、表示制御装置1に設けられるボタン等のユーザインターフェースを総称したものである。操作入力部17は、ボタン等の機械的なスイッチでも良いし、タッチスクリーンでも良いし、これらの両方であっても良い。また、操作入力部17は、表示制御装置1を遠隔操作可能なリモートコントロール装置、タブレット型コンピュータ、スマートフォン等でも良い。本実施形態では、表示部14がタッチスクリーンとして機能する。操作入力部17に対してなされた操作入力に応じて操作入力部17は操作信号を生成し、当該操作信号をDSP13に供給する。DSP13は、操作信号に応じた処理を行う。
[音声データを記録する際に考慮すべき問題]
 ここで、音声データを記録する際に考慮すべき問題について説明する。上述したように、ピークレベルメータでは、その瞬間におけるピークレベルしか表示することができない。従って、ユーザは、例えば、収録中の音源(入力される音声)の音圧の範囲や、ピークレベルの発生頻度の分布が直感的に分からなかった。高い(大きい)量子化ビット数から記録媒体16に記録するために低い(小さい)量子化ビット数に変換する際に、記録範囲やコンプレッサに関する設定を行う必要があり得るが、ピークレベルメータで提供される情報では、効果的な設定を行うための情報としては不十分であった。このため、ある固定の比率で圧縮したり、若しくは、ピークの値のみに値を合わせて自動で補正を行っているのが現状であった。なお、記録媒体16が対応する規格や、記録媒体16の残記録容量、ユーザ設定等に応じて高い量子化ビット数でサンプリングされたデジタル音声データから低い量子化ビット数でサンプリングされたデジタル音声データへの変換が行われる。以上の点を踏まえ、本開示の実施形態について更に説明する。
[記録可能範囲に関する表示]
(0dBFSの設定)
 次に、記録可能範囲に関する表示について図2~図4を参照して説明する。図2Aは、24ビットのダイナミックレンジを矩形の枠で模式的に示した図である。また、図2Bは、16ビットのダイナミックレンジを矩形の枠で模式的に示した図である。図2A及び図2Bにおいて、矩形上部の辺部は、最大の信号レベルである0デシベルフルスケール(以下、0dBFSと適宜、表記する)に対応しており、底辺はノイズフロアに対応している。24ビットの場合は-144dBFS、16ビット場合は-96dBFSのノイズフロアを有する。一般に、ダイナミックレンジは最大の信号レベルとノイズフロアとの差で規定されることから、図2A及び図2Bのそれぞれにおいて、長手方向の長さがダイナミックレンジに対応している。ダイナミックレンジの範囲外の信号、換言すれば、ノイズフロア以下の信号は表現することができない(記録することができない。)。
 図3A及び図3Bは、図2A及び図2Bに示したダイナミックレンジに対して、ある音源に含まれる信号の範囲を模式的に示した図である。図3A及び図3Bでは、音源の範囲を楕円により示している。24ビットの場合は、図3Aに例示した音源の全ての範囲を記録することができる。16ビットの場合は、図3Bに例示した音源のうち-96dBFS以下の信号は記録することができない(なお、図3Bでは、記録することができない範囲(-96dBFSより小さい範囲、より具体的には、-96dFS~-144dFSの範囲)に斜線を付した上、雑音と表記している。)。
 ところで、図4Aに例示した音源の場合、0dBFS付近には信号がない。従って、図4Bに模式的に示すように、0dBFSの位置を適切な位置に変更して記録を行えば、音源に含まれる全ての信号を記録することが可能となる。
(表示例)
 以上、説明したように、例えば、音源の音声データを24ビットでサンプリングし、16ビットで記録する場合に、音源の特徴に応じて0dBFSの位置を設定することにより、音声データの適切な記録が可能となる。従って、音源の特徴を例えば表示によりユーザに提供すれば、ユーザは当該表示を参照して0dBFSの位置を適切に設定することができる。
 図5は、第1の実施形態において表示される表示例(表示5)を示している。表示5は、例えば、表示部14に表示される。表示5は、例えば、矩形状の枠部22を含む、枠部22は、短手方向において対向する辺部23a、23bを有し、且つ、長手方向において対向する辺部24a、24bを有している。辺部23aの右側には「FULL」との文字が表示されている。辺部23aは、24ビットに対応する0dBFSに対応している。また、辺部23bの右側には「-∞」と記載されており、デジタル的な0(本例では、24ビットに対応するノイズフロア(-144dBFS))に対応している。
 また、枠部22は、中央付近に、長手方向に延在する分割辺部25を有している。分割辺部25により、枠部22で囲われる領域が、左右方向の2つの領域に分割されている。左側の領域には、左チャンネル(L)の音量レベル及び右チャンネル(R)の音量レベルを表示するピークレベルメータ26が表示される。
 また、右側の領域には音圧レベル分布表示27が表示される。音圧レベル分布表示27の一例について説明する。図5の右側に記載されているグラフは、ある音源の音圧レベル分布を示すグラフである。当該グラフにおいて、横軸は単位時間当たりのピークレベルの発生頻度を示しており、縦軸は音圧を示している。図示の例では、ピークレベルがX1の発生頻度が最も高くなっている。本実施形態に係る音圧レベル分布表示27は、グラフで示される音圧レベル分布を、色を用いて表す。例えば、発生頻度に対して複数の閾値を設定し、発生頻度が高い順に、赤色、橙色、黄色、緑色、無色を表示し、これにより音圧レベル分布を表す。異なる色ではなく、発生頻度が高い順に色が濃くなるように、色の濃淡を変更して音圧レベル分布を表すようにしても良い。なお、図5に示すグラフが音圧レベル分布表示27と共に表示されても良いし、音圧レベル分布表示27に替えて表示されても良い。即ち、音圧レベル分布表示27がグラフにより表示されても良い。
 更に、表示5は、矩形状の枠部32を含む。枠部32は、枠部22に重畳して表示される。本実施形態における重畳とは、互いの枠部の少なくとも一部が重なっている若しくは交差していることを意味する。枠部32は、短手方向において対向する辺部33a、33bを有し、且つ、長手方向において対向する辺部34a、34bを有している。辺部33a、33bのそれぞれが、枠部32の辺部24a、24bと交差している。辺部33aの左側には0dBと表示されている。即ち、辺部33aは、16ビットの0dBFSに対応している。また、辺部33bは、16ビットのノイズフロア(-96dB)に対応している。これにより、音圧レベル分布表示27と、音声データを記録する際の量子化ビット数である16ビットに対応する記録可能範囲とが近接した位置に表示される。近接した位置の具体例は、記録可能範囲の表示内に音圧レベル分布表示27の少なくとも一部が含まれるように、音圧レベル分布表示27と記録可能範囲とが表示される位置である。
 ユーザは、操作入力部17に対する操作入力を行うことにより、枠部32全体を例えば上下方向に移動する。音圧レベル分布表示27における例えば着色された箇所全てが枠部32内に位置するように枠部32を移動すれば、記録しようとする音声の帯域に対して十分なダイナミックレンジを有していることになる。また、着色された箇所全てを枠部32内に収めることができない場合でも、発生頻度が高いことに対応する色(例えば、赤色等)を含むように、枠部32の位置を調整すれば、記録しようとする音声の特徴(例えば、音圧分布)に適したダイナミックレンジの設定が可能となる。以上のように、音圧レベル分布表示27を一つの指標として表示し、且つ、16ビットでの記録可能範囲を表示することにより、16ビットによる記録可能範囲を効果的に使用した録音が可能となる。
[動作例]
 次に、表示制御装置1の動作例について説明する。マイクロフォン11により集音が行われる。マイクロフォン11から出力されたアナログ音声データがA/Dコンバータ12により量子化ビット数24ビットでサンプリングされ、AD変換される。A/Dコンバータ12から出力されたデジタル音声データD1がDSP13に供給される。
 DSP13のピークレベル検出処理部13aは、デジタル音声データD1のピークレベルを検出する。ピークレベル検出処理部13aによる検出結果に応じてDSP13は表示部14を制御し、当該制御に応じてピークレベルメータ26が表示部14に表示される。
 また、ピークレベル積算処理部13bによりピークレベルの発生頻度が積算され、その結果に応じて、積算値可視化処理部13cが、音圧レベル分布表示を表示するためのデータ(例えば、音圧と当該音圧に対応する単位時間当たりの発生頻度)を取得する。そして、取得したデータに基づいてDSP13が表示部14を制御し、当該制御に応じて音圧レベル分布表示27が表示部14に表示される。また、DSP13は、表示部14に枠部22及び枠部32を表示する。
 ユーザによる操作入力部17を使用した操作により、枠部32の位置が調整される。調整の結果、16ビットに対応するダイナミックレンジが設定される。デジタル信号処理部13dは、設定されたダイナミックレンジに基づいて、デジタル音声データD1を量子化ビット数16ビットで再度変換し、その結果をデジタル音声データD2として出力する。デジタル音声データD2が記録部15により記録媒体16に記録される。
[効果]
 以上、説明した第1の実施形態によれば、例えば、以下の効果を得ることができる。
 音声を実際に記録媒体に記録するより高い量子化ビット数でサンプリングした後、それより低い量子化ビット数で記録する場合に、記録する音声の音圧レベル分布をユーザに対して表示することができ、且つ、記録可能範囲を表示することができる。従って、ユーザは、記録しようとする音声の特徴に応じて、量子化ビット数に対応する記録可能範囲を適切に設定することができ、効果的な録音が可能となる。
<2.第2の実施形態>
 次に、第2の実施形態について説明する。なお、第1の実施形態で説明した事項は、特に断らない限り第2の実施形態にも適用することができ、同様、同質の構成については同一の符号を付し重複した説明を省略する。第2の実施形態に係る表示制御装置としては、第1の実施形態で説明した表示制御装置1を適用することができる。
 第2の実施形態は、DSP13が表示部14を制御して、コンプレッサに関する情報を表示する例である。図6に示すように、コンプレッサをかけることによりダイナミックレンジを圧縮する方法が知られている。例えば、入力があるレベルを超えたところでコンプレッサをかけ、入力に対する出力を圧縮して記録する。図6では、コンプレッサがかかる動作開始点がX2で模式的に示されている。
 図7を参照して、コンプレッサに関する情報の表示例について説明する。図7において、中央に位置する図がコンプレッサに関する情報の表示例(表示5a)である。なお、表示5aにおいて、枠部22、ピークレベルメータ26、音圧レベル分布表示27等の表示は上述した表示5と同様であるので、重複した説明を省略すると共に、参照符号の一部を省略して図示している。図7において、左側の図は、コンプレッサがかかっていない場合の枠部32を示している。また、右側の図は、横軸が入力を示し、縦軸が出力を示す、コンプレッサの動作例を示しているグラフ6である。なお、本実施形態では、グラフ6は表示部14に表示されないが、表示されても構わない。
 例えば、コンプレッサに関する情報の表示をオンする操作やモードに応じて、コンプレッサに関する情報が表示される。表示5aは、コンプレッサに関する情報として、枠部32内で水平方向に延在する辺部36を含む。また、表示5aは、コンプレッサに関する情報として、枠部32内の領域において辺部36より上の領域が着色された着色部37を含む。着色部37の色は、赤色等、任意の色とすることができる。着色部37は、コンプレッサがかかる範囲(圧縮される範囲)を示している。従って、着色部37の端部である辺部36は、コンプレッサの動作開始点を示すものである。
 ユーザは、音圧レベル分布表示27を参照しながら、辺部36を上下方向に移動させてコンプレッサの動作開始点を調整する。例えば、音圧レベル分布表示27において、ピークレベルの発生頻度が低くなる箇所、換言すれば、着色部37に含まれる信号成分が多くならないように辺部36の位置を設定する。これにより、記録しようとする音声の特徴に合わせて、適切な箇所(レベル)をコンプレッサの動作開始点として設定することができる。デジタル信号処理部13dは、辺部36により設定されたコンプレッサの動作開始点に基づいて、コンプレッサを行う。
 なお、上述したように、コンプレッサを動作させることにより記録可能範囲が大きくなることから、辺部36の位置に応じて枠部32の垂直方向の長さが変化する。即ち、本実施形態では、16ビットに対応する記録可能範囲と、コンプレッサに関する情報とを形状が変化する枠部32によって表示している。
 枠部32の水平方向の幅を調整可能とし、例えば、水平方向の幅が大きくなるに連れてコンプレッサにおける圧縮率を大きくし、水平方向の幅が小さくなるに連れてコンプレッサにおける圧縮率を小さくする処理が行われても良い。これにより、コンプレッサの圧縮率に関する設定も容易に行うことができる。また、音圧レベル分布表示27を参照し、信号成分の分布範囲が広い場合に圧縮率を大きくすることにより、音声の特徴に応じた圧縮率を適切に設定することができる。
 着色部37に対応する領域は、網掛け等で表示されても良い。また、辺部36だけの表示でも良く、コンプレッサに関する情報は、少なくともコンプレッサの動作開始点を含むものであれば良い。また、第2の実施形態において、第1の実施形態で説明した調整と同様の調整ができるようにしても良い。
<3.変形例>
 以上、本開示の複数の実施形態について具体的に説明したが、本開示の内容は上述した実施形態に限定されるものではなく、本開示の技術的思想に基づく各種の変形が可能である。
 上述した実施形態において、ピークレベル積算処理部が積算を開始するタイミングは、任意のタイミングとすることができる。例えば、表示制御装置1が撮像装置に適用される場合には、撮影(音の記録を含む)が開始されたタイミングや、記録する音声のレベルが変更されたタイミングや動画を撮影するタイミング、電源がオンされたタイミング(記録が開始される前でも良い)等でピークレベル積算処理部が積算を開始しても良い。また、第2の実施形態で説明したように、ダイナミックレンジの圧縮に関する設定がなされた後に、ピークレベル積算処理部が積算を開始しても良い。また、積算の対象となるデータも適宜、設定することができる。例えば、積算開始後の全てのデータを積算しても良いし、現在から所定期間前の期間で取得されたデータを積算するようにしても良い。
 ピークレベル積算処理部が積算した結果が、所定の処理に応じてリセットされるようにしても良い。そして、リセットされたタイミングから、ピークレベル積算処理部が再度、積算を開始して音圧レベル分布を再取得するようにしても良い。リセットは、例えば、ユーザが操作入力部17により所定の操作を行った処理に応じて行われる。これにより、録音対象の音声の特徴が大きく変わった場合でも、当該音声の音圧レベル分布を取得することが可能となり、上述した実施形態と同様にして、当該音声の特徴に対応する適切な設定が可能となる。
 表示制御装置に係る構成は、適宜、変更することができる。例えば、表示制御装置が表示部を有しない構成でも良い。この場合、表示部はユーザが有するスマートフォン等の端末の表示部でも良く、当該表示部に上述した実施形態における表示がなされるようにしても良い。また、表示制御装置が記録部を有しない構成でも良い。そして、外部の記録装置(クラウドサーバ、パーソナルコンピュータ、スマートフォン等)においてデジタル音声データの記録が行われるようにしても良い。
 上述した実施形態における表示は、適宜、変更することができる。例えば、上述した実施形態では、音圧レベル分布が垂直方向に沿って表示される例について説明したが、水平方向に沿って表示されるようにしても良い。また、枠部の形状は、矩形状に限らず楕円形状等であっても良い。また、ピークレベルメータは表示されなくても良い。また、機器内において自動で設定される枠部をユーザの参考のために表示しても良い。更に、上述した実施形態における表示のオン/オフをモードとして選択できるようにしても良い。
 上述した実施形態における量子化ビット数は一例であり、量子化ビット数が他の場合(例えば32ビット)でも本開示を適用することができる。
 上述した各実施形態で説明した機能は、方法、プログラム、当該プログラムを記録した記録媒体等、任意の形態で実現することができる。また、当該プログラムをダウンロード可能としても良い。そして、他の装置(例えば、撮像装置、スマートフォン)が当該プログラムをダウンロードしてインストールすることにより、各実施形態で説明した機能を実現するようにしても良い。
 上述の実施形態において挙げた構成、方法、工程、形状、材料及び数値などはあくまでも例に過ぎず、必要に応じてこれと異なる構成、方法、工程、形状、材料及び数値などを用いてもよい。上述した実施形態および変形例は、適宜組み合わせることができる。
 本開示は、以下の構成も採ることができる。
(1)
 所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する制御部を有する
 表示制御装置。
(2)
 前記制御部は、前記音圧レベル分布を取得する
 (1)に記載の表示制御装置。
(3)
 前記制御部は、所定の処理に応じて前記音圧レベル分布をリセットして再取得する
 (2)に記載の表示制御装置。
(4)
 前記音圧レベル分布は、音声データの単位時間当たりのピークレベルの発生頻度を示す
 (1)から(3)までの何れかに記載の表示制御装置。
(5)
 前記制御部は、前記ピークの発生頻度を、色を用いて又はグラフ化して表示する
 (4)に記載の表示制御装置。
(6)
 前記制御部は、前記音圧レベル分布と、前記記録可能範囲とを近接した位置に表示する
 (1)から(5)までの何れかに記載の表示制御装置。
(7)
 前記制御部は、前記量子化ビット数より高い量子化ビット数に対応する他の記録可能範囲を、前記記録可能範囲と重畳して表示する
 (6)に記載の表示制御装置。
(8)
 前記制御部は、コンプレッサに関する情報を前記表示部に表示する
 (1)から(7)までの何れかに記載の表示制御装置。
(9)
 前記コンプレッサに関する情報は、少なくともコンプレッサの動作開始点に関する情報を含む
 (8)に記載の表示制御装置。
(10)
 前記制御部は、前記記録可能範囲と、前記コンプレッサに関する情報とを形状が変化する図形により表示する
 (8)又は(9)に記載の表示制御装置。
(11)
 前記制御部は、前記記録可能範囲を矩形状の枠部により表示する
 (1)から(10)までの何れかに記載の表示制御装置。
(12)
 前記枠部が有する対向辺が、フルスケール及びノイズフロアにそれぞれ対応している
 (11)に記載の表示制御装置。
(13)
 前記制御部は、前記枠部内にコンプレッサに関する情報を表示する
 (11)又は(12)に記載の表示制御装置。
(14)
 前記記録範囲内に対応する音声データを記録する記録部を有する
 (1)から(13)までの何れかに記載の表示制御装置。
(15)
 前記表示部を有する
 (1)から(14)までの何れかに記載の表示制御装置。
(16)
 制御部が、所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する
 表示制御方法。
(17)
 制御部が、所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する
 表示制御方法をコンピュータに実行させるプログラム。
1・・・表示制御装置、11・・・マイクロフォン、13・・・DSP、14・・・表示部、15・・・記録媒体、27・・・音圧レベル分布表示、32・・・枠部

Claims (17)

  1.  所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する制御部を有する
     表示制御装置。
  2.  前記制御部は、前記音圧レベル分布を取得する
     請求項1に記載の表示制御装置。
  3.  前記制御部は、所定の処理に応じて前記音圧レベル分布をリセットして再取得する
     請求項2に記載の表示制御装置。
  4.  前記音圧レベル分布は、音声データの単位時間当たりのピークレベルの発生頻度を示す
     請求項1に記載の表示制御装置。
  5.  前記制御部は、前記ピークの発生頻度を、色を用いて又はグラフ化して表示する
     請求項4に記載の表示制御装置。
  6.  前記制御部は、前記音圧レベル分布と、前記記録可能範囲とを近接した位置に表示する
     請求項1に記載の表示制御装置。
  7.  前記制御部は、前記量子化ビット数より高い量子化ビット数に対応する他の記録可能範囲を、前記記録可能範囲と重畳して表示する
     請求項6に記載の表示制御装置。
  8.  前記制御部は、コンプレッサに関する情報を前記表示部に表示する
     請求項1に記載の表示制御装置。
  9.  前記コンプレッサに関する情報は、少なくともコンプレッサの動作開始点に関する情報を含む
     請求項8に記載の表示制御装置。
  10.  前記制御部は、前記記録可能範囲と、前記コンプレッサに関する情報とを形状が変化する図形により表示する
     請求項8に記載の表示制御装置。
  11.  前記制御部は、前記記録可能範囲を矩形状の枠部により表示する
     請求項1に記載の表示制御装置。
  12.  前記枠部が有する対向辺が、フルスケール及びノイズフロアにそれぞれ対応している
     請求項11に記載の表示制御装置。
  13.  前記制御部は、前記枠部内にコンプレッサに関する情報を表示する
     請求項11に記載の表示制御装置。
  14.  前記記録範囲内に対応する音声データを記録する記録部を有する
     請求項1に記載の表示制御装置。
  15.  前記表示部を有する
     請求項1に記載の表示制御装置。
  16.  制御部が、所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する
     表示制御方法。
  17.  制御部が、所定の音声データの音圧レベル分布と、前記音声データを記録する際の量子化ビット数に対応する記録可能範囲とを表示部に表示する
     表示制御方法をコンピュータに実行させるプログラム。
PCT/JP2018/027918 2017-09-08 2018-07-25 表示制御装置、表示制御方法及びプログラム WO2019049544A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US16/642,112 US11601751B2 (en) 2017-09-08 2018-07-25 Display control device and display control method
JP2019540817A JP7167920B2 (ja) 2017-09-08 2018-07-25 表示制御装置、表示制御方法及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017172687 2017-09-08
JP2017-172687 2017-09-08

Publications (1)

Publication Number Publication Date
WO2019049544A1 true WO2019049544A1 (ja) 2019-03-14

Family

ID=65634813

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/027918 WO2019049544A1 (ja) 2017-09-08 2018-07-25 表示制御装置、表示制御方法及びプログラム

Country Status (3)

Country Link
US (1) US11601751B2 (ja)
JP (1) JP7167920B2 (ja)
WO (1) WO2019049544A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024135179A1 (ja) * 2022-12-23 2024-06-27 富士フイルム株式会社 表示方法及び情報処理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007025001A (ja) * 2005-07-12 2007-02-01 Sony Corp 音声記録装置、音声記録方法及び音声記録プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8004527B2 (en) * 2006-01-20 2011-08-23 Newport Corporation Self-centering zoom bar graph
US8194866B2 (en) * 2007-08-20 2012-06-05 Smith Christopher M Sound monitoring, data collection and advisory system
EP2517486A1 (en) * 2009-12-23 2012-10-31 Nokia Corp. An apparatus
US9690539B2 (en) * 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration user interface

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007025001A (ja) * 2005-07-12 2007-02-01 Sony Corp 音声記録装置、音声記録方法及び音声記録プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AUDIO PLUG-INS GUIDE, 2010, pages 243 - 248, Retrieved from the Internet <URL:http://akmedia.digidesign.com/support/dots/Audio_Pluglns_Guide_v90_69827.pdf> [retrieved on 20180906] *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024135179A1 (ja) * 2022-12-23 2024-06-27 富士フイルム株式会社 表示方法及び情報処理装置

Also Published As

Publication number Publication date
JPWO2019049544A1 (ja) 2020-08-20
US20200204914A1 (en) 2020-06-25
US11601751B2 (en) 2023-03-07
JP7167920B2 (ja) 2022-11-09

Similar Documents

Publication Publication Date Title
US10565990B1 (en) Signal processing based on audio context
CN105872253B (zh) 一种直播声音处理方法及移动终端
JP2019046506A (ja) 動的ハプティック変換システム
US20180321908A1 (en) Audio control system and related methods
US10140088B2 (en) Visual spatial audio
KR101427993B1 (ko) 오디오 신호의 햅틱 신호 변환 방법 및 이를 수행하는 장치
WO2012160415A1 (en) An apparatus with an audio equalizer and associated method
US20190014435A1 (en) Sound output apparatus and signal processing method thereof
WO2024032133A1 (zh) 听力检测方法、装置、电子设备及存储介质
US11412341B2 (en) Electronic apparatus and controlling method thereof
KR20180090294A (ko) 오디오 파일 재 녹음 방법, 장치 및 저장매체
JP2023503311A (ja) 調整可能な信号処理付きマイクロフォン
US20220329966A1 (en) Electronic apparatus and controlling method thereof
JP7167920B2 (ja) 表示制御装置、表示制御方法及びプログラム
CN106303841B (zh) 一种音频播放方式的切换方法及移动终端
KR20190012003A (ko) 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법
CN102568512A (zh) 一种音量控制的方法及装置
WO2018062406A1 (ja) フィルタの周波数レスポンス設定方法および設定装置
CN104216641A (zh) 一种界面控制方法、装置和终端设备
JP6018141B2 (ja) オーディオ信号処理装置、オーディオ信号処理方法およびオーディオ信号処理プログラム
JP2015114444A (ja) 音声処理装置、音声処理方法
CN104007951A (zh) 一种信息处理方法及电子设备
CA2790755A1 (en) Method and system of audio image capture based on logarithmic conversion
CN108028055A (zh) 信息处理装置、信息处理系统和程序
US11227615B2 (en) Sound processing apparatus and sound processing method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18854385

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019540817

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18854385

Country of ref document: EP

Kind code of ref document: A1