WO2022181013A1 - 会議システム - Google Patents

会議システム Download PDF

Info

Publication number
WO2022181013A1
WO2022181013A1 PCT/JP2021/047258 JP2021047258W WO2022181013A1 WO 2022181013 A1 WO2022181013 A1 WO 2022181013A1 JP 2021047258 W JP2021047258 W JP 2021047258W WO 2022181013 A1 WO2022181013 A1 WO 2022181013A1
Authority
WO
WIPO (PCT)
Prior art keywords
speaker
conference
sound
teleconference
microphone
Prior art date
Application number
PCT/JP2021/047258
Other languages
English (en)
French (fr)
Inventor
達也 奥野
睦彦 松本
Original Assignee
パナソニックIpマネジメント株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニックIpマネジメント株式会社 filed Critical パナソニックIpマネジメント株式会社
Priority to JP2023502103A priority Critical patent/JPWO2022181013A1/ja
Publication of WO2022181013A1 publication Critical patent/WO2022181013A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques

Definitions

  • the present invention relates to conference systems.
  • Patent Document 1 discloses a voice input means for inputting the voice of a speaker as an input voice, and an output voice decision means for processing the input voice input by the voice input means and determining an output voice. and an audio output control means for controlling output of the generated masking sound.
  • the present invention provides a conference system that makes it difficult for secret information to leak and that allows remote conferences to proceed efficiently.
  • a conference system includes: a first speaker device that outputs a masking sound that masks audio in a remote conference so that it is difficult for people who are not in the remote conference to hear it; A conference device, a second speaker device that outputs the voice of the other party of the remote conference, conference information related to the remote conference, and presence/absence information indicating whether or not a person who is not participating in the remote conference exists at a predetermined location. and a control device for controlling the first speaker device based on at least one of the conference information and the presence/absence information.
  • the conference system of the present invention makes it difficult for secret information to leak, and allows remote conferences to proceed efficiently.
  • FIG. 1 is a diagram showing a conference system according to an embodiment.
  • FIG. 2 is a block diagram showing the functional configuration of the conference system of FIG. 1.
  • FIG. 3 is a flow chart showing an operation example 1 of the conference system of FIG.
  • FIG. 4 is a flow chart showing an operation example 2 of the conference system in FIG.
  • FIG. 5 is a flow chart showing operation example 3 of the conference system of FIG.
  • FIG. 6 is a flowchart showing operation example 4 of the conference system of FIG.
  • FIG. 7 is a flow chart showing an operation example 5 of the conference system in FIG.
  • FIG. 8 is a flow chart showing an operation example 6 of the conference system of FIG.
  • FIG. 9 is a diagram showing a conference system according to another embodiment.
  • FIG. 10 is a diagram showing another example of a space where remote conferences are held.
  • each figure is a schematic diagram and is not necessarily strictly illustrated. Moreover, in each figure, the same code
  • FIG. 1 is a diagram showing a conference system 10 according to an embodiment. A conference system 10 will be described with reference to FIG.
  • the conference system 10 is a conference system that can prevent people who are not participating in the remote conference from hearing the audio in the remote conference held in the space 1.
  • the space 1 where the teleconference takes place is an open space inside a building.
  • the conference system 10 includes a plurality of pillars 12, a plurality of beams 14, a desk 16, a plurality of chairs 18, a plurality of first speaker devices 20, a conference device 22, a second speaker device 24, It comprises an acquisition device 26 and a plurality of second microphone devices 32 .
  • a plurality of pillars 12 are installed around the space 1 .
  • Each of the plurality of beams 14 is installed above the space 1 .
  • Each of the beams 14 has a duct rail (not shown).
  • a desk 16 and a plurality of chairs 18 are installed in the space 1 .
  • Each of the plurality of first speaker devices 20 outputs a masking sound that masks the voice in the teleconference so that it is difficult for people who are not in the teleconference to hear it.
  • a teleconference is a conference between a person in space 1 and a person in a place away from space 1 .
  • the voice in the remote conference is the voice emitted by the person who is holding the remote conference.
  • a person who is not in a teleconference is a person outside the space 1 .
  • the masking sound is white noise or environmental sound in the city.
  • the masking sounds output from each of the plurality of first speaker devices 20 further mask the sounds generated outside the space 1 so as to make it difficult for the people in the remote conference to hear them.
  • the person having the teleconference is the person in space 1 .
  • Each of the plurality of first speaker devices 20 is a directional speaker device. Each of the plurality of first speaker devices 20 is attached to the beam portion 14 and outputs masking sound toward the outside of the space 1 . For example, each of the plurality of first speaker devices 20 outputs a masking sound near the boundary between space 1 and a space outside space 1 .
  • the conference system 10 may include one first speaker device 20 instead of multiple.
  • the masking sound does not have to be masked so as to make the sound generated outside the space 1 less audible to the people in the teleconference.
  • the first speaker device 20 may not be a directional speaker device. In this case, the masking sound can be output over a wide range outside the space 1 .
  • the first speaker device 20 may not be attached to the beam portion 14, and may be attached to the support portion 12, the ceiling, the floor, or the like.
  • the conference device 22 is a conference device for holding remote conferences.
  • a conference device 22 is installed on a desk 16 in the space 1 .
  • the conference device 22 is a terminal device such as a personal computer in which remote conference software is installed. Note that the conference device 22 does not have to be installed on the desk 16 .
  • the second speaker device 24 outputs the voice of the remote conference partner.
  • the remote conference partner is a person who is having a remote conference with a person in space 1 from a location away from space 1 .
  • the second speaker device 24 is a directional speaker.
  • the second speaker device 24 is slidably attached to a duct rail (not shown) of the beam portion 14 and outputs sound downward.
  • the second speaker device 24 is positioned and installed so as to be positioned above people who are having a teleconference in the space 1 .
  • a sound absorbing material may be installed at a location where the sound output from the second speaker device 24 is reflected.
  • the location is the floor or the like.
  • the conference system 10 may include a plurality of second speaker devices 24 .
  • the second speaker device 24 may not be a directional speaker device.
  • the second speaker device 24 may not be attached to the beam portion 14, may be installed on the desk 16, or may be attached to the ceiling, the floor, or the like.
  • the acquisition device 26 is an acquisition device for acquiring at least one of conference information related to a remote conference and presence/absence information indicating whether or not a person who is not in a remote conference exists at a predetermined location.
  • the acquisition device 26 is a device for acquiring both meeting information and presence/absence information.
  • Acquisition device 26 includes a first microphone device 28 and a plurality of sensor devices 30 .
  • the conference information includes audio information about the audio input to the first microphone device 28, information indicating participants in the remote conference, and information indicating the degree of secrecy of the remote conference.
  • the sound information includes information indicating the sound pressure of the sound input to the first microphone device 28, information indicating the frequency of the sound input to the first microphone device 28, and information indicating the frequency of the sound input to the first microphone device 28. Contains information that indicates the words contained in the spoken audio. Also, for example, the information indicating the attendees of the remote conference and the information indicating the degree of confidentiality of the remote conference are determined in advance by the person conducting the remote conference.
  • the predetermined place is a place where the voice in the teleconference can be easily heard, specifically, a place around the space 1.
  • the presence/absence information includes detection information of each of the plurality of sensor devices 30 .
  • the detection information is information indicating the detection result of the sensor device 30 .
  • the first microphone device 28 is a first microphone device into which voice in the teleconference is input.
  • the first microphone device 28 is installed on the desk 16 in the space 1 .
  • a plurality of sensor devices 30 detect people who are not in a teleconference who are present at a predetermined location.
  • Each of the plurality of sensor devices 30 is attached to the beam portion 14 .
  • each of the plurality of sensor devices 30 is a human sensor device, an infrared sensor device, an ultrasonic sensor device, or a visible light sensor device.
  • the acquisition device 26 may include a plurality of first microphone devices 28, or may include one sensor device 30 instead of a plurality. Also, for example, acquisition device 26 may include a camera that captures an image of a predetermined location. In this case, the presence/absence information includes imaging information captured by the camera.
  • the first microphone device 28 may not be installed on the desk 16, and may be a wearable microphone device worn by a person who is having a teleconference.
  • the sensor device 30 may not be attached to the beam portion 14, and may be attached to the column portion 12, the ceiling, the floor, or the like.
  • Each of the plurality of second microphone devices 32 is a second microphone device to which sounds generated outside the space 1 where the teleconference is held are input.
  • the sounds are environmental sounds and include background music and voices emitted by people who are not in the teleconference.
  • Each of the plurality of second microphone devices 32 is attached to the support section 12 .
  • the conference system 10 may include one second microphone device 32 instead of multiple.
  • the second microphone device 32 may not be attached to the support 12, and may be attached to the beam 14, the ceiling, the floor, or the like.
  • FIG. 2 is a block diagram showing the functional configuration of the conference system 10 of FIG. A functional configuration of the conference system 10 will be described with reference to FIG.
  • the conference system 10 further includes a player device 34 and a control device 36.
  • the player device 34 reproduces the sound source in which the masking sound is stored, and transmits an audio signal for outputting the masking sound to the first speaker device 20 .
  • the first speaker device 20 outputs masking sound based on the audio signal transmitted from the player device 34 .
  • the control device 36 controls the first speaker device 20 based on at least one of the conference information and the presence/absence information.
  • the control device 36 controls the first speaker device 20 based on audio information included in the conference information. The details of the control of the control device 36 based on the voice information will be described later. Also, for example, the control device 36 controls the first speaker device 20 based on the information indicating the attendees of the teleconference included in the conference information. Specifically, for example, when a predetermined person is included in the participants of the remote conference, the control device 36 sets the masking sound in the remote conference to a predetermined volume. make it larger than Also, for example, the control device 36 controls the first speaker device 20 based on information indicating the degree of secrecy of the teleconference included in the conference information. Specifically, for example, when the degree of confidentiality of the teleconference is higher than a predetermined height, the control device 36 makes the masking sound in the teleconference louder than a predetermined volume.
  • the control device 36 controls the first speaker device 20 based on the detection information included in the presence/absence information. Details of the control of the control device 36 based on the detection information will be described later. Also, for example, when the acquisition device 26 has the camera described above, the control device 36 controls the first speaker device 20 based on the imaging information included in the presence/absence information. Specifically, for example, the control device 36 sets the volume of the masking sound to be higher when the camera detects people who are not in a remote conference than when the camera does not detect people who are not in a remote conference. The first speaker device 20 is controlled so that .
  • the control device 36 controls the first speaker device 20 based on both the conference information and the presence/absence information. For example, the control device 36 adjusts the volume of the masking sound when there is a person who is not participating in the teleconference at a predetermined location in a teleconference with a higher degree of confidentiality than the predetermined height.
  • the first speaker device 20 is controlled so that the volume of the masking sound becomes louder than when there is a person who is not participating in the teleconference at a predetermined place in the teleconference whose height is lower than a predetermined height.
  • control device 36 is realized by a processor or the like.
  • FIG. 3 is a flowchart showing operation example 1 of the conference system 10 of FIG. An operation example 1 of the conference system 10 will be described with reference to FIG.
  • the control device 36 acquires information indicating the sound pressure of the voice input from the first microphone device 28 (step S1).
  • the control device 36 determines whether or not the sound pressure of the sound input to the first microphone device 28 is higher than a predetermined threshold (step S2).
  • the predetermined threshold is predetermined.
  • the control device 36 controls the volume of the masking sound to be higher than when the sound pressure is equal to or less than the predetermined threshold.
  • the first speaker device 20 is controlled to increase (step S3). In this way, when the sound pressure of the sound input to the first microphone device 28 is greater than a predetermined threshold, the control device 36 makes the volume of the masking sound louder than when the sound pressure is equal to or less than the predetermined threshold.
  • the first speaker device 20 is controlled so that
  • the control device 36 controls the masking sound to be higher than when the sound pressure is greater than the predetermined threshold value.
  • the first speaker device 20 is controlled to reduce the volume (step S4). In this way, when the sound pressure of the sound input to the first microphone device 28 is not greater than a predetermined threshold, the control device 36 controls the volume of the masking sound to be higher than when the sound pressure is greater than the predetermined threshold.
  • the first speaker device 20 is controlled so that .
  • control device 36 controls the first speaker device 20 so that the volume of the masking sound becomes 0 dB when the sound pressure is equal to or less than a predetermined threshold, and when the sound pressure becomes greater than the predetermined threshold, The first speaker device 20 is controlled so that the volume of the masking sound becomes 20 dB.
  • FIG. 4 is a flowchart showing operation example 2 of the conference system 10 of FIG. Operation example 2 of the conference system 10 will be described with reference to FIG.
  • the control device 36 acquires information indicating the frequency of the voice input from the first microphone device 28 (step S11).
  • control device 36 controls the first speaker device 20 so that the frequency of the masking sound changes according to the frequency of the sound input to the first microphone device 28 (step S12).
  • the control device 36 performs masking according to changes in the frequency of the voice input to the first microphone device 28 so that the masked sound having the same frequency as the frequency of the voice input to the first microphone device 28 is output.
  • the first speaker device 20 is controlled so that the frequency of sound changes.
  • the control device 36 responds to changes in the frequency of the voice input to the first microphone device 28 so that the masking sound with a frequency lower than the frequency of the voice input to the first microphone device 28 is output.
  • the first speaker device 20 is controlled so that the frequency of the masking sound is changed.
  • FIG. 5 is a flowchart showing operation example 3 of the conference system 10 of FIG. An operation example 3 of the conference system 10 will be described with reference to FIG.
  • the control device 36 acquires information indicating the frequency of the voice input from the first microphone device 28 to the first microphone device 28 , and Information indicating the frequency of the sound input to the two-microphone device 32 is obtained (step S21).
  • control device 36 changes the frequency of the masking sound according to the frequency of the sound input to the first microphone device 28 and the frequency of the sound input to the second microphone device 32.
  • the first speaker device 20 is controlled (step S22).
  • the control device 36 controls the frequency of the sound input to the second microphone device 32 and the frequency of the sound input to the second microphone device 32.
  • the first speaker device 20 is controlled so as to output masking sounds of the same frequency.
  • the control device 36 controls the frequency of the sound input to the second microphone device 32.
  • the first speaker device 20 is controlled so that the sum of the frequency and the frequency of the masking sound is equal to or lower than the frequency of the voice input to the first microphone device 28 .
  • control device 36 outputs a masking sound having a frequency lower than the frequency of the sound input to the first microphone device 28 and the frequency of the sound input to the second microphone device 32 .
  • the masking sound can further mask sounds generated outside of the space 1 so as to make them less audible to people having a teleconference in the space 1 .
  • FIG. 6 is a flowchart showing operation example 4 of the conference system 10 of FIG. An operation example 4 of the conference system 10 will be described with reference to FIG.
  • the control device 36 acquires information indicating the words included in the voice input to the first microphone device 28 (step S31).
  • the control device 36 determines whether or not the voice input to the first microphone device 28 contains a predetermined word (step S32).
  • the predetermined word is a predetermined word.
  • the control device 36 controls the first speaker device 20 to increase the volume of the masking sound (step S33). For example, the control device 36 controls the first speaker device 20 to output a masking sound with a volume higher than the volume of the masking sound at the time of the determination (step S32).
  • the control device 36 controls the first speaker device 20 so that the volume of the masking sound does not change (step S34). For example, the control device 36 controls the first speaker device 20 so that the masking sound having the same volume as the volume of the masking sound at the time of the determination (step S32) is output.
  • FIG. 7 is a flowchart showing operation example 5 of the conference system 10 of FIG. Operation example 5 of the conference system 10 will be described with reference to FIG.
  • the control device 36 controls the information indicating the frequency of the voice input from the first microphone device 28 to the first microphone device 28 and the frequency of the voice input to the first microphone device 28 .
  • Information indicating words included in the voice is acquired (step S41).
  • the control device 36 Upon acquiring these pieces of information, the control device 36 estimates the speaker (step S42) and determines whether or not a predetermined speaker is speaking (step S43). For example, the control device 36 acquires in advance the frequency of the voice when a predetermined speaker utters a voice including a predetermined word, and obtains the frequency and the frequency of the voice input to the first microphone device 28, etc. Estimate the speaker by comparing
  • control device 36 controls the first speaker device 20 so that the volume of the masking sound becomes louder than when the predetermined speaker is not speaking. is controlled (step S44). In this way, the control device 36 controls the first speaker device 20 so that the volume of the masking sound becomes louder when the predetermined speaker is speaking than when the predetermined speaker is not speaking. to control.
  • the control device 36 controls the first speaker device 20 so that the volume of the masking sound becomes smaller than when the predetermined speaker speaks. is controlled (step S45). In this way, the control device 36 controls the first speaker device 20 so that the volume of the masking sound is lower when the predetermined speaker is not speaking than when the predetermined speaker is speaking. to control.
  • control device 36 controls the first speaker device 20 so that the volume of the masking sound becomes 0 dB when the predetermined speaker is not speaking, and only when the predetermined speaker is speaking.
  • the first speaker device 20 is controlled so that the volume of the masking sound is 20 dB.
  • FIG. 8 is a flowchart showing an operation example 6 of the conference system 10 of FIG. An operation example 6 of the conference system 10 will be described with reference to FIG.
  • the control device 36 acquires detection information from the sensor device 30 (step S51).
  • control device 36 determines whether the sensor device 30 has detected a person who is not in a remote conference (step S52).
  • the control device 36 controls the masking sound to be higher than when the sensor device 30 does not detect a person who is not participating in a teleconference. control the first speaker device 20 to increase the volume of the sound (step S53). In this way, the control device 36 makes the masking sound more pronounced when the sensor device 30 detects a person who is not participating in a teleconference than when the sensor device 30 does not detect a person who is not participating in a teleconference.
  • the first speaker device 20 is controlled so as to increase the volume.
  • the control device 36 controls the masking sound to be higher than when the sensor device 30 detects a person who is not in a remote conference. control the first speaker device 20 so that the volume of the sound is reduced (step S54). In this way, the control device 36 controls the masking sound when the sensor device 30 does not detect a person who is not in a teleconference than when the sensor device 30 detects a person who is not in a teleconference. The first speaker device 20 is controlled so that the volume is reduced.
  • control device 36 controls the first speaker device 20 so that the volume of the masking sound becomes 0 dB when the sensor device 30 does not detect a person who is not participating in the teleconference.
  • the first speaker device 20 is controlled so that the volume of the masking sound becomes 20 dB only when a person who does not mask is detected.
  • the conference system 10 according to the embodiment has been described above.
  • the conference system 10 includes a first speaker device 20 that outputs a masking sound for masking the voice in the remote conference so that it is difficult for people who are not in the remote conference to hear it, and a conference device for conducting the remote conference. 22, a second speaker device 24 for outputting the voice of the other party in the teleconference, and at least one of conference information relating to the teleconference and presence/absence information indicating whether or not a person who is not in the teleconference exists at a predetermined location. and a control device 36 for controlling the first speaker device 20 based on at least one of the conference information and the presence/absence information.
  • the first speaker device 20 that outputs the masking sound is controlled based on at least one of the conference information and the presence/absence information, it is possible to suppress the voice in the teleconference from being heard by people who are not participating in the teleconference. . As a result, it is possible to prevent leakage of secret information that is kept secret to people other than the person who is holding the teleconference, and to proceed with the teleconference efficiently.
  • the acquisition device 26 has the first microphone device 28 to which the voice in the remote conference is input, and the conference information is the voice related to the voice input to the first microphone device 28.
  • the control device 36 controls the first speaker device 20 based on the audio information.
  • the audio information includes information indicating the sound pressure of the audio input to the first microphone device 28, and the control device 36 determines that the sound pressure is greater than a predetermined threshold value.
  • the first speaker device 20 is controlled so that the volume of the masking sound becomes louder than when the sound pressure is equal to or lower than the predetermined threshold.
  • the audio information includes information indicating the frequency of the audio input to the first microphone device 28, and the control device 36 changes the frequency of the masking sound according to the frequency.
  • the first speaker device 20 is controlled so as to do so.
  • the acquisition device 26 further includes a second microphone device 32 to which sounds generated outside the space 1 where the remote conference is being held are input, and the control device 36 , the first speaker device 20 is controlled so that the frequency of the masking sound changes according to the frequency of the sound input to the first microphone device 28 and the frequency of the sound input to the second microphone device 32 .
  • the voice information includes information indicating the words included in the voice input to the first microphone device 28, and the control device 36 controls the voice input to the first microphone device 28.
  • the first speaker device 20 is controlled to increase the volume of the masking sound when the voice includes a predetermined word.
  • the audio information includes information indicating the frequency of the audio input to the first microphone device 28 and information indicating words included in the audio input to the first microphone device 28.
  • the control device 36 estimates the speaker based on information indicating the frequency of the voice input to the first microphone device 28 and information indicating words included in the voice input to the first microphone device 28. (1) controls the first speaker device 20 so that the masking sound becomes louder when the predetermined speaker is speaking than when the predetermined speaker is not speaking.
  • the acquisition device 26 includes the sensor device 30 that detects a person who is present at a predetermined location and is not participating in a teleconference.
  • the control device 36 controls the masking sound when the sensor device 30 detects a person who is not in a teleconference than when the sensor device 30 does not detect a person who is not in a teleconference.
  • the first speaker device 20 is controlled so as to increase the volume.
  • the first speaker device 20 and the second speaker device 24 are directional speakers.
  • the masking sound further masks the sounds generated outside the space 1 so that the people in the conference cannot hear them.
  • FIG. 9 is a diagram showing a conference system 10a according to another embodiment.
  • the conference system 10a includes a first speaker device 20a different from the first speaker device 20.
  • the first speaker device 20a has a sound absorbing material 38 in the center, and is configured so that the sound output from the first speaker device 20a spreads downward in an annular (doughnut) shape (see FIG. 9). dashed line).
  • an annular (doughnut) shape see FIG. 9). dashed line.
  • FIG. 10 is a diagram showing another example of a space where remote conferences are held.
  • the space where the teleconference is held may be an open space 2 inside a vehicle such as a bullet train.
  • the first speaker device for outputting a masking sound for masking the voice in the teleconference so as to make it difficult for people who are not in the teleconference to hear it is installed between the seats.
  • the space where the teleconference is held may be an outdoor open space.
  • the person holding the teleconference may adjust the volume of the masking sound using a volume controller or the like.
  • the conference system is implemented by a plurality of devices, but may be implemented as a single device.
  • the conferencing system may be implemented as a single device corresponding to the control device or the first speaker device.
  • the components (especially functional components) included in the conference system may be distributed to the multiple devices in any way.
  • the information transmission route in the above embodiment is an example and is not particularly limited.
  • a relay device (not shown) may intervene between the two devices.
  • processing executed by a specific processing unit may be executed by another processing unit.
  • order of multiple processes may be changed, and multiple processes may be executed in parallel.
  • each component may be realized by executing a software program suitable for each component.
  • Each component may be realized by reading and executing a software program recorded in a recording medium such as a hard disk or a semiconductor memory by a program execution unit such as a CPU or processor.
  • each component may be realized by hardware.
  • each component may be a circuit (or integrated circuit). These circuits may form one circuit as a whole, or may be separate circuits. These circuits may be general-purpose circuits or dedicated circuits.
  • general or specific aspects of the present invention may be implemented in systems, devices, methods, integrated circuits, computer programs, or computer-readable recording media such as CD-ROMs. Also, general or specific aspects of the invention may be implemented in any combination of systems, devices, methods, integrated circuits, computer programs and recording media.
  • the present invention may be implemented as a method executed by a computer such as a conference system, or as a program for causing a computer to execute such a method.
  • the present invention may be implemented as a computer-readable non-temporary recording medium in which such a program is recorded.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

会議システム(10)は、遠隔会議における音声を遠隔会議をしていない人に聞こえにくくするようにマスキングするマスキング音を出力する第1スピーカ装置(20)と、遠隔会議を行うための会議装置(22)と、遠隔会議の相手方の音声を出力する第2スピーカ装置(24)と、遠隔会議に関する会議情報および所定の場所に遠隔会議をしていない人が存在しているか否かを示す存否情報の少なくとも一方を取得するための取得装置(26)と、会議情報および存否情報の少なくとも一方に基づいて第1スピーカ装置(20)を制御する制御装置(36)とを備える。

Description

会議システム
 本発明は、会議システムに関する。
 従来、話者の音声に対してマスキング音を出力するマスキング装置が知られている。この種の従来技術の一例として、特許文献1には、話者の音声を入力音声として入力する音声入力手段と、音声入力手段によって入力された入力音声を加工して出力音声決定手段によって決定されたマスキング音を生成し、生成したマスキング音を出力するように制御する音声出力制御手段とを備えるマスキング装置が開示されている。
特許第4336552号公報
 ところで、オープンな空間で遠隔会議を行う場合、遠隔地から遠隔会議に参加する人は、当該空間の周囲の状況等が分かりづらいため秘密にしている秘密情報を含んだ発言を不用意にしてしまいやすく、秘密情報が漏れやすい。一方、遠隔地から遠隔会議に参加する人は、秘密情報が漏れないように発言を制限すると効率的に議論に参加できず、遠隔会議を効率よく進めることができない。
 そこで、本発明は、秘密情報を漏れにくくできるとともに、遠隔会議を効率よく進めることができる会議システムを提供する。
 本発明の一態様に係る会議システムは、遠隔会議における音声を前記遠隔会議をしていない人に聞こえにくくするようにマスキングするマスキング音を出力する第1スピーカ装置と、前記遠隔会議を行うための会議装置と、前記遠隔会議の相手方の音声を出力する第2スピーカ装置と、前記遠隔会議に関する会議情報および所定の場所に前記遠隔会議をしていない人が存在しているか否かを示す存否情報の少なくとも一方を取得するための取得装置と、前記会議情報および前記存否情報の少なくとも一方に基づいて前記第1スピーカ装置を制御する制御装置とを備える。
 本発明の会議システムは、秘密情報を漏れにくくできるとともに、遠隔会議を効率よく進めることができる。
図1は、実施の形態に係る会議システムを示す図である。 図2は、図1の会議システムの機能構成を示すブロック図である。 図3は、図1の会議システムの動作例1を示すフローチャートである。 図4は、図1の会議システムの動作例2を示すフローチャートである。 図5は、図1の会議システムの動作例3を示すフローチャートである。 図6は、図1の会議システムの動作例4を示すフローチャートである。 図7は、図1の会議システムの動作例5を示すフローチャートである。 図8は、図1の会議システムの動作例6を示すフローチャートである。 図9は、他の実施の形態に係る会議システムを示す図である。 図10は、遠隔会議が行われる空間の他の例を示す図である。
 以下、実施の形態について、図面を参照しながら具体的に説明する。
 なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置および接続形態、ステップ、ステップの順序等は、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
 また、各図は、模式図であり、必ずしも厳密に図示されたものではない。また、各図において、同じ構成部材については同じ符号を付している。
 (実施の形態)
 図1は、実施の形態に係る会議システム10を示す図である。図1を参照して、会議システム10について説明する。
 図1に示すように、会議システム10は、空間1で行われる遠隔会議における音声が遠隔会議をしていない人に聞こえることを抑制できる会議システムである。たとえば、遠隔会議が行われる空間1は、建物の内部のオープンな空間である。会議システム10は、複数の支柱部12と、複数の梁部14と、机16と、複数の椅子18と、複数の第1スピーカ装置20と、会議装置22と、第2スピーカ装置24と、取得装置26と、複数の第2マイク装置32とを備えている。
 複数の支柱部12は、空間1の周囲に設置されている。複数の梁部14のそれぞれは、空間1の上方に設置されている。複数の梁部14のそれぞれは、ダクトレール(図示せず)を有している。机16および複数の椅子18は、空間1に設置されている。
 複数の第1スピーカ装置20のそれぞれは、遠隔会議における音声を遠隔会議をしていない人に聞こえにくくするようにマスキングするマスキング音を出力する。たとえば、遠隔会議は、空間1にいる人と、空間1とは離れた場所にいる人とが行う会議である。また、たとえば、遠隔会議における音声は、遠隔会議をしている人から発せられた音声であり、空間1で遠隔会議を行っているときに空間1にいる人から発せられた音声および第2スピーカ装置24から出力された音声を含む。また、たとえば、遠隔会議をしていない人は、空間1の外部にいる人である。また、たとえば、マスキング音は、ホワイトノイズまたは街中の環境音である。
 複数の第1スピーカ装置20のそれぞれから出力されたマスキング音は、さらに、空間1の外部で発生した音を遠隔会議をしている人に聞こえにくくするようにマスキングする。たとえば、遠隔会議をしている人は、空間1にいる人である。
 複数の第1スピーカ装置20のそれぞれは、指向性スピーカ装置である。複数の第1スピーカ装置20のそれぞれは、梁部14に取り付けられており、空間1の外部に向かってマスキング音を出力する。たとえば、複数の第1スピーカ装置20のそれぞれは、空間1と空間1の外部の空間との境界付近にマスキング音を出力する。
 なお、たとえば、会議システム10は、複数ではなく1つの第1スピーカ装置20を備えていてもよい。また、マスキング音は、空間1の外部で発生した音を遠隔会議をしている人に聞こえにくくするようにマスキングしなくてもよい。また、第1スピーカ装置20は、指向性スピーカ装置でなくてもよい。この場合、空間1の外部における広範囲に亘ってマスキング音を出力できる。また、第1スピーカ装置20は、梁部14に取り付けられていなくてもよく、支柱部12、天井、または床等に取り付けられていてもよい。
 会議装置22は、遠隔会議を行うための会議装置である。会議装置22は、空間1において机16に設置されている。たとえば、会議装置22は、遠隔会議用のソフトウェアがインストールされているパソコン等の端末装置である。なお、会議装置22は、机16に設置されていなくてもよい。
 第2スピーカ装置24は、遠隔会議の相手方の音声を出力する。たとえば、遠隔会議の相手方は、空間1とは離れた場所から空間1にいる人と遠隔会議を行っている人である。
 第2スピーカ装置24は、指向性スピーカである。第2スピーカ装置24は、梁部14のダクトレール(図示せず)に摺動可能に取り付けられており、下方に向かって音声を出力する。たとえば、第2スピーカ装置24は、空間1で遠隔会議をしている人の上方に位置するように位置決めされて設置される。
 なお、たとえば、第2スピーカ装置24から出力された音声が反射する箇所に、吸音材(図示せず)を設置してもよい。たとえば、当該箇所は、床等である。これによって、第2スピーカ装置24から出力された音声が空間1内で反射されて空間1の外部に漏れることを抑制できる。
 また、たとえば、会議システム10は、複数の第2スピーカ装置24を備えていてもよい。また、第2スピーカ装置24は、指向性スピーカ装置でなくてもよい。また、第2スピーカ装置24は、梁部14に取り付けられていなくてもよく、机16に設置されていてもよいし、天井または床等に取り付けられていてもよい。
 取得装置26は、遠隔会議に関する会議情報および所定の場所に遠隔会議をしていない人が存在しているか否かを示す存否情報の少なくとも一方を取得するための取得装置である。この実施の形態では、取得装置26は、会議情報および存否情報の両方を取得するための装置である。取得装置26は、第1マイク装置28と、複数のセンサ装置30とを有している。
 たとえば、会議情報は、第1マイク装置28に入力された音声に関する音声情報、遠隔会議の出席者を示す情報、および遠隔会議の秘匿性の高さを示す情報を含む。また、たとえば、音声情報は、第1マイク装置28に入力された音声の音圧を示す情報、第1マイク装置28に入力された音声の周波数を示す情報、および第1マイク装置28に入力された音声に含まれる言葉を示す情報を含む。また、たとえば、遠隔会議の出席者を示す情報および遠隔会議の秘匿性の高さを示す情報は、遠隔会議を行う人によって予め定められる。
 また、たとえば、所定の場所は、遠隔会議における音声が聞こえやすい場所であり、具体的には、空間1の周囲の場所である。また、たとえば、存否情報は、複数のセンサ装置30のそれぞれの検知情報を含む。検知情報は、センサ装置30の検知結果を示す情報である。
 第1マイク装置28は、遠隔会議における音声が入力される第1マイク装置である。第1マイク装置28は、空間1において机16に設置されている。
 複数のセンサ装置30は、所定の場所に存在している遠隔会議をしていない人を検知する。複数のセンサ装置30のそれぞれは、梁部14に取り付けられている。たとえば、複数のセンサ装置30のそれぞれは、人感センサ装置であり、赤外線センサ装置、超音波センサ装置、または可視光センサ装置である。
 なお、たとえば、取得装置26は、複数の第1マイク装置28を備えていてもよいし、複数ではなく1つのセンサ装置30を備えていてもよい。また、たとえば、取得装置26は、所定の場所を撮像するカメラを備えていてもよい。この場合、存否情報は、カメラによって撮像された撮像情報を含む。
 また、たとえば、第1マイク装置28は、机16に設置されていなくてもよく、遠隔会議をしている人に装着されるウェアラブルなマイク装置であってもよい。また、センサ装置30は、梁部14に取り付けられていなくてもよく、支柱部12、天井、または床等に取り付けられていてもよい。
 複数の第2マイク装置32のそれぞれは、遠隔会議が行われる空間1の外部で発生した音が入力される第2マイク装置である。たとえば、当該音は、環境音であり、BGMおよび遠隔会議をしていない人から発せられた音声を含む。複数の第2マイク装置32のそれぞれは、支柱部12に取り付けられている。
 なお、たとえば、会議システム10は、複数ではなく1つの第2マイク装置32を備えていてもよい。また、第2マイク装置32は、支柱部12に取り付けられていなくてもよく、梁部14、天井、または床等に取り付けられていてもよい。
 図2は、図1の会議システム10の機能構成を示すブロック図である。図2を参照して、会議システム10の機能構成について説明する。
 図2に示すように、会議システム10は、プレーヤ装置34と、制御装置36とをさらに備えている。
 プレーヤ装置34は、マスキング音が記憶されている音源を再生し、マスキング音を出力するための音声信号を第1スピーカ装置20に送信する。第1スピーカ装置20は、プレーヤ装置34から送信される音声信号に基づいてマスキング音を出力する。
 制御装置36は、会議情報および存否情報の少なくとも一方に基づいて第1スピーカ装置20を制御する。
 たとえば、制御装置36は、会議情報に含まれる音声情報に基づいて、第1スピーカ装置20を制御する。音声情報に基づく制御装置36の制御の詳細については後述する。また、たとえば、制御装置36は、会議情報に含まれる遠隔会議の出席者を示す情報に基づいて、第1スピーカ装置20を制御する。具体的には、たとえば、制御装置36は、遠隔会議の出席者の中に予め定められている所定の人物が含まれている場合、当該遠隔会議におけるマスキング音を予め定められている所定の音量よりも大きくする。また、たとえば、制御装置36は、会議情報に含まれる遠隔会議の秘匿性の高さを示す情報に基づいて、第1スピーカ装置20を制御する。具体的には、たとえば、制御装置36は、遠隔会議の秘匿性の高さが予め定められている所定の高さよりも高い場合、当該遠隔会議におけるマスキング音を所定の音量よりも大きくする。
 また、たとえば、制御装置36は、存否情報に含まれる検知情報に基づいて、第1スピーカ装置20を制御する。検知情報に基づく制御装置36の制御の詳細については後述する。また、たとえば、制御装置36は、取得装置26が上述したカメラを有している場合、存否情報に含まれる撮像情報に基づいて、第1スピーカ装置20を制御する。具体的には、たとえば、制御装置36は、カメラが遠隔会議をしていない人を検知しているときに、カメラが遠隔会議をしていない人を検知していないときよりもマスキング音の音量が大きくなるように、第1スピーカ装置20を制御する。
 また、たとえば、制御装置36は、会議情報および存否情報の両方に基づいて第1スピーカ装置20を制御する。たとえば、制御装置36は、秘匿性の高さが所定の高さよりも高い遠隔会議において所定の場所に当該遠隔会議をしていない人がいるときのマスキング音の音量が、秘匿性の高さが所定の高さよりも低い遠隔会議において所定の場所に当該遠隔会議をしていない人がいるときのマスキング音の音量よりも大きくなるように、第1スピーカ装置20を制御する。
 たとえば、制御装置36は、プロセッサ等によって実現される。
 図3は、図1の会議システム10の動作例1を示すフローチャートである。図3を参照して、会議システム10の動作例1について説明する。
 図3に示すように、制御装置36は、遠隔会議が始まると、第1マイク装置28から第1マイク装置28に入力された音声の音圧を示す情報を取得する(ステップS1)。
 制御装置36は、当該情報を取得すると、第1マイク装置28に入力された音声の音圧が所定の閾値よりも大きいか否かを判定する(ステップS2)。たとえば、当該所定の閾値は、予め定められている。
 制御装置36は、第1マイク装置28に入力された音声の音圧が所定の閾値よりも大きい場合(ステップS2でYes)、当該音圧が所定の閾値以下のときよりもマスキング音の音量が大きくなるように第1スピーカ装置20を制御する(ステップS3)。このように、制御装置36は、第1マイク装置28に入力された音声の音圧が所定の閾値よりも大きいときに、当該音圧が所定の閾値以下のときよりもマスキング音の音量が大きくなるように第1スピーカ装置20を制御する。
 制御装置36は、第1マイク装置28に入力された音声の音圧が所定の閾値よりも大きくない場合(ステップS2でNo)、当該音圧が所定の閾値よりも大きいときよりもマスキング音の音量が小さくなるように第1スピーカ装置20を制御する(ステップS4)。このように、制御装置36は、第1マイク装置28に入力された音声の音圧が所定の閾値よりも大きくないときに、当該音圧が所定の閾値よりも大きいときよりもマスキング音の音量が小さくなるように第1スピーカ装置20を制御する。
 たとえば、制御装置36は、当該音圧が所定の閾値以下のときにはマスキング音の音量が0dBになるように第1スピーカ装置20を制御し、当該音圧が所定の閾値よりも大きくなったときにだけマスキング音の音量が20dBになるように第1スピーカ装置20を制御する。
 図4は、図1の会議システム10の動作例2を示すフローチャートである。図4を参照して、会議システム10の動作例2について説明する。
 図4に示すように、制御装置36は、遠隔会議が始まると、第1マイク装置28から第1マイク装置28に入力された音声の周波数を示す情報を取得する(ステップS11)。
 制御装置36は、当該情報を取得すると、第1マイク装置28に入力された音声の周波数に応じてマスキング音の周波数が変化するように第1スピーカ装置20を制御する(ステップS12)。
 たとえば、制御装置36は、第1マイク装置28に入力された音声の周波数と同じ周波数のマスキング音が出力されるように、第1マイク装置28に入力された音声の周波数の変化に合わせてマスキング音の周波数が変化するように、第1スピーカ装置20を制御する。また、たとえば、制御装置36は、第1マイク装置28に入力された音声の周波数よりも低い周波数のマスキング音が出力されるように、第1マイク装置28に入力された音声の周波数の変化に合わせてマスキング音の周波数が変化するように、第1スピーカ装置20を制御する。
 図5は、図1の会議システム10の動作例3を示すフローチャートである。図5を参照して、会議システム10の動作例3について説明する。
 図5に示すように、制御装置36は、遠隔会議が始まると、第1マイク装置28から第1マイク装置28に入力された音声の周波数を示す情報を取得し、第2マイク装置32から第2マイク装置32に入力された音の周波数を示す情報を取得する(ステップS21)。
 制御装置36は、これらの情報を取得すると、第1マイク装置28に入力された音声の周波数、および第2マイク装置32に入力された音の周波数に応じてマスキング音の周波数が変化するように第1スピーカ装置20を制御する(ステップS22)。
 たとえば、制御装置36は、第1マイク装置28に入力された音声の周波数が第2マイク装置32に入力された音の周波数よりも高い場合、第2マイク装置32に入力された音の周波数と同じ周波数のマスキング音が出力されるように、第1スピーカ装置20を制御する。また、たとえば、制御装置36は、第1マイク装置28に入力された音声の周波数が第2マイク装置32に入力された音の周波数よりも低い場合、第2マイク装置32に入力された音の周波数とマスキング音の周波数とを足し合わせた周波数が第1マイク装置28に入力された音声の周波数以下になるように、第1スピーカ装置20を制御する。また、たとえば、制御装置36は、第1マイク装置28に入力された音声の周波数および第2マイク装置32に入力された音の周波数よりも低い周波数のマスキング音を出力する。これによって、マスキング音は、さらに、空間1の外部で発生した音を空間1で遠隔会議をしている人に聞こえにくくするようにマスキングできる。
 図6は、図1の会議システム10の動作例4を示すフローチャートである。図6を参照して、会議システム10の動作例4について説明する。
 図6に示すように、制御装置36は、遠隔会議が始まると、第1マイク装置28から第1マイク装置28に入力された音声に含まれる言葉を示す情報を取得する(ステップS31)。
 制御装置36は、当該情報を取得すると、第1マイク装置28に入力された音声に所定の言葉が含まれているか否かを判定する(ステップS32)。たとえば、所定の言葉は、予め定められている言葉である。
 制御装置36は、第1マイク装置28に入力された音声に所定の言葉が含まれている場合(ステップS32でYes)、マスキング音の音量が増大するように第1スピーカ装置20を制御する(ステップS33)。たとえば、制御装置36は、上記判定(ステップS32)時におけるマスキング音の音量よりも、大きい音量のマスキング音が出力されるように第1スピーカ装置20を制御する。
 制御装置36は、第1マイク装置28に入力された音声に所定の言葉が含まれていない場合(ステップS32でNo)、マスキング音の音量が変化しないように第1スピーカ装置20を制御する(ステップS34)。たとえば、制御装置36は、上記判定(ステップS32)時におけるマスキング音の音量と、同じ音量のマスキング音が出力されるように、第1スピーカ装置20を制御する。
 図7は、図1の会議システム10の動作例5を示すフローチャートである。図7を参照して、会議システム10の動作例5について説明する。
 図7に示すように、制御装置36は、遠隔会議が始まると、第1マイク装置28から第1マイク装置28に入力された音声の周波数を示す情報、および第1マイク装置28に入力された音声に含まれる言葉を示す情報を取得する(ステップS41)。
 制御装置36は、これらの情報を取得すると、話者を推定し(ステップS42)、所定の話者が音声を発しているか否かを判定する(ステップS43)。たとえば、制御装置36は、所定の話者が所定の言葉を含む音声を発したときの当該音声の周波数を予め取得しておき、当該周波数と第1マイク装置28に入力された音声の周波数等とを比較することによって、話者を推定する。
 制御装置36は、所定の話者が音声を発している場合(ステップS43でYes)、所定の話者が音声を発していないときよりもマスキング音の音量が大きくなるように第1スピーカ装置20を制御する(ステップS44)。このように、制御装置36は、所定の話者が音声を発しているときに、所定の話者が音声を発していないときよりもマスキング音の音量が大きくなるように、第1スピーカ装置20を制御する。
 制御装置36は、所定の話者が音声を発していない場合(ステップS43でNo)、所定の話者が音声を発しているときよりもマスキング音の音量が小さくなるように第1スピーカ装置20を制御する(ステップS45)。このように、制御装置36は、所定の話者が音声を発していないときに、所定の話者が音声を発しているときよりもマスキング音の音量が小さくなるように、第1スピーカ装置20を制御する。
 たとえば、制御装置36は、所定の話者が音声を発していないときにはマスキング音の音量が0dBになるように第1スピーカ装置20を制御し、所定の話者が音声を発しているときにだけマスキング音の音量が20dBになるように第1スピーカ装置20を制御する。
 図8は、図1の会議システム10の動作例6を示すフローチャートである。図8を参照して、会議システム10の動作例6について説明する。
 図8に示すように、制御装置36は、遠隔会議が始まると、センサ装置30から検知情報を取得する(ステップS51)。
 制御装置36は、検知情報を取得すると、センサ装置30が遠隔会議をしていない人を検知しているか否かを判定する(ステップS52)。
 制御装置36は、センサ装置30が遠隔会議をしていない人を検知している場合(ステップS52でYes)、センサ装置30が遠隔会議をしていない人を検知していないときよりもマスキング音の音量が大きくなるように第1スピーカ装置20を制御する(ステップS53)。このように、制御装置36は、センサ装置30が遠隔会議をしていない人を検知しているときに、センサ装置30が遠隔会議をしていない人を検知していないときよりもマスキング音の音量が大きくなるように、第1スピーカ装置20を制御する。
 制御装置36は、センサ装置30が遠隔会議をしていない人を検知していない場合(ステップS52でNo)、センサ装置30が遠隔会議をしていない人を検知しているときよりもマスキング音の音量が小さくなるように第1スピーカ装置20を制御する(ステップS54)。このように、制御装置36は、センサ装置30が遠隔会議をしていない人を検知していないときに、センサ装置30が遠隔会議をしていない人を検知しているときよりもマスキング音の音量が小さくなるように、第1スピーカ装置20を制御する。
 たとえば、制御装置36は、センサ装置30が遠隔会議をしていない人を検知していないときにはマスキング音の音量が0dBになるように第1スピーカ装置20を制御し、センサ装置30が遠隔会議をしていない人を検知しているときにだけマスキング音の音量が20dBになるように第1スピーカ装置20を制御する。
 以上、実施の形態に係る会議システム10について説明した。
 実施の形態に係る会議システム10は、遠隔会議における音声を遠隔会議をしていない人に聞こえにくくするようにマスキングするマスキング音を出力する第1スピーカ装置20と、遠隔会議を行うための会議装置22と、遠隔会議の相手方の音声を出力する第2スピーカ装置24と、遠隔会議に関する会議情報および所定の場所に遠隔会議をしていない人が存在しているか否かを示す存否情報の少なくとも一方を取得するための取得装置26と、会議情報および存否情報の少なくとも一方に基づいて第1スピーカ装置20を制御する制御装置36とを備える。
 これによれば、会議情報および存否情報の少なくとも一方に基づいて、マスキング音を出力する第1スピーカ装置20を制御するので、遠隔会議における音声が遠隔会議をしていない人に聞こえることを抑制できる。これによって、遠隔会議をしている人以外の人に対して秘密にしている秘密情報を漏れにくくできるとともに、遠隔会議を効率よく進めることができる。
 また、実施の形態に係る会議システム10において、取得装置26は、遠隔会議における音声が入力される第1マイク装置28を有し、会議情報は、第1マイク装置28に入力された音声に関する音声情報を含み、制御装置36は、音声情報に基づいて第1スピーカ装置20を制御する。
 これによれば、遠隔会議における音声に応じて、マスキング音を適切に出力させやすくなるので、遠隔会議における音声が遠隔会議をしていない人に聞こえることをさらに抑制できる。これによって、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、実施の形態に係る会議システム10において、音声情報は、第1マイク装置28に入力された音声の音圧を示す情報を含み、制御装置36は、当該音圧が所定の閾値よりも大きいときに、当該音圧が所定の閾値以下のときよりもマスキング音の音量が大きくなるように、第1スピーカ装置20を制御する。
 これによれば、遠隔会議における音声が大きくなったときにだけマスキング音の音量を大きくしやすくなるので、マスキング音が遠隔会議の妨げになることを抑制しつつ、遠隔会議における音声が遠隔会議をしていない人に聞こえることをさらに抑制できる。これによって、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、実施の形態に係る会議システム10において、音声情報は、第1マイク装置28に入力された音声の周波数を示す情報を含み、制御装置36は、当該周波数に応じてマスキング音の周波数が変化するように、第1スピーカ装置20を制御する。
 これによれば、遠隔会議における音声をマスキングしやすい周波数のマスキング音を出力させやすくなるので、遠隔会議における音声が遠隔会議をしていない人に聞こえることをさらに抑制できる。これによって、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、実施の形態に係る会議システム10において、取得装置26は、遠隔会議が行われている空間1の外部で発生した音が入力される第2マイク装置32をさらに有し、制御装置36は、第1マイク装置28に入力された音声の周波数および第2マイク装置32に入力された音の周波数に応じてマスキング音の周波数が変化するように、第1スピーカ装置20を制御する。
 これによれば、空間1の外部で発生した音の周波数を考慮することによって、遠隔会議における音声をマスキングしやすい周波数のマスキング音を出力させやすくなるので、遠隔会議における音声が遠隔会議をしていない人に聞こえることをさらに抑制できる。これによって、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、実施の形態に係る会議システム10において、音声情報は、第1マイク装置28に入力された音声に含まれる言葉を示す情報を含み、制御装置36は、第1マイク装置28に入力された音声に所定の言葉が含まれている場合、マスキング音の音量が増大するように、第1スピーカ装置20を制御する。
 これによれば、秘密情報を含む音声が発せられているときにだけマスキング音の音量を増大させやすくなるので、マスキング音が遠隔会議の妨げになることを抑制しつつ、遠隔会議における音声が遠隔会議をしていない人に聞こえることをさらに抑制できる。これによって、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、実施の形態に係る会議システム10において、音声情報は、第1マイク装置28に入力された音声の周波数を示す情報と、第1マイク装置28に入力された音声に含まれる言葉を示す情報とを含み、制御装置36は、第1マイク装置28に入力された音声の周波数を示す情報および第1マイク装置28に入力された音声に含まれる言葉を示す情報に基づいて話者を推定し、所定の話者が音声を発しているときに、所定の話者が音声を発していないときよりもマスキング音が大きくなるように、第1スピーカ装置20を制御する。
 これによれば、秘密情報を含む音声を発しやすい人が音声を発しているときにだけマスキング音の音量を大きくしやすくなるので、マスキング音が遠隔会議の妨げになることを抑制しつつ、遠隔会議における音声が遠隔会議をしていない人に聞こえることをさらに抑制できる。これによって、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、実施の形態に係る会議システム10において、取得装置26は、所定の場所に存在している遠隔会議をしていない人を検知するセンサ装置30を備え、存否情報は、センサ装置30の検知情報を含み、制御装置36は、センサ装置30が遠隔会議をしていない人を検知しているときに、センサ装置30が遠隔会議をしていない人を検知していないときよりもマスキング音の音量が大きくなるように、第1スピーカ装置20を制御する。
 これによれば、遠隔会議における音声が聞こえやすい場所に遠隔会議をしていない人がいるときにだけマスキング音の音量を大きくしやすくなるので、マスキング音が遠隔会議の妨げになることを抑制しつつ、遠隔会議における音声が遠隔会議をしていない人に聞こえることをさらに抑制できる。これによって、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、実施の形態に係る会議システム10において、第1スピーカ装置20および第2スピーカ装置24は、指向性スピーカである。
 これによれば、マスキング音が遠隔会議の妨げになることを抑制しつつ、第2スピーカ装置24から出力される遠隔会議の相手方の音声が遠隔会議をしていない人に聞こえることをさらに抑制できる。これによって、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、実施の形態に係る会議システム10において、マスキング音は、さらに、空間1の外部で発生した音を会議をしている人に聞こえにくくするようにマスキングする。
 これによれば、空間1の外部で発生した音が遠隔会議をしている人に聞こえることを抑制できるので、空間1の外部で発生した音が遠隔会議の妨げになることを抑制でき、遠隔会議をさらに効率よく進めることができる。
 (他の実施の形態等)
 以上、実施の形態について説明したが、本発明は、上記の実施の形態に限定されるものではない。
 図9は、他の実施の形態に係る会議システム10aを示す図である。図9に示すように、会議システム10aは、第1スピーカ装置20とは異なる第1スピーカ装置20aを備えている。第1スピーカ装置20aは、中央に吸音材38を有しており、第1スピーカ装置20aから出力された音声が下方に向かって環状(ドーナツ状)に広がるように構成されている(図9の破線参照)。これによって、遠隔会議をしている人にマスキング音が聞こえることを抑制しつつ、遠隔会議における音声が遠隔会議をしていない人に聞こえることを抑制できるので、秘密情報をさらに漏れにくくできるとともに、遠隔会議をさらに効率よく進めることができる。
 また、上記の実施の形態では、遠隔会議が行われる空間1が、建物の内部のオープンな空間1である場合について説明したが、これに限定されない。図10は、遠隔会議が行われる空間の他の例を示す図である。たとえば、図10に示すように、遠隔会議が行われる空間は、新幹線等の車両の内部のオープンな空間2であってもよい。この場合、たとえば、遠隔会議における音声を遠隔会議をしていない人に聞こえにくくするようにマスキングするマスキング音を出力する第1スピーカ装置は、座席と座席との間に設置される。また、たとえば、遠隔会議が行われる空間は、屋外のオープンな空間であってもよい。
 また、遠隔会議をしている人が、ボリュームコントローラ等を用いて、マスキング音の音量等を調整してもよい。
 また、上記の実施の形態において、会議システムは、複数の装置によって実現されたが、単一の装置として実現されてもよい。たとえば、会議システムは、制御装置または第1スピーカ装置に相当する単一の装置として実現されてもよい。会議システムが複数の装置によって実現される場合、会議システムが備える構成要素(特に、機能的な構成要素)は、複数の装置にどのように振り分けられてもよい。
 また、上記の実施の形態における情報の伝達経路については一例であり、特に限定されるものではない。上記実施の形態において2つの装置が通信により情報の送受信を行う場合、2つの装置間には図示されない中継装置が介在してもよい。
 また、上記の実施の形態において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、複数の処理の順序が変更されてもよいし、複数の処理が並行して実行されてもよい。
 また、上記の実施の形態において、各構成要素は、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサ等のプログラム実行部が、ハードディスクまたは半導体メモリ等の記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
 また、各構成要素は、ハードウェアによって実現されてもよい。たとえば、各構成要素は、回路(または集積回路)でもよい。これらの回路は、全体として1つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。
 また、本発明の全般的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROM等の記録媒体で実現されてもよい。また、本発明の全般的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
 たとえば、本発明は、会議システム等のコンピュータによって実行される方法として実現されてもよいし、このような方法をコンピュータに実行させるためのプログラムとして実現されてもよい。本発明は、このようなプログラムが記録されたコンピュータ読み取り可能な非一時的な記録媒体として実現されてもよい。
 その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、または、本発明の趣旨を逸脱しない範囲で各実施の形態における構成要素および機能を任意に組み合わせることで実現される形態も本発明に含まれる。
 10,10a   会議システム
 20,20a   第1スピーカ装置
 22   会議装置
 24   第2スピーカ装置
 26   取得装置
 28   第1マイク装置
 30   センサ装置
 32   第2マイク装置
 36   制御装置

Claims (10)

  1.  遠隔会議における音声を前記遠隔会議をしていない人に聞こえにくくするようにマスキングするマスキング音を出力する第1スピーカ装置と、
     前記遠隔会議を行うための会議装置と、
     前記遠隔会議の相手方の音声を出力する第2スピーカ装置と、
     前記遠隔会議に関する会議情報および所定の場所に前記遠隔会議をしていない人が存在しているか否かを示す存否情報の少なくとも一方を取得するための取得装置と、
     前記会議情報および前記存否情報の少なくとも一方に基づいて前記第1スピーカ装置を制御する制御装置とを備える、
     会議システム。
  2.  前記取得装置は、前記遠隔会議における音声が入力される第1マイク装置を有し、
     前記会議情報は、前記第1マイク装置に入力された音声に関する音声情報を含み、
     前記制御装置は、前記音声情報に基づいて前記第1スピーカ装置を制御する、
     請求項1に記載の会議システム。
  3.  前記音声情報は、前記第1マイク装置に入力された音声の音圧を示す情報を含み、
     前記制御装置は、前記音圧が所定の閾値よりも大きいときに、前記音圧が前記所定の閾値以下のときよりも前記マスキング音の音量が大きくなるように、前記第1スピーカ装置を制御する、
     請求項2に記載の会議システム。
  4.  前記音声情報は、前記第1マイク装置に入力された音声の周波数を示す情報を含み、
     前記制御装置は、当該周波数に応じて前記マスキング音の周波数が変化するように、前記第1スピーカ装置を制御する、
     請求項2または3に記載の会議システム。
  5.  前記遠隔会議が行われる空間の外部で発生した音が入力される第2マイク装置をさらに備え、
     前記制御装置は、前記第1マイク装置に入力された音声の周波数および前記第2マイク装置に入力された音の周波数に応じて前記マスキング音の周波数が変化するように、前記第1スピーカ装置を制御する、
     請求項4に記載の会議システム。
  6.  前記音声情報は、前記第1マイク装置に入力された音声に含まれる言葉を示す情報を含み、
     前記制御装置は、前記第1マイク装置に入力された音声に所定の言葉が含まれている場合、前記マスキング音の音量が増大するように、前記第1スピーカ装置を制御する、
     請求項2から5のいずれか1項に記載の会議システム。
  7.  前記音声情報は、前記第1マイク装置に入力された音声の周波数を示す情報と、前記第1マイク装置に入力された音声に含まれる言葉を示す情報とを含み、
     前記制御装置は、前記第1マイク装置に入力された音声の周波数を示す情報および前記第1マイク装置に入力された音声に含まれる言葉を示す情報に基づいて話者を推定し、所定の話者が音声を発しているときに、前記所定の話者が音声を発していないときよりも前記マスキング音が大きくなるように、前記第1スピーカ装置を制御する、
     請求項2から6のいずれか1項に記載の会議システム。
  8.  前記取得装置は、前記所定の場所に存在している前記遠隔会議をしていない人を検知するセンサ装置を備え、
     前記存否情報は、前記センサ装置の検知情報を含み、
     前記制御装置は、前記センサ装置が前記遠隔会議をしていない人を検知しているときに、前記センサ装置が前記遠隔会議をしていない人を検知していないときよりも前記マスキング音の音量が大きくなるように、前記第1スピーカ装置を制御する、
     請求項1から7のいずれか1項に記載の会議システム。
  9.  前記第1スピーカ装置および前記第2スピーカ装置は、指向性スピーカ装置である、
     請求項1から8のいずれか1項に記載の会議システム。
  10.  前記マスキング音は、さらに、前記遠隔会議が行われる空間の外部で発生した音を前記遠隔会議をしている人に聞こえにくくするようにマスキングする、
     請求項1から9のいずれか1項に記載の会議システム。
PCT/JP2021/047258 2021-02-24 2021-12-21 会議システム WO2022181013A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023502103A JPWO2022181013A1 (ja) 2021-02-24 2021-12-21

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021027903 2021-02-24
JP2021-027903 2021-02-24

Publications (1)

Publication Number Publication Date
WO2022181013A1 true WO2022181013A1 (ja) 2022-09-01

Family

ID=83047987

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/047258 WO2022181013A1 (ja) 2021-02-24 2021-12-21 会議システム

Country Status (2)

Country Link
JP (1) JPWO2022181013A1 (ja)
WO (1) WO2022181013A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024084854A1 (ja) * 2022-10-17 2024-04-25 パナソニックIpマネジメント株式会社 音調整方法、音調整装置、音調整システム及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040125922A1 (en) * 2002-09-12 2004-07-01 Specht Jeffrey L. Communications device with sound masking system
JP2010091777A (ja) * 2008-10-08 2010-04-22 Yamaha Corp 防音システム及び防音制御システム
JP2014130251A (ja) * 2012-12-28 2014-07-10 Glory Ltd 会話保護システム及び会話保護方法
JP2014206683A (ja) * 2013-04-15 2014-10-30 株式会社ニコン 消音装置および消音方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040125922A1 (en) * 2002-09-12 2004-07-01 Specht Jeffrey L. Communications device with sound masking system
JP2010091777A (ja) * 2008-10-08 2010-04-22 Yamaha Corp 防音システム及び防音制御システム
JP2014130251A (ja) * 2012-12-28 2014-07-10 Glory Ltd 会話保護システム及び会話保護方法
JP2014206683A (ja) * 2013-04-15 2014-10-30 株式会社ニコン 消音装置および消音方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024084854A1 (ja) * 2022-10-17 2024-04-25 パナソニックIpマネジメント株式会社 音調整方法、音調整装置、音調整システム及びプログラム

Also Published As

Publication number Publication date
JPWO2022181013A1 (ja) 2022-09-01

Similar Documents

Publication Publication Date Title
KR102639491B1 (ko) 개인화된 실시간 오디오 프로세싱
US20180048768A1 (en) Nearby Talker Obscuring, Duplicate Dialogue Amelioration and Automatic Muting of Acoustically Proximate Participants
EP3081011B1 (en) Name-sensitive listening device
JP5581329B2 (ja) 会話検出装置、補聴器及び会話検出方法
JP2018506080A (ja) 音声マスキング・ゾーンにおいて再生された音声をマスキングする音声再生装置
CN114080589A (zh) 自动主动降噪(anr)控制以改善用户交互
JP5862585B2 (ja) コミュニケーションシステム及びロボット
US20190138603A1 (en) Coordinating Translation Request Metadata between Devices
JP2006238254A (ja) 拡声システム
US10771631B2 (en) State-based endpoint conference interaction
JP2013232891A (ja) マイクロホン・アレイによる不所望のノイズの自動マイクロホンミュート
JP2019523583A (ja) メディア補償されたパススルーおよびモード切り換え
US20230115674A1 (en) Multi-source audio processing systems and methods
WO2022181013A1 (ja) 会議システム
US11455980B2 (en) Vehicle and controlling method of vehicle
JP2010506525A (ja) 補聴器の駆動方法および補聴器
Tomassi et al. Effects of sidetone amplification on vocal function during telecommunication
JP6874437B2 (ja) コミュニケーションロボット、プログラム及びシステム
WO2018193826A1 (ja) 情報処理装置、情報処理方法、音声出力装置、および音声出力方法
JP2010506526A (ja) 補聴器の動作方法、および補聴器
JP2006211156A (ja) 音響装置
JP7065964B2 (ja) 音場制御装置および音場制御方法
JPH07162989A (ja) 音声信号選択処理装置
JP2007096555A (ja) 音声会議システム、端末装置及びそれに用いる話者優先レベル制御方法並びにそのプログラム
EP4184507A1 (en) Headset apparatus, teleconference system, user device and teleconferencing method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21928106

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2023502103

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21928106

Country of ref document: EP

Kind code of ref document: A1