JP5594152B2 - NAM conversation support system and NAM conversation support method - Google Patents

NAM conversation support system and NAM conversation support method Download PDF

Info

Publication number
JP5594152B2
JP5594152B2 JP2011003302A JP2011003302A JP5594152B2 JP 5594152 B2 JP5594152 B2 JP 5594152B2 JP 2011003302 A JP2011003302 A JP 2011003302A JP 2011003302 A JP2011003302 A JP 2011003302A JP 5594152 B2 JP5594152 B2 JP 5594152B2
Authority
JP
Japan
Prior art keywords
nam
speaker
conversation
fundamental frequency
assigned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011003302A
Other languages
Japanese (ja)
Other versions
JP2012147196A (en
Inventor
政博 原
一穂 前田
義典 柳沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011003302A priority Critical patent/JP5594152B2/en
Publication of JP2012147196A publication Critical patent/JP2012147196A/en
Application granted granted Critical
Publication of JP5594152B2 publication Critical patent/JP5594152B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援するNAM会話支援システムおよびNAM会話支援方法に関する。   The present invention relates to a NAM conversation support system and a NAM conversation support method for supporting NAM conversation by a plurality of persons using NAM (Non Audible Murmur).

現在、NAMを用いた会話システムが色々研究されている。NAMとは、非可聴のつぶやきであって、半径1m以内の他人にも聴き取られない無声音声である。NAMは、例えば、呼吸の呼気を利用して行われる。無声音声とは、言語音を調音する際、肺からの呼気が喉頭を通る時に喉頭上部にある声帯を震動させずそのまま通り抜けて出る音である。   Various conversation systems using NAM are currently being researched. NAM is a non-audible tweet, and is unvoiced speech that cannot be heard by others within a radius of 1 m. The NAM is performed using, for example, breathing exhalation. Unvoiced speech is a sound that passes through the vocal cords located above the larynx without shaking when exhalation from the lungs passes through the larynx when adjusting speech.

例えば、NAMによる音声として、声帯の規則振動を伴わず、ごく少量の呼吸量を伴って発言者の肉などの体内軟部組織を伝導する振動音を採取するマイクロフォンと、このマクロフォンを用いたコミュニケーションインターフェースシステムが知られている。
NAMを用いた音声では、上述したように声帯を使用しない無声音であるため、有声音において通常用いるフォルトマンを用いて発言者を識別することは難しい。したがって、NAMを用いたコミュニケーションシステムでは、複数人の発言者がいる場合、発言者を視覚以外で識別しにくい。
For example, as a voice by NAM, a microphone that collects a vibration sound that is not accompanied by a regular vibration of the vocal cords and is accompanied by a very small amount of respiration and that is conducted through a soft tissue of the body such as a speaker's meat, and a communication using this microphone Interface systems are known.
Since the voice using NAM is an unvoiced sound that does not use a vocal cord as described above, it is difficult to identify a speaker using a faultman that is usually used for voiced sound. Therefore, in the communication system using the NAM, when there are a plurality of speakers, it is difficult to identify the speakers other than visually.

一方、複数のユーザが同時に発言を行っているときであっても、発言を行っているユーザと発言を行っていないユーザを容易に特定することができる通信システムが知られている。当該通信システムは、発言者を識別する識別情報を含む制御情報を用いて発言者と非発言者を特定し、それぞれの発言者、非発言者に関する情報を異なる形式で表示させるディスプレイを有する。   On the other hand, there is known a communication system that can easily identify a user who is speaking and a user who is not speaking even when a plurality of users are speaking at the same time. The communication system includes a display that specifies a speaker and a non-speaker using control information including identification information for identifying a speaker and displays information related to each speaker and non-speaker in different formats.

WO2004/021738 A1WO2004 / 021738 A1 特開2007−288255号公報JP 2007-288255 A

上記NAMを用いたコミュニケーションシステムでは、3人以上でNAMによる会話を行い、2人以上が発言をする場合、聴き手であるNAM会話参加者は、発言者同士がお互いに近くにいる場合、お互いに顔を見合すことができるため、誰が発言者であるかを識別することができる。お互いに近くにいない、例えば100m程度離れている場合、NAMの無声音声だけでは誰が発生しているのか識別できない。
一方、上記通信システムを利用する場合、発言者、非発言者に関する情報を異なる形式で表示させるディスプレイを設けるので、上記通信システムを複数人のNAM会話参加者がどこでも気軽に利用することは難しい。
In the above communication system using NAM, when three or more people have a conversation with NAM and two or more people speak, NAM conversation participants who are listeners can talk to each other when the speakers are close to each other. Since the faces can be matched, it is possible to identify who is the speaker. If they are not close to each other, for example, about 100 m away, it is impossible to identify who is generating only by the NAM unvoiced speech.
On the other hand, when the communication system is used, since a display for displaying information on speakers and non-speakers in different formats is provided, it is difficult for a plurality of NAM conversation participants to easily use the communication system anywhere.

そこで、本発明は、NAMを用いた複数人によるNAM会話を支援する際、各NAM会話参加者がNAM発言者によるNAMの会話を聴くことによりNAM発言者を容易に識別することができるNAM会話支援システムおよびNAM会話支援方法を提供することを目的とする。   Therefore, according to the present invention, when supporting NAM conversation by a plurality of persons using NAM, each NAM conversation participant can easily identify the NAM speaker by listening to the NAM conversation by the NAM speaker. An object is to provide a support system and a NAM conversation support method.

本発明の一態様は、NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援するNAM会話支援システムである。当該システムは、
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを取得する計測部と、各NAM会話参加者がNAM会話に用いる音声入出力デバイスと、前記位置情報と前記向きの情報の通信およびNAM会話中の音声信号の通信を行う通信部と、を備える各NAM会話参加者が保持する携帯端末装置と、
前記携帯端末装置から受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、前記割り当て方位と前記割り当て基本周波数とに基いて前記携帯端末装置から受信したNAMの無声音声信号を処理する信号処理部と、処理した前記無声音声信号を前記携帯端末装置に送信する通信部と、を備える会話管理装置と、を有する。
このとき、前記信号処理部は、前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、予め設定された複数の分割方位と予め設定された複数の分割周波数を組とした複数のブロックから、別のNAM発言者と重複したブロックが割り当てられないように前記NAM発言者に1つのブロックを割り当てる。
あるいは、前記信号処理部は、前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、前記NAM発言者の前記現在の方位と前記NAM発言者の音声基本周波数を用いて1つのブロックを前記NAM発言者に割り当てる。
あるいは、前記信号処理部は、各NAM会話参加者から見て所定の距離範囲内に位置するNAM発言者に対して、当該NAM発言者の前記現在の方位と前記音声基本周波数を前記割り当て方位および前記割り当て基本周波数として設定する。
One aspect of the present invention is a NAM conversation support system that supports NAM conversation by a plurality of persons using NAM (Non Audible Murmur). The system
A measurement unit that acquires position information indicating the current position of each NAM conversation participant and information on a direction in which each NAM conversation participant is currently facing; a voice input / output device that each NAM conversation participant uses for NAM conversation; A mobile terminal device held by each NAM conversation participant, comprising: a communication unit that performs communication of the position information and the orientation information and communication of an audio signal during NAM conversation;
Based on the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker as seen from each NAM conversation participant specified using the position information and the orientation information received from the mobile terminal device, The NAM speaker's assigned direction and the NAM speaker's assigned fundamental frequency for each NAM conversation participant are determined, and the NAM silent voice signal received from the portable terminal device based on the assigned direction and the assigned fundamental frequency A conversation management device comprising: a signal processing unit for processing; and a communication unit for transmitting the processed silent voice signal to the portable terminal device.
At this time, when the signal processing unit determines the allocation direction and the allocation fundamental frequency for the NAM speaker, a plurality of blocks each having a plurality of preset division directions and a plurality of preset division frequencies as a set. Therefore, one block is allocated to the NAM speaker so that a block overlapping with another NAM speaker is not allocated.
Alternatively, when the signal processing unit determines the assigned direction and the assigned fundamental frequency for the NAM speaker, the signal processing unit uses the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker to create one block. Assign to the NAM speaker.
Alternatively, the signal processing unit, for NAM speakers located within a predetermined distance range when viewed from each NAM conversation participant, assigns the current orientation of the NAM speaker and the voice fundamental frequency to the assigned orientation and Set as the assigned fundamental frequency.

本発明の他の一態様は、NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援する会話管理装置が行うNAM会話支援方法である。当該方法では、
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを各NAM会話参加者が保持する携帯端末装置から受信し、
受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、
前記割り当て方位と前記割り当て基本周波数とに基いてNAMの無声音声信号を処理し、処理した前記無声音声信号を各NAM会話参加者に送信する。
前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定めるとき、予め設定された複数の分割方位と予め設定された複数の分割周波数を組とした複数のブロックから、別のNAM発言者と重複したブロックが割り当てられないように前記NAM発言者に1つのブロックを割り当てる。あるいは、前記NAM発言者の前記現在の方位と前記NAM発言者の音声基本周波数を用いて1つのブロックを前記NAM発言者に割り当てる。あるいは、各NAM会話参加者から見て所定の距離範囲内に位置するNAM発言者に対して、当該NAM発言者の前記現在の方位と前記音声基本周波数を前記割り当て方位および前記割り当て基本周波数として設定する。
Another aspect of the present invention is a NAM conversation support method performed by a conversation management device that supports NAM conversation by a plurality of persons using NAM (Non Audible Murmur). In this method,
Receiving position information indicating the current position of each NAM conversation participant and information on the direction in which each NAM conversation participant is currently facing from a mobile terminal device held by each NAM conversation participant;
Each NAM conversation participant is based on the current direction of the NAM speaker and the voice fundamental frequency of the NAM speaker as viewed from each NAM conversation participant identified using the received position information and the orientation information. Defining the NAM speaker's allocation direction and the NAM speaker's allocation fundamental frequency for
A NAM unvoiced voice signal is processed based on the assigned direction and the assigned fundamental frequency, and the processed unvoiced voice signal is transmitted to each NAM conversation participant.
When determining the allocation direction of the NAM speaker and the allocation fundamental frequency of the NAM speaker, another NAM message is determined from a plurality of blocks each having a set of a plurality of preset division directions and a plurality of preset division frequencies. One block is allocated to the NAM speaker so that a block overlapping with the speaker is not allocated. Alternatively, a block is assigned to the NAM speaker using the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker. Alternatively, for a NAM speaker located within a predetermined distance range when viewed from each NAM conversation participant, the current direction and the voice fundamental frequency of the NAM speaker are set as the assigned direction and the assigned fundamental frequency. To do.

上述の態様のNAM会話支援システムおよびNAM会話支援方法は、NAMを用いた複数人によるNAM会話を支援する際、各NAM会話参加者がNAM発言者によるNAMの会話を聴くことによりNAM発言者を容易に識別することができる。   In the NAM conversation support system and the NAM conversation support method according to the above-described aspect, when supporting a NAM conversation by a plurality of persons using the NAM, each NAM conversation participant listens to the NAM conversation by the NAM speaker, thereby It can be easily identified.

本実施形態のNAM会話支援システムの全体概要を説明する図である。It is a figure explaining the whole outline of the NAM conversation support system of this embodiment. 本実施形態における携帯端末装置とNAM管理サーバの構成を示す図である。It is a figure which shows the structure of the portable terminal device and NAM management server in this embodiment. 図2に示すNAM会話管理サーバの周波数・方位割り当て部が行う方位と基本周波数の割り当ての一例を説明する図である。It is a figure explaining an example of allocation of the azimuth | direction and fundamental frequency which the frequency and azimuth | direction allocation part of the NAM conversation management server shown in FIG. 2 performs. 図2に示すNAM会話管理サーバの周波数・方位割り当て部が行う方位と基本周波数の割り当ての他の例を説明する図である。It is a figure explaining the other example of allocation of the azimuth | direction and fundamental frequency which the frequency and azimuth | direction allocation part of the NAM conversation management server shown in FIG. 2 performs. 図2に示すNAM会話管理サーバの周波数・方位割り当て部が行う方位と基本周波数の割り当ての他の例を説明する図である。It is a figure explaining the other example of allocation of the azimuth | direction and fundamental frequency which the frequency and azimuth | direction allocation part of the NAM conversation management server shown in FIG. 2 performs. 図2に示すNAM会話管理サーバの周波数・方位割り当て部が行う方位と基本周波数の割り当ての他の例を説明する図である。It is a figure explaining the other example of allocation of the azimuth | direction and fundamental frequency which the frequency and azimuth | direction allocation part of the NAM conversation management server shown in FIG. 2 performs. 本実施形態のNAM会話支援システムを用いたNAM会話中に、NAM発言者がNAM会話参加者に近づく状態を説明する図である。It is a figure explaining the state where a NAM speaker approaches a NAM conversation participant during NAM conversation using the NAM conversation support system of this embodiment. 本実施形態のNAM会話支援システムを用いたNAM会話中に、NAM発言者がNAM会話参加者の周りを移動する状態を説明する図である。It is a figure explaining the state where a NAM speaker moves around a NAM conversation participant during NAM conversation using the NAM conversation support system of this embodiment. 本実施形態における割り当て基本周波数および割り当て方位の設定の一例のフローを示す図である。It is a figure which shows the flow of an example of the setting of the allocation fundamental frequency and allocation direction in this embodiment. 本実施形態における割り当て基本周波数および割り当て方位の設定の他の例のフローを示す図である。It is a figure which shows the flow of the other example of the setting of the allocation fundamental frequency and allocation direction in this embodiment. 本実施形態における割り当て基本周波数および割り当て方位の設定のさらに他の例のフローを示す図である。It is a figure which shows the flow of the further another example of the setting of the allocation fundamental frequency and allocation direction in this embodiment.

以下、本発明のNAM会話支援システムおよびNAM会話支援方法について説明する。
図1は、本実施形態のNAM会話支援システム10の全体概要を説明する図である。
Hereinafter, the NAM conversation support system and NAM conversation support method of the present invention will be described.
FIG. 1 is a diagram illustrating an overall outline of a NAM conversation support system 10 of the present embodiment.

(NAM会話支援システム)
図1に示すNAM会話支援システム10は、NAM会話参加者A〜Eがばらばらの向きを向いてNAM会話をする場合の例を示している。NAM会話参加者A〜Eのいずれも、NAMで発言すればNAM発言者となり得る。
NAM会話参加者A〜Eは、携帯端末装置12a〜12eを携帯する。各携帯端末装置12a〜12eは、音声入出力デバイスとして、マイクおよびヘッドフォンを一体化したヘッドセットを有し、NAM会話参加者A〜Eは上記ヘッドセットを装着する。携帯端末装置12a〜12eは、各NAM会話参加者A〜Eの現在の位置を示す位置情報と各NAM会話参加者A〜Eが現在向いている向きの情報とをセンサにより取得し、NAM会話管理サーバ14に送信する。NAM会話管理サーバ14は、各NAM会話参加者A〜Eから見たNAM発言者の現在の方位を、受信した位置情報と向きの情報を用いて特定し、特定したNAM発言者の現在の方位とNAM発言者の音声基本周波数とに基いて、割り当て方位と割り当て基本周波数を定める。この割り当て方位および割り当て基本周波数を用いて、NAM発言者の無声音声信号を処理して、各NAM会話参加者A〜Eに送信する。携帯端末装置12a〜12eおよびNAM会話管理サーバ14は、音声信号としてステレオ信号等の多チャンネル信号を用いる。
(NAM conversation support system)
The NAM conversation support system 10 shown in FIG. 1 shows an example in which NAM conversation participants A to E face NAM conversations in different directions. Any of the NAM conversation participants A to E can become a NAM speaker if he / she speaks at the NAM.
The NAM conversation participants A to E carry the portable terminal devices 12a to 12e. Each of the mobile terminal devices 12a to 12e has a headset in which a microphone and headphones are integrated as a voice input / output device, and the NAM conversation participants A to E wear the headset. The portable terminal devices 12a to 12e acquire position information indicating the current positions of the NAM conversation participants A to E and information on the direction in which the NAM conversation participants A to E are currently facing by using sensors, and perform NAM conversation. It transmits to the management server 14. The NAM conversation management server 14 identifies the current direction of the NAM speaker viewed from each of the NAM conversation participants A to E using the received position information and direction information, and identifies the current direction of the identified NAM speaker. And an allocation fundamental frequency based on the voice fundamental frequency of the NAM speaker. Using the assigned direction and the assigned fundamental frequency, the NAM speaker's silent voice signal is processed and transmitted to each NAM conversation participant A to E. The portable terminal devices 12a to 12e and the NAM conversation management server 14 use multi-channel signals such as stereo signals as audio signals.

このため、NAM会話において、識別が困難な無声音声であっても、割り当て基本周波数に合わせて無声音声の基本周波数を変換処理し、かつ、多チャンネル信号である無声音声信号を割り当て方位に合わせて信号処理するので、各NAM会話参加者A〜Eは、無声音声の基本周波数とNAM発言者のNAMの聞こえる方位から、NAM発言者を識別することができる。以下、携帯端末装置12a〜12eおよびNAM会話管理サーバ14について説明する。   For this reason, even in the case of unvoiced speech that is difficult to identify in NAM conversation, the fundamental frequency of the unvoiced speech is converted in accordance with the assigned fundamental frequency, and the unvoiced speech signal that is a multi-channel signal is matched to the assigned direction. Since the signal processing is performed, each of the NAM conversation participants A to E can identify the NAM speaker from the fundamental frequency of the unvoiced speech and the direction in which the NAM speaker can hear the NAM. Hereinafter, the mobile terminal devices 12a to 12e and the NAM conversation management server 14 will be described.

(携帯端末装置)
図2は、携帯端末装置12aとNAM管理サーバ14の構成を示す図である。携帯端末装置12a〜12eはいずれも同じ構造を有するので、以降、携帯端末装置12aを携帯端末装置12a〜12eの代表として説明する。また、携帯端末装置12a〜12eを総称して説明するとき、携帯端末装置12と称する。
携帯端末装置12は、音声入出力デバイスであるヘッドセット16と、計測部18と、Lombard検出部20と、通信部22と、を有する。
ヘッドセット16は、スピーカを通してNAM会話を聴くことができるヘッドフォン16aと、NAMの無声音声を収音することができる無声音声用マイクおよび通常の有声音声を収音する有声音声用マイクを含むマイク16bを有する。
無声音声用マイクは、例えば、WO2004/021738 A1に記載されているマイクロフォンが例示される。具体的には、頭蓋骨の耳介の後下方部の乳様突起直下の体表に、聴診器型マイクが無声音声用マイクとして装着される。聴診器型マイクは、体表に粘着する粘着面を有する振動板と、この振動板に吸着盤を介して固定されたコンデンサマイクとを備える。
NAM発言者が声帯の規則振動を用いずにNAMを発するとき、NAMは、舌、口唇、顎、軟口蓋などの調音器官の発話運動により調音されるとともに肉等の体内軟部組織を伝導する振動音として乳様突起直下の体表に到達する。無声音声用マイクはこの振動音を収音する。
ヘッドフォン16aは、有声音声のほか、略100〜300Hz等の基本周波数を有するささやき音を再生する。
マイク16bで得られた有声音声信号、無声音声信号は、通信部22へ送られる。ヘッドフォン16aは、NAM管理サーバ14から送信されるNAM会話信号を音声化し再生する。
(Mobile terminal device)
FIG. 2 is a diagram showing the configuration of the mobile terminal device 12a and the NAM management server 14. Since all the portable terminal devices 12a to 12e have the same structure, the portable terminal device 12a will be described below as a representative of the portable terminal devices 12a to 12e. In addition, when the mobile terminal devices 12a to 12e are generically described, they are referred to as the mobile terminal device 12.
The mobile terminal device 12 includes a headset 16 that is a voice input / output device, a measurement unit 18, a Lombard detection unit 20, and a communication unit 22.
The headset 16 includes a headphone 16a capable of listening to NAM conversation through a speaker, a microphone 16b including a microphone for voiceless voice capable of collecting voiceless voice of the NAM and a voiced voice microphone capable of collecting normal voiced voice. Have
The microphone for silent voice is exemplified by a microphone described in WO2004 / 021738 A1, for example. Specifically, a stethoscope-type microphone is attached as a microphone for unvoiced speech on the body surface just below the mastoid process at the rear lower part of the auricle of the skull. The stethoscope-type microphone includes a diaphragm having an adhesive surface that adheres to the body surface, and a condenser microphone fixed to the diaphragm via a suction disk.
When a NAM speaker utters a NAM without using the regular vibration of the vocal cords, the NAM is tuned by the speech movement of the articulatory organs such as the tongue, lips, chin, and soft palate and also vibrates in the body's soft tissue such as meat. As it reaches the body surface just below the mastoid process. The microphone for silent voice picks up this vibration sound.
The headphone 16a reproduces a whisper sound having a fundamental frequency such as approximately 100 to 300 Hz in addition to voiced sound.
The voiced voice signal and the voiceless voice signal obtained by the microphone 16 b are sent to the communication unit 22. The headphone 16 a converts the NAM conversation signal transmitted from the NAM management server 14 into sound and reproduces it.

計測部18は、各NAM会話参加者A〜Eの現在の位置を示す位置情報を取得するGPS(Global Positioning System)位置センサ18aと、各NAM会話参加者A〜Eが現在向いている向きの情報を取得する方位センサ18bを有する。計測部18で得られた位置情報および向きの情報は、通信部22へ送られ、NAM管理サーバ14へ送信される。
各NAM会話参加者A〜Eの位置情報および向きの情報をNAM管理サーバ14に送信するのは、NAM管理サーバ14において、各NAM会話参加者A〜Eから見たNAM発言者の現在の方位を特定するためである。
The measurement unit 18 includes a GPS (Global Positioning System) position sensor 18a that acquires position information indicating the current position of each NAM conversation participant A to E, and a direction in which each NAM conversation participant A to E is currently facing. It has a direction sensor 18b for acquiring information. The position information and orientation information obtained by the measurement unit 18 are sent to the communication unit 22 and transmitted to the NAM management server 14.
The location information and orientation information of each NAM conversation participant A to E is transmitted to the NAM management server 14 in the NAM management server 14 in the current direction of the NAM speaker viewed from each NAM conversation participant A to E. This is because

Lombard検出部20は、マイク16bで発した音声に有声音声が含まれるか否かを検出する。Lombard検出部20は、例えば、有声音声に含まれるが無声音声に含まれない所定の周波数帯域(フォルマントに相当する周波数帯域)の音声信号のパワー値を調べることにより、NAM発言者の音声に有声音声が含まれるか否かを検出する。検出結果は、通信部22へ送られる。   The Lombard detection unit 20 detects whether or not voiced sound is included in the voice emitted from the microphone 16b. For example, the Lombard detection unit 20 is voiced to the voice of a NAM speaker by examining the power value of a voice signal in a predetermined frequency band (frequency band corresponding to formant) that is included in voiced voice but not included in unvoiced voice. Detect whether audio is included. The detection result is sent to the communication unit 22.

通信部22は、ヘッドセット16、計測部18、およびLombard検出部20から送られた信号や情報を無線通信により、NAM管理サーバ14に送信し、また、NAM管理サーバ14から送信された信号を受信する。図2は、通信部22を機能的に示している。すなわち、通信部22は、有声音声送信部22aと、NAM送信部22bと、Lombard送信部22cと、位置・方位送信部22dと、音声信号受信部22eと、を有する。   The communication unit 22 transmits signals and information transmitted from the headset 16, the measurement unit 18, and the Lombard detection unit 20 to the NAM management server 14 by wireless communication, and also transmits signals transmitted from the NAM management server 14. Receive. FIG. 2 functionally shows the communication unit 22. That is, the communication unit 22 includes a voiced voice transmission unit 22a, a NAM transmission unit 22b, a Lombard transmission unit 22c, a position / orientation transmission unit 22d, and a voice signal reception unit 22e.

有声音声送信部22aは、マイク16bの有声音声マイクで得られた有声音声信号を送信するように、送信信号を生成する。NAM送信部22bは、マイク16bの無声音声マイクで得られた無声音声信号を送信するように、送信信号を生成する。Lombard送信部22cは、Lombard検出部20で得られた検出結果の情報を送信するように、送信信号を生成する。位置・方位送信部22dは、計測部18で得られた情報を送信するように、送信信号を生成する。音声信号受信部22eは、NAM管理サーバ14から送信された送信信号を受信して、音声信号を生成する。通信部22は図示されない送信機および受信機を有する。図示されない送信機は、各送信部で生成された送信信号をNAM会話管理サーバ14に送信する。図示されない受信機はNAM会話管理サーバ14から送信された信号を受信する。   The voiced voice transmission unit 22a generates a transmission signal so as to transmit the voiced voice signal obtained by the voiced voice microphone of the microphone 16b. The NAM transmission unit 22b generates a transmission signal so as to transmit an unvoiced voice signal obtained by the unvoiced voice microphone of the microphone 16b. The Lombard transmission unit 22c generates a transmission signal so as to transmit information on the detection result obtained by the Lombard detection unit 20. The position / azimuth transmission unit 22d generates a transmission signal so as to transmit the information obtained by the measurement unit 18. The audio signal receiving unit 22e receives the transmission signal transmitted from the NAM management server 14 and generates an audio signal. The communication unit 22 includes a transmitter and a receiver not shown. A transmitter (not shown) transmits the transmission signal generated by each transmitter to the NAM conversation management server 14. A receiver (not shown) receives a signal transmitted from the NAM conversation management server 14.

(NAM会話管理サーバ)
NAM会話管理サーバ14は、携帯端末装置12から送信される各種情報および有声音声信号および無声音声信号を処理して、携帯端末装置12に送信する。
NAM会話管理サーバ14は、通信部30と、信号処理部32とを有する。NAM会話管理サーバ14は、図示されないCPU、RAM、ROM、記憶部を有するコンピュータであり、CPU、RAM、ROM、記憶部はバスでお互いに接続されている。
信号処理部32のうち、後述する基本周波数算出部32aと、周波数・方位割り当て部32cと、ささやき声変換部32dと、音声ミキシング部32eは、ROMあるいは記憶部に記憶されているプログラムを読み出して実行することにより生成されるソフトウェアモジュールである。すなわち、図示されないCPUが基本周波数算出部32a、周波数・方位割り当て部32c、ささやき声変換部32d、及び音声ミキシング部32eの各機能を担う。
通信部30は、有声音声受信部30aと、NAM受信部30bと、Lombard受信部30cと、位置・方位受信部30dと、音声信号送信部30eと、を有する。
(NAM conversation management server)
The NAM conversation management server 14 processes various information, voiced voice signals, and unvoiced voice signals transmitted from the mobile terminal device 12 and transmits them to the mobile terminal device 12.
The NAM conversation management server 14 includes a communication unit 30 and a signal processing unit 32. The NAM conversation management server 14 is a computer having a CPU, RAM, ROM, and storage unit (not shown), and the CPU, RAM, ROM, and storage unit are connected to each other via a bus.
Of the signal processing unit 32, a fundamental frequency calculation unit 32a, a frequency / orientation allocation unit 32c, a whispering voice conversion unit 32d, and a voice mixing unit 32e, which will be described later, read and execute programs stored in the ROM or the storage unit. It is a software module generated by doing. In other words, a CPU (not shown) has the functions of a fundamental frequency calculation unit 32a, a frequency / orientation assignment unit 32c, a whispering voice conversion unit 32d, and an audio mixing unit 32e.
The communication unit 30 includes a voiced voice receiving unit 30a, a NAM receiving unit 30b, a Lombard receiving unit 30c, a position / orientation receiving unit 30d, and a voice signal transmitting unit 30e.

有声音声受信部30aは、受信した送信信号から有声音声信号を取り出す。NAM受信部30bは、受信した送信信号から無声音声信号を取り出す。Lombard受信部30cは、Lombard検出部20で得られた検出結果の情報を送信信号から取り出す。位置・方位受信部30dは、送信信号から計測部18で得られた情報を取り出す。音声信号送信部30eは、各携帯端末装置12a〜12eから送信され、信号処理およびミキシングされた音声信号を各携帯端末装置12a〜12eに送信するように、送信信号を生成する。通信部30は図示されない送信機および受信機を有する。図示されない受信機は各携帯端末装置12a〜12eから送信された信号を受信する。図示されない送信機は、音声信号送信部30eで生成された送信信号を各携帯端末装置12a〜12eに送信する。   The voiced voice receiving unit 30a extracts a voiced voice signal from the received transmission signal. The NAM receiving unit 30b extracts a silent voice signal from the received transmission signal. The Lombard receiving unit 30c extracts information on the detection result obtained by the Lombard detecting unit 20 from the transmission signal. The position / orientation receiving unit 30d extracts information obtained by the measuring unit 18 from the transmission signal. The audio signal transmission unit 30e generates a transmission signal so as to transmit the audio signal transmitted from each of the mobile terminal devices 12a to 12e and subjected to signal processing and mixing to each of the mobile terminal devices 12a to 12e. The communication unit 30 includes a transmitter and a receiver not shown. A receiver (not shown) receives signals transmitted from the mobile terminal devices 12a to 12e. A transmitter (not shown) transmits the transmission signal generated by the audio signal transmission unit 30e to each of the mobile terminal devices 12a to 12e.

信号処理部32は、基本周波数算出部32aと、データベース32bと、周波数・方位割り当て部32cと、ささやき声変換部32dと、音声ミキシング部32eと、を有する。
基本周波数算出部32aは、有声音声受信部30aで生成される有声音声信号を周波数解析することにより、NAM発言者の音声の基本周波数を算出する。有声音声は、基本周波数と、倍音等の基本周波数に調和した周波数とを有する。有声音声の基本周波数は、NAMの無声音声の音声基本周波数とも一致する。すなわち、NAM発言者の有声音声を予め周波数解析をすることによりNAMの基本周波数を取得することができる。このため、基本周波数算出部32は、NAM会話に参加する各NAM会話参加者の音声の基本周波数、すなわち音声基本周波数を事前に算出し、この音声基本周波数をNAM発言時の音声基本周波数として、携帯端末装置12の識別情報と共にデータベース32bに記録する。なお、NAM会話管理サーバ14であるコンピュータの図示されない記憶部の一部がデータベース32bとして利用される。
The signal processing unit 32 includes a fundamental frequency calculation unit 32a, a database 32b, a frequency / orientation allocation unit 32c, a whispering voice conversion unit 32d, and an audio mixing unit 32e.
The fundamental frequency calculation unit 32a calculates the fundamental frequency of the voice of the NAM speaker by performing frequency analysis on the voiced speech signal generated by the voiced speech reception unit 30a. Voiced speech has a fundamental frequency and a frequency harmonized with a fundamental frequency such as overtones. The fundamental frequency of voiced speech matches the speech fundamental frequency of unvoiced speech of NAM. That is, the fundamental frequency of the NAM can be obtained by analyzing the frequency of the voice of the NAM speaker in advance. For this reason, the fundamental frequency calculation unit 32 calculates in advance the fundamental frequency of the voice of each NAM conversation participant participating in the NAM conversation, that is, the fundamental speech frequency, and this fundamental speech frequency is used as the fundamental speech frequency at the time of NAM speech. It records in the database 32b with the identification information of the portable terminal device 12. FIG. A part of the storage unit (not shown) of the computer that is the NAM conversation management server 14 is used as the database 32b.

周波数・方位割り当て部32cは、NAM受信部30cにおいてNAMの無声音声信号を受信すると、NAM発言者の音声基本周波数をデータベース32bから取り出す。このとき、さらに、周波数・方位割り当て部32cは、携帯端末装置12から受信した各NAM会話参加者A〜Eの位置情報と向きの情報を用いて各NAM会話参加者A〜Eから見たNAM発言者の現在の方位をそれぞれ特定する。周波数・方位割り当て部32cは、各NAM会話参加者A〜Eの位置情報と向きの情報を得ているので、各発言者の現在の方位を容易に特定することができる。また、周波数・方位割り当て部32cは、受信したNAMによる無声音声がどの携帯端末装置から送信されたものであるかわかるので、携帯端末装置の識別情報からデータベース32bに記録されている音声基本周波数を取り出すことができる。
このとき、NAM発言者に対して、後述する割り当て方位および割り当て基本周波数がすでに設定されており、さらに、割り当て方位および割り当て基本周波数が変更されない場合、以下の処理は行われず、ささやき声変換部32dおよび音声ミキシング部32eにおいて、設定されている割り当て方位および割り当て基本周波数がそのまま用いられる。一方、割り当て方位および割り当て基本周波数が設定されていない場合、あるいは、割り当て方位および割り当て基本周波数が変更される場合、周波数・方位割り当て部32cは、後述する割り当て方位および割り当て基本周波数の設定を行う。割り当て方位および割り当て基本周波数が設定されていない場合とは、NAM会話に参加して初めて発言した場合や、NAM会話に参加しているが、一定期間内の発言が少なく、割り当て方位および割り当て基本周波数が取り消された場合等であり、割り当て方位および割り当て基本周波数が変更される場合とは、NAM発言者あるいはNAM会話参加者がNAM会話中に移動して方位等が変化した場合である。
When the NAM receiving unit 30c receives the NAM silent voice signal, the frequency / orientation allocating unit 32c extracts the NAM speaker's voice fundamental frequency from the database 32b. At this time, the frequency / orientation allocating unit 32c further uses the position information and orientation information of each NAM conversation participant A to E received from the mobile terminal device 12 to view the NAM viewed from each NAM conversation participant A to E. Identify the current orientation of each speaker. Since the frequency / orientation allocating unit 32c obtains position information and orientation information of each NAM conversation participant A to E, the current direction of each speaker can be easily specified. Further, since the frequency / orientation allocating unit 32c knows from which mobile terminal device the unvoiced voice by the received NAM is transmitted, the voice basic frequency recorded in the database 32b is determined from the identification information of the mobile terminal device. It can be taken out.
At this time, if an allocation direction and an allocation fundamental frequency, which will be described later, are already set for the NAM speaker, and if the allocation direction and the allocation fundamental frequency are not changed, the following processing is not performed, and the whispering voice conversion unit 32d and In the audio mixing unit 32e, the assigned allocation direction and the assigned fundamental frequency are used as they are. On the other hand, when the allocation azimuth and the allocation fundamental frequency are not set, or when the allocation azimuth and the allocation fundamental frequency are changed, the frequency / azimuth allocation unit 32c sets the allocation azimuth and the allocation fundamental frequency described later. The case where the assigned direction and the assigned fundamental frequency are not set is a case where the user speaks for the first time after participating in the NAM conversation, or who participates in the NAM conversation, but there are few utterances within a certain period, and the assigned direction and assigned fundamental frequency. Is a case where the assigned orientation and the assigned fundamental frequency are changed, for example, when the NAM speaker or NAM conversation participant moves during the NAM conversation and the orientation changes.

周波数・方位割り当て部32cは、割り当て方位および割り当て基本周波数の設定を行う場合、あるいは、割り当て方位および割り当て基本周波数を変更する場合、周波数・方位割り当て部32cは、音声基本周波数と特定した現在の方位に基いて各NAM会話参加者に対するNAM発言者の割り当て方位とNAM発言者の割り当て基本周波数を定める。具体的には、周波数・方位割り当て部32cは、予め設定された数で360度の方位を分割した分割方位と、所定の周波数範囲、例えば100〜160Hzの範囲を予め設定された数で分割した分割周波数を組とした複数のブロックから、NAM発言者同士で重複したブロックが割り当てられないようにNAM発言者に1つのブロックを割り当てる。その際、NAM発言者の現在の方位とNAM発言者の音声基本周波数を用いてブロックをNAM発言者に割り当てる。上記割り当て方位および割り当て基本周波数の設定については後述する。   When setting the assigned direction and the assigned fundamental frequency, or when changing the assigned direction and the assigned fundamental frequency, the frequency / orientation assigning unit 32c determines the current direction identified as the voice fundamental frequency. The NAM speaker allocation direction and NAM speaker allocation fundamental frequency for each NAM conversation participant are determined based on the above. Specifically, the frequency / azimuth allocating unit 32c divides a divided azimuth obtained by dividing a 360 degree azimuth by a preset number and a predetermined frequency range, for example, a range of 100 to 160 Hz, by a preset number. One block is assigned to a NAM speaker so that a block overlapping between NAM speakers is not assigned from a plurality of blocks having a set of division frequencies. At that time, the block is allocated to the NAM speaker using the current direction of the NAM speaker and the voice fundamental frequency of the NAM speaker. The setting of the allocation direction and the allocation fundamental frequency will be described later.

ささやき声変換部32dは、割り当て基本周波数がNAMの音声基本周波数となるように音声信号の周波数を変換し、さらに、つぶやき声であるNAMがささやき声に相当する音声になるように信号レベルを増大する。音声信号の周波数の変換は、周知の変換処理が用いられる。変換処理として、例えば、河原等によるSTRAIGHT(河原他、信学技法、EA96−28、1996)が例示される。
音声ミキシング部32eは、周波数・方位割り当て部32cで定められたNAM発言者の割り当て方位を用いて、各NAM会話参加者からみて、NAMが視覚に略一致する方向から無声音声が聴こえるように、NAMの無声音声信号のミキシング処理を行う。音声信号は、ステレオ信号等の多チャンネル信号であるので、音声ミキシング部32eでは、各NAM会話参加者から見た割り当て方位に従って音声信号が処理される。さらに、音声ミキシング部32eでは、複数のNAM発言者が同時に発言するとき、複数の音声信号がミキシングされる。音声ミキシング部32eは、ミキシングされた音声信号を音声信号送信部30eに送る。
The whispering voice conversion unit 32d converts the frequency of the voice signal so that the assigned fundamental frequency becomes the NAM voice fundamental frequency, and further increases the signal level so that the NAM that is a whisper becomes voice equivalent to the whispering voice. A known conversion process is used to convert the frequency of the audio signal. Examples of the conversion processing include STRIGHT by Kawara et al. (Kawahara et al., Shingaku Techniques, EA 96-28, 1996).
The voice mixing unit 32e uses the NAM speaker's assigned orientation determined by the frequency / orientation assigning unit 32c so that the NAM can hear unvoiced speech from the direction in which the NAM substantially matches the vision as seen from each NAM conversation participant. Mixing processing of NAM silent voice signal. Since the audio signal is a multi-channel signal such as a stereo signal, the audio mixing unit 32e processes the audio signal according to the assigned direction as viewed from each NAM conversation participant. Furthermore, in the audio mixing unit 32e, when a plurality of NAM speakers speak at the same time, a plurality of audio signals are mixed. The audio mixing unit 32e sends the mixed audio signal to the audio signal transmission unit 30e.

NAM発言者はNAM会話中、場合によっては有声音声を発する。この場合、Lombard受信部30cはLombard検出部20で行われた検出結果の情報を得、この情報が音声ミキシング部32eに送られる。音声ミキシング部32eは、NAM発言者の音声が有声音声である旨の検出結果を得ると、NAMによる無声音声の会話を支援する無声音声モードから有声音声による会話を支援する有声音声モードに切り替わる。具体的には、音声ミキシング部32eは、NAM会話中の別の無声音声信号を遮断して、有声音声受信部30aから送られる有声音声信号を、音声信号送信部30eを通して各携帯端末装置12a〜12eに送信する。すなわち、あるNAM発言者の発言のときマイク16bが有声音声を収音したとき、NAM会話管理サーバ14は、NAM会話中の無声音声信号を遮断して、有声音声信号を、通信装置30を通して携帯端末装置12a〜12eに送信する。
有声音声モードは、NAM発言者が一定時間、例えば10秒間有声音声が検出されない場合、自動的に無声音声モードに戻る。
本実施形態のNAM会話支援システムは、NAM会話参加者が有声音声を発したとき、自動的に、無声音声モードから有声音声モードに切り替わるが、有声音声モードを有させず、無声音声モードのみで支援を行うものであってもよい。
A NAM speaker utters voiced speech in some cases during a NAM conversation. In this case, the Lombard receiving unit 30c obtains information on the detection result performed by the Lombard detecting unit 20, and this information is sent to the audio mixing unit 32e. When the voice mixing unit 32e obtains a detection result indicating that the voice of the NAM speaker is voiced voice, the voice mixing unit 32e switches from the voiceless voice mode supporting voiceless voice conversation by the NAM to the voiced voice mode supporting voiced voice conversation. Specifically, the voice mixing unit 32e blocks another unvoiced voice signal during the NAM conversation, and sends the voiced voice signal sent from the voiced voice reception unit 30a to each portable terminal device 12a to 12a through the voice signal transmission unit 30e. 12e. That is, when a microphone 16b picks up voiced speech when a certain NAM speaker speaks, the NAM conversation management server 14 cuts off the voiceless voice signal during the NAM conversation and carries the voiced voice signal through the communication device 30. It transmits to terminal device 12a-12e.
The voiced voice mode automatically returns to the voiceless voice mode when the NAM speaker does not detect voiced voice for a certain period of time, for example, 10 seconds.
The NAM conversation support system according to the present embodiment automatically switches from the voiceless voice mode to the voiced voice mode when the NAM conversation participant utters voiced voice, but does not have the voiced voice mode but only the voiceless voice mode. Support may be provided.

(周波数、方位の割り当て)
図3〜5は、上述した周波数・方位割り当て部32cが行う方位と基本周波数の割り当ての一例を説明する図である。
図3に示す例では、周波数・方位割り当て部32cは、360度の方位を8分割し、各NAM会話参加者A〜Eから見て北、北東、東、南東、南等に45度ずつの8つの分割方位を定める。また、周波数・方位割り当て部32cは、割り当て基本周波数として、100〜160Hzの周波数範囲を6分割し、150Hz以上、140〜150Hz、130〜140Hz、・・・、110Hz未満の6つの分割周波数の帯域を定める。図3は、NAM会話参加者が男性の場合の割り当ての例である。図4は、NAM会話参加者が女性の場合の分割方位と分割周波数の割り当ての例である。女性の場合、割り当て基本周波数は、220Hz未満、220〜230Hz、230〜240Hz、・・・、270Hz以上の7分割の分割周波数の帯域に設定されている。各NAM会話参加者に割り当て基本周波数を設定する場合、分割周波数として、各NAM会話参加者の基本周波数に±10Hz、±20Hz、…加算した値を割り当てる。例えば、NAM会話参加者の基本周波数が132Hzであり、割り当てようとする分割周波数は、140〜150Hzの帯域の周波数である場合、142Hzとする。また、150Hz以上や110Hz未満の帯域でも同様に152Hzや102Hzとする。方位においても例えば、NAM会話参加者の方位に±45°、±90°、…といった値を割り当て方位とする。
(Assignment of frequency and direction)
3 to 5 are diagrams for explaining an example of the direction and fundamental frequency assignment performed by the frequency / orientation assignment unit 32c described above.
In the example shown in FIG. 3, the frequency / orientation allocating unit 32c divides the 360 degree azimuth into eight parts, and each 45 degrees north, northeast, east, southeast, south, etc. as viewed from each NAM conversation participant A to E. Eight division directions are defined. In addition, the frequency / azimuth allocation unit 32c divides the frequency range of 100 to 160 Hz into six as the allocation fundamental frequency, and is a band of six division frequencies of 150 Hz or more, 140 to 150 Hz, 130 to 140 Hz, ..., less than 110 Hz. Determine. FIG. 3 is an example of assignment when the NAM conversation participant is a male. FIG. 4 is an example of assignment of division directions and division frequencies when the NAM conversation participant is a woman. In the case of a woman, the assigned fundamental frequency is set to a band of seven divided frequencies of less than 220 Hz, 220 to 230 Hz, 230 to 240 Hz,. When setting a basic frequency to be assigned to each NAM conversation participant, a value obtained by adding ± 10 Hz, ± 20 Hz,..., To the basic frequency of each NAM conversation participant is assigned as a divided frequency. For example, when the basic frequency of the NAM conversation participant is 132 Hz and the division frequency to be assigned is a frequency in a band of 140 to 150 Hz, it is 142 Hz. Similarly, in a band of 150 Hz or more and less than 110 Hz, the frequency is set to 152 Hz or 102 Hz. Also in the direction, for example, values such as ± 45 °, ± 90 °,...

周波数・方位割り当て部32cは、図3に示す例では、分割方位と分割周波数を組とした48個(=8個×6個)のブロックから、NAM発言者同士で重複したブロックが割り当てられないように各NAM発言者に1つのブロックを割り当てる。したがって、図3、図4に示す例では、割り当て方位が異なる条件で、同じ割り当て基本周波数を8人のNAM発言者に割り当てることができる。その際、各NAM発言者の現在の方位と各NAM発言者の音声基本周波数を用いてブロックを各NAM発言者に割り当てる。   In the example shown in FIG. 3, the frequency / orientation allocating unit 32 c does not allocate overlapping blocks among NAM speakers from 48 (= 8 × 6) blocks in which the division direction and the division frequency are set. Thus, one block is allocated to each NAM speaker. Therefore, in the example shown in FIGS. 3 and 4, the same assigned fundamental frequency can be assigned to eight NAM speakers under conditions where the assigned directions are different. In that case, a block is allocated to each NAM speaker using the current direction of each NAM speaker and the voice fundamental frequency of each NAM speaker.

図5は、図3に示す例を用いて割り当てを説明する図である。割り当てでは、割り当ての優先順位を用いて行われる。具体的には、周波数・方位割り当て部32cは、過去の一定時間、例えば過去3分間に発言した回数又は時間の多いNAM発言者の順に優先順位を定め、この優先順位に従って、NAM発言者に対して割り当て方位および割り当て基本周波数を定める。割り当ての優先順位の設定は、上記発言した回数又は時間によるものの他、NAM会話の開始前にNAM会話参加者の優先順位を打ち合わせにより定めてもよいし、NAM会話の開始直後にNAMで発言した順番に優先順位を定めてもよい。
図5に示す例では、140〜150Hzに1人、130〜140Hzに1人、120〜130Hzに2人、110〜120Hzに、8人割り当てられている状態が示されている。このような割り当ての情報は、NAM発言者にブロックを割り当てようとするとき、優先して調べられる。すなわち、NAM発言者にブロックを割り当てるとき、周波数・方位割り当て部32cは、図6に示すNAM発言者の音声基本周波数に対応する分割周波数の欄の「割り当て数」を調べ、「割り当て数」が8未満である場合、この分割周波数の欄の、NAM発言者の現在の方位に対応するブロックがすでに割り当てられているか否かを調べる。このブロックが割り当てられていなければ、このブロックを上記NAM発言者に割り当てる。一方、上記ブロックが別のNAM発言者にすでに割り当てられている場合、周波数・方位割り当て部32cは、割り当てられていない隣接ブロックを探す。
FIG. 5 is a diagram for explaining assignment using the example shown in FIG. Allocation is performed using the priority of allocation. Specifically, the frequency / orientation allocating unit 32c sets priorities in the order of NAM speakers having a large number of times or the number of times of speech in the past fixed time, for example, the past 3 minutes, and according to the priorities, To determine the assigned direction and assigned fundamental frequency. Prioritization of assignment may be determined by the number or time of the above-mentioned utterances, the priorities of the NAM conversation participants may be determined by a meeting before the start of the NAM conversation, or may be made by the NAM immediately after the start of the NAM conversation. Priorities may be set in order.
In the example shown in FIG. 5, one person is assigned to 140 to 150 Hz, one person is assigned to 130 to 140 Hz, two persons are assigned to 120 to 130 Hz, and eight persons are assigned to 110 to 120 Hz. Such allocation information is preferentially examined when attempting to allocate blocks to NAM speakers. That is, when allocating a block to a NAM speaker, the frequency / orientation allocating unit 32c examines the “number of allocations” in the division frequency column corresponding to the voice fundamental frequency of the NAM speaker shown in FIG. If it is less than 8, it is checked whether or not a block corresponding to the current direction of the NAM speaker is already allocated in the division frequency column. If this block is not assigned, it is assigned to the NAM speaker. On the other hand, when the block is already assigned to another NAM speaker, the frequency / orientation assigning unit 32c searches for an unassigned adjacent block.

例えば、120〜130Hzの範囲に音声基本周波数を有し、あるNAM会話参加者から見て南東の方位に現在位置するNAM発言者Aが発言して、図3に示すように、120〜130Hzの分割周波数と南東の分割方位のブロックXに割り当てられている状態を想定する。このとき、120〜130Hzの音声基本周波数を有し、NAM会話参加者から見て南東の方位に位置するNAM発言者Bが発言したとき、すでにブロックXにNAM発言者Aが割り当てられているので、周波数・方位割り当て部32cは、割り当てようとするブロックXの分割周波数または分割方位が隣接する隣接分割周波数または隣接分割方位を有する隣接ブロックY1〜Y4の中から割り当てる。NAM会話参加者は、NAM発言者の音声基本周波数でNAM発言者を容易に識別することができるので、周波数・方位割り当て部32cは、音声基本周波数を変えないことを優先して、方位を隣接分割方位に変えることが好ましい。すなわち、図3の例では、周波数・方位割り当て部32cは、ブロックY1またはY4に割り当てることが好ましい。ブロックY1及びY4が既に別のNAM発言者に割り当てられているとき、方位を変えずに、ブロックY2及びY3のいずれか一方が割り当てられる。ブロックY1〜Y4のすべてが既に割り当てられている場合、NAM発言者Bに比べて優先順位が低く、さらに、4つのブロックY1〜Y4が割り当てられている4人のNAM発言者のうち優先順位の最も低いNAM発言者に割り当てられているブロックに強制的に割り当てられる。このとき、周波数・方位割り当て部32cは、優先順位の低いNAM発言者の割り当てが取り消されたブロックの隣接ブロックが割り当て可能であれば、この隣接ブロックを割り当てが取り消されたNAM発言者に割り当ててもよい。図5に示す例では、ブロックZに割り当てられていたNAM発言者Cが取り消され、NAM発言者B4に割り当てられていることを示す。 For example, the NAM speaker A who has a voice fundamental frequency in the range of 120 to 130 Hz and is currently located in the southeast direction as seen from a certain NAM conversation participant speaks as shown in FIG. Assume that a state is assigned to a block X having a division frequency and a division direction in the southeast. At this time, when NAM speaker B who has a voice fundamental frequency of 120 to 130 Hz and is located in the southeast direction as viewed from the NAM conversation participant speaks, since NAM speaker A is already assigned to block X. The frequency / orientation assigning unit 32c assigns the blocks X 1 to Y 4 having adjacent divided frequencies or adjacent divided directions adjacent to each other in the divided frequency or divided direction of the block X to be assigned. Since the NAM conversation participant can easily identify the NAM speaker by the NAM speaker's voice fundamental frequency, the frequency / orientation allocation unit 32c gives priority to not changing the voice fundamental frequency, and the orientation is adjacent. It is preferable to change the division direction. That is, in the example of FIG. 3, it is preferable that the frequency / orientation assigning unit 32c assigns to the block Y 1 or Y 4 . When blocks Y 1 and Y 4 are already assigned to another NAM speaker, one of blocks Y 2 and Y 3 is assigned without changing orientation. If all of the blocks Y 1 to Y 4 are already assigned, the priority is lower than that of the NAM speaker B, and the four NAM speakers assigned with the four blocks Y 1 to Y 4 are assigned. Of these, the block assigned to the NAM speaker with the lowest priority is forcibly assigned. At this time, if the adjacent block of the block for which the assignment of the NAM speaker having a low priority is canceled can be assigned, the frequency / orientation assigning unit 32c assigns the adjacent block to the NAM speaker for which the assignment has been canceled. Also good. The example shown in FIG. 5 shows that the NAM speaker C assigned to the block Z is canceled and assigned to the NAM speaker B 4 .

また、周波数・方位割り当て部32cは、過去の一定時間、例えば10分間、発言をしなかったNAM発言者Gに割り当てられているブロックを開放する。しかし、この場合、周波数・方位割り当て部32cは、分割周波数の「割り当て数」を8のまま維持してもよい。これは、発言をしなかったNAM発言者Gが急に発言を再開したとき、開放されたブロックの割り当てを可能にするためである。このとき、優先順位がNAM発言者Gより高いNAM発言者Hが発言し、周波数・方位割り当て部32cが、NAM発言者Gに割り当てていた上記ブロックをNAM発言者Hに割り当てようとする場合、図5中のブロックαに示されるように、ブロックαをNAM発言者Gの代わりにNAM発言者Hに割り当ててもよい。このとき、周波数・方位割り当て部32cは、ブロックαに隣接する隣接ブロックβが割り当て可能であれば、隣接ブロックβをNAM発言者Gに割り当ててもよい。   Further, the frequency / orientation assigning unit 32c releases the block assigned to the NAM speaker G who has not made a speech for a certain past time, for example, 10 minutes. However, in this case, the frequency / orientation assigning unit 32c may maintain the “assignment number” of the divided frequencies as eight. This is because when the NAM speaker G who has not made a speech suddenly resumes the speech, the released block can be allocated. At this time, when the NAM speaker H whose priority is higher than that of the NAM speaker G speaks, and the frequency / orientation allocation unit 32c tries to allocate the block allocated to the NAM speaker G to the NAM speaker H, As shown in block α in FIG. 5, block α may be assigned to NAM speaker H instead of NAM speaker G. At this time, if the adjacent block β adjacent to the block α can be assigned, the frequency / orientation assigning unit 32c may assign the adjacent block β to the NAM speaker G.

周波数・方位割り当て部32cは、図6に示すように、NAM発言者Dにブロックを割り当てるとき、割り当て基本周波数が同じNAM発言者Aと同じ方位にならず、割り当て方位が同じNAM発言者Cと割り当て基本周波数が同じにならないようなブロックを1つ定める。
このようなブロックの割り当ては、ブロックが割り当てられていないNAM発言者に対して行われるだけでなく、NAM発言者が異なる方位に移動する場合にもブロックの割り当てが行われる。この場合、設定されていた割り当て方位が新しい割り当て方位に変更されることになる。
As shown in FIG. 6, when assigning a block to the NAM speaker D, the frequency / orientation assigning unit 32c does not have the same orientation as the NAM speaker A with the same assigned fundamental frequency, but with the NAM speaker C with the same assigned orientation. One block is determined so that the assigned fundamental frequencies are not the same.
Such block allocation is performed not only for NAM speakers to which no block is allocated, but also when the NAM speaker moves in different directions. In this case, the set allocation direction is changed to a new allocation direction.

図3〜図6に示すような割り当て基本周波数および割り当て方位の設定は、NAM発言者が各NAM会話参加者からみて遠くに位置する場合に行われることが好ましい。遠くに位置するとは、NAM発言者が各NAM会話参加者からみて予め定められた距離以上離間して位置することをいう。
また、周波数・方位割り当て部32cは、各NAM会話参加者から見てNAM発言者が近くに位置する場合、このNAM発言者に対して、このNAM発言者の現在の方位と音声基本周波数を割り当て方位および割り当て基本周波数として設定する、ことが好ましい。近くに位置するとは、各NAM会話参加者から見てNAM発言者が所定の距離範囲内に位置することをいう。この場合、割り当て基本周波数および割り当て方位が他のNAM発言者と重なってもよい。割り当て基本周波数および割り当て方位が他のNAM発言者と重なっても、各NAM会話参加者から見てNAM発言者が近くに位置するので、視覚によりNAM発言者の口の動きや顔の表情を見て、NAM発言者を十分に識別することができる。
The setting of the allocation fundamental frequency and the allocation direction as shown in FIGS. 3 to 6 is preferably performed when the NAM speaker is located far from each NAM conversation participant. To be located far away means that NAM speakers are located apart from each other by a predetermined distance or more when viewed from each NAM conversation participant.
In addition, when the NAM speaker is located near to each NAM conversation participant as viewed from each NAM conversation participant, the frequency / orientation allocating unit 32c allocates the current direction of the NAM speaker and the voice fundamental frequency to the NAM speaker. It is preferable to set the direction and the assigned fundamental frequency. “Nearly located” means that a NAM speaker is located within a predetermined distance range as viewed from each NAM conversation participant. In this case, the assigned fundamental frequency and assigned direction may overlap with other NAM speakers. Even if the assigned fundamental frequency and orientation are overlapped with other NAM speakers, the NAM speakers are located close to each other as viewed from each NAM conversation participant, so the NAM speaker's mouth movements and facial expressions can be visually observed. Thus, the NAM speaker can be sufficiently identified.

図7は、NAM発言者Aが移動して、NAM会話参加者Pに近づく状態を示している。割り当て基本周波数及び割り当て方位を図5に示すように定める方法は、図7では、NAM発言者AがNAM会話参加者Pから予め定められた距離L1以上離間した範囲に位置する場合に用いられる。一方、NAM発言者AがNAM会話参加者Pから所定の距離L2以内の範囲に位置する場合、周波数・方位割り当て部32cは、NAM発言者Aの現在の方位を割り当て方位として定め、NAM発言者Aの音声基本周波数を割り当て基本周波数として定める。さらに、周波数・方位割り当て部32cは、上記距離L1と上記距離L2との間では、NAM発言者AとNA会話参加者Pとの間の距離に応じて割り当て方位および割り当て基本周波数を修正することが好ましい。
例えば、NAM会話参加者PからのNAM発言者Aの距離をxとしたとき、割り当て基本周波数をf(x)および割り当て方位θ(x)は、下記式(1),(2)のように表される。
式(1)中のFは音声基本周波数であり、F’は図3〜図6に示す方法により定められた割り当て基本周波数である。式(2)中のψは現在の方位であり、ψ’は、図3〜図6に示す方法により定められた割り当て方位である。距離L1は例えば100m、距離L2は例えば10mである。
FIG. 7 shows a state in which the NAM speaker A moves and approaches the NAM conversation participant P. The method of determining the allocation fundamental frequency and the allocation direction as shown in FIG. 5 is used in FIG. 7 when the NAM speaker A is located in a range separated from the NAM conversation participant P by a predetermined distance L 1 or more. . On the other hand, when the NAM speaker A is located within a predetermined distance L 2 from the NAM conversation participant P, the frequency / orientation assigning unit 32c determines the current orientation of the NAM speaker A as the assigned orientation, The voice fundamental frequency of person A is assigned and determined as the fundamental frequency. Furthermore, the frequency and direction assignment unit 32c, in between the distance L 1 and the distance L 2, modifying the allocation orientation and allocated fundamental frequency in accordance with the distance between the NAM speaker A and NA conversation participants P It is preferable to do.
For example, when the distance from the NAM conversation participant P to the NAM speaker A is x, the assigned fundamental frequency is f (x) and the assigned direction θ (x) is expressed by the following equations (1) and (2). expressed.
F in the formula (1) is a voice fundamental frequency, and F ′ is an assigned fundamental frequency determined by the method shown in FIGS. In equation (2), ψ is the current orientation, and ψ ′ is the assigned orientation determined by the method shown in FIGS. The distance L 1 is 100 m, for example, and the distance L 2 is 10 m, for example.

このとき、周波数・方位割り当て部32cは、割り当て方位または割り当て基本周波数が、NAM会話参加者Pから見たNAM発言者Aの現在の方位またはNAM発言者Aの音声基本周波数に近づくように、一定の時間Tをかけて滑らかに修正することが好ましい。例えば、NAM発言者が移動して移動先に行き着いたときの移動先における割り当て基本周波数をF’とし、移動元の割り当て基本周波数をFとし、移動先における割り当て方位をψ’とし、移動元の割り当て方位をψとしたとき、下記式(3),(4)に従って割り当て基本周波数f(t)および割り当て方位θ(t)が表される。式(3),(4)中のTは例えば3秒である。NAM会話参加者Pが複数のブロックを跨いで移動するとき、周波数・方位割り当て部32cは、通過するブロック毎に割り当て方位と割り当て周波数をF’およびψ’として設定するとよい。   At this time, the frequency / orientation assigning unit 32c keeps the assigned orientation or the assigned fundamental frequency close to the current orientation of the NAM speaker A as viewed from the NAM conversation participant P or the voice fundamental frequency of the NAM speaker A. It is preferable that the correction be performed smoothly over time T. For example, when the NAM speaker moves and arrives at the destination, the assigned fundamental frequency at the destination is F ′, the assigned fundamental frequency at the source is F, the assigned direction at the destination is ψ ′, and the source When the assigned direction is ψ, the assigned fundamental frequency f (t) and the assigned direction θ (t) are expressed according to the following formulas (3) and (4). T in the equations (3) and (4) is, for example, 3 seconds. When the NAM conversation participant P moves across a plurality of blocks, the frequency / orientation assigning unit 32c may set the assigning direction and the assigning frequency as F ′ and ψ ′ for each passing block.

また、図8に示すように、NAM発言者BがNAM会話参加者Pの周りを移動している場合、割り当て方位は、NAM会話参加者Pから見たNAM発言者Bの現在の方位に応じて一定の時間をかけて滑らかに変化するように修正をすることが好ましい。このとき、上述したようにNAM発言者Bの移動によって割り当てようとするブロックが変わり、変わった先のブロックが既に別のNAM発言者に割り当てられている場合、周波数・方位割り当て部32cは、変わった先のブロックに隣接する隣接ブロックを割り当ててもよい。このように、NAM発言者Bが移動する場合、NAM会話参加者PはNAM発言者Bの移動を音声によって聴き取ることができる。   Also, as shown in FIG. 8, when the NAM speaker B is moving around the NAM conversation participant P, the allocation direction depends on the current direction of the NAM speaker B viewed from the NAM conversation participant P. It is preferable to make corrections so as to change smoothly over a certain period of time. At this time, as described above, when the block to be allocated changes due to the movement of the NAM speaker B and the changed previous block has already been allocated to another NAM speaker, the frequency / direction allocation unit 32c changes An adjacent block adjacent to the previous block may be assigned. Thus, when the NAM speaker B moves, the NAM conversation participant P can hear the movement of the NAM speaker B by voice.

(NAM会話支援方法)
NAM会話支援システム10では、NAM会話開始前のNAM会話参加者A〜Eの音声が収音される。NAM会話管理サーバ14は、有声音声受信部30aを介して得られたNAM会話参加者A〜Eの有声音声を用いて有声音声の基本周波数が基本周波数算出部32で算出され、音声基本周波数としてデータベース32bに記録される。
この後、NAM会話が開始される。NAM会話中、NAM受信部30bは、各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者A〜Eが現在向いている向きの情報とを各NAM会話参加者A〜Eが保持する携帯端末装置12a〜12eから継続的に受信する。
周波数・方位割り当て部32cは、受信した位置情報と向きの情報を用いて特定される各NAM会話参加者A〜Eから見た各NAM発言者の現在の方位と、各NAM発言者の記録された音声基本周波数とに基いて、各NAM会話参加者A〜Eに対する各NAM発言者の割り当て方位と各NAM発言者の割り当て基本周波数を定める。図3〜5に示すような割り当て周波数と割り当て方位との設定は、各NAM会話参加者から見て図7に示すような距離L1より遠い範囲に位置するNAM発言者に対して、行われる。NAM発言者に対して、割り当て方位及び割り当て基本周波数の設定がすでに行われ、更に変更もされない場合、周波数・方位割り当て部32cは、割り当てを行わない。各NAM会話参加者から見て図7に示すような距離L2より近い範囲に位置するNAM発言者には、NAM発言者の現在の方位とNAM発言者の音声基本周波数が割り当て方位および割り当て基本周波数として設定される。
ささやき声変換部32dおよび音声ミキシング部32eは、設定した割り当て方位と割り当て基本周波数とに基いてNAMの無声音声信号の信号処理(信号レベルの増大、基本周波数の変換、およびミキシング)をする。音声信号送信部30eは、処理した無声音声信号を各NAM会話参加者A〜Eに向けて送信する。
(NAM conversation support method)
In the NAM conversation support system 10, the voices of the NAM conversation participants A to E before the start of the NAM conversation are collected. The NAM conversation management server 14 uses the voiced voices of the NAM conversation participants A to E obtained via the voiced voice receiver 30a to calculate the fundamental frequency of voiced voice at the fundamental frequency calculator 32, which is used as the voice fundamental frequency. Recorded in the database 32b.
Thereafter, the NAM conversation is started. During the NAM conversation, the NAM receiving unit 30b displays the position information indicating the current position of each NAM conversation participant and the information on the direction in which each NAM conversation participant A to E is currently facing each NAM conversation participant A to E. Are continuously received from the mobile terminal devices 12a to 12e held by the device.
The frequency / azimuth allocation unit 32c records the current direction of each NAM speaker as viewed from each NAM conversation participant A to E specified using the received position information and direction information, and records each NAM speaker. The allocation direction of each NAM speaker for each NAM conversation participant A to E and the allocation fundamental frequency of each NAM speaker are determined based on the voice basic frequency. The allocation frequency and allocation direction as shown in FIGS. 3 to 5 are set for NAM speakers located in a range farther than the distance L 1 as shown in FIG. 7 when viewed from each NAM conversation participant. . When the allocation direction and the allocation fundamental frequency are already set for the NAM speaker and are not changed, the frequency / direction allocation unit 32c does not perform allocation. For NAM speakers located within a range closer to the distance L 2 as shown in FIG. 7 when viewed from each NAM conversation participant, the current direction of the NAM speaker and the voice fundamental frequency of the NAM speaker are assigned directions and assigned basics. Set as frequency.
The whispering voice conversion unit 32d and the audio mixing unit 32e perform signal processing (increase in signal level, conversion of basic frequency, and mixing) of the NAM unvoiced audio signal based on the assigned direction and the assigned fundamental frequency. The voice signal transmitting unit 30e transmits the processed silent voice signal to each of the NAM conversation participants A to E.

このように、NAM会話支援方法では、各NAM発言者の現在の方位と、各NAM発言者の音声基本周波数とに基いて、各NAM会話参加者A〜Eに対する各NAM発言者の割り当て方位と各NAM発言者の割り当て基本周波数が定められ、定められた割り当て方位と割り当て基本周波数とに基いてNAMの無声音声信号の信号処理が行われる。このため、各NAM会話参加者がNAM発言者によるNAMを変換したささやき声を聴くことで、各NAM会話参加者はNAM発言者を識別することができる。すなわち、各NAM会話参加者は、どの方向にいるどの人がNAMを発したのか知ることができる。   As described above, in the NAM conversation support method, the allocation direction of each NAM speaker for each NAM conversation participant A to E based on the current direction of each NAM speaker and the voice fundamental frequency of each NAM speaker. The assigned fundamental frequency of each NAM speaker is determined, and signal processing of the NAM unvoiced speech signal is performed based on the assigned direction and assigned fundamental frequency. Therefore, each NAM conversation participant can identify the NAM speaker by listening to the whispering voice obtained by converting the NAM by the NAM speaker. That is, each NAM conversation participant can know which person in which direction issued the NAM.

図9〜11は、NAM発言者AがNAM会話参加者に対してNAMで発言したときの割り当て基本周波数および割り当て方位の設定の様々な場合のフローを示している。
図9に示す例では、NAM発言者AがNAM会話参加者に対してNAMで発言する。このとき、周波数・方位割り当て部32cは、NAM発言者Aに対して図3〜6に示す割り当て方法により、NAM発言者Aに割り当て基本周波数及び割り当て方位を新規に設定する(ステップS10)。この状態で、NAM発言者Aが異なる方位に移動する場合(ステップS20のYesの場合)、周波数・方位割り当て部32cは、割り当て基本周波数を維持し、割り当て方位を変更する(ステップS30)。具体的に、周波数・方位割り当て部32cは、実際の移動先の方位に近い分割方位を割り当て方位に設定する。NAM発言者Aが異なる方位に移動しない場合(ステップS20のNoの場合)、周波数・方位割り当て部32cは、割り当て基本周波数および割り当て方位を維持する(ステップS40)。こうして、NAM会話は続行される。
FIGS. 9 to 11 show flows in various cases of setting the allocation fundamental frequency and the allocation direction when the NAM speaker A speaks to the NAM conversation participant using the NAM.
In the example shown in FIG. 9, the NAM speaker A speaks to the NAM conversation participant with the NAM. At this time, the frequency / orientation allocating unit 32c newly sets a basic frequency and an allocation direction to be assigned to the NAM speaker A by the assignment method shown in FIGS. 3 to 6 for the NAM speaker A (step S10). In this state, when the NAM speaker A moves to a different direction (Yes in step S20), the frequency / direction assigning unit 32c maintains the assigned fundamental frequency and changes the assigned direction (step S30). Specifically, the frequency / orientation allocating unit 32c sets a divided azimuth that is close to the actual moving destination azimuth as the allocated azimuth. When the NAM speaker A does not move to a different direction (No in step S20), the frequency / direction assigning unit 32c maintains the assigned fundamental frequency and the assigned direction (step S40). Thus, the NAM conversation is continued.

図10に示す例では、NAM発言者AがNAM会話参加者に対してNAMで発言する。このとき、周波数・方位割り当て部32cは、NAM発言者Aに対して図3〜6に示す割り当て方法により、NAM発言者Aに割り当て基本周波数及び割り当て方位を新規に設定する(ステップS10)。この状態で、NAM発言者Aが一定時間無言である場合(ステップS50のYesの場合)、周波数・方位割り当て部32cは、割り当て基本周波数を維持し、割り当て方位を開放する(ステップS60)。ここで開放とは、図3〜5に示す表中の「割り当て数」を変更せず、ステップS10で割り当てたブロックからNAM発言者Aの割り当てを解除することである。
一方、NAM発言者Aが一定時間無言でない場合(ステップS50でNoの場合)、NAM発言者Aが一定時間無言になる(ステップS50でYesになる)までステップS10で設定された割り当て基本周波数および割り当て方位が維持される。この後、NAM発言者Aが再び発言するまで割り当て方位が開放された状態が維持される。NAM発言者Aが再び発言する場合(ステップS70のYesの場合)、周波数・方位割り当て部32cは、NAM発言者Aに割り当てようとするブロック、すなわちステップS60で維持された割り当て基本周波数と開放された割り当て方位とを有するブロックが割り当て可能か否かを判定する(ステップS80)。ブロックの割り当てが可能である場合(ステップS80でYesの場合)、周波数・方位割り当て部32cは、割り当て基本周波数を維持し、開放された割り当て方位を再設定する(ステップS90)。ブロックの割り当てが不可能である場合(ステップS80でNoの場合)、周波数・方位割り当て部32cは、割り当て基本周波数および割り当て方位を、近接ブロックの分割周波数および分割方位に変更する(ステップS100)。こうして、NAM会話は続行される。
In the example shown in FIG. 10, the NAM speaker A speaks to the NAM conversation participant using the NAM. At this time, the frequency / orientation allocating unit 32c newly sets a basic frequency and an allocation direction to be assigned to the NAM speaker A by the assignment method shown in FIGS. In this state, when the NAM speaker A is silent for a certain time (Yes in step S50), the frequency / orientation allocating unit 32c maintains the allocated fundamental frequency and releases the allocated azimuth (step S60). Here, the release means that the allocation of NAM speaker A is canceled from the block allocated in step S10 without changing the “number of allocations” in the tables shown in FIGS.
On the other hand, if NAM speaker A is not mute for a certain period of time (No in step S50), the assigned fundamental frequency set in step S10 and until NAM speaker A becomes mute for a certain period of time (Yes in step S50) and The assigned orientation is maintained. Thereafter, the state in which the allocation direction is released is maintained until the NAM speaker A speaks again. When the NAM speaker A speaks again (in the case of Yes in step S70), the frequency / orientation allocating unit 32c is released from the block to be allocated to the NAM speaker A, that is, the allocated fundamental frequency maintained in step S60. It is determined whether or not a block having the assigned orientation can be assigned (step S80). If block allocation is possible (Yes in step S80), the frequency / orientation allocating unit 32c maintains the allocated fundamental frequency and resets the released allocation azimuth (step S90). If block allocation is impossible (No in step S80), the frequency / orientation allocation unit 32c changes the allocation fundamental frequency and allocation direction to the division frequency and division direction of the adjacent block (step S100). Thus, the NAM conversation is continued.

図11に示す例では、NAM発言者AがNAM会話参加者に対してNAMで発言する。このとき、周波数・方位割り当て部32cは、NAM発言者Aに対して図3〜6に示す割り当て方法により、NAM発言者Aに割り当て基本周波数及び割り当て方位を新規に設定する(ステップS10)。
この状態で、優先順位が高く、ブロックが割り当てられていないNAM発言者BがNAM会話で発言する場合(ステップS110でYesの場合)、周波数・方位割り当て部32cは、NAM発言者Bに割り当てようとするブロックがNAM発言者Aに割り当てているブロックと重複するか否かを判定する(ステップS120)。
一方、ステップS120における判定において、割り当てようとするブロックが重複しない場合(ステップS120のNoの場合)、周波数・方位割り当て部32cは、NAM発言者Bの割り当て基本周波数および割り当て方位を新規に設定する(ステップS140)。ステップS120における判定において、割り当てブロックが重複する場合(ステップS120のYesの場合)、周波数・方位割り当て部32cは、NAM発言者Aの割り当て基本周波数および割り当て方位を近接ブロックの周波数および方位に変更する(ステップS130)。この後、ステップS140に進む。
こうして、NAM会話は続行される。
In the example shown in FIG. 11, the NAM speaker A speaks to the NAM conversation participant with the NAM. At this time, the frequency / orientation allocating unit 32c newly sets a basic frequency and an allocation direction to be assigned to the NAM speaker A by the assignment method shown in FIGS.
In this state, when the NAM speaker B who has high priority and is not assigned a block speaks in a NAM conversation (Yes in step S110), the frequency / orientation allocating unit 32c will assign to the NAM speaker B. It is determined whether or not the block to be overlapped with the block assigned to the NAM speaker A (step S120).
On the other hand, if it is determined in step S120 that the blocks to be assigned do not overlap (No in step S120), the frequency / orientation assigning unit 32c newly sets the assigned fundamental frequency and assigned orientation of the NAM speaker B. (Step S140). In the determination in step S120, when the allocation blocks overlap (in the case of Yes in step S120), the frequency / direction allocation unit 32c changes the allocation basic frequency and allocation direction of the NAM speaker A to the frequency and direction of the adjacent block. (Step S130). Thereafter, the process proceeds to step S140.
Thus, the NAM conversation is continued.

なお、NAM参加者Aが聴き手であるNAM会話参加者Pに近づいて来るときにおいても、ステップS10の新規の割り当てが行われる。一方、NAM発言者Aは、NAM会話参加者Pから遠ざかっているとき、また、NAM会話参加者Pの近くでNAM会話から離脱するとき、設定されていたNAM発言者Aの割り当て基本周波数および割り当て方位は取り消される。NAM会話からの離脱は、携帯端末装置12a〜12eから離脱の旨の情報をNAM会話管理サーバ14が受けることにより実行される。   Even when the NAM participant A approaches the NAM conversation participant P who is the listener, the new assignment in step S10 is performed. On the other hand, when the NAM speaker A moves away from the NAM conversation participant P or leaves the NAM conversation near the NAM conversation participant P, the NAM speaker A's assigned fundamental frequency and assignment are set. The direction is canceled. The withdrawal from the NAM conversation is executed when the NAM conversation management server 14 receives information indicating the withdrawal from the mobile terminal devices 12a to 12e.

以上説明したように、周波数・方位割り当て部32cは、各NAM発言者に割り当て方位および割り当て基本周波数を定めるとき、複数の分割方位と、複数の分割周波数を組とした複数のブロックから、NAM発言者同士で重複したブロックが割り当てられないように各NAM発言者に1つのブロックを割り当てる。このため、割り当て方位と割り当て基本周波数の設定を簡単にまとめて行うことができる。
さらに、周波数・方位割り当て部32cは、各NAM発言者の現在の方位と各NAM発言者の音声基本周波数を用いて、1つのブロックを各NAM発言者に割り当てる。このため、割り当て方位および割り当て基本周波数は、各NAM発言者の現在の方位と各NAM発言者の音声基本周波数に設定され得る。
なお、周波数・方位割り当て部32cは、割り当てようとするブロックがすでに別のNAM発言者に割り当てられているとき、この割り当てようとするブロックの分割周波数または分割方位が隣接する隣接分割周波数または隣接分割方位を有する隣接ブロックを割り当てる。このため、割り当て方位および割り当て基本周波数は、各NAM発言者の現在の方位と各NAM発言者の音声基本周波数に近い方位と周波数に設定され得る。
As described above, the frequency / orientation allocating unit 32c determines the allocation direction and the allocation fundamental frequency for each NAM speaker from a plurality of blocks each including a plurality of division directions and a plurality of division frequencies as a set. One block is assigned to each NAM speaker so that no overlapping blocks are assigned to each other. For this reason, the setting of the allocation direction and the allocation fundamental frequency can be easily performed collectively.
Further, the frequency / orientation assigning unit 32c assigns one block to each NAM speaker using the current orientation of each NAM speaker and the voice fundamental frequency of each NAM speaker. Thus, the assigned orientation and assigned fundamental frequency can be set to the current orientation of each NAM speaker and the voice fundamental frequency of each NAM speaker.
When the block to be allocated has already been allocated to another NAM speaker, the frequency / azimuth allocation unit 32c is adjacent to the adjacent division frequency or adjacent division in which the division frequency or division direction of the block to be allocated is adjacent. Assign an adjacent block with orientation. For this reason, the allocation direction and the allocation fundamental frequency can be set to a direction and frequency close to the current orientation of each NAM speaker and the voice fundamental frequency of each NAM speaker.

上記割り当てにおいて、過去の一定時間に発言した回数又は時間の多いNAM発言者の順に優先順位が定められ、この優先順位に従って、各NAM発言者に割り当て方位および割り当て基本周波数が定められる。例えば、優先順位の高いNAM発言者が移動して、別のNAM発言者に割り当てられているブロックに移動する場合、既に割り当てられている上記別のNAM発言者は、割り当てられていたブロックを失い、隣接ブロックが割り当てられる。このため、割り当てにおいて各NAM発言者に割り当てるブロックの重複を防止することができる。   In the above allocation, priorities are determined in the order of the number of times of speech or the NAM speakers having a long time in a certain past time, and the allocation direction and the allocation fundamental frequency are determined for each NAM speaker according to this priority. For example, when a high priority NAM speaker moves and moves to a block assigned to another NAM speaker, the other NAM speaker already assigned loses the assigned block. Adjacent blocks are assigned. For this reason, it is possible to prevent duplication of blocks allocated to each NAM speaker in allocation.

このようなNAM会話支援方法による方位および周波数の割り当ては、図7に示すように、各NAM会話参加者A〜EからみてNAM発言者が予め設定された距離L1以上離れている場合に行われる。各NAM会話参加者A〜EからみてNAM発言者が予め設定された距離L2以内(図7参照)に位置する場合、周波数・方位割り当て部32cは、上記NAM発言者の現在の方位を割り当て方位として設定し、上記NAM発言者の音声基本周波数を割り当て基本周波数として設定する。各NAM会話参加者A〜EからみてNAM発言者が距離L2以内(図7参照)に位置する場合、NAM発言者が各NAM会話参加者A〜Eの近くにいるので、各NAM会話参加者A〜EはNAM発言者の口の動きや顔の表情を見つつ、NAM発言者のNAM会話を現在の方位に一致する方向から聴きとることができる。このため、各NAM会話参加者A〜Eは、誰が発言したかを知りながら、NAM会話を聴くことができる。 As shown in FIG. 7, the direction and frequency allocation by the NAM conversation support method is performed when the NAM speaker is separated by a predetermined distance L 1 or more as viewed from each NAM conversation participant A to E. Is called. When the NAM speaker is located within a preset distance L 2 (see FIG. 7) as viewed from each NAM conversation participant A to E, the frequency / orientation assigning unit 32c assigns the current orientation of the NAM speaker. The direction is set as the direction, and the voice fundamental frequency of the NAM speaker is set as the assigned fundamental frequency. If the NAM speaker viewed from each NAM conversation participant A~E is located at a distance L 2 within (see Fig. 7), since the NAM speaker is in the vicinity of each NAM conversation participant A~E, participate each NAM conversation The persons A to E can listen to the NAM speaker's NAM conversation from the direction that matches the current direction while watching the movement of the mouth and facial expression of the NAM speaker. Therefore, each NAM conversation participant A to E can listen to the NAM conversation while knowing who spoke.

一人のNAM発言者が一人のNAM会話参加者に近づくとき、周波数・方位割り当て部32cは、割り当て方位および割り当て基本周波数が、上記NAM発言者の現在の方位および音声基本周波数に一致または近づくように、上記NAM会話参加者と上記NA発言者との間の距離に応じて割り当て方位および割り当て基本周波数の少なくとも一方を修正する。このため、図7に示すように、NAM発言者AがNAM会話参加者Pから距離L2以内に位置するとき、割り当て方位は現在の方位に一致しあるいは近づき、割り当て基本周波数はNAM発言者Aの音声基本周波数に一致あるいは近づくので、NAM会話参加者Pは、近づいてくるNAM発言者Aの口の動きや顔の表情を見ながら違和感無くNAM会話を聴くことができる。 When one NAM speaker approaches one NAM conversation participant, the frequency / orientation assigning unit 32c makes the assigned direction and the assigned fundamental frequency coincide with or approaches the current orientation and the voice fundamental frequency of the NAM speaker. Then, at least one of the allocation direction and the allocation fundamental frequency is corrected according to the distance between the NAM conversation participant and the NA speaker. Thus, as shown in FIG. 7, when the NAM speaker A is located within a distance L 2 from the NAM conversation participant P, the assigned direction matches or approaches the current direction, and the assigned fundamental frequency is NAM speaker A. Therefore, the NAM conversation participant P can listen to the NAM conversation without feeling uncomfortable while watching the movement of the mouth and the facial expression of the approaching NAM speaker A.

一人のNAM発言者が一人のNAM会話参加者に近づくとき、周波数・方位割り当て部32cは、上述したように割り当て方位および割り当て基本周波数の少なくとも一方を、一定の時間、例えば3秒間をかけて滑らかに修正をする。このため、NAM会話参加者は、NAM発言者のNAM会話を違和感無く聴くことができる。   When one NAM speaker approaches one NAM conversation participant, the frequency / orientation assigning unit 32c smoothes at least one of the assigned orientation and the assigned fundamental frequency over a certain time, for example, 3 seconds as described above. Make corrections. For this reason, the NAM conversation participant can listen to the NAM conversation of the NAM speaker without discomfort.

NAM発言者が有声音声を発して、マイク16bが有声音声を収音したとき、音声ミキシング部32eは、NAM会話中の無声音声信号を遮断して、上記有声音声の音声信号を、通信部30を通して携帯端末装置12a〜12eに送信する。このため、NAM会話と共に、有声音声を併用して会話をすることができる。   When the NAM speaker emits voiced voice and the microphone 16b picks up voiced voice, the voice mixing unit 32e cuts off the voiceless voice signal during the NAM conversation and converts the voiced voice signal into the communication unit 30. To the mobile terminal devices 12a to 12e. For this reason, it is possible to have a conversation using voiced voice together with the NAM conversation.

基本周波数算出部32は、各NAM発言者の音声を、周波数解析をすることにより音声基本周波数を事前に取得する。このため、NAM会話支援システムに参加できる人を制限しない。   The fundamental frequency calculation unit 32 obtains a speech fundamental frequency in advance by performing frequency analysis on the speech of each NAM speaker. For this reason, the person who can participate in the NAM conversation support system is not restricted.

上記実施形態は、以下に示す内容を開示する。   The said embodiment discloses the content shown below.

(付記1)
NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援するNAM会話支援システムであって、
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを取得する計測部と、各NAM会話参加者がNAM会話に用いる音声入出力デバイスと、前記位置情報と前記向きの情報の通信およびNAM会話中の音声信号の通信を行う通信部と、を備える各NAM会話参加者が保持する携帯端末装置と、
前記携帯端末装置から受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、前記割り当て方位と前記割り当て基本周波数とに基いて前記携帯端末装置から受信したNAMの無声音声信号を処理する信号処理部と、処理した前記無声音声信号を前記携帯端末装置に送信する通信部と、を備える会話管理装置と、を有することを特徴とするNAM会話支援システム。
(Appendix 1)
A NAM conversation support system that supports NAM conversation by multiple people using NAM (Non Audible Murmur),
A measurement unit that acquires position information indicating the current position of each NAM conversation participant and information on a direction in which each NAM conversation participant is currently facing; a voice input / output device that each NAM conversation participant uses for NAM conversation; A mobile terminal device held by each NAM conversation participant, comprising: a communication unit that performs communication of the position information and the orientation information and communication of an audio signal during NAM conversation;
Based on the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker as seen from each NAM conversation participant specified using the position information and the orientation information received from the mobile terminal device, The NAM speaker's assigned direction and the NAM speaker's assigned fundamental frequency for each NAM conversation participant are determined, and the NAM silent voice signal received from the portable terminal device based on the assigned direction and the assigned fundamental frequency A NAM conversation support system, comprising: a conversation management device comprising: a signal processing unit to process; and a communication unit that transmits the processed silent voice signal to the portable terminal device.

(付記2)
前記信号処理部は、前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、予め設定された複数の分割方位と予め設定された複数の分割周波数を組とした複数のブロックから、別のNAM発言者と重複したブロックが割り当てられないように前記NAM発言者に1つのブロックを割り当てる、付記1に記載のNAM会話支援システム。
(Appendix 2)
The signal processing unit, when determining the allocation direction and the allocation fundamental frequency for the NAM speaker, is separated from a plurality of blocks each having a set of a plurality of preset division directions and a plurality of preset division frequencies. The NAM conversation support system according to appendix 1, wherein one block is allocated to the NAM speaker so that no duplicate block is allocated to the NAM speaker.

(付記3)
前記信号処理部は、前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、前記NAM発言者の前記現在の方位と前記NAM発言者の音声基本周波数を用いて1つのブロックを前記NAM発言者に割り当てる、付記2に記載のNAM会話支援システム。
(Appendix 3)
When the signal processing unit determines the allocation direction and the allocated fundamental frequency for the NAM speaker, the NAM speaker uses the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker as one block for the NAM. The NAM conversation support system according to appendix 2, which is assigned to a speaker.

(付記4)
前記信号処理部は、割り当てようとするブロックがすでに別のNAM発言者に割り当てられているとき、前記割り当てようとするブロックの分割周波数または分割方位に隣接する隣接分割周波数または隣接分割方位を有する隣接ブロックの1つを割り当てる、付記3に記載のNAM会話支援システム。
(Appendix 4)
When the block to be allocated has already been allocated to another NAM speaker, the signal processing unit has an adjacent division frequency or adjacent division direction adjacent to the division frequency or division direction of the block to be allocated. The NAM conversation support system according to attachment 3, wherein one of the blocks is allocated.

(付記5)
前記信号処理部は、前記隣接ブロックのうち、前記割り当てようとするブロックの分割周波数を有する隣接ブロックを、前記割り当てようとするブロックの分割方位を有する隣接ブロックに対して優先的に割り当てる、付記4に記載のNAM会話支援システム。
(Appendix 5)
The signal processing unit preferentially assigns an adjacent block having a division frequency of the block to be assigned among adjacent blocks to an adjacent block having a division direction of the block to be assigned. The NAM conversation support system described in 1.

(付記6)
前記信号処理部は、過去の一定時間に発言した回数又は時間の多いNAM発言者の順に優先順位を定めて、前記割り当て方位および前記割り当て基本周波数を定める、付記1〜5のいずれか1項に記載のNAM会話支援システム。
(Appendix 6)
In any one of appendices 1 to 5, the signal processing unit determines priority in the order of NAM speakers having a large number of times or time of speaking in a certain past time, and determines the allocation direction and the allocation fundamental frequency. The NAM conversation support system described.

(付記7)
前記信号処理部は、各NAM会話参加者から見て所定の距離範囲内に位置するNAM発言者に対して、当該NAM発言者の前記現在の方位と前記音声基本周波数を前記割り当て方位および前記割り当て基本周波数として設定する、付記1〜6のいずれか1項に記載のNAM会話支援システム。
(Appendix 7)
For the NAM speaker located within a predetermined distance range when viewed from each NAM conversation participant, the signal processing unit assigns the current orientation and the voice fundamental frequency of the NAM speaker to the assigned orientation and the assigned The NAM conversation support system according to any one of supplementary notes 1 to 6, which is set as a fundamental frequency.

(付記8)
前記信号処理部は、前記NAM発言者が一人のNAM会話参加者に近づくとき、前記割り当て方位および前記割り当て基本周波数が、前記一人のNAM会話参加者から見た前記NAM発言者の前記現在の方位および前記音声基本周波数に一致あるいは近づくように、前記一人のNAM会話参加者と前記NA発言者との間の距離に応じて前記割り当て方位および前記割り当て基本周波数の少なくとも一方を修正する、付記1〜7のいずれか1項に記載のNAM会話支援システム。
(Appendix 8)
When the NAM speaker approaches one NAM conversation participant, the signal processing unit determines that the assigned orientation and the assigned fundamental frequency are the current orientation of the NAM speaker as viewed from the one NAM conversation participant. And at least one of the assigned orientation and the assigned fundamental frequency is modified according to the distance between the one NAM conversation participant and the NA speaker so as to match or approach the voice fundamental frequency, 8. The NAM conversation support system according to any one of 7 above.

(付記9)
前記信号処理部は、前記割り当て方位および前記割り当て基本周波数の少なくとも一方を修正するとき、一定の時間をかけて滑らかに変化するように修正をする、付記8に記載のNAM会話支援システム。
(Appendix 9)
9. The NAM conversation support system according to appendix 8, wherein the signal processor corrects at least one of the allocation direction and the allocation fundamental frequency so as to change smoothly over a certain time.

(付記10)
前記携帯端末装置の前記音声入出力デバイスが有声音声を収音したとき、前記信号処理部は、前記NAM会話中の無声音声信号を遮断して、有声音声信号を、前記通信部を通して前記携帯端末装置に送信する、付記1〜9のいずれか1項に記載のNAM会話支援システム。
(Appendix 10)
When the voice input / output device of the portable terminal device picks up voiced voice, the signal processing unit cuts off the voiceless voice signal during the NAM conversation and sends the voiced voice signal through the communication unit to the portable terminal. The NAM conversation support system according to any one of appendices 1 to 9, which is transmitted to a device.

(付記11)
前記信号処理部は、前記NAM発言者の音声を周波数解析することにより前記音声基本周波数を事前に取得する、付記1〜10のいずれか1項に記載のNAM会話支援システム。
(Appendix 11)
The NAM conversation support system according to any one of appendices 1 to 10, wherein the signal processing unit acquires the voice fundamental frequency in advance by performing frequency analysis on the voice of the NAM speaker.

(付記12)
NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援する会話管理装置が行うNAM会話支援方法であって、
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを各NAM会話参加者が保持する携帯端末装置から受信し、
受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、
前記割り当て方位と前記割り当て基本周波数とに基いてNAMの無声音声信号を処理し、処理した前記無声音声信号を各NAM会話参加者に送信する、ことを特徴とするNAM会話支援方法。
(Appendix 12)
A NAM conversation support method performed by a conversation management device that supports NAM conversation by a plurality of people using NAM (Non Audible Murmur),
Receiving position information indicating the current position of each NAM conversation participant and information on the direction in which each NAM conversation participant is currently facing from a mobile terminal device held by each NAM conversation participant;
Each NAM conversation participant is based on the current direction of the NAM speaker and the voice fundamental frequency of the NAM speaker as viewed from each NAM conversation participant identified using the received position information and the orientation information. Defining the NAM speaker's allocation direction and the NAM speaker's allocation fundamental frequency for
A NAM conversation support method, comprising: processing a silent voice signal of NAM based on the assigned direction and the assigned fundamental frequency, and transmitting the processed silent voice signal to each NAM conversation participant.

(付記13)
前記会話管理装置が前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、予め設定された複数の分割方位と予め設定された複数の分割周波数を組とした複数のブロックから、別のNAM発言者と重複したブロックが割り当てられないように前記NAM発言者に1つのブロックを割り当てる、付記12に記載のNAM会話支援方法。
(Appendix 13)
When the conversation management device determines the allocation direction and the allocation fundamental frequency for the NAM speaker, a plurality of blocks each of which is a set of a plurality of preset division directions and a plurality of preset division frequencies, 13. The NAM conversation support method according to appendix 12, wherein one block is allocated to the NAM speaker so that a block overlapping with the NAM speaker is not allocated.

(付記14)
前記会話管理装置が前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、前記NAM発言者の現在の方位と前記NAM発言者の音声基本周波数を用いて1つのブロックを前記NAM発言者に割り当てる、付記13に記載のNAM会話支援方法。
(Appendix 14)
When the conversation management device determines the allocation direction and the allocated fundamental frequency for the NAM speaker, the NAM speaker uses one block using the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker. The NAM conversation support method according to appendix 13, which is assigned to

(付記15)
前記会話管理装置が割り当てようとするブロックがすでに別のNAM発言者に割り当てられているとき、前記割り当てようとするブロックの分割周波数または分割方位に隣接する隣接分割周波数または隣接分割方位を有する隣接ブロックの1つを割り当てる、付記14に記載のNAM会話支援方法。
(Appendix 15)
When a block to be allocated by the conversation management apparatus is already allocated to another NAM speaker, an adjacent block having an adjacent divided frequency or adjacent divided direction adjacent to the divided frequency or divided direction of the block to be allocated 15. The NAM conversation support method according to appendix 14, wherein one of the above is assigned.

(付記16)
前記隣接ブロックのうち、前記割り当てようとするブロックの分割周波数を有する隣接ブロックを、前記割り当てようとするブロックの分割方位を有する隣接ブロックに対して優先的に割り当てる、付記15に記載のNAM会話支援方法。
(Appendix 16)
The NAM conversation support according to appendix 15, wherein, among the adjacent blocks, an adjacent block having a division frequency of the block to be allocated is preferentially allocated to an adjacent block having a division direction of the block to be allocated. Method.

(付記17)
前記会話管理装置は、過去の一定時間に発言した回数又は時間の多いNAM発言者の順に優先順位を定め、前記割り当て方位および前記割り当て基本周波数を定める、付記12〜16のいずれか1項に記載のNAM会話支援方法。
(Appendix 17)
17. The conversation management device according to any one of appendices 12 to 16, wherein the conversation management device sets priorities in order of NAM speakers having a large number of times of speaking or a long time in the past, and determines the allocation direction and the allocation fundamental frequency. NAM conversation support method.

(付記18)
前記会話管理装置は、各NAM会話参加者から見て所定の距離範囲内に位置するNAM発言者に対して、当該NAM発言者の前記現在の方位と前記音声基本周波数を前記割り当て方位および前記割り当て基本周波数として設定する、付記12〜17のいずれか1項に記載のNAM会話支援方法。
(Appendix 18)
The conversation management device, for NAM speakers located within a predetermined distance range when viewed from each NAM conversation participant, assigns the current orientation and the voice fundamental frequency of the NAM speaker to the assigned orientation and the assigned 18. The NAM conversation support method according to any one of appendices 12 to 17, which is set as a fundamental frequency.

(付記19)
前記会話管理装置は、前記NAM発言者が一人のNAM会話参加者に近づくとき、前記割り当て方位および前記割り当て基本周波数が、前記一人のNAM会話参加者から見た前記NAM発言者の前記現在の方位および前記音声基本周波数に一致あるいは近づくように、前記一人のNAM会話参加者と前記NA発言者との間の距離に応じて前記割り当て方位および前記割り当て基本周波数の少なくとも一方を修正する、付記12〜18のいずれか1項に記載のNAM会話支援方法。
(Appendix 19)
When the NAM speaker approaches one NAM conversation participant, the conversation management device determines that the assigned orientation and the assigned fundamental frequency are the current orientation of the NAM speaker viewed from the one NAM conversation participant. And at least one of the assigned orientation and the assigned fundamental frequency is modified according to the distance between the one NAM conversation participant and the NA speaker so as to match or approach the voice fundamental frequency. 19. The NAM conversation support method according to any one of items 18.

(付記20)
前記会話管理装置は、前記割り当て方位および前記割り当て基本周波数の少なくとも一方を修正するとき、一定の時間をかけて滑らかに修正をする、付記19に記載のNAM会話支援方法。
(Appendix 20)
The NAM conversation support method according to supplementary note 19, wherein the conversation management device performs a smooth correction over a predetermined time when correcting at least one of the allocation direction and the allocation fundamental frequency.

(付記21)
前記携帯端末装置の音声入出力デバイスが有声音声を収音したとき、前記会話管理装置は、前記NAM会話中の無声音声信号を遮断して、有声音声の音声信号を前記携帯端末装置に送信する、付記12〜20のいずれか1項に記載のNAM会話支援方法。
(Appendix 21)
When the voice input / output device of the portable terminal device picks up voiced voice, the conversation management device cuts off the voiceless voice signal during the NAM conversation and transmits the voiced voice signal to the portable terminal device. The NAM conversation support method according to any one of appendices 12 to 20.

(付記22)
前記会話管理装置は、前記NAM発言者の音声の周波数解析をすることにより前記音声基本周波数を事前に取得する、付記12〜21のいずれか1項に記載のNAM会話支援方法。
(Appendix 22)
The NAM conversation support method according to any one of appendices 12 to 21, wherein the conversation management device acquires the voice fundamental frequency in advance by performing frequency analysis of the voice of the NAM speaker.

以上、本発明のNAM会話支援システムおよびNAM会話支援方法について詳細に説明したが、本発明は上記実施形態に限定されず、本発明の主旨を逸脱しない範囲において、種々の改良や変更をしてもよいのはもちろんである。   As described above, the NAM conversation support system and the NAM conversation support method of the present invention have been described in detail. However, the present invention is not limited to the above-described embodiment, and various improvements and modifications can be made without departing from the gist of the present invention. Of course it is also good.

10 NAM会話支援システム
12,12a〜12e 携帯端末装置
14 NAM会話管理サーバ
16 ヘッドセット
16a ヘッドフォン
16b マイク
18 計測部
18a GPS位置センサ
18b 方位センサ
20 Lombard検出部
22 通信部
22a 有声音声送信部
22b NAM送信部
22c Lombard送信部
22d 位置・方位送信部
22e 音声信号受信部
30 通信部
30a 有声音声受信部
30b NAM受信部
30c Lombard受信部
30d 位置・方位受信部
30e 音声信号送信部
32 信号処理部
32a 基本周波数算出部
32b データベース
32c 周波数・方位割り当て部
32d ささやき声変換部
32e 音声ミキシング部
DESCRIPTION OF SYMBOLS 10 NAM conversation support system 12,12a-12e Portable terminal device 14 NAM conversation management server 16 Headset 16a Headphone 16b Microphone 18 Measurement part 18a GPS position sensor 18b Direction sensor 20 Lombard detection part 22 Communication part 22a Voiced voice transmission part 22b NAM transmission Unit 22c Lombard transmission unit 22d position / azimuth transmission unit 22e audio signal reception unit 30 communication unit 30a voiced audio reception unit 30b NAM reception unit 30c Lombard reception unit 30d position / azimuth reception unit 30e audio signal transmission unit 32 signal processing unit 32a fundamental frequency Calculation unit 32b Database 32c Frequency / azimuth allocation unit 32d Whispering voice conversion unit 32e Audio mixing unit

Claims (9)

NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援するNAM会話支援システムであって、
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを取得する計測部と、各NAM会話参加者がNAM会話に用いる音声入出力デバイスと、前記位置情報と前記向きの情報の通信およびNAM会話中の音声信号の通信を行う通信部と、を備える各NAM会話参加者が保持する携帯端末装置と、
前記携帯端末装置から受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、前記割り当て方位と前記割り当て基本周波数とに基いて前記携帯端末装置から受信したNAMの無声音声信号を処理する信号処理部と、処理した前記無声音声信号を前記携帯端末装置に送信する通信部と、を備える会話管理装置と、を有し、
前記信号処理部は、前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、予め設定された複数の分割方位と予め設定された複数の分割周波数を組とした複数のブロックから、別のNAM発言者と重複したブロックが割り当てられないように前記NAM発言者に1つのブロックを割り当てる、ことを特徴とするNAM会話支援システム。
A NAM conversation support system that supports NAM conversation by multiple people using NAM (Non Audible Murmur),
A measurement unit that acquires position information indicating the current position of each NAM conversation participant and information on a direction in which each NAM conversation participant is currently facing; a voice input / output device that each NAM conversation participant uses for NAM conversation; A mobile terminal device held by each NAM conversation participant, comprising: a communication unit that performs communication of the position information and the orientation information and communication of an audio signal during NAM conversation;
Based on the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker as seen from each NAM conversation participant specified using the position information and the orientation information received from the mobile terminal device, The NAM speaker's assigned direction and the NAM speaker's assigned fundamental frequency for each NAM conversation participant are determined, and the NAM silent voice signal received from the portable terminal device based on the assigned direction and the assigned fundamental frequency A conversation management device comprising: a signal processing unit for processing; and a communication unit for transmitting the processed silent voice signal to the portable terminal device,
The signal processing unit, when determining the allocation direction and the allocation fundamental frequency for the NAM speaker, is separated from a plurality of blocks each having a set of a plurality of preset division directions and a plurality of preset division frequencies. A NAM conversation support system , wherein one block is allocated to the NAM speaker so that no duplicate block is allocated to the NAM speaker .
前記信号処理部は、前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、前記NAM発言者の前記現在の方位と前記NAM発言者の音声基本周波数を用いて1つのブロックを前記NAM発言者に割り当てる、請求項に記載のNAM会話支援システム。 When the signal processing unit determines the allocation direction and the allocated fundamental frequency for the NAM speaker, the NAM speaker uses the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker as one block for the NAM. assigned to speakers, NAM conversation support system according to claim 1. 前記信号処理部は、割り当てようとするブロックがすでに別のNAM発言者に割り当てられているとき、前記割り当てようとするブロックの分割周波数または分割方位に隣接する隣接分割周波数または隣接分割方位を有する隣接ブロックの1つを割り当てる、請求項に記載のNAM会話支援システム。 When the block to be allocated has already been allocated to another NAM speaker, the signal processing unit has an adjacent division frequency or adjacent division direction adjacent to the division frequency or division direction of the block to be allocated. The NAM conversation support system according to claim 2 , wherein one of the blocks is allocated. 前記信号処理部は、前記隣接ブロックのうち、前記割り当てようとするブロックの分割周波数を有する隣接ブロックを、前記割り当てようとするブロックの分割方位を有する隣接ブロックに対して優先的に割り当てる、請求項に記載のNAM会話支援システム。 The signal processing unit preferentially allocates an adjacent block having a division frequency of the block to be allocated among adjacent blocks to an adjacent block having a division direction of the block to be allocated. 3. The NAM conversation support system according to 3. NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援するNAM会話支援システムであって、
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを取得する計測部と、各NAM会話参加者がNAM会話に用いる音声入出力デバイスと、前記位置情報と前記向きの情報の通信およびNAM会話中の音声信号の通信を行う通信部と、を備える各NAM会話参加者が保持する携帯端末装置と、
前記携帯端末装置から受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、前記割り当て方位と前記割り当て基本周波数とに基いて前記携帯端末装置から受信したNAMの無声音声信号を処理する信号処理部と、処理した前記無声音声信号を前記携帯端末装置に送信する通信部と、を備える会話管理装置と、を有し、
前記信号処理部は、過去の一定時間に発言した回数又は時間の多いNAM発言者の順に優先順位を定めて、前記割り当て方位および前記割り当て基本周波数を定める、ことを特徴とするNAM会話支援システム。
A NAM conversation support system that supports NAM conversation by multiple people using NAM (Non Audible Murmur),
A measurement unit that acquires position information indicating the current position of each NAM conversation participant and information on a direction in which each NAM conversation participant is currently facing; a voice input / output device that each NAM conversation participant uses for NAM conversation; A mobile terminal device held by each NAM conversation participant, comprising: a communication unit that performs communication of the position information and the orientation information and communication of an audio signal during NAM conversation;
Based on the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker as seen from each NAM conversation participant specified using the position information and the orientation information received from the mobile terminal device, The NAM speaker's assigned direction and the NAM speaker's assigned fundamental frequency for each NAM conversation participant are determined, and the NAM silent voice signal received from the portable terminal device based on the assigned direction and the assigned fundamental frequency A conversation management device comprising: a signal processing unit for processing; and a communication unit for transmitting the processed silent voice signal to the portable terminal device,
The signal processing unit may prioritize the order of the past number of times or time spoke constant time NAM speaker, determining the allocation orientation and the allocation fundamental frequency, NAM conversation support system, characterized in that.
NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援するNAM会話支援システムであって、
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを取得する計測部と、各NAM会話参加者がNAM会話に用いる音声入出力デバイスと、前記位置情報と前記向きの情報の通信およびNAM会話中の音声信号の通信を行う通信部と、を備える各NAM会話参加者が保持する携帯端末装置と、
前記携帯端末装置から受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、前記割り当て方位と前記割り当て基本周波数とに基いて前記携帯端末装置から受信したNAMの無声音声信号を処理する信号処理部と、処理した前記無声音声信号を前記携帯端末装置に送信する通信部と、を備える会話管理装置と、を有し、
前記信号処理部は、各NAM会話参加者から見て所定の距離範囲内に位置するNAM発言者に対して、当該NAM発言者の前記現在の方位と前記音声基本周波数を前記割り当て方位および前記割り当て基本周波数として設定する、ことを特徴とするNAM会話支援システム。
A NAM conversation support system that supports NAM conversation by multiple people using NAM (Non Audible Murmur),
A measurement unit that acquires position information indicating the current position of each NAM conversation participant and information on a direction in which each NAM conversation participant is currently facing; a voice input / output device that each NAM conversation participant uses for NAM conversation; A mobile terminal device held by each NAM conversation participant, comprising: a communication unit that performs communication of the position information and the orientation information and communication of an audio signal during NAM conversation;
Based on the current orientation of the NAM speaker and the voice fundamental frequency of the NAM speaker as seen from each NAM conversation participant specified using the position information and the orientation information received from the mobile terminal device, The NAM speaker's assigned direction and the NAM speaker's assigned fundamental frequency for each NAM conversation participant are determined, and the NAM silent voice signal received from the portable terminal device based on the assigned direction and the assigned fundamental frequency A conversation management device comprising: a signal processing unit for processing; and a communication unit for transmitting the processed silent voice signal to the portable terminal device,
For the NAM speaker located within a predetermined distance range when viewed from each NAM conversation participant, the signal processing unit assigns the current orientation and the voice fundamental frequency of the NAM speaker to the assigned orientation and the assigned A NAM conversation support system characterized by being set as a fundamental frequency.
NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援する会話管理装置が行うNAM会話支援方法であって、
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを各NAM会話参加者が保持する携帯端末装置から受信し、
受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、
前記割り当て方位と前記割り当て基本周波数とに基いてNAMの無声音声信号を処理し、処理した前記無声音声信号を各NAM会話参加者に送信
前記NAM発言者に前記割り当て方位および前記割り当て基本周波数を定めるとき、予め設定された複数の分割方位と予め設定された複数の分割周波数を組とした複数のブロックから、別のNAM発言者と重複したブロックが割り当てられないように前記NAM発言者に1つのブロックを割り当てる、ことを特徴とするNAM会話支援方法。
A NAM conversation support method performed by a conversation management device that supports NAM conversation by a plurality of people using NAM (Non Audible Murmur),
Receiving position information indicating the current position of each NAM conversation participant and information on the direction in which each NAM conversation participant is currently facing from a mobile terminal device held by each NAM conversation participant;
Each NAM conversation participant is based on the current direction of the NAM speaker and the voice fundamental frequency of the NAM speaker as viewed from each NAM conversation participant identified using the received position information and the orientation information. Defining the NAM speaker's allocation direction and the NAM speaker's allocation fundamental frequency for
The allocation orientation the assignment based on the fundamental frequency and processing the unvoiced speech signal NAM, transmits the unvoiced speech signal processed in each NAM conversation participant,
When the allocation direction and the allocation fundamental frequency are determined for the NAM speaker, the NAM speaker overlaps with another NAM speaker from a plurality of blocks each of which includes a plurality of preset division directions and a plurality of preset division frequencies. And assigning one block to the NAM speaker so that the assigned block is not assigned .
NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援する会話管理装置が行うNAM会話支援方法であって、A NAM conversation support method performed by a conversation management device that supports NAM conversation by a plurality of people using NAM (Non Audible Murmur),
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを各NAM会話参加者が保持する携帯端末装置から受信し、Receiving position information indicating the current position of each NAM conversation participant and information on the direction in which each NAM conversation participant is currently facing from a mobile terminal device held by each NAM conversation participant;
受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、Each NAM conversation participant is based on the current direction of the NAM speaker and the voice fundamental frequency of the NAM speaker as viewed from each NAM conversation participant identified using the received position information and the orientation information. Defining the NAM speaker's allocation direction and the NAM speaker's allocation fundamental frequency for
前記割り当て方位と前記割り当て基本周波数とに基いてNAMの無声音声信号を処理し、処理した前記無声音声信号を各NAM会話参加者に送信し、Processing a silent voice signal of a NAM based on the assigned direction and the assigned fundamental frequency, and sending the processed silent voice signal to each NAM conversation participant;
前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定めるとき、過去の一定時間に発言した回数又は時間の多いNAM発言者の順に優先順位を定めて、前記割り当て方位および前記割り当て基本周波数を定める、ことを特徴とするNAM会話支援方法。When determining the allocation direction of the NAM speaker and the allocation basic frequency of the NAM speaker, the priority is determined in the order of the number of NAM speakers or the number of NAM speakers having a long time, and the allocation direction and the allocation basic frequency. A NAM conversation support method, characterized by determining a frequency.
NAM(Non Audible Murmur)を用いた複数人によるNAM会話を支援する会話管理装置が行うNAM会話支援方法であって、A NAM conversation support method performed by a conversation management device that supports NAM conversation by a plurality of people using NAM (Non Audible Murmur),
各NAM会話参加者の現在の位置を示す位置情報と各NAM会話参加者が現在向いている向きの情報とを各NAM会話参加者が保持する携帯端末装置から受信し、Receiving position information indicating the current position of each NAM conversation participant and information on the direction in which each NAM conversation participant is currently facing from a mobile terminal device held by each NAM conversation participant;
受信した前記位置情報と前記向きの情報を用いて特定される各NAM会話参加者から見たNAM発言者の現在の方位と前記NAM発言者の音声基本周波数とに基いて、各NAM会話参加者に対する前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定め、Each NAM conversation participant is based on the current direction of the NAM speaker and the voice fundamental frequency of the NAM speaker as viewed from each NAM conversation participant identified using the received position information and the orientation information. Defining the NAM speaker's allocation direction and the NAM speaker's allocation fundamental frequency for
前記割り当て方位と前記割り当て基本周波数とに基いてNAMの無声音声信号を処理し、処理した前記無声音声信号を各NAM会話参加者に送信し、Processing a silent voice signal of a NAM based on the assigned direction and the assigned fundamental frequency, and sending the processed silent voice signal to each NAM conversation participant;
前記NAM発言者の割り当て方位と前記NAM発言者の割り当て基本周波数を定めるとき、各NAM会話参加者から見て所定の距離範囲内に位置するNAM発言者に対して、当該NAM発言者の前記現在の方位と前記音声基本周波数を前記割り当て方位および前記割り当て基本周波数として設定する、ことを特徴とするNAM会話支援方法。When determining the NAM speaker's allocation direction and the NAM speaker's allocated fundamental frequency, the NAM speaker's current status is determined for each NAM speaker located within a predetermined distance range as viewed from each NAM conversation participant. And setting the voice fundamental frequency as the assigned direction and the assigned fundamental frequency.
JP2011003302A 2011-01-11 2011-01-11 NAM conversation support system and NAM conversation support method Expired - Fee Related JP5594152B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011003302A JP5594152B2 (en) 2011-01-11 2011-01-11 NAM conversation support system and NAM conversation support method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011003302A JP5594152B2 (en) 2011-01-11 2011-01-11 NAM conversation support system and NAM conversation support method

Publications (2)

Publication Number Publication Date
JP2012147196A JP2012147196A (en) 2012-08-02
JP5594152B2 true JP5594152B2 (en) 2014-09-24

Family

ID=46790325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011003302A Expired - Fee Related JP5594152B2 (en) 2011-01-11 2011-01-11 NAM conversation support system and NAM conversation support method

Country Status (1)

Country Link
JP (1) JP5594152B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3027793B2 (en) * 1994-08-03 2000-04-04 日本電信電話株式会社 Virtual space sharing device
AU2003261871A1 (en) * 2002-08-30 2004-03-19 Asahi Kasei Kabushiki Kaisha Microphone and communication interface system
JP2006237864A (en) * 2005-02-23 2006-09-07 Yamaha Corp Terminal for processing voice signals of a plurality of talkers, server apparatus, and program
JP5366043B2 (en) * 2008-11-18 2013-12-11 株式会社国際電気通信基礎技術研究所 Audio recording / playback device

Also Published As

Publication number Publication date
JP2012147196A (en) 2012-08-02

Similar Documents

Publication Publication Date Title
US11294619B2 (en) Earphone software and hardware
EP3424229B1 (en) Systems and methods for spatial audio adjustment
US9380374B2 (en) Hearing assistance systems configured to detect and provide protection to the user from harmful conditions
CA2812014C (en) Method and apparatus for multi-sensory speech enhancement on a mobile device
WO2016167878A1 (en) Hearing assistance systems configured to enhance wearer's ability to communicate with other individuals
US11893997B2 (en) Audio signal processing for automatic transcription using ear-wearable device
EP3095252A2 (en) Hearing assistance system
WO2019090283A1 (en) Coordinating translation request metadata between devices
CN112995874B (en) Method for coupling two hearing devices to each other and hearing device
WO2018088319A1 (en) Reproduction terminal and reproduction method
WO2016167877A1 (en) Hearing assistance systems configured to detect and provide protection to the user harmful conditions
CN116324969A (en) Hearing enhancement and wearable system with positioning feedback
JP5594152B2 (en) NAM conversation support system and NAM conversation support method
JP2007187748A (en) Sound selective processing device
CN112188341B (en) Earphone awakening method and device, earphone and medium
US10805710B2 (en) Acoustic device and acoustic processing method
WO2024202805A1 (en) Acoustic processing device, information transmission device, and acoustic processing system
CN114830692A (en) System comprising a computer program, a hearing device and a stress-assessing device
CN111314824A (en) Communication device, communication system, and associated methods with location-dependent spatial source generation
CN111149373B (en) Hearing device for assessing voice contact and related method
JP2022110759A (en) Conversation support device and conversation support system
JP2024146519A (en) Information processing system, hearing device and information processing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140422

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140708

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140721

R150 Certificate of patent or registration of utility model

Ref document number: 5594152

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees