CN110310622A - 语音传输系统 - Google Patents

语音传输系统 Download PDF

Info

Publication number
CN110310622A
CN110310622A CN201910191839.0A CN201910191839A CN110310622A CN 110310622 A CN110310622 A CN 110310622A CN 201910191839 A CN201910191839 A CN 201910191839A CN 110310622 A CN110310622 A CN 110310622A
Authority
CN
China
Prior art keywords
voice
unmanned plane
unmanned vehicle
voice data
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910191839.0A
Other languages
English (en)
Inventor
宫胁慎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kuolida Software Co Ltd
Original Assignee
Kuolida Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kuolida Software Co Ltd filed Critical Kuolida Software Co Ltd
Publication of CN110310622A publication Critical patent/CN110310622A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C17/00Arrangements for transmitting signals characterised by the use of a wireless electrical link
    • G08C17/02Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • H04R27/04Electric megaphones
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64CAEROPLANES; HELICOPTERS
    • B64C39/00Aircraft not otherwise provided for
    • B64C39/02Aircraft not otherwise provided for characterised by special use
    • B64C39/024Aircraft not otherwise provided for characterised by special use of the remote controlled vehicle type, i.e. RPV
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/0011Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot associated with a remote control arrangement
    • G05D1/0038Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot associated with a remote control arrangement by providing the operator with simple or augmented images from one or more cameras located onboard the vehicle, e.g. tele-operation
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/0094Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot involving pointing a payload, e.g. camera, weapon, sensor, towards a fixed or moving target
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/086Detection of language
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64UUNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
    • B64U2101/00UAVs specially adapted for particular uses or applications
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64UUNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
    • B64U2101/00UAVs specially adapted for particular uses or applications
    • B64U2101/20UAVs specially adapted for particular uses or applications for use as communications relays, e.g. high-altitude platforms
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64UUNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
    • B64U2101/00UAVs specially adapted for particular uses or applications
    • B64U2101/30UAVs specially adapted for particular uses or applications for imaging, photography or videography
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64UUNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
    • B64U50/00Propulsion; Power supply
    • B64U50/10Propulsion
    • B64U50/19Propulsion using electrically powered motors
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/028Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles

Abstract

本发明提供能够不区分本国人以及外国人地使用无人机来传输必要消息的语音传输系统。本发明的语音传输系统具备:无人飞行器;操纵终端,其用于操纵该无人飞行器;以及信息终端,其经由网络能够访问下述的服务器,并能够从该服务器下载下述的语音数据,即,该服务器能够将由相应国家的官方语言制作出来的文本数据翻译成官方语言以外的指定的语言,并且提供将已翻译出来的所述文本数据转换为语音数据的服务。信息终端将从所述服务器下载下来的指定语言的语音数据发送给无人飞行器,该无人飞行器将所述指定语言的语音数据从安装于机体上的扬声器输出出去,来作为语音消息。

Description

语音传输系统
技术领域
本发明涉及利用语音向公众传输消息的语音传输系统。
背景技术
作为利用语音向公众传输消息的方法,有:使用设置在市政厅的房屋上等的扩音器的方法、在车辆上搭载扩音器并由人来驾驶该车辆而在负责区域巡回的方法。
其中,使用固定的扩音器的方法会导致:在设置了扬声器的附近其音量令人产生不快。另外,能覆盖的区域的大小也有限,需要每隔一定的区域设置扩音器,所以设置成本增大。
另一方面,在车辆上搭载扩音器的方法会导致:若区域范围大则在传输上耗费时间,而且,当所传输的信息为灾害信息等紧急信息的情况下,巡回车辆上乘坐的人在安全性上也存在着问题。
作为解决上述问题的方式,提出了如下系统,即:在被称为无人机的无人飞行器上搭载扬声器,一边使无人机移动一边利用语音来传输消息的系统(参照专利文献1)。
若使用专利文献1中记载的语音传输系统,则无需以大音量输出语音,而且对象方稀疏地存在于范围大的区域内的情况下,也能够有效并安全地以低成本利用语音来传输信息。
现有技术文献
专利文献
专利文献1:WO2016/171160
专利文献2:日本特开2015-126535号公报
发明内容
另一方面,在以观光目的出访国外的人已呈现增加的现今,不仅仅是观光地、城市,以前几乎没见过外国人的地方城市也有外国人频繁到访。
在这样的状况下,当发生灾害而对人们进行避难疏导的情况、或者禁止进入危险区域等的警告的情况下,由于在上述的现有的语音传输系统中,使用所访问的国家的官方语言来进行传输消息,所以,无法恰当地引导到访该地区的外国人,而且无法防止到访该地区的外国人进入危险区域等。
作为上述问题的解决方案,可以考虑将精通外语的人采用为无人机的操作者,并由该操作者使用外语从无人机的扬声器传递消息的方案,但事实上,确保精通外语的操作者是极其困难的。
本发明是鉴于如上所述的状况而提出的,目的在于提供能够不区分本国人和外国人地使用无人机来传输必要的消息的语音传输系统。
为了实现上述目的,本发明所涉及的语音传输系统的特征在于,具备:
无人飞行器,其具有多个转子,该无人飞行器能够在空中向上下左右飞行,且在机体安装有扬声器;
操纵终端,其通过无线能够与所述无人飞行器进行通讯,用于操纵所述无人飞行器;以及
信息终端,其经由网络能够访问下述的服务器,并能够从该服务器下载下述的语音数据,即,该服务器能够将由相应国家的官方语言制作出来的文本数据翻译成官方语言以外的指定的语言,并且提供将被翻译出来的所述文本数据转换为语音数据的服务,
所述信息终端将从所述服务器下载下来的指定的语言的语音数据发送给所述无人飞行器,
该无人飞行器将所述指定的语言的语音数据从安装于机体上的扬声器输出出去,来作为语音消息。
在此,优选为,在所述无人飞行器上搭载有摄像机,并且在所述操纵终端搭载有:对由所述摄像机拍摄到的影像进行显示的监视器,
当所述监视器的画面上显现有应当被传输语音消息的对象方时,所述信息终端会按照操作者的指示而将所述指定的语言的语音数据读取出来,并发送给所述无人飞行器。
另外,优选为,在所述信息终端的存储部预先存储有:由所述官方语言制作出来的文本数据的语音数据,
所述信息终端将从所述服务器下载下来的指定的语言的语音数据、和从所述存储部读取出来的所述官方语言的语音数据以规定的时间间隔进行排列,来制作出多种语言的语音数据,并将所述多种语言的语音数据发送给所述无人飞行器,
所述无人飞行器从所述扬声器重复输出所述多种语言的语音数据。
优选为,所述摄像机借助能够变更拍摄方向的第1方向控制器而被安装于所述无人飞行器的机体上,能够按照被输入到所述操纵终端的操作者的指示,来变更拍摄方向。
优选为,在所述操作者指定了已在所述监视器的画面上显现有的语音消息传输的对象方时,所述无人飞行器自主地飞行到所述对象方的上方。
优选为,所述操纵终端与所述信息终端为一体构成,并且所述信息终端的输入显示部由触摸屏式的显示器构成,所述触摸屏式的显示器兼用作所述操纵终端的输入装置以及监视器。
优选为,所述扬声器借助能够改变语音的发送方向的第2方向控制器而被安装于所述无人飞行器的机体上,所述第2方向控制器与所述第1的方向控制器同步进行动作。
根据本发明所涉及的语音传输系统,针对于不懂所到访的国家的官方语言的外国人,也能够在发生灾害时恰当地进行避难引导,并且还能够防止进入到禁止区域等。
附图说明
图1是示出了本发明的实施方式1所使用的无人机的外观的主视图。
图2是示出了实施方式1中的无人机的操纵系统的构成的框图。
图3是示出了实施方式1中的语音数据的发送系统的构成的框图。
图4是示出了“文本读取服务”的输入画面的图。
图5是示出了在本发明的实施方式2中使用的无人机的外观的立体图。
图6是示出了实现无人机的自主移动的步骤的流程图。
图7是示出了无人机的自主飞行的样子的图。
图8是示出了本发明的实施方式3所使用的无人机的外观的主视图。
附图标记说明
1:无人机;2:操纵终端;3:信息终端;4:公用电话网;5:供应商;6:因特网;7:服务器;10:机体;11:转子;12:摄像机;13:方向控制器;14、332:扬声器;15、331:麦克风;16:飞行控制器;17:ESC;18、36:通信模块;19、33:语音处理部;21、161:控制装置;22、163:无线收发部;23:输入装置;24:监视器;31:控制部;32:无线通信部;34、162、211:存储部;35:输入显示部;164:传感器组;165:GPS接收器;143、181、221、321、361:天线。
具体实施方式
下面,参照附图,对本发明的实施方式所涉及的语音传输系统进行说明。
(实施方式1)
<无人机的外观和操纵系统的构成>
在图1中,示出了本发明的实施方式1所使用的无人机的外观。另外,在图2中,示出了无人机的操纵系统的构成。
无人机一般是指:能够进行远程操作、或自动操纵的没有人的飞行器。如图1所示,在本实施方式中,使用了:在从机体10向四周伸出的4个臂的前端上安装有转子11的无人机1,通过使转子11旋转而产生升力。
转子11由桨叶111和未图示的马达来构成,在马达的旋转轴安装有桨叶111。通过使转子11旋转的方向改变而产生反向作用,防止机体本身旋转,并且将陀螺仪传感器、气压传感器的数据整合而进行姿势控制、高度维持。在机体10的下表面安装有:4个脚101、摄像机12、改变摄像机12的拍摄方向的方向控制器13、扬声器14、以及麦克风15。
方向控制器13内置有2个马达(未图示),通过控制各个马达的旋转,如箭头所示,在水平面内以及垂直面内进行旋转,从而能够变更摄像机12的拍摄方向。
基于图2,对无人机1的操纵系统的构成进行说明。无人机1由操作者进行操作,并与通过无线进行操纵的指示的操纵终端2一体使用。
无人机1除了前述的转子11、摄像机12、方向控制器13、扬声器14和麦克风15以外,还具备飞行控制器16、ESC(Electronic Speed Controller,电子速度控制器)17和蓄电池。来自未图示的蓄电池的直流电被供给到各部,从而发挥各自的功能。
飞行控制器16集中管理4个转子11的动作,并控制机体10在空中的姿势、飞行动作。飞行控制器16具备作为微型控制器而发挥功能的控制装置161,该控制装置161由进行运算处理的CPU、存储有规定CPU的动作的程序的ROM、以及作为CPU的工作存储器而发挥功能的RAM来构成。
飞行控制器16还具备:在与操纵终端2之间进行通讯的无线收发部163、用于控制飞行的传感器组164以及GPS接收器165。在传感器组164中包括:用于检测机体10的加速度以及角速度的加速度传感器及角速度传感器、用于检测机体10的高度的气压传感器、以及用于检测机体10的方位的地磁传感器。
从控制装置161输出的控制用的数据被分别输入给与4个转子11连接的ESC14,用来控制:使各转子11旋转的马达的转速以及旋转速度。
控制装置161基于上述的传感器组164以及GPS接收器165的输出数据,来获取位置信息,该位置信息包括:机体10的倾斜或旋转、飞行中的纬度以及经度、机体10的高度、以及机体10的方位角。
控制装置161内置有由非易失性存储器构成的存储部162,在存储部162储存有程序,该程序中安装有控制无人机1在飞行时的姿势、基本的飞行动作的算法。程序按照从操纵终端2发过来的指示信号来修改机体10的姿势、位置,同时还使无人机1飞行。
无人机1的操纵可以由操作者使用操纵终端2而手动进行,或者可以预先在存储部162中存储有纬度以及经度、高度、制定飞行路线等的程序,使无人机自主地飞行至目的地。
搭载于无人机1的摄像机12的影像信号是在无线收发部163而被转换为高频信号之后,以2.4GHz频带的电波而从天线143被发送出去。由操纵终端2的天线221接收到的影像信号被显示于监视器24的画面上。
此外,在本实施方式中,虽然使用了:在机体的周围安装有4个转子并且具备利用2个马达来驱动的方向控制器的无人机,但是,关于无人机的机体的大小、转子的数量、方向控制器的结构等,只要配合搭载于机体的扬声器、摄像机的大小、重量而适当地选择即可。
接下来,操纵终端2具备:控制装置21、无线收发部22、输入装置23、以及监视器24。控制装置21与飞行控制器的控制装置161同样,由CPU、ROM以及RAM构成,对从无人机1接收的数据进行处理,并且还生成:发送给无人机1的数据。
如上所述,监视器24显示:被无人机1的摄像机12拍摄的的影像。在监视器24中不仅显示影像,还显示无人机1的飞行位置等。
控制装置21具备由非易失性存储器构成的存储部211,在该存储部211存储有:从无人机1接收来的影像信号、飞行位置数据等。存储于存储部211的数据能够通过操作者的操作而在事后显示于监视器24。
无线收发部22是实现与无人机1的无线收发部163同样的功能的部分,将由控制装置21生成的操纵的指示信号转换为高频信号而从天线221发送给无人机1,并且接收从无人机1发送来的无线信号而对影像信号等进行播放。
输入装置23是用于操纵无人机的装置,由操纵杆、按键来构成。如前述的图1所示,摄像机12借助方向控制器13而被安装于无人机的机体10上,通过由输入装置23生成的指示信号,而使内置于方向控制器13中的马达进行旋转,由此能够变更摄像机12的拍摄方向。
在通常的状态下,摄像机12相对于无人机1的行进方向而朝向前方且斜下方,所以,操作者在无人机1的飞行中,能够一边利用监视器24来看斜下方的影像一边操纵无人机1。
<语音数据发送系统的构成>
接下来,参照图3以及图4,对于下述的语音数据通信系统的构成进行说明,即:将利用“文本读取服务”的服务器获取到的语音数据从无人机搭载的扬声器作为语音消息予以输出出去。
在图3中,示出了语音数据通信系统的构成。语音数据通信系统由下述的通信系统来构成,即,该通信系统包括:经由无人机1的操作者所持有的信息终端3、公用电话网4、供应商5和因特网6而从“文本读取服务”的服务器7获取语音数据的通信系统、以及将由信息终端3获取到的语音数据通过无线而发送到搭载于无人机1的扬声器14的通信系统。
在本实施方式中,采用了:作为信息终端3而具备便携电话功能的平板型电脑。信息终端3能够经由无线的基站41以及公用电话网4而与供应商5进行通讯。供应商5对作为公用电话网4的用户的信息终端3,提供公用电话网4和因特网6之间的连接服务。下面,将公用电话网4、供应商5以及因特网6统称为“网络”。
首先,对信息终端3的构成和功能进行说明。信息终端3由控制部31、无线通信部32、语音处理部33、存储部34、输入显示部35以及通信模块36构成,各个部件由内部母线30相互连接。另外,在无线通信部32连接有:与基站41之间进行无线通讯的天线321,在语音处理部33连接有:语音输入用的麦克风331和语音输出用的扬声器332。而且,在通信模块36连接有:在与无人机1所搭载的通信模块18之间进行通讯的天线361。
虽然未图示,但控制部31由CPU、ROM以及RAM来构成,其搭载有操作系统,以能够实现与个人电脑同样的功能。
无线通信部32将从语音处理部33被输入的语音数据、从输入显示部35被输入的文本数据转换为高频信号,并且经由天线321而发送到公用电话网4的基站41。另外,无线通信部32接收从基站41发送来的高频信号,并且从高频信号中抽取出语音、图像等数据而进行播放。
语音处理部33基于被输入给麦克风331的操作者的语音信号来生成语音数据,并且对利用无线通信部32抽取的语音数据进行扩展及解码而播放语音信号,并从扬声器332输出。
存储部34由非易失性存储器构成,其存储有便携电话的动作所需的各种程序、电话簿等个人数据,还存储有:用于访问提供“文本读取服务”的服务器的因特网浏览软件、“文本读取服务”用的应用软件。
输入显示部35由触摸屏式的显示器来构成,在画面上显示文字、数字等输入键,操纵者通过对输入键进行指触(利用手指触摸)而输入文字、数字等文本数据。另外,在输入显示部35的画面上显示:经由因特网6以及公用电话网4而从服务器7发过来的网站的图像。
通信模块36是在与无人机1之间相互进行通信的模块,在本实施方式中,采用了进行2.4GHz频带的无线通信的数字音频模块。
另一方面,在无人机1的机体10上搭载有:具有与信息终端3的通信模块36同样的功能的通信模块18以及语音处理部19,在语音处理部19连接有:扬声器14和麦克风15。语音处理部19将从信息终端3发过来的数字语音数据转换为模拟语音信号,并且将从麦克风15被输入的模拟语音信号转换为数字语音数据。因此,在信息终端3与无人机1之间,能够与通常的无人机同样地进行通讯。
此外,由于安装于无人机1的扬声器14需要从空中向位于地面上的对象方可靠地传输语音消息,所以,优选为重量轻且适合传输语音消息的扬声器。作为这样的扬声器,优选使用如专利文献2中记载的压电扬声器。
<“文本读取服务”的内容>
接下来,使用上述的图3以及新的图4,对通过服务器7提供的“文本读取服务”进行说明。在本实施方式中,以外国人以观光目的访问日本的情况为例进行说明。
在以下说明中,“文本读取服务”例如为以“亚马逊波利”(AmazonPolly)这一名称提供的服务,是将日语文章翻译成指定的外语并且以语音输出的服务。
在图4中,示出了“文本读取服务”的输入画面S。操作者使用信息终端3而访问服务器7,并打开“文本读取服务”的输入画面S。然后,在画面S的上部的框F1中,写入作为翻译对象的日语文本数据。然后,打开在画面S的下端的框F2的窗口而确定翻译的语言,而且指定以男性以及女性中的哪一种来进行语音输出。
在框F2中,显示有“打开语音”以及“下载MP3”这两个按键。用户若对“打开语音”的按键进行指触(利用手指触摸),则从信息终端3的扬声器332就会以男性或者女性的声音来输出已被翻译成指定语言的文本数据的内容。
另一方面,若用户对“下载MP3”的按键进行指触,则以MP3(MPEG-1Audio Layer-3)的格式已被压缩编码的语音数据就会被下载至信息终端3,并存储至存储部34。
在将存储于信息终端3的存储部34的语音数据从无人机1的扬声器14输出的情况下,若信息终端3的操作者从输入显示部35指示发送语音数据,则从存储部34读取出来的MP3格式的语音数据就会暂时由语音处理部33被扩展及解码而转换为数字语音数据,之后,利用通信模块36而被转换为高频信号,并从天线361被作为无线信号而发送出去。
由天线181来接收上述无线信号的无人机1又利用通信模块18来解调语音数据,并且利用语音处理部19而转换为模拟的语音信号,之后从扬声器14输出。
<语音传输系统的动作>
接下来,对于本发明所涉及的语音传输系统,想象出具体的场面来说明动作。如上所述,语音传输系统是在发生了灾害时对身处受灾地区的外国人进行避难引导、或者使进入到危险区域的外国人移动到区域外时使用。
下面,假定如下情况而对语音传输系统的动作进行说明,即,当到访滑雪场的外国人进入禁止滑行区域而滑雪时,从无人机的扬声器发出呼唤,使之移动到区域外。假设经事先调查,得知:在该滑雪场中,除了日本人以外,从澳大利亚以及中国来访的观光客较多。
操作者在使无人机1飞行之前,使用信息终端3而访问“文本读取服务”的服务器7,并获取:从无人机1的扬声器14输出的语音数据。具体而言,如图4的框F1所记载那样,输入日语的文本数据—“此处为禁止滑行区域。请您离开”。
由于经过上述的调查结果,得知:在该滑雪场中,除了日本以外,从澳大利亚以及中国来访的观光客较多,所以作为督促离开禁止滑行区域的语言,选择日语、英语以及中文。然后,利用“文本读取服务”来获取:“此处为禁止滑行区域。请您离开。”的英语以及中文的MP3格式的语音数据,并存储至信息终端3的存储部34。
信息终端3的操作者将使用麦克风331而制作出的“此处为禁止滑行区域。请您离开。”的日语的语音数据利用语音处理部33进行D/A转换,由此准备出数字语音数据。另外,操作者将存储于存储部34的MP3格式的语音数据利用语音处理部33来进行扩展及解码,由此准备出英语以及中文的数字语音数据。
按照被输入至输入显示部35的指示,将以上述方式准备出的日语、英语以及中文的数字语音数据隔开规定的时间间隔进行排列,从而制作出从无人机1的扬声器14播放的语音数据。所制作出来的语音数据被存储至存储部34。
接下来,操作者持有无人机1、操纵终端2以及信息终端3而移动至监视对象区域,在该情况下为移动至滑雪场。原则上,在能够目视的范围内由两个人一边监视一边进行无人机的飞行,所以,优选为如下方式,即,由1个人操作操纵终端2而操纵无人机1,由另一个人操作信息终端3,使得从无人机1的扬声器14播放上述的消息。
操作者操作操纵终端2而使无人机1在成为监视对象的禁止滑行区域的上空飞行。此时,可以通过手动操作操纵终端2的操纵杆(输入装置)23而使无人机1移动,也可以使无人机以存储于控制装置16的存储部162中的路线以及高度自主地飞行。
在无人机1的飞行中,操作者利用操纵终端2的监视器24来确认由摄像机12拍摄到的影像,当发现有人进入到了禁止滑行区域的情况下,操作操纵终端2的操纵杆而使无人机1移动到对象方的上空,并悬停在那里。
在该状态下,另一个操作者操作信息终端3而读取出已存储于存储部34的语音数据,并通过通信模块36发送到无人机1。由无人机1的通信模块18接收到的语音数据会从扬声器14被输出出去,日语、英语以及中文的消息—“此处为禁止滑行区域。请您离开”隔一定的时间间隔而重复播放。
如上所述,由于到访该区域的对象方为日本人、澳大利亚人或者中国人中的某一种的可能性较高,所以,通过利用上述的消息,来督促离开禁止滑行区域,从而能够将事故的发生防患于未然。
(实施方式2)
在实施方式1中,对于在操纵终端2的监视器24显现出的对象方,虽然操作者通过手动操作操纵终端2的操纵杆,使无人机移动到对象方的上空,但是,由于随着移动,摄像机12的拍摄范围发生变化,所以,需要控制方向控制器13来改变摄像机12的拍摄方向。
然而,一边操作无人机1一边改变摄像机12的拍摄方向是需要事前培训的,在想要尽快向对象方传递该区域是危险区域的情况下,利用手动会妨碍无人机的操作。因此,在本实施方式中,使无人机自主进行向对象方的上空的移动。
在图5中,示出了本实施方式所使用的操纵终端2和信息终端3的外观。在本实施方式中,通过使用将操纵终端2和信息终端3一体化的终端2A,能够改善终端的便携性和操作性。
具体而言,如图5所示,在操纵终端2的壳体安装有一对臂25,在该臂上固定有信息终端3。而且,在图5所示的一体化终端2A中,拆卸了操纵终端2的监视器24,作为信息终端3的输入显示部35的触摸屏式的显示器兼具备该监视器24的功能。相应地,输入显示部35不仅具备监视器的功能,还作为触摸屏式的输入单元而被使用。
接下来,参照图6以及图7,对无人机1的自主移动进行说明。图6是示出了实现无人机1的自主移动的步骤的流程图,图7是示出了此时的无人机1的飞行样子的图。
通过操作者的操作,使无人机飞行在禁止滑行区域的高度H1的上空(步骤S1)。如上所述,在无人机1的飞行中,操作者通过图5所示的一体化终端的监视器35,能够看见利用无人机1的摄像机12拍摄的影像。在图7所示的状态下,在监视器35的画面上显示出:无人机1的行进方向的斜下方的影像。
在通过监视器35而确认到对象方H进入到了禁止滑行区域的情况下(在步骤S2中为“是”),操作者对显示在监视器35的画面的对象方进行指触(利用手指触摸),指示无人机1移动到对象方H的上方(步骤S3)。
在无人机1的控制装置161的存储部162中,预先存储有:使无人机移动到在监视器35的画面上进行了指触的位置的程序,控制装置161将该程序读取出来并执行,使无人机1移动到指定的位置。
具体而言,在图7中,若将无人机1的高度设为H1,并将摄像机12相对于水平线的倾斜角设为θ,则移动距离为:从无人机1到对象方H的水平距离L=H1/tanθ(步骤S3)。接着,无人机1从该位置下降到扬声器14的语音能传到对象方H的高度H2(在步骤S4中为“是”),并悬停在那里。
然后,信息终端3读取出已:存储于存储部34的语音数据、即以一定的间隔排列“此处为禁止滑行区域。请您离开。”的日语、英语以及中文的消息而成的语音数据,并通过通信模块18发送到无人机1。接收到上述的语音数据的无人机1又利用语音处理部19而将数字语音数据转换为模拟的语音信号,之后,从扬声器14输出去。
如上所述,在本实施方式中,若操作者对在一体化终端2A的监视器画面显现出的对象方进行指触,这之后,无人机就会自主地移动到对象方的上方,所以,无人机的操纵得到飞跃性的简化。
此外,在本实施方式中,虽然以使无人机在白天飞行为前提进行了说明,但是,当代替摄像机12而将红外相机搭载在无人机的情况下,通过同样的操作,也能够使无人机在夜间自主地飞行。
(实施方式3)
在图8中,示出了:本实施方式所使用的无人机1的构成。在本实施方式中,不同于图1所示的构成,借助具备与方向控制器13同样的功能的方向控制器18而将扬声器14安装在无人机的机体10。
在上述的实施方式1、2中,对从固定于无人机1的机体10下表面上的扬声器输出语音消息的情况进行了说明。这种情况下,从扬声器的指向特性来看,若不使无人机1移动到对象方的上空,就会发生无法将语音消息传输到对象方的情况。
对此,在本实施方式中,由于使方向控制器13与方向控制器18同步进行动作,所以,摄像机12的拍摄方向与扬声器14的语音发送方向一直一致。若采用这样的构成,就在无人机与对象方之间的距离较短的情况下,只要对在监视器25的画面显现出的对象方发送语音消息,则不用使无人机1移动到对象方的上方就能够传输语音消息。
本实施方式所涉及的无人机如果在洞穴的入口附近、大树的树根等有妨碍飞行路径的壁、树枝的场所,从无人机向对象方传输消息时是特别有效。
但是,在采用了上述的构成的情况下,由于方向控制器18的设置而导致无人机整体的重量变重,能够飞行的距离会变短,所以,需要在对设置方向控制器的优点和缺点进行比较考量之后,决定方向控制器18的采用。
此外,在上述的各实施方式中,对对应于到访该区域的外国人的人数而利用语音来传输日语、英语以及中文的消息的情况进行了说明,但传输的语言并不限定于此。目前,由于利用“文本读取服务”提供的语言超过20种,所以,只要根据到访该区域的外国人来选择语言即可。
另外,在上述的各实施方式中,对本发明所涉及的语音传输系统能够有效应用于下述的情况进行了说明,但其用途并不限定于此,即:发生灾害时用于对人们进行避难引导的情况、以及用于禁止进入危险区域等的警告的情况。例如,在广阔的会场举办活动的情况下,不用设置引导员,而是通过无人机以特定国家的语言来广播引导消息,就能够实现对人们顺利的引导。
此外,在上述的各实施方式中,以规定的时间间隔而从扬声器输出:操作者预先准备出的多种语言的语音消息。对此,若通过在操纵终端上搭载有能够识别人脸的软件,根据在监视器画面显现出的人的骨骼、脸部特征来判别人种,来传输认为最适合该人种的语言的语音消息,就能够省略不必要的语言来传输,从而能够实现消息传输的有效化。

Claims (7)

1.一种语音传输系统,其特征在于,具备:
无人飞行器,其具有多个转子,该无人飞行器能够在空中向上下左右飞行,且在机体安装有扬声器;
操纵终端,其通过无线能够与所述无人飞行器进行通讯,并用于操纵所述无人飞行器;以及
信息终端,其经由网络能够访问下述的服务器,并能够从该服务器下载下述的语音数据,即,该服务器能够将由相应国家的官方语言制作出来的文本数据翻译成官方语言以外的指定的语言,并且提供将已翻译出来的所述文本数据转换为语音数据的服务,
所述信息终端将从所述服务器下载下来的指定的语言的语音数据发送给所述无人飞行器,
所述无人飞行器将所述指定的语言的语音数据从安装于机体上的扬声器输出出去,来作为语音消息。
2.根据权利要求1所述的语音传输系统,其特征在于,
在所述无人飞行器上搭载有摄像机,并且在所述操纵终端搭载有:对由所述摄像机拍摄到的影像进行显示的监视器,
当所述监视器的画面上显现出应当被传输语音消息的对象方时,所述信息终端按照操作者的指示而将所述指定的语言的语音数据读取出来,并发送给所述无人飞行器。
3.根据权利要求1或2所述的语音传输系统,其特征在于,
在所述信息终端的存储部预先存储有:由所述官方语言制作出来的文本数据的语音数据,
所述信息终端将从所述服务器下载下来的指定的语言的语音数据、和从所述存储部读取出来的所述官方语言的语音数据以规定的时间间隔进行排列,来制作出多种语言的语音数据,并将所述多种语言的语音数据发送给所述无人飞行器,
所述无人飞行器从所述扬声器重复输出所述多种语言的语音数据。
4.根据权利要求2所述的语音传输系统,其特征在于,
所述摄像机借助能够变更拍摄方向的第1方向控制器而被安装于所述无人飞行器的机体上,能够按照被输入到所述操纵终端的操作者的指示,来变更拍摄方向。
5.根据权利要求2所述的语音传输系统,其特征在于,
当所述操作者指定已在所述监视器的画面上显现出的语音消息传输的对象方时,所述无人飞行器自主地飞行到所述对象方的上方。
6.根据权利要求2所述的语音传输系统,其特征在于,
所述操纵终端与所述信息终端为一体构成,并且所述信息终端的输入显示部由触摸屏式的显示器构成,
所述触摸屏式的显示器兼用作所述操纵终端的输入装置以及监视器。
7.根据权利要求4所述的语音传输系统,其特征在于,
所述扬声器借助能够改变语音的发送方向的第2方向控制器而被安装于所述无人飞行器的机体上,所述第2方向控制器与所述第1的方向控制器同步进行动作。
CN201910191839.0A 2018-03-20 2019-03-14 语音传输系统 Pending CN110310622A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-051882 2018-03-20
JP2018051882A JP6624747B2 (ja) 2018-03-20 2018-03-20 音声伝達システム

Publications (1)

Publication Number Publication Date
CN110310622A true CN110310622A (zh) 2019-10-08

Family

ID=67985962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910191839.0A Pending CN110310622A (zh) 2018-03-20 2019-03-14 语音传输系统

Country Status (3)

Country Link
US (1) US10602287B2 (zh)
JP (1) JP6624747B2 (zh)
CN (1) CN110310622A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180186472A1 (en) * 2016-12-30 2018-07-05 Airmada Technology Inc. Method and apparatus for an unmanned aerial vehicle with a 360-degree camera system
US9984455B1 (en) * 2017-06-05 2018-05-29 Hana Resources, Inc. Organism growth prediction system using drone-captured images
JP6675603B1 (ja) * 2019-08-08 2020-04-01 株式会社T&T 避難誘導用ドローン
US11882129B2 (en) * 2020-07-15 2024-01-23 Fenix Group, Inc. Self-contained robotic units for providing mobile network services and intelligent perimeter
JP7094421B1 (ja) * 2021-05-17 2022-07-01 楽天グループ株式会社 無人航空機の制御システム、制御方法、及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171498A (ja) * 2004-12-17 2006-06-29 Fortune Gate:Kk 音声合成システム、音声合成方法および音声合成サーバ
CN102233191A (zh) * 2010-05-07 2011-11-09 上海九鹰电子科技有限公司 一种兼有语音控制功能的航模
CN102693725A (zh) * 2011-03-25 2012-09-26 通用汽车有限责任公司 依赖于文本信息语境的语音识别
CN104380349A (zh) * 2013-04-15 2015-02-25 弗莱克斯电子有限责任公司 车辆入侵者警报检测和指示
WO2016171160A1 (ja) * 2015-04-20 2016-10-27 株式会社プロドローン 音声伝達システム
JP2017063287A (ja) * 2015-09-24 2017-03-30 株式会社オプティム 情報処理装置、情報処理方法及びそのプログラム。

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6385586B1 (en) * 1999-01-28 2002-05-07 International Business Machines Corporation Speech recognition text-based language conversion and text-to-speech in a client-server configuration to enable language translation devices
JP4024592B2 (ja) * 2002-05-21 2007-12-19 株式会社日立国際電気 防災無線システム
JP4219719B2 (ja) * 2003-03-28 2009-02-04 三菱電機エンジニアリング株式会社 スピーカー付き撮像装置
JP4342355B2 (ja) * 2004-03-19 2009-10-14 中国電力株式会社 無人飛行体を利用した公衆への告知システム
JP5358843B2 (ja) * 2008-07-09 2013-12-04 シャープ株式会社 音出力制御装置、音出力制御方法、及び音出力制御プログラム
JP6268353B2 (ja) 2013-12-26 2018-01-31 有限会社ZenTec 分散配置型圧電スピーカーネットワークシステムおよび圧電スピーカー装置
GB2523353B (en) * 2014-02-21 2017-03-01 Jaguar Land Rover Ltd System for use in a vehicle
US9747901B1 (en) * 2015-02-27 2017-08-29 Amazon Technologies, Inc. Speech interaction for unmanned aerial vehicles
CN108141512B (zh) * 2015-09-30 2021-06-22 株式会社尼康 飞行装置、移动装置、电子设备以及计算机可读存储介质
JP6395187B2 (ja) * 2016-01-08 2018-09-26 株式会社日立国際電気 情報配信装置
FR3048843A1 (fr) * 2016-03-09 2017-09-15 Parrot Drones Procede d'encodage et de decodage d'une video et dispositifs associes
US10040552B2 (en) * 2016-05-06 2018-08-07 International Business Machines Corporation Alert system for an unmanned aerial vehicle
CN107726923A (zh) * 2016-08-10 2018-02-23 李查启学 具无人飞行器的保全驱逐系统
JP6383769B2 (ja) * 2016-09-08 2018-08-29 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd 無人飛行体、情報処理装置、及び記録媒体
JP6238181B1 (ja) * 2016-10-05 2017-11-29 パナソニックIpマネジメント株式会社 拡声装置およびその制御方法
CA2993718A1 (en) * 2017-01-31 2018-07-31 Albert Williams Drone based security system
US20190227555A1 (en) * 2018-01-22 2019-07-25 GM Global Technology Operations LLC Methods and systems for assisting operation of a road vehicle with an aerial drone

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171498A (ja) * 2004-12-17 2006-06-29 Fortune Gate:Kk 音声合成システム、音声合成方法および音声合成サーバ
CN102233191A (zh) * 2010-05-07 2011-11-09 上海九鹰电子科技有限公司 一种兼有语音控制功能的航模
CN102693725A (zh) * 2011-03-25 2012-09-26 通用汽车有限责任公司 依赖于文本信息语境的语音识别
CN104380349A (zh) * 2013-04-15 2015-02-25 弗莱克斯电子有限责任公司 车辆入侵者警报检测和指示
WO2016171160A1 (ja) * 2015-04-20 2016-10-27 株式会社プロドローン 音声伝達システム
JP2017063287A (ja) * 2015-09-24 2017-03-30 株式会社オプティム 情報処理装置、情報処理方法及びそのプログラム。

Also Published As

Publication number Publication date
JP6624747B2 (ja) 2019-12-25
US20190297438A1 (en) 2019-09-26
US10602287B2 (en) 2020-03-24
JP2019164576A (ja) 2019-09-26

Similar Documents

Publication Publication Date Title
CN110310622A (zh) 语音传输系统
US10741061B1 (en) Mobile computing device for use in controlling wirelessly controlled vehicles
CN104303177B (zh) 执行即时语音翻译的方法及耳机计算装置
KR101636723B1 (ko) 휴대 단말기 및 그 동작 방법
EP3425889A1 (en) Terminal device and control method therefor
CN102939576B (zh) 用于基于手势的远程控制的方法和装置
CN110383712B (zh) 通信中继方法、中继飞行体、程序以及记录介质
EP2627073B1 (en) Terminal apparatus
CN104052867A (zh) 移动终端及其控制方法
CN104520787A (zh) 头戴式计算机作为具有自动语音识别和头部追踪输入的辅助显示器
JP6759445B2 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
CN104521223A (zh) 具有无需手动的紧急反应的头戴式电脑
JP6622660B2 (ja) 位置誘導システムおよび飛行体
CN108061557A (zh) 一种导航方法及移动终端
CN109167884A (zh) 一种基于用户语音的服务方法和装置
CN109412932A (zh) 一种截屏方法和终端
CN109040968A (zh) 路况提醒方法、移动终端及计算机可读存储介质
CN205770189U (zh) 一种带显示屏的无人机
CN109889741A (zh) 字幕显示方法、存储介质和移动终端
CN109857129A (zh) 一种控制电子设备的方法、装置、移动终端及存储介质
CN110637340A (zh) 无人机的扬声器控制方法和设备
CN109873902A (zh) 播放效果展示方法、装置和计算机可读存储介质
CN111532427B (zh) 无人飞行器、方法和存储介质
CN109388471A (zh) 一种导航方法及装置
CN213859288U (zh) 一种人机交互的车载机器人

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191008