CN107889085A - 将语音信号输入到智能装置的方法、电子装置及计算机 - Google Patents
将语音信号输入到智能装置的方法、电子装置及计算机 Download PDFInfo
- Publication number
- CN107889085A CN107889085A CN201610878241.5A CN201610878241A CN107889085A CN 107889085 A CN107889085 A CN 107889085A CN 201610878241 A CN201610878241 A CN 201610878241A CN 107889085 A CN107889085 A CN 107889085A
- Authority
- CN
- China
- Prior art keywords
- intelligent apparatus
- voice
- electronic installation
- speech
- telephone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000009434 installation Methods 0.000 title claims abstract description 95
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 60
- 238000004891 communication Methods 0.000 claims abstract description 43
- 230000009471 action Effects 0.000 claims abstract description 14
- 238000004148 unit process Methods 0.000 claims abstract description 6
- 241001269238 Data Species 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000005611 electricity Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 3
- 241000209140 Triticum Species 0.000 claims description 2
- 235000021307 Triticum Nutrition 0.000 claims description 2
- 241001503991 Consolida Species 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 9
- 241000238558 Eucarida Species 0.000 description 7
- 238000004088 simulation Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000010006 flight Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72409—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明揭露一种将电话机的语音信号输入到智能装置的方法、电子装置及具有非易失性储存装置的计算机。将电话机的语音信号输入到智能装置的方法包括:通过电子装置仿真语音输入单元给智能装置;通过电子装置的RJ‑11连接头与用户线路接口电路从电话机接收电话语音信号;通过电子装置的处理单元处理电话语音信号,以产生语音数据给智能装置;以及通过电子装置的通信单元传送语音数据到智能装置,以由仿真的语音输入单元仿真输入动作给智能装置。
Description
技术领域
本发明涉及一种将电话机的语音信号通过电子装置输入到智能装置的方法、电子装置及具有非易失性储存装置的计算机。
背景技术
现今,智能型手机已被世人广泛地使用,不仅作为远程通信装置,而且也将智能型手机当成语音辨识或语音命令的声音输入装置。智能型手机就像一个智能机器一样,可以执行因特网上的多功能应用,例如获取航班信息或天气预报,或者当成闹钟来使用。另外,智能型手机的语音输入也可以进行将语音转录到文本、语音识别或是语音翻译等功能的应用,操作时,使用者只要按下手上的智能型手机的按键并对它说话即可实现。此外,一般使用者离开家里或办公室时也随身携带着智能型手机,因此,在外出时仍然可以很方便地通过智能型手机来使用上述的应用或功能。
然而,如果使用者将智能型手机放在家里的角落进行充电时,对使用者来说,要实时找到智能型手机可能有些困难,且找到后要按下智能型手机的按键并对它说话以执行上述功能与应用是一件麻烦与困难的事情。此外,当在充电时,拿着智能型手机打电话或接听电话也是一件危险的事情。
另外,市面上有许多种其它型式的声音输入设备,例如蓝牙耳机、蓝牙扬声器与麦克风,或是蓝牙电话,这些设备虽然也可以用来传送语音命令与语音呼叫,然而,这些声音输入设备与电话机相比还是比较贵,而且它们也不像一般按键式电话机被广泛使用。另外,上述的声音输入设备在使用上较为困难,并不像电话机一样,一拿起话筒就可开始说话。而且,对大部分的蓝牙扬声器或蓝牙耳机来说,使用者仍然必须找到该设备所放置的位置,并且要知道按哪个按键才可进行通话。此外,如果是蓝牙扬声器的话,使用上可能有个人隐私泄露的问题,而且扬声器所发出的声音也可能打扰到房间里的其它人。
发明内容
本发明的目的为提供一种将传统电话机(或称按键电话机)的语音信号输入到智能装置的方法、电子装置及具有非易失性储存装置的计算机。
本发明提供一种将电话机的语音信号输入到智能装置的方法,包括:通过电子装置仿真语音输入单元给智能装置;通过电子装置的RJ-11连接头与用户线路接口电路从电话机接收电话语音信号;通过电子装置的处理单元处理电话语音信号,以产生语音数据给智能装置;以及通过电子装置的通信单元传送语音数据到智能装置,以由仿真的语音输入单元仿真输入动作给智能装置。
在一个实施例中,该方法进一步包括:通过通信单元建立智能装置与电子装置之间的联机为蓝牙联机,且仿真的语音输入单元是蓝牙麦克风,蓝牙麦克风与智能装置的内建麦克风具有相同功能。
在一个实施例中,该方法进一步包括:借助处理单元通过RJ-11连接头与用户线路接口电路检测电话机的话筒是否被拿起。
在一个实施例中,该方法进一步包括:通过智能装置分析语音数据,以当成语音命令控制智能装置。
在一个实施例中,该方法进一步包括:通过智能装置对语音数据进行语音辨识。
在一个实施例中,该方法进一步包括:检测电话机的哪一个按键被按压;将被按压按键转换为数字码,以仿真使用者按压键盘;由智能装置依据从语音数据的被按压按键(数字码)的检测结果执行对应的指定任务。
在一个实施例中,电话语音信号是通过用户线路接口电路与处理单元从模拟转换成数字的语音数据,且语音数据没有经处理单元进行语音分析及辨识,而被直接传送至智能装置。
本发明还提供一种电子装置,电子装置包括通信单元、连接接口以及处理单元。通信单元配置以仿真成语音输入单元给智能装置。连接接口包含RJ-11连接头与用户线路接口电路,RJ-11连接头与用户线路接口电路从电话机接收电话语音信号。处理单元处理电话语音信号,以产生语音数据给智能装置;其中,通信单元配置以传送语音数据到智能装置,以由仿真的语音输入单元仿真输入动作给智能装置。
在一个实施例中,电子装置为电路板、芯片、路由器、调制解调器或机顶盒或计算机。
在一个实施例中,通信单元建立智能装置与电子装置之间的联机。
在一个实施例中,该联机为蓝牙联机,且仿真的语音输入单元是蓝牙麦克风,蓝牙麦克风与智能装置的内建麦克风具有相同功能。
在一个实施例中,处理单元通过RJ-11连接头与用户线路接口电路检测电话机的话筒是否被拿起。
在一个实施例中,电话语音信号通过用户线路接口电路与处理单元从模拟转换成数字的语音数据,且语音数据没有经处理单元进行语音分析及辨识,而被直接传送至智能装置。
在一个实施例中,语音数据当成语音命令传送至智能装置,以控制智能装置。
在一个实施例中,智能装置对语音数据进行语音辨识。
在一个实施例中,语音数据包含有关电话机的按键拨号声音的信息,且该信息使智能装置执行指定任务。
本发明还提供一种具有非易失性储存装置的计算机,其储存一个或多个程序,该一个或多个程序包含多个指令,当这些指令被计算机的一个或多个处理器执行时,可使计算机执行将电话机的语音信号输入到智能装置的方法,该方法包括:仿真语音输入单元给智能装置;通过RJ-11连接头与用户线路接口电路从电话机接收电话语音信号;处理电话语音信号,以产生语音数据给智能装置;以及传送语音数据到智能装置,由仿真的语音输入单元仿真输入动作给智能装置。
在一个实施例中,该方法进一步包括:通过通信单元建立智能装置与电子装置之间的联机。
在一个实施例中,该联机为蓝牙联机,且仿真的语音输入单元是蓝牙麦克风,蓝牙麦克风与智能装置的内建麦克风具有相同功能。
在一个实施例中,该方法进一步包括:借助处理单元通过RJ-11连接头与用户线路接口电路检测电话机的话筒是否被拿起。
在一个实施例中,语音数据当成语音命令传送至智能装置,以控制智能装置。
在一个实施例中,智能装置对语音数据进行语音辨识。
在一个实施例中,语音数据包含有关电话机的按键拨号声音的信息,且该信息使智能装置执行指定任务。
在一个实施例中,智能装置为智能型手机或平板计算机。
本发明还提供一种电子装置,使用运行智能装置的语音辨识系统,电子装置包括通信单元以及处理单元。通信单元配置以从语音输入单元接收第一语音数据,并配置与智能装置进行通信。处理单元耦接通信单元,并配置以将第一语音数据作为语音命令通过通信单元输入至智能装置;其中,通信单元配置以接收语音辨识系统的回复以响应从智能装置的语音命令。
在一个实施例中,通信单元配置以从语音输入单元接收第二语音数据,处理单元通过输入第二语音数据至电子装置的操作系统语音服务而取得电子装置的操作系统语音服务的回复。
在一个实施例中,电子装置为通过互联网向用户提供各种应用服务(Over TheTop,OTT)的装置、网际协议通话技术路由器(VoIP Router)、调制解调器或机顶盒,语音输入单元为蓝牙麦克风,且智能装置为智能型手机或平板计算机。
在一个实施例中,电子装置进一步包括连接接口。连接接口包含RJ-11连接头与用户线路接口电路,RJ-11连接头与用户线路接口电路从电话机接收电话语音信号;其中,通信单元仿真智能装置的第二语音输入单元;其中,处理单元处理电话语音信号,以产生PCM语音数据给智能装置;其中,通信单元传送PCM语音数据到智能装置,以由仿真的语音输入单元仿真输入动作给该智能装置;其中,该联机为蓝牙联机,且仿真的语音输入单元是蓝牙麦克风,且蓝牙麦克风与智能装置的内建麦克风具有相同功能。
承上所述,在本发明上述实施例的将电话机的语音信号输入到智能装置的方法、电子装置及具有非易失性储存装置的计算机中,使用者只要拿起传统的按键电话机的话筒并说话,就可控制智能装置执行使用者的语音命令。更进一步来说,在不需要按下电话机的任何按键的情况下,由使用者说出的语音输入就可以让智能装置执行使用者的语音命令(例如打电话给John)或进行语音辨识的工作。
附图说明
图1为根据一个实施例的电子装置与电话机及智能装置配合应用的方块图。
图2为显示通过图1的电子装置将语音信号从电话机输入到智能装置的流程图。
图3为图1的智能装置的功能方块图。
图4显示的由图3智能装置执行的该方法的流程图。
图5为根据另一个实施例的功能方块图。
图6与图7为根据其它实施例如OTT的功能方块图。
具体实施方式
以下将参照相关附图,说明依据本发明优选实施例的将电话机的语音信号输入到智能装置的方法、电子装置与非瞬时计算机可读取储存媒体,其中相同的元件将以相同的附图标记加以说明。
请参照图1所示,其为根据一个实施例的电子装置300与电话机100及智能装置400配合应用的功能方块图。电子装置300与电话机100作为智能装置(smart device)400的语音输入单元(voice input unit)。智能装置400可为一种智能型手机或平板计算机。举例来说,当使用者拿起电话机100的话筒102并说话时,就可通过电子装置300将他的声音变成智能装置400的语音输入。更进一步来说,使用者并不需要按压电话机100的任何按键,使用者的声音就可直接指示智能装置400执行对应的工作。在本实施例中,使用者可直接拿起传统的按键电话,并对传统电话的话筒直接说出“打电话给Jonn”的语音命令给智能装置400、或者可让智能装置400进行语音辨识。
电话机100具有话筒102。电话机100可为一般市售电话机,例如为双音多频式(Dual-Tone Multi-Frequency,DTMF)电话机,即俗称的按键电话。本实施例的电话机100为按键式电话(Push-button telephone)而具有可拨号的多个按键(例如按键0、按键1、按键2、…、按键*、按键#等)。电话机100就像是麦克风一样,可当成一种模拟的语音输入单元而产生模拟的电话语音信号(phone voice signal)。在一般电话的使用上,此模拟的声音信号将被传送到电话公司来打电话与通话。但在本实施例中,当电话机100与电子装置300建立联机后,由电话机100所产生的电话语音信号将被传送至电子装置300。
电子装置300包括电话机100的连接接口302、处理单元308、通信单元310以及存储单元312。电子装置300可实际做为电路板(例如PCB)、集成电路芯片(IC chip)、或路由器(例如网络电话路由器(VoIP Router))、或调制解调器(cable modem)、或机顶盒(set-topbox,STB,或称信号接收译码器),或实作为一台计算机,并不限制。在一个实施例中,电子装置300可以为PCB或IC chip而设置在电话机100的壳体内。
电子装置300通过电话机的连接接口302与电话机100耦接。在本实施例中,电话机的连接接口302包含RJ-11连接头(RJ-11 connector)304与用户线路接口电路(SubscriberLine Interface Circuit,SLIC)306。RJ-11连接头304可以是公头并通过电话线路200与电话机100有线连接,RJ-11连接头304用以连接电话机100与用户线路接口电路306。处理单元308可通过RJ-11连接头304与用户线路接口电路306从电话机100接收电话语音信号S1。用户线路接口电路306也可实际做为芯片或整合于处理单元308中,并不限制。因此,电话机100传送的模拟电话语音信号S1将通过RJ-11连接头304传送至用户线路接口电路306,而此电话语音信号S1是使用者拿起电话机100的话筒102,并对话筒102的麦克风说话时所产生的模拟语音信号。之后,在处理单元308的控制之下,用户线路接口电路306可处理此模拟的电话语音信号S1以产生脉冲编码调变(Pulse-Code Modulation,PCM)格式的电话语音信号S1而传送至处理单元308。举例来说,电话语音信号S1通过用户线路接口电路306与处理单元308从模拟信号(analogy signal)转换成数字信号(digital signal)而产生数字的PCM语音数据(PCM voice data,简称语音数据)S2。此转换可通过PCM来实现,并输出数字的PCM数据。
用户线路接口电路306包含电路,该电路可将按键电路所产生的模拟电话语音信号S1转换成数字的PCM语音数据S2,本实施例的用户线路接口电路306并不需要连接(interface)到公用交换电话网络(PSTN)电话系统或任何电话公司。
以双音多频(DTMF)技术来说,当使用者按下电话机100的某一按键时,电话机100被按压的按键会使用户线路接口电路306产生由两个不同频率所组成的双音调信号(故称为“双音多频”技术)。此双音调信号(或按键信号)将在处理单元308的控制之下,被用户线路接口电路306检测与转换。因此,用户线路接口电路306将与处理单元308配合,以控制、检测以及转换DTMF电话机信号为数字信号。
在一个实施例中,处理单元308例如可包含一个或多个控制器、处理器或核心,并耦接电话机的连接接口302、通信单元310及存储单元312。而通信单元310是用以建立与智能装置400之间的无线联机,例如基于蓝牙协议或是其它通信协议的联机。
此外,存储单元312可储存一个或多个指令或程序,以被处理单元308所存取或执行。其中,存储单元312可为具有非易失性的可读取储存装置(non-volatile readablestorage device),例如为只读存储器(ROM)、或现场可编程门阵列(Field-ProgrammableGate Array,FPGA),或其它形式的内存,并不限定。
请分别参照图1、图2所示,其中,图2为显示通过图1电子装置将语音信号从电话机输入到智能装置的流程图。图2的方法包括步骤S01至步骤S06。
步骤S01为:通过例如通信单元310建立智能装置400与电子装置300之间的联机。其中,该联机可为蓝牙联机;步骤S02为:通过例如通信单元310仿真语音输入单元给智能装置400。或者简单来说,利用通信单元310通知智能装置400,电子装置300将成为语音输入单元;另外,步骤S03为:借助例如处理单元308通过RJ-11连接头304与用户线路接口电路306检测电话机100的话筒102是否被拿起;步骤S04为:通过例如RJ-11连接头304与用户线路接口电路306从电话机100接收模拟的电话语音信号S1;步骤S05为:通过例如处理单元308处理电话语音信号S1,以产生PCM语音数据S2给智能装置400;最后,步骤S06为:通过通信单元310传送PCM语音数据S2到智能装置400,以由仿真的语音输入单元(电子装置300)仿真输入动作给智能装置400。
具体来说,在步骤S01与步骤S02中,电子装置300的通信单元310建立与智能装置400之间的蓝牙联机。在此,通信单元310基于蓝牙协议送出信息给智能装置400,该信息可例如关于电子装置300的ID或电子装置300的类型。而在电子装置300中,内建的信息内容为“语音输入单元”,因此,电子装置300可以仿真成为智能装置400的语音输入单元。之后,智能装置400就可将电子装置300视为蓝牙麦克风,而且此蓝牙麦克风与智能装置400的内建麦克风(或智能装置400本身所有的麦克风)具有相同功能与操作规则。
另外,在步骤S03中,处理单元308通过RJ-11连接头304与用户线路接口电路306检测电话机100的话筒102是否被拿起,。举例来说,如果电话机100的话筒102没有被使用者拿起,则电话机100将不会产生任何的信号给用户线路接口电路306;但是,如果电话机100的话筒102被使用者拿起时,则电话机100将产生信号(例如电压或电流信号)给用户线路接口电路306,此时,该信号将触发处理单元308,使处理单元308产生后续的动作。
在步骤S04中,一旦得知话筒102被拿起,则处理单元308将通过RJ-11连接头304与用户线路接口电路306且通过电话线路200从电话机100接收电话语音信号S1。
在步骤S05中,处理单元308将处理由用户线路接口电路306传来的电话语音信号S1,以产生PCM语音数据S2给智能装置400。其中,处理单元308的“处理”,包含将模拟的电话语音信号S1例如利用脉冲编码调变技术转换成数字的PCM语音数据S2。因此,电话语音信号S1将通过用户线路接口电路306与处理单元308从模拟转换成数字的PCM语音数据S2。此外,用户线路接口电路306也可检测电话机100的哪一个按键被按压,并将该被按压按键转换为数字码,以仿真使用者按压某一键盘(或称按压键盘上的某一按键)。
在步骤S06中,电子装置300已仿真成为智能装置400的语音输入单元,故通信单元310将通过建立的联机(例如蓝牙联机)将PCM的语音数据S2传送至智能装置400,以由仿真的语音输入单元(电子装置300)仿真输入动作给智能装置400。
此外,存储单元312可以储存一个或多个程序,该一个或多个程序包含多个指令,当该些指令被电子装置300的处理单元308执行时,可使电子装置300执行将电话机100的语音输入到智能装置400的上述方法。
请参照图3所示,其为图1的智能装置400的功能方块示意图。
智能装置400可以是行动装置(mobile phone)。一般来说,智能装置400包含有无线输出/入单元402、处理单元404、显示单元406、有线/无线网络接入单元408、输入接口410以及存储单元412。
无线输出/入单元402与处理单元404耦接。无线输出/入单元402(或可称为通信单元)例如可为蓝牙(Bluetooth)单元。处理单元404例如可包含一个或多个控制器、处理器或核心,并耦接无线输出/入单元402、显示单元406、有线/无线网络接入单元408、输入接口410及存储单元412。显示单元406可包含显示面板、监视器(Monitor)与高画质多媒体接口(High Definition Multimedia Interface,HDMI)电缆线。有线/无线网络接入单元408可例如包含Wi-Fi单元、第三代行动通信技术单元(简称3G)、第四代行动通信技术单元(简称4G)、长期演进技术(Long Term Evolution,LTE)单元或局域网络(LAN)模块,或其组合等等。
输入接口410可包含鼠标、遥控器或触控面板,以接收使用者的操作输入。在其它的实施中,输入接口410除了包含触控面板之外,也可包含实体按键。此外,输入接口410也可与显示单元406整合而成为触控显示面板。
存储单元412储存智能装置400的操作系统(例如iOS或Android操作系统)与至少一个APP软件。存储单元412也可储存一个或多个指令或程序,以供处理单元404存取而执行。存储单元412可包含非易失性读取储存装置,或称非瞬时计算机可读取记录媒体,例如只读存储器(ROM)、快闪(Flash)内存、或现场可编程门阵列,或其它形式的内存,并不限定。
另外,请同时参照图3及图4所示,其中,图4显示的由图3智能装置执行的该方法的流程图,该方法包括步骤S11至步骤S17。
步骤S11为:建立智能装置400与电子装置300之间的联机;步骤S12为:将电子装置300仿真成语音输入单元;步骤S13为:从仿真的语音输入单元(电子装置300)取得PCM语音数据S2当成输入动作,其中PCM语音数据S2是来自于电话机100;步骤S14为:分析PCM语音数据S2且当成语音命令以控制智能装置400;步骤S15为:对PCM语音数据S2进行语音辨识;步骤S16为:从PCM语音数据S2中检测被按压按键的拨号;步骤S17为:依据从PCM语音数据S2的被按压按键(数字码)的检测结果执行指定任务。
在步骤S11与步骤S12中,该些步骤是分别对应于上述的步骤S01与步骤S02。例如,在电子装置300通过蓝牙单元建立与智能装置400之间的蓝牙联机及得知蓝芽装置的描述后,智能装置400将电子装置300当成语音输入单元,因此,智能装置400可将电子装置300视为蓝牙麦克风,此蓝牙麦克风与智能装置400的内建麦克风具有相同功能与操作规则。
在步骤S13中,此步骤是对应于上述的步骤S06。因为电子装置300已被智能装置400视为语音输入单元,故智能装置400将通过建立的联机(例如蓝牙联机)而从仿真的语音输入单元(电子装置300)接收PCM语音数据S2且当成输入动作。当智能装置400接收PCM语音数据S2时,智能装置400可选择性地执行步骤S14到步骤S16的至少其中之一的工作。
在从电子装置300的通信单元310接收到PCM语音数据S2后,智能装置400可分析此PCM语音数据S2,或对PCM语音数据S2执行语音辨识。举例来说,在步骤S14中,经分析后,PCM语音数据S2被当成语音命令(voice command),并依据此语音命令(PCM语音数据S2)产生任务命令(task command)。举例来说,若使用者拿起电话机100的话筒102并对话筒102说出“打电话给Mary”时,则PCM语音数据S2将包含“打电话给Mary”的语音命令且被通信单元310传送到智能装置400而被无线输出/入单元402所接收,处理单元404在分析PCM语音数据S2后,智能装置400将依照“打电话给Mary”的任务命令拨打Mary的电话号码,以通过有线/无线网络接入单元408建立与Mary的电话联机。此外,该语音命令也可以控制智能装置400的组件或功能,例如关启或关闭显示单元406。
另外,在步骤S15中,经语音辨识后的PCM语音数据S2的内容也可以被转换成文字,该文字可以自动输入到搜寻引擎(如Google搜寻引擎)以找出相关的信息。
另外,在步骤S16与S17中,因为电话机100的不同按键被按压时可产生不同的DTMF信号,因此,用户线路接口电路306可以检测出电话机100中的哪一个按键被按压,并将该被按压按键转换成数字码以仿真使用者按压键盘,而且被智能装置400接收的PCM语音数据S2也包含电话机100中的哪一个按键被按压的相关信息,该信息可使智能装置400执行指定任务。
以具体例子来说,当使用者按下电话机100的数字键1时,包含按键1的DTMF信号的电话声音信号S1将由处理单元308处理后传送至智能装置400,智能装置400接收并辨识出数字1的DTMF信号时,智能装置400可自动执行动作例如拨号,此快捷键可便于年老者使用与操作。
另外,语音辨识的结果或是上述的指定任务也可以包含语音或声音,此语音或声音也可通过电子装置300与电话线路200从智能装置400回传至电话机100,使使用者可以用电话机100听到该语音或声音。
另外,存储单元412可储存一个或多个程序,该一个或多个程序包含多个指令,这些指令可被处理单元404执行以使智能装置400执行上述的方法。
另外,请参照图5所示,其为根据另一实施例的功能方块示意图。与图1主要的不同在于,电子装置300设在电话机100内或整合于电话机100中。举例来说,本实例的电子装置300例如为电路板或集成电路芯片,其可设置在电话机100的壳体内。
另外,请参照图6所示,其为根据又一实施例的功能方块示意图。本实施例与图1主要不同在于,图6的电子装置500整合了智能装置的某些功能。其中,电子装置500包括耦接电话机100的连接接口502、处理单元508、显示输出510、有线/无线网络接入单元512、输入接口514、无线输出/入单元516以及存储单元518。连接接口502包含RJ-11连接器504及用户线路接口电路(SLIC)506。而显示输出510可为通过电缆线700连接至显示装置600的显示端口(display port)。在此,显示端口可以为HDMI,而电缆线700可为HDMI电缆线,且显示装置600例如但不限于为电视机或监视器(monitor)。此外,无线输出/入单元516可为通信单元,其可通过无线连接方式与其它的装置连接。
在智能装置400中,存储单元412可储存程序、软件或数据,例如iOS操作系统的指令或数据、iOS的Siri语言辨识系统的指令或数据,及使用者的数据,且存储单元412储存的指令与数据都可被处理单元404所执行。在此,智能装置400可运行在iOS操作系统,且可提供iOS Siri语言辨识系统的功能。
另外,电子装置500的存储单元518也可储存程序、软件或数据,例如Android操作系统的指令或数据、Android操作系统语音服务的指令与数据,及使用者的数据。存储单元518也可储存软件或计算机程序,并使用由iOS与Android操作系统的Google语音所提供的服务应用程序接口(Application Programming Interface,API)。另外,存储单元518储存的这些指令与数据可被处理单元508所执行。本实施例的电子装置500运行于Android操作系统,并可使用运行在iOS操作系统的智能装置400的iOS Siri语音辨识系统。另外,无线输出/入单元516(可称为通信单元)配置以从语音输入单元800接收第一语音数据D1,并配置与智能装置400进行通信。另外,处理单元508耦接于无线输出/入单元516,并配置以将第一语音数据D1作为语音命令通过无线输出/入单元516输入至智能装置400。此外,无线输出/入单元516是配置以接收由智能装置400的iOS操作系统的Siri语音辨识所传回的回复,以响应从智能装置400的该语音命令。
处理单元508取得Siri语音辨识系统所传回有关该语音命令的回复后可通过显示输出510将该回复传送到显示装置600,使显示装置600可显示该语音命令的回复内容。此外,处理单元508在取得Siri语音辨识系统所传回有关该语音命令的回复后,可通过无线输出/入单元516输出语音或声音的回复到语音输出装置900,以通过语音输出装置900输出该语音或声音。
在本实施例中,电子装置500可为通过互联网向用户提供各种应用服务(Over TheTop,OTT)的装置、网际协议通话技术路由器(VoIP Router)、调制解调器或机顶盒;语音输入单元800为蓝牙麦克风;智能装置400为智能型手机或平板计算机,而语音输出装置900为蓝牙耳机或蓝牙扬声器。此外,语音输入单元800与语音输出装置900也可整合成为单一构件的耳机。
具体来说,使用者可对语音输入单元800说话,且当使用者说出例如“打电话给Jon”的语音命令给智能装置400时,智能装置400将执行该语音命令以打电话给Jon。此时,使用者的数据(电话号码)并不需要储存于电子装置300,只要储存在智能装置400即可。
连接接口502可接收由来自电话机100的电话语音信号S1。而无线输出/入单元516可仿真成为智能装置400的语音输入单元(第二语音输入单元)。处理单元508可处理电话语音信号S1而产生给智能装置400的PCM语音数据S2。另外,无线输出/入单元516可传送语音数据S2到智能装置400,以仿真智能装置400的语音输入。其中,上述的联机可为蓝牙联机,且该仿真的语音输入单元(第二语音输入单元)是蓝牙麦克风,且该蓝牙麦克风与智能装置400的内建麦克风具有相同功能。因此,处理单元508可将语音数据S2当成语音命令并通过无线输出/入单元516输入至智能装置400。另外,无线输出/入单元516也可配置以接收iOS的Siri语音辨识系统的回复以响应从智能装置400的该语音命令,且响应的内容也可传送到显示装置600而被显示出。此外,响应的声音也可被传送到电话机100而被播放,并不限制。
举例来说,使用者可对电话机502的话筒说话,且当使用者说出例如“打电话给Jon”的语音命令给智能装置400时,智能装置400将执行该语音命令以打电话给Jon。
另外,请参照图7所示,其为根据又一实施例的功能方块示意图。在此,电子装置500并不与智能装置400配合应用。在本实施例中,电子装置500的无线输出/入单元516(可称为通信单元)更配置以接收从语音输入单元800送出的第二语音数据D2,而处理单元508通过输入第二语音数据D2至电子装置500的Android操作系统语音服务后所产生的响应,而取得电子装置500的Android操作系统语音服务的回复,且回复的内容可被传送到显示装置600而被显示出。此外,回复的声音也可被传送到语音输出装置900而被播放。
另外,连接接口502可接收由电话机100送出的电话语音信号S3。而处理单元508是配置以处理电话语音信号S3,以产生PCM语音数据,且处理单元508可通过输入PCM的语音数据给电子装置500的Android操作系统的语音服务后所产生的响应,而取得电子装置500的Android操作系统语音服务的回复,且PCM的语音数据所产生的该回复内容可被传送到显示装置600而被显示出。此外,该回复的声音也可被传送到电话机100而被播放。
举例来说,使用者可以对语音输入单元800或电话机100说出“CX590航班的抵达时间”或“今天的天气如何”的语音命令给电子装置300。此时,电子装置300可以执行搜寻并以声音响应搜寻的结果,使使用者可以听到该结果。
综上所述,本发明上述实施例的将电话机的语音信号输入到智能装置的方法、电子装置及具有非易失性储存装置的计算机中,使用者只要拿起传统的按键电话机的话筒并说话,就可控制智能装置执行使用者的语音命令。更进一步来说,在不需要按下电话机的任何按键的情况下,由使用者说出的语音输入就可以让智能装置执行使用者的语音命令(例如打电话给John)或进行语音辨识的工作。
以上所述仅为举例性,而非限制性。任何未脱离本发明的精神与范畴,而对其进行的等效修改或变更,均应包含在随附的权利要求书中。
Claims (20)
1.一种将电话机的语音信号输入到智能装置的方法,包括:
通过电子装置仿真语音输入单元给所述智能装置;
通过所述电子装置的RJ-11连接头与用户线路接口电路从所述电话机接收电话语音信号;
通过所述电子装置的处理单元处理所述电话语音信号,以产生语音数据给所述智能装置;以及
通过所述电子装置的通信单元传送所述语音数据到所述智能装置,以由所述仿真的语音输入单元仿真输入动作给所述智能装置。
2.根据权利要求1所述的方法,进一步包括:
通过所述通信单元建立所述智能装置与所述电子装置之间的联机,所述联机为蓝牙联机,且所述仿真的语音输入单元是蓝牙麦克风,所述蓝牙麦克风与所述智能装置的内建麦克风具有相同功能。
3.根据权利要求1所述的方法,进一步包括:
借助所述处理单元通过所述RJ-11连接头与所述用户线路接口电路检测所述电话机的话筒是否被拿起。
4.根据权利要求1所述的方法,进一步包括:
通过所述智能装置分析所述语音数据,以当成语音命令控制所述智能装置;及
通过所述智能装置对所述语音数据进行语音辨识。
5.根据权利要求1所述的方法,进一步包括:
检测所述电话机的哪一个按键被按压;
将所述被按压按键转换为数字码,以仿真使用者按压键盘;及
通过所述智能装置依据从所述语音数据的该被按压按键(所述数字码)的检测结果执行指定任务。
6.根据权利要求1所述的方法,其中所述电话语音信号通过所述用户线路接口电路与所述处理单元从模拟转换成数字而产生所述语音数据,且所述语音数据没有经所述处理单元进行语音分析及辨识,而被直接传送至所述智能装置。
7.一种电子装置,与电话机及智能装置配合应用,所述电子装置包括:
通信单元,配置以仿真成语音输入单元给所述智能装置;
连接接口,包含RJ-11连接头与用户线路接口电路,所述RJ-11连接头与所述用户线路接口电路从所述电话机接收电话语音信号;以及
处理单元,处理所述电话语音信号,以产生语音数据给所述智能装置;
其中,所述通信单元配置以传送所述语音数据到所述智能装置,以由所述仿真的语音输入单元仿真输入动作给所述智能装置。
8.根据权利要求7所述的电子装置,其为电路板、芯片、路由器、调制解调器、机顶盒或计算机,其中所述通信单元建立所述智能装置与所述电子装置之间的联机,其中所述联机为蓝牙联机,且所述仿真的语音输入单元是蓝牙麦克风,所述蓝牙麦克风与所述智能装置的内建麦克风具有相同功能。
9.根据权利要求7所述的电子装置,其中所述处理单元通过所述RJ-11连接头与所述用户线路接口电路检测所述电话机的话筒是否被拿起。
10.根据权利要求7所述的电子装置,其中所述电话语音信号通过所述用户线路接口电路与所述处理单元从模拟转换成数字而产生所述语音数据,且所述语音数据没有经所述处理单元进行语音分析及辨识,而被直接传送至所述智能装置。
11.根据权利要求7所述的电子装置,其中所述语音数据当成语音命令传送至所述智能装置,以控制所述智能装置,其中所述智能装置对所述语音数据进行语音辨识。
12.根据权利要求7所述的电子装置,其中所述语音数据包含有关所述电话机的按键拨号声音的信息,且所述信息使所述智能装置执行指定任务。
13.一种具有非易失性储存装置的计算机,其储存一个或多个程序,所述一个或多个程序包含多个指令,当所述指令被所述计算机的一个或多个处理器执行时,可使所述计算机执行将电话机的语音信号输入到智能装置的方法,所述方法包括:
仿真语音输入单元给所述智能装置;
通过RJ-11连接头与用户线路接口电路从所述电话机接收电话语音信号;
处理所述电话语音信号,以产生语音数据给所述智能装置;以及
传送所述语音数据到所述智能装置,以由所述仿真的语音输入单元仿真输入动作给所述智能装置。
14.根据权利要求13所述的计算机,其中所述方法进一步包括:
建立所述智能装置与所述电子装置之间的联机,其中所述联机为蓝牙联机,且所述仿真的语音输入单元是蓝牙麦克风,所述蓝牙麦克风与所述智能装置的内建麦克风具有相同功能。
15.根据权利要求13所述的计算机,其中所述方法进一步包括:
通过所述RJ-11连接头与所述用户线路接口电路检测所述电话机的话筒是否被拿起。
16.根据权利要求13所述的计算机,其中所述语音数据当成语音命令传送至所述智能装置,以控制所述智能装置,其中所述智能装置对所述语音数据进行语音辨识。
17.根据权利要求13所述的计算机,其中所述语音数据包含有关所述电话机的按键拨号声音的信息,且所述信息使所述智能装置执行指定任务。
18.一种电子装置,使用运行智能装置的语音辨识系统,并包括:
通信单元,配置以从语音输入单元接收第一语音数据,并配置与所述智能装置进行通信;以及
处理单元,耦接所述通信单元,并配置以将所述第一语音数据作为语音命令通过所述通信单元输入至所述智能装置;
其中,所述通信单元配置以接收所述语音辨识系统的回复以响应从所述智能装置的所述语音命令。
19.根据权利要求18所述的电子装置,其中所述通信单元配置以从所述语音输入单元接收第二语音数据,所述处理单元通过输入所述第二语音数据至所述电子装置的操作系统语音服务而取得所述电子装置的操作系统语音服务的回复。
20.根据权利要求19所述的电子装置,其中所述电子装置为通过互联网向用户提供各种应用服务(Over The Top,OTT)的装置、网际协议通话技术路由器(VoIP Router)、调制解调器或机顶盒,所述语音输入单元为蓝牙麦克风,所述智能装置为智能型手机或平板计算机,所述电子装置进一步包括:
连接接口,包含RJ-11连接头与用户线路接口电路,所述RJ-11连接头与所述用户线路接口电路从电话机接收电话语音信号;
其中,所述通信单元仿真所述智能装置的第二语音输入单元;
其中,所述处理单元处理所述电话语音信号,以产生PCM语音数据给所述智能装置;
其中,所述通信单元传送所述PCM语音数据到所述智能装置,以由所述仿真的语音输入单元仿真输入动作给所述智能装置;
其中,所述联机为蓝牙联机,且所述仿真的语音输入单元是蓝牙麦克风,所述蓝牙麦克风与所述智能装置的内建麦克风具有相同功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610878241.5A CN107889085A (zh) | 2016-09-30 | 2016-09-30 | 将语音信号输入到智能装置的方法、电子装置及计算机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610878241.5A CN107889085A (zh) | 2016-09-30 | 2016-09-30 | 将语音信号输入到智能装置的方法、电子装置及计算机 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107889085A true CN107889085A (zh) | 2018-04-06 |
Family
ID=61769627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610878241.5A Pending CN107889085A (zh) | 2016-09-30 | 2016-09-30 | 将语音信号输入到智能装置的方法、电子装置及计算机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107889085A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110931001A (zh) * | 2019-09-05 | 2020-03-27 | 新华通讯社 | 一种面向语音识别的抗噪音频传输的装置 |
CN111399799A (zh) * | 2019-07-26 | 2020-07-10 | 威锋电子股份有限公司 | 音频传输装置及操作系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1212106A (zh) * | 1996-10-25 | 1999-03-24 | 北方电讯有限公司 | 连接至固定无线接入用户单元的电话设备的呼叫管理业务 |
WO2002063792A1 (en) * | 2001-02-07 | 2002-08-15 | Amalgamated Sciences, Llc | Wireless telephone coupler |
US20060187900A1 (en) * | 2005-02-22 | 2006-08-24 | Akbar Imran M | Method and system for providing private virtual secure Voice over Internet Protocol communications |
US20060229108A1 (en) * | 2005-02-04 | 2006-10-12 | Cehelnik Thomas G | Mobile phone extension and data interface via an audio headset connection |
CN101170713A (zh) * | 2007-04-27 | 2008-04-30 | 任少华 | 用于集团电话的用户识别管理系统 |
CN101420707A (zh) * | 2008-12-08 | 2009-04-29 | 内蒙古电子信息职业技术学院 | 一种手机监控系统及其监控方法 |
CN101459984A (zh) * | 2007-12-11 | 2009-06-17 | 希姆通信息技术(上海)有限公司 | 一种将手机作为家庭座机的子机的系统及其控制方法 |
US20100151788A1 (en) * | 2008-01-18 | 2010-06-17 | Aliphcom, Inc. | Headset and Audio Gateway System for Execution of Voice Input Driven Applications |
CN101807398A (zh) * | 2009-02-16 | 2010-08-18 | 宏正自动科技股份有限公司 | 语音识别装置及其操作方法 |
CN103118178A (zh) * | 2013-01-16 | 2013-05-22 | 深圳市金立通信设备有限公司 | 一种将移动终端接入固定电话网络的方法、装置及系统 |
CN103685709A (zh) * | 2012-09-24 | 2014-03-26 | 上海斐讯数据通信技术有限公司 | 普通电话座机连接手机实现语音通话的系统 |
-
2016
- 2016-09-30 CN CN201610878241.5A patent/CN107889085A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1212106A (zh) * | 1996-10-25 | 1999-03-24 | 北方电讯有限公司 | 连接至固定无线接入用户单元的电话设备的呼叫管理业务 |
WO2002063792A1 (en) * | 2001-02-07 | 2002-08-15 | Amalgamated Sciences, Llc | Wireless telephone coupler |
US20060229108A1 (en) * | 2005-02-04 | 2006-10-12 | Cehelnik Thomas G | Mobile phone extension and data interface via an audio headset connection |
US20060187900A1 (en) * | 2005-02-22 | 2006-08-24 | Akbar Imran M | Method and system for providing private virtual secure Voice over Internet Protocol communications |
CN101170713A (zh) * | 2007-04-27 | 2008-04-30 | 任少华 | 用于集团电话的用户识别管理系统 |
CN101459984A (zh) * | 2007-12-11 | 2009-06-17 | 希姆通信息技术(上海)有限公司 | 一种将手机作为家庭座机的子机的系统及其控制方法 |
US20100151788A1 (en) * | 2008-01-18 | 2010-06-17 | Aliphcom, Inc. | Headset and Audio Gateway System for Execution of Voice Input Driven Applications |
CN101420707A (zh) * | 2008-12-08 | 2009-04-29 | 内蒙古电子信息职业技术学院 | 一种手机监控系统及其监控方法 |
CN101807398A (zh) * | 2009-02-16 | 2010-08-18 | 宏正自动科技股份有限公司 | 语音识别装置及其操作方法 |
CN103685709A (zh) * | 2012-09-24 | 2014-03-26 | 上海斐讯数据通信技术有限公司 | 普通电话座机连接手机实现语音通话的系统 |
CN103118178A (zh) * | 2013-01-16 | 2013-05-22 | 深圳市金立通信设备有限公司 | 一种将移动终端接入固定电话网络的方法、装置及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111399799A (zh) * | 2019-07-26 | 2020-07-10 | 威锋电子股份有限公司 | 音频传输装置及操作系统 |
CN111399799B (zh) * | 2019-07-26 | 2023-09-05 | 威锋电子股份有限公司 | 音频传输装置及操作系统 |
CN110931001A (zh) * | 2019-09-05 | 2020-03-27 | 新华通讯社 | 一种面向语音识别的抗噪音频传输的装置 |
CN110931001B (zh) * | 2019-09-05 | 2022-05-17 | 新华通讯社 | 一种面向语音识别的抗噪音频传输的装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104380254B (zh) | 快速启动应用服务的方法和终端 | |
US7030752B2 (en) | Universal gateway module for interfacing a security system control to external peripheral devices | |
CN103888581B (zh) | 一种通信终端及其记录通话信息的方法 | |
CN107566658A (zh) | 通话方法、装置、存储介质及移动终端 | |
US20180293982A1 (en) | Voice assistant extension device and working method therefor | |
CN104104789A (zh) | 语音接听方法与移动终端装置 | |
CN106657528A (zh) | 一种来电管理方法及装置 | |
CN105493440A (zh) | 家用电器及其控制方法 | |
CN108184201A (zh) | 音频测试方法、音频测试系统 | |
CN105577882B (zh) | 一种信息显示的方法及用户终端 | |
CN103491257A (zh) | 一种在通话过程中发送联系人信息的方法及系统 | |
CN107360332A (zh) | 通话状态显示方法、装置、移动终端及存储介质 | |
CN105491216A (zh) | 来电处理方法、装置及终端 | |
CN106911840A (zh) | 移动终端及其语音服务方法和装置 | |
CN107889085A (zh) | 将语音信号输入到智能装置的方法、电子装置及计算机 | |
US20020082057A1 (en) | System and method for utilizing mobile conmunication terminal as wireless headset | |
TWI601071B (zh) | 將電話機的語音訊號輸入到智慧裝置的方法、電子裝置及具有非揮發性儲存裝置之電腦 | |
KR20150088532A (ko) | 통화 중 서비스 제공 장치 및 이를 이용하는 방법 | |
CN103795853B (zh) | 耳机接口适配设备的连接切换方法及终端 | |
CN105472152A (zh) | 一种智能终端自动接听电话的方法系统 | |
CN109545231A (zh) | 一种便携式控制智能设备的方法 | |
CN104902389A (zh) | 一种信息处理方法和电子设备 | |
CN204795612U (zh) | 具群组对讲功能之蓝牙耳机通讯系统 | |
CN109819297A (zh) | 一种操作控制方法及机顶盒 | |
JP7133781B2 (ja) | インターホン装置及びインターホンシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180406 |