KR20040061792A - Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone - Google Patents

Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone Download PDF

Info

Publication number
KR20040061792A
KR20040061792A KR1020020088090A KR20020088090A KR20040061792A KR 20040061792 A KR20040061792 A KR 20040061792A KR 1020020088090 A KR1020020088090 A KR 1020020088090A KR 20020088090 A KR20020088090 A KR 20020088090A KR 20040061792 A KR20040061792 A KR 20040061792A
Authority
KR
South Korea
Prior art keywords
voice signal
voice
signal processing
mobile communication
processing
Prior art date
Application number
KR1020020088090A
Other languages
Korean (ko)
Other versions
KR100494873B1 (en
Inventor
김희성
Original Assignee
주식회사 팬택앤큐리텔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 팬택앤큐리텔 filed Critical 주식회사 팬택앤큐리텔
Priority to KR10-2002-0088090A priority Critical patent/KR100494873B1/en
Publication of KR20040061792A publication Critical patent/KR20040061792A/en
Application granted granted Critical
Publication of KR100494873B1 publication Critical patent/KR100494873B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

PURPOSE: A mobile terminal for processing a multi-voice signal using a general DSP(Digital Signal Processor) chip and a voice signal processing method using the same are provided to be used for environment requesting security over a general personal voice by applying a voice processing solution to a mobile terminal. CONSTITUTION: A mobile terminal receives a voice signal(401). A user selects a system for processing the received voice signal(402). The user selects a processing function for processing voice signal data sent to a voice processing module(403). A corresponding CODEC(Compression/Decompression) is selected for the suitably processed data in order to meet system compatibility in a CDMA(Code Division Multiple Access) and a GSM(Global System for Mobile Communications)(404). The voice data undergoes voice combining and voice compression(405,406), and a result is transmitted to the mobile terminal(407).

Description

범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기 및 그를 활용한 음성신호 처리 방법{Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone}Multi voice signal processing mobile phone using general DSP chip and voice signal processing method using same {Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone}

본 발명은 범용 디에스피(DSP : Digital Signal Processor)칩을 이용한 멀티 음성신호처리의 이동통신 단말기 및 그를 활용한 음성신호 처리 방법에 관한 것으로, 더욱 상세하게는 일반 개인음성에 대한 보안이 요구되는 환경에서나 재미와 흥미를 요구하는 환경과 일반 언어 교정 및 외국어 교육을 위한 시스템등에서 활용 할 수 있는 음성처리솔루션을 일반 단말기에 적용한 범용 디에스피(DSP)칩을 이용한 멀티 음성신호처리의 이동통신 단말기 및 그를 활용한 음성신호 처리 방법에 관한 것이다.The present invention relates to a mobile communication terminal for multi-voice signal processing using a general digital signal processor (DSP) chip and a voice signal processing method using the same, and more particularly, in an environment requiring security for general personal voice. Mobile communication terminal and multi-voice signal processing system using general-purpose DSP chip applying voice processing solution that can be used in environment that requires fun and interest, general language proofing and foreign language education system A voice signal processing method.

본 발명이 속하는 기술 분야는 크게 두 가지로 분류해서 설명할 수 있는데, 이는 일반 사용자의 음성신호를 다양한 변조 부호화와 속도, 높낮이 등의 음의 변조 방식을 이용하여 원래 음성과 다른 독특한 성질의 음성신호를 출력하는 범용 디에스피(DSP)의 디지털 기술과 이를 적절히 제어할 수 있는 무선통신상의 제어기술이 그 핵심이라고 말할 수 있다.The technical field to which the present invention pertains can be broadly classified into two types, which are speech signals of general users using various modulation coding and sound modulation methods such as speed and height. The core technology is a digital technology of a general purpose DSP that outputs a control signal and a wireless communication control technology capable of controlling the same.

종래의 일반적인 음성처리 시스템에서는 특별한 제어가 없는 일방적인 유선상의 전송에 그치고 있으며, 최근에는 인터넷상으로까지 그 기술이 발전하기는 하였으나 완전한 무선상의 제어 및 전송기술에 대한 구현은 아직 알려지지 않았다.In the conventional general voice processing system, there is only one-way transmission over the wire without special control. Recently, although the technology has been developed to the Internet, the implementation of the complete wireless control and transmission technology is not yet known.

도 1 은 종래의 음성처리 정보 시스템을 위한 유선상의 시스템 전송장치에 대한 구성예시도이다.1 is an exemplary configuration diagram of a system transmission apparatus on a wired line for a conventional speech processing information system.

도 1 은 종래의 음성처리 정보 시스템을 위한 유선상의 시스템 전송장치를 개략적으로 나타낸 것이다. 아직은 음성처리 정보 시스템의 기술들이 일반인들에게는 폭 넓게 다가가지 못하고 있으며, 간간이 시뮬레이션(simulation) 정도만이 가능하며 이마저도 제한적인 컨텐츠(content)로만 가능하도록 되어있다. 즉, 널리 알려진 일기예보 서비스라든가 교통정보서비스 등에 그 한계를 두고 있다. 이마저도 대부분 보유하고 있는 일부 정보 풀(pool)로 한정되어 있다. 이는 도면에 도시된 바와 같이 유선상에서 해당 음성처리 정보 시스템을 연결하여 처리하여야 한다는 비용적인 문제점 때문에 발생하기도 한다.1 schematically illustrates a system transmission apparatus on a wired line for a conventional speech processing information system. Yet, the technology of voice processing information system is not widely available to the general public, and it is only possible to make simulations and even limited content. In other words, there are limitations on the well-known weather forecast service and traffic information service. Even this is limited to some pool of information that most have. This may occur due to a cost problem that the voice processing information system must be connected and processed on a wire as shown in the drawing.

도 2 는 종래의 기술로 가능한 음성처리시스템을 적용한 무선상의 음성처리를 개략적으로 나타낸 일예시도이다.FIG. 2 is an exemplary view schematically showing wireless voice processing using the voice processing system possible in the related art.

도면에 도시된 바와 같이 무선 단말기(2-2)가 무선탑, 기지국제어기(BSC : Base Station Controller)/이동전화 교환국(MSC : Mobile Switching Center) 및 무선 망을 거쳐 음성처리 서버(SERVER, 2-1)에 연결되어 음성처리를 수행한다.As shown in the figure, the wireless terminal 2-2 is a voice processing server (SERVER, 2-) via a wireless tower, a base station controller (BSC) / mobile switching center (MSC) and a wireless network. 1) performs voice processing.

도면에서 볼 수 있는 바와 같이 기존에는 이동통신 단말기, 즉 무선 단말기에서 음성처리시스템을 적용하기 위해서는 망을 통해 특정 서버에 접속하여야만 하는 문제점이 있었다.As can be seen in the drawings, there has been a problem in that a mobile communication terminal, that is, a wireless terminal, needs to be connected to a specific server through a network in order to apply a voice processing system.

본 발명은, 상기한 바와 같은 문제점을 해결하기 위하여 안출된 것으로, 서로 독립적인 음성처리기술을 이동통신 단말기에 적용 및 구현함으로써 멀지않은 미래의 사용자로 하여금 자신의 음성을 다양한 성질의 음성으로 느낄 수 있고 더 나아가 자신의 음성을 보안할 수 있는 범용 디에스피(DSP)칩을 이용한 멀티 음성신호처리의 이동통신 단말기 및 그를 활용한 음성신호 처리 방법을 제공하는데 그 목적이 있다.The present invention has been made to solve the problems described above, by applying and implementing a mutually independent voice processing technology to a mobile communication terminal, the user of the future can feel his voice as a voice of various properties Furthermore, an object of the present invention is to provide a mobile communication terminal for multi-voice signal processing using a general-purpose DSP chip capable of securing its own voice, and a voice signal processing method using the same.

도 1 은 종래의 음성처리 정보 시스템을 위한 유선상의 시스템 전송장치에 대한 구성예시도.1 is a configuration example of a system transmission apparatus on a wired line for a conventional speech processing information system.

도 2 는 종래의 기술로 가능한 음성처리시스템을 적용한 무선상의 음성처리를 개략적으로 나타낸 일예시도.Figure 2 is an exemplary view schematically showing a voice processing on the radio by applying a voice processing system possible in the prior art.

도 3 은 본 발명에 따른 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기에 대한 일실시예 구성도.3 is a block diagram of an embodiment of a mobile communication terminal of multi-voice signal processing using a general purpose DS chip according to the present invention;

도 4 는 본 발명에 따른 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기를 활용한 음성신호 처리 방법에 대한 일실시예 흐름도.4 is a flowchart illustrating an embodiment of a voice signal processing method using a mobile communication terminal of multi-voice signal processing using a general purpose DS chip according to the present invention;

*도면의 주요 부분에 대한 부호의 설명* Explanation of symbols for the main parts of the drawings

31 : 단말기 모뎀 32 : 음성 입력 및 출력부31: terminal modem 32: voice input and output unit

33 : 음성신호 처리제어부33: voice signal processing control unit

34 : 음성인식/문자음성변환/음성변조 처리부34: speech recognition / text to speech conversion / voice modulation processing unit

35 : 음성합성/압축 처리부 36 : 공유메모리35: speech synthesis / compression processing unit 36: shared memory

상기 목적을 달성하기 위한 본 발명의 장치는, 이동통신 단말기에 있어서, 입력되는 음성신호에 대해 요청된 음성신호처리 방식에 따라 상기 음성신호의 변조, 인식, 변환 등을 선택적으로 수행하여 출력하는 음성신호처리수단; 상기 음성신호를 포함하는 데이터 신호, 제어 인터페이스 신호 및 어드레스 신호를 상기 음성신호처리수단과 교환하며 이동통신 송/수신 기능을 수행하기 위한 이동통신 처리수단; 및 상기 음성신호처리수단 및 상기 이동통신 처리수단에서 사용되는 데이터를 소정의 기간동안 저장하기 위한 저장수단을 포함하는 것을 특징으로 한다.The apparatus of the present invention for achieving the above object, in the mobile communication terminal, a voice for selectively performing the modulation, recognition, conversion, etc. of the voice signal according to the requested voice signal processing method for the input voice signal to output Signal processing means; Mobile communication processing means for exchanging a data signal, a control interface signal, and an address signal including said voice signal with said voice signal processing means and performing a mobile communication transmission / reception function; And storage means for storing the data used in the voice signal processing means and the mobile communication processing means for a predetermined period of time.

또한, 본 발명은, 멀티 음성신호처리의 이동통신 단말기에 적용되는 음성데이터 부호화 방법에 있어서, 상기 이동통신 단말기가 음성 신호를 입력받는 제 1 단계; 상기 음성 신호에 대한 처리방식을 사용자로부터 선택받는 제 2 단계; 상기 사용자로부터 요청된 음성신호 처리방식에 대해 확인하여 범용의 디에스피(DSP)칩으로 구성된 음성신호처리부에 이를 통지하는 제 3 단계; 및 상기 음성신호처리부에서 상기 음성신호 처리방식에 따라 상기 음성신호를 처리하여 변형된 신호를 산출하는 제 4 단계를 포함하는 것을 특징으로 한다.The present invention also provides a voice data encoding method applied to a mobile communication terminal of a multi-voice signal processing, comprising: a first step of receiving a voice signal from the mobile communication terminal; A second step of selecting a processing method for the voice signal from a user; A third step of confirming the voice signal processing method requested by the user and notifying the voice signal processing unit composed of a general purpose DSP chip; And a fourth step of processing the voice signal in the voice signal processing unit and calculating a modified signal in accordance with the voice signal processing method.

본 발명은 기존의 단말기와 시스템 기술에 음성변조 및 합성 등 음성처리에 대한 부호화/복호화 기술을 추가함으로써, 현재의 무선 망이나 가까운 미래에 서비스될 아이엠티2000(IMT2000) 동기식 및 비동기식 광대역 통신망을 이용한 무선상 음성처리 및 제어의 수행을 기본 특징으로 하며, 기본적인 기능으로는 음성 인식, 음성 변조기능과 음성의 합성기능 등이 해당된다.The present invention adds encoding / decoding techniques for speech processing, such as voice modulation and synthesis, to existing terminals and system technologies, and uses IMT2000 synchronous and asynchronous broadband communication networks to be serviced in the near future. Its basic features include wireless voice processing and control, and basic functions include voice recognition, voice modulation, and voice synthesis.

본 발명에서의 음성변조 기능으로는 사용자의 음성을 사용자와 다른 독특하고 다양한 성질의 음성으로 부호화하고 이렇게 부호화된 음성을 합성모듈에서 합성하여 단말기 모뎀부로 전달하게 된다. 이러한 일련의 과정들을 디에스피(DSP)와 같은 음성처리장치와 단말기 그리고 무선상의 통신방식을 이용함으로써 저비용으로 간결하게 구현할 수 있으며 여기에 적용되는 고도의 기술로 인해 파생되는 부가가치를 적절히 적용하거나 응용함으로써 본 발명에 대한 단발적인 가치는 물론 추가적으로 야기되는 가치를 갖고자 하는데 본 발명의 본질이 있다.In the present invention, the voice modulation function encodes the user's voice into a voice having a unique and different property different from that of the user, and synthesizes the encoded voice in the synthesis module and delivers the synthesized voice to the terminal modem unit. This series of processes can be implemented simply and at low cost by using voice processing devices such as DSP, terminals and wireless communication methods, and by applying or applying the added value derived from the high technology applied thereto. It is the nature of the present invention to have a one-time value as well as an additionally caused value.

상술한 바와 같이 발명의 구성에는 크게 기존의 단말기 시스템에 대한 음성처리모듈에 대한 인터페이스 기술부분과 음성 신호처리 기술로 구성되며 이에 대한 내용들을 그림을 참고 하면서 자세히 설명하기로 한다. 우선, 본 발명의 방법을 설명하기 위하여 사용된 용어부터 정의한다.As described above, the configuration of the invention is largely composed of the interface description portion and the voice signal processing technology for the voice processing module for the existing terminal system, which will be described in detail with reference to the drawings. First, the terms used to describe the method of the present invention are defined.

문자 음성 변환(TTS : Text to Speech) : 택스트(Text)를 사람 목소리가 아닌 기계합성을 통하여 음성으로 변환시키는 기술을 말한다. 즉, 문자 정보 또는 기호를 인간의 음성으로 변환하여 들려주는 기술이다. 이는 모든 음소에 대한 발음 데이터베이스를 구축하고 이를 연결시켜 연속된 음성을 생성하게 되는데, 이 때 음성의 크기, 길이, 높낮이 등을 조절해 자연스러운 음성을 합성해낸다.Text-to-Speech (TTS): Text-to-Speech is a technology that converts text into speech through machine synthesis rather than human voice. In other words, it is a technology that converts text information or symbols into human voices and plays them. It builds a pronunciation database for all phonemes and connects them to create a continuous voice. At this time, it adjusts the size, length and height of the voice to synthesize a natural voice.

음성인식(ASR : Automatic Speech Recognition) : 음성을 마이크를 통하여 입력을 받아 미리 저장된 자료와 비교하여 특정한 작업을 수행하는 기술을 말한다(발음에 따라 입 모양과 혀의 위치 변화로 특정한 주파수를 갖는 인간의 음성을 이용, 발성된 음성을 전기신호로 변환한 후 음성 신호의 여러가지 특성을 추출해 사람의 발음을 인식하는 기술이다).Automatic Speech Recognition (ASR): A technology that performs a specific task by receiving a voice input through a microphone and comparing it with pre-stored data. It is a technology that recognizes human pronunciation by extracting various characteristics of voice signal after converting spoken voice into electric signal using voice).

브이씨(VC : Voice Coloring) : 음성변조를 말한다. 음성변조는 임의의 포맷으로 구성된 음성 신호에 다양한 변조 효과를 적용하여 다시 임의의 포맷으로 새로운 음성 신호를 생성해주는 것이다. 여러 음향학적 요소를 포함하는 스펙트럼 포락의 변환과 개인성 요소에 가장 큰 영향을 미치는 운율 요소인 피치주기 값등의 변화에 의하여 음성을 변환시킨다.음성변조를 이용하여 목소리 변조, 사운드 이펙트, 음속조절, 음높이 조절 등이 가능하며, 음성에 배경음을 처리하는 기능까지 가능하다VC: Voice Coloring. Voice modulation is to generate a new voice signal in an arbitrary format by applying various modulation effects to the voice signal composed of any format. The voice is transformed by a change in the spectral envelope that includes several acoustical elements and a change in the pitch period, which is the rhyme factor that has the greatest influence on the personality factor. Voice modulation, sound effects, sound velocity control, and pitch are used by voice modulation. It is possible to adjust and even to process the background sound to the voice

기지국 제어기(BSC) : 기지국 장치(BTS : Base Transceiver System) 제어 및 기지국 호 처리 등의 역할을 한다.Base station controller (BSC): plays a role of base transceiver station (BTS) control and base station call processing.

이동 교환국(MSC) : 교환기능 등 타 MSC와 연동시키거나 타 망과 연결시켜주는 역할을 한다.Mobile switching center (MSC): It plays a role of interworking with other MSCs such as exchange function or connecting to other networks.

상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 3 은 본 발명에 따른 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기에 대한 일실시예 구성도이다. 즉, 도 3 에서는 음성처리시스템을 탑재한 무선 단말기를 나타내고 있다.3 is a diagram illustrating an embodiment of a mobile communication terminal for multi-voice signal processing using a general purpose DS chip according to the present invention. That is, Fig. 3 shows a wireless terminal equipped with a voice processing system.

도 3은 도 1과 도 2에서 보이는 바와 같이 종래의 인터넷 서버 기반의 음성처리시스템과는 다르게 무선 단말기에 실시간 음성처리시스템을 탑재하여 사용자가 직접 사용자 인터페이스(UI : User Interface) 또는 엠엠아이(MMI : Man Machine Interface)를 통해 제어할 수 있는 시스템을 도면으로 나타내고 있다.As shown in FIGS. 1 and 2, unlike the conventional Internet server-based speech processing system, FIG. 3 is provided with a real-time speech processing system in a wireless terminal, so that a user directly uses a user interface (UI) or MMI (MMI). : System that can be controlled through Man Machine Interface is shown in the drawings.

본 발명에 따른 이동통신 단말기는 도면에 도시된 바와 같이 단말기 시스템, 즉 단말기 처리모듈과 음성처리시스템 즉, 음성처리모듈로 크게 나눌 수 있으며, 좀 더 구체적으로 살펴보면 무선통신 처리를 담당하는 단말기 모뎀(31), 음성 입력 및 출력부(32)의 단말기 처리모듈과 음성신호 처리제어부(33), 음성인식/문자음성변환/음성변조 처리부(34) 및 음성합성/압축 처리부(35)를 가지는 음성처리모듈을 가진다. 또한, 단말기 처리모듈과 음성처리모듈은 공유메모리(36)를 공유한다.The mobile communication terminal according to the present invention can be broadly divided into a terminal system, that is, a terminal processing module and a voice processing system, that is, a voice processing module, as shown in the drawings. 31), a voice processing having a terminal processing module of the voice input and output unit 32, a voice signal processing control unit 33, a voice recognition / text voice conversion / voice modulation processing unit 34 and a voice synthesis / compression processing unit 35 Have a module In addition, the terminal processing module and the voice processing module share the shared memory 36.

좀 더 세부적으로 살펴보면 음성신호처리모듈은 일반적으로 DSP 모듈(33, 34, 35)을 장착했다. DSP칩은 처리속도 등의 퍼포먼스(performance)가 우수하며, 전류소모에도 유리한 이점이 있다. 특히, 음성 등의 신호처리에 적합하기 때문에 일반적인 범용의 DSP칩을 이용하여도 무리가 없다.In more detail, the voice signal processing module is generally equipped with DSP modules 33, 34, and 35. The DSP chip has excellent performance such as processing speed and has an advantage in terms of current consumption. In particular, since it is suitable for signal processing such as voice, a general general purpose DSP chip can be used.

데이터(Data)의 흐름으로 시스템의 구성 및 데이터(data)의 처리과정을 설명하자면, 먼저 일반 음성통신에 있어서 시디엠에이(CDMA : code division multiple access)의 경우에는 '퀄컴'사의 칩에서 제공하는 음성 코덱(CODEC : compression/decompression)을 사용하고, 지에스엠(GSM : Global System for Mobile Communications)의 경우에는 알피이-엘티피(RPE-LTP : Regular Pulse Excited - Long Term Prediction)방식의 CODEC을 사용하면 된다.Referring to the configuration of the system and the processing of the data with the flow of data, first, in the case of code division multiple access (CDMA) in general voice communication, a chip provided by Qualcomm When using a voice codec (CODEC: compression / decompression), in the case of the Global System for Mobile Communications (GSM) using a codec of RPE-LTP (Regular Pulse Excited-Long Term Prediction) do.

본 발명은, 이를 제외한 기타 다른 음성신호처리의 경우 즉, 음성인식. 음성변조. 음성합성 등의 경우에 실시간으로 이를 처리하는 부분을 독립적으로 모듈(34, 35)로 구성하고 있다. 이러한 각각의 기능에 대해선 본 발명에서는 언급하지는 않는다. 이미 여러 업체에서 나름대로의 성능을 가진 소프트웨어(Software)들이 제시되고 있다. 본 발명에 따른 이동통신 단말기는 이러한 부분을 선택 적용하되, DSP칩에 맞게 최적화(optimize)하고 통합(integration)하는 작업이 요구된다.The present invention, in the case of other speech signal processing other than this, that is, speech recognition. Negative modulation. In the case of speech synthesis or the like, the modules 34 and 35 independently configure a part for processing the same in real time. Each of these functions is not mentioned in the present invention. Many companies are already offering their own software. Although the mobile communication terminal according to the present invention selectively applies such a part, it is required to optimize and integrate for the DSP chip.

도 3 을 보면 점선을 경계로 일반 단말기 시스템(31, 32)과 음성신호 처리 모듈(33, 34, 35)로 분리된다. 사용자가 일반 통화 시 음성변조를 적용하고자 할 경우에는, 단말기에 음성변조기능을 사용자가 선택한다. 이때는 음성 데이터 경로(speech data path)가 음성처리모듈(33)로 천이된다. 물론 음성처리모듈에는 소프트웨어(software)적으로 음성변조, 음성인식, 음성합성, 음성압축 등의 모듈(34, 35)을 범용의 DSP 칩을 통해 구비하고 있다.3, the general terminal system 31 and 32 and the voice signal processing modules 33, 34, and 35 are separated by a dotted line. When the user wants to apply voice modulation in a normal call, the user selects a voice modulation function in the terminal. At this time, the speech data path transitions to the speech processing module 33. Of course, the voice processing module includes software modules 34, 35 such as voice modulation, voice recognition, voice synthesis, and voice compression through a general purpose DSP chip.

음성신호처리모듈에서 음성변조처리된 음성 데이터(speech data)는 최종 압축 처리되어 단말기 고주파(RF : Radio Frequency)의 전송(TX)단으로 보내져 송신된다.Speech data modulated by the voice signal processing module may be finally compressed and transmitted to a transmission (TX) terminal of a radio frequency (RF) terminal.

물론, 음성처리모듈에 있어서 압축에 사용되는 CODEC은 BSC/BTS와 호환성을 고려하여, CDMA의 경우에 'QCELP(QualComm Code Excited Linear Predictive Coding) 13K' 또는 이브이알씨(EVRC : Enhanced Variable Rate Coder)를 사용하고, GSM의 경우는 RPE-LTP 및 지에스엠-에이엠알(GSM-AMR : GSM-Adaptive Multi Rate) 등을 사용하게 된다.Of course, the CODEC used for the compression in the voice processing module considers QSCLP (QualComm Code Excited Linear Predictive Coding) 13K or EVRC (Enhanced Variable Rate Coder) in consideration of compatibility with BSC / BTS. In case of GSM, RPE-LTP and GSM-AMR (GSM-AMR: GSM-Adaptive Multi Rate) are used.

도 4 는 본 발명에 따른 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기를 활용한 음성신호 처리 방법에 대한 일실시예 흐름도이다.4 is a flowchart illustrating a method of processing a voice signal using a mobile communication terminal of multi-voice signal processing using a general purpose DS chip according to the present invention.

도 4 에서는 본 발명에 따른 범용 DSP칩을 이용한 멀티 음성신호처리 이동통신 단말기에서의 음성신호 처리 방법에 대한 일실시예 흐름도를 나타내고 있다.4 is a flowchart illustrating a method of processing a voice signal in a multi-voice signal processing mobile communication terminal using a general-purpose DSP chip according to the present invention.

먼저, 이동통신 단말기가 음성 신호를 입력받는다(401).First, the mobile communication terminal receives a voice signal (401).

이후, 입력받은 음성신호의 처리시스템을 사용자로부터 선택받는다(402). 즉, 미리 구성된 단말기의 MMI 또는 UI를 통해 사용자로부터 음성신호 처리시스템을 이용하고자 함을 선택받는다.Thereafter, the processing system for receiving the received voice signal is selected by the user (402). That is, the user is selected to use the voice signal processing system through the MMI or the UI of the preconfigured terminal.

이어서, 음성처리모듈로 보내진 음성신호 데이터(Data)를 처리하기 위하여 처리기능을 사용자로부터 선택받는다(403). 이 역시 미리 구성된 단말기의 메뉴에서 선택하게 되어있다. 음성신호의 처리기능에는 음성인식(ASR), 문자 음성 변환(TTS), 음성변조(VC) 등이 있다.Subsequently, a processing function is selected by the user in order to process the voice signal data Data sent to the voice processing module (403). This is also selected from the menu of the preconfigured terminal. Voice signal processing functions include speech recognition (ASR), text-to-speech (TTS), voice modulation (VC), and the like.

그리고, 이동통신 단말기의 음성신호 처리제어부에서의 제어신호를 바탕으로 입력된 음성신호에 대해 해당하는 음성신호의 처리, 즉 음성인식(ASR), 문자 음성변환(TTS), 음성변조(VC) 등을 수행한다.And, based on the control signal from the voice signal processing control unit of the mobile communication terminal, processing of the corresponding voice signal, that is, voice recognition (ASR), text-to-speech (TTS), voice modulation (VC), etc. Do this.

기능에 맞게 신호처리 되어진 데이터(data)는 CDMA와 GSM에서의 시스템 호환성을 맞추기 위하여 해당하는 CODEC을 선택한다(404).The data signaled according to the function selects the corresponding CODEC to match the system compatibility in CDMA and GSM (404).

이후, 신호 처리된 음성 데이터를 부호화 즉, 음성합성과 음성압축을 수행하여(405, 406), 그 결과를 이동통신 단말기의 송신부로 전송한다(407).Thereafter, the processed speech data is encoded, that is, speech synthesis and speech compression are performed (405 and 406), and the result is transmitted to the transmitter of the mobile communication terminal (407).

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.The method of the present invention as described above may be implemented as a program and stored in a computer-readable recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.).

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.The present invention described above is not limited to the above-described embodiments and the accompanying drawings, and various substitutions, modifications, and changes are possible in the art without departing from the technical spirit of the present invention. It will be clear to those of ordinary knowledge.

상기한 바와 같은 본 발명은, 음성처리솔루션을 일반 단말기에 적용함으로써 일반 개인음성에 대한 보안이 요구되는 환경에서나 재미와 흥미를 요구하는 환경 과 일반 언어 교정 및 외국어 교육을 위한 시스템등에서 활용 할 수 있는 효과가 있다. 특히, 본 발명은, 언어 장애자를 위해서 티티에스(TTS) 합성 모듈을 단말기에 적용함으로써 일반 사용자는 물론 단말기 사용에 부담을 갖는 언어 장애자들까지 폭넓게 이용할 수 있는 효과가 있다.The present invention as described above, by applying the speech processing solution to the general terminal can be utilized in the environment that requires security for general personal voice or in the environment that requires fun and interest and the system for general language correction and foreign language education, etc. It works. In particular, by applying the TTS synthesis module to a terminal for a language impaired, the present invention can be widely used for general users as well as language impaired people who have a burden on using a terminal.

또한, 본 발명은, 음성처리시스템에서 제공하는 음성처리 루프백(loopback)을 이용하여 본인의 언어감각을 판단할 수 있으며, 사용자의 외국어 교육에도 큰 기여를 할 수 있는 효과가 있다.In addition, the present invention, by using the speech processing loopback (loopback) provided by the speech processing system can determine the sense of the language of the user, there is an effect that can make a significant contribution to the foreign language education of the user.

나아가 본 발명은, 소요비용 측면에서도 기존의 인터넷 이용으로 인한 불편함, 고비용의 이용료 및 신뢰도 등에 대한 부담을 줄일 수 있는 효과가 있다.Furthermore, the present invention has the effect of reducing the burden on the inconvenience, high cost of use and reliability, etc. due to the existing use of the Internet.

또한, 본 발명은, 사용자의 이용시 부담없이 단말기 조작만으로도 쉽게 사용할 수 있다는 것과 이동통신 단말기 내에 별도의 음성처리모듈을 장착하고 있기 때문에 향후 기술적인 소프트웨어(software) 기능 업그레이드(upgrade)시 쉽게 적용할 수 있는 효과가 있다.In addition, the present invention can be easily applied when upgrading the technical software function in the future because it can be easily used only by operating the terminal without any burden on the user and equipped with a separate voice processing module in the mobile communication terminal. It has an effect.

또한, 본 발명은, 음성처리기술 즉, 음성인식, 음성변조, 음성합성, 음성변환 등 여러 가지 음성통신기술을 단말기에 적용할 수 있어, 파생되는 기술 및 응용범위는 현재와 미래의 실생활과 밀접하게 적용시킬 수 있는 효과가 있다.In addition, the present invention can be applied to a variety of voice communication technology, such as voice processing technology, that is, voice recognition, voice modulation, voice synthesis, voice conversion, the terminal, the derived technology and application range is closely related to the real life of the present and future There is an effect that can be applied.

또한, 본 발명은, 기존의 인터넷상의 한정된 음성처리시스템에 대한 서비스에 견주하여 간결하면서도 다양한 무선상 음성처리방법을 제시하고 있으며, 이는 기존의 이동통신 단말기의 무선통신기술을 적극적으로 활용함으로써 비용면으로 보나 적용면으로 보나 보다 효과적이다. 특히, 본 발명은, 구조적인 장애에 대한 부하를 크게 줄일 수 있고 더 나아가 음성처리모듈을 직접 단말기에 적용함으로써 일반 대중이 쉽게 사용할 수 있는 기반을 마련한다는 점에서 커다란 파급효과를 얻을 수 있는 효과가 있다.In addition, the present invention proposes a simple and diverse wireless voice processing method compared to the service for the limited voice processing system on the Internet, which is a cost aspect by actively utilizing the wireless communication technology of the existing mobile communication terminal. It is more effective in terms of both application and application. In particular, the present invention can significantly reduce the load on structural obstacles, and furthermore, by applying the voice processing module directly to the terminal, a large ripple effect can be obtained in that it provides a foundation for easy use by the general public. have.

Claims (5)

이동통신 단말기에 있어서,In the mobile communication terminal, 입력되는 음성신호에 대해 요청된 음성신호처리 방식에 따라 상기 음성신호의 변조, 인식, 변환, 합성 등을 선택적으로 수행하여 출력하는 음성신호처리수단;Voice signal processing means for selectively performing modulation, recognition, conversion, synthesis, etc. of the voice signal according to the requested voice signal processing method for the input voice signal; 상기 음성신호를 포함하는 데이터 신호, 제어 인터페이스 신호 및 어드레스 신호를 상기 음성신호처리수단과 교환하며 이동통신 송/수신 기능을 수행하기 위한 이동통신 처리수단; 및Mobile communication processing means for exchanging a data signal, a control interface signal, and an address signal including said voice signal with said voice signal processing means and performing a mobile communication transmission / reception function; And 상기 음성신호처리수단 및 상기 이동통신 처리수단에서 사용되는 데이터를 소정의 기간동안 저장하기 위한 저장수단Storage means for storing data used in the voice signal processing means and the mobile communication processing means for a predetermined period of time; 을 포함하는 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기.Mobile communication terminal of the multi-voice signal processing using a general purpose DS chip comprising a. 제 1 항에 있어서,The method of claim 1, 상기 음성신호처리수단은,The voice signal processing means, 범용의 디에스피(DSP : Digital Signal Processor)칩을 이용하여 사용자로부터 요청받은 문자 음성 변환(TTS : Text to Speech), 음성인식(ASR : Automatic Speech Recognition), 음성합성 및 음성변조(VC : Voice Coloring)를 선택적으로 수행하는 것을 특징으로 하는 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기.Text-to-Speech (TTS), Automatic Speech Recognition (ASR), Speech Synthesis and Voice Modulation (VC) using a general purpose Digital Signal Processor (DSP) chip A mobile communication terminal of a multi-voice signal processing using a general purpose DS chip, characterized in that selectively performing. 멀티 음성신호처리의 이동통신 단말기에 적용되는 음성데이터 부호화 방법에 있어서,In the voice data encoding method applied to the mobile communication terminal of the multi-voice signal processing, 상기 이동통신 단말기가 음성 신호를 입력받는 제 1 단계;A first step of receiving a voice signal from the mobile communication terminal; 상기 음성 신호에 대한 처리방식을 사용자로부터 선택받는 제 2 단계;A second step of selecting a processing method for the voice signal from a user; 상기 사용자로부터 요청된 음성신호 처리방식에 대해 확인하여 범용의 디에스피(DSP)칩으로 구성된 음성신호처리부에 이를 통지하는 제 3 단계; 및A third step of confirming the voice signal processing method requested by the user and notifying the voice signal processing unit composed of a general purpose DSP chip; And 상기 음성신호처리부에서 상기 음성신호 처리방식에 따라 상기 음성신호를 처리하여 변형된 신호를 산출하는 제 4 단계A fourth step of the voice signal processor processing the voice signal according to the voice signal processing method and calculating a modified signal 를 포함하는 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기를 활용한 음성신호 처리 방법.Voice signal processing method using a mobile communication terminal of the multi-voice signal processing using a general-purpose DS chip comprising a. 제 3 항에 있어서,The method of claim 3, wherein 상기 음성 처리된 신호에 대해 음성합성 및 음성압축을 수행하여 상기 이동통신 단말기의 송신부로 전달하는 제 5 단계A fifth step of performing speech synthesis and speech compression on the speech processed signal and transmitting the same to the transmitter of the mobile communication terminal; 를 더 포함하는 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기를 활용한 음성신호 처리 방법.Voice signal processing method using a mobile communication terminal of a multi-voice signal processing using a general purpose DS chip further comprising. 제 3 항 또는 제 4 항에 있어서,The method according to claim 3 or 4, 상기 음성신호 처리방식은,The voice signal processing method, 실질적으로 상기 음성신호처리부에서 처리가 가능한 음성변조(VC), 음성인식(ASR) 및 문자 음성 변환(TTS) 등을 나타내는 것을 특징으로 하는 범용 디에스피칩을 이용한 멀티 음성신호처리의 이동통신 단말기를 활용한 음성신호 처리 방법.It utilizes a mobile communication terminal of a multi-voice signal processing using a general purpose DS chip, characterized in that it represents a voice modulation (VC), a voice recognition (ASR) and a text-to-speech (TTS) and the like that can be processed by the voice signal processor. One voice signal processing method.
KR10-2002-0088090A 2002-12-31 2002-12-31 Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone KR100494873B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2002-0088090A KR100494873B1 (en) 2002-12-31 2002-12-31 Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0088090A KR100494873B1 (en) 2002-12-31 2002-12-31 Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone

Publications (2)

Publication Number Publication Date
KR20040061792A true KR20040061792A (en) 2004-07-07
KR100494873B1 KR100494873B1 (en) 2005-06-14

Family

ID=37353289

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0088090A KR100494873B1 (en) 2002-12-31 2002-12-31 Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone

Country Status (1)

Country Link
KR (1) KR100494873B1 (en)

Also Published As

Publication number Publication date
KR100494873B1 (en) 2005-06-14

Similar Documents

Publication Publication Date Title
US7343282B2 (en) Method for transcoding audio signals, transcoder, network element, wireless communications network and communications system
US5995923A (en) Method and apparatus for improving the voice quality of tandemed vocoders
US6625576B2 (en) Method and apparatus for performing text-to-speech conversion in a client/server environment
US10218856B2 (en) Voice signal processing method, related apparatus, and system
US8069049B2 (en) Speech coding system and method
KR101668401B1 (en) Method and apparatus for encoding an audio signal
KR20030076646A (en) Method and apparatus for interoperability between voice transmission systems during speech inactivity
EP2380095A1 (en) Methods, devices, and computer program products for providing real-time language translation capabilities between communication terminals
US20060235685A1 (en) Framework for voice conversion
JPH10260692A (en) Method and system for recognition synthesis encoding and decoding of speech
RU2333546C2 (en) Voice modulation device and technique
JP2010092059A (en) Speech synthesizer based on variable rate speech coding
CN1972478A (en) A novel method for mobile phone reading short message
JP3473204B2 (en) Translation device and portable terminal device
US20080147409A1 (en) System, apparatus and method for providing global communications
KR100835109B1 (en) Method and system for providing audio book service with generating underscore
KR100494873B1 (en) Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone
JP2000356995A (en) Voice communication system
TWI358057B (en) Systems and methods for dimming a first packet ass
KR100428717B1 (en) Speech signal transmission method on data channel
KR20110021439A (en) Apparatus and method for transformation voice stream
KR100659200B1 (en) Method to normalize voice signal in vocoder for mobile communication terminal
JP3173639B2 (en) Background noise update system and method
Burileanu et al. Recent advances in Romanian language text-to-speech synthesis
KR100606676B1 (en) Apparatus and method for voice conversion in mobile communication system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130530

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140529

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20150601

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160601

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee